您現(xiàn)在的位置是：首頁 » python編程資訊

資訊內(nèi)容

介紹python 數(shù)據(jù)抓取三種方法

極客小將2021-02-20-

簡介免費(fèi)學(xué)習(xí)推薦：python視頻教程三種數(shù)據(jù)抓取的方法正則表達(dá)式（re庫）BeautifulSoup（bs4）lxml*利用之前構(gòu)建的下載網(wǎng)頁函數(shù)，獲取目標(biāo)網(wǎng)頁的html，我們以https://guojiadiqu.bmcx.com/AFG__guojiayudiqu/為例，獲取html。fromge

u9d少兒編程網(wǎng)-Scratch_Python_教程_免費(fèi)兒童編程學(xué)習(xí)平臺

免費(fèi)學(xué)習(xí)推薦：python視頻教程u9d少兒編程網(wǎng)-Scratch_Python_教程_免費(fèi)兒童編程學(xué)習(xí)平臺

三種數(shù)據(jù)抓取的方法u9d少兒編程網(wǎng)-Scratch_Python_教程_免費(fèi)兒童編程學(xué)習(xí)平臺

正則表達(dá)式（re庫）BeautifulSoup（bs4）lxml

*利用之前構(gòu)建的下載網(wǎng)頁函數(shù)，獲取目標(biāo)網(wǎng)頁的html，我們以https://guojiadiqu.bmcx.com/AFG__guojiayudiqu/為例，獲取html。u9d少兒編程網(wǎng)-Scratch_Python_教程_免費(fèi)兒童編程學(xué)習(xí)平臺

u9d少兒編程網(wǎng)-Scratch_Python_教程_免費(fèi)兒童編程學(xué)習(xí)平臺

from get_html import download url = 'https://guojiadiqu.bmcx.com/AFG__guojiayudiqu/'page_content = download(url)

*假設(shè)我們需要爬取該網(wǎng)頁中的國家名稱和概況，我們依次使用這三種數(shù)據(jù)抓取的方法實(shí)現(xiàn)數(shù)據(jù)抓取。
1.正則表達(dá)式u9d少兒編程網(wǎng)-Scratch_Python_教程_免費(fèi)兒童編程學(xué)習(xí)平臺

from get_html import downloadimport re url = 'https://guojiadiqu.bmcx.com/AFG__guojiayudiqu/'page_content = download(url)country = re.findall('class="h2dabiaoti">(.*?)</h2>', page_content) #注意返回的是listsurvey_data = re.findall('<tr><td bgcolor="#FFFFFF" id="wzneirong">(.*?)</td></tr>', page_content)survey_info_list = re.findall('<p>　　(.*?)</p>', survey_data[0])survey_info = ''.join(survey_info_list)print(country[0],survey_info)

2.BeautifulSoup（bs4）u9d少兒編程網(wǎng)-Scratch_Python_教程_免費(fèi)兒童編程學(xué)習(xí)平臺

from get_html import downloadfrom bs4 import BeautifulSoup url = 'https://guojiadiqu.bmcx.com/AFG__guojiayudiqu/'html = download(url)#創(chuàng)建 beautifulsoup 對象soup = BeautifulSoup(html,"html.parser")#搜索country = soup.find(attrs={'class':'h2dabiaoti'}).text survey_info = soup.find(attrs={'id':'wzneirong'}).textprint(country,survey_info)

3.lxmlu9d少兒編程網(wǎng)-Scratch_Python_教程_免費(fèi)兒童編程學(xué)習(xí)平臺

from get_html import downloadfrom lxml import etree #解析樹url = 'https://guojiadiqu.bmcx.com/AFG__guojiayudiqu/'page_content = download(url)selector = etree.HTML(page_content)#可進(jìn)行xpath解析country_select = selector.xpath('//*[@id="main_content"]/h2') #返回列表for country in country_select: print(country.text)survey_select = selector.xpath('//*[@id="wzneirong"]/p')for survey_content in survey_select: print(survey_content.text,end='')

運(yùn)行結(jié)果：

**后，引用《用python寫網(wǎng)絡(luò)爬蟲》中對三種方法的性能對比，如下圖：

僅供參考。u9d少兒編程網(wǎng)-Scratch_Python_教程_免費(fèi)兒童編程學(xué)習(xí)平臺

相關(guān)免費(fèi)學(xué)習(xí)推薦：python教程（視頻）u9d少兒編程網(wǎng)-Scratch_Python_教程_免費(fèi)兒童編程學(xué)習(xí)平臺

以上就是介紹python 數(shù)據(jù)抓取三種方法的詳細(xì)內(nèi)容，更多請關(guān)注少兒編程網(wǎng)其它相關(guān)文章！u9d少兒編程網(wǎng)-Scratch_Python_教程_免費(fèi)兒童編程學(xué)習(xí)平臺

上一篇
pycharm怎么設(shè)置背景顏色

簡介pycharm設(shè)置背景顏色的方法：1、打開pycharm，點(diǎn)擊【file】、【settings】；2、找到【editor】，選擇【colorscheme】；3、根據(jù)需要選擇合適的背景顏色即可。本文操作環(huán)境：windows10系統(tǒng)、pycharmcommunity2020.3、宏基S40-51電腦。具

下一篇
Python簡單地實(shí)現(xiàn)一鍵提取陰陽師原畫方法

簡介免費(fèi)學(xué)習(xí)推薦：python視頻教程xpath–簡單的爬蟲實(shí)例–提取陰陽師原畫壁紙文章目錄一、前言二、需要用到的庫三、實(shí)現(xiàn)過程1、分析網(wǎng)頁2、完整代碼實(shí)現(xiàn)四、合成視頻一、前言很多人都玩過陰陽師吧，別的不談，陰陽師的原畫制作的那是相當(dāng)?shù)鼐?xì)，閑暇之余，用幾行簡單的代碼爬取下來，豈不美哉？二、需要用到的庫

相關(guān)資訊

預(yù)約試聽課

已有385人預(yù)約都是免費(fèi)的，你也試試吧...

精品課程

Scratch自學(xué)精品課程(45節(jié)課)目...

官方教程 10、錄制聲音

官方教程 9、制作音樂

官方教程 8、創(chuàng)作故事

官方教程 7、角色動畫

推薦下載

Scratch 3.29.1 Windows版 Mac...

Scratch 3.26.0 Setup Windows...

Scratch 3.26 Mac版本官方下載...

scratchlink 下載

Scratch 3.23.1 Mac版本官方下...

Scratch 3.23.1 Setup Windows...

Scratch 3.22.0 Mac版本官方下...

Scratch 3.22.0 Setup Windows...

標(biāo)簽云

Scratch(112) python(56) 少兒編程(44) 藍(lán)橋杯(32) 小升初(20) Scratch教材(19) 清華大學(xué)出版社(19) 電子學(xué)會(17) 等級考試(15) scratch作品(13) 真題(11) 數(shù)學(xué)(10) 人工智能(10) 算法(9) scratch等級(9) 四級考試(9) 三級考試(9) 電子協(xié)會(9) Scratch下載(9) 字典(6)

猜你喜歡

認(rèn)識Scratch的舞臺

Scratch電子學(xué)會等級考試時間和...

Scratch考試將會在近期進(jìn)行全面...

Scratch編程：培養(yǎng)孩子創(chuàng)新思維...

學(xué)Scratch編程的費(fèi)用一般是多少

Scratch教程：進(jìn)階課程-打地鼠

Scratch教程：進(jìn)階課程-打蝙蝠...

scratch教程判斷 if then

Scratch計算三角形面積

Scratch會飛的巫婆

Scratch迷宮游戲設(shè)計

竹内纱里奈和大战黑人_欧美成人黄色小视频_91福利影视_欧美在线观看视频网站_h色网站免费观看_97综合

資訊內(nèi)容

介紹python 數(shù)據(jù)抓取三種方法

pycharm怎么設(shè)置背景顏色

Python簡單地實(shí)現(xiàn)一鍵提取陰陽師原畫方法

相關(guān)資訊

預(yù)約試聽課