您現(xiàn)在的位置是：首頁 » python編程資訊

資訊內(nèi)容

介紹python60行代碼寫一個簡單的筆趣閣爬蟲

極客小將2021-01-16-

簡介推薦（免費）：Python視頻教程文章目錄系列文章目錄前言一、網(wǎng)頁解析二、代碼填寫1.獲取Html及寫入方法2.其余代碼總結(jié)前言利用python寫一個簡單的筆趣閣爬蟲，根據(jù)輸入的小說網(wǎng)址爬取整個小說并保存到txt文件。爬蟲用到了BeautifulSoup庫的select方法結(jié)果如圖所示：本文只用于學

j27少兒編程網(wǎng)-Scratch_Python_教程_免費兒童編程學習平臺

推薦（免費）：python視頻教程j27少兒編程網(wǎng)-Scratch_Python_教程_免費兒童編程學習平臺

文章目錄j27少兒編程網(wǎng)-Scratch_Python_教程_免費兒童編程學習平臺

系列文章目錄前言一、網(wǎng)頁解析二、代碼填寫1.獲取Html及寫入方法2.其余代碼總結(jié)

前言j27少兒編程網(wǎng)-Scratch_Python_教程_免費兒童編程學習平臺

j27少兒編程網(wǎng)-Scratch_Python_教程_免費兒童編程學習平臺

利用python寫一個簡單的筆趣閣爬蟲，根據(jù)輸入的小說網(wǎng)址爬取整個小說并保存到txt文件。爬蟲用到了BeautifulSoup庫的select方法
結(jié)果如圖所示：

本文只用于學習爬蟲j27少兒編程網(wǎng)-Scratch_Python_教程_免費兒童編程學習平臺

j27少兒編程網(wǎng)-Scratch_Python_教程_免費兒童編程學習平臺

一、網(wǎng)頁解析j27少兒編程網(wǎng)-Scratch_Python_教程_免費兒童編程學習平臺

這里以斗羅大陸小說為例網(wǎng)址：
http://www.biquge001.com/Book/2/2486/

可以發(fā)現(xiàn)每章的網(wǎng)頁地址和章節(jié)名都放在了 <"p id=list dl dd a>中的a標簽中，所以利用BeautfulSoup中的select方法可以得到網(wǎng)址和章節(jié)名j27少兒編程網(wǎng)-Scratch_Python_教程_免費兒童編程學習平臺

Tag = BeautifulSoup(getHtmlText(url), "html.parser") #這里的getHtmlText是自己寫的獲取html的方法urls = Tag.select("p #list dl dd a")

然后遍歷列表j27少兒編程網(wǎng)-Scratch_Python_教程_免費兒童編程學習平臺

for url in urls: href = "http://www.biquge001.com/" + url['href'] # 字符串的拼接拼接成正確的網(wǎng)址 pageName = url.text # 每章的章名

然后每章小說的內(nèi)容都存放在<p id=“content” 里同理得
j27少兒編程網(wǎng)-Scratch_Python_教程_免費兒童編程學習平臺

substance = Tag.select("p #content") # 文章的內(nèi)容

**后同理在首頁獲取小說的名稱
<"p id = info h1>j27少兒編程網(wǎng)-Scratch_Python_教程_免費兒童編程學習平臺

j27少兒編程網(wǎng)-Scratch_Python_教程_免費兒童編程學習平臺

bookName = Tag.select("p #info h1")

j27少兒編程網(wǎng)-Scratch_Python_教程_免費兒童編程學習平臺

二、代碼填寫j27少兒編程網(wǎng)-Scratch_Python_教程_免費兒童編程學習平臺

1.獲取Html及寫入方法j27少兒編程網(wǎng)-Scratch_Python_教程_免費兒童編程學習平臺

def getHtmlText(url): r = requests.get(url, headers=headers) r.encoding = r.apparent_encoding # 編碼轉(zhuǎn)換 r.raise_for_status() return r.textdef writeIntoTxt(filename, content): with open(filename, "w", encoding="utf-8") as f: f.write(content) f.close() print(filename + "已完成")

2.其余代碼j27少兒編程網(wǎng)-Scratch_Python_教程_免費兒童編程學習平臺

代碼如下（示例）：j27少兒編程網(wǎng)-Scratch_Python_教程_免費兒童編程學習平臺

url = "http://www.biquge001.com/Book/2/2486/"substanceStr = ""bookName1 = ""html = getHtmlText(url)# 判斷是否存在這個文件Tag = BeautifulSoup(getHtmlText(url), "html.parser")urls = Tag.select("p #list dl dd a")bookName = Tag.select("p #info h1")for i in bookName: bookName1 = i.textif not os.path.exists(bookName1): os.mkdir(bookName1) print(bookName1 + "創(chuàng)建完成")else: print("文件已創(chuàng)建")for url in urls: href = "http://www.biquge001.com/" + url['href'] # 字符串的拼接拼接成正確的網(wǎng)址 pageName = url.text # 每章的章名 path = bookName1 + "\" # 路徑 fileName = path + url.text + ".txt" # 文件名 = 路徑 + 章節(jié)名 + ".txt" Tag = BeautifulSoup(getHtmlText(href), "html.parser") # 解析每張的網(wǎng)頁 substance = Tag.select("p #content") # 文章的內(nèi)容 for i in substance: substanceStr = i.text writeIntoTxt(fileName, substanceStr) time.sleep(1)

j27少兒編程網(wǎng)-Scratch_Python_教程_免費兒童編程學習平臺

總結(jié)j27少兒編程網(wǎng)-Scratch_Python_教程_免費兒童編程學習平臺

簡單利用了BeautfulSoup的select方法對筆趣閣的網(wǎng)頁進行了爬取 j27少兒編程網(wǎng)-Scratch_Python_教程_免費兒童編程學習平臺

更多相關(guān)學習敬請關(guān)注python教程欄目！

以上就是介紹python60行代碼寫一個簡單的筆趣閣爬蟲的詳細內(nèi)容，更多請關(guān)注少兒編程網(wǎng)其它相關(guān)文章！j27少兒編程網(wǎng)-Scratch_Python_教程_免費兒童編程學習平臺

上一篇
Python數(shù)據(jù)分析實戰(zhàn)之概述數(shù)據(jù)分析

簡介Python教程欄目介紹概述數(shù)據(jù)。推薦（免費）：Python教程文章目錄一、入門數(shù)據(jù)分析1.大數(shù)據(jù)時代的基本面2.數(shù)據(jù)分析師職業(yè)前景3.成為數(shù)據(jù)分析師之路二、Python的安裝與環(huán)境配置1.Python版本2.不同系統(tǒng)安裝Python3.環(huán)境變量配置4.安裝pip5.集成開發(fā)環(huán)境選擇三、Anacon

下一篇
Python培訓機構(gòu)靠譜嗎？Python培訓機構(gòu)怎么選？

簡介近幾年，網(wǎng)絡(luò)浪潮涌起，而Python市場一直是人才稀缺。Python語言簡單易學，就業(yè)前景廣自然也獲得了年輕人的青睞。Python培訓機構(gòu)靠譜嗎？Python培訓機構(gòu)怎么選？是每位學習者的糾結(jié)點，那么一個合格的Python培訓機構(gòu)是什么樣子的呢？跟隨小編篩一篩。一、培訓機構(gòu)地理位置就拿北京來說，哪個

相關(guān)資訊

預(yù)約試聽課

已有385人預(yù)約都是免費的，你也試試吧...

精品課程

Scratch自學精品課程(45節(jié)課)目...

官方教程 10、錄制聲音

官方教程 9、制作音樂

官方教程 8、創(chuàng)作故事

官方教程 7、角色動畫

推薦下載

Scratch 3.29.1 Windows版 Mac...

Scratch 3.26.0 Setup Windows...

Scratch 3.26 Mac版本官方下載...

scratchlink 下載

Scratch 3.23.1 Mac版本官方下...

Scratch 3.23.1 Setup Windows...

Scratch 3.22.0 Mac版本官方下...

Scratch 3.22.0 Setup Windows...

標簽云

Scratch(112) python(56) 少兒編程(44) 藍橋杯(32) 小升初(20) Scratch教材(19) 清華大學出版社(19) 電子學會(17) 等級考試(15) scratch作品(13) 真題(11) 數(shù)學(10) 人工智能(10) 算法(9) scratch等級(9) 四級考試(9) 三級考試(9) 電子協(xié)會(9) Scratch下載(9) 字典(6)

猜你喜歡

認識Scratch的舞臺

Scratch電子學會等級考試時間和...

Scratch考試將會在近期進行全面...

Scratch編程：培養(yǎng)孩子創(chuàng)新思維...

學Scratch編程的費用一般是多少

Scratch教程：進階課程-打地鼠

Scratch教程：進階課程-打蝙蝠...

scratch教程判斷 if then

Scratch計算三角形面積

Scratch會飛的巫婆

Scratch迷宮游戲設(shè)計

竹内纱里奈和大战黑人_欧美成人黄色小视频_91福利影视_欧美在线观看视频网站_h色网站免费观看_97综合

資訊內(nèi)容

介紹python60行代碼寫一個簡單的筆趣閣爬蟲

Python數(shù)據(jù)分析實戰(zhàn)之 概述數(shù)據(jù)分析

Python培訓機構(gòu)靠譜嗎？Python培訓機構(gòu)怎么選？

相關(guān)資訊

預(yù)約試聽課

Python數(shù)據(jù)分析實戰(zhàn)之概述數(shù)據(jù)分析

Python培訓機構(gòu)靠譜嗎？Python培訓機構(gòu)怎么選？