日本的两大动漫hyrz和hzw

时间:2021-5-20 作者:花小时

开始前,先表明,纯属个人意见。

个人认为火影比海贼王更好看,从根本意义上讲,海贼王已经不如火影忍者了,因为海贼王这看起来像海军是反派,海贼是正派一样,比如赤犬杀了艾斯,一群人就骂他,在此不多描述,而火影从根本也没什么好讲的,因为整个构造都是想出来的,再说说从深的意义来讲,火影的内涵绝对比海贼要多的多,火影一开始讲团结,友爱之类的后期讲战争,和平,人心,因果关系之类的,非常有内涵,而海贼从目前为止只是团结,友爱之类的,再从剧情上讲,火影与海贼的前期剧情都无比生动,但海贼后期拖泥带水,以至于让我产生了反感,并没感觉有什么作用,只不过在耗时间罢了,再看火影,虽然回忆杀有许许多多,但都是构造出完整的体系,每个角色都有丰富的故事,而且火影做的铺垫真的特别好,尤其是鼬灭全族,看到那时,我的心情真的不知如何来描述,再看看海贼,没啥铺垫,不能让人产生那种流连忘返的感觉。说到这里,大家恐怕都说我说火影好的,海贼坏的,那反过来说,海贼好的,热血哇,打斗场景都好,抱歉火影也都有,只能这么说海贼好的优点火影有,火影的优点海贼没有,尤其是那内涵,海贼真的太贫乏了。就这样,纯属个人意见,勿喷,谢谢@火影手游二营长你也来说说嘛。

中年大叔学编程-Python下载海贼王漫画图片

虽然一把年纪了,但是也追过几年的海贼王,总感觉动漫更新得比较慢,所以就想着提前预知剧情,就去看看漫画来满足自己的好奇心。每次都需要去漫画的网站一个个看,觉得还是比较麻烦,最近才学了Python,所以就想着用Python把现在更新完的漫画下载下来。

日本的两大动漫hyrz和hzw

这里我们需要两个组件:

日本的两大动漫hyrz和hzw

PyQuery 主要用于解析htmlRequests 主要用于请求图片获取文件流selenium 加载网页那么我们先来简单分析一下页面结构吧,

日本的两大动漫hyrz和hzw

日本的两大动漫hyrz和hzw

从截图中,我们可以看到每个章节就是个超链接,它的dom结构是id为chapter-list-4的ul下的li节点中,那么我们就先解析出这些超链接地址,PyQuery的安装就不再细说了,直接使用pip install PyQuery即可(不出意外的话是可以正常使用了),

日本的两大动漫hyrz和hzw

from pyquery import PyQuery as pqpage = pq(url="}

日本的两大动漫hyrz和hzw

初步效果有了,我们再继续看看详细的动漫页面

日本的两大动漫hyrz和hzw

我们可以看到页面结构、图片路径以及图片页数,当我们点击下一页的时候,URL和图片都有所变化

好,这里,我们就可以来获取我们的图片了

from pyquery import PyQuery as pqfrom selenium import webdriverimport requestsbrowser = webdriver.Chrome()browser.get('}

现在我们再来结合之前的获取到的地址,来全量下载吧,来看看最终代码

from pyquery import PyQuery as pqfrom selenium import webdriverimport requestsimport osbrowser = webdriver.Chrome()def get_pic(source_url, file_path, index): url = source_url if index > 1: url = url+"#p="+str(index) browser.get(url) # 浏览器加载的地址 browser.refresh() # 刷新浏览器 page = pq(browser.page_source) images = page("#images") img_url = images.find('img').attr.src page_total = images.find('p').text() page_total = page_total.split('/')[1].replace(')', '') # 获取漫画页数 response = requests.get(img_url) with open(file_path+str(index)+'.jpg', 'wb') as f: # 保存图片 f.write(response.content) if index < int(page_total): get_pic(source_url, file_path, index+1) # 递归获取网页中的图片def get_page(url): page = pq(url=url, encoding='utf-8') lias = page("#chapter-list-4").find('li').find('a').items() for a in lias: folder='F:/hzw/'+a.text() # isExists=os.path.exists(folder) # 检查文件夹是否存在 if not isExists: # 如果不存在则新建文件夹 os.makedirs(folder) get_pic('}

是不是感觉有点意思呢?

我只是记录我的学习过程,由于书读的少,可能很多地方表述或者是理解得不对,请轻喷并指正。

声明:本文内容由互联网用户自发贡献自行上传,本网站不拥有所有权,未作人工编辑处理,也不承担相关法律责任。如果您发现有涉嫌版权的内容,欢迎发送邮件至:1@qq.com 进行举报,并提供相关证据,工作人员会在5个工作日内联系你,一经查实,本站将立刻删除涉嫌侵权内容。