煎蛋网怎么看原图(在煎蛋网爬取美女图片)

煎蛋网站

 

很多朋友都反应学 python 语言太枯燥,学不进去,其实学语言最好的方法是自己用所学的语言做项目,在项目中学习语言的用法。今天给大家带来的项目是用 python3 爬取煎蛋网妹子的图片。图片质量还不错,我放两张图片大家感受下。

 

 

这个项目用了 requests + selenium + beautifulsoup 库对网站的图片进行抓取。接下来我就,给大家一步步解析一下,怎么用 python 爬虫爬取图片并下载的。

爬取结果

 

以上就是爬取的结果,通过运行 meizi.py 代码,就可以把图片保存在我指定的目录下,如果没有此目录,就用程序自动创建目录,爬取的所有图片都保存在此目录下。

程序构造

 

程序主要是由 6 个函数组成:

  • get_html() :利用 webdriver 来请求对应的网站。
  • get_page():解析面跳转地址。
  • mkdir():判断目录是否存在,不存在就创建一个。
  • get_pic():提取图片链接。
  • download():通过图片链接下载保存。
  • main():程序执行的主函数。

程序思路

  1. 对目标网站链接进行分析,找出目标网站链接的规律。
  2. 从目标网站里面提取图片链接。
  3. 将图片下载并保存在目录中。

源代码分析

我们通过f12调试页面,看到图片的链接,发现此链接并没有在源代码中,我们推测,图片应该是通过 js 加载的,对于需要 js 才能加载出来的网站,我们就可以利用 selenium 的自动化测试请求库来进行加载。利用 selenium 请求可以模拟真实浏览器访问。

1browser = webdriver.Chrome()

2wait = WebDriverWait(browser, 3)

利用 selenium 请求网页需要下载 chrome 驱动放在 python 安装目录下。

分页链接分析

1def get_page():

2 base_url = 'http://jandan.net/ooxx/' #第一次进入的原始地址

3 soup = BeautifulSoup(get_html(base_url), 'lxml') #解析原始地址

4 current_pages=soup.select('.cp-pagenavi .current-comment-page')[0].get_text()[1:-1] #取出当前页面字段

5 urllist = []

6 for page in range(1,int(current_pages)+1):

7 real_url=base_url+'page-'+str(page)+'#comments' #拼出分页地址

8 urllist.append(real_url)

9 return urllist #返回所有分页地址列表

原始链接 base_url = ‘http://jandan.net/ooxx/’,当我们点击下一页时,发现在原始链接的后面加了一段「page-52#comments」。

其中加的数字,就是表示现在所在的页数,通过 BeautifulSoup 库对页面进行解析,用选择器提取表示页数的字段「current-comment-page」,加入到原始链接中进行拼接。

创建目录

1def get_pic():

2 for url in get_page():

3 mkdir()

4 html=get_html(url)

5 soup=BeautifulSoup(html,'lxml')

6 allimgs=soup.select('div .text p img')

7 allimgs=re.findall('src="(.*?)"',str(allimgs))

8 download(allimgs)

9 print("下载完毕!")

用 os.path.exists 方法来个判断,如果不存在此目录就创建一个,如果存在就忽略。

提取图片

1def get_pic():

2 for url in get_page():

3 mkdir()

4 html=get_html(url)

5 soup=BeautifulSoup(html,'lxml')

6 allimgs=soup.select('div .text p img')

7 allimgs=re.findall('src="(.*?)"',str(allimgs))

8 download(allimgs)

9 print("下载完毕!")

用 BeautifulSoup 解析源码,用选择器循环提取图片的链接,并调用 download() 函数下载图片直至下载所有图片。

优化改进

本次的程序还有一些不足的地方,比如利用 selenium 库在爬取的时候非常的慢,每页我还设置了 3 秒等待时间,这部分待优化。还有所有页面的图片都保存在一个目录下,没有分开保存,这部分也可以优化。

这波教程不点个关注,说不过去吧?哈哈。这个网站有很多福利,我只能说大家注意身体啊。

本站部分内容由互联网用户自发贡献,该文观点仅代表作者本人,本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。

如发现本站有涉嫌抄袭侵权/违法违规等内容,请联系我们举报!一经查实,本站将立刻删除。

(0)

相关推荐

  • 干燥剂有毒吗,食品干燥剂有什么

    大家好,今天我要来给大家分享一下,食品干燥剂的使用小妙招。因为我们平时家里,在买很多食品的时候,一般他们都会往里面,放入一些干燥剂。像我们也很爱吃的瓜子、海苔、干果这些食品,都是必带干燥剂的。 在面对这些干燥剂的时候,大多数朋友都是直接扔掉了,你以前是不是也是这样一种行为呢?如果你也是直接扔掉的话,未免就太可惜了。因为这些干燥剂,还有很好的废物利用方式,只是…

    2023-06-29
  • 少林寺武僧团培训基地 ,中国嵩山少林寺武僧团培训基地

    昨日,我校举行了嵩山少林寺武僧团培训基地教育集团第二季度武术考核表彰大会,对此次武术考核中成绩优异的系给予奖励,希望他们通过此次的考核比赛能够再接再厉,再创佳绩。 少林之源,传承最正宗的少林功夫。少林之禅,发扬最精髓的禅武文化。少林之魂,演绎正气的中华武术魂! 相信嵩山少林寺武僧团培训基地教育集团的学员们有信心在此次武术节中取得优异成绩,用实际行动为第十一届…

    2023-06-07 用户投稿
  • 三国群英传8武将编号,三国英雄属性

    三国杀武将编号总表编号WEISHUWUQUNLEEMSPG.SPOLJ.SP001曹操(标、界)刘备(标、界)孙权华佗(标、界)关羽刘备杨修周瑜袁术孙尚香002司马懿(标、界)关羽(标、界)甘宁(标、界)吕布(标、界)吕蒙张角小乔诸葛恪马超003夏侯惇(标、界)张飞(标、界)吕蒙(标、界)貂蝉(标、SP)周瑜孙权关羽004张辽(标、界)诸葛亮(迟暮的丞相) …

    用户投稿 2023-06-25
  • 产品附加值 免费售后服务 免费售后服务的优

    近年来,国内各个行业都在以令人惊叹的速度发展着,在这其中,对人们生活影响最大的,应该就是移动信息技术产业了。作为移动互联网的终端,手机也随着移动信息技术产业的发展不断更新着自己的角色,随之而来的,便是手机行业使劲浑身解数,渴望产品能够得到消费者的认可。 所谓的“服务升级” 早些年,厂商们通过性价比拴住用户的心,而现在,这一招可能不管用了。生活品质的提高,性价…

    用户投稿 2023-05-22
  • 阿里指数,阿里指数怎么没有了

    《阿里指数:网站SEO运营的重要利器》 在网站SEO运营的领域中,阿里指数无疑是一个极具价值的工具。 它就像是一位隐藏在互联网背后的神秘智者,为我们提供了关于市场趋势、热门商品、消费者行为等诸多方面的宝贵信息。 或许你会疑惑,一个专注于电商领域的指数,怎么能对网站SEO运营产生如此重要的影响呢?让我们一起深入探索阿里指数的奥秘吧。 一、阿里指数是什么? 阿里…

    用户投稿 2025-02-28
  • erp项目是什么意思(erp工程师是什么意思啊)

    先看一份数据! 来自于国家统计局的近15年来北京市各行业的平均工资(年收入,单位为元),数据来自于官方 排第1,金融业,2020年平均薪酬为260508元。 排第2,信息传输、计算机服务和软件业,2020年平均薪酬为259729元。 排第3,文化、体育和娱乐业,2020年平均薪酬为221193元。 排第4,卫生、社会保障和社会福利业,2020年平均薪酬为20…

    2022-05-06
  • softfsb超频软件,内存超频教程

    内存超频是一种提高计算机性能的有效方式,它能够提高内存的时钟频率和带宽,从而加快计算机的运行速度。本文将为大家提供一份简单的内存超频教程,并通过性能对比测试,探讨内存超频对计算机性能的影响。   首先,让我们了解一些超频的基础知识。内存超频是通过增加内存控制器的时钟频率和更改内存的时序来实现的。内存控制器的时钟频率通常以MHz为单位,内存的时序则由…

    2023-07-09
  • 旺旺批量加好友,旺旺怎么批量发送消息

    《旺旺批量加好友:从原理到实操》 在如今的互联网时代,社交网络成为了人们生活中不可或缺的一部分。 而旺旺作为一款常用的商务沟通工具,其批量加好友功能也备受关注。 也许你会好奇,旺旺批量加好友到底是怎么回事?它有哪些技巧和注意事项呢?接下来,我将带你深入探讨这个话题。 一、旺旺批量加好友的原理 旺旺批量加好友的原理其实并不复杂。 它主要是通过程序或脚本自动执行…

    用户投稿 2025-02-16
  • 数码宝贝网页游戏,游戏厅数码宝贝游戏

    经典《数码宝贝》系列TV动画新作《数码宝贝 幽魂游戏(Ghost Game)》正在热播中,日前官方公开了最新伽玛兽特别艺图以及新话预告,最新32话《你是谁》将于7月3日播出,敬请期待。 ?《数码宝贝 幽魂游戏》的故事舞台位于“非常近的未来世界”,当时的SNS流传着不知真假“全息幽魂”的奇怪现象传言,少年天河宙靠着父亲遗留的装置可以清楚看见数码宝贝,与父亲留下…

    2023-07-05
  • 美容面部提升,怎样圆脸变成瓜子脸

    我今年47岁了,快奔5的年龄,脸上肉比较多,自从上了年纪之后,松垂的厉害。尤其是中面部的法令纹,脸颊的组织堆积在两侧,原来的小圆脸也变成了“U型”脸,真是看不下去。 术前照片: 下面亲身经历,术前术后的真实感受,和大家说道说道。 1、不疼是真,可紧绷麻木也难受 手术是静脉睡眠麻醉,睡一觉就结束了,当然感觉不到疼痛,即使是术后第一、二天,也没多疼,只能说脸木木…

    2023-07-09 用户投稿
  • 莫雷谈及的重要性:探索莫雷如何影响我们的生

    Q:在常规赛开始前,你拒绝给自己休赛期的操作打分,你说“功过自有他人评说。”那现在你愿意给休赛期的操作一个评分吗? 莫雷:“我觉得在季后赛结束之前,你们都不能给我们的表现盖棺定论。我不是在试图回避你的问题,但我认为季后赛才是衡量一名总经理工作是否成功的唯一标准。你的球队打了82场比赛,并且他们打得还算不错,但即使这样人们还是根据一些随机事件来对你评头论足。我…

    用户投稿 2023-06-05
  • 拼多多虚拟网店怎么开(虚拟网店的开店流程)

      拼多多怎么开虚拟商品店?   很多小伙伴都想在品多多开一家虚拟商品店,但是不知道怎么操作。那么,我们来给你解释一下。   拼多多开虚拟用品店时如何在品多多开虚拟用品店?   1.打开品多多,选择官网进入。在品多多首页,点击顶部导航栏的【商户结算】进入。   2.输入手机号码,完成验证,点击下面的[回车]。…

    用户投稿 2022-05-05