煎蛋网怎么看原图（在煎蛋网爬取美女图片）

2021-11-04 22:12:41 • 用户投稿

煎蛋网站

很多朋友都反应学 python 语言太枯燥，学不进去，其实学语言最好的方法是自己用所学的语言做项目，在项目中学习语言的用法。今天给大家带来的项目是用 python3 爬取煎蛋网妹子的图片。图片质量还不错，我放两张图片大家感受下。

这个项目用了 requests + selenium + beautifulsoup 库对网站的图片进行抓取。接下来我就，给大家一步步解析一下，怎么用 python 爬虫爬取图片并下载的。

爬取结果

以上就是爬取的结果，通过运行 meizi.py 代码,就可以把图片保存在我指定的目录下，如果没有此目录，就用程序自动创建目录，爬取的所有图片都保存在此目录下。

程序构造

程序主要是由 6 个函数组成：

get_html() ：利用 webdriver 来请求对应的网站。
get_page()：解析面跳转地址。
mkdir()：判断目录是否存在，不存在就创建一个。
get_pic()：提取图片链接。
download()：通过图片链接下载保存。
main()：程序执行的主函数。

程序思路

对目标网站链接进行分析，找出目标网站链接的规律。
从目标网站里面提取图片链接。
将图片下载并保存在目录中。

源代码分析

我们通过f12调试页面，看到图片的链接，发现此链接并没有在源代码中，我们推测，图片应该是通过 js 加载的，对于需要 js 才能加载出来的网站，我们就可以利用 selenium 的自动化测试请求库来进行加载。利用 selenium 请求可以模拟真实浏览器访问。

1browser = webdriver.Chrome()

2wait = WebDriverWait(browser, 3)

利用 selenium 请求网页需要下载 chrome 驱动放在 python 安装目录下。

分页链接分析

1def get_page():

2 base_url = 'http://jandan.net/ooxx/' #第一次进入的原始地址

3 soup = BeautifulSoup(get_html(base_url), 'lxml') #解析原始地址

4 current_pages=soup.select('.cp-pagenavi .current-comment-page')[0].get_text()[1:-1] #取出当前页面字段

5 urllist = []

6 for page in range(1,int(current_pages)+1):

7 real_url=base_url+'page-'+str(page)+'#comments' #拼出分页地址

8 urllist.append(real_url)

9 return urllist #返回所有分页地址列表

原始链接　base_url = ‘http://jandan.net/ooxx/’，当我们点击下一页时，发现在原始链接的后面加了一段「page-52#comments」。

其中加的数字，就是表示现在所在的页数，通过 BeautifulSoup 库对页面进行解析，用选择器提取表示页数的字段「current-comment-page」，加入到原始链接中进行拼接。

创建目录

1def get_pic():

2 for url in get_page():

3 mkdir()

4 html=get_html(url)

5 soup=BeautifulSoup(html,'lxml')

6 allimgs=soup.select('div .text p img')

7 allimgs=re.findall('src="(.*?)"',str(allimgs))

8 download(allimgs)

9 print("下载完毕！")

用 os.path.exists 方法来个判断，如果不存在此目录就创建一个，如果存在就忽略。

提取图片

1def get_pic():

2 for url in get_page():

3 mkdir()

4 html=get_html(url)

5 soup=BeautifulSoup(html,'lxml')

6 allimgs=soup.select('div .text p img')

7 allimgs=re.findall('src="(.*?)"',str(allimgs))

8 download(allimgs)

9 print("下载完毕！")

用 BeautifulSoup 解析源码，用选择器循环提取图片的链接，并调用 download() 函数下载图片直至下载所有图片。

优化改进

本次的程序还有一些不足的地方，比如利用 selenium 库在爬取的时候非常的慢，每页我还设置了 3 秒等待时间，这部分待优化。还有所有页面的图片都保存在一个目录下，没有分开保存，这部分也可以优化。

这波教程不点个关注，说不过去吧？哈哈。这个网站有很多福利，我只能说大家注意身体啊。

本文来自投稿，不代表展天博客立场，如若转载，请注明出处：https://www.me900.com/4642.html

用户投稿

控件注册，如何注册ocx控件

用户反馈在win7注册OCX控件系统报错提示错误代码0x80040200，下面就给大家分享注册OCX控件提示错误代码0x80040200解决步骤。 1、打开运行窗口输入cmd，选择点击“cmd.exe”，如下图所示： 2、右击cmd.exe，选择“以管理员身份运行”，如下图所示： 3、输入“regsvr32 xx.ocx”按回车，…

2023-06-25
用户投稿

大雄宝殿内有哪三尊佛（龙华寺大雄宝殿内有哪三尊佛）

菩提只向心觅，何劳向外求玄。听说依此修行，西方只在目前。穿过天王殿就到了佛教寺院中的正殿——大雄宝殿，也有称为大殿的。大雄宝殿是整座寺院的核心建筑，也是僧众朝暮集中修持的地方。大雄宝殿中除供奉本师释迦牟尼佛的佛像外，有的寺院还会在大殿内供奉三世佛像。所供奉的三世佛像，一般有两种组合形式：从时间上讲，为过去世迦叶佛，现在世释迦牟尼佛和末来世…

2022-05-05
用户投稿

免费qq靓号，免费获取QQ靓号：最新攻略，教你轻松获取

对于数字，人们似乎有一种执念，位数越短越好，号码越靓越好，这一点在我们的手机号、车牌号、QQ号等各种号码中都有所体现，都喜欢888和666，不喜欢带有4的，当然，1314除外。尤其是QQ号，记得课小编的账号是在10年左右申请的，申请到了一个9开头的9位数QQ号，然后再申请，就是十位数了，距离小编两年前申请小号，已经是3开头的十位数字，又长又难记，想要再申请…

2023-05-14
用户投稿

一路向西字幕你打算去哪里

@刘伟元的旅行? 大家好，我是新疆乌鲁木齐的山东人，让我们跟着刘伟元的视频镜头，一起畅游我们的大美新疆！看新疆的山山水水，看新疆的风土人情！今天是2023年2月11日，农历正月二十一，由于其他的原因，更或者是时间上的原因吧，一篇文章，从构思，到剪辑、编辑、码字等需要大量的时间，一般来说5~6个小时，才能发布一篇自以为还算比较完整的文章。所以，不知不觉的，本…

2023-06-02
成吉思汗博尔术，博尔术和成吉思汗的关系

只识弯弓射大雕，说的便是一代天骄成吉思汗。在很多人看来，成吉思汗只知道开疆拓土，其实不然。据史书记载，成吉思汗统治期间的蒙古国鼎盛时期疆域可达4400万平方公里，比秦汉唐宋四朝加起来还要大，实在令人叹为观止。不光如此，他的驭人手段也高明，但也很简单，那就是看重才能与忠心。那么成吉思汗是个什么样的人呢？为什么说他的驭人手段高明又简单呢？今天我们就来聊聊成…

2023-07-05 • 用户投稿
维生素b2的作用和功效及副作用，维生素b2对女性的好处

大家对维生素的熟悉或许主要是维生素C，几乎每天都有人都在补充维生素C。维生素 c 而对维生素B2或许比较陌生，其实维生素B2，也在我们身边，先卖个关子，我们先看看维生素B2是什么？维生素B2缺乏会怎么样？ B 族维生素和维生素B2片又名核黄素，是人体中一种水溶性的维生素，体内一旦缺乏维生素B2，会引起阴囊瘙痒、烂嘴角、溢脂性皮炎、结膜炎、舌炎等维生素B…

2023-06-25 • 用户投稿
用户投稿

鬼泣5攻略教程,《鬼泣5》实用入门技巧视频

是尼禄开始控制《鬼泣5》。所以关于尼禄，新手玩家应该不太习惯大部分甚至整场战斗都用剑的战斗流派。所以你在操控尼禄的时候，在远距离射击的同时加上不间断翻滚是一个非常实用的技能。毕竟在《鬼泣》系列中，边滚边拍是《鬼泣5》迄今为止独有的。当你开始用大剑攻击时(当然是在操控尼禄的情况下)，毕竟新手应该无法准确判断三个红点和一个红点，所以你可以腾出一根手指在用大剑砍…

2023-07-10
用户投稿

淘宝云客服，淘宝云客服考试的题目答案

《淘宝云客服：互联网时代的客服新趋势》在当今数字化飞速发展的时代，淘宝云客服作为一种新兴的客服模式，正逐渐引起广泛关注。它仿佛是一颗在电商领域闪耀的新星，给传统客服模式带来了全新的变革和挑战。那么，淘宝云客服到底是什么？它有哪些特点和优势？又将如何影响未来的客服行业呢？一、淘宝云客服的定义与起源淘宝云客服，简单来说，就是依托于云计算技术，将客服服务…

2025-03-06
用户投稿

导入mdf文件，怎样将mdf数据导入sql数据库

以下是一篇关于“导入mdf文件”的文章：一、导入mdf文件的背景与意义在数据库管理和数据处理的领域中，mdf文件是一种常见的数据库文件格式。它可能包含了大量的结构化数据，对于企业、科研机构以及各种数据驱动的应用场景来说，导入mdf文件意味着能够获取和利用其中蕴含的宝贵信息。我觉得就好像是打开了一个装满宝藏的宝箱，里面的每一条数据都可能是我们进一步分析和决…

2025-08-09
用户投稿

施工模拟2012，施工升降机司机考试题库模拟题

百分百题库提供特种工（施工升降机）考试试题、特种工（施工升降机）考试预测题、特种工（施工升降机）考试真题、特种工（施工升降机）证考试题库等,提供在线做题刷题，在线模拟考试，助你考试轻松过关。 46.施工升降机的滑轮、曳引轮应有钢丝绳（）。 A.防跳槽装置 B.闭锁装置 C.防脱装置 D.防卡槽装置答案：C 46.施工升降机附着装置以上的导轨架（）不得超过…

2023-06-30
巡抚相当于现在什么官（古代的巡抚相当于现在什么官）

作为”晚清中兴四大名臣”之一，左宗棠在清末的地位毋庸置疑。他一生虽未按照一般的科考之路步入仕途，但也是从基层起步，最终成为巡抚、总督，乃至军机大臣。因而这样优秀的左宗棠，若是在今天，大抵算是个怎样的官？或者说，巡抚和总督这类的职务，在今天相当于什么职务？巡抚和总督，其实都不是清代的产物。”巡抚”一词最早见于南…

2022-05-06 • 用户投稿
qq电脑管家和360哪个好，电脑安全管家软件哪个好

大家好，关于解答：新系统选择360还是腾讯管家好？每日壁纸 · 长按保存本周话题：360安全卫士和腾讯管家该选择哪个好？开始之前，小白做一个大胆的预判，留言区肯定有不少裸机的用户先投个票看看有多少人！说实话小白是不建议大家随随便便裸机（什么安全软件都不装）的，因为小白知道大家的水平不一样，而电脑上涉及隐私、金钱的内容，不…

2023-06-23 • 用户投稿

煎蛋网怎么看原图（在煎蛋网爬取美女图片）

相关推荐