煎蛋网怎么看原图(在煎蛋网爬取美女图片)

煎蛋网站

 

很多朋友都反应学 python 语言太枯燥,学不进去,其实学语言最好的方法是自己用所学的语言做项目,在项目中学习语言的用法。今天给大家带来的项目是用 python3 爬取煎蛋网妹子的图片。图片质量还不错,我放两张图片大家感受下。

 

 

这个项目用了 requests + selenium + beautifulsoup 库对网站的图片进行抓取。接下来我就,给大家一步步解析一下,怎么用 python 爬虫爬取图片并下载的。

爬取结果

 

以上就是爬取的结果,通过运行 meizi.py 代码,就可以把图片保存在我指定的目录下,如果没有此目录,就用程序自动创建目录,爬取的所有图片都保存在此目录下。

程序构造

 

程序主要是由 6 个函数组成:

  • get_html() :利用 webdriver 来请求对应的网站。
  • get_page():解析面跳转地址。
  • mkdir():判断目录是否存在,不存在就创建一个。
  • get_pic():提取图片链接。
  • download():通过图片链接下载保存。
  • main():程序执行的主函数。

程序思路

  1. 对目标网站链接进行分析,找出目标网站链接的规律。
  2. 从目标网站里面提取图片链接。
  3. 将图片下载并保存在目录中。

源代码分析

我们通过f12调试页面,看到图片的链接,发现此链接并没有在源代码中,我们推测,图片应该是通过 js 加载的,对于需要 js 才能加载出来的网站,我们就可以利用 selenium 的自动化测试请求库来进行加载。利用 selenium 请求可以模拟真实浏览器访问。

1browser = webdriver.Chrome()

2wait = WebDriverWait(browser, 3)

利用 selenium 请求网页需要下载 chrome 驱动放在 python 安装目录下。

分页链接分析

1def get_page():

2 base_url = 'http://jandan.net/ooxx/' #第一次进入的原始地址

3 soup = BeautifulSoup(get_html(base_url), 'lxml') #解析原始地址

4 current_pages=soup.select('.cp-pagenavi .current-comment-page')[0].get_text()[1:-1] #取出当前页面字段

5 urllist = []

6 for page in range(1,int(current_pages)+1):

7 real_url=base_url+'page-'+str(page)+'#comments' #拼出分页地址

8 urllist.append(real_url)

9 return urllist #返回所有分页地址列表

原始链接 base_url = ‘http://jandan.net/ooxx/’,当我们点击下一页时,发现在原始链接的后面加了一段「page-52#comments」。

其中加的数字,就是表示现在所在的页数,通过 BeautifulSoup 库对页面进行解析,用选择器提取表示页数的字段「current-comment-page」,加入到原始链接中进行拼接。

创建目录

1def get_pic():

2 for url in get_page():

3 mkdir()

4 html=get_html(url)

5 soup=BeautifulSoup(html,'lxml')

6 allimgs=soup.select('div .text p img')

7 allimgs=re.findall('src="(.*?)"',str(allimgs))

8 download(allimgs)

9 print("下载完毕!")

用 os.path.exists 方法来个判断,如果不存在此目录就创建一个,如果存在就忽略。

提取图片

1def get_pic():

2 for url in get_page():

3 mkdir()

4 html=get_html(url)

5 soup=BeautifulSoup(html,'lxml')

6 allimgs=soup.select('div .text p img')

7 allimgs=re.findall('src="(.*?)"',str(allimgs))

8 download(allimgs)

9 print("下载完毕!")

用 BeautifulSoup 解析源码,用选择器循环提取图片的链接,并调用 download() 函数下载图片直至下载所有图片。

优化改进

本次的程序还有一些不足的地方,比如利用 selenium 库在爬取的时候非常的慢,每页我还设置了 3 秒等待时间,这部分待优化。还有所有页面的图片都保存在一个目录下,没有分开保存,这部分也可以优化。

这波教程不点个关注,说不过去吧?哈哈。这个网站有很多福利,我只能说大家注意身体啊。

本文来自投稿,不代表展天博客立场,如若转载,请注明出处:https://www.me900.com/4642.html

(0)

相关推荐

  • 电脑租赁app,租电脑什么价格

    电脑租赁价格怎么算?按月租电脑多少钱? 随着科技的飞速发展,电脑在日常生活和工作中扮演着越来越重要。然而购买电脑对于许多人来说可能是一笔不小的开支。因此越来越多的人开始选择租赁电脑,以降低成本并灵活使用。 电脑租赁价格是如何计算的呢?花费多少钱?今天就给大家解答这些问题。 电脑租赁价格的计算因素。电脑租赁价格主要受以下几个因素的影响:电脑的品牌和型号。不同品…

    2023-07-06
  • debian源,debian镜像源

    《关于Debian源的深入探讨》 一、什么是Debian源 Debian源,简单来说可能就是Debian操作系统用于获取软件包的地方。就好像我们在生活中需要去不同的商店购买各种生活用品一样,Debian系统也需要从特定的源那里获取它运行所需的各种软件包。这些源就像是软件的仓库,里面存放着各种各样的软件版本供系统选择和安装。 Debian是一个非常流行的开源操…

    2025-08-24
  • 电脑bios设置详解,电脑bios设置详解中英文对照

    本文详细介绍了电脑BIOS设置,分享给大家学习。如学有所得,请动动小手,帮忙点赞。  

    2023-07-07 用户投稿
  • 饰品店怎么取名(饰品网店名字大全)

    有的人说,当今时代国民经济水平飞速发展,销售业与服务业这类的第三产业也有了卓越的进步。十分典型的一个例子就是网购,自从国内网购平台全面发展,以及有关行业的完善。网购已经从最早的独立网店逐步演变,形成了当下十分完整的销售产业链,成为了国内销售行业发展的契机。所以,在当下的这种消费狂热时代里,开一家店铺是能够有机会获利的。如果你是有想法和创意的创业者,不妨就开一…

    2022-05-05
  • 淘宝特价版入驻入口,怎么入驻淘宝特价版需要哪些条件

    现在的电商竞争已非常激烈,拼多多的低价团购模式圈了不少粉,这使得淘宝的流量受到了一定的冲击,要怎么挽回这一局呢?淘宝推出了淘宝特价版app!对于卖家来说,能成功入驻无疑能给自己带来更多流量,要怎么入驻呢? 我们说过,淘宝特价版,主攻低价市场。所以,低价,低价,就是核心。但是按照淘宝一贯的作风,低价不意味着假货,低质量的。这样你又理解错了!拼多多的教训,淘宝是…

    2023-06-27
  • 山外有山天外有天的诗句,飞鸟文章素材

    飞鸟的文章 在头条发布文章,首先是一个学习提高的过程。 因为在这里,有高手云集,有各行各业的精英,有学者,有各个专业门类的实干者。 有经济领域,科技前沿,医学尖端,有艺术精髓,也有上层建筑的高端延伸。 当然更有普通百姓的喜怒哀乐,以及他们的家庭幸福,精神面貌等方面的真实写照。那就是一幅幅无比生动美好的生活画面。 在头条号里,可以看到美妙绝伦的风景图片,那是摄…

    2023-06-05
  • 什么叫有效数字(按有效数字规则计算)

    今天的是个困难题,因为前一百道我都做过了,时间久了,不记得当时是怎么做的了。 有效数字(按顺序)可以分成以下几个部分: 一个 小数 或者 整数(可选)一个 ‘e’ 或 ‘E’ ,后面跟着一个 整数小数(按顺序)可以分成以下几个部分: (可选)一个符号字符(’+’ 或 ‘-&#…

    用户投稿 2023-05-29
  • 克莉丝汀翡翠卡 如何购买 如何选择 哪里有卖

    每一个时代都孕育了各自的时尚风潮,承载了时代风华的服装与发型随着时间逐渐消逝不见,而永续流传的高级珠宝却未曾改变丝毫。那些凝聚了潮流风尚的珠宝,如同一件件璀璨而生动的化石,记录着每个时代的风格变迁。这个夏天,一场名为“When Elegance Meets Art雅艺之美”的古董珠宝展在北京今日美术馆上演,近360件Van Cleef & Arpe…

    用户投稿 2023-05-23
  • dnf51宝珠,dnf春节收集箱多少钱

    叒进行了一波更新,现在的51收集箱和过年收集箱属性可以叠加了,那么是否是这样呢,下面来个简单的测试。 首先这是收集箱什么都不放的面板,智力2811,独立2273,光强231   接着把两个收集箱都放入宝珠和卡片,多了84点独立,30点四维以及4点属强。   关掉收集箱页面,可以看到,确实涨了30点智力,独立涨了84,属强高了4点 &nbs…

    2023-07-11
  • 域名出租,域名出租

    《域名出租:一个充满机遇与挑战的领域》 一、域名出租的基本概念 域名出租,简单来说,就是将自己拥有的域名出租给他人使用。就好像你有一套闲置的房子,你可以将它出租给别人居住一样。域名是在互联网上用于标识和定位网站的地址,它具有唯一性和识别性。当一个企业或个人需要一个网站来展示自己的产品或服务时,他们就需要购买一个域名。而对于一些不需要长期拥有域名的人来说,域名…

    用户投稿 2025-08-16
  • 看广告挣钱app一次多少钱(看广告赚话费)

    对于在家妈宝、休闲上班族、寻找兼职的朋友们应该或多或少都有想过用手机兼职赚钱的想法,盲目地下载视频广告里的各种赚钱app,更有甚者很多朋友都被骗过,各种虚假广告得不偿失。 我自己最开始的时候也就只有抖音一个休闲软件,当然那时候不是为了刷金币赚钱,只是闲来无事的时候打发时间。直到有一天看到一个老铁的看文章刷金币分享视频,那时候就开始心动了。考虑到自己白天上班时…

    用户投稿 2021-10-29