煎蛋网怎么看原图(在煎蛋网爬取美女图片)

煎蛋网站

 

很多朋友都反应学 python 语言太枯燥,学不进去,其实学语言最好的方法是自己用所学的语言做项目,在项目中学习语言的用法。今天给大家带来的项目是用 python3 爬取煎蛋网妹子的图片。图片质量还不错,我放两张图片大家感受下。

 

 

这个项目用了 requests + selenium + beautifulsoup 库对网站的图片进行抓取。接下来我就,给大家一步步解析一下,怎么用 python 爬虫爬取图片并下载的。

爬取结果

 

以上就是爬取的结果,通过运行 meizi.py 代码,就可以把图片保存在我指定的目录下,如果没有此目录,就用程序自动创建目录,爬取的所有图片都保存在此目录下。

程序构造

 

程序主要是由 6 个函数组成:

  • get_html() :利用 webdriver 来请求对应的网站。
  • get_page():解析面跳转地址。
  • mkdir():判断目录是否存在,不存在就创建一个。
  • get_pic():提取图片链接。
  • download():通过图片链接下载保存。
  • main():程序执行的主函数。

程序思路

  1. 对目标网站链接进行分析,找出目标网站链接的规律。
  2. 从目标网站里面提取图片链接。
  3. 将图片下载并保存在目录中。

源代码分析

我们通过f12调试页面,看到图片的链接,发现此链接并没有在源代码中,我们推测,图片应该是通过 js 加载的,对于需要 js 才能加载出来的网站,我们就可以利用 selenium 的自动化测试请求库来进行加载。利用 selenium 请求可以模拟真实浏览器访问。

1browser = webdriver.Chrome()

2wait = WebDriverWait(browser, 3)

利用 selenium 请求网页需要下载 chrome 驱动放在 python 安装目录下。

分页链接分析

1def get_page():

2 base_url = 'http://jandan.net/ooxx/' #第一次进入的原始地址

3 soup = BeautifulSoup(get_html(base_url), 'lxml') #解析原始地址

4 current_pages=soup.select('.cp-pagenavi .current-comment-page')[0].get_text()[1:-1] #取出当前页面字段

5 urllist = []

6 for page in range(1,int(current_pages)+1):

7 real_url=base_url+'page-'+str(page)+'#comments' #拼出分页地址

8 urllist.append(real_url)

9 return urllist #返回所有分页地址列表

原始链接 base_url = ‘http://jandan.net/ooxx/’,当我们点击下一页时,发现在原始链接的后面加了一段「page-52#comments」。

其中加的数字,就是表示现在所在的页数,通过 BeautifulSoup 库对页面进行解析,用选择器提取表示页数的字段「current-comment-page」,加入到原始链接中进行拼接。

创建目录

1def get_pic():

2 for url in get_page():

3 mkdir()

4 html=get_html(url)

5 soup=BeautifulSoup(html,'lxml')

6 allimgs=soup.select('div .text p img')

7 allimgs=re.findall('src="(.*?)"',str(allimgs))

8 download(allimgs)

9 print("下载完毕!")

用 os.path.exists 方法来个判断,如果不存在此目录就创建一个,如果存在就忽略。

提取图片

1def get_pic():

2 for url in get_page():

3 mkdir()

4 html=get_html(url)

5 soup=BeautifulSoup(html,'lxml')

6 allimgs=soup.select('div .text p img')

7 allimgs=re.findall('src="(.*?)"',str(allimgs))

8 download(allimgs)

9 print("下载完毕!")

用 BeautifulSoup 解析源码,用选择器循环提取图片的链接,并调用 download() 函数下载图片直至下载所有图片。

优化改进

本次的程序还有一些不足的地方,比如利用 selenium 库在爬取的时候非常的慢,每页我还设置了 3 秒等待时间,这部分待优化。还有所有页面的图片都保存在一个目录下,没有分开保存,这部分也可以优化。

这波教程不点个关注,说不过去吧?哈哈。这个网站有很多福利,我只能说大家注意身体啊。

本文来自投稿,不代表展天博客立场,如若转载,请注明出处:https://www.me900.com/4642.html

(0)

相关推荐

  • 网站建设心得体会(个人网站建设陈述)

    网站的意义是能否满足目标用户群的某种特定需求,在满足用户需求的前提下实现自己的商业目的,很多企业网站建设者在进行网站建设方案策划时无从下手,有的甚至找不到方向。网站建设是一个公司必不可少的成本输出,所以对于我们来讲是要让我们花的钱物有所值,甚至物超所值。而网站建设更需要我们提供良好的切入点: 一、分析行业数据,知己知彼,“对症下药” 我们需要首先对企业所处的…

    2021-11-04 用户投稿
  • 店铺收藏,店铺收藏量多有什么好处

    《店铺收藏:提升网站流量与用户粘性的关键》 在网站运营的过程中,店铺收藏这个看似简单的功能,却蕴含着巨大的潜力。 它可能是提升网站流量与用户粘性的关键因素之一,也许能为我们带来意想不到的收获。 接下来,我们将深入探讨店铺收藏的各个方面,看看它到底能为我们的网站带来哪些好处。 一、店铺收藏的基本概念 店铺收藏,顾名思义,就是用户将自己喜欢的店铺添加到收藏夹中。…

    用户投稿 2025-04-15
  • 项目评估文案怎么写(项目评估名词解释)

    项目立项一般需要提交项目建议书、可行性研究报告、项目招标和投标 一、项目建议书 由建设单位(甲方)提交的文件 核心内容:项目必要性、项目的市场预测、产品方案或服务的市场预测、项目建设必需的条件。 二、可行性研究 (一)内容 投资必要性 技术可行性分析:项目开发风险、人力资源有效性、技术能力、物资可用性 财务可行性:财务方案、理财、财务盈利 组织可行性:人、计…

    2022-05-05
  • u盘里的文件夹不见了,u盘里的文件不见了怎么恢复

    在数字化时代,我们不可避免地使用各种便携式存储设备,如U盘,来传输和存储重要数据。然而,有时我们可能不小心删除了U盘中的文件,或者格式化了U盘等等而导致数据丢失。这种情况下,你可能会困惑地想知道,是否有简单的方式可以快速而轻松地恢复U盘中丢失的数据。本文将为您介绍几种简单的方法,让您轻松地恢复U盘中的数据。 ▌U盘数据丢失是什么原因 U盘数据丢失可能有以下几…

    2023-07-08 用户投稿
  • 极限广告联盟,极限广告联盟:获得更多流量和收入

    作者:史洪举 据报道,近日,有消费者投诉,巴黎欧莱雅曾在官方微博宣传公司产品安瓶面膜在李佳琦直播间的优惠为“全年最大力度”,共计50片的面膜售价429元。但11月1日-3日,巴黎欧莱雅官方淘宝直播间持续放出几万张“满999元-200元”优惠券,使得同款面膜用券后最低价为257.7元。随后,该事件持续发酵。11月18日凌晨,巴黎欧莱雅官方微博发布相关说明,对于…

    用户投稿 2023-05-20
  • 过敏体质是指什么,严重过敏体质是指什么

    阅读之我见一、体质表现过敏体质的人,有的即使不感冒也经常鼻塞、打喷嚏、流鼻涕,容易患哮喘,容易对药物、食物、气味、花粉、季节过敏,有的皮肤容易起荨麻疹,皮肤常因过敏出现紫红色瘀点、瘀斑,皮肤常一抓就红,并出现抓痕。 二、食疗调养1、在饮食方面就应该清淡、均衡,粗细搭配适当,荤素配置合理,多吃一些益气固表的食物。 2、益气固表的药中最好的是人参,虽然贵点,但也…

    2023-06-25 用户投稿
  • 那些令人愤怒的瞬间,愤怒的经典事例

    这几天,一个很短的视频,惹怒了许多人。   北京某商厦门口,几个外卖小哥坐在门前台阶上,正得以片刻喘息。 突然一个物业人员,拎着一桶水来了。 就在众人疑惑时,他打开水桶,对着台阶,就洒起了水。 坐着的几个外卖小哥,只能狼狈迅速起身。 他们的脸上没有太多不满和怒气,更多的是那一抹难以收起的尴尬。‍‍‍‍‍‍‍‍‍   大抵是看多了类似纠纷,…

    2023-07-10 用户投稿
  • 踏入职场的生存法则是什么(职场生存法则语录)

    职场如战场,不是所有人都能成为你的朋友。毕竟,步入社会,人与人之间的关系,大多是建立在利益至上。 若是你不能给对方同等的价值,便只能保持陌生人的距离,这就是现实。 因此,做人可以不世俗,但是,也不要过于单纯。在利益面前,千万不要低估人性的力量,它可以成全一个人,也可以毁掉一个人。 踏入职场,若是希望自己能够更好地生存,希望你能记住这五条必备生存技能。 &nb…

    2021-11-01 用户投稿
  • GoDaddy有哪些优势,域名注册属于什么经营范围

      一般我们注册域名会找专门的域名服务商进行注册,但是在最近几年来互联网行业竞争越来越激烈,市场上的域名注册商有成千上万家,找到一个靠谱的域名提供商,通过专业的注册平台完成注册,对后续自己网站的建立会有很大帮助。那么,GoDaddy是什么意思?GoDaddy有哪些优势? GoDaddy是什么意思? GoDaddy是一家提供域名注册和互联网主机服务的…

    2023-07-08
  • 电脑为什么不能关机,电脑关机时间长了开不了机怎么办

    来啦,客官!小员码字不易,烦请您在阅读前点击上面的“关注”二字,后续会为您提供更多有价值的电脑知识,感谢每一位朋友的支持! 最近,有位粉丝带着他的东芝4030CDT笔记本电脑来找小员,配置为:C-300, 64M, 4.0G, 13.3英寸TFT, 24速CD。 按下电源按钮,有时能正常开机,关机后短时间内可以再开机,时间一长就无法开机,经过测试发现供电指示…

    2023-06-29
  • 域名服务器是什么,域名服务器是什么意思

    《域名服务器是什么》 在互联网的浩瀚海洋中,域名服务器就像是一个个默默工作的导航员,引导着我们在虚拟世界中畅游。那么,域名服务器究竟是什么呢?它又在互联网中扮演着怎样重要的角色呢? 一、域名服务器的定义及作用 域名服务器,简单来说,可能就是专门用于处理域名和IP地址之间转换的服务器。就好像我们在现实生活中使用地图来找到目的地一样,域名服务器就是互联网世界中的…

    2025-10-20
  • 开店还是打工不知道怎么选择(打工不如自己开店)

    小张是今年的应届生,他的父母是做建材生意的,从小耳濡目染父母的工作,所以他在毕业时也想着自己出去创业。 但是小张身边许多人却建议他先去企业发展,毕竟他在校期间非常优秀,选择一家大公司工作,能积累不少经验,还有收入保障。至于创业,就和千军万马走独木桥一般,并不靠谱。 小张觉得内心有些错乱,犹豫不决,年轻时到底是选择创业还是选择打工呢? 他跑来找我咨询,希望听听…

    2021-11-03 用户投稿