煎蛋网怎么看原图(在煎蛋网爬取美女图片)

煎蛋网站

 

很多朋友都反应学 python 语言太枯燥,学不进去,其实学语言最好的方法是自己用所学的语言做项目,在项目中学习语言的用法。今天给大家带来的项目是用 python3 爬取煎蛋网妹子的图片。图片质量还不错,我放两张图片大家感受下。

 

 

这个项目用了 requests + selenium + beautifulsoup 库对网站的图片进行抓取。接下来我就,给大家一步步解析一下,怎么用 python 爬虫爬取图片并下载的。

爬取结果

 

以上就是爬取的结果,通过运行 meizi.py 代码,就可以把图片保存在我指定的目录下,如果没有此目录,就用程序自动创建目录,爬取的所有图片都保存在此目录下。

程序构造

 

程序主要是由 6 个函数组成:

  • get_html() :利用 webdriver 来请求对应的网站。
  • get_page():解析面跳转地址。
  • mkdir():判断目录是否存在,不存在就创建一个。
  • get_pic():提取图片链接。
  • download():通过图片链接下载保存。
  • main():程序执行的主函数。

程序思路

  1. 对目标网站链接进行分析,找出目标网站链接的规律。
  2. 从目标网站里面提取图片链接。
  3. 将图片下载并保存在目录中。

源代码分析

我们通过f12调试页面,看到图片的链接,发现此链接并没有在源代码中,我们推测,图片应该是通过 js 加载的,对于需要 js 才能加载出来的网站,我们就可以利用 selenium 的自动化测试请求库来进行加载。利用 selenium 请求可以模拟真实浏览器访问。

1browser = webdriver.Chrome()

2wait = WebDriverWait(browser, 3)

利用 selenium 请求网页需要下载 chrome 驱动放在 python 安装目录下。

分页链接分析

1def get_page():

2 base_url = 'http://jandan.net/ooxx/' #第一次进入的原始地址

3 soup = BeautifulSoup(get_html(base_url), 'lxml') #解析原始地址

4 current_pages=soup.select('.cp-pagenavi .current-comment-page')[0].get_text()[1:-1] #取出当前页面字段

5 urllist = []

6 for page in range(1,int(current_pages)+1):

7 real_url=base_url+'page-'+str(page)+'#comments' #拼出分页地址

8 urllist.append(real_url)

9 return urllist #返回所有分页地址列表

原始链接 base_url = ‘http://jandan.net/ooxx/’,当我们点击下一页时,发现在原始链接的后面加了一段「page-52#comments」。

其中加的数字,就是表示现在所在的页数,通过 BeautifulSoup 库对页面进行解析,用选择器提取表示页数的字段「current-comment-page」,加入到原始链接中进行拼接。

创建目录

1def get_pic():

2 for url in get_page():

3 mkdir()

4 html=get_html(url)

5 soup=BeautifulSoup(html,'lxml')

6 allimgs=soup.select('div .text p img')

7 allimgs=re.findall('src="(.*?)"',str(allimgs))

8 download(allimgs)

9 print("下载完毕!")

用 os.path.exists 方法来个判断,如果不存在此目录就创建一个,如果存在就忽略。

提取图片

1def get_pic():

2 for url in get_page():

3 mkdir()

4 html=get_html(url)

5 soup=BeautifulSoup(html,'lxml')

6 allimgs=soup.select('div .text p img')

7 allimgs=re.findall('src="(.*?)"',str(allimgs))

8 download(allimgs)

9 print("下载完毕!")

用 BeautifulSoup 解析源码,用选择器循环提取图片的链接,并调用 download() 函数下载图片直至下载所有图片。

优化改进

本次的程序还有一些不足的地方,比如利用 selenium 库在爬取的时候非常的慢,每页我还设置了 3 秒等待时间,这部分待优化。还有所有页面的图片都保存在一个目录下,没有分开保存,这部分也可以优化。

这波教程不点个关注,说不过去吧?哈哈。这个网站有很多福利,我只能说大家注意身体啊。

本文来自投稿,不代表展天博客立场,如若转载,请注明出处:https://www.me900.com/4642.html

(0)

相关推荐

  • 系统不支持curl,系统不支持软件怎么办

    《当系统不支持curl时:探索背后的原因与应对之策》 在当今数字化的时代,网络技术在各个领域都发挥着至关重要的作用。而curl作为一种常用的命令行工具,在网络请求和数据传输方面有着广泛的应用。然而,有时候我们可能会遇到系统不支持curl的情况,这可能会给我们的工作和生活带来一些不便。那么,系统不支持curl到底是怎么回事呢?我们又该如何应对呢? 一、curl…

    2025-10-30
  • 开电脑店攻略 如何在家开设电脑店获取收益

    老罗怎样才能赚钱? 3060Ti这两年非常好卖,有人卖二手卡1000多块钱,有强东哥卖299,老罗同一个型号卖2000多。这些都是这钱咋赚的呀?卖了十几年都没有给大家讲过这个事情。 欢迎收看,今天的奸商自述之-卖显卡买保时捷,今天花了100多万,拿了400多张显卡,这些都是别人卖299,我卖2,800多,我踏马还赚钱。 这两个东西有区别吗?区别在你的差价40…

    2023-05-23
  • 夏天吃什么菜(蒜酱排骨怎么做窍门)

    夏日来临,对一些人来说,高温带来食欲减退,但对于真正的“吃货”来说,气温的高低从来不是影响食欲的理由,即便户外烈日炎炎,照样也能吹着空调吃火锅,抱着猪脚啃的满嘴油光。 无论何时何地,解馋这件事还是得吃肉才能过瘾,推荐8道“硬菜”,解馋不油腻,更适合这个炎热的夏季。 蒜香酱排骨 1、排骨冷水放入煮锅中,加入姜片和1勺料酒,中火煮沸,撇去浮末,继续煮10分钟捞出…

    2023-06-11 用户投稿
  • 驱动器中没有磁盘怎么解决,为什么你的电脑没有a盘和b盘选项

    想象一下,你像平时一样,一大早来到办公室并且打开电脑。因为想要找一些文件所以先打开了文件管理器,然后进入了D盘……但是你有没有想过为什么你的电脑是从C盘开始的?A盘和B盘去哪里了?其实如果时间退回到20多年前,甚至在Windows XP和WIndows 7时代,许多人的电脑里面还是会有A盘的,那么下面我们就来聊一聊为什么现在的电脑当中没有A盘和B盘。 因为下…

    2023-07-06 用户投稿
  • 春晚微凉算是看得比较完整的节目吗

    2023年春晚微凉算是看得比较完整的,除了中途煮饺子离开了一会儿,整台晚会算是看完了,所以写篇文字,记录下微凉眼中精彩瞬间吧! 第一个精彩瞬间:秦岚流金人鱼姬造型很美 今年的春晚开场歌舞和往年一样,很多明星合唱,而且明星们大多数穿得很喜庆,赵丽颖、宋轶、宋祖儿、万茜、秦海璐等女明星都穿得大红大紫,不过开场最让人惊艳的,反倒是穿着流金长裙、披肩短发的秦岚,虽然…

    2023-06-01 用户投稿
  • 角鲨烯的作用和功效,角鲨烷精油怎么用

      在护肤界有这样一种广受追捧的护肤成分,号称“护肤万金油”,一抹柔润肌肤,肤感优良,对敏感肌很友好……   它就是角鲨烷,相信不少小伙伴都用过角鲨烷精油、含角鲨烷的乳液或面霜等等。   今天我们就来聊聊,角鲨烷对皮肤到底有多好,真的和鲨鱼有关,是杀了鲨鱼才能获取的吗?   角鲨烷与角鲨烯   说到角鲨烷,不…

    2023-07-11 用户投稿
  • 仙草骨痛贴,仙草骨痛贴效果怎么样

    中医小讲堂 《芳草百味》栏目由广东省中医院携手广州新闻资讯广播联合推出,在“广东省中医院”微信公众号、广州新闻电台FM962(逢周六日下午16:30分)《周末健康课堂》节目推送。 凉粉草 主持人:最近全城人民都在防控新冠疫情,恰恰又遇上梅雨季节前的高温湿热天气,一会儿暴晒一会儿暴雨。回家是否想吃到一款既冰凉又健康的甜品小吃呢?凉粉草这种中药就很适合推荐给大家…

    2023-07-10
  • 太溪的准确位置图和作用,按解溪治脑供血不足方法

    一:高血压1)两经两穴防治高血压 治、防高血压,直接的方法是敲肝经和胃经。 治、防高血压,间接的方法是按揉合谷穴和足三里! 2)太冲、太溪、曲池(大肠经穴,肘横纹外侧端)是最好的降压药。 不论是什么类型的高血压,自古至今证明效果都是非常好的,就是太冲、太溪和曲池!每天坚持按揉五分钟,两个月后,可以有效降血压! 二:冠心病平躺,将双手摩擦发热,然后摩擦胸部50…

    2023-06-24 用户投稿
  • 世界上还会出现丧尸吗(丧尸危机 如何避免世界被毁灭)

    著名的物理学家史蒂芬霍金在生前曾经声称地球会在200年内毁灭,并建议人类移民外太空。 此言一出引发民间讨论,对此有专家表示霍金这么说,并不是建立在科学基础上,而是霍金对人类的一个忠告。 我认为未来的灾难确实会有很多,随着人类工业和科技文明的不断发展,对地球的开发也越来越大,而且随着生活水平和医疗水平的不断提高,人类的寿命大大增加,虽然生育率低,但是人口寿命却…

    2023-05-22
  • ti8淘汰赛赛程图,淘汰赛对阵表图

    在国际邀请赛开幕式结束后,TI7冠军Liquid与北美新贵OpTic开启了TI8正赛的首场战斗。 首局,Liquid点出了骨弓炼金骷髅王三核,而OpTic则是选出了五号位亚巴顿作为一手奇兵。前期线上,CCNC的小小在中路似乎对于炼金的发育没有造成太大压制,,反而被炼金在酸雾里追着A。而小小在对线压制无果后,带领队友企图寻找节奏,但由于几次操作失误使得OpTi…

    2023-07-04
  • 北京721特大暴雨事件 什么原因导致721特大暴雨事件

    沉痛的灾难 7月20日,河南郑州等多地降雨量突破历史极值,灾害之严重,令全国人民揪心。 在县区方面,市内五区和四个开发区共遇难108人; 巩义市遇难64人、荥阳市58人、新密市46人; 登封市12人、新郑市2人,上街区2人,中牟市0人,郑州郊县市共遇难184人。全市共遇难292人,失踪47人; 在郑州之外,遭遇了同**暴雨,市域多县多日泡在水里的新乡市遇难7…

    2023-06-03
  • 淘宝秒杀技巧(手机自动抢购秒杀软件哪个好)

    淘宝商家们开店了以后有必要去不断的上新产品,这样可以给店铺注入新活力,商家们上新产品以后也可以去设置抢购活动。那么淘宝上架新品后如何去抢购呢?下面为大家进行介绍。 1、大家都在用的办法,提前进入秒杀的页面,然后不停的刷新,等时间快到的时候,提高刷新频率。 用这个方法需要注意的是,要提前保持自己在登录状态,省的点击立刻购买之后,还没有登录,那就太慢了;只留一个…

    2023-05-28