煎蛋网怎么看原图(在煎蛋网爬取美女图片)

煎蛋网站

 

很多朋友都反应学 python 语言太枯燥,学不进去,其实学语言最好的方法是自己用所学的语言做项目,在项目中学习语言的用法。今天给大家带来的项目是用 python3 爬取煎蛋网妹子的图片。图片质量还不错,我放两张图片大家感受下。

 

 

这个项目用了 requests + selenium + beautifulsoup 库对网站的图片进行抓取。接下来我就,给大家一步步解析一下,怎么用 python 爬虫爬取图片并下载的。

爬取结果

 

以上就是爬取的结果,通过运行 meizi.py 代码,就可以把图片保存在我指定的目录下,如果没有此目录,就用程序自动创建目录,爬取的所有图片都保存在此目录下。

程序构造

 

程序主要是由 6 个函数组成:

  • get_html() :利用 webdriver 来请求对应的网站。
  • get_page():解析面跳转地址。
  • mkdir():判断目录是否存在,不存在就创建一个。
  • get_pic():提取图片链接。
  • download():通过图片链接下载保存。
  • main():程序执行的主函数。

程序思路

  1. 对目标网站链接进行分析,找出目标网站链接的规律。
  2. 从目标网站里面提取图片链接。
  3. 将图片下载并保存在目录中。

源代码分析

我们通过f12调试页面,看到图片的链接,发现此链接并没有在源代码中,我们推测,图片应该是通过 js 加载的,对于需要 js 才能加载出来的网站,我们就可以利用 selenium 的自动化测试请求库来进行加载。利用 selenium 请求可以模拟真实浏览器访问。

1browser = webdriver.Chrome()

2wait = WebDriverWait(browser, 3)

利用 selenium 请求网页需要下载 chrome 驱动放在 python 安装目录下。

分页链接分析

1def get_page():

2 base_url = 'http://jandan.net/ooxx/' #第一次进入的原始地址

3 soup = BeautifulSoup(get_html(base_url), 'lxml') #解析原始地址

4 current_pages=soup.select('.cp-pagenavi .current-comment-page')[0].get_text()[1:-1] #取出当前页面字段

5 urllist = []

6 for page in range(1,int(current_pages)+1):

7 real_url=base_url+'page-'+str(page)+'#comments' #拼出分页地址

8 urllist.append(real_url)

9 return urllist #返回所有分页地址列表

原始链接 base_url = ‘http://jandan.net/ooxx/’,当我们点击下一页时,发现在原始链接的后面加了一段「page-52#comments」。

其中加的数字,就是表示现在所在的页数,通过 BeautifulSoup 库对页面进行解析,用选择器提取表示页数的字段「current-comment-page」,加入到原始链接中进行拼接。

创建目录

1def get_pic():

2 for url in get_page():

3 mkdir()

4 html=get_html(url)

5 soup=BeautifulSoup(html,'lxml')

6 allimgs=soup.select('div .text p img')

7 allimgs=re.findall('src="(.*?)"',str(allimgs))

8 download(allimgs)

9 print("下载完毕!")

用 os.path.exists 方法来个判断,如果不存在此目录就创建一个,如果存在就忽略。

提取图片

1def get_pic():

2 for url in get_page():

3 mkdir()

4 html=get_html(url)

5 soup=BeautifulSoup(html,'lxml')

6 allimgs=soup.select('div .text p img')

7 allimgs=re.findall('src="(.*?)"',str(allimgs))

8 download(allimgs)

9 print("下载完毕!")

用 BeautifulSoup 解析源码,用选择器循环提取图片的链接,并调用 download() 函数下载图片直至下载所有图片。

优化改进

本次的程序还有一些不足的地方,比如利用 selenium 库在爬取的时候非常的慢,每页我还设置了 3 秒等待时间,这部分待优化。还有所有页面的图片都保存在一个目录下,没有分开保存,这部分也可以优化。

这波教程不点个关注,说不过去吧?哈哈。这个网站有很多福利,我只能说大家注意身体啊。

本文来自投稿,不代表展天博客立场,如若转载,请注明出处:https://www.me900.com/4642.html

(0)

相关推荐

  • 暗黑3钥匙守护者,恐惧之炼狱装置打了有什么用

      大家好啊,心心念念的22赛季终于开启了,这一周过去了,我发现有人开始讨论地狱火护符的问题了。地狱火护符呢,它是《暗黑破坏神3》中一些BD必需的装备,他可以额外提供一个被动技能,想想啊,多一个被动技能多给力啊,下边就给大家带来暗黑破坏神3地狱火护符制作方法,帮助大家获得地狱火护符。 1地狱火图纸购买地点:第二幕剧情→秘密营地→小贩奎斯特。 说明:…

    2023-06-26
  • 虚拟主机系统,虚拟主机windows

    《虚拟主机系统:从入门到进阶》 一、什么是虚拟主机系统虚拟主机系统,也许可以理解为在一台物理服务器上划分出多个相互独立的虚拟空间,每个虚拟空间就像是一个独立的服务器环境。就好像一栋大楼里有很多个小房间,每个小房间都可以有自己的用途和主人,互不干扰。 它的出现,为那些没有足够资金购买独立服务器的网站所有者提供了一种经济实惠的选择。通过虚拟主机系统,他们可以将自…

    用户投稿 2025-11-16
  • 润肤乳怎么用,润肤液怎么用效果最好

    乳液和面霜必须要一起用吗? 有人觉得乳液不够滋润,需要先用乳液后用面霜。 有人觉得乳液足够,不需要面霜了。 各有各的说法,各有各的道理,那么应该如何选择呢? 不同的人对于乳液和面霜的看法完全不一样,有的喜欢有的嫌弃,那么究竟乳液和面霜有必要一起用吗?一 乳液和面霜是什么?在功能上,乳液和面霜都是用于滋润补水、锁水保湿的一款护肤品,他们整体的成分相似。 基本的…

    2023-07-03 用户投稿
  • 抢购技巧,抢购技巧视频

    《抢购技巧:如何在抢购中脱颖而出》 在当今数字化的时代,抢购已经成为了一种常见的消费行为。 无论是抢购热门的电子产品、限量版的商品,还是参与各种促销活动,抢购技巧似乎变得越来越重要。 那么,到底有哪些抢购技巧呢?让我们一起来探讨一下。 一、提前了解抢购信息 在进行抢购之前,我们首先需要了解抢购的时间、地点和商品信息。 这就好像我们在参加一场考试之前,需要知道…

    用户投稿 2025-06-13
  • 余额宝 限额,余额宝限额怎么调整

    《余额宝限额:全面解析与影响》 一、余额宝限额的背景与由来 余额宝作为一款备受欢迎的互联网金融产品,自推出以来就吸引了大量用户的关注和使用。 然而,随着其规模的不断扩大和市场环境的变化,为了保障金融体系的稳定和用户的利益,余额宝限额政策也逐渐出台。 也许最初推出余额宝时,并没有预想到它会发展得如此迅速,所以在后期才开始对其进行限额管理。 我觉得这就像是一个原…

    用户投稿 2025-05-07
  • 金庸群侠传5攻略,金庸群侠传完美攻略

    金庸群侠传5创新队友方法 金庸群侠传5怎么创新队友?金庸群侠传5队友是角色作战时的得力助手,玩家可以通过道具修改它们的属性增强实力,帮助自己更快的获取胜利,金庸群侠传5创新队友方法由6399小编给大家带来,希望对大家有用。 首先当然还是要准备RMXP 随便在你喜欢的空白处 建立 名称 职业 记得选一个你喜欢的脸谱 职业你可以自己弄 我是懒 就用 青书了 反正…

    2023-06-26
  • 笔记本性能排行榜,笔记本cpu天梯图2023

    笔记本电脑作为现代人们生活工作中必不可少的工具,其性能一直是大家所关注的焦点。其中最重要的部分便是CPU,也就是中央处理器。在这篇文章中,我们将讨论笔记本电脑CPU的性能表现,并介绍笔记本CPU天梯图。 首先,我们需要了解什么是CPU。CPU是一台计算机的大脑,它负责执行计算机程序中的指令。在笔记本电脑中,CPU的性能表现直接影响到电脑的速度和响应能力。因此…

    2023-06-27
  • 脸萌,脸萌:萌萌哒动物眼睛美妆护肤

    美妆护肤品一向是电商销售的常胜将军,其中外资品牌曾多年占据销售榜单前列。如李佳琦直播间销售额Top10的品牌中,有6个都是外资美妆品牌,且都占据了榜单的较高位。但是今年很多消费者也发现,不少美妆护肤品牌不单纯依赖价格战,而是顺势推出新科技生物护肤产品。这其中就有来自丰赫FENGHE面部护肤新概念——丰赫纳米雾化水光仪 臻美焕颜精华液 沁透润泽精华首创推出。携…

    用户投稿 2023-05-16
  • 电信的卡怎么包流量(电信卡怎么包流量套餐)

    一、原套餐详情 1、原资费39元30G定向流量+5G通用流量; 2、套餐外流量5元/G,通话0.1元/分钟,短彩信0.1元/条,国内接听免费 二、优惠后套餐详情 激活过程中首充1000元享受以下优惠,不充值无法享受: 1、激活后立即到账100G通用流量(有效期25个月) 2、激活后立即到账100分钟通话(有效期25个月) 3、次月起系统每月减免10元月租(减…

    2023-05-27
  • 360安全路由2p4,美的智能路由器ly-1a300k-a

    近年来网络在人们生活中越来越重要,人们无时不刻不依赖着网络,而网络的连接方式也逐渐从有线变为无线。因此作为家庭网络的核心之一,无线路由器的好坏决定着网络的稳定性与快慢,选对一款好的无线路由器对于提高网上冲浪的体验性是至关重要的。 不久之前,笔者有幸获得了360安全路由器2全千兆的公测资格,收到产品后十分惊喜,那么废话不多说了,就让我们一睹它的风采吧。 一、外…

    2023-07-03 用户投稿
  • 防弹玻璃装现金(防玻璃碎贴膜)

    这年头,个个都想当“网红”,为了吸引眼球是无所不用其极,因为有关注能上头条就意味着财源滚滚而来。这不,湖南长沙一家餐馆就火了,因为老板特制了一个收银台,在里边整整齐齐码放了1400万人民币现金,还特地强调,这是真钱!有人问收银员“你们不怕被抢吗?”小姑娘很不屑地回答说“收银台的玻璃是防弹的!”。那么问题来了:有防弹玻璃,装钱就一定安全吗?长沙餐馆用1400万…

    2022-05-05 用户投稿
  • 勇者战魔王攻略,死灵法师暗黑破坏神

    刹那·F·赛耶从“第一段冒险”开始聊起就《暗黑破坏神》这块儿,你记忆最深的是哪段场景? 对我来说,这个场景是我在《暗黑破坏神2》中进入的第一个洞穴。 在那个没有耐心把剧情看完的屁孩年代,草草建完角色后,我顺着小路前行,顺手消灭着沉沦魔,僵尸和硬毛老鼠们,最终踏入那个阴森气息十足的洞穴里。 昏黄的光源让这个洞穴时刻处于一种令人不安的未知感中,在这里,我初次遭遇…

    2023-07-09 用户投稿