煎蛋网怎么看原图(在煎蛋网爬取美女图片)

煎蛋网站

 

很多朋友都反应学 python 语言太枯燥,学不进去,其实学语言最好的方法是自己用所学的语言做项目,在项目中学习语言的用法。今天给大家带来的项目是用 python3 爬取煎蛋网妹子的图片。图片质量还不错,我放两张图片大家感受下。

 

 

这个项目用了 requests + selenium + beautifulsoup 库对网站的图片进行抓取。接下来我就,给大家一步步解析一下,怎么用 python 爬虫爬取图片并下载的。

爬取结果

 

以上就是爬取的结果,通过运行 meizi.py 代码,就可以把图片保存在我指定的目录下,如果没有此目录,就用程序自动创建目录,爬取的所有图片都保存在此目录下。

程序构造

 

程序主要是由 6 个函数组成:

  • get_html() :利用 webdriver 来请求对应的网站。
  • get_page():解析面跳转地址。
  • mkdir():判断目录是否存在,不存在就创建一个。
  • get_pic():提取图片链接。
  • download():通过图片链接下载保存。
  • main():程序执行的主函数。

程序思路

  1. 对目标网站链接进行分析,找出目标网站链接的规律。
  2. 从目标网站里面提取图片链接。
  3. 将图片下载并保存在目录中。

源代码分析

我们通过f12调试页面,看到图片的链接,发现此链接并没有在源代码中,我们推测,图片应该是通过 js 加载的,对于需要 js 才能加载出来的网站,我们就可以利用 selenium 的自动化测试请求库来进行加载。利用 selenium 请求可以模拟真实浏览器访问。

1browser = webdriver.Chrome()

2wait = WebDriverWait(browser, 3)

利用 selenium 请求网页需要下载 chrome 驱动放在 python 安装目录下。

分页链接分析

1def get_page():

2 base_url = 'http://jandan.net/ooxx/' #第一次进入的原始地址

3 soup = BeautifulSoup(get_html(base_url), 'lxml') #解析原始地址

4 current_pages=soup.select('.cp-pagenavi .current-comment-page')[0].get_text()[1:-1] #取出当前页面字段

5 urllist = []

6 for page in range(1,int(current_pages)+1):

7 real_url=base_url+'page-'+str(page)+'#comments' #拼出分页地址

8 urllist.append(real_url)

9 return urllist #返回所有分页地址列表

原始链接 base_url = ‘http://jandan.net/ooxx/’,当我们点击下一页时,发现在原始链接的后面加了一段「page-52#comments」。

其中加的数字,就是表示现在所在的页数,通过 BeautifulSoup 库对页面进行解析,用选择器提取表示页数的字段「current-comment-page」,加入到原始链接中进行拼接。

创建目录

1def get_pic():

2 for url in get_page():

3 mkdir()

4 html=get_html(url)

5 soup=BeautifulSoup(html,'lxml')

6 allimgs=soup.select('div .text p img')

7 allimgs=re.findall('src="(.*?)"',str(allimgs))

8 download(allimgs)

9 print("下载完毕!")

用 os.path.exists 方法来个判断,如果不存在此目录就创建一个,如果存在就忽略。

提取图片

1def get_pic():

2 for url in get_page():

3 mkdir()

4 html=get_html(url)

5 soup=BeautifulSoup(html,'lxml')

6 allimgs=soup.select('div .text p img')

7 allimgs=re.findall('src="(.*?)"',str(allimgs))

8 download(allimgs)

9 print("下载完毕!")

用 BeautifulSoup 解析源码,用选择器循环提取图片的链接,并调用 download() 函数下载图片直至下载所有图片。

优化改进

本次的程序还有一些不足的地方,比如利用 selenium 库在爬取的时候非常的慢,每页我还设置了 3 秒等待时间,这部分待优化。还有所有页面的图片都保存在一个目录下,没有分开保存,这部分也可以优化。

这波教程不点个关注,说不过去吧?哈哈。这个网站有很多福利,我只能说大家注意身体啊。

本文来自投稿,不代表展天博客立场,如若转载,请注明出处:https://www.me900.com/4642.html

(0)

相关推荐

  • ip查询详细地址,ip查询地址手机

    《关于“ip查询详细地址”的深入探讨》 一、ip地址的基本概念 ip地址,也许大家对它并不陌生,但可能又不是特别了解。它就像是互联网世界中的门牌号,每一个连接到互联网的设备都有一个唯一的ip地址。通过这个地址,其他设备才能找到它并与之进行通信。 就好像我们生活在一个巨大的城市里,每个家庭都有一个唯一的门牌号,快递员根据这个门牌号才能把包裹送到正确的地方。在互…

    2025-11-05
  • 如家连锁酒店加盟优势有哪些

    如家借鉴欧美完善成熟的经济型酒店模式,为商务和休闲旅行等客人提供“干净、温馨”的酒店产品,倡导“适度生活,自然自在”的生活理念。 截至2006年12月31日,如家快捷酒店集团共有134家酒店,其中包括94家租赁经营酒店,以及40家特许经营酒店,足迹遍布上海、北京、天津、杭州、广州、深圳、宁波、厦门、成都等39个国内主要商务城市。 由于扩张迅速,如家已经超越发…

    2023-05-22
  • 昂达vx610w时尚版,2021年北京车展

    再过几天,全球瞩目的2020(第十六届)北京国际汽车展览会将拉开帷幕。这是新冠肺炎疫情爆发以来举办的第一个全球顶级车展,也很可能是2020年惟一举办的国际顶级车展。 合资品牌 北京现代全新一代伊兰特 全新一代伊兰特将于北京车展开启预售,并在10月下旬上市。继索纳塔后,伊兰特完成换代,新款伊兰特是第七代车型。新技术、新设计语言,全新一代伊兰特值得期待。新车将提…

    2023-07-03
  • nike篮球鞋,买Nike篮球鞋,舒适实用!

    一双篮球鞋,到底有多讲究? 无论你是不是球鞋爱好者,或者是篮球爱好者,可能你都听说过乔丹鞋。然而说到所谓的乔丹鞋呢?你可能会有印象的是满大街的AJ1,或者AJ11?又或者是AJ3?AJ4?AJ6?等等。然而,今天我要和大家深度分享的,可能是整个“历史上最好的一双篮球鞋”。 说一下背景,在AJ的第23代之后的4年,可谓是AJ正代史上,最灰暗,最不愿意提及的时代…

    2023-05-21
  • 如何判断白斑是不是白风(如何判断白斑是不是白风图片白色糠疹)

    白癜风是一种常见的色素减退性皮肤病,表现为局部或泛发性色素脱失。其发病是由于皮肤和毛囊黑素细胞内酪氨酸酶系统的功能减退、丧失而引起,目前认为本病的发生与自身免疫、黑素细胞自身破坏、神经化因子、遗传因素、微量元素缺乏等因素有关。那应如何判断身上的白斑是否为白癜风呢?可以参考以下几点: 白斑的颜色   刚长出来的白斑,颜色比较浅,色素脱失轻,边界比较模糊,随着色…

    2023-05-24
  • 苹果手机短信加密安全保护怎么解除

    最后一般会附上一条链接 千!万!别!点! 点开就是上当的第一步! 不法分子以色情内容为诱饵 附上网址链接群发钓鱼短信 一旦点击钓鱼链接 手机可能会被植入木马 窃取个人银行卡号、手机号 验证码等个人信息 手机这样设置 拦截骚扰信息 第三步: 取消邮箱收发短信 这个主要和之前所说的【iMessage信息】设置有关,如果非要开启【iMessage信息】这一设置的话…

    2023-06-07 用户投稿
  • j.j.希克森,希克转会勒沃库森

    美职篮每天一球员:9月4日 J.J.希克森 J.J.希克森 2016年8月22日,福建男篮宣布签下J.J.希克森。2016-2017赛季为福建队出战27场,场均24.5分,13.4个篮板,1.7次助攻,0.6个盖帽和1.8次抢断。 J.J.希克森争抢篮板 2017年8月21日,江苏同曦队宣布签约J.J.希克森。2017-2018赛季为江苏队共出战38场,场均…

    2023-06-07
  • 最早指出红楼梦突破传统方法写人物

    最早精辟地指出《红楼梦》写作手法的当是乾隆年间的进士戚蓼生。他在《石头记序》中说:“吾闻绛树两歌,一声在喉,一声在鼻;华二牍,左腕能楷,右腕能草。神乎技也,吾未之见也。今则两歌而不分乎喉鼻,二牍而无区乎左右,一声也而两歌,一手也而二牍,此万万不能有之事,不可得之奇,而竟得之《石头记》一书。……第观其蕴于心而抒于手也,注彼而写此,目送而…

    2023-06-03 用户投稿
  • 保健养生茶配方(养生茶配方大全)

    By 高冷一下 用料红枣 25粒枸杞 5克水 看需求 做法步骤 1、准备好所需材料 2、先取出红枣核:用大刀拍红枣,拍至中间有缝即可 3、然后中间撕开红枣,取出红枣核,红枣肉备用 4、冷水+红枣肉,煲10分钟 5、煲好后,倒入枸杞,煲5分钟 6、这样,养生茶就做好了 做菜好吃都有技巧,我的每道菜都有小妙招,大家搜索“豆果”可以直接查看我的菜谱! 喜欢这个食谱…

    2023-06-04 用户投稿
  • 赵誉博扒皮技术发展史,网红鼻祖ck沉珂的故事

    1-沉珂 被誉为网红鼻祖 因为一首《飞向别人的床》走红网络 后来因为抑郁症自杀了 以前照片 2-王思聪 今年网红排行榜力压群雄 夺冠 真正的的国民老公 多少拜金女势利眼的心中老公的不二人选啊 假如楼楼是吗男的肯定也想嫁给他 以前照片 现在照片 4-黎允稀 以前自称13岁各种P图修图,简直是一代P神最大的愿望就是成网红 后来被人家扒红了 以前照片 现在照片 确…

    2023-06-01 用户投稿
  • 手机视频画质修复清晰软件(百度老照片修复软件)

    作为一枚经常处理图片、视频的自媒体打工人,经常会遇到下载的图片画质模糊清晰度不高的情况,这个时候必须修复画质才能不影响图片使用感!下面给大家分享下画质修复清晰度的工具,重构高清图像! 智能修复老照片 一款可以将老旧照片、模糊照片修复到比较良好的状态的智能修复工具,同时还可以对黑白照片上色,快速修复老照片、修复模糊人脸、一键图片变清晰。除此之外,软件的证件照制…

    2023-06-09 用户投稿
  • 沈旭佳王朔之妻美貌披露,1984年是王朔的转运之年吗

    1984年是王朔的转运之年。在这之前,他很倒霉,他创业,创业失败,谈恋爱,没有一个女孩能和他长久。 面对这灰暗的人生,王朔不愿意屈服,他想办法改变自己的命运,考虑到自己当年为了高考苦练作文,他觉得自己可能会靠写文章吃饱饭。于是在这一年,他写了一部名为《空中小姐》的小说发布在《当代》杂志上,正式进军文学界。 年轻时的王朔和马未都 分别之后,两人虽然能通电话,但…

    2023-06-06 用户投稿