脚本之家,脚本语言编程技术及教程分享平台!
分类导航

Python|VBS|Ruby|Lua|perl|VBA|Golang|PowerShell|Erlang|autoit|Dos|bat|shell|

服务器之家 - 脚本之家 - Python - Python使用BeautifulSoup解析并获取图片的实战分享

Python使用BeautifulSoup解析并获取图片的实战分享

2024-06-05 15:31江禾藜 Python

这篇文章主要介绍了Python使用BeautifulSoup解析并获取图片的实战分享,文中通过代码和图文结合的方式给大家讲解的非常详细,对大家的学习或工作有一定的帮助,需要的朋友可以参考下

一、前言

在本文我们将以下面的例子带着大家去看看在实战中是如何运用的。

目标url:https://www.58pic.com/tupian/1272.html

二、数据分析

根据下图所示,图片被保存至img标签下,并且class值为lazy。当然这个网站除了lazy的img标签还有其他的(比如:class="lazy-bg-img"),这个可以自己想办法处理一下,如何去获取所有跟图片有关的img标签。

Python使用BeautifulSoup解析并获取图片的实战分享

三、数据获取及展示

数据获取

 '''
 爬虫:
 ​
 目标网站:https://www.58pic.com/c/27075257
 ​
 任务需求:1、抓取第一页前36张图片   2、使用bs4解析
 '''
 import time
 ​
 import requests
 from bs4 import BeautifulSoup
 ​
 ​
 class Image(object):
     def __init__(self):
         self.headers = {
             'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/116.0.0.0 Safari/537.36 Edg/116.0.1938.62'
         }
 ​
     def parse_url(self,url):
         print('开始分析')
         resp = requests.get(url,headers=self.headers)
         #print(resp.text)
         if resp.status_code == 200:
             soup = BeautifulSoup(resp.text,'lxml')
             image_list = soup.find_all('img',class_='lazy-bg-img',limit=36)
             #print(image_list)
             for data in image_list:
                 # print(title)
                 print(f"开始下载 {title}")
                 img_url = 'https:'+data.get('data-original')
                 self.image_save(title,img_url)
         else:
             return None
 ​
     def image_save(self,title,url):
         resp = requests.get(url,headers=self.headers)
         content = resp.content
         with open('./img/'+title+'.jpg',mode='wb')as f:
             f.write(content)
 ​
 if __name__ == '__main__':
     t = time.time()
     url='https://www.58pic.com/tupian/1272.html'
     image = Image()
     image.parse_url(url)
     print("总共耗时:",time.time()-t)

最终效果展示

Python使用BeautifulSoup解析并获取图片的实战分享

Python使用BeautifulSoup解析并获取图片的实战分享

四、结语

根据示例,我们会发现通过bs4解析可以很快速的根据标签的特殊性得到我们想要的数据。但要注意,有时候我们得到的响应内容会与F12打开看到的不同,所有在发现没有拿到数据的时候,请考虑我们得到的相应内容里面究竟是什么样子的。

到此这篇关于Python使用BeautifulSoup解析并获取图片的实战分享的文章就介绍到这了,更多相关Python BeautifulSoup获取图片内容请搜索服务器之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持服务器之家!

原文链接:https://juejin.cn/post/7376484708546314251

延伸 · 阅读

精彩推荐
  • Python详解Python Socket网络编程

    详解Python Socket网络编程

    这篇文章主要为大家介绍了Python Socket网络编程,主要介绍使用 Python 进行 TCP Socket网络编程...

    脚本之家3572020-08-05
  • Python为什么Python比VBA更适合自动化处理Excel数据?

    为什么Python比VBA更适合自动化处理Excel数据?

    每当有人发布关于 python 处理 Excel 数据的文章,总会有人只看了标题就评论:"vba处理已经足够,完全没必要使用python";"我工作环境不能安装,因此vba就比...

    今日头条31272021-01-15
  • Python使用Python生成随机密码的示例分享

    使用Python生成随机密码的示例分享

    这篇文章主要介绍了使用Python生成随机密码的示例分享,比如发生一些安全问题时为用户先设置随机密码然后供用户修改的情况下可以用到,需要的朋友可以...

    Python教程网3492020-08-13
  • Python用Python计算三角函数之atan()方法的使用

    用Python计算三角函数之atan()方法的使用

    这篇文章主要介绍了用Python计算三角函数之atan()方法的使用,是Python入门的基础知识,需要的朋友可以参考下...

    Python教程网8122020-06-29
  • PythonPython colormap库的安装和使用详情

    Python colormap库的安装和使用详情

    这篇文章主要介绍了Python colormap库的安装和使用详情,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们...

    Python碎片9802020-10-07
  • PythonPython3 实现爬取网站下所有URL方式

    Python3 实现爬取网站下所有URL方式

    今天小编就为大家分享一篇Python3 实现爬取网站下所有URL方式,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧 ...

    嗨学编程6392020-04-19
  • Pythonpython引用DLL文件的方法

    python引用DLL文件的方法

    这篇文章主要介绍了python引用DLL文件的方法,涉及Python调用dll文件的相关技巧,需要的朋友可以参考下 ...

    像风一样的自由43512020-06-27
  • PythonPython利用zhdate模块实现农历日期处理

    Python利用zhdate模块实现农历日期处理

    zhdate模块统计从1900年到2100年的农历月份数据代码,支持农历和公历之间的转化,并且支持日期差额运算。本文将利用这一模块实现农历日期的处理,需要...

    三爷带你飞11142022-11-20