脚本之家,脚本语言编程技术及教程分享平台!
分类导航

Python|VBS|Ruby|Lua|perl|VBA|Golang|PowerShell|Erlang|autoit|Dos|bat|

服务器之家 - 脚本之家 - Python - python简单构建可用IP代理池

python简单构建可用IP代理池

2022-09-18 17:33阿南-anan Python

这篇文章主要介绍了python构建简单可以代理池,实现过程匹配ip:port的正则表达式、匹配出所有的ip与端口,放入列表、判断爬取的代理ip是否可用、使用代理ip访问指定网站,具体实现需要的小伙伴可以参考下面文章内容

以下为简单示例:

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
import requests
import re
import telnetlib
 
url='http://www.66ip.cn/nmtq.php?getnum=100000&isp=0&anonymoustype=4&start=&ports=&export=&ipaddress=&area=2&proxytype=0&api=66ip'
header = {'User-agent':'xxxxxxxxxxx','Connection':'close'}
page_text = requests.get(url=url,headers=header).text
#用于匹配ip:port的正则表达式
p = r'(?:((?:\d|[1-9]\d|1\d{2}|2[0-5][0-5])\.(?:\d|[1-9]\d|1\d{2}|2[0-5][0-5])\.(?:\d|[1-9]\d|1\d{2}|2[0-5][0-5])\.(?:\d|[1-9]\d|1\d{2}|2[0-5][0-5]))\D+?(6[0-5]{2}[0-3][0-5]|[1-5]\d{4}|[1-9]\d{1,3}|[0-9]))'
#匹配出所有的ip与端口,放入列表
iplist = re.findall(p,page_text)
# 判断爬取的代理ip是否可用
for i in iplist:
    ip = i[0]+':'+i[1]+'\n'
    try:
        # 使用代理ip访问指定网站,能访问说明代理可用
        # requests.get('http://www.baidu.com', proxies={"http": ip})
        # 使用telnet测试代理是否可用
        telnetlib.Telnet(i[0], port=i[1], timeout=3)
    except:
        print('connect failed')
    else:
        print(ip)
        with open('ip.txt', 'a+', encoding='utf-8') as fp:
            fp.write(ip)

python简单构建可用IP代理池

python简单构建可用IP代理池

 到此这篇关于python构建简单可以代理池的文章就介绍到这了,更多相关python构建简单代理池内容请搜索服务器之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持服务器之家!

原文链接:https://blog.csdn.net/weixin_42380348/article/details/122832448

延伸 · 阅读

精彩推荐
  • Pythonpython基础之文件操作和异常处理

    python基础之文件操作和异常处理

    这篇文章主要介绍了python基础之文件操作和异常处理,文中有非常详细的代码示例,对正在学习python基础的小伙伴们有一定的帮助,需要的朋友可以参考下...

    weixin_513827265612021-10-14
  • Python快速解决pymongo操作mongodb的时区问题

    快速解决pymongo操作mongodb的时区问题

    这篇文章主要介绍了快速解决pymongo操作mongodb的时区问题,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧...

    一屋不码,何以码天下5042021-08-09
  • Pythonpython爬虫之线程池和进程池功能与用法详解

    python爬虫之线程池和进程池功能与用法详解

    这篇文章主要介绍了python爬虫之线程池和进程池功能与用法,结合实例形式分析了Python基于线程池与进程池的爬虫功能相关操作技巧与使用注意事项,需要的...

    Charles.L9942021-03-25
  • Python详解supervisor使用教程

    详解supervisor使用教程

    supervisor是用python写的一个进程管理工具,用来控制进程,本文为大家介绍一下supervisor使用教程,希望能够帮助到你。...

    loveyouyou6168932020-12-19
  • Pythonpython使用xlrd与xlwt对excel的读写和格式设定

    python使用xlrd与xlwt对excel的读写和格式设定

    最近在用python处理excel表的时候出现了一些问题,所以想着记录下最后的实现方式和问题解决方法。方便自己或者大家在有需要的时候参考借鉴,下面这篇...

    cutecoot6492020-09-18
  • PythonPython标准库之collections包的使用教程

    Python标准库之collections包的使用教程

    这篇文章主要给大家介绍了Python标准库之collections包的使用教程,详细介绍了collections中多个集合类的使用方法,相信对大家具有一定的参考价值,需要的朋...

    ziwenxie2462020-10-05
  • Python如何把外网python虚拟环境迁移到内网

    如何把外网python虚拟环境迁移到内网

    这篇文章主要介绍了如何把外网python虚拟环境迁移到内网,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友...

    酸果实爱吐泡泡的鱼9642020-05-19
  • PythonPython数据标准化的实例分析

    Python数据标准化的实例分析

    在本篇文章里小编给大家整理了关于Python数据标准化的实例内容,有需要的朋友们可以测试学习下。...

    小妮浅浅11152021-12-20