Python基于scrapy采集数据时使用代理服务器的方法

2020-06-08 09:37pythoner Python

这篇文章主要介绍了Python基于scrapy采集数据时使用代理服务器的方法,涉及Python使用代理服务器的技巧,具有一定参考借鉴价值,需要的朋友可以参考下

本文实例讲述了Python基于scrapy采集数据时使用代理服务器的方法。分享给大家供大家参考。具体如下：

				?

									# To authenticate the proxy, 

									#you must set the Proxy-Authorization header. 

									#You *cannot* use the form http://user:pass@proxy:port 

									#in request.meta['proxy']

									import base64

									proxy_ip_port = "123.456.789.10:8888"

									proxy_user_pass = "awesome:dude"

									request = Request(url, callback=self.parse)

									# Set the location of the proxy

									request.meta['proxy'] = "http://%s" % proxy_ip_port

									# setup basic authentication for the proxy

									encoded_user_pass=base64.encodestring(proxy_user_pass)

									request.headers['Proxy-Authorization'] = 'Basic ' + encoded_user_pass

希望本文所述对大家的python程序设计有所帮助。

Python

Scrapy

代理服务器

采集数据

延伸 · 阅读

2022-06-28Python数据读写之Python读写CSV文件
2022-06-28Python操作HDF5文件示例
2022-06-28python操作csv格式文件之csv.DictReader()方法
2022-06-28Python简明讲解filter函数的用法
2022-06-28分享13个非常有用的Python代码片段
2022-06-28使用Docker制作Python环境连接Oracle镜像

精彩推荐

Python

Windows下Python的Django框架环境部署及应用编写入门

这篇文章主要介绍了Windows下Python的Django框架环境部署及程序编写入门,Django在Python的框架中算是一个重量级的MVC框架,本文将从程序部署开始讲到hellow world...

像风一样的自由4082020-08-16
Python

Python实现敏感词过滤的4种方法

这篇文章主要介绍了Python实现敏感词过滤的4种方法，帮助大家处理不和谐的言论，感兴趣的朋友可以了解下...

我被狗咬了29912020-09-14
Python

python访问类中docstring注释的实现方法

这篇文章主要介绍了python访问类中docstring注释的实现方法,涉及python类注释的访问技巧,非常具有实用价值,需要的朋友可以参考下...

重负在身6552020-06-21
Python

keras.layer.input()用法说明

这篇文章主要介绍了keras.layer.input()用法说明，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧...

TinaO-O9152020-06-17
Python

pandas将DataFrame的列变成行索引的方法

下面小编就为大家分享一篇pandas将DataFrame的列变成行索引的方法，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧...

修炼之路21712021-01-29
Python

Django自带的用户验证系统实现

这篇文章主要介绍了Django自带的用户验证系统实现，文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值，需要的朋友们下...

ZPeng_Yan4462021-08-16
Python

python中使用smtplib和email模块发送邮件实例

python脚本发邮件，一般会用到smtplib和email这两个模块。看看该模块怎么使用，先看smtplib模块。 smtplib模块定义了一个简单的SMTP客户端，可以用来在互联网上...

脚本之家6102020-09-20
Python

分析并输出Python代码依赖的库的实现代码

这篇文章主要介绍了分析并输出Python代码依赖的库的实现代码,需要的朋友可以参考下...

Python教程网3442020-07-29