Python爬虫 requests教学(一):requests的请求参数
requests模块是一个网络请求模块,可以帮助我们模拟成客户端去请求服务器的数据。
我们今天就是主要针对这个模块进行学习。
我们可以在浏览器中抓取到这些请求与响应的内容,那么我们可以"伪造"请求吗?也就是不再通过浏览器发送这些数据,而是通过Python来模拟浏览器发送请求。答案是可行的。而Requests模块就可以完成这种功能。
Requests模块就是 Python 实现的简单易用的HTTP库
还有其他库吗?回答也是肯定的,列如urllib,urllib2,等模块。但是目前来说Requests模块是最流行的。而且也是最好用的模块。
利用pip可以非常方便的安装:
pip install requests
requests模块请求参数
通过前面我们使用用requests模块已经知道,requests模块在发送网络请求的时候可以传递一些关键字参数,如下图我们写过的案例所示:
那么除了这两个关键字参数,requests模块在发送网络请求的时候还有哪些关键字参数呢?接下来我们通过查看源码的方式,介绍requests模块发送请求常用的关键字参数。如下所示:
method: 请求方法 get post
url: 请求网址
params: (可选的) 查询参数
headers: (可选的) 字典 请求头
cookies: (可选的) 字典.cookiejar对象,用户身份信息
proxies: (可选的) ip代理
data: (可选的) 字典.列表.元组.bytes post请求时会用到
json: (可选的) 字典 提交参数
verify: (可选的) 是否验证证书,ca证书
timeout: (可选的) 设置响应时间,一单超过,程序会报错
allow_redirects: (可选的) 是否允许重定向,布尔类型数据
files: (可选的) 字典,文件
auth: (可选的) 字典,权限认证
stream: (可选的) 是否是数据串流
以上关键字参数排列顺序根据使用的频率进行排列。
赞 (0)