一起学爬虫（Python） — 02

2024-05-02 12:15:45

今天要学会爬

requests模块
- 什么是requests模块
- 如何安装requests模块
- 怎么用requests模块
实战！

requests模块

什么是requests模块

大家好鸭，今天是写博客的第二天，昨天写的结果只有不几个人看了呢，不过还有两个小伙伴点赞了，真的是万分感谢！！！

希望各位看客能多多提意见还有提问题哦，小泽都会努力解答的~
咳咳，开始今天的正题：requests模块。
如果学过python基础的话就会知道模块是个什么东西，没有学过直接来这里看的呢，也应该大致知道模块是个什么东东，就是类似于数学公式的存在，不需要繁琐的计算，直接套用公式的那种感觉。
那么，什么是requests模块呢？
python自带的一款基于网络请求的模块，功能强大，效率极高！
一个字，牛逼！！
总之你不会写不理解的东东，这个模块统统都给你解决喽，你只需要一句话，一个词就可以直接调用一大堆神奇的指令~

如何安装requests模块

环境安装：

pip install requests

我的系统是win7的，不过推荐各位用win10系统，在下是因为贫穷…咳咳，还有如果用的是pycharm的话，安装模块要在……

找到上图所示的目录Project–>Project interpreter，然后点击右上角的加号。

搜索requests，然后点击左下角的install Package进行下载，成功了下面会提示你绿了（有个绿条条）
这里我已经下载过了，所以各位自行下载吧~

怎么用requests模块

如果上面的步骤都准备好了，那么恭喜你，可以开始爬了！
当然可能会有些小伙伴会报错呀报错呀报错呀之类的，没事，把问题留言一下，小泽看到了会及时回复的~
那么，光看不做可不行，知道了理论知识，也要会实践，对吧。
在那之前先了解一下requests模块干事的四个步骤，然后敲代码的时候要想着这四个步骤，一步一步来，稳住，不要浪！
1.指定url（发现敌军位置）
2.发起请求（请求使用意大利炮）
3.获取响应数据（开炮！）
4.持久化存储（收拾战场）
后面的比喻可能不那么精准哈…不过大概意思就是这样，要知道，requests模块是模拟我们去上网，所以要从我们自己的角度去给requests模块施加命令，不能一步登天哈。

实战！

首先啊，不管干什么，要先记住一件事，导入模块！

#导入requests模块import requests

1.指定url 那我们随便找一个网站去试一试，随便找啊，比如说百度吧。 www.baidu.com

#1:指定urlurl='https://www.baidu.com/'

各位会不会觉得百度很厉害，一定爬不下来？
给我爬！

#2:发起请求(get方法会返回一个响应对象)response = requests.get(url=url)

这一步大家应该都看得懂吧，requests.get（）是一个方法，里面要指定url，爬也得爬对地方对吧。response则是接受了requests.get（）方法爬取回来的数据，就是响应对象，很专业的名词啊，但是没关系，知道就好了。

#3:获取响应数据page_text = response.text

到了第三步喽，这个时候已经爬回东西来了，进去了又出来，那还进不进去都无所谓了，毕竟东西已经爬到了，接下来就是把这个东西转换成我们能看得懂的数据，当然你也可以自己把response打印一下，看一看对吧，要多动手实践才能知道为什么要这么做的，不要光我说什么就是什么了。
.text就是把response转换成了文本格式，然后又把数据给了page_text，这里为什么要用page_text呢，因为高级啊！别人看不懂就会显得很高级~

#4:持久化存储with open('./baidu.html','w',encoding='utf-8') as fp: fp.write(page_text)print('爬完了')

最后一步，把我们爬取到的东西保存下来，这个大家应该都能理解，突然觉得很简单吧，这就是爬虫！但是程序员会让你这么简单的爬下来吗那些重要数据吗？答案肯定是No！所以为了爬取美女图片，我们要更加努力学习！明天，我们就来使自己更强大！至少得爬取到我们想要的东西，对吧。那今天就到这里啦，各位看官早点睡吧，晚安~

python爬虫整理| 原来我曾经拥有过这么多爬虫啊

一.requests模块的学习使用事前:pip install requests 1)发送get,post请求,获取相应: response = requests.get(url) #发送get请求 ...
你要偷偷的学Python，然后惊呆所有人（第七天）

标题无意冒犯,就是觉得这个广告挺好玩的文章目录前言欢迎来到我们的圈子初见爬虫为什么是爬虫通用爬虫架构爬虫的工作步骤优秀爬虫的特性 1.高性能 2.可扩展性 3.健壮性 4.友好性爬虫 ...
爬虫入门教程 —— 2

requests Request 自称是 HTTP for Humans ,非常的方便. Request 其实底层就是封装的urllib3,它的文档非常的完备,完全可以支持现在的网络需要,可以在py ...
Python爬虫：爬取需要登录的网站

不少伙伴学爬虫,这就出一期Python爬虫教程,文末总结的有视频教程,自己按需学习哈! 爬虫在采集网站的过程中,部分数据价值较高的网站,会限制访客的访问行为.这种时候建议通过登录的方式,获取目标网站的 ...
requests模块的入门使用

requests模块的入门使用 dongge-destiny 2018-07-11 00:10:18 137 收藏分类专栏: python-爬虫文章标签: requests模块的入门使用版权 ...
Python爬虫学习笔记(三)

Cookies: 以抓取https://www.yaozh.com/为例 Test1(不使用cookies): 代码: import urllib.request# 1.添加URLurl = &quo ...
Python Urllib和urllib2哪个模块好？Python入门

Python是一门高级的编程语言,它语法简单.清晰,容易入门,可用的包.库.模块有很多,即便是初学者也能够快速实现简单的网络爬虫,那么你知道Python中爬虫模块有哪些吗?我们一起来看看吧. Pyth ...
用 50 行代码写个听小说的爬虫

来源:Python 技术「ID: pythonall」在路上发现好多人都喜欢用耳机听小说,同事居然可以一整天的带着一只耳机听小说.小编表示非常的震惊.今天就用 Python 下载听小说 tingch ...
一起学爬虫（Python） — 06

一起学爬虫(Python) - 19 年轻人,进来学自动化今天我们要停下来回顾 xpath 什么是xpath 查帕斯的原理案例举一反三回顾鲁迅先生曾说过,学习要脚踏实地,要会举一反三!昨晚 ...
python爬虫入门02：教你通过 Fiddler 进行手机抓包

哟~哟~哟~ hi起来 everybody 今天要说说怎么在我们的手机抓包通过 python爬虫入门01:教你在Chrome浏览器轻松抓包我们知道了 HTTP 的请求方式以及在 Chrome 中 ...
「从0开始学架构」02 | 架构设计的历史背景

理解了架构的有关概念和定义之后,今天,我会给你讲讲架构设计的历史背景.我认为,如果想要深入理解一个事物的本质,最好的方式就是去追寻这个事物出现的历史背景和推动因素.我们先来简单梳理一下软件开发进化的历 ...
机器学习用Python—Python集成工具包Anaconda安装步骤

近几年来,机器学习以及深度学习的研究异常火热,机器学习和深度学习也逐渐渗透到各个领域,当然,脑科学领域也不例外.利用机器学习和深度学习技术解决脑科学领域中的问题,成为目前最为火热的研究方向之一.而神经 ...
硕博士都在学的Python高效工具，建议掌握

科研人,科研魂,科研人眼泪溢出盆. 工欲善其事必先利其器,据我所知,很多行业专家逐渐在使用Python进行文本数据处理.特殊图像的处理.仿真脚本的撰写. 那么可能就有善于发掘的同学会问,做科研是不是一 ...
《中国相学·面相》02.什么是面相

《中国相学·面相》02.什么是面相
学了 Python 能用来做什么？

说起编程语言,Python 也许不是使用最广的,但一定是现在被谈论最多的.随着近年大数据.人工智能的兴起,Python 越来越多的出现在人们的视野中. 那么人们在谈论 Python 的时候究竟在谈论什 ...
什么是Python爬虫?Python学习难不难?

爬虫是Python的应用领域之一,简单.入门快.就业前景好,也是Python学习者就业的首选岗位,那么什么是Python爬虫?Python爬虫学习难不难?我们一起来看看吧. 什么是Python爬虫? ...
新工具上线！只需2步助你轻松学爬虫!

作者简介:张老师,学习计算机十余年,在信息安全.生物信息学.会计.平面设计.编辑出版等多个领域也均有涉猎,热爱钻研.热爱考证.热爱生活. 来源:菜J学Python 不买也可以分享给需要的人哦你还在为 ...