一起学爬虫(Python) — 02

一起学爬虫(Python) — 19 年轻人,进来学自动化

今天要学会爬

  • requests模块
    • 什么是requests模块
    • 如何安装requests模块
    • 怎么用requests模块
  • 实战!

requests模块

什么是requests模块

大家好鸭,今天是写博客的第二天,昨天写的结果只有不几个人看了呢,不过还有两个小伙伴点赞了,真的是万分感谢!!!

希望各位看客能多多提意见还有提问题哦,小泽都会努力解答的~
咳咳,开始今天的正题:requests模块。
如果学过python基础的话就会知道模块是个什么东西,没有学过直接来这里看的呢,也应该大致知道模块是个什么东东,就是类似于数学公式的存在,不需要繁琐的计算,直接套用公式的那种感觉。
那么,什么是requests模块呢?
python自带的一款基于网络请求的模块,功能强大,效率极高!
一个字,牛逼!!
总之你不会写不理解的东东,这个模块统统都给你解决喽,你只需要一句话,一个词就可以直接调用一大堆神奇的指令~

如何安装requests模块

环境安装:

pip install requests

  • 1
  • 1

我的系统是win7的,不过推荐各位用win10系统,在下是因为贫穷…咳咳,还有如果用的是pycharm的话,安装模块要在……

找到上图所示的目录Project–>Project interpreter,然后点击右上角的加号。

搜索requests,然后点击左下角的install Package进行下载,成功了下面会提示你绿了(有个绿条条)
这里我已经下载过了,所以各位自行下载吧~

怎么用requests模块

如果上面的步骤都准备好了,那么恭喜你,可以开始爬了!
当然可能会有些小伙伴会报错呀报错呀报错呀之类的,没事,把问题留言一下,小泽看到了会及时回复的~
那么,光看不做可不行,知道了理论知识,也要会实践,对吧。
在那之前先了解一下requests模块干事的四个步骤,然后敲代码的时候要想着这四个步骤,一步一步来,稳住,不要浪!
1.指定url(发现敌军位置)
2.发起请求(请求使用意大利炮)
3.获取响应数据(开炮!)
4.持久化存储(收拾战场)

后面的比喻可能不那么精准哈…不过大概意思就是这样,要知道,requests模块是模拟我们去上网,所以要从我们自己的角度去给requests模块施加命令,不能一步登天哈。

实战!

首先啊,不管干什么,要先记住一件事,导入模块!

#导入requests模块import requests
  • 1
  • 2
  • 1
  • 2

1.指定url
那我们随便找一个网站去试一试,随便找啊,比如说百度吧。
www.baidu.com

#1:指定urlurl='https://www.baidu.com/'

  • 1
  • 2
  • 1
  • 2

各位会不会觉得百度很厉害,一定爬不下来?
给我爬!

#2:发起请求(get方法会返回一个响应对象)response = requests.get(url=url)
  • 1
  • 2
  • 1
  • 2

这一步大家应该都看得懂吧,requests.get()是一个方法,里面要指定url,爬也得爬对地方对吧。response则是接受了requests.get()方法爬取回来的数据,就是响应对象,很专业的名词啊,但是没关系,知道就好了。

#3:获取响应数据page_text = response.text

  • 1
  • 2
  • 1
  • 2

到了第三步喽,这个时候已经爬回东西来了,进去了又出来,那还进不进去都无所谓了,毕竟东西已经爬到了,接下来就是把这个东西转换成我们能看得懂的数据,当然你也可以自己把response打印一下,看一看对吧,要多动手实践才能知道为什么要这么做的,不要光我说什么就是什么了。
.text就是把response转换成了文本格式,然后又把数据给了page_text,这里为什么要用page_text呢,因为高级啊!别人看不懂就会显得很高级~

#4:持久化存储with open('./baidu.html','w',encoding='utf-8') as fp: fp.write(page_text)print('爬完了')
  • 1
  • 2
  • 3
  • 4
  • 1
  • 2
  • 3
  • 4

最后一步,把我们爬取到的东西保存下来,这个大家应该都能理解,突然觉得很简单吧,这就是爬虫!
但是程序员会让你这么简单的爬下来吗那些重要数据吗?答案肯定是No!所以为了爬取美女图片,我们要更加努力学习!
明天,我们就来使自己更强大!
至少得爬取到我们想要的东西,对吧。
那今天就到这里啦,各位看官早点睡吧,晚安~

(0)

相关推荐

  • Python Urllib和urllib2哪个模块好?Python入门

    Python是一门高级的编程语言,它语法简单.清晰,容易入门,可用的包.库.模块有很多,即便是初学者也能够快速实现简单的网络爬虫,那么你知道Python中爬虫模块有哪些吗?我们一起来看看吧. Pyth ...

  • 爬虫入门教程 —— 2

    requests Request 自称是 HTTP for Humans  ,非常的方便. Request 其实底层就是封装的urllib3,它的文档非常的完备,完全可以支持现在的网络需要,可以在py ...

  • Python爬虫:爬取需要登录的网站

    不少伙伴学爬虫,这就出一期Python爬虫教程,文末总结的有视频教程,自己按需学习哈! 爬虫在采集网站的过程中,部分数据价值较高的网站,会限制访客的访问行为.这种时候建议通过登录的方式,获取目标网站的 ...

  • Python爬虫学习笔记(三)

    Cookies: 以抓取https://www.yaozh.com/为例 Test1(不使用cookies): 代码: import urllib.request# 1.添加URLurl = &quo ...

  • 用 50 行代码写个听小说的爬虫

    来源:Python 技术「ID: pythonall」 在路上发现好多人都喜欢用耳机听小说,同事居然可以一整天的带着一只耳机听小说.小编表示非常的震惊.今天就用 Python 下载听小说 tingch ...

  • 你要偷偷的学Python,然后惊呆所有人(第七天)

    标题无意冒犯,就是觉得这个广告挺好玩的 文章目录 前言 欢迎来到我们的圈子 初见爬虫 为什么是爬虫 通用爬虫架构 爬虫的工作步骤 优秀爬虫的特性 1.高性能 2.可扩展性 3.健壮性 4.友好性 爬虫 ...

  • requests模块的入门使用

    requests模块的入门使用 dongge-destiny 2018-07-11 00:10:18  137  收藏 分类专栏: python-爬虫 文章标签: requests模块的入门使用 版权 ...

  • python爬虫整理| 原来我曾经拥有过这么多爬虫啊

    一.requests模块的学习 使用事前:pip install requests 1)发送get,post请求,获取相应: response = requests.get(url) #发送get请求 ...

  • 一起学爬虫(Python) — 06

    一起学爬虫(Python) - 19 年轻人,进来学自动化 今天我们要停下来 回顾 xpath 什么是xpath 查帕斯的原理 案例 举一反三 回顾 鲁迅先生曾说过,学习要脚踏实地,要会举一反三!昨晚 ...

  • python爬虫入门02:教你通过 Fiddler 进行手机抓包

    哟~哟~哟~ hi起来 everybody 今天要说说怎么在我们的手机抓包 通过 python爬虫入门01:教你在Chrome浏览器轻松抓包 我们知道了 HTTP 的请求方式 以及在 Chrome 中 ...

  • 「从0开始学架构」02 | 架构设计的历史背景

    理解了架构的有关概念和定义之后,今天,我会给你讲讲架构设计的历史背景.我认为,如果想要深入理解一个事物的本质,最好的方式就是去追寻这个事物出现的历史背景和推动因素.我们先来简单梳理一下软件开发进化的历 ...

  • 机器学习用Python—Python集成工具包Anaconda安装步骤

    近几年来,机器学习以及深度学习的研究异常火热,机器学习和深度学习也逐渐渗透到各个领域,当然,脑科学领域也不例外.利用机器学习和深度学习技术解决脑科学领域中的问题,成为目前最为火热的研究方向之一.而神经 ...

  • 硕博士都在学的Python高效工具,建议掌握

    科研人,科研魂,科研人眼泪溢出盆. 工欲善其事必先利其器,据我所知,很多行业专家逐渐在使用Python进行文本数据处理.特殊图像的处理.仿真脚本的撰写. 那么可能就有善于发掘的同学会问,做科研是不是一 ...

  • 《中国相学·面相》02.什么是面相

    《中国相学·面相》02.什么是面相

  • 学了 Python 能用来做什么?

    说起编程语言,Python 也许不是使用最广的,但一定是现在被谈论最多的.随着近年大数据.人工智能的兴起,Python 越来越多的出现在人们的视野中. 那么人们在谈论 Python 的时候究竟在谈论什 ...

  • 什么是Python爬虫?Python学习难不难?

    爬虫是Python的应用领域之一,简单.入门快.就业前景好,也是Python学习者就业的首选岗位,那么什么是Python爬虫?Python爬虫学习难不难?我们一起来看看吧. 什么是Python爬虫? ...

  • 新工具上线!只需2步助你轻松学爬虫!

    作者简介:张老师,学习计算机十余年,在信息安全.生物信息学.会计.平面设计.编辑出版等多个领域也均有涉猎,热爱钻研.热爱考证.热爱生活. 来源:菜J学Python 不买也可以分享给需要的人哦 你还在为 ...