来自多个页面的Python requests.get()?

2021-07-01 23:24:18 发布

网友

男 | 程序猿一只,喜欢编程写python代码。

我正在学习如何使用python进行webscrape,我想知道是否可以使用requests.get()获取两个页面,这样我就不必进行两个单独的调用和变量。例如:

r1 = requests.get("page1")r2 = requests.get("page2")pg1 = BeautifulSoup(r1.content, "html.parser")pg2 = BeautifulSoup(r2.content, "html.parser")

如你所见,有重复的代码。有办法吗?谢谢!在

2条回答
网友

1楼 ·

你可以使用列表赋值和理解,尽管只有两页的篇幅并不短。在

pg1, pg2 = [ BeautifulSoup(requests.get(page).content, "html.parser")                for page in ["page1","page2"] ]
网友

2楼 ·

我喜欢grequests库一次获取多个url,而不是请求。尤其是在处理大量的URL或包含多个子页面的单个URL时。在

import grequests  urls = ['http://google.com', 'http://yahoo.com', 'http://bing.com']  unsent_request = (grequests.get(url) for url in urls)results = grequests.map(unsent_request)

在此之后,results可以根据需要进行处理。这可以很好地处理JSON数据:results[0]=第一个URL数据,results[1]=第二个URL数据,等等。。在

(0)

相关推荐

  • python测试开发django-112.文件下载功能

    前言 开发一个文件下载功能,在页面上点下载按钮,可以下载一个文件,如excel,word,pdf等 前端模板 前端页面写一个a标签,href地址对应接口下载接口地址:/downpdf <!DOC ...

  • 入门爬虫?一文搞定!

    为了感谢大家对"Python客栈"的关注与支持,我们每天会在留言中随机抽取三位粉丝发放6.6元小红包.快来参与吧! 文章分三个个部分 两个爬虫库requests和selenium如 ...

  • 凭借这5步,我30分钟学会了Python爬虫

    https://m.toutiao.com/is/JqEjGhU/ 在不同公司的许多人可能出于各种原因需要从Internet收集外部数据:分析竞争,汇总新闻摘要.跟踪特定市场的趋势,或者收集每日股票价 ...

  • 用Python进行Web爬取数据

    介绍 我们拥有的数据太少,无法建立机器学习模型.我们需要更多数据! 如果这句话听起来很熟悉,那么你并不孤单!希望获得更多数据来训练我们的机器学习模型是一个一直困扰人们的问题.我们无法在数据科学项目中获 ...

  • Python3.5

    应朋友之约,帮他做个爬虫,并且每个网页的数据都分别导入到excel中. 目标网站:http://www.hs-bianma.com/hs_chapter_01.htm 根据我的观察,网页采取的是< ...

  • SAP Spartacus 如何获得当前渲染页面的 CMS 元数据

    PageLayoutService 实现里有一个 cms 依赖:CmsService. 当前页面元数据信息,通过 cms.getCurrentPage 维护. 从 routingService 里拿到 ...

  • python+requests接口自动化项目完整框架设计

    前言 有很多小伙伴吵着要完整的项目源码,完整的项目属于公司内部的代码,这个是没法分享的,违法职业道德了,就算别人分享了,也只适用于本公司内部的业务. 所以用例的代码还是得自己去一个个写,我只能分享项目 ...

  • python+requests+excel接口自动化数据驱动

    一.前言 1.环境准备: - python3.6 - requests - xlrd - openpyxl - HTMLTestRunner_api 2.目前实现的功能: - 封装requests请求 ...

  • 第 60 天:Python Requests 库的基本使用

    之前我们用了 urllib 库,这个作为入门的工具还是不错的,对了解一些爬虫的基本理念,掌握爬虫爬取的流程有所帮助.入门之后,我们就需要学习一些更加高级的内容和工具来方便我们的爬取.那么这一节来简单介 ...

  • 第 61 天:Python Requests 库高级用法

    上一篇我们介绍了 Requests 库的基本用法,学会之后大家就可以应付一般的请求了.这一篇我们接着介绍 Requests 的高级用法,以便应付一些棘手的问题. 会话维持 在 requests 中,直 ...

  • 【浏览器】HTML、CSS和JS如何变成页面的?

    我们经常写 HTML . CSS 和 JavaScript ,写好这些之后,我们就会在浏览器中看到页面,那浏览器究竟在这背后做了一些什么事情呢?本篇文章将揭晓答案! 了解浏览器的渲染原理是我们在通往更 ...

  • 网站文章页面的Tag标签对内链优化有什么作用

    文章页面的Tag标签虽然不及关键词的重要度,但也是SEO优化时不可缺少的一个重点,通过tag标签把相关性较高的文章整理成一个聚合页,把Tag标签作为聚合页面的标题,可以方便搜索引擎的抓取,特别是百度引 ...

  • 你见过的最全面的Python重点

    二十一 Python编程 6天前 来自:SegmentFault ,作者:二十一  链接:https://segmentfault.com/a/1190000018737045 这是一份来自于 Seg ...

  • 可能是最全面的 Python 字符串拼接总结

    Python编程学习圈 1周前 在 Python 中字符串连接有多种方式,这里简单做个总结,应该是比较全面的了,方便以后查阅. 加号连接 第一种,通过+号的形式: >>> a, b ...