别去送死了！Selenium 能被网站探测的几十个特征

2024-06-05 04:21:18

很多人喜欢使用Selenium 或者 Puppeteer(Pyppeteer)通过模拟浏览器来编写爬虫，自以为这样可以不被网站检测到，想爬什么数据就爬什么数据。

但实际上，Selenium 启动的浏览器，有几十个特征可以被网站通过 JavaScript 探测到。Puppeteer 启动的浏览器，也有很多特征能够被网站探测。

如果你不相信，那么我们来做一个实验。首先你使用正常的浏览器打开如下网址：https://bot.sannysoft.com/。可以看到，页面的内容如下：

这个页面很长，你得滚动鼠标往下看。大部分都是绿色的。

接下来，使用Selenium启动一个 Chrome 的有头模式，再打开这个页面看看效果：

一开始WebDriver这一项就标红了，说明网站成功检测到你使用模拟浏览器了。你再往下翻，标红的都是可以被检测出的特征。

左边是普通浏览器，右边是模拟浏览器

左边是普通浏览器，右边是模拟浏览器。如果你一项一项对比，就会发现很多地方都不一样。

这还是有头模式的效果。我们来看看无头模式：

from selenium.webdriver import Chrome

from selenium.webdriver.chrome.options import Options
chrome_options = Options

chrome_options.add_argument('--headless')

driver = Chrome('./chromedriver', options=chrome_options) driver.get('https://bot.sannysoft.com/') driver.save_screenshot('screenshot.png')

截图打开以后是下面这样的。不要吓到：

这么多特征都直接暴露了，你还隐藏个屁。网站只要想发现你，非常容易。

既然 Selenium 不行，那 Puppeteer 或者 Pyppeteer怎么样呢？我们使用 Pyppeteer 来做个实验。直接启动无头模式并截图。运行效果是下面这样的：

跟 Selenium 没什么区别。

所以，你还好意思继续用这两个东西来写爬虫？爬点没有安全意识的小网站可以。爬那些有强大安全团队和法务团队的公司，你就是在找死。

今天给大家推荐一本机器学习、深度学习的人都应该听说过一本经典教材：《Pattern Recognition and Machine Learning》，中文译名《模式识别与机器学习》，简称 PRML。出自微软剑桥研究院实验室主任 Christopher Bishop 大神之手。对，就是豆瓣评分 9.5 的这本书。

赞 (0)

爬虫神器 Pyppeteer 介绍及爬取某商城实战

重磅干货,第一时间送达作者:叶庭云,来自读者投稿编辑:Lemon 出品:Python数据之道提起 selenium 想必大家都不陌生,作为一款知名的 Web 自动化测试框架,selenium 支 ...
selenium+python自动化85-Chrome静默模式（headless）

前言 selenium+phantomjs可以打开无界面的浏览器,实现静默模式启动浏览器完成自动化测试,这个模式是极好的,不需要占用电脑的屏幕. but...,phantomjs这个坑还是比较多的,并 ...
Python实现数据技术|爬虫便可获取免费百度文库付费文档

相信大家在百度文档中看到了比较合适的文档之后就有了想下载学习一下的想法,但是有些时候文章更多的需要付费下载,针对于文档中能发现语句是分为一个一个的标签中的文本进行输出的.如果你有耐心和任劳任怨的想法, ...
超越selenium的爬虫神器Pyppeteer

在写爬虫的时候,为了效率我们通常会选择解析网页api来获取数据,但是有时候解析方式比较困难,或者我们纯粹是为了快速实现爬虫,会使用浏览器自动化操作,说起这一点,肯定第一个想到的就是selenium,但 ...
庞统明知落凤坡有埋伏，为啥还要去送死？他算错了一事看错了一人

大家好,我们的老虎仔谈历史又来了,今天起我们一起来分享历史知识,也许你可以得到意想不到的收获哦. 来都来了,点个赞再走呗!本文由超级七品小芝麻官原创,欢迎关注交流! 落凤坡有埋伏其实关于落凤坡有埋伏 ...
《每个人都希望别人去送死，来保卫自己的生活》【陈旭-屠龙有术语录】

<每个人都希望别人去送死,来保卫自己的生活>[陈旭-屠龙有术语录] 作者:陈旭网名:屠龙有术唯一微信公众号:tulongys 陈旭私人微信:chenxusir [网友提 ...
李世民明知道孤城守不住，为何还让罗士信去送死？

罗士信是李世民麾下的一员猛将,以作战不要命著称.但俗话说,常在河边走哪有不湿鞋,越是猛人,死在战场上的可能性就越大,罗士信即是如此. 公元622年,李世民奉命平定窦建德死灰复燃的余党刘黑闼.相比窦建德 ...
破十天君的十绝阵，燃灯道人为何要派人去探阵送死呢？

破十天君的十绝阵，燃灯道人为何要派人去探阵送死呢？
元始天尊故意派谁去破十绝阵送死？

元始天尊故意派谁去破十绝阵送死？
六耳猕猴明知去灵山死路一条，为何还要送死，悟空说出了原因

六耳猕猴明知去灵山死路一条,为何还要送死,悟空说出了原因
她怕我去阿富汗送死，又跑来中亚边境

流浪地球第1361天本篇纯属虚构,请不要对号入座饿着肚子跑了三天,总算吃一顿热饭, 新疆的穆斯林过年不休息,也不涨价,一个包子才一元, 那超市也没吃的吗?那就饿着嘛, 你真狠心,我从160斤饿 ...
雍正王朝中雍正为何要派孙嘉诚去西北送死？问题在于他一错误举动！

(杨角风谈雍正王朝解密篇6--总106期) 在<雍正王朝>中有个人物的死引起了轩然大波,这个人就是孙嘉诚,也正是由于他的死,点燃了年羹尧灭亡的导火索. 那么到底谁该为孙嘉诚的死负责呢? 本 ...
女拳：挣钱我来，送死你去

文|进击的熊儿子本文系拆台(ID:chaitai2019)原创文章转载请联系授权今天(6月9日),@中国消防官微怒挂了一个垃圾@月岛天鹤. 称其"污言连篇,侮辱英烈!",还 ...