高赞!一键下载知乎全部内容!再薅一把限量羊毛!
现在一说起来知乎,大家的印象就是「泻药,人在美国,刚下飞机」 ,所以也被人称作是「逼乎」,就是感觉里面都是装逼的。
知乎虽然如今确实内容质量不如从前,但这是所有社区快速扩展必然的结果,这是规律,不管是谁,都一样。
尽管大环境如此,但不可否认的是,知乎的内容质量相对其他社区依然还是有不小的优势,特别是很多早期的优质答主沉淀了大量的高质量内容,可惜的是,却被现在很多低质量的问答内容所埋没。
如果可以把这些尘封的优质内容挖掘出来,一键下载到本地,读起来想必会多一些专注,少一些浮躁。
再比如下面这种问题,基本都是用照片来回答的,肯定有不少小伙伴想把这些照片一起保存下来,然而一张一张保存真的是累人,如果能一起下载下来就好了。
幸运的是,Github 上的开发者姚泽源做了一个叫做知乎助手的工具,可以把话题、专栏、文章、问题及答案一键以电子书和网页的形式保存到本地,包括回答的那些照片。
怎么样,有兴趣吧,一起来试一下。
使用须知
首先打开已经安装好的知乎助手,它要求必须登录知乎账号,登录之后,找到你想爬取的话题、专栏、文章、问题及答案等等,点击分享,复制好链接备用。
在自定义任务那个版块,点击添加。
此时界面会变成下图的样子,此时得给大家提醒一下,免得操作不成功。
电子书名就是你爬取结果的文件夹名,可以随意取名。
下面的任务类型和待提取 url,就得慎重了。
将你复制的话题、专栏、文章、问题及答案等类型的链接复制输入到「待提取 url」下方的框内,然后选择任务类型。
一定要选择正确啊,选择正确了,任务 id 就能在后面显示出来。
如果选择错误,就会显示「未解析到任务 id」,自然就是失败的。
黑哥第一次用时就在这里栽了个跟头,以为直接复制粘贴链接就行了,弄了一会才明白咋回事,也算是为大家踩了雷了。
爬取过程
接下给大家展示一下爬取的过程,先试一下网罗灯下黑这个专栏吧,这里可是宝藏啊,今天一起把它下载下来。
把专栏的链接复制上去,选好类型,任务 id 解析出来了,电子书名也命名好了,那就点击「开始执行」。
这时宝藏里的文章就要被一一抓取了,由于文章、图片太多,它需要一定的时间,这时我们就喝杯茶,看下手机,该干嘛干嘛去。
任务完成后,它会在运行日志中显示存放的文件夹,同时还会自动打开文件呢,简直太听话了。
就是红框中那个文件夹。
里面有 2 个文件夹,这两个文件夹名称就不用多介绍了,里面分别是 epub 格式的电子书和网页格式的文件。
试了一下在手机阅读软件上打开这个专栏的电子书,和看平时的电子书没什么区别,就是之前的动图在这里成了静止的,这个不必苛责,毕竟电子书还没见过都可以支持动图的。
排版都是固定好的,效果看着还不错。
在 html 这个文件夹里呢,还有 4 个子文件夹,其中第二个同名的文件夹里面有专栏下每篇文章的链接,image 里面则有专栏下面文章中所有的图片,单文件版里面只有一个链接,但是包括了专栏下面的所有文章。
打开 html 链接,当然同样也是不支持动图。
其实知乎自己也有出品电子书,当然主题都是固定的,用这个工具,大家就可以把自己感兴趣的主题下载下来,制成电子书,非常方便。
这个工具和之前安利过 《一键下载公众号全部文章》的工具差不多,个人觉得功能还是不错的,毕竟有些知乎的问题及答案还是太长、太多,一次看不完,那就保存到本地来慢慢看,而且排版效果还不错。