自定义网站搜索教程

点击查看:站源导入教程

1、基本原理与参数

自定义站源规则,说白了就是APP直接请求所填的搜索网址,得到返回的 html 后,根据对应标签来定位,获取指定内容包括: text(也就是文字),href(详情链接)。

一般格式  class/id/tag.属性名@tag.标签名.定位数字@获取内容的类型

2、网站案例说明

我们拿 https://53ys.cc/ (网站域名更改了,之前是https://wsys.tv) 这个网站来说一下具体的规则。

浏览器打来网站后,F12或者右键选择“检查”选项以后,就打开了开发者模式,再刷新下网页,让网站显示手机适配模式。点击网站中的搜索功能,这里我们以搜索“钢铁”为例,搜索地址为 https://53ys.cc/vodsearch/so.html?wd=钢铁

先给出完整规则:

站源规则

1、网站名称:无双电影

2、搜索优先级:1 (说明:优先级的意思就是当添加了多个站源时首先搜索哪一个网站)

3、请求类型:get(说明:网站的搜索提交规则为get请求)

4、请求编码:utf-8(说明:请求搜索词的编码类型,也就是“钢铁”两个汉字的编码类型,一般为跟网页编码一样)

5、网页编码:utf-8(说明:查看网页<head>头里面的编码规则,如果不填写跟网站相同的规则,请求后容易乱码)

网页编码

6、HttpUserAgent (说明:一般请求为手机类型,这样页面能简单快速一点)

7、网站URL:https://53ys.cc (说明:网站的首页地址,此项为判断此站源的唯一标识)

8、搜索地址:https://53ys.cc/vodsearch/so.html?wd={search} (说明:在地址栏中获得网站的搜索网址,并且对应的搜索关键词用{search}来替代)

9、搜索结果列表规则:class.fed-part-layout fed-back-whits@tag.dl(说明:此项就是来获得搜索结果列表。上面规则的意思就是 class='fed-part-layout fed-back-whits'的这个里面的tag标签为dl的内容。这样就会得到下面html返回的共10个内容。)

搜索结果列表规则

10、搜索结果列表每项地址规则:tag.h1.0@tag.a.0@href(说明:此项就是来获得每一项结果的具体url地址。上面规则的意思就是 第一个 h1 标签中的第一个 a 标签中的href内容,也就是“/detail/178525.html”。当防止出现相同标签的时候,可以加数字定位,第一个是 0,第二个是 1,第三个是 2,以此类推,默认不写的话就是所有的。)

搜索结果列表每项地址规则

11、搜索结果列表每项地址前缀:https://53ys.cc(说明:前面我们已经获取了每项结果的地址为“/detail/178525.html”,可以看出是个不完整的url,所以这一项的意思就是给他添加前缀补充完整,即“https://53ys.cc/detail/178525.html”)

12、搜索结果列表每项标题:tag.h1@tag.a@text(说明:每项结果的标题,规则的意思就是 第一个 h1 标签中的第一个 a 标签中的text内容,因为是第一个也就是0,默认可以不填写,获得文本内容即“钢铁苍穹2:即临种族”)

搜索结果列表每项标题

这样一个完整的网站搜索源就填写完成了,点击页面中的测试,来测试下搜索成功后,就可以保存了!

完整Json格式如下可复制后导入APP中:点击查看:站源导入教程

{

'name':'无双电影',

'serialNumber':'1',

'reqType':'get',

'reqCharset':'utf-8',

'htmlCharset':'utf-8',

'userAgent':'',

'baseUrl':'https://53ys.cc',

'searchUrl':'https://53ys.cc/vodsearch/so.html?wd={search}',

'ruleResultList':'class.fed-part-layout fed-back-whits@tag.dl',

'ruleResultLink':'tag.h1@tag.a@href',

'resultLinkPrefix':'https://53ys.cc',

'ruleResultTitle':'tag.h1@tag.a@text'

}

(0)

相关推荐