自定义网站搜索教程
点击查看:站源导入教程
1、基本原理与参数
自定义站源规则,说白了就是APP直接请求所填的搜索网址,得到返回的 html 后,根据对应标签来定位,获取指定内容包括: text(也就是文字),href(详情链接)。
一般格式 class/id/tag.属性名@tag.标签名.定位数字@获取内容的类型
2、网站案例说明
我们拿 https://53ys.cc/ (网站域名更改了,之前是https://wsys.tv) 这个网站来说一下具体的规则。
浏览器打来网站后,F12或者右键选择“检查”选项以后,就打开了开发者模式,再刷新下网页,让网站显示手机适配模式。点击网站中的搜索功能,这里我们以搜索“钢铁”为例,搜索地址为 https://53ys.cc/vodsearch/so.html?wd=钢铁
先给出完整规则:
1、网站名称:无双电影
2、搜索优先级:1 (说明:优先级的意思就是当添加了多个站源时首先搜索哪一个网站)
3、请求类型:get(说明:网站的搜索提交规则为get请求)
4、请求编码:utf-8(说明:请求搜索词的编码类型,也就是“钢铁”两个汉字的编码类型,一般为跟网页编码一样)
5、网页编码:utf-8(说明:查看网页<head>头里面的编码规则,如果不填写跟网站相同的规则,请求后容易乱码)
6、HttpUserAgent (说明:一般请求为手机类型,这样页面能简单快速一点)
7、网站URL:https://53ys.cc (说明:网站的首页地址,此项为判断此站源的唯一标识)
8、搜索地址:https://53ys.cc/vodsearch/so.html?wd={search} (说明:在地址栏中获得网站的搜索网址,并且对应的搜索关键词用{search}来替代)
9、搜索结果列表规则:class.fed-part-layout fed-back-whits@tag.dl(说明:此项就是来获得搜索结果列表。上面规则的意思就是 class='fed-part-layout fed-back-whits'的这个里面的tag标签为dl的内容。这样就会得到下面html返回的共10个内容。)
10、搜索结果列表每项地址规则:tag.h1.0@tag.a.0@href(说明:此项就是来获得每一项结果的具体url地址。上面规则的意思就是 第一个 h1 标签中的第一个 a 标签中的href内容,也就是“/detail/178525.html”。当防止出现相同标签的时候,可以加数字定位,第一个是 0,第二个是 1,第三个是 2,以此类推,默认不写的话就是所有的。)
11、搜索结果列表每项地址前缀:https://53ys.cc(说明:前面我们已经获取了每项结果的地址为“/detail/178525.html”,可以看出是个不完整的url,所以这一项的意思就是给他添加前缀补充完整,即“https://53ys.cc/detail/178525.html”)
12、搜索结果列表每项标题:tag.h1@tag.a@text(说明:每项结果的标题,规则的意思就是 第一个 h1 标签中的第一个 a 标签中的text内容,因为是第一个也就是0,默认可以不填写,获得文本内容即“钢铁苍穹2:即临种族”)
这样一个完整的网站搜索源就填写完成了,点击页面中的测试,来测试下搜索成功后,就可以保存了!
完整Json格式如下可复制后导入APP中:点击查看:站源导入教程
{
'name':'无双电影',
'serialNumber':'1',
'reqType':'get',
'reqCharset':'utf-8',
'htmlCharset':'utf-8',
'userAgent':'',
'baseUrl':'https://53ys.cc',
'searchUrl':'https://53ys.cc/vodsearch/so.html?wd={search}',
'ruleResultList':'class.fed-part-layout fed-back-whits@tag.dl',
'ruleResultLink':'tag.h1@tag.a@href',
'resultLinkPrefix':'https://53ys.cc',
'ruleResultTitle':'tag.h1@tag.a@text'
}