网页检索工具(使用文档 测试中….)
采集地址: 必填
- 真实地址
选择器:
- .post_list 表示class为post_list的标签
- 表示输入的class参数,此参数必须全文唯一
结构:
- ul>li 表示选择器下的ul标签下的li标签
- 定位区块中的每一个元素/这样就达到了循环采集的目的
- 定位错误可能拿不到数据,或者只拿到一条
采集规则:
- 标签名 表示要采集结构下的标签 例如a、img等
- 标签属性 表示要采集标签的属性值 例如href、src等
- 当属性值填写text时输出标签中的内容
- 当属性值填写html时输出当前范围的html源码 便于调试
- 序号 例如li标签下有两个a标签,不在同一级,通过改变序号来选择,在程序中0表示第一位
- 前缀,当检索到的链接没有前缀地址时,可以在此处添加,默认为空
示例代码
<div class="post-list">
<ul>
<li>
<h1>
<a href="https://www.jsten.cn/">斯腾博客1</a>
</h1>
<a href="http://api.jsten.cn">斯腾API 1</a>
<img src="https://free2.yunpng.top/2024/09/20/66ec8b2587ec3.jpg">
</li>
<li>
<h1>
<a href="https://www.jsten.cn/">斯腾博客2</a>
</h1>
<a href="http://api.jsten.cn">斯腾API 2</a>
<img src="https://free2.yunpng.top/2024/09/20/66ec8b2587ec3.jpg">
</li>
<li>
<h1>
<a href="https://www.jsten.cn/">斯腾博客3</a>
</h1>
<a href="http://api.jsten.cn">斯腾API 3</a>
<img src="https://free2.yunpng.top/2024/09/20/66ec8b2587ec3.jpg">
</li>
</ul>
</div>
示例截图:
阅读剩余
版权声明:
作者:jsten
链接:https://www.jsten.cn/webretrieval/
文章版权归作者所有,未经允许请勿转载。
THE END