欢迎光临 - 我的站长站,本站所有资源仅供学习与参考,禁止用于商业用途或从事违法行为!

wordpress插件

WordPress自动采集Crawling插件
2019-06-18 我的站长站

WordPress自动采集Crawling插件

  • 插件编号:197
  • 插件分类:wordpress插件
  • 点击次数:450
  • 插件编码:GBK/UTF
  • 插件版本:wordpress4.0.x
  • 插件大小:438 KB
  • 下载权限:普通 / VIP
  • 插件售价:免费下载
  • 下载次数:38
立即下载

Crawling插件说明

Crawling是一款WordPress下的自动采集爬虫插件,能够自动采集爬取目标网站内容并自动发布。插件开源免费。爬虫漫步版权所有。

简单设置,轻松几步设置即可全站采集,定时更新。分类、标签自动匹配,内容批量替换

高速采集,可设置抓取线程数和抓取延时,最大限度控制抓取速度。防止主机商限制,防止反爬虫。

内容过滤,支持翻页、内容过滤、广告过滤。灵活控制抓取内容,发布文章干净简洁。

智能发布,支持文章图片自动保存替换,添加到媒体库同时链接到文章。支持上传至七牛云

Crawling插件使用教程

首先,下载最新版,得到crawling_v*.tar.gz。然后,解压压缩包,上传到wordpress插件目录。激活插件。

首先我们需要新建一个任务,一个任务可以理解为一个爬虫,在这里你可以配置多个任务,每个任务可以单独设置参数。

以采集我的站长站网站为例,这里只需要右键查看网页源代码,即可知道相应的链接 Xpath 规则是如何的,在我们目标网站中,文章的链接在网站 h2 标签下的 a 标签,所以规则就写//h2/a,即可。如下图所示。

WordPress自动采集Crawling插件
wordpress采集,Crawling插件截图

同理,文章标题匹配方式为文章页源代码中<div class=”post-main clearfix”>标签下的 h1 标签,那么我们匹配的时候按照 Xpath 规则,写为//div[@class=”post-main clearfix”]/h1 即可,@的作用是选中 class=”post-main clearfix”的 div 标签,按照这样的规则,再将文章内容匹配的标签规则写上,即可开始采集。

WordPress自动采集Crawling插件
WordPress采集,Crawling插件截图

还有更多高级功能,如翻页,内容过滤等,完全可以实现自定义采集目标网站内的任意内容。

不足之处,在实际运行这个插件中,发现,如果目标网站的文章链接为相对链接,则无法采集成功(此处也可能是小编对 Xpath 的规则掌握尚浅),所以选定目标网站时候,需要先查看一下,确认该网站的文章链接为绝对链接才行。

相关专题
解析
解析
2022-03-03 1433

解析是一种破解限制下载工具,我的站长站为你整理收集所有关于解析的资源,包含视频解析软件,音乐解析软件,在线解析网站,通通都是免费解析下载必备软件....

下载地址

· 积分下载:下载扣除对应积分,不扣除下载次数
· VIP免费:VIP会员免费下载,扣除下载次数
· 下载即代表您已阅读并同意 [服务条款]

相关推荐
  • 采集插件
  • wordpress采集
  • Emlog橙子自动采集插件
    Emlog橙子自动采集插件

    Emlog橙子自动采集插件是一款扩展性强悍能采集大部分未加密的网站,操作简单易上手,主要的一点就是免费。Emlog采集插件使用方法登录后台点击任务-添加任务-信息自己填-采集模板旁边有一个导入规则-...

    emlog插件 636 3年前
  • 织梦CMS神箭手云采集官方插件
    织梦CMS神箭手云采集官方插件

    插件后台截图采集插件简介神箭手云采集由大数据公司快忆科技自主研发,采用分布式架构,是一款云端在线智能爬虫,通过使用JS渲染、代理IP、防屏 蔽、验证码识别、数据发布和导出、图表控件等一系列技...

    织梦cms插件 1385 4年前
  • Discuz众大云采集插件v9.6.5
    Discuz众大云采集插件v9.6.5

    众大云采集说明01、安装本插件之后,可以自己编写采集规则或者输入您网站的关键词、一键批量采集任何的内容到您的论坛版块或者门户栏目、群组发布。02、可以把已经成功发布的内容推送到百度数据收...

    discuz插件 1316 4年前
  • DEDE织梦采集侠v2.8破解完美版
    DEDE织梦采集侠v2.8破解完美版

    DEDE织梦采集侠破解版 完整源码无限制版,采集版分UTF8和GBK两个版本,根据自己使用的dedecms版本来选择使用说明采集版分UTF8和GBK两个版本,根据自己使用的dedecms版本来选择!重要!!! 因文件是用mac系统...

    织梦cms插件 1373 4年前
  • 织梦cms采集侠v2.9.2破解版[微信采集增强版]
    织梦cms采集侠v2.9.2破解版[微信采集增强版]

    织梦cms采集侠说明采集侠2.9破解版是一款非常好用的cms采集工具,自动采集文章所以内容,分标题、段落、内链、外链等等不同的内容,还可以分清伪原创,seo站长必备工具,新增可以采集指定微信公众号内...

    织梦cms插件 5265 4年前
  • wordpress定时采集发布知乎《每天60秒》

    wordpress+宝塔面板定时采集发布知乎的《每天60秒读懂世界》,设置定时任务后,访问该文件即可自动创建分类,自动截图并发布当日60的文章。wordpress知乎每天60秒接口代码<?php$date = file_get_contents("https://www.zhihu.com/api/v4/columns/c_126125...

    wordpress教程 3 7个月前
  • WPOPT免费优化插件v1.1
    WPOPT免费优化插件v1.1

    插件介绍WPOPT免费优化插件v1.1由lovestu开发的一款WordPress优化插件,能对WordPress底层功能进行优化,支持功能开关,系统加速等功能。目前有几十种开关可以供使用,同时,每个功能都有开关说明。插件截...

    wordpress插件 82 1年前
  • wordpress自动采集插件3.7.8最新版
    wordpress自动采集插件3.7.8最新版

    wordpress自动采集插件3.7.8最新版,目前完美运行于的 WordPress 各个版本,请放心使用。WP-AutoPost-Pro 是一款优秀的 WordPress 文章采集器,是您操作站群,让网站自动更新内容的利器!如果是新手,请查看...

    wordpress插件 300 3年前
  • WordPress SEO by Yoast 插件+所有扩展
    WordPress SEO by Yoast 插件+所有扩展

    Yoast SEO插件介绍WordPress SEO by Yoast 插件包含了来自代码段编辑器和实时页面分析功能的所有内容,可帮助您优化页面内容、图片标题、元描述等更多的XML站点地图,以及其间的优化选项。扩展包括 ...

    wordpress插件 309 4年前
  • WordPress自动采集Crawling插件
    WordPress自动采集Crawling插件

    Crawling插件说明Crawling是一款WordPress下的自动采集爬虫插件,能够自动采集爬取目标网站内容并自动发布。插件开源免费。爬虫漫步版权所有。简单设置,轻松几步设置即可全站采集,定时更新。分类、...

    wordpress插件 450 4年前