CTspider下载-长腿蜘蛛采集插件 v2.5 官方版

CTspider也称作为长腿蜘蛛采集插件,这是一款简单易用的全自动WordPress采集插件,该程序旨在帮助您实现全自动采集,而无需人工干预,用户仅需设置任务名称、更新时间、字符集、随机IP、多线程采集、文章标题、文章内容、内容过滤、内容替换、自定义样式等参数,随后即可执行采集任务,软件具备了简单直观的配置界面,而且根据类型分为不同的模块,从而使配置更加简单,此外,其还内置了日志功能,可以生成详细的操作日志,有需要的朋友赶紧到本站下载吧!

CTspider(长腿蜘蛛采集插件)

软件功能

全自动采集无需人工干预

只需几分钟,便可以立即更新到网站,完全自动执行无需人工干预。

多线程任务执行

多线程,多任务同时执行,每个任务互不干扰,提高了近40%的执行速度。

CSS选择器精确采集

只需要简单设置规则便可以精确采集标题,正文及其他任何HTML内容。

定时自动采集

简单设置好每个任务,多久执行一次任务时间,便可以定时执行采集任务。

支持WordPress全功能

完美支持WordPress各种功能、标签,摘要,特色图片,自定义栏目等。SEO

支持SEO全功能优化

支持内容过滤,甚至可以在文章任意位置添加上自定义内容,也可以自定义文章样式。

软件特色

随机IP,开启后减少采集时P被封的几率。

多线程采集,开启多线程有助于提高采集速度。

设置多线程数量,根据服务器配置可设置(10-100)之间。

简单直观的配置界面,您可以轻松完成配置过程。

标题匹配规则支持文章内容、文章摘要、文章标签、特色图片、发布时间、自定义栏目等多种类型。

内置日志功能,可以自动记录详细的操作信息。

安装方法

首先下载长腿蜘蛛-CTspider插件

然后到WordPress插件页面点击上传,安装启用即可。

如果使用FTP上传,请使用二进制上传协议。

使用说明

伪原创同义词替换

CTspider(长腿蜘蛛采集插件)

同义词替换功能可以对每一个项目进行单独设置,需要开启的可以选择《是》,不需要开启的你可以保留《否》。

使用本功能前你需要在CT spider 插件选项上进行伪原创功能设置。下图

CTspider(长腿蜘蛛采集插件)

点击之后进行设置你需要转换的同义词。

CTspider(长腿蜘蛛采集插件)

每一行填写一个你希望替换的词语。

翻译功能

CTspider(长腿蜘蛛采集插件)

目前支持百度翻译引擎(完全免费),共支持29种语言相互翻译,轻松获取原创文章。后续更新中还会不断扩展….

发布模式:一共 有3中发布模式。

第一种-只发布译文

第二种-原文一段,译文一段

第三种-上面全部原文,下面全是译文。

使用本功能前你需要在CT spider 插件选项上进行翻译能设置。下图

CTspider(长腿蜘蛛采集插件)

然后填写你在百度翻译上申请的APP ID 及 密匙 保存后可进行配置设置29种语言任你选择。

CTspider(长腿蜘蛛采集插件)

文章内容过滤

CTspider(长腿蜘蛛采集插件)

CSS选择器:span 表示过滤 * 标签包含的内容

你也可以用class属性 例如.ad 表示过滤 HTML元素属性为 class=”.ad” 包含的内容

索引:如果 索引 是 0 为找到所有匹配的元素 ; 1 为找到第1个匹配的元素 ; -1 为找到最后1个匹配的元素.

HTML标签过滤

CTspider(长腿蜘蛛采集插件)

HTML标签:script 表示过滤 html中的javascript标签

是否删除标签内容:是:表示删除标签内所有的内容 否:表示只过滤标签,不删除内容。

HTML标签属性过滤

CTspider(长腿蜘蛛采集插件)

自动删除HTML中的 id 属性:

例如 上面HTML代码中包含 id=”Cnt-Main-Article-QQ”,class=”Cnt-Main-Article-QQ” 则只会过滤 id属性 class不会被过滤。

自动删除HTML中的 class 属性: 例如 上面HTML代码中包含 id=”Cnt-Main-Article-QQ”,class=”Cnt-Main-Article-QQ” 则只会过滤 class属性 id不会被过滤。

自动删除HTML中的 style 属性: ( 例如

形式的html标签属性 ) style属性会被过滤。

标签属性忽略:如果你img和p标签不想过滤任何属性,可填写即可,过个标签用 | 隔开。

发布设置

发布设置这个标签可以对文章,分类,作者,发布状态,标签和摘要,文章的图片是否下载到本地进行设置。

CTspider(长腿蜘蛛采集插件)

发布设置

分类:选择你对应文章发布的分类。

作者:选择你对应文章的作者。

发布状态:分为,已发布,草稿,等待复审,自行选择即可。

标签和摘要

标签设置:如选择自动标签,可在标签列表文本框内填入你的标签,如果文章内容包含下面标签的关键字时,会自动添加到对应的文章标签。

使用WordPress标签库:如果勾选,表示从你的wordpress网站,标签库寻找文章匹配的标签 ,进行自动添加。

标签限制数量:默认是0 表示不限制,文章中包含多少标签便添加多少没数量限制,如果设置为3,表示只匹配3个标签。

自动摘要:开启后默认将文章中的第一段设置为文章摘要,如果设置为2:表示将第二段设置为文章摘要。

图片设置

CTspider(长腿蜘蛛采集插件)

图片地址属性:默认src 一般不需要修改。

下载远程图片:开启后,可以将采集的文章图片下载到你的wordpress本地。

下载图片自动添加水印:首先在CTspide 水印设置,上传你的水印图片,开启后即可给你下载的图片自行添加水印。

文章抓取

文章标题匹配规则

CSS选择器:h1

CTspider(长腿蜘蛛采集插件)

1.如果查找全文只有1个 h1 可直接填写CSS选择器为 h1

2.谷歌浏览器一键查找 F12 右键点击例图(h1) 出现Copy 然后选项 Copy Selector

得到 #Main-Article-QQ > div > div.qq_main > div.qq_article > div.hd > h1 直接填入CSS选择器也可以 两种方法。

文章内容匹配规则

CSS选择器:#Cnt-Main-Article-QQ

CTspider(长腿蜘蛛采集插件)

可以可到文章内容div节点ID Cnt-Main-Article-QQ 是唯一可以直接写入CSS选择器规则即可。

采集设置

文章列表来源

CTspider(长腿蜘蛛采集插件)

添加要采集的网址,可以添加多个网址,每个网址以新行开始。

缩略图采集(wp特色图片)

CTspider(长腿蜘蛛采集插件)

勾选(抓取缩略图)表示开始此功能。

设置CSS选择器:填写要采集的HTML元素。

详细CSS选择器教程:

方法1. 查看列表页面HTML源代码

CTspider(长腿蜘蛛采集插件)

可以看到img元素 有class=”zuto0″ 属性 CSS选择器:可设置 .zuto0

即可获得img图片链接

方法2. 可以用谷歌浏览器按 Ctrl + Shift +C 选择当前缩略图元素 右键点击HTML源代码img 出现 Copy 下面的 Copy selector 点击以后获取如下:

#news > div.list.first > div:nth-child(2) > div > a > img

div:nth-child(2) 2代表的是你选择的第二个 把2换成0 则可以选择所有

根据当前网址显示图片的默认属性,可以自己更换采集的图片属性。

文章网址匹配

CTspider(长腿蜘蛛采集插件)

文章网址CSS选择器:同缩略图CSS选择器道理一样。

添加文章来源网址:定义一个字段例如:(url)采集后会把采集到文章网址添加到每篇相对应的文章ID下,可自己调用。

最后保存,然后点击列表测试。

CTspider(长腿蜘蛛采集插件)

此文由“快兔兔AI采集器”自动生成,目的为演示采集器效果,若侵权请及时联系删除。

原文链接:https://www.anxz.com/down/92340.html

更多内容