免费好用的WordPress采集插件WPJPost功能说明以及安装/添加采集任务的教程

之前我们在网上看到有wp-autopost插件,是自动采集的。但是需要付费。下面我们这边发布一个开源的版本。如果觉得好,大家可以赞助我们哦。本插件使用需要一定的html、css 基础。本插件开发纯属兴趣~~~插件已发布到WordPress官方插件中心。

主要功能

如何安装WordPress采集插件WP-JPost?

WP-JPOST

如何添加采集任务?

命名请使用英文字母数字组合.

例:douban。

这里填写目标网站首页的地址,以/结束。

例:https://www.douban.com

列表页一般都是二级页面,是栏目的具体展示页,一般是用页内跳转的链接。

例如:https://www.douban.com/group/meituikong/

WordPress 后台 — 文章 — 分类目录 — 编译你想入库到的分类 — 查看浏览器地址栏的地址。

例:/wp-admin/term.php?taxonomy=category&tag_ID=38…

这里的tag_ID=38,这个38就是我们需要填写的值。

WordPress 入库时,写入文章的标签值。多个标签请使用,分割(英文状态的逗号分隔)

例:WordPress,LaoJi,wp-jpost。

列表页中到二级目录的链接地址,同jQuery选择器方法。

列表页中第二页区别列表页的地方。例:

列表页地址:https://www.douban.com/group/meituikong/

翻页后变成:https://www.douban.com/group/meituikong/discussiON?start=8850

那么这里就填写:discussion?start={page}

这里的 {page} 就是翻页变化的地方。

这里填写翻页后最后的page值。例:

http://147hub.com/page/2052

这里翻页的最大值,即填写:2052

内容页中标题、内容的标签值。同jQuery选择器方法。下面我们具体得讲述一下怎么选择元素。首先我们需要使用chrome、firefox之类的浏览器。这些浏览器都具有调试等功能。我们这里以Firefox为例。

首先分析代码,以下元素标签可以是div , h3 ,title ,span , p 等。

例:<元素标签 class=”classname”>…</元素标签>,那么我们应该则填入:元素标签.classname。

例:<元素标签 id=”classname”>…</元素标签>,那么我们应该则填入:元素标签#classname。

学习更多CSS选择器可以参考:http://www.w3schools.com/cssref/css_selectors.asp

比如标题正文中带有一些原来的字符串,我想替换成我的,或者不要了。

注意:这里如想替换成一样的值,可以直接写一个。如每个替换成不同的则需要对应填。例:

搜索值:- 摔角资料, – 赛事新闻 – 摔角网, – 赛事战报, – 摔角网

替换值:

搜索值:搜索1,搜索2,搜索3

替换值:替换1,替换2,替换3

注意这里要一一对应。例如搜索2去要替换成空则替换值也需要留空(替换1,,替换2),否则就不能对应替换了。

我们在采集时,会遇到一些网站带有https,或者做了防采集。这时我们就需要curl来帮忙。

此文由“快兔兔AI采集器”自动生成,目的为演示采集器效果,若侵权请及时联系删除。

原文链接:http://justmysocks66.com/post/1181.html

更多内容