(图文)产品入门指导

快兔兔AI采集器采用机器学习算法引擎打造,专门设计用来采集各类文章,并且发布到自己的网站,它无需配置便能爬取整个互联网内容,并且自动分析和提取,真正做到简单易用。

前提条件:

  • 能打开的wordpress博客程序
  • 安装好快兔兔AI采集器客户端

 

1:打开快兔兔,点击“连接到wordpress网站”,输入自己的网站地址

2:点击新增的网站,进入到爬虫管理界面,初次添加点击“自动生成关键词”

3:快兔兔会读取程序文章分类,并且根据分类名称自动生成一份默认的长尾词关键词,请手动检查和修改每个关键词,尽量和网站要采集的内容一致。

快兔兔爬取成功的内容,会自动根据这些关键词进行分类匹配

4:关键词完善之后,点击新增爬虫按钮,添加要被采集的网站地址(此例以博客园和CSDN举例)

  • 任务名称(随便起)
  • 爬虫地址:建议网站首页地址
  • URL深度:根据爬虫其实地址计算要爬取的URL深度,0表示爬取整个网站
  • 请求间隔:建议3~5秒,性能好的机器可以1秒

5:爬虫会自动根据URL地址逐层索引,并分析网页结构,自动提取文章正文和标题,通过AI算法引擎智能过滤不必要的内容,爬取成功的文章会被保存在“待发布文章”tab页。

6:用wordpress账号,远程登录到后台,然后点击发布就能发布到自己的网站中。AI算法会计算每篇文章的关键词,并根据事先设定好的关键词范围进行匹配,匹配到的文章会被投递到匹配度最高的文章分类中。

 

快兔兔AI采集器不同于您见到的任何采集器,采用最先进的机器学习算法打造,仅需几步就能轻松爬取文章进行发布。

更多内容