火车采集器保存为本地word、excel、html、txt文件方法及文件模板_爬虫软件技术与爬虫软件网页数据采集器门户

火车采集器保存为本地word、excel、html、txt文件方法及文件模板_爬虫软件技术与爬虫软件网页数据采集器门户

火车采集器如何将采集到的数据发布到本地的文件 TXT 或者CSV 等格式乱码

解决办法:

模版文件,用txt格式打开,然后 文件—另存为,选择ansi编码 然后发布设置那里 选择GBK 编码,或者

文件—另存为,选择utf-8编码 然后发布设置那里 选择UTF-8 发布即可

1、 我们以软件自带的火车采集器采集规则 搜狐新闻 为例子

火车采集器如何保存为本地word、excel、html、txt文件方法及文件模版说明截图教程1

2、 双击火车采集器采集规则,打开 搜狐新闻 这个规则

火车采集器如何保存为本地word、excel、html、txt文件方法及文件模版说明截图教程2

第三步:发布内容设置勾选 “方式二”的启用保存文件格式(自己可根据需要来选择)

3、 保存位置,这里就不做说明了,想保存到哪里就保存到哪里你的地盘你自个做主~

4、 文件模版,简单的说就是你保存到文件的具体模版样式。

以 “搜狐新闻”为例做txt文件模版

火车采集器如何保存为本地word、excel、html、txt文件方法及文件模版说明截图教程3

有5个标签

所以txt模版对应写上就可以了

火车采集器如何保存为本地word、excel、html、txt文件方法及文件模版说明截图教程4

模版会自动提取相应的标签内容。

Html 模版也是一样的

火车采集器如何保存为本地word、excel、html、txt文件方法及文件模版说明截图教程5

csv模版

火车采集器如何保存为本地word、excel、html、txt文件方法及文件模版说明截图教程6

Word模版亦是如此

火车采集器如何保存为本地word、excel、html、txt文件方法及文件模版说明截图教程7

5、 火车采集器文件名格式

火车采集器如何保存为本地word、excel、html、txt文件方法及文件模版说明截图教程8

点击这个按钮,可出现一个选择列表,这里可以任意选择匹配,给文件命名。

6、 火采集器文件编码

有utf-8和 gb2312 两种。 发布后 如果显示是乱码 ,就可能是你的编码没设置正确,换一种 应该就可以了。

嗯 就这些了,写的非常的直白,应该都可以看懂~~

此文由“快兔兔AI采集器”自动生成,目的为演示采集器效果,若侵权请及时联系删除。

原文链接:http://www.tadke.com/android-kaifa/huochetou-caiji/27/12621.html

更多内容