WordPress防采集的几种方法

WordPress

防采集的⼏种⽅法

⼩提⽰:本⽂提供的⽅法只能⼀定程度上防⽌通过

feed

采集的程序,对于直接采集⽂章页⾯的程序没有作⽤。

相信经常写博客的⼈都知道采集是怎么回事,⽹上有很多免费的或者付费的各种采集程序,可以采集⽂章、图⽚、下载内容等等,甚⾄还有

各种明⽬张胆的⼩偷程序。做这种⽹站的⽬的很明显,就是不劳⽽获,通过采集⽂章,经过⼀定的处理将内容⼆次发布。其实现在很多门户

⽹站也会这么做,只不多很多时候是靠⼈⼯的将⽂章

⼀下,就作为原创了。

那么,对于那些坚持产出原创⽂章的博主,应该怎样防⽌被采集呢?

 

⽬前⼤部分的博客都是通过建⽴的,⽽

WordPress

本⾝就可以安装各种

采集插件(这⾥就不做介绍了),因⽽就有很多⼈直接⽤

WordPress

来做采集站。当然,也有⽤其它博客程序或者程序来做采集站的。

 

过,⼀般的采集站都是以订阅

feed

为基础的,那么通过对

feed

进⾏⼀定的处理,就可以在某种程度上防⽌被采集程序强暴。

⽹上已经有⼀些

WordPress

的防采集插件,有判断

User-Agent

的,有增加⼲扰⽂字的,这⾥就不做讨论了,有兴趣的同学可以。这⾥有⼀

篇,年代久远了,不知是否还可⽤。

下⾯主要介绍⼏种对

feed

的处理办法:

将博客的

feed

设置只显⽰摘要,并增加

阅读全⽂

链接

通过这样的⽅法,采集程序只能采集到摘要部分,并含有

阅读全⽂

的链接。但是对于普通的订阅者,也只能看到这些了,那么这会不会造

成不便呢?其实,让访问者打开你的⽹站阅读⽂章是可以提升⽤户体验的,你⾃⼰的排版设计等在阅读器中不⼀定能很好的展现,就习惯在

订阅器中看到好的⽂章时直接转到⽹站继续阅读。

具体做法:

1. 

WordPress

⾯板中,选择

Settings

(设置)

– Reading Settings

(阅读设置),选择下图中所⽰位置的

 Summary

(摘要),然后点击

Save Changes

即可(中⽂版

WordPress

可参照对应位置进⾏操作):

feed

输出设置成只显⽰摘要

2. 

feed

中加⼊

阅读全⽂

链接,找到你的模版⽂件中的

functions.php

<?php 

 ?> 

之间添加以下代码:

/* RSS 

中添加查看全⽂链接

 @44ux.com */

function

 

feed_read_more($content) {

    return

 

$content

 

. ‘<p><a rel=”bookmark” href=”‘.get_permalink().'” target=”_blank”>

阅读全⽂

</a></p>’;

add_filter (‘the_excerpt_rss’, ‘feed_read_more’);

保存后上传到服务器,覆盖原来的⽂件即可,这样在

feed

中就会显⽰

阅读全⽂

链接了。其实通过这种⽅式可以向

feed

中增添很多信息,甚

⾄可以将

Google Adsense

的⼴告放进去,不过要⼩⼼,这样可能会引起订阅者的反感。

3. 

还可以在

feed

中增添版权信息,让你的版权更加突出。同样是在

functions.php

中,增添以下代码(将版权信息改成你⾃⼰的)即可:

13

/* RSS 

中添加版权信息

 @44ux.com */

function

 

feed_copyright($content) {

     if(is_single() or

 

is_feed()) {

          $content.= “<p class=’copyright’>”;

          $content.= ‘

版权所有:

<a title=”Hi.laser! @44ux.com” href=””>Hi,laser! @44ux.com</a> <a rel=”bookmark” title=”‘.get_the_title().'”

href=”‘.get_permalink().'”>

‘.get_the_title().’

</a><br />’;

          $content.= ‘

本⽂链接:

<a rel=”bookmark” title=”‘.get_the_title().'” href=”‘.get_permalink().'”>’.get_permalink().'</a><br />’;

          $content.= ‘

特别声明:除特别标注,本站⽂章均为原创,遵循

<a href=”” target=”_blank”>CC BY-NC 3.0</a>

,转载请注明出处

‘;

          $content.= “</p><br />”;

     }

     return

 

$content;

//add_filter (‘the_content’, ‘feed_copyright’); //

此句可像⽂章内容中添加版权

add_filter (‘the_excerpt_rss’, ‘feed_copyright’);

另外,顺便提⼀下,还有⼀些防⽌采集的⽅法,都各有利弊,这⾥简单列⼀下:

、限制

地址单位时间的访问次数

、屏蔽

ip

、利⽤

加密⽹页内容

、⽹页⾥隐藏⽹站版权或者⼀些随机垃圾⽂字,这些⽂字样式写在

css

、⽤户登录才能访问⽹站内容

、利⽤脚本语⾔做分页

隐藏分页

、防盗链措施

只允许通过本站页⾯连接查看,如:

Request.ServerVariables(“HTTP_REFERER“)

此文由“快兔兔AI采集器”自动生成,目的为演示采集器效果,若侵权请及时联系删除。

原文链接:https://wenku.baidu.com/view/8d1c67c4514de518964bcf84b9d528ea81c72fbd.html

更多内容