網站采集者在采集時,通常都是指定頭尾特征從哪到哪過濾.我們這里講的第一種方法:文章頭尾加隨機廣告,當然隨機廣告是不固定的。
比如你的文章內容是"校內網涂鴉代碼",則隨機廣告的加入方法:
<div id="xxx">隨機廣告1歡迎訪問校內網涂鴉代碼站隨機廣告2</div>
注:隨機廣告1和隨機廣告2每篇文章只要隨機顯示一個就可以了.
防采集第二種方法:在文章正文頁面插入重復特征頭尾代碼的注釋。文章列表加隨機不同的鏈接標簽,比如<a href="",<a class="dds" href=''
當然,這個可以用正則去掉,但足于對付通用的CMS采集系統了。。
<!--<div id="xxx_文章ID">-->
其它標題或內容...
<!--<div id="xxx_文章ID">--> <div id="xxx_文章ID">
隨機廣告1歡迎訪問4399com小游戲站隨機廣告2
<--</div>--></div><--</div>-->
防采集第三種方法:加在文章列表的隨便鏈接樣式。
即:正文頭尾或列表頭尾添加<!--重復特征代碼-->
原理是讓采集的人無法抓到列表鏈接規律,無法批量進行采集.
請看:
<a href="xxx.html">標題一</a>
<a alt="xxx" href="xxx.html">標題二</a>
<a href='xxx.html'>標題三</a>
<a href=xxx.html>標題四</a>
如果你把三種方法全部加上,我想一定能讓想采集的人頭疼半天而放棄的..
如果你還問,如何防止別人復制采集呢?要做到這一點容易,把你的網站的網線拔了,自己給自己看就好了.
新聞熱點
疑難解答