這個小偷程序比較牛,只需要輸入一個網址就能一鍵采集全站,且支持98%站點。但是如果要做出比較精致的采集站來還是得下點功夫。
本文就介紹一下采集規則的編寫,要求程序在2.0以上版本。
首先需要選擇一個目標站,目標站需要的條件:
1. 最好是單域名,即只有 www.xxx.com,最好不存在其他的二級域名,圖片JS這些不影響。
2. 盡量選擇JS少的站,華麗的一般JS較多,如:美麗說 這些就不合適了。
3. 圖片不要防盜鏈,速度穩定。
教程選用的網站為:范文網,符號要求,下面開始規則的編寫步驟。
一、添加規則:
1. 打開VIVI萬能小偷的后臺 采集節點 -> 添加 ,節點名稱可以隨便填寫一個,然后填上目標站地址
2. 選上編碼gb2312(編碼的選擇:在你的瀏覽器打開目標網站,右鍵查看源代碼,找到text/html; charset=xxx xxx就是編碼)
3. 在【目標站名稱】處填:第一范文網
4. 保存
二、過濾廣告:
1. 打開你的網站首頁,看到已經完整的采集過來了。點擊一個內頁鏈接,進去看到有些廣告
2. 回到后臺,修改剛才編寫的采集規則。
3. 勾選上站外鏈接、站外JS文件、站內JS文件 (這個站廣告是放在站內JS文件所以過濾)。目的是為了過濾廣告以及一些無用鏈接
三、替換logo
1. 對著logo圖片右鍵,點擊屬性可以看到logo的地址了,把后面的地方復制下來(從問號開始)
2. 回到字符串替換規則,輸入
{vivisign}siteimages/DyfwLog.gif{vivicut}{vivisign}static/fanwen/logo.gif (后面的 {vivisign}static/fanwen/logo.gif 代表 /static/fanwen/logo.gif,也就是把logo地址替換成你本地的logo文件)
3.到本地static文件夾下,新建一個文件夾為fanwen,然后把logo保存進去為logo.gif
教程結束,采集規則如下
VIVI:YToxNTp7czo0OiJuYW1lIjtzOjY6Ire2zsTN+CI7czo4OiJmcm9tX3VybCI7czoyNjoiaHR0cDovL3d3dy5kaXlpZmFud2VuLmNvbS8iO3M6OToib3RoZXJfdXJsIjtzOjA6IiI7czo3OiJjaGFyc2V0IjtzOjY6ImdiMjMxMiI7czoxMjoicmVwbGFjZXJ1bGVzIjtzOjE3MDoiP3NpdGVpbWFnZXMvRHlmd0xvZy5naWZ7dml2aWN1dH17dml2aXNpZ259c3RhdGljL2Zhbndlbi9sb2dvLmdpZg0Ke3ZpdmljdXRsaW5lfQ0KaHR0cDovL2ltZy5kaXlpZmFud2VuLmNvbS9zaXRlaW1hZ2VzL0R5ZndMb2cuZ2lme3ZpdmljdXR9e3ZpdmlzaWdufXN0YXRpYy9mYW53ZW4vbG9nby5naWYiO3M6OToic2lmdHJ1bGVzIjtzOjA6IiI7czo3OiJyZXBsYWNlIjtzOjE6IjAiO3M6NzoicmV3cml0ZSI7czoxOiIwIjtzOjc6ImxpY2VuY2UiO3M6NzA6IrW9c3RhdGljzsS8/rzQz8KjrNDCvajSu7j2zsS8/rzQzqpmYW53ZW6jrMi7uvOw0WxvZ2+xo7TmvfjIpc6qbG9nby5naWYiO3M6Nzoic2lmdGFncyI7YTo1OntpOjA7czo2OiJpZnJhbWUiO2k6MTtzOjY6Im9iamVjdCI7aToyO3M6NDoib3V0YSI7aTozO3M6NToib3V0anMiO2k6NDtzOjc6ImxvY2FsanMiO31zOjQ6InRpbWUiO2k6MTM5OTczMTc0NDtzOjEwOiJzZWFyY2hfdXJsIjtzOjA6IiI7czoxNDoic2VhcmNoX2NoYXJzZXQiO3M6NjoiZ2IyMzEyIjtzOjEwOiJmcm9tX3RpdGxlIjtzOjEwOiK12tK7t7bOxM34IjtzOjg6ImJpZzUyZ2JrIjtzOjE6IjAiO30=:END
新聞熱點
疑難解答