添加采集規(guī)則
規(guī)則說明系統(tǒng)默認(rèn)變量:<{articleid}> - 文章序號,<{chapterid}> - 章節(jié)序號, <{subarticleid}> - 文章子序號, <{subchapterid}> - 章節(jié)子序號。系統(tǒng)標(biāo)簽 * 可以替代任意字符串。系統(tǒng)標(biāo)簽 ! 可以替代除了<和>以外的任意字符串。系統(tǒng)標(biāo)簽 ~ 可以替代除了<>'"以外的任意字符串。系統(tǒng)標(biāo)簽 ^ 可以替代除了數(shù)字和<>之外字符串。系統(tǒng)標(biāo)簽 $ 可以替代數(shù)字字符串。采集規(guī)則中,需要獲取的內(nèi)容部分用四個以上系統(tǒng)標(biāo)簽代替,如 !!!!基本設(shè)置 網(wǎng)站標(biāo)識configs/article/collectsite.php中所添寫的標(biāo)識,可隨便填寫,一般為所采集站點的域名簡寫,以和其他規(guī)則區(qū)分。例:feiku 網(wǎng)站名稱所采集站的名稱。例:飛庫 網(wǎng)站地址所采集站的地址。例:http://www.feiku.com 文章子序號運(yùn)算方式不是必須添寫的,我這里就留空了。支持使用<{articleid}>標(biāo)記的四則運(yùn)算(+加,-減,*乘,/除,%取余) 章節(jié)子序號運(yùn)算方式不是必須添寫的,我這里就留空了。(誰知道他一個文件夾放多少書啊,他不按規(guī)則放,我不是采集不到 )支持使用<{articleid}>標(biāo)記的四則運(yùn)算(+加,-減,*乘,/除,%取余) 代理服務(wù)器地址 不使用代理服務(wù)器請留空 代理服務(wù)器端口 現(xiàn)有章節(jié)無法對應(yīng)時候是否全部清空重新采集 是 否 根據(jù)自己需要選擇 是否默認(rèn)把采集到的文章設(shè)置為全本 是 否 根據(jù)自己需要選擇,如果選擇"是"無論文章是連載還是完結(jié),你站上都顯示全本,建議選“否” 發(fā)送HTTP_REFERER標(biāo)志,用于突破防采集設(shè)置 是 否 默認(rèn)選“是”,不知道什么用,我選“是”先突破下再說 對方網(wǎng)頁編碼 (自動檢測 GB2312 UTF8 BIG5)默認(rèn)“自動檢測” 編碼與本站不同將自動嘗試轉(zhuǎn)換 文章信息頁面采集規(guī)則 文章信息頁面地址書籍信息頁網(wǎng)址,書籍ID用<{articleid}>代替。例:http://feiku.com/Book/<{articleid}>/Index.html 文章標(biāo)題采集規(guī)則要求會查看網(wǎng)頁的源文件啊 ,不會的可以停止了 .查看下信息頁面的源文件,然后找到文章標(biāo)題在源文件的什么位置(我們是以飛庫為例的,就是章節(jié)信息頁面那個《文章標(biāo)題》在源文件的位置).這里以《我的美女大小姐》這個為例,找到標(biāo)題附近的代碼是<div id="CrBookTitle"><span class="booktitle">《我的美女大小姐》</span></div>把上面代碼復(fù)制到文章標(biāo)題采集規(guī)則的那個框里,然后把我的美女大小姐這個真實的標(biāo)題替換為!!!!當(dāng)然也可以替換成其他的替換符號比如****不過講究的是在能表達(dá)意思的情況下范圍越小越好(習(xí)慣問題,這里當(dāng)然只能采集到文章標(biāo)題了,但是其他的一些采集的時候就有你不想要的東西). 作者采集規(guī)則<li class="l6"><a href="/Author/WB/144238.html">李興禹</a></li>這里的李興禹是要采集的內(nèi)容,用!!!!代替不過144238只對這個文章有用,其他文章有其他的數(shù)字,所以用任意數(shù)字串$代替.所以作者采集規(guī)則就是<li class="l6"><a href="/Author/WB/$.html">!!!!</a></li> 文章類型采集規(guī)則 <li class="l2"><a href="/Book/LN/133.html">都市</a></li>由上面兩個采集規(guī)則的寫法不難看出這里的規(guī)則是 <li class="l2"><a href="/Book/LN/$.html">!!!!</a></li>新聞熱點
疑難解答
圖片精選