所以下面給出臨時的解決方法: 我這里是用的 火車頭采集器2010sp2個人版。
商業版用戶的采集后的網址都存儲在 PageUrl 目錄里面的,一個任務對應一個db3.大家可以從最上面的任務往下數第一個,對應的就是Site_*.db3.這樣大家可以先備份一下,然后清空也不怕了,到時候直接還原用戶名既可以,如果怕出錯,全部保存,一會恢復即可。
如圖:
如果想更進一步的查看,這個db3其實就是sqlite數據庫格式的文件,可以用db3數據庫編輯器 查看修改。根據jobid查看,有朋友問不知道jobid怎么辦,呵呵,大家可以到 Data 目錄查看 3-新浪國內新聞 后面的新浪國內新聞就是你自定義的網站欄目名稱。這個跟jobid對應上即可。
如圖:
最后大家備份好數據庫以后就可以(需要備份在 PageUrl 與 Data目錄的你的任務名對應的文件夾,最好是全部以防萬一,采集完就可以覆蓋下。)
后來從網站也看到了如下文件,跟我的這篇大同小異。大家可以參考下。
火車頭是一個不錯的采集軟件,“盜亦有道”,看你如何利用了。
Linker以前也偶爾研究下火車頭采集軟件,只是一直沒有購買商業版本,想想,現在的版本遠沒有以前的1.x和2.x版本來得爽快。
一位兄弟,昨晚說他的火車頭采集軟件(企業版本的哦,有錢人?。偸翘崾救蝿盏刂穾熘貜?,研究了下,比較簡單,告訴了他處理的方法,另外,經過搜索發現,火車頭的3.0 sp1版本有過這個bug,清除不掉任務地址庫,但管理員已經在sp2版本中解決掉這個問題了。
后來這位朋友又問火車頭采集軟件的任務地址庫是哪個文件?怎么樣保存任務地址庫?怎么樣手動清理任務地址庫文件?據Linker所知,編輯任務地址庫,需要是商業版本了,如果想手動來處理,可以發現,手動地址庫文件是在火車頭根目錄下的pageurl目錄中,每一個任務對應一個地址庫文件,mdb格式的,打開可以發現,具體地址是被加密了?;疖囶^也有些太商業了,嘿嘿!
既然知道任務地址庫的位置和文件了,手動清理任務地址庫,自然就簡單了。刪除讓火車頭重復(刪除后,編輯該任務,再保存),或者直接刪除該庫里面的記錄,都可以。想另存為其他任務所用,重命令為其它任務的id就行了。
簡單測試通過。 VeVb武林網原創文章。
新聞熱點
疑難解答