嘗試采集了幾個網站的文章,由于是圖文混排,選擇了保存圖片到本地,采集完成后,瀏覽中發現圖片顯示為X,右鍵查看圖片屬性,發現圖片地址為“/CMS/UploadFiles_4256/200707/20070702152907736.jpg”,我們知道,動易默認上傳圖片統一保存在相應頻道的“UploadFiles”的目錄下,在使用默認設置時,上傳圖片時會在該目錄下按年月自動生成一個目錄,并把圖片保存在該目錄中。采集圖片時選擇保存到本地也是存在這個文件夾下,由于目標網站的圖片亦是采用類似的規則,這樣我們采集來的圖片由于多了幾級目錄而不能顯示。
在以前介紹FLASH采集時曾提到采用過濾替換方法替換圖片地址,按照以前的方法在過濾項目中編輯替換規則,但在替換中發現假如把“/XXXX/2007/02/4476/”類似代碼一一替換為“/Article/UploadFiles/200707/”,非常費事,因為目標網站的圖片生成目錄也是按時間自動生成的數字目錄,一個個去替換,累皺山人也,忽然想起了通配符“*”,能否用通配符替代這些代碼呢,立馬嘗試。
重新編輯替換規則,將內容中“/XXXX/2007/02/4476/”改用“/XXXX/*/*/*/”,替換為依舊用“/Article/UploadFiles/200707/”,提交啟用,重新采集,完成后瀏覽,圖片顯示正常,查看圖片地址,變成了“/CMS/UploadFiles_4256/200707/20070702152908399.jpg”。
原貼:http://bbs.powereasy.net/dispbbs.asp?boardID=67&ID=327306&page=1
?。?EM>-感謝 狼哥 提供------
新聞熱點
疑難解答
圖片精選