亚洲香蕉成人av网站在线观看_欧美精品成人91久久久久久久_久久久久久久久久久亚洲_热久久视久久精品18亚洲精品_国产精自产拍久久久久久_亚洲色图国产精品_91精品国产网站_中文字幕欧美日韩精品_国产精品久久久久久亚洲调教_国产精品久久一区_性夜试看影院91社区_97在线观看视频国产_68精品久久久久久欧美_欧美精品在线观看_国产精品一区二区久久精品_欧美老女人bb

首頁 > 網站 > 幫助中心 > 正文

采集教程及采集分頁設置問題

2020-10-28 20:20:31
字體:
來源:轉載
供稿:網友
其實采集可以這么理解,定義頭和尾,除了在截取鏈接不需要檢測,在其它地方你定義的頭和尾,在同一個html表里不能有相同的,為什么不能有相同的呢?是因為采集的每一步(除了截取鏈接外)都是根據你所定義的頭和尾來截取頁面內容的。所以你在定義頭和尾不僅不能有相同的,還要盡可能地把不需要的內容排除開。如果你理解了這個定義頭和尾,基本上對于簡單的頁面是能采集的。下面我以一個實例來說明一下:


以下內容為程序代碼:

新聞列表網址:http://ent.qq.com/newxw/thd_sjym.htmhttp://ent.qq.com/newxw/thd_sjym.htmhttp://ent.qq.com/newxw/thd_sjym.htm
列表開始代碼: <td style="padding-left:6px;"><table  border="0" cellpadding="0" cellspacing="0" class="table_logo">
列表結束代碼:    <td height="5" colspan="2"></td>
鏈接開始代碼:?<a target="_blank" href="
鏈接結束代碼:">
標題開始標記:<title>
標題結束標記:</title>
正文開始標記:<div id="ArticleCnt">
正文結束標記:<div id="ArticleTopic"></div>


上面所采集的頁面是比較標準的?,F在來分析一下:

列表網址:就是你要采集的頁面,這一步很關鍵,以前這一步我是亂搞,現在發現這一步關系到你能否采集完所有內容。一般你進入采集頁面先判斷一下是不是有多頁,如果有多頁你進入第二頁和第一頁是不是有規律變化,比如是:xxxx_1.htm,xxx_2.htm,特別注意數字,如果第一頁開始就有_id的規律,那就把第一頁作為列表網址,如果第一頁與第二頁沒相關規律,而是從第二頁開始才能這樣的規律,那將第二頁作為列表網址,第一頁放到一邊,等所有數據采集完了,再來采集單獨頁面,反正以后也只采集第一頁,為啥?因為一般更新的都在第一頁。

列表開始與結束:這里就是向采集程序說明你要采集的內容大概方向,比如上例里的列表網址,里面有好多內容,我只采集右邊的新聞,這時你可以搜索第一條新聞,向上看,找段在這個HTML文件里唯一的內容,這里定義頭和尾要值得注意的是:空格也算的。比如<a href前有四個空格,這也算個特征,反正不管怎么樣,只要是全文僅有的就行。同樣方法,只是這次搜索最后一條新聞,定位一下,省得全文亂找,浪費時間,往下推找個全文僅有的代碼,

鏈接開始與結束,這里你得看一下采集頁面了,然后再看HTML文件,一般是<a href=   開始,>結束。中間的內容就讓采集程序幫你去放
到這里已經接近成功了,這時為了保險一點,隨機點五個頁面,找五個頁面的共同點,把標題開始與結束,正文開始與結束填一下,
最后測試一下。應該可以了吧。

下面談談分頁,分頁有二種,一種是采集頁的分頁,另一種是文章內容的分頁。

采集頁的分頁:

例:

以下內容為程序代碼:

新聞列表網址:http://www.pconline.com.cn/mobile/news/hgxz/index_1.htmlhttp://www.pconline.com.cn/mobile/news/hgxz/index_1.html
列表開始代碼:1px solid; ">文章列表 </TD>
列表結束代碼: <DIV ALIGN="CENTER">
列表索引分頁: 批量生成:http://www.pconline.com.cn/mobile/news/hgxz/index_{$ID}.htmlhttp://www.pconline.com.cn/mobile/news/hgxz/index_{$ID}.html
生成范圍:4to1
鏈接開始代碼:<a href="
鏈接結束代碼:target="_blank"
標題開始標記:<title>
標題結束標記:-太平洋電腦網Pconline-[手機新品速遞]</title>
正文開始標記:廣告:ad_top</IFRAME>
正文結束標記:<br clear=all>


請注意列表網址與列表索引分頁鏈接的不同之處:就是將index_1.html改為了index_{$ID}.html,
生成范圍:這里有多少頁就?to?,有二種選擇,由后到前,前到后,隨便你喜好。

內容頁的分頁:

例:

以下內容為程序代碼:

新聞列表網址:http://www.enet.com.cn/emobile/inforcenter/articlelist.jsp?page=1&atype=A&acid=4146http://www.enet.com.cn/emobile/inforcenter/articlelist.jsp?page=1&atype=A&acid=4146
列表開始代碼:<td class="filter4" width="350"><font color="#FFFFFF">手機資訊
列表結束代碼:  <td height="2"></td>
批量生成: http://www.enet.com.cn/emobile/inforcenter/articlelist.jsp?page={$ID}&atype=A&acid=4146http://www.enet.com.cn/emobile/inforcenter/articlelist.jsp?page={$ID}&atype=A&acid=4146
生成范圍:10to1(這樣的好處最新新聞在前面,不然剛好跟采集頁面相反,最后一頁為最新新聞)
鏈接開始代碼:<td><a href="
鏈接結束代碼:target="_blank"
標題開始標記:<strong class="p24">
標題結束標記:   <td align="center">(這里要把前面的空格一起復制了,不然會出現錯誤)
正文開始標記:<table width="100%" border="0" cellspacing="0" cellpadding="2" align="center">
正文結束標記:<p id="adv_under_cont"></p>
下頁開始標記:           <a href="./(找到下一頁,把<a href="./的空格也復制了)
下頁結束標記:">下一頁</a>

請注意下頁開始與結束:找到分頁代碼,找到下一頁的代碼:定義好下一頁開始與結束就OK。這里多試幾次,因為這里代碼可選擇范圍小。 
發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
亚洲香蕉成人av网站在线观看_欧美精品成人91久久久久久久_久久久久久久久久久亚洲_热久久视久久精品18亚洲精品_国产精自产拍久久久久久_亚洲色图国产精品_91精品国产网站_中文字幕欧美日韩精品_国产精品久久久久久亚洲调教_国产精品久久一区_性夜试看影院91社区_97在线观看视频国产_68精品久久久久久欧美_欧美精品在线观看_国产精品一区二区久久精品_欧美老女人bb
日韩欧美高清在线视频| 欧美激情视频免费观看| 亚洲第一精品久久忘忧草社区| 国产黑人绿帽在线第一区| 国产欧美 在线欧美| 欧美大人香蕉在线| 欧美黄色片免费观看| 日本精品一区二区三区在线| 国产日产欧美精品| 亚洲欧美国产一区二区三区| 久久精品国产91精品亚洲| 中文字幕免费精品一区高清| 欧美日韩在线视频一区二区| 欧美成人精品h版在线观看| 欧美激情第99页| 日韩高清中文字幕| 九九精品在线观看| 国产日韩欧美影视| 日韩一中文字幕| 九九视频直播综合网| 久久久国产精品视频| 深夜福利亚洲导航| 国产精品亚洲第一区| 久久99久久99精品中文字幕| 精品亚洲国产成av人片传媒| 91爱爱小视频k| 久久综合九色九九| 中文字幕亚洲欧美一区二区三区| 欧美性videos高清精品| 国产日产欧美a一级在线| 亚洲黄色免费三级| 国产精品久久91| 国产亚洲一区二区在线| 亚洲天堂视频在线观看| 57pao国产成人免费| 91精品啪在线观看麻豆免费| 日韩精品视频在线观看免费| 亚洲精品综合久久中文字幕| 国产成人精品综合| 久久91超碰青草是什么| 91成人在线播放| 国产亚洲人成网站在线观看| 欧美日韩成人在线视频| 国产剧情日韩欧美| 在线观看国产成人av片| 亚洲精品福利视频| 日本成熟性欧美| 日本久久久久久久久| 国色天香2019中文字幕在线观看| 国语自产精品视频在线看抢先版图片| 亚洲人在线视频| 91高清视频免费| 最近中文字幕2019免费| 亚洲第一区在线观看| 国产一区二区三区直播精品电影| 揄拍成人国产精品视频| 精品国内产的精品视频在线观看| 欧美国产日韩精品| 亚洲成色777777女色窝| 成人免费高清完整版在线观看| 久久精品青青大伊人av| 78色国产精品| 欧美成人黑人xx视频免费观看| 欧美一级黑人aaaaaaa做受| 久久综合久久八八| 久久人人爽亚洲精品天堂| 欧美日韩裸体免费视频| 国产精品美女免费看| 日韩a**中文字幕| 热久久这里只有精品| 国产有码在线一区二区视频| 亚洲天堂av高清| 欧美人与物videos| 亚洲欧美日韩天堂一区二区| 精品香蕉在线观看视频一| 国产a级全部精品| 91久久精品日日躁夜夜躁国产| 成人免费高清完整版在线观看| 日韩av电影中文字幕| 亚洲欧美综合v| 亚洲人成网站777色婷婷| 国产成人av在线播放| 午夜精品一区二区三区av| 2019av中文字幕| 欧美大片免费观看在线观看网站推荐| 欧美福利在线观看| 欧美专区在线观看| 亚洲黄一区二区| 亚洲精品成人网| 成人欧美一区二区三区在线湿哒哒| 久热精品视频在线| 国产精品专区第二| 成人亲热视频网站| 91精品在线一区| 亚洲香蕉av在线一区二区三区| 欧美一级视频在线观看| 97碰在线观看| 国产一区二区三区三区在线观看| 亚洲精品videossex少妇| 国产精品久久久久久亚洲调教| 成人黄色av网| 狠狠干狠狠久久| 亚洲精品免费在线视频| 欧美成人激情在线| 91夜夜揉人人捏人人添红杏| 国产一区深夜福利| 95av在线视频| 亚洲欧美日韩视频一区| 国产精品h片在线播放| 91精品久久久久久久久青青| 日韩精品在线观看一区| 国产一区二中文字幕在线看| 国产在线播放不卡| 欧美日韩免费看| 亚洲va久久久噜噜噜久久天堂| 久久影视电视剧免费网站清宫辞电视| 久久精品99国产精品酒店日本| 2019中文字幕在线免费观看| 5566成人精品视频免费| 国产丝袜一区二区三区免费视频| 国产成人精品在线播放| 精品亚洲aⅴ在线观看| 久久久久国产精品www| 91精品一区二区| 777国产偷窥盗摄精品视频| 日韩欧美精品网址| 在线成人免费网站| 欧美日韩亚洲91| 一区二区三区久久精品| 成人欧美一区二区三区在线| 久久久久久69| 国产美女主播一区| 日本伊人精品一区二区三区介绍| 欧美亚洲午夜视频在线观看| 欧美日韩成人网| 欧美午夜影院在线视频| 日韩av成人在线观看| 亚洲xxx自由成熟| 亚洲无限乱码一二三四麻| 91精品视频大全| 日韩国产欧美精品一区二区三区| 国产在线观看精品一区二区三区| 主播福利视频一区| 日本精品在线视频| 91中文精品字幕在线视频| 成人欧美一区二区三区黑人孕妇| 成人国产精品一区| 国产手机视频精品| 国产精品第3页| 国产精品网红直播| 欧美专区国产专区| 中文字幕日韩高清| 国产精品免费观看在线| 欧美精品少妇videofree| 这里只有精品在线观看| 亚洲精品www久久久久久广东| 国产精品国产自产拍高清av水多| 国产精品黄色影片导航在线观看| 国产亚洲欧洲高清一区| 欧美一性一乱一交一视频| 亚洲黄色www| 性欧美在线看片a免费观看| 中文在线不卡视频| 亚洲最大福利视频网站|