亚洲香蕉成人av网站在线观看_欧美精品成人91久久久久久久_久久久久久久久久久亚洲_热久久视久久精品18亚洲精品_国产精自产拍久久久久久_亚洲色图国产精品_91精品国产网站_中文字幕欧美日韩精品_国产精品久久久久久亚洲调教_国产精品久久一区_性夜试看影院91社区_97在线观看视频国产_68精品久久久久久欧美_欧美精品在线观看_国产精品一区二区久久精品_欧美老女人bb

首頁 > 網站 > 建站經驗 > 正文

使用php中的file_get_contents函數抓取調用淘寶任意一商品詳情的方法

2024-04-25 20:32:58
字體:
來源:轉載
供稿:網友

使用淘寶提供的api當然可以調用淘寶的數據,但是基于當前項目只需調用淘寶商品圖片名稱等公開信息在自己網站上就ok,因此使用php中的file_get_contents函數實現。ecshop二次開發

思路:

file_get_contents(url)該函數根據url如http://www.baidu.com將該網頁內容(源碼)以字符串形式輸出(一個 整字符串),然后配合preg_match,preg_replace等這些正則表達式操作就可以實現獲取該url特定div,img等信息了。

當然前題 是淘寶在單個商品頁面的結構是固定的,如500圖的img中id就是J_ImgBooth,我想在一段時間內這種命名方式應該不會變吧!

具體實現:(獲取500圖,名稱,價格,屬性及商品描述)

$text=file_get_contents("http://item.taobao.com/item.htm?spm=a1z10.5-c.w4002-10545496040.65.7DFLy7&id=44576319301"); //將url地址上頁面內容保存進$text

A.獲取500圖:

preg_match('/<img[^>]*id="J_ImgBooth"[^r]*rc=/"([^"]*)/"[^>]*>/', $text, $img);

//運用正則抓取img標簽中id為J_ImgBooth的img,$img[0]為該500圖img標簽,$img[1]為500圖的圖片地址;

B. 獲取名稱:

preg_match('/<title>([^<>]*)<//title>/', $text, $title);

//因為正文中的商品名稱標簽沒有特殊class或id正則不好抓取,就抓<title>標簽中的內容了,一般來說title中內容就是商品名稱了(實際有些出入),$title[0]整個title標簽 $title[1]標簽中內容;

$title=iconv('GBK','UTF-8',$title);

//如果你的網站是utf8編碼,那么需要進行一下轉碼(淘寶是gbk編碼)

C.獲取價格:

preg_match('/<([a-z]+)[^i]*id=/"J_StrPrice/"[^>]*>([^<]*)<////1>/is', $text, $price);

//同理獲取id為J_StrPrice的標簽內容$price[2], $price[0]是整個標簽, $price[1]為strong標簽名;

$price=floatval($price);//放入數據庫估計還有轉一下變量類型

D.獲取屬性:

這之前獲取的內容都是在單標簽中相對只需一個正則就可搞定,然而如果要獲取如

<div id=”xxx”>

<ul>

</ul>

<div>…

<div>…

</div>

</div>

</div>

這樣特定div中有未知n個<>標簽,獲取該特定div將會非常的困難,搜了下網上,最接近的也只是"/<([a-z]+) [^>]*>([^<>]|(?R))*<////1>/"這樣使用遞歸抓取標簽對,但是他不能抓特定標簽,所以想 要輕松抓取class="attributes"的div我是沒法辦到了。

但是淘寶網頁有其特殊性,就是它的各個標簽結構基本是固定的…< div class="attributes">…</div>標簽后面不是</div>< div id="description">就是</div><div class="box J_TBox">,所以我 們可以采用變通法達到獲取屬性標簽內容的目的。

preg_match('/<(div)[^c]*class=/"attributes/"[^>]*>.*<////1>/is', $text, $text0);

//這個正則會抓取<div class="attributes"開始到整個頁面最后一個</div>標簽,當然我們屬性標簽就在這個的前面部分。

$text1=preg_replace("/<//div>[^<]*<(div)[^c]*id=/"description/"[^>]*>.*<////1>/is","",$text0);

//匹配到</div ><div id="description">至最后</div>然后用””代替(就是把匹配的刪除了),所以如果attributes的div后面緊跟的是description那么我們已經達到目的了。

$attributes=preg_replace("/<//div>[^<]*<(div)[^c]*class=/"box J_TBox/"[^>]*>.*<////1>/is","",$text1);

//如果attributes后面緊跟box J_Tbox標簽,那么我們還需要使用以上這步來剔除box J_Tbox標簽,當然如果attributes的div后面緊跟的是description,這一步將不會匹配到任何即什么都不會做。

E.獲取描述:

通過上面方法你肯定覺得淘寶頁面上任何標簽都可以很簡單獲取了吧(我之前也是這么想的),但是使用這個方法獲取描述時得到的內容將會是“描述加載中”,是的,這個描述內容不是在源碼中的,它是打開頁面加載進一大堆js后,不知道從淘寶的哪個角落中加載進來的。

好吧,那么我們也可以模仿它放一些js進去。不知道哪些對加載描述有用?沒事,全加載進來肯定沒錯。

不知道需要放那些特定div上去有作用?抓一個源碼, 刪掉一些div一步步試試看,你會發現“<div id="detail" class="box"> </div>

<div id="description" class="J_DetailSection">

<div class="content" id="J_DivItemDesc">描述加載中</div>

</div>”

這幾個div是加載描述所必須的,那么下面就是寫代碼了:

preg_match_all('/<script[^>]*>[^<]*<//script>/is', $text, $content);//頁面js腳本

$content=$content[0];

$description='<div id="detail" class="box"> </div>

<div id="description" class="J_DetailSection">

<div class="content" id="J_DivItemDesc">描述加載中</div>

</div>';

foreach ($content as &$v){$description.=iconv('GBK','UTF-8',$v);};

//將這個$description放進頁面,描述就會自動的加載進來了,當然多個商品描述在同一個頁面也會只有一個描述會被加載的。ecshop整站開發

發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
亚洲香蕉成人av网站在线观看_欧美精品成人91久久久久久久_久久久久久久久久久亚洲_热久久视久久精品18亚洲精品_国产精自产拍久久久久久_亚洲色图国产精品_91精品国产网站_中文字幕欧美日韩精品_国产精品久久久久久亚洲调教_国产精品久久一区_性夜试看影院91社区_97在线观看视频国产_68精品久久久久久欧美_欧美精品在线观看_国产精品一区二区久久精品_欧美老女人bb
国产欧美一区二区三区四区| 色偷偷av一区二区三区| 美女啪啪无遮挡免费久久网站| 亚洲精品狠狠操| 久久久在线免费观看| 成人精品在线视频| 性色av一区二区咪爱| 久久99久久亚洲国产| 在线激情影院一区| 欧美高清激情视频| 亚洲精品资源美女情侣酒店| 日韩成人在线视频观看| 日韩精品在线影院| 久久99久国产精品黄毛片入口| 88xx成人精品| 国产精品视频白浆免费视频| 久久成人综合视频| 俺去了亚洲欧美日韩| 欧美国产日韩xxxxx| 26uuu另类亚洲欧美日本老年| 91精品国产综合久久久久久久久| 一夜七次郎国产精品亚洲| 中文字幕国产亚洲2019| 亚洲一区制服诱惑| 亚洲第一免费网站| 成人天堂噜噜噜| 国产精品香蕉在线观看| 久久91精品国产| 久久久久久91| 国产亚洲一级高清| 日本韩国在线不卡| 中文字幕日韩欧美在线视频| 亚洲一区二区三区在线免费观看| 国产亚洲人成网站在线观看| 亚洲男人第一av网站| 亚洲第一网站男人都懂| 日韩高清免费在线| 中文字幕成人精品久久不卡| 国产福利精品av综合导导航| 亚洲免费视频观看| 精品国产一区二区三区在线观看| 国产不卡av在线免费观看| 粉嫩老牛aⅴ一区二区三区| 日韩av网站在线| 亚洲精品久久久久久久久久久久| 日本欧美国产在线| 97久久久免费福利网址| 国产欧美一区二区白浆黑人| 国产一区玩具在线观看| 亚洲欧美福利视频| 国模吧一区二区| 亚洲欧美精品一区二区| 91九色单男在线观看| 亚洲性xxxx| 国产日韩欧美中文| 久久综合免费视频影院| 欧美成人免费视频| 欧美限制级电影在线观看| 亚洲天堂免费视频| 欧美高清videos高潮hd| 久久久999国产| 超碰97人人做人人爱少妇| 久久久久久国产精品美女| 久久手机精品视频| 成人www视频在线观看| 亚洲一区二区中文| 欧美亚洲午夜视频在线观看| 欧美色视频日本版| 日韩**中文字幕毛片| 国产精品免费看久久久香蕉| 亚洲精品国产品国语在线| 欧美午夜片欧美片在线观看| 国产精品九九九| 97久久伊人激情网| 亚洲嫩模很污视频| 亚洲综合在线做性| 色婷婷**av毛片一区| 色伦专区97中文字幕| 中文字幕在线看视频国产欧美| 国产精品久久久久久久久久久久久| 伦伦影院午夜日韩欧美限制| 欧美大片在线看免费观看| 久久久久久久久久久网站| 久久久国产一区二区三区| 久久久久久久国产精品视频| 国产亚洲精品激情久久| **欧美日韩vr在线| 午夜免费久久久久| 欧美尺度大的性做爰视频| 亚洲成人精品久久久| 欧美成人精品不卡视频在线观看| 亚洲第一精品夜夜躁人人躁| 欧美日韩免费一区| 日本中文字幕成人| 成人免费黄色网| 亚洲国产高潮在线观看| 在线观看久久久久久| 国产aⅴ夜夜欢一区二区三区| 91精品国产91久久久久久最新| 91深夜福利视频| 久久久av免费| 日韩精品在线观看网站| 国产日韩精品综合网站| 97热在线精品视频在线观看| 日本高清+成人网在线观看| 九九热最新视频//这里只有精品| 一区二区三区四区视频| 国产激情视频一区| 九九精品在线观看| 久久91亚洲人成电影网站| y97精品国产97久久久久久| 91精品久久久久久久久久入口| 日韩av资源在线播放| 国产黑人绿帽在线第一区| 亚洲色图15p| 日韩在线免费视频| 亚洲精品久久久一区二区三区| 亚洲精品网址在线观看| 国产精品一区二区3区| 久久综合久中文字幕青草| 日韩电影免费观看中文字幕| 亚洲国产99精品国自产| 久久久在线视频| 欧美日韩中文在线观看| 成人福利在线视频| 91亚洲精华国产精华| 人九九综合九九宗合| 亚洲v日韩v综合v精品v| 久久久久99精品久久久久| 欧美成人亚洲成人| 黑丝美女久久久| 成人深夜直播免费观看| 成人性生交大片免费看视频直播| 欧美在线视频免费观看| 久久精品小视频| 伊人久久男人天堂| 国产欧美va欧美va香蕉在| 韩剧1988免费观看全集| 中文字幕日韩专区| 国产精品美腿一区在线看| 91精品国产91久久久久久不卡| 97超碰国产精品女人人人爽| 欧美视频第一页| 国产精品免费久久久久久| 成人激情春色网| 欧美激情视频在线观看| 国产精品久久久久免费a∨大胸| 国产精品免费福利| 国产成人精品电影久久久| 成人网址在线观看| 日韩中文字幕在线播放| 亚洲热线99精品视频| 国产在线不卡精品| 久久久国产精品一区| 欧美成人精品在线| 亚洲欧美国产精品专区久久| 亚洲影院色在线观看免费| 777午夜精品福利在线观看| 91视频九色网站| 免费99精品国产自在在线| 欧美日韩国产一区在线| 国产精品日韩电影| 日韩欧美一区二区三区久久| 国产日韩欧美另类|