關(guān)于VBS采集,網(wǎng)上流行比較多的方法都是正則,其實(shí) htmlfile 可以解析 html 代碼,但如果 designMode 沒(méi)開(kāi)啟的話,有時(shí)候會(huì)包安全提示信息
關(guān)于VBS采集,網(wǎng)上流行比較多的方法都是正則,其實(shí) htmlfile 可以解析 html 代碼,但如果 designMode 沒(méi)開(kāi)啟的話,有時(shí)候會(huì)包安全提示信息。
但是開(kāi)啟 designMode (@預(yù)言家晚報(bào) 分享的方法) 的話,所有js都不會(huì)被執(zhí)行,只是干干凈凈的dom文檔,所以在逼不得已的情況下開(kāi)啟 designMode 一般情況保持默認(rèn)即可。
- Set html = CreateObject("htmlfile")
- Set http = CreateObject("Msxml2.ServerXMLHTTP")
- html.designMode = "on" ' 開(kāi)啟編輯模式
- http.open "GET", "http://www.cnblogs.com/", False
- http.send
- strHtml = http.responseText
- html.write strHtml ' 寫(xiě)入數(shù)據(jù)
- Set post_list = html.getElementById("post_list")
- For Each el In post_list.children
- WScript.Echo el.getElementsByTagName("a")(0).innerText
- Next
其實(shí)方法很簡(jiǎn)單,但是重點(diǎn)是會(huì)vbs的,卻不一定都會(huì) dom 操作,所以這個(gè)很糾結(jié)。
我也沒(méi)辦法,只能靠你們自己了,我只是分享一下思路而已、
這樣解析 html 比正則方便快捷多了。
新聞熱點(diǎn)
疑難解答
圖片精選