關于VBS采集,網上流行比較多的方法都是正則,其實 htmlfile 可以解析 html 代碼,但如果 designMode 沒開啟的話,有時候會包安全提示信息
關于VBS采集,網上流行比較多的方法都是正則,其實 htmlfile 可以解析 html 代碼,但如果 designMode 沒開啟的話,有時候會包安全提示信息。
但是開啟 designMode (@預言家晚報 分享的方法) 的話,所有js都不會被執行,只是干干凈凈的dom文檔,所以在逼不得已的情況下開啟 designMode 一般情況保持默認即可。
- Set html = CreateObject("htmlfile")
- Set http = CreateObject("Msxml2.ServerXMLHTTP")
- html.designMode = "on" ' 開啟編輯模式
- http.open "GET", "http://www.cnblogs.com/", False
- http.send
- strHtml = http.responseText
- html.write strHtml ' 寫入數據
- Set post_list = html.getElementById("post_list")
- For Each el In post_list.children
- WScript.Echo el.getElementsByTagName("a")(0).innerText
- Next
其實方法很簡單,但是重點是會vbs的,卻不一定都會 dom 操作,所以這個很糾結。
我也沒辦法,只能靠你們自己了,我只是分享一下思路而已、
這樣解析 html 比正則方便快捷多了。
新聞熱點
疑難解答