Beautiful Soup提供一些簡單的、python式的函數用來處理導航、搜索、修改分析樹等功能。它是一個工具箱,通過解析文檔為用戶提供需要抓取的數據,因為簡單,所以不需要多少代碼就可以寫出一個完整的應用程序。
Beautiful Soup自動將輸入文檔轉換為Unicode編碼,輸出文檔轉換為utf-8編碼。你不需要考慮編碼方式,除非文檔沒有指定一個編碼方式,這時,Beautiful Soup就不能自動識別編碼方式了。然后,你僅僅需要說明一下原始編碼方式就可以了。Beautiful Soup已成為和lxml、html6lib一樣出色的python解釋器,為用戶靈活地提供不同的解析策略或強勁的速度。
Beautiful Soup 4 包,在下面鏈接(非官方下載,比較全)里可以找到。
鏈接:http://www.lfd.uci.edu/~gohlke/pythonlibs/
或到點擊打開鏈接 下載Beautiful Soup 4的安裝包whl文件。
安裝Beautiful Soup 4的whl文件:
在C:/PRogram Files/Python35/Scripts目錄下,運行pip命令,文件名寫全路徑
pip install D:/FileTest/beautifulsoup4-4.5.3-py3-none-any.whl
新聞熱點
疑難解答