說到Java的本地存儲,肯定使用IO流進行操作。
首先,我們需要一個創建文件的函數createNewFile:
然后,我們需要一個寫入文件的函數:
我們把這兩個函數封裝到一個FileReaderWriter.java文件中以便后續使用。
接著我們回到知乎爬蟲中。
我們需要給知乎的Zhihu封裝類加個函數,用來格式化寫入到本地時的排版。
OK,這樣就差不多了,接下來吧mian方法中的System.out.println改成
運行,便可以看到本來在控制臺看到的內容已經被寫到了本地的txt文件里:
大體一看沒什么問題,仔細看看發現問題:存在太多的html標簽,主要是<b>和<br>。
我們可以在輸出的時候對這些標記進行處理。
先把<br>換成io流里面的/r/n,再把所有的html標簽都刪除,這樣看起來便會清晰很多。
這里的replaceAll函數可以使用正則,于是所有的<>標簽在最后就都被刪除了。
新聞熱點
疑難解答