此文主要分享了如何將自己博客園的文章自動導出到 Markdown 文檔進行存儲,以便在本地進行歸檔管理,程序中也對文章的分類、tag、代碼塊以及文章中的圖片進行了保存處理,以便上傳到自己的圖。
整理后的 Markdown 可以在本地整理成冊或者發布到自己的個人博客上,比如我使用 Markdown 書寫的 個人博客 。
codeblock
中,你也可以修改源碼保存成其他的格式塊;EntryName
,那生成的文件名就會非常的友好;抓取保存后文件預覽。
這里使用了一個開源的組件 Html2Markdown ,在控制臺安裝組件后就可以使用了,主要支持兩個方法。
對字符串進行轉換
var html = "Something to <strong>convert</strong>";var converter = new Converter();var markdown = converter.Convert(html);
對文件進行轉換
var path = "file.html";var converter = new Converter();var markdown = converter.ConvertFile(path);
具體的區別可以看這里,可以根據自己的情況對源碼進行修改。
unix、windows、mac 的換行習慣
unix / linux:用 LF (/n) 表示一行結束。
mac:用 CR (/r) 表示一行結束。
windows:用 CR LF (/r/n) 和起來表示一行結束。
分析后發現通過模擬請求 API 獲取即可,需要的參數通過正則匹配獲取,返回數據為 Unicode 進行轉碼提取。
你可以修改源碼開啟或關閉此功能,使用文章中文件名作為保存到本地的文件名,并將文章中的圖片前綴進行了替換,你可以替換成你自己新的圖床地址。輸出的圖片文件在程序啟動的 images
文件夾。
項目源代碼在 GitHub
需要注意的問題是,項目中可能因為新舊文章中某些格式的變化導致抓取出來的 Markdown 格式可能稍有偏差,以及圖片、代碼塊的處理,你需要去根據自己的博客去進行對應的調整后使用。
新聞熱點
疑難解答