最近需要使用SourceInsight查看分析在Linux系統下開發的項目代碼,我們知道Linux系統中文本文件默認編碼格式是UTF-8,而Windows中文系統中的默認編碼格式是Gb2312。系統內的編碼格式有所區別倒無傷大雅,關鍵的是SourceInsight竟不支持UTF-8,導致項目代碼內的中文注釋全部亂碼!
既然SourceInsight不支持UTF-8編碼的文件,那我們就得想辦法將UTF-8的代碼文件轉化為GB2312編碼的。首先想到的是到網上搜一下“批量編碼轉換工具”,結果下載后發現編碼轉換后的文件總是出現亂碼,可能是工具的bug吧。既然不能使用工具轉換,那就自己寫一個程序進行編碼轉換,但是細想一下覺得C++/java的編碼轉換程序寫起來又比較啰嗦,要是在Linux下寫一個shell腳本就能輕松搞定了。還好Windows下有vbs腳本可以幫助我們輕松達到這個目的。
我們使用ReadFile函數讀取文件,其中FileUrl指定文件的路徑,CharSet指定文件的原始編碼格式,使用adodb.stream對象讀取文件內容到Str。
然后使用WriteToFile將Str寫回原文件FileUrl,并設定新的編碼CharSet。