亚洲香蕉成人av网站在线观看_欧美精品成人91久久久久久久_久久久久久久久久久亚洲_热久久视久久精品18亚洲精品_国产精自产拍久久久久久_亚洲色图国产精品_91精品国产网站_中文字幕欧美日韩精品_国产精品久久久久久亚洲调教_国产精品久久一区_性夜试看影院91社区_97在线观看视频国产_68精品久久久久久欧美_欧美精品在线观看_国产精品一区二区久久精品_欧美老女人bb

首頁 > 學院 > 開發設計 > 正文

java中 中文問題詳解

2019-11-18 11:51:28
字體:
來源:轉載
供稿:網友

  預備知識:
   1.字節和unicode
    java內核是unicode的,就連class文件也是,但是很多媒體,包括文件/流的保存方式
    是使用字節流的。 因此Java要對這些字節流經行轉化。char是unicode的,而byte是字節.
    Java中byte/char互轉的函數在sun.io的包中間有。其中ByteToCharConverter類是中調度,
    可以用來告訴你,你用的Convertor。其中兩個很常用的靜態函數是
     public static ByteToCharConverter getDefault() ;
     public static ByteToCharConverter getConverter(String encoding);
    假如你不指定converter,則系統會自動使用當前的Encoding,GB平臺上用GBK,EN平臺上用
    8859_1
    
    我們來就一個簡單的例子:
       "你"的gb碼是:0xC4E3 ,unicode是0x4F60
       你用:
       --encoding="gb2312";
       --byte b[]={(byte)"u00c4",(byte)"u00E3"};
       --convertor=ByteToCharConverter.getConverter(encoding);
       --char [] c=converter.convertAll(b);
       --for(int i=0;i       --{
       -- System.out.PRintln(Integer.toHexString(c[i]));
       --}
       --打印出來是0x4F60
       --但是假如使用8859_1的編碼,打印出來是
       --0x00C4,0x00E3
       ----例1
       反過來:
       --encoding="gb2312";
          char c[]={"u4F60"};
          convertor=ByteToCharConverter.getConverter(encoding);
       --byte [] b=converter.convertAll(c);
       --for(int i=0;i       --{
       -- System.out.println(Integer.toHexString(b[i]));
       --}
        --打印出來是:0xC4,0xE3
        ----例2
        --假如用8859_1就是0x3F,?號,表示無法轉化      --
        很多中文問題就是從這兩個最簡單的類派生出來的。而卻有很多類  
    不直接支持把Encoding輸入,這給我們帶來諸多不便。很多程序難得用encoding
    了,直接用default的encoding,這就給我們移植帶來了很多困難
    --
    2.UTF-8
    --UTF-8是和Unicode一一對應的,其實現很簡單
    --
     -- 7位的Unicode: 0 _ _ _ _ _ _ _
    --11位的Unicode: 1 1 0 _ _ _ _ _ 1 0 _ _ _ _ _ _
    --16位的Unicode: 1 1 1 0 _ _ _ _ 1 0 _ _ _ _ _ _ 1 0 _ _ _ _ _ _
    --21位的Unicode: 1 1 1 1 0 _ _ _ 1 0 _ _ _ _ _ _ 1 0 _ _ _ _ _ _ 1 0 _ _ _ _ _ _
    --大多數情況是只使用到16位以下的Unicode:
    --"你"的gb碼是:0xC4E3 ,unicode是0x4F60
    --我們還是用上面的例子
    --  --例1:0xC4E3的二進制:
    --  --    1 1 0 0 0 1 0 0 1 1 1 0 0 0 1 1
    --  --    由于只有兩位我們按照兩位的編碼來排,但是我們發現這行不通,
    --  --    因為第7位不是0因此,返回"?"
    --  --   
    --  --例2:0x4F60的二進制:
    --  --    0 1 0 0 1 1 1 1 0 1 1 0 0 0 0 0
    --  --    我們用UTF-8補齊,變成:
    --  --    11100100 10111101 10100000
    --  --    E4--BD-- A0
    --  --    于是返回0xE4,0xBD,0xA0
    --  --
    3.String和byte[]
    --String其實核心是char[],然而要把byte轉化成String,必須經過編碼。
    --String.length()其實就是char數組的長度,假如使用不同的編碼,很可
    --能會錯分,造成散字和亂碼。
    --例:
    ----byte [] b={(byte)"u00c4",(byte)"u00e3"};
    ----String str=new String(b,encoding);  ----
    ----假如encoding=8859_1,會有兩個字,但是encoding=gb2312只有一個字  ----
    --這個問題在處理分頁是經常發生
    4.Reader,Writer/InputStream,OutputStream
    --Reader和Writer核心是char,InputStream和OutputStream核心是byte。
    --但是Reader和Writer的主要目的是要把Char讀/寫InputStream/OutputStream
  --一個reader的例子:
  --文件test.txt只有一個"你"字,0xC4,0xE3--
  --String encoding=;
  --InputStreamReader reader=new InputStreamReader(
  ----new FileInputStream("text.txt"),encoding);
  --char []c=new char[10];
  --int length=reader.read(c);
  --for(int i=0;i  ----System.out.println(c[i]);
    --假如encoding是gb2312,則只有一個字符,假如encoding=8859_1,則有兩個字符
    --------
  --
  --
    
     ----
   2.我們要對Java的編譯器有所了解:
   --javac -encoding
    我們經常沒有用到ENCODING這個參數。其實Encoding這個參數對于跨平臺的操作是很重要的。
    假如沒有指定Encoding,則按照系統的默認Encoding,gb平臺上是gb2312,英文平臺上是ISO8859_1?!?
   --Java的編譯器實際上是調用sun.tools.javac.Main的類,對文件進行編譯,這個類 --
   有compile函數中間有一個encoding的變量,-encoding的參數其實直接傳給encoding變量。
   編譯器就是根據這個變量來讀取java文件的,然后把用UTF-8形式編譯成class文件。
   一個例子:
   --public void test()
   --{
   ----String str="你";
   ----FileWriter write=new FileWriter("test.txt");
   ----write.write(str);
   ----write.close();
   --}
   ----例3
  --假如用gb2312編譯,你會找到E4 BD A0的字段
  --
  --假如用8859_1編譯,
  --00C4 00E3的二進制:
  --00000000 11000100 00000000 11100011--
  --因為每個字符都大于7位,因此用11位編碼:
  --11000001 10000100 11000011 10100011
  --C1-- 84-- C3--  A3
  --你會找到C1 84 C3 A3 --
      
    但是我們往往忽略掉這個參數,因此這樣往往會有跨平臺的問題:
    --  例3在中文平臺上編譯,生成ZhClass
    --  例3在英文平臺上編譯,輸出EnClass
    --1.  ZhClass在中文平臺上執行OK,但是在英文平臺上不行
    --2.  EnClass在英文平臺上執行OK,但是在中文平臺上不行
    原因:
   --1.在中文平臺上編譯后,其實str在運行態的char[]是0x4F60, ----
   --在中文平臺上運行,FileWriter的缺省編碼是gb2312,因此
   --CharToByteConverter會自動用調用gb2312的converter,把str轉化
   --成byte輸入到FileOutputStream中,于是0xC4,0xE3放進了文件。
   --但是假如是在英文平臺下,CharToByteConverter的缺省值是8859_1,
   --FileWriter會自動調用8859_1去轉化str,但是他無法解釋,因此他會
   --輸出"?" ----
   --2. 在英文平臺上編譯后,其實str在運行態的char[]是0x00C4 0x00E3, ----
   --在中文平臺上運行,中文無法識別,因此會出現??
   --  在英文平臺上,0x00C4-->0xC4,0x00E3->0xE3,因此0xC4,0xE3被放進了
   --文件
  ----
  1.對于jsp正文的解釋:
  --Tomcat首先看一下你的葉面中有沒有"<%@page include的符號。有,則在相同
  --地方設定response.setContentType(..);按照encoding的來讀,沒有他按照8859_1
  --讀取文件,然后用UTF-8寫成.java文件,然后用sun.tools.Main去讀取這個文件,
  --(當然它使用UTF-8去讀),然后編譯成class文件
  --setContentType改變的是out的屬性,out變量缺省的encoding是8859_1
  
  2.對Parameter的解釋
  --很不幸Parameter只有ISO8859_1的解釋,這個質料可以在servlet的實現代碼中找到。
  
  3.對include的解釋
  格式的,但是很不幸,由于那個寫"org.apache.jasper.compiler.Parser"的人
  在數組JspUtil.ValidAttribute[]忘記加了一個參數:encoding,因此導致不支
  持這種方式。你完全可以編譯源代碼,加上對encoding的支持
  
  總結:
  
  假如你在NT底下,最簡單的方法就是欺騙java,不加任何Encoding變量:
  
  你好<%=request.getParameter("value")%>
  
  
  http://localhost/test/test.jsp?value=你
  
  結果:你好你
  
  但這種方法局限性較大,比如對上傳的文章分段,這樣的做法是死定的,最好的
  解決方案是用這種方案:
  <%@ page contentType="text/html;charset=gb2312" %>
  
  你好<%=new String(request.getParameter("value").getBytes("8859_1"),"gb2312")%>
  
  
  
  必讀好文,但解決方案不敢恭維

發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
亚洲香蕉成人av网站在线观看_欧美精品成人91久久久久久久_久久久久久久久久久亚洲_热久久视久久精品18亚洲精品_国产精自产拍久久久久久_亚洲色图国产精品_91精品国产网站_中文字幕欧美日韩精品_国产精品久久久久久亚洲调教_国产精品久久一区_性夜试看影院91社区_97在线观看视频国产_68精品久久久久久欧美_欧美精品在线观看_国产精品一区二区久久精品_欧美老女人bb
伊人伊成久久人综合网小说| 日韩在线观看免费高清| 少妇精69xxtheporn| 久久免费视频网| 久久久女女女女999久久| 欧美视频在线观看 亚洲欧| 久久成人这里只有精品| 欧美在线视频网站| 亚洲国产精品99久久| 国产网站欧美日韩免费精品在线观看| 久久久久久久久久婷婷| 亚洲欧洲一区二区三区在线观看| 97在线观看免费| 国产一区二区日韩精品欧美精品| 波霸ol色综合久久| 久久视频在线看| 中文字幕日韩专区| 日韩电影大全免费观看2023年上| www.日韩.com| 91禁国产网站| 亚洲电影第1页| 欧美日韩综合视频网址| 国产精品入口福利| 国产精品99久久久久久久久久久久| 日韩成人中文电影| 国产亚洲欧美日韩精品| 成人妇女免费播放久久久| 亚洲国产成人精品一区二区| 日韩av在线一区| 日韩免费av在线| 久久中文字幕在线视频| 亚洲国产精品女人久久久| 欧美日韩不卡合集视频| 97国产真实伦对白精彩视频8| 欧美俄罗斯性视频| 欧洲亚洲免费在线| 精品视频www| 69国产精品成人在线播放| 中文字幕欧美在线| 久久视频中文字幕| 久久久久久久久久久成人| 欧美xxxx14xxxxx性爽| 日韩中文视频免费在线观看| 伊人久久大香线蕉av一区二区| 成人黄色免费网站在线观看| 黄色一区二区在线| 性欧美暴力猛交69hd| 欧美性猛交xxxx黑人猛交| 日韩av中文字幕在线免费观看| 欧美日韩国产在线看| 成人综合国产精品| 欧美日韩福利在线观看| 国产区精品视频| 国产成人精品电影| 亚洲第一国产精品| 欧美国产欧美亚洲国产日韩mv天天看完整| 欧美精品午夜视频| 78色国产精品| 在线一区二区日韩| 欧美日韩一区二区在线| 久久影视三级福利片| 国产美女精品免费电影| 丝袜美腿精品国产二区| 午夜精品国产精品大乳美女| 成人xxxx视频| 欧美国产日韩一区二区三区| 日韩福利伦理影院免费| 亚洲裸体xxxx| 亚洲成人av在线播放| 8050国产精品久久久久久| 久久精品成人欧美大片| 日韩成人激情在线| 亚洲人成电影网站色xx| 欧美伊久线香蕉线新在线| 久久精品国产久精国产一老狼| 国产精品日韩在线播放| 中文字幕视频一区二区在线有码| 久久人人爽国产| 欧美国产日韩中文字幕在线| 国产美女久久精品香蕉69| 亚洲欧美中文日韩v在线观看| 久久视频中文字幕| 国产精品久久久久久久久免费看| 国产69精品99久久久久久宅男| 欧美孕妇与黑人孕交| 成人美女av在线直播| 日韩精品免费在线播放| 一个人看的www欧美| 欧美日韩国产综合视频在线观看中文| 久久av红桃一区二区小说| 日韩成人在线网站| 日韩激情在线视频| 国产成人精品av在线| 精品久久在线播放| 精品人伦一区二区三区蜜桃免费| 亚洲性猛交xxxxwww| 日韩精品在线观看网站| 日韩三级成人av网| 欧美一级电影久久| 亚洲国产高清自拍| 欧美人与性动交| 欧美大尺度电影在线观看| 国产精品入口夜色视频大尺度| 日本精品免费观看| 欧美精品一区三区| 欧美精品一区三区| 日韩成人激情在线| 成人午夜激情网| 久久国产精品影视| 国产精品天天狠天天看| 国产精品久久久av久久久| 国产精品免费看久久久香蕉| 色妞色视频一区二区三区四区| 亚洲毛片在线观看.| 操人视频在线观看欧美| 欧美日韩国产精品一区二区三区四区| 欧美性猛交xxxx久久久| 奇米一区二区三区四区久久| 亚洲人成电影网站| 一区二区三区视频免费| 97激碰免费视频| 97视频在线观看免费高清完整版在线观看| 欧美另类交人妖| 亚洲影院色无极综合| 欧美老少做受xxxx高潮| 2018中文字幕一区二区三区| 欧美电影在线观看完整版| 亚洲一区二区久久久久久| 精品福利一区二区| 欧美日韩精品在线| 欧美电影免费观看网站| 午夜精品一区二区三区在线| 久久久久亚洲精品成人网小说| 国产午夜精品视频免费不卡69堂| 成人激情黄色网| 久久精品夜夜夜夜夜久久| 国产欧美日韩亚洲精品| 国产精品成人av在线| 国产手机视频精品| 亚洲第一视频在线观看| 久久久久久久av| 国产在线观看91精品一区| 国产精品入口免费视频一| 亚洲欧美在线免费| 日韩电视剧在线观看免费网站| 亚洲一区二区三区视频播放| 日韩av在线网页| 国产偷国产偷亚洲清高网站| 久久久久久久久久国产精品| 日韩中文字幕av| 久久久久久高潮国产精品视| 国产成人一区二区三区电影| 亚洲国产精品成人一区二区| 4p变态网欧美系列| www高清在线视频日韩欧美| 亚洲精品一区二区三区不| 欧美高清激情视频| 日韩美女写真福利在线观看| 欧美日韩亚洲激情| 欧美精品videos另类日本| 久久人人爽亚洲精品天堂| 欧美乱大交做爰xxxⅹ性3| 亚洲免费视频网站| 欧美性猛交xxxx免费看|