亚洲香蕉成人av网站在线观看_欧美精品成人91久久久久久久_久久久久久久久久久亚洲_热久久视久久精品18亚洲精品_国产精自产拍久久久久久_亚洲色图国产精品_91精品国产网站_中文字幕欧美日韩精品_国产精品久久久久久亚洲调教_国产精品久久一区_性夜试看影院91社区_97在线观看视频国产_68精品久久久久久欧美_欧美精品在线观看_国产精品一区二区久久精品_欧美老女人bb

首頁 > 開發 > Java > 正文

使用Pinyin4j進行拼音分詞的方法

2024-07-13 10:15:53
字體:
來源:轉載
供稿:網友

使用maven引入相關的jar

<dependency> <groupId>com.belerweb</groupId> <artifactId>pinyin4j</artifactId> <version>2.5.1</version></dependency>

創建Pinyin4jUtil

package com.os.core.util.solr;import net.sourceforge.pinyin4j.PinyinHelper;import net.sourceforge.pinyin4j.format.HanyuPinyinCaseType;import net.sourceforge.pinyin4j.format.HanyuPinyinOutputFormat;import net.sourceforge.pinyin4j.format.HanyuPinyinToneType;import net.sourceforge.pinyin4j.format.exception.BadHanyuPinyinOutputFormatCombination;import java.util.ArrayList;import java.util.Hashtable;import java.util.List;import java.util.Map;/** * 漢語拼音工具類 * Created by PengSongHe on 2017/2/9 0009. */public class Pinyin4jUtil { public static void main(String[] args) {  String str = "測試";  String pinyin = Pinyin4jUtil.converterToSpell(str);  System.out.println(str + " pin yin :" + pinyin);  pinyin = Pinyin4jUtil.converterToFirstSpell(str);  System.out.println(str + " short pin yin :" + pinyin); } /**  * 漢字轉換位漢語拼音首字母,英文字符不變,特殊字符丟失 支持多音字,生成方式如(長沙市長:cssc,zssz,zssc,cssz)  *  * @param chines 漢字  * @return 拼音  */ public static String converterToFirstSpell(String chines) {  StringBuffer pinyinName = new StringBuffer();  char[] nameChar = chines.toCharArray();  HanyuPinyinOutputFormat defaultFormat = new HanyuPinyinOutputFormat();  defaultFormat.setCaseType(HanyuPinyinCaseType.LOWERCASE);  defaultFormat.setToneType(HanyuPinyinToneType.WITHOUT_TONE);  for (int i = 0; i < nameChar.length; i++) {   if (nameChar[i] > 128) {    try {     // 取得當前漢字的所有全拼     String[] strs = PinyinHelper.toHanyuPinyinStringArray(       nameChar[i], defaultFormat);     if (strs != null) {      for (int j = 0; j < strs.length; j++) {       // 取首字母       pinyinName.append(strs[j].charAt(0));       if (j != strs.length - 1) {        pinyinName.append(",");       }      }     }     // else {     // pinyinName.append(nameChar[i]);     // }    } catch (BadHanyuPinyinOutputFormatCombination e) {     e.printStackTrace();    }   } else {    pinyinName.append(nameChar[i]);   }   pinyinName.append(" ");  }  // return pinyinName.toString();  return parseTheChineseByObject(discountTheChinese(pinyinName.toString())); } /**  * 漢字轉換位漢語全拼,英文字符不變,特殊字符丟失  * 支持多音字,生成方式如(重當參:zhongdangcen,zhongdangcan,chongdangcen  * ,chongdangshen,zhongdangshen,chongdangcan)  *  * @param chines 漢字  * @return 拼音  */ public static String converterToSpell(String chines) {  StringBuffer pinyinName = new StringBuffer();  char[] nameChar = chines.toCharArray();  HanyuPinyinOutputFormat defaultFormat = new HanyuPinyinOutputFormat();  defaultFormat.setCaseType(HanyuPinyinCaseType.LOWERCASE);  defaultFormat.setToneType(HanyuPinyinToneType.WITHOUT_TONE);  for (int i = 0; i < nameChar.length; i++) {   if (nameChar[i] > 128) {    try {     // 取得當前漢字的所有全拼     String[] strs = PinyinHelper.toHanyuPinyinStringArray(       nameChar[i], defaultFormat);     if (strs != null) {      for (int j = 0; j < strs.length; j++) {       pinyinName.append(strs[j]);       if (j != strs.length - 1) {        pinyinName.append(",");       }      }     }    } catch (BadHanyuPinyinOutputFormatCombination e) {     e.printStackTrace();    }   } else {    pinyinName.append(nameChar[i]);   }   pinyinName.append(" ");  }  // return pinyinName.toString();  return parseTheChineseByObject(discountTheChinese(pinyinName.toString())); } /**  * 去除多音字重復數據  *  * @param theStr  * @return  */ private static List<Map<String, Integer>> discountTheChinese(String theStr) {  // 去除重復拼音后的拼音列表  List<Map<String, Integer>> mapList = new ArrayList<Map<String, Integer>>();  // 用于處理每個字的多音字,去掉重復  Map<String, Integer> onlyOne = null;  String[] firsts = theStr.split(" ");  // 讀出每個漢字的拼音  for (String str : firsts) {   onlyOne = new Hashtable<String, Integer>();   String[] china = str.split(",");   // 多音字處理   for (String s : china) {    Integer count = onlyOne.get(s);    if (count == null) {     onlyOne.put(s, new Integer(1));    } else {     onlyOne.remove(s);     count++;     onlyOne.put(s, count);    }   }   mapList.add(onlyOne);  }  return mapList; } /**  * 解析并組合拼音,對象合并方案(推薦使用)  *  * @return  */ private static String parseTheChineseByObject(   List<Map<String, Integer>> list) {  Map<String, Integer> first = null; // 用于統計每一次,集合組合數據  // 遍歷每一組集合  for (int i = 0; i < list.size(); i++) {   // 每一組集合與上一次組合的Map   Map<String, Integer> temp = new Hashtable<String, Integer>();   // 第一次循環,first為空   if (first != null) {    // 取出上次組合與此次集合的字符,并保存    for (String s : first.keySet()) {     for (String s1 : list.get(i).keySet()) {      String str = s + s1;      temp.put(str, 1);     }    }    // 清理上一次組合數據    if (temp != null && temp.size() > 0) {     first.clear();    }   } else {    for (String s : list.get(i).keySet()) {     String str = s;     temp.put(str, 1);    }   }   // 保存組合數據以便下次循環使用   if (temp != null && temp.size() > 0) {    first = temp;   }  }  String returnStr = "";  if (first != null) {   // 遍歷取出組合字符串   for (String str : first.keySet()) {    returnStr += (str + ",");   }  }  if (returnStr.length() > 0) {   returnStr = returnStr.substring(0, returnStr.length() - 1);  }  return returnStr; }}

以上這篇使用Pinyin4j進行拼音分詞的方法就是小編分享給大家的全部內容了,希望能給大家一個參考,也希望大家多多支持VeVb武林網。


注:相關教程知識閱讀請移步到JAVA教程頻道。
發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
亚洲香蕉成人av网站在线观看_欧美精品成人91久久久久久久_久久久久久久久久久亚洲_热久久视久久精品18亚洲精品_国产精自产拍久久久久久_亚洲色图国产精品_91精品国产网站_中文字幕欧美日韩精品_国产精品久久久久久亚洲调教_国产精品久久一区_性夜试看影院91社区_97在线观看视频国产_68精品久久久久久欧美_欧美精品在线观看_国产精品一区二区久久精品_欧美老女人bb
中文.日本.精品| 国产91露脸中文字幕在线| 亚洲欧洲日本专区| 在线激情影院一区| 91在线播放国产| 欧美性猛交xxxx乱大交极品| 性色av一区二区三区红粉影视| 欧美视频一二三| 欧美亚洲视频在线观看| 97视频在线观看网址| 国产精品免费看久久久香蕉| 中文字幕在线看视频国产欧美在线看完整| 国产精品久久久久久久天堂| 精品久久久久久久久久久久久久| 亚洲黄色www网站| 欧美激情按摩在线| 日韩视频―中文字幕| 久久久精品免费视频| 久久精品国产欧美激情| 精品一区精品二区| 中文字幕亚洲一区在线观看| 欧美一级淫片aaaaaaa视频| 欧美在线视频网| 免费av在线一区| 亚洲在线观看视频网站| 国产在线观看不卡| 欧美床上激情在线观看| 这里只有精品丝袜| 国产综合久久久久久| 国产精品色悠悠| 亚洲成人中文字幕| 亚洲最大福利视频网站| 中文字幕在线视频日韩| 国产精品高清在线| 欧美xxxx14xxxxx性爽| 亚洲精品美女久久久久| www亚洲欧美| 国产亚洲精品美女| 亚洲第一中文字幕在线观看| 欧美亚洲视频在线观看| 国产精品亚洲一区二区三区| 亚洲欧美福利视频| 日韩精品电影网| 97超级碰碰碰| 亚洲少妇激情视频| 色偷偷av亚洲男人的天堂| 久久久成人av| 国产精品福利小视频| 国产精品av在线播放| 国产精品三级美女白浆呻吟| 91久久精品美女| 奇米影视亚洲狠狠色| 久久久99免费视频| 国产精品欧美日韩一区二区| 亚洲激情视频网站| 黑人巨大精品欧美一区二区一视频| 亚洲一区www| 日韩中文有码在线视频| 国产成人a亚洲精品| 97国产精品视频人人做人人爱| 国产一区二区在线免费视频| 欧美猛男性生活免费| 亚洲人成网7777777国产| 九色91av视频| 亚洲男人av在线| 国产精品视频不卡| 久久伊人色综合| 91社影院在线观看| 亚洲欧美日韩直播| 欧美亚洲激情视频| 国产成人精品久久亚洲高清不卡| 国产日韩在线看| 亚洲国产99精品国自产| 91在线色戒在线| 日韩亚洲在线观看| 中文字幕亚洲色图| 91香蕉国产在线观看| 91情侣偷在线精品国产| 亚洲第一免费网站| 欧美xxxx14xxxxx性爽| 久久亚洲国产成人| 国产日韩欧美日韩大片| 日韩欧美视频一区二区三区| 91精品美女在线| 国产在线a不卡| 亚洲japanese制服美女| 欧美日韩中文在线观看| 国产精品美女免费看| 久久香蕉精品香蕉| 亚洲人精选亚洲人成在线| 免费99精品国产自在在线| 91久久在线视频| 欧美夜福利tv在线| 久热精品视频在线免费观看| 91在线中文字幕| 色悠悠久久88| 亚洲欧美中文字幕在线一区| 亚洲福利视频专区| 日本欧美在线视频| 91亚洲精品在线| 黄色成人av网| 91欧美视频网站| 91久久久久久| 日韩在线视频中文字幕| 美女av一区二区| 久久精品久久久久| 欧美孕妇孕交黑巨大网站| 国产+成+人+亚洲欧洲| 欧美日韩高清区| 在线看日韩欧美| 国产精品视频网| 欧美激情精品久久久久久变态| 欧美极品少妇xxxxⅹ免费视频| 伊人久久大香线蕉av一区二区| 97人人模人人爽人人喊中文字| 日韩av免费在线观看| 成人免费视频网址| 国产精品久久久久国产a级| 日韩欧美在线观看| 亚洲福利在线播放| 91精品久久久久| 日韩久久精品电影| 亚洲国产精品福利| 亚洲精品黄网在线观看| 国产日韩精品电影| 国产精品日日摸夜夜添夜夜av| 欧美一区三区三区高中清蜜桃| 亚洲国产成人久久综合一区| 欧美成人三级视频网站| 不卡av在线网站| 在线观看精品国产视频| 亚洲综合色激情五月| 欧美性猛交xxxx偷拍洗澡| 久久色在线播放| 日韩亚洲一区二区| 欧美一级bbbbb性bbbb喷潮片| 精品色蜜蜜精品视频在线观看| 亚洲电影在线观看| 亚洲图片欧美日产| 国产一区av在线| 久久综合久中文字幕青草| 久久久久久久久久久av| 成人黄色av播放免费| 国产成人精品一区二区| 中文字幕日韩精品在线观看| 欧美成人性色生活仑片| 国产精品高潮呻吟久久av无限| 精品久久久久久久大神国产| 日韩电影大片中文字幕| 国产美女直播视频一区| 日韩成人在线播放| 亚洲女人被黑人巨大进入| 国产精品色婷婷视频| 国产精品中文在线| 国产欧美日韩高清| 不卡中文字幕av| 久久精品视频免费播放| 久久av在线播放| 久久精品国产91精品亚洲| 欧美激情视频给我| 97超碰色婷婷| 亚洲欧美制服另类日韩| 亚洲国产精品人人爽夜夜爽| 久久精品视频中文字幕|