亚洲香蕉成人av网站在线观看_欧美精品成人91久久久久久久_久久久久久久久久久亚洲_热久久视久久精品18亚洲精品_国产精自产拍久久久久久_亚洲色图国产精品_91精品国产网站_中文字幕欧美日韩精品_国产精品久久久久久亚洲调教_国产精品久久一区_性夜试看影院91社区_97在线观看视频国产_68精品久久久久久欧美_欧美精品在线观看_国产精品一区二区久久精品_欧美老女人bb

首頁 > 編程 > Python > 正文

python實現中文分詞FMM算法實例

2020-01-04 18:06:01
字體:
來源:轉載
供稿:網友

這篇文章主要介紹了python實現中文分詞FMM算法,實例分析了Python基于FMM算法進行中文分詞的實現方法,涉及Python針對文件、字符串及正則匹配操作的相關技巧,需要的朋友可以參考下

本文實例講述了python實現中文分詞FMM算法。分享給大家供大家參考。具體分析如下:

FMM算法的最簡單思想是使用貪心算法向前找n個,如果這n個組成的詞在詞典中出現,就ok,如果沒有出現,那么找n-1個...然后繼續下去。假如n個詞在詞典中出現,那么從n+1位置繼續找下去,直到句子結束。

 

 
  1. import re  
  2. def PreProcess(sentence,edcode="utf-8"):  
  3. sentence = sentence.decode(edcode)  
  4. sentence=re.sub(u"[。,,!……!《》<>/"'::?/?、/|“”‘';]"," ",sentence)  
  5. return sentence  
  6. def FMM(sentence,diction,result = [],maxwordLength = 4,edcode="utf-8"): 
  7. i = 0 
  8. sentence = PreProcess(sentence,edcode)  
  9. length = len(sentence)  
  10. while i < length:  
  11. # find the ascii word  
  12. tempi=i  
  13. tok=sentence[i:i+1]  
  14. while re.search("[0-9A-Za-z/-/+#@_/.]{1}",tok)<>None:  
  15. i= i+1 
  16. tok=sentence[i:i+1]  
  17. if i-tempi>0:  
  18. result.append(sentence[tempi:i].lower().encode(edcode))  
  19. # find chinese word  
  20. left = len(sentence[i:])  
  21. if left == 1:  
  22. """go to 4 step over the FMM""" 
  23. """should we add the last one? Yes, if not blank""" 
  24. if sentence[i:] <> " ":  
  25. result.append(sentence[i:].encode(edcode))  
  26. return result  
  27. m = min(left,maxwordLength)  
  28. for j in xrange(m,0,-1):  
  29. leftword = sentence[i:j+i].encode(edcode)  
  30. # print leftword.decode(edcode)  
  31. if LookUp(leftword,diction):  
  32. # find the left word in dictionary  
  33. # it's the right one  
  34. i = j+i  
  35. result.append(leftword)  
  36. break 
  37. elif j == 1:  
  38. """only one word, add into result, if not blank""" 
  39. if leftword.decode(edcode) <> " ":  
  40. result.append(leftword)  
  41. i = i+1 
  42. else:  
  43. continue 
  44. return result  
  45. def LookUp(word,dictionary):  
  46. if dictionary.has_key(word):  
  47. return True 
  48. return False 
  49. def ConvertGBKtoUTF(sentence):  
  50. return sentence.decode('gbk').encode('utf-8'
  51. dictions = {}  
  52. dictions["ab"] = 1 
  53. dictions["cd"] = 2 
  54. dictions["abc"] = 1 
  55. dictions["ss"] = 1 
  56. dictions[ConvertGBKtoUTF("好的")] = 1 
  57. dictions[ConvertGBKtoUTF("真的")] = 1 
  58. sentence = "asdfa好的是這樣嗎vasdiw呀真的daf dasfiw asid是嗎?" 
  59. s = FMM(ConvertGBKtoUTF(sentence),dictions)  
  60. for i in s:  
  61. print i.decode("utf-8"
  62. test = open("test.txt","r")  
  63. for line in test:  
  64. s = FMM(CovertGBKtoUTF(line),dictions)  
  65. for i in s:  
  66. print i.decode("utf-8"

運行結果如下:

asdfa

好的

vasdiw

真的

daf

dasfiw

asid

?

希望本文所述對大家的Python程序設計有所幫助。

發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
亚洲香蕉成人av网站在线观看_欧美精品成人91久久久久久久_久久久久久久久久久亚洲_热久久视久久精品18亚洲精品_国产精自产拍久久久久久_亚洲色图国产精品_91精品国产网站_中文字幕欧美日韩精品_国产精品久久久久久亚洲调教_国产精品久久一区_性夜试看影院91社区_97在线观看视频国产_68精品久久久久久欧美_欧美精品在线观看_国产精品一区二区久久精品_欧美老女人bb
日韩欧美在线视频| 欧美激情精品久久久久久大尺度| 自拍偷拍亚洲区| 国产一区二区三区毛片| 中文字幕一区日韩电影| 亚洲国产精品福利| …久久精品99久久香蕉国产| 日韩电影在线观看中文字幕| 欧美亚洲日本网站| 国产欧美精品xxxx另类| 伊人久久免费视频| 国产精品嫩草视频| 精品久久久久久久久中文字幕| 日日摸夜夜添一区| 成人在线视频网站| 欧美日韩国产丝袜美女| 成人精品一区二区三区电影免费| 欧美成人精品一区| 午夜精品一区二区三区av| 性金发美女69hd大尺寸| 亚洲xxx大片| 久久久噜噜噜久久中文字免| 91精品美女在线| 亚洲第一页自拍| 欧美性感美女h网站在线观看免费| 成人免费网视频| 国产亚洲欧洲黄色| 欧美日韩色婷婷| 久久免费福利视频| 欧美成人免费小视频| 欧美成年人在线观看| 国产69精品99久久久久久宅男| 精品在线欧美视频| 久久精品中文字幕| 777国产偷窥盗摄精品视频| 国产精品jizz在线观看麻豆| 欧美日韩国产麻豆| 一区二区三区四区精品| 孩xxxx性bbbb欧美| 国产欧美一区二区三区在线看| 国产精品久久不能| 日本道色综合久久影院| 疯狂欧美牲乱大交777| 精品亚洲va在线va天堂资源站| 日韩精品在线观看一区| 亚洲人成亚洲人成在线观看| 欧美日韩成人免费| 在线a欧美视频| 欧美日韩一区二区免费视频| 国产精品中文在线| 国产午夜精品一区二区三区| 欧美日韩在线观看视频小说| 国产亚洲欧美日韩美女| 久久99精品久久久久久噜噜| 日韩视频免费看| 日韩成人在线电影网| 日韩麻豆第一页| 韩国19禁主播vip福利视频| 成人精品视频99在线观看免费| 人人澡人人澡人人看欧美| 日本精品视频在线播放| 欧美成人在线免费| 欧美与黑人午夜性猛交久久久| 97热在线精品视频在线观看| 欧美国产第一页| 久久天天躁狠狠躁夜夜躁2014| 欧美激情免费看| 欧美中文字幕在线视频| 成人福利在线观看| 日韩av三级在线观看| 国产成人精品国内自产拍免费看| 欧美大片免费观看| 国产精品爱啪在线线免费观看| 国产精品久久久久久久久久久久久久| 亚洲一区中文字幕| 菠萝蜜影院一区二区免费| 精品日韩视频在线观看| 精品久久久久人成| 在线观看精品国产视频| 国产精品美女久久久免费| 成人动漫网站在线观看| 日本久久久久久久久久久| 国内偷自视频区视频综合| 精品国产欧美一区二区三区成人| 国产成人精品免高潮在线观看| 欧美极品美女电影一区| 91亚洲一区精品| 午夜精品一区二区三区视频免费看| 国产精品白嫩美女在线观看| 8x海外华人永久免费日韩内陆视频| 亚洲tv在线观看| 欧美日韩一区二区精品| 日韩亚洲综合在线| 欧美精品久久久久久久免费观看| 国产精品高潮呻吟久久av黑人| 久久久精品久久久久| 久久久久久久久久久国产| 91精品国产网站| 日韩视频中文字幕| 欧美日韩中文字幕综合视频| 日韩高清电影免费观看完整| 精品国产91久久久| 欧美精品久久一区二区| 日韩高清中文字幕| 日韩精品亚洲精品| 亚洲国产精品久久久久秋霞蜜臀| 国产精品永久免费视频| 国产丝袜一区二区三区免费视频| 欧美在线亚洲在线| 日韩精品在线视频美女| 在线观看国产成人av片| 国产91精品在线播放| 亚洲精品视频中文字幕| 久久久国产精品免费| 日韩在线观看精品| 国产aⅴ夜夜欢一区二区三区| 久久精品国产96久久久香蕉| www.日韩.com| 91国产视频在线播放| 日韩av三级在线观看| 午夜精品福利在线观看| 国产精品成人播放| 日韩一中文字幕| 久久天天躁狠狠躁夜夜躁| 欧美日本亚洲视频| 欧美成人在线影院| 91日本在线视频| 亚洲成人黄色在线观看| 欧美黑人巨大xxx极品| 亚洲高清av在线| 亚洲国产精品99久久| 久久久久久久久久久91| 亚洲香蕉成视频在线观看| 国产精品美女久久久免费| 中文字幕成人精品久久不卡| 久久视频精品在线| 欧美日韩亚洲网| 亚洲国内精品在线| 精品久久久久久久久久ntr影视| 国产日本欧美在线观看| 亚洲福利视频网站| 欧美大成色www永久网站婷| 国产精品一区=区| 国产成人午夜视频网址| 国产国语刺激对白av不卡| 国产精品色婷婷视频| 日韩精品一二三四区| 国产精品久久久av| 欧美在线中文字幕| 精品视频在线导航| 精品国产一区二区三区四区在线观看| 精品久久中文字幕久久av| 高清亚洲成在人网站天堂| 91在线中文字幕| 伊人亚洲福利一区二区三区| 国产精品高清在线| 欧美专区日韩视频| 色综合老司机第九色激情| 亚洲国产精品一区二区三区| 亚洲一区美女视频在线观看免费| 久久久国产视频| 国产精品丝袜视频| 欧美日韩中文字幕在线视频| 精品视频久久久久久久|