亚洲香蕉成人av网站在线观看_欧美精品成人91久久久久久久_久久久久久久久久久亚洲_热久久视久久精品18亚洲精品_国产精自产拍久久久久久_亚洲色图国产精品_91精品国产网站_中文字幕欧美日韩精品_国产精品久久久久久亚洲调教_国产精品久久一区_性夜试看影院91社区_97在线观看视频国产_68精品久久久久久欧美_欧美精品在线观看_国产精品一区二区久久精品_欧美老女人bb

首頁 > 編程 > PHP > 正文

如何安裝 php scws(分詞組件)?

2020-03-22 19:11:44
字體:
來源:轉載
供稿:網友
make install順利的話已經編譯并安裝成功到 /usr/local/scws 中了,執行下面命令看看文件是否存在ls -al /usr/local/scws/lib/libscws.la5、用 wget 下載并解壓詞典,或從主頁下載然后自行解壓再將 *.xdb 放入 /usr/local/scws/etc 目錄中cd /usr/local/scws/etcwget http://www.xunsearch.com/scws/down/scws-dict-chs-gbk.tar.bz2wget http://www.xunsearch.com/scws/down/scws-dict-chs-utf8.tar.bz2tar xvjf scws-dict-chs-gbk.tar.bz2tar xvjf scws-dict-chs-utf8.tar.bz26、php擴展如果您需要在 php 中調用分詞,建議繼續閱讀本文安裝 php 擴展,否則可跳過不看。假設您已經將 scws 按上述步驟安裝到 /usr/local/scws 中。安裝此擴展要求您的 php 和系統環境安裝了相應的 autoconf automake 工具及 phpize 。1) 進入源碼目錄的 phpext/ 目錄 cd /var/scws-1.2.3/phpext2) 執行 phpize (在PHP安裝目錄的bin/目錄下)[沒有安裝phpize 使用 yum install php-devel 安裝]3) 執行 ./configure --with-scws=/usr/local/scws 4) 若 php 安裝在特殊目錄 $php_prefix, 則請在 configure 后加上 --with-php-config=$php_prefix/bin/php-config5) 在 php.ini [/etc/php.ini] 中加入以下幾行[scws]extension = scws.soscws.default.charset = utf8scws.default.fpath = /usr/local/scws/etc

Windows 環境下安裝 scws

php 擴展下載地址1. 根據您當前用的 PHP 版本,下載相應已編譯好的 php_scws.dll 擴展庫。 目前支持 PHP-4.4.x 和 PHP-5.2.x 系列,下載地址分別為: php-4.4.x: http://www.xunsearch.com/scws/down/php-4.4.x/php_scws.dll php-5.2.x: http://www.xunsearch.com/scws/down/php-5.2.x/php_scws.dll php-5.3.x: http://www.xunsearch.com/scws/down/php-5.3.x/php_scws.dll2. 將下載后的 php_scws.dll 放到 php 安裝目錄的 extensions/ 目錄中去(通常為:X:/php/extensions/或 X:/php/ext/)。3. 建立一個本地目錄放規則集文件和詞典文件,建議使用:C:/program files/scws/etc4. 從 scws 主頁上下載詞典文件,解壓后將 *.xdb 放到上述目錄中 詞典系列:http://www.xunsearch.com/scws/down/scws-dict-chs-gbk.tar.bz2 http://www.xunsearch.com/scws/down/scws-dict-chs-utf8.tar.bz2 http://www.xunsearch.com/scws/down/scws-dict-cht-utf8.tar.bz25. 從 scws 主頁上下載規則集文件,解壓后將 *.ini 放到第 3 步建立的目錄 規則集文件壓縮包:http://www.xunsearch.com/scws/down/rules.tgz 解壓后有三個文件分別為 rules.ini rules.utf8.ini rules_cht.utf8.ini 將三件文件拷到第 3 步所述的目錄中6. 修改 php.ini 通常位于 C:/windows/php.ini 或 C:/winnt/php.ini 之類的目錄, 在 php.ini 的末尾加入以下幾行:[scws]; 注意請檢查 php.ini 中的 extension_dir 的設定值是否正確, 否則請將 extension_dir 設為空,; 再把 php_scws.dll 指定為絕對路徑。extension = php_scws.dllscws.default.charset = gbkscws.default.fpath = c:/program files/scws/etc 5. 重開 web 服務器即可完成。

php 代碼

php 代碼 ?php$so = scws_new();//$so- set_charset( utf-8 // 這里沒有調用 set_dict 和 set_rule 系統會自動試調用 ini 中指定路徑下的詞典和規則文件$so- send_text( 我是一個中國人,我會C++語言,我也有很多T恤衣服 name is hai while ($tmp = $so- get_result()) print_r($tmp);$so- close();預定義常量-----------* `SCWS_XDICT_XDB` 詞典文件為 XDB* `SCWS_XDICT_MEM` 將詞典全部加載到內存里* `SCWS_XDICT_TXT` 詞典文件為 TXT(純文本)* `SCWS_MULTI_NONE` 不進行復合分詞* `SCWS_MULTI_SHORT` 短詞復合 * `SCWS_MULTI_DUALITY` 散字二元復合* `SCWS_MULTI_ZMAIN` 重要單字* `SCWS_MULTI_ZALL` 全部單字---------這是一個類似 `Directory` 的內置式偽類操作,類方法建立請使用 `scws_new()` 函數,而不能直接用 `new SimpleCWS`。否則不會包含有 handle 指針,將無法正確操作。它包含的方法有:```phphtml' target='_blank'>class SimpleCWS { resource handle; bool close(void); bool set_charset(string charset) bool add_dict(string dict_path[, int mode = SCWS_XDICT_XDB]) bool set_dict(string dict_path[, int mode = SCWS_XDICT_XDB]) bool set_rule(string rule_path) bool set_ignore(bool yes) bool set_multi(int mode) bool set_duality(bool yes) bool send_text(string text) mixed get_result(void) mixed get_tops([int limit [, string xattr]]) bool has_word(string xattr) mixed get_words(string xattr) string version(void) **注意** 類方法的用與支 scws_xxx_xxx 系列函數用法一致,只不過免去第一參數, 故不另外編寫說明,請參見函數列表即可。**例子1** 使用類方法分詞```php ?php$so = scws_new();$so- set_charset( gbk // 這里沒有調用 set_dict 和 set_rule 系統會自動試調用 ini 中指定路徑下的詞典和規則文件$so- send_text( 我是一個中國人,我會C++語言,我也有很多T恤衣服 while ($tmp = $so- get_result()) print_r($tmp);$so- close();**例子2** 使用函數提取高頻詞```php ?php$sh = scws_open();scws_set_charset($sh, gbk scws_set_dict($sh, /path/to/dict.xdb scws_set_rule($sh, /path/to/rules.ini $text = 我是一個中國人,我會C++語言,我也有很多T恤衣服 scws_send_text($sh, $text);$top = scws_get_tops($sh, 5);print_r($top); **注意** 為方便使用,當 `SimpleCWS::send_text` 方法或 `scws_send_text()` 函數被調用前并且沒有 加載任何詞典和規則集時,系統會自動在 `scws.default.fpath` (ini配置)目錄中查找相應的字符集詞典。 詞典和規則文件的命名方式為 dict[.字符集].xdb 和 rules[.字符集].ini ,當字符集是 gbk 時中括號里面的 部分則不需要,直接使用 dict.xdb 和 rules.ini 而不是 dict.gbk.xdb 。 此外,輸入的文字,詞典、規則文件這三者的字符集必須統一,如果不是默認的 gbk 字符集請調用  `SimpleCWS::set_charset` 或 `scws_set_charset` 來設定,否則可能出現意外錯誤。--------1. `mixed scws_new(void)` 創建并返回一個 `SimpleCWS` 類操作對象。 **返回值** 成功返回類操作句柄,失敗返回 false。2. `mixed scws_open(void)` 創建并返回一個分詞操作句柄。 **返回值** 成功返回 scws 操作句柄,失敗返回 false。3. `bool scws_close(resource scws_handle)`  `SimpleCWS::close(void)` 關閉一個已打開的 scws 分詞操作句柄。 **參數 scws_handle** 即之前由 scws_open 打開的返回值。  **返回值** 始終為 true  **注意** 后面的 API 中省去介紹 scws_handle 參數,含義和本函數相同。4. `bool scws_set_charset(resource scws_handle, string charset)`  `bool SimpleCWS::set_charset(string charset)` 設定分詞詞典、規則集、欲分文本字符串的字符集。 **參數 charset** 要新設定的字符集,目前只支持 utf8 和 gbk。(注:默認為 gbk,utf8不要寫成utf-8)  **返回值** 始終為 true5. `bool scws_add_dict(resource scws_handle, string dict_path [, int mode])` `bool SimpleCWS::add_dict(string dict_path [, int mode])` 添加分詞所用的詞典,新加入的優先查找。 **參數 dict_path** 詞典的路徑,可以是相對路徑或完全路徑。(遵循安全模式下的 open_basedir)  **參數 mode** 可選,表示加載的方式。其值有: - SCWS_XDICT_TXT 表示要讀取的詞典文件是文本格式,可以和后2項結合用 - SCWS_XDICT_XDB 表示直接讀取 xdb 文件(此為默認值) - SCWS_XDICT_MEM 表示將 xdb 文件全部加載到內存中,以 XTree 結構存放,可用異或結合另外2個使用。 **返回值** 成功返回 true 失敗返回 false6. `bool scws_set_dict(resource scws_handle, string dict_path [, int mode])`  `bool SimpleCWS::set_dict(string dict_path [, int mode])` 設定分詞所用的詞典并清除已存在的詞典列表。 **參數 dict_path** 詞典的路徑,可以是相對路徑或完全路徑。(遵循安全模式下的 open_basedir)  **參數 mode** 可選,表示加載的方式。參見 `scws_add_dict`  **返回值** 成功返回 true 失敗返回 false7. `bool scws_set_rule(resource scws_handle, string rule_path)`  `bool SimpleCWS::set_rule(string rule_path)` 設定分詞所用的新詞識別規則集(用于人名、地名、數字時間年代等識別)。 **參數 rule_path** 規則集的路徑,可以是相對路徑或完全路徑。(遵循安全模式下的 open_basedir)  **參數 mode** 可選,表示加載的方式。參見 `scws_add_dict`  **返回值** 成功返回 true 失敗返回 false8. `bool scws_set_ignore(resource scws_handle, bool yes)`  `bool SimpleCWS::set_ignore(bool yes)` 設定分詞返回結果時是否去除一些特殊的標點符號之類。 **參數 yes** 設定值,如果為 true 則結果中不返回標點符號,如果為 false 則會返回,缺省為 false。  **返回值** 始終為 true9. `bool scws_set_multi(resource scws_handle, int mode)`  `bool SimpleCWS::set_multi(bool yes)` 設定分詞返回結果時是否復式分割,如“中國人”返回“中國+人+中國人”三個詞。 **參數 mode** 復合分詞法的級別,缺省不復合分詞。取值由下面幾個常量異或組合(也可用 1-15 來表示): - SCWS_MULTI_SHORT (1)短詞 - SCWS_MULTI_DUALITY (2)二元(將相鄰的2個單字組合成一個詞) - SCWS_MULTI_ZMAIN (4)重要單字 - SCWS_MULTI_ZALL (8)全部單字 **返回值** 始終為 true10. `bool scws_set_duality(resource scws_handle, bool yes)`  `bool SimpleCWS::set_duality(bool yes)` 設定是否將閑散文字自動以二字分詞法聚合 **參數 yes** 設定值,如果為 true 則結果中多個單字會自動按二分法聚分,如果為 false 則不處理,缺省為 false。  **返回值** 始終為 true11. `bool scws_send_text(resource scws_handle, string text)`  `bool SimpleCWS::send_text(string text)` 發送設定分詞所要切割的文本。 **參數 text** 要切分的文本的內容。  **返回值** 成功返回 true 失敗返回 false  **注意** 系統底層處理方式為對該文本增加一個引用,故不論多長的文本并不會造成內存浪費; 執行本函數時,若未加載任何詞典和規則集,則會自動試圖在 ini 指定的缺省目錄下查找缺省字符集的詞典和規則集。12. `mixed scws_get_result(resource scws_handle)`  `mixed SimpleCWS::get_result()` 根據 send_text 設定的文本內容,返回一系列切好的詞匯。 **返回值** 成功返回切好的詞匯組成的數組,若無更多詞匯,返回 false。返回的詞匯包含的鍵值如下: - word _string_ 詞本身 - idf _float_ 逆文本詞頻 - off _int_ 該詞在原文本路的位置 - attr _string_ 詞性 **注意** 每次切詞后本函數應該循環調用,直到返回 false 為止,因為程序每次返回的詞數是不確定的。13. `mixed scws_get_tops(resource scws_handle [, int limit [, string attr]])`  `mixed SimpleCWS::get_tops([int limit [, string attr]])` 根據 send_text 設定的文本內容,返回系統計算出來的最關鍵詞匯列表。 **參數 limit** 可選參數,返回的詞的最大數量,缺省是 10  **參數 attr** 可選參數,是一系列詞性組成的字符串,各詞性之間以半角的逗號隔開, 這表示返回的詞性必須在列表中,如果以~開頭,則表示取反,詞性必須不在列表中,缺省為NULL,返回全部詞性,不過濾。  **返回值** 成功返回統計好的的詞匯組成的數組,返回 false。返回的詞匯包含的鍵值如下: - word _string_ 詞本身 - times _int_ 詞在文本中出現的次數 - weight _float_ 該詞計算后的權重 - attr _string_ 詞性14. `mixed scws_get_words(resource scws_handle, string attr)`  `mixed SimpleCWS::get_words(string attr)` 根據 send_text 設定的文本內容,返回系統中詞性符合要求的關鍵詞匯。 **參數 attr** 是一系列詞性組成的字符串,各詞性之間以半角的逗號隔開, 這表示返回的詞性必須在列表中,如果以~開頭,則表示取反,詞性必須不在列表中,若為空則返回全部詞。  **返回值** 成功返回符合要求詞匯組成的數組,返回 false。返回的詞匯包含的鍵值參見 `scws_get_result`15. `bool scws_has_words(resource scws_handle, string attr)`  `mixed SimpleCWS::has_words(string attr)` 根據 send_text 設定的文本內容,返回系統中是否包括符合詞性要求的關鍵詞。 **參數 attr** 是一系列詞性組成的字符串,各詞性之間以半角的逗號隔開, 這表示返回的詞性必須在列表中,如果以~開頭,則表示取反,詞性必須不在列表中,若為空則返回全部詞。  **返回值** 如果有則返回 true,沒有就返回 false。16. `string scws_version(void)`  `string SimpleCWS::version(void)` 返回 scws 版本號名稱信息(字符串)。        

鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播更多信息之目的,如作者信息標記有誤,請第一時間聯系我們修改或刪除,多謝。

發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
亚洲香蕉成人av网站在线观看_欧美精品成人91久久久久久久_久久久久久久久久久亚洲_热久久视久久精品18亚洲精品_国产精自产拍久久久久久_亚洲色图国产精品_91精品国产网站_中文字幕欧美日韩精品_国产精品久久久久久亚洲调教_国产精品久久一区_性夜试看影院91社区_97在线观看视频国产_68精品久久久久久欧美_欧美精品在线观看_国产精品一区二区久久精品_欧美老女人bb
久久99精品久久久久久噜噜| 热久久视久久精品18亚洲精品| 亚洲2020天天堂在线观看| 98午夜经典影视| 欧美特黄级在线| 欧美亚洲第一页| 久久久精品国产网站| 国产日韩在线看片| 激情久久av一区av二区av三区| 91精品国产色综合| 亚洲电影第1页| 国产精品第七十二页| 亚洲欧美日韩国产中文专区| 7777精品视频| 亚洲变态欧美另类捆绑| 欧美性极品xxxx做受| 青青久久av北条麻妃黑人| 日韩综合视频在线观看| 国内精品小视频在线观看| 日韩欧美在线视频日韩欧美在线视频| 亚洲精品一区在线观看香蕉| 亚洲图片欧洲图片av| 国产精品久久久久久久9999| 欧美激情性做爰免费视频| 成人在线精品视频| 国产成人精品视频在线观看| 久久乐国产精品| 琪琪第一精品导航| 精品福利在线观看| 69国产精品成人在线播放| 午夜伦理精品一区| 欧美最猛性xxxxx免费| 亚洲国产精品成人va在线观看| 国产精品wwww| 欧美日韩在线观看视频小说| 538国产精品视频一区二区| 91亚洲一区精品| 欧美极品少妇xxxxⅹ裸体艺术| 美乳少妇欧美精品| 26uuu亚洲国产精品| xxxx欧美18另类的高清| 亚洲欧美在线免费| 欧美在线亚洲一区| 成人网在线观看| 久久久在线视频| 国产精品美腿一区在线看| 美女国内精品自产拍在线播放| 国产成人精品久久| 97在线观看免费| 亚洲人成在线免费观看| 欧美一区二粉嫩精品国产一线天| 国产精品免费视频久久久| 欧美国产激情18| 久久在线观看视频| 精品国产999| 亚洲第一区第一页| 91av在线看| 欧美亚洲国产视频小说| 自拍偷拍亚洲欧美| 91精品国产综合久久香蕉| 欧美激情精品久久久久久大尺度| 日韩中文在线视频| 96sao精品视频在线观看| 久久久免费精品| 国产精品网站大全| www国产精品视频| 亚洲嫩模很污视频| 91精品中国老女人| 国产九九精品视频| 精品在线小视频| 亚洲精品国偷自产在线99热| 日本久久久久久| 欧美国产第二页| 91久久精品在线| 激情成人中文字幕| 黄色91在线观看| 欧美激情一区二区三区久久久| 色无极亚洲影院| 亚洲天堂男人天堂女人天堂| 亚洲人a成www在线影院| 色综合久久88色综合天天看泰| 成人黄色中文字幕| 久久精品国产亚洲精品| 欧美性生交xxxxx久久久| 91久久嫩草影院一区二区| 国产视频欧美视频| 亚洲国产日韩精品在线| 亚洲激情在线观看视频免费| 全球成人中文在线| 国产精品成人免费视频| 国产精品欧美日韩一区二区| 日韩成人中文电影| 亚洲一区二区三区四区视频| 另类专区欧美制服同性| 久久久精品久久久久| 九九热这里只有精品免费看| 国产精品久久久久久久久男| 国产91色在线|| 91精品国产99久久久久久| 日韩国产欧美区| 日韩中文字幕第一页| 欧美日韩国产成人高清视频| 美女撒尿一区二区三区| 欧美最猛性xxxx| 亚洲人成在线一二| 久久综合久久美利坚合众国| 国产精品久久久久久久app| 国产在线拍揄自揄视频不卡99| 国产在线观看一区二区三区| 亚洲色在线视频| 国产欧美日韩免费| 亚洲美女福利视频网站| 亚洲人成伊人成综合网久久久| 欧美在线观看网站| 日韩国产在线播放| 国产欧美精品一区二区三区介绍| 久久免费国产视频| 中文字幕欧美视频在线| 午夜精品福利在线观看| 欧美在线亚洲一区| 亚洲欧美在线免费| 国产成人在线精品| 国产精品中文在线| 国产成人精品一区二区| 亚洲精品国产成人| 国产精品∨欧美精品v日韩精品| 色偷偷亚洲男人天堂| 色综合男人天堂| 久久久久国产一区二区三区| 欧美激情啊啊啊| 在线日韩中文字幕| 97久久国产精品| 最近免费中文字幕视频2019| 福利视频第一区| 日韩欧美中文字幕在线观看| 在线观看日韩www视频免费| 欧美日韩在线视频一区二区| 色综合久久88色综合天天看泰| 欧美老女人www| 日韩精品中文字幕在线| 久久91超碰青草是什么| 精品小视频在线| 欧美一区二区三区艳史| 一区二区三区在线播放欧美| 亚洲欧洲国产精品| 粉嫩av一区二区三区免费野| 一区二区三区视频在线| 国产99久久精品一区二区 夜夜躁日日躁| 欧美高清视频在线播放| 福利微拍一区二区| 日韩视频欧美视频| 国产精品久久久久久久av电影| 日韩av一卡二卡| 欧美老少配视频| 国产视频一区在线| 萌白酱国产一区二区| 国产精品久久久久久久久免费看| 亚洲2020天天堂在线观看| 欧美高清在线视频观看不卡| 日韩美女免费观看| 日韩精品中文字幕在线观看| 国内精品久久久久久久| 国产日本欧美一区二区三区| 精品成人久久av|