配置同義詞首 擴展詞典 停止詞典等功能 先是要基于中文分詞的基礎上進行的,如果檢索關鍵詞不能夠進行中文分詞那么是查詢不到相關的同義詞的(配置中文分詞可參考:點擊打開鏈接)
在進行配置前需要先下載下修改后的IK分詞jar包:IK分詞jar
找到solrhome中schema.xml文件進行添加如下配置:
<fieldType name="text_ik" class="solr.TextField"> <analyzer type="query"> <tokenizer class="org.wltea.analyzer.lucene.IKTokenizerFactory" useSmart="false"/> <filter class="solr.LowerCaseFilterFactory"/> </analyzer> <analyzer type="index"> <tokenizer class="org.wltea.analyzer.lucene.IKTokenizerFactory" useSmart="fasle"/> <filter class="solr.SynonymFilterFactory" synonyms="synonyms.txt" ignoreCase="true" expand="true" /> <filter class="solr.LowerCaseFilterFactory"/> </analyzer> </fieldType> 在schema.xml文件中添加一個字段并且引用text_ik分詞:<field name="content" type="text_ik" indexed="true" stored="true" multiValued="false" />完成配置之后保存下面我們就需要添加一下我們同義詞進行測試下是否成功
在schema.xml同級目錄下有synonyms.txt 這個文件夾 我們配置的同義詞就在這個文件中
格式 ,好隔開 一行為一個同義詞 保存 啟動服務 到admin頁面查看效果
下面說下擴展詞典和停止詞典的配置
解壓剛才下載的jar包 將 ext.dic IKAnalyzer.cfg.xml stopWord.dic 三個文件復制到
將上面復制的三個文件粘貼到apache-tomcat-7.0.47/webapps/solr/WEB-INF/classes目錄下
為修改ext.dic 如果
編輯ext.dic文件添加我們要擴展的詞匯例如:河北廊坊(格式一行為一個詞組)
添加之后 保存 重新啟動服務如圖 : 河北廊坊已經成為一次詞組出現
注: 如果編輯ext.dic時候未出現效果 需要將ext.dic格式設置為UTF-8格式
擴展的停止詞匯同理配置
停止詞匯含義:編輯到 stopword.dic 文件中的詞匯 在搜索的時候不會以詞組的形式出現
例如:麻痹 這個詞組放到了stopword.dic 中 在搜索時 麻痹 這個詞就不會在出現了
新聞熱點
疑難解答