濮阳杆衣贸易有限公司

主頁 > 知識庫 > TrieTree服務-組件構成及其作用介紹

TrieTree服務-組件構成及其作用介紹

熱門標簽:電話機器人廣告話術 蘇州銷售外呼系統(tǒng)預算 淘寶地圖標注如何做 東莞語音電銷機器人排名 朝陽市地圖標注 保山電話外呼管理系統(tǒng)怎么用 外呼系統(tǒng)用員工身份證 使用智能電話機器人違法嗎 太原外呼電銷機器人費用

上一篇中我們對TrieTree服務有了一個整體的了解,不知道大家下載完之后有沒有真正玩過這個TrieTree服務,如果你還沒有玩過,沒關系,本文將一步步教你配置和使用TrieTree服務。

TrieTree服務由幾大組件組成,如下圖

Dictionary組件是核心庫,主要提供基本數(shù)據(jù)定義、配置信息定義,數(shù)據(jù)結構表示,同時也提供了POSType(參考Pangu的Part of Speech定義)。由于TrieTree是利用內存來加載數(shù)據(jù)的,所以這個組件的設計直接決定了內存的占用大小和數(shù)據(jù)查詢性能。Dictionary.Providers組件主要負責提供各種自定義數(shù)據(jù)提供者(DataProvider),你可以把它理解為字典數(shù)據(jù)的加載器,例如自帶的PanguDictProviders就是負責加載盤古自己的dict格式的字典。TrieTree服務的加載器是高度可配置的,你可以通過配置文件來選擇你需要使用的加載器,如下所示:

復制代碼 代碼如下:

dictionaryService>
provider name="pangu_dict" uri="F:\Dropbox\research\NLP\TrieTreeService\DictionaryService.UnitTest\Data\panguDict.dct" type="BluePrint.Dictionary.Providers.PanguDictProvider, BluePrint.Dictionary.Providers" />
provider name="IKdict" uri="F:\Dropbox\research\NLP\TrieTreeService\DictionaryService.UnitTest\Data\IKdict.dic" type="BluePrint.Dictionary.Providers.TxtFileProvider, BluePrint.Dictionary.Providers"/>
/dictionaryService>

上面這個配置選擇了2個加載器,分別是PanguDictProvider、TxtFileProvider(純文本格式加載器,你可以理解為.csv字典加載器),這里的TxtFileProvider是用來加載IKAnalyzer中的IKdict.dic文件的。在服務啟動后(調試模式)你會看到類似的提示:

TrieTree中由于使用了log4net的ColoredConsoleAppender,所以能夠顯示不同顏色的提示信息。你會看到日志中有pangu_dict和IKdict的加載時間,這里的名字是由app.config中的provider的name屬性設置的。其實TrieTree也是支持加載基于MongoDB的字典的,只是由于牽扯到相對復雜的MongoDB的配置和一些概念,就不在本文中講解了,我會考慮在之后的教程中提供。

DictionaryService組件是TrieTree服務的容器組件,主要包含了Windows服務的實現(xiàn),還有Windows服務的安裝器。這個組件是一個控制臺程序,它為用戶提供了兩種運行模式——調試模式和Service模式。調試模式就是直接運行控制臺,提供基于log4net的日志信息,方便調試和斷點;而Service模式是直接運行為一個Windows服務,主要用于測試與生產環(huán)境。由于是控制臺程序,切換模式是通過參數(shù)完成的,例如-i 表示安裝windows服務,-u表示卸載windows服務, -c表示啟動控制臺模式。

以上便是TrieTree服務的三大核心組件,但我還打算介紹一個非常實用的附加組件DictionaryQuery。

雖然名字也叫查詢分析器,但其實和SQL的查詢分析器不是一個級別的,你不用去比較,沒啥意思。這東西主要是兩個作用,第一,測試TrieTree服務的運行情況;第二,檢查加載字典后字典中的詞的狀態(tài)。你也可以用右側的POS過濾器進行篩選,多選表示或的關系,比如你選擇了地名和人名,你搜索“上?!?,結果是“上海, 頻率:251, 類型:地名(A_NS)”,如果找不到的話會顯示紅色的“未找到合適詞”,如下所示。

你還可以選擇匹配的方式,即最大正向匹配、最大反向匹配和完全匹配,這個就不用我多解釋了吧。對了,運行這玩意之前字典服務必須打開,且你要指向你配置的TrieTree服務的端口,默認是7010,圖中配置的是dict://127.0.0.1:7010,注意字典服務的URI是以dict://開頭的。

您可能感興趣的文章:
  • Java中實現(xiàn)雙數(shù)組Trie樹實例
  • Python Trie樹實現(xiàn)字典排序
  • C# TrieTree介紹及實現(xiàn)方法
  • Trie樹_字典樹(字符串排序)簡介及實現(xiàn)
  • 詳解字典樹Trie結構及其Python代碼實現(xiàn)
  • Trie樹(字典樹)的介紹及Java實現(xiàn)

標簽:運城 克拉瑪依 呼倫貝爾 洛陽 阿里 綏化 潛江 西藏

巨人網絡通訊聲明:本文標題《TrieTree服務-組件構成及其作用介紹》,本文關鍵詞  TrieTree,服務,組件,構成,;如發(fā)現(xiàn)本文內容存在版權問題,煩請?zhí)峁┫嚓P信息告之我們,我們將及時溝通與處理。本站內容系統(tǒng)采集于網絡,涉及言論、版權與本站無關。
  • 相關文章
  • 下面列出與本文章《TrieTree服務-組件構成及其作用介紹》相關的同類信息!
  • 本頁收集關于TrieTree服務-組件構成及其作用介紹的相關信息資訊供網民參考!
  • 推薦文章
    浠水县| 峨眉山市| 治县。| 德惠市| 尉犁县| 庆云县| 平乡县| 平南县| 晋中市| 炎陵县| 汽车| 长汀县| 历史| 昔阳县| 丽水市| 罗甸县| 南华县| 景东| 怀集县| 长沙市| 开阳县| 罗甸县| 台湾省| 张家口市| 巴彦淖尔市| 雷山县| 宜都市| 灵山县| 沁源县| 沧源| 光山县| 香河县| 乡城县| 宜昌市| 左云县| 东兴市| 沂水县| 靖州| 元江| 宣武区| 乌拉特后旗|