国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      一種數(shù)據(jù)處理方法及搜索服務(wù)器、同步服務(wù)器的制造方法

      文檔序號(hào):10655364閱讀:551來(lái)源:國(guó)知局
      一種數(shù)據(jù)處理方法及搜索服務(wù)器、同步服務(wù)器的制造方法
      【專利摘要】本發(fā)明實(shí)施例公開了一種數(shù)據(jù)處理方法,包括:搜索服務(wù)器接收同步服務(wù)器發(fā)送的詞庫(kù)文件更新信息;所述詞庫(kù)文件更新信息是所述同步服務(wù)器在確定出存在待更新狀態(tài)的待更新詞庫(kù)文件后而生成的;所述搜索服務(wù)器根據(jù)所述詞庫(kù)文件更新信息,向所述同步服務(wù)器獲取所述待更新詞庫(kù)文件所對(duì)應(yīng)的位置信息;所述搜索服務(wù)器根據(jù)所述待更新詞庫(kù)文件的位置信息,向詞庫(kù)文件數(shù)據(jù)庫(kù)讀取所述待更新詞庫(kù)文件,以更新所述搜索服務(wù)器所對(duì)應(yīng)的詞庫(kù)文件。本發(fā)明實(shí)施例同時(shí)還公開了一種搜索服務(wù)器和同步服務(wù)器。
      【專利說(shuō)明】
      一種數(shù)據(jù)處理方法及搜索服務(wù)器、同步服務(wù)器
      技術(shù)領(lǐng)域
      [0001]本發(fā)明涉及數(shù)據(jù)處理技術(shù),尤其涉及一種數(shù)據(jù)處理方法及搜索服務(wù)器、同步服務(wù)器。
      【背景技術(shù)】
      [0002]現(xiàn)有分詞器如mmSeg4j的詞庫(kù)文件通常會(huì)保存在搜索服務(wù)器本地,應(yīng)用商店通過(guò)搜索服務(wù)器進(jìn)行搜索,所以,搜索服務(wù)器需要及時(shí)更新自身的詞庫(kù)文件;但是,現(xiàn)有搜索服務(wù)器常為分布式集群,因此,應(yīng)用商店均會(huì)通過(guò)安全文件傳送協(xié)議(SFTP,Secure FileTransfer Protocol),或者文件傳輸協(xié)議(FTP,F(xiàn)ile Transfer Protocol)等類似的協(xié)議將更新指令發(fā)送至分布式集群所對(duì)應(yīng)的多個(gè)搜索服務(wù)器,調(diào)用每個(gè)搜索服務(wù)器的更新接口,重載詞庫(kù)文件,以使新的詞庫(kù)文件生效;這樣,由于每個(gè)搜索服務(wù)器都有與自身對(duì)應(yīng)的一份詞庫(kù)文件,所以會(huì)造成詞庫(kù)文件不一致的問題,進(jìn)而導(dǎo)致每個(gè)搜索服務(wù)器的分詞效果不同。因此,亟需一種方法以至少解決上述問題。

      【發(fā)明內(nèi)容】

      [0003]有鑒于此,本發(fā)明實(shí)施例提供了一種數(shù)據(jù)處理方法及搜索服務(wù)器、同步服務(wù)器,能夠至少解決現(xiàn)有技術(shù)中所存在的問題。
      [0004]本發(fā)明實(shí)施例的技術(shù)方案是這樣實(shí)現(xiàn)的:
      [0005]本發(fā)明實(shí)施例第一方面提供了一種數(shù)據(jù)處理方法,包括:
      [0006]搜索服務(wù)器接收同步服務(wù)器發(fā)送的詞庫(kù)文件更新信息;所述詞庫(kù)文件更新信息是所述同步服務(wù)器在確定出存在待更新狀態(tài)的待更新詞庫(kù)文件后而生成的;
      [0007]所述搜索服務(wù)器根據(jù)所述詞庫(kù)文件更新信息,向所述同步服務(wù)器獲取所述待更新詞庫(kù)文件所對(duì)應(yīng)的位置信息;
      [0008]所述搜索服務(wù)器根據(jù)所述待更新詞庫(kù)文件的位置信息,向詞庫(kù)文件數(shù)據(jù)庫(kù)讀取所述待更新詞庫(kù)文件,以更新所述搜索服務(wù)器所對(duì)應(yīng)的詞庫(kù)文件。
      [0009]上述方案中,所述方法還包括:
      [0010]所述搜索服務(wù)器基于更新后的自身對(duì)應(yīng)的詞庫(kù)文件重建索引列表;
      [0011]將重建的索引列表替換未更新前的索引列表。
      [0012]上述方案中,所述方法還包括:
      [0013]所述搜索服務(wù)器更新完成自身對(duì)應(yīng)的詞庫(kù)文件后,向所述同步服務(wù)器發(fā)送更新響應(yīng)信息;其中,所述更新響應(yīng)信息用于控制所述同步服務(wù)器修改所述待更新詞庫(kù)文件所對(duì)應(yīng)的狀態(tài),以將所述待更新詞庫(kù)文件的狀態(tài)從待更新狀態(tài)修改至更新完成狀態(tài)。
      [0014]本發(fā)明實(shí)施例第二方面提供了一種數(shù)據(jù)處理方法,包括:
      [0015]同步服務(wù)器檢測(cè)自身存儲(chǔ)的與詞庫(kù)文件數(shù)據(jù)庫(kù)對(duì)應(yīng)的至少一個(gè)詞庫(kù)文件的狀態(tài)是否處于待更新狀態(tài);
      [0016]當(dāng)確定出自身存儲(chǔ)的與詞庫(kù)文件數(shù)據(jù)庫(kù)對(duì)應(yīng)的至少一個(gè)詞庫(kù)文件處于待更新狀態(tài)時(shí),所述同步服務(wù)器將處于待更新狀態(tài)的至少一個(gè)詞庫(kù)文件作為待更新詞庫(kù)文件,生成與所述待更新詞庫(kù)文件對(duì)應(yīng)的詞庫(kù)文件更新信息;
      [0017]所述同步服務(wù)器將所述詞庫(kù)文件更新信息發(fā)送至搜索服務(wù)器。
      [0018]上述方案中,所述方法還包括:
      [0019]所述同步服務(wù)器獲取所述詞庫(kù)文件數(shù)據(jù)庫(kù)對(duì)應(yīng)的至少一個(gè)詞庫(kù)文件的狀態(tài)以及位置信息,并存儲(chǔ)所述詞庫(kù)文件數(shù)據(jù)庫(kù)對(duì)應(yīng)的至少一個(gè)詞庫(kù)文件的狀態(tài)以及位置信息;其中,所述狀態(tài)至少包括待更新狀態(tài)和更新完成狀態(tài)。
      [0020]上述方案中,所述方法還包括:
      [0021 ]所述同步服務(wù)器接收所述搜索服務(wù)器發(fā)送的更新響應(yīng)信息;
      [0022]所述同步服務(wù)器根據(jù)所述更新響應(yīng)信息,修改與所述更新響應(yīng)信息所對(duì)應(yīng)的待更新詞庫(kù)文件的狀態(tài),以將所述更新響應(yīng)信息所對(duì)應(yīng)的待更新詞庫(kù)文件的狀態(tài)從待更新狀態(tài)修改至更新完成狀態(tài)。
      [0023 ]本發(fā)明實(shí)施例第三方面提供了一種搜索服務(wù)器,包括:
      [0024]第一信息接收單元,用于接收同步服務(wù)器發(fā)送的詞庫(kù)文件更新信息;所述詞庫(kù)文件更新信息是所述同步服務(wù)器在確定出存在待更新狀態(tài)的待更新詞庫(kù)文件后而生成的;
      [0025]信息獲取單元,用于根據(jù)所述詞庫(kù)文件更新信息,向所述同步服務(wù)器獲取所述待更新詞庫(kù)文件所對(duì)應(yīng)的位置信息;
      [0026]數(shù)據(jù)更新單元,用于根據(jù)所述待更新詞庫(kù)文件的位置信息,向詞庫(kù)文件數(shù)據(jù)庫(kù)讀取所述待更新詞庫(kù)文件,以更新所述搜索服務(wù)器所對(duì)應(yīng)的詞庫(kù)文件。
      [0027]上述方案中,所述數(shù)據(jù)更新單元,還用于基于更新后的自身對(duì)應(yīng)的詞庫(kù)文件重建索引列表;將重建的索引列表替換未更新前的索引列表。
      [0028]上述方案中,所述搜索服務(wù)器還包括:
      [0029]第一信息發(fā)送單元,用于更新完成自身對(duì)應(yīng)的詞庫(kù)文件后,向所述同步服務(wù)器發(fā)送更新響應(yīng)信息;其中,所述更新響應(yīng)信息用于控制所述同步服務(wù)器修改所述待更新詞庫(kù)文件所對(duì)應(yīng)的狀態(tài),以將所述待更新詞庫(kù)文件的狀態(tài)從待更新狀態(tài)修改至更新完成狀態(tài)。
      [0030]本發(fā)明實(shí)施例第四方面提供了一種同步服務(wù)器,包括:
      [0031 ]檢測(cè)單元,用于檢測(cè)自身存儲(chǔ)的與詞庫(kù)文件數(shù)據(jù)庫(kù)對(duì)應(yīng)的至少一個(gè)詞庫(kù)文件的狀態(tài)是否處于待更新狀態(tài);
      [0032]信息生成單元,用于當(dāng)確定出自身存儲(chǔ)的與詞庫(kù)文件數(shù)據(jù)庫(kù)對(duì)應(yīng)的至少一個(gè)詞庫(kù)文件處于待更新狀態(tài)時(shí),所述同步服務(wù)器將處于待更新狀態(tài)的至少一個(gè)詞庫(kù)文件作為待更新詞庫(kù)文件,生成與所述待更新詞庫(kù)文件對(duì)應(yīng)的詞庫(kù)文件更新信息;
      [0033]第二信息發(fā)送單元,用于將所述詞庫(kù)文件更新信息發(fā)送至搜索服務(wù)器。
      [0034]上述方案中,所述同步服務(wù)器還包括:
      [0035]存儲(chǔ)單元,用于獲取所述詞庫(kù)文件數(shù)據(jù)庫(kù)對(duì)應(yīng)的至少一個(gè)詞庫(kù)文件的狀態(tài)以及位置信息,并存儲(chǔ)所述詞庫(kù)文件數(shù)據(jù)庫(kù)對(duì)應(yīng)的至少一個(gè)詞庫(kù)文件的狀態(tài)以及位置信息;其中,所述狀態(tài)至少包括待更新狀態(tài)和更新完成狀態(tài)。
      [0036]上述方案中,所述同步服務(wù)器還包括:
      [0037]第二信息接收單元,用于接收所述搜索服務(wù)器發(fā)送的更新響應(yīng)信息;
      [0038]信息調(diào)整單元,用于根據(jù)所述更新響應(yīng)信息,修改與所述更新響應(yīng)信息所對(duì)應(yīng)的待更新詞庫(kù)文件的狀態(tài),以將所述更新響應(yīng)信息所對(duì)應(yīng)的待更新詞庫(kù)文件的狀態(tài)從待更新狀態(tài)修改至更新完成狀態(tài)。
      [0039]本發(fā)明實(shí)施例所述的數(shù)據(jù)處理方法及搜索服務(wù)器、同步服務(wù)器,通過(guò)搜索服務(wù)器接收同步服務(wù)器發(fā)送的詞庫(kù)文件更新信息,根據(jù)所述詞庫(kù)文件更新信息,向所述同步服務(wù)器獲取所述待更新詞庫(kù)文件所對(duì)應(yīng)的位置信息,根據(jù)所述待更新詞庫(kù)文件的位置信息,向詞庫(kù)文件數(shù)據(jù)庫(kù)讀取所述待更新詞庫(kù)文件,如此,更新所述搜索服務(wù)器所對(duì)應(yīng)的詞庫(kù)文件;這樣,由于本發(fā)明實(shí)施例所述的方法中,所有詞庫(kù)文件均統(tǒng)一存儲(chǔ)至詞庫(kù)文件數(shù)據(jù)庫(kù)中,所以,確保了不同搜索服務(wù)器所獲取到的詞庫(kù)文件的一致性,進(jìn)而避免了詞庫(kù)文件不一致而導(dǎo)致的分詞效果不一致的問題。
      【附圖說(shuō)明】
      [0040]圖1為本發(fā)明實(shí)施例一數(shù)據(jù)處理方法所涉及到的各實(shí)體之間連接關(guān)系示意圖;
      [0041 ]圖2為本發(fā)明實(shí)施例一數(shù)據(jù)處理方法的實(shí)現(xiàn)流程示意圖;
      [0042]圖3為本發(fā)明實(shí)施例數(shù)據(jù)處理方法的具體應(yīng)用示意圖一;
      [0043]圖4為本發(fā)明實(shí)施例配置服務(wù)器所對(duì)應(yīng)的配置界面示意圖;
      [0044]圖5為本發(fā)明實(shí)施例數(shù)據(jù)處理方法的具體應(yīng)用示意圖二;
      [0045]圖6為本發(fā)明實(shí)施例搜索服務(wù)器的具體結(jié)構(gòu)示意圖;
      [0046]圖7為本發(fā)明實(shí)施例同步服務(wù)器的具體結(jié)構(gòu)示意圖。
      【具體實(shí)施方式】
      [0047]應(yīng)當(dāng)理解,此處所描述的具體實(shí)施例僅僅用以解釋本發(fā)明的技術(shù)方案,并不用于限定本發(fā)明的保護(hù)范圍。
      [0048]實(shí)施例一
      [0049]本發(fā)明實(shí)施例提供了一種數(shù)據(jù)處理方法;這里,如圖1所示,為解決現(xiàn)有搜索服務(wù)器集群中多個(gè)搜索服務(wù)器詞庫(kù)文件不一致而導(dǎo)致的分詞效果不一致的問題,本發(fā)明實(shí)施例引入了分布式文件系統(tǒng)(如詞庫(kù)文件數(shù)據(jù)庫(kù)),以及同步系統(tǒng)(如同步服務(wù)器)對(duì)現(xiàn)有搜索服務(wù)器更新自身對(duì)應(yīng)的詞庫(kù)文件的方式進(jìn)行優(yōu)化;具體地,所述分布式文件系統(tǒng),也即詞庫(kù)文件數(shù)據(jù)庫(kù),用于存儲(chǔ)所有搜索服務(wù)器對(duì)應(yīng)的所有詞庫(kù)文件,并統(tǒng)一對(duì)詞庫(kù)文件進(jìn)行管理,例如將所有詞庫(kù)文件統(tǒng)一存儲(chǔ)至分布式存儲(chǔ)系統(tǒng)hbase,并對(duì)所有詞庫(kù)文件進(jìn)行統(tǒng)一管理(如通過(guò)分布式存儲(chǔ)系統(tǒng)hbase對(duì)詞庫(kù)文件進(jìn)行增、刪、改、查)。所述同步系統(tǒng),也即同步服務(wù)器,用于獲取詞庫(kù)文件數(shù)據(jù)庫(kù)所對(duì)應(yīng)的所有詞庫(kù)文件的狀態(tài)和位置信息;例如,利用分布式應(yīng)用程序協(xié)調(diào)服務(wù)zookeeper保存所有詞庫(kù)文件的狀態(tài)和位置信息;其中,所述位置信息表征詞庫(kù)文件在詞庫(kù)文件數(shù)據(jù)庫(kù)中所對(duì)應(yīng)的位置。
      [0050]這樣,由于將所有詞庫(kù)文件統(tǒng)一存儲(chǔ)至詞庫(kù)文件數(shù)據(jù)庫(kù),所以,確保了不同搜索服務(wù)器所獲取到的詞庫(kù)文件的一致性,進(jìn)而避免了詞庫(kù)文件不一致而導(dǎo)致的分詞效果不一致的問題。
      [0051]在實(shí)際應(yīng)用中,為便于對(duì)詞庫(kù)文件數(shù)據(jù)庫(kù)中的詞庫(kù)文件的增、刪、改等操作,還可以設(shè)置配置服務(wù)器,進(jìn)而通過(guò)配置服務(wù)器對(duì)詞庫(kù)文件數(shù)據(jù)庫(kù)中的詞庫(kù)文件進(jìn)行增刪改操作;進(jìn)一步地,當(dāng)配置服務(wù)器對(duì)詞庫(kù)文件數(shù)據(jù)庫(kù)中的詞庫(kù)文件進(jìn)行增刪改操作后,還可以觸發(fā)所述同步服務(wù)器,如觸發(fā)所述同步服務(wù)器中的zookeeper,以修改增刪改操作所對(duì)應(yīng)的詞庫(kù)文件在所述同步服務(wù)器中的狀態(tài)。
      [0052]具體地,圖2為本發(fā)明實(shí)施例一數(shù)據(jù)處理方法的實(shí)現(xiàn)流程示意圖;如圖2所示,所述方法包括:
      [0053]步驟201:搜索服務(wù)器接收同步服務(wù)器發(fā)送的詞庫(kù)文件更新信息;所述詞庫(kù)文件更新信息是所述同步服務(wù)器在確定出存在待更新狀態(tài)的待更新詞庫(kù)文件后而生成的;
      [0054]在一實(shí)施例中,所述同步服務(wù)器檢測(cè)自身存儲(chǔ)的與詞庫(kù)文件數(shù)據(jù)庫(kù)對(duì)應(yīng)的至少一個(gè)詞庫(kù)文件的狀態(tài)是否處于待更新狀態(tài);例如,所述同步服務(wù)器中設(shè)置zookeeper,通過(guò)zookeeper定時(shí)掃描自身存儲(chǔ)的詞庫(kù)文件的狀態(tài),并根據(jù)詞庫(kù)文件的狀態(tài)修改詞庫(kù)文件的路徑(也即以下所述的位置信息),同時(shí)存儲(chǔ)修改后的詞庫(kù)文件的路徑;進(jìn)一步地,當(dāng)確定出自身存儲(chǔ)的與詞庫(kù)文件數(shù)據(jù)庫(kù)對(duì)應(yīng)的至少一個(gè)詞庫(kù)文件處于待更新狀態(tài)時(shí),所述同步服務(wù)器將處于待更新狀態(tài)的至少一個(gè)詞庫(kù)文件作為待更新詞庫(kù)文件,生成與所述待更新詞庫(kù)文件對(duì)應(yīng)的詞庫(kù)文件更新信息,并將所述詞庫(kù)文件更新信息發(fā)送至搜索服務(wù)器,以便于觸發(fā)所述搜索服務(wù)器執(zhí)行詞庫(kù)文件更新流程。
      [0055]在實(shí)際應(yīng)用中,所述同步服務(wù)器獲取所述詞庫(kù)文件數(shù)據(jù)庫(kù)對(duì)應(yīng)的至少一個(gè)詞庫(kù)文件的狀態(tài)以及位置信息,并存儲(chǔ)所述詞庫(kù)文件數(shù)據(jù)庫(kù)對(duì)應(yīng)的至少一個(gè)詞庫(kù)文件的狀態(tài)以及位置信息;其中,所述狀態(tài)至少包括待更新狀態(tài)和更新完成狀態(tài);也就是說(shuō),所述同步服務(wù)器存儲(chǔ)詞庫(kù)文件數(shù)據(jù)庫(kù)中的所有詞庫(kù)文件的狀態(tài)以及地址,這樣,通過(guò)所述同步服務(wù)器去檢測(cè)詞庫(kù)文件的狀態(tài)是否發(fā)生了變化,是否需要觸發(fā)搜索服務(wù)器去執(zhí)行詞庫(kù)文件的更新流程,因此,與現(xiàn)有應(yīng)用商店通過(guò)SFTP或FTP等協(xié)議去觸發(fā)搜索服務(wù)器執(zhí)行詞庫(kù)文件更新流程的方式相比,本發(fā)明實(shí)施例通過(guò)同步服務(wù)器去觸發(fā)搜索服務(wù)器的更新流程,避免了使用SFTP或FTP等協(xié)議,進(jìn)而避免了保存搜索服務(wù)器的賬號(hào)密碼,減少了被攻擊的危險(xiǎn)。而且,由于本發(fā)明實(shí)施例所述的同步服務(wù)器能夠定時(shí)地、主動(dòng)去觸發(fā)自身檢測(cè)詞庫(kù)文件的狀態(tài)是否存在更新,進(jìn)而主動(dòng)去觸發(fā)搜索服務(wù)器進(jìn)行詞庫(kù)文件的更新,所以,本發(fā)明實(shí)施例實(shí)現(xiàn)了自動(dòng)感知詞庫(kù)文件的變化,自動(dòng)加載詞庫(kù)文件的目的。
      [0056]進(jìn)一步地,當(dāng)通過(guò)配置服務(wù)器對(duì)詞庫(kù)文件數(shù)據(jù)庫(kù)中的詞庫(kù)文件進(jìn)行增刪改操作時(shí),所述配置服務(wù)器增刪改操作結(jié)束后,還可以直接去觸發(fā)同步服務(wù)器,告知同步服務(wù)器存在詞庫(kù)文件需要更新,此時(shí),所述同步服務(wù)器修改需要更新的詞庫(kù)文件的狀態(tài),并修改為待更新狀態(tài);進(jìn)一步地,所述同步服務(wù)器可以立即去觸發(fā)所述搜索服務(wù)器執(zhí)行詞庫(kù)文件的更新過(guò)程,或者,待定時(shí)時(shí)間到達(dá)后,再去觸發(fā)所述搜索服務(wù)器執(zhí)行詞庫(kù)文件的更新過(guò)程,在實(shí)際應(yīng)用中,可以根據(jù)實(shí)際需求去選取觸發(fā)機(jī)制。
      [0057]步驟202:所述搜索服務(wù)器根據(jù)所述詞庫(kù)文件更新信息,向所述同步服務(wù)器獲取所述待更新詞庫(kù)文件所對(duì)應(yīng)的位置信息;
      [0058]步驟203:所述搜索服務(wù)器根據(jù)所述待更新詞庫(kù)文件的位置信息,向詞庫(kù)文件數(shù)據(jù)庫(kù)讀取所述待更新詞庫(kù)文件,以更新所述搜索服務(wù)器所對(duì)應(yīng)的詞庫(kù)文件。
      [0059]本實(shí)施例中,所述搜索服務(wù)器接收到所述同步服務(wù)器發(fā)送的詞庫(kù)文件更新信息后,向所述同步服務(wù)器去獲取待更新詞庫(kù)文件所對(duì)應(yīng)的位置信息,進(jìn)而基于位置信息,向所述詞庫(kù)文件數(shù)據(jù)庫(kù)去讀取所述待更新詞庫(kù)文件,進(jìn)而,實(shí)現(xiàn)詞庫(kù)文件的更新過(guò)程。
      [0060]這里,值得注意的是,在實(shí)際應(yīng)用中,所述同步服務(wù)器、配置服務(wù)器、搜索服務(wù)器可以具體為一臺(tái)服務(wù)器,也可以具體為服務(wù)器集群,在實(shí)際應(yīng)用中,可以根據(jù)實(shí)際數(shù)據(jù)規(guī)模而選擇。
      [0061]本發(fā)明實(shí)施例所述的方法,通過(guò)搜索服務(wù)器接收同步服務(wù)器發(fā)送的詞庫(kù)文件更新信息,根據(jù)所述詞庫(kù)文件更新信息,向所述同步服務(wù)器獲取所述待更新詞庫(kù)文件所對(duì)應(yīng)的位置信息,根據(jù)所述待更新詞庫(kù)文件的位置信息,向詞庫(kù)文件數(shù)據(jù)庫(kù)讀取所述待更新詞庫(kù)文件,如此,更新所述搜索服務(wù)器所對(duì)應(yīng)的詞庫(kù)文件;這樣,由于本發(fā)明實(shí)施例所述的方法中,所有詞庫(kù)文件均統(tǒng)一存儲(chǔ)至詞庫(kù)文件數(shù)據(jù)庫(kù)中,所以,確保了不同搜索服務(wù)器所獲取到的詞庫(kù)文件的一致性,進(jìn)而避免了詞庫(kù)文件不一致而導(dǎo)致的分詞效果不一致的問題。
      [0062]實(shí)施例二
      [0063]基于實(shí)施例一所述的方法,本實(shí)施例中,當(dāng)所述搜索服務(wù)器更新完成詞庫(kù)文件后,所述搜索服務(wù)器還基于更新后的自身對(duì)應(yīng)的詞庫(kù)文件重建索引列表,進(jìn)而將重建的索引列表替換未更新前的索引列表。具體地,所述搜索服務(wù)器更新完成詞庫(kù)文件后,根據(jù)更新后的詞庫(kù)文件重建索引、并將新建立的索引替換舊索引,進(jìn)而刪除舊索引,這樣,便于應(yīng)用商店根據(jù)最新的索引去獲取最新的詞庫(kù)文件。
      [0064]實(shí)施例三
      [0065]基于實(shí)施例一或?qū)嵤├龅姆椒?,為便于所述同步服?wù)器檢測(cè)到的詞庫(kù)文件的狀態(tài)為最新狀態(tài),所述搜索服務(wù)器更新完成自身對(duì)應(yīng)的詞庫(kù)文件后,向所述同步服務(wù)器發(fā)送更新響應(yīng)信息;其中,所述更新響應(yīng)信息用于控制所述同步服務(wù)器修改所述待更新詞庫(kù)文件所對(duì)應(yīng)的狀態(tài),以將所述待更新詞庫(kù)文件的狀態(tài)從待更新狀態(tài)修改至更新完成狀
      ??τ O
      [0066]對(duì)應(yīng)地,所述同步服務(wù)器接收所述搜索服務(wù)器發(fā)送的更新響應(yīng)信息;
      [0067]所述同步服務(wù)器根據(jù)所述更新響應(yīng)信息,修改與所述更新響應(yīng)信息所對(duì)應(yīng)的待更新詞庫(kù)文件的狀態(tài),以將所述更新響應(yīng)信息所對(duì)應(yīng)的待更新詞庫(kù)文件的狀態(tài)從待更新狀態(tài)修改至更新完成狀態(tài)。
      [0068]在一具體實(shí)施例中,當(dāng)所述搜索服務(wù)器更新完成詞庫(kù)文件后,將表征更新完畢的更新響應(yīng)信息發(fā)送至同步服務(wù)器,以便于所述同步服務(wù)器根據(jù)所述更新響應(yīng)信息修改與所述更新響應(yīng)信息所對(duì)應(yīng)的待更新詞庫(kù)文件的狀態(tài);同時(shí),所述同步服務(wù)器告知配置服務(wù)器更新完畢的結(jié)果,進(jìn)而通過(guò)配置服務(wù)器告知用戶更新完成。
      [0069]這樣,本發(fā)明實(shí)施例所述的方法通過(guò)引入詞庫(kù)文件數(shù)據(jù)庫(kù),將所有詞庫(kù)文件統(tǒng)一存儲(chǔ)至詞庫(kù)文件數(shù)據(jù)庫(kù),進(jìn)而確保了不同搜索服務(wù)器所獲取到的詞庫(kù)文件的一致性,避免了詞庫(kù)文件不一致而導(dǎo)致的分詞效果不一致的問題。
      [0070]而且,本發(fā)明實(shí)施例所述的方法通過(guò)同步服務(wù)器去觸發(fā)搜索服務(wù)器執(zhí)行詞庫(kù)文件的更新流程,所以,與現(xiàn)有應(yīng)用商店通過(guò)SFTP或FTP等協(xié)議去觸發(fā)搜索服務(wù)器執(zhí)行詞庫(kù)文件更新流程的方式相比,本發(fā)明實(shí)施例避免了使用SFTP或FTP等協(xié)議,進(jìn)而避免了保存搜索服務(wù)器的賬號(hào)密碼,減少了被攻擊的危險(xiǎn)。
      [0071]同時(shí),本發(fā)明實(shí)施例所述的方法,能夠通過(guò)同步服務(wù)器去自動(dòng)感知詞庫(kù)文件的變化,進(jìn)而了實(shí)現(xiàn)自動(dòng)加載詞庫(kù)文件的目的。
      [0072]以下通過(guò)具體應(yīng)用場(chǎng)景對(duì)本發(fā)明實(shí)施例做進(jìn)一步詳細(xì)說(shuō)明:
      [0073]應(yīng)用場(chǎng)景一:如圖3所示,
      [0074]配置服務(wù)器讀取分布式文件系統(tǒng)hbase的詞庫(kù)文件中目標(biāo)詞,并展示配置人員;
      [0075]配置服務(wù)器接收配置人員的相關(guān)操作,對(duì)目標(biāo)詞進(jìn)行增刪改查操作;例如,配置人員通過(guò)如圖4所示的配置界面對(duì)目標(biāo)詞進(jìn)行增刪改查操作;
      [0076]配置服務(wù)器確定增刪改查操作結(jié)束后,觸發(fā)同步服務(wù)器更新所述目標(biāo)詞的狀態(tài),以將所述目標(biāo)詞的狀態(tài)從更新完成狀態(tài)調(diào)整至待更新狀態(tài),進(jìn)而便于所述同步服務(wù)器去觸發(fā)所述搜索服務(wù)器更新詞庫(kù)文件。
      [0077]應(yīng)用場(chǎng)景二:如圖5所示,
      [0078]同步服務(wù)器初始化zookeeper配置、hbase配置以及搜索服務(wù)器配置;
      [0079]所述同步服務(wù)器實(shí)時(shí)或定時(shí)檢測(cè)自身存儲(chǔ)的詞庫(kù)文件的狀態(tài);如檢測(cè)是否存在處于待更新狀態(tài)的詞庫(kù)文件;
      [0080]確定存在處于待更新狀態(tài)的詞庫(kù)文件時(shí),調(diào)用搜索服務(wù)器中更新接口,以使所述搜索服務(wù)器通過(guò)更新接口向詞庫(kù)文件數(shù)據(jù)庫(kù)去獲取待更新狀態(tài)所對(duì)應(yīng)的詞庫(kù)文件,以更新詞庫(kù)文件,并生成詞典;
      [0081]所述搜索服務(wù)器中詞庫(kù)文件更新后,根據(jù)更新后的詞庫(kù)文件新建一索引,待索引建立完成后,切換索引,以使用新的索引,刪除舊索引。
      [0082]實(shí)施例四
      [0083]本發(fā)明實(shí)施例還提供了一種搜索服務(wù)器,如圖6所示,所述搜索服務(wù)器包括:
      [0084]第一信息接收單元61,用于接收同步服務(wù)器發(fā)送的詞庫(kù)文件更新信息;所述詞庫(kù)文件更新信息是所述同步服務(wù)器在確定出存在待更新狀態(tài)的待更新詞庫(kù)文件后而生成的;
      [0085]信息獲取單元62,用于根據(jù)所述詞庫(kù)文件更新信息,向所述同步服務(wù)器獲取所述待更新詞庫(kù)文件所對(duì)應(yīng)的位置信息;
      [0086]數(shù)據(jù)更新單元63,用于根據(jù)所述待更新詞庫(kù)文件的位置信息,向詞庫(kù)文件數(shù)據(jù)庫(kù)讀取所述待更新詞庫(kù)文件,以更新所述搜索服務(wù)器所對(duì)應(yīng)的詞庫(kù)文件。
      [0087]在一實(shí)施例中,所述數(shù)據(jù)更新單元,還用于基于更新后的自身對(duì)應(yīng)的詞庫(kù)文件重建索引列表;將重建的索引列表替換未更新前的索引列表。
      [0088]在另一實(shí)施例中,所述搜索服務(wù)器還包括:
      [0089]第一信息發(fā)送單元,用于更新完成自身對(duì)應(yīng)的詞庫(kù)文件后,向所述同步服務(wù)器發(fā)送更新響應(yīng)信息;其中,所述更新響應(yīng)信息用于控制所述同步服務(wù)器修改所述待更新詞庫(kù)文件所對(duì)應(yīng)的狀態(tài),以將所述待更新詞庫(kù)文件的狀態(tài)從待更新狀態(tài)修改至更新完成狀態(tài)。
      [0090]本發(fā)明實(shí)施例還提供了一種同步服務(wù)器,如圖7所示,所述同步服務(wù)器包括:
      [0091 ]檢測(cè)單元71,用于檢測(cè)自身存儲(chǔ)的與詞庫(kù)文件數(shù)據(jù)庫(kù)對(duì)應(yīng)的至少一個(gè)詞庫(kù)文件的狀態(tài)是否處于待更新狀態(tài);
      [0092]信息生成單元72,用于當(dāng)確定出自身存儲(chǔ)的與詞庫(kù)文件數(shù)據(jù)庫(kù)對(duì)應(yīng)的至少一個(gè)詞庫(kù)文件處于待更新狀態(tài)時(shí),所述同步服務(wù)器將處于待更新狀態(tài)的至少一個(gè)詞庫(kù)文件作為待更新詞庫(kù)文件,生成與所述待更新詞庫(kù)文件對(duì)應(yīng)的詞庫(kù)文件更新信息;
      [0093]第二信息發(fā)送單元73,用于將所述詞庫(kù)文件更新信息發(fā)送至搜索服務(wù)器。
      [0094]在一實(shí)施例中,所述同步服務(wù)器還包括:
      [0095]存儲(chǔ)單元,用于獲取所述詞庫(kù)文件數(shù)據(jù)庫(kù)對(duì)應(yīng)的至少一個(gè)詞庫(kù)文件的狀態(tài)以及位置信息,并存儲(chǔ)所述詞庫(kù)文件數(shù)據(jù)庫(kù)對(duì)應(yīng)的至少一個(gè)詞庫(kù)文件的狀態(tài)以及位置信息;其中,所述狀態(tài)至少包括待更新狀態(tài)和更新完成狀態(tài)。
      [0096]在另一實(shí)施例中,所述同步服務(wù)器還包括:
      [0097]第二信息接收單元,用于接收所述搜索服務(wù)器發(fā)送的更新響應(yīng)信息;
      [0098]信息調(diào)整單元,用于根據(jù)所述更新響應(yīng)信息,修改與所述更新響應(yīng)信息所對(duì)應(yīng)的待更新詞庫(kù)文件的狀態(tài),以將所述更新響應(yīng)信息所對(duì)應(yīng)的待更新詞庫(kù)文件的狀態(tài)從待更新狀態(tài)修改至更新完成狀態(tài)。
      [0099]這里需要指出的是:以上服務(wù)器實(shí)施例的描述,與上述方法實(shí)施例的描述是類似的,具有同方法實(shí)施例相似的有益效果,因此不做贅述。對(duì)于本發(fā)明裝置實(shí)施例中未披露的技術(shù)細(xì)節(jié),請(qǐng)參照本發(fā)明方法實(shí)施例的描述而理解,為節(jié)約篇幅,因此不再贅述。
      [0100]應(yīng)理解,說(shuō)明書通篇中提到的“一實(shí)施例”意味著與實(shí)施例有關(guān)的特定特征、結(jié)構(gòu)或特性包括在本發(fā)明的至少一個(gè)實(shí)施例中。因此,在整個(gè)說(shuō)明書各處出現(xiàn)的“在一實(shí)施例中”或“在另一實(shí)施例中”未必一定指相同的實(shí)施例。此外,這些特定的特征、結(jié)構(gòu)或特性可以任意適合的方式結(jié)合在一個(gè)或多個(gè)實(shí)施例中。應(yīng)理解,在本發(fā)明的各種實(shí)施例中,上述各過(guò)程的序號(hào)的大小并不意味著執(zhí)行順序的先后,各過(guò)程的執(zhí)行順序應(yīng)以其功能和內(nèi)在邏輯確定,而不應(yīng)對(duì)本發(fā)明實(shí)施例的實(shí)施過(guò)程構(gòu)成任何限定。上述本發(fā)明實(shí)施例序號(hào)僅僅為了描述,不代表實(shí)施例的優(yōu)劣。
      [0101]需要說(shuō)明的是,在本文中,術(shù)語(yǔ)“包括”、“包含”或者其任何其他變體意在涵蓋非排他性的包含,從而使得包括一系列要素的過(guò)程、方法、物品或者裝置不僅包括那些要素,而且還包括沒有明確列出的其他要素,或者是還包括為這種過(guò)程、方法、物品或者裝置所固有的要素。在沒有更多限制的情況下,由語(yǔ)句“包括一個(gè)……”限定的要素,并不排除在包括該要素的過(guò)程、方法、物品或者裝置中還存在另外的相同要素。
      [0102]在本申請(qǐng)所提供的幾個(gè)實(shí)施例中,應(yīng)該理解到,所揭露的設(shè)備和方法,可以通過(guò)其它的方式實(shí)現(xiàn)。以上所描述的設(shè)備實(shí)施例僅僅是示意性的,例如,所述單元的劃分,僅僅為一種邏輯功能劃分,實(shí)際實(shí)現(xiàn)時(shí)可以有另外的劃分方式,如:多個(gè)單元或組件可以結(jié)合,或可以集成到另一個(gè)系統(tǒng),或一些特征可以忽略,或不執(zhí)行。另外,所顯示或討論的各組成部分相互之間的耦合、或直接耦合、或通信連接可以是通過(guò)一些接口,設(shè)備或單元的間接耦合或通信連接,可以是電性的、機(jī)械的或其它形式的。
      [0103]上述作為分離部件說(shuō)明的單元可以是、或也可以不是物理上分開的,作為單元顯示的部件可以是、或也可以不是物理單元;既可以位于一個(gè)地方,也可以分布到多個(gè)網(wǎng)絡(luò)單元上;可以根據(jù)實(shí)際的需要選擇其中的部分或全部單元來(lái)實(shí)現(xiàn)本實(shí)施例方案的目的。
      [0104]另外,在本發(fā)明各實(shí)施例中的各功能單元可以全部集成在一個(gè)處理單元中,也可以是各單元分別單獨(dú)作為一個(gè)單元,也可以兩個(gè)或兩個(gè)以上單元集成在一個(gè)單元中;上述集成的單元既可以采用硬件的形式實(shí)現(xiàn),也可以采用硬件加軟件功能單元的形式實(shí)現(xiàn)。
      [0105]本領(lǐng)域普通技術(shù)人員可以理解:實(shí)現(xiàn)上述方法實(shí)施例的全部或部分步驟可以通過(guò)程序指令相關(guān)的硬件來(lái)完成,前述的程序可以存儲(chǔ)于計(jì)算機(jī)可讀取存儲(chǔ)介質(zhì)中,該程序在執(zhí)行時(shí),執(zhí)行包括上述方法實(shí)施例的步驟;而前述的存儲(chǔ)介質(zhì)包括:移動(dòng)存儲(chǔ)設(shè)備、只讀存儲(chǔ)器(Read Only Memory,R0M)、磁碟或者光盤等各種可以存儲(chǔ)程序代碼的介質(zhì)。
      [0106]或者,本發(fā)明上述集成的單元如果以軟件功能模塊的形式實(shí)現(xiàn)并作為獨(dú)立的產(chǎn)品銷售或使用時(shí),也可以存儲(chǔ)在一個(gè)計(jì)算機(jī)可讀取存儲(chǔ)介質(zhì)中?;谶@樣的理解,本發(fā)明實(shí)施例的技術(shù)方案本質(zhì)上或者說(shuō)對(duì)現(xiàn)有技術(shù)做出貢獻(xiàn)的部分可以以軟件產(chǎn)品的形式體現(xiàn)出來(lái),該計(jì)算機(jī)軟件產(chǎn)品存儲(chǔ)在一個(gè)存儲(chǔ)介質(zhì)中,包括若干指令用以使得一臺(tái)計(jì)算機(jī)設(shè)備(可以是個(gè)人計(jì)算機(jī)、服務(wù)器、或者網(wǎng)絡(luò)設(shè)備等)執(zhí)行本發(fā)明各個(gè)實(shí)施例所述方法的全部或部分。而前述的存儲(chǔ)介質(zhì)包括:移動(dòng)存儲(chǔ)設(shè)備、ROM、磁碟或者光盤等各種可以存儲(chǔ)程序代碼的介質(zhì)。
      [0107]以上所述,僅為本發(fā)明的【具體實(shí)施方式】,但本發(fā)明的保護(hù)范圍并不局限于此,任何熟悉本技術(shù)領(lǐng)域的技術(shù)人員在本發(fā)明揭露的技術(shù)范圍內(nèi),可輕易想到變化或替換,都應(yīng)涵蓋在本發(fā)明的保護(hù)范圍之內(nèi)。因此,本發(fā)明的保護(hù)范圍應(yīng)以所述權(quán)利要求的保護(hù)范圍為準(zhǔn)。
      【主權(quán)項(xiàng)】
      1.一種搜索服務(wù)器,其特征在于,所述搜索服務(wù)器包括: 第一信息接收單元,用于接收同步服務(wù)器發(fā)送的詞庫(kù)文件更新信息;所述詞庫(kù)文件更新信息是所述同步服務(wù)器在確定出存在待更新狀態(tài)的待更新詞庫(kù)文件后而生成的; 信息獲取單元,用于根據(jù)所述詞庫(kù)文件更新信息,向所述同步服務(wù)器獲取所述待更新詞庫(kù)文件所對(duì)應(yīng)的位置信息; 數(shù)據(jù)更新單元,用于根據(jù)所述待更新詞庫(kù)文件的位置信息,向詞庫(kù)文件數(shù)據(jù)庫(kù)讀取所述待更新詞庫(kù)文件,以更新所述搜索服務(wù)器所對(duì)應(yīng)的詞庫(kù)文件。2.根據(jù)權(quán)利要求1所述的搜索服務(wù)器,其特征在于,所述數(shù)據(jù)更新單元,還用于基于更新后的自身對(duì)應(yīng)的詞庫(kù)文件重建索引列表;將重建的索引列表替換未更新前的索引列表。3.根據(jù)權(quán)利要求1所述的搜索服務(wù)器,其特征在于,所述搜索服務(wù)器還包括: 第一信息發(fā)送單元,用于更新完成自身對(duì)應(yīng)的詞庫(kù)文件后,向所述同步服務(wù)器發(fā)送更新響應(yīng)信息;其中,所述更新響應(yīng)信息用于控制所述同步服務(wù)器修改所述待更新詞庫(kù)文件所對(duì)應(yīng)的狀態(tài),以將所述待更新詞庫(kù)文件的狀態(tài)從待更新狀態(tài)修改至更新完成狀態(tài)。4.一種同步服務(wù)器,其特征在于,所述同步服務(wù)器包括: 檢測(cè)單元,用于檢測(cè)自身存儲(chǔ)的與詞庫(kù)文件數(shù)據(jù)庫(kù)對(duì)應(yīng)的至少一個(gè)詞庫(kù)文件的狀態(tài)是否處于待更新狀態(tài); 信息生成單元,用于當(dāng)確定出自身存儲(chǔ)的與詞庫(kù)文件數(shù)據(jù)庫(kù)對(duì)應(yīng)的至少一個(gè)詞庫(kù)文件處于待更新狀態(tài)時(shí),所述同步服務(wù)器將處于待更新狀態(tài)的至少一個(gè)詞庫(kù)文件作為待更新詞庫(kù)文件,生成與所述待更新詞庫(kù)文件對(duì)應(yīng)的詞庫(kù)文件更新信息; 第二信息發(fā)送單元,用于將所述詞庫(kù)文件更新信息發(fā)送至搜索服務(wù)器。5.根據(jù)權(quán)利要求4所述的同步服務(wù)器,其特征在于,所述同步服務(wù)器還包括: 存儲(chǔ)單元,用于獲取所述詞庫(kù)文件數(shù)據(jù)庫(kù)對(duì)應(yīng)的至少一個(gè)詞庫(kù)文件的狀態(tài)以及位置信息,并存儲(chǔ)所述詞庫(kù)文件數(shù)據(jù)庫(kù)對(duì)應(yīng)的至少一個(gè)詞庫(kù)文件的狀態(tài)以及位置信息;其中,所述狀態(tài)至少包括待更新狀態(tài)和更新完成狀態(tài)。6.根據(jù)權(quán)利要求5所述的同步服務(wù)器,其特征在于,所述同步服務(wù)器還包括: 第二信息接收單元,用于接收所述搜索服務(wù)器發(fā)送的更新響應(yīng)信息; 信息調(diào)整單元,用于根據(jù)所述更新響應(yīng)信息,修改與所述更新響應(yīng)信息所對(duì)應(yīng)的待更新詞庫(kù)文件的狀態(tài),以將所述更新響應(yīng)信息所對(duì)應(yīng)的待更新詞庫(kù)文件的狀態(tài)從待更新狀態(tài)修改至更新完成狀態(tài)。7.一種數(shù)據(jù)處理方法,其特征在于,所述方法包括: 搜索服務(wù)器接收同步服務(wù)器發(fā)送的詞庫(kù)文件更新信息;所述詞庫(kù)文件更新信息是所述同步服務(wù)器在確定出存在待更新狀態(tài)的待更新詞庫(kù)文件后而生成的; 所述搜索服務(wù)器根據(jù)所述詞庫(kù)文件更新信息,向所述同步服務(wù)器獲取所述待更新詞庫(kù)文件所對(duì)應(yīng)的位置信息; 所述搜索服務(wù)器根據(jù)所述待更新詞庫(kù)文件的位置信息,向詞庫(kù)文件數(shù)據(jù)庫(kù)讀取所述待更新詞庫(kù)文件,以更新所述搜索服務(wù)器所對(duì)應(yīng)的詞庫(kù)文件。8.根據(jù)權(quán)利要求7所述的方法,其特征在于,所述方法還包括: 所述搜索服務(wù)器基于更新后的自身對(duì)應(yīng)的詞庫(kù)文件重建索引列表; 將重建的索引列表替換未更新前的索引列表。9.根據(jù)權(quán)利要求7所述的方法,其特征在于,所述方法還包括: 所述搜索服務(wù)器更新完成自身對(duì)應(yīng)的詞庫(kù)文件后,向所述同步服務(wù)器發(fā)送更新響應(yīng)信息;其中,所述更新響應(yīng)信息用于控制所述同步服務(wù)器修改所述待更新詞庫(kù)文件所對(duì)應(yīng)的狀態(tài),以將所述待更新詞庫(kù)文件的狀態(tài)從待更新狀態(tài)修改至更新完成狀態(tài)。10.一種數(shù)據(jù)處理方法,其特征在于,所述方法包括: 同步服務(wù)器檢測(cè)自身存儲(chǔ)的與詞庫(kù)文件數(shù)據(jù)庫(kù)對(duì)應(yīng)的至少一個(gè)詞庫(kù)文件的狀態(tài)是否處于待更新狀態(tài); 當(dāng)確定出自身存儲(chǔ)的與詞庫(kù)文件數(shù)據(jù)庫(kù)對(duì)應(yīng)的至少一個(gè)詞庫(kù)文件處于待更新狀態(tài)時(shí),所述同步服務(wù)器將處于待更新狀態(tài)的至少一個(gè)詞庫(kù)文件作為待更新詞庫(kù)文件,生成與所述待更新詞庫(kù)文件對(duì)應(yīng)的詞庫(kù)文件更新信息; 所述同步服務(wù)器將所述詞庫(kù)文件更新信息發(fā)送至搜索服務(wù)器。11.根據(jù)權(quán)利要求10所述的方法,其特征在于,所述方法還包括: 所述同步服務(wù)器獲取所述詞庫(kù)文件數(shù)據(jù)庫(kù)對(duì)應(yīng)的至少一個(gè)詞庫(kù)文件的狀態(tài)以及位置信息,并存儲(chǔ)所述詞庫(kù)文件數(shù)據(jù)庫(kù)對(duì)應(yīng)的至少一個(gè)詞庫(kù)文件的狀態(tài)以及位置信息;其中,所述狀態(tài)至少包括待更新狀態(tài)和更新完成狀態(tài)。12.根據(jù)權(quán)利要求11所述的方法,其特征在于,所述方法還包括: 所述同步服務(wù)器接收所述搜索服務(wù)器發(fā)送的更新響應(yīng)信息; 所述同步服務(wù)器根據(jù)所述更新響應(yīng)信息,修改與所述更新響應(yīng)信息所對(duì)應(yīng)的待更新詞庫(kù)文件的狀態(tài),以將所述更新響應(yīng)信息所對(duì)應(yīng)的待更新詞庫(kù)文件的狀態(tài)從待更新狀態(tài)修改至更新完成狀態(tài)。
      【文檔編號(hào)】G06F17/30GK106021527SQ201610353312
      【公開日】2016年10月12日
      【申請(qǐng)日】2016年5月24日
      【發(fā)明人】林桂泉
      【申請(qǐng)人】努比亞技術(shù)有限公司
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
      1