国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      一種基于云的信息化系統(tǒng)全文索引方法

      文檔序號(hào):9453147閱讀:219來(lái)源:國(guó)知局
      一種基于云的信息化系統(tǒng)全文索引方法
      【技術(shù)領(lǐng)域】
      [0001]本發(fā)明涉及信息檢索和數(shù)據(jù)處理領(lǐng)域,尤其涉及一種基于云的信息化系統(tǒng)全文索引方法。
      【背景技術(shù)】
      [0002]在現(xiàn)有的企業(yè)信息化系統(tǒng)中主要是基于全文文檔搜索的搜索信息化方案或者是基于數(shù)據(jù)庫(kù)全文搜索的信息化方案。其中,全文文檔搜索主要包括以下步驟:抓取文檔內(nèi)容,抓取方式可以是網(wǎng)絡(luò)、本地,但被抓取的文檔本身是公用文本格式的,如txt、doc、html等;建立索引數(shù)據(jù)庫(kù),將抓取的內(nèi)容以搜索引擎本身的方式構(gòu)建成為索引文件;在索引文件中搜索排序。全文文檔搜索的側(cè)重點(diǎn)是在第三步上,即根據(jù)優(yōu)良的分詞方法得到用戶想知道的、準(zhǔn)確的文檔內(nèi)容或是文檔摘要。
      [0003]但是,目前通用搜索希望覆蓋盡可能廣泛的內(nèi)容,內(nèi)容的重要性由搜索引擎本身根據(jù)一定算法決定,并不依賴于內(nèi)容源本身的重要程度。并且,通用搜索一般按照自己定義的排序方法進(jìn)行排序,并預(yù)先把計(jì)算好的排序結(jié)果保存在索引中。由此,隨著企業(yè)信息化應(yīng)用的深入,企業(yè)信息化系統(tǒng)中的數(shù)據(jù)量日益增大,難以避免會(huì)出現(xiàn)臟數(shù)據(jù),數(shù)據(jù)質(zhì)量隨之下降;另一方面,隨著數(shù)據(jù)源、數(shù)據(jù)依從關(guān)系的日益復(fù)雜,企業(yè)通過(guò)各系統(tǒng)提取信息的效率也在逐漸降低。
      [0004]對(duì)于擁有內(nèi)容的網(wǎng)站本身,又不簡(jiǎn)單滿足于通用的搜索引擎基于文本的搜索方式,而希望根據(jù)其數(shù)據(jù)結(jié)構(gòu)提供復(fù)雜而結(jié)構(gòu)化的搜索結(jié)果。所以,目前索引方式在可以檢索到全部?jī)?nèi)容的同時(shí),無(wú)法按照自己的要求調(diào)整排序,并無(wú)法快速的適應(yīng)各種變化,包括內(nèi)容變化,排序變化等。

      【發(fā)明內(nèi)容】

      [0005]有鑒于此,本發(fā)明提供一種基于云的信息化系統(tǒng)全文索引方法,以解決目前索引方法數(shù)據(jù)質(zhì)量和效率低,無(wú)法根據(jù)其數(shù)據(jù)結(jié)構(gòu)提供復(fù)雜而結(jié)構(gòu)化的搜索結(jié)果,導(dǎo)致無(wú)法按照用戶的要求調(diào)整排序。
      [0006]為了對(duì)披露的實(shí)施例的一些方面有一個(gè)基本的理解,下面給出了簡(jiǎn)單的概括。該概括部分不是泛泛評(píng)述,也不是要確定關(guān)鍵/重要組成元素或描繪這些實(shí)施例的保護(hù)范圍。其唯一目的是用簡(jiǎn)單的形式呈現(xiàn)一些概念,以此作為后面的詳細(xì)說(shuō)明的序言。
      [0007]在一些可選的實(shí)施例中,所述一種基于云的信息化系統(tǒng)全文索引方法,包括:建立實(shí)現(xiàn)集中管理和SAAS服務(wù)的云平臺(tái):所述云平臺(tái)由多個(gè)計(jì)算機(jī)組成,將所述各個(gè)計(jì)算機(jī)通過(guò)socket連接起來(lái),在所述各個(gè)計(jì)算機(jī)設(shè)置索引服務(wù)和檢索服務(wù);結(jié)構(gòu)化源數(shù)據(jù):對(duì)所述源數(shù)據(jù)進(jìn)行標(biāo)注,標(biāo)注的方式采用將所述源數(shù)據(jù)分為多種數(shù)據(jù)類型;建立索引:根據(jù)所述源數(shù)據(jù)的標(biāo)注結(jié)果,建立不同類型的索引,建立不同類型的索引采用將所述索引分為多種類型。
      [0008]在一些可選的實(shí)施例中,將所述源數(shù)據(jù)分為多種數(shù)據(jù)類型中的數(shù)據(jù)類型包括:可被搜索且分詞的;可被搜索且不分詞的;不被搜索僅存儲(chǔ)的;可做排序和范圍查詢的;時(shí)間;需要快速變化的。
      [0009]在一些可選的實(shí)施例中,將所述索引分為多種類型中的類型包括:全文索引;快速變化的數(shù)字索引;關(guān)鍵字、類型、類型級(jí)別、關(guān)聯(lián)字;用來(lái)存儲(chǔ)但不參與搜索的源數(shù)據(jù)。
      [0010]有益效果:根據(jù)不同的搜索條件輸出各種形式的搜索結(jié)果,搜索結(jié)果輸出為結(jié)構(gòu)化文檔,可用于各種設(shè)備和平臺(tái),提供結(jié)構(gòu)化數(shù)據(jù)搜索,通過(guò)對(duì)數(shù)據(jù)標(biāo)注,使搜索結(jié)構(gòu)化,可以實(shí)現(xiàn)各種基于范圍的搜索,并定制排序方法;基于云平臺(tái),通過(guò)SAAS方式提供服務(wù),實(shí)現(xiàn)集中管理,降低運(yùn)營(yíng)成本和用戶使用成本。
      [0011]為了上述以及相關(guān)的目的,一個(gè)或多個(gè)實(shí)施例包括后面將詳細(xì)說(shuō)明并在權(quán)利要求中特別指出的特征。下面的說(shuō)明以及附圖詳細(xì)說(shuō)明某些示例性方面,并且其指示的僅僅是各個(gè)實(shí)施例的原則可以利用的各種方式中的一些方式。其它的益處和新穎性特征將隨著下面的詳細(xì)說(shuō)明結(jié)合附圖考慮而變得明顯,所公開(kāi)的實(shí)施例是要包括所有這些方面以及它們的等同。
      【附圖說(shuō)明】
      [0012]圖1是本發(fā)明一種基于云的信息化系統(tǒng)全文索引方法的流程示意圖;
      [0013]圖2是本發(fā)明創(chuàng)建索引文件的流程示意圖。
      【具體實(shí)施方式】
      [0014]以下描述和附圖充分地示出本發(fā)明的具體實(shí)施方案,以使本領(lǐng)域的技術(shù)人員能夠?qū)嵺`它們。其他實(shí)施方案可以包括結(jié)構(gòu)的、邏輯的、電氣的、過(guò)程的以及其他的改變。實(shí)施例僅代表可能的變化。除非明確要求,否則單獨(dú)的部件和功能是可選的,并且操作的順序可以變化。一些實(shí)施方案的部分和特征可以被包括在或替換其他實(shí)施方案的部分和特征。
      [0015]在一些說(shuō)明性的實(shí)施例中,如圖1所示,提供一種基于云的信息化系統(tǒng)全文索引方法,包括:
      [0016]101:建立云平臺(tái)。所述云平臺(tái)由多個(gè)計(jì)算機(jī)組成,將所述各個(gè)計(jì)算機(jī)通過(guò)socket連接起來(lái),socket可實(shí)現(xiàn)不同虛擬機(jī)或不同計(jì)算機(jī)之間的通信。在所述云平臺(tái)上實(shí)現(xiàn)集中管理和SAAS服務(wù),降低運(yùn)營(yíng)成本和用戶使用成本,并且在各計(jì)算機(jī)上設(shè)置索引服務(wù)和檢索服務(wù)。
      [0017]102:結(jié)構(gòu)化源數(shù)據(jù)。對(duì)所述源數(shù)據(jù)進(jìn)行標(biāo)注,以使數(shù)據(jù)結(jié)構(gòu)化,對(duì)所述源數(shù)據(jù)進(jìn)行標(biāo)注的方法是用將所述源數(shù)據(jù)分為多種數(shù)據(jù)類型。在一些說(shuō)明性的實(shí)施例中,所述數(shù)據(jù)類型包括:可被搜索且分詞的;可被搜索且不分詞的;不被搜索僅存儲(chǔ)的;可做排序和范圍查詢的;時(shí)間;需要快速變化的。
      [0018]103:建立索引。根據(jù)所述源數(shù)據(jù)的標(biāo)注結(jié)果,建立不同類型的索引,用于搜索,建立不同類型的索引的方法是,將索引分為多種類型。在一些說(shuō)明性的實(shí)施例中,所述類型包括:全文索引;快速變化的數(shù)字索引;關(guān)鍵字、類型、類型級(jí)別、關(guān)聯(lián)字;用來(lái)存儲(chǔ)但不參與搜索的源數(shù)據(jù)。
      [0019]索引建立完成后,即可創(chuàng)建索引文件,如圖2所示,包括:
      [0020]201:啟動(dòng)索引節(jié)點(diǎn);
      [0021]202:初始化節(jié)點(diǎn);
      [0022]203:初始化消息列隊(duì);
      [0023]204:初始化索引執(zhí)行器;
      [0024]205:判斷是否有舊索引文件;
      [0025]206:若有所述舊索引文件,則上傳到分布式文件系統(tǒng);
      [0026]207:若無(wú)所述舊索引文件,則創(chuàng)建本地索引文件。
      [0027]本領(lǐng)域技術(shù)人員還應(yīng)當(dāng)理解,結(jié)合本文的實(shí)施例描述的各種說(shuō)明性的邏輯框、模塊、電路和算法步驟均可以實(shí)現(xiàn)成電子硬件、計(jì)算機(jī)軟件或其組合。為了清楚地說(shuō)明硬件和軟件之間的可交換性,上面對(duì)各種說(shuō)明性的部件、框、模塊、電路和步驟均圍繞其功能進(jìn)行了一般地描述。至于這種功能是實(shí)現(xiàn)成硬件還是實(shí)現(xiàn)成軟件,取決于特定的應(yīng)用和對(duì)整個(gè)系統(tǒng)所施加的設(shè)計(jì)約束條件。熟練的技術(shù)人員可以針對(duì)每個(gè)特定應(yīng)用,以變通的方式實(shí)現(xiàn)所描述的功能,但是,這種實(shí)現(xiàn)決策不應(yīng)解釋為背離本公開(kāi)的保護(hù)范圍。
      【主權(quán)項(xiàng)】
      1.一種基于云的信息化系統(tǒng)全文索引方法,其特征在于,包括: 建立實(shí)現(xiàn)集中管理和SAAS服務(wù)的云平臺(tái):所述云平臺(tái)由多個(gè)計(jì)算機(jī)組成,將所述各個(gè)計(jì)算機(jī)通過(guò)socket連接起來(lái),在所述各個(gè)計(jì)算機(jī)設(shè)置索引服務(wù)和檢索服務(wù); 結(jié)構(gòu)化源數(shù)據(jù):對(duì)所述源數(shù)據(jù)進(jìn)行標(biāo)注,標(biāo)注的方式采用將所述源數(shù)據(jù)分為多種數(shù)據(jù)類型; 建立索引:根據(jù)所述源數(shù)據(jù)的標(biāo)注結(jié)果,建立不同類型的索引,建立不同類型的索引采用將所述索引分為多種類型。2.根據(jù)權(quán)利要求1所述的一種基于云的信息化系統(tǒng)全文索引方法,其特征在于,將所述源數(shù)據(jù)分為多種數(shù)據(jù)類型中的數(shù)據(jù)類型包括:可被搜索且分詞的;可被搜索且不分詞的;不被搜索僅存儲(chǔ)的;可做排序和范圍查詢的;時(shí)間;需要快速變化的。3.根據(jù)權(quán)利要求1所述的一種基于云的信息化系統(tǒng)全文索引方法,其特征在于,將所述索引分為多種類型中的類型包括:全文索引;快速變化的數(shù)字索引;關(guān)鍵字、類型、類型級(jí)別、關(guān)聯(lián)字;用來(lái)存儲(chǔ)但不參與搜索的源數(shù)據(jù)。
      【專利摘要】本發(fā)明公開(kāi)一種基于云的信息化系統(tǒng)全文索引方法,包括:建立云平臺(tái);結(jié)構(gòu)化源數(shù)據(jù);建立索引。根據(jù)不同的搜索條件輸出各種形式的搜索結(jié)果,搜索結(jié)果輸出為結(jié)構(gòu)化文檔,可用于各種設(shè)備和平臺(tái),提供結(jié)構(gòu)化數(shù)據(jù)搜索,通過(guò)對(duì)數(shù)據(jù)標(biāo)注,使搜索結(jié)構(gòu)化,可以實(shí)現(xiàn)各種基于范圍的搜索,并定制排序方法;基于云平臺(tái),通過(guò)SAAS方式提供服務(wù),實(shí)現(xiàn)集中管理,降低運(yùn)營(yíng)成本和用戶使用成本。
      【IPC分類】G06F17/30
      【公開(kāi)號(hào)】CN105205149
      【申請(qǐng)?zhí)枴緾N201510608959
      【發(fā)明人】高志軍, 伍爵博, 陳婷, 劉鑫
      【申請(qǐng)人】鎮(zhèn)江銳捷信息科技有限公司
      【公開(kāi)日】2015年12月30日
      【申請(qǐng)日】2015年9月22日
      網(wǎng)友詢問(wèn)留言 已有0條留言
      • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
      1