一種索引更新的方法
【專利摘要】一種索引更新的方法,包括步驟:A、根據(jù)規(guī)則為實時創(chuàng)建的普通索引增加記載權(quán)值的索引權(quán)值標(biāo)簽,作為增量索引放入增量索引池緩存;B、判斷符合基礎(chǔ)索引的更新條件時,根據(jù)更新規(guī)則將增量索引池中的增量索引根據(jù)索引權(quán)值標(biāo)簽記載的權(quán)值大小排序,并依次更新至基礎(chǔ)索引中。由上,根據(jù)所述更新條件、更新規(guī)則可以實現(xiàn)新增量索引靈活的動態(tài)更新。
【專利說明】一種索引更新的方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及一種數(shù)據(jù)處理技術(shù),特別是指一種索引更新的方法。
【背景技術(shù)】
[0002]全文檢索引擎不能時時更新增量索引,只能在規(guī)定的時間去解析新增的文件,提取文件中的文本,然后將文本轉(zhuǎn)為索引,再追加到全文檢索引擎,這個過程是個循環(huán),文件越多,耗費的時間越多。每次做索引更新時,應(yīng)用都無法使用索引,所以時間越長,應(yīng)用無法使用索引的時間也就越長,導(dǎo)致效率降低。
[0003]為了優(yōu)化索引更新,中國專利申請?zhí)朇N201010554536提供了一種云環(huán)境中的文本索引在線更新方法,其要更新的各個節(jié)點分批次執(zhí)行索引更新,逐個節(jié)點進行更新,來替代由于整體更新時帶來的節(jié)點不可訪問的問題,從整體上解決了在更新增量索引時無法使用索引的問題。
[0004]但是對于某個節(jié)點進行更新時,對于該節(jié)點,其全文檢索更新仍是獨占模式。其要更新所要的新增索引量數(shù)據(jù)量大時,該節(jié)點仍無法被訪問,如何能夠?qū)崿F(xiàn)新增量索引更新的更加靈活,是所要解決的技術(shù)問題。
【發(fā)明內(nèi)容】
[0005]有鑒于此,本發(fā)明的主要目的在于提供一種索引更新的方法,以實現(xiàn)新增量索引靈活的動態(tài)更新。
[0006]本發(fā)明提供的索引更新的方法,包括步驟:
[0007]A、根據(jù)規(guī)則為實時創(chuàng)建的普通索引增加記載權(quán)值的索引權(quán)值標(biāo)簽,作為增量索引放入增量索引池緩存;
[0008]B、判斷符合基礎(chǔ)索引的更新條件時,根據(jù)更新規(guī)則將增量索引池中的增量索引根據(jù)索引權(quán)值標(biāo)簽記載的權(quán)值大小排序,并依次更新至基礎(chǔ)索引中。
[0009]由上,將增量索引根據(jù)一定規(guī)則設(shè)定不同的權(quán)值,從而具有不同的優(yōu)先級,當(dāng)增量索引追加到基礎(chǔ)索引時,根據(jù)增量索引的各個權(quán)值的優(yōu)先級來決定各增量索引更新的時間、范圍等,以實現(xiàn)新增量索引靈活的動態(tài)更新。
[0010]較佳的,步驟A所述權(quán)值包括不同類型的權(quán)值;步驟B所述更新規(guī)則包括指定類型的權(quán)值或由不同類型的權(quán)值計算的綜合權(quán)值;相應(yīng)的,步驟B所述根據(jù)索引權(quán)值標(biāo)簽記載的權(quán)值大小排序是根據(jù)所述指定類型的權(quán)值大小排序,或根據(jù)計算出的所述綜合權(quán)值大小排序。
[0011]由上,將增量索引根據(jù)一定規(guī)則設(shè)定不同的權(quán)值,從而具有不同的優(yōu)先級,當(dāng)增量索引追加到基礎(chǔ)索引時,根據(jù)增量索引的各個權(quán)值的優(yōu)先級來決定各增量索引更新的時間、范圍等,以實現(xiàn)新增量索引靈活的動態(tài)更新。
[0012]可選的,所述索引權(quán)值標(biāo)簽記載有下述至少之一的類型的權(quán)值:用于體現(xiàn)同一文件出現(xiàn)頻率的出現(xiàn)頻率權(quán)值、用于體現(xiàn)文件內(nèi)容字節(jié)的長度的長度權(quán)值、用于體現(xiàn)文件對應(yīng)業(yè)務(wù)類型的業(yè)務(wù)規(guī)則權(quán)值、文件格式權(quán)值。
[0013]由上,通過不同權(quán)重對應(yīng)其不同的修改權(quán)限,可以間接體現(xiàn)出文件重要性。
[0014]可選的,所述綜合權(quán)值的計算步驟包括
【權(quán)利要求】
1.一種索引更新的方法,其特征在于,包括步驟: A、根據(jù)規(guī)則為實時創(chuàng)建的普通索引增加記載權(quán)值的索引權(quán)值標(biāo)簽,作為增量索引放入增量索引池緩存; B、判斷符合基礎(chǔ)索引的更新條件時,根據(jù)更新規(guī)則將增量索引池中的增量索引根據(jù)索引權(quán)值標(biāo)簽記載的權(quán)值大小排序,并依次更新至基礎(chǔ)索引中。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于, 步驟A所述權(quán)值包括不同類型的權(quán)值; 步驟B所述更新規(guī)則包括指定類型的權(quán)值或由不同類型的權(quán)值計算的綜合權(quán)值;相應(yīng)的,步驟B所述根據(jù)索引權(quán)值標(biāo)簽記載的權(quán)值大小排序是根據(jù)所述指定類型的權(quán)值大小排序,或根據(jù)計算出的所述綜合權(quán)值大小排序。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述索引權(quán)值標(biāo)簽記載有下述至少之一的類型的權(quán)值: 用于體現(xiàn)同一文件出現(xiàn)頻率的出現(xiàn)頻率權(quán)值、用于體現(xiàn)文件內(nèi)容字節(jié)的長度的長度權(quán)值、用于體現(xiàn)文件對應(yīng)業(yè)務(wù)類型的業(yè)務(wù)規(guī)則權(quán)值、文件格式權(quán)值。
4.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述綜合權(quán)值的計算步驟包括:
其中,X綜合指要計算的綜合權(quán)值,Xi表示每類權(quán)值,ai表示每類權(quán)值的系數(shù)。
5.根據(jù)權(quán)利要求2所述的方法,其特征在于,步驟B所述判斷符合基礎(chǔ)索引的更新條件包括以下之一或任意組合: 判斷是否到達設(shè)定時間確定是否符合基礎(chǔ)索引的更新條件; 判斷與基礎(chǔ)索引前次更新的時間間隔是否到達設(shè)定時長確定是否符合基礎(chǔ)索引的更新條件; 判斷某權(quán)值以上的索引量是否達到某預(yù)定值確定是否符合基礎(chǔ)索引的更新條件; 判斷新增的增量索引權(quán)值是否大于設(shè)定權(quán)值確定是否符合基礎(chǔ)索引的更新條件; 判斷增量索引池內(nèi)緩存的索引是否到達到一定容量確定是否符合基礎(chǔ)索引的更新條件。
6.根據(jù)權(quán)利要求5所述的方法,其特征在于,還包括: 基礎(chǔ)索引更新過程所限定的更新時長。
7.根據(jù)權(quán)利要求1所述的方法,其特征在于,步驟B所述更新規(guī)則包括對應(yīng)的以下之一或任意組合: 更新過程所限定的更新時長;相應(yīng)的,步驟B所述依次更新至基礎(chǔ)索引中是在所述更新時長內(nèi)執(zhí)行; 更新過程所限定的權(quán)值;相應(yīng)的,步驟B所述依次更新至基礎(chǔ)索引中是將符合所述權(quán)值的增量索引更新至基礎(chǔ)索引; 不同時刻所對應(yīng)的更新過程所限定的不同權(quán)值;相應(yīng)的,步驟B所述依次更新至基礎(chǔ)索引中是將所述時刻符合所述權(quán)值的增量索引更新至基礎(chǔ)索引。
【文檔編號】G06F17/30GK104077379SQ201410295061
【公開日】2014年10月1日 申請日期:2014年6月25日 優(yōu)先權(quán)日:2014年6月25日
【發(fā)明者】管延軍, 蔣紅宇, 李文琦 申請人:北京海泰方圓科技有限公司