一種信息檢索方法及裝置的制造方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及數(shù)據(jù)處理技術(shù)領(lǐng)域,特別涉及一種信息檢索方法及裝置。
【背景技術(shù)】
[0002]隨著信息技術(shù)的飛速發(fā)展,當今社會進入了信息爆炸時代,人們越來越多地借助網(wǎng)絡(luò)來尋找自己需要的信息,因此,檢索成為人們工作、生活不可或缺的一部分。
[0003]人們通常使用搜索引擎來進行檢索,搜索引擎是指根據(jù)一定的策略、運用特定的計算機程序從互聯(lián)網(wǎng)上搜集信息,在對信息進行組織和處理后,為用戶提供檢索服務(wù),將與用戶檢索相關(guān)的信息展示給用戶的系統(tǒng)。
[0004]現(xiàn)有技術(shù)中,搜索引擎在對信息進行組織和處理時,會直接存儲信息內(nèi)容本身,例如,北京植物園包括很多展區(qū),如樹木園、月季園、牡丹園等,則會保存文字北京植物園包括很多展區(qū),如樹木園、月季園、牡丹園等,這樣需要大量的存儲空間。并且,在后續(xù)提供檢索服務(wù)時,檢索速度較慢。
【發(fā)明內(nèi)容】
[0005]本發(fā)明提供一種信息檢索方法及裝置,用以實現(xiàn)靈活、快速的檢索信息的目的。
[0006]本發(fā)明提供一種信息檢索方法,包括:
[0007]根據(jù)給定的屬性值及天數(shù),從對應(yīng)的詞語關(guān)聯(lián)表中查找所述屬性值對應(yīng)的數(shù)據(jù)項,其中,所述詞語關(guān)聯(lián)表的數(shù)據(jù)項架構(gòu)包括關(guān)聯(lián)的兩個詞的標識和對應(yīng)的關(guān)聯(lián)深度值;
[0008]從所述查找到的數(shù)據(jù)項中選取對應(yīng)的關(guān)聯(lián)深度值滿足預設(shè)數(shù)值條件的至少一個數(shù)據(jù)項;
[0009]在詞典表中查找所述至少一個數(shù)據(jù)項的詞的標識對應(yīng)的各個詞,作為所述屬性值的熱門詞匯,其中,所述詞典表的數(shù)據(jù)項架構(gòu)包括詞的標識、詞的哈希hash值以及詞本身。
[0010]在本發(fā)明一實施例中,所述從所述查找到的數(shù)據(jù)項中選取對應(yīng)的關(guān)聯(lián)深度值滿足預設(shè)數(shù)值條件的至少一個數(shù)據(jù)項,包括:
[0011]對所述查找到的數(shù)據(jù)項對應(yīng)的關(guān)聯(lián)深度值進行降序排列;
[0012]選取前η個關(guān)聯(lián)深度值對應(yīng)的至少一個數(shù)據(jù)項。
[0013]在本發(fā)明一實施例中,所述根據(jù)給定的屬性值及天數(shù),從對應(yīng)的詞語關(guān)聯(lián)表中查找所述屬性值對應(yīng)的數(shù)據(jù)項之前,還包括:
[0014]計算所述屬性值的hash值;
[0015]在所述詞典表中查找所述屬性值的hash值對應(yīng)的所述屬性值的標識。
[0016]在本發(fā)明一實施例中,所述在詞典表中查找所述至少一個數(shù)據(jù)項的詞的標識對應(yīng)的各個詞,作為所述屬性值的熱門詞匯,包括:
[0017]將所述至少一個數(shù)據(jù)項的詞的標識生成標識集合;
[0018]在詞典表中查找所述標識集合中各標識對應(yīng)的各個詞,作為所述屬性值的熱門詞匯。
[0019]在本發(fā)明一實施例中,若所述屬性值包括多個,所述根據(jù)給定的屬性值及天數(shù),從對應(yīng)的詞語關(guān)聯(lián)表中查找所述屬性值對應(yīng)的數(shù)據(jù)項,包括:
[0020]根據(jù)給定的多個屬性值及天數(shù),從對應(yīng)的多個詞語關(guān)聯(lián)表中查找所述屬性值對應(yīng)的數(shù)據(jù)項。
[0021]本發(fā)明還提供一種信息檢索裝置,包括:
[0022]第一查找模塊,用于根據(jù)給定的屬性值及天數(shù),從對應(yīng)的詞語關(guān)聯(lián)表中查找所述屬性值對應(yīng)的數(shù)據(jù)項,其中,所述詞語關(guān)聯(lián)表的數(shù)據(jù)項架構(gòu)包括關(guān)聯(lián)的兩個詞的標識和對應(yīng)的關(guān)聯(lián)株度值;
[0023]選取模塊,用于從所述查找到的數(shù)據(jù)項中選取對應(yīng)的關(guān)聯(lián)深度值滿足預設(shè)數(shù)值條件的至少一個數(shù)據(jù)項;
[0024]第二查找模塊,用于在詞典表中查找所述至少一個數(shù)據(jù)項的詞的標識對應(yīng)的各個詞,作為所述屬性值的熱門詞匯,其中,所述詞典表的數(shù)據(jù)項架構(gòu)包括詞的標識、詞的哈希hash值以及詞本身。
[0025]在本發(fā)明一實施例中,所述選取模塊還用于:
[0026]對所述查找到的數(shù)據(jù)項對應(yīng)的關(guān)聯(lián)深度值進行降序排列;
[0027]選取前η個關(guān)聯(lián)深度值對應(yīng)的至少一個數(shù)據(jù)項。
[0028]在本發(fā)明一實施例中,在所述第一查找模塊根據(jù)給定的屬性值及天數(shù),從對應(yīng)的詞語關(guān)聯(lián)表中查找所述屬性值對應(yīng)的數(shù)據(jù)項之前,所述第一查找模塊還用于:
[0029]計算所述屬性值的hash值;
[0030]在所述詞典表中查找所述屬性值的hash值對應(yīng)的所述屬性值的標識。
[0031]在本發(fā)明一實施例中,所述第二查找模塊還用于:
[0032]將所述至少一個數(shù)據(jù)項的詞的標識生成標識集合;
[0033]在詞典表中查找所述標識集合中各標識對應(yīng)的各個詞,作為所述屬性值的熱門詞匯。
[0034]在本發(fā)明一實施例中,若所述屬性值包括多個,所述第一查找模塊還用于:
[0035]根據(jù)給定的多個屬性值及天數(shù),從對應(yīng)的多個詞語關(guān)聯(lián)表中查找所述屬性值對應(yīng)的數(shù)據(jù)項。
[0036]本發(fā)明實施例的一些有益效果可以包括:
[0037]本發(fā)明實施例中,由于詞語關(guān)聯(lián)表可以包括人物關(guān)聯(lián)表,地點關(guān)聯(lián)表,機構(gòu)關(guān)聯(lián)表,屬性關(guān)聯(lián)表等等,并且詞語關(guān)聯(lián)表的數(shù)據(jù)項架構(gòu)包括關(guān)聯(lián)的兩個詞的標識和對應(yīng)的關(guān)聯(lián)深度值,因而本發(fā)明根據(jù)給定的屬性值及天數(shù),從對應(yīng)的詞語關(guān)聯(lián)表中查找屬性值對應(yīng)的數(shù)據(jù)項,查找結(jié)果更加準確。進一步,本發(fā)明利用屬性值的標識查找屬性值對應(yīng)的數(shù)據(jù)項,能夠提高查找的效率。此外,關(guān)聯(lián)深度值反映了兩個詞的關(guān)聯(lián)程度,本發(fā)明選取了對應(yīng)的關(guān)聯(lián)深度值滿足預設(shè)數(shù)值條件的至少一個數(shù)據(jù)項,進一步提高查找結(jié)果的準確性。
[0038]本發(fā)明的其它特征和優(yōu)點將在隨后的說明書中闡述,并且,部分地從說明書中變得顯而易見,或者通過實施本發(fā)明而了解。本發(fā)明的目的和其他優(yōu)點可通過在所寫的說明書、權(quán)利要求書、以及附圖中所特別指出的結(jié)構(gòu)來實現(xiàn)和獲得。
[0039]下面通過附圖和實施例,對本發(fā)明的技術(shù)方案做進一步的詳細描述。
【附圖說明】
[0040]附圖用來提供對本發(fā)明的進一步理解,并且構(gòu)成說明書的一部分,與本發(fā)明的實施例一起用于解釋本發(fā)明,并不構(gòu)成對本發(fā)明的限制。在附圖中:
[0041]圖1為本發(fā)明一實施例中信息檢索方法的流程圖;
[0042]圖2為本發(fā)明一實施例提供的詞典表的結(jié)構(gòu)字段示意圖;
[0043]圖3為本發(fā)明一實施例提供的詞語關(guān)聯(lián)表的結(jié)構(gòu)字段示意圖;
[0044]圖4為本發(fā)明一實施例提供的詞典數(shù)據(jù)表的結(jié)構(gòu)字段示意圖;以及
[0045]圖5為本發(fā)明一實施例中信息檢索裝置的結(jié)構(gòu)示意圖。
【具體實施方式】
[0046]以下結(jié)合附圖對本發(fā)明的優(yōu)選實施例進行說明,應(yīng)當理解,此處所描述的優(yōu)選實施例僅用于說明和解釋本發(fā)明,并不用于限定本發(fā)明。
[0047]圖1所示為本發(fā)明一實施例中信息檢索方法的流程圖,該方法包括以下步驟S11-S13:
[0048]步驟S11,根據(jù)給定的屬性值及天數(shù),從對應(yīng)的詞語關(guān)聯(lián)表中查找屬性值對應(yīng)的數(shù)據(jù)項,其中,詞語關(guān)聯(lián)表的數(shù)據(jù)項架構(gòu)包括關(guān)聯(lián)的兩個詞的標識和對應(yīng)的關(guān)聯(lián)深度值。
[0049]這里提及的詞語關(guān)聯(lián)表可以包括:人物關(guān)聯(lián)表,地點關(guān)聯(lián)表,機構(gòu)關(guān)聯(lián)表,屬性關(guān)聯(lián)表等,本發(fā)明不限于此。下文提及的詞語關(guān)聯(lián)表中nr (表示人物)、nt (表示機構(gòu))或ns(表示地點)均視為不同的詞語關(guān)聯(lián)表,但每個關(guān)聯(lián)表數(shù)據(jù)結(jié)構(gòu)保持一致。
[0050]詞語關(guān)聯(lián)性表可以表示為Tzn_terms,其包括兩個字段分別為rel和weight,其中,rel記錄了關(guān)聯(lián)的兩個詞的ID (標識),I