一種信息檢索方法及裝置的制造方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及數(shù)據(jù)處理技術(shù)領(lǐng)域,特別涉及一種信息檢索方法及裝置。
【背景技術(shù)】
[0002]隨著信息技術(shù)的飛速發(fā)展,當(dāng)今社會(huì)進(jìn)入了信息爆炸時(shí)代,人們?cè)絹?lái)越多地借助網(wǎng)絡(luò)來(lái)尋找自己需要的信息,因此,檢索成為人們工作、生活不可或缺的一部分。
[0003]人們通常使用搜索引擎來(lái)進(jìn)行檢索,搜索引擎是指根據(jù)一定的策略、運(yùn)用特定的計(jì)算機(jī)程序從互聯(lián)網(wǎng)上搜集信息,在對(duì)信息進(jìn)行組織和處理后,為用戶提供檢索服務(wù),將與用戶檢索相關(guān)的信息展示給用戶的系統(tǒng)。
[0004]現(xiàn)有技術(shù)中,搜索引擎在對(duì)信息進(jìn)行組織和處理時(shí),會(huì)直接存儲(chǔ)信息內(nèi)容本身,例如,北京關(guān)聯(lián)的相關(guān)機(jī)構(gòu)是故宮,則會(huì)保存文字北京關(guān)聯(lián)的相關(guān)機(jī)構(gòu)是故宮,這樣需要大量的存儲(chǔ)空間。并且,搜索引擎在檢索時(shí)會(huì)直接根據(jù)文字匹配與搜索詞相關(guān)的信息,如,搜索詞為“北京關(guān)聯(lián)的機(jī)構(gòu)是什么”,則會(huì)匹配到“北京關(guān)聯(lián)的相關(guān)機(jī)構(gòu)是故宮”等,檢索速度較慢。
【發(fā)明內(nèi)容】
[0005]本發(fā)明提供一種信息檢索方法及裝置,用以實(shí)現(xiàn)提高檢索速度及詞語(yǔ)關(guān)聯(lián)準(zhǔn)確度的目的。
[0006]本發(fā)明提供一種信息檢索方法,包括:
[0007]從給定的、包含關(guān)聯(lián)屬性信息的詞匯中提取出給定詞的名稱和關(guān)聯(lián)屬性;
[0008]根據(jù)所述給定詞的名稱,計(jì)算所述給定詞的哈希hash值;
[0009]在詞典表中根據(jù)所述給定詞的hash值查找所述給定詞的標(biāo)識(shí),其中,所述詞典表的數(shù)據(jù)項(xiàng)架構(gòu)包括詞的標(biāo)識(shí)、詞的hash值以及詞本身;
[0010]根據(jù)所述給定詞的標(biāo)識(shí)和關(guān)聯(lián)屬性,在對(duì)應(yīng)的詞語(yǔ)關(guān)聯(lián)表中查找所述給定詞的屬性關(guān)聯(lián)詞的標(biāo)識(shí);
[0011]在所述詞典表中根據(jù)所述給定詞的屬性關(guān)聯(lián)詞的標(biāo)識(shí)查找所述給定詞的屬性關(guān)聯(lián)詞。
[0012]在本發(fā)明一實(shí)施例中,所述詞語(yǔ)關(guān)聯(lián)表的數(shù)據(jù)項(xiàng)架構(gòu)包括關(guān)聯(lián)的兩個(gè)詞的標(biāo)識(shí)和對(duì)應(yīng)的關(guān)聯(lián)深度值。
[0013]在本發(fā)明一實(shí)施例中,所述根據(jù)所述給定詞的標(biāo)識(shí)和關(guān)聯(lián)屬性,在詞語(yǔ)關(guān)聯(lián)表中查找所述給定詞的屬性關(guān)聯(lián)詞的標(biāo)識(shí),包括:
[0014]在所述給定詞的關(guān)聯(lián)屬性對(duì)應(yīng)的詞語(yǔ)關(guān)聯(lián)表中,根據(jù)所述給定詞的標(biāo)識(shí)查找所述給定詞的屬性關(guān)聯(lián)詞的標(biāo)識(shí)。
[0015]在本發(fā)明一實(shí)施例中,所述根據(jù)所述給定詞的標(biāo)識(shí)查找所述給定詞的屬性關(guān)聯(lián)詞的標(biāo)識(shí),包括:
[0016]根據(jù)所述給定詞的標(biāo)識(shí)查找到多個(gè)所述給定詞的屬性關(guān)聯(lián)詞的標(biāo)識(shí);
[0017]從多個(gè)所述給定詞的屬性關(guān)聯(lián)詞的標(biāo)識(shí)中,選取對(duì)應(yīng)的關(guān)聯(lián)深度值滿足預(yù)設(shè)數(shù)值條件的標(biāo)識(shí)。
[0018]在本發(fā)明一實(shí)施例中,所述給定詞的關(guān)聯(lián)屬性包括多個(gè),所述根據(jù)所述給定詞的標(biāo)識(shí)和關(guān)聯(lián)屬性,在詞語(yǔ)關(guān)聯(lián)表中查找所述給定詞的屬性關(guān)聯(lián)詞的標(biāo)識(shí),包括:
[0019]根據(jù)所述給定詞的標(biāo)識(shí)和第一關(guān)聯(lián)屬性,在詞語(yǔ)關(guān)聯(lián)表中查找所述給定詞的第一屬性關(guān)聯(lián)詞的標(biāo)識(shí);
[0020]根據(jù)所述給定詞的第一屬性關(guān)聯(lián)詞的標(biāo)識(shí)和第二關(guān)聯(lián)屬性,在詞語(yǔ)關(guān)聯(lián)表中查找所述給定詞的第二屬性關(guān)聯(lián)詞的標(biāo)識(shí),以此類推,直至在詞語(yǔ)關(guān)聯(lián)表中查找所述給定詞的所有屬性關(guān)聯(lián)詞的標(biāo)識(shí)。
[0021]本發(fā)明還提供一種信息檢索裝置,包括:
[0022]提取模塊,用于從給定的、包含關(guān)聯(lián)屬性信息的詞匯中提取出給定詞的名稱和關(guān)聯(lián)屬性;
[0023]計(jì)算模塊,用于根據(jù)所述給定詞的名稱,計(jì)算所述給定詞的哈希hash值;
[0024]第一查找模塊,用于在對(duì)應(yīng)的詞典表中根據(jù)所述給定詞的hash值查找所述給定詞的標(biāo)識(shí),其中,所述詞典表的數(shù)據(jù)項(xiàng)架構(gòu)包括詞的標(biāo)識(shí)、詞的hash值以及詞本身;
[0025]第二查找模塊,用于根據(jù)所述給定詞的標(biāo)識(shí)和關(guān)聯(lián)屬性,在詞語(yǔ)關(guān)聯(lián)表中查找所述給定詞的屬性關(guān)聯(lián)詞的標(biāo)識(shí);
[0026]第三查找模塊,用于在所述詞典表中根據(jù)所述給定詞的屬性關(guān)聯(lián)詞的標(biāo)識(shí)查找所述給定詞的屬性關(guān)聯(lián)詞。
[0027]在本發(fā)明一實(shí)施例中,所述詞語(yǔ)關(guān)聯(lián)表的數(shù)據(jù)項(xiàng)架構(gòu)包括關(guān)聯(lián)的兩個(gè)詞的標(biāo)識(shí)和對(duì)應(yīng)的關(guān)聯(lián)深度值。
[0028]在本發(fā)明一實(shí)施例中,所述第二查找模塊還包括:
[0029]查找單元,用于在所述給定詞的關(guān)聯(lián)屬性對(duì)應(yīng)的詞語(yǔ)關(guān)聯(lián)表中,根據(jù)所述給定詞的標(biāo)識(shí)查找所述給定詞的屬性關(guān)聯(lián)詞的標(biāo)識(shí)。
[0030]在本發(fā)明一實(shí)施例中,所述查找單元還用于:
[0031 ] 根據(jù)所述給定詞的標(biāo)識(shí)查找到多個(gè)所述給定詞的屬性關(guān)聯(lián)詞的標(biāo)識(shí);
[0032]從多個(gè)所述給定詞的屬性關(guān)聯(lián)詞的標(biāo)識(shí)中,選取對(duì)應(yīng)的關(guān)聯(lián)深度值滿足預(yù)設(shè)數(shù)值條件的標(biāo)識(shí)。
[0033]在本發(fā)明一實(shí)施例中,所述給定詞的關(guān)聯(lián)屬性包括多個(gè),所述第二查找模塊還用于:
[0034]根據(jù)所述給定詞的標(biāo)識(shí)和第一關(guān)聯(lián)屬性,在詞語(yǔ)關(guān)聯(lián)表中查找所述給定詞的第一屬性關(guān)聯(lián)詞的標(biāo)識(shí);
[0035]根據(jù)所述給定詞的第一屬性關(guān)聯(lián)詞的標(biāo)識(shí)和第二關(guān)聯(lián)屬性,在詞語(yǔ)關(guān)聯(lián)表中查找所述給定詞的第二屬性關(guān)聯(lián)詞的標(biāo)識(shí),以此類推,直至在詞語(yǔ)關(guān)聯(lián)表中查找所述給定詞的所有屬性關(guān)聯(lián)詞的標(biāo)識(shí)。
[0036]本發(fā)明實(shí)施例的一些有益效果可以包括:
[0037]本發(fā)明實(shí)施例中,從給定的、包含關(guān)聯(lián)屬性信息的詞匯中提取出給定詞的名稱和關(guān)聯(lián)屬性,隨后根據(jù)給定詞的名稱,計(jì)算給定詞的hash值,進(jìn)而在詞典表中根據(jù)給定詞的hash值查找給定詞的標(biāo)識(shí),根據(jù)給定詞的標(biāo)識(shí)和關(guān)聯(lián)屬性,在對(duì)應(yīng)的詞語(yǔ)關(guān)聯(lián)表中查找給定詞的屬性關(guān)聯(lián)詞的標(biāo)識(shí),最后在詞典表中根據(jù)給定詞的屬性關(guān)聯(lián)詞的標(biāo)識(shí)查找給定詞的屬性關(guān)聯(lián)詞。由此可知,本發(fā)明能夠根據(jù)給定詞的標(biāo)識(shí),在關(guān)聯(lián)屬性對(duì)應(yīng)的詞語(yǔ)關(guān)聯(lián)表中查找給定詞的屬性關(guān)聯(lián)詞的標(biāo)識(shí),最后在詞典表中根據(jù)給定詞的屬性關(guān)聯(lián)詞的標(biāo)識(shí)查找給定詞的屬性關(guān)聯(lián)詞,相比于現(xiàn)有技術(shù)中查找匹配文字本身,本發(fā)明能夠提高檢索效率及詞語(yǔ)關(guān)聯(lián)準(zhǔn)確度。并且,本發(fā)明在詞語(yǔ)關(guān)聯(lián)表中存儲(chǔ)詞的標(biāo)識(shí),能夠節(jié)約資源存儲(chǔ)空間。
[0038]本發(fā)明的其它特征和優(yōu)點(diǎn)將在隨后的說(shuō)明書(shū)中闡述,并且,部分地從說(shuō)明書(shū)中變得顯而易見(jiàn),或者通過(guò)實(shí)施本發(fā)明而了解。本發(fā)明的目的和其他優(yōu)點(diǎn)可通過(guò)在所寫的說(shuō)明書(shū)、權(quán)利要求書(shū)、以及附圖中所特別指出的結(jié)構(gòu)來(lái)實(shí)現(xiàn)和獲得。
[0039]下面通過(guò)附圖和實(shí)施例,對(duì)本發(fā)明的技術(shù)方案做進(jìn)一步的詳細(xì)描述。
【附圖說(shuō)明】
[0040]附圖用來(lái)提供對(duì)本發(fā)明的進(jìn)一步理解,并且構(gòu)成說(shuō)明書(shū)的一部分,與本發(fā)明的實(shí)施例一起用于解釋本發(fā)明,并不構(gòu)成對(duì)本發(fā)明的限制。在附圖中:
[0041]圖1為本發(fā)明一實(shí)施例中信息檢索方法的流程圖;
[0042]圖2為本發(fā)明一實(shí)施例提供的詞典表的結(jié)構(gòu)字段示意圖;
[0043]圖3為本發(fā)明一實(shí)施例提供的詞典數(shù)據(jù)表的結(jié)構(gòu)字段示意圖;
[0044]圖4為本發(fā)明一實(shí)施例提供的詞語(yǔ)關(guān)聯(lián)表的結(jié)構(gòu)字段示意圖;
[0045]圖5為本發(fā)明一實(shí)施例中信息檢索裝置的結(jié)構(gòu)示意圖;以及
[0046]圖6為本發(fā)明一實(shí)施例中信息檢索裝置中第二查找模塊的結(jié)構(gòu)示意圖。
【具體實(shí)施方式】
[0047]以下結(jié)合附圖對(duì)本發(fā)明的優(yōu)選實(shí)施例進(jìn)行說(shuō)明,應(yīng)當(dāng)理解,此處所描述的優(yōu)選實(shí)施例僅用于說(shuō)明和解釋本發(fā)明,并不用于限定本發(fā)明。
[0048]本發(fā)明實(shí)施例中,詞語(yǔ)關(guān)聯(lián)表可以包括:人物關(guān)聯(lián)表,地點(diǎn)關(guān)聯(lián)表,機(jī)構(gòu)關(guān)聯(lián)表,屬性關(guān)聯(lián)表等,本發(fā)明不限于此。下文提及的詞語(yǔ)關(guān)聯(lián)表中nr (表示人物)、nt (表示機(jī)構(gòu))或ns (表示地點(diǎn))均視為不同的詞語(yǔ)關(guān)聯(lián)表,但每個(gè)關(guān)聯(lián)表數(shù)據(jù)結(jié)構(gòu)保持一致。
[0049]圖1所示為本發(fā)明一實(shí)施例中信息檢索方法的流程圖,該方法包括以下步驟S11-S15:
[0050]步驟Sll,從給定的、包含關(guān)聯(lián)屬性信息的詞匯中提取出給定詞的名稱和關(guān)聯(lián)屬性。
[0051]在該步驟中,給定的、包含關(guān)聯(lián)屬性信息的詞匯,例如“北京關(guān)聯(lián)的機(jī)構(gòu)資源”,從該詞匯中提取出給定詞為“北京”,關(guān)聯(lián)屬性為“關(guān)聯(lián)的機(jī)構(gòu)”。
[0052]步驟S12,根據(jù)給定詞的名稱,計(jì)算給定詞的hash值。
[0053]步驟S13,在詞典表中根據(jù)給定詞的hash值查找給