基于用戶標(biāo)注信息構(gòu)建知識(shí)圖譜的方法和裝置制造方法
【專利摘要】本發(fā)明提供了一種基于用戶標(biāo)注信息構(gòu)建知識(shí)圖譜的方法和裝置,該方法包括:收集網(wǎng)絡(luò)中對(duì)特定實(shí)體的用戶標(biāo)注信息;根據(jù)所述用戶標(biāo)注信息,生成所述特定實(shí)體、標(biāo)注類屬性信息的結(jié)構(gòu)化數(shù)據(jù)對(duì);利用所述結(jié)構(gòu)化數(shù)據(jù)對(duì)作為知識(shí)條目,構(gòu)建知識(shí)圖譜。本發(fā)明基于結(jié)構(gòu)化數(shù)據(jù)對(duì)對(duì)外提供搜索服務(wù)時(shí),能夠直觀、精確地將標(biāo)注類屬性信息作為搜索結(jié)果提供給用戶,從而提高搜索效率,提升用戶搜索體驗(yàn)。
【專利說明】基于用戶標(biāo)注信息構(gòu)建知識(shí)圖譜的方法和裝置
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及信息搜索領(lǐng)域,特別是一種基于用戶標(biāo)注信息構(gòu)建知識(shí)圖譜的方法和裝置,以及一種基于知識(shí)圖譜提供搜索的方法和裝置。
【背景技術(shù)】
[0002]隨著信息技術(shù)的飛速發(fā)展,當(dāng)今社會(huì)進(jìn)入了信息爆炸時(shí)代,人們?cè)絹碓蕉嗟亟柚W(wǎng)絡(luò)來尋找自己需要的信息,因此,檢索成為人們工作、生活不可或缺的一部分。人們通常使用搜索引擎來進(jìn)行檢索,搜索引擎是指根據(jù)一定的策略、運(yùn)用特定的計(jì)算機(jī)程序從互聯(lián)網(wǎng)上搜集信息,在對(duì)信息進(jìn)行組織和處理后,為用戶提供檢索服務(wù),將與用戶檢索相關(guān)的信息展示給用戶的系統(tǒng)。
[0003]相關(guān)技術(shù)中,例如影視的檢索,主要是以影視的片名、導(dǎo)演、演員、簡(jiǎn)介信息作為檢索手段,提供的檢索信息不夠豐富,而且這些信息還需要投入大量的人力進(jìn)行信息的編輯或分類,人力成本高,且效率較低。
【發(fā)明內(nèi)容】
[0004]鑒于上述問題,提出了本發(fā)明以便提供一種克服上述問題或者至少部分地解決上述問題的基于用戶標(biāo)注信息構(gòu)建知識(shí)圖譜的方法和裝置,以及基于知識(shí)圖譜提供搜索的方法和裝置。
[0005]依據(jù)本發(fā)明的一個(gè)方面,提供了一種基于用戶標(biāo)注信息構(gòu)建知識(shí)圖譜的方法,包括:收集網(wǎng)絡(luò)中對(duì)特定實(shí)體的用戶標(biāo)注信息;根據(jù)所述用戶標(biāo)注信息,生成所述特定實(shí)體、標(biāo)注類屬性信息的結(jié)構(gòu)化數(shù)據(jù)對(duì);利用所述結(jié)構(gòu)化數(shù)據(jù)對(duì)作為知識(shí)條目,構(gòu)建知識(shí)圖譜。
[0006]可選地,所述標(biāo)注類屬性信息至少包括標(biāo)注類屬性名稱以及相應(yīng)的標(biāo)注類屬性賦值。
[0007]可選地,所述方法還包括:若當(dāng)前收集的特定實(shí)體已存在于所述知識(shí)圖譜中,則利用當(dāng)前收集的所述特定實(shí)體的用戶標(biāo)注信息更新已存在的所述特定實(shí)體、標(biāo)注類屬性信息的結(jié)構(gòu)化數(shù)據(jù)對(duì);或者,將當(dāng)前收集的特定實(shí)體的用戶標(biāo)注信息生成的所述特定實(shí)體、標(biāo)注類屬性信息的結(jié)構(gòu)化數(shù)據(jù)對(duì)作為新的知識(shí)條目,插入所述知識(shí)圖譜。
[0008]可選地,所述特定實(shí)體包括下列至少之一:影視、視頻、音樂、小說、論壇。
[0009]可選地,所述用戶標(biāo)注信息包括下列至少之一:用戶評(píng)論信息、用戶創(chuàng)建的標(biāo)簽、用戶選取的標(biāo)簽。
[0010]依據(jù)本發(fā)明的另一個(gè)方面,提供了一種基于知識(shí)圖譜提供搜索的方法,包括:接收來自用戶的查詢?cè)~,從所述查詢?cè)~中解析出實(shí)體名稱以及實(shí)體屬性名稱;在知識(shí)圖譜中匹配所述實(shí)體名稱和/或?qū)嶓w屬性名稱,查找到相應(yīng)的結(jié)構(gòu)化數(shù)據(jù)對(duì);查找所述結(jié)構(gòu)化數(shù)據(jù)對(duì)中所述實(shí)體屬性名稱對(duì)應(yīng)的屬性賦值,并將所述屬性賦值提供給所述用戶。
[0011]可選地,所述實(shí)體包括下列至少之一:影視、視頻、音樂、小說、論壇。
[0012]依據(jù)本發(fā)明的又一個(gè)方面,還提供了一種基于用戶標(biāo)注信息構(gòu)建知識(shí)圖譜的裝置,包括:
[0013]收集器,適于收集網(wǎng)絡(luò)中對(duì)特定實(shí)體的用戶標(biāo)注信息;
[0014]數(shù)據(jù)對(duì)生成器,適于根據(jù)所述用戶標(biāo)注信息,生成所述特定實(shí)體、標(biāo)注類屬性信息的結(jié)構(gòu)化數(shù)據(jù)對(duì);
[0015]知識(shí)圖譜構(gòu)建器,適于利用所述結(jié)構(gòu)化數(shù)據(jù)對(duì)作為知識(shí)條目,構(gòu)建知識(shí)圖譜。
[0016]可選地,所述標(biāo)注類屬性信息至少包括標(biāo)注類屬性名稱以及相應(yīng)的標(biāo)注類屬性賦值。
[0017]可選地,所述知識(shí)圖譜構(gòu)建器還適于:若當(dāng)前收集的特定實(shí)體已存在于所述知識(shí)圖譜中,則利用當(dāng)前收集的所述特定實(shí)體的用戶標(biāo)注信息更新已存在的所述特定實(shí)體、標(biāo)注類屬性信息的結(jié)構(gòu)化數(shù)據(jù)對(duì);或者,將當(dāng)前收集的特定實(shí)體的用戶標(biāo)注信息生成的所述特定實(shí)體、標(biāo)注類屬性信息的結(jié)構(gòu)化數(shù)據(jù)對(duì)作為新的知識(shí)條目,插入所述知識(shí)圖譜。
[0018]可選地,所述特定實(shí)體包括下列至少之一:影視、視頻、音樂、小說、論壇。
[0019]可選地,所述用戶標(biāo)注信息包括下列至少之一:用戶評(píng)論信息、用戶創(chuàng)建的標(biāo)簽、用戶選取的標(biāo)簽。
[0020]依據(jù)本發(fā)明的再一個(gè)方面,還提供了一種基于知識(shí)圖譜提供搜索的裝置,包括:
[0021]數(shù)據(jù)輸入器,適于接收來自用戶的查詢?cè)~;
[0022]解析器,適于從所述查詢?cè)~中解析出實(shí)體名稱以及實(shí)體屬性名稱;
[0023]知識(shí)圖譜數(shù)據(jù)庫(kù),適于存儲(chǔ)結(jié)構(gòu)化數(shù)據(jù)對(duì);
[0024]查找器,適于在所述知識(shí)圖譜數(shù)據(jù)庫(kù)中匹配所述實(shí)體名稱和/或?qū)嶓w屬性名稱,查找到相應(yīng)的結(jié)構(gòu)化數(shù)據(jù)對(duì),查找所述結(jié)構(gòu)化數(shù)據(jù)對(duì)中所述實(shí)體屬性名稱對(duì)應(yīng)的屬性賦值;
[0025]數(shù)據(jù)輸出器,適于將所述屬性賦值提供給所述用戶。
[0026]可選地,所述實(shí)體包括下列至少之一:影視、視頻、音樂、小說、論壇。
[0027]本發(fā)明提供了基于用戶標(biāo)注信息構(gòu)建知識(shí)圖譜的方案,首先收集網(wǎng)絡(luò)中對(duì)特定實(shí)體的用戶標(biāo)注信息,隨后根據(jù)用戶標(biāo)注信息,生成特定實(shí)體、標(biāo)注類屬性信息的結(jié)構(gòu)化數(shù)據(jù)對(duì),進(jìn)而利用結(jié)構(gòu)化數(shù)據(jù)對(duì)作為知識(shí)條目,構(gòu)建知識(shí)圖譜。由此,本發(fā)明基于網(wǎng)絡(luò)中對(duì)特定實(shí)體的用戶標(biāo)注信息生成架構(gòu)包括特定實(shí)體、標(biāo)注類屬性信息的結(jié)構(gòu)化數(shù)據(jù)對(duì),基于結(jié)構(gòu)化數(shù)據(jù)對(duì)對(duì)外提供搜索服務(wù)時(shí),能夠直觀、精確地將標(biāo)注類屬性信息作為搜索結(jié)果提供給用戶,解決了相關(guān)技術(shù)中在搜索結(jié)果中無法直接地展示這些信息,需要用戶花費(fèi)較多時(shí)間從相關(guān)網(wǎng)頁中篩選出這部分信息的問題,從而提高搜索效率,提升用戶搜索體驗(yàn)。并且,本發(fā)明收集用戶對(duì)特定實(shí)體的用戶標(biāo)注信息,其能夠反映大多數(shù)用戶的主觀意見,可以大幅提升知識(shí)圖譜的適用范圍,使其能夠更好的理解用戶。另外,本發(fā)明能夠充分利用海量用戶的力量對(duì)特定實(shí)體進(jìn)行信息的標(biāo)注,收集的用戶標(biāo)注信息豐富、全面,極大改善用戶搜索體驗(yàn),且無需投入大量人力資源,實(shí)現(xiàn)節(jié)約成本的目的。此外,基于結(jié)構(gòu)化數(shù)據(jù)的特點(diǎn),本發(fā)明能夠?qū)⑾嚓P(guān)知識(shí)信息系統(tǒng)化地提供給用戶,使得用戶獲取更多的知識(shí)信息。
[0028]上述說明僅是本發(fā)明技術(shù)方案的概述,為了能夠更清楚了解本發(fā)明的技術(shù)手段,而可依照說明書的內(nèi)容予以實(shí)施,并且為了讓本發(fā)明的上述和其它目的、特征和優(yōu)點(diǎn)能夠更明顯易懂,以下特舉本發(fā)明的【具體實(shí)施方式】。
[0029]根據(jù)下文結(jié)合附圖對(duì)本發(fā)明具體實(shí)施例的詳細(xì)描述,本領(lǐng)域技術(shù)人員將會(huì)更加明了本發(fā)明的上述以及其他目的、優(yōu)點(diǎn)和特征。
【專利附圖】
【附圖說明】
[0030]通過閱讀下文優(yōu)選實(shí)施方式的詳細(xì)描述,各種其他的優(yōu)點(diǎn)和益處對(duì)于本領(lǐng)域普通技術(shù)人員將變得清楚明了。附圖僅用于示出優(yōu)選實(shí)施方式的目的,而并不認(rèn)為是對(duì)本發(fā)明的限制。而且在整個(gè)附圖中,用相同的參考符號(hào)表示相同的部件。在附圖中:
[0031]圖1示出了搜索服務(wù)系統(tǒng)的通用架構(gòu)示意圖;
[0032]圖2示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的基于用戶標(biāo)注信息構(gòu)建知識(shí)圖譜的方法的流程圖;
[0033]圖3示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的基于知識(shí)圖譜提供搜索的方法的流程圖;
[0034]圖4示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的搜索詞為“好看的科幻電影”的搜索結(jié)果示意圖;
[0035]圖5示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的搜索詞為“好聽的流行音樂”的搜索結(jié)果示意圖;
[0036]圖6示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的搜索詞為“玄幻小說”的搜索結(jié)果示意圖;
[0037]圖7示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的基于用戶標(biāo)注信息構(gòu)建知識(shí)圖譜的裝置的結(jié)構(gòu)示意圖;以及
[0038]圖8示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的基于知識(shí)圖譜提供搜索的裝置的結(jié)構(gòu)示意圖。
【具體實(shí)施方式】
[0039]下面將參照附圖更詳細(xì)地描述本公開的示例性實(shí)施例。雖然附圖中顯示了本公開的示例性實(shí)施例,然而應(yīng)當(dāng)理解,可以以各種形式實(shí)現(xiàn)本公開而不應(yīng)被這里闡述的實(shí)施例所限制。相反,提供這些實(shí)施例是為了能夠更透徹地理解本公開,并且能夠?qū)⒈竟_的范圍完整的傳達(dá)給本領(lǐng)域的技術(shù)人員。
[0040]在介紹本發(fā)明之前,先簡(jiǎn)要介紹知識(shí)圖譜這個(gè)概念。知識(shí)圖譜旨在描述真實(shí)世界中存在的各種實(shí)體(如人物、漢字、視頻、音樂、影視、小說等)或概念,每個(gè)實(shí)體或概念用一個(gè)全局唯一確定的ID (Identity,身份標(biāo)識(shí)號(hào))來標(biāo)識(shí)。每個(gè)屬性-值對(duì)用來刻畫實(shí)體的內(nèi)在特性,而關(guān)系用來連接兩個(gè)實(shí)體,刻畫它們之間的關(guān)聯(lián)。知識(shí)圖譜亦可被看作是一張巨大的網(wǎng)狀圖,網(wǎng)狀圖中的節(jié)點(diǎn)表示實(shí)體或概念,而網(wǎng)狀圖中的邊則由屬性或關(guān)系構(gòu)成。知識(shí)圖譜主要就是構(gòu)建和維護(hù)上述的實(shí)體和關(guān)系,為搜索中的推薦系統(tǒng)、語義理解、問題回答等提供支持。此外,知識(shí)圖譜并不是一張靜態(tài)的網(wǎng)狀圖,它會(huì)根據(jù)外界的變化而進(jìn)行自我調(diào)整與更新。
[0041]基于上述知識(shí)圖譜提供搜索知識(shí)圖譜信息的服務(wù),整體搜索服務(wù)系統(tǒng)的通用架構(gòu)如圖1所示,由查詢解析模塊、知識(shí)圖譜數(shù)據(jù)庫(kù)、結(jié)果處理模塊三部分組成。這里,查詢解析模塊的功能是分析用戶輸入的搜索詞,判斷用戶的查詢是否屬于知識(shí)圖譜數(shù)據(jù)庫(kù)覆蓋的范圍,將現(xiàn)有知識(shí)圖譜數(shù)據(jù)庫(kù)覆蓋的查詢轉(zhuǎn)成知識(shí)圖譜數(shù)據(jù)庫(kù)可以理解的查詢語言,提交給知識(shí)圖譜數(shù)據(jù)庫(kù)。其次,知識(shí)圖譜數(shù)據(jù)庫(kù)是整個(gè)搜索服務(wù)系統(tǒng)的核心部分,它是從互聯(lián)網(wǎng)海量數(shù)據(jù)(例如結(jié)構(gòu)化數(shù)據(jù)、網(wǎng)頁源數(shù)據(jù)、用戶生成數(shù)據(jù)等)利用數(shù)據(jù)挖掘方法整理組織起來,并通過特有的查詢語言查詢知識(shí)圖譜數(shù)據(jù)庫(kù)中相關(guān)的知識(shí)信息。再者,結(jié)果處理模塊的功能是根據(jù)用戶查詢和知識(shí)圖譜數(shù)據(jù)庫(kù)返回的知識(shí)信息,組織成可視化的搜索結(jié)果展示給用戶。
[0042]因而,知識(shí)圖譜數(shù)據(jù)庫(kù)覆蓋的領(lǐng)域知識(shí)范圍決定了搜索服務(wù)系統(tǒng)為用戶解答問題的能力,因此構(gòu)建一個(gè)覆蓋多領(lǐng)域知識(shí)的通用知識(shí)圖譜數(shù)據(jù)庫(kù)是搜索服務(wù)系統(tǒng)實(shí)現(xiàn)的一個(gè)重點(diǎn)。在大數(shù)據(jù)環(huán)境下可以利用的數(shù)據(jù)資源空前豐富,如UGC(User Generated Content,用戶生產(chǎn)內(nèi)容),即網(wǎng)友將自己制作的內(nèi)容通過互聯(lián)網(wǎng)平臺(tái)進(jìn)行展示或者提供給其他用戶。本發(fā)明針對(duì)用戶生成數(shù)據(jù)中的用戶標(biāo)注信息構(gòu)建知識(shí)圖譜,用于大幅提升知識(shí)圖譜的適用范圍,使其能夠更好的理解用戶,如幫助搜索引擎更好的理解偏主觀色彩的用戶查詢。圖2示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的基于用戶標(biāo)注信息構(gòu)建知識(shí)圖譜的方法的流程圖。如圖2所示,該方法至少包括以下步驟S202至步驟S206。
[0043]步驟S202、收集網(wǎng)絡(luò)中對(duì)特定實(shí)體的用戶標(biāo)注信息。
[0044]步驟S204、根據(jù)用戶標(biāo)注信息,生成特定實(shí)體、標(biāo)注類屬性信息的結(jié)構(gòu)化數(shù)據(jù)對(duì)。
[0045]步驟S206、利用結(jié)構(gòu)化數(shù)據(jù)對(duì)作為知識(shí)條目,構(gòu)建知識(shí)圖譜。
[0046]本發(fā)明提供了基于用戶標(biāo)注信息構(gòu)建知識(shí)圖譜的方案,首先收集網(wǎng)絡(luò)中對(duì)特定實(shí)體的用戶標(biāo)注信息,隨后根據(jù)用戶標(biāo)注信息,生成特定實(shí)體、標(biāo)注類屬性信息的結(jié)構(gòu)化數(shù)據(jù)對(duì),進(jìn)而利用結(jié)構(gòu)化數(shù)據(jù)對(duì)作為知識(shí)條目,構(gòu)建知識(shí)圖譜。由此,本發(fā)明基于網(wǎng)絡(luò)中對(duì)特定實(shí)體的用戶標(biāo)注信息生成架構(gòu)包括特定實(shí)體、標(biāo)注類屬性信息的結(jié)構(gòu)化數(shù)據(jù)對(duì),基于結(jié)構(gòu)化數(shù)據(jù)對(duì)對(duì)外提供搜索服務(wù)時(shí),能夠直觀、精確地將標(biāo)注類屬性信息作為搜索結(jié)果提供給用戶,解決了相關(guān)技術(shù)中在搜索結(jié)果中無法直接地展示這些信息,需要用戶花費(fèi)較多時(shí)間從相關(guān)網(wǎng)頁中篩選出這部分信息的問題,從而提高搜索效率,提升用戶搜索體驗(yàn)。并且,本發(fā)明收集用戶對(duì)特定實(shí)體的用戶標(biāo)注信息,其能夠反映大多數(shù)用戶的主觀意見,可以大幅提升知識(shí)圖譜的適用范圍,使其能夠更好的理解用戶。另外,本發(fā)明能夠充分利用海量用戶的力量對(duì)特定實(shí)體進(jìn)行信息的標(biāo)注,收集的用戶標(biāo)注信息豐富、全面,極大改善用戶搜索體驗(yàn),且無需投入大量人力資源,實(shí)現(xiàn)節(jié)約成本的目的。此外,基于結(jié)構(gòu)化數(shù)據(jù)的特點(diǎn),本發(fā)明能夠?qū)⑾嚓P(guān)知識(shí)信息系統(tǒng)化地提供給用戶,使得用戶獲取更多的知識(shí)信息。
[0047]上文步驟S202中提及的特定實(shí)體如影視、視頻、音樂、小說、論壇等,用戶標(biāo)注信息如用戶評(píng)論信息、用戶創(chuàng)建的(tag)標(biāo)簽、用戶選取的標(biāo)簽等等。這里收集網(wǎng)絡(luò)中對(duì)特定實(shí)體的用戶標(biāo)注信息,例如,收集豆瓣電影、豆瓣讀書網(wǎng)站的短評(píng)信息。又例如,收集優(yōu)酷、土豆、愛奇異等視頻類網(wǎng)站的用戶評(píng)論或標(biāo)簽。再例如,收集蝦米、酷狗等音樂類網(wǎng)站中用戶為歌曲創(chuàng)建的標(biāo)簽,如標(biāo)簽舒緩、歐美經(jīng)典、動(dòng)漫、爵士、中國(guó)好聲音、好聽女聲、純音樂坐寸ο
[0048]在步驟S202收集網(wǎng)絡(luò)中對(duì)特定實(shí)體的用戶標(biāo)注信息之后,步驟S204根據(jù)用戶標(biāo)注信息,生成特定實(shí)體、標(biāo)注類屬性信息的結(jié)構(gòu)化數(shù)據(jù)對(duì)。這里的標(biāo)注類屬性信息至少包括標(biāo)注類屬性名稱以及相應(yīng)的標(biāo)注類屬性賦值,此時(shí)生成的結(jié)構(gòu)化數(shù)據(jù)對(duì)的架構(gòu)包括特定實(shí)體、標(biāo)注類屬性名稱以及相應(yīng)的標(biāo)注類屬性賦值,即“特定實(shí)體-標(biāo)注類屬性名稱-標(biāo)注類屬性賦值”三元結(jié)構(gòu)化數(shù)據(jù)對(duì),例如,“明日邊緣-類型-科幻”、“超凡蜘蛛俠2-類型-科幻”、“我相信-類型-勵(lì)志”、“時(shí)間煮雨-類型-流行”、“武極天下-類型-玄幻”、“花都特工-更新-已完結(jié)”等等。
[0049]此外,本發(fā)明還可以對(duì)知識(shí)圖譜進(jìn)行更新操作,在本發(fā)明的優(yōu)選方案中,若當(dāng)前收集的特定實(shí)體已存在于知識(shí)圖譜中,則利用當(dāng)前收集的特定實(shí)體的用戶標(biāo)注信息更新已存在的特定實(shí)體、標(biāo)注類屬性信息的結(jié)構(gòu)化數(shù)據(jù)對(duì);或者,將當(dāng)前收集的特定實(shí)體的用戶標(biāo)注信息生成的特定實(shí)體、標(biāo)注類屬性信息的結(jié)構(gòu)化數(shù)據(jù)對(duì)作為新的知識(shí)條目,插入知識(shí)圖譜。例如,當(dāng)前收集的特定實(shí)體“明日邊緣”已存在于知識(shí)圖譜中,其對(duì)應(yīng)的用戶標(biāo)注信息為“明日邊緣的類型為科幻電影”,當(dāng)前收集的“明日邊緣”對(duì)應(yīng)的用戶標(biāo)注信息為“明日邊緣的類型為愛情電影”,此時(shí)可以利用“明日邊緣-類型-愛情”替換“明日邊緣-類型-科幻”,或者將“明日邊緣-類型-愛情”作為新的知識(shí)條目插入知識(shí)圖譜。當(dāng)然,此處列舉僅是示意性的,并不用于限制本發(fā)明,在實(shí)際應(yīng)用中,可以根據(jù)實(shí)際需求進(jìn)行更新操作。
[0050]進(jìn)一步地,本發(fā)明還可以根據(jù)特定實(shí)體的基本信息,生成特定實(shí)體、基本屬性信息的結(jié)構(gòu)化數(shù)據(jù)對(duì)。這里的基本屬性信息至少包括基本屬性名稱以及相應(yīng)的基本屬性賦值,此時(shí)生成的結(jié)構(gòu)化數(shù)據(jù)對(duì)的架構(gòu)包括特定實(shí)體、基本屬性名稱以及相應(yīng)的基本屬性賦值,即“特定實(shí)體-基本屬性名稱-基本屬性賦值”三元結(jié)構(gòu)化數(shù)據(jù)對(duì),例如,“明日邊緣-地區(qū)-美國(guó)”、“我相信-歌手-群星”等。
[0051]相應(yīng)的,在基于用戶標(biāo)注信息構(gòu)建的知識(shí)圖譜的基礎(chǔ)上,本發(fā)明還提供了一種基于知識(shí)圖譜的影視歌曲搜索的方法。圖3示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的基于知識(shí)圖譜提供搜索的方法的流程圖。如圖3所示,該方法至少包括以下步驟S302至步驟S306。
[0052]步驟S302、接收來自用戶的查詢?cè)~,從查詢?cè)~中解析出實(shí)體名稱以及實(shí)體屬性名稱。
[0053]步驟S304、在知識(shí)圖譜中匹配實(shí)體名稱和/或?qū)嶓w屬性名稱,查找到相應(yīng)的結(jié)構(gòu)化數(shù)據(jù)對(duì)。
[0054]步驟S306、查找結(jié)構(gòu)化數(shù)據(jù)對(duì)中實(shí)體屬性名稱對(duì)應(yīng)的屬性賦值,并將屬性賦值提供給用戶。
[0055]本發(fā)明基于結(jié)構(gòu)化數(shù)據(jù)對(duì)對(duì)外提供搜索服務(wù),能夠直觀、精確地將屬性賦值作為搜索結(jié)果提供給用戶,解決了相關(guān)技術(shù)中在搜索結(jié)果中無法直接地展示這些信息,需要用戶花費(fèi)較多時(shí)間從相關(guān)網(wǎng)頁中篩選出這部分信息的問題,從而提高搜索效率,提升用戶搜索體驗(yàn)。并且,基于結(jié)構(gòu)化數(shù)據(jù)的特點(diǎn),本發(fā)明能夠?qū)⑾嚓P(guān)知識(shí)信息系統(tǒng)化地提供給用戶,使得用戶獲取更多的知識(shí)信息。
[0056]上文步驟S302解析出查詢?cè)~中包含的實(shí)體名稱及實(shí)體屬性名稱可以通過多種方式來實(shí)現(xiàn)。例如,在預(yù)先配置的、包含實(shí)體名稱和實(shí)體屬性名稱的索引詞中匹配查詢?cè)~,進(jìn)而根據(jù)匹配的結(jié)果,得到該查詢?cè)~對(duì)應(yīng)的實(shí)體名稱和實(shí)體屬性名稱,如預(yù)先在索引詞中配置“科幻類的電影”,若用戶搜索“科幻類的電影”時(shí),即命中索引詞。又例如,在預(yù)先配置的、包含實(shí)體屬性名稱的正則規(guī)則中匹配查詢?cè)~,進(jìn)而根據(jù)匹配的結(jié)果,得到該查詢?cè)~對(duì)應(yīng)的實(shí)體名稱和實(shí)體屬性名稱,如預(yù)先配置正則規(guī)則“~(.+ ?)的電影”,若用戶搜索“愛情類的電影”時(shí),就匹配上了這條正則規(guī)則,即正則命中。再例如,對(duì)查詢?cè)~作分詞處理,并在預(yù)置的、包含實(shí)體名稱及實(shí)體屬性名稱的詞類別組合中匹配查詢?cè)~對(duì)應(yīng)的分詞,進(jìn)而根據(jù)匹配的結(jié)果,得到查詢?cè)~對(duì)應(yīng)的實(shí)體名稱和實(shí)體屬性名稱。舉例來說,預(yù)先配置“電影”為關(guān)鍵詞、“科幻類”為屬性詞,“的”為停用詞,然后再配置詞類別的組合規(guī)則,比如配置一條組合規(guī)則,屬性詞關(guān)鍵詞,若用戶搜索“科幻類的電影”,則先對(duì)查詢?cè)~“科幻類的電影”作分詞處理,結(jié)果為科幻類/的/電影,拋掉停用詞“的”,剩下“科幻類電影”,匹配上了“屬性詞關(guān)鍵詞”這條組合規(guī)則。
[0057]步驟S306查找結(jié)構(gòu)化數(shù)據(jù)對(duì)中實(shí)體屬性名稱對(duì)應(yīng)的屬性賦值,并將屬性賦值提供給用戶。進(jìn)一步地,本發(fā)明還可以將屬性賦值相關(guān)的信息提供給用戶,使得用戶獲取更多的知識(shí)信息。例如,用戶輸入的查詢?cè)~為“好看的科幻電影”,通過步驟S302至步驟S304,查找相應(yīng)的結(jié)構(gòu)化數(shù)據(jù)對(duì)為“明日邊緣-類型-科幻”、“星際穿越-類型-科幻”等,進(jìn)而將“明日邊緣”、“星際穿越”等提供給用戶。進(jìn)一步地,本發(fā)明還可以將“明日邊緣”、“星際穿越”的播放資源地址、下載地址、用戶評(píng)論信息等提供給用戶,其搜索結(jié)果如圖4所示。圖4以圖框的形式展示歌曲信息,在實(shí)際應(yīng)用中,圖框本身可以是其他形狀或顏色,也可以隱藏。圖4中,當(dāng)用戶點(diǎn)擊“明日邊緣”、“星際穿越”等可以直接進(jìn)入播放頁面播放影片。
[0058]在本發(fā)明的另一個(gè)實(shí)施例中,用戶輸入的查詢?cè)~為“好聽的流行音樂”,通過步驟S302至步驟S304,查找匹配的結(jié)構(gòu)化數(shù)據(jù)對(duì)為“時(shí)間煮雨-類型-流行”、“泡沫-類型-流行”、“雪人-類型-流行”等,進(jìn)而將“時(shí)間煮雨”、“泡沫”、“雪人”等提供給用戶。進(jìn)一步地,本發(fā)明還可以將“時(shí)間煮雨”、“泡沫”、“雪人”的播放資源地址、下載地址、用戶評(píng)論信息等提供給用戶,其搜索結(jié)果如圖5所示。圖5以圖框的形式展示歌曲信息,在實(shí)際應(yīng)用中,圖框本身可以是其他形狀或顏色,也可以隱藏。圖5中,當(dāng)用戶點(diǎn)擊“時(shí)間煮雨”、“泡沫”、“雪人”等可以直接進(jìn)入播放頁面播放音樂。進(jìn)一步地,當(dāng)用戶點(diǎn)擊“更多流行歌曲”時(shí),會(huì)跳轉(zhuǎn)到鏈接 “http://music, s0.com” 查找。
[0059]在本發(fā)明的再一個(gè)實(shí)施例中,用戶輸入的查詢?cè)~為“玄幻小說”,通過步驟S302至步驟S304,查找匹配的結(jié)構(gòu)化數(shù)據(jù)對(duì)為“武極天下-類型-小說”、“極品仙商-類型-玄幻”等,進(jìn)而將“武極天下”、“極品仙商”等提供給用戶。進(jìn)一步地,本發(fā)明還可以將“武極天下”、“極品仙商”等的閱讀資源地址、下載地址、用戶評(píng)論信息等提供給用戶,其搜索結(jié)果如圖6所示。圖6以圖框的形式展示歌曲信息,在實(shí)際應(yīng)用中,圖框本身可以是其他形狀或顏色,也可以隱藏。圖6中,當(dāng)用戶點(diǎn)擊“武極天下”、“極品仙商”等可以直接進(jìn)入閱讀頁面閱讀小說。進(jìn)一步地,當(dāng)用戶點(diǎn)擊“查看更多”按鍵時(shí),可以展示更多的玄幻類小說。
[0060]基于同一發(fā)明構(gòu)思,本發(fā)明實(shí)施例還提供了一種基于用戶標(biāo)注信息構(gòu)建知識(shí)圖譜的裝置,以實(shí)現(xiàn)上述基于用戶標(biāo)注信息構(gòu)建知識(shí)圖譜的方法。
[0061]圖7示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的基于用戶標(biāo)注信息構(gòu)建知識(shí)圖譜的裝置的結(jié)構(gòu)示意圖。參見圖7,該裝置至少可以包括:收集器710、數(shù)據(jù)對(duì)生成器720以及知識(shí)圖譜構(gòu)建器730。
[0062]現(xiàn)介紹本發(fā)明實(shí)施例的基于用戶標(biāo)注信息構(gòu)建知識(shí)圖譜的裝置的各組成或器件的功能以及各部分間的連接關(guān)系:
[0063]收集器710,適于收集網(wǎng)絡(luò)中對(duì)特定實(shí)體的用戶標(biāo)注信息;
[0064]數(shù)據(jù)對(duì)生成器720,與收集器710相耦合,適于根據(jù)用戶標(biāo)注信息,生成特定實(shí)體、標(biāo)注類屬性信息的結(jié)構(gòu)化數(shù)據(jù)對(duì);
[0065]知識(shí)圖譜構(gòu)建器730,與數(shù)據(jù)對(duì)生成器720相耦合,適于利用結(jié)構(gòu)化數(shù)據(jù)對(duì)作為知識(shí)條目,構(gòu)建知識(shí)圖譜。
[0066]在一個(gè)實(shí)施例中,標(biāo)注類屬性信息至少包括標(biāo)注類屬性名稱以及相應(yīng)的標(biāo)注類屬性賦值。
[0067]在一個(gè)實(shí)施例中,上述知識(shí)圖譜構(gòu)建器730還適于:若當(dāng)前收集的特定實(shí)體已存在于知識(shí)圖譜中,則利用當(dāng)前收集的特定實(shí)體的用戶標(biāo)注信息更新已存在的特定實(shí)體、標(biāo)注類屬性信息的結(jié)構(gòu)化數(shù)據(jù)對(duì);或者,將當(dāng)前收集的特定實(shí)體的用戶標(biāo)注信息生成的特定實(shí)體、標(biāo)注類屬性信息的結(jié)構(gòu)化數(shù)據(jù)對(duì)作為新的知識(shí)條目,插入知識(shí)圖譜。
[0068]在一個(gè)實(shí)施例中,特定實(shí)體包括下列至少之一:影視、視頻、音樂、小說、論壇。
[0069]在一個(gè)實(shí)施例中,用戶標(biāo)注信息包括下列至少之一:用戶評(píng)論信息、用戶創(chuàng)建的標(biāo)簽、用戶選取的標(biāo)簽。
[0070]相應(yīng)的,本發(fā)明實(shí)施例還提供了基于知識(shí)圖譜提供搜索的裝置,以實(shí)現(xiàn)上述基于知識(shí)圖譜提供搜索的方法。
[0071]圖8示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的基于知識(shí)圖譜提供搜索的裝置的結(jié)構(gòu)示意圖。參見圖8,該裝置至少可以包括:數(shù)據(jù)輸入器810、解析器820、知識(shí)圖譜數(shù)據(jù)庫(kù)830、查找器840以及數(shù)據(jù)輸出器850。
[0072]現(xiàn)介紹本發(fā)明實(shí)施例的基于知識(shí)圖譜提供搜索的裝置的各組成或器件的功能以及各部分間的連接關(guān)系:
[0073]數(shù)據(jù)輸入器810,適于接收來自用戶的查詢?cè)~;
[0074]解析器820,與數(shù)據(jù)輸入器810相耦合,適于從查詢?cè)~中解析出實(shí)體名稱以及實(shí)體屬性名稱;
[0075]知識(shí)圖譜數(shù)據(jù)庫(kù)830,適于存儲(chǔ)結(jié)構(gòu)化數(shù)據(jù)對(duì);
[0076]查找器840,與解析器820以及知識(shí)圖譜數(shù)據(jù)庫(kù)830相耦合,適于在知識(shí)圖譜數(shù)據(jù)庫(kù)中匹配實(shí)體名稱和/或?qū)嶓w屬性名稱,查找到相應(yīng)的結(jié)構(gòu)化數(shù)據(jù)對(duì),查找結(jié)構(gòu)化數(shù)據(jù)對(duì)中實(shí)體屬性名稱對(duì)應(yīng)的屬性賦值;
[0077]數(shù)據(jù)輸出器850,與查找器840相耦合,適于將屬性賦值提供給用戶。
[0078]在一個(gè)實(shí)施例中,實(shí)體包括下列至少之一:影視、視頻、音樂、小說、論壇。
[0079]根據(jù)上述任意一個(gè)優(yōu)選實(shí)施例或多個(gè)優(yōu)選實(shí)施例的組合,本發(fā)明實(shí)施例能夠達(dá)到如下有益效果:
[0080]本發(fā)明提供了基于用戶標(biāo)注信息構(gòu)建知識(shí)圖譜的方案,首先收集網(wǎng)絡(luò)中對(duì)特定實(shí)體的用戶標(biāo)注信息,隨后根據(jù)用戶標(biāo)注信息,生成特定實(shí)體、標(biāo)注類屬性信息的結(jié)構(gòu)化數(shù)據(jù)對(duì),進(jìn)而利用結(jié)構(gòu)化數(shù)據(jù)對(duì)作為知識(shí)條目,構(gòu)建知識(shí)圖譜。由此,本發(fā)明基于網(wǎng)絡(luò)中對(duì)特定實(shí)體的用戶標(biāo)注信息生成架構(gòu)包括特定實(shí)體、標(biāo)注類屬性信息的結(jié)構(gòu)化數(shù)據(jù)對(duì),基于結(jié)構(gòu)化數(shù)據(jù)對(duì)對(duì)外提供搜索服務(wù)時(shí),能夠直觀、精確地將標(biāo)注類屬性信息作為搜索結(jié)果提供給用戶,解決了相關(guān)技術(shù)中在搜索結(jié)果中無法直接地展示這些信息,需要用戶花費(fèi)較多時(shí)間從相關(guān)網(wǎng)頁中篩選出這部分信息的問題,從而提高搜索效率,提升用戶搜索體驗(yàn)。并且,本發(fā)明收集用戶對(duì)特定實(shí)體的用戶標(biāo)注信息,其能夠反映大多數(shù)用戶的主觀意見,可以大幅提升知識(shí)圖譜的適用范圍,使其能夠更好的理解用戶。另外,本發(fā)明能夠充分利用海量用戶的力量對(duì)特定實(shí)體進(jìn)行信息的標(biāo)注,收集的用戶標(biāo)注信息豐富、全面,極大改善用戶搜索體驗(yàn),且無需投入大量人力資源,實(shí)現(xiàn)節(jié)約成本的目的。此外,基于結(jié)構(gòu)化數(shù)據(jù)的特點(diǎn),本發(fā)明能夠?qū)⑾嚓P(guān)知識(shí)信息系統(tǒng)化地提供給用戶,使得用戶獲取更多的知識(shí)信息。
[0081]在此處所提供的說明書中,說明了大量具體細(xì)節(jié)。然而,能夠理解,本發(fā)明的實(shí)施例可以在沒有這些具體細(xì)節(jié)的情況下實(shí)踐。在一些實(shí)例中,并未詳細(xì)示出公知的方法、結(jié)構(gòu)和技術(shù),以便不模糊對(duì)本說明書的理解。
[0082]類似地,應(yīng)當(dāng)理解,為了精簡(jiǎn)本公開并幫助理解各個(gè)發(fā)明方面中的一個(gè)或多個(gè),在上面對(duì)本發(fā)明的示例性實(shí)施例的描述中,本發(fā)明的各個(gè)特征有時(shí)被一起分組到單個(gè)實(shí)施例、圖、或者對(duì)其的描述中。然而,并不應(yīng)將該公開的方法解釋成反映如下意圖:即所要求保護(hù)的本發(fā)明要求比在每個(gè)權(quán)利要求中所明確記載的特征更多的特征。更確切地說,如下面的權(quán)利要求書所反映的那樣,發(fā)明方面在于少于前面公開的單個(gè)實(shí)施例的所有特征。因此,遵循【具體實(shí)施方式】的權(quán)利要求書由此明確地并入該【具體實(shí)施方式】,其中每個(gè)權(quán)利要求本身都作為本發(fā)明的單獨(dú)實(shí)施例。
[0083]本領(lǐng)域那些技術(shù)人員可以理解,可以對(duì)實(shí)施例中的設(shè)備中的模塊進(jìn)行自適應(yīng)性地改變并且把它們?cè)O(shè)置在與該實(shí)施例不同的一個(gè)或多個(gè)設(shè)備中??梢园褜?shí)施例中的模塊或單元或組件組合成一個(gè)模塊或單元或組件,以及此外可以把它們分成多個(gè)子模塊或子單元或子組件。除了這樣的特征和/或過程或者單元中的至少一些是相互排斥之外,可以采用任何組合對(duì)本說明書(包括伴隨的權(quán)利要求、摘要和附圖)中公開的所有特征以及如此公開的任何方法或者設(shè)備的所有過程或單元進(jìn)行組合。除非另外明確陳述,本說明書(包括伴隨的權(quán)利要求、摘要和附圖)中公開的每個(gè)特征可以由提供相同、等同或相似目的的替代特征來代替。
[0084]此外,本領(lǐng)域的技術(shù)人員能夠理解,盡管在此所述的一些實(shí)施例包括其它實(shí)施例中所包括的某些特征而不是其它特征,但是不同實(shí)施例的特征的組合意味著處于本發(fā)明的范圍之內(nèi)并且形成不同的實(shí)施例。例如,在權(quán)利要求書中,所要求保護(hù)的實(shí)施例的任意之一都可以以任意的組合方式來使用。
[0085]本發(fā)明的各個(gè)部件實(shí)施例可以以硬件實(shí)現(xiàn),或者以在一個(gè)或者多個(gè)處理器上運(yùn)行的軟件模塊實(shí)現(xiàn),或者以它們的組合實(shí)現(xiàn)。本領(lǐng)域的技術(shù)人員應(yīng)當(dāng)理解,可以在實(shí)踐中使用微處理器或者數(shù)字信號(hào)處理器(DSP)來實(shí)現(xiàn)根據(jù)本發(fā)明實(shí)施例的基于用戶標(biāo)注信息構(gòu)建知識(shí)圖譜的裝置以及基于知識(shí)圖譜提供搜索的裝置中的一些或者全部部件的一些或者全部功能。本發(fā)明還可以實(shí)現(xiàn)為用于執(zhí)行這里所描述的方法的一部分或者全部的設(shè)備或者裝置程序(例如,計(jì)算機(jī)程序和計(jì)算機(jī)程序產(chǎn)品)。這樣的實(shí)現(xiàn)本發(fā)明的程序可以存儲(chǔ)在計(jì)算機(jī)可讀介質(zhì)上,或者可以具有一個(gè)或者多個(gè)信號(hào)的形式。這樣的信號(hào)可以從因特網(wǎng)網(wǎng)站上下載得到,或者在載體信號(hào)上提供,或者以任何其他形式提供。
[0086]應(yīng)該注意的是上述實(shí)施例對(duì)本發(fā)明進(jìn)行說明而不是對(duì)本發(fā)明進(jìn)行限制,并且本領(lǐng)域技術(shù)人員在不脫離所附權(quán)利要求的范圍的情況下可設(shè)計(jì)出替換實(shí)施例。在權(quán)利要求中,不應(yīng)將位于括號(hào)之間的任何參考符號(hào)構(gòu)造成對(duì)權(quán)利要求的限制。單詞“包含”不排除存在未列在權(quán)利要求中的元件或步驟。位于元件之前的單詞“一”或“一個(gè)”不排除存在多個(gè)這樣的元件。本發(fā)明可以借助于包括有若干不同元件的硬件以及借助于適當(dāng)編程的計(jì)算機(jī)來實(shí)現(xiàn)。在列舉了若干裝置的單元權(quán)利要求中,這些裝置中的若干個(gè)可以是通過同一個(gè)硬件項(xiàng)來具體體現(xiàn)。單詞第一、第二、以及第三等的使用不表示任何順序??蓪⑦@些單詞解釋為名稱。
[0087]至此,本領(lǐng)域技術(shù)人員應(yīng)認(rèn)識(shí)到,雖然本文已詳盡示出和描述了本發(fā)明的多個(gè)示例性實(shí)施例,但是,在不脫離本發(fā)明精神和范圍的情況下,仍可根據(jù)本發(fā)明公開的內(nèi)容直接確定或推導(dǎo)出符合本發(fā)明原理的許多其他變型或修改。因此,本發(fā)明的范圍應(yīng)被理解和認(rèn)定為覆蓋了所有這些其他變型或修改。
[0088]本發(fā)明還公開了:
[0089]Al、一種基于用戶標(biāo)注信息構(gòu)建知識(shí)圖譜的方法,包括:
[0090]收集網(wǎng)絡(luò)中對(duì)特定實(shí)體的用戶標(biāo)注信息;
[0091]根據(jù)所述用戶標(biāo)注信息,生成所述特定實(shí)體、標(biāo)注類屬性信息的結(jié)構(gòu)化數(shù)據(jù)對(duì);
[0092]利用所述結(jié)構(gòu)化數(shù)據(jù)對(duì)作為知識(shí)條目,構(gòu)建知識(shí)圖譜。
[0093]A2、根據(jù)Al所述的方法,其中,所述標(biāo)注類屬性信息至少包括標(biāo)注類屬性名稱以及相應(yīng)的標(biāo)注類屬性賦值。
[0094]A3、根據(jù)Al或A2所述的方法,其中,還包括:
[0095]若當(dāng)前收集的特定實(shí)體已存在于所述知識(shí)圖譜中,則利用當(dāng)前收集的所述特定實(shí)體的用戶標(biāo)注信息更新已存在的所述特定實(shí)體、標(biāo)注類屬性信息的結(jié)構(gòu)化數(shù)據(jù)對(duì);或者,將當(dāng)前收集的特定實(shí)體的用戶標(biāo)注信息生成的所述特定實(shí)體、標(biāo)注類屬性信息的結(jié)構(gòu)化數(shù)據(jù)對(duì)作為新的知識(shí)條目,插入所述知識(shí)圖譜。
[0096]A4、根據(jù)A1-A3任一項(xiàng)所述的方法,其中,所述特定實(shí)體包括下列至少之一:影視、視頻、音樂、小說、論壇。
[0097]A5、根據(jù)A1-A4任一項(xiàng)所述的方法,其中,所述用戶標(biāo)注信息包括下列至少之一:用戶評(píng)論信息、用戶創(chuàng)建的標(biāo)簽、用戶選取的標(biāo)簽。
[0098]A6、一種基于知識(shí)圖譜提供搜索的方法,包括:
[0099]接收來自用戶的查詢?cè)~,從所述查詢?cè)~中解析出實(shí)體名稱以及實(shí)體屬性名稱;
[0100]在知識(shí)圖譜中匹配所述實(shí)體名稱和/或?qū)嶓w屬性名稱,查找到相應(yīng)的結(jié)構(gòu)化數(shù)據(jù)對(duì);
[0101]查找所述結(jié)構(gòu)化數(shù)據(jù)對(duì)中所述實(shí)體屬性名稱對(duì)應(yīng)的屬性賦值,并將所述屬性賦值提供給所述用戶。
[0102]A7、根據(jù)A6所述的方法,其中,所述實(shí)體包括下列至少之一:影視、視頻、音樂、小說、論壇。
[0103]B8、一種基于用戶標(biāo)注信息構(gòu)建知識(shí)圖譜的裝置,包括:
[0104]收集器,適于收集網(wǎng)絡(luò)中對(duì)特定實(shí)體的用戶標(biāo)注信息;
[0105]數(shù)據(jù)對(duì)生成器,適于根據(jù)所述用戶標(biāo)注信息,生成所述特定實(shí)體、標(biāo)注類屬性信息的結(jié)構(gòu)化數(shù)據(jù)對(duì);
[0106]知識(shí)圖譜構(gòu)建器,適于利用所述結(jié)構(gòu)化數(shù)據(jù)對(duì)作為知識(shí)條目,構(gòu)建知識(shí)圖譜。
[0107]B9、根據(jù)B8所述的裝置,其中,所述標(biāo)注類屬性信息至少包括標(biāo)注類屬性名稱以及相應(yīng)的標(biāo)注類屬性賦值。
[0108]B10、根據(jù)B8或B9所述的裝置,其中,所述知識(shí)圖譜構(gòu)建器還適于:
[0109]若當(dāng)前收集的特定實(shí)體已存在于所述知識(shí)圖譜中,則利用當(dāng)前收集的所述特定實(shí)體的用戶標(biāo)注信息更新已存在的所述特定實(shí)體、標(biāo)注類屬性信息的結(jié)構(gòu)化數(shù)據(jù)對(duì);或者,將當(dāng)前收集的特定實(shí)體的用戶標(biāo)注信息生成的所述特定實(shí)體、標(biāo)注類屬性信息的結(jié)構(gòu)化數(shù)據(jù)對(duì)作為新的知識(shí)條目,插入所述知識(shí)圖譜。
[0110]B11、根據(jù)B8-B10任一項(xiàng)所述的裝置,其中,所述特定實(shí)體包括下列至少之一:影視、視頻、音樂、小說、論壇。
[0111]B12、根據(jù)B8-B11任一項(xiàng)所述的裝置,其中,所述用戶標(biāo)注信息包括下列至少之一:用戶評(píng)論信息、用戶創(chuàng)建的標(biāo)簽、用戶選取的標(biāo)簽。
[0112]B13、一種基于知識(shí)圖譜提供搜索的裝置,包括:
[0113]數(shù)據(jù)輸入器,適于接收來自用戶的查詢?cè)~;
[0114]解析器,適于從所述查詢?cè)~中解析出實(shí)體名稱以及實(shí)體屬性名稱;
[0115]知識(shí)圖譜數(shù)據(jù)庫(kù),適于存儲(chǔ)結(jié)構(gòu)化數(shù)據(jù)對(duì);
[0116]查找器,適于在所述知識(shí)圖譜數(shù)據(jù)庫(kù)中匹配所述實(shí)體名稱和/或?qū)嶓w屬性名稱,查找到相應(yīng)的結(jié)構(gòu)化數(shù)據(jù)對(duì),查找所述結(jié)構(gòu)化數(shù)據(jù)對(duì)中所述實(shí)體屬性名稱對(duì)應(yīng)的屬性賦值;
[0117]數(shù)據(jù)輸出器,適于將所述屬性賦值提供給所述用戶。
[0118]B14、根據(jù)B13所述的裝置,其中,所述實(shí)體包括下列至少之一:影視、視頻、音樂、小說、論壇。
【權(quán)利要求】
1.一種基于用戶標(biāo)注信息構(gòu)建知識(shí)圖譜的方法,包括: 收集網(wǎng)絡(luò)中對(duì)特定實(shí)體的用戶標(biāo)注信息; 根據(jù)所述用戶標(biāo)注信息,生成所述特定實(shí)體、標(biāo)注類屬性信息的結(jié)構(gòu)化數(shù)據(jù)對(duì); 利用所述結(jié)構(gòu)化數(shù)據(jù)對(duì)作為知識(shí)條目,構(gòu)建知識(shí)圖譜。
2.根據(jù)權(quán)利要求1所述的方法,其中,所述標(biāo)注類屬性信息至少包括標(biāo)注類屬性名稱以及相應(yīng)的標(biāo)注類屬性賦值。
3.根據(jù)權(quán)利要求1或2所述的方法,其中,還包括: 若當(dāng)前收集的特定實(shí)體已存在于所述知識(shí)圖譜中,則利用當(dāng)前收集的所述特定實(shí)體的用戶標(biāo)注信息更新已存在的所述特定實(shí)體、標(biāo)注類屬性信息的結(jié)構(gòu)化數(shù)據(jù)對(duì);或者,將當(dāng)前收集的特定實(shí)體的用戶標(biāo)注信息生成的所述特定實(shí)體、標(biāo)注類屬性信息的結(jié)構(gòu)化數(shù)據(jù)對(duì)作為新的知識(shí)條目,插入所述知識(shí)圖譜。
4.根據(jù)權(quán)利要求1-3任一項(xiàng)所述的方法,其中,所述特定實(shí)體包括下列至少之一:影視、視頻、音樂、小說、論壇。
5.根據(jù)權(quán)利要求1-4任一項(xiàng)所述的方法,其中,所述用戶標(biāo)注信息包括下列至少之一:用戶評(píng)論信息、用戶創(chuàng)建的標(biāo)簽、用戶選取的標(biāo)簽。
6.一種基于知識(shí)圖譜提供搜索的方法,包括: 接收來自用戶的查詢?cè)~,從所述查詢?cè)~中解析出實(shí)體名稱以及實(shí)體屬性名稱; 在知識(shí)圖譜中匹配所述實(shí)體名稱和/或?qū)嶓w屬性名稱,查找到相應(yīng)的結(jié)構(gòu)化數(shù)據(jù)對(duì);查找所述結(jié)構(gòu)化數(shù)據(jù)對(duì)中所述實(shí)體屬性名稱對(duì)應(yīng)的屬性賦值,并將所述屬性賦值提供給所述用戶。
7.根據(jù)權(quán)利要求6所述的方法,其中,所述實(shí)體包括下列至少之一:影視、視頻、音樂、小說、論壇。
8.一種基于用戶標(biāo)注信息構(gòu)建知識(shí)圖譜的裝置,包括: 收集器,適于收集網(wǎng)絡(luò)中對(duì)特定實(shí)體的用戶標(biāo)注信息; 數(shù)據(jù)對(duì)生成器,適于根據(jù)所述用戶標(biāo)注信息,生成所述特定實(shí)體、標(biāo)注類屬性信息的結(jié)構(gòu)化數(shù)據(jù)對(duì); 知識(shí)圖譜構(gòu)建器,適于利用所述結(jié)構(gòu)化數(shù)據(jù)對(duì)作為知識(shí)條目,構(gòu)建知識(shí)圖譜。
9.根據(jù)權(quán)利要求8所述的裝置,其中,所述標(biāo)注類屬性信息至少包括標(biāo)注類屬性名稱以及相應(yīng)的標(biāo)注類屬性賦值。
10.一種基于知識(shí)圖譜提供搜索的裝置,包括: 數(shù)據(jù)輸入器,適于接收來自用戶的查詢?cè)~; 解析器,適于從所述查詢?cè)~中解析出實(shí)體名稱以及實(shí)體屬性名稱; 知識(shí)圖譜數(shù)據(jù)庫(kù),適于存儲(chǔ)結(jié)構(gòu)化數(shù)據(jù)對(duì); 查找器,適于在所述知識(shí)圖譜數(shù)據(jù)庫(kù)中匹配所述實(shí)體名稱和/或?qū)嶓w屬性名稱,查找到相應(yīng)的結(jié)構(gòu)化數(shù)據(jù)對(duì),查找所述結(jié)構(gòu)化數(shù)據(jù)對(duì)中所述實(shí)體屬性名稱對(duì)應(yīng)的屬性賦值;數(shù)據(jù)輸出器,適于將所述屬性賦值提供給所述用戶。
【文檔編號(hào)】G06F17/30GK104462506SQ201410806174
【公開日】2015年3月25日 申請(qǐng)日期:2014年12月19日 優(yōu)先權(quán)日:2014年12月19日
【發(fā)明者】晉松, 王志龍, 吳凱 申請(qǐng)人:北京奇虎科技有限公司, 奇智軟件(北京)有限公司