搜索方法和搜索裝置制造方法
【專(zhuān)利摘要】本發(fā)明公開(kāi)了一種搜索方法,包括:S1、搜索引擎獲取搜索語(yǔ)句;S2、搜索引擎將搜索語(yǔ)句轉(zhuǎn)化為結(jié)構(gòu)化查詢(xún)?cè)~;以及S3、搜索引擎根據(jù)結(jié)構(gòu)化查詢(xún)?cè)~進(jìn)行查詢(xún)以獲取搜索結(jié)果。本發(fā)明實(shí)施例的搜索方法,實(shí)現(xiàn)了不管搜索語(yǔ)句的復(fù)雜程度均可將其轉(zhuǎn)化為結(jié)構(gòu)化查詢(xún)?cè)~,并結(jié)合數(shù)據(jù)庫(kù)信息進(jìn)行知識(shí)推理以自動(dòng)產(chǎn)生搜索語(yǔ)句對(duì)應(yīng)的答案,提高了準(zhǔn)確率,對(duì)于用戶(hù)來(lái)說(shuō),得到了更為精確的搜索結(jié)果,提升了用戶(hù)體驗(yàn)。本發(fā)明還公開(kāi)了一種搜索裝置。
【專(zhuān)利說(shuō)明】搜索方法和搜索裝置
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及互聯(lián)網(wǎng)【技術(shù)領(lǐng)域】,尤其涉及一種搜索方法和搜索裝置。
【背景技術(shù)】
[0002] 目前,互聯(lián)網(wǎng)上的搜索引擎主要通過(guò)提供和用戶(hù)Query (查詢(xún)?cè)~)相關(guān)的網(wǎng)頁(yè)信息 來(lái)滿(mǎn)足獲取信息的需求。如果用戶(hù)的Query是一個(gè)特定信息的請(qǐng)求,如"謝霆鋒是誰(shuí)的兒 子",那么用戶(hù)期望得到該Q uery對(duì)應(yīng)的答案"謝賢",而不是相關(guān)的網(wǎng)頁(yè)。
[0003] 相關(guān)技術(shù)中,有一些搜索引擎已經(jīng)實(shí)現(xiàn)了上述功能,但是這些搜索引擎只能為簡(jiǎn) 單Query提供答案,而無(wú)法處理復(fù)雜Query,這里提到的復(fù)雜Query包括:(1)表達(dá)相似但語(yǔ) 義不同的Query,如"謝霆鋒是誰(shuí)的兒子?","謝霆鋒的兒子是誰(shuí)","誰(shuí)是謝霆鋒的兒子"等; (2)內(nèi)容復(fù)雜的Query,如"劉德華和那些女演員演過(guò)電影?"、"演過(guò)還珠格格的女演員演過(guò) 的電視劇"等。這樣,當(dāng)用戶(hù)輸入的Query較為復(fù)雜時(shí),搜索引擎就無(wú)法為用戶(hù)提供其期望 的答案,導(dǎo)致準(zhǔn)確率降低,用戶(hù)體驗(yàn)變差。
【發(fā)明內(nèi)容】
[0004] 本發(fā)明的目的旨在至少在一定程度上解決上述的技術(shù)問(wèn)題之一。
[0005] 為此,本發(fā)明的一個(gè)目的在于提出一種搜索方法。該方法實(shí)現(xiàn)了不管搜索語(yǔ)句的 復(fù)雜程度均可將其轉(zhuǎn)化為結(jié)構(gòu)化查詢(xún)?cè)~,并結(jié)合數(shù)據(jù)庫(kù)信息進(jìn)行知識(shí)推理以自動(dòng)產(chǎn)生搜索 語(yǔ)句對(duì)應(yīng)的答案,提高了準(zhǔn)確率。
[0006] 本發(fā)明的另一個(gè)目的在于提出一種搜索裝置。
[0007] 為了實(shí)現(xiàn)上述目的,本發(fā)明一方面實(shí)施例的搜索方法,包括:S1、搜索引擎獲取搜 索語(yǔ)句;S2、所述搜索引擎將所述搜索語(yǔ)句轉(zhuǎn)化為結(jié)構(gòu)化查詢(xún)?cè)~;以及S3、所述搜索引擎根 據(jù)所述結(jié)構(gòu)化查詢(xún)?cè)~進(jìn)行查詢(xún)以獲取搜索結(jié)果。
[0008] 本發(fā)明實(shí)施例的搜索方法,通過(guò)將搜索語(yǔ)句轉(zhuǎn)化為結(jié)構(gòu)化查詢(xún)?cè)~,并根據(jù)結(jié)構(gòu)化 查詢(xún)?cè)~在結(jié)構(gòu)化數(shù)據(jù)庫(kù)中進(jìn)行查詢(xún)以獲取對(duì)應(yīng)的搜索結(jié)果,實(shí)現(xiàn)了不管搜索語(yǔ)句的復(fù)雜程 度均可將其轉(zhuǎn)化為結(jié)構(gòu)化查詢(xún)?cè)~,并結(jié)合數(shù)據(jù)庫(kù)信息進(jìn)行知識(shí)推理以自動(dòng)產(chǎn)生搜索語(yǔ)句對(duì) 應(yīng)的答案,提高了準(zhǔn)確率,對(duì)于用戶(hù)來(lái)說(shuō),得到了更為精確的搜索結(jié)果,提升了用戶(hù)體驗(yàn)。 [000 9]為了實(shí)現(xiàn)上述目的,本發(fā)明另一方面實(shí)施例的搜索裝置,包括:獲取模塊,用于獲 取搜索語(yǔ)句;轉(zhuǎn)化模塊,用于將所述搜索語(yǔ)句轉(zhuǎn)化為結(jié)構(gòu)化查詢(xún)?cè)~;以及查詢(xún)模塊,用于根 據(jù)所述結(jié)構(gòu)化查詢(xún)?cè)~進(jìn)行查詢(xún)以獲取搜索結(jié)果。
[0010]本發(fā)明實(shí)施例的搜索裝置,通過(guò)獲取模塊獲取搜索語(yǔ)句,轉(zhuǎn)化模塊將搜索語(yǔ)句轉(zhuǎn) 化為結(jié)構(gòu)化查詢(xún)?cè)~,查詢(xún)模塊根據(jù)結(jié)構(gòu)化查詢(xún)?cè)~在結(jié)構(gòu)化數(shù)據(jù)庫(kù)中進(jìn)行查詢(xún)以獲取對(duì)應(yīng)的 搜索結(jié)果,實(shí)現(xiàn)了不管搜索語(yǔ)句的復(fù)雜程度均可將其轉(zhuǎn)化為結(jié)構(gòu)化查詢(xún)?cè)~,并結(jié)合數(shù)據(jù)庫(kù) 信息進(jìn)行知識(shí)推理以自動(dòng)產(chǎn)生搜索語(yǔ)句對(duì)應(yīng)的答案,提高了準(zhǔn)確率,對(duì)于用戶(hù)來(lái)說(shuō),得到了 更為精確的搜索結(jié)果,提升了用戶(hù)體驗(yàn)。
[0011]本發(fā)明附加的方面和優(yōu)點(diǎn)將在下面的描述中部分給出,部分將從下面的描述中變 得明顯,或通過(guò)本發(fā)明的實(shí)踐了解到。
【專(zhuān)利附圖】
【附圖說(shuō)明】
[0012]本發(fā)明上述的和/或附加的方面和優(yōu)點(diǎn)從下面結(jié)合附圖對(duì)實(shí)施例的描述中將變 得明顯和容易理解,其中,
[0013]圖1是根據(jù)本發(fā)明一個(gè)實(shí)施例的搜索方法的流程圖;
[0014]圖2是根據(jù)本發(fā)明另一個(gè)實(shí)施例的搜索方法的流程圖;
[0015]圖3是根據(jù)本發(fā)明一個(gè)實(shí)施例的依存關(guān)系標(biāo)簽的示意圖;
[0016]圖4是根據(jù)本發(fā)明一個(gè)實(shí)施例的搜索語(yǔ)句中各個(gè)詞之間的語(yǔ)義關(guān)系的示意圖; [00Π ]圖5是根據(jù)本發(fā)明一個(gè)實(shí)施例的結(jié)構(gòu)化查詢(xún)?cè)~以二叉樹(shù)的形式進(jìn)行表示的示意 圖;
[0018]圖6是根據(jù)本發(fā)明一個(gè)實(shí)施例的語(yǔ)義分析過(guò)程的示意圖;
[0019]圖7是根據(jù)本發(fā)明一個(gè)實(shí)施例的搜索裝置的結(jié)構(gòu)示意圖;以及
[0020] 圖8是根據(jù)本發(fā)明另一個(gè)實(shí)施例的搜索裝置的結(jié)構(gòu)示意圖。
【具體實(shí)施方式】
[0021] 下面詳細(xì)描述本發(fā)明的實(shí)施例,所述實(shí)施例的示例在附圖中示出,其中自始至終 相同或類(lèi)似的標(biāo)號(hào)表示相同或類(lèi)似的元件或具有相同或類(lèi)似功能的元件。下面通過(guò)參考附 圖描述的實(shí)施例是示例性的,旨在用于解釋本發(fā)明,而不能理解為對(duì)本發(fā)明的限制。
[0022] 下面參考附圖描述根據(jù)本發(fā)明實(shí)施例的搜索方法和搜索裝置。
[0023] 本發(fā)明提出了一種搜索方法,包括:搜索引擎獲取搜索語(yǔ)句;搜索引擎將搜索語(yǔ) 句轉(zhuǎn)化為結(jié)構(gòu)化查詢(xún)?cè)~;以及搜索引擎根據(jù)結(jié)構(gòu)化查詢(xún)?cè)~進(jìn)行查詢(xún)以獲取搜索結(jié)果。
[0024] 圖1是根據(jù)本發(fā)明一個(gè)實(shí)施例的搜索方法的流程圖。如圖1所示,該搜索方法可 以包括:
[0025] S101,搜索引擎獲取搜索語(yǔ)句。
[0026] 其中,在本發(fā)明的實(shí)施例中,搜索語(yǔ)句可以是各種語(yǔ)言的字符(如文字、拼音、符 號(hào)和/或數(shù)字等)中的一種或者它們的組合。
[0027] 例如,搜索引擎可獲取用戶(hù)在瀏覽器提供的輸入框中輸入的搜索語(yǔ)句。
[0028] S102,搜索引擎將搜索語(yǔ)句轉(zhuǎn)化為結(jié)構(gòu)化查詢(xún)?cè)~。
[0029] 具體地,搜索引擎可對(duì)搜索語(yǔ)句進(jìn)行解析,將解析之后的搜索語(yǔ)句進(jìn)行排序或重 組等操作以生成結(jié)構(gòu)化查詢(xún)?cè)~。具體的實(shí)現(xiàn)方式可參照后續(xù)實(shí)施例。其中,在本發(fā)明的 實(shí)施例中,結(jié)構(gòu)化查詢(xún)?cè)~可理解是可以直接用來(lái)查詢(xún)結(jié)構(gòu)化數(shù)據(jù)(例如知識(shí)庫(kù))的邏輯表 達(dá)式,類(lèi)似于 SQL 語(yǔ)言(Structured Query Language,結(jié)構(gòu)化查詢(xún)語(yǔ)言)、SPARQL(Simple Protocol and RDF Query Language,為RDF開(kāi)發(fā)的一種查詢(xún)語(yǔ)目和數(shù)據(jù)犾取協(xié)議)語(yǔ)目等。 這種邏輯表達(dá)式具有很強(qiáng)的結(jié)構(gòu)化特點(diǎn),所以計(jì)算機(jī)可以直接解析該表達(dá)式來(lái)查詢(xún)結(jié)構(gòu)化 數(shù)據(jù)從而獲得答案。
[0030] S103,搜索引擎根據(jù)結(jié)構(gòu)化查詢(xún)?cè)~進(jìn)行查詢(xún)以獲取搜索結(jié)果。
[0031] 具體而言,在本發(fā)明的實(shí)施例中,可根據(jù)結(jié)構(gòu)化查詢(xún)?cè)~進(jìn)行查詢(xún)結(jié)構(gòu)化數(shù)據(jù)庫(kù)以 獲取搜索結(jié)果。其中,在本發(fā)明的實(shí)施例中,結(jié)構(gòu)化數(shù)據(jù)庫(kù)可為三元組數(shù)據(jù)庫(kù)或 SQL數(shù)據(jù)庫(kù) 等。
[0032] 其中,在本發(fā)明的實(shí)施例中,當(dāng)結(jié)構(gòu)化數(shù)據(jù)庫(kù)為三元組數(shù)據(jù)庫(kù)時(shí),可根據(jù)結(jié)構(gòu)化查 詢(xún)?cè)~直接在三元組數(shù)據(jù)庫(kù)中進(jìn)行查詢(xún)以查詢(xún)出對(duì)應(yīng)的搜索結(jié)果;當(dāng)結(jié)構(gòu)化數(shù)據(jù)庫(kù)為SQL數(shù) 據(jù)庫(kù)時(shí),可先將結(jié)構(gòu)化查詢(xún)?cè)~轉(zhuǎn)化為與其對(duì)應(yīng)的SQL查詢(xún)語(yǔ)句,之后可根據(jù)該SQL查詢(xún)語(yǔ)句 在SQL數(shù)據(jù)庫(kù)進(jìn)行查詢(xún)以得到對(duì)應(yīng)的搜索結(jié)果。
[0033] 本發(fā)明實(shí)施例的搜索方法,通過(guò)將搜索語(yǔ)句轉(zhuǎn)化為結(jié)構(gòu)化查詢(xún)?cè)~,并根據(jù)結(jié)構(gòu)化 查詢(xún)?cè)~在結(jié)構(gòu)化數(shù)據(jù)庫(kù)中進(jìn)行查詢(xún)以獲取對(duì)應(yīng)的搜索結(jié)果,實(shí)現(xiàn)了不管搜索語(yǔ)句的復(fù)雜程 度均可將其轉(zhuǎn)化為結(jié)構(gòu)化查詢(xún)?cè)~,并結(jié)合數(shù)據(jù)庫(kù)信息進(jìn)行知識(shí)推理以自動(dòng)產(chǎn)生搜索語(yǔ)句對(duì) 應(yīng)的答案,提高了準(zhǔn)確率,對(duì)于用戶(hù)來(lái)說(shuō),得到了更為精確的搜索結(jié)果,提升了用戶(hù)體驗(yàn)。
[0034]圖2是根據(jù)本發(fā)明的另一個(gè)實(shí)施例的搜索方法的流程圖。如圖2所示,該搜索方 法可以包括:
[0035] S201,搜索引擎獲取搜索語(yǔ)句。
[0036] 其中,在本發(fā)明的實(shí)施例中,搜索語(yǔ)句可以是各種語(yǔ)言的字符(如文字、拼音、符 號(hào)和/或數(shù)字等)中的一種或者它們的組合。
[0037] 例如,搜索引擎可獲取用戶(hù)在瀏覽器提供的輸入框中輸入的搜索語(yǔ)句。
[0038] S202,搜索引擎對(duì)搜索語(yǔ)句進(jìn)行分詞以生成多個(gè)詞。
[0039] 例如,以搜索語(yǔ)句為"劉德華和哪些女演員演過(guò)電影"為例,可通過(guò)現(xiàn)有的分詞技 術(shù)對(duì)該搜索語(yǔ)句進(jìn)行分詞,可得到多個(gè)詞,即"劉德華"、"和"、"哪些""女""演員"、"演過(guò)"、 "電影"。應(yīng)當(dāng)理解,現(xiàn)有的分詞技術(shù)可包括字符串匹配的分詞技術(shù)等。
[0040] S203,搜索引擎對(duì)搜索語(yǔ)句進(jìn)行詞法分析以獲取搜索語(yǔ)句中每個(gè)詞對(duì)應(yīng)的詞性標(biāo) 注標(biāo)簽。
[0041] 其中,應(yīng)當(dāng)理解,詞性標(biāo)注是指根據(jù)句子中的上下文信息給句中的每個(gè)詞確定一 個(gè)最為合適的詞性標(biāo)記。可通過(guò)字符對(duì)每個(gè)詞性進(jìn)行標(biāo)記,即如下面表1所示為詞性標(biāo)注 語(yǔ)料庫(kù)中的一部分:
[0042]
【權(quán)利要求】
1. 一種搜索方法,其特征在于,包括以下步驟: 51、 搜索引擎獲取搜索語(yǔ)句; 52、 所述搜索引擎將所述搜索語(yǔ)句轉(zhuǎn)化為結(jié)構(gòu)化查詢(xún)?cè)~;以及 53、 所述搜索引擎根據(jù)所述結(jié)構(gòu)化查詢(xún)?cè)~進(jìn)行查詢(xún)以獲取搜索結(jié)果。
2. 如權(quán)利要求1所述的搜索方法,其特征在于,所述步驟S2具體包括: 521、 對(duì)所述搜索語(yǔ)句進(jìn)行分詞以生成多個(gè)詞; 522、 對(duì)所述搜索語(yǔ)句進(jìn)行詞法分析以獲取所述搜索語(yǔ)句中每個(gè)詞對(duì)應(yīng)的詞性標(biāo)注標(biāo) 簽; 523、 對(duì)所述搜索語(yǔ)句進(jìn)行句法分析以獲取所述搜索語(yǔ)句中各個(gè)詞之間的依存關(guān)系標(biāo) 簽;以及 524、 根據(jù)所述詞性標(biāo)注標(biāo)簽和所述依存關(guān)系標(biāo)簽生成所述結(jié)構(gòu)化查詢(xún)?cè)~。
3. 如權(quán)利要求2所述的搜索方法,其特征在于,所述步驟S24具體包括: 分別對(duì)所述詞性標(biāo)注標(biāo)簽所對(duì)應(yīng)的詞和所述依存關(guān)系標(biāo)簽所對(duì)應(yīng)的詞進(jìn)行語(yǔ)義分析, 以生成所述搜索語(yǔ)句中各個(gè)詞之間的語(yǔ)義關(guān)系; 根據(jù)所述語(yǔ)義關(guān)系生成所述結(jié)構(gòu)化查詢(xún)?cè)~。
4. 如權(quán)利要求1所述的搜索方法,其特征在于,所述步驟S3具體包括: 根據(jù)所述結(jié)構(gòu)化查詢(xún)?cè)~進(jìn)行查詢(xún)結(jié)構(gòu)化數(shù)據(jù)庫(kù)以獲取所述搜索結(jié)果。
5. 如權(quán)利要求4所述的搜索方法,其特征在于,所述結(jié)構(gòu)化數(shù)據(jù)庫(kù)為三元組數(shù)據(jù)庫(kù)或 結(jié)構(gòu)化查詢(xún)語(yǔ)言SQL數(shù)據(jù)庫(kù)。
6. -種搜索裝置,其特征在于,包括: 獲取模塊,用于獲取搜索語(yǔ)句; 轉(zhuǎn)化模塊,用于將所述搜索語(yǔ)句轉(zhuǎn)化為結(jié)構(gòu)化查詢(xún)?cè)~;以及 查詢(xún)模塊,用于根據(jù)所述結(jié)構(gòu)化查詢(xún)?cè)~進(jìn)行查詢(xún)以獲取搜索結(jié)果。
7. 如權(quán)利要求6所述的搜索裝置,其特征在于,所述轉(zhuǎn)化模塊包括: 分詞單元,用于對(duì)所述搜索語(yǔ)句進(jìn)行分詞以生成多個(gè)詞; 第一獲取單元,用于對(duì)所述搜索語(yǔ)句進(jìn)行詞法分析以獲取所述搜索語(yǔ)句中每個(gè)詞對(duì)應(yīng) 的詞性標(biāo)注標(biāo)簽; 第二獲取單元,用于對(duì)所述搜索語(yǔ)句進(jìn)行句法分析以獲取所述搜索語(yǔ)句中各個(gè)詞之間 的依存關(guān)系標(biāo)簽; 生成單元,用于根據(jù)所述詞性標(biāo)注標(biāo)簽和所述依存關(guān)系標(biāo)簽生成所述結(jié)構(gòu)化查詢(xún)?cè)~。
8. 如權(quán)利要求7所述的搜索裝置,其特征在于,所述生成單元具體用于: 分別對(duì)所述詞性標(biāo)注標(biāo)簽所對(duì)應(yīng)的詞和所述依存關(guān)系標(biāo)簽所對(duì)應(yīng)的詞進(jìn)行語(yǔ)義分析, 以生成所述搜索語(yǔ)句中各個(gè)詞之間的語(yǔ)義關(guān)系; 根據(jù)所述語(yǔ)義關(guān)系生成所述結(jié)構(gòu)化查詢(xún)?cè)~。
9. 如權(quán)利要求6所述的搜索裝置,其特征在于,所述查詢(xún)模塊具體用于: 根據(jù)所述結(jié)構(gòu)化查詢(xún)?cè)~進(jìn)行查詢(xún)結(jié)構(gòu)化數(shù)據(jù)庫(kù)以獲取所述搜索結(jié)果。
10. 如權(quán)利要求9所述的搜索裝置,其特征在于,所述結(jié)構(gòu)化數(shù)據(jù)庫(kù)為三元組數(shù)據(jù)庫(kù)或 結(jié)構(gòu)化查詢(xún)語(yǔ)言SQL數(shù)據(jù)庫(kù)。
【文檔編號(hào)】G06F17/30GK104252533SQ201410466232
【公開(kāi)日】2014年12月31日 申請(qǐng)日期:2014年9月12日 優(yōu)先權(quán)日:2014年9月12日
【發(fā)明者】徐文智, 劉占一, 吳華, 王海峰 申請(qǐng)人:百度在線網(wǎng)絡(luò)技術(shù)(北京)有限公司