一種信息處理方法和裝置、一種用于信息處理的裝置的制造方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及互聯(lián)網(wǎng)信息處理技術(shù)領(lǐng)域,特別是涉及一種信息處理方法、一種信息處理裝置、及一種用于信息處理的裝置。
【背景技術(shù)】
[0002]隨著信息和網(wǎng)絡(luò)技術(shù)的不斷發(fā)展,人們?cè)絹?lái)越多地通過(guò)搜索引擎進(jìn)行各種信息的搜索。搜索引擎是指根據(jù)一定的策略、運(yùn)用特定的計(jì)算機(jī)程序從互聯(lián)網(wǎng)上搜集信息,在對(duì)信息進(jìn)行組織和處理后,為用戶提供搜索服務(wù),并將用戶搜索相關(guān)的信息展示給用戶的系統(tǒng)。
[0003]目前,用戶可以在搜索引擎提供的搜索框中輸入查詢?cè)~,由搜索引擎查詢得到與該查詢?cè)~匹配的網(wǎng)頁(yè)或文檔,以作為搜索結(jié)果,并利用一定的排序策略,將經(jīng)過(guò)排序的搜索結(jié)果返回給用戶。
[0004]然而,用戶在使用搜索引擎的過(guò)程中,有時(shí)會(huì)遇到無(wú)法準(zhǔn)確描述查詢意圖的問(wèn)題。此種情況下若將不符合查詢意圖的、欠準(zhǔn)確的查詢?cè)~提交至搜索引擎,將容易得到不準(zhǔn)確的搜索結(jié)果,從而影響了用戶的搜索效率。例如,用戶欲要搜索某人名“馬化騰”,但只知道該人名的前字“馬”和后字“騰”,不知道該人名的中間字“化”。又如,用戶欲要搜索某道菜名“紅燒烤麩”,但不知道“麩”字的讀音,無(wú)法輸入該漢字。上述情況下,如果將“馬騰”或者“紅燒烤”提交至搜索引擎,則將使得搜索引擎給出較多的無(wú)效信息(無(wú)用的搜索結(jié)果),這些無(wú)效信息還會(huì)誤導(dǎo)用戶,使得用戶挑選真正所需的搜索結(jié)果比較困難,因此增加了用戶的搜索時(shí)間,影響了用戶的搜索效率。
【發(fā)明內(nèi)容】
[0005]鑒于上述問(wèn)題,提出了本發(fā)明實(shí)施例以便提供一種克服上述問(wèn)題或者至少部分地解決上述問(wèn)題的信息處理方法、信息處理裝置及用于信息處理的裝置,可以得到能夠較好地契合用戶的查詢意圖的目標(biāo)實(shí)體詞條,因此可以解決用戶無(wú)法準(zhǔn)確描述查詢意圖的問(wèn)題。
[0006]為了解決上述問(wèn)題,本發(fā)明公開了一種信息處理方法,包括:
[0007]接收用戶的查詢串;
[0008]當(dāng)所述查詢串中包括有用于標(biāo)記空缺字符的預(yù)置字符串時(shí),依據(jù)所述查詢串在實(shí)體庫(kù)中進(jìn)行查詢,以得到所述實(shí)體庫(kù)中命中所述查詢串中第一字符的目標(biāo)實(shí)體詞條;其中,所述第一字符為所述查詢串中除所述預(yù)置字符串之外的字符;
[0009]輸出所述目標(biāo)實(shí)體詞條。
[0010]優(yōu)選的,所述依據(jù)所述查詢串在實(shí)體庫(kù)中進(jìn)行查詢,以得到所述實(shí)體庫(kù)中命中所述查詢串中第一字符的目標(biāo)實(shí)體詞條的步驟,包括:
[0011 ]查找實(shí)體庫(kù),得到命中所述查詢串中第一字符的目標(biāo)實(shí)體詞條;所述目標(biāo)實(shí)體詞條包括所述第一字符、且所述第一字符在所述查詢串中的第一位置與所述第一字符在所述目標(biāo)實(shí)體詞條中的第二位置一致。
[0012]優(yōu)選的,所述查找實(shí)體庫(kù),得到命中所述查詢串中第一字符的目標(biāo)實(shí)體詞條的步驟,包括:
[0013]將所述查詢串中包括的預(yù)置字符串作為空缺字符,以得到所述第一字符和所述空缺字符組合得到的匹配串;
[0014]按照字符位置,將所述匹配串中第一字符與所述實(shí)體庫(kù)中實(shí)體詞條對(duì)應(yīng)的第二字符進(jìn)行匹配,以得到所述匹配串對(duì)應(yīng)的目標(biāo)實(shí)體詞條;其中,所述第二字符與所述第一字符相同且所述第二字符在所述目標(biāo)實(shí)體詞條中的位置與所述第一字符在所述查詢串中的位置一致。
[0015]優(yōu)選的,單次出現(xiàn)的預(yù)置字符串對(duì)應(yīng)一個(gè)或者多個(gè)空缺字符。
[0016]優(yōu)選的,所述輸出所述目標(biāo)實(shí)體詞條的步驟,包括:
[0017]在搜索結(jié)果頁(yè),展示所述目標(biāo)實(shí)體詞條;和/或
[0018]在所述搜索結(jié)果頁(yè),展示與所述目標(biāo)實(shí)體詞條相關(guān)的網(wǎng)頁(yè)鏈接;和/或
[0019]在所述搜索結(jié)果頁(yè),展示與熱度最高的目標(biāo)實(shí)體詞條相關(guān)的網(wǎng)頁(yè)鏈接和其他的目標(biāo)實(shí)體詞條;和/或
[0020]在所述搜索結(jié)果頁(yè),展示所述目標(biāo)實(shí)體詞條、以及與所述目標(biāo)實(shí)體詞條相關(guān)的推薦搜索詞。
[0021 ]優(yōu)選的,所述目標(biāo)實(shí)體詞條包括:第一目標(biāo)實(shí)體詞條和第二目標(biāo)實(shí)體詞條,則所述輸出所述目標(biāo)實(shí)體詞條的步驟,包括:
[0022]客戶端展示所述第一目標(biāo)實(shí)體詞條對(duì)應(yīng)的實(shí)體信息,以及,客戶端展示所述第二目標(biāo)實(shí)體詞條。
[0023]優(yōu)選的,所述方法還包括:依據(jù)目標(biāo)實(shí)體詞條的熱度,對(duì)多個(gè)目標(biāo)實(shí)體詞條進(jìn)行排序;
[0024]則所述輸出所述目標(biāo)實(shí)體詞條的步驟,包括:將排好序的多個(gè)目標(biāo)實(shí)體詞條輸出。
[0025]優(yōu)選的,所述目標(biāo)實(shí)體詞條的熱度包括如下熱度中的至少一種:目標(biāo)實(shí)體詞條在搜索程序中的第一搜索熱度、及目標(biāo)實(shí)體詞條在百科網(wǎng)站中的第二搜索熱度。
[0026]優(yōu)選的,所述實(shí)體信息包括:所述第一目標(biāo)實(shí)體詞條對(duì)應(yīng)實(shí)體的圖片信息,和/或,所述第一目標(biāo)實(shí)體詞條對(duì)應(yīng)實(shí)體的簡(jiǎn)介信息。
[0027]優(yōu)選的,通過(guò)如下步驟建立所述實(shí)體庫(kù):
[0028]從百科網(wǎng)站抓取實(shí)體名稱,并將所述實(shí)體名稱作為實(shí)體詞條保存至所述實(shí)體庫(kù);和/或
[0029]從垂直網(wǎng)站抓取領(lǐng)域數(shù)據(jù),對(duì)所述領(lǐng)域數(shù)據(jù)進(jìn)行分析,依據(jù)分析結(jié)果從所述領(lǐng)域數(shù)據(jù)中抽取關(guān)鍵詞,并將所述關(guān)鍵詞作為實(shí)體詞條保存至所述實(shí)體庫(kù)。
[0030]本發(fā)明還提供一種信息處理裝置,包括:
[0031]接收模塊,用于接收用戶的查詢串;
[0032]查詢模塊,用于當(dāng)所述查詢串中包括有用于標(biāo)記空缺字符的預(yù)置字符串時(shí),依據(jù)所述查詢串在實(shí)體庫(kù)中進(jìn)行查詢,以得到所述實(shí)體庫(kù)中命中所述查詢串中第一字符的目標(biāo)實(shí)體詞條;其中,所述第一字符為所述查詢串中除所述預(yù)置字符串之外的字符;
[0033]輸出模塊,用于輸出所述目標(biāo)實(shí)體詞條。
[0034]本發(fā)明還提供一種用于信息處理的裝置,包括有存儲(chǔ)器,以及一個(gè)或者一個(gè)以上的程序,其中一個(gè)或者一個(gè)以上程序存儲(chǔ)于存儲(chǔ)器中,且經(jīng)配置以由一個(gè)或者一個(gè)以上處理器執(zhí)行所述一個(gè)或者一個(gè)以上程序包含用于進(jìn)行以下操作的指令:
[0035]接收用戶的查詢串;
[0036]當(dāng)所述查詢串中包括有用于標(biāo)記空缺字符的預(yù)置字符串時(shí),依據(jù)所述查詢串在實(shí)體庫(kù)中進(jìn)行查詢,以得到所述實(shí)體庫(kù)中命中所述查詢串中第一字符的目標(biāo)實(shí)體詞條;其中,所述第一字符為所述查詢串中除所述預(yù)置字符串之外的字符;
[0037]輸出所述目標(biāo)實(shí)體詞條。
[0038]本發(fā)明實(shí)施例包括以下優(yōu)點(diǎn):
[0039]本發(fā)明實(shí)施例在查詢串中包括有預(yù)置字符串時(shí),依據(jù)所述查詢串在實(shí)體庫(kù)中進(jìn)行查詢,以得到所述實(shí)體庫(kù)中命中所述查詢串中第一字符的目標(biāo)實(shí)體詞條;其中,所述第一字符為所述查詢串中除所述預(yù)置字符串之外的字符;由于上述預(yù)置字符串可用于標(biāo)記空缺,故本發(fā)明實(shí)施例可以基于上述第一字符和上述實(shí)體庫(kù)對(duì)上述預(yù)置字符串代表的空缺查詢字符進(jìn)行填充,以向用戶提供填充后具有完整含義的查詢串,從而可以解決用戶無(wú)法準(zhǔn)確描述查詢意圖的問(wèn)題;
[0040]并且,由于上述實(shí)體庫(kù)中可以存儲(chǔ)有各領(lǐng)域內(nèi)實(shí)體的實(shí)體詞條,故得到的目標(biāo)實(shí)體詞條能夠較好地契合用戶的查詢意圖;這樣,可以使得用戶選擇所需的目標(biāo)實(shí)體詞條進(jìn)行搜索,從而能夠提高用戶的搜索效率。
【附圖說(shuō)明】
[0041]圖1是本發(fā)明的一種信息處理方法的應(yīng)用環(huán)境的結(jié)構(gòu)示意圖;
[0042]圖2是本發(fā)明的一種信息處理方法實(shí)施例一的步驟流程圖;
[0043]圖3是本發(fā)明的一種信息處理方法實(shí)施例二的步驟流程圖;
[0044]圖4是本發(fā)明的一種展示目標(biāo)實(shí)體詞條的示意圖;
[0045]圖5是本發(fā)明的一種信息處理方法實(shí)施例三的步驟流程圖;
[0046]圖6是本發(fā)明的一種展示目標(biāo)實(shí)體詞條的示意圖;
[0047]圖7是本發(fā)明的一種信息處理方法實(shí)施例四的步驟流程圖;
[0048]圖8是本發(fā)明的一種信息處理裝置實(shí)施例的結(jié)構(gòu)圖;
[0049]圖9是本發(fā)明的一種用于信息處理的裝置900的框圖;及
[0050]圖10是本發(fā)明的一種服務(wù)器的結(jié)構(gòu)示意圖。
【具體實(shí)施方式】
[0051]為使本發(fā)明的上述目的、特征和優(yōu)點(diǎn)能夠更加明顯易懂,下面結(jié)合附圖和【具體實(shí)施方式】對(duì)本發(fā)明作進(jìn)一步詳細(xì)的說(shuō)明。
[0052]針對(duì)用戶無(wú)法準(zhǔn)確描述查詢意圖的問(wèn)題,本發(fā)明實(shí)施例可以允許用戶在查詢串中攜帶具有明確含義的第一字符和用于標(biāo)記空缺的預(yù)置字符串,并基于上述第一字符對(duì)上述預(yù)置字符串代表的空缺查詢字符進(jìn)行填充,以向用戶提供填充后具有完整含義的查詢串。
[0053]并且,本發(fā)明實(shí)施例經(jīng)研究發(fā)現(xiàn),用戶的查詢意圖經(jīng)常與人名、地名、菜名、影視劇名、技術(shù)名稱等各領(lǐng)域內(nèi)實(shí)體有關(guān),故為了提高對(duì)空缺查詢字符的填充結(jié)果與用戶的查詢意圖的契合度,本發(fā)明實(shí)施例可以依據(jù)上述查詢串在實(shí)體庫(kù)中進(jìn)行查詢,以得到實(shí)體庫(kù)中命中所述查詢串中第一字符的目標(biāo)實(shí)體詞條;由于上述實(shí)體庫(kù)中可以存儲(chǔ)有各領(lǐng)域內(nèi)實(shí)體的實(shí)體詞條,故得到的目標(biāo)實(shí)體詞條能夠較好地契合用戶的查詢意圖;這樣,可以使得用戶選擇所需的目標(biāo)實(shí)體詞條進(jìn)行搜索,從而能夠提高用戶的搜索效率。
[0054]在實(shí)際應(yīng)用中,上述預(yù)置字符串可以為本領(lǐng)域技術(shù)人員或者用戶根據(jù)實(shí)際應(yīng)用需求預(yù)置的、用于標(biāo)記空缺的任意字符串,如“什么”、、“sm”、“X”、、“#,,等,也可以是用戶隨手輸入的不代表任何含義的字符,如等,可以理解,本發(fā)明實(shí)施例對(duì)于具體的預(yù)置字符串不加以限制。
[0055]在本發(fā)明的一種應(yīng)用示例I中,用戶A欲要搜索某人名“馬化騰”,但只知道該人名的前字“馬”和后字“騰”,不知道該人名的中間字“化”,故可以在搜索引擎的搜索框中輸入查詢串“馬*騰”或“馬什么騰”,其中“馬” “騰”為具有明確含義的第一字符,或“什么”為用于標(biāo)記空缺的預(yù)置字符串。則本發(fā)明實(shí)施例可以基于前字“馬”和后字“騰”對(duì)空缺查詢字符進(jìn)行填充,以得到命中前字“馬”和后字“騰”、且“馬”和“騰”之間具有字符的目標(biāo)實(shí)體詞條,例如,可以為“馬化騰”、“馬昌騰”、“馬曉騰”、“馬云騰”、“馬奔騰”、“馬雪騰”等。
[0056]在本發(fā)明的一種應(yīng)用示例2中,用戶B欲要搜索某道菜名“紅燒烤麩”,但不知道“麩”字的讀音,無(wú)法輸入該漢字,故可以在搜索引擎的搜索框中輸入查詢串“紅燒()”,其中“()”為用于標(biāo)記空缺的預(yù)置字符串。則本發(fā)明實(shí)施例可以基于前兩個(gè)字“紅燒”對(duì)空缺查詢字符“()”進(jìn)行填充,以得到命中前兩個(gè)字“紅燒”的目標(biāo)實(shí)體詞條,例如可以包括紅燒魚”、“紅燒雞翅”、“紅燒牛肉面”、“紅燒菠蘿”、“紅燒烤麩”等。由此可見(jiàn),對(duì)空缺查詢字符進(jìn)行填充時(shí),可以但不限于一個(gè)字符,也可以為兩個(gè)字符、三個(gè)字符等等。
[0057]本發(fā)明實(shí)施例可以應(yīng)用于搜索引擎等具有搜索功能的網(wǎng)站或者應(yīng)用程序中,或者,本發(fā)明實(shí)施例可以應(yīng)用于具有輸入框的任意應(yīng)用程序中,當(dāng)接收到用戶在這些應(yīng)用程序的輸入框中輸入的查詢串時(shí),這些應(yīng)用程序均可以利用本發(fā)明實(shí)施例對(duì)上述查詢串中的預(yù)置字符串進(jìn)行填充,從而可以得到契合用戶的查詢意圖的目標(biāo)實(shí)體詞條。
[0058]本發(fā)明實(shí)施例提供的信息處理方法可應(yīng)用于圖1所示的應(yīng)用環(huán)境中,如圖1所示,客戶端100與服務(wù)器200位于有線或無(wú)線網(wǎng)絡(luò)中,通過(guò)該有線或無(wú)線網(wǎng)絡(luò),客戶端100與服務(wù)器200進(jìn)行數(shù)據(jù)交互。
[0059]具體地,客戶端100可以運(yùn)行在信息設(shè)備上,上述信息設(shè)備具體包括但不限:智能手機(jī)、平板電腦、電子書閱讀器、MP3(動(dòng)態(tài)影像專家壓縮標(biāo)準(zhǔn)音頻層面3 ,Moving PictureExperts Group Aud1 Layer III)播放器、MP4(動(dòng)態(tài)影像專家壓縮標(biāo)準(zhǔn)音頻層面4,MovingPic