搜索方法及裝置的制造方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明實(shí)施例涉及互聯(lián)網(wǎng)技術(shù)領(lǐng)域,尤其涉及搜索方法及裝置。
【背景技術(shù)】
[0002]隨著網(wǎng)絡(luò)基礎(chǔ)設(shè)施的不斷升級(jí),為解決信息過(guò)載問(wèn)題,用于為用戶提供搜索服務(wù)的搜索引擎應(yīng)用而生。目前,搜索引擎通常會(huì)線下預(yù)先學(xué)習(xí)得到用戶行為模型,并在線上接收到用戶實(shí)時(shí)輸入的搜索語(yǔ)句(Query)后,基于該搜索語(yǔ)句利用用戶行為模型進(jìn)行用戶行為理解,進(jìn)而結(jié)合用戶行為的理解結(jié)果確定出搜索結(jié)果。其中,用戶行為模型用于預(yù)測(cè)用戶對(duì)網(wǎng)頁(yè)的行為,例如預(yù)測(cè)用戶是否點(diǎn)擊網(wǎng)頁(yè)、瀏覽網(wǎng)頁(yè)的時(shí)長(zhǎng)或者對(duì)網(wǎng)頁(yè)的滿意度等。
[0003]然而,現(xiàn)有技術(shù)僅是基于用戶的屬性特征(例如所在地區(qū)、年齡、性別、職業(yè))、文本特征(例如輸入的歷史搜索語(yǔ)句)、對(duì)歷史搜索結(jié)果的搜索行為(例如是否點(diǎn)擊、瀏覽時(shí)長(zhǎng))等,來(lái)建立用戶行為模型。雖然這些特征覆蓋廣泛、內(nèi)容豐富,但是并沒(méi)有從本質(zhì)上對(duì)用戶行為進(jìn)行理解建模,使得建立得到的用戶行為模型不夠合理,不能很好的理解用戶的搜索需求,用戶體驗(yàn)較差。
【發(fā)明內(nèi)容】
[0004]本發(fā)明實(shí)施例提供一種搜索方法及裝置,以能夠利用較為合理準(zhǔn)確的用戶行為模型,為用戶提供更加優(yōu)質(zhì)的搜索結(jié)果,提升用戶對(duì)搜索的滿意度。
[0005]—方面,本發(fā)明實(shí)施例提供了一種搜索方法,該方法包括:
[0006]識(shí)別當(dāng)前用戶輸入的目標(biāo)搜索語(yǔ)句所屬的意圖類別;
[0007]根據(jù)識(shí)別得到的意圖類別以及預(yù)先創(chuàng)建的用戶行為模型,預(yù)測(cè)當(dāng)前用戶對(duì)候選搜索結(jié)果的行為,其中所述用戶行為模型根據(jù)歷史用戶的歷史搜索語(yǔ)句所屬的意圖類別確定;
[0008]基于預(yù)測(cè)結(jié)果,從所述候選搜索結(jié)果中確定本次輸出的搜索結(jié)果。
[0009]另一方面,本發(fā)明實(shí)施例還提供了一種搜索裝置,該裝置包括:
[0010]意圖類別識(shí)別單元,用于識(shí)別當(dāng)前用戶輸入的目標(biāo)搜索語(yǔ)句所屬的意圖類別;
[0011]用戶行為預(yù)測(cè)單元,用于根據(jù)所述意圖類別識(shí)別單元識(shí)別得到的意圖類別以及預(yù)先創(chuàng)建的用戶行為模型,預(yù)測(cè)當(dāng)前用戶對(duì)候選搜索結(jié)果的行為,其中所述用戶行為模型根據(jù)歷史用戶的歷史搜索語(yǔ)句所屬的意圖類別確定;
[0012]搜索結(jié)果輸出單元,用于基于所述用戶行為預(yù)測(cè)單元得到的預(yù)測(cè)結(jié)果,從所述候選搜索結(jié)果中確定本次輸出的搜索結(jié)果。
[0013]本發(fā)明實(shí)施例提供的技術(shù)方案,基于歷史用戶輸入的歷史搜索語(yǔ)句所屬的意圖進(jìn)行用戶行為建模,能夠深入理解用戶行為,使得用戶行為模型更為合理準(zhǔn)確,進(jìn)而利用該模型預(yù)測(cè)線上用戶對(duì)候選搜索結(jié)果的行為,可以為用戶提供更加優(yōu)質(zhì)的搜索結(jié)果,提升用戶對(duì)搜索的滿意度。
【附圖說(shuō)明】
[0014]圖1是本發(fā)明實(shí)施例一提供的一種搜索方法的流程示意圖;
[0015]圖2是本發(fā)明實(shí)施例四提供的一種搜索方法的流程示意圖;
[0016]圖3是本發(fā)明實(shí)施例五提供的一種搜索裝置的結(jié)構(gòu)示意圖。
【具體實(shí)施方式】
[0017]下面結(jié)合附圖和實(shí)施例對(duì)本發(fā)明作進(jìn)一步的詳細(xì)說(shuō)明??梢岳斫獾氖?,此處所描述的具體實(shí)施例僅僅用于解釋本發(fā)明,而非對(duì)本發(fā)明的限定。另外還需要說(shuō)明的是,為了便于描述,附圖中僅示出了與本發(fā)明相關(guān)的部分而非全部結(jié)構(gòu)。
[0018]在更加詳細(xì)地討論示例性實(shí)施例之前應(yīng)當(dāng)提到的是,一些示例性實(shí)施例被描述成作為流程圖描繪的處理或方法。雖然流程圖將各項(xiàng)操作(或步驟)描述成順序的處理,但是其中的許多操作可以被并行地、并發(fā)地或者同時(shí)實(shí)施。此外,各項(xiàng)操作的順序可以被重新安排。當(dāng)其操作完成時(shí)所述處理可以被終止,但是還可以具有未包括在附圖中的附加步驟。所述處理可以對(duì)應(yīng)于方法、函數(shù)、規(guī)程、子例程、子程序等等。
[0019]隨著網(wǎng)絡(luò)基礎(chǔ)設(shè)施的日益完善,互聯(lián)網(wǎng)資源越來(lái)越豐富,諸多用戶都會(huì)有各式各樣的搜索需求。為滿足該搜索需求,用戶通常是有意圖地通過(guò)搜索框輸入相應(yīng)的搜索語(yǔ)句進(jìn)行搜索,之后對(duì)搜索引擎返回的搜索結(jié)果進(jìn)行諸如點(diǎn)擊、瀏覽、收藏等之類的行為。這些用戶行為是與意圖動(dòng)機(jī)有密切關(guān)聯(lián)的。
[0020]目前,搜索引擎在接收到任意用戶實(shí)時(shí)輸入的搜索語(yǔ)句后,會(huì)基于該搜索語(yǔ)句,利用線下預(yù)先建立好的用戶行為模型,預(yù)測(cè)用戶對(duì)各個(gè)候選搜索結(jié)果的行為結(jié)果,進(jìn)而基于該預(yù)測(cè)結(jié)果從多個(gè)候選搜索結(jié)果中選擇本次要輸出的搜索結(jié)果。其中,所述行為結(jié)果通常是用于表征用戶對(duì)候選結(jié)果滿意程度的度量參數(shù)值。
[0021]但是在已有技術(shù)中,線下對(duì)用戶行為模型的建立方案,根本不會(huì)考慮意圖動(dòng)機(jī)這一因素,通過(guò)意圖分析來(lái)進(jìn)行用戶行為理解,而是一味的不分意圖地將歷史用戶在歷史搜索語(yǔ)句下的歷史搜索結(jié)果對(duì)應(yīng)的通用行為特征與通用行為結(jié)果,作為訓(xùn)練實(shí)例進(jìn)行建模。所以,已有技術(shù)并沒(méi)有從本質(zhì)上對(duì)用戶行為進(jìn)行理解建模,從而導(dǎo)致建立得到的用戶行為模型并不能準(zhǔn)確預(yù)測(cè)用戶對(duì)候選搜索結(jié)果的行為結(jié)果,因?yàn)橛脩舻男袨榻Y(jié)果與搜索意圖有著密不可分的關(guān)系。
[0022]所謂通用行為特征指的是:不包含意圖特征的歷史用戶的行為特征。示例性的,通用行為特征通??砂ㄈ缦轮辽僖环N特征:用戶屬性特征(例如包含用戶所在地區(qū)、年齡、性別、職業(yè)等),用戶輸入特征(例如輸入的歷史搜索語(yǔ)句),歷史搜索結(jié)果的文本特征(例如歷史搜索結(jié)果所對(duì)應(yīng)網(wǎng)頁(yè)的主題、關(guān)鍵詞)等。
[0023]所謂通用行為結(jié)果指的是:與意圖特征無(wú)關(guān)的、采用統(tǒng)一的用于表征歷史用戶對(duì)歷史搜索結(jié)果滿意程度的度量參數(shù)得到的值。也即,不管歷史用戶是何意圖的搜索動(dòng)機(jī),所采用的用于表征歷史用戶對(duì)歷史搜索結(jié)果滿意程度的度量參數(shù)均相同。例如,對(duì)于任何搜索意圖而言,度量參數(shù)均為歷史用戶對(duì)歷史搜索結(jié)果的停留時(shí)間。但是,在歷史用戶的搜索意圖為信息類意圖下,歷史用戶對(duì)所滿意的歷史搜索結(jié)果的停留時(shí)間往往較長(zhǎng);而在歷史用戶的搜索意圖為資源下載類意圖下,歷史用戶對(duì)所滿意的歷史搜索結(jié)果的停留時(shí)間卻很短,只有數(shù)次下載鏈接的點(diǎn)擊。顯然,這些用戶行為的特點(diǎn)是與搜索意圖有密切關(guān)聯(lián),不同搜索意圖觸發(fā)的用戶行為在對(duì)搜索結(jié)果滿意的情況下的表現(xiàn)是不一致的,因而采用統(tǒng)一的度量參數(shù)來(lái)表征用戶對(duì)候選結(jié)果滿意程度不夠細(xì)致,相應(yīng)的也就造成建立的用戶行為模型對(duì)用戶行為的理解力較差,準(zhǔn)確度不高。
[0024]有鑒于此,本發(fā)明實(shí)施例引入意圖分析的思想,基于意圖特征建立用戶行為模型,進(jìn)而利用該模型預(yù)測(cè)線上用戶對(duì)候選搜索結(jié)果的行為,以為用戶提供更加優(yōu)質(zhì)的搜索結(jié)果,提升用戶對(duì)搜索的滿意度。
[0025]實(shí)施例一
[0026]圖1是本發(fā)明實(shí)施例一提供的一種搜索方法的流程示意圖。本實(shí)施例的方法可以由搜索裝置來(lái)執(zhí)行,該裝置可通過(guò)軟件實(shí)現(xiàn),集成于為各式各樣的終端設(shè)備提供搜索服務(wù)的搜索引擎中。參見(jiàn)圖1,本實(shí)施例提供的搜索方法所包括的操作具體如下。
[0027]S110、識(shí)別當(dāng)前用戶輸入的目標(biāo)搜索語(yǔ)句所屬的意圖類別。
[0028]目標(biāo)搜索語(yǔ)句為搜索引擎接收到的由終端上的搜索客戶端或者瀏覽器發(fā)送的搜索請(qǐng)求中所包含的搜索語(yǔ)句。該搜索語(yǔ)句可以是當(dāng)前用戶以語(yǔ)音輸入方式輸入的語(yǔ)音搜索信息,或者以文本輸入方式輸入的文字搜索內(nèi)容。
[0029]在獲取到目標(biāo)搜索語(yǔ)句后,基于設(shè)定的意圖類別識(shí)別算法,對(duì)該搜索語(yǔ)句進(jìn)行識(shí)另IJ,以確定該搜索語(yǔ)句具體屬于哪類意圖類別。需要說(shuō)明的是,本實(shí)施例并不具體對(duì)意圖的種類以及個(gè)數(shù)加以限定。優(yōu)選的,意圖類別包括如下至少一種:尋址類意圖(也即查找統(tǒng)一資源定位符的意圖)、信息類意圖(查詢問(wèn)題的信息或解決辦法的意圖)和商品類意圖(查找商品信息的意圖)。示例性的,可預(yù)先設(shè)定多種意圖類別,并建立意圖類別與關(guān)鍵詞之間的映射關(guān)系加以存儲(chǔ)。其中,每種意圖類別可以同時(shí)映射有多個(gè)關(guān)鍵詞。例如,與尋址類意圖具有映射關(guān)系的關(guān)鍵詞有:“網(wǎng)站”、“網(wǎng)址”等;與彳目息類意圖具有映射關(guān)系的關(guān)鍵詞有:“為什么”、“如何”、“怎樣”、“是否”等;與商品類意圖具有映射關(guān)系的關(guān)鍵詞有:“京東”、“淘寶”、“天貓”、“大眾點(diǎn)評(píng)”等。
[0030]相應(yīng)的,識(shí)別當(dāng)前用戶輸入的目標(biāo)搜索語(yǔ)句所屬的意圖類別,可具體包括:對(duì)當(dāng)前用戶輸入的目標(biāo)搜索語(yǔ)句進(jìn)行解析,以提取其中所包含的關(guān)鍵詞;從預(yù)先創(chuàng)建的意圖類別與關(guān)鍵詞之間的映射關(guān)系中,查詢與本次提取得到的