查詢?cè)~的推薦方法及裝置制造方法
【專利摘要】本發(fā)明提供一種查詢?cè)~的推薦方法及裝置。本發(fā)明實(shí)施例通過獲得當(dāng)前將要發(fā)起的本次查詢的查詢參數(shù),所述查詢參數(shù)包括用戶輸入的輸入查詢?cè)~、用戶標(biāo)識(shí)信息和上一次查詢的目標(biāo)查詢?cè)~中的至少一項(xiàng)參數(shù),進(jìn)而根據(jù)所述查詢參數(shù),獲得所述本次查詢的主題分布,所述主題分布包括M個(gè)特定主題的分布信息,所述M為大于或等于2的整數(shù),使得能夠根據(jù)所述主題分布,獲得所述本次查詢的推薦查詢?cè)~,能夠避免現(xiàn)有技術(shù)中由于用戶通過應(yīng)用反復(fù)進(jìn)行查詢而導(dǎo)致的增加應(yīng)用與查詢引擎之間的數(shù)據(jù)交互的問題,從而降低了查詢引擎的處理負(fù)擔(dān)。
【專利說明】查詢?cè)~的推薦方法及裝置 【【技術(shù)領(lǐng)域】】
[0001] 本發(fā)明涉及查詢技術(shù),尤其涉及一種查詢?cè)~的推薦方法及裝置。 【【背景技術(shù)】】
[0002] 隨著網(wǎng)絡(luò)信息技術(shù)的發(fā)展和普及,互聯(lián)網(wǎng)逐漸滲透到人們的生活、學(xué)習(xí)和工作的 各個(gè)領(lǐng)域,由此將人類真正帶入信息時(shí)代。然而,互聯(lián)網(wǎng)上的信息量很大,用戶不容易找到 自己需要的對(duì)象。為了提高處理即查詢的精度,現(xiàn)有的一種做法是,用戶在查詢引擎對(duì)應(yīng)本 地的應(yīng)用中的查詢框中,輸入一個(gè)輸入查詢?cè)~,由應(yīng)用實(shí)時(shí)將輸入查詢?cè)~發(fā)送給查詢引擎。 查詢引擎根據(jù)輸入查詢?cè)~,向應(yīng)用返回由所述輸入查詢?cè)~與該輸入查詢?cè)~相關(guān)的附加查詢 詞組成的推薦查詢?cè)~,由用戶選擇是否利用推薦查詢?cè)~,進(jìn)行查詢。
[0003] 然而,現(xiàn)有的查詢?cè)~的推薦方法,只是根據(jù)輸入查詢?cè)~,向用戶展現(xiàn)輸入查詢?cè)~相 關(guān)的附加查詢?cè)~,而沒有結(jié)合本次查詢的主題,向用戶展現(xiàn)主題相關(guān)的推薦查詢?cè)~,可能會(huì) 使得查詢結(jié)果無法滿足用戶真正的查詢意圖,使得用戶需要通過應(yīng)用反復(fù)進(jìn)行查詢,這樣, 會(huì)增加應(yīng)用與查詢引擎之間的數(shù)據(jù)交互,從而導(dǎo)致了查詢引擎的處理負(fù)擔(dān)的增加。 【
【發(fā)明內(nèi)容】
】
[0004] 本發(fā)明的多個(gè)方面提供一種查詢?cè)~的推薦方法及裝置,用以降低查詢引擎的處理 負(fù)擔(dān)。
[0005] 本發(fā)明的一方面,提供一種查詢?cè)~的推薦方法,包括:
[0006] 獲得當(dāng)前將要發(fā)起的本次查詢的查詢參數(shù),所述查詢參數(shù)包括用戶輸入的輸入查 詢?cè)~、用戶標(biāo)識(shí)信息和上一次查詢的目標(biāo)查詢?cè)~中的至少一項(xiàng)參數(shù);
[0007] 根據(jù)所述查詢參數(shù),獲得所述本次查詢的主題分布,所述主題分布包括Μ個(gè)特定 主題的分布信息,所述Μ為大于或等于2的整數(shù);
[0008] 根據(jù)所述主題分布,獲得所述本次查詢的推薦查詢?cè)~。
[0009] 如上所述的方面和任一可能的實(shí)現(xiàn)方式,進(jìn)一步提供一種實(shí)現(xiàn)方式,所述根據(jù)所 述查詢參數(shù),獲得所述本次查詢的主題分布,所述主題分布包括Μ個(gè)特定主題的分布信息, 包括:
[0010] 根據(jù)所述查詢參數(shù),獲得在所述查詢參數(shù)中每項(xiàng)參數(shù)的條件下,所述Μ個(gè)特定主 題中每個(gè)特定主題出現(xiàn)的經(jīng)驗(yàn)概率;
[0011] 根據(jù)在所述查詢參數(shù)中每項(xiàng)參數(shù)的條件下,所述每個(gè)特定主題出現(xiàn)的經(jīng)驗(yàn)概率, 獲得所述主題分布。
[0012] 如上所述的方面和任一可能的實(shí)現(xiàn)方式,進(jìn)一步提供一種實(shí)現(xiàn)方式,所述根據(jù)所 述主題分布,獲得所述本次查詢的推薦查詢?cè)~,包括:
[0013] 根據(jù)所述查詢參數(shù),獲得在所述查詢參數(shù)和所述Μ個(gè)特定主題中每個(gè)特定主題的 條件下,Ν個(gè)候選查詢?cè)~中每個(gè)候選查詢?cè)~出現(xiàn)的第一概率,所述Ν為大于或等于2的整 數(shù);
[0014] 根據(jù)所述主題分布和所述每個(gè)候選查詢?cè)~出現(xiàn)的第一概率,獲得在所述查詢參數(shù) 的條件下,所述每個(gè)候選查詢?cè)~出現(xiàn)的第二概率;
[0015] 根據(jù)所述每個(gè)候選查詢?cè)~出現(xiàn)的第二概率,選擇0個(gè)候選查詢?cè)~,以作為推薦查 詢?cè)~,所述0為大于或等于1,且小于或等于N的整數(shù)。
[0016] 如上所述的方面和任一可能的實(shí)現(xiàn)方式,進(jìn)一步提供一種實(shí)現(xiàn)方式,所述根據(jù)所 述查詢參數(shù),獲得在所述查詢參數(shù)和所述Μ個(gè)特定主題中每個(gè)特定主題的條件下,N個(gè)候選 查詢?cè)~中每個(gè)候選查詢?cè)~出現(xiàn)的第一概率,包括:
[0017] 根據(jù)所述輸入查詢?cè)~,獲得在所述輸入查詢?cè)~和所述Μ個(gè)特定主題中每個(gè)特定主 題的條件下,所述每個(gè)候選查詢?cè)~出現(xiàn)的經(jīng)驗(yàn)概率,根據(jù)該經(jīng)驗(yàn)概率,獲得在所述查詢參數(shù) 和所述Μ個(gè)特定主題中每個(gè)特定主題的條件下,所述每個(gè)候選查詢?cè)~出現(xiàn)的第一概率。
[0018] 如上所述的方面和任一可能的實(shí)現(xiàn)方式,進(jìn)一步提供一種實(shí)現(xiàn)方式,所述根據(jù)所 述每個(gè)候選查詢?cè)~出現(xiàn)的第二概率,選擇0個(gè)候選查詢?cè)~,以作為推薦查詢?cè)~,包括:
[0019] 根據(jù)所述每個(gè)候選查詢?cè)~出現(xiàn)的第二概率,按照從大到小的順序,對(duì)所述Ν個(gè)候 選查詢?cè)~進(jìn)行排序,以獲得第一排序結(jié)果;
[0020] 根據(jù)所述第一排序結(jié)果,選擇前0個(gè)候選查詢?cè)~,以作為所述推薦查詢?cè)~。
[0021] 如上所述的方面和任一可能的實(shí)現(xiàn)方式,進(jìn)一步提供一種實(shí)現(xiàn)方式,所述根據(jù)所 述第一排序結(jié)果,選擇前0個(gè)候選查詢?cè)~,以作為所述推薦查詢?cè)~,包括:
[0022] 根據(jù)全部用戶的用戶歷史查詢數(shù)據(jù),獲得所述每個(gè)候選查詢?cè)~的第一位置調(diào)整參 數(shù)和所述每個(gè)候選查詢?cè)~的第二位置調(diào)整參數(shù)中的至少一項(xiàng);
[0023] 根據(jù)所述第一位置調(diào)整參數(shù)和所述第二位置調(diào)整參數(shù)中的至少一項(xiàng),對(duì)所述第一 排序結(jié)果進(jìn)行調(diào)整,以獲得第二排序結(jié)果;
[0024] 根據(jù)所述第二排序結(jié)果,選擇前0個(gè)候選查詢?cè)~,以作為所述推薦查詢?cè)~。
[0025] 如上所述的方面和任一可能的實(shí)現(xiàn)方式,進(jìn)一步提供一種實(shí)現(xiàn)方式,所述根據(jù)全 部用戶的用戶歷史查詢數(shù)據(jù),獲得所述每個(gè)候選查詢?cè)~的第一位置調(diào)整參數(shù)和所述每個(gè)候 選查詢?cè)~的第二位置調(diào)整參數(shù)中的至少一項(xiàng),包括:
[0026] 根據(jù)全部用戶的用戶歷史查詢數(shù)據(jù),利用如下公式,獲得所述第一位置調(diào)整參數(shù), 所述第一位置調(diào)整參數(shù)包括所述每個(gè)候選查詢?cè)~的第一出現(xiàn)位置和所述每個(gè)候選查詢?cè)~ 的第一調(diào)整位置;
[0027] (BasePositionJquery, user) = (1 - QueryScore(query, user)) * 10· { IncrementPositiori! = Q1 '
[0028] 其中,
[0029] query表示候選查詢?cè)~;
[0030] user表示所述用戶標(biāo)識(shí)信息;
[0031] BasePositior^ (query, user)表示候選查詢?cè)~的第一出現(xiàn)位置;
[0032] IncrementPositior^表示候選查詢?cè)~的第一調(diào)整位置,單位為個(gè);Q1為大于或等 于〇的整數(shù);
[0033] 其中,
[0034] QueryScore (query, user)表示候選查詢?cè)~的總得分;具體地,
[0035] 計(jì)算QueryScore (query, user)時(shí),采用query在該user下面的個(gè)性化得分及 query在全部用戶下面的通用得分;
[0036] 計(jì)算query在該user下面的個(gè)性化得分時(shí),采用query在該user下面N天內(nèi)的 查詢總頻率及query在N天內(nèi)查詢頻率在天級(jí)時(shí)間上的分布,query在天級(jí)時(shí)間上重復(fù)性 越強(qiáng),得分越高;
[0037] 計(jì)算query在全部用戶下面的通用得分時(shí),采用query在N天內(nèi)的總查詢頻率;
[0038] 計(jì)算N天內(nèi)的查詢總頻率及在單天內(nèi)的查詢頻率時(shí),采用時(shí)間加權(quán),距離當(dāng)前時(shí) 間越近的時(shí)間內(nèi)的查詢頻率權(quán)重越高。
[0039] 如上所述的方面和任一可能的實(shí)現(xiàn)方式,進(jìn)一步提供一種實(shí)現(xiàn)方式,所述根據(jù)全 部用戶的用戶歷史查詢數(shù)據(jù),獲得所述每個(gè)候選查詢?cè)~的第一位置調(diào)整參數(shù)和所述每個(gè)候 選查詢?cè)~的第二位置調(diào)整參數(shù)中的至少一項(xiàng),包括:
[0040] 根據(jù)全部用戶的用戶歷史查詢數(shù)據(jù),利用如下公式,獲得所述每個(gè)候選查詢?cè)~的 第二位置調(diào)整參數(shù),所述第二位置調(diào)整參數(shù)包括所述每個(gè)候選查詢?cè)~的第二出現(xiàn)位置和所 述每個(gè)候選查詢?cè)~的第二調(diào)整位置;
[0041] fBasePosition2 (query, pre_query) = (l - Pnew(query | pre_query)) * 10 [ IncrementPosition2 = Q2 5
[0042] 其中,
[0043] query表示候選查詢?cè)~;
[0044] pre_query表示所述目標(biāo)查詢?cè)~;
[0045] BasePosition2 (query, pre_query)表示候選查詢?cè)~的第二出現(xiàn)位置;
[0046] IncrementPosition2表示候選查詢?cè)~的第二調(diào)整位置,單位為個(gè);Q2為大于或等 于〇的整數(shù);
[0047] 其中,
[0048] Pnew (query |pre_query)表示用戶歷史查詢數(shù)據(jù)中候選查詢?cè)~出現(xiàn)在所述目標(biāo)查 詢?cè)~后面的概率得分,其為大于或等于〇,且小于或等于1的數(shù)1 ;具體地,
[0049] 計(jì)算Pnew (query | pre_query)時(shí),采用目標(biāo)查詢?cè)~到候選查詢?cè)~及候選查詢?cè)~到目 標(biāo)查詢?cè)~的雙向條件概率,雙向條件概率均以其經(jīng)驗(yàn)分布代替;
[0050] 計(jì)算條件概率的經(jīng)驗(yàn)分布時(shí),采用時(shí)間加權(quán),距離當(dāng)前時(shí)間越近的時(shí)間內(nèi)的查詢 頻率權(quán)重越高。
[0051] 如上所述的方面和任一可能的實(shí)現(xiàn)方式,進(jìn)一步提供一種實(shí)現(xiàn)方式,所述根據(jù)所 述查詢參數(shù),獲得所述本次查詢的主題分布之前,還包括:
[0052] 根據(jù)全部用戶的用戶歷史查詢數(shù)據(jù),獲得歷史查詢?cè)~和所述歷史查詢?cè)~的主題分 布;
[0053] 根據(jù)所述歷史查詢?cè)~,獲得包含所述歷史查詢?cè)~的用戶歷史數(shù)據(jù);
[0054] 將所述歷史查詢?cè)~的主題分布,整合到所述包含所述歷史查詢?cè)~的用戶歷史數(shù)據(jù) 中,以獲得整合用戶歷史數(shù)據(jù);
[0055] 根據(jù)所述整合用戶歷史數(shù)據(jù),進(jìn)行經(jīng)驗(yàn)統(tǒng)計(jì)操作,以獲得如下概率中的至少一 項(xiàng):
[0056] 在所述輸入查詢?cè)~的條件下,所述每個(gè)特定主題出現(xiàn)的經(jīng)驗(yàn)概率;
[0057] 在所述用戶標(biāo)識(shí)信息的條件下,所述每個(gè)特定主題出現(xiàn)的經(jīng)驗(yàn)概率;
[0058] 在所述目標(biāo)查詢?cè)~的條件下,所述每個(gè)特定主題出現(xiàn)的經(jīng)驗(yàn)概率;以及
[0059] 在所述輸入查詢?cè)~和所述每個(gè)特定主題的條件下,所述每個(gè)候選查詢?cè)~出現(xiàn)的經(jīng) 驗(yàn)概率。
[0060] 本發(fā)明的另一方面,提供一種查詢?cè)~的推薦裝置,包括:
[0061] 獲得單元,用于獲得當(dāng)前將要發(fā)起的本次查詢的查詢參數(shù),所述查詢參數(shù)包括用 戶輸入的輸入查詢?cè)~、用戶標(biāo)識(shí)信息和上一次查詢的目標(biāo)查詢?cè)~中的至少一項(xiàng)參數(shù);
[0062] 處理單元,用于根據(jù)所述查詢參數(shù),獲得所述本次查詢的主題分布,所述主題分布 包括Μ個(gè)特定主題的分布信息,所述Μ為大于或等于2的整數(shù);
[0063] 推薦單元,用于根據(jù)所述主題分布,獲得所述本次查詢的推薦查詢?cè)~。
[0064] 如上所述的方面和任一可能的實(shí)現(xiàn)方式,進(jìn)一步提供一種實(shí)現(xiàn)方式,所述處理單 元,具體用于
[0065] 根據(jù)所述查詢參數(shù),獲得在所述查詢參數(shù)中每項(xiàng)參數(shù)的條件下,所述Μ個(gè)特定主 題中每個(gè)特定主題出現(xiàn)的經(jīng)驗(yàn)概率;以及
[0066] 根據(jù)在所述查詢參數(shù)中每項(xiàng)參數(shù)的條件下,所述每個(gè)特定主題出現(xiàn)的經(jīng)驗(yàn)概率, 獲得所述主題分布。
[0067] 如上所述的方面和任一可能的實(shí)現(xiàn)方式,進(jìn)一步提供一種實(shí)現(xiàn)方式,所述推薦單 元,具體用于
[0068] 根據(jù)所述查詢參數(shù),獲得在所述查詢參數(shù)和所述Μ個(gè)特定主題中每個(gè)特定主題的 條件下,Ν個(gè)候選查詢?cè)~中每個(gè)候選查詢?cè)~出現(xiàn)的第一概率,所述Ν為大于或等于2的整 數(shù);
[0069] 根據(jù)所述主題分布和所述每個(gè)候選查詢?cè)~出現(xiàn)的第一概率,獲得在所述查詢參數(shù) 的條件下,所述每個(gè)候選查詢?cè)~出現(xiàn)的第二概率;以及
[0070] 根據(jù)所述每個(gè)候選查詢?cè)~出現(xiàn)的第二概率,選擇0個(gè)候選查詢?cè)~,以作為推薦查 詢?cè)~,所述〇為大于或等于1,且小于或等于Ν的整數(shù)。
[0071] 如上所述的方面和任一可能的實(shí)現(xiàn)方式,進(jìn)一步提供一種實(shí)現(xiàn)方式,所述推薦單 元,具體用于
[0072] 根據(jù)所述輸入查詢?cè)~,獲得在所述輸入查詢?cè)~和所述Μ個(gè)特定主題中每個(gè)特定主 題的條件下,所述每個(gè)候選查詢?cè)~出現(xiàn)的經(jīng)驗(yàn)概率,根據(jù)該經(jīng)驗(yàn)概率,獲得在所述查詢參數(shù) 和所述Μ個(gè)特定主題中每個(gè)特定主題的條件下,所述每個(gè)候選查詢?cè)~出現(xiàn)的第一概率。
[0073] 如上所述的方面和任一可能的實(shí)現(xiàn)方式,進(jìn)一步提供一種實(shí)現(xiàn)方式,所述推薦單 元,具體用于
[0074] 根據(jù)所述每個(gè)候選查詢?cè)~出現(xiàn)的第二概率,按照從大到小的順序,對(duì)所述Ν個(gè)候 選查詢?cè)~進(jìn)行排序,以獲得第一排序結(jié)果;以及
[0075] 根據(jù)所述第一排序結(jié)果,選擇前0個(gè)候選查詢?cè)~,以作為所述推薦查詢?cè)~。
[0076] 如上所述的方面和任一可能的實(shí)現(xiàn)方式,進(jìn)一步提供一種實(shí)現(xiàn)方式,所述推薦單 元,具體用于
[0077] 根據(jù)全部用戶的用戶歷史查詢數(shù)據(jù),獲得所述每個(gè)候選查詢?cè)~的第一位置調(diào)整參 數(shù)和所述每個(gè)候選查詢?cè)~的第二位置調(diào)整參數(shù)中的至少一項(xiàng);
[0078] 根據(jù)所述第一位置調(diào)整參數(shù)和所述第二位置調(diào)整參數(shù)中的至少一項(xiàng),對(duì)所述第一 排序結(jié)果進(jìn)行調(diào)整,以獲得第二排序結(jié)果;以及
[0079] 根據(jù)所述第二排序結(jié)果,選擇前0個(gè)候選查詢?cè)~,以作為所述推薦查詢?cè)~。
[0080] 如上所述的方面和任一可能的實(shí)現(xiàn)方式,進(jìn)一步提供一種實(shí)現(xiàn)方式,所述推薦單 元,具體用于
[0081] 根據(jù)全部用戶的用戶歷史查詢數(shù)據(jù),利用如下公式,獲得所述第一位置調(diào)整參數(shù), 所述第一位置調(diào)整參數(shù)包括所述每個(gè)候選查詢?cè)~的第一出現(xiàn)位置和所述每個(gè)候選查詢?cè)~ 的第一調(diào)整位置;
[0082] pasePosition'jXquery, user) = (1 - QueryScore(query, user)) * 10 ? IncrementPosition-L = Q1 '
[0083] 其中,
[0084] query表示候選查詢?cè)~;
[0085] user表示所述用戶標(biāo)識(shí)信息;
[0086] BasePositior^ (query, user)表示候選查詢?cè)~的第一出現(xiàn)位置;
[0087] IncrementPositior^表示候選查詢?cè)~的第一調(diào)整位置,單位為個(gè);Q1為大于或等 于0的整數(shù);
[0088] 其中,
[0089] QueryScore (query, user)表示候選查詢?cè)~的總得分;具體地,
[0090] 計(jì)算QueryScore (query, user)時(shí),采用query在該user下面的個(gè)性化得分及 query在全部用戶下面的通用得分;
[0091] 計(jì)算query在該user下面的個(gè)性化得分時(shí),采用query在該user下面N天內(nèi)的 查詢總頻率及query在N天內(nèi)查詢頻率在天級(jí)時(shí)間上的分布,query在天級(jí)時(shí)間上重復(fù)性 越強(qiáng),得分越高;
[0092] 計(jì)算query在全部用戶下面的通用得分時(shí),采用query在N天內(nèi)的總查詢頻率;
[0093] 計(jì)算N天內(nèi)的查詢總頻率及在單天內(nèi)的查詢頻率時(shí),采用時(shí)間加權(quán),距離當(dāng)前時(shí) 間越近的時(shí)間內(nèi)的查詢頻率權(quán)重越高。
[0094] 如上所述的方面和任一可能的實(shí)現(xiàn)方式,進(jìn)一步提供一種實(shí)現(xiàn)方式,所述推薦單 元,具體用于
[0095] 根據(jù)全部用戶的用戶歷史查詢數(shù)據(jù),利用如下公式,獲得所述每個(gè)候選查詢?cè)~的 第二位置調(diào)整參數(shù),所述第二位置調(diào)整參數(shù)包括所述每個(gè)候選查詢?cè)~的第二出現(xiàn)位置和所 述每個(gè)候選查詢?cè)~的第二調(diào)整位置;
[0096] iBasePosition2(query,pre_query) = (l - Pnew(query | pre_query)) * 10 { lncrementPosition2 = Q2 '
[0097] 其中,
[0098] query表示候選查詢?cè)~;
[0099] pre_query表示所述目標(biāo)查詢?cè)~;
[0100] BasePosition2 (query, pre_query)表示候選查詢?cè)~的第二出現(xiàn)位置;
[0101] IncrementPosition2表示候選查詢?cè)~的第二調(diào)整位置,單位為個(gè);Q2為大于或等 于0的整數(shù);
[0102] 其中,
[0103] Pnew (query |pre_query)表示用戶歷史查詢數(shù)據(jù)中候選查詢?cè)~出現(xiàn)在所述目標(biāo)查 詢?cè)~后面的概率得分,其為大于或等于〇,且小于或等于1的數(shù)1 ;具體地,
[0104] 計(jì)算Pnew (query | pre_query)時(shí),采用目標(biāo)查詢?cè)~到候選查詢?cè)~及候選查詢?cè)~到目 標(biāo)查詢?cè)~的雙向條件概率,雙向條件概率均以其經(jīng)驗(yàn)分布代替;
[0105] 計(jì)算條件概率的經(jīng)驗(yàn)分布時(shí),采用時(shí)間加權(quán),距離當(dāng)前時(shí)間越近的時(shí)間內(nèi)的查詢 頻率權(quán)重越高。
[0106] 如上所述的方面和任一可能的實(shí)現(xiàn)方式,進(jìn)一步提供一種實(shí)現(xiàn)方式,所述裝置還 包括挖掘單元,用于
[0107] 根據(jù)全部用戶的用戶歷史查詢數(shù)據(jù),獲得歷史查詢?cè)~和所述歷史查詢?cè)~的主題分 布;
[0108] 根據(jù)所述歷史查詢?cè)~,獲得包含所述歷史查詢?cè)~的用戶歷史數(shù)據(jù);
[0109] 將所述歷史查詢?cè)~的主題分布,整合到所述包含所述歷史查詢?cè)~的用戶歷史數(shù)據(jù) 中,以獲得整合用戶歷史數(shù)據(jù);以及
[0110] 根據(jù)所述整合用戶歷史數(shù)據(jù),進(jìn)行經(jīng)驗(yàn)統(tǒng)計(jì)操作,以獲得如下概率中的至少一 項(xiàng):
[0111] 在所述輸入查詢?cè)~的條件下,所述每個(gè)特定主題出現(xiàn)的經(jīng)驗(yàn)概率;
[0112] 在所述用戶標(biāo)識(shí)信息的條件下,所述每個(gè)特定主題出現(xiàn)的經(jīng)驗(yàn)概率;
[0113] 在所述目標(biāo)查詢?cè)~的條件下,所述每個(gè)特定主題出現(xiàn)的經(jīng)驗(yàn)概率;以及
[0114] 在所述輸入查詢?cè)~和所述每個(gè)特定主題的條件下,所述每個(gè)候選查詢?cè)~出現(xiàn)的經(jīng) 驗(yàn)概率。
[0115] 由上述技術(shù)方案可知,本發(fā)明實(shí)施例通過獲得當(dāng)前將要發(fā)起的本次查詢的查詢參 數(shù),所述查詢參數(shù)包括用戶輸入的輸入查詢?cè)~、用戶標(biāo)識(shí)信息和上一次查詢的目標(biāo)查詢?cè)~ 中的至少一項(xiàng)參數(shù),進(jìn)而根據(jù)所述查詢參數(shù),獲得所述本次查詢的主題分布,所述主題分布 包括Μ個(gè)特定主題的分布信息,所述Μ為大于或等于2的整數(shù),使得能夠根據(jù)所述主題分 布,獲得所述本次查詢的推薦查詢?cè)~,能夠避免現(xiàn)有技術(shù)中由于用戶通過應(yīng)用反復(fù)進(jìn)行查 詢而導(dǎo)致的增加應(yīng)用與查詢引擎之間的數(shù)據(jù)交互的問題,從而降低了查詢引擎的處理負(fù) 擔(dān)。
[0116] 另外,采用本發(fā)明提供的技術(shù)方案,由于利用特定主題對(duì)查詢參數(shù)進(jìn)行合理降維, 使得獲取推薦查詢?cè)~的復(fù)雜度降低,能夠有效提高推薦查詢?cè)~獲取的效率。
[0117] 另外,采用本發(fā)明提供的技術(shù)方案,由于考慮了本次查詢的主題分布,使得從語義 層面更為準(zhǔn)確地表達(dá)用戶的查詢意圖,以滿足用戶真正的查詢意圖,能夠有效提高查詢的 有效性。
[0118] 另外,采用本發(fā)明提供的技術(shù)方案,能夠滿足用戶真正的查詢意圖,能夠有效提高 查詢的精確性。
[0119] 另外,采用本發(fā)明提供的技術(shù)方案,能夠滿足用戶真正的查詢意圖,能夠有效提高 查詢的效率。 【【專利附圖】
【附圖說明】】
[0120] 為了更清楚地說明本發(fā)明實(shí)施例中的技術(shù)方案,下面將對(duì)實(shí)施例或現(xiàn)有技術(shù)描述 中所需要使用的附圖作一簡(jiǎn)單地介紹,顯而易見地,下面描述中的附圖是本發(fā)明的一些實(shí) 施例,對(duì)于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動(dòng)性的前提下,還可以根據(jù)這些附 圖獲得其他的附圖。
[0121] 圖1為本發(fā)明一實(shí)施例提供的查詢?cè)~的推薦方法的流程示意圖;
[0122] 圖2為本發(fā)明另一實(shí)施例提供的查詢?cè)~的推薦裝置的結(jié)構(gòu)示意圖;
[0123] 圖3為本發(fā)明另一實(shí)施例提供的查詢?cè)~的推薦裝置的結(jié)構(gòu)示意圖。 【【具體實(shí)施方式】】
[0124] 為使本發(fā)明實(shí)施例的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面將結(jié)合本發(fā)明實(shí)施例 中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例是 本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員 在沒有作出創(chuàng)造性勞動(dòng)前提下所獲得的全部其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
[0125] 另外,本文中術(shù)語"和/或",僅僅是一種描述關(guān)聯(lián)對(duì)象的關(guān)聯(lián)關(guān)系,表示可以存在 三種關(guān)系,例如,A和/或B,可以表示:?jiǎn)为?dú)存在A,同時(shí)存在A和B,單獨(dú)存在B這三種情 況。另外,本文中字符"/",一般表示前后關(guān)聯(lián)對(duì)像是一種"或"的關(guān)系。
[0126] 圖1為本發(fā)明一實(shí)施例提供的查詢?cè)~的推薦方法的流程示意圖,如圖1所示。
[0127] 101、獲得當(dāng)前將要發(fā)起的本次查詢的查詢參數(shù),所述查詢參數(shù)包括用戶輸入的輸 入查詢?cè)~、用戶標(biāo)識(shí)信息和上一次查詢的目標(biāo)查詢?cè)~中的至少一項(xiàng)參數(shù)。
[0128] 102、根據(jù)所述查詢參數(shù),獲得所述本次查詢的主題分布,所述主題分布包括Μ個(gè) 特定主題的分布信息,所述Μ為大于或等于2的整數(shù)。
[0129] 103、根據(jù)所述主題分布,獲得所述本次查詢的推薦查詢?cè)~。
[0130] 需要說明的是,101?103的執(zhí)行主體,可以是位于網(wǎng)絡(luò)側(cè)的服務(wù)器中的查詢引 擎,也可以是位于本地終端中的應(yīng)用,或者還可以是位于網(wǎng)絡(luò)側(cè)的分布式系統(tǒng),本實(shí)施例對(duì) 此不進(jìn)行特別限定。
[0131] 可以理解的是,所述應(yīng)用可以是安裝在終端上的應(yīng)用程序(nativeApp),或者還可 以是終端上的瀏覽器的一個(gè)網(wǎng)頁程序(webApp),本實(shí)施例對(duì)此不進(jìn)行限定。
[0132] 這樣,通過獲得當(dāng)前將要發(fā)起的本次查詢的查詢參數(shù),所述查詢參數(shù)包括用戶輸 入的輸入查詢?cè)~、用戶標(biāo)識(shí)信息和上一次查詢的目標(biāo)查詢?cè)~中的至少一項(xiàng)參數(shù),進(jìn)而根據(jù) 所述查詢參數(shù),獲得所述本次查詢的主題分布,所述主題分布包括Μ個(gè)特定主題的分布信 息,所述Μ為大于或等于2的整數(shù),使得能夠根據(jù)所述主題分布,獲得所述本次查詢的推薦 查詢?cè)~,能夠避免現(xiàn)有技術(shù)中由于用戶通過應(yīng)用反復(fù)進(jìn)行查詢而導(dǎo)致的增加應(yīng)用與查詢引 擎之間的數(shù)據(jù)交互的問題,從而降低了查詢引擎的處理負(fù)擔(dān)。
[0133] 可選地,在本實(shí)施例的一個(gè)可能的實(shí)現(xiàn)方式中,在101中,具體可以實(shí)時(shí)獲取用戶 在查詢框中輸入的所述輸入查詢?cè)~。
[0134] 可選地,在本實(shí)施例的一個(gè)可能的實(shí)現(xiàn)方式中,在101中,所獲得的所述用戶 標(biāo)識(shí)信息可以包括但不限于Cookie標(biāo)識(shí)(CookielD)、網(wǎng)站為用戶分配的用戶身份標(biāo)識(shí) (IDentity,ID)或終端的IP地址,本實(shí)施例對(duì)此不進(jìn)行特別限定。
[0135] 網(wǎng)站具體可以采用現(xiàn)有技術(shù)中的方法,獲取客戶端的Cookie信息。例如,在網(wǎng)站 的頁面上埋點(diǎn)(即放上一個(gè)1x1的不可見像素),在客戶端第一次訪問該網(wǎng)頁時(shí),就會(huì)獲得 網(wǎng)站為客戶端分配一個(gè)唯一的CookielD,以在客戶端上創(chuàng)建一個(gè)Cookie對(duì)象,以供將用戶 的用戶歷史查詢數(shù)據(jù)存儲(chǔ)在用戶本地的終端上,形成Cookie信息。這樣,客戶端則可以在 指定時(shí)機(jī)將Cookie信息發(fā)送給網(wǎng)站,例如,可以在客戶端下次請(qǐng)求同一網(wǎng)站時(shí),向網(wǎng)站發(fā) 送該Cookie信息等。
[0136] 具體地,Cookie信息可以包括但不限于CookielD、用戶標(biāo)識(shí)、用戶歷史查詢數(shù)據(jù), 本實(shí)施例對(duì)此不進(jìn)行特別限定。其中,所述用戶標(biāo)識(shí)可以包括但不限于網(wǎng)站為用戶分配的 用戶身份標(biāo)識(shí)(IDentity,ID)或終端的IP地址,本實(shí)施例對(duì)此不進(jìn)行特別限定。
[0137] 具體地,在全網(wǎng)的數(shù)據(jù)源中,用戶的一個(gè)用戶歷史查詢數(shù)據(jù)為如下格式:[uid URL source query title date time ip actid actname actattr unifyUrl PtNumber commonQuery]。其中,共包括14個(gè)字段,各字段的含義如下所述:
[0138] 用戶標(biāo)識(shí)(User ID, uid) :baiduid映射出來的用戶id,由若干數(shù)字組成;
[0139] 統(tǒng)一資源定位符(Uniform Resource Locator, URL):可能為空,或可能不以 "http" 開頭;
[0140] 數(shù)據(jù)源(source):產(chǎn)品線的數(shù)據(jù)來源,例如,百度百科(baike)、百度論壇(forum) 或百度地圖(map);
[0141] 目標(biāo)查詢?cè)~(query):可能為空;
[0142] 題目(title):網(wǎng)頁名稱;
[0143] 日期(date):例如,2013年6月3日,其格式一般可以為"20120603"。
[0144] 時(shí)間(time):例如,12點(diǎn)34分02秒,其格式一般可以為12:34:02。
[0145] ip: IP 地址
[0146] 動(dòng)作標(biāo)識(shí)(actid):網(wǎng)頁動(dòng)作的標(biāo)識(shí);
[0147] 動(dòng)作名稱(actname):網(wǎng)頁動(dòng)作的名稱;
[0148] 動(dòng)作屬性(actattr):網(wǎng)頁動(dòng)作的屬性;
[0149] 歸一化 URL (unifyUrl) :URL 的歸一化結(jié)果;
[0150] URL資源類型(PtNumber):整數(shù)顯示,默認(rèn)'-'(即'0');
[0151] 通用 Query (commonQuery) :URL 最常用的 Query。
[0152] 現(xiàn)有技術(shù)中,可以對(duì)用戶歷史查詢數(shù)據(jù)進(jìn)行劃分,以獲得若干個(gè)會(huì)話(Session) 段。其中,Session段是一個(gè)邏輯意義,它代表一個(gè)用戶在某段時(shí)間內(nèi)的一個(gè)行為意圖,從 用戶的瀏覽行為來看,Session段具體可以規(guī)約成在語義上具有相同關(guān)聯(lián)的連續(xù)查詢行為。
[0153] 可選地,在本實(shí)施例的一個(gè)可能的實(shí)現(xiàn)方式中,在101中,具體可以對(duì)當(dāng)前網(wǎng)頁的 統(tǒng)一資源定位符(Uniform Resource Locator, URL)中的Referrer參數(shù)進(jìn)行解析,以獲得 上一次查詢的目標(biāo)查詢?cè)~。
[0154] 本實(shí)施例中,候選查詢?cè)~的產(chǎn)生方法,是與執(zhí)行主體相關(guān)的。
[0155] 例如,若執(zhí)行主體為網(wǎng)絡(luò)側(cè)的服務(wù)器中的查詢引擎或本地終端中的應(yīng)用,所述執(zhí) 行主體則可以根據(jù)所獲得的所述輸入查詢?cè)~,進(jìn)行匹配,以獲得與所述輸入查詢?cè)~匹配的N 個(gè)候選查詢?cè)~,所述N為大于或等于2的整數(shù)。
[0156] 或者,再例如,若執(zhí)行主體為網(wǎng)絡(luò)側(cè)的分布式系統(tǒng),那么,則可以先由查詢引擎根 據(jù)所述輸入查詢?cè)~,進(jìn)行匹配,以獲得與所述輸入查詢?cè)~匹配的N個(gè)候選查詢?cè)~,所述N為 大于或等于2的整數(shù),進(jìn)而將N個(gè)候選查詢?cè)~發(fā)送給所述執(zhí)行主體。
[0157] 本實(shí)施例中,具體可以利用產(chǎn)生式概率模型,可以將在本次查詢的查詢參 數(shù)的條件下,N個(gè)候選查詢?cè)~中每個(gè)候選查詢?cè)~出現(xiàn)的概率即后面所述的第二概率 P (query | prefix, user, pre_query)展開表示為如下形式:
[0158] P (query | prefix, user, pre_query)=
[0159] Σ tP (query, 11 prefix, user, pre_query)=
[0160] Σ tP (query 11, prefix, user, pre_query) P (t | prefix, user, pre_query);
[0161] 其中,
[0162] prefix表示所述輸入查詢?cè)~;
[0163] user表示所述用戶標(biāo)識(shí)信息;
[0164] pre_query表示所述目標(biāo)查詢?cè)~;
[0165] t表示特定主題即Μ個(gè)特定主題中任意一個(gè)特定主題;
[0166] query表示候選查詢?cè)~即Ν個(gè)候選查詢?cè)~中任意一個(gè)候選查詢?cè)~;
[0167] P (query 11, prefix, user, pre_query)表示在所述查詢參數(shù)和特定主題的條件下, 候選查詢?cè)~出現(xiàn)的概率即后面所述的第一概率;
[0168] P (t | prefix, user, pre_query)表示所述本次查詢的主題分布。
[0169] 可以理解的是,本發(fā)明中,都可以采用如下方式進(jìn)行表述,即t表示特定主題即Μ 個(gè)特定主題中任意一個(gè)特定主題,query表示候選查詢?cè)~即Ν個(gè)候選查詢?cè)~中任意一個(gè)候 選查詢?cè)~。
[0170] 這樣,由于利用特定主題對(duì)查詢參數(shù)進(jìn)行合理降維,使得獲取推薦查詢?cè)~的復(fù)雜 度降低,能夠有效提高推薦查詢?cè)~獲取的效率。
[0171] 基于大數(shù)據(jù)的統(tǒng)計(jì),進(jìn)一步通過使用經(jīng)驗(yàn)分布來代替真實(shí)分布對(duì) P (t | prefix, user, pre_query)進(jìn)行簡(jiǎn)化,因此,可選地,在本實(shí)施例的一個(gè)可能的實(shí)現(xiàn)方式 中,在102中,具體可以根據(jù)所述查詢參數(shù),獲得在所述查詢參數(shù)中每項(xiàng)參數(shù)的條件下,所 述Μ個(gè)特定主題中每個(gè)特定主題出現(xiàn)的經(jīng)驗(yàn)概率。然后,則可以根據(jù)在所述查詢參數(shù)中每 項(xiàng)參數(shù)的條件下,所述每個(gè)特定主題出現(xiàn)的經(jīng)驗(yàn)概率,獲得所述主題分布。
[0172] 可選地,在本實(shí)施例的一個(gè)可能的實(shí)現(xiàn)方式中,在103中,具體可以根據(jù)所述查詢 參數(shù),獲得在所述查詢參數(shù)和所述Μ個(gè)特定主題中每個(gè)特定主題的條件下,Ν個(gè)候選查詢?cè)~ 中每個(gè)候選查詢?cè)~出現(xiàn)的第一概率,所述Ν為大于或等于2的整數(shù)。進(jìn)而,則可以根據(jù)所述 主題分布和所述每個(gè)候選查詢?cè)~出現(xiàn)的第一概率,獲得在所述查詢參數(shù)的條件下,所述每 個(gè)候選查詢?cè)~出現(xiàn)的第二概率。然后,則可以根據(jù)所述每個(gè)候選查詢?cè)~出現(xiàn)的第二概率,選 擇〇個(gè)候選查詢?cè)~,以作為推薦查詢?cè)~,所述〇為大于或等于1,且小于或等于Ν的整數(shù)。
[0173] 基于大數(shù)據(jù)的統(tǒng)計(jì),進(jìn)一步通過使用經(jīng)驗(yàn)分布來代替真實(shí)分布對(duì) P (query 11, prefix, user, pre_query)進(jìn)行簡(jiǎn)化,具體地,具體可以根據(jù)所述輸入查詢?cè)~,獲 得在所述輸入查詢?cè)~和所述Μ個(gè)特定主題中每個(gè)特定主題的條件下,所述每個(gè)候選查詢?cè)~ 出現(xiàn)的經(jīng)驗(yàn)概率,根據(jù)該經(jīng)驗(yàn)概率,獲得在所述查詢參數(shù)和所述Μ個(gè)特定主題中每個(gè)特定 主題的條件下,所述每個(gè)候選查詢?cè)~出現(xiàn)的第一概率。
[0174] 具體地,具體可以根據(jù)所述每個(gè)候選查詢?cè)~出現(xiàn)的第二概率,按照從大到小的順 序,對(duì)所述N個(gè)候選查詢?cè)~進(jìn)行排序,以獲得第一排序結(jié)果。然后,則可以根據(jù)所述第一排 序結(jié)果,選擇前〇個(gè)候選查詢?cè)~,以作為所述推薦查詢?cè)~。
[0175] 更具體地,具體可以根據(jù)全部用戶的用戶歷史查詢數(shù)據(jù),獲得所述每個(gè)候選查詢 詞的第一位置調(diào)整參數(shù)和所述每個(gè)候選查詢?cè)~的第二位置調(diào)整參數(shù)中的至少一項(xiàng)。進(jìn)而, 根據(jù)所述第一位置調(diào)整參數(shù)和所述第二位置調(diào)整參數(shù)中的至少一項(xiàng),對(duì)所述第一排序結(jié)果 進(jìn)行調(diào)整,以獲得第二排序結(jié)果,則可以根據(jù)所述第二排序結(jié)果,選擇前0個(gè)候選查詢?cè)~, 以作為所述推薦查詢?cè)~。
[0176] 例如,第一位置調(diào)整參數(shù)的算法可以表示為如下形式:
[0177] Userlndivduation (prefix, UserData) = {〈query, BasePosition, IncrementPosi tion>};
[0178] 其中,算法的輸入?yún)?shù)為所述輸入查詢?cè)~記為prefix,以及全部用戶的用戶歷史查 詢數(shù)據(jù),算法的輸出參數(shù)為〈query, BasePositior^,IncrementPositionP三元組的集合。
[0179] 具體地,可以根據(jù)全部用戶的歷史查詢數(shù)據(jù),利用如下公式,獲得所述第一位置調(diào) 整參數(shù),所述第一位置調(diào)整參數(shù)包括所述每個(gè)候選查詢?cè)~的第一出現(xiàn)位置和所述每個(gè)候選 查詢?cè)~的第一調(diào)整位置;其中,所述第一調(diào)整位置用于指示將所述第一出現(xiàn)位置與所述第 一排序結(jié)果中的基準(zhǔn)位置中位置靠前的一個(gè)位置,向前移動(dòng)第一調(diào)整位置。 iBasePosition-L(query, user) = (l - QueryScore(query, user)) * 10_ L〇180」 j I l IncrementPositior^ = Q1
[0181] 其中,
[0182] query表示候選查詢?cè)~;
[0183] user表示所述用戶標(biāo)識(shí)信息;
[0184] BasePositior^ (query, user)表示候選查詢?cè)~的第一出現(xiàn)位置;
[0185] IncrementPositior^表示候選查詢?cè)~的第一調(diào)整位置,單位為個(gè);Q1為大于或等 于〇的整數(shù);
[0186] 其中,
[0187] QueryScore (query, user)表示候選查詢?cè)~的總得分;具體地,
[0188] 計(jì)算QueryScore (query, user)時(shí),采用query在該user下面的個(gè)性化得分及 query在全部用戶下面的通用得分;
[0189] 計(jì)算query在該user下面的個(gè)性化得分時(shí),采用query在該user下面N天內(nèi)的 查詢總頻率及query在N天內(nèi)查詢頻率在天級(jí)時(shí)間上的分布,query在天級(jí)時(shí)間上重復(fù)性 越強(qiáng),得分越高;
[0190] 計(jì)算query在全部用戶下面的通用得分時(shí),采用query在N天內(nèi)的總查詢頻率;
[0191] 計(jì)算N天內(nèi)的查詢總頻率及在單天內(nèi)的查詢頻率時(shí),采用時(shí)間加權(quán),距離當(dāng)前時(shí) 間越近的時(shí)間內(nèi)的查詢頻率權(quán)重越高。
[0192] 或者,再例如,第一位置調(diào)整參數(shù)的算法可以表示為如下形式:
[0193] QueryCoOcc (prefix, QueryCoOccData) = {〈query, BasePosition2, IncrementPosi tion2>}
[0194] 其中,算法的輸入?yún)?shù)為所述輸入查詢?cè)~記為prefix,以及全部用戶的用戶歷史查 詢數(shù)據(jù)即候選查詢?cè)~的共現(xiàn)數(shù)據(jù),算法的輸出參數(shù)為〈query, BasePosition2, IncrementPo sition2>三元組的集合。
[0195] 具體地,可以根據(jù)全部用戶的歷史查詢數(shù)據(jù),利用如下公式,獲得所述每個(gè)候選查 詢?cè)~的第二位置調(diào)整參數(shù),所述第二位置調(diào)整參數(shù)包括所述每個(gè)候選查詢?cè)~的第二出現(xiàn)位 置和所述每個(gè)候選查詢?cè)~的第二調(diào)整位置;其中,所述第二調(diào)整位置用于指示將所述第二 出現(xiàn)位置與所述第一排序結(jié)果中的基準(zhǔn)位置中位置靠前的一個(gè)位置,向前移動(dòng)第二調(diào)整位 置。
[0196]
[BasePosition2(query, pre_query) = (l - Pnew(query | pre_query)) * 10 { IncrementPosition2 = Q2 '
[0197] 其中,
[0198] query表示候選查詢?cè)~;
[0199] pre_query表示所述目標(biāo)查詢?cè)~;
[0200] BasePosition2 (query, pre_query)表示候選查詢?cè)~的第二出現(xiàn)位置;
[0201] IncrementPosition2表示候選查詢?cè)~的第二調(diào)整位置,單位為個(gè);Q2為大于或等 于〇的整數(shù);
[0202] 其中,
[0203] Pnew (query |pre_query)表示用戶歷史查詢數(shù)據(jù)中候選查詢?cè)~出現(xiàn)在所述目標(biāo)查 詢?cè)~后面的概率得分,其為大于或等于〇,且小于或等于1的數(shù)1 ;具體地,
[0204] 計(jì)算Pnew (query | pre_query)時(shí),采用目標(biāo)查詢?cè)~到候選查詢?cè)~及候選查詢?cè)~到目 標(biāo)查詢?cè)~的雙向條件概率,雙向條件概率均以其經(jīng)驗(yàn)分布代替;
[0205] 計(jì)算條件概率的經(jīng)驗(yàn)分布時(shí),采用時(shí)間加權(quán),距離當(dāng)前時(shí)間越近的時(shí)間內(nèi)的查詢 頻率權(quán)重越高。
[0206] 可選地,在本實(shí)施例的一個(gè)可能的實(shí)現(xiàn)方式中,在102之前,還可以進(jìn)一步根據(jù)全 部用戶的用戶歷史查詢數(shù)據(jù),獲得歷史查詢?cè)~和所述歷史查詢?cè)~的主題分布。然后,則可以 根據(jù)所述歷史查詢?cè)~,獲得包含所述歷史查詢?cè)~的用戶歷史數(shù)據(jù),進(jìn)而將所述歷史查詢?cè)~ 的主題分布,整合到所述包含所述歷史查詢?cè)~的用戶歷史數(shù)據(jù)中,以獲得整合用戶歷史數(shù) 據(jù)。最后,則可以根據(jù)所述整合用戶歷史數(shù)據(jù),進(jìn)行經(jīng)驗(yàn)統(tǒng)計(jì)操作,以獲得如下概率中的至 少一項(xiàng):
[0207] 在所述輸入查詢?cè)~的條件下,所述每個(gè)特定主題出現(xiàn)的經(jīng)驗(yàn)概率;
[0208] 在所述用戶標(biāo)識(shí)信息的條件下,所述每個(gè)特定主題出現(xiàn)的經(jīng)驗(yàn)概率;
[0209] 在所述目標(biāo)查詢?cè)~的條件下,所述每個(gè)特定主題出現(xiàn)的經(jīng)驗(yàn)概率;以及
[0210] 在所述輸入查詢?cè)~和所述每個(gè)特定主題的條件下,所述每個(gè)候選查詢?cè)~出現(xiàn)的經(jīng) 驗(yàn)概率。
[0211] 這樣,數(shù)據(jù)統(tǒng)計(jì)完成之后,則可以將這些統(tǒng)計(jì)結(jié)果進(jìn)行處理,以生成可序列化加載 至內(nèi)存的二進(jìn)制字典數(shù)據(jù),就可以直接被線上服務(wù)例如,用戶發(fā)起的查詢等,加載使用了。
[0212] 具體地,可以利用監(jiān)督方法,生成關(guān)于Μ個(gè)特定主題的分類器。例如,具體可以確 定特定主題的數(shù)量和每個(gè)特定主題的定義,收集訓(xùn)練數(shù)據(jù),利用訓(xùn)練數(shù)據(jù),訓(xùn)練關(guān)于Μ個(gè)特 定主題的查詢?cè)~分類器,以獲得Μ個(gè)特定主題。這種方法,精度高,但召回率低。
[0213] 具體地,可以利用非監(jiān)督方法,建立關(guān)于Μ個(gè)特定主題的主題模型。例如,具體可 以將歷史查詢?cè)~和所述歷史查詢?cè)~所對(duì)應(yīng)的查詢結(jié)果中的題目組合成一個(gè)片段,對(duì)該片段 進(jìn)行分詞處理,以生成訓(xùn)練數(shù)據(jù)。利用訓(xùn)練數(shù)據(jù),訓(xùn)練主題模型(Topic Model)。然后,對(duì) 主題模型進(jìn)行優(yōu)化操作,例如,基于語義的刪除操作、基于語義的去重操作等,以獲得關(guān)于Μ 個(gè)特定主題的主題模型。這種方法,精度稍低,但召回率高。
[0214] 可以理解的是,具體還可以對(duì)利用監(jiān)督方法所生成的關(guān)于Μ個(gè)特定主題的分類 器,以及利用非監(jiān)督方法所建立關(guān)于Μ個(gè)特定主題的主題模型,進(jìn)行整合處理,以獲得一個(gè) 更加可靠的生成關(guān)于Μ個(gè)特定主題的模型。
[0215] 具體地,可以采用利用監(jiān)督方法所生成的關(guān)于Μ個(gè)特定主題的分類器,生成歷史 查詢?cè)~的主題分布。例如,采集全部用戶的用戶歷史查詢數(shù)據(jù)中的歷史查詢?cè)~,進(jìn)而利用該 分類器,生成歷史查詢?cè)~的主題分布。
[0216] 具體地,可以采用利用非監(jiān)督方法所建立關(guān)于Μ個(gè)特定主題的主題模型,生成歷 史查詢?cè)~的主題分布。例如,采集全部用戶的用戶歷史查詢數(shù)據(jù)中的歷史查詢?cè)~,以及該歷 史查詢?cè)~所對(duì)應(yīng)的查詢結(jié)果中的題目,將歷史查詢?cè)~和該歷史查詢?cè)~所對(duì)應(yīng)的查詢結(jié)果中 的題目組合成一個(gè)片段,對(duì)該片段進(jìn)行分詞處理,以生成分詞結(jié)果,進(jìn)而利用該主題模型, 生成歷史查詢?cè)~的主題分布。
[0217] 可以理解的是,具體還可以對(duì)上述兩種方法所生成的歷史查詢?cè)~的主題分布進(jìn)行 整合,以獲得更加可靠的歷史查詢?cè)~的主題分布。
[0218] 本發(fā)明實(shí)現(xiàn)后,使查詢推薦(Suggestion)服務(wù)的點(diǎn)擊展示比(Click_Throught_ Rate,CTR)絕對(duì)提升約2. 5%,相對(duì)提升約6%。用戶點(diǎn)擊位置和用戶平均輸入長(zhǎng)度也有明 顯的降低,明顯的提高了查詢?cè)~推薦的用戶體驗(yàn)。
[0219] 本實(shí)施例中,通過獲得當(dāng)前將要發(fā)起的本次查詢的查詢參數(shù),所述查詢參數(shù)包括 用戶輸入的輸入查詢?cè)~、用戶標(biāo)識(shí)信息和上一次查詢的目標(biāo)查詢?cè)~中的至少一項(xiàng)參數(shù),進(jìn) 而根據(jù)所述查詢參數(shù),獲得所述本次查詢的主題分布,所述主題分布包括Μ個(gè)特定主題的 分布信息,所述Μ為大于或等于2的整數(shù),使得能夠根據(jù)所述主題分布,獲得所述本次查詢 的推薦查詢?cè)~,能夠避免現(xiàn)有技術(shù)中由于用戶通過應(yīng)用反復(fù)進(jìn)行查詢而導(dǎo)致的增加應(yīng)用與 查詢引擎之間的數(shù)據(jù)交互的問題,從而降低了查詢引擎的處理負(fù)擔(dān)。
[0220] 另外,采用本發(fā)明提供的技術(shù)方案,由于利用特定主題對(duì)查詢參數(shù)進(jìn)行合理降維, 使得獲取推薦查詢?cè)~的復(fù)雜度降低,能夠有效提高推薦查詢?cè)~獲取的效率。
[0221] 另外,采用本發(fā)明提供的技術(shù)方案,由于采用了本次查詢的主題分布,使得從語義 層面更為準(zhǔn)確地表達(dá)用戶的查詢意圖,以滿足用戶真正的查詢意圖,能夠有效提高查詢的 有效性。
[0222] 另外,采用本發(fā)明提供的技術(shù)方案,能夠滿足用戶真正的查詢意圖,能夠有效提高 查詢的精確性。
[0223] 另外,采用本發(fā)明提供的技術(shù)方案,能夠滿足用戶真正的查詢意圖,能夠有效提高 查詢的效率。
[0224] 需要說明的是,對(duì)于前述的各方法實(shí)施例,為了簡(jiǎn)單描述,故將其都表述為一系列 的動(dòng)作組合,但是本領(lǐng)域技術(shù)人員應(yīng)該知悉,本發(fā)明并不受所描述的動(dòng)作順序的限制,因?yàn)?依據(jù)本發(fā)明,某些步驟可以采用其他順序或者同時(shí)進(jìn)行。其次,本領(lǐng)域技術(shù)人員也應(yīng)該知 悉,說明書中所描述的實(shí)施例均屬于優(yōu)選實(shí)施例,所涉及的動(dòng)作和模塊并不一定是本發(fā)明 所必須的。
[0225] 在上述實(shí)施例中,對(duì)各個(gè)實(shí)施例的描述都各有側(cè)重,某個(gè)實(shí)施例中沒有詳述的部 分,可以參見其他實(shí)施例的相關(guān)描述。
[0226] 圖2為本發(fā)明另一實(shí)施例提供的查詢?cè)~的推薦裝置的結(jié)構(gòu)示意圖,如圖3所示。本 實(shí)施例的查詢?cè)~的推薦裝置可以包括獲得單元21、處理單元22和推薦單元23。其中,獲得 單元21,用于獲得當(dāng)前將要發(fā)起的本次查詢的查詢參數(shù),所述查詢參數(shù)包括用戶輸入的輸 入查詢?cè)~、用戶標(biāo)識(shí)信息和上一次查詢的目標(biāo)查詢?cè)~中的至少一項(xiàng)參數(shù);處理單元22,用 于根據(jù)所述查詢參數(shù),獲得所述本次查詢的主題分布,所述主題分布包括Μ個(gè)特定主題的 分布信息,所述Μ為大于或等于2的整數(shù);推薦單元23,用于根據(jù)所述主題分布,獲得所述 本次查詢的推薦查詢?cè)~。
[0227] 需要說明的是,本實(shí)施例所提供的查詢?cè)~的推薦裝置,可以是位于網(wǎng)絡(luò)側(cè)的服務(wù) 器中的查詢引擎,也可以是位于本地終端中的應(yīng)用,或者還可以是位于網(wǎng)絡(luò)側(cè)的分布式系 統(tǒng),本實(shí)施例對(duì)此不進(jìn)行特別限定。
[0228] 可以理解的是,所述應(yīng)用可以是安裝在終端上的應(yīng)用程序(nativeApp),或者還可 以是終端上的瀏覽器的一個(gè)網(wǎng)頁程序(webApp),本實(shí)施例對(duì)此不進(jìn)行限定。
[0229] 可選地,在本實(shí)施例的一個(gè)可能的實(shí)現(xiàn)方式中,所述處理單元22,具體可以用于根 據(jù)所述查詢參數(shù),獲得在所述查詢參數(shù)中每項(xiàng)參數(shù)的條件下,所述Μ個(gè)特定主題中每個(gè)特 定主題出現(xiàn)的經(jīng)驗(yàn)概率;以及根據(jù)在所述查詢參數(shù)中每項(xiàng)參數(shù)的條件下,所述每個(gè)特定主 題出現(xiàn)的經(jīng)驗(yàn)概率,獲得所述主題分布。
[0230] 可選地,在本實(shí)施例的一個(gè)可能的實(shí)現(xiàn)方式中,所述推薦單元23,具體可以用于根 據(jù)所述查詢參數(shù),獲得在所述查詢參數(shù)和所述Μ個(gè)特定主題中每個(gè)特定主題的條件下,Ν個(gè) 候選查詢?cè)~中每個(gè)候選查詢?cè)~出現(xiàn)的第一概率,所述Ν為大于或等于2的整數(shù);根據(jù)所述主 題分布和所述每個(gè)候選查詢?cè)~出現(xiàn)的第一概率,獲得在所述查詢參數(shù)的條件下,所述每個(gè) 候選查詢?cè)~出現(xiàn)的第二概率;以及根據(jù)所述每個(gè)候選查詢?cè)~出現(xiàn)的第二概率,選擇0個(gè)候 選查詢?cè)~,以作為推薦查詢?cè)~,所述0為大于或等于1,且小于或等于Ν的整數(shù)。
[0231] 具體地,所述推薦單元23,具體可以用于根據(jù)所述輸入查詢?cè)~,獲得在所述輸入 查詢?cè)~和所述Μ個(gè)特定主題中每個(gè)特定主題的條件下,所述每個(gè)候選查詢?cè)~出現(xiàn)的經(jīng)驗(yàn)概 率,根據(jù)該經(jīng)驗(yàn)概率,獲得在所述查詢參數(shù)和所述Μ個(gè)特定主題中每個(gè)特定主題的條件下, 所述每個(gè)候選查詢?cè)~出現(xiàn)的第一概率。
[0232] 具體地,所述推薦單元23,具體可以用于根據(jù)所述每個(gè)候選查詢?cè)~出現(xiàn)的第二概 率,按照從大到小的順序,對(duì)所述Ν個(gè)候選查詢?cè)~進(jìn)行排序,以獲得第一排序結(jié)果;以及根 據(jù)所述第一排序結(jié)果,選擇前〇個(gè)候選查詢?cè)~,以作為所述推薦查詢?cè)~。
[0233] 具體地,所述推薦單元23,具體可以用于根據(jù)全部用戶的用戶歷史查詢數(shù)據(jù),獲得 所述每個(gè)候選查詢?cè)~的第一位置調(diào)整參數(shù)和所述每個(gè)候選查詢?cè)~的第二位置調(diào)整參數(shù)中 的至少一項(xiàng);根據(jù)所述第一位置調(diào)整參數(shù)和所述第二位置調(diào)整參數(shù)中的至少一項(xiàng),對(duì)所述 第一排序結(jié)果進(jìn)行調(diào)整,以獲得第二排序結(jié)果;以及根據(jù)所述第二排序結(jié)果,選擇前〇個(gè)候 選查詢?cè)~,以作為所述推薦查詢?cè)~。
[0234] 例如,所述推薦單元23,具體可以用于根據(jù)全部用戶的用戶歷史查詢數(shù)據(jù),利用如 下公式,獲得所述第一位置調(diào)整參數(shù),所述第一位置調(diào)整參數(shù)包括所述每個(gè)候選查詢?cè)~的 第一出現(xiàn)位置和所述每個(gè)候選查詢?cè)~的第一調(diào)整位置;
[0235] (BasePositionjXquery, user) = (1 - QueryScore(query, user)) * 10· { IncrementPosition1 = Q1 '
[0236] 其中,
[0237] query表示候選查詢?cè)~;
[0238] user表示所述用戶標(biāo)識(shí)信息;
[0239] BasePositior^ (query, user)表示候選查詢?cè)~的第一出現(xiàn)位置;
[0240] IncrementPositior^表示候選查詢?cè)~的第一調(diào)整位置,單位為個(gè);Q1為大于或等 于〇的整數(shù);
[0241] 其中,
[0242] QueryScore (query, user)表示候選查詢?cè)~的總得分;具體地,
[0243] 計(jì)算QueryScore (query, user)時(shí),采用query在該user下面的個(gè)性化得分及 query在全部用戶下面的通用得分;
[0244] 計(jì)算query在該user下面的個(gè)性化得分時(shí),采用query在該user下面N天內(nèi)的 查詢總頻率及query在N天內(nèi)查詢頻率在天級(jí)時(shí)間上的分布,query在天級(jí)時(shí)間上重復(fù)性 越強(qiáng),得分越高;
[0245] 計(jì)算query在全部用戶下面的通用得分時(shí),采用query在N天內(nèi)的總查詢頻率;
[0246] 計(jì)算N天內(nèi)的查詢總頻率及在單天內(nèi)的查詢頻率時(shí),采用時(shí)間加權(quán),距離當(dāng)前時(shí) 間越近的時(shí)間內(nèi)的查詢頻率權(quán)重越高。
[0247] fBasePosition2(query, pre_query) = (1 - Pnew(query | pre_query)) * 10. { IncrementPosition2 = Q2 5
[0248] 其中,
[0249] query表示候選查詢?cè)~;
[0250] pre_query表示所述目標(biāo)查詢?cè)~;
[0251] BasePosition2 (query, pre_query)表示候選查詢?cè)~的第二出現(xiàn)位置;
[0252] IncrementPosition2表示候選查詢?cè)~的第二調(diào)整位置,單位為個(gè);Q2為大于或等 于〇的整數(shù);
[0253] 其中,
[0254] Pnew (query |pre_query)表示用戶歷史查詢數(shù)據(jù)中候選查詢?cè)~出現(xiàn)在所述目標(biāo)查 詢?cè)~后面的概率得分,其為大于或等于〇,且小于或等于1的數(shù)1 ;具體地,
[0255] 計(jì)算Pnew (query | pre_query)時(shí),采用目標(biāo)查詢?cè)~到候選查詢?cè)~及候選查詢?cè)~到目 標(biāo)查詢?cè)~的雙向條件概率,雙向條件概率均以其經(jīng)驗(yàn)分布代替;
[0256] 計(jì)算條件概率的經(jīng)驗(yàn)分布時(shí),采用時(shí)間加權(quán),距離當(dāng)前時(shí)間越近的時(shí)間內(nèi)的查詢 頻率權(quán)重越高。
[0257] 可選地,在本實(shí)施例的一個(gè)可能的實(shí)現(xiàn)方式中,如圖3所示,本實(shí)施例所提供的查 詢?cè)~的推薦裝置還可以進(jìn)一步包括挖掘單元31,用于根據(jù)全部用戶的用戶歷史查詢數(shù)據(jù), 獲得歷史查詢?cè)~和所述歷史查詢?cè)~的主題分布;根據(jù)所述歷史查詢?cè)~,獲得包含所述歷史 查詢?cè)~的用戶歷史數(shù)據(jù);將所述歷史查詢?cè)~的主題分布,整合到所述包含所述歷史查詢?cè)~ 的用戶歷史數(shù)據(jù)中,以獲得整合用戶歷史數(shù)據(jù);以及根據(jù)所述整合用戶歷史數(shù)據(jù),進(jìn)行經(jīng)驗(yàn) 統(tǒng)計(jì)操作,以獲得如下概率中的至少一項(xiàng):
[0258] 在所述輸入查詢?cè)~的條件下,所述每個(gè)特定主題出現(xiàn)的經(jīng)驗(yàn)概率;
[0259] 在所述用戶標(biāo)識(shí)信息的條件下,所述每個(gè)特定主題出現(xiàn)的經(jīng)驗(yàn)概率;
[0260] 在所述目標(biāo)查詢?cè)~的條件下,所述每個(gè)特定主題出現(xiàn)的經(jīng)驗(yàn)概率;以及
[0261] 在所述輸入查詢?cè)~和所述每個(gè)特定主題的條件下,所述每個(gè)候選查詢?cè)~出現(xiàn)的經(jīng) 驗(yàn)概率。
[0262] 需要說明的是,圖1對(duì)應(yīng)的實(shí)施例中方法,可以由本實(shí)施例提供的查詢?cè)~的推薦 裝置實(shí)現(xiàn)。詳細(xì)描述可以參見圖1對(duì)應(yīng)的實(shí)施例中的相關(guān)內(nèi)容,此處不再贅述。
[0263] 本實(shí)施例中,通過獲得單元獲得當(dāng)前將要發(fā)起的本次查詢的查詢參數(shù),所述查詢 參數(shù)包括用戶輸入的輸入查詢?cè)~、用戶標(biāo)識(shí)信息和上一次查詢的目標(biāo)查詢?cè)~中的至少一項(xiàng) 參數(shù),進(jìn)而由處理單元根據(jù)所述查詢參數(shù),獲得所述本次查詢的主題分布,所述主題分布包 括Μ個(gè)特定主題的分布信息,所述Μ為大于或等于2的整數(shù),使得推薦單元能夠根據(jù)所述主 題分布,獲得所述本次查詢的推薦查詢?cè)~,能夠避免現(xiàn)有技術(shù)中由于用戶通過應(yīng)用反復(fù)進(jìn) 行查詢而導(dǎo)致的增加應(yīng)用與查詢引擎之間的數(shù)據(jù)交互的問題,從而降低了查詢引擎的處理 負(fù)擔(dān)。
[0264] 另外,采用本發(fā)明提供的技術(shù)方案,由于利用特定主題對(duì)查詢參數(shù)進(jìn)行合理降維, 使得獲取推薦查詢?cè)~的復(fù)雜度降低,能夠有效提高推薦查詢?cè)~獲取的效率。
[0265] 另外,采用本發(fā)明提供的技術(shù)方案,由于考慮了本次查詢的主題分布,使得從語義 層面更為準(zhǔn)確地表達(dá)用戶的查詢意圖,以滿足用戶真正的查詢意圖,能夠有效提高查詢的 有效性。
[0266] 另外,采用本發(fā)明提供的技術(shù)方案,能夠滿足用戶真正的查詢意圖,能夠有效提高 查詢的精確性。
[0267] 另外,采用本發(fā)明提供的技術(shù)方案,能夠滿足用戶真正的查詢意圖,能夠有效提高 查詢的效率。
[0268] 所屬領(lǐng)域的技術(shù)人員可以清楚地了解到,為描述的方便和簡(jiǎn)潔,上述描述的系統(tǒng), 裝置和單元的具體工作過程,可以參考前述方法實(shí)施例中的對(duì)應(yīng)過程,在此不再贅述。
[0269] 在本發(fā)明所提供的幾個(gè)實(shí)施例中,應(yīng)該理解到,所揭露的系統(tǒng),裝置和方法,可以 通過其它的方式實(shí)現(xiàn)。例如,以上所描述的裝置實(shí)施例僅僅是示意性的,例如,所述單元的 劃分,僅僅為一種邏輯功能劃分,實(shí)際實(shí)現(xiàn)時(shí)可以有另外的劃分方式,例如多個(gè)單元或組件 可以結(jié)合或者可以集成到另一個(gè)系統(tǒng),或一些特征可以忽略,或不執(zhí)行。另一點(diǎn),所展現(xiàn)或 討論的相互之間的耦合或直接耦合或通信連接可以是通過一些接口,裝置或單元的間接耦 合或通信連接,可以是電性,機(jī)械或其它的形式。
[0270] 所述作為分離部件說明的單元可以是或者也可以不是物理上分開的,作為單元展 現(xiàn)的部件可以是或者也可以不是物理單元,即可以位于一個(gè)地方,或者也可以分布到多個(gè) 網(wǎng)絡(luò)單元上??梢愿鶕?jù)實(shí)際的需要選擇其中的部分或者全部單元來實(shí)現(xiàn)本實(shí)施例方案的目 的。
[0271] 另外,在本發(fā)明各個(gè)實(shí)施例中的各功能單元可以集成在一個(gè)處理單元中,也可以 是各個(gè)單元單獨(dú)物理存在,也可以兩個(gè)或兩個(gè)以上單元集成在一個(gè)單元中。上述集成的單 元既可以采用硬件的形式實(shí)現(xiàn),也可以采用硬件加軟件功能單元的形式實(shí)現(xiàn)。
[0272] 上述以軟件功能單元的形式實(shí)現(xiàn)的集成的單元,可以存儲(chǔ)在一個(gè)計(jì)算機(jī)可讀取存 儲(chǔ)介質(zhì)中。上述軟件功能單元存儲(chǔ)在一個(gè)存儲(chǔ)介質(zhì)中,包括若干指令用以使得一臺(tái)計(jì)算 機(jī)裝置(可以是個(gè)人計(jì)算機(jī),服務(wù)器,或者網(wǎng)絡(luò)裝置等)或處理器(processor)執(zhí)行本發(fā) 明各個(gè)實(shí)施例所述方法的部分步驟。而前述的存儲(chǔ)介質(zhì)包括:U盤、移動(dòng)硬盤、只讀存儲(chǔ)器 (Read-Only Memory, ROM)、隨機(jī)存取存儲(chǔ)器(Random Access Memory, RAM)、磁碟或者光盤 等各種可以存儲(chǔ)程序代碼的介質(zhì)。
[0273] 最后應(yīng)說明的是:以上實(shí)施例僅用以說明本發(fā)明的技術(shù)方案,而非對(duì)其限制;盡 管參照前述實(shí)施例對(duì)本發(fā)明進(jìn)行了詳細(xì)的說明,本領(lǐng)域的普通技術(shù)人員應(yīng)當(dāng)理解:其依然 可以對(duì)前述各實(shí)施例所記載的技術(shù)方案進(jìn)行修改,或者對(duì)其中部分技術(shù)特征進(jìn)行等同替 換;而這些修改或者替換,并不使相應(yīng)技術(shù)方案的本質(zhì)脫離本發(fā)明各實(shí)施例技術(shù)方案的精 神和范圍。
【權(quán)利要求】
1. 一種查詢?cè)~的推薦方法,其特征在于,包括: 獲得當(dāng)前將要發(fā)起的本次查詢的查詢參數(shù),所述查詢參數(shù)包括用戶輸入的輸入查詢 詞、用戶標(biāo)識(shí)信息和上一次查詢的目標(biāo)查詢?cè)~中的至少一項(xiàng)參數(shù); 根據(jù)所述查詢參數(shù),獲得所述本次查詢的主題分布,所述主題分布包括Μ個(gè)特定主題 的分布信息,所述Μ為大于或等于2的整數(shù); 根據(jù)所述主題分布,獲得所述本次查詢的推薦查詢?cè)~。
2. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述根據(jù)所述查詢參數(shù),獲得所述本次查 詢的主題分布,所述主題分布包括Μ個(gè)特定主題的分布信息,包括: 根據(jù)所述查詢參數(shù),獲得在所述查詢參數(shù)中每項(xiàng)參數(shù)的條件下,所述Μ個(gè)特定主題中 每個(gè)特定主題出現(xiàn)的經(jīng)驗(yàn)概率; 根據(jù)在所述查詢參數(shù)中每項(xiàng)參數(shù)的條件下,所述每個(gè)特定主題出現(xiàn)的經(jīng)驗(yàn)概率,獲得 所述主題分布。
3. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述根據(jù)所述主題分布,獲得所述本次查 詢的推薦查詢?cè)~,包括: 根據(jù)所述查詢參數(shù),獲得在所述查詢參數(shù)和所述Μ個(gè)特定主題中每個(gè)特定主題的條件 下,Ν個(gè)候選查詢?cè)~中每個(gè)候選查詢?cè)~出現(xiàn)的第一概率,所述Ν為大于或等于2的整數(shù); 根據(jù)所述主題分布和所述每個(gè)候選查詢?cè)~出現(xiàn)的第一概率,獲得在所述查詢參數(shù)的條 件下,所述每個(gè)候選查詢?cè)~出現(xiàn)的第二概率; 根據(jù)所述每個(gè)候選查詢?cè)~出現(xiàn)的第二概率,選擇〇個(gè)候選查詢?cè)~,以作為推薦查詢?cè)~, 所述〇為大于或等于1,且小于或等于Ν的整數(shù)。
4. 根據(jù)權(quán)利要求3所述的方法,其特征在于,所述根據(jù)所述查詢參數(shù),獲得在所述查詢 參數(shù)和所述Μ個(gè)特定主題中每個(gè)特定主題的條件下,Ν個(gè)候選查詢?cè)~中每個(gè)候選查詢?cè)~出 現(xiàn)的第一概率,包括: 根據(jù)所述輸入查詢?cè)~,獲得在所述輸入查詢?cè)~和所述Μ個(gè)特定主題中每個(gè)特定主題的 條件下,所述每個(gè)候選查詢?cè)~出現(xiàn)的經(jīng)驗(yàn)概率,根據(jù)該經(jīng)驗(yàn)概率,獲得在所述查詢參數(shù)和所 述Μ個(gè)特定主題中每個(gè)特定主題的條件下,所述每個(gè)候選查詢?cè)~出現(xiàn)的第一概率。
5. 根據(jù)權(quán)利要求3或4所述的方法,其特征在于,所述根據(jù)所述每個(gè)候選查詢?cè)~出現(xiàn)的 第二概率,選擇0個(gè)候選查詢?cè)~,以作為推薦查詢?cè)~,包括: 根據(jù)所述每個(gè)候選查詢?cè)~出現(xiàn)的第二概率,按照從大到小的順序,對(duì)所述Ν個(gè)候選查 詢?cè)~進(jìn)行排序,以獲得第一排序結(jié)果; 根據(jù)所述第一排序結(jié)果,選擇前〇個(gè)候選查詢?cè)~,以作為所述推薦查詢?cè)~。
6. 根據(jù)權(quán)利要求5所述的方法,其特征在于,所述根據(jù)所述第一排序結(jié)果,選擇前0個(gè) 候選查詢?cè)~,以作為所述推薦查詢?cè)~,包括: 根據(jù)全部用戶的用戶歷史查詢數(shù)據(jù),獲得所述每個(gè)候選查詢?cè)~的第一位置調(diào)整參數(shù)和 所述每個(gè)候選查詢?cè)~的第二位置調(diào)整參數(shù)中的至少一項(xiàng); 根據(jù)所述第一位置調(diào)整參數(shù)和所述第二位置調(diào)整參數(shù)中的至少一項(xiàng),對(duì)所述第一排序 結(jié)果進(jìn)行調(diào)整,以獲得第二排序結(jié)果; 根據(jù)所述第二排序結(jié)果,選擇前〇個(gè)候選查詢?cè)~,以作為所述推薦查詢?cè)~。
7. 根據(jù)權(quán)利要求6所述的方法,其特征在于,所述根據(jù)全部用戶的用戶歷史查詢數(shù)據(jù), 獲得所述每個(gè)候選查詢?cè)~的第一位置調(diào)整參數(shù)和所述每個(gè)候選查詢?cè)~的第二位置調(diào)整參 數(shù)中的至少一項(xiàng),包括: 根據(jù)全部用戶的用戶歷史查詢數(shù)據(jù),利用如下公式,獲得所述第一位置調(diào)整參數(shù),所述 第一位置調(diào)整參數(shù)包括所述每個(gè)候選查詢?cè)~的第一出現(xiàn)位置和所述每個(gè)候選查詢?cè)~的第 一調(diào)整位置; [BasePosition-L(query, user) = (l - QueryScore(query, user)) * 10t { IncrementPositiori! = Q1 ' 其中, query表示候選查詢?cè)~; user表示所述用戶標(biāo)識(shí)信息; BasePositior^ (query, user)表示候選查詢?cè)~的第一出現(xiàn)位置; IncrementPositior^表示候選查詢?cè)~的第一調(diào)整位置,單位為個(gè);Q1為大于或等于0 的整數(shù); 其中, QueryScore (query, user)表示候選查詢?cè)~的總得分;具體地, 計(jì)算QueryScore (query, user)時(shí),采用query在該user下面的個(gè)性化得分及query 在全部用戶下面的通用得分; 計(jì)算query在該user下面的個(gè)性化得分時(shí),采用query在該user下面N天內(nèi)的查詢 總頻率及query在N天內(nèi)查詢頻率在天級(jí)時(shí)間上的分布,query在天級(jí)時(shí)間上重復(fù)性越強(qiáng), 得分越1? ; 計(jì)算query在全部用戶下面的通用得分時(shí),采用query在N天內(nèi)的總查詢頻率; 計(jì)算N天內(nèi)的查詢總頻率及在單天內(nèi)的查詢頻率時(shí),采用時(shí)間加權(quán),距離當(dāng)前時(shí)間越 近的時(shí)間內(nèi)的查詢頻率權(quán)重越高。
8.根據(jù)權(quán)利要求6所述的方法,其特征在于,所述根據(jù)全部用戶的用戶歷史查詢數(shù)據(jù), 獲得所述每個(gè)候選查詢?cè)~的第一位置調(diào)整參數(shù)和所述每個(gè)候選查詢?cè)~的第二位置調(diào)整參 數(shù)中的至少一項(xiàng),包括: 根據(jù)全部用戶的用戶歷史查詢數(shù)據(jù),利用如下公式,獲得所述每個(gè)候選查詢?cè)~的第二 位置調(diào)整參數(shù),所述第二位置調(diào)整參數(shù)包括所述每個(gè)候選查詢?cè)~的第二出現(xiàn)位置和所述每 個(gè)候選查詢?cè)~的第二調(diào)整位置; iBasePosition2(query, pre_query) = (l - Pnew(query | pre_query)) * 10_ { IncrementPosition2 = Q2 , 其中, query表示候選查詢?cè)~; pre_query表示所述目標(biāo)查詢?cè)~; BasePosition2 (query, pre_query)表示候選查詢?cè)~的第二出現(xiàn)位置; IncrementPosition2表示候選查詢?cè)~的第二調(diào)整位置,單位為個(gè);Q2為大于或等于0 的整數(shù); 其中, Pn"(query |pre_query)表示用戶歷史查詢數(shù)據(jù)中候選查詢?cè)~出現(xiàn)在所述目標(biāo)查詢?cè)~ 后面的概率得分,其為大于或等于〇,且小于或等于1的數(shù)1 ;具體地, 計(jì)算pn? (query I pre_query)時(shí),采用目標(biāo)查詢?cè)~到候選查詢?cè)~及候選查詢?cè)~到目標(biāo)查 詢?cè)~的雙向條件概率,雙向條件概率均以其經(jīng)驗(yàn)分布代替; 計(jì)算條件概率的經(jīng)驗(yàn)分布時(shí),采用時(shí)間加權(quán),距離當(dāng)前時(shí)間越近的時(shí)間內(nèi)的查詢頻率 權(quán)重越高。
9. 根據(jù)權(quán)利要求1?8任一權(quán)利要求所述的方法,其特征在于,所述根據(jù)所述查詢參 數(shù),獲得所述本次查詢的主題分布之前,還包括: 根據(jù)全部用戶的用戶歷史查詢數(shù)據(jù),獲得歷史查詢?cè)~和所述歷史查詢?cè)~的主題分布; 根據(jù)所述歷史查詢?cè)~,獲得包含所述歷史查詢?cè)~的用戶歷史數(shù)據(jù); 將所述歷史查詢?cè)~的主題分布,整合到所述包含所述歷史查詢?cè)~的用戶歷史數(shù)據(jù)中, 以獲得整合用戶歷史數(shù)據(jù); 根據(jù)所述整合用戶歷史數(shù)據(jù),進(jìn)行經(jīng)驗(yàn)統(tǒng)計(jì)操作,以獲得如下概率中的至少一項(xiàng): 在所述輸入查詢?cè)~的條件下,所述每個(gè)特定主題出現(xiàn)的經(jīng)驗(yàn)概率; 在所述用戶標(biāo)識(shí)信息的條件下,所述每個(gè)特定主題出現(xiàn)的經(jīng)驗(yàn)概率; 在所述目標(biāo)查詢?cè)~的條件下,所述每個(gè)特定主題出現(xiàn)的經(jīng)驗(yàn)概率;以及 在所述輸入查詢?cè)~和所述每個(gè)特定主題的條件下,所述每個(gè)候選查詢?cè)~出現(xiàn)的經(jīng)驗(yàn)概 率。
10. -種查詢?cè)~的推薦裝置,其特征在于,包括: 獲得單元,用于獲得當(dāng)前將要發(fā)起的本次查詢的查詢參數(shù),所述查詢參數(shù)包括用戶輸 入的輸入查詢?cè)~、用戶標(biāo)識(shí)信息和上一次查詢的目標(biāo)查詢?cè)~中的至少一項(xiàng)參數(shù); 處理單元,用于根據(jù)所述查詢參數(shù),獲得所述本次查詢的主題分布,所述主題分布包括 Μ個(gè)特定主題的分布信息,所述Μ為大于或等于2的整數(shù); 推薦單元,用于根據(jù)所述主題分布,獲得所述本次查詢的推薦查詢?cè)~。
11. 根據(jù)權(quán)利要求10所述的裝置,其特征在于,所述處理單元,具體用于 根據(jù)所述查詢參數(shù),獲得在所述查詢參數(shù)中每項(xiàng)參數(shù)的條件下,所述Μ個(gè)特定主題中 每個(gè)特定主題出現(xiàn)的經(jīng)驗(yàn)概率;以及 根據(jù)在所述查詢參數(shù)中每項(xiàng)參數(shù)的條件下,所述每個(gè)特定主題出現(xiàn)的經(jīng)驗(yàn)概率,獲得 所述主題分布。
12. 根據(jù)權(quán)利要求10所述的裝置,其特征在于,所述推薦單元,具體用于 根據(jù)所述查詢參數(shù),獲得在所述查詢參數(shù)和所述Μ個(gè)特定主題中每個(gè)特定主題的條件 下,Ν個(gè)候選查詢?cè)~中每個(gè)候選查詢?cè)~出現(xiàn)的第一概率,所述Ν為大于或等于2的整數(shù); 根據(jù)所述主題分布和所述每個(gè)候選查詢?cè)~出現(xiàn)的第一概率,獲得在所述查詢參數(shù)的條 件下,所述每個(gè)候選查詢?cè)~出現(xiàn)的第二概率;以及 根據(jù)所述每個(gè)候選查詢?cè)~出現(xiàn)的第二概率,選擇〇個(gè)候選查詢?cè)~,以作為推薦查詢?cè)~, 所述〇為大于或等于1,且小于或等于Ν的整數(shù)。
13. 根據(jù)權(quán)利要求12所述的裝置,其特征在于,所述推薦單元,具體用于 根據(jù)所述輸入查詢?cè)~,獲得在所述輸入查詢?cè)~和所述Μ個(gè)特定主題中每個(gè)特定主題的 條件下,所述每個(gè)候選查詢?cè)~出現(xiàn)的經(jīng)驗(yàn)概率,根據(jù)該經(jīng)驗(yàn)概率,獲得在所述查詢參數(shù)和所 述Μ個(gè)特定主題中每個(gè)特定主題的條件下,所述每個(gè)候選查詢?cè)~出現(xiàn)的第一概率。
14. 根據(jù)權(quán)利要求12或13所述的裝置,其特征在于,所述推薦單元,具體用于 根據(jù)所述每個(gè)候選查詢?cè)~出現(xiàn)的第二概率,按照從大到小的順序,對(duì)所述Ν個(gè)候選查 詢?cè)~進(jìn)行排序,以獲得第一排序結(jié)果;以及 根據(jù)所述第一排序結(jié)果,選擇前〇個(gè)候選查詢?cè)~,以作為所述推薦查詢?cè)~。
15. 根據(jù)權(quán)利要求14所述的裝置,其特征在于,所述推薦單元,具體用于 根據(jù)全部用戶的用戶歷史查詢數(shù)據(jù),獲得所述每個(gè)候選查詢?cè)~的第一位置調(diào)整參數(shù)和 所述每個(gè)候選查詢?cè)~的第二位置調(diào)整參數(shù)中的至少一項(xiàng); 根據(jù)所述第一位置調(diào)整參數(shù)和所述第二位置調(diào)整參數(shù)中的至少一項(xiàng),對(duì)所述第一排序 結(jié)果進(jìn)行調(diào)整,以獲得第二排序結(jié)果;以及 根據(jù)所述第二排序結(jié)果,選擇前〇個(gè)候選查詢?cè)~,以作為所述推薦查詢?cè)~。
16. 根據(jù)權(quán)利要求15所述的裝置,其特征在于,所述推薦單元,具體用于 根據(jù)全部用戶的用戶歷史查詢數(shù)據(jù),利用如下公式,獲得所述第一位置調(diào)整參數(shù),所述 第一位置調(diào)整參數(shù)包括所述每個(gè)候選查詢?cè)~的第一出現(xiàn)位置和所述每個(gè)候選查詢?cè)~的第 一調(diào)整位置; fBasePosition!(query, user) = (l - QueryScore(query, user)) * 10. { IncrementPositiori! = Q1 ' 其中, query表示候選查詢?cè)~; user表示所述用戶標(biāo)識(shí)信息; BasePositior^ (query, user)表示候選查詢?cè)~的第一出現(xiàn)位置; IncrementPositior^表示候選查詢?cè)~的第一調(diào)整位置,單位為個(gè);Q1為大于或等于0 的整數(shù); 其中, QueryScore (query, user)表示候選查詢?cè)~的總得分;具體地, 計(jì)算QueryScore (query, user)時(shí),采用query在該user下面的個(gè)性化得分及query 在全部用戶下面的通用得分; 計(jì)算query在該user下面的個(gè)性化得分時(shí),采用query在該user下面N天內(nèi)的查詢 總頻率及query在N天內(nèi)查詢頻率在天級(jí)時(shí)間上的分布,query在天級(jí)時(shí)間上重復(fù)性越強(qiáng), 得分越1? ; 計(jì)算query在全部用戶下面的通用得分時(shí),采用query在N天內(nèi)的總查詢頻率; 計(jì)算N天內(nèi)的查詢總頻率及在單天內(nèi)的查詢頻率時(shí),采用時(shí)間加權(quán),距離當(dāng)前時(shí)間越 近的時(shí)間內(nèi)的查詢頻率權(quán)重越高。
17. 根據(jù)權(quán)利要求15所述的裝置,其特征在于,所述推薦單元,具體用于 根據(jù)全部用戶的用戶歷史查詢數(shù)據(jù),利用如下公式,獲得所述每個(gè)候選查詢?cè)~的第二 位置調(diào)整參數(shù),所述第二位置調(diào)整參數(shù)包括所述每個(gè)候選查詢?cè)~的第二出現(xiàn)位置和所述每 個(gè)候選查詢?cè)~的第二調(diào)整位置; iBasePosition2(query, pre_query) = (l - Pnew(query | pre_query)) * 10_ l IncrementPosition2 = Q2 ' 其中, query表示候選查詢?cè)~; pre_query表示所述目標(biāo)查詢?cè)~; BasePosition2 (query, pre_query)表示候選查詢?cè)~的第二出現(xiàn)位置; IncrementPosition2表示候選查詢?cè)~的第二調(diào)整位置,單位為個(gè);Q2為大于或等于0 的整數(shù); 其中, Pn" (query |pre_query)表示用戶歷史查詢數(shù)據(jù)中候選查詢?cè)~出現(xiàn)在所述目標(biāo)查詢?cè)~ 后面的概率得分,其為大于或等于〇,且小于或等于1的數(shù)1 ;具體地, 計(jì)算pn? (query I pre_query)時(shí),采用目標(biāo)查詢?cè)~到候選查詢?cè)~及候選查詢?cè)~到目標(biāo)查 詢?cè)~的雙向條件概率,雙向條件概率均以其經(jīng)驗(yàn)分布代替; 計(jì)算條件概率的經(jīng)驗(yàn)分布時(shí),采用時(shí)間加權(quán),距離當(dāng)前時(shí)間越近的時(shí)間內(nèi)的查詢頻率 權(quán)重越高。
18.根據(jù)權(quán)利要求10?17任一權(quán)利要求所述的裝置,其特征在于,所述裝置還包括挖 掘單元,用于 根據(jù)全部用戶的用戶歷史查詢數(shù)據(jù),獲得歷史查詢?cè)~和所述歷史查詢?cè)~的主題分布; 根據(jù)所述歷史查詢?cè)~,獲得包含所述歷史查詢?cè)~的用戶歷史數(shù)據(jù); 將所述歷史查詢?cè)~的主題分布,整合到所述包含所述歷史查詢?cè)~的用戶歷史數(shù)據(jù)中, 以獲得整合用戶歷史數(shù)據(jù);以及 根據(jù)所述整合用戶歷史數(shù)據(jù),進(jìn)行經(jīng)驗(yàn)統(tǒng)計(jì)操作,以獲得如下概率中的至少一項(xiàng): 在所述輸入查詢?cè)~的條件下,所述每個(gè)特定主題出現(xiàn)的經(jīng)驗(yàn)概率; 在所述用戶標(biāo)識(shí)信息的條件下,所述每個(gè)特定主題出現(xiàn)的經(jīng)驗(yàn)概率; 在所述目標(biāo)查詢?cè)~的條件下,所述每個(gè)特定主題出現(xiàn)的經(jīng)驗(yàn)概率;以及 在所述輸入查詢?cè)~和所述每個(gè)特定主題的條件下,所述每個(gè)候選查詢?cè)~出現(xiàn)的經(jīng)驗(yàn)概 率。
【文檔編號(hào)】G06F17/30GK104102727SQ201410352570
【公開日】2014年10月15日 申請(qǐng)日期:2014年7月23日 優(yōu)先權(quán)日:2014年7月23日
【發(fā)明者】杜俊武, 張智敏, 王京傲 申請(qǐng)人:百度在線網(wǎng)絡(luò)技術(shù)(北京)有限公司