通過計算機實現(xiàn)的用于生成趨勢解釋數(shù)據(jù)的方法及裝置制造方法
【專利摘要】本發(fā)明提供一種通過計算機實現(xiàn)的用于生成趨勢解釋數(shù)據(jù)的方法及裝置。所述方法包括:獲取用戶搜索日志;從所述用戶搜索日志提取與一組待考查搜索詞關(guān)聯(lián)搜索的第一關(guān)聯(lián)搜索詞、關(guān)聯(lián)時間點及其搜索次數(shù);根據(jù)提取的第一關(guān)聯(lián)搜索詞、關(guān)聯(lián)時間點及其搜索次數(shù)以及所述用戶搜索日志選取搜索次數(shù)改變幅度超過預(yù)定標(biāo)準(zhǔn)的第二關(guān)聯(lián)搜索詞、其在搜索次數(shù)上的變化方向以及變化時間區(qū)間,所述變化方向為正向或反向;根據(jù)所述第二關(guān)聯(lián)搜索詞以及變化時間區(qū)間生成趨勢解釋數(shù)據(jù)。如此,自動地生成客觀且準(zhǔn)確度較高的趨勢解釋數(shù)據(jù),給用戶提供客觀、有效、系統(tǒng)的趨勢解釋,進而增強用戶體驗。
【專利說明】通過計算機實現(xiàn)的用于生成趨勢解釋數(shù)據(jù)的方法及裝置
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及計算機數(shù)據(jù)處理技術(shù),尤其涉及一種通過計算機實現(xiàn)的用于生成趨勢解釋數(shù)據(jù)的方法及裝置。
【背景技術(shù)】
[0002]隨著互聯(lián)網(wǎng)數(shù)據(jù)的爆炸性增長,圍繞互聯(lián)網(wǎng)數(shù)據(jù)展開的趨勢性應(yīng)用和產(chǎn)品正不斷受到關(guān)注。例如,社交類網(wǎng)站可以給出用戶社交活躍程度的趨勢變化,電子商務(wù)類網(wǎng)站可以給出用戶網(wǎng)絡(luò)消費的趨勢變化,搜索引擎類網(wǎng)站可以給出用戶興趣點的趨勢變化,趨勢本身可以通過對數(shù)據(jù)的組織和挖掘表現(xiàn)出來,但是如何自主的、有效的、系統(tǒng)的對趨勢進行解讀成了一個難題。
[0003]常規(guī)的趨勢可解釋性方法主要是人工或者半自動的對趨勢進行解讀,賦予主觀理解,或者單純的把趨勢變化跟外部新聞綁定在一起。
[0004]上述方法存在如下問題:1)偏主觀性,由于人工解讀,不同的主觀偏見往往會呈現(xiàn)不同結(jié)果;2)局限性,缺乏對可能結(jié)果集的完整的分析;3)非自主性,這樣解讀通常依賴領(lǐng)域?qū)<业南闰炛R,對于某些常規(guī)的領(lǐng)域能產(chǎn)出結(jié)果,但是對于用戶任意的輸入行為則無法獲取結(jié)果;4)時效性差,現(xiàn)有方法往往無法及時的對所描述的趨勢給出可解釋性結(jié)果O
【發(fā)明內(nèi)容】
[0005]本發(fā)明的目的在于,提供一種通過計算機實現(xiàn)的用于生成趨勢解釋數(shù)據(jù)的方法及裝置,通過對用戶搜索日志進行分析以生成一定時間范圍內(nèi)的趨勢解釋數(shù)據(jù),從而可自動地生成客觀且準(zhǔn)確度較高的趨勢解釋數(shù)據(jù)。
[0006]根據(jù)本發(fā)明的一方面,提供一種通過計算機實現(xiàn)的用于生成趨勢解釋數(shù)據(jù)的方法,包括:獲取用戶搜索日志;從所述用戶搜索日志提取與一組待考查搜索詞關(guān)聯(lián)搜索的第一關(guān)聯(lián)搜索詞、關(guān)聯(lián)時間點及其搜索次數(shù);根據(jù)提取的第一關(guān)聯(lián)搜索詞、關(guān)聯(lián)時間點及其搜索次數(shù)以及所述用戶搜索日志選取搜索次數(shù)改變幅度超過預(yù)定標(biāo)準(zhǔn)的第二關(guān)聯(lián)搜索詞、其在搜索次數(shù)上的變化方向以及變化時間區(qū)間,所述變化方向為正向或反向;根據(jù)所述第二關(guān)聯(lián)搜索詞以及變化時間區(qū)間生成趨勢解釋數(shù)據(jù)。
[0007]根據(jù)本發(fā)明的另一方面,提供一種用于生成趨勢解釋數(shù)據(jù)的裝置,包括:日志獲取單元,用戶獲取用戶搜索日志;第一信息提取單元,用于從所述用于搜索日志提取與一組待考查搜索詞關(guān)聯(lián)搜索的第一關(guān)聯(lián)搜索詞、關(guān)聯(lián)搜索時間點及其搜索次數(shù);第二信息提取單元,用于根據(jù)提取的第一關(guān)聯(lián)搜索詞、關(guān)聯(lián)時間點及其搜索次數(shù)以及所述用戶搜索日志選取搜索次數(shù)改變幅度超過預(yù)定標(biāo)準(zhǔn)的第二關(guān)聯(lián)搜索詞、其在搜索次數(shù)上的變化方向以及變化時間區(qū)間,所述變化方向為正向或反向;趨勢解釋數(shù)據(jù)生成單元,根據(jù)所述第二關(guān)聯(lián)搜索詞以及變化時間區(qū)間生成趨勢解釋數(shù)據(jù)。
[0008]本發(fā)明實施例提供的一種用于生成趨勢解釋數(shù)據(jù)的方法及裝置,通過從用戶搜索日志獲取第一關(guān)聯(lián)搜索詞、關(guān)聯(lián)時間點及其搜索次數(shù),再從所述第一關(guān)聯(lián)搜索詞中篩選出第二關(guān)聯(lián)搜索詞,根據(jù)第二關(guān)聯(lián)搜索詞及其在搜索次數(shù)上的變化方向和變化時間區(qū)間生成趨勢解釋數(shù)據(jù),如此,自動地生成客觀且準(zhǔn)確度較高的趨勢解釋數(shù)據(jù),給用戶提供客觀、有效、系統(tǒng)的趨勢解釋,進而增強用戶體驗。
【專利附圖】
【附圖說明】
[0009]圖1是示出本發(fā)明一示例性實施例的用于生成趨勢解釋數(shù)據(jù)的方法流程示意圖。
[0010]圖2是示出本發(fā)明另一示例性實施例的用戶生成趨勢解釋數(shù)據(jù)的方法流程示意圖。
[0011]圖3是示出本發(fā)明示例性實施例的從用戶搜索日志中提取的第一關(guān)聯(lián)搜索詞、關(guān)聯(lián)時間點及其搜索次數(shù)的數(shù)據(jù)示例圖。
[0012]圖4是示出本發(fā)明示例性實施例的第二關(guān)聯(lián)搜索詞、其在搜索次數(shù)上的變化方向以及變化時間區(qū)間的數(shù)據(jù)示例圖。
[0013]圖5是示出本發(fā)明示例性實施例的第二關(guān)聯(lián)搜索詞的趨勢匹配示意圖。
[0014]圖6是示出本發(fā)明示例性實施例的第二關(guān)聯(lián)搜索詞的變化時間區(qū)間映射到一組待考查搜索詞的搜索曲線的數(shù)據(jù)示例圖。
[0015]圖7是示出本發(fā)明示例性實施例的生成的數(shù)據(jù)趨勢以及結(jié)合其他數(shù)據(jù)源進行趨勢解釋的示例圖。
[0016]圖8是示出與圖7所示的數(shù)據(jù)趨勢相對應(yīng)的相關(guān)數(shù)據(jù)源示例圖。
[0017]圖9是示出本發(fā)明一示例性實施例的用于生成趨勢解釋數(shù)據(jù)的裝置結(jié)構(gòu)框圖。
[0018]圖10是示出本發(fā)明另一示例性實施例的用于生成趨勢解釋數(shù)據(jù)的裝置結(jié)構(gòu)框圖。
【具體實施方式】
[0019]本發(fā)明的基本構(gòu)思是,通過計算機技術(shù)從用戶的搜索日志中提取關(guān)聯(lián)搜索詞及其相關(guān)數(shù)據(jù)內(nèi)容信息,并基于關(guān)聯(lián)搜索詞的搜索次數(shù)對關(guān)聯(lián)搜索詞進行篩選,將篩選出的滿足預(yù)定標(biāo)準(zhǔn)的關(guān)聯(lián)搜索詞與其搜索次數(shù)的變化時間區(qū)間結(jié)合,生成趨勢解釋數(shù)據(jù)。
[0020]下面結(jié)合附圖對本發(fā)明示例性實施例的通過計算機實現(xiàn)的用于生成趨勢解釋數(shù)據(jù)的方法及裝置進行詳細(xì)描述。
[0021]圖1是示出本發(fā)明一示例性實施例的用于生成趨勢解釋數(shù)據(jù)的方法流程示意圖。
[0022]參照圖1,在步驟S101,獲取用戶搜索日志,優(yōu)選地,所述用戶搜索日志包括來自多個數(shù)據(jù)源的互聯(lián)網(wǎng)搜索記錄。
[0023]在步驟S102,從用戶搜索日志提取與一組待考查搜索詞關(guān)聯(lián)搜索的第一關(guān)聯(lián)搜索詞、關(guān)聯(lián)時間點及其搜索次數(shù)。
[0024]例如,可從要考查的目標(biāo)詞包、用戶訪問的標(biāo)題集合或者用戶訪問的非結(jié)構(gòu)化數(shù)據(jù)提取所述一組待考查搜索詞。
[0025]根據(jù)本發(fā)明優(yōu)選實施例,通過以下方式提取所述第一關(guān)聯(lián)搜索詞:從所述用戶搜索日志提取任意用戶在一定時間間隔內(nèi)與所述一組待考查搜索詞中的任一待考查搜索詞一同搜索的搜索詞(可稱作查詢間共現(xiàn)的搜索詞,例如,用戶A通過任一待考查搜索詞“嘉寶”進行搜索,在時隔半小時后,該用戶A將“亨氏米粉”與“嘉寶”同時搜索,此時,可以將“亨氏米粉”作為第一關(guān)聯(lián)搜索詞),以及/或者在任一查詢搜索詞中與所述一組待考查搜索詞中的任一待考查搜索詞一同出現(xiàn)的搜索詞作為第一關(guān)聯(lián)搜索詞(可稱作查詢內(nèi)共現(xiàn)的搜索詞,例如,用戶A通過任一待考查搜索詞“嘉寶”進行搜索時,與其同時出現(xiàn)的搜索詞還包括“亨氏米粉”、“范冰冰李治廷”等,可以將“亨氏米粉”、“范冰冰李治廷”等作為第一關(guān)聯(lián)搜索詞)。
[0026]本領(lǐng)域技術(shù)人員可以理解的是,所述任一待考查搜索詞也可能被選取為第一關(guān)聯(lián)搜索詞,此時,將從選取出的第一關(guān)聯(lián)搜索詞的結(jié)果中將所述任一待考查搜索詞剔除。
[0027]此外,根據(jù)本發(fā)明的優(yōu)選實施例,在步驟S102,還從提取的第一關(guān)聯(lián)搜索詞刪除這樣的搜索詞:其與所述一組待考查搜索詞中的任一待考查搜索詞一同出現(xiàn)的次數(shù)低于預(yù)定的共現(xiàn)次數(shù),從而僅選取與待考查搜索詞共現(xiàn)足夠多次數(shù)的搜索詞。
[0028]在提取了第一關(guān)聯(lián)搜索詞之后,按照預(yù)定的統(tǒng)計時間段單位(例如I天),將所述第一關(guān)聯(lián)搜索詞被搜索的統(tǒng)計單位時間段作為其關(guān)聯(lián)時間點,并且統(tǒng)計所述第一關(guān)聯(lián)搜索詞在所述統(tǒng)計單位時間段內(nèi)被搜索的次數(shù)作為其搜索次數(shù)。
[0029]圖3是示出本發(fā)明示例性實施例的從用戶搜索日志中提取的第一關(guān)聯(lián)搜索詞、關(guān)聯(lián)時間點及其搜索次數(shù)的數(shù)據(jù)示例圖。
[0030]參照圖3,可以看出,從目標(biāo)詞包中選取的任一待考查搜索詞為“嘉寶”,通過步驟S102的選取之后,得到的第一關(guān)聯(lián)搜索詞有“亨氏米粉最新事件”(關(guān)聯(lián)時間點為2014年8月19日和2014年8月20日)、“范冰冰李治廷”(關(guān)聯(lián)時間點為2014年8月19日和2014年8月20日)、“中國好聲音張江泡沫”(關(guān)聯(lián)時間點為2014年8月19日)、“burning退役”(關(guān)聯(lián)時間點為2014年8月19日)以及“魅族發(fā)布會”(關(guān)聯(lián)時間點為2014年8月19日)等,且還從用戶搜索日志中提取前述各第一關(guān)聯(lián)搜索詞的關(guān)聯(lián)時間點以及與“嘉寶”共現(xiàn)次數(shù)和各自的訪問量(即使用所述關(guān)聯(lián)搜索詞進行搜索的搜索次數(shù)),其中,“亨氏米粉最新事件”與“嘉寶”的共現(xiàn)次數(shù)最多,分別為13559和13429,訪問量分別為26737和26168。
[0031]在步驟S103,根據(jù)步驟S102中提取的第一關(guān)聯(lián)搜索詞、關(guān)聯(lián)時間點及其搜索次數(shù)以及所述用戶搜索日志選取搜索次數(shù)改變幅度超過預(yù)定標(biāo)準(zhǔn)的第二關(guān)聯(lián)搜索詞、其在搜索次數(shù)上的變化方向以及變化時間區(qū)間,其中,所述變化方向為正向或者反向。
[0032]優(yōu)選地,對任一所述第一關(guān)聯(lián)搜索詞,執(zhí)行如下操作:
[0033]根據(jù)所述用戶搜索日志獲取在其關(guān)聯(lián)時間點前的預(yù)定的考查時間段內(nèi)的所述統(tǒng)計單位時間段的搜索次數(shù)均值,如果所述第一關(guān)聯(lián)搜索詞的搜索次數(shù)相對于所述搜索次數(shù)均值的改變幅度超過預(yù)定改變閾值,則將所述第一關(guān)聯(lián)搜索詞選取為第二關(guān)聯(lián)搜索詞,其中,所述改變幅度可以但不限于用所述第一關(guān)聯(lián)搜索詞的搜索次數(shù)相對于所述搜索次數(shù)均值的比值來表示,所述預(yù)定改變閾值也可以但不限于是比值形式,例如,假設(shè)計算的改變幅度為4,預(yù)定的改變閾值為3,則將其對應(yīng)的第一關(guān)聯(lián)搜索詞選取為第二關(guān)聯(lián)搜索詞。
[0034]此外,將所述第一關(guān)聯(lián)搜索詞的搜索次數(shù)相對于所述搜索次數(shù)均值的改變方向作為所述第二關(guān)聯(lián)搜索詞的在搜索次數(shù)上的變化方向。例如,如果所述第一關(guān)聯(lián)搜索詞的搜索次數(shù)大于所述搜索次數(shù)均值,則可以確定所述第二關(guān)聯(lián)搜索詞在搜索次數(shù)上的變化方向為正方向,反之,則可以確定所述第二關(guān)聯(lián)搜索詞在搜索次數(shù)上的變化方向為負(fù)方向。
[0035]對任一選取的第二關(guān)聯(lián)搜索詞,將其相鄰的關(guān)聯(lián)時間點連續(xù)或者間斷小于預(yù)定時間間隔的關(guān)聯(lián)時間點合并成為其變化時間區(qū)間。
[0036]圖4是示出本發(fā)明示例性實施例的第二關(guān)聯(lián)搜索詞、其在搜索次數(shù)上的變化方向以及變化時間區(qū)間的數(shù)據(jù)示例圖。
[0037]假設(shè)所述統(tǒng)計單位時間段為I天,預(yù)定改變閾值為3,考查時間段為過去的I個月。從圖4中可以看出,“亨氏米粉最新事件”在2014年8月19日相對于考查時間段的搜索次數(shù)均值的改變幅度為63.27,搜索次數(shù)為26168,2014年8月20日相對于考查時間段的搜索次數(shù)均值的改變幅度為20.45,搜索次數(shù)為26737,“范冰冰李治廷”分別為285.98和33.14,搜索次數(shù)分別為23983和30160,而“burning退役”以及“魅族發(fā)布會”在2014年8月19日相對于考查時間段的搜索次數(shù)均值的改變幅度分別為44.03和48.49,搜索次數(shù)分別為30717和30405,因而上述第二關(guān)聯(lián)搜索詞的變化方向均為正向。
[0038]在步驟S104,根據(jù)在步驟S103中選取的第二關(guān)聯(lián)搜索詞以及變化時間區(qū)間生成趨勢解釋數(shù)據(jù)。
[0039]本發(fā)明實施例提供的一種用于生成趨勢解釋數(shù)據(jù)的方法,通過從用戶搜索日志獲取第一關(guān)聯(lián)搜索詞、關(guān)聯(lián)時間點及其搜索次數(shù),再從所述第一關(guān)聯(lián)搜索詞中篩選出第二關(guān)聯(lián)搜索詞,根據(jù)第二關(guān)聯(lián)搜索詞及其在搜索次數(shù)上的變化方向和變化時間區(qū)間生成趨勢解釋數(shù)據(jù),如此,自動地生成客觀且準(zhǔn)確度較高的趨勢解釋數(shù)據(jù),給用戶提供客觀、有效、系統(tǒng)的趨勢解釋,進而增強用戶體驗。
[0040]圖2是示出本發(fā)明另一示例性實施例的用戶生成趨勢解釋數(shù)據(jù)的方法流程示意圖。圖2中的步驟SlOl?步驟S103的處理與圖1中相應(yīng)步驟的處理一致,在此不再詳述。
[0041]參照圖2,在步驟S105,將第二關(guān)聯(lián)搜索詞的變化時間區(qū)間映射到所述一組待考查搜索詞的搜索曲線上。
[0042]可根據(jù)在考查時間段內(nèi),在每個統(tǒng)計單位時間段所述一組待考查搜索詞的總搜索次數(shù)來獲得所述搜索曲線。
[0043]在步驟S106,自第二關(guān)聯(lián)搜索詞的變化時間區(qū)間的區(qū)間起始點回溯至所述搜索變化曲線上沿第二關(guān)聯(lián)搜索詞的變化方向延伸到的階段起始時間點,然后計算在所述第二關(guān)聯(lián)搜索詞的變化時間區(qū)間內(nèi)所述待考查搜索詞的第一平均搜索次數(shù)以及所述階段起始時間點和所述區(qū)間起始時間段之間的所述待考查搜索詞的第二平均搜索次數(shù),其中,關(guān)聯(lián)搜索詞在統(tǒng)計單位時間段內(nèi)被搜索的次數(shù)作為其搜索次數(shù)。
[0044]在步驟S107,根據(jù)所述第二關(guān)聯(lián)搜索詞在搜索次數(shù)上的變化方向、所述第一平均搜索次數(shù)和第二平均搜索次數(shù)的值確定是否將所述第二關(guān)聯(lián)搜索詞選取為第三關(guān)聯(lián)搜索
ο
[0045]根據(jù)本發(fā)明的示例性實施例,如果所述變化方向為正向,并且所述第二平均搜索次數(shù)小于所述第一平均搜索次數(shù),則可認(rèn)為所述第二關(guān)聯(lián)搜索詞的變化方向與所述搜索曲線在所述變化區(qū)間的改變匹配,將所述第二關(guān)聯(lián)搜索詞選取為第三關(guān)聯(lián)搜索詞;如果所述變化方向為負(fù)向,并且所述第二平均搜索次數(shù)大于所述第一平均搜索次數(shù),則將所述第二關(guān)聯(lián)搜索詞選取為第三關(guān)聯(lián)搜索詞;如果所述變化方向為正向并且所述第二平均搜索次數(shù)不小于所述第一平均搜索次數(shù),或者如果所述變化方向為負(fù)向并且所述第二平均搜索次數(shù)不大于所述第一平均搜索次數(shù),則不將所述第二關(guān)聯(lián)搜索詞選取為第三關(guān)聯(lián)搜索詞。
[0046]還可通過對所述第一平均搜索次數(shù)和所述第二平均搜索次數(shù)相差的值設(shè)置閾值來進一步控制第三關(guān)聯(lián)搜索詞的選取。根據(jù)本發(fā)明的另一示例性實施例,如果所述變化方向為正向,所述第二平均搜索次數(shù)小于所述第一平均搜索次數(shù),并且所述第一平均搜索次數(shù)與所述第二平均搜索次數(shù)之間的差大于預(yù)定的第一搜索次數(shù)閾值,則選取所述關(guān)聯(lián)搜索詞;如果所述變化方向為負(fù)向,所述第二平均搜索次數(shù)大于所述第一平均搜索次數(shù),并且所述第二平均搜索次數(shù)與所述第一平均搜索次數(shù)之間的差大于預(yù)定的第二搜索次數(shù)閾值,則選取所述關(guān)聯(lián)搜索詞;如果所述變化方向為正向并且所述第二平均搜索次數(shù)不小于所述第一平均搜索次數(shù),則不選取所述關(guān)聯(lián)搜索詞;如果所述變化方向為正向,所述第二平均搜索次數(shù)小于所述第一平均搜索次數(shù),并且所述第一平均搜索次數(shù)與所述第二平均搜索次數(shù)之間的差不大于預(yù)定的第一搜索次數(shù)閾值,則不選取所述關(guān)聯(lián)搜索詞;如果所述變化方向為負(fù)向并且所述第二平均搜索次數(shù)不大于所述第一平均搜索次數(shù),則不選取所述關(guān)聯(lián)搜索詞;如果所述變化方向為負(fù)向,所述第二平均搜索次數(shù)大于所述第一平均搜索次數(shù),并且所述第二平均搜索次數(shù)與所述第一平均搜索次數(shù)之間的差不大于預(yù)定的第二搜索次數(shù)閾值,則選取所述關(guān)聯(lián)搜索詞。
[0047]圖5是示出本發(fā)明示例性實施例的第二關(guān)聯(lián)搜索詞的趨勢匹配示意圖。
[0048]如圖5所示,以在搜索次數(shù)上正向變化的第二關(guān)聯(lián)搜索詞的變化時間區(qū)間為示例進行說明,從圖中可以看出圖中較大的黑線框中的點表示第一平均搜索次數(shù),較小的線框中的點表示第二平均搜索次數(shù)??梢钥闯?,所述第二平均搜索次數(shù)小于所述第一平均搜索次數(shù),因此可以認(rèn)為第二關(guān)聯(lián)搜索詞的在該變化時間區(qū)間在該段所述一組待考查搜索詞的搜索曲線上是匹配的,即可以將所述第二關(guān)聯(lián)搜索詞選取為第三關(guān)聯(lián)搜索詞。
[0049]圖6是示出本發(fā)明示例性實施例的第二關(guān)聯(lián)搜索詞的變化時間區(qū)間映射到待考查搜索詞的搜索曲線的數(shù)據(jù)示例圖。
[0050]參照圖6,該部分?jǐn)?shù)據(jù)除了包括圖4中所示的數(shù)據(jù)外,還包括區(qū)間的匹配判斷,從圖中可以看出,前述第二關(guān)聯(lián)搜索詞的變化時間區(qū)間與映射到的所述一組待考查搜索詞的搜索曲線完全匹配,均可將所述第二關(guān)聯(lián)搜索詞選取為第三關(guān)聯(lián)搜索詞。
[0051]在步驟S108,根據(jù)所述第三關(guān)聯(lián)搜索詞以及變化時間區(qū)間生成趨勢解釋數(shù)據(jù)。
[0052]優(yōu)選地,根據(jù)所述第三關(guān)聯(lián)搜索詞從多個數(shù)據(jù)源(如新聞、綜藝節(jié)目等)獲取描述數(shù)據(jù),并且獲取其變化時間區(qū)間內(nèi)的搜索次數(shù),根據(jù)所述第三關(guān)聯(lián)搜索詞的所述描述數(shù)據(jù)和搜索次數(shù)生成所述變化時間區(qū)間的趨勢解釋數(shù)據(jù)。
[0053]進一步地,對于變化時間區(qū)間重疊的第三關(guān)聯(lián)搜索詞,按照其在所述變化時間區(qū)間被搜索的次數(shù)由高到低的順序排序。
[0054]圖7是示出本發(fā)明示例性實施例的生成的數(shù)據(jù)趨勢以及結(jié)合其他數(shù)據(jù)源進行趨勢解釋的示例圖,圖8是示出與圖7所示的數(shù)據(jù)趨勢相對應(yīng)的相關(guān)數(shù)據(jù)源示例圖。
[0055]參照圖7,待考查搜索詞為“新葉古村”,考查時間為20140601?20140729,經(jīng)過篩選后提取的第三關(guān)聯(lián)搜索詞為“爸爸去哪兒第二季”,在2014年7月5日當(dāng)天的“新葉古村”的搜索次數(shù)處于考查時間內(nèi)最高值,在此第三關(guān)聯(lián)搜索詞“爸爸去哪兒第二季”、關(guān)聯(lián)時間2014年7月5日以及搜索次數(shù)17336可以作為基本的趨勢解釋數(shù)據(jù)。圖8示出根據(jù)其他數(shù)據(jù)源獲取的描述數(shù)據(jù),通過對所述基本的趨勢解釋數(shù)據(jù)進行擴展,可將“新葉古村”的搜索量在2014年7月5日驟然升高的趨勢解釋為,由于爸爸去哪兒第二季的取景地是新葉古村,使得新古葉村的訪問趨勢發(fā)生變化。
[0056]綜上所述,趨勢解釋數(shù)據(jù)包括但不限于關(guān)聯(lián)搜索詞、可解釋時間或時間區(qū)間、關(guān)聯(lián)搜索詞的搜索次數(shù)以及關(guān)聯(lián)搜索詞的新聞或其他相關(guān)內(nèi)容。
[0057]本發(fā)明實施例提供的一種用于生成趨勢解釋數(shù)據(jù)的方法,通過從用戶搜索日志獲取關(guān)聯(lián)搜索詞、關(guān)聯(lián)時間點及其搜索次數(shù),并通過預(yù)設(shè)的標(biāo)準(zhǔn)或條件對關(guān)聯(lián)搜索詞進行多次篩選,結(jié)合關(guān)聯(lián)時間點及其關(guān)聯(lián)搜索詞的搜索次數(shù)最終生成趨勢解釋數(shù)據(jù),如此,如此,自動地生成客觀且準(zhǔn)確度較高的趨勢解釋數(shù)據(jù),給用戶提供客觀、有效、系統(tǒng)的趨勢解釋,進而增強用戶體驗。
[0058]圖9是示出本發(fā)明一示例性實施例的用于生成趨勢解釋數(shù)據(jù)的裝置結(jié)構(gòu)框圖。參照圖9,所述裝置包括:日志獲取單元201、第一信息提取單元202、第二信息提取單元203以及趨勢解釋數(shù)據(jù)生成單元204。
[0059]日志獲取單元201用于獲取用戶搜索日志,其中,所述用戶搜索日志包括來自多個數(shù)據(jù)源的互聯(lián)網(wǎng)搜索記錄。
[0060]第一信息提取單元202用于從所述用于搜索日志提取與一組待考查搜索詞關(guān)聯(lián)搜索的第一關(guān)聯(lián)搜索詞、關(guān)聯(lián)搜索時間點及其搜索次數(shù)。
[0061]根據(jù)本發(fā)明的優(yōu)選實施例,第一信息提取單元202用于從所述用戶搜索日志提取任一用戶在一定時間間隔內(nèi)與所述一組待考查搜索詞中的任一待考查搜索詞一同搜索的搜索詞,以及/或者在任一查詢搜索詞中與所述一組待考查搜索詞中的任一待考查搜索詞一同出現(xiàn)的搜索詞作為第一關(guān)聯(lián)搜索詞,
[0062]根據(jù)本發(fā)明的優(yōu)選實施例,第一信息提取單元202還用于按照預(yù)定的統(tǒng)計時間段單位,將所述第一關(guān)聯(lián)搜索詞被搜索的統(tǒng)計單位時間段作為其關(guān)聯(lián)時間點,并且統(tǒng)計所述關(guān)聯(lián)搜索詞在所述統(tǒng)計單位時間段內(nèi)被搜索的次數(shù)作為其搜索次數(shù)。
[0063]第二信息提取單元203用于根據(jù)提取的第一關(guān)聯(lián)搜索詞、關(guān)聯(lián)時間點及其搜索次數(shù)以及所述用戶搜索日志選取搜索次數(shù)改變幅度超過預(yù)定標(biāo)準(zhǔn)的第二關(guān)聯(lián)搜索詞、其在搜索次數(shù)上的變化方向以及變化時間區(qū)間,所述變化方向為正向或反向。
[0064]根據(jù)本發(fā)明的優(yōu)選實施例,第二信息提取單元203用于對任一所述第一關(guān)聯(lián)搜索詞,執(zhí)行以下操作:根據(jù)所述用戶搜索日志獲取在其關(guān)聯(lián)時間點前的預(yù)定的考查時間段內(nèi)的所述統(tǒng)計單位時間段的搜索次數(shù)均值,如果所述第一關(guān)聯(lián)搜索詞的搜索次數(shù)相對于所述搜索次數(shù)均值的改變幅度超過預(yù)定改變閾值,則將所述第一關(guān)聯(lián)搜索詞選取為第二關(guān)聯(lián)搜索詞,并且將所述第一關(guān)聯(lián)搜索詞的搜索次數(shù)相對于所述搜索次數(shù)均值的改變方向作為所述第二關(guān)聯(lián)搜索詞在搜索次數(shù)上的變化方向。
[0065]優(yōu)選地,第二信息提取單元203還用于對任一選取的第二關(guān)聯(lián)搜索詞,將其相鄰的關(guān)聯(lián)時間點連續(xù)或間隔小于預(yù)定時間間隔的關(guān)聯(lián)時間點合并成為其變化時間區(qū)間。
[0066]趨勢解釋數(shù)據(jù)生成單元204用于根據(jù)所述第二關(guān)聯(lián)搜索詞以及變化時間區(qū)間生成趨勢解釋數(shù)據(jù)。
[0067]優(yōu)選地,所述裝置還包括待考查搜索詞獲取單元(圖中未示出),用于從要考查的目標(biāo)詞包、用戶訪問的標(biāo)題集合或者用戶訪問的非結(jié)構(gòu)化數(shù)據(jù)提取所述一組待考查搜索
1-rJ ο
[0068]本發(fā)明實施例提供的一種用于生成趨勢解釋數(shù)據(jù)的裝置,通過從用戶搜索日志獲取第一關(guān)聯(lián)搜索詞、關(guān)聯(lián)時間點及其搜索次數(shù),再從所述第一關(guān)聯(lián)搜索詞中篩選出第二關(guān)聯(lián)搜索詞,根據(jù)第二關(guān)聯(lián)搜索詞及其在搜索次數(shù)上的變化方向和變化時間區(qū)間生成趨勢解釋數(shù)據(jù),如此,能夠很好地捕捉到數(shù)據(jù)趨勢產(chǎn)生的原因,給用戶提供一個自主的、有效的、系統(tǒng)的趨勢解釋,進而增強用戶體驗。
[0069]圖10是示出本發(fā)明另一示例性實施例的用于生成趨勢解釋數(shù)據(jù)的裝置結(jié)構(gòu)框圖。參照圖10,所述裝置包括:日志獲取單元201、第一信息提取單元202、第二信息提取單元203、第三關(guān)聯(lián)搜索詞獲取單元205以及趨勢解釋數(shù)據(jù)生成單元204,其中,日志獲取單元201、第一信息提取單元202以及第二信息提取單元203與圖9中所示的相應(yīng)單元一致,在此不再詳述。
[0070]第三關(guān)聯(lián)搜索詞獲取單元205用于將所述第二關(guān)聯(lián)搜索詞的變化時間區(qū)間映射到所述一組待考查搜索詞的搜索變化曲線上,根據(jù)所述一組待考查搜索詞的搜索次數(shù)的變化篩選出變化方向匹配的第三關(guān)聯(lián)搜索詞。
[0071]根據(jù)本發(fā)明優(yōu)選實施例,第三關(guān)聯(lián)搜索詞獲取單元205用于對于任一所述第二關(guān)聯(lián)搜索詞,執(zhí)行以下操作:自所述第二關(guān)聯(lián)搜索詞的變化時間區(qū)間的區(qū)間起始時間點回溯至所述搜索變化曲線上沿所述第二關(guān)聯(lián)搜索詞的變化方向延伸到的階段起始時間點,計算在所述第二關(guān)聯(lián)搜索詞的變化時間區(qū)間內(nèi)所述待考查搜索詞的第一平均搜索次數(shù)以及所述階段起始時間點和所述區(qū)間起始時間點之間所述待考查搜索詞的第二平均搜索次數(shù),用于根據(jù)所述變化方向、所述第一平均搜索次數(shù)和第二平均搜索次數(shù)的值確定是否將所述第二關(guān)聯(lián)搜索詞選取為第三關(guān)聯(lián)搜索詞。
[0072]如果所述變化方向為正向,并且所述第二平均搜索次數(shù)小于所述第一平均搜索次數(shù),則第三關(guān)聯(lián)搜索詞獲取單元205選取所述關(guān)聯(lián)搜索詞。
[0073]如果所述變化方向為負(fù)向,并且所述第二平均搜索次數(shù)大于所述第一平均搜索次數(shù),則第三關(guān)聯(lián)搜索詞獲取單元205選取所述關(guān)聯(lián)搜索詞。
[0074]如果所述變化方向為正向并且所述第二平均搜索次數(shù)不小于所述第一平均搜索次數(shù),或者如果所述變化方向為負(fù)向并且所述第二平均搜索次數(shù)不大于所述第一平均搜索次數(shù),則第三關(guān)聯(lián)搜索詞獲取單元205不選取所述關(guān)聯(lián)搜索詞。
[0075]基于第三關(guān)聯(lián)搜索詞獲取單元205,此時,趨勢解釋數(shù)據(jù)生成單元204用于根據(jù)所述第三關(guān)聯(lián)搜索詞以及變化時間區(qū)間生成趨勢解釋數(shù)據(jù)。
[0076]優(yōu)選地,趨勢解釋數(shù)據(jù)生成單元204根據(jù)所述第三關(guān)聯(lián)搜索詞從多個數(shù)據(jù)源獲取描述數(shù)據(jù),并且獲取其變化時間區(qū)間內(nèi)的搜索次數(shù),且根據(jù)所述第三關(guān)聯(lián)搜索詞的所述描述數(shù)據(jù)和搜索次數(shù)生成所述變化時間區(qū)間的趨勢解釋數(shù)據(jù)。
[0077]優(yōu)選地,趨勢解釋數(shù)據(jù)生成單元204還用于對于變化時間區(qū)間重疊的第三關(guān)聯(lián)搜索詞,按照其在所述變化時間區(qū)間被搜索的次數(shù)由高到低的順序排序。
[0078]本發(fā)明實施例提供的一種用于生成趨勢解釋數(shù)據(jù)的裝置,通過從用戶搜索日志獲取關(guān)聯(lián)搜索詞、關(guān)聯(lián)時間點及其搜索次數(shù),并通過預(yù)設(shè)的標(biāo)準(zhǔn)或條件對關(guān)聯(lián)搜索詞進行多次篩選,結(jié)合關(guān)聯(lián)時間點及其關(guān)聯(lián)搜索詞的搜索次數(shù)最終生成趨勢解釋數(shù)據(jù),如此,能夠很好地捕捉到數(shù)據(jù)趨勢產(chǎn)生的原因,給用戶提供一個自主的、有效的、系統(tǒng)的趨勢解釋,進而增強用戶體驗。
[0079]需要指出,根據(jù)實施的需要,可將本申請中描述的各個步驟拆分為更多步驟,也可將兩個或多個步驟或者步驟的部分操作組合成新的步驟,以實現(xiàn)本發(fā)明的目的。
[0080]上述根據(jù)本發(fā)明的方法可在硬件、固件中實現(xiàn),或者被實現(xiàn)為可存儲在記錄介質(zhì)(諸如CD ROM、RAM、軟盤、硬盤或磁光盤)中的軟件或計算機代碼,或者被實現(xiàn)通過網(wǎng)絡(luò)下載的原始存儲在遠(yuǎn)程記錄介質(zhì)或非暫時機器可讀介質(zhì)中并將被存儲在本地記錄介質(zhì)中的計算機代碼,從而在此描述的方法可被存儲在使用通用計算機、專用處理器或者可編程或?qū)S糜布?諸如ASIC或FPGA)的記錄介質(zhì)上的這樣的軟件處理??梢岳斫?,計算機、處理器、微處理器控制器或可編程硬件包括可存儲或接收軟件或計算機代碼的存儲組件(例如,RAM、R0M、閃存等),當(dāng)所述軟件或計算機代碼被計算機、處理器或硬件訪問且執(zhí)行時,實現(xiàn)在此描述的處理方法。此外,當(dāng)通用計算機訪問用于實現(xiàn)在此示出的處理的代碼時,代碼的執(zhí)行將通用計算機轉(zhuǎn)換為用于執(zhí)行在此示出的處理的專用計算機。
[0081]以上所述,僅為本發(fā)明的【具體實施方式】,但本發(fā)明的保護范圍并不局限于此,任何熟悉本【技術(shù)領(lǐng)域】的技術(shù)人員在本發(fā)明揭露的技術(shù)范圍內(nèi),可輕易想到變化或替換,都應(yīng)涵蓋在本發(fā)明的保護范圍之內(nèi)。因此,本發(fā)明的保護范圍應(yīng)以所述權(quán)利要求的保護范圍為準(zhǔn)。
【權(quán)利要求】
1.一種通過計算機實現(xiàn)的用于生成趨勢解釋數(shù)據(jù)的方法,其特征在于,所述方法包括: 獲取用戶搜索日志; 從所述用戶搜索日志提取與一組待考查搜索詞關(guān)聯(lián)搜索的第一關(guān)聯(lián)搜索詞、關(guān)聯(lián)時間點及其搜索次數(shù); 根據(jù)提取的第一關(guān)聯(lián)搜索詞、關(guān)聯(lián)時間點及其搜索次數(shù)以及所述用戶搜索日志選取搜索次數(shù)改變幅度超過預(yù)定標(biāo)準(zhǔn)的第二關(guān)聯(lián)搜索詞、其在搜索次數(shù)上的變化方向以及變化時間區(qū)間,所述變化方向為正向或反向; 根據(jù)所述第二關(guān)聯(lián)搜索詞以及變化時間區(qū)間生成趨勢解釋數(shù)據(jù)。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述方法還包括: 從要考查的目標(biāo)詞包、用戶訪問的標(biāo)題集合或者用戶訪問的非結(jié)構(gòu)化數(shù)據(jù)提取所述一組待考查搜索詞。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述用戶搜索日志包括來自多個數(shù)據(jù)源的互聯(lián)網(wǎng)搜索記錄。
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述方法還包括: 將所述第二關(guān)聯(lián)搜索詞的變化時間區(qū)間映射到所述一組待考查搜索詞的搜索變化曲線上,根據(jù)所述一組待考查搜索詞的搜索次數(shù)的變化篩選出變化方向匹配的第三關(guān)聯(lián)搜索詞,并且 所述根據(jù)所述第二關(guān)聯(lián)搜索詞以及變化時間區(qū)間生成趨勢解釋數(shù)據(jù)的處理包括:根據(jù)所述第三關(guān)聯(lián)搜索詞以及變化時間區(qū)間生成趨勢解釋數(shù)據(jù)。
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述根據(jù)所述一組待考查搜索詞的搜索次數(shù)的變化篩選出變化方向匹配的第三關(guān)聯(lián)搜索詞的處理包括: 對于任一所述第二關(guān)聯(lián)搜索詞,執(zhí)行以下操作: 自所述第二關(guān)聯(lián)搜索詞的變化時間區(qū)間的區(qū)間起始時間點回溯至所述搜索變化曲線上沿所述第二關(guān)聯(lián)搜索詞的變化方向延伸到的階段起始時間點, 計算在所述第二關(guān)聯(lián)搜索詞的變化時間區(qū)間內(nèi)所述待考查搜索詞的第一平均搜索次數(shù)以及所述階段起始時間點和所述區(qū)間起始時間點之間所述待考查搜索詞的第二平均搜索次數(shù), 根據(jù)所述變化方向、所述第一平均搜索次數(shù)和第二平均搜索次數(shù)的值確定是否將所述第二關(guān)聯(lián)搜索詞選取為第三關(guān)聯(lián)搜索詞。
6.根據(jù)權(quán)利要求5所述的方法,其特征在于,所述根據(jù)所述變化方向、所述第一平均搜索次數(shù)和第二平均搜索次數(shù)的值確定是否選取所述關(guān)聯(lián)搜索詞的處理包括: 如果所述變化方向為正向,并且所述第二平均搜索次數(shù)小于所述第一平均搜索次數(shù),則選取所述關(guān)聯(lián)搜索詞, 如果所述變化方向為負(fù)向,并且所述第二平均搜索次數(shù)大于所述第一平均搜索次數(shù),則選取所述關(guān)聯(lián)搜索詞, 如果所述變化方向為正向并且所述第二平均搜索次數(shù)不小于所述第一平均搜索次數(shù),或者如果所述變化方向為負(fù)向并且所述第二平均搜索次數(shù)不大于所述第一平均搜索次數(shù),則不選取所述關(guān)聯(lián)搜索詞。
7.根據(jù)權(quán)利要求5所述的方法,其特征在于,所述根據(jù)所述變化方向、所述第一平均搜索次數(shù)和第二平均搜索次數(shù)的值確定是否選取所述關(guān)聯(lián)搜索詞的處理包括: 如果所述變化方向為正向,所述第二平均搜索次數(shù)小于所述第一平均搜索次數(shù),并且所述第一平均搜索次數(shù)與所述第二平均搜索次數(shù)之間的差大于預(yù)定的第一搜索次數(shù)閾值,則選取所述關(guān)聯(lián)搜索詞, 如果所述變化方向為負(fù)向,所述第二平均搜索次數(shù)大于所述第一平均搜索次數(shù),并且所述第二平均搜索次數(shù)與所述第一平均搜索次數(shù)之間的差大于預(yù)定的第二搜索次數(shù)閾值,則選取所述關(guān)聯(lián)搜索詞, 如果所述變化方向為正向并且所述第二平均搜索次數(shù)不小于所述第一平均搜索次數(shù),則不選取所述關(guān)聯(lián)搜索詞, 如果所述變化方向為正向,所述第二平均搜索次數(shù)小于所述第一平均搜索次數(shù),并且所述第一平均搜索次數(shù)與所述第二平均搜索次數(shù)之間的差不大于預(yù)定的第一搜索次數(shù)閾值,則不選取所述關(guān)聯(lián)搜索詞, 如果所述變化方向為負(fù)向并且所述第二平均搜索次數(shù)不大于所述第一平均搜索次數(shù),則不選取所述關(guān)聯(lián)搜索詞, 如果所述變化方向為負(fù)向,所述第二平均搜索次數(shù)大于所述第一平均搜索次數(shù),并且所述第二平均搜索次數(shù)與所述第一平均搜索次數(shù)之間的差不大于預(yù)定的第二搜索次數(shù)閾值,則選取所述關(guān)聯(lián)搜索詞。
8.根據(jù)權(quán)利要求1?7中任一項所述的方法,其特征在于,所述從所述用戶搜索日志提取與一組待考查搜索詞關(guān)聯(lián)搜索的第一關(guān)聯(lián)搜索詞、關(guān)聯(lián)時間點及其搜索次數(shù)的處理包括: 從所述用戶搜索日志提取任一用戶在一定時間間隔內(nèi)與所述一組待考查搜索詞中的任一待考查搜索詞一同搜索的搜索詞,以及/或者在任一查詢搜索詞中與所述一組待考查搜索詞中的任一待考查搜索詞一同出現(xiàn)的搜索詞作為第一關(guān)聯(lián)搜索詞, 按照預(yù)定的統(tǒng)計時間段單位,將所述第一關(guān)聯(lián)搜索詞被搜索的統(tǒng)計單位時間段作為其關(guān)聯(lián)時間點,并且統(tǒng)計所述關(guān)聯(lián)搜索詞在所述統(tǒng)計單位時間段內(nèi)被搜索的次數(shù)作為其搜索次數(shù)。
9.根據(jù)權(quán)利要求8所述的方法,其特征在于,所述從所述用戶搜索日志提取與一組待考查搜索詞關(guān)聯(lián)搜索的第一關(guān)聯(lián)搜索詞、關(guān)聯(lián)時間點及其搜索次數(shù)的處理還包括: 從提取的第一關(guān)聯(lián)搜索詞刪除這樣的搜索詞:其與所述一組待考查搜索詞中的任一待考查搜索詞一同出現(xiàn)的次數(shù)低于預(yù)定的共現(xiàn)次數(shù)。
10.根據(jù)權(quán)利要求9所述的方法,其特征在于,所述根據(jù)提取的第一關(guān)聯(lián)搜索詞、關(guān)聯(lián)時間點及其搜索次數(shù)以及所述用戶搜索日志選取搜索次數(shù)改變幅度超過預(yù)定標(biāo)準(zhǔn)的第二關(guān)聯(lián)搜索詞、其在搜索次數(shù)上的變化方向以及變化時間區(qū)間的處理包括: 對任一所述第一關(guān)聯(lián)搜索詞,執(zhí)行以下操作: 根據(jù)所述用戶搜索日志獲取在其關(guān)聯(lián)時間點前的預(yù)定的考查時間段內(nèi)的所述統(tǒng)計單位時間段的搜索次數(shù)均值, 如果所述第一關(guān)聯(lián)搜索詞的搜索次數(shù)相對于所述搜索次數(shù)均值的改變幅度超過預(yù)定改變閾值,則將所述第一關(guān)聯(lián)搜索詞選取為第二關(guān)聯(lián)搜索詞,并且將所述第一關(guān)聯(lián)搜索詞的搜索次數(shù)相對于所述搜索次數(shù)均值的改變方向作為所述第二關(guān)聯(lián)搜索詞在搜索次數(shù)上的變化方向, 對任一選取的第二關(guān)聯(lián)搜索詞,將其相鄰的關(guān)聯(lián)時間點連續(xù)或間隔小于預(yù)定時間間隔的關(guān)聯(lián)時間點合并成為其變化時間區(qū)間。
11.根據(jù)權(quán)利要求10所述的方法,其特征在于,所述根據(jù)所述篩選出的第三關(guān)聯(lián)搜索詞以及變化時間區(qū)間生成趨勢解釋數(shù)據(jù)的處理包括: 根據(jù)所述第三關(guān)聯(lián)搜索詞從多個數(shù)據(jù)源獲取描述數(shù)據(jù),并且獲取其變化時間區(qū)間內(nèi)的搜索次數(shù), 根據(jù)所述第三關(guān)聯(lián)搜索詞的所述描述數(shù)據(jù)和搜索次數(shù)生成所述變化時間區(qū)間的趨勢解釋數(shù)據(jù)。
12.根據(jù)權(quán)利要求11所述的方法,其特征在于,所述根據(jù)所述篩選出的第三關(guān)聯(lián)搜索詞以及變化時間區(qū)間生成趨勢解釋數(shù)據(jù)的處理還包括: 對于變化時間區(qū)間重疊的第三關(guān)聯(lián)搜索詞,按照其在所述變化時間區(qū)間被搜索的次數(shù)由高到低的順序排序。
13.一種用于生成趨勢解釋數(shù)據(jù)的裝置,其特征在于,所述裝置包括: 日志獲取單元,用于獲取用戶搜索日志; 第一信息提取單元,用于從所述用于搜索日志提取與一組待考查搜索詞關(guān)聯(lián)搜索的第一關(guān)聯(lián)搜索詞、關(guān)聯(lián)搜索時間點及其搜索次數(shù); 第二信息提取單元,用于根據(jù)第一信息提取單元提取的第一關(guān)聯(lián)搜索詞、關(guān)聯(lián)時間點及其搜索次數(shù)以及所述用戶搜索日志選取搜索次數(shù)改變幅度超過預(yù)定標(biāo)準(zhǔn)的第二關(guān)聯(lián)搜索詞、其在搜索次數(shù)上的變化方向以及變化時間區(qū)間,所述變化方向為正向或反向; 趨勢解釋數(shù)據(jù)生成單元,用于根據(jù)所述第二關(guān)聯(lián)搜索詞以及變化時間區(qū)間生成趨勢解釋數(shù)據(jù)。
14.根據(jù)權(quán)利要求13所述的裝置,其特征在于,所述裝置還包括: 待考查搜索詞獲取單元,用于從要考查的目標(biāo)詞包、用戶訪問的標(biāo)題集合或者用戶訪問的非結(jié)構(gòu)化數(shù)據(jù)提取所述一組待考查搜索詞。
15.根據(jù)權(quán)利要求14所述的裝置,其特征在于,所述裝置還包括: 第三關(guān)聯(lián)搜索詞獲取單元,用于將所述第二關(guān)聯(lián)搜索詞的變化時間區(qū)間映射到所述一組待考查搜索詞的搜索變化曲線上,根據(jù)所述一組待考查搜索詞的搜索次數(shù)的變化篩選出變化方向匹配的第三關(guān)聯(lián)搜索詞,并且 所述趨勢解釋數(shù)據(jù)生成單元用于根據(jù)所述第三關(guān)聯(lián)搜索詞以及變化時間區(qū)間生成趨勢解釋數(shù)據(jù)。
16.根據(jù)權(quán)利要求15所述的裝置,其特征在于,所述第三關(guān)聯(lián)搜索詞獲取單元用于對于任一所述第二關(guān)聯(lián)搜索詞,執(zhí)行以下操作: 自所述第二關(guān)聯(lián)搜索詞的變化時間區(qū)間的區(qū)間起始時間點回溯至所述搜索變化曲線上沿所述第二關(guān)聯(lián)搜索詞的變化方向延伸到的階段起始時間點, 計算在所述第二關(guān)聯(lián)搜索詞的變化時間區(qū)間內(nèi)所述待考查搜索詞的第一平均搜索次數(shù)以及所述階段起始時間點和所述區(qū)間起始時間點之間所述待考查搜索詞的第二平均搜索次數(shù), 根據(jù)所述變化方向、所述第一平均搜索次數(shù)和第二平均搜索次數(shù)的值確定是否將所述第二關(guān)聯(lián)搜索詞選取為第三關(guān)聯(lián)搜索詞。
17.根據(jù)權(quán)利要求16所述的裝置,其特征在于, 如果所述變化方向為正向,并且所述第二平均搜索次數(shù)小于所述第一平均搜索次數(shù),則所述第三關(guān)聯(lián)搜索詞獲取單元選取所述關(guān)聯(lián)搜索詞, 如果所述變化方向為負(fù)向,并且所述第二平均搜索次數(shù)大于所述第一平均搜索次數(shù),則所述第三關(guān)聯(lián)搜索詞獲取單元選取所述關(guān)聯(lián)搜索詞, 如果所述變化方向為正向并且所述第二平均搜索次數(shù)不小于所述第一平均搜索次數(shù),或者如果所述變化方向為負(fù)向并且所述第二平均搜索次數(shù)不大于所述第一平均搜索次數(shù),則所述第三關(guān)聯(lián)搜索詞獲取單元不選取所述關(guān)聯(lián)搜索詞。
18.根據(jù)權(quán)利要求13?17中任一項所述的裝置,其特征在于,所述第一信息提取單元用于: 從所述用戶搜索日志提取任一用戶在一定時間間隔內(nèi)與所述一組待考查搜索詞中的任一待考查搜索詞一同搜索的搜索詞,以及/或者在任一查詢搜索詞中與所述一組待考查搜索詞中的任一待考查搜索詞一同出現(xiàn)的搜索詞作為第一關(guān)聯(lián)搜索詞, 按照預(yù)定的統(tǒng)計時間段單位,將所述第一關(guān)聯(lián)搜索詞被搜索的統(tǒng)計單位時間段作為其關(guān)聯(lián)時間點,并且統(tǒng)計所述關(guān)聯(lián)搜索詞在所述統(tǒng)計單位時間段內(nèi)被搜索的次數(shù)作為其搜索次數(shù)。
19.根據(jù)權(quán)利要求18所述的裝置,其特征在于,所述第二信息提取單元用于: 對任一所述第一關(guān)聯(lián)搜索詞,執(zhí)行以下操作: 根據(jù)所述用戶搜索日志獲取在其關(guān)聯(lián)時間點前的預(yù)定的考查時間段內(nèi)的所述統(tǒng)計單位時間段的搜索次數(shù)均值, 如果所述第一關(guān)聯(lián)搜索詞的搜索次數(shù)相對于所述搜索次數(shù)均值的改變幅度超過預(yù)定改變閾值,則將所述第一關(guān)聯(lián)搜索詞選取為第二關(guān)聯(lián)搜索詞,并且將所述第一關(guān)聯(lián)搜索詞的搜索次數(shù)相對于所述搜索次數(shù)均值的改變方向作為所述第二關(guān)聯(lián)搜索詞在搜索次數(shù)上的變化方向, 第二信息提取單元還用于對任一選取的第二關(guān)聯(lián)搜索詞,將其相鄰的關(guān)聯(lián)時間點連續(xù)或間隔小于預(yù)定時間間隔的關(guān)聯(lián)時間點合并成為其變化時間區(qū)間。
20.根據(jù)權(quán)利要求19所述的裝置,其特征在于,所述趨勢解釋數(shù)據(jù)生成單元用于: 根據(jù)所述第三關(guān)聯(lián)搜索詞從多個數(shù)據(jù)源獲取描述數(shù)據(jù),并且獲取其變化時間區(qū)間內(nèi)的搜索次數(shù), 根據(jù)所述第三關(guān)聯(lián)搜索詞的所述描述數(shù)據(jù)和搜索次數(shù)生成所述變化時間區(qū)間的趨勢解釋數(shù)據(jù), 其中,對于變化時間區(qū)間重疊的第三關(guān)聯(lián)搜索詞,所述趨勢解釋數(shù)據(jù)生成單元還用于按照其在所述變化時間區(qū)間被搜索的次數(shù)由高到低的順序排序。
【文檔編號】G06F17/30GK104331493SQ201410652571
【公開日】2015年2月4日 申請日期:2014年11月17日 優(yōu)先權(quán)日:2014年11月17日
【發(fā)明者】王曉元, 陳承澤 申請人:百度在線網(wǎng)絡(luò)技術(shù)(北京)有限公司