国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      上下文敏感的用戶行為智能預(yù)測(cè)方法

      文檔序號(hào):9810622閱讀:592來(lái)源:國(guó)知局
      上下文敏感的用戶行為智能預(yù)測(cè)方法
      【技術(shù)領(lǐng)域】
      [0001] 本發(fā)明涉及大數(shù)據(jù),特別涉及一種上下文敏感的用戶行為智能預(yù)測(cè)方法。
      【背景技術(shù)】
      [0002] 隨著移動(dòng)互聯(lián)網(wǎng)的發(fā)展,網(wǎng)絡(luò)內(nèi)容給用戶提供了豐富的信息資源和服務(wù)然而網(wǎng)絡(luò) 上信息質(zhì)量卻是參差不齊,大量的信息被復(fù)制、轉(zhuǎn)載,各種推廣信息廣告檢索結(jié)果,已經(jīng)影 響了用戶體驗(yàn);如果對(duì)于所有用戶相同的檢索詞輸入返回一樣的檢索結(jié)果恐怕已經(jīng)不是用 戶希望的。只采用檢索詞匹配的方式,而忽略獨(dú)立用戶的真正需求,也就是不結(jié)合用戶行為 (包括用戶興趣、用戶偏好、用戶查詢記錄)和檢索詞而對(duì)用戶本次查詢意圖做出準(zhǔn)確的判 斷,將無(wú)法給出符合用戶需求的結(jié)果。現(xiàn)有的技術(shù)方案是通過用戶的注視歷史或個(gè)人描述 信息為用戶建立興趣特征向量,再利用該向量對(duì)檢索返回的檢索結(jié)果進(jìn)行相似度的計(jì)算, 這往往將一些用戶真正需要的卻沒有在向量?jī)?nèi)的信息排除在外。

      【發(fā)明內(nèi)容】

      [0003] 為解決上述現(xiàn)有技術(shù)所存在的問題,本發(fā)明提出了一種上下文敏感的用戶行為智 能預(yù)測(cè)方法,包括:
      [0004] 通過用戶行為信息建立興趣向量,調(diào)整檢索詞的權(quán)值,向用戶返回檢索結(jié)果列表。
      [0005] 優(yōu)選地,所述通過用戶行為信息建立興趣向量,進(jìn)一步包括:
      [0006] 基于0DP分類構(gòu)建興趣樹結(jié)構(gòu),樹結(jié)構(gòu)的每個(gè)節(jié)點(diǎn)對(duì)應(yīng)一個(gè)興趣檢索詞,具有興趣 節(jié)點(diǎn)類型標(biāo)識(shí)符,根據(jù)興趣節(jié)點(diǎn)在興趣樹結(jié)構(gòu)中的不同層次具有不同的權(quán)值,對(duì)樹結(jié)構(gòu)特 征詞進(jìn)行別名和近義詞擴(kuò)充;
      [0007] 所述興趣向量中的元素是一個(gè)鍵值對(duì),分別是興趣樹結(jié)構(gòu)中的標(biāo)識(shí)符和具有的權(quán) 值;在興趣確定過程中設(shè)定閾值,只有達(dá)到該閾值的特征詞才能被判別為興趣,并在之后的 興趣更新階段進(jìn)行權(quán)值增加,或者權(quán)值減少;在檢索結(jié)果特征詞的提取上進(jìn)行過濾,檢索結(jié) 果進(jìn)行分詞并取消停用詞之后,采用低頻閾值來(lái)篩選檢索結(jié)果特征詞;在原檢索結(jié)果特征 詞提取規(guī)則上設(shè)置高頻上限,即詞條頻率超過了高頻閾值的詞條不能被判別為檢索結(jié)果特 征詞,在特征詞確定的同時(shí)記錄該詞的詞頻和出現(xiàn)的位置信息,用于確定為興趣特征詞之 后的權(quán)值計(jì)算;
      [0008] 興趣特征詞的確定在檢索結(jié)果特征詞匯判別之后,根據(jù)檢索結(jié)果特征詞所有頁(yè)面 出現(xiàn)的次數(shù)來(lái)確定,興趣特征詞的判別公式表示如下:
      [0009] Iterm= ( 1/n) (TPage+Tsearch_d)+Tsubmit
      [0010] 其中,itCTm是判別興趣特征詞時(shí)的興趣度值,如果值大于1則判別為興趣詞;Tpage3是 指包含興趣特征詞的興趣對(duì)象數(shù)量;是用戶手動(dòng)輸入的檢索詞出現(xiàn)的次數(shù);T page3和 Tseaixh是累加計(jì)算的;η是滿足興趣特征詞條件的計(jì)數(shù)閾值,只有Tpage+Tseaixh-d的值大于等 于η才能被判別為興趣詞;T submit則是用戶提交的興趣詞,該值只能為0或者1;
      [0011] 用戶興趣的更新包括,根據(jù)興趣特征詞使用頻率計(jì)算興趣詞的權(quán)值的變化,在特 征詞判別為興趣特征詞后,設(shè)置其初始化權(quán)值為1,該值是興趣詞的最小權(quán)值,如果權(quán)值小 于1那么該詞則從興趣向量中取消;在確定為興趣特征詞之后進(jìn)行權(quán)值分配計(jì)算,該權(quán)值計(jì) 算根據(jù)詞頻以及詞條在頁(yè)面中出現(xiàn)的位置;將權(quán)值計(jì)算公式表示為:
      [0013] 其中Wl,表示興趣特征詞的權(quán)值,WQ是權(quán)值初始值,即判別為興趣特征詞后設(shè)置的
      是包含興趣特征詞檢索結(jié)果的平均權(quán)值,η為包含該興趣特征詞的 檢索結(jié)果數(shù),k為興趣特征詞在所有檢索結(jié)果中出現(xiàn)的總數(shù);wpi是相應(yīng)檢索結(jié)果中檢索詞的 權(quán)值。
      [0014] 本發(fā)明相比現(xiàn)有技術(shù),具有以下優(yōu)點(diǎn):
      [0015] 本發(fā)明提出了一種上下文敏感的用戶行為智能預(yù)測(cè)方法,有效提高互聯(lián)網(wǎng)用戶特 征的識(shí)別準(zhǔn)確率,充分考慮到檢索結(jié)果與用戶查詢內(nèi)容的相關(guān)度,應(yīng)用廣泛,實(shí)現(xiàn)方便。
      【附圖說明】
      [0016] 圖1是根據(jù)本發(fā)明實(shí)施例的上下文敏感的用戶行為智能預(yù)測(cè)方法的流程圖。
      【具體實(shí)施方式】
      [0017] 下文與圖示本發(fā)明原理的附圖一起提供對(duì)本發(fā)明一個(gè)或者多個(gè)實(shí)施例的詳細(xì)描 述。結(jié)合這樣的實(shí)施例描述本發(fā)明,但是本發(fā)明不限于任何實(shí)施例。本發(fā)明的范圍僅由權(quán)利 要求書限定,并且本發(fā)明涵蓋諸多替代、修改和等同物。在下文描述中闡述諸多具體細(xì)節(jié)以 便提供對(duì)本發(fā)明的透徹理解。出于示例的目的而提供這些細(xì)節(jié),并且無(wú)這些具體細(xì)節(jié)中的 一些或者所有細(xì)節(jié)也可以根據(jù)權(quán)利要求書實(shí)現(xiàn)本發(fā)明。
      [0018] 本發(fā)明的一方面提供了一種上下文敏感的用戶行為智能預(yù)測(cè)方法。圖1是根據(jù)本 發(fā)明實(shí)施例的上下文敏感的用戶行為智能預(yù)測(cè)方法流程圖。本發(fā)明的方案在原通用檢索架 構(gòu)基礎(chǔ)上增加用戶興趣模塊,采用查詢改進(jìn)與權(quán)值設(shè)置結(jié)合方式。用戶輸入檢索詞后由興 趣向量調(diào)整查詢信息,并根據(jù)用戶興趣設(shè)定不同的權(quán)值初始值,在返回結(jié)果列表中調(diào)整排 列順序。
      [0019] 在檢索架構(gòu)中,信息采集模塊負(fù)責(zé)收集用戶數(shù)據(jù),包括用戶檢索詞,注視行為,網(wǎng) 頁(yè)注視時(shí)間等能夠反映用戶特征的信息,為構(gòu)建用戶興趣模型作準(zhǔn)備。然后興趣模塊根據(jù) 本次查詢內(nèi)容結(jié)合用戶興趣,優(yōu)化調(diào)整用戶檢索檢索詞,同時(shí)將興趣向量和調(diào)整后的查詢 詞作為參數(shù)傳遞到排序公式中,最后把經(jīng)過優(yōu)化過濾的檢索結(jié)果列表返回給用戶端瀏覽 器。
      [0020] 信息采集模塊包括檢索詞提取和用戶相關(guān)操作兩部分:1)檢索詞提取,是對(duì)用戶 在檢索界面輸入的內(nèi)容進(jìn)行檢索詞分析提取,通過分詞器對(duì)用戶查詢內(nèi)容進(jìn)行分詞處理。 每個(gè)詞對(duì)應(yīng)一個(gè)Term,最后得到一個(gè)查詢向量V(q) = (termi,term2,temr"termn)其中n> 1,其中查詢向量的每個(gè)維度都帶有一個(gè)數(shù)值,表示檢索詞對(duì)應(yīng)的權(quán)值,用來(lái)標(biāo)識(shí)檢索詞的 重要程度。2)獲取用戶相關(guān)操作信息。用戶在注視結(jié)果列表的過程中,可能只是因?yàn)闃?biāo)題吸 引而點(diǎn)擊了排名靠前的檢索結(jié)果,但是檢索結(jié)果內(nèi)容并不符合用戶需求。所以首先要根據(jù) 用戶注視行為判別興趣對(duì)象,再通過興趣對(duì)象進(jìn)行分析構(gòu)建興趣模型。
      [0021] 注視時(shí)間長(zhǎng)度、在注視檢索結(jié)果的時(shí)候是否進(jìn)行內(nèi)容復(fù)制,收藏等交互操作均表 征興趣對(duì)象的關(guān)系。綜上考慮對(duì)用戶注視檢索結(jié)果進(jìn)行估計(jì)從而得出檢索結(jié)果是否為用戶 的興趣對(duì)象,用作構(gòu)建興趣模型的參考內(nèi)容。具體估計(jì)公式如:
      [0022] Ip = aXTb+PXU〇
      [0023] 其中:
      [0025] Uo = a X Ccopy+b X Ssave+G X Rreply
      [0026] Ip表示檢索結(jié)果興趣度分值,α和β是調(diào)整系數(shù),通過不同的值反映檢索結(jié)果注視 時(shí)間和檢索結(jié)果交互操作在估計(jì)公式中占的比重,其中α+β = 1。!^是用戶在檢索結(jié)果停留 的時(shí)間維度,通過正態(tài)分布來(lái)計(jì)算,反映出用戶的注視檢索結(jié)果時(shí)間。注視時(shí)間At與參考 時(shí)間t的接近程度反映興趣度,注視時(shí)間過長(zhǎng)或者過短都會(huì)降低興趣在檢索結(jié)果注視時(shí)間 上的分值,t是根據(jù)文檔長(zhǎng)度決定的,t和檢索結(jié)果長(zhǎng)度成正比關(guān)系。Uo是用戶在檢索結(jié)果上 的交互操作,C? Py表示用戶是否在檢索結(jié)果進(jìn)行復(fù)制操作,是則值為1,否值為0; Ss_表示用 戶是否進(jìn)行檢索結(jié)果保存操作,是則值為1,否值為〇;Rre3ply表示對(duì)于檢索結(jié)果是否進(jìn)行反饋 相關(guān)操作,是則值為1,否值為(Ka、b和c是Uo的調(diào)整系數(shù),根據(jù)不同的操作對(duì)是否是興趣對(duì) 象評(píng)判的重要程度,分別對(duì)系數(shù)設(shè)置不同的值。
      [0027] 本發(fā)明將用戶興趣分成普遍興趣和特定興趣,這里的普遍興趣不屬于任何一個(gè)用 戶,它是脫離用戶獨(dú)立存在的,可以看作特征詞構(gòu)成的樹結(jié)構(gòu)。而特定興趣則是上述樹結(jié)構(gòu) 的節(jié)點(diǎn)集合,具有普遍興趣的興趣節(jié)點(diǎn)類型標(biāo)識(shí)符,根據(jù)興趣節(jié)點(diǎn)在興趣樹結(jié)構(gòu)中的不同 層次具有不同的權(quán)值。使得興趣模型是脫離用戶依賴,在索引階段或者是離線階段興趣模 型不受到限制的使用。本發(fā)明興趣模型基于0DP分類構(gòu)建的,樹結(jié)構(gòu)的每個(gè)節(jié)
      當(dāng)前第1頁(yè)1 2 
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
      1