專利名稱:一種基于用戶行為信息的檢索結(jié)果實(shí)時(shí)更新方法及其系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及信息搜索技術(shù)領(lǐng)域,尤其涉及一種基于用戶行為信息的檢索結(jié)果實(shí)時(shí)更新方法及其系統(tǒng)。
背景技術(shù):
隨著計(jì)算機(jī)及信息技術(shù)的快速發(fā)展,由計(jì)算機(jī)自動(dòng)或輔助用戶生成的信息越來(lái)越多,如何在海量信息中檢索特定信息由此變得十分重要。為了解決此類問(wèn)題,各種計(jì)算機(jī)信息檢索技術(shù)應(yīng)運(yùn)而生,包括計(jì)算機(jī)文件檢索系統(tǒng)、網(wǎng)絡(luò)搜索引擎、在線數(shù)據(jù)庫(kù)聯(lián)機(jī)檢索系統(tǒng)等。計(jì)算機(jī)用戶利用這些系統(tǒng)通過(guò)鍵入關(guān)鍵詞而查找所需信息,此類系統(tǒng)在很大程度上解決了用戶檢索信息的難題,但是缺乏精確檢索的能力以及良好的用戶體驗(yàn)。近年來(lái)機(jī)器學(xué)習(xí)技術(shù)發(fā)展迅速,它可利用人工智能相關(guān)技術(shù)模仿自然人行為和思考方式,對(duì)用戶行為進(jìn)行推斷使計(jì)算機(jī)能達(dá)到交流目的。然而,此類技術(shù)尚未被廣泛用于改進(jìn)信息檢索系統(tǒng)的用 戶體驗(yàn)?,F(xiàn)有技術(shù)中尚未見(jiàn)基于用戶體驗(yàn)及反饋等用戶行為信息的對(duì)檢索結(jié)果進(jìn)行重組及動(dòng)態(tài)實(shí)時(shí)更新的技術(shù)。
發(fā)明內(nèi)容
本發(fā)明提出了一種基于用戶行為信息的檢索結(jié)果實(shí)時(shí)更新方法,包括步驟一獲取包含至少一項(xiàng)條目的檢索結(jié)果;步驟二 獲取用戶行為信息;步驟三基于所述用戶行為信息選擇處理模式,并根據(jù)條目相似度,對(duì)所述檢索結(jié)果中的條目進(jìn)行處理;步驟四得到并顯示更新后的檢索結(jié)果?!案鳁l目的相似度對(duì)比”是各條目之間、各條目的內(nèi)容之間進(jìn)行相似度的比較。相似度比較的算法包括計(jì)算兩個(gè)集合的Jaccard指數(shù)的算法等。相似度用于表示各條目或者各條目的內(nèi)容之間的相似程度。若相似度值越高,則代表該兩個(gè)條目或者條目的內(nèi)容中存在相同或相近似的信息越多。其中,所述步驟一中所述包含至少一項(xiàng)條目的檢索結(jié)果的生成步驟包括步驟Al :獲取關(guān)鍵詞,對(duì)所述關(guān)鍵詞進(jìn)行預(yù)處理;步驟A2 :判斷所述預(yù)處理后的關(guān)鍵詞是否符合要求;若符合要求的,則根據(jù)所述關(guān)鍵詞進(jìn)行檢索生成檢索結(jié)果;若不符合要求的,則重新執(zhí)行所述步驟Al、A2,直至生成檢索結(jié)果。其中,所述步驟一中,根據(jù)權(quán)值將所述條目由高到低排序。其中,所述步驟一中,根據(jù)所述條目被引用次數(shù)將權(quán)值相同的條目由高到低排序。本發(fā)明中,所述用戶行為信息是指對(duì)于所述檢索結(jié)果中包含的各項(xiàng)條目,用戶會(huì)產(chǎn)生不同的興趣或關(guān)注,例如,可能會(huì)訪問(wèn)或點(diǎn)擊某個(gè)/些條目的,可能會(huì)選擇性訪問(wèn)某個(gè)/些條目,可能會(huì)跳過(guò)某個(gè)/些條目,對(duì)各條目的關(guān)注時(shí)間長(zhǎng)短不一,等等,因不同需求或反應(yīng),用戶作出的不同行為,從而形成相應(yīng)的用戶行為信息。所述用戶行為信息包括用戶歷史訪問(wèn)條目、用戶忽略條目、用戶訪問(wèn)不同條目的時(shí)間間隔、用戶歷史訪問(wèn)條目的內(nèi)容長(zhǎng)度、用戶歷史訪問(wèn)條目的閱讀時(shí)間長(zhǎng)度、用戶訪問(wèn)條目時(shí)的生理體征信息。還包括用戶在訪問(wèn)條目時(shí)可能的其他反應(yīng)信息。用戶歷史訪問(wèn)條目,是指用戶在瀏覽檢索結(jié)果的過(guò)程中,點(diǎn)選進(jìn)入某一條目進(jìn)行進(jìn)一步訪問(wèn),則該條目為用戶歷史訪問(wèn)條目。用戶忽略條目,是指用戶在跳躍性瀏覽檢索結(jié)果的過(guò)程中,在訪問(wèn)某一條目之前仍然存在某些條目未被訪問(wèn),則這些條目為用戶忽略條目。用戶訪問(wèn)不同條目的時(shí)間間隔,是指用戶點(diǎn)選不同條目進(jìn)行進(jìn)一步訪問(wèn)的時(shí)間間
隔。 用戶歷史訪問(wèn)條目的內(nèi)容長(zhǎng)度,是指用戶進(jìn)一步訪問(wèn)的這個(gè)條目的內(nèi)容的信息量,包括該條目?jī)?nèi)的字?jǐn)?shù)、視頻播放的時(shí)間等信息。用戶歷史訪問(wèn)條目的閱讀時(shí)間長(zhǎng)度,是指用戶點(diǎn)選后進(jìn)一步訪問(wèn)一個(gè)條目直到訪問(wèn)完畢返回檢索結(jié)果頁(yè)面所花費(fèi)的時(shí)間。用戶訪問(wèn)條目時(shí)的生理體征信息,是指用戶行為信息獲取裝置捕捉到的用戶在閱讀條目時(shí)的各種生理或者肢體特征參數(shù)及其變化信息。例如,用戶在閱讀條目時(shí)產(chǎn)生的面部表情、眼球運(yùn)動(dòng)、肢體特征、心率變化、呼吸變化、或可適用的其他生理體征信息。本發(fā)明進(jìn)一步包括步驟五即,重復(fù)執(zhí)行所述步驟二至步驟四,直到停止獲取所述用戶行為信息時(shí)終止。本發(fā)明中,所述步驟三,基于所述用戶行為信息選擇的所述檢索結(jié)果包含的各項(xiàng)條目的處理模式包括隱藏歷史訪問(wèn)條目、相似歷史訪問(wèn)條目排序、或相似忽略條目排序。進(jìn)一步地,本發(fā)明可以運(yùn)用上述三種模式之任意一項(xiàng)進(jìn)行處理,或運(yùn)用其中的任意多項(xiàng)組合進(jìn)行處理,例如,將已訪問(wèn)的條目加以隱藏,使其不顯示在更新后的檢索結(jié)果中。例如,將相似的已忽略的條目按降序排列,不再顯示在更新后的檢索結(jié)果中。例如,將相似的歷史訪問(wèn)條目按升序排列顯示在更新后的檢索結(jié)果中。其中,所述隱藏歷史訪問(wèn)條目包括以下步驟步驟Rl :基于所述用戶行為信息選中用戶已訪問(wèn)的條目;步驟B2 :將所述用戶已訪問(wèn)的條目從所述檢索結(jié)果中移出;步驟B3 :將所述已訪問(wèn)的條目存入歷史訪問(wèn)條目集合中。本發(fā)明中,歷史訪問(wèn)條目集合是指由已訪問(wèn)的條目組成。歷史訪問(wèn)條目集合存儲(chǔ)于所述條目處理裝置中。其中,所述相似歷史訪問(wèn)條目排序包括以下步驟步驟Cl :基于所述用戶行為信息選中用戶已訪問(wèn)的條目;步驟C2 :將所述歷史訪問(wèn)條目存入所述歷史訪問(wèn)條目集合中;步驟C3 :對(duì)所述歷史訪問(wèn)條目集合中的條目進(jìn)行相似度對(duì)比,獲取所述條目之間的相似內(nèi)容;步驟C4:根據(jù)所述相似內(nèi)容對(duì)所述檢索結(jié)果中的各條目進(jìn)行相似度對(duì)比,生成所述各條目與所述相似內(nèi)容的相似度值;步驟C5 :依據(jù)所述相似度值由高至低對(duì)所述檢索結(jié)果中的各條目進(jìn)行排序。
所述條目之間的相似內(nèi)容是指歷史訪問(wèn)條目之間相似度最高的信息。例如,歷史訪問(wèn)條目的摘要內(nèi)容中均出現(xiàn)某一詞匯ABC,根據(jù)相似度對(duì)比裝置計(jì)算后認(rèn)定該詞匯ABC作為歷史訪問(wèn)條目中相似度最高的內(nèi)容,則該詞匯ABC作為各個(gè)歷史訪問(wèn)條目之間的相似內(nèi)容。根據(jù)所述相似內(nèi)容對(duì)所述檢索結(jié)果中的各條目進(jìn)行相似度對(duì)比,計(jì)算檢索結(jié)果中的各條目與該相似內(nèi)容的相似程度。相似度值越高,即相似程度越高,表明所述檢索結(jié)果中的條目與用戶歷史訪問(wèn)條目越相似。進(jìn)一步地,條目處理裝置根據(jù)該相似度值對(duì)所述檢索結(jié)果中的條目進(jìn)行排序,使用戶感興趣的條目的排序靠前。其中,所述相似忽略條目排序包括以下步驟步驟Dl :基于所述用戶行為信息選中用戶在訪問(wèn)中忽略的條目;步驟D2 :將所述用戶的忽略條目存入歷史忽略條目集合中; 步驟D3 :將所述檢索結(jié)果中的各條目與所述歷史忽略條目集合中的各條目進(jìn)行相似度對(duì)比,獲取所述檢索結(jié)果中各條目的相似性權(quán)值;步驟D4:依據(jù)所述相似性權(quán)值由低至高對(duì)所述檢索結(jié)果中的各條目進(jìn)行排序。本發(fā)明中,歷史忽略條目集合是指由已忽略的條目組成。歷史忽略條目集合存儲(chǔ)于所述條目處理裝置中。其中,進(jìn)一步包括計(jì)算所述歷史訪問(wèn)條目集合中的條目與所述相似內(nèi)容的相似度值,將所述歷史訪問(wèn)條目集合中的各條目按照所述相似度值由高到低排序。本發(fā)明還提出了一種基于用戶行為信息的檢索結(jié)果實(shí)時(shí)更新系統(tǒng),包括用戶行為信息獲取裝置,其獲取用戶行為信息;相似度對(duì)比裝置,其包含計(jì)算相似度的功能模塊;條目處理裝置,其與所述用戶行為信息獲取裝置以及相似度對(duì)比裝置連接,用于根據(jù)所述用戶行為信息獲取裝置獲取的所述用戶行為信息選擇模式,并根據(jù)所述相似度對(duì)比裝置對(duì)于所述條目的相似度對(duì)比結(jié)果,處理所述檢索結(jié)果中的條目;顯示裝置,其與所述條目處理裝置連接,接收并顯示由所述條目處理裝置發(fā)送的條目。本發(fā)明檢索結(jié)果實(shí)時(shí)更新系統(tǒng)中,進(jìn)一步包括數(shù)據(jù)庫(kù),其存儲(chǔ)有海量信息;檢索裝置,其與所述數(shù)據(jù)庫(kù)及所述條目處理裝置連接,用于根據(jù)關(guān)鍵詞檢索所述海量信息生成所述檢索結(jié)果。進(jìn)一步地,所述檢索裝置生成所述檢索結(jié)果中各條目與所述關(guān)鍵詞的匹配度的權(quán)值。其中,用戶行為信息獲取裝置包括鼠標(biāo)、鍵盤、圖像獲取設(shè)備、計(jì)算機(jī)系統(tǒng)內(nèi)置的計(jì)時(shí)設(shè)備、紅外感應(yīng)設(shè)備、全球定位系統(tǒng)、觸覺(jué)感應(yīng)設(shè)備。本發(fā)明根據(jù)用戶在與檢索系統(tǒng)交互過(guò)程中產(chǎn)生的間接信息而動(dòng)態(tài)更新和重組搜索結(jié)果的機(jī)制,改進(jìn)計(jì)算機(jī)檢索系統(tǒng)的用戶體驗(yàn)。本發(fā)明基于用戶行為信息實(shí)時(shí)改進(jìn)檢索結(jié)果,排序靠前的條目始終為用戶需要且未被訪問(wèn)的條目,使用戶更迅速地檢索查詢到其所需信息,提高了用戶查看檢索結(jié)果的效率,從而實(shí)現(xiàn)為用戶提供快速精確的檢索服務(wù)的目的。本發(fā)明在與用戶交互的過(guò)程中逐步迭代改進(jìn)每一次檢索過(guò)程的結(jié)果,保證用戶每次首先看到的都是未閱讀過(guò)的結(jié)果條目,排列在檢索結(jié)果前列的結(jié)果條目都是與用戶想要的最終結(jié)果最相似的,且當(dāng)用戶回查歷史訪問(wèn)條目時(shí),排序最靠前的條目就是用戶最想回查的條目,改善了用戶檢索體驗(yàn)。本發(fā)明不需要直接詢問(wèn)用戶問(wèn)題,而是通過(guò)間接讀取用戶與系統(tǒng)的交互行為信息推測(cè)用戶的偏好情況。例如,當(dāng)用戶使用本發(fā)明系統(tǒng)檢索信息時(shí),系統(tǒng)會(huì)返回相關(guān)結(jié)果條目并顯示每個(gè)結(jié)果條目的概述性內(nèi)容,用戶會(huì)根據(jù)這些概述性內(nèi)容選擇查看結(jié)果條目的完整內(nèi)容。例如,當(dāng)用戶依據(jù)內(nèi)容概要信息查閱了一些檢索結(jié)果的條目(設(shè)檢索結(jié)果為RS,ResultSet)后,本系統(tǒng)自動(dòng)從這些條目中提取它們的相似信息(記為Cl,即相似內(nèi)容),并利用此相似信息Cl在檢索結(jié)果中再次檢索(亦可連接數(shù)據(jù)庫(kù)重新檢索),動(dòng)態(tài)更新檢索結(jié)果RS內(nèi)容以及RS中條目的排名。再如,系統(tǒng)檢測(cè)用戶已訪問(wèn)的條目和未訪問(wèn)的條目統(tǒng)計(jì)信息,推測(cè)出用戶不感興趣的方面,動(dòng)態(tài)降低檢索結(jié)果中此類類目的排名。例如假設(shè)用戶訪問(wèn)了 RS中的條目R1,R2,R4以及R5,則系統(tǒng)推斷出該用戶對(duì)條目R3以及與之相似的結(jié)果不感興趣,進(jìn)一步將RS中與R3相似的的條目動(dòng)態(tài)降低排名,以減少該類條目對(duì)用戶的干擾。 本發(fā)明自動(dòng)隱藏用戶歷史訪問(wèn)條目,例如,當(dāng)用戶訪問(wèn)了某條結(jié)果條目后再次返回到檢索結(jié)果頁(yè)面時(shí),本發(fā)明系統(tǒng)將用戶已訪問(wèn)過(guò)的條目自動(dòng)隱藏。這樣用戶每次返回到檢索結(jié)果頁(yè)面時(shí)看到的都是未訪問(wèn)過(guò)的結(jié)果條目,從而減少了重復(fù)冗余信息對(duì)用戶的干擾。即,本發(fā)明將已訪問(wèn)的條目從檢索結(jié)果的條目中轉(zhuǎn)移至已訪問(wèn)的條目中,保持用戶在查看檢索結(jié)果時(shí)避免重復(fù)訪問(wèn)到已訪問(wèn)的條目,使用戶能始終查看未經(jīng)訪問(wèn)的條目,從而減少了重復(fù)冗余信息對(duì)用戶的干擾。本發(fā)明對(duì)隱藏的歷史訪問(wèn)條目自動(dòng)排序,例如,在歷史訪問(wèn)條目自動(dòng)隱藏后,本發(fā)明提供接口以便用戶查看歷史訪問(wèn)。并且,在每一次展開(kāi)歷史訪問(wèn)條目的內(nèi)容時(shí),根據(jù)用戶的交互信息對(duì)歷史訪問(wèn)條目進(jìn)行排序,以便用戶能快速地從歷史訪問(wèn)信息中找到自己關(guān)注的條目。例如,本發(fā)明對(duì)用戶已訪問(wèn)的條目中進(jìn)行相似度對(duì)比,選取其中相似度最高的相似內(nèi)容作為用戶最感興趣的內(nèi)容。通過(guò)根據(jù)該相似內(nèi)容對(duì)檢索結(jié)果中的條目進(jìn)行相似度由高到低的排序,使檢索結(jié)果中包含用戶最感興趣的內(nèi)容的條目的排序靠前,便于用戶更快查看到感興趣的條目,提高了用戶查看條目的效率,改善了用戶的檢索體驗(yàn)。本發(fā)明對(duì)用戶在選擇性或跳躍性訪問(wèn)時(shí)被忽略的條目歸為歷史忽略條目集合,將檢索結(jié)果中的各條目與歷史忽略條目集合中的每個(gè)被忽略條目進(jìn)行相似度對(duì)比,按照獲得的相似性權(quán)值由低至高對(duì)檢索結(jié)果中的各條目進(jìn)行排序,使用戶不感興趣的內(nèi)容的排序靠后,提高了用戶查看條目的效率,改善了用戶的檢索體驗(yàn)。
圖I表示本發(fā)明基于用戶行為信息的檢索結(jié)果實(shí)時(shí)更新方法的流程圖。圖2表示本發(fā)明基于用戶行為信息的檢索結(jié)果實(shí)時(shí)更新方法的詳細(xì)流程圖。圖3表示本發(fā)明基于用戶行為信息的檢索結(jié)果實(shí)時(shí)更新系統(tǒng)的結(jié)構(gòu)圖。圖4表示本發(fā)明實(shí)施例中條目轉(zhuǎn)移至歷史訪問(wèn)條目集合的示意圖。圖5表示本發(fā)明相似歷史訪問(wèn)條目排序模式的詳細(xì)流程圖。圖6表示本發(fā)明實(shí)施例中基于用戶行為信息的條目處理的示意圖。
圖7表示本發(fā)明隱藏歷史訪問(wèn)條目模式的流程圖。圖8表示本發(fā)明相似歷史訪問(wèn)條目排序模式的流程圖。圖9表示本發(fā)明相似忽略條目排序模式的流程圖。
具體實(shí)施例方式結(jié)合以下具體實(shí)施例和附圖,對(duì)本發(fā)明作進(jìn)一步詳細(xì)說(shuō)明。實(shí)施本發(fā)明的過(guò)程、條件、實(shí)驗(yàn)方法等,除以下專門提及的內(nèi)容之外,均為本領(lǐng)域的普遍知識(shí)和公知常識(shí),本發(fā)明沒(méi)有特別限制內(nèi)容。如圖I至圖9,I-數(shù)據(jù)庫(kù),2-檢索裝置,3-用戶行為信息獲取裝置,4-條目處理裝 置,5-相似度對(duì)比裝置,6-顯示裝置。如圖I與圖2所示,本發(fā)明基于用戶行為信息的檢索結(jié)果實(shí)時(shí)更新方法,包括步驟一獲取包含至少一項(xiàng)條目的檢索結(jié)果,該檢索結(jié)果通過(guò)顯示裝置6顯示并展示給用戶。用戶輸入關(guān)鍵詞。由檢索裝置2獲得用戶輸入的關(guān)鍵詞并對(duì)該關(guān)鍵詞進(jìn)行預(yù)處理。關(guān)鍵詞的預(yù)處理是指對(duì)關(guān)鍵詞的修剪、拆分、合成等,分析并提取出關(guān)鍵詞中的核心部分用于數(shù)據(jù)庫(kù)I的檢索。關(guān)鍵詞預(yù)處理完畢之后,進(jìn)一步對(duì)該關(guān)鍵詞是否符合檢索要求進(jìn)行判斷。檢索要求通常包括關(guān)鍵詞的長(zhǎng)度要求、關(guān)鍵詞涉及的敏感信息審查要求等。當(dāng)關(guān)鍵詞不符合檢索要求的,則提示用戶重新輸入關(guān)鍵詞直到關(guān)鍵詞符合檢索要求或用戶退出檢索為止。若關(guān)鍵詞符合檢索要求,則檢索裝置2利用該關(guān)鍵詞在數(shù)據(jù)庫(kù)I存儲(chǔ)的海量信息中進(jìn)行檢索直至生成相應(yīng)的檢索結(jié)果,將該檢索結(jié)果傳輸至條目處理裝置4,條目處理裝置4獲取該檢索結(jié)果并保存,該檢索結(jié)果中包含一項(xiàng)或多項(xiàng)條目。條目處理裝置4將待顯示的條目傳輸至顯示裝置6,由顯示裝置6展示該檢索結(jié)果及其所包含的各項(xiàng)條目。檢索裝置2在利用關(guān)鍵詞生成檢索結(jié)果時(shí),同時(shí)獲得檢索結(jié)果中各條目的相關(guān)信息,其中包括各條目的權(quán)值與被引用次數(shù)。使用關(guān)鍵詞進(jìn)行檢索時(shí),檢索裝置2獲得該條目與關(guān)鍵詞的權(quán)值。本發(fā)明中,權(quán)值是指關(guān)鍵詞與各條目的匹配程度。權(quán)值越高,則說(shuō)明該條目與關(guān)鍵詞的匹配程度越高。權(quán)值的計(jì)算方法可采用現(xiàn)有的算法及開(kāi)源工具完成,如Lucene。例如,含有與關(guān)鍵詞相同內(nèi)容的條目的權(quán)值是高于不含有與關(guān)鍵詞相關(guān)內(nèi)容的條目的權(quán)值。條目的被引用次數(shù)是指該條目被點(diǎn)擊或引用或查閱的次數(shù),由數(shù)據(jù)庫(kù)I保存。檢索裝置2獲取條目時(shí),同時(shí)獲取該條目的一些參數(shù),包括該條目的被引用次數(shù)。本發(fā)明中,優(yōu)選地,條目處理裝置4對(duì)獲取的檢索結(jié)果中的各項(xiàng)條目根據(jù)其權(quán)值(權(quán)值是指關(guān)鍵詞與各條目的匹配度)進(jìn)行排序,例如,按權(quán)值由高至低對(duì)各條目進(jìn)行排序。進(jìn)一步優(yōu)選地,當(dāng)檢索結(jié)果中包含的多個(gè)條目具有相同的權(quán)值時(shí),即出現(xiàn)與關(guān)鍵詞匹配度相同的多個(gè)條目的情況,則條目處理裝置4根據(jù)各條目被引用的次數(shù)將這些權(quán)值相同的條目再次排序,例如,根據(jù)被引用次數(shù)由高至低將各條目進(jìn)一步排序。步驟二 獲取用戶行為信息。用戶查看顯示裝置6展示的上述步驟一得到的檢索結(jié)果。用戶根據(jù)實(shí)際情況的不同,通過(guò)鼠標(biāo)、鍵盤、觸摸屏等常用設(shè)備進(jìn)行操作,點(diǎn)擊、選取該檢索結(jié)果中的各個(gè)相關(guān)條目進(jìn)行進(jìn)一步訪問(wèn)。用戶行為信息獲取裝置3通過(guò)監(jiān)控用戶操作,判斷用戶訪問(wèn)某個(gè)/些條目或忽略某個(gè)/些條目,從而獲得用戶行為信息,該用戶行為信息反映用戶對(duì)各條目不同程度的關(guān)注或忽略。用戶行為信息包括用戶歷史訪問(wèn)條目、用戶忽略條目、用戶訪問(wèn)不同條目的時(shí)間間隔、用戶歷史訪問(wèn)條目的內(nèi)容長(zhǎng)度、用戶歷史訪問(wèn)條目的閱讀時(shí)間長(zhǎng)度、用戶訪問(wèn)條目時(shí)的生理體征信息。還包括用戶在訪問(wèn)條目時(shí)可能的其他反應(yīng)信息。例如,用戶行為信息獲取裝置3監(jiān)控到用戶點(diǎn)選了某一條目作進(jìn)一步訪問(wèn),則用戶行為信息獲取裝置3判定該條目為用戶歷史訪問(wèn)條目。例如,用戶在訪問(wèn)檢索結(jié)果的條目時(shí),可能跳躍性地訪問(wèn)其中某些條目,而忽略了其他條目。當(dāng)用戶點(diǎn)選某一條目時(shí),若該條目之前存在未被訪問(wèn)的條目,用戶行為信息獲取裝置3判定這些未被訪問(wèn)的條目為用戶忽略條目。
例如,用戶行為信息獲取裝置3可通過(guò)檢測(cè)用戶訪問(wèn)不同條目時(shí)所花的時(shí)間和精力推測(cè)用戶實(shí)際感興趣的內(nèi)容。進(jìn)一步地,為了提高本發(fā)明系統(tǒng)推斷評(píng)估用戶喜好的精度,以該用戶訪問(wèn)閱讀該條目?jī)?nèi)容的時(shí)間長(zhǎng)度除以該條目的內(nèi)容長(zhǎng)度所獲得的一個(gè)度量值,作為對(duì)用戶訪問(wèn)某條結(jié)果項(xiàng)所花的時(shí)間和精力的評(píng)估。例如,當(dāng)用戶行為信息獲取裝置3檢測(cè)到用戶在某個(gè)結(jié)果條目上花費(fèi)的精力異常的高時(shí),更新系統(tǒng)推斷該用戶對(duì)該條目以及與該條目類似的信息感興趣,并在后面的步驟中提升此類信息的排名,以便該用戶盡快獲取相關(guān)相似信息;反之,當(dāng)用戶行為信息獲取裝置3檢測(cè)到用戶在某個(gè)結(jié)果條目上花費(fèi)的精力異常的低時(shí),更新系統(tǒng)推斷該用戶對(duì)該條目以及與該條目類似的信息不感興趣,并在后面的步驟中降低此類信息的排名,以降低該用戶盡快獲取此類信息的幾率。例如,用戶行為信息獲取裝置3,通過(guò)記錄某一單獨(dú)用戶的歷史閱讀速度統(tǒng)計(jì)信息來(lái)大致判斷該用戶閱讀某個(gè)條目的預(yù)計(jì)時(shí)間,以區(qū)分用戶在閱讀過(guò)程中受到其它干擾而導(dǎo)致閱讀時(shí)間變長(zhǎng)的現(xiàn)象。優(yōu)選地,為了更準(zhǔn)確推斷用戶喜好,用戶行為信息獲取裝置3還可以進(jìn)一步通過(guò)獲取在閱讀條目時(shí)的用戶面部表情信息進(jìn)行判斷。優(yōu)選地,本發(fā)明設(shè)置圖像獲取設(shè)備,捕獲用戶在閱讀某個(gè)/些條目時(shí)的實(shí)時(shí)面部表情。進(jìn)一步地,設(shè)置面部表情分析模塊,分析用戶的實(shí)時(shí)表情,建立每個(gè)條目的表情參數(shù),通過(guò)結(jié)合用戶的其他行為參數(shù),捕捉用戶行為信息,以確定用戶喜好度。例如,在用戶同意情況下可以直接通過(guò)瀏覽器插件的方式調(diào)用用戶計(jì)算機(jī)的圖像捕捉設(shè)備。進(jìn)一步地,還可以獲取用戶在閱讀條目時(shí)發(fā)生的眼球運(yùn)動(dòng)變化、肢體特征變化、心率變化、呼吸變化、或可適用的其他生理體征信息。步驟三基于用戶行為信息選擇處理模式,并根據(jù)條目相似度,對(duì)檢索結(jié)果中的條目進(jìn)行處理。本發(fā)明中,基于用戶行為信息對(duì)檢索結(jié)果包含的各項(xiàng)條目的處理模式包括隱藏歷史訪問(wèn)條目、相似歷史訪問(wèn)條目排序、相似忽略條目排序等模式。本發(fā)明可以采用上述三種模式中的任意一種,還可用任意兩種或任意兩種以上的模式組合。圖7顯示的是本發(fā)明隱藏歷史訪問(wèn)條目模式的流程圖。在執(zhí)行隱藏歷史訪問(wèn)條目模式后,當(dāng)用戶訪問(wèn)某一條目后再次返回到檢索結(jié)果頁(yè)面時(shí),用戶已訪問(wèn)過(guò)的條目被自動(dòng)隱藏,在檢索結(jié)果列表的頁(yè)面上則不再顯示該用戶剛剛訪問(wèn)過(guò)的條目,即,在返回檢索結(jié)果列表的頁(yè)面之后用戶看到的全部條目一定是該用戶未訪問(wèn)過(guò)的。其中,用戶已訪問(wèn)的條目從檢索結(jié)果的內(nèi)容中轉(zhuǎn)移至歷史訪問(wèn)條目集合中。歷史訪問(wèn)條目集合存儲(chǔ)于條目處理裝置4中。進(jìn)一步地,歷史訪問(wèn)條目自動(dòng)隱藏之后,若用戶需要查看所隱藏歷史訪問(wèn)的記錄,本發(fā)明提供展示歷史閱讀條目重新的功能,用戶可查閱所有歷史訪問(wèn)信息。進(jìn)一步地,為方便用戶從歷史訪問(wèn)信息中快速找出關(guān)注條目,本發(fā)明在展開(kāi)歷史訪問(wèn)條目時(shí)可以根據(jù)用戶行為信息對(duì)歷史訪問(wèn)條目進(jìn)行排序,例如,通過(guò)相似度對(duì)比裝置5對(duì)歷史訪問(wèn)條目集合中的各歷史訪問(wèn)條目的摘要等信息進(jìn)行相似度對(duì)比,提取出各條目摘要中最常出現(xiàn)的內(nèi)容作為相似內(nèi)容,例如,以出現(xiàn)最多的內(nèi)容作為相似內(nèi)容。再依據(jù)各條目與相似內(nèi)容的相似度進(jìn)行由高到低的排序,使歷史訪問(wèn)條目集合中包含用戶最感興趣的內(nèi)容的條目的排序靠前。進(jìn)一步地,本發(fā)明也可以條目被訪問(wèn)的時(shí)間由近到遠(yuǎn)對(duì)各條目進(jìn)行排序。圖8顯示的是本發(fā)明相似歷史訪問(wèn)條目排序模式的流程圖。相似歷史訪問(wèn)條目排序模式是指根據(jù)歷史訪問(wèn)條目集合,對(duì)檢索結(jié)果中的條目排序。 條目處理裝置4自動(dòng)保存用戶在當(dāng)前會(huì)話中已訪問(wèn)的條目歸入歷史訪問(wèn)條目集合中(記為VisitedItemSet)。例如,如圖4所示,當(dāng)用戶行為信息獲取裝置3檢測(cè)到用戶訪問(wèn)了檢索結(jié)果(記為ResultSet)中的某一條目A或者條目子集A時(shí),這一條目A或條目子集A會(huì)自動(dòng)被轉(zhuǎn)移到歷史訪問(wèn)條目集合VisitedItemSet中。VisitedItemSet是用戶在訪問(wèn)檢索結(jié)果的過(guò)程中所形成的條目集合,自動(dòng)保存在條目處理裝置4中。由相似度對(duì)比裝置5計(jì)算VisitedItemSet中各歷史訪問(wèn)條目的相似性(記為Similarity)。各條目相似性的比較可以依據(jù)各條目的摘要或內(nèi)容或關(guān)鍵詞等內(nèi)容計(jì)算出相似性最強(qiáng)的相似內(nèi)容。相似度對(duì)比裝置5根據(jù)此相似內(nèi)容再次對(duì)檢索結(jié)果中的各條目進(jìn)行相似度對(duì)比,得出檢索結(jié)果中各條目與該相似內(nèi)容的相似度值,根據(jù)該相似度值更新ResultSet中各條目的排序。更新ResultSet中各條目排序可以依據(jù)用戶需要不同而設(shè)置,例如,可以依相似度值由高到低排序,或依相似度值由低到高排序,也可以依據(jù)其他設(shè)置條件進(jìn)行排序。優(yōu)選地,本發(fā)明中更新后的檢索結(jié)果(更新后的ResultSet)中按照條目相似性的相似度值由高到低排序。優(yōu)選地,歷史訪問(wèn)條目集合(已訪問(wèn)條目集合)中的各歷史訪問(wèn)條目根據(jù)與相似內(nèi)容的相似度值由高至低進(jìn)行排序,使用戶能快速地從歷史信息中找到自己最關(guān)注的條目。更新后重新排序的ResultSet中的各條目不馬上展示給用戶,而是等到用戶回到檢索結(jié)果頁(yè)面時(shí)由顯示裝置6向用戶展示。如圖5,本發(fā)明較佳實(shí)施例具體采用以下的方式實(shí)現(xiàn)
權(quán)利要求
1.一種基于用戶行為信息的檢索結(jié)果實(shí)時(shí)更新方法,其特征在于,包括以下步驟 步驟一獲取包含至少一項(xiàng)條目的檢索結(jié)果; 步驟二 獲取用戶行為信息; 步驟三基于所述用戶行為信息選擇處理模式,并根據(jù)條目相似度,對(duì)所述檢索結(jié)果中的條目進(jìn)行處理; 步驟四得到并顯示更新后的檢索結(jié)果。
2.如權(quán)利要求I所述的檢索結(jié)果實(shí)時(shí)更新方法,其特征在于,所述步驟一中所述包含至少一項(xiàng)條目的檢索結(jié)果是通過(guò)以下步驟獲得 步驟Al :獲取關(guān)鍵詞,對(duì)所述關(guān)鍵詞進(jìn)行預(yù)處理; 步驟A2 :判斷所述預(yù)處理后的關(guān)鍵詞是否符合要求;若符合要求的,則根據(jù)所述關(guān)鍵詞進(jìn)行檢索生成檢索結(jié)果;若不符合要求的,則重新執(zhí)行所述步驟Al、A2,直至生成檢索結(jié)果O
3.如權(quán)利要求I所述的檢索結(jié)果實(shí)時(shí)更新方法,其特征在于,所述步驟一中,根據(jù)權(quán)值將所述條目由高到低排序。
4.如權(quán)利要求3所述的檢索結(jié)果實(shí)時(shí)更新方法,其特征在于,所述步驟一中,根據(jù)所述條目被引用次數(shù)將權(quán)值相同的所述條目由高到低排序。
5.如權(quán)利要求I所述的檢索結(jié)果實(shí)時(shí)更新方法,其特征在于,所述用戶行為信息包括用戶歷史訪問(wèn)條目、用戶忽略條目、用戶訪問(wèn)不同條目的時(shí)間間隔、用戶歷史訪問(wèn)條目的內(nèi)容長(zhǎng)度、用戶歷史訪問(wèn)條目的閱讀時(shí)間長(zhǎng)度、用戶訪問(wèn)條目時(shí)的生理體征信息。
6.如權(quán)利要求I所述的檢索結(jié)果實(shí)時(shí)更新方法,其特征在于,進(jìn)一步包括步驟五重復(fù)執(zhí)行所述步驟二至步驟四,直到停止獲取所述用戶行為信息時(shí)終止。
7.如權(quán)利要求I所述的檢索結(jié)果實(shí)時(shí)更新方法,其特征在于,所述步驟三的處理模式包括 隱藏歷史訪問(wèn)條目模式、相似歷史訪問(wèn)條目排序模式、或相似忽略條目排序模式中任意一項(xiàng)或多項(xiàng)。
8.如權(quán)利要求7所述的檢索結(jié)果實(shí)時(shí)更新方法,其特征在于,所述隱藏歷史訪問(wèn)條目包括 步驟BI :基于所述用戶行為信息選中用戶已訪問(wèn)的條目; 步驟B2 :將所述用戶歷史訪問(wèn)條目從所述檢索結(jié)果中移出; 步驟B3 :將所述已訪問(wèn)的條目存入歷史訪問(wèn)條目集合中。
9.如權(quán)利要求7所述的檢索結(jié)果實(shí)時(shí)更新方法,其特征在于,所述相似歷史訪問(wèn)條目排序包括 步驟Cl :基于所述用戶行為信息選中用戶已訪問(wèn)的條目; 步驟C2 :將所述歷史訪問(wèn)條目存入所述歷史訪問(wèn)條目集合中; 步驟C3 :對(duì)所述歷史訪問(wèn)條目集合中的條目進(jìn)行相似度對(duì)比,獲取所述條目之間的相似內(nèi)容; 步驟C4 :根據(jù)所述相似內(nèi)容對(duì)所述檢索結(jié)果中的各條目進(jìn)行相似度對(duì)比,生成所述各條目與所述相似內(nèi)容的相似度值; 步驟C5 依據(jù)所述相似度值由高至低對(duì)所述檢索結(jié)果中的各條目進(jìn)行排序。
10.如權(quán)利要求7所述的檢索結(jié)果實(shí)時(shí)更新方法,其特征在于,所述相似忽略條目排序包括 步驟Dl :基于所述用戶行為信息選中用戶在訪問(wèn)中忽略的條目; 步驟D2 :將所述用戶的忽略條目存入歷史忽略條目集合中; 步驟D3 :將所述檢索結(jié)果中的各條目與所述歷史忽略條目集合中的各條目進(jìn)行相似度對(duì)比,獲取所述檢索結(jié)果中各條目的相似性權(quán)值; 步驟D4:依據(jù)所述相似性權(quán)值由低至高對(duì)所述檢索結(jié)果中的各條目進(jìn)行排序。
11.如權(quán)利要求9所述的檢索結(jié)果實(shí)時(shí)更新方法,其特征在于,進(jìn)一步包括計(jì)算所述歷史訪問(wèn)條目集合中條目與所述相似內(nèi)容的相似度值,將所述歷史訪問(wèn)條目集合中的各條目按照所述相似度值由高到低排序。
12.一種基于用戶行為信息的檢索結(jié)果實(shí)時(shí)更新系統(tǒng),其特征在于,包括 用戶行為信息獲取裝置(3),其獲取用戶行為信息; 相似度對(duì)比裝置(5),其包含計(jì)算相似度的功能模塊; 條目處理裝置(4),其與所述用戶行為信息獲取裝置(3)以及相似度對(duì)比裝置(5)連接,用于根據(jù)所述用戶行為信息獲取裝置(3)獲取的所述用戶行為信息選擇模式,并根據(jù)所述相似度對(duì)比裝置(5)對(duì)于所述條目的相似度對(duì)比結(jié)果,處理所述檢索結(jié)果中的條目; 顯示裝置出),其與所述條目處理裝置(4)連接,接收并顯示由所述條目處理裝置(4)發(fā)送的條目。
13.如權(quán)利要求12所述的檢索結(jié)果實(shí)時(shí)更新系統(tǒng),其特征在于,進(jìn)一步包括 數(shù)據(jù)庫(kù)(I),其存儲(chǔ)海量信息; 檢索裝置(2),其與所述數(shù)據(jù)庫(kù)(I)及所述條目處理裝置(4)連接,用于根據(jù)關(guān)鍵詞檢索所述海量信息生成所述檢索結(jié)果。
14.如權(quán)利要求13所述的檢索結(jié)果實(shí)時(shí)更新系統(tǒng),其特征在于,所述檢索裝置(2)生成所述檢索結(jié)果中各條目與所述關(guān)鍵詞的匹配度的權(quán)值。
15.如權(quán)利要求12所述的檢索結(jié)果實(shí)時(shí)更新系統(tǒng),其特征在于,所述用戶行為信息獲取裝置(3)包括鼠標(biāo)、鍵盤、圖像獲取設(shè)備、計(jì)算機(jī)系統(tǒng)內(nèi)置的計(jì)時(shí)設(shè)備、紅外感應(yīng)設(shè)備、全球定位系統(tǒng)、觸覺(jué)感應(yīng)設(shè)備。
全文摘要
本發(fā)明公開(kāi)了一種基于用戶行為信息的檢索結(jié)果實(shí)時(shí)更新方法及系統(tǒng),包括獲取包含至少一項(xiàng)條目的檢索結(jié)果;獲取用戶行為信息;基于用戶行為信息選擇處理模式,并根據(jù)條目相似度,對(duì)檢索結(jié)果中的條目進(jìn)行處理;得到并顯示更新后的檢索結(jié)果。本發(fā)明基于用戶行為信息實(shí)時(shí)改進(jìn)檢索結(jié)果,排序靠前的條目始終為用戶需要且未被訪問(wèn)的條目,提高了用戶查看檢索結(jié)果的效率,改善了用戶檢索體驗(yàn)。
文檔編號(hào)G06F17/30GK102930041SQ20121045346
公開(kāi)日2013年2月13日 申請(qǐng)日期2012年11月12日 優(yōu)先權(quán)日2012年11月12日
發(fā)明者李道遠(yuǎn), 程鑫, 高俊, 顧鑫 申請(qǐng)人:江蘇外博資訊有限公司