專利名稱:一種基于信度網(wǎng)的資源推薦方法和裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及資源推薦技術(shù),特別涉及一種基于信度網(wǎng)的資源推薦方法和裝置。
背景技術(shù):
推薦技術(shù)是指在用戶訪問系統(tǒng)資源時(shí),通過研究用戶的興趣等,主動(dòng)為其推薦還未訪問的資源的技術(shù)。目前幾乎所有的大型電子商務(wù)系統(tǒng)都不同程度的使用了推薦技術(shù),該技術(shù)有助于提高電子商務(wù)服務(wù)質(zhì)量和用戶的忠誠度等?,F(xiàn)有推薦方式主要為根據(jù)特定領(lǐng)域的領(lǐng)域知識(shí)或通過數(shù)據(jù)挖掘方法生成規(guī)則,當(dāng)用戶訪問系統(tǒng)資源時(shí),根據(jù)用戶已訪問的資源情況以及所述規(guī)則推理出用戶還未訪問過但可能感興趣的資源,根據(jù)規(guī)則的強(qiáng)度等進(jìn)行排序后推薦給用戶。但是,上述方式在實(shí)際應(yīng)用中會(huì)存在一定的問題,如基本上所有的用戶都使用統(tǒng)一的規(guī)則,因此推薦結(jié)果的個(gè)性化程度較低。
發(fā)明內(nèi)容
有鑒于此,本發(fā)明提供了一種基于信度網(wǎng)的資源推薦方法和裝置,能夠提高推薦結(jié)果的個(gè)性化程度。為達(dá)到上述目的,本發(fā)明的技術(shù)方案是這樣實(shí)現(xiàn)的—種基于信度網(wǎng)的資源推薦方法,包括A、在用戶訪問系統(tǒng)資源的過程中,當(dāng)每次滿足推薦條件時(shí),則執(zhí)行步驟B;B、為用戶建立基于信度網(wǎng)的用戶興趣模型;根據(jù)所建立的用戶興趣模型確定待推薦資源;按照用戶感興趣的程度由高到低的順序?qū)Ω鞔扑]資源進(jìn)行排序,將排序后的結(jié)果推薦給用戶。一種基于信度網(wǎng)的資源推薦裝置,包括控制模塊,用于在用戶訪問系統(tǒng)資源的過程中,當(dāng)每次滿足推薦條件時(shí),通知推薦模塊執(zhí)行自身功能;所述推薦模塊,用于為用戶建立基于信度網(wǎng)的用戶興趣模型;根據(jù)所建立的用戶興趣模型確定待推薦資源;按照用戶感興趣的程度由高到低的順序?qū)Ω鞔扑]資源進(jìn)行排序,將排序后的結(jié)果推薦給用戶。可見,采用本發(fā)明的技術(shù)方案,針對(duì)每個(gè)用戶,分別為其建立基于信度網(wǎng)的用戶興趣模型,并根據(jù)所建立的用戶興趣模型進(jìn)行資源推薦,從而提高了推薦結(jié)果的個(gè)性化程度。
圖1為本發(fā)明基于信度網(wǎng)的資源推薦方法實(shí)施例的流程圖。圖2為一個(gè)有向無環(huán)圖結(jié)構(gòu)的示意圖。圖3為另一個(gè)有向無環(huán)圖結(jié)構(gòu)的示意圖。
圖4為為某一用戶建立的用戶興趣模型的示意圖。圖5為本發(fā)明基于信度網(wǎng)的資源推薦裝置實(shí)施例的組成結(jié)構(gòu)示意圖。
具體實(shí)施例方式針對(duì)現(xiàn)有技術(shù)中存在的問題,本發(fā)明中提出一種基于信度網(wǎng)的資源推薦方案,能夠提高推薦結(jié)果的個(gè)性化程度。為使本發(fā)明的技術(shù)方案更加清楚、明白,以下參照附圖并舉實(shí)施例,對(duì)本發(fā)明所述方案作進(jìn)一步地詳細(xì)說明。圖1為本發(fā)明基于信度網(wǎng)的資源推薦方法實(shí)施例的流程圖。如圖1所示,包括以下步驟步驟101 :在用戶訪問系統(tǒng)資源的過程中,當(dāng)每次滿足推薦條件時(shí),則執(zhí)行步驟102。當(dāng)用戶每訪問一個(gè)新的資源時(shí),即可生成一個(gè)數(shù)據(jù),所述數(shù)據(jù)用于描述用戶對(duì)系統(tǒng)中各資源的訪問或評(píng)價(jià)情況。假設(shè)系統(tǒng)中共存在3個(gè)資源,分別為資源1、資源2、資源3,用戶訪問了資源2,那么所生成的數(shù)據(jù)即可為(0,1,0),如果用戶同時(shí)訪問了資源2和資源3,那么所生成的數(shù)據(jù)即可為(O, I, I)。上述是以二值的0、1來表示資源是否被訪問的,如果要體現(xiàn)對(duì)資源的評(píng)價(jià)情況,則需要用多值來表示,具體實(shí)現(xiàn)為本領(lǐng)域公知。以下均以二值為例。當(dāng)每生成N個(gè)數(shù)據(jù)時(shí),則執(zhí)行一次步驟102,N為正整數(shù)。步驟102 :為用戶建立基于信度網(wǎng)的用戶興趣模型;根據(jù)所建立的用戶興趣模型確定待推薦資源;按照用戶感興趣的程度由高到低的順序?qū)Ω鞔扑]資源進(jìn)行排序,將排序后的結(jié)果推薦給用戶。本步驟的實(shí)現(xiàn)主要包括三個(gè)過程,第一個(gè)過程為建立基于信度網(wǎng)的用戶興趣模型,第二個(gè)過程為根據(jù)所建立的用戶興趣模型確定待推薦資源,第三個(gè)過程為按照用戶感興趣的程度由高到低的順序?qū)Ω鞔扑]資源進(jìn)行排序,將排序后的結(jié)果推薦給用戶。所建立的用戶興趣模型的個(gè)數(shù)可以為一個(gè),也可為多個(gè),即兩個(gè)以上,以下以建立一個(gè)用戶興趣模型為例,分別對(duì)上述各過程的具體實(shí)現(xiàn)進(jìn)行詳細(xì)說明。I)第一個(gè)過程信度網(wǎng)包括兩部分有向無環(huán)圖結(jié)構(gòu)和各節(jié)點(diǎn)的條件概率分布,可表示為一個(gè)二元組S =〈G,P〉,G表示有向無環(huán)圖結(jié)構(gòu),P表示各節(jié)點(diǎn)的條件概率分布。圖2為一個(gè)有向無環(huán)圖結(jié)構(gòu)的示意圖,如圖2所示,節(jié)點(diǎn)B和節(jié)點(diǎn)A之間存在連接,表示節(jié)點(diǎn)B和節(jié)點(diǎn)A之間存在依賴關(guān)系,箭頭方向表示節(jié)點(diǎn)B對(duì)節(jié)點(diǎn)A有直接的因果影響,P= {P(A Ji (A))}表示節(jié)點(diǎn)A的父節(jié)點(diǎn)對(duì)節(jié)點(diǎn)A的因果影響的強(qiáng)度,(A)表示節(jié)點(diǎn)A的父節(jié)點(diǎn)集合,節(jié)點(diǎn)B和節(jié)點(diǎn)E即為節(jié)點(diǎn)A的父節(jié)點(diǎn)。為方便計(jì)算,可對(duì)信度網(wǎng)的有向無環(huán)圖結(jié)構(gòu)進(jìn)行編碼,即表示為容易處理的數(shù)據(jù)結(jié)構(gòu),編碼后主要包括三部分第一部分、第二部分和第三部分。其中,第一部分表示信度網(wǎng)中的各節(jié)點(diǎn)的排序,任何節(jié)點(diǎn)的父節(jié)點(diǎn)都必須排在該節(jié)點(diǎn)的后面;第二部分表示每個(gè)節(jié)點(diǎn)的父節(jié)點(diǎn)在第一部分中的排序位置分布情況,共包括η-1段,第I段表示第一部分中排在第I位的節(jié)點(diǎn)的父節(jié)點(diǎn)在第一部分中的排序位置分布情況,第2段表示第一部分中排在第2位的節(jié)點(diǎn)的父節(jié)點(diǎn)在第一部分中的排序位置分布情況,依次類推;第三部分為自適應(yīng)步長σ,σ為整數(shù)。圖3為另一個(gè)有向無環(huán)圖結(jié)構(gòu)的示意圖。假設(shè)針對(duì)該結(jié)構(gòu)進(jìn)行編碼,那么得到的編碼可為[54231 234 345 4 O σ ],“54231”為第一部分,“234 345 4 O”為第二部分,“ σ ”為第三部分。可以看出,節(jié)點(diǎn)4、節(jié)點(diǎn)2和節(jié)點(diǎn)3為節(jié)點(diǎn)5的父節(jié)點(diǎn),因此節(jié)點(diǎn)4、節(jié)點(diǎn)2和節(jié)點(diǎn)3排在節(jié)點(diǎn)5的后面,節(jié)點(diǎn)2和節(jié)點(diǎn)3為節(jié)點(diǎn)4的父節(jié)點(diǎn),因此節(jié)點(diǎn)2和節(jié)點(diǎn)3排在節(jié)點(diǎn)4的后面,節(jié)點(diǎn)3又為節(jié)點(diǎn)2的父節(jié)點(diǎn),因此節(jié)點(diǎn)3排在節(jié)點(diǎn)2的后面,節(jié)點(diǎn)I也為節(jié)點(diǎn)4的父節(jié)點(diǎn),因此也排在節(jié)點(diǎn)4的后面。另外,對(duì)于第一部分中排在第I位的節(jié)點(diǎn)5,其父節(jié)點(diǎn)4在第一部分中的排序位置為2,父節(jié)點(diǎn)2在第一部分中的排序位置為3,父節(jié)點(diǎn)3在第一部分中的排序位置為4,因此,節(jié)點(diǎn)5對(duì)應(yīng)的第二部分中的第I段可為“234”,同理,第一部分中排在第2位的節(jié)點(diǎn)4對(duì)應(yīng)的第二部分中的第2段可為“345”,第一部分中排在第3位的節(jié)點(diǎn)2對(duì)應(yīng)的第二部分中的第3段可為“4”,第一部分中排在第4位的節(jié)點(diǎn)3沒有父節(jié)點(diǎn),那么其對(duì)應(yīng)的第二部分中的第4段可為“O” (如果有父節(jié)點(diǎn)則不是O),而第一部分中排在最后一位,即第5位的節(jié)點(diǎn)I 一定是沒有父節(jié)點(diǎn)的,因此其在第二部分無對(duì)應(yīng)的段。通常來說,每個(gè)節(jié)點(diǎn)的父節(jié)點(diǎn)的個(gè)數(shù)會(huì)限制為不超過一定數(shù)目,那么第二部分中的每段的長度也不會(huì)超過該數(shù)目?;谏鲜鼋榻B,建立基于信度網(wǎng)的用戶興趣模型的過程可如下所示。11)隨機(jī)生成μ個(gè)不同的信度網(wǎng),并從中選出一個(gè)作為最優(yōu)信度網(wǎng)Sb,μ為大于I的正整數(shù);每個(gè)信度網(wǎng)中的每個(gè)節(jié)點(diǎn)分別對(duì)應(yīng)系統(tǒng)中的一個(gè)資源,每個(gè)信度網(wǎng)中的節(jié)點(diǎn)數(shù)均等于系統(tǒng)中的資源數(shù);本步驟中,可隨機(jī) 選出一個(gè)信度網(wǎng)作為Sb。12)根據(jù)Sb分別計(jì)算出所生成的各信度網(wǎng)的評(píng)分函數(shù)值。13)如果計(jì)算出的μ個(gè)評(píng)分函數(shù)值中的最大值與最小值之差小于預(yù)定閾值,或者,本步驟的重復(fù)執(zhí)行次數(shù)已經(jīng)達(dá)到預(yù)定閾值,則將取值最大的評(píng)分函數(shù)值對(duì)應(yīng)的信度網(wǎng)作為sb,并將Sb作為用戶興趣模型,結(jié)束流程,否則,將取值最大的評(píng)分函數(shù)值對(duì)應(yīng)的信度網(wǎng)作為sb,執(zhí)行步驟14)。14)根據(jù)最新一次生成的μ個(gè)信度網(wǎng)生成λ個(gè)新的信度網(wǎng),λ為大于I的正整數(shù),且大于μ。15)根據(jù)新的Sb分別計(jì)算出各新的信度網(wǎng)的評(píng)分函數(shù)值,并按照評(píng)分函數(shù)值由大到小的順序從中選出μ個(gè)信度網(wǎng),重復(fù)執(zhí)行步驟13)。在計(jì)算各信度網(wǎng)的評(píng)分函數(shù)值時(shí),各信度網(wǎng)的有向無環(huán)圖結(jié)構(gòu)以編碼的形式參與運(yùn)算。上述步驟12)和15)中所提到的信度網(wǎng)的評(píng)分函數(shù)值的計(jì)算主要涉及到三部分,即信度網(wǎng)與新數(shù)據(jù)的匹配程度(適用程度)、信度網(wǎng)與舊數(shù)據(jù)的匹配程度,以及懲罰因子。評(píng)分函數(shù)值的計(jì)算過程中應(yīng)考慮網(wǎng)絡(luò)結(jié)構(gòu)的簡(jiǎn)潔度,越簡(jiǎn)單的網(wǎng)絡(luò)結(jié)構(gòu)用于預(yù)測(cè)和推理時(shí)的計(jì)算復(fù)雜度越低,因此可引入懲罰因子,用于懲罰復(fù)雜度高的網(wǎng)絡(luò)結(jié)構(gòu),從而使得評(píng)分函數(shù)值傾向于簡(jiǎn)單的網(wǎng)絡(luò)結(jié)構(gòu)。
具體來說,針對(duì)每個(gè)信度網(wǎng)S,可分別計(jì)算其與新數(shù)據(jù)的匹配程度、與舊數(shù)據(jù)的匹配程度以及其懲罰因子,用與新數(shù)據(jù)的匹配程度減去預(yù)定系數(shù)與舊數(shù)據(jù)的匹配程度的乘積,再減去懲罰因子,即可得到信度網(wǎng)S的評(píng)分函數(shù)值。所述新數(shù)據(jù)可為以下之一最新N次生成的數(shù)據(jù)、截止時(shí)間為當(dāng)前時(shí)間的一段預(yù)定時(shí)長內(nèi)生成的數(shù)據(jù);除新數(shù)據(jù)以外的數(shù)據(jù)即為舊數(shù)據(jù)(針對(duì)該用戶生成的所有數(shù)據(jù)中除新數(shù)據(jù)以外的數(shù)據(jù))。其中,信度網(wǎng)S與新數(shù)據(jù)的匹配程度可通過計(jì)算信度網(wǎng)S與新數(shù)據(jù)之間的似然度log (D I S)來得至Ij,D表示新數(shù)據(jù)ο信度網(wǎng)S與舊數(shù)據(jù)的匹配程度可通過計(jì)算信度網(wǎng)S與上一次進(jìn)行推薦時(shí)所建立的用戶興趣模型之間的距離
權(quán)利要求
1.一種基于信度網(wǎng)的資源推薦方法,其特征在于,包括 A、在用戶訪問系統(tǒng)資源的過程中,當(dāng)每次滿足推薦條件時(shí),則執(zhí)行步驟B; B、為用戶建立基于信度網(wǎng)的用戶興趣模型;根據(jù)所建立的用戶興趣模型確定待推薦資源;按照用戶感興趣的程度由高到低的順序?qū)Ω鞔扑]資源進(jìn)行排序,將排序后的結(jié)果推薦給用戶。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述步驟A包括 用戶每訪問一個(gè)新的資源,則生成一個(gè)數(shù)據(jù),所述數(shù)據(jù)用于描述用戶對(duì)系統(tǒng)中各資源的訪問或評(píng)價(jià)情況; 當(dāng)每生成N個(gè)數(shù)據(jù)時(shí),則執(zhí)行一次步驟B,N為正整數(shù)。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所建立的用戶興趣模型的個(gè)數(shù)為一個(gè),建立方式包括 BH、隨機(jī)生成μ個(gè)不同的信度網(wǎng),并從中選出一個(gè)作為最優(yōu)信度網(wǎng)Sb,μ為大于I的正整數(shù);每個(gè)信度網(wǎng)中的每個(gè)節(jié)點(diǎn)分別對(duì)應(yīng)系統(tǒng)中的一個(gè)資源,每個(gè)信度網(wǎng)中的節(jié)點(diǎn)數(shù)均等于系統(tǒng)中的資源數(shù); Β12、根據(jù)Sb分別計(jì)算出所生成的各信度網(wǎng)的評(píng)分函數(shù)值; Β13、如果計(jì)算出的μ個(gè)評(píng)分函數(shù)值中的最大值與最小值之差小于預(yù)定閾值,或者,本步驟的重復(fù)執(zhí)行次數(shù)已經(jīng)達(dá)到預(yù)定閾值,則將取值最大的評(píng)分函數(shù)值對(duì)應(yīng)的信度網(wǎng)作為Sb,并將Sb作為用戶興趣模型,結(jié)束流程,否則,將取值最大的評(píng)分函數(shù)值對(duì)應(yīng)的信度網(wǎng)作為Sb,執(zhí)行步驟Β14 ; Β14、根據(jù)最新一次生成的μ個(gè)信度網(wǎng)生成λ個(gè)新的信度網(wǎng),λ為大于I的正整數(shù),且大于μ ; Β15、根據(jù)新的Sb分別計(jì)算出各新的信度網(wǎng)的評(píng)分函數(shù)值,并按照評(píng)分函數(shù)值由大到小的順序從中選出μ個(gè)信度網(wǎng),重復(fù)執(zhí)行步驟Β13。
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述計(jì)算每個(gè)信度網(wǎng)的評(píng)分函數(shù)值包括 針對(duì)每個(gè)信度網(wǎng)S,分別計(jì)算其與新數(shù)據(jù)的匹配程度、與舊數(shù)據(jù)的匹配程度以及懲罰因子;用與新數(shù)據(jù)的匹配程度減去預(yù)定系數(shù)與舊數(shù)據(jù)的匹配程度的乘積,再減去懲罰因子,則得到信度網(wǎng)S的評(píng)分函數(shù)值; 其中,所述新數(shù)據(jù)為以下之一最新N次生成的數(shù)據(jù)、截止時(shí)間為當(dāng)前時(shí)間的一段預(yù)定時(shí)長內(nèi)生成的數(shù)據(jù);除新數(shù)據(jù)以外的數(shù)據(jù)即為舊數(shù)據(jù)。
5.根據(jù)權(quán)利要求4所述的方法,其特征在于, 所述計(jì)算信度網(wǎng)S與新數(shù)據(jù)的匹配程度包括計(jì)算信度網(wǎng)S與新數(shù)據(jù)之間的似然度log (D I S),D表示新數(shù)據(jù); 所述計(jì)算信度網(wǎng)S與舊數(shù)據(jù)的匹配程度包括計(jì)算信度網(wǎng)S與上一次進(jìn)行推薦時(shí)所建立的用戶興趣模型之間的距離
6.根據(jù)權(quán)利要求5所述的方法,其特征在于,所述信度網(wǎng)S包括兩部分有向無環(huán)圖結(jié)構(gòu)和各節(jié)點(diǎn)的條件概率分布;在計(jì)算信度網(wǎng)S的評(píng)分函數(shù)值時(shí),有向無環(huán)圖結(jié)構(gòu)以編碼的形式參與運(yùn)算; 其中,有向無環(huán)圖結(jié)構(gòu)的編碼包括三部分第一部分、第二部分和第三部分; 第一部分表示信度網(wǎng)S中的各節(jié)點(diǎn)的排序,任何節(jié)點(diǎn)的父節(jié)點(diǎn)都必須排在該節(jié)點(diǎn)的后面; 第二部分表示每個(gè)節(jié)點(diǎn)的父節(jié)點(diǎn)在第一部分中的排序位置分布情況,共包括η-1段,第I段表示第一部分中排在第I位的節(jié)點(diǎn)的父節(jié)點(diǎn)在第一部分中的排序位置分布情況,第2段表示第一部分中排在第2位的節(jié)點(diǎn)的父節(jié)點(diǎn)在第一部分中的排序位置分布情況,依次類推; 第三部分為自適應(yīng)步長σ,σ為整數(shù)。
7.根據(jù)權(quán)利要求6所述的方法,其特征在于,所述步驟Β14包括 Β141、從最新一次生成的μ個(gè)信度網(wǎng)中隨機(jī)選出兩個(gè)不同的信度網(wǎng),針對(duì)選出的兩個(gè)信度網(wǎng)的第一部分,隨機(jī)產(chǎn)生兩個(gè)交叉點(diǎn),將每個(gè)第一部分中處于這兩個(gè)交叉點(diǎn)之間的區(qū)域定義為匹配區(qū)域,并交換兩個(gè)第一部分中的匹配區(qū)域,然后,針對(duì)每個(gè)第一部分,分別將匹配區(qū)域以外出現(xiàn)的與匹配區(qū)域內(nèi)重復(fù)的字符按照匹配區(qū)域內(nèi)的位置映射關(guān)系進(jìn)行映射;之后,隨機(jī)選擇一個(gè)第一部分作為新的信度網(wǎng)的第一部分; Β142、針對(duì)選出的兩個(gè)信度網(wǎng)的第二部分,以段為單位,分別隨機(jī)選擇兩個(gè)第二部分中的一段作為新的信度網(wǎng)的第二部分中的一段; Β143、針對(duì)選出的兩個(gè)信度網(wǎng)的第三部分,將(σ1+σ2)/2作為新的信度網(wǎng)的第三部分σ,σ i和σ 2分別表示選出的兩個(gè)信度網(wǎng)的第三部分; Β144、針對(duì)新的信度網(wǎng),對(duì)其施加I σ · Ν(0,1) I次變異因子,所述變異因子包括增加一條邊、減少一條邊,以及反轉(zhuǎn)一條邊,Ν(0,1)表不均值為O,方差為I的正態(tài)分布隨機(jī)變量; 之后,重復(fù)執(zhí)行步驟Β141,直到得到λ個(gè)新的信度網(wǎng)。
8.根據(jù)權(quán)利要求4 7中任一項(xiàng)所述的方法,其特征在于,所述根據(jù)所建立的用戶興趣模型確定待推薦資源包括 從所建立的用戶興趣模型中找出與用戶已訪問的資源對(duì)應(yīng)的節(jié)點(diǎn)存在父節(jié)點(diǎn)和子節(jié)點(diǎn)關(guān)系的節(jié)點(diǎn)對(duì)應(yīng)的資源; 從找出的資源中刪除重復(fù)以及用戶已訪問的資源,將剩下的資源作為待推薦資源; 其中,如果將最新N次生成的數(shù)據(jù)作為新數(shù)據(jù),則用戶已訪問的資源為用戶最新N次訪問的資源;如果將截止時(shí)間為當(dāng)前時(shí)間的一段預(yù)定時(shí)長內(nèi)生成的數(shù)據(jù)作為新數(shù)據(jù),則用戶已訪問的資源為該預(yù)定時(shí)長內(nèi)用戶訪問的資源。
9.根據(jù)權(quán)利要求8所述的方法,其特征在于,所述按照用戶感興趣的程度由高到低的順序?qū)Ω鞔扑]資源進(jìn)行排序包括 針對(duì)每個(gè)待推薦資源X,分別根據(jù)信度網(wǎng)推理算法計(jì)算其在用戶興趣模型中的條件概率值;將各條件概率值按照取值由大到小的順序進(jìn)行排序;其中,條件概率值=P (XIR),R表示用戶已訪問的資源的集合。
10.根據(jù)權(quán)利要求2所述的方法,其特征在于,所建立的用戶興趣模型的個(gè)數(shù)為兩個(gè)以上,各用戶興趣模型的建立方式相同; 所述根據(jù)所建立的用戶興趣模型確定待推薦資源包括從所建立的各用戶興趣模型中找出與用戶已訪問的資源對(duì)應(yīng)的節(jié)點(diǎn)存在父節(jié)點(diǎn)和子節(jié)點(diǎn)關(guān)系的節(jié)點(diǎn)對(duì)應(yīng)的資源,從找出的資源中刪除重復(fù)以及用戶已訪問的資源,將剩下的資源作為待推薦資源;其中,用戶已訪問的資源為以下之一用戶最新N次訪問的資源、截止時(shí)間為當(dāng)前時(shí)間的一段預(yù)定時(shí)長內(nèi)用戶訪問的資源; 所述按照用戶感興趣的程度由高到低的順序?qū)Ω鞔扑]資源進(jìn)行排序包括針對(duì)每個(gè)待推薦資源X,分別根據(jù)信度網(wǎng)推理算法計(jì)算其在各用戶興趣模型中的條件概率值,將計(jì)算結(jié)果取平均,作為最終的條件概率值,將各最終的條件概率值按照取值由大到小的順序進(jìn)行排序,將排序后的結(jié)果推薦給用戶;其中,條件概率值=P(X|R),R表示用戶已訪問的資源的集合。
11.一種基于信度網(wǎng)的資源推薦裝置,其特征在于,包括 控制模塊,用于在用戶訪問系統(tǒng)資源的過程中,當(dāng)每次滿足推薦條件時(shí),通知推薦模塊執(zhí)行自身功能; 所述推薦模塊,用于為用戶建立基于信度網(wǎng)的用戶興趣模型;根據(jù)所建立的用戶興趣模型確定待推薦資源;按照用戶感興趣的程度由高到低的順序?qū)Ω鞔扑]資源進(jìn)行排序,將排序后的結(jié)果推薦給用戶。
12.根據(jù)權(quán)利要求11所述的裝置,其特征在于,當(dāng)用戶每訪問一個(gè)新的資源時(shí),所述控制模塊即生成一個(gè)數(shù)據(jù),所述數(shù)據(jù)用于描述用戶對(duì)系統(tǒng)中各資源的訪問或評(píng)價(jià)情況,并且,當(dāng)每生成N個(gè)數(shù)據(jù)時(shí),所述控制模塊即通知所述推薦模塊執(zhí)行一次自身功能,N為正整數(shù)。
13.根據(jù)權(quán)利要求12所述的裝置,其特征在于,所述推薦模塊中包括 建立單元,用于為用戶建立一個(gè)基于信度網(wǎng)的用戶興趣模型; 推薦單元,用于根據(jù)所建立的用戶興趣模型確定待推薦資源,并按照用戶感興趣的程度由高到低的順序?qū)Ω鞔扑]資源進(jìn)行排序,將排序后的結(jié)果推薦給用戶。
14.根據(jù)權(quán)利要求13所述的裝置,其特征在于,所述建立單元中包括 第一處理子單元,用于隨機(jī)生成μ個(gè)不同的信度網(wǎng),并從中選出一個(gè)作為最優(yōu)信度網(wǎng)Sb, μ為大于I的正整數(shù),每個(gè)信度網(wǎng)中的每個(gè)節(jié)點(diǎn)分別對(duì)應(yīng)系統(tǒng)中的一個(gè)資源,每個(gè)信度網(wǎng)中的節(jié)點(diǎn)數(shù)均等于系統(tǒng)中的資源數(shù);根據(jù)Sb分別計(jì)算出所生成的各信度網(wǎng)的評(píng)分函數(shù)值,并通知第二處理子單元執(zhí)行自身功能; 所述第二處理子單元,用于當(dāng)計(jì)算出的μ個(gè)評(píng)分函數(shù)值中的最大值與最小值之差小于預(yù)定閾值,或自身的重復(fù)執(zhí)行次數(shù)已經(jīng)達(dá)到預(yù)定閾值時(shí),將取值最大的評(píng)分函數(shù)值對(duì)應(yīng)的信度網(wǎng)作為sb,并將Sb作為用戶興趣模型,結(jié)束處理,否則,將取值最大的評(píng)分函數(shù)值對(duì)應(yīng)的信度網(wǎng)作為sb,通知第三處理子單元執(zhí)行自身功能; 所述第三處理子單元,用于根據(jù)最新一次生成的μ個(gè)信度網(wǎng)生成λ個(gè)新的信度網(wǎng),入為大于I的正整數(shù),且大于μ,并根據(jù)新的Sb分別計(jì)算出各新的信度網(wǎng)的評(píng)分函數(shù)值,按照評(píng)分函數(shù)值由大到小的順序從中選出μ個(gè)信度網(wǎng),之后通知所述第二處理子單元重復(fù)執(zhí)行自身功能。
15.根據(jù)權(quán)利要求14所述的裝置,其特征在于,每個(gè)信度網(wǎng)S的評(píng)分函數(shù)值為信度網(wǎng)S與新數(shù)據(jù)的匹配程度減去預(yù)定系數(shù)與信度網(wǎng)S與舊數(shù)據(jù)的匹配程度的乘積,再減去懲罰因子; 其中,所述新數(shù)據(jù)為以下之一最新N次生成的數(shù)據(jù)、截止時(shí)間為當(dāng)前時(shí)間的一段預(yù)定時(shí)長內(nèi)生成的數(shù)據(jù);除新數(shù)據(jù)以外的數(shù)據(jù)即為舊數(shù)據(jù)。
16.根據(jù)權(quán)利要求15所述的裝置,其特征在于,所述信度網(wǎng)S包括兩部分有向無環(huán)圖結(jié)構(gòu)和各節(jié)點(diǎn)的條件概率分布;在計(jì)算信度網(wǎng)S的評(píng)分函數(shù)值時(shí),有向無環(huán)圖結(jié)構(gòu)以編碼的形式參與運(yùn)算; 其中,有向無環(huán)圖結(jié)構(gòu)的編碼包括三部分第一部分、第二部分和第三部分; 第一部分表示信度網(wǎng)S中的各節(jié)點(diǎn)的排序,任何節(jié)點(diǎn)的父節(jié)點(diǎn)都必須排在該節(jié)點(diǎn)的后面; 第二部分表示每個(gè)節(jié)點(diǎn)的父節(jié)點(diǎn)在第一部分中的排序位置分布情況,共包括η-1段,第I段表示第一部分中排在第I位的節(jié)點(diǎn)的父節(jié)點(diǎn)在第一部分中的排序位置分布情況,第2段表示第一部分中排在第2位的節(jié)點(diǎn)的父節(jié)點(diǎn)在第一部分中的排序位置分布情況,依次類推; 第三部分為自適應(yīng)步長σ,σ為整數(shù)。
17.根據(jù)權(quán)利要求16所述的裝置,其特征在于,所述第三處理子單元按照以下方式生成每個(gè)新的信度網(wǎng) 從最新一次生成的μ個(gè)信度網(wǎng)中隨機(jī)選出兩個(gè)不同的信度網(wǎng),針對(duì)選出的兩個(gè)信度網(wǎng)的第一部分,隨機(jī)產(chǎn)生兩個(gè)交叉點(diǎn),將每個(gè)第一部分中處于這兩個(gè)交叉點(diǎn)之間的區(qū)域定義為匹配區(qū)域,并交換兩個(gè)第一部分中的匹配區(qū)域,然后,針對(duì)每個(gè)第一部分,分別將匹配區(qū)域以外出現(xiàn)的與匹配區(qū)域內(nèi)重復(fù)的字符按照匹配區(qū)域內(nèi)的位置映射關(guān)系進(jìn)行映射;之后,隨機(jī)選擇一個(gè)第一部分作為新的信度網(wǎng)的第一部分; 針對(duì)選出的兩個(gè)信度網(wǎng)的第二部分,以段為單位,分別隨機(jī)選擇兩個(gè)第二部分中的一段作為新的信度網(wǎng)的第二部分中的一段; 針對(duì)選出的兩個(gè)信度網(wǎng)的第三部分,將(0,(^)/2作為新的信度網(wǎng)的第三部分0,σ i和σ 2,分別表示選出的兩個(gè)信度網(wǎng)的第三部分; 針對(duì)新的信度網(wǎng),對(duì)其施加I?!う?0,1)|次變異因子,所述變異因子包括增加一條邊、減少一條邊,以及反轉(zhuǎn)一條邊,Ν(0,1)表示均值為0,方差為I的正態(tài)分布隨機(jī)變量。
18.根據(jù)權(quán)利要求15 17中任一項(xiàng)所述的裝置,其特征在于,所述推薦單元中包括 第四處理子單元,用于從所建立的用戶興趣模型中找出與用戶已訪問的資源對(duì)應(yīng)的節(jié)點(diǎn)存在父節(jié)點(diǎn)和子節(jié)點(diǎn)關(guān)系的節(jié)點(diǎn)對(duì)應(yīng)的資源,從找出的資源中刪除重復(fù)以及用戶已訪問的資源,將剩下的資源作為待推薦資源;其中,如果將最新N次生成的數(shù)據(jù)作為新數(shù)據(jù),則用戶已訪問的資源為用戶最新N次訪問的資源,如果將截止時(shí)間為當(dāng)前時(shí)間的一段預(yù)定時(shí)長內(nèi)生成的數(shù)據(jù)作為新數(shù)據(jù),則用戶已訪問的資源為該預(yù)定時(shí)長內(nèi)用戶訪問的資源; 第五處理子單元,用于針對(duì)每個(gè)待推薦資源X,分別根據(jù)信度網(wǎng)推理算法計(jì)算其在用戶興趣模型中的條件概率值;將各條件概率值按照取值由大到小的順序進(jìn)行排序;其中,條件概率值=P(XlR),R表示用戶已訪問的資源的集合。
19.根據(jù)權(quán)利要求12所述的裝置,其特征在于,所述推薦模塊中包括建立單元,用于為用戶建立兩個(gè)以上基于信度網(wǎng)的用戶興趣模型,各用戶興趣模型的建立方式相同; 推薦單元,用于根據(jù)所建立的用戶興趣模型確定待推薦資源,并按照用戶感興趣的程度由高到低的順序?qū)Ω鞔扑]資源進(jìn)行排序,將排序后的結(jié)果推薦給用戶。
20.根據(jù)權(quán)利要求19所述的裝置,其特征在于,所述推薦單元中包括 第四處理子單元,用于從所建立的各用戶興趣模型中找出與用戶已訪問的資源對(duì)應(yīng)的節(jié)點(diǎn)存在父節(jié)點(diǎn)和子節(jié)點(diǎn)關(guān)系的節(jié)點(diǎn)對(duì)應(yīng)的資源,從找出的資源中刪除重復(fù)以及用戶已訪問的資源,將剩下的資源作為待推薦資源;其中,用戶已訪問的資源為以下之一用戶最新N次訪問的資源、截止時(shí)間為當(dāng)前時(shí)間的一段預(yù)定時(shí)長內(nèi)用戶訪問的資源; 第五處理子單元,用于針對(duì)每個(gè)待推薦資源X,分別根據(jù)信度網(wǎng)推理算法計(jì)算其在各用戶興趣模型中的條件概率值,將計(jì)算結(jié)果取平均,作為最終的條件概率值,將各最終的條件概率值按照取值由大到小的順序進(jìn)行排序,將排序后的結(jié)果推薦給用戶;其中,條件概率值= P(X|R),R表示用戶已訪問的資源的集合。
全文摘要
本發(fā)明公開了一種基于信度網(wǎng)的資源推薦方法,包括A、在用戶訪問系統(tǒng)資源的過程中,當(dāng)每次滿足推薦條件時(shí),則執(zhí)行步驟B;B、為用戶建立基于信度網(wǎng)的用戶興趣模型;根據(jù)所建立的用戶興趣模型確定待推薦資源;按照用戶感興趣的程度由高到低的順序?qū)Ω鞔扑]資源進(jìn)行排序,將排序后的結(jié)果推薦給用戶。本發(fā)明同時(shí)公開了一種基于信度網(wǎng)的資源推薦裝置。應(yīng)用本發(fā)明所述的方法和裝置,能夠提高推薦結(jié)果的個(gè)性化程度。
文檔編號(hào)G06F17/30GK103064856SQ20111032231
公開日2013年4月24日 申請(qǐng)日期2011年10月21日 優(yōu)先權(quán)日2011年10月21日
發(fā)明者王世君, 陳樂君, 朱賢澤, 何渝君, 王琨, 董宇翔 申請(qǐng)人:中國移動(dòng)通信集團(tuán)重慶有限公司