一種多維協(xié)同推薦的系統(tǒng)與方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明屬于計算機(jī)技術(shù)領(lǐng)域,具體涉及一種多維協(xié)同推薦的系統(tǒng)與方法。
【背景技術(shù)】
[0002]隨著軟件技術(shù)的不斷發(fā)展與成熟,越來越多的服務(wù)實(shí)現(xiàn)了相同或者相近的功能,在服務(wù)選取的過程中,如何最大化用戶的滿意度,真正做到面向用戶是現(xiàn)階段研宄的一個熱點(diǎn)問題。
[0003]當(dāng)前各類互聯(lián)網(wǎng)應(yīng)用中多包含有內(nèi)容推薦功能,這些推薦多是以用戶的瀏覽和使用歷史記錄為依據(jù),向用戶推薦與歷史相關(guān)的同類內(nèi)容。但是,用戶的興趣和關(guān)注點(diǎn)通常是開放的,僅基于歷史數(shù)據(jù)來推薦可能會使大部分用戶錯過感興趣內(nèi)容,同時對于內(nèi)容運(yùn)營和推廣也不利。而完全開放式的內(nèi)容推薦,即向用戶推薦任何新內(nèi)容,又缺乏針對性,既不能保證內(nèi)容的接收效果,同時又容易招致用戶反感或使用戶迷失在信息海洋中。因而,有必要尋求一種更加有效的推薦辦法,既不完全依賴用戶個人的瀏覽歷史,同時又能更大限度、更大可能地推薦給用戶感興趣的內(nèi)容。
【發(fā)明內(nèi)容】
[0004]發(fā)明目的:本發(fā)明針對上述現(xiàn)有技術(shù)存在的問題做出改進(jìn),即本發(fā)明的第一個目的是公開了一種多維協(xié)同推薦的系統(tǒng)。本發(fā)明的第二個目的是公開了一種多維協(xié)同推薦的方法。
[0005]技術(shù)方案:一種多維協(xié)同推薦的系統(tǒng),包括以下模塊:
[0006]挖掘模塊,完成主題提取、位置關(guān)系挖掘和文本分類;
[0007]推薦模塊,完成各推薦內(nèi)容對于各用戶的推薦指數(shù)以及被閱讀后的內(nèi)容相對于相關(guān)用戶的推薦指數(shù),綜合得出待推薦內(nèi)容的推薦模型,計算過程需調(diào)用挖掘模塊;
[0008]內(nèi)容數(shù)據(jù)庫模塊,用于記錄推薦內(nèi)容、分類標(biāo)簽和內(nèi)容分類;
[0009]用戶數(shù)據(jù)庫模塊,記錄用戶基本信息、群組屬性、交流記錄、位置信息記錄、瀏覽記錄、關(guān)聯(lián)用戶、關(guān)注標(biāo)簽和推薦記錄。
[0010]一種多維協(xié)同推薦的方法,包括以下步驟:
[0011](I)、計算用戶的主題關(guān)注度
[0012](11)、根據(jù)用戶瀏覽記錄將相應(yīng)內(nèi)容抽取為樣本集合;
[0013](12)、對步驟(11)中的樣本集合進(jìn)行主題提取,
[0014](13)、將步驟(12)提取的主題作為該用戶的關(guān)注標(biāo)簽,以用戶瀏覽量為權(quán)重,對各標(biāo)簽進(jìn)行相關(guān)度賦值,用戶瀏覽量包括瀏覽次數(shù)和瀏覽時長,其中時長轉(zhuǎn)化為分鐘數(shù)處理;
[0015](2)、計算用戶之間的群組相關(guān)度
[0016]根據(jù)用戶分屬群組和在群組中交流的頻次,對用戶進(jìn)行群組關(guān)聯(lián)賦值,第I用戶與第2用戶的群組相關(guān)度為累計用戶在同一群組中交流的時長,時長轉(zhuǎn)化為分鐘數(shù)取整處理;
[0017](3)、計算用戶間話題相關(guān)度,
[0018](31)、提取第I用戶與第2用戶間的交流記錄做為統(tǒng)計樣本;
[0019](32)、從步驟(31)中的統(tǒng)計樣本中進(jìn)行主題提?。?br>[0020](33)、根據(jù)用戶對主題的內(nèi)容貢獻(xiàn)大小對第I用戶與第2用戶在每個主題上的相關(guān)度進(jìn)行賦值,用戶對主題的內(nèi)容貢獻(xiàn)以用戶每次發(fā)言與主題的吻合度來衡量;
[0021](4)、計算用戶間位置相關(guān)度
[0022]通過位置關(guān)系挖掘,發(fā)現(xiàn)用戶的鄰居,即與用戶在地理位置上經(jīng)常處于鄰近局域的另一用戶為該用戶的鄰居,
[0023](5)、組合關(guān)聯(lián)用戶的群組相關(guān)度、話題相關(guān)度、位置相關(guān)度及用戶的主題相關(guān)度,進(jìn)行分條件的賦權(quán)累加,得出最終的推薦模型;
[0024](6)、內(nèi)容分類,
[0025](61)從樣本內(nèi)容集合中進(jìn)行主題提取,得到對內(nèi)容的分類標(biāo)簽;
[0026](62)使用文本分類器,將目標(biāo)內(nèi)容集合按步驟(61)得到的分類標(biāo)簽分類;
[0027](7)、內(nèi)容推薦,分兩種情況:
[0028](71)、若推薦的內(nèi)容是用戶未瀏覽過的內(nèi)容:首先根據(jù)內(nèi)容的類別屬性和任意用戶的關(guān)注標(biāo)簽的匹配度進(jìn)行計算,得出一個推薦指數(shù),當(dāng)某一用戶的推薦指數(shù)大于閾值,則向該用戶推薦,該閾值取值區(qū)間為(0,1);
[0029](72)、若推薦的內(nèi)容為用戶瀏覽過的內(nèi)容,首先確保該用戶對內(nèi)容產(chǎn)生真正的接收,然后分三種情況計算用戶的關(guān)聯(lián)用戶的推薦指數(shù);
[0030](721)、位置關(guān)聯(lián)用戶的基礎(chǔ)系數(shù)為rl,當(dāng)分類的內(nèi)容涉及物理方位信息時,則該基礎(chǔ)系數(shù)進(jìn)行放大處理,物理方位信息包括場所、賣場、地點(diǎn)和位置;
[0031](722)、群組關(guān)聯(lián)用戶的基礎(chǔ)系數(shù)為r2,當(dāng)分類的內(nèi)容覆蓋到群組主題或群組標(biāo)簽時,則該系數(shù)進(jìn)行放大處理;
[0032](723)、話題關(guān)聯(lián)用戶的相關(guān)系數(shù)算法為:R = | {Tc} Π U打,其中{Tj為內(nèi)容主題的集合,{Tul_u2}為第I用戶與第2用戶之間話題的集合,取兩個集合交集的度再乘以一個系數(shù)r作為話題相關(guān)系數(shù),系數(shù)r的取值范圍為[1,10];
[0033]最終相關(guān)用戶推薦指數(shù)計算公式為:R U1-U2= r dRg+rdRt+rA,其中,rl,r2,r3的初始值均設(shè)為1,后續(xù)可根據(jù)推薦效果進(jìn)行優(yōu)化調(diào)整。一個相關(guān)用戶可能同時是三種相關(guān)用戶,也可能只是其中的兩種或一種,對于不是某類相關(guān)的用戶,可將相應(yīng)的相關(guān)系數(shù)設(shè)為
O。,Rg表示群組關(guān)聯(lián)用戶的群組相關(guān)度,R t表示話題關(guān)聯(lián)用戶的話題相關(guān)度,R ^表示位置關(guān)聯(lián)用戶的位置相關(guān)度;
[0034]對于第I用戶閱讀過的內(nèi)容,當(dāng)推薦指數(shù)R 111_112大于閾值,則向第2用戶推薦,閾值取I或者根據(jù)統(tǒng)計區(qū)間段內(nèi)段的所有推薦指數(shù)的總體情況取中間值;
[0035](8)、推薦優(yōu)化
[0036](81)、對于推薦給用戶的內(nèi)容,當(dāng)用戶進(jìn)行主動接收后,記錄用戶的閱讀時長,當(dāng)閱讀時長超過閾值,則認(rèn)為推薦成功;否則認(rèn)為推薦失??;
[0037](82)、查看該用戶的推薦模型,確定該模型中起主要作用的相關(guān)度系數(shù),若推薦成功,則調(diào)大該系數(shù)的百分比;如果推薦失敗,則調(diào)小該系數(shù)的百分比。
[0038]作為本發(fā)明中一種多維協(xié)同推薦的方法的一種優(yōu)選方案:步驟(12)采用LSA文檔主題模型或者LDA文檔主題模型提取樣本集合。
[0039]作為本發(fā)明中一種多維協(xié)同推薦的方法的一種優(yōu)選方案:步驟(4)中位置關(guān)系挖掘采用聚類算法挖掘或者關(guān)聯(lián)規(guī)則分析算法挖掘。
[0040]作為本發(fā)明中一種多維協(xié)同推薦的方法的一種優(yōu)選方案:步驟(81)中的,閾值為30 秒 /100 字。
[0041]有益效果:相對于當(dāng)前僅基于用戶歷史瀏覽記錄或僅基于用戶間的社會網(wǎng)絡(luò)關(guān)系進(jìn)行推薦,本發(fā)明方法能夠更大范圍地查找相關(guān)內(nèi)容及相關(guān)用戶,并更細(xì)粒度地鑒別內(nèi)容的相關(guān)性,從而使內(nèi)容推薦更加充分有效、更加有針對性。
【附圖說明】
[0042]圖1為本發(fā)明公開的一種多維協(xié)同推薦的系統(tǒng)的結(jié)構(gòu)示意框圖;
[0043]圖2為用戶關(guān)注主題相關(guān)度計算示意框圖;
[0044]圖3為用戶群組相關(guān)度計算示意框圖;
[0045]圖4為用戶間話題相關(guān)度計算示意框圖;
[0046]圖5為用戶間位置相關(guān)度計算示意框圖;
[0047]圖6為推薦模型的結(jié)構(gòu)示意框圖;
[0048]圖7為內(nèi)容分類示意框圖;
[0049]圖8為內(nèi)容推薦示意框圖;
[0050]圖9為推薦優(yōu)化示意框圖。
【具體實(shí)施方式】
:
[0051]下面對本發(fā)明的【具體實(shí)施方式】詳細(xì)說明。
[0052]具體實(shí)施例1
[0053]本發(fā)明方法主要是在社交類軟件和互聯(lián)網(wǎng)應(yīng)用環(huán)境下,通過加權(quán)計算用戶在瀏覽記錄、鄰近位置、分屬群組、參與話題方面的關(guān)聯(lián)關(guān)系,將一個用戶的關(guān)注內(nèi)容向與之有共同興趣的其他用戶推薦,達(dá)到有效推薦的目的。本發(fā)明的應(yīng)用目的主要通過如附圖1所示的“多維協(xié)同推薦系統(tǒng)”來實(shí)現(xiàn)。
[0054]如圖1所示,一種多維協(xié)同推薦的系統(tǒng),包括以下模塊:
[0055]挖掘模塊,完成主題提取、位置關(guān)系挖掘和文本分類;
[0056]推薦模塊,完成各推薦內(nèi)容對于各用戶的推薦指數(shù)以及被閱讀后的內(nèi)容相對于相關(guān)用戶的推薦指數(shù),綜合得出待推薦內(nèi)容的推薦模型,計算過程需調(diào)用挖掘模塊;
[0057]內(nèi)容數(shù)據(jù)庫模塊,用于記錄推薦內(nèi)容、分類標(biāo)簽和內(nèi)容分類;
[0058]用戶數(shù)據(jù)庫模塊,記錄用戶基本信息、群組屬性、交流記錄、位置信息記錄、瀏覽記錄、關(guān)聯(lián)用戶、關(guān)注標(biāo)簽和推薦記錄。
[0059]一種多維協(xié)同推薦的方法,包括以下步驟:
[0060](I)、計算用戶的主題關(guān)注度(如圖2所示)
[0061](11)、根據(jù)用戶瀏覽記錄將相應(yīng)內(nèi)容抽取為樣本集合;
[0062](12)、對步驟(11)中的樣本集合進(jìn)行主題提取,
[0063](13)、將步驟(12)提取的主題作為該用戶的關(guān)注標(biāo)簽,以用戶瀏覽量為權(quán)重,對各標(biāo)簽進(jìn)行相關(guān)度賦值,用戶瀏覽量包括瀏覽次數(shù)和瀏覽時長,其中時長轉(zhuǎn)化為分鐘數(shù)處理;
[0064](2)、計算用戶之間的群組相關(guān)度(如圖3所示)
[0065]根據(jù)用戶分屬群組和在群組中交流的頻次,對用戶進(jìn)行群組關(guān)聯(lián)賦值,第I用戶與第2用戶的群組相關(guān)度為累計用戶在同一群組中交流的時長,時長轉(zhuǎn)化為分鐘數(shù)取整處理;
[0066](3)、計算用戶間話題相關(guān)度(如圖4所示)
[0067](31)、提取第I用戶與第2用戶間的交流記錄做為統(tǒng)計樣本;
[0068](32)、從步驟(31)中的統(tǒng)計樣本中進(jìn)行主題提??;
[0069](33)、根據(jù)用戶對主題的內(nèi)容貢獻(xiàn)大小對第I用戶與第2用戶在每個主題上