就得了待推薦物品列表及權(quán)重,排序取權(quán)重最高的部分物品。
[0180]步驟S503還包括了,熱門及榜單推薦。對所有物品按照多維度特征計算得到的分 數(shù)進(jìn)行從高到低排序,就得到熱門排行榜,針對每個類別的熱門排行榜單是分類排行榜,挖 掘一部分可能成為爆款的物品形成潛力榜等等各種榜單。針對不同的用戶群體進(jìn)行推薦。 [0181]步驟S504算法融合。不同的算法分別得到待推薦的物品及權(quán)重,但是不同的算法 本身也有權(quán)重,權(quán)重越高,計算得到的結(jié)果越準(zhǔn)確。綜合待推薦物品的權(quán)重和算法權(quán)重得到 待推薦物品的最終權(quán)重,按照從大到小排列,得到最后的物品列表推薦給用戶。
[0182]具體地,在本實施例中,算法融合時使用加權(quán)式混合和分級混合相結(jié)合的方式。 [0183] 加權(quán)式混合
[0184]主要是對每個算法賦予不同的權(quán)重,通過將多個推薦算法的結(jié)果進(jìn)行加權(quán)組合在 一起,最后排序得到推薦結(jié)果。
[0186] 其中,reCwelghted(u,i)表示物品i推薦給用戶u的最終權(quán)重,η表示推薦算法數(shù)量,k 代表是第k個推薦算法,&表示第k個推薦算法的算法權(quán)重,&越大代表此推薦算法越好, reck(u,i)表示第k個算法計算得到的物品i推薦給用戶u的權(quán)重。
[0187] 分級混合
[0188]主要是先界定不同的算法的好壞,優(yōu)先使用好算法的推薦結(jié)果,得不到結(jié)果時再 使用次好的,依次類推。
[0189]主要過程是:設(shè)置基于用戶的協(xié)同過濾、基于物品的協(xié)同過濾、基于內(nèi)容的推薦、 熱門推薦的算法權(quán)重分別為1、〇. 9、0.001、0.0001。首先使用算法權(quán)重高的算法作為候選 集,算法權(quán)重低的推薦物品若是在候選集中存在則不加入候選集中,否則加入候選集里面, 并且將推薦權(quán)重和算法權(quán)重相乘作為此物品的最終權(quán)重。對候選集中的所有物品按照權(quán)重 從大到小排序,取權(quán)重最高的一些作為最終的推薦結(jié)果。
[0190]所屬領(lǐng)域的普通技術(shù)人員應(yīng)當(dāng)理解:以上,所述僅為本發(fā)明的具體實施例而已,并 不用于限制本發(fā)明,凡在本發(fā)明的精神和原則之內(nèi),所做的任何修改、等同替換、改進(jìn)等,均 應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。
【主權(quán)項】
1. 基于概率模型和用戶行為分析的個性化推薦方法,其特征在于,包括如下步驟: 提取得到物品W及物品屬性信息,且提取得到用戶對物品的操作行為;所述物品是在 不同場景下,待推薦主體;所述操作行為是用戶在不同場景下,所包含的操作類型; 通過所述物品屬性信息和用戶對物品的操作行為,得到興趣點;通過用戶對物品的操 作行為,獲取用戶興趣相似度,并得到相似用戶;根據(jù)用戶對物品基于時間維度的操作行 為,得到衰減因子;根據(jù)所述興趣點、相似用戶、衰減因子建立用戶模型; 根據(jù)用戶模型,得到用戶在各個維度的興趣特征信息; 對所述興趣特征信息進(jìn)行過濾,并采用推薦算法生成待推薦結(jié)果; 根據(jù)所述待推薦結(jié)果進(jìn)行算法融合,得到用戶個性化推薦的結(jié)果。2. 根據(jù)權(quán)利要求1所述的個性化推薦方法,其特征在于,所述物品W及物品屬性信息 為: 〈itemid,publisher,categroyid,tagid〉 其中itemid表示唯一標(biāo)識一個物品,publisher表示物品的發(fā)布者,categoryid表示物 品所屬的類別id,tagid表不物品的柄;簽1(1。3. 根據(jù)權(quán)利要求1所述的個性化推薦方法,其特征在于,所述用戶對物品的操作行為 為: <userid,itemid,timestamp,action_type〉 其中userid表示唯一標(biāo)識一個用戶,itemid表示唯一標(biāo)識一個物品,timestamp表示本 次操作的時間,action_type表示本次操作的類型;所述用戶對物品的操作行為包括,用戶 的歷史行為數(shù)據(jù)。4. 根據(jù)權(quán)利要求2所述的個性化推薦方法,其特征在于,通過所述物品屬性信息和用戶 對物品的操作行為,得到興趣點的方法為: 4-1)遍歷用戶所有點擊過的itemid,獲取itemid對應(yīng)的categoirid,統(tǒng)計每一個用戶 點擊行為下的每個類別的點擊次數(shù),運樣就得到了每個用戶點擊過的類別次數(shù)分布; 4-2)計算點擊過的各個物品的類別概率分布為:其中,P(catego巧id I click)表示在點擊行為下的類別categoirid的概率,表示對不同 操作類型下的屬性權(quán)重;Count (category id I click)表示在點擊行為下的類別categoirid 的點擊次數(shù);Count (category id I click)表示在點擊行為下的各個類別的點擊次數(shù)之和; 4-3)類別最終的概率如下: P(c曰tegoryid)=P(c曰tegoryidIbeh曰viori)*Weight(beh曰viori) +P(c曰tegoryidIbeh曰vior2)*Weight(beh曰ν?〇Γ2) + ... +P(categoryidIbehaviorn)本W(wǎng)eight(behaviorn) 其中,P(categoryid)表示在各種行為下的類別categoiyid的最終權(quán)重;P(categoryid I behaviorn)表示在行為類型behavior下的類別categoiyid的概率;Wei組t (behaviorn)表 示行為類型的權(quán)重,η為自然數(shù); 4-4)根據(jù)在各種行為下的類別categoryid的最終權(quán)重,得到用戶在各個維度上的偏好 數(shù)據(jù)即興趣點。5. 根據(jù)權(quán)利要求4所述的個性化推薦方法,其特征在于,對不同操作類型下的屬性權(quán)重 P進(jìn)行置信度計算:其中,α代表概率論中Z統(tǒng)計量的顯著性水平,多表示的是屬性分布概率,η表示樣本大 小,表示對應(yīng)某個置信水平的Ζ統(tǒng)計量,為常數(shù);己表示的平方,為常數(shù)。 ?? . · -6. 根據(jù)權(quán)利要求1所述的個性化推薦方法,其特征在于,通過用戶對物品的操作行為, 獲取用戶興趣相似度,并得到用戶U與用戶V的相似度計算方法具體為: 所述用戶興趣相似度其中,N(u)表示用戶U有過行為的物品列表,i表示用戶U和用戶V都有過行為的物品,|Ν α)|表示對物品i有過行為的總用戶數(shù)量,|N(u)|表示用戶U有過行為的物品數(shù)量,Ν(ν)表 示用戶V有過行為的物品列表,|N(v) I表示用戶V有過行為的物品數(shù)量。7. 根據(jù)權(quán)利要求6所述的個性化推薦方法,其特征在于,對所述相似用戶進(jìn)行歸一化處 理:其中,simi(i)表示兩個用戶的相似度,min(sim)表示所有相似用戶中最小的相似度, max(sim)表示所有相似用戶中最大的相似度,min (sim)表示所有相似用戶中最小的相似 度。8. 根據(jù)權(quán)利要求1所述的個性化推薦方法,其特征在于,根據(jù)用戶對物品基于時間維度 的操作行為,得到:其中,t ime_d i f f表示某一次操作距離當(dāng)前時間的時間間隔,max_t ime_di f f表示待分 析數(shù)據(jù)距離當(dāng)前時間最大的時間間隔,X是個調(diào)節(jié)系數(shù)。9. 根據(jù)權(quán)利要求1所述的個性化推薦方法,其特征在于,對所述興趣特征信息進(jìn)行過濾 的方法包括: 基于用戶的協(xié)同過濾: 找到與第一用戶興趣相似的第二用戶,并把第二用戶喜歡的并且第一用戶不知道的 item物品推薦給第一用戶; 其中第一用戶與第二用戶的相似度為simi,第二用戶對item的喜歡程度為bias, item 本身的質(zhì)量得分表示為score; 則把item推薦給第一用戶的權(quán)重計算方式為: weight = simi 本 bias 本 score 基于物品的協(xié)同過濾: 預(yù)先計算好各個物品的相似物品列表,根據(jù)用戶偏好的第一物品itemA,把與所述 itemA相似的第二物品itemB推薦給用戶; 第一物品與第二物品的相似度記為simi,用戶對第一物品偏好程度表示為bias,第二 物品itemB本身的質(zhì)量得分記為score,則將第二物品itemB推薦給用戶的權(quán)重計算方式為: weight = simi 本 bias 本 score 基于內(nèi)容的推薦: 根據(jù)用戶偏好的類別、標(biāo)簽、品牌等與物品相關(guān)的信息查找符合條件的物品推薦給用 戶;其中,對類別、標(biāo)簽、品牌等的偏好程度記為bias,物品本身的質(zhì)量得分為score,則把物 品推薦給用戶的權(quán)重計算方式為: weight = bias*score 對上述權(quán)重排序后,去除權(quán)重最高的物品,得到推薦結(jié)果。 10 .基于概率模型和用戶行為分析的個性化推薦系統(tǒng),其特征在于,包括: 提取模塊,所述提取模塊用W提取得到物品W及物品屬性信息,且提取得到用戶對物 品的操作行為;所述物品是在不同場景下,待推薦主體;所述操作行為是用戶在不同場景 下,所包含的操作類型; 預(yù)處理模塊,所述預(yù)處理模塊用W對所述提取模塊中的物品屬性信息、用戶對物品的 操作行為進(jìn)行預(yù)處理; 用戶模型建立模塊,所述用戶模型建立模塊用W通過所述物品屬性信息和用戶對物品 的操作行為,得到興趣點;通過用戶對物品的操作行為,獲取用戶興趣相似度,并得到相似 用戶;根據(jù)用戶對物品基于時間維度的操作行為,得到衰減因子;根據(jù)所述興趣點、相似用 戶、衰減因子建立用戶模型; 個性化推薦模塊,所述個性化推薦模塊用W根據(jù)用戶模型,得到用戶在各個維度的興 趣特征信息;對所述興趣特征信息進(jìn)行過濾,并采用推薦算法生成待推薦結(jié)果;根據(jù)所述待 推薦結(jié)果進(jìn)行算法融合,得到用戶個性化推薦的結(jié)果。
【專利摘要】本發(fā)明公開了基于概率模型和用戶行為分析的個性化推薦方法及系統(tǒng),方法包括:提取得到物品以及物品屬性信息,且提取得到用戶對物品的操作行為;通過所述物品屬性信息和用戶對物品的操作行為,得到興趣點;通過用戶對物品的操作行為,獲取用戶興趣相似度,并得到相似用戶;根據(jù)用戶對物品基于時間維度的操作行為,得到衰減因子,建立用戶模型;根據(jù)用戶模型,得到用戶在各個維度的興趣特征信息;過濾后并采用推薦算法生成待推薦結(jié)果,進(jìn)行算法融合,得到用戶個性化推薦的結(jié)果。本發(fā)明通過將原始數(shù)據(jù)進(jìn)行預(yù)處理后,構(gòu)建用戶模型,準(zhǔn)確刻畫用戶的興趣點和本質(zhì)的信息獲取需求,以提供精準(zhǔn)的個性化推薦,從而解決互聯(lián)網(wǎng)中的信息過載和長尾物品的問題。
【IPC分類】G06F17/30
【公開號】CN105574216
【申請?zhí)枴緾N201610127077
【發(fā)明人】于敬, 陳運文, 桂洪冠, 紀(jì)傳俊, 張健
【申請人】達(dá)而觀信息科技(上海)有限公司
【公開日】2016年5月11日
【申請日】2016年3月7日