本發(fā)明屬于推薦系統(tǒng),尤其是涉及一種基于主動學(xué)習(xí)的商品推薦方法和介質(zhì)。
背景技術(shù):
1、推薦系統(tǒng)(recommender?systems)可以用于幫助用戶從海量的項目中尋找對用戶有利用價值或用戶感興趣的部分,目前已在信息化社會中得當(dāng)廣泛應(yīng)用。為了產(chǎn)生可靠推薦,推薦系統(tǒng)通常需要大量用戶交互數(shù)據(jù),當(dāng)相關(guān)數(shù)據(jù)較少時,推薦的準(zhǔn)確性受到制約,因此,當(dāng)一名新用戶進(jìn)入推薦系統(tǒng)時,由于系統(tǒng)對于用戶的了解情況較少,基于協(xié)同過濾(collaborative?filtering)的推薦算法難以生成可靠的推薦,即會產(chǎn)生用戶冷啟動問題(user?cold-start?problem),使得推薦系統(tǒng)在初始階段難以有效運轉(zhuǎn)。
2、主動學(xué)習(xí)(active?learning)作為在機器學(xué)習(xí)中,面對數(shù)據(jù)集中數(shù)據(jù)量不足或數(shù)據(jù)種類不全面時的常用方法,也被視為解決用戶冷啟動問題的主流方法。相比于基于內(nèi)容的推薦,主動學(xué)習(xí)不需要任何用戶的統(tǒng)計信息,能在充分保護(hù)用戶隱私的條件下解決用戶冷啟動問題。現(xiàn)有的主動學(xué)習(xí)方法,要求用戶提供固定數(shù)目的評分結(jié)果,并依此作為后續(xù)產(chǎn)生推薦的依據(jù),例如,中國發(fā)明專利cn106127506b公開了一種基于主動學(xué)習(xí)解決商品冷啟動問題的推薦方法,挑選用戶基于四個要素對新商品進(jìn)行評分,使用得到的評分?jǐn)?shù)據(jù)對評分模型進(jìn)行再訓(xùn)練,利用再訓(xùn)練的評分模型預(yù)測未挑選用戶對新商品的評分,并根據(jù)該評分進(jìn)行商品推薦。然而,主動學(xué)習(xí)過程中,固定長度的待評分列表,會極大程度的影響用戶的全局滿意度,具體來說,過長的列表會導(dǎo)致用戶的忍耐度降低,用戶可能快速的退出系統(tǒng);而過短的列表會導(dǎo)致系統(tǒng)在主動學(xué)習(xí)階段收集的用戶偏好不充足,從而影響后續(xù)推薦的準(zhǔn)確度。由于推薦系統(tǒng)與每一個用戶的交互情況不一致,即完全相同的待評分列表對于部分用戶可能是過長,而對于其他用戶是過短,因此,如何控制不同用戶退出主動學(xué)習(xí)的時機,確保推薦系統(tǒng)既能充分收集用戶的偏好信息,以生成高質(zhì)量的推薦結(jié)果,同時又可以避免用戶因為主動學(xué)習(xí)階段冗長棄用推薦系統(tǒng),是亟待解決的關(guān)鍵問題。
技術(shù)實現(xiàn)思路
1、本發(fā)明的目的就是為了克服上述現(xiàn)有技術(shù)存在的缺陷而提供一種基于主動學(xué)習(xí)的商品推薦方法和介質(zhì),既可以確保充分收集用戶的偏好信息,生成高質(zhì)量的推薦結(jié)果,同時又可以避免用戶因為主動學(xué)習(xí)階段冗長棄用推薦系統(tǒng)。
2、本發(fā)明的目的可以通過以下技術(shù)方案來實現(xiàn):
3、本發(fā)明提供一種基于主動學(xué)習(xí)的商品推薦方法,包括以下步驟:
4、獲取推薦系統(tǒng)新用戶在主動學(xué)習(xí)階段生成的用戶交互數(shù)據(jù),據(jù)此進(jìn)行商品推薦;
5、其中,基于量化推薦相關(guān)性判斷推薦系統(tǒng)新用戶是否需要退出主動學(xué)習(xí),所述量化推薦相關(guān)性基于當(dāng)前評分預(yù)估結(jié)果與初始評分預(yù)估結(jié)果的差異進(jìn)行計算,所述初始評分預(yù)估結(jié)果基于推薦系統(tǒng)初始用戶交互數(shù)據(jù)計算,所述當(dāng)前評分預(yù)估結(jié)果基于推薦系統(tǒng)新用戶對待評分項目的評分計算。
6、進(jìn)一步地,以預(yù)估方差為指標(biāo)選取所述待評分項目,所述預(yù)估方差包括熵、最大評分和最小評分指標(biāo)。
7、進(jìn)一步地,所述預(yù)估方差的計算公式具體如下:
8、
9、其中,vp為預(yù)估方差,ui為與物品i有過交互的用戶集合,為用戶u′i對物品i的評分結(jié)果,對應(yīng)熵,為特定用戶u在輪數(shù)t對物品i的預(yù)估評分,對應(yīng)最大評分和最小評分指標(biāo)。
10、進(jìn)一步地,所述量化推薦相關(guān)性的計算公式具體如下:
11、
12、其中,r為量化推薦相關(guān)性,i為待評分項目的集合,為初始評分預(yù)估結(jié)果,為當(dāng)前評分預(yù)估結(jié)果,t為推薦輪數(shù),u為用戶標(biāo)識符。
13、進(jìn)一步地,基于所述量化推薦相關(guān)性判斷推薦系統(tǒng)新用戶是否需要退出主動學(xué)習(xí)的具體過程如下:
14、s301、基于量化推薦相關(guān)性進(jìn)行曲線擬合,得到曲線上界a;
15、s302、判斷是否滿足:若是,則需要退出主動學(xué)習(xí),其中,r為量化推薦相關(guān)性,t為推薦輪數(shù),u為用戶標(biāo)識符,k為偏好信息閾值。
16、進(jìn)一步地,步驟s301中,通過指數(shù)函數(shù)進(jìn)行曲線擬合。
17、進(jìn)一步地,步驟s302中,同時還需考慮是否滿足:若是,則需要退出主動學(xué)習(xí),其中,v為偏好信息增益,g為偏好信息增益閾值。
18、進(jìn)一步地,所述偏好信息增益v的計算公式具體如下:
19、
20、其中,z為滑動窗口大小。
21、進(jìn)一步地,通過評分預(yù)估算法計算所述初始評分預(yù)估結(jié)果和所述當(dāng)前評分預(yù)估結(jié)果。
22、本發(fā)明還提供一種計算機可讀存儲介質(zhì),其上存儲有計算機程序,所述程序被處理器執(zhí)行時實現(xiàn)上述方法。
23、與現(xiàn)有技術(shù)相比,本發(fā)明具有以下有益效果:
24、1、本發(fā)明提出一種基于主動學(xué)習(xí)的商品推薦方法,根據(jù)推薦系統(tǒng)新用戶在主動學(xué)習(xí)階段生成的用戶交互數(shù)據(jù)進(jìn)行商品推薦,特別地,判斷推薦系統(tǒng)新用戶是否需要退出主動學(xué)習(xí)的過程為:首先獲取推薦系統(tǒng)初始用戶交互數(shù)據(jù),計算初始評分預(yù)估結(jié)果,然后獲取推薦系統(tǒng)新用戶對主動學(xué)習(xí)中待評分項目的評分,計算當(dāng)前評分預(yù)估結(jié)果,基于當(dāng)前評分預(yù)估結(jié)果與初始評分預(yù)估結(jié)果的差異,計算量化推薦相關(guān)性,據(jù)此判斷推薦系統(tǒng)新用戶是否需要退出主動學(xué)習(xí),上述方法可以步進(jìn)式?jīng)Q定推薦系統(tǒng)新用戶退出主動學(xué)習(xí)階段的時機,在確保收集到充足的用戶偏好信息以產(chǎn)生高質(zhì)量的推薦結(jié)果的同時,避免用戶因為主動學(xué)習(xí)階段冗長而棄用系統(tǒng)。
25、2、本發(fā)明構(gòu)建了預(yù)估方差這一新指標(biāo)選取待評分項目,預(yù)估方差融合了熵、最大評分和最小評分指標(biāo),其中,熵可以用于表示不同評分之間的離散程度,最大評分和最小評分指標(biāo)有助于了解項目的評分范圍和極值情況,因此預(yù)估方差夠綜合考量待評分項目的評分分布、不確定性和差異性,提供更全面、準(zhǔn)確的評估結(jié)果,本發(fā)明提出的待評分項目的選取方式,可以與大量的主動學(xué)習(xí)方法和部分非主動學(xué)習(xí)方法相結(jié)合,解決用戶冷啟動問題。
1.一種基于主動學(xué)習(xí)的商品推薦方法,其特征在于,包括以下步驟:
2.根據(jù)權(quán)利要求1所述的一種基于主動學(xué)習(xí)的商品推薦方法,其特征在于,以預(yù)估方差為指標(biāo)選取所述待評分項目,所述預(yù)估方差包括熵、最大評分和最小評分指標(biāo)。
3.根據(jù)權(quán)利要求2所述的一種基于主動學(xué)習(xí)的商品推薦方法,其特征在于,所述預(yù)估方差的計算公式具體如下:
4.根據(jù)權(quán)利要求1所述的一種基于主動學(xué)習(xí)的商品推薦方法,其特征在于,所述量化推薦相關(guān)性的計算公式具體如下:
5.根據(jù)權(quán)利要求1所述的一種基于主動學(xué)習(xí)的商品推薦方法,其特征在于,基于所述量化推薦相關(guān)性判斷推薦系統(tǒng)新用戶是否需要退出主動學(xué)習(xí)的具體過程如下:
6.根據(jù)權(quán)利要求5所述的一種基于主動學(xué)習(xí)的商品推薦方法,其特征在于,步驟s301中,通過指數(shù)函數(shù)進(jìn)行曲線擬合。
7.根據(jù)權(quán)利要求5所述的一種基于主動學(xué)習(xí)的商品推薦方法,其特征在于,步驟s302中,同時還需考慮是否滿足:若是,則需要退出主動學(xué)習(xí),其中,v為偏好信息增益,g為偏好信息增益閾值。
8.根據(jù)權(quán)利要求7所述的一種基于主動學(xué)習(xí)的商品推薦方法,其特征在于,所述偏好信息增益v的計算公式具體如下:
9.根據(jù)權(quán)利要求1所述的一種基于主動學(xué)習(xí)的商品推薦方法,其特征在于,通過評分預(yù)估算法計算所述初始評分預(yù)估結(jié)果和所述當(dāng)前評分預(yù)估結(jié)果。
10.一種計算機可讀存儲介質(zhì),其上存儲有計算機程序,其特征在于,所述程序被處理器執(zhí)行時實現(xiàn)如權(quán)利要求1-9中任一所述的方法。