一種基于時間上下文和協(xié)同過濾的電影推薦方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明設(shè)及一種基于時間上下文與基于item的協(xié)同過濾的電影推薦方法,是屬于 互聯(lián)網(wǎng)應(yīng)用領(lǐng)域。
【背景技術(shù)】
[0002] 隨著互聯(lián)網(wǎng)技術(shù)的興起,個性化推薦系統(tǒng)層出不窮,也應(yīng)用到各個行業(yè)和領(lǐng)域當(dāng) 中。例如:淘寶、京東、亞馬遜等一些電子商務(wù)網(wǎng)站根據(jù)用戶的歷史行為數(shù)據(jù)進行挖掘,實現(xiàn) 了個性化推薦給用戶一些商品,進而促進用戶的消費。伴隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展,人們的生 活得到了極大的改善,運個平臺給我們帶來了各種各樣的服務(wù)于體驗,與互聯(lián)網(wǎng)一同出現(xiàn) 的還有一個詞,那就是大數(shù)據(jù),互聯(lián)網(wǎng)+大數(shù)據(jù)讓數(shù)據(jù)挖掘和個性化推薦技術(shù)得到了巨大發(fā) 展。當(dāng)我們上網(wǎng)想看電影時,我們可W從互聯(lián)網(wǎng)中獲取到個性化的推薦信息。從而可W從互 聯(lián)網(wǎng)海量資源中得到更適合我們的電影資源。
[0003] 目前,市場上常見的電影推薦方法主要有3種,一種是基于用戶興趣模型,計算電 影之間的相似度實現(xiàn)個性化推薦;一種是基于用戶的歷史評分反饋數(shù)據(jù),實現(xiàn)基于熱口推 薦或者好評推薦;還有一種是基于社交網(wǎng)絡(luò),通過社交網(wǎng)絡(luò)獲取用戶好友數(shù)據(jù),做數(shù)據(jù)挖掘 并分析,從而給用戶提供個性化的推薦。
[0004] 上述電影推薦方法主要集中研究了如何聯(lián)系用戶興趣和物品,將某種程度上符合 用戶興趣的電影推薦給用戶,但運些方法都忽略了一點,就是用戶所處的上下文。運些上下 文包括用戶訪問電影推薦系統(tǒng)的時間、地點、屯、情等,運些因素對提高推薦系統(tǒng)的推薦效率 是非常重要的,同時,運些因素也可能決定推薦的結(jié)果是否符合用戶的需要。比如:某用戶 的興趣愛好是看恐怖電影,該用戶可能工作上不太順利,在公司挨批了,屯、情比較郁悶,想 找個電影來緩解下屯、情,運時推薦系統(tǒng)本該推薦個搞笑的電影,從而讓用戶從不愉快中走 出來,重拾好屯、情,然而推薦系統(tǒng)根據(jù)用戶的興趣推薦了一個恐怖片,用戶看完反而沒有得 到好屯、情,似乎變得更加的憂郁,運便說明了上述推薦方法的不足。
【發(fā)明內(nèi)容】
[0005] 本發(fā)明的目的在于提供一種基于時間上下文和協(xié)同過濾的電影推薦方法,主要用 于解決傳統(tǒng)推薦方法中沒有考慮到用戶訪問推薦系統(tǒng)的上下文信息,導(dǎo)致推薦結(jié)果滿意度 不局等問題,從而提局電影推薦的準(zhǔn)確率和滿意度。
[0006] 為解決上述的技術(shù)問題,本發(fā)明采用的方案如下:
[0007] 第一步,由專家對屯、情類型進行劃分并構(gòu)建標(biāo)簽,為電影添加對應(yīng)的屯、情標(biāo)簽,形 成電影資源庫;
[000引第二步,用戶進入電影推薦系統(tǒng),選擇符合自己屯、情的標(biāo)簽;
[0009] 第Ξ步,系統(tǒng)通過基于時間上下文的協(xié)同過濾算法給出個性化的推薦列表;
[0010] 第四步,用戶根據(jù)推薦列表選擇電影觀看,觀看完成后,給出好評或者差評;好評 代表著該推薦結(jié)果符合該屯、情標(biāo)簽,差評代表著不符合該屯、情標(biāo)簽;
[0011] 第五步,根據(jù)用戶給出的評價結(jié)果,不斷的修正電影對應(yīng)的屯、情標(biāo)簽,從而為今后 的推薦提供依據(jù),提高推薦準(zhǔn)確率和滿意度。
[0012] 采用基于時間上下文的協(xié)同過濾算法的原因如下:
[0013] 第一,用戶在相隔很短的時間內(nèi)屯、情和喜歡的物品具有更高的相似度,舉個例子 就是,用戶在今天看的電影和用戶昨天的看的電影其相似度在統(tǒng)計意義上應(yīng)該大于用戶今 天看的電影和用戶一年前看的電影的相似度。
[0014] 第二,用戶近期的行為相比用戶很久之前的行為,更能體現(xiàn)用戶現(xiàn)在的興趣。因此 在預(yù)測用戶現(xiàn)在的興趣時,應(yīng)該加重用戶近期行為的權(quán)重,優(yōu)先給用戶推薦那些和他近期 喜歡的電影相似的電影。
[001引有益效果
[0016] 本發(fā)明對比已有的電影推薦方法,具有W下創(chuàng)新點:
[0017] a.利用給電影添加屯、情標(biāo)簽屬性,在推薦過程中,加入了用戶選擇觀看電影時的 屯、情運個環(huán)節(jié),使得推薦滿意度提高;
[0018] b.將基于時間上下文和基于物品的協(xié)同過濾算法結(jié)合起來作為電影推薦的核屯、, 融入了上下文的概念,使得推薦結(jié)果更加符合常理,效率更高。
[0019] 本發(fā)明對比已有電影推薦方法具有W下顯著優(yōu)點:
[0020] 1、提高了電影推薦結(jié)果的時效性和精確度;
[0021] 2、提高了電影推薦結(jié)果的滿意度。
【附圖說明】
[0022] 附圖1是基于時間上下文和協(xié)同過濾的電影推薦方法的總體流程圖。
[0023] 具體的實施方式
[0024] 下面結(jié)合說明書附圖和【具體實施方式】對本發(fā)明作進一步的說明。
[0025] 為解決上述的技術(shù)問題,本發(fā)明采用的技術(shù)方案是:一種基于時間上下文和協(xié)同 過濾的電影推薦方法,包括W下的步驟:
[0026] S1、對電影添加屯、情標(biāo)簽,運部分需要專家首先對屯、情進行合理劃分,然后根據(jù)屯、 情的分類給電影加上合適的屯、情標(biāo)簽屬性;
[0027] S2、用戶選擇符合自己屯、情的標(biāo)簽,根據(jù)用戶的時間上下文行為數(shù)據(jù)和選擇的屯、 情標(biāo)簽,計算符合條件電影i與電影j之間的相似度sim(i,j);
[00%] S3、根據(jù)上一步中計算好的相似度sim(i,j)和基于時間上下文的協(xié)同過濾算法計 算用戶U對符合條件電影i的興趣度,給出推薦列表;
[0029] S4、用戶觀看后給出自己的評價,觀看電影是否符合所選屯、情標(biāo)簽,只提供滿意或 者不滿意兩種選項,統(tǒng)計此項數(shù)據(jù),在之后的推薦中展示給其它用戶供參考,在下一次的用 戶看到推薦結(jié)果時,可W參考曾經(jīng)用戶對運部電影的評價,再從推薦列表中更加合理的選 擇電影觀看,從而讓推薦的滿意度提高。
[0030] 采用基于時間上下文的協(xié)同過濾算法得出個性化推薦列表的具體過程如下:
[0031] 第一步,基于用戶利用用戶行為離線計算電影之間的相似度,公式如下:
[0032]
[0033] 注意,上面公式sim(i,j)表示電影i與電影j的相似度;N(i)表示喜歡電影i的用戶 數(shù);tui是用戶U對電影i產(chǎn)生行為的時間。f函數(shù)的含義是用戶對電影i和電影j產(chǎn)生行為的時 間越遠(yuǎn),則f越小。即數(shù)學(xué)衰減函數(shù),此處使用如下衰減函數(shù):
[0034]
[0035] 其中,α是時間衰減參數(shù),它的取值在不同系統(tǒng)中不同,如果一個系統(tǒng)用戶興趣變 化快,就應(yīng)該取比較大的α,反之需要取比較小的α。
[0036] 第二步,根據(jù)用戶的歷史行為和電影相似度矩陣,給用戶做在線個性化推薦,計算 用戶U對物品i的興趣p(u,i),公式如下:
[0037]
[0038] 其中to是當(dāng)前時間,S(i,k)是和物品i最相似的k個物品的集合,上面公式表明,tuj 越靠近to,和物品j相似的物品就會在用戶U的推薦列表中獲得越高的排名。β是時間衰減參 數(shù),需要根據(jù)不同的數(shù)據(jù)集選擇合適的值。
【主權(quán)項】
1. 一種基于時間上下文與協(xié)同過濾算法相結(jié)合的電影推薦方法,其特征在于,采用了 基于時間上下文和協(xié)同過濾算法實現(xiàn)電影推薦,具體的步驟如下: 51、 對電影添加心情標(biāo)簽,這部分需要專家首先對心情進行合理劃分,然后根據(jù)心情的 分類給電影加上合適的標(biāo)簽; 52、 用戶選擇符合自己心情的標(biāo)簽,根據(jù)用戶的時間上下文行為數(shù)據(jù)和選擇的心情標(biāo) 簽,計算符合條件電影之間的相似度; 53、 根據(jù)相似度和基于時間上下文的協(xié)同過濾算法計算用戶對符合條件電影的興趣 度,給出推薦列表; 54、 用戶觀看后給出自己的評價,觀看電影是否符合所選心情標(biāo)簽,統(tǒng)計此項數(shù)據(jù),在 之后的推薦中展示給其它用戶供參考,從而讓推薦的滿意度提高。2. 根據(jù)權(quán)利要求1所述的基于時間上下文與協(xié)同過濾算法相結(jié)合的電影推薦方法,其 特征在于,對于電影,按照專家給出的心情的類型劃分,給電影添加對應(yīng)的心情標(biāo)簽屬性。3. 根據(jù)權(quán)利要求1所述的基于時間上下文與協(xié)同過濾算法相結(jié)合的電影推薦方法,其 特征在于,對于符合用戶心情和根據(jù)用戶行為上下文得到的電影,計算電影之間的相似度, 具體計算公式如下:注意,上面公式sim(i,j)表示電影i與電影j的相似度;N(i)表示喜歡電影i的用戶數(shù); tul是用戶u對電影i產(chǎn)生行為的時間。f函數(shù)的含義是用戶對電影i和電影j產(chǎn)生行為的時間 越遠(yuǎn),則f越小。即數(shù)學(xué)衰減函數(shù),此處使用如下衰減函數(shù):其中,α是時間衰減參數(shù),它的取值在不同系統(tǒng)中不同,如果一個系統(tǒng)用戶興趣變化快, 就應(yīng)該取比較大的α,反之需要取比較小的α。4. 根據(jù)權(quán)利要求1所述的基于時間上下文與協(xié)同過濾算法相結(jié)合的電影推薦方法,其 特征在于,利用用戶上下文歷史數(shù)據(jù)和上一步中計算好的電影相似度信息,根據(jù)基于Item 的協(xié)同過濾算法計算用戶u對電影i的興趣度,計算公式如下:其中to是當(dāng)前時間,S(i,k)是和物品i最相似的k個物品的集合,上面公式表明,tUj越靠 近to,和物品j相似的物品就會在用戶u的推薦列表中獲得越高的排名。β是時間衰減參數(shù), 需要根據(jù)不同的數(shù)據(jù)集選擇合適的值。5. 根據(jù)權(quán)利要求1所述的基于時間上下文與協(xié)同過濾算法相結(jié)合的電影推薦方法,其 特征在于,在用戶觀看完推薦的電影后,增加了反饋方法,使得個性化的推薦隨著時間增長 變得更加合理,用戶的滿意度提升。
【專利摘要】本發(fā)明采用一種基于時間上下文與基于物品的協(xié)同過濾算法相結(jié)合的方法實現(xiàn)電影推薦,旨在改善電影推薦的精確度和用戶滿意度,其實現(xiàn)電影推薦的主要過程如下:第一,對電影添加心情標(biāo)簽,這部分需要專家根據(jù)心情的分類給電影加上合適的標(biāo)簽;第二,根據(jù)用戶的時間上下文行為數(shù)據(jù)和選擇的心情標(biāo)簽,計算符合條件電影之間的相似度;第三,根據(jù)相似度和基于時間上下文的協(xié)同過濾算法計算用戶對符合條件電影的興趣度,給出推薦列表;第四,用戶觀看后給出自己的評價,觀看電影是否符合所選心情標(biāo)簽,統(tǒng)計此項數(shù)據(jù),在之后的推薦中展示給其它用戶供參考,從而讓推薦的滿意度提高。
【IPC分類】G06F17/30
【公開號】CN105630930
【申請?zhí)枴緾N201510974493
【發(fā)明人】蘇航, 梁榮華, 劉海亮
【申請人】中山大學(xué)深圳研究院
【公開日】2016年6月1日
【申請日】2015年12月23日