本發(fā)明屬于數(shù)據(jù)分析與處理技術(shù)領(lǐng)域,尤其涉及一種內(nèi)容推送方法及裝置。
背景技術(shù):
隨著逐漸步入信息時代,當今世界正處于信息大爆炸的環(huán)境下,同時面臨著嚴峻的信息過載問題。僅在2011年,全球數(shù)據(jù)量就達到了1.8zb,相當于全世界每人每年能產(chǎn)生200gb以上的數(shù)據(jù),并且這個數(shù)字還在逐年增長,據(jù)保守預計,接下來幾年中,數(shù)據(jù)產(chǎn)生量將始終保持每年50%的增長速度。現(xiàn)如今,在各大電商、視頻播放平臺、音頻播放平臺上,用戶每天都產(chǎn)生海量的數(shù)據(jù),因此如何有效地利用用戶產(chǎn)生的數(shù)據(jù)是當今互聯(lián)網(wǎng)企業(yè)亟需解決的問題。此時,個性化的推薦系統(tǒng)作為數(shù)據(jù)挖掘的手段便應運而生了。推薦系統(tǒng)是指互聯(lián)網(wǎng)網(wǎng)站向用戶提供物品信息或建議,讓用戶發(fā)現(xiàn)自己潛在的興趣和需求并幫助用戶選擇物品。
基于物品的協(xié)同過濾(item-basedcollaborativefiltering)算法是目前業(yè)界應用最多的推薦算法。無論是亞馬遜網(wǎng),還是netflix、hulu、youtube等,其推薦算法的基礎都是該算法。其優(yōu)點有:1.計算簡單;2.可以根據(jù)用戶歷史行為歸納推薦理由;3.用戶行為歷史越多推薦效率越高。其缺點主要有1.物品數(shù)量遠大于用戶時,計算物品共現(xiàn)矩陣代價太大;2.冷啟動問題嚴重;3.選取種子物品進行計算推薦列表時,沒有考慮時間信息。
技術(shù)實現(xiàn)要素:
本發(fā)明實施例所要解決的技術(shù)問題在于提供一種內(nèi)容推送方法及裝置,旨在解決現(xiàn)有技術(shù)中用戶興趣度計算不精確的問題。
本發(fā)明實施例第一方面提供了一種內(nèi)容推送方法,所述方法包括:
獲取全部用戶的內(nèi)容查看歷史數(shù)據(jù),所述用戶的內(nèi)容查看歷史數(shù)據(jù)包括用戶的全部歷史內(nèi)容及各所述歷史內(nèi)容的查看時間點,所述歷史內(nèi)容為用戶查看過的內(nèi)容;
將與目標用戶的歷史內(nèi)容相關(guān)聯(lián)的內(nèi)容確定為目標內(nèi)容,計算所述目標內(nèi)容與關(guān)聯(lián)的所述目標用戶的歷史內(nèi)容的相似度,獲取所述目標用戶對與所述目標內(nèi)容關(guān)聯(lián)的所述目標用戶的歷史內(nèi)容的用戶評分,根據(jù)各所述歷史內(nèi)容的查看時間點,計算所述目標用戶查看與所述目標內(nèi)容關(guān)聯(lián)的所述目標用戶的歷史內(nèi)容的行為時間權(quán)重;
根據(jù)所述相似度、所述用戶評分及所述行為時間權(quán)重,計算所述目標用戶對所述目標內(nèi)容的興趣度;
選取所述目標用戶興趣度最高的預置數(shù)量個所述目標內(nèi)容,推送給所述目標用戶。
本發(fā)明實施例第二方面提供了一種內(nèi)容推送裝置,所述裝置包括:
獲取模塊,用于獲取全部用戶的內(nèi)容查看歷史數(shù)據(jù),所述用戶的內(nèi)容查看歷史數(shù)據(jù)包括用戶的全部歷史內(nèi)容及各所述歷史內(nèi)容的查看時間點,所述歷史內(nèi)容為用戶查看過的內(nèi)容;
處理模塊,用于將與目標用戶的歷史內(nèi)容相關(guān)聯(lián)的內(nèi)容確定為目標內(nèi)容,計算所述目標內(nèi)容與關(guān)聯(lián)的所述目標用戶的歷史內(nèi)容的相似度,獲取所述目標用戶對與所述目標內(nèi)容關(guān)聯(lián)的所述目標用戶的歷史內(nèi)容的用戶評分,根據(jù)各所述歷史內(nèi)容的查看時間點,計算所述目標用戶查看與所述目標內(nèi)容關(guān)聯(lián)的所述目標用戶的歷史內(nèi)容的行為時間權(quán)重;
計算模塊,用于根據(jù)所述相似度、所述用戶評分及所述行為時間權(quán)重,計算所述目標用戶對所述目標內(nèi)容的興趣度;
推送模塊,用于選取所述目標用戶興趣度最高的預置數(shù)量個所述目標內(nèi)容,推送給所述目標用戶。
從上述本發(fā)明實施例可知,本發(fā)明通過獲取全部用戶的內(nèi)容查看歷史數(shù)據(jù),將與目標用戶的歷史內(nèi)容相關(guān)聯(lián)的內(nèi)容確定為目標內(nèi)容,計算目標內(nèi)容與關(guān)聯(lián)的目標用戶的歷史內(nèi)容的相似度,獲取目標用戶對與目標內(nèi)容關(guān)聯(lián)的目標用戶的歷史內(nèi)容的用戶評分,根據(jù)各歷史內(nèi)容的查看時間點,計算目標用戶查看與目標內(nèi)容關(guān)聯(lián)的目標用戶的歷史內(nèi)容的行為時間權(quán)重,根據(jù)相似度、用戶評分及行為時間權(quán)重,計算目標用戶對目標內(nèi)容的興趣度,選取目標用戶興趣度最高的預置數(shù)量個目標內(nèi)容,推送給目標用戶,相較于現(xiàn)有技術(shù),本方案在獲取用戶推送內(nèi)容過程中,在計算用戶的興趣度時,引入了用戶歷史內(nèi)容的行為時間權(quán)重這一參數(shù),使用戶興趣度的統(tǒng)計更為準確,進而使獲取的用戶推送內(nèi)容更為精確。
附圖說明
為了更清楚地說明本發(fā)明實施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對實施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實施例,對于本領(lǐng)域技術(shù)人員來講,在不付出創(chuàng)造性勞動性的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
附圖1是本發(fā)明第一實施例提供的內(nèi)容推送方法的實現(xiàn)流程示意圖;
附圖2是本發(fā)明第二實施例提供的內(nèi)容推送方法的實現(xiàn)流程示意圖;
附圖3是本發(fā)明第三實施例提供的內(nèi)容推送裝置的結(jié)構(gòu)示意圖;
附圖4是本發(fā)明第四實施例提供的內(nèi)容推送裝置的結(jié)構(gòu)示意圖;
附圖5是本發(fā)明第二實施例提供的用戶行為歷史矩陣;
附圖6是本發(fā)明第二實施例提供的目標內(nèi)容興趣度計算的示意圖。
具體實施方式
為使得本發(fā)明實施例的發(fā)明目的、特征、優(yōu)點能夠更加的明顯和易懂,下面將結(jié)合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術(shù)方案進行清楚、完整地描述,顯然,所描述的實施例僅僅是本發(fā)明一部分實施例,而非全部實施例?;诒景l(fā)明中的實施例,本領(lǐng)域技術(shù)人員在沒有做出創(chuàng)造性勞動前提下所獲得的所有其他實施例,都屬于本發(fā)明保護的范圍。
請參閱附圖1,附圖1為本發(fā)明第一實施例提供的內(nèi)容推送方法的實現(xiàn)流程示意圖,該方法可以應用于終端設備中。如附圖1所示,該方法主要包括以下步驟:
s101、獲取全部用戶的內(nèi)容查看歷史數(shù)據(jù);
其中,用戶的內(nèi)容查看歷史數(shù)據(jù)包括用戶的全部歷史內(nèi)容及各歷史內(nèi)容的查看時間點。進一步地,該歷史內(nèi)容為用戶查看過的內(nèi)容,即終端設備記錄下的用戶之前通過該終端設備查看過的內(nèi)容。該歷史內(nèi)容可以但不限于包括:網(wǎng)絡上的視頻、音頻、新聞或商品。查看的方式包括點擊該歷史內(nèi)容的鏈接。
s102、將與目標用戶的歷史內(nèi)容相關(guān)聯(lián)的內(nèi)容確定為目標內(nèi)容,計算目標內(nèi)容與關(guān)聯(lián)的目標用戶的歷史內(nèi)容的相似度,獲取目標用戶對與目標內(nèi)容關(guān)聯(lián)的目標用戶的歷史內(nèi)容的用戶評分,根據(jù)各歷史內(nèi)容的查看時間點,計算目標用戶查看與目標內(nèi)容關(guān)聯(lián)的目標用戶的歷史內(nèi)容的行為時間權(quán)重;
若存在用戶既查看過某一內(nèi)容,又目標用戶的歷史內(nèi)容,則認為該內(nèi)容為與目標用戶的歷史內(nèi)容相關(guān)聯(lián)的內(nèi)容,將該內(nèi)容確定為目標內(nèi)容。
當目標用戶對目標用戶的歷史內(nèi)容無用戶評分時,默認該用戶評分為1。
s103、根據(jù)相似度、用戶評分及行為時間權(quán)重,計算目標用戶對目標內(nèi)容的興趣度;
s104、選取目標用戶興趣度最高的預置數(shù)量個目標內(nèi)容,推送給目標用戶。
可以理解的,此處的預置數(shù)量可以根據(jù)需要進行設置、更改。
本發(fā)明實施例提供的內(nèi)容推送方法,通過獲取全部用戶的內(nèi)容查看歷史數(shù)據(jù),將與目標用戶的歷史內(nèi)容相關(guān)聯(lián)的內(nèi)容確定為目標內(nèi)容,計算目標內(nèi)容與關(guān)聯(lián)的目標用戶的歷史內(nèi)容的相似度,獲取目標用戶對與目標內(nèi)容關(guān)聯(lián)的目標用戶的歷史內(nèi)容的用戶評分,根據(jù)各歷史內(nèi)容的查看時間點,計算目標用戶查看與目標內(nèi)容關(guān)聯(lián)的目標用戶的歷史內(nèi)容的行為時間權(quán)重,根據(jù)相似度、用戶評分及行為時間權(quán)重,計算目標用戶對目標內(nèi)容的興趣度,選取目標用戶興趣度最高的預置數(shù)量個目標內(nèi)容,推送給目標用戶,相較于現(xiàn)有技術(shù),本方案在獲取用戶推送內(nèi)容過程中,在計算用戶的興趣度時,引入了用戶歷史內(nèi)容的行為時間權(quán)重這一參數(shù),使用戶興趣度的統(tǒng)計更為準確,進而使獲取的用戶推送內(nèi)容更為精確。
請參閱附圖2,附圖2為本發(fā)明第二實施例提供的內(nèi)容推送方法的實現(xiàn)流程示意圖,該方法可以應用于終端設備中。如附圖2所示,該方法主要包括以下步驟:
s201、獲取全部用戶的內(nèi)容查看歷史數(shù)據(jù);
其中,用戶的內(nèi)容查看歷史數(shù)據(jù)包括用戶的全部歷史內(nèi)容及各歷史內(nèi)容的查看時間點。進一步地,該歷史內(nèi)容為用戶查看過的內(nèi)容,即終端設備記錄下的用戶之前通過該終端設備查看過的內(nèi)容。該歷史內(nèi)容可以但不限于包括:網(wǎng)絡上的視頻、音頻、新聞或商品。查看的方式包括點擊該歷史內(nèi)容的鏈接。
s202、將與目標用戶的歷史內(nèi)容相關(guān)聯(lián)的內(nèi)容確定為目標內(nèi)容;
若存在用戶既查看過某一內(nèi)容,又目標用戶的歷史內(nèi)容,則認為該內(nèi)容為與目標用戶的歷史內(nèi)容相關(guān)聯(lián)的內(nèi)容,將該內(nèi)容確定為目標內(nèi)容。
s203、根據(jù)獲取的全部用戶的內(nèi)容查看歷史數(shù)據(jù),建立用戶行為歷史矩陣;
如圖5所示,圖5為終端設備建立的一個用戶行為歷史矩陣,其中a、b、c、d、e為用戶,a、b、c、d、e為歷史內(nèi)容。
s204、根據(jù)用戶行為歷史矩陣及公式
其中wij為目標內(nèi)容與關(guān)聯(lián)的目標用戶的歷史內(nèi)容的相似度,n(i)為全部用戶中查看過與目標內(nèi)容關(guān)聯(lián)的目標用戶的歷史內(nèi)容i的用戶數(shù)量,n(j)為全部用戶中查看過目標內(nèi)容j的用戶數(shù)量,n(i)∩n(j)為同時查看過i和j的用戶數(shù)量。將用戶行為歷史矩陣中統(tǒng)計的數(shù)據(jù)帶入公式
s205、獲取目標用戶對與目標內(nèi)容關(guān)聯(lián)的目標用戶的歷史內(nèi)容的用戶評分;
其中,當目標用戶對目標用戶的歷史內(nèi)容無用戶評分時,默認該用戶評分為1。
s206、根據(jù)公式
δ為興趣衰減因子,該興趣衰減因子可以根據(jù)需要進行調(diào)整。tui為目標用戶u查看與目標內(nèi)容關(guān)聯(lián)的目標用戶的歷史內(nèi)容i距離目標用戶最新行為的邏輯距離,目標用戶最新行為是目標用戶查看目標用戶的歷史內(nèi)容中查看時間點距當前時間點最近的內(nèi)容的行為。目標用戶u查看i的查看時間點與目標用戶u查看目標用戶最新行為的查看時間點之間的目標用戶的歷史內(nèi)容的個數(shù)越多時,tui的值越大,tui為非負整數(shù)。
s207、根據(jù)公式
puj為目標用戶u對目標內(nèi)容j的興趣度,n(u)為目標用戶u的全部歷史內(nèi)容的集合,s(j,k)為目標用戶u的歷史內(nèi)容中與目標內(nèi)容j相似度最高的k個歷史內(nèi)容的集合,wij為目標內(nèi)容j與目標用戶u的歷史內(nèi)容i的相似度,rui為目標用戶u對目標用戶的歷史內(nèi)容i的用戶評分,lui為目標用戶u查看目標用戶的歷史內(nèi)容i的行為時間權(quán)重。
s208、選取目標用戶興趣度最高的預置數(shù)量個目標內(nèi)容,推送給目標用戶。
可以理解的,此處的預置數(shù)量可以根據(jù)需要進行設置、更改。
以圖6為例,假設目標用戶u按查看時間從早到晚的順序查看的全部歷史內(nèi)容分別為:a、b、c、d,此時d即為目標用戶最新行為,則可以令tud=0、tuc=1、tub=2、tua=3。用戶對a、b、c、d的評分分別為0.7、0.6、0.5和0.8,這里取興趣衰減因子δ=10、取k=3,與a相似度最高的3個視頻分別是a、b、c,waa=0.9、wba=0.8、wca=0.7;與b相似度最高的3個視頻分別是d、e、f,wdb=0.7、web=0.6、wfb=0.5;與c相似度最高的3個視頻分別是f、g、h,wfc=0.6、wgc=0.5、whc=0.4;與d相似度最高的3個視頻分別是i、j、k,wid=0.8、wjd=0.7、wkd=0.6,其中f既是與b相似度最高的3個視頻中的一個,又是與c相似度最高的3個視頻中的一個。
用戶u對a的興趣度為pua,pua計算如下:
用戶u對f的興趣度為puf,puf計算如下:
根據(jù)計算得,pua=0.467、pub=0.415、puc=0.363、pud=0.344、pue=0.295、puf=0.517、pug=0.226、puh=0.181、pui=0.64、puj=0.56、puk=0.48。
將計算得到的興趣度降序排列,并取前topn個目標內(nèi)容推薦給用戶。例如,如果取top5個目標內(nèi)容推薦給用戶時,推薦列表為[i,j,f,k,a]。
本發(fā)明實施例提供的內(nèi)容推送方法,通過獲取全部用戶的內(nèi)容查看歷史數(shù)據(jù),將與目標用戶的歷史內(nèi)容相關(guān)聯(lián)的內(nèi)容確定為目標內(nèi)容,計算目標內(nèi)容與關(guān)聯(lián)的目標用戶的歷史內(nèi)容的相似度,獲取目標用戶對與目標內(nèi)容關(guān)聯(lián)的目標用戶的歷史內(nèi)容的用戶評分,根據(jù)各歷史內(nèi)容的查看時間點,計算目標用戶查看與目標內(nèi)容關(guān)聯(lián)的目標用戶的歷史內(nèi)容的行為時間權(quán)重,根據(jù)相似度、用戶評分及行為時間權(quán)重,計算目標用戶對目標內(nèi)容的興趣度,選取目標用戶興趣度最高的預置數(shù)量個目標內(nèi)容,推送給目標用戶,相較于現(xiàn)有技術(shù),本方案在獲取用戶推送內(nèi)容過程中,在計算用戶的興趣度時,引入了用戶歷史內(nèi)容的行為時間權(quán)重這一參數(shù),使用戶興趣度的統(tǒng)計更為準確,進而使獲取的用戶推送內(nèi)容更為精確。
請參閱附圖3,附圖3是本發(fā)明第三實施例提供的內(nèi)容推送裝置的結(jié)構(gòu)示意圖,為了便于說明,僅示出了與本發(fā)明實施例相關(guān)的部分。附圖3示例的內(nèi)容推送裝置可以是前述第一實施例提供的內(nèi)容推送方法的執(zhí)行主體,其可以是終端設備或者終端設備中的一個功能模塊。附圖3示例的內(nèi)容推送裝置,主要包括:獲取模塊301、處理模塊302、計算模塊303及推送模塊304。各功能模塊詳細說明如下:
獲取模塊301,用于獲取全部用戶的內(nèi)容查看歷史數(shù)據(jù),用戶的內(nèi)容查看歷史數(shù)據(jù)包括用戶的全部歷史內(nèi)容及各歷史內(nèi)容的查看時間點,歷史內(nèi)容為用戶查看過的內(nèi)容。
處理模塊302,用于將與目標用戶的歷史內(nèi)容相關(guān)聯(lián)的內(nèi)容確定為目標內(nèi)容,計算目標內(nèi)容與關(guān)聯(lián)的目標用戶的歷史內(nèi)容的相似度,獲取目標用戶對與目標內(nèi)容關(guān)聯(lián)的目標用戶的歷史內(nèi)容的用戶評分,根據(jù)各歷史內(nèi)容的查看時間點,計算目標用戶查看與目標內(nèi)容關(guān)聯(lián)的目標用戶的歷史內(nèi)容的行為時間權(quán)重。
計算模塊303,用于根據(jù)相似度、用戶評分及行為時間權(quán)重,計算目標用戶對目標內(nèi)容的興趣度。
推送模塊304,用于選取目標用戶興趣度最高的預置數(shù)量個目標內(nèi)容,推送給目標用戶。
上述各功能模塊實現(xiàn)各自功能的具體過程,可參考前述第一實施例提供的內(nèi)容推送方法的相關(guān)內(nèi)容,此處不再贅述。
本發(fā)明實施例提供的內(nèi)容推送裝置,通過獲取全部用戶的內(nèi)容查看歷史數(shù)據(jù),將與目標用戶的歷史內(nèi)容相關(guān)聯(lián)的內(nèi)容確定為目標內(nèi)容,計算目標內(nèi)容與關(guān)聯(lián)的目標用戶的歷史內(nèi)容的相似度,獲取目標用戶對與目標內(nèi)容關(guān)聯(lián)的目標用戶的歷史內(nèi)容的用戶評分,根據(jù)各歷史內(nèi)容的查看時間點,計算目標用戶查看與目標內(nèi)容關(guān)聯(lián)的目標用戶的歷史內(nèi)容的行為時間權(quán)重,根據(jù)相似度、用戶評分及行為時間權(quán)重,計算目標用戶對目標內(nèi)容的興趣度,選取目標用戶興趣度最高的預置數(shù)量個目標內(nèi)容,推送給目標用戶,相較于現(xiàn)有技術(shù),本方案在獲取用戶推送內(nèi)容過程中,在計算用戶的興趣度時,引入了用戶歷史內(nèi)容的行為時間權(quán)重這一參數(shù),使用戶興趣度的統(tǒng)計更為準確,進而使獲取的用戶推送內(nèi)容更為精確。
請參閱附圖4,附圖4是本發(fā)明第四實施例提供的內(nèi)容推送裝置的結(jié)構(gòu)示意圖,為了便于說明,僅示出了與本發(fā)明實施例相關(guān)的部分。附圖4示例的內(nèi)容推送裝置可以是前述第二實施例提供的內(nèi)容推送方法的執(zhí)行主體,其可以是終端設備或者終端設備中的一個功能模塊。附圖4示例的內(nèi)容推送裝置,主要包括:獲取模塊401、處理模塊402、計算模塊403及推送模塊404。各功能模塊詳細說明如下:
獲取模塊401,用于獲取全部用戶的內(nèi)容查看歷史數(shù)據(jù),用戶的內(nèi)容查看歷史數(shù)據(jù)包括用戶的全部歷史內(nèi)容及各歷史內(nèi)容的查看時間點,歷史內(nèi)容為用戶查看過的內(nèi)容。
處理模塊402,用于將與目標用戶的歷史內(nèi)容相關(guān)聯(lián)的內(nèi)容確定為目標內(nèi)容,根據(jù)獲取的全部用戶的內(nèi)容查看歷史數(shù)據(jù),建立用戶行為歷史矩陣。
處理模塊402,還用于根據(jù)用戶行為歷史矩陣及公式
處理模塊402,還用于獲取目標用戶對與目標內(nèi)容關(guān)聯(lián)的目標用戶的歷史內(nèi)容的用戶評分,根據(jù)公式
計算模塊403,用于根據(jù)公式
推送模塊404,用于選取目標用戶興趣度最高的預置數(shù)量個目標內(nèi)容,推送給目標用戶。
上述各功能模塊實現(xiàn)各自功能的具體過程,可參考前述第二實施例提供的內(nèi)容推送方法的相關(guān)內(nèi)容,此處不再贅述。
本發(fā)明實施例提供的內(nèi)容推送裝置,通過獲取全部用戶的內(nèi)容查看歷史數(shù)據(jù),將與目標用戶的歷史內(nèi)容相關(guān)聯(lián)的內(nèi)容確定為目標內(nèi)容,計算目標內(nèi)容與關(guān)聯(lián)的目標用戶的歷史內(nèi)容的相似度,獲取目標用戶對與目標內(nèi)容關(guān)聯(lián)的目標用戶的歷史內(nèi)容的用戶評分,根據(jù)各歷史內(nèi)容的查看時間點,計算目標用戶查看與目標內(nèi)容關(guān)聯(lián)的目標用戶的歷史內(nèi)容的行為時間權(quán)重,根據(jù)相似度、用戶評分及行為時間權(quán)重,計算目標用戶對目標內(nèi)容的興趣度,選取目標用戶興趣度最高的預置數(shù)量個目標內(nèi)容,推送給目標用戶,相較于現(xiàn)有技術(shù),本方案在獲取用戶推送內(nèi)容過程中,在計算用戶的興趣度時,引入了用戶歷史內(nèi)容的行為時間權(quán)重這一參數(shù),使用戶興趣度的統(tǒng)計更為準確,進而使獲取的用戶推送內(nèi)容更為精確。
需要說明的是,對于前述的各方法實施例,為了簡便描述,故將其都表述為一系列的動作組合,但是本領(lǐng)域技術(shù)人員應該知悉,本發(fā)明并不受所描述的動作順序的限制,因為依據(jù)本發(fā)明,某些步驟可以采用其它順序或者同時進行。其次,本領(lǐng)域技術(shù)人員也應該知悉,說明書中所描述的實施例均屬于優(yōu)選實施例,所涉及的動作和模塊并不一定都是本發(fā)明所必須的。
在上述實施例中,對各個實施例的描述都各有側(cè)重,某個實施例中沒有詳述的部分,可以參見其它實施例的相關(guān)描述。
以上為對本發(fā)明所提供的內(nèi)容推送方法、裝置的描述,對于本領(lǐng)域的技術(shù)人員,依據(jù)本發(fā)明實施例的思想,在具體實施方式及應用范圍上均會有改變之處,綜上,本說明書內(nèi)容不應理解為對本發(fā)明的限制。