專利名稱:一種個性化音樂推薦方法及系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種音樂數(shù)據(jù)處理服務(wù),特別是涉及一種個性化音樂推薦方法及系統(tǒng)。
背景技術(shù):
用戶在收聽歌曲時通常利用兩種途徑,一種是使用傳統(tǒng)的音頻播放器在本地播放,另一種是通過網(wǎng)絡(luò)進(jìn)行在線搜索或試聽。傳統(tǒng)的音頻播放器只能播放用戶已有的音樂文件,不能拓展用戶的收聽范圍,不能幫助用戶根據(jù)其興趣愛好而發(fā)掘其他歌曲。通過網(wǎng)絡(luò)在線搜索試聽的方式,解決了擴(kuò)展用戶的收聽范圍的問題。在現(xiàn)有技術(shù)中,基于網(wǎng)絡(luò)還可以實現(xiàn)為用戶推薦歌曲。推薦一般采用兩種方式實現(xiàn)基于選擇一致性產(chǎn)生推薦以及基于協(xié)同過濾產(chǎn)生推薦。
以選擇一致性為例,現(xiàn)有技術(shù)的歌曲推薦通過如下方式實現(xiàn)用戶終端通過網(wǎng)絡(luò)連接至服務(wù)器端。服務(wù)器端設(shè)置有用戶行為提取模塊、用戶口味分析模塊以及基于口味的內(nèi)容過濾模塊。用戶終端每次對歌曲進(jìn)行操作所產(chǎn)生的操作數(shù)據(jù)均發(fā)送至該服務(wù)器端。該用戶行為提取模塊接收該操作數(shù)據(jù),該用戶口味分析模塊根據(jù)累積的該操作數(shù)據(jù)分析用戶的口味,例如用戶偏向于收聽流行歌曲,則該內(nèi)容過濾模塊針對服務(wù)器中存儲的歌曲內(nèi)容進(jìn)行過濾,依照該口味生成關(guān)于流行歌曲的推薦列表,并發(fā)送至該用戶終端。上述現(xiàn)有技術(shù)存在的問題在于,用戶的口味通常是隨時間變化的,不但有隨著長時間跨度而發(fā)生的緩慢的無周期規(guī)律的變化,而且有按照天、星期等短時間跨度和應(yīng)用場景而發(fā)生的周期性變化。例如上個月喜歡聽愛情相關(guān)的歌曲,這個月可能就會喜歡聽勵志歌曲;早上上班路上喜歡聽振奮精神的音樂,晚上可能會喜歡聽悠揚的器樂歌曲。而現(xiàn)有技術(shù)無法準(zhǔn)確識別出由于時間變化所帶來的用戶口味差異,無法基于時間屬性給出相應(yīng)的推薦內(nèi)容。另外,用戶的口味通常是以固定組合形式出現(xiàn)的,例如用戶可能會喜歡聽美國歌手演唱的鄉(xiāng)村音樂和中國歌手演唱的RAP音樂。如果僅機械的識別出用戶具有鄉(xiāng)村音樂和RAP音樂的口味,而忽略了演唱歌手的因素,為用戶推薦了中國或美國歌手演唱的鄉(xiāng)村音樂或者RAP音樂,則將出現(xiàn)噪聲推薦數(shù)據(jù),不符合用戶的需求,降低了用戶體驗度。同時,現(xiàn)有技術(shù)還無法根據(jù)用戶的反饋數(shù)據(jù),調(diào)整推薦內(nèi)容。
發(fā)明內(nèi)容
本發(fā)明公開了一種個性化音樂推薦方法及系統(tǒng),用于發(fā)現(xiàn)與時間相關(guān)的用戶口味,并根據(jù)該口味為用戶推薦符合該用戶口味的歌曲。更進(jìn)一步的,本發(fā)明根據(jù)用戶對推薦內(nèi)容的反饋數(shù)據(jù)進(jìn)一步調(diào)整推薦內(nèi)容。為解決上述問題,本發(fā)明公開了一種個性化音樂推薦方法,應(yīng)用于音樂推薦服務(wù)器中,包括如下步驟
步驟1,音樂推薦服務(wù)器根據(jù)用戶終端針對歌曲的操作生成用戶行為數(shù)據(jù),該用戶行為數(shù)據(jù)包括操作時間標(biāo)簽、操作次數(shù)標(biāo)簽和歌曲標(biāo)簽;步驟2,對該用戶行為數(shù)據(jù)進(jìn)行聚類計算,得到多個結(jié)果標(biāo)簽;步驟3,對該用戶行為數(shù)據(jù)的操作次數(shù)依據(jù)其所處時段進(jìn)行加權(quán)處理,越臨近當(dāng)前時刻的時段權(quán)重越高;步驟4,針對加權(quán)處理后的該用戶行為數(shù)據(jù)進(jìn)行歸一化處理;
步驟5,對該多個結(jié)果標(biāo)簽進(jìn)行排列組合,將該歸一化后的用戶行為數(shù)據(jù)依次與每種排列組合進(jìn)行多維相似度計算,根據(jù)該計算結(jié)果得到用戶口味,并從用戶口味中選取用戶口味模型;步驟6,音樂推薦服務(wù)器根據(jù)該用戶口味模型,為用戶終端推薦歌曲。更進(jìn)一步的,本發(fā)明還公開了一種個性化音樂推薦服務(wù)系統(tǒng),包括音樂推薦服務(wù)器與至少一用戶終端,該音樂推薦服務(wù)器包括用戶數(shù)據(jù)存儲管理模塊,用于接收用戶終端針對歌曲進(jìn)行的操作數(shù)據(jù),并據(jù)以生成用戶行為數(shù)據(jù),該用戶行為數(shù)據(jù)包括操作時間標(biāo)簽、操作次數(shù)標(biāo)簽和歌曲標(biāo)簽;相似度計算模塊,基于相似度計算對該用戶行為數(shù)據(jù)進(jìn)行聚類計算,得到多個結(jié)果標(biāo)簽;用戶口味發(fā)現(xiàn)模塊,包括加權(quán)處理模塊、歸一化模塊以及用戶口味模型選擇模塊,該加權(quán)處理模塊用于對該用戶行為數(shù)據(jù)的操作次數(shù)依據(jù)其所處時段進(jìn)行加權(quán)處理,越臨近當(dāng)前時刻的時段權(quán)重越高,該歸一化模塊用于針對加權(quán)處理后的該用戶行為數(shù)據(jù)進(jìn)行歸一化處理,該用戶口味模型選擇模塊用于對該多個結(jié)果標(biāo)簽進(jìn)行排列組合,調(diào)用該相似度計算模塊將該歸一化后的用戶行為數(shù)據(jù)依次與每種排列組合進(jìn)行多維相似度計算,根據(jù)該計算結(jié)果得到用戶口味,并從用戶口味中選取用戶口味模型;推薦過濾模塊,用于根據(jù)該用戶口味模型,為用戶終端推薦歌曲。本發(fā)明實現(xiàn)的技術(shù)效果在于,發(fā)掘用戶口味,并體現(xiàn)出與時間相關(guān)聯(lián)的用戶口味,能夠體現(xiàn)出口味組合,提高所發(fā)掘的用戶口味的準(zhǔn)確度。并自適應(yīng)的根據(jù)用戶對推薦內(nèi)容的反饋數(shù)據(jù)調(diào)整推薦策略與推薦內(nèi)容。
圖IA所示為本發(fā)明的個性化音樂推薦系統(tǒng)的結(jié)構(gòu)示意圖;圖IB所示為本發(fā)明的個性化音樂推薦方法的流程示意圖;圖2A、2B所示為本發(fā)明的個性化音樂推薦系統(tǒng)的結(jié)構(gòu)示意圖;圖3A所示為本發(fā)明的個性化音樂推薦系統(tǒng)的結(jié)構(gòu)示意圖;圖3B所示為本發(fā)明的個性化音樂推薦方法的流程示意圖;圖4A、4B所示為本發(fā)明的個性化音樂推薦系統(tǒng)的結(jié)構(gòu)示意圖;圖4C所示為本發(fā)明的個性化音樂推薦方法的流程示意圖。
具體實施例方式以下通過具體實施例詳細(xì)描述本發(fā)明的實現(xiàn)過程。本發(fā)明用于獲取用戶口味,特別是獲取與時間相關(guān)聯(lián)的用戶口味。同時,根據(jù)所獲取的用戶口味,為用戶推薦符合用戶口味的歌曲。如圖IA所示為本發(fā)明的個性化音樂推薦系統(tǒng)的結(jié)構(gòu)示意圖。至少一個用戶終端I通過網(wǎng)絡(luò)與音樂推薦服務(wù)器2連接。音樂推薦服務(wù)器2包括用戶數(shù)據(jù)存儲管理模塊21、相似度計算模塊22、用戶口味發(fā)現(xiàn)模塊23以及推薦過濾模塊24。用戶終端I包括PC機、手機、PDA、平板電腦、車載移動終端等。用戶終端I通過有線或無線方式登錄音樂推薦服務(wù)器2,在音樂推薦服務(wù)器2提供的界面中進(jìn)行針對歌曲的操作,并對應(yīng)生成操作數(shù)據(jù)。通常,對歌曲的操作可包括正向操作或負(fù)向操作,例如播放歌曲、將歌曲添加入播放列表、閱讀歌曲的相關(guān)資料、推薦歌曲、為歌曲評分等為正向操作,跳過歌曲、將歌曲從播放列表中刪除等為負(fù)向操作。用戶終端對歌曲進(jìn)行操作,對應(yīng)的操作數(shù)據(jù)被發(fā)送至該音樂推薦服務(wù)器2,用戶數(shù)據(jù)存儲管理模塊21用于存儲/管理該操作數(shù)據(jù),并根據(jù)該操作數(shù)據(jù)對應(yīng)生成用戶行為數(shù) 據(jù)。該用戶行為數(shù)據(jù)至少包括操作時間標(biāo)簽、操作次數(shù)標(biāo)簽和歌曲標(biāo)簽。用戶數(shù)據(jù)存儲管理模塊21還用于存儲用戶終端的環(huán)境因素信息,例如用戶終端的型號、登錄音樂推薦服務(wù)器時的地理位置等。該用戶行為數(shù)據(jù)還可以包括環(huán)境標(biāo)簽(用戶終端的型號、登錄時的位置等)。關(guān)于操作次數(shù)標(biāo)簽,不同的操作可根據(jù)一預(yù)先設(shè)置的數(shù)據(jù)表對應(yīng)不同的操作次數(shù)賦值,比如,進(jìn)行收聽的操作,其操作次數(shù)為+1,進(jìn)行添加至播放列表的操作,其操作次數(shù)是+2,而進(jìn)行跳過的操作,其操作次數(shù)為-I。正向操作正向記次,負(fù)向操作負(fù)向記次。其他常用操作也包括在本發(fā)明的公開范圍內(nèi)。當(dāng)用戶收聽歌曲《大海》并將其加入播放列表時,用戶數(shù)據(jù)存儲管理模塊21對應(yīng)生成一條用戶行為數(shù)據(jù),其中包括操作時間標(biāo)簽為下午(或16:00),操作次數(shù)標(biāo)簽為+3(1+2),歌曲標(biāo)簽為歌曲《大海》的全部標(biāo)簽。本領(lǐng)域的技術(shù)人員可以知道,每首歌曲都預(yù)先設(shè)置有關(guān)于其歌曲內(nèi)容的標(biāo)簽集合,用于從多個維度體現(xiàn)歌曲的特征。例如歌曲標(biāo)簽包括速度、配器、節(jié)奏、嗓音等涉及音頻屬性領(lǐng)域的維度,流派、音色等涉及音樂屬性的維度,情緒、主題等涉及內(nèi)容屬性的維度,地域、歌手等涉及人文屬性的維度。每個維度包括至少一個可選具體標(biāo)簽。以配器為例,可能包括鋼琴、大提琴、二胡、琵琶等多個具體標(biāo)簽。則歌曲《大海》的標(biāo)簽包括中速、鋼琴、抒情......隨后,相似度計算模塊22開始針對用戶數(shù)據(jù)存儲管理模塊21當(dāng)前收集到的所有用戶行為數(shù)據(jù)進(jìn)行聚類計算?;蛘撸嗨贫扔嬎隳K22可對一定時間范圍內(nèi)收集到的用戶行為數(shù)據(jù)進(jìn)行聚類計算,例如最近6個月內(nèi)。本領(lǐng)域的技術(shù)人員可知,聚類計算包括相似度計算,需基于相似度計算的數(shù)據(jù),實現(xiàn)最終聚類。該聚類計算利用了現(xiàn)有技術(shù)中的常用算法,例如DENCLUE算法等。相似度計算模塊22還可執(zhí)行后續(xù)涉及的相似度計算。由于用戶行為數(shù)據(jù)均由標(biāo)簽組成,故而聚類計算將得到針對該用戶的多個結(jié)果標(biāo)簽,可體現(xiàn)出用戶的部分操作特點。例如,結(jié)果標(biāo)簽可能包括早晨、下午、搖滾、鄉(xiāng)村、中國、美國等。由于這些標(biāo)簽頻繁出現(xiàn)在用戶的操作行為中,因此這些結(jié)果標(biāo)簽將作為確定用戶口味的備選標(biāo)簽。用戶口味發(fā)現(xiàn)模塊23將基于結(jié)果標(biāo)簽以及用戶行為數(shù)據(jù),從中發(fā)現(xiàn)用戶收聽歌曲的口味。該口味就是用戶的欣賞偏好,對于歌曲的選擇傾向性。如圖2A、2B所示為本發(fā)明的個性化音樂推薦系統(tǒng)的結(jié)構(gòu)示意圖。用戶口味發(fā)現(xiàn)模塊23進(jìn)一步包括加權(quán)處理模塊231、歸一化模塊232、用戶口味模型選擇t吳塊233。加權(quán)處理模塊231針對當(dāng)前聚類計算所針對的所有用戶行為數(shù)據(jù),進(jìn)行加權(quán)處理。具體處理包括對用戶行為數(shù)據(jù)中的操作次數(shù),依據(jù)其所處時段進(jìn)行加權(quán)處理。加權(quán)值=時間系數(shù)K*用戶行為數(shù)據(jù)的操作次數(shù)。時間系數(shù)K依下表所示?!坝脩粜袨樗跁r間范圍”為該用戶行為距離當(dāng)前時刻的時長,用戶行為處于越臨近當(dāng)前時刻的時段,其時間系數(shù)(權(quán)重)越高。下表僅用于示例。用戶行為所在時間范圍(天)時間系數(shù)KO 7 (不含)I 7 14 (不含)0.714 21 (不含)0.421 mO. 2如果該用戶發(fā)生3個用戶行為數(shù)據(jù),用戶行為數(shù)據(jù)A在3天前收聽歌曲《大?!凡⑵浼尤氩シ帕斜恚脩粜袨閿?shù)據(jù)B在10天前收聽歌曲《大?!稩次,用戶行為數(shù)據(jù)C在20天前跳過收聽歌曲《大?!稩次,則針對用戶行為數(shù)據(jù)A,加權(quán)值=1*3 = 3,針對用戶行為數(shù)據(jù)B,加權(quán)值=O. 7*1 = O. 7,針對用戶行為數(shù)據(jù)C,加權(quán)值=O. 4* (-1) = -O. 4,則針對《大?!返募訖?quán)值可累計為3+0. 7-0. 4 = 3. 3。其他加權(quán)處理的方式也可,例如,加權(quán)值=K*K*操作次數(shù)。由于臨近當(dāng)前時刻的時段的時間系數(shù)K較大,故而近期的操作行為會導(dǎo)致該加權(quán)值大幅增加,可及時體現(xiàn)出用戶短時間內(nèi)的口味,又由于逐漸遠(yuǎn)離當(dāng)前時刻的時段的時間系數(shù)K存在漸變降低,但仍大于0,故而加權(quán)值中也可以體現(xiàn)出用戶長時間內(nèi)的口味。隨后,歸一化模塊232對該加權(quán)處理后的該用戶行為數(shù)據(jù)進(jìn)行歸一化處理。歸一化處理的目的是為了避免用戶極大量收聽的某歌曲對于收聽的其他歌曲產(chǎn)生絕對壓制,例如一首歌曲由于用戶喜歡或者誤操作(循環(huán)播放)試聽了 50次,那樣將會極大地影響到后續(xù)進(jìn)行歌曲推薦的結(jié)果,因此需要對該用戶行為數(shù)據(jù)進(jìn)行歸一化。歸一化的方法可參照下表,但不以此為限,其他歸一化方法也在本發(fā)明的公開范圍中。
編號I加權(quán)后的用戶行為值X 歸一值
~ O < X < 10χ/20
~210 < X < 100lgx/2
3X > 100 該加權(quán)后的用戶行為值X包括上述的對操作次數(shù)加權(quán)處理后的加權(quán)值。例如,當(dāng)上述歌曲《大?!返募訖?quán)值累加為3. 3,則其屬于編號I的O 10的范圍內(nèi),則歸一值為3. 3/20 = O. 0165。該歸一值視為對用戶行為數(shù)據(jù)附加的權(quán)重,特別是對于用戶行為數(shù)據(jù)中的歌曲標(biāo)簽附加了權(quán)重。
該用戶口味模型選擇模塊233,對該多個結(jié)果標(biāo)簽進(jìn)行排列組合,并調(diào)用相似度計算模塊22將該歸一化后的用戶行為數(shù)據(jù)依次與每種排列組合進(jìn)行多維相似度計算,根據(jù)該計算結(jié)果得到用戶口味,并從用戶口味中選取用戶口味模型。具體來說,承接上例,結(jié)果標(biāo)簽可能包括早晨、下午、搖滾、鄉(xiāng)村、中國、美國等。用戶口味模型選擇模塊233對所有的結(jié)果標(biāo)簽依照維度進(jìn)行排列組合。早晨、下午為同一維度,搖滾、鄉(xiāng)村為同一維度,中國、美國為同一維度,則每個維度選擇一個標(biāo)簽進(jìn)行排列組合,得到的結(jié)果例如為,早晨中國搖滾、下午中國搖滾、早晨美國鄉(xiāng)村等等。這樣,用戶口味可以以固定組合的方式出現(xiàn),更加貼近用戶的實際口味。同時,還可體現(xiàn)出用戶口味在一天中的變化,體現(xiàn)出口味與時間屬性的關(guān)聯(lián)關(guān)系。利用該歸一化后的用戶行為數(shù)據(jù)依次與每種排列組合進(jìn)行多維相似度計算。該歸一化后的用戶行為數(shù)據(jù)由標(biāo)簽組成,每種排列組合也由標(biāo)簽組成。二者之間的多維相似度計算可以采用余弦相似度算法,或者,用戶協(xié)同過濾算法。本領(lǐng)域的技術(shù)人員可以知道,余弦相似度算法是為了解決具有多維度屬性實體間的相似度而提出的計算模型。可以認(rèn)為兩個實體之間的相似度S是兩實體的多個維度的相似度乘以權(quán)重后的疊加。S = D1*S1+D2*S2+......+Dn*Sn(I)Sn為兩個實體在第n維度內(nèi)的相似度,Dn為第η維度的權(quán)重,Dn為預(yù)先設(shè)定。在同一維度內(nèi),任意兩個可選值之間都有確定的相似度。例如,在速度這一維度內(nèi),慢速、中速為不同的可選值,每個可選值都有預(yù)先設(shè)定的相似度賦值,這樣該維度內(nèi)任意兩個可選值之間的相似度可以通過對該相似度賦值的計算而得到。而該歸一化后的用戶行為數(shù)據(jù)與每種排列組合之間進(jìn)行的多維相似度計算,就是在分別計算每個維度內(nèi),屬于用戶行為數(shù)據(jù)的標(biāo)簽與屬于排列組合的標(biāo)簽之間的相似度Sn,并進(jìn)行公式(I)的累加計笪特別是,該歸一化后的用戶行為數(shù)據(jù)還包括該歸一值,其可視為在公式(I)的基礎(chǔ)上附加一權(quán)重值,即,S = (D1*S1+D2*S2+……+Dn*Sn)*歸一值。具體的說,該用戶口味模型選擇模塊233包括一用戶口味取得模塊2331,用于依照預(yù)定規(guī)則從該多維相似度計算的結(jié)果中進(jìn)行選擇,確定對應(yīng)的用戶口味,形成用戶口味
口 O該預(yù)定規(guī)則包括但不限于從該多維相似度計算的結(jié)果中,選取相似度大于預(yù)定值的結(jié)果,該結(jié)果所對應(yīng)的排列組合,視為用戶口味?;蛘?,對于多維相似度計算結(jié)果未超過預(yù)定值的排列組合,按照標(biāo)簽的維度進(jìn)行累加。即,計算任意兩個該多維相似度計算結(jié)果未超過預(yù)定值的排列組合中,在同一維度下的結(jié)果標(biāo)簽之間的相似度,對于相似度大于一閾值(例如O. 8)的兩個結(jié)果標(biāo)簽進(jìn)行合并,將合并后的結(jié)果標(biāo)簽重新進(jìn)行排列組合以進(jìn)行該多維相似度計算,如果結(jié)果大于該預(yù)定值,同樣認(rèn)定該合并后的結(jié)果標(biāo)簽所在的排列組合為用戶口味。例如,由于部分維度劃分很細(xì),造成無法達(dá)到門限的情況。用戶在流派這一維度上同時喜歡硬搖滾、慢搖滾、前衛(wèi)搖滾,通過上述聚類步驟可以得到硬搖滾、慢搖滾、前衛(wèi)搖滾這三個結(jié)果標(biāo)簽。但是按照這三個結(jié)果標(biāo)簽分別進(jìn)行多維相似度計算都不能達(dá)到該預(yù)定值??梢姡捎谟脩敉瑫r喜歡多種搖滾形式,其同時也分散了對搖滾的相似度計數(shù)。此時,計算硬搖滾、慢搖滾、前衛(wèi)搖滾之間的相似度,依照前述相似度計算規(guī)則,假設(shè)這三者的兩兩之間都超過了該閾值,則此時可將流派這一維度下的這三個結(jié)果標(biāo)簽進(jìn)行合并。即,針對該三個結(jié)果標(biāo)簽的用戶行為數(shù)據(jù)可合為一體,累計計算。將該三個結(jié)果標(biāo)簽視為一個整體進(jìn)行后續(xù)計算。由于將三個結(jié)果標(biāo)簽進(jìn)行了合并,則在進(jìn)行上述多維相似度計算時,對該三個結(jié)果標(biāo)簽分別與其他維度的結(jié)果標(biāo)簽進(jìn)行排列組合,并進(jìn)行與用戶行為數(shù)據(jù)之間的相似度計算,這三個結(jié)果標(biāo)簽的相似度計算值可以累加,其累加結(jié)果可能超過該預(yù)定值,則合并后的結(jié)果標(biāo)簽也可作為用戶口味,也就是說,這三個結(jié)果標(biāo)簽都視為用戶口味。用戶口味體現(xiàn)出了用戶操作行為的特點,可以據(jù)以直接為用戶推薦歌曲,或者,還可以從中精細(xì)挑選用戶口味模型。更進(jìn)一步的,本發(fā)明的該用戶口味模型選擇模塊233還可以包括一用戶口味模型取得模塊2332,用于從該已經(jīng)獲得的用戶口味中,依照預(yù)定規(guī)則挑取用于實際為用戶推薦歌曲的用戶口味模型。該用戶口味模型取得模塊2332所遵循的預(yù)定規(guī)則包括,依次判斷用戶口味集合中,每個用戶口味所對應(yīng)的歌曲數(shù)占總歌曲數(shù)的比例是否超過一預(yù)定值(例如30%),如果是,該用戶口味視為用戶口味模型。例如,早上美國鄉(xiāng)村為一用戶口味,判斷該用戶所操作過的歌曲中,具有早上美國鄉(xiāng)村這一標(biāo)簽的歌曲數(shù),占總歌曲數(shù)的比例是否超過預(yù)定值,如果超過,代表該類型歌曲較多,該用戶口味可以作為用戶口味模型?;蛘撸谝呀?jīng)獲取的用戶口味中,依次統(tǒng)計同一維度內(nèi)每種結(jié)果標(biāo)簽所對應(yīng)的歌曲占總歌曲數(shù)的比例,如果該比例超過一比例閾值,,則該結(jié)果標(biāo)簽成為用戶口味模型。S卩,在已經(jīng)獲取的用戶口味的范圍內(nèi),針對例如地區(qū)、主題、流派等維度,逐個維度進(jìn)行判斷。例如,在流派維度內(nèi),如果具有流行的標(biāo)簽的歌曲占歌曲總數(shù)的20%,搖滾占45%,古典占20%,民族占15%。而該比例閾值例如設(shè)定為30%,按照上述規(guī)則,搖滾(45% )超過該比例閾值,則搖滾成為用戶在流派緯度上的口味模型?;蛘?,該用戶口味模型取得模塊2332,對于全部m個用戶口味,進(jìn)一步對每個該用戶口味依照其對應(yīng)的歌曲數(shù)進(jìn)行排序,排序的前η個用戶口味所對應(yīng)的歌曲總數(shù)占總歌曲數(shù)的比例為C,當(dāng)c/(n/m) > 4時,前η個用戶口味視為用戶口味模型;或者,該用戶口味模型取得模塊2332將所有的用戶口味直接作為用戶口味模型。用戶口味模型取得模塊2332更進(jìn)一步實現(xiàn)了從眾多用戶口味中挑選出更加符合用戶操作傾向性,更貼合用戶需求的用戶口味模型,以提高推薦的準(zhǔn)確性。該推薦過濾模塊24,根據(jù)該用戶口味發(fā)現(xiàn)模塊23提供的用戶口味或者該用戶口味模型,從音樂推薦服務(wù)器所存儲的大量歌曲中,選擇符合該用戶口味或者該用戶口味模型的歌曲,推薦給用戶?;谝陨厦枋?,本發(fā)明的個性化音樂推薦方法的流程示意圖如圖IB所示步驟101,音樂推薦服務(wù)器根據(jù)用戶終端針對歌曲的操作生成用戶行為數(shù)據(jù),該用戶行為數(shù)據(jù)至少包括操作時間標(biāo)簽、操作次數(shù)標(biāo)簽和歌曲標(biāo)簽;
步驟102,對該用戶行為數(shù)據(jù)進(jìn)行聚類計算,得到多個結(jié)果標(biāo)簽;步驟103,對該用戶行為數(shù)據(jù)的操作次數(shù)依據(jù)其所處時段進(jìn)行加權(quán)處理,越臨近當(dāng)前時刻的時段權(quán)重越高;步驟104,針對加權(quán)處理后的該用戶行為數(shù)據(jù)進(jìn)行歸一化處理;步驟105,對該多個結(jié)果標(biāo)簽進(jìn)行排列組合,將該歸一化后的用戶行為數(shù)據(jù)依次與每種排列組合進(jìn)行多維相似度計算,根據(jù)該計算結(jié)果得到用戶口味,并從用戶口味中選取用戶口味模型;步驟106,音樂推薦服務(wù)器根據(jù)該用戶口味模型,為用戶終端推薦歌曲。圖3A所示為本發(fā)明的個性化音樂推薦系統(tǒng)的結(jié)構(gòu)示意圖,圖3B所示為本發(fā)明的個性化音樂推薦方法的流程示意圖。在用戶口味發(fā)現(xiàn)模塊23中進(jìn)一步包括一用戶行為數(shù)據(jù)過濾模塊234。對應(yīng)于在步驟102與103之間執(zhí)行一依照預(yù)定規(guī)則對用戶行為數(shù)據(jù)進(jìn)行刪除的步驟(步驟1021)。用于從當(dāng)前收集的用戶行為數(shù)據(jù)中過濾掉噪聲。步驟1021,對于用戶終端針對歌曲的操作方式為播放,且操作次數(shù)少于預(yù)定次數(shù)的歌曲,視為噪聲,刪除該歌曲對應(yīng)的用戶行為數(shù)據(jù),或者,對應(yīng)該結(jié)果標(biāo)簽的歌曲數(shù)量少于預(yù)定數(shù)量,視為噪聲,刪除對應(yīng)該結(jié)果標(biāo)簽的用戶行為數(shù)據(jù),或者,由于人不可能同時包括有較大差異的多種口味,當(dāng)該結(jié)果標(biāo)簽中的一個與其他結(jié)果標(biāo)簽的相似度小于預(yù)定值時(差異較大),則認(rèn)為該結(jié)果標(biāo)簽是用戶的誤操作,刪除對應(yīng)該結(jié)果標(biāo)簽的用戶行為數(shù)據(jù),不對其進(jìn)行后續(xù)操作,不將其作為發(fā)現(xiàn)用戶口味的基礎(chǔ)。另外,步驟102-105每隔第一預(yù)定時間循環(huán)依次執(zhí)行。由于用戶不定時執(zhí)行對歌曲的操作,因此,步驟101為不定時執(zhí)行。步驟102-105每隔特定時間循環(huán)執(zhí)行可以不斷收集用戶行為數(shù)據(jù),通過加權(quán)計算從中分析出用戶長時間與短時間內(nèi)的口味變化,并最終體現(xiàn)在自動選取出的用戶口味模型中,以提高為用戶推薦音樂的準(zhǔn)確度。并在用戶不定時登陸時,執(zhí)行步驟106,最終實現(xiàn)推薦。請參閱圖4A、4B所示為本發(fā)明的個性化音樂推薦系統(tǒng)的結(jié)構(gòu)示意圖。圖4C所示為本發(fā)明的個性化音樂推薦方法的流程示意圖。音樂推薦服務(wù)器2中還可進(jìn)一步包括一模型訓(xùn)練演進(jìn)模塊25。該模型訓(xùn)練演進(jìn)模塊25用于根據(jù)不斷累積的用戶歷史數(shù)據(jù),自動對用戶口味模型做進(jìn)一步的精確調(diào)整,以無限接近用戶的喜好,提高后續(xù)音樂推薦與用戶需求的匹配度。其對應(yīng)的步驟執(zhí)行于步驟105、106 之間。模型訓(xùn)練演進(jìn)模塊25進(jìn)一步包括權(quán)重調(diào)整模塊251以及模型調(diào)整模塊252。權(quán)重調(diào)整模塊251針對當(dāng)前所生成的該用戶行為數(shù)據(jù),計算各維度的標(biāo)簽的聚集比例,根據(jù)該聚集比例調(diào)整該維度的標(biāo)簽在計算相似度時的權(quán)重Sn,聚集比例越高,權(quán)重值越高(步驟1051),則在下一次循環(huán)執(zhí)行步驟102、105時,將采用調(diào)整后的權(quán)重進(jìn)行計算,則在后續(xù)選出的用戶口味中進(jìn)一步突出。關(guān)于聚集比例的計算,其針對每個維度分別進(jìn)行。以流派維度為例,對預(yù)定時間段內(nèi)的用戶行為數(shù)據(jù)涉及的流派進(jìn)行累計,發(fā)現(xiàn)在此預(yù)定時間段內(nèi)用戶行為數(shù)據(jù)共涉及N種流派,根據(jù)經(jīng)驗值n%,計算得到一經(jīng)驗數(shù)據(jù)N*n%。對截止到目前每種流派的試聽次數(shù)進(jìn)行累計,對試聽次數(shù)進(jìn)行排序,提取排序的 前N*n%種流派,對前N*n%種流派的試聽次數(shù)進(jìn)行加總得到一加總數(shù)據(jù),計算該加總數(shù)據(jù)在總試聽數(shù)中所占比例,該比例就是流派這一維度的聚集比例。
例如,m為流派這一維度的聚集比例,則該流派維度的權(quán)重為Sn = m/0. 2。模型調(diào)整模塊252根據(jù)歷史用戶行為數(shù)據(jù)或用戶終端針對音樂推薦服務(wù)器推薦的歌曲的反饋操作,依照預(yù)定規(guī)則調(diào)整該用戶口味模型(步驟1052)。g卩,為后續(xù)的推薦操作,做更精確的符合用戶個人習(xí)慣的調(diào)整。步驟1052的預(yù)定規(guī)則包括A、計算不同時間同一用戶的用戶口味,發(fā)現(xiàn)用戶是否在不同時間具有不同的用戶口味,如果有,在該步驟106中根據(jù)時間使用不同的用戶口味模型進(jìn)行推薦;和/或B、計算用戶行為數(shù)據(jù)中,操作方式為播放,標(biāo)簽為流行的歌曲數(shù)占所有操作方式為播放的歌曲總數(shù)的比例,作為用戶口味模型的流行追隨度;和/或C、計算用戶行為數(shù)據(jù)中,針對步驟106所推薦的全部歌曲,進(jìn)行播放的操作方式的比例,作為用戶口味模型的新事物接受度。 D、該預(yù)定規(guī)則覆蓋了用戶在各個方面的收聽習(xí)慣因素,其他具體規(guī)則也在本發(fā)明的公開范圍之內(nèi)。其中,對于預(yù)定規(guī)則A,本發(fā)明劃分了不同的時間段,例如7-9點為一時間段,9-18、18-19、19-7各為一時間段。其他時間分段也在本發(fā)明的公開范圍內(nèi)。首先在各個時間段內(nèi)分別依照上述方法計算用戶口味,也就是說,分別收集這四個時間段中的用戶行為數(shù)據(jù),依照圖IB的方法針對這四個時間段分別收集到的用戶行為數(shù)據(jù),分別進(jìn)行用戶口味的計算。對于計算出的各個時間段的用戶口味,兩兩進(jìn)行重合度或者相似度計算,如果兩個時間段間的重合度或相似度小于門限(例如50%),視為用戶在這兩個時間段中的口味差異較大,則認(rèn)定用戶在不同時間段需要采用不同的用戶口味模型進(jìn)行推薦。S卩,如果差異較大,則利用每個時間段的用戶口味作為用戶口味模型,進(jìn)行推薦。如果差異不大,可利用任一時間段的用戶口味作為用戶口味模型,進(jìn)行推薦。使得為用戶推薦的歌曲更加符合用戶在當(dāng)時這一時刻的需求。步驟1051、1052每隔第二預(yù)定時間循環(huán)執(zhí)行一次,第二預(yù)定時間大于等于第一預(yù)定時間。推薦過濾模塊24執(zhí)行的步驟106可進(jìn)一步執(zhí)行以下步驟步驟1061,根據(jù)該用戶口味模型,計算音樂推薦服務(wù)器的數(shù)據(jù)庫中所有歌曲與該用戶口味模型的相似度;步驟1062,依照預(yù)定的推薦控制策略,從相似度高于預(yù)定值的歌曲中選擇推薦歌曲。該推薦控制策略進(jìn)一步包括根據(jù)用戶終端的訪問時間,選擇與該訪問時間對應(yīng)的用戶口味模型所對應(yīng)的歌曲;和/或根據(jù)該流行追隨度,控制推薦歌曲中流行歌曲的比例;和/或根據(jù)該新事物接受度,控制推薦歌曲中與用戶已播放過的歌曲的相似度,該新事物接受度越高,該相似度越低;和/或根據(jù)預(yù)設(shè)的特殊事件/時間點,推薦對應(yīng)的歌曲(例如,在國慶節(jié)當(dāng)天或臨近幾天內(nèi),推薦《我愛我的祖國》等歌曲);和/或
根據(jù)預(yù)設(shè)的歌曲音質(zhì)要求,推薦符合對應(yīng)音質(zhì)要求的歌曲。該推薦控制策略將結(jié)合步驟1052的預(yù)定規(guī)則中涉及的調(diào)整因素,具體選擇推薦內(nèi)容。另外,該推薦控制策略還包括根據(jù)用戶終端的設(shè)備類型(同一用戶每次利用不同用戶設(shè)備(手機、音響、電腦)登錄音樂推薦服務(wù)器2時,均提供當(dāng)前設(shè)備型號),基于用戶針對當(dāng)前設(shè)備類型的口味,推薦相關(guān)歌曲。另外,本發(fā)明中計算得到的每個用戶的用戶口味模型還可用于區(qū)分用戶群以及為一用戶尋找好友。當(dāng)不同用戶的用戶口味模型的相似度大于預(yù)定值時,可將該不同用戶劃分至同一群,或者,推薦該不同用戶互為好友?;蛘?,利用用戶口味模型之間的相似度作為 用戶之間的距離,按照距離進(jìn)行聚類計算。根據(jù)聚類計算的結(jié)果劃分用戶群,或,為用戶推薦好友。基于以上技術(shù)方案,本發(fā)明實現(xiàn)的技術(shù)效果在于,發(fā)掘用戶口味,并體現(xiàn)出與時間相關(guān)聯(lián)的用戶口味,能夠體現(xiàn)出口味組合,提高所發(fā)掘的用戶口味的準(zhǔn)確度。并自適應(yīng)的根據(jù)用戶對推薦內(nèi)容的反饋數(shù)據(jù)調(diào)整推薦策略與內(nèi)容。上述為本發(fā)明的具體實施例,并不用于限定本發(fā)明的保護(hù)范圍,具體保護(hù)范圍以后續(xù)權(quán)利要求為準(zhǔn)。
權(quán)利要求
1.一種個性化音樂推薦方法,應(yīng)用于音樂推薦服務(wù)器中,其特征在于,包括如下步驟 步驟1,音樂推薦服務(wù)器根據(jù)用戶終端針對歌曲的操作生成用戶行為數(shù)據(jù),該用戶行為數(shù)據(jù)包括操作時間標(biāo)簽、操作次數(shù)標(biāo)簽和歌曲標(biāo)簽; 步驟2,對該用戶行為數(shù)據(jù)進(jìn)行聚類計算,得到多個結(jié)果標(biāo)簽; 步驟3,對該用戶行為數(shù)據(jù)的操作次數(shù)依據(jù)其所處時段進(jìn)行加權(quán)處理,越臨近當(dāng)前時刻的時段權(quán)重越高; 步驟4,針對加權(quán)處理后的該用戶行為數(shù)據(jù)進(jìn)行歸一化處理; 步驟5,對該多個結(jié)果標(biāo)簽進(jìn)行排列組合,將該歸一化后的用戶行為數(shù)據(jù)依次與每種排列組合進(jìn)行多維相似度計算,根據(jù)該計算結(jié)果得到用戶口味,并從用戶口味中選取用戶口味模型; 步驟6,音樂推薦服務(wù)器根據(jù)該用戶口味模型,為用戶終端推薦歌曲。
2.如權(quán)利要求I所述的方法,其特征在于,該操作次數(shù)標(biāo)簽包括正向操作的次數(shù)以及反向操作的次數(shù)。
3.如權(quán)利要求I所述的方法,其特征在于,步驟3的加權(quán)處理包括操作次數(shù)*時段權(quán)重系數(shù),或者,操作次數(shù)*時段權(quán)重系數(shù)2。
4.如權(quán)利要求I所述的方法,其特征在于,步驟2、3之間還包括步驟21,根據(jù)預(yù)定規(guī)則對該用戶行為數(shù)據(jù)進(jìn)行刪除。
5.如權(quán)利要求4所述的方法,其特征在于,該預(yù)定規(guī)則包括對于用戶終端針對歌曲的操作方式為播放,且操作次數(shù)少于預(yù)定次數(shù)的歌曲,刪除該歌曲對應(yīng)的用戶行為數(shù)據(jù),或者,對應(yīng)該結(jié)果標(biāo)簽的歌曲數(shù)量少于預(yù)定數(shù)量,刪除對應(yīng)該結(jié)果標(biāo)簽的用戶行為數(shù)據(jù),或者,當(dāng)該結(jié)果標(biāo)簽中的一個與其他結(jié)果標(biāo)簽的相似度小于預(yù)定值時,刪除對應(yīng)該結(jié)果標(biāo)簽的用戶行為數(shù)據(jù)。
6.如權(quán)利要求I所述的方法,其特征在于,步驟5中根據(jù)該計算結(jié)果得到用戶口味的步驟進(jìn)一步包括 對于相似度計算結(jié)果超過預(yù)定值的排列組合,視為用戶口味;或者, 對于相似度計算結(jié)果未超過預(yù)定值的排列組合,計算不同排列組合在同一維度下的不同結(jié)果標(biāo)簽之間的相似度,對于相似度大于預(yù)定值的結(jié)果標(biāo)簽進(jìn)行合并,合并后的結(jié)果標(biāo)簽執(zhí)行該步驟5,如多維相似度計算結(jié)果超過預(yù)定值,將該合并后的結(jié)果標(biāo)簽所在的排列組合視為用戶口味。
7.如權(quán)利要求I或6所述的方法,其特征在于,該步驟5的從該用戶口味中選取用戶口味模型的步驟進(jìn)一步包括 判斷對應(yīng)一該用戶口味的歌曲數(shù)占總歌曲數(shù)的比例是否超過一預(yù)定值,如果是,該用戶口味視為用戶口味模型;或者 依次判斷對應(yīng)該用戶口味中同一維度標(biāo)簽的每種結(jié)果標(biāo)簽對應(yīng)的歌曲數(shù)占總歌曲數(shù)的比例是否超過一預(yù)定值,如果是,該結(jié)果標(biāo)簽視為用戶口味模型;或者 對于全部m個用戶口味,進(jìn)一步對每個該用戶口味依照其對應(yīng)的歌曲數(shù)進(jìn)行排序,排序的前η個用戶口味所對應(yīng)的歌曲總數(shù)占總歌曲數(shù)的比例為C,當(dāng)c/(n/m) > 4時,前η個用戶口味視為用戶口味模型;或者 將全部用戶口味直接視為用戶口味模型。
8.如權(quán)利要求I所述的方法,其特征在于,該相似度計算采用余弦相似度算法或用戶協(xié)同過濾算法,該聚類算法也采用余弦相似度算法。
9.如權(quán)利要求I所述的方法,其特征在于,步驟2之后還包括,每隔第一預(yù)定時間,循環(huán)執(zhí)行步驟2-5,該步驟2包括對當(dāng)前已生成的全部用戶行為數(shù)據(jù)進(jìn)行聚類計算。
10.如權(quán)利要求9所述的方法,其特征在于,步驟5、6之間進(jìn)一步包括,每隔第二預(yù)定時間,第二預(yù)定時間大于等于第一預(yù)定時間,循環(huán)執(zhí)行以下步驟 針對該用戶行為數(shù)據(jù),計算各維度的標(biāo)簽的聚集比例,根據(jù)該聚集比例調(diào)整該維度的標(biāo)簽在計算相似度時的權(quán)重,聚集比例越高,權(quán)重值越高; 根據(jù)歷史用戶行為數(shù)據(jù)或用戶終端針對音樂推薦服務(wù)器推薦的歌曲的反饋操作,依照預(yù)定規(guī)則調(diào)整該用戶口味模型。
11.如權(quán)利要求10所述的方法,其特征在于,該根據(jù)該聚集比例調(diào)整該維度的標(biāo)簽在計算相似度時的權(quán)重的步驟進(jìn)一步包括 該權(quán)重為聚集比例/0. 2。
12.如權(quán)利要求10所述的方法,其特征在于,該根據(jù)歷史用戶行為數(shù)據(jù)或用戶終端針對音樂推薦服務(wù)器推薦的歌曲的反饋操作,依照預(yù)定規(guī)則調(diào)整該用戶口味模型的步驟進(jìn)一步包括 計算不同時間同一用戶的用戶口味,發(fā)現(xiàn)用戶是否在不同時間具有不同的用戶口味,如果有在該步驟6中根據(jù)時間使用不同的用戶口味模型進(jìn)行推薦;和/或 計算用戶行為數(shù)據(jù)中,操作方式為播放,標(biāo)簽為流行的歌曲數(shù)占所有操作方式為播放的歌曲總數(shù)的比例,作為流行追隨度;和/或 計算用戶行為數(shù)據(jù)中,針對步驟6所推薦的全部歌曲,進(jìn)行播放的操作方式的比例,作為新事物接受度。
13.如權(quán)利要求12所述的方法,其特征在于,該步驟6進(jìn)一步包括 根據(jù)該用戶口味模型,計算數(shù)據(jù)庫中所有歌曲與該用戶口味模型的相似度; 依照預(yù)定的推薦控制策略,從相似度高于預(yù)定值的歌曲中選擇推薦歌曲。
14.如權(quán)利要求12所述的方法,其特征在于,該依照預(yù)定的推薦控制策略,從相似度高于預(yù)定值的歌曲中選擇推薦歌曲的步驟進(jìn)一步包括 根據(jù)用戶終端的訪問時間,選擇與該訪問時間對應(yīng)的用戶口味模型所對應(yīng)的歌曲;和/或 根據(jù)該流行追隨度,控制推薦歌曲中流行歌曲的比例;和/或根據(jù)該新事物接受度,控制推薦歌曲中與用戶已播放過的歌曲的相似度,該新事物接受度越高,該相似度越低;和/或 根據(jù)預(yù)設(shè)的特殊事件/時間點,推薦對應(yīng)的歌曲;和/或 根據(jù)預(yù)設(shè)的歌曲音質(zhì)要求,推薦符合對應(yīng)音質(zhì)要求的歌曲;和/或 根據(jù)用戶終端的型號,依據(jù)與該用戶終端型號相關(guān)的用戶口味模型進(jìn)行推薦。
15.一種個性化音樂推薦服務(wù)系統(tǒng),包括音樂推薦服務(wù)器與至少一用戶終端,其特征在于,該音樂推薦服務(wù)器包括 用戶數(shù)據(jù)存儲管理模塊,用于接收用戶終端針對歌曲進(jìn)行的操作數(shù)據(jù),并據(jù)以生成用戶行為數(shù)據(jù),該用戶行為數(shù)據(jù)包括操作時間標(biāo)簽、操作次數(shù)標(biāo)簽和歌曲標(biāo)簽;相似度計算模塊,基于相似度計算對該用戶行為數(shù)據(jù)進(jìn)行聚類計算,得到多個結(jié)果標(biāo)簽; 用戶口味發(fā)現(xiàn)模塊,包括加權(quán)處理模塊、歸一化模塊以及用戶口味模型選擇模塊,該加權(quán)處理模塊用于對該用戶行為數(shù)據(jù)的操作次數(shù)依據(jù)其所處時段進(jìn)行加權(quán)處理,越臨近當(dāng)前時刻的時段權(quán)重越高,該歸一化模塊用于針對加權(quán)處理后的該用戶行為數(shù)據(jù)進(jìn)行歸一化處理,該用戶口味模型選擇模塊用于對該多個結(jié)果標(biāo)簽進(jìn)行排列組合,調(diào)用該相似度計算模塊將該歸一化后的用戶行為數(shù)據(jù)依次與每種排列組合進(jìn)行多維相似度計算,根據(jù)該計算結(jié)果得到用戶口味,并從用戶口味中選取用戶口味模型; 推薦過濾模塊,用于根據(jù)該用戶口味模型,為用戶終端推薦歌曲。
16.如權(quán)利要求15所述的系統(tǒng),其特征在于,該操作次數(shù)標(biāo)簽包括正向操作的次數(shù)以及反向操作的次數(shù)。
17.如權(quán)利要求15所述的系統(tǒng),其特征在于,該用戶口味發(fā)現(xiàn)模塊的加權(quán)處理包括操作次數(shù)*時段權(quán)重系數(shù),或者,操作次數(shù)*時段權(quán)重系數(shù)2。
18.如權(quán)利要求15所述的系統(tǒng),其特征在于,該用戶口味發(fā)現(xiàn)模塊還包括一用戶行為數(shù)據(jù)過濾模塊,該用戶行為數(shù)據(jù)過濾模塊根據(jù)預(yù)定規(guī)則對該用戶行為數(shù)據(jù)進(jìn)行刪除,該預(yù)定規(guī)則包括對于用戶終端針對歌曲的操作方式為播放,且操作次數(shù)少于預(yù)定次數(shù)的歌曲,刪除該歌曲對應(yīng)的用戶行為數(shù)據(jù),或者,對應(yīng)該結(jié)果標(biāo)簽的歌曲數(shù)量少于預(yù)定數(shù)量,刪除對應(yīng)該結(jié)果標(biāo)簽的用戶行為數(shù)據(jù),或者,當(dāng)該結(jié)果標(biāo)簽中的一個與其他結(jié)果標(biāo)簽的相似度小于預(yù)定值時,刪除對應(yīng)該結(jié)果標(biāo)簽的用戶行為數(shù)據(jù)。
19.如權(quán)利要求15所述的系統(tǒng),其特征在于,該用戶口味模型選擇模塊還包括一用戶口味取得模塊,用于從調(diào)用該相似度計算模塊將該歸一化后的用戶行為數(shù)據(jù)依次與每種排列組合進(jìn)行多維相似度計算后的結(jié)果中取得對應(yīng)的用戶口味; 其中,對于相似度計算結(jié)果超過預(yù)定值的排列組合,視為用戶口味;或者, 對于相似度計算結(jié)果未超過預(yù)定值的排列組合,計算不同排列組合在同一維度下的不同結(jié)果標(biāo)簽之間的相似度,對于相似度大于預(yù)定值的結(jié)果標(biāo)簽進(jìn)行合并,將合并后的結(jié)果標(biāo)簽發(fā)送至該用戶口味模型選擇模塊,如多維相似度計算結(jié)果超過預(yù)定值,將該合并后的結(jié)果標(biāo)簽所在的排列組合視為用戶口味。
20.如權(quán)利要求15或19所述的系統(tǒng),其特征在于,該用戶口味模型選擇模塊還包括一用戶口味模型取得模塊,用于從用戶口味中選取用戶口味模型; 其中,判斷對應(yīng)該用戶口味的歌曲數(shù)占總歌曲數(shù)的比例是否超過一預(yù)定值,如果是,該用戶口味視為用戶口味模型;或者 依次判斷對應(yīng)該用戶口味中同一維度標(biāo)簽的每種結(jié)果標(biāo)簽對應(yīng)的歌曲數(shù)占總歌曲數(shù)的比例是否超過一預(yù)定值,如果是,該結(jié)果標(biāo)簽視為用戶口味模型;或者 對于全部m個用戶口味,進(jìn)一步對每個該用戶口味依照其對應(yīng)的歌曲數(shù)進(jìn)行排序,排序的前η個用戶口味所對應(yīng)的歌曲總數(shù)占總歌曲數(shù)的比例為C,當(dāng)c/(n/m) > 4時,前η個用戶口味視為用戶口味模型;或者 將全部用戶口味直接視為用戶口味模型。
21.如權(quán)利要求15所述的系統(tǒng),其特征在于,該相似度計算采用余弦相似度算法或用戶協(xié)同過濾算法,該聚類算法也采用余弦相似度算法。
22.如權(quán)利要求21所述的系統(tǒng),其特征在于,該系統(tǒng)還包括一模型訓(xùn)練演進(jìn)模塊,該模型訓(xùn)練演進(jìn)模塊包括一權(quán)重調(diào)整模塊以及一模型調(diào)整模塊,該權(quán)重調(diào)整模塊用于針對該用戶行為數(shù)據(jù),計算各維度的標(biāo)簽的聚集比例,根據(jù)該聚集比例調(diào)整該維度的標(biāo)簽在相似度計算模塊中計算相似度時的權(quán)重,聚集比例越高,權(quán)重值越高,該模型調(diào)整模塊用于根據(jù)歷史用戶行為數(shù)據(jù)或用戶終端針對音樂推薦服務(wù)器推薦的歌曲的反饋操作,根據(jù)預(yù)定規(guī)則調(diào)整該用戶口味模型。
23.如權(quán)利要求22所述的系統(tǒng),其特征在于,該預(yù)定規(guī)則包括 該權(quán)重調(diào)整模塊計算不同時間同一用戶的用戶口味,發(fā)現(xiàn)用戶是否在不同時間具有不同的用戶口味,如果有,在該推薦過濾模塊中根據(jù)時間使用不同的用戶口味模型進(jìn)行推薦;和/或 該權(quán)重調(diào)整模塊計算用戶行為數(shù)據(jù)中,操作方式為播放,標(biāo)簽為流行的歌曲數(shù)占所有操作方式為播放的歌曲總數(shù)的比例,作為流行追隨度;和/或 該權(quán)重調(diào)整模塊計算用戶行為數(shù)據(jù)中,針對該推薦過濾模塊所推薦的全部歌曲,進(jìn)行播放的操作方式的比例,作為新事物接受度。
24.如權(quán)利要求23所述的系統(tǒng),其特征在于,該推薦過濾模塊調(diào)用該相似度計算模塊計算數(shù)據(jù)庫中所有歌曲與該用戶口味模型的相似度,并依照預(yù)定的推薦控制策略,從相似度高于預(yù)定值的歌曲中選擇推薦歌曲。
25.如權(quán)利要求23所述的系統(tǒng),其特征在于,該預(yù)定的推薦控制策略進(jìn)一步包括 根據(jù)用戶終端的訪問時間,選擇與該訪問時間對應(yīng)的用戶口味模型所對應(yīng)的歌曲;和/或 根據(jù)該流行追隨度,控制推薦歌曲中流行歌曲的比例;和/或根據(jù)該新事物接受度,控制推薦歌曲中與用戶已播放的歌曲的相似度,該新事物接受度越高,該相似度越低;和/或 根據(jù)預(yù)設(shè)的特殊事件/時間點,推薦對應(yīng)的歌曲;和/或 根據(jù)預(yù)設(shè)的歌曲音質(zhì)要求,推薦符合對應(yīng)音質(zhì)要求的歌曲;和/或 根據(jù)用戶終端的型號,依據(jù)與該用戶終端型號相關(guān)的用戶口味模型進(jìn)行推薦。
全文摘要
本發(fā)明公開了一種個性化音樂推薦方法及系統(tǒng),該方法包括步驟1,音樂推薦服務(wù)器根據(jù)用戶終端針對歌曲的操作生成用戶行為數(shù)據(jù),該用戶行為數(shù)據(jù)包括操作時間標(biāo)簽、操作次數(shù)標(biāo)簽和歌曲標(biāo)簽;步驟2,對該用戶行為數(shù)據(jù)進(jìn)行聚類計算,得到多個結(jié)果標(biāo)簽;步驟3,對該用戶行為數(shù)據(jù)的操作次數(shù)依據(jù)其所處時段進(jìn)行加權(quán)處理,越臨近當(dāng)前時刻的時段權(quán)重越高;步驟4,針對加權(quán)處理后的該用戶行為數(shù)據(jù)進(jìn)行歸一化處理;步驟5,對該多個結(jié)果標(biāo)簽進(jìn)行排列組合將該歸一化后的用戶行為數(shù)據(jù)依次與每種排列組合進(jìn)行相似度計算,根據(jù)該計算結(jié)果得到用戶口味,并從用戶口味中選取用戶口味模型;步驟6,音樂推薦服務(wù)器根據(jù)該用戶口味模型,為用戶終端推薦歌曲。
文檔編號G06F17/30GK102654860SQ20111004882
公開日2012年9月5日 申請日期2011年3月1日 優(yōu)先權(quán)日2011年3月1日
發(fā)明者奉佑生, 孫武, 石建平, 趙凌 申請人:北京彩云在線技術(shù)開發(fā)有限公司