一種基于用戶特征及其信任度的協(xié)同過濾推薦方法
【專利摘要】本發(fā)明公開了一種基于用戶特征及其信任度的協(xié)同過濾推薦方法,根據(jù)用戶對項(xiàng)目的歷史評分和特征分別計(jì)算用戶之間的相似度;選取適當(dāng)權(quán)值將兩種相似度結(jié)合得到用戶之間最終相似度;根據(jù)KNN(kNearestNeighbors,K最臨近方法)方法計(jì)算用戶最近鄰;將用戶歷史評分的數(shù)量作為信任度,利用用戶最近鄰矩陣和加入信任度的預(yù)測公式計(jì)算推薦結(jié)果。
【專利說明】一種基于用戶特征及其信任度的協(xié)同過濾推薦方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及一種基于特征用戶及其信任度的協(xié)同過濾推薦方法,在協(xié)同過濾的基礎(chǔ)上引入用戶特征和用戶信任度,以緩解傳統(tǒng)協(xié)同過濾推薦算法的冷啟動(dòng)問題及數(shù)據(jù)稀疏性問題,進(jìn)一步提高推薦精度,屬于個(gè)性化推薦技術(shù)研究的領(lǐng)域。
【背景技術(shù)】
[0002]隨著互聯(lián)網(wǎng)的飛速發(fā)展,互聯(lián)網(wǎng)信息海量增長,帶來的問題正是用戶難以及時(shí)準(zhǔn)確地找到自身需要的信息,用戶需要可以根據(jù)自身特點(diǎn)組織協(xié)調(diào)信息的解決方案,個(gè)性化推薦技術(shù)應(yīng)運(yùn)而生。
[0003]目前,在個(gè)性化推薦技術(shù)中,比較常用的推薦算法有2種:基于內(nèi)容的推薦和協(xié)同過濾推薦?;趦?nèi)容的推薦算法是假定用戶的興趣不變,根據(jù)用戶以往的數(shù)據(jù)來構(gòu)造出用戶喜歡項(xiàng)目的特征,然后根據(jù)用戶數(shù)據(jù)特征與內(nèi)容特征的擬合,向用戶推薦項(xiàng)目。協(xié)同過濾源于“集體智慧”的思想,利用當(dāng)前用戶或者其他用戶對部分項(xiàng)目的已知偏好數(shù)據(jù)來預(yù)測當(dāng)前用戶對其他項(xiàng)目的潛在偏好,或者利用部分用戶對當(dāng)前項(xiàng)目或者其他項(xiàng)目的已知偏好數(shù)據(jù)來預(yù)測其他用戶對當(dāng)前項(xiàng)目的潛在偏好。
[0004]協(xié)同過濾是現(xiàn)今推薦系統(tǒng)中應(yīng)用最為成熟的一個(gè)推薦算法系類,它利用興趣相投、擁有共同經(jīng)驗(yàn)之群體的喜好來推薦使用者感興趣的資訊,個(gè)人透過合作的機(jī)制給予資訊相當(dāng)程度的回應(yīng)并記錄下來以達(dá)到過濾的目的進(jìn)而幫助別人篩選資訊。但其缺陷也很明顯:推薦品質(zhì)取決于歷史資料,對于新用戶或新項(xiàng)目系統(tǒng)開始時(shí)推薦品質(zhì)較差或無法推薦一一冷啟動(dòng)問題;系統(tǒng)歷史數(shù)據(jù)過少時(shí),難以進(jìn)行精確的模式查找匹配推薦——數(shù)據(jù)稀疏性問題;新增用戶或項(xiàng)目時(shí),系統(tǒng)需要增加計(jì)算負(fù)荷量大——擴(kuò)展性問題。
[0005]協(xié)同過濾推薦算法依賴系統(tǒng)內(nèi)的其他用戶,其他用戶就是未來提供推薦的合作伙伴,用戶接受合作伙伴的建議,是基于對對方的一種信任,并且認(rèn)為會(huì)從中獲益,支持協(xié)同過濾算法的原理就是一種信任機(jī)制。但傳統(tǒng)的協(xié)同過濾推薦算法并沒有考慮不同用戶之間的信任程度的問題。
【發(fā)明內(nèi)容】
[0006]本發(fā)明目的是提出一種基于特征用戶和用戶信任度的協(xié)同過濾推薦方法,在協(xié)同過濾的基礎(chǔ)上引入用戶特征及其信任度對協(xié)同過傳統(tǒng)濾推薦算法進(jìn)行改進(jìn),通過引入用戶特征緩解傳統(tǒng)協(xié)同過濾推薦算法中的冷啟動(dòng)問題和數(shù)據(jù)稀疏性問題(利用用戶的特征計(jì)算便可脫離對歷史數(shù)據(jù)的依賴)以及通過引入用戶信任度來進(jìn)一步提高推薦精度。
[0007]為實(shí)現(xiàn)上述發(fā)明目的,本發(fā)明采取如下技術(shù)方案:一種基于用戶特征及其信任度的協(xié)同過濾推薦方法,其特征在于:在協(xié)同過濾的基礎(chǔ)上引入用戶特征和用戶信任度對協(xié)同過傳統(tǒng)濾推薦算法進(jìn)行改進(jìn),在計(jì)算相似度時(shí)結(jié)合評分?jǐn)?shù)據(jù)和用戶特征因素,并在生成推薦時(shí)加入用戶信任度,包括如下步驟:
[0008]步驟1,獲取用戶的歷史評分?jǐn)?shù)據(jù)和用戶特征信息;[0009]步驟2,在歷史評分?jǐn)?shù)據(jù)上利用Pearson相關(guān)系數(shù)公式,在用戶特征數(shù)據(jù)上利用歐氏距離公式,分別構(gòu)造基于用戶評分的用戶相似度矩陣SimUserl (x, y)和基于用戶特征的相似度矩陣SimUser2 (x, y):
[0010][0011]
【權(quán)利要求】
1.一種基于用戶特征和用戶信任度的協(xié)同過濾推薦方法,其特征在于:在協(xié)同過濾的基礎(chǔ)上引入用戶特征和用戶信任度對協(xié)同過傳統(tǒng)濾推薦算法進(jìn)行改進(jìn),在計(jì)算相似度時(shí)結(jié)合評分?jǐn)?shù)據(jù)和用戶特征因素,并在生成推薦時(shí)加入用戶信任度,包括如下步驟: 步驟1,獲取用戶的歷史評分?jǐn)?shù)據(jù)和用戶特征信息; 步驟2,在歷史評分?jǐn)?shù)據(jù)上利用Pearson相關(guān)系數(shù)公式,在用戶特征數(shù)據(jù)上利用歐氏距離公式,分別構(gòu)造基于用戶評分的用戶相似度矩陣SimUserl (x, y)和基于用戶特征的相似度矩陣 SimUser2 (x, y):
【文檔編號】G06F17/30GK103761237SQ201310646099
【公開日】2014年4月30日 申請日期:2013年12月4日 優(yōu)先權(quán)日:2013年12月4日
【發(fā)明者】王曉軍, 馮旻遠(yuǎn) 申請人:南京郵電大學(xué)