一種基于社交網(wǎng)絡(luò)的信息推薦方法
【專利摘要】本發(fā)明公開了一種基于社交網(wǎng)絡(luò)的信息推薦方法,其步驟如下:步驟1:計(jì)算用戶之間的信任度和相似性,使用加權(quán)值來構(gòu)建用戶關(guān)系矩陣;步驟2:使用社區(qū)發(fā)現(xiàn)算法對用戶進(jìn)行聚類,形成用戶最近鄰居集;步驟3:預(yù)測評分并生成推薦列表。本發(fā)明可達(dá)到以下的有益效果:(1)解決冷啟動(dòng)問題。本發(fā)明引入信任度,進(jìn)行推薦時(shí)如果根據(jù)共同評分物品無法得到足夠多的近鄰,可信朋友可以作為預(yù)測的起點(diǎn),這樣可以減輕冷啟動(dòng)問題以及提高用戶覆蓋度;(2)提高實(shí)時(shí)性。本發(fā)明中采用社交網(wǎng)絡(luò)分析中常用的社區(qū)發(fā)現(xiàn)算法對用戶網(wǎng)絡(luò)進(jìn)行社區(qū)劃分,即相同的用戶興趣聚類,使得在尋找用戶鄰居集時(shí)大大縮短時(shí)間,提高了信息推薦的響應(yīng)實(shí)時(shí)性。
【專利說明】一種基于社交網(wǎng)絡(luò)的信息推薦方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及網(wǎng)絡(luò)信息【技術(shù)領(lǐng)域】,尤其涉及到一種能夠基于社交網(wǎng)絡(luò)的信息推薦方法。
【背景技術(shù)】
[0002]互聯(lián)網(wǎng)的飛速發(fā)展和不斷增長的信息資源使得信息指數(shù)激增,信息服務(wù)領(lǐng)域面臨著“信息資源豐富,但獲取有利用價(jià)值的信息困難”的問題,給人們帶來很大的信息負(fù)擔(dān)。一方面,網(wǎng)絡(luò)上出現(xiàn)大量數(shù)據(jù)資源導(dǎo)致的“信息過載”現(xiàn)象(information overload);另一方面,用戶無法獲取自己需要的信息資源。推薦系統(tǒng)(recommendation systems)作為一種以“信息推送”模式服務(wù)的重要方法,是解決信息過載問題的主要手段,它能夠以用戶為中心在分析預(yù)測用戶需求的基礎(chǔ)上主動(dòng)給用戶推送其可能需要但又難以獲取的信息,通過根據(jù)用戶的不同環(huán)境場合下的行為特征為用戶推薦更具有利用價(jià)值的信息資源。
[0003]伴隨著互聯(lián)網(wǎng)發(fā)展的還有社交網(wǎng)絡(luò)的飛速擴(kuò)增。社交網(wǎng)絡(luò)通過互聯(lián)網(wǎng)把具有相同愛好甚至是互不相識的人們連接起來,從而形成具有某一特點(diǎn)的團(tuán)體。社交網(wǎng)絡(luò)是一個(gè)能夠互相溝通和交流并且能夠參與互動(dòng)的平臺,它從研究部門、學(xué)校、政府、商業(yè)應(yīng)用平臺擴(kuò)展成一個(gè)人類社會(huì)交流的工具。因?yàn)榛ヂ?lián)網(wǎng)是虛擬的,人們千方百計(jì)地隱瞞自己在網(wǎng)絡(luò)中的真實(shí)身份,這不僅帶來了大量的虛假信息,而且使人們之間的信任程度越來越低,溝通變得更加困難。社交網(wǎng)絡(luò)采用真實(shí)信息注冊,增強(qiáng)了網(wǎng)絡(luò)用戶的身份真實(shí)性和行為可信性,極大地保障了系統(tǒng)中信息安全和用戶交互的可靠性、地域性和實(shí)時(shí)性,使人們能更放心、更輕松的與其他人進(jìn)行交流,同時(shí)也帶來了全新的用戶體驗(yàn)。通過社交網(wǎng)絡(luò),他們會(huì)主動(dòng)公布自己的特點(diǎn)和偏好,積極提供并注釋各種資源(比如圖片、視頻)或分享他們的知識。例如,用戶可以通過豆瓣來分享圖書,通過Facebook進(jìn)行網(wǎng)絡(luò)社交和分享照片,通過Twitter發(fā)送微博,通過Flickr發(fā)布照片,通過YouTube上傳視頻等。越來越流行的社交網(wǎng)絡(luò)悄悄的改變著人們的生活方式和價(jià)值取向。
[0004]目前,經(jīng)常使用的推薦方法包括以下幾種:
[0005]I)基于關(guān)聯(lián)規(guī)則的推薦方法,它根據(jù)用戶交易數(shù)據(jù),生成關(guān)聯(lián)規(guī)則,并結(jié)合用戶當(dāng)前購買行為提出建議,購物車分析是關(guān)聯(lián)規(guī)則最典型的應(yīng)用?;陉P(guān)聯(lián)規(guī)則的推薦方法通用性比較強(qiáng),可以應(yīng)用于多種領(lǐng)域,但關(guān)聯(lián)規(guī)則抽取難、消耗的時(shí)間多,隨著關(guān)聯(lián)規(guī)則數(shù)量不斷增多,系統(tǒng)也變的難以管理。
[0006]2)基于內(nèi)容的推薦方法,它主要側(cè)重于信息資源項(xiàng)目的內(nèi)容分析及其用戶偏好模型的構(gòu)建,推薦功能是通過比較資源與用戶偏好的相似度來實(shí)現(xiàn)的?;趦?nèi)容的推薦技術(shù)雖然有直觀的結(jié)果,簡單的計(jì)算,迅速的響應(yīng)時(shí)間,良好的可解釋性,能解決冷啟動(dòng)和數(shù)據(jù)稀疏的問題。但是,仍然具有一定的局限性:可以分析項(xiàng)目的內(nèi)容是有限的,僅是可以通過一系列的特征集合表示的信息,并不能有效地處理諸如聲音、圖片、視頻等多媒體信息;用戶可以接收和過去喜好推薦類似的項(xiàng)目,但不能為用戶發(fā)現(xiàn)新的感興趣的商品,推薦內(nèi)容單一;無法處理品質(zhì)、風(fēng)格或觀點(diǎn)。[0007]3)協(xié)同過濾推薦方法,它是目前推薦信息系統(tǒng)中最成功的技術(shù),協(xié)同過濾的基本思想是利用用戶或項(xiàng)目之間的相似度進(jìn)行推薦或預(yù)測,該方法找出一群具有相同偏好的用戶群,然后分析用戶的共同偏好來對目標(biāo)用戶進(jìn)行推薦。協(xié)同過濾算法的優(yōu)點(diǎn)在于它并不關(guān)注項(xiàng)目本身的內(nèi)容,主要是根據(jù)用戶或項(xiàng)目相似度來推薦資源,系統(tǒng)只需要獲得足夠的項(xiàng)目評價(jià)就可以可靠的進(jìn)行項(xiàng)目推薦。但是,協(xié)同過濾算法的缺點(diǎn)也非常明顯,即“冷啟動(dòng)”問題、數(shù)據(jù)稀疏問題、可擴(kuò)展性問題等。
[0008]社交網(wǎng)絡(luò)的發(fā)展為個(gè)性化推薦提供了良好的渠道,本發(fā)明將用戶間的信任度量、社交網(wǎng)絡(luò)方式和個(gè)性化推薦技術(shù)有機(jī)結(jié)合,提出了一種基于社交網(wǎng)絡(luò)的信息推薦方法來構(gòu)造一個(gè)高效率、高精確度的推薦系統(tǒng)。
【發(fā)明內(nèi)容】
[0009]為解決上述技術(shù)問題,本發(fā)明提供一種基于社交網(wǎng)絡(luò)的信息推薦方法,其采用的技術(shù)方案如下:
[0010]一種基于社交網(wǎng)絡(luò)的信息推薦方法,其步驟如下:
[0011]步驟1:計(jì)算用戶之間的信任度和相似性,使用加權(quán)值來構(gòu)建用戶關(guān)系矩陣;
[0012]步驟2:使用社區(qū)發(fā)現(xiàn)算法對用戶進(jìn)行聚類,形成用戶最近鄰居集;
[0013]步驟3:預(yù)測評分并生成推薦列表。
[0014]構(gòu)建用戶-評分矩陣Rmxn:
[0015]
【權(quán)利要求】
1.一種基于社交網(wǎng)絡(luò)的信息推薦方法,其步驟如下: 步驟1:計(jì)算用戶之間的信任度和相似性,使用加權(quán)值來構(gòu)建用戶關(guān)系矩陣; 步驟2:使用社區(qū)發(fā)現(xiàn)算法對用戶進(jìn)行聚類,形成用戶最近鄰居集; 步驟3:預(yù)測評分并生成推薦列表。
2.根據(jù)權(quán)利要求1所述的一種基于社交網(wǎng)絡(luò)的信息推薦方法,其特征在于步驟I中的構(gòu)建用戶關(guān)系矩陣其方法如下: 構(gòu)建用戶-評分矩陣Rmxn:
3.根據(jù)權(quán)利要求2所述的一種基于社交網(wǎng)絡(luò)的信息推薦方法,其特征在于直接信任度為交互信任度、用戶之間的共同好友所占比例、用戶的評價(jià)能力三者的結(jié)合,其計(jì)算公式為:
4.根據(jù)權(quán)利要求1所述的一種基于社交網(wǎng)絡(luò)的信息推薦方法,其特征在于步驟2中社區(qū)發(fā)現(xiàn)法的過程如下: Stepl:計(jì)算網(wǎng)絡(luò)中各個(gè)用戶的度(和該頂點(diǎn)相關(guān)聯(lián)的邊數(shù)),并從中選擇度最大的用戶i作為初始社區(qū)Ci,并初始化模塊度Q = O; Step2:找出所有與社區(qū)Ci相連接的用戶,并把它們放入鄰近用戶集N中; Step3:計(jì)算用戶集N中的每個(gè)用戶j對社區(qū)Ci的貢獻(xiàn)度q,并將對社區(qū)具有最大貢獻(xiàn)度的用戶加入到社區(qū)Ci中; Step4:計(jì)算社區(qū)Ci的模塊度Q’,若Q’ > Q,則將用戶j加入社區(qū)Ci成功,并將用戶j做上標(biāo)記,同時(shí)更新模塊度Q = Q’,返回St印2繼續(xù)執(zhí)行;否則,轉(zhuǎn)St印5 ; Step5:模塊度Q已經(jīng)達(dá)到最大值,即當(dāng)前社區(qū)Ci達(dá)到劃分的最優(yōu)結(jié)果; Step6:如果不存在未作標(biāo)記的用戶,網(wǎng)絡(luò)中的所有社區(qū)已檢測到,則過程結(jié)束;否則,從沒有標(biāo)記的用戶中選擇度最大的用戶,作為新的初始社區(qū)Ci,返回step2繼續(xù)執(zhí)行。
5.根據(jù)權(quán)利要求4所述的一種基于社交網(wǎng)絡(luò)的信息推薦方法,其特征在于用戶對社區(qū)的貢獻(xiàn)度q計(jì)算方法如下:
6.根據(jù)權(quán)利要求4所述的一種基于社交網(wǎng)絡(luò)的信息推薦方法,其特征在于模塊度Q的表達(dá)方式如下: 如果是無權(quán)網(wǎng)絡(luò),模塊度Q的表達(dá)式如下:
7.根據(jù)權(quán)利要求1所述的一種基于社交網(wǎng)絡(luò)的信息推薦方法,其特征在于步驟3的評分推薦方法如下:根據(jù)目標(biāo)用戶的η個(gè)最近鄰居對候選項(xiàng)目的評分信息,預(yù)測目標(biāo)用戶對候選項(xiàng)目的評分,并選擇預(yù)測分?jǐn)?shù)最高的前幾個(gè)項(xiàng)目,作為推薦結(jié)果主動(dòng)推送給目標(biāo)用戶,即產(chǎn)生top-N信息資源推薦:
8.根據(jù)權(quán)利要求7所述的一種基于社交網(wǎng)絡(luò)的信息推薦方法,其特征在于直接信任度trust (U,V)也可為傳遞信任度trustUA,B)代替,其計(jì)算方式如下:
trustL(A;B) = trust (A, X1) X trust (X1, X2) X …X trust (Xn, B); 其中,Xi表示路徑L上用戶A和B之間的用戶,L(A,B)表示用戶A和用戶B之間的存在的信任路徑,如果信任網(wǎng)絡(luò)中用戶A和用戶B之間存在多個(gè)的信任路徑Lai, L2,…,Ln),(η≥2),則選取路徑L中的最短路徑,假如存在k條最短路徑,計(jì)算公式如下:
【文檔編號】G06F17/30GK103995823SQ201410112163
【公開日】2014年8月20日 申請日期:2014年3月25日 優(yōu)先權(quán)日:2014年3月25日
【發(fā)明者】徐小龍, 曹嘉倫, 周鈺淇, 馬瑞文, 李雙雙, 李玲娟, 陳丹偉 申請人:南京郵電大學(xué)