專利名稱:一種應用于推薦系統(tǒng)的算法及其實現方法
技術領域:
本發(fā)明屬于互聯網計算技術領域。
背景技術:
近年來,隨著互聯網和電子商務的發(fā)展,推薦系統(tǒng)得到了廣泛的發(fā)展。推薦系統(tǒng)的非形式化概念是在1997年由Varian和Resnick提出的“它是利用電子商務網站向客戶提供商品信息和建議,幫助用戶決定應該購買什么產品,模擬銷售人員幫助客戶完成購買的過程”。為了挖掘用戶的需求,根據用戶的興趣和愛好推薦他們滿意的商品成為了各大電子商務系統(tǒng)的重點。目前,不同形式的推薦系統(tǒng)被應用到了各個領域,如Amazon、EBay為代表的電子商務網站,Netflix、moviefinder為代表的電影網站,songtaste為代表的音樂網站。
·
推薦算法是整個推薦系統(tǒng)的核心部分,從很大程度上決定了推薦系統(tǒng)的準確性和效率。目前,主流的推薦算法包括基于內容推薦、協(xié)同過濾推薦和組合推薦。雖然這些算法都從一定程度上解決了查詢專家的問題,但是在應用范圍上局限于封閉的機構,所有的數據需要用戶或者專家本身去更新,具行較差的維護性;其次,只考慮了專家作為個人的價值,而專家作為知識的載體,在知識的分享和利用的過程中并不是孤立的,他們的人際關系和社會地位也能從一定程度上反映專家與專家之間的差異性;第三,這些系統(tǒng)僅僅是查詢系統(tǒng),列出與查詢詞匹配的專家,但沒有排序功能,缺少推薦性。因此,需要一個能使推薦系統(tǒng)更具有開放性、推薦性和多指標的推薦算法,在用戶查詢專家的同時,根據一些因素對查詢的結果進行排序,為用戶提供更精準的搜索服務。
發(fā)明內容
本發(fā)明的目的在于提供一種應用于推薦系統(tǒng)的算法及其實現方法,實現基于用戶偏好的個性化專家推薦,使推薦系統(tǒng)更具有開放性、推薦性和多指標性。為達到以上目的,本發(fā)明采用了主成分分析法,直線型無量綱化方法中的極值法,實現評價專家的三個維度質量指標、結構指標、匹配指標。進一步,所述的一種應用于專家推薦的推薦算法具有如下特征對于質量指標,采用主成分分析法(principal components analysis),對數據進行標準化,判斷變量間的相關性,將具有一定相關性的變量根據協(xié)方差重新組合成一組新的綜合指標,選擇不同的累計貢獻率大小來確定主成分個數,最終質量指標的因子分析僅包括活躍性因子和互助因子。對于結構指標,基于網站中搜集的“關注”與“被關注”關系,我們將主要考慮社會網絡中三個比較關鍵的節(jié)點hub結點,bridge結點,Core結點,在結構指標中只需提取一個因子作為專家衡量的依據。對于匹配指標,選擇加法合成法作為專家評價效用函數的公式,將四個因子做了相關性分析和公共因子提取,得出專家效用函數
U = w1*Y1+w2*Y2+w3*Y3+w4*T4o本發(fā)明對專家的匹配基于活躍性因子、互助因子、社會性因子和內容匹配因子,這些因子能全面的反映出專家在某一個維度上的表現水平,是用戶在選取專家時可能會考慮的因素。
圖I是本發(fā)明所述的應用于推薦系統(tǒng)的算法的結構指標分析流程。圖2是本發(fā)明所述的應用于推薦系統(tǒng)的算法的質量指標分析流程。
具體實施例方式本發(fā)明的技術方案說明 本發(fā)明采用了主成分分析法,直線型無量綱化方法中的極值法,實現評價專家的三個維度質量指標、結構指標、匹配指標。首先根據質量指標(相關性因子Y1,權威性因子Y2,活躍性因子Y3)和結構指標(社會性因子Y4),初步找出專家,然后計算出以上專家的可達指標(可達性因子Y5),最后根據專家及其可達性得出最終推薦專家。上述各參數指標可由如下數據計算得出相關性因子Y1,特定會員在特定領域內的發(fā)帖數,回帖數可以體現出該會員在該領域內的相關性,Yl =Average([發(fā)帖數]+ [回帖數]);權威性因子Y2,特定會員在特定領域內的精華帖數,推薦帖數,以及是否為斑竹可以體現出該會員在該領域內的權威性Y2 = a Average ([精華帖數]+ [推薦帖數])+ β * [是否為版主];活躍性因子Υ3,特定會員在某時間段(可自定義)內的所有發(fā)帖數,回帖數,以及帖子回復總數可以反映出該會員的活躍性Υ3 = Average([發(fā)帖數]+ [回帖數]+ [帖子回復總數]);社會性因子Υ4,由特定會員的好友關系圖可以反映出(具體算法待定);可達性因子Υ5,特定會員與專家之間的距離(距離超過3以上可以視為關系太遠而不在推薦范圍之內)。其中Υ1,Υ2,Υ3,Υ4的權重系數可由多元線形回歸算法獲得。
權利要求
1.一種應用于專家推薦系統(tǒng)的算法及其實現方法,其特征在于本發(fā)明采用了主成分分析法,直線型無量綱化方法中的極值法,實現評價專家的三個維度質量指標、結構指標、匹配指標。
2.根據權利要求I所述的多指標專家推薦系統(tǒng)及其實現方法,其特征在于對于質量指標,采用主成分分析法(principal components analysis),對數據進行標準化,判斷變量間的相關性,將具有一定相關性的變量根據協(xié)方差重新組合成ー組新的綜合指標,選擇不同的累計貢獻率大小來確定主成分個數,最終質量指標的因子分析僅包括活躍性因子和互助因子。
3.根據權利要求I所述的多指標專家推薦系統(tǒng)及其實現方法,其特征在于對于結構指標,基于網站中搜集的“關注”與“被關注”關系,我們將主要考慮社會網絡中三個比較關鍵的節(jié)點hub結點,bridge結點,Core結點,在結構指標中只需提取ー個因子作為專家衡量的依據。
4.根據權利要求I所述的多指標專家推薦系統(tǒng)及其實現方法,其特征在于對于匹配指標,選擇加法合成法作為專家評價效用函數的公式,將四個因子做了相關性分析和公共因子提取,得出專家效用函數。對專家的匹配基于活躍性因子、互助因子、社會性因子和內容匹配因子。
全文摘要
本發(fā)明公開了一種應用于推薦系統(tǒng)的算法及其實現方法。本發(fā)明的目的是實現基于用戶偏好的個性化專家推薦,使推薦系統(tǒng)更具有開放性、推薦性和多指標性。為達到以上目的,本發(fā)明采用了主成分分析法,直線型無量綱化方法中的極值法,實現評價專家的三個維度質量指標、結構指標、匹配指標。首先根據質量指標(相關性因子Y1,權威性因子Y2,活躍性因子Y3)和結構指標(社會性因子Y4),初步找出專家,然后計算出以上專家的可達指標(可達性因子Y5),最后根據專家及其可達性得出最終推薦專家。
文檔編號G06Q30/00GK102855240SQ201110177698
公開日2013年1月2日 申請日期2011年6月28日 優(yōu)先權日2011年6月28日
發(fā)明者楊永玲 申請人:上海邁輝信息技術有限公司