專利名稱:獲取用戶相似度的方法、裝置及用戶推薦方法、系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及計(jì)算機(jī)領(lǐng)域,尤指一種獲取用戶相似度的方法、裝置及用戶推薦方法、 系統(tǒng)。
背景技術(shù):
目前,用戶與用戶的相似度主要是根據(jù)用戶的資料計(jì)算得出的,現(xiàn)有相似度的計(jì)算方法完全依賴于用戶資料。但是,一方面,用戶資料很難反映一個(gè)人的全部特征,而另一方面,如果用戶資料填寫不完整,那么,相似度的計(jì)算是不理想的,也降低了用戶推薦系統(tǒng)中相似用戶推薦的滿意度。
發(fā)明內(nèi)容
有鑒于此,本發(fā)明實(shí)施例提供一種獲取用戶相似度的方法及裝置,能夠更準(zhǔn)確的查找相似用戶。本發(fā)明還提供一種用戶推薦方法及系統(tǒng),能夠提高推薦相似用戶的準(zhǔn)確性。本發(fā)明的技術(shù)方案是這樣實(shí)現(xiàn)的一種獲取用戶相似度的方法,包括分析用戶的反向收聽關(guān)系;根據(jù)所述反向收聽關(guān)系確定用戶間的相似度。所述分析用戶的反向收聽關(guān)系,包括采用向量&表示用戶X的反向收聽關(guān)系,& =( Ql, Q2…Qi);其中i = i,2... Π, η為所述用戶所在系統(tǒng)中除該用戶之外的用戶個(gè)數(shù),Qi為所述用戶所在系統(tǒng)中除該用戶之外的用戶i ;如果Qi已經(jīng)收聽所述用戶X,則Qi = 1,否則Qi = 0。所述根據(jù)收聽關(guān)系確定用戶間的相似度包括
Vi-Vl按照公式Sim(i,j) = ^^=^^^4+算用戶間的相似度,其中,
Vvi. V'. VvJ ‘ vji、j分別表示用戶i和用戶j,sim(i, j)表示用戶i和用戶j的相似度舊表示用戶i的反向收聽關(guān)系,^表示用戶j的反向收聽關(guān)系。一種獲取用戶相似度的裝置,至少包括分析模塊、獲取模塊以及存儲(chǔ)模塊,其中,分析模塊,用于分析用戶的收聽關(guān)系,并將得到的收聽關(guān)系中的反向收聽關(guān)系輸出給獲取模塊;獲取模塊,用于根據(jù)用戶的反向收聽關(guān)系,確定用戶間的相似度,按照相似度從高到低的順序,選出與該用戶相似度較高的預(yù)設(shè)數(shù)目個(gè)相似用戶,并存儲(chǔ)在存儲(chǔ)模塊中;存儲(chǔ)模塊,用于存儲(chǔ)用戶的相似用戶信息。還包括收聽關(guān)系存儲(chǔ)模塊,用于存儲(chǔ)分析模塊分析出的正向收聽關(guān)系和反向收聽關(guān)系;此時(shí),分析模塊,還用于將分析出的收聽關(guān)系中的正向收聽關(guān)系和反向收聽關(guān)系輸出給收聽關(guān)系存儲(chǔ)模塊。所述存儲(chǔ)模塊,還用于為存儲(chǔ)的各相似用戶分別設(shè)置權(quán)值。一種用戶推薦方法,包括獲取用戶的正向收聽關(guān)系;確定正向收聽關(guān)系中記錄的該用戶收聽的各用戶的相似用戶,所述相似用戶是根據(jù)反向收聽關(guān)系確定的用戶間的相似度確定的;從確定出的相似用戶中選出推薦給該用戶的推薦用戶。該方法還包括獲取所述相似用戶的相似度的權(quán)值。所述選出推薦給該用戶的推薦用戶包括按照所述各相似用戶的相似度從高到低的順序,選擇相似度較大的預(yù)設(shè)數(shù)量的相似用戶作為推薦用戶。所述選出推薦給該用戶的推薦用戶包括按照預(yù)先設(shè)置的策略選擇預(yù)設(shè)數(shù)量的相似用戶作為推薦用戶?!N用戶推薦系統(tǒng),包括請求單元、獲取用戶相似度的裝置,以及推薦單元,其中,請求單元,用于向獲取用戶相似度的裝置發(fā)起第一請求,以請求獲取用戶的正向收聽關(guān)系;將獲得的發(fā)起請求的用戶的正向收聽關(guān)系發(fā)送給推薦單元;獲取用戶相似度的裝置,用于接收來自請求單元的第一請求,向請求單元輸出發(fā)起請求的用戶的正向收聽關(guān)系;接收來自推薦單元的第二請求,向推薦單元輸出發(fā)起請求的用戶收聽的用戶的相似用戶;推薦單元,用于根據(jù)發(fā)起請求的用戶的正向收聽關(guān)系,獲取發(fā)起請求的用戶收聽的用戶,并向獲取用戶相似度的裝置發(fā)起第二請求,用于請求該發(fā)起請求的用戶收聽的用戶的相似用戶;從獲得的所有相似用戶中選出預(yù)設(shè)數(shù)量的推薦給發(fā)起請求用戶的推薦用戶。所述獲取用戶相似度的裝置,在收到第二請求時(shí),還用于向所述推薦單元輸出相似用戶的權(quán)值;此時(shí),所述推薦單元,具體用于從獲得的所有相似用戶中,按照相似度從高到低,選出預(yù)設(shè)數(shù)量的推薦給發(fā)起請求用戶的推薦用戶。從上述本發(fā)明提供的技術(shù)方案可以看出,本發(fā)明根據(jù)follow關(guān)系確定用戶間的相似度,保證了相似用戶與請求的用戶的高相似度,提高了查找相似用戶的準(zhǔn)確度。本發(fā)明用戶推薦方法中推薦的用戶與請求用戶的相似度,是通過用戶的follow關(guān)系獲得的,保證了相似用戶與請求用戶的高相似度,因此,提高了用戶推薦系統(tǒng)中推薦相似用戶的準(zhǔn)確性。
圖1為本發(fā)明獲取用戶相似度的方法的流程圖;圖2為本發(fā)明獲取用戶相似度的裝置的組成結(jié)構(gòu)示意圖;圖3為本發(fā)明用戶推薦方法的流程圖;圖4為本發(fā)明用戶推薦系統(tǒng)的組成結(jié)構(gòu)示意圖;圖5為本發(fā)明用戶推薦方法的實(shí)施例的實(shí)現(xiàn)過程示意圖。
具體實(shí)施例方式圖1為本發(fā)明獲取用戶相似度的方法的流程圖,如圖1所示,包括步驟100 分析用戶的收聽(follow)關(guān)系。follow關(guān)系包括正向follow關(guān)系和反向follow關(guān)系,對(duì)于某用戶如用戶X,正向
follow關(guān)系記錄的是用戶X收聽的用戶如用戶Al、用戶A2.......用戶An ;反向follow
關(guān)系記錄的是收聽用戶X的用戶如用戶Bi、用戶B2.......用戶Bm,也就是用戶X被用戶
Bi、用戶B2、......用戶an收聽。本步驟中,對(duì)用戶的follow關(guān)系的分析指對(duì)反向follow關(guān)系的分析,包括假設(shè)用戶χ所在系統(tǒng)共有η個(gè)用戶(除用戶X本身),用戶X的反向follow關(guān)系可以表示為向量& = (Q1, Q2…Qi),其中i = l,2...n,如果Qi已經(jīng)收聽用戶XJijQi = 1,否則Qi = O0步驟101 根據(jù)follow關(guān)系確定用戶間的相似度。本步驟根據(jù)公式⑴計(jì)算用戶
V -V
間的相似度Sim(iJ) = 7^^^74^^(1)
Vv. - ^ · VvJ · vJ公式(1)中,i、j分別表示用戶i和用戶j,▽,表示用戶i的反向follow關(guān)
系,、表示用戶j的反向follow關(guān)系。假設(shè)X= (0, 1, 1),▽廣(1,1, 1),那么,
simri ^ Vi-Vj(0x1 + 1X1 + 1X1)___
Simi 1, I )-----—■==--- ~- ----------
^i-Vi -^VrVl+ + /(lxl + lxl + lxl)對(duì)于每個(gè)用戶來講,可以按照相似度從高到低的順序,為該用戶保存預(yù)設(shè)數(shù)目個(gè)相似用戶,如10個(gè)。具體數(shù)目可以根據(jù)不同系統(tǒng)的需要設(shè)置。本發(fā)明方法,通過用戶的follow關(guān)系獲得用戶相似度,從用戶對(duì)信息的關(guān)注程度進(jìn)行考慮,更好地體現(xiàn)了用戶的相似度,得到了比較理想的用戶的相似度,為后續(xù)用戶推薦系統(tǒng)中相似用戶的推薦提供了保障。針對(duì)本發(fā)明獲取用戶相似度的方法,還提供一種獲取用戶相似度的裝置,如圖2 所示,至少包括分析模塊、獲取模塊以及存儲(chǔ)模塊,其中,分析模塊,用于分析用戶的follow關(guān)系,并將得到的follow關(guān)系中的反向follow 關(guān)系輸出給獲取模塊;獲取模塊,用于根據(jù)用戶的反向follow關(guān)系,確定用戶間的相似度,并按照相似度從高到低的順序,選出與該用戶相似度較高的預(yù)設(shè)數(shù)目個(gè)相似用戶,并存儲(chǔ)在存儲(chǔ)模塊中。存儲(chǔ)模塊,用于存儲(chǔ)用戶的相似用戶信息,比如可以是用戶的標(biāo)識(shí),還可以進(jìn)一步存儲(chǔ)該用戶與其相似用戶的相似度等。本發(fā)明獲取用戶相似度的裝置還包括follow關(guān)系存儲(chǔ)模塊,用于存儲(chǔ)分析模塊分析出的正向follow關(guān)系和反向follow關(guān)系。此時(shí),分析模塊,還用于將分析出的follow中的正向follow關(guān)系和反向follow關(guān)系輸出給follow關(guān)系存儲(chǔ)模塊。圖3為本發(fā)明用戶推薦方法的流程圖,如圖3所示,包括以下步驟步驟300 獲取用戶的正向follow關(guān)系。
從本發(fā)明獲取用戶相似度的裝置中的follow關(guān)系存儲(chǔ)模塊可以獲得用戶的正向 follow關(guān)系,也就是獲得了該用戶收聽的用戶的信息。步驟301 確定正向follow關(guān)系中記錄的該用戶收聽的各用戶的相似用戶。從本發(fā)明存儲(chǔ)的用戶的相似用戶信息,可以對(duì)應(yīng)獲得該用戶收聽的用戶的相似用戶。所述相似用戶是根據(jù)反向收聽關(guān)系確定的用戶間的相似度來確定的,具體如圖1所示的方法,這里不再詳述。進(jìn)一步地,在本發(fā)明獲取用戶相似度的裝置的存儲(chǔ)模塊存儲(chǔ)相似用戶信息時(shí),還用于為這些相似用戶設(shè)置權(quán)值,具體實(shí)現(xiàn)屬于本領(lǐng)域技術(shù)人員慣用技術(shù)手段,這里不再贅述。這樣,本步驟中,還同時(shí)獲得該用戶的相似用戶的權(quán)值。步驟302 從確定出的所有相似用戶中選出推薦給該用戶的推薦用戶。本步驟中,可以按照預(yù)先設(shè)置的策略選擇預(yù)設(shè)數(shù)量的相似用戶作為推薦用戶,比如按照各相似用戶的相似度從高到低,選擇相似度較大的預(yù)設(shè)數(shù)量的相似用戶作為推薦用戶,比如10個(gè)。具體數(shù)目可以根據(jù)不同系統(tǒng)的需要設(shè)置。本發(fā)明用戶推薦方法中推薦的用戶與請求用戶的相似度,是通過用戶的follow 關(guān)系獲得的,保證了相似用戶與請求的用戶的高相似度,因此,提高了用戶推薦系統(tǒng)中相似用戶推薦的滿意度。圖4為本發(fā)明用戶推薦系統(tǒng)的組成結(jié)構(gòu)示意圖,如圖4所示,包括請求單元、獲取用戶相似度的裝置,以及推薦單元,其中,請求單元,用于向獲取用戶相似度的裝置發(fā)起第一請求,以請求獲取用戶的正向 follow關(guān)系;將獲得的發(fā)起請求的用戶的正向follow關(guān)系發(fā)送給推薦單元。獲取用戶相似度的裝置,用于接收來自請求單元的第一請求,向請求單元輸出發(fā)起請求的用戶的正向follow關(guān)系;接收來自推薦單元的第二請求,向推薦單元輸出發(fā)起請求的用戶收聽的用戶的相似用戶。推薦單元,用于根據(jù)發(fā)起請求的用戶的正向follow關(guān)系,獲取發(fā)起請求的用戶收聽的用戶,并向獲取用戶相似度的裝置發(fā)起第二請求,用于請求該發(fā)起請求的用戶收聽的用戶的相似用戶;從獲得的所有相似用戶中選出預(yù)設(shè)數(shù)量的推薦給發(fā)起請求用戶的推薦用戶。獲取用戶相似度的裝置,在收到第二請求時(shí),還用于向推薦單元輸出相似用戶的權(quán)值;此時(shí),推薦單元,具體用于從獲得的所有相似用戶中,按照相似度從高到低,選出預(yù)設(shè)數(shù)量的推薦給發(fā)起請求用戶的推薦用戶。需要說明的是,本發(fā)明獲取用戶相似度的裝置中,存儲(chǔ)模塊,和/或follow關(guān)系存儲(chǔ)模塊也可以作為獨(dú)立的數(shù)據(jù)庫設(shè)置在該裝置之外,這種實(shí)現(xiàn)形式屬于本領(lǐng)域技術(shù)人員的慣用技術(shù)手段,并不用于限定本發(fā)明的保護(hù)范圍。圖5為本發(fā)明用戶推薦方法的實(shí)施例的實(shí)現(xiàn)過程示意圖,結(jié)合圖3和圖4,具體過程包括1、請求單元如系統(tǒng)前臺(tái),請求查詢用戶X的follow歷史記錄,即用戶Xfollow的用戶,也就是用戶X的正向follow關(guān)系;2、用戶follow數(shù)據(jù)庫返回用戶X的正向follow關(guān)系歷史記錄,假設(shè)用戶X已經(jīng) follow的用戶為用戶Al...用戶An ;本實(shí)施例中,follow關(guān)系存儲(chǔ)模塊采用用戶follow數(shù)據(jù)庫來實(shí)現(xiàn);3、請求單元將獲得的用戶列表即用戶Al...用戶An上報(bào)給推薦單元;4、推薦單元通過用戶相似度數(shù)據(jù)庫,分別查詢與用戶Al...用戶An最相似的10 個(gè)用戶;5、用戶相似度數(shù)據(jù)庫向推薦單元返回分別與用戶Al...用戶An最相似的10個(gè)用戶,以及各相似用戶的權(quán)值;6、推薦單元對(duì)(10*n)個(gè)用戶的相似度進(jìn)行合并處理,比如將與同一用戶相似的相似度相加,并選相似度大的前10個(gè)用戶,比如用戶Bi...用戶BlO返回給請求單元,這10 個(gè)用戶即為推薦給用戶X的推薦用戶。本發(fā)明提供的方法,同樣適用于基于好友關(guān)系的相似度的獲取,以及利用鈣相似度進(jìn)行的相似用戶的推薦,具體實(shí)現(xiàn),參考本發(fā)明提供的具體實(shí)現(xiàn)方法,這里不再贅述。以上所述,僅為本發(fā)明的較佳實(shí)施例而已,并非用于限定本發(fā)明的保護(hù)范圍,凡在本發(fā)明的精神和原則之內(nèi)所作的任何修改、等同替換和改進(jìn)等,均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。
8
權(quán)利要求
1.一種獲取用戶相似度的方法,其特征在于,包括分析用戶的反向收聽關(guān)系;根據(jù)所述反向收聽關(guān)系確定用戶間的相似度。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述分析用戶的反向收聽關(guān)系,包括采用向量已表示用戶X的反向收聽關(guān)系,& =( Ql, Q2…Qi);其中i = 1,2... n,n為所述用戶所在系統(tǒng)中除該用戶之外的用戶個(gè)數(shù),Qi為所述用戶所在系統(tǒng)中除該用戶之外的用戶i ;如果Qi已經(jīng)收聽所述用戶X,則Qi = 1,否則Qi =0。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述根據(jù)收聽關(guān)系確定用戶間的相似度包括 按照公式
4.一種獲取用戶相似度的裝置,其特征在于,至少包括分析模塊、獲取模塊以及存儲(chǔ)模塊,其中,分析模塊,用于分析用戶的收聽關(guān)系,并將得到的收聽關(guān)系中的反向收聽關(guān)系輸出給獲取模塊;獲取模塊,用于根據(jù)用戶的反向收聽關(guān)系,確定用戶間的相似度,按照相似度從高到低的順序,選出與該用戶相似度較高的預(yù)設(shè)數(shù)目個(gè)相似用戶,并存儲(chǔ)在存儲(chǔ)模塊中;存儲(chǔ)模塊,用于存儲(chǔ)用戶的相似用戶信息。
5.根據(jù)權(quán)利要求4所述的裝置,其特征在于,還包括收聽關(guān)系存儲(chǔ)模塊,用于存儲(chǔ)分析模塊分析出的正向收聽關(guān)系和反向收聽關(guān)系;此時(shí),分析模塊,還用于將分析出的收聽關(guān)系中的正向收聽關(guān)系和反向收聽關(guān)系輸出給收聽關(guān)系存儲(chǔ)模塊。
6.根據(jù)權(quán)利要求4所述的裝置,其特征在于,所述存儲(chǔ)模塊,還用于為存儲(chǔ)的各相似用戶分別設(shè)置權(quán)值。
7.一種用戶推薦方法,其特征在于,包括獲取用戶的正向收聽關(guān)系;確定正向收聽關(guān)系中記錄的該用戶收聽的各用戶的相似用戶,所述相似用戶是根據(jù)反向收聽關(guān)系確定的用戶間的相似度確定的;從確定出的相似用戶中選出推薦給該用戶的推薦用戶。
8.根據(jù)權(quán)利要求7所述的用戶推薦方法,其特征在于,該方法還包括獲取所述相似用戶的相似度的權(quán)值。
9.根據(jù)權(quán)利要求8所述的用戶推薦方法,其特征在于,所述選出推薦給該用戶的推薦用戶包括按照所述各相似用戶的相似度從高到低的順序,選擇相似度較大的預(yù)設(shè)數(shù)量的相似用戶作為推薦用戶。
10.根據(jù)權(quán)利要求7所述的用戶推薦方法,其特征在于,所述選出推薦給該用戶的推薦用戶包括按照預(yù)先設(shè)置的策略選擇預(yù)設(shè)數(shù)量的相似用戶作為推薦用戶。
11.一種用戶推薦系統(tǒng),其特征在于,包括請求單元、獲取用戶相似度的裝置,以及推薦單元,其中,請求單元,用于向獲取用戶相似度的裝置發(fā)起第一請求,以請求獲取用戶的正向收聽關(guān)系;將獲得的發(fā)起請求的用戶的正向收聽關(guān)系發(fā)送給推薦單元;獲取用戶相似度的裝置,用于接收來自請求單元的第一請求,向請求單元輸出發(fā)起請求的用戶的正向收聽關(guān)系;接收來自推薦單元的第二請求,向推薦單元輸出發(fā)起請求的用戶收聽的用戶的相似用戶;推薦單元,用于根據(jù)發(fā)起請求的用戶的正向收聽關(guān)系,獲取發(fā)起請求的用戶收聽的用戶,并向獲取用戶相似度的裝置發(fā)起第二請求,用于請求該發(fā)起請求的用戶收聽的用戶的相似用戶;從獲得的所有相似用戶中選出預(yù)設(shè)數(shù)量的推薦給發(fā)起請求用戶的推薦用戶。
12.根據(jù)權(quán)利要求11所述的用戶推薦系統(tǒng),其特征在于,所述獲取用戶相似度的裝置,在收到第二請求時(shí),還用于向所述推薦單元輸出相似用戶的權(quán)值;此時(shí),所述推薦單元,具體用于從獲得的所有相似用戶中,按照相似度從高到低,選出預(yù)設(shè)數(shù)量的推薦給發(fā)起請求用戶的推薦用戶。
全文摘要
本發(fā)明提供了一種獲取用戶相似度的方法、裝置及用戶推薦方法、系統(tǒng),本發(fā)明根據(jù)收聽(follow)關(guān)系確定用戶間的相似度,保證了相似用戶與請求的用戶的高相似度,提高了查找相似用戶的準(zhǔn)確度。本發(fā)明用戶推薦方法中推薦的用戶與請求用戶的相似度,是通過用戶的follow關(guān)系獲得的,保證了相似用戶與請求的用戶的高相似度,因此,提高了用戶推薦系統(tǒng)中推薦相似用戶的準(zhǔn)確性。
文檔編號(hào)G06F17/30GK102467542SQ201010543870
公開日2012年5月23日 申請日期2010年11月11日 優(yōu)先權(quán)日2010年11月11日
發(fā)明者文勖, 王銳 申請人:騰訊科技(深圳)有限公司