一種社交網(wǎng)絡中匿名用戶身份的識別方法
【專利摘要】本發(fā)明公開了一種社交網(wǎng)絡中匿名用戶身份的識別方法,特點是具體步驟如下:(1)將已知用戶的社交網(wǎng)絡中抽象成無向圖;計算出目標節(jié)點Vi與其他任一節(jié)點Vj之間的最短路徑,并進一步計算出表示該已知用戶與目標用戶的關系強度的用戶權值;(2)將另一包含目標匿名用戶的社交網(wǎng)絡圖抽象成無向圖,利用深度優(yōu)先搜索計算其他任一已知節(jié)點到起點節(jié)點的權值,利用深度優(yōu)先搜索法分別計算起點節(jié)點與未知節(jié)點的權值平均值;(3)通過搜索權值平均值差距最小的兩個節(jié)點,從而識別出已知用戶社交網(wǎng)絡中的目標用戶即為另一包含目標匿名用戶社交網(wǎng)絡中的目標匿名用戶,優(yōu)點是不僅能夠識別匿名用戶身份,同時匹配的準確率高。
【專利說明】
一種社交網(wǎng)絡中匿名用戶身份的識別方法
技術領域
[0001] 本發(fā)明涉及社交網(wǎng)絡中用戶身份的識別方法,尤其是涉及一種社交網(wǎng)絡中匿名用 戶身份的識別方法。
【背景技術】
[0002] 在社交網(wǎng)絡中存在著大量的用戶,用戶與用戶之間的關聯(lián)關系使得用戶之間組成 了一張巨大的社交網(wǎng)絡。而現(xiàn)有的社交網(wǎng)絡中用戶身份的確認方法大部分都是匹配已知的 用戶賬號,具體步驟為:(1)根據(jù)兩個候選社交網(wǎng)絡中的每個用戶賬號計算他們的關系環(huán)境 評分;(2)將其中一個社交網(wǎng)絡的每個賬號與另一個社交網(wǎng)絡賬號進行匹配,通過計算好友 親密度和非好友疏遠度結(jié)合用戶環(huán)境評分得到各自的結(jié)果值;(3)對每個結(jié)果值進行排序; (4)選出得分最高的用戶賬號作為最終選中的用戶。從結(jié)果來看,現(xiàn)有技術是建立在已知的 用戶和相應的屬性值的基礎上進行相應的評價值計算,這已經(jīng)無法滿足實現(xiàn)匹配匿名用戶 的需求,因為匿名用戶的所有屬性值是未知的,因此無法計入評價體系,就更加無法得到之 后的評分結(jié)果值。
【發(fā)明內(nèi)容】
[0003] 本發(fā)明所要解決的技術問題是提供一種通過已知的社交網(wǎng)絡中的賬戶匹配不同 社交網(wǎng)絡中的相應匿名賬戶,不僅能夠識別匿名用戶身份,同時匹配的準確率高的社交網(wǎng) 絡中匿名用戶身份的識別方法。
[0004] 本發(fā)明解決上述技術問題所采用的技術方案為:一種社交網(wǎng)絡中匿名用戶身份的 識別方法,具體步驟如下: (1) 已知社交網(wǎng)絡中用戶權值計算 A. 在已知用戶的社交網(wǎng)絡中,將用戶作為具有屬性的節(jié)點,用戶與用戶之間的關系作 為節(jié)點與節(jié)點之間的邊,將社交網(wǎng)絡圖抽象成無向圖; B. 在無向圖中,以目標節(jié)點Vi為起點,其他任一節(jié)點Vj為終點,通過Di jkstra算法計算 出目標節(jié)點Vi與其他任一節(jié)點Vj之間的最短路徑,計算最短路徑上所有相鄰節(jié)點的相似 度; C. 若其他任一節(jié)點Vj與目標節(jié)點Vi直接相連,則以該兩節(jié)點的相似度作為用戶權值; 若其他任一節(jié)點Vj與目標節(jié)點Vi不直接相連,則以該兩節(jié)點最短路徑上相鄰兩節(jié)點相似度 的累乘作為該任一節(jié)點Vj與目標節(jié)點Vi的相似度,以該相似度作為用戶權值;得到的用戶 權值表示該已知用戶與目標用戶的關系強度; D. 將計算得到的用戶權值的節(jié)點以〈目標節(jié)點Vi,已知節(jié)點Vj,權值〉形式組成結(jié)果集 輸出,得到已知社交網(wǎng)絡中各用戶權值; (2) 包含目標匿名用戶的社交網(wǎng)絡中權值計算 A.在另一包含目標匿名用戶的社交網(wǎng)絡圖中,將已知用戶作為具有屬性的已知節(jié)點, 匿名用戶作為未知屬性的未知節(jié)點,用戶與用戶之間的關系作為節(jié)點與節(jié)點之間的邊,將 社交網(wǎng)絡圖抽象成無向圖; B. 選取任意已知節(jié)點為起點節(jié)點Wi,對其他任一已知節(jié)點Wj進行深度優(yōu)先搜索得到相 應的權值,以〈起點節(jié)點Wi,已知節(jié)點Wj,權值〉形式組成結(jié)果集輸出; C. 利用深度優(yōu)先搜索法分別計算起點節(jié)點Wi到所有未知節(jié)點X的相應距離值,將所有 距離值相加除以未知節(jié)點X的個數(shù),得到起點節(jié)點Wi與未知節(jié)點的權值平均值,以〈起點節(jié) 點Wi,未知節(jié)點X,權值平均值〉形式組成結(jié)果集輸出; (3)匿名用戶輸出 A. 從步驟(2 )B中的結(jié)果集中選取起點節(jié)點Wi屬性與步驟(1 )D中的結(jié)果集中已知節(jié)點 Vj屬性相同的各組,分別將各組〈起點節(jié)點Wi,已知節(jié)點Wj,權值〉中的權值除以〈目標節(jié)點 Vi,已知節(jié)點Vj,權值〉中的權值,將各比值取平均值,以〈起點節(jié)點Wi,目標節(jié)點Vi,權值平 均值〉形式組成結(jié)果集輸出; B. 將〈起點節(jié)點Wi,目標節(jié)點Vi,權值平均值〉與步驟(2)C中得到的〈起點節(jié)點Wi,未知 節(jié)點X,權值平均值〉進行比較,搜索權值平均值差距最小的兩個節(jié)點,該目標節(jié)點Vi即為未 知節(jié)點X,從而獲得已知用戶社交網(wǎng)絡中的目標用戶即為另一包含目標匿名用戶社交網(wǎng)絡 中的目標匿名用戶,其中i = l,2,3,…,11,」=1,2,3,一,11,1與」之和為無向圖中所有節(jié)點個 數(shù)。
[0005] 步驟(2)中節(jié)點相似度具體計算方法如下: 從目標節(jié)點Vi到其他任一節(jié)點Vj,沿著最短路徑的方向,以相鄰兩節(jié)點度數(shù)和減一的 倒數(shù)作為相鄰兩節(jié)點間的相似度,計算得到的相似度表示兩用戶之間的關系強度;相鄰節(jié) 點相似度計算公式如下所示:
[0006] 與現(xiàn)有技術相比,本發(fā)明的優(yōu)點在于:本發(fā)明首次公開了一種社交網(wǎng)絡中匿名用 戶身份的識別方法,該方法在匿名用戶的在識別過程中主要經(jīng)歷了尋找最短路徑,權值計 算,匹配三個過程。
[0007] 在尋找最短路徑階段,該方法采用了 Dijkstra算法。利用該算法,可以得到兩個節(jié) 點之間的最短路徑,在該節(jié)點的最短路徑上經(jīng)過的節(jié)點越多,相似度累乘之后的結(jié)果越小, 權值越小。這表明了距離越遠的節(jié)點之間對于身份識別的貢獻也越小。
[0008] 在相似度計算中主要分為兩種情況:與目標節(jié)點直接相連的節(jié)點,與目標節(jié)點不 直接相連的節(jié)點。其中與目標直接相連的節(jié)點,以目標節(jié)點與相鄰節(jié)點度數(shù)和減一的倒數(shù) 作為兩者的相似度,并將該相似度作為相鄰節(jié)點的權值。與目標節(jié)點不直接相鄰的節(jié)點我 們通過計算在兩個節(jié)點之間的最短路徑上,兩兩相鄰節(jié)點的相似度,以這些相似度的累乘 結(jié)果作為不相鄰節(jié)點的權值。這樣充分保證了節(jié)點度數(shù)越大,結(jié)果值越小,權值越小。在評 價值準確的基礎上,再利用深度優(yōu)先遍歷算法匹配得到的目標結(jié)果,可以保證最終匹配結(jié) 果的準確率。
【附圖說明】
[0009] 圖1為本發(fā)明實施例無向圖。
【具體實施方式】
[0010] 以下結(jié)合附圖實施例對本發(fā)明作進一步詳細描述。 具體實施例
[0011] -種社交網(wǎng)絡中匿名用戶身份的識別方法,具體步驟如下: (1) 已知社交網(wǎng)絡中用戶權值計算 A. 在已知用戶的社交網(wǎng)絡中,將用戶作為具有屬性的節(jié)點,用戶與用戶之間的關系作 為節(jié)點與節(jié)點之間的邊,將社交網(wǎng)絡圖抽象成無向圖; B. 在無向圖中,以目標節(jié)點Vi為起點,其他任一節(jié)點Vj為終點,通過Di jkstra算法計算 出目標節(jié)點Vi與其他任一節(jié)點Vj之間的最短路徑,計算最短路徑上所有相鄰節(jié)點的相似 度;具體計算方法如下: 從目標節(jié)點Vi到其他任一節(jié)點Vj,沿著最短路徑的方向,以相鄰兩節(jié)點度數(shù)和減一的 倒數(shù)作為相鄰兩節(jié)點間的相似度,計算得到的相似度表示兩用戶之間的關系強度;相鄰節(jié) 點相似度計算公式如下所示:
C. 若其他任一節(jié)點Vj與目標節(jié)點Vi直接相連,則以該兩節(jié)點的相似度作為用戶權值; 若其他任一節(jié)點Vj與目標節(jié)點Vi不直接相連,則以該兩節(jié)點最短路徑上相鄰兩節(jié)點相似度 的累乘作為該任一節(jié)點Vj與目標節(jié)點Vi的相似度,以該相似度作為用戶權值;得到的用戶 權值表示該已知用戶與目標用戶的關系強度; 例如以圖1無向圖為例說明節(jié)點之間相似度的計算:以A,B,G,F(xiàn)四個用戶說明用戶相似 度算法:A用戶與G用戶之間不存在相互鏈接的路徑,因此A,G相似度為0,則G的權值為0; A,B 直接直接相連則相似度為1/(1+2-1)=1/2,則B的權值為1/2;A,F(xiàn)用戶之間沒有直接相連,但 存在多條路徑A-B-F j-B-C-E-F多條路徑。在眾多的路徑中選擇由A到F之間最短的 路徑A-B-F。則A,B之間的相似度為1/(1+2-1)=1/2,而B,F(xiàn)之間的相似度為1/(3+4-1) = 1/ 6,.則A,F(xiàn)之間的關系強度為(1/2)*(1/6) =1/12,F(xiàn)的權值為1/12; D. 將計算得到的用戶權值的節(jié)點以〈目標節(jié)點Vi,已知節(jié)點Vj,權值〉形式組成結(jié)果集 輸出,得到已知社交網(wǎng)絡中各用戶權值; (2) 包含目標匿名用戶的社交網(wǎng)絡中權值計算 A.在另一包含目標匿名用戶的社交網(wǎng)絡圖中,將已知用戶作為具有屬性的已知節(jié)點, 匿名用戶作為未知屬性的未知節(jié)點,用戶與用戶之間的關系作為節(jié)點與節(jié)點之間的邊,將 社交網(wǎng)絡圖抽象成無向圖; B. 選取任意已知節(jié)點為起點節(jié)點Wi,對其他任一已知節(jié)點Wj進行深度優(yōu)先搜索得到相 應的權值(權值計算方法同上述步驟(1)),以〈起點節(jié)點Wi,已知節(jié)點Wj,權值〉形式組成結(jié) 果集輸出; C. 利用深度優(yōu)先搜索法分別計算起點節(jié)點Wi到所有未知節(jié)點X的相應距離值,將所有 距離值相加除以未知節(jié)點X的個數(shù),得到起點節(jié)點Wi與未知節(jié)點的權值平均值,以〈起點節(jié) 點Wi,未知節(jié)點X,權值平均值〉形式組成結(jié)果集輸出; (3)匿名用戶輸出 A. 從步驟(2 )B中的結(jié)果集中選取起點節(jié)點Wi屬性與步驟(1 )D中的結(jié)果集中已知節(jié)點 Vj屬性相同的各組,分別將各組〈起點節(jié)點Wi,已知節(jié)點Wj,權值〉中的權值除以〈目標節(jié)點 Vi,已知節(jié)點Vj,權值〉中的權值,將各比值取平均值,以〈起點節(jié)點Wi,目標節(jié)點Vi,權值平 均值〉形式組成結(jié)果集輸出; B. 將〈起點節(jié)點Wi,目標節(jié)點Vi,權值平均值〉與步驟(2)C中得到的〈起點節(jié)點Wi,未知 節(jié)點X,權值平均值〉進行比較,搜索權值平均值差距最小的兩個節(jié)點,該目標節(jié)點Vi即為未 知節(jié)點X,從而獲得已知用戶社交網(wǎng)絡中的目標用戶即為另一包含目標匿名用戶社交網(wǎng)絡 中的目標匿名用戶,其中i = l,2,3,…,11,」=1,2,3,一,11,1與」之和為無向圖中所有節(jié)點個 數(shù)。
[0012] 該方法在匿名用戶的識別過程中不同節(jié)點所起到的作用不同,為了定量的描述不 同節(jié)點在匿名用戶識別工程中所作貢獻大小,我們?yōu)槊總€節(jié)點賦予不同的權值。權值的大 小反應了在后期識別工作中該節(jié)點貢獻大小。而權值的大小主要受以下幾方面的影響:與 待識別的匿名用戶的距離,節(jié)點度的數(shù)量(代表的是用戶好友數(shù)量),與待識別匿名用戶的 親密程度等因素影響。在這些因素中,距離匿名用戶越近,與匿名用戶越親密,在識別用戶 身份時起到的作用越大,相應的權值也就越大,而節(jié)點度的數(shù)量越大,在識別用戶身份時貢 獻越小,權值也就越小。因此,該方法提出使用節(jié)點相似度算法來計算節(jié)點之間的相似度, 并將相似度的值作為該節(jié)點的權值。在節(jié)點相似度算法中該方法用相鄰節(jié)點度數(shù)和減一的 倒數(shù)作為兩節(jié)點的相似度,這保證了度數(shù)越大(朋友越多),節(jié)點相似度越低(權值越?。2?且使用累乘的結(jié)果作為不相鄰節(jié)點的相似度,由于相似度均小于1,距離越遠累乘越多,則 相似度越小(權值越小)。這保證了距離越遠的節(jié)點,貢獻度也越小。所以說該算法充分的考 慮到了節(jié)點度的問題以及節(jié)點與匿名用戶距離的問題。真正實現(xiàn)了度數(shù)越大,距離越遠節(jié) 點的權值越小。在評價值準確的基礎上,再利用深度優(yōu)先遍歷算法匹配得到的目標結(jié)果,可 以保證最終匹配結(jié)果的準確率。
[0013] 當然,上述說明并非對本發(fā)明的限制,本發(fā)明也并不限于上述舉例。本技術領域的 普通技術人員在本發(fā)明的實質(zhì)范圍內(nèi)做出的變化、改型、添加或替換,也應屬于本發(fā)明保護 范圍。
【主權項】
1. 一種社交網(wǎng)絡中匿名用戶身份的識別方法,其特征在于具體步驟如下: (1) 已知社交網(wǎng)絡中用戶權值計算 A. 在已知用戶的社交網(wǎng)絡中,將用戶作為具有屬性的節(jié)點,用戶與用戶之間的關系作 為節(jié)點與節(jié)點之間的邊,將社交網(wǎng)絡圖抽象成無向圖; B. 在無向圖中,以目標節(jié)點Vi為起點,其他任一節(jié)點Vj為終點,通過Di jkstra算法計算 出目標節(jié)點Vi與其他任一節(jié)點Vj之間的最短路徑,計算最短路徑上所有相鄰節(jié)點的相似 度; C. 若其他任一節(jié)點Vj與目標節(jié)點Vi直接相連,則以該兩節(jié)點的相似度作為用戶權值; 若其他任一節(jié)點Vj與目標節(jié)點Vi不直接相連,則以該兩節(jié)點最短路徑上相鄰兩節(jié)點相似度 的累乘作為該任一節(jié)點Vj與目標節(jié)點Vi的相似度,以該相似度作為用戶權值;得到的用戶 權值表示該已知用戶與目標用戶的關系強度; D. 將計算得到的用戶權值的節(jié)點以〈目標節(jié)點Vi,已知節(jié)點Vj,權值〉形式組成結(jié)果集 輸出,得到已知社交網(wǎng)絡中各用戶權值; (2) 包含目標匿名用戶的社交網(wǎng)絡中權值計算 A. 在另一包含目標匿名用戶的社交網(wǎng)絡圖中,將已知用戶作為具有屬性的已知節(jié)點, 匿名用戶作為未知屬性的未知節(jié)點,用戶與用戶之間的關系作為節(jié)點與節(jié)點之間的邊,將 社交網(wǎng)絡圖抽象成無向圖; B. 選取任意已知節(jié)點為起點節(jié)點Wi,對其他任一已知節(jié)點Wj進行深度優(yōu)先搜索得到相 應的權值,以〈起點節(jié)點Wi,已知節(jié)點Wj,權值〉形式組成結(jié)果集輸出; C. 利用深度優(yōu)先搜索法分別計算起點節(jié)點Wi到所有未知節(jié)點X的相應距離值,將所有 距離值相加除以未知節(jié)點X的個數(shù),得到起點節(jié)點Wi與未知節(jié)點的權值平均值,以〈起點節(jié) 點Wi,未知節(jié)點X,權值平均值〉形式組成結(jié)果集輸出; (3) 匿名用戶輸出 A. 從步驟(2 )B中的結(jié)果集中選取起點節(jié)點Wi屬性與步驟(I )D中的結(jié)果集中已知節(jié)點 Vj屬性相同的各組,分別將各組〈起點節(jié)點Wi,已知節(jié)點Wj,權值〉中的權值除以〈目標節(jié)點 Vi,已知節(jié)點Vj,權值〉中的權值,將各比值取平均值,以〈起點節(jié)點Wi,目標節(jié)點Vi,權值平 均值〉形式組成結(jié)果集輸出; B. 將〈起點節(jié)點Wi,目標節(jié)點Vi,權值平均值〉與步驟(2)C中得到的〈起點節(jié)點Wi,未知 節(jié)點X,權值平均值〉進行比較,搜索權值平均值差距最小的兩個節(jié)點,該目標節(jié)點Vi即為未 知節(jié)點X,從而獲得已知用戶社交網(wǎng)絡中的目標用戶即為另一包含目標匿名用戶社交網(wǎng)絡 中的目標匿名用戶,其中i = l,2,3,…,11,」=1,2,3,一,11,1與」之和為無向圖中所有節(jié)點個 數(shù)。2. 根據(jù)權利要求1所述的一種社交網(wǎng)絡中匿名用戶身份的識別方法,其特征在于步驟 (2)中節(jié)點相似度具體計算方法如下: 從目標節(jié)點Vi到其他任一節(jié)點Vj,沿著最短路徑的方向,以相鄰兩節(jié)點度數(shù)和減一的 倒數(shù)作為相鄰兩節(jié)點間的相似度,計算得到的相似度表示兩用戶之間的關系強度;相鄰節(jié) 點相似度計算公式如下所示:
【文檔編號】H04L29/06GK106027507SQ201610308386
【公開日】2016年10月12日
【申請日】2016年5月11日
【發(fā)明人】梁秀波, 尹可挺, 王宇凡, 陳志民
【申請人】浙江大學軟件學院(寧波)管理中心(寧波軟件教育中心)