一種基于社交網(wǎng)絡(luò)的多重關(guān)聯(lián)挖掘的方法和裝置的制造方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及互聯(lián)網(wǎng)技術(shù)領(lǐng)域,尤其涉及一種基于社交網(wǎng)絡(luò)的多重關(guān)聯(lián)挖掘的方法和裝置。
【背景技術(shù)】
[0002]社交網(wǎng)絡(luò)擁有海量的用戶散布世界各地,但這些海量的用戶又會(huì)基于某些共同愛好、目的或某種關(guān)聯(lián)關(guān)系自然聚合,形成多種群體。群體中的成員一般擁有多重網(wǎng)絡(luò)身份,他們可利用多重身份使用多種社交網(wǎng)絡(luò)應(yīng)用與群體中的其他成員建立聯(lián)系,形成特定社交網(wǎng)。如何挖掘出特定團(tuán)體成員之間的關(guān)聯(lián)關(guān)系,并通過定量分析得出關(guān)系間的強(qiáng)弱聯(lián)系,已成為社交網(wǎng)絡(luò)分析的重要方面。目前,針對(duì)社交網(wǎng)絡(luò)關(guān)聯(lián)關(guān)系強(qiáng)弱分析的方法主要是基于圖模型的加權(quán)鏈接矩陣算法或其改進(jìn)算法。該方法將用戶之間的聯(lián)系用加權(quán)鏈接矩陣表示,根據(jù)交互行為的不同形成多個(gè)加權(quán)鏈接矩陣,反映用戶之間的關(guān)聯(lián)關(guān)系,通過最優(yōu)化矩陣重構(gòu),矩陣的稀疏和低秩表達(dá)算法,獲得社交網(wǎng)絡(luò)用戶之間相互關(guān)系的度量。該方法能夠較真實(shí)的反映用戶之間的關(guān)聯(lián)關(guān)系,但是不具有完備性,它更側(cè)重于社交網(wǎng)絡(luò)某個(gè)特有應(yīng)用的分析,對(duì)于多個(gè)應(yīng)用的綜合分析方面缺乏有力支持。另一種分析方法為節(jié)點(diǎn)遍歷統(tǒng)計(jì)法,節(jié)點(diǎn)遍歷統(tǒng)計(jì)法則是通過采用多個(gè)節(jié)點(diǎn)同時(shí)并發(fā)的機(jī)制,即所有節(jié)點(diǎn)都并行推送遍歷信息,還原了點(diǎn)對(duì)點(diǎn)的虛擬賬號(hào)交互軌跡,解決了社交網(wǎng)絡(luò)中需要多次迭代才能遍歷完數(shù)據(jù)的問題,降低了分析的時(shí)間復(fù)雜度,但是隨著網(wǎng)絡(luò)應(yīng)用的與日倶增,單一的分析點(diǎn)對(duì)點(diǎn)的網(wǎng)絡(luò)交互情況,越來越難反映出真實(shí)用戶網(wǎng)絡(luò)交互情況,該方法使用的局限性也越來越大。
【發(fā)明內(nèi)容】
[0003]本發(fā)明要解決的技術(shù)問題是,提供一種基于社交網(wǎng)絡(luò)的多重關(guān)聯(lián)挖掘的方法和裝置,通過對(duì)互聯(lián)網(wǎng)中各個(gè)虛擬人之間的聯(lián)系進(jìn)行定量分析,展現(xiàn)出各個(gè)虛擬人之間聯(lián)系的強(qiáng)弱程度。
[0004]本發(fā)明采用的技術(shù)方案是,所述基于社交網(wǎng)絡(luò)的多重關(guān)聯(lián)挖掘的方法,包括:
[0005]步驟1:針對(duì)具備已知互聯(lián)網(wǎng)賬號(hào)的虛擬人,利用聯(lián)想算法,在互聯(lián)網(wǎng)中挖掘出所述虛擬人的其他互聯(lián)網(wǎng)賬號(hào);
[0006]步驟2:通過多重身份關(guān)聯(lián)算法對(duì)所述虛擬人的所有互聯(lián)網(wǎng)賬號(hào)進(jìn)行處理,得到所述虛擬人的每個(gè)互聯(lián)網(wǎng)賬號(hào)的一度關(guān)聯(lián)結(jié)果集;所述一度關(guān)聯(lián)結(jié)果集中包括:與所述虛擬人的任一互聯(lián)網(wǎng)賬號(hào)有直接聯(lián)系的一度賬號(hào),以及每個(gè)所述一度賬號(hào)的一度賬號(hào)積分;
[0007]步驟3:通過深度聯(lián)系分析算法對(duì)每個(gè)一度關(guān)聯(lián)結(jié)果集進(jìn)行處理,得到每個(gè)所述一度關(guān)聯(lián)結(jié)果集的設(shè)定數(shù)量的重要聯(lián)系人以及每個(gè)所述重要聯(lián)系人的重要聯(lián)系人賬號(hào)集;
[0008]步驟4:針對(duì)每個(gè)所述重要聯(lián)系人的重要聯(lián)系人賬號(hào)集,利用多重關(guān)聯(lián)加權(quán)算法,得到每個(gè)所述重要聯(lián)系人的多重關(guān)聯(lián)加權(quán)值;多重關(guān)聯(lián)加權(quán)值的數(shù)值從高到低代表重要聯(lián)系人與虛擬人的關(guān)系的緊密程度從高到低。
[0009]進(jìn)一步的,步驟I中,利用聯(lián)想算法,在互聯(lián)網(wǎng)中挖掘出所述虛擬人的其他互聯(lián)網(wǎng)賬號(hào),包括:
[0010]根據(jù)所述虛擬人的已知互聯(lián)網(wǎng)賬號(hào),在互聯(lián)網(wǎng)中找到所述已知互聯(lián)網(wǎng)賬號(hào)的上線時(shí)刻、下線時(shí)刻以及IP地址,并在互聯(lián)網(wǎng)中找到所述上線時(shí)刻到下線時(shí)刻的時(shí)間段內(nèi)使用所述IP地址的其他互聯(lián)網(wǎng)賬號(hào);或者,
[0011]根據(jù)所述虛擬人使用已知互聯(lián)網(wǎng)賬號(hào)時(shí)的登錄密碼,在互聯(lián)網(wǎng)中找到使用所述登錄密碼的其他互聯(lián)網(wǎng)賬號(hào)。
[0012]進(jìn)一步的,步驟2中,通過多重身份關(guān)聯(lián)算法對(duì)所述虛擬人的所有互聯(lián)網(wǎng)賬號(hào)進(jìn)行處理,得到所述虛擬人的每個(gè)互聯(lián)網(wǎng)賬號(hào)的一度關(guān)聯(lián)結(jié)果集,包括:
[0013]步驟21:在互聯(lián)網(wǎng)中找到與所述虛擬人的任一互聯(lián)網(wǎng)賬號(hào)有直接聯(lián)系的一度賬號(hào);
[0014]步驟22:計(jì)算每個(gè)所述一度賬號(hào)的一度賬號(hào)積分,所述一度賬號(hào)積分等于在待測時(shí)間段內(nèi)所述一度賬號(hào)與所述虛擬人的任一互聯(lián)網(wǎng)賬號(hào)之間單向聯(lián)系的次數(shù);
[0015]步驟23:將與所述虛擬人的任一互聯(lián)網(wǎng)賬號(hào)有直接聯(lián)系的一度賬號(hào)以及每個(gè)所述一度賬號(hào)的一度賬號(hào)積分組成所述虛擬人的所述互聯(lián)網(wǎng)賬號(hào)的一度關(guān)聯(lián)結(jié)果集。
[0016]進(jìn)一步的,步驟3,包括:
[0017]步驟31:根據(jù)每個(gè)所述一度關(guān)聯(lián)結(jié)果集中一度賬號(hào)的一度賬號(hào)積分的高低,從高到低的選出設(shè)定數(shù)量的一度賬號(hào);
[0018]步驟32:針對(duì)具備選出的所述設(shè)定數(shù)量的一度賬號(hào)的重要聯(lián)系人,利用聯(lián)想算法,在互聯(lián)網(wǎng)中挖掘出每個(gè)重要聯(lián)系人的其他互聯(lián)網(wǎng)賬號(hào);每個(gè)重要聯(lián)系人的所有互聯(lián)網(wǎng)賬號(hào),構(gòu)成了重要聯(lián)系人賬號(hào)集合。
[0019]進(jìn)一步的,步驟4中,利用多重關(guān)聯(lián)加權(quán)算法,得到所述每個(gè)重要聯(lián)系人的多重關(guān)聯(lián)加權(quán)值,包括:
[0020]步驟41:將任一重要聯(lián)系人賬號(hào)集與所有一度關(guān)聯(lián)結(jié)果集進(jìn)行匹配,若所述重要聯(lián)系人賬號(hào)集中的一個(gè)互聯(lián)網(wǎng)賬號(hào)與所有一度關(guān)聯(lián)結(jié)果集中的一個(gè)一度賬號(hào)相同,則匹配成功,記錄所有匹配成功的一度賬號(hào),以及對(duì)應(yīng)的一度賬號(hào)積分;
[0021]步驟42:根據(jù)匹配成功的一度賬號(hào)的應(yīng)用類型,賦予每個(gè)匹配成功的一度賬號(hào)一個(gè)對(duì)應(yīng)的權(quán)重值;
[0022]步驟43:先將每個(gè)匹配成功的一度賬號(hào)的一度賬號(hào)積分與對(duì)應(yīng)的權(quán)重值相乘,得到每個(gè)匹配成功的一度賬號(hào)的乘積結(jié)果,再將每個(gè)所述乘積結(jié)果相加,得到重要聯(lián)系人的多重關(guān)聯(lián)加權(quán)值。
[0023]本發(fā)明還提供一種基于社交網(wǎng)絡(luò)的多重關(guān)聯(lián)挖掘的裝置,包括:
[0024]虛擬身份聯(lián)系挖掘模塊:用于針對(duì)具備已知互聯(lián)網(wǎng)賬號(hào)的虛擬人,利用聯(lián)想算法,在互聯(lián)網(wǎng)中挖掘出所述虛擬人的其他互聯(lián)網(wǎng)賬號(hào);
[0025]多重身份關(guān)聯(lián)模塊:用于通過多重身份關(guān)聯(lián)算法對(duì)所述虛擬人的所有互聯(lián)網(wǎng)賬號(hào)進(jìn)行處理,得到所述虛擬人的每個(gè)互聯(lián)網(wǎng)賬號(hào)的一度關(guān)聯(lián)結(jié)果集;所述一度關(guān)聯(lián)結(jié)果集中包括:與所述虛擬人的任一互聯(lián)網(wǎng)賬號(hào)有直接聯(lián)系的一度賬號(hào),以及每個(gè)所述一度賬號(hào)的一度賬號(hào)積分;
[0026]深度聯(lián)系分析模塊:用于通過深度聯(lián)系分析算法對(duì)每個(gè)一度關(guān)聯(lián)結(jié)果集進(jìn)行處理,得到每個(gè)所述一度關(guān)聯(lián)結(jié)果集的設(shè)定數(shù)量的重要聯(lián)系人以及每個(gè)所述重要聯(lián)系人的重要聯(lián)系人賬號(hào)集;
[0027]多重關(guān)聯(lián)加權(quán)模塊:用于針對(duì)每個(gè)所述重要聯(lián)系人的重要聯(lián)系人賬號(hào)集,利用多重關(guān)聯(lián)加權(quán)算法,得到每個(gè)所述重要聯(lián)系人的多重關(guān)聯(lián)加權(quán)值;多重關(guān)聯(lián)加權(quán)值的數(shù)值從高到低代表重要聯(lián)系人與虛擬人的關(guān)系的緊密程度從高到低。
[0028]進(jìn)一步的,所述虛擬身份聯(lián)系挖掘模塊,具體用于:
[0029]根據(jù)所述虛擬人的已知互聯(lián)網(wǎng)賬號(hào),在互聯(lián)網(wǎng)中找到所述已知互聯(lián)網(wǎng)賬號(hào)的上線時(shí)刻、下線時(shí)刻以及IP地址,并在互聯(lián)網(wǎng)中找到所述上線時(shí)刻到下線時(shí)刻的時(shí)間段內(nèi)使用所述IP地址的其他互聯(lián)網(wǎng)賬號(hào);或者,根據(jù)所述虛擬人使用已知互聯(lián)網(wǎng)賬號(hào)時(shí)的登錄密碼,在互聯(lián)網(wǎng)中找到使用所述登錄密碼的其他互聯(lián)網(wǎng)賬號(hào)。
[0030]進(jìn)一步的,所述多重身份關(guān)聯(lián)模塊,包括:
[0031]查找模塊:用于在互聯(lián)網(wǎng)中找到與所述虛擬人的任一互聯(lián)網(wǎng)賬號(hào)有直接聯(lián)系的一度賬號(hào);
[0032]計(jì)算模塊:用于計(jì)算每個(gè)所述一度賬號(hào)的一度賬號(hào)積分,所述一度賬號(hào)積分等于在待測時(shí)間段內(nèi)所述一度賬號(hào)與所述虛擬人的任一互聯(lián)網(wǎng)賬號(hào)之間單向聯(lián)系的次數(shù);
[0033]確定模塊:用于將與所述虛擬人的任一互聯(lián)網(wǎng)賬號(hào)有直接聯(lián)系的一度賬號(hào)以及每個(gè)所述一度賬號(hào)的一度賬號(hào)積分組成所述虛擬人的所述互聯(lián)網(wǎng)賬號(hào)的一度關(guān)聯(lián)結(jié)果集。
[0034]進(jìn)一步的,所