社會(huì)網(wǎng)絡(luò)傳播拓?fù)渲杏脩?hù)關(guān)系構(gòu)建方法及系統(tǒng)的制作方法
【專(zhuān)利摘要】本發(fā)明提供了一種社會(huì)網(wǎng)絡(luò)傳播拓?fù)渲杏脩?hù)關(guān)系構(gòu)建方法及系統(tǒng),所述方法包括:S1.根據(jù)某一社會(huì)網(wǎng)絡(luò)事件,獲取一個(gè)以上所述社會(huì)網(wǎng)絡(luò)事件的轉(zhuǎn)發(fā)頁(yè)面的鏈接作為種子列表;S2.根據(jù)所述種子列表,通過(guò)網(wǎng)頁(yè)解析方式獲取所述社會(huì)網(wǎng)絡(luò)事件的傳播用戶(hù);S3.將所述社會(huì)網(wǎng)絡(luò)事件的傳播用戶(hù)作為關(guān)注任務(wù),并將所述關(guān)注任務(wù)分為N組;S4.預(yù)設(shè)的N個(gè)登錄賬號(hào)模擬N個(gè)用戶(hù)登錄,分別對(duì)N組關(guān)注任務(wù)執(zhí)行關(guān)注操作,將每個(gè)登錄賬號(hào)得到的用戶(hù)關(guān)注列表作為一個(gè)群組;S5.構(gòu)建群組內(nèi)的用戶(hù)關(guān)系網(wǎng)絡(luò);S6.構(gòu)建本群組內(nèi)的用戶(hù)與其他群組的用戶(hù)關(guān)系網(wǎng)絡(luò)。本發(fā)明可以獲取參與網(wǎng)絡(luò)事件傳播的用戶(hù)之間的關(guān)系。
【專(zhuān)利說(shuō)明】社會(huì)網(wǎng)絡(luò)傳播拓?fù)渲杏脩?hù)關(guān)系構(gòu)建方法及系統(tǒng)
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及網(wǎng)絡(luò)與信息安全【技術(shù)領(lǐng)域】,具體涉及一種社會(huì)網(wǎng)絡(luò)傳播拓?fù)渲杏脩?hù)關(guān)系構(gòu)建方法及系統(tǒng)。
【背景技術(shù)】
[0002]社會(huì)網(wǎng)絡(luò)分析技術(shù)是信息安全和社會(huì)網(wǎng)絡(luò)領(lǐng)域中的核心技術(shù)。其主要任務(wù)是以社會(huì)網(wǎng)絡(luò)中的個(gè)人、群體、事件等不同維度進(jìn)行多角度分析。
[0003]社會(huì)媒體的內(nèi)部結(jié)構(gòu)稱(chēng)為社會(huì)網(wǎng)絡(luò)。社會(huì)網(wǎng)絡(luò)最初起源于1934年美國(guó)社會(huì)心理學(xué)家Moreno對(duì)小群體使用計(jì)量學(xué)的方法進(jìn)行的實(shí)驗(yàn)研究。哈佛大學(xué)的心理學(xué)教授StanleyMilgram在1967年創(chuàng)立了六度分割理論,其主要思想是在網(wǎng)絡(luò)上隨機(jī)抽取的兩個(gè)人之間所間隔的人不會(huì)超過(guò)六個(gè),通過(guò)這個(gè)理論每一個(gè)人物的社交范圍都會(huì)不斷地被放大并形成大型的網(wǎng)絡(luò)。70年代,社會(huì)網(wǎng)絡(luò)研究逐漸成為一個(gè)新興的社會(huì)學(xué)專(zhuān)業(yè),近年來(lái)社交網(wǎng)絡(luò)的相關(guān)研究也成為計(jì)算機(jī)科學(xué)領(lǐng)域的一個(gè)研究熱點(diǎn)。
[0004]2011年2月,著名的IT風(fēng)險(xiǎn)投資人約翰.杜爾提出一個(gè)新興概念ZSoLoMo”。So (Social,社交);Lo (Local,本地位置);Mo (Mobile,移動(dòng))。在此之后,SoLoMo被一致認(rèn)為是互聯(lián)網(wǎng)未來(lái)發(fā)展趨勢(shì),SoLoMo的概念風(fēng)靡全世界。
[0005]隨著社會(huì)網(wǎng)絡(luò)的發(fā)展,截止到2014年I月,F(xiàn)acebook、Twitter、新浪微博的月活躍用戶(hù)數(shù)分別突破了 12.3億、2.55億和1.438億。與此同時(shí),社會(huì)網(wǎng)絡(luò)也產(chǎn)生了大量的用戶(hù)生成內(nèi)容(User Generated Content,UGC)信息,這些UGC信息在社會(huì)網(wǎng)絡(luò)上呈病毒式信息擴(kuò)散,而且傳播速度呈指數(shù)性增長(zhǎng)。
[0006]社會(huì)網(wǎng)絡(luò)中用戶(hù)關(guān)系是維持人與人交流最普遍和最重要的基本屬性之一,通過(guò)用戶(hù)之間的消息傳遞使得事件在網(wǎng)絡(luò)中快速傳播。揭示復(fù)雜網(wǎng)絡(luò)中事件的傳播過(guò)程對(duì)分析網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)、理解其功能、發(fā)現(xiàn)其隱含模式、預(yù)測(cè)其行為都具有十分重要的理論意義和應(yīng)用價(jià)值,在科學(xué)研究、計(jì)算機(jī)科學(xué)、社會(huì)、生物和互聯(lián)網(wǎng)等領(lǐng)域中具有廣泛應(yīng)用。然而,在事件傳播研究領(lǐng)域中,往往分析人員很難獲取到參與事件討論用戶(hù)之間的關(guān)系,現(xiàn)在還沒(méi)有一種非常有效的事件傳播中用戶(hù)關(guān)系構(gòu)建方法。
【發(fā)明內(nèi)容】
[0007]針對(duì)現(xiàn)有技術(shù)中的缺陷,本發(fā)明提供一種社會(huì)網(wǎng)絡(luò)傳播拓?fù)渲杏脩?hù)關(guān)系構(gòu)建方法及系統(tǒng),以獲取參與網(wǎng)絡(luò)事件傳播的用戶(hù)之間的關(guān)系。
[0008]第一方面,本發(fā)明提供一種社會(huì)網(wǎng)絡(luò)傳播拓?fù)渲杏脩?hù)關(guān)系構(gòu)建方法,所述方法包括:
[0009]S1.根據(jù)某一社會(huì)網(wǎng)絡(luò)事件,獲取一個(gè)以上所述社會(huì)網(wǎng)絡(luò)事件的轉(zhuǎn)發(fā)頁(yè)面的鏈接作為種子列表;
[0010]S2.根據(jù)所述種子列表,通過(guò)網(wǎng)頁(yè)解析方式獲取所述社會(huì)網(wǎng)絡(luò)事件的傳播用戶(hù);
[0011]S3.將所述社會(huì)網(wǎng)絡(luò)事件的傳播用戶(hù)作為關(guān)注任務(wù),并將所述關(guān)注任務(wù)分為N組;
[0012]S4.預(yù)設(shè)的N個(gè)登錄賬號(hào)模擬N個(gè)用戶(hù)登錄,分別對(duì)N組關(guān)注任務(wù)執(zhí)行關(guān)注操作,將每個(gè)登錄賬號(hào)得到的用戶(hù)關(guān)注列表作為一個(gè)群組;
[0013]S5.依次進(jìn)入各群組中用戶(hù)的共同關(guān)注頁(yè)面,并將共同關(guān)注的用戶(hù)信息存儲(chǔ)至所述群組的用戶(hù)關(guān)注列表中,通過(guò)用戶(hù)之間的關(guān)注信息,構(gòu)建群組內(nèi)的用戶(hù)關(guān)系網(wǎng)絡(luò);
[0014]S6.每個(gè)登錄賬號(hào)依次訪問(wèn)其他登錄賬號(hào)得到的群組中的用戶(hù),通過(guò)用戶(hù)之間的關(guān)注信息,構(gòu)建本群組內(nèi)的用戶(hù)與其他群組的用戶(hù)關(guān)系網(wǎng)絡(luò)。
[0015]其中,步驟S2中所述社會(huì)網(wǎng)絡(luò)事件的傳播用戶(hù)包括社會(huì)網(wǎng)絡(luò)事件的原創(chuàng)用戶(hù)和轉(zhuǎn)發(fā)用戶(hù)。
[0016]其中,所述方法還包括:步驟S2中,在所述通過(guò)網(wǎng)頁(yè)解析方式獲取所述社會(huì)網(wǎng)絡(luò)事件的傳播用戶(hù)之后,對(duì)所述社會(huì)網(wǎng)絡(luò)事件的傳播用戶(hù)進(jìn)行去重。
[0017]其中,步驟S4中所述預(yù)設(shè)的N個(gè)登錄賬號(hào)模擬N個(gè)用戶(hù)登錄為:
[0018]通過(guò)模擬瀏覽器的形式,以post請(qǐng)求形式與社會(huì)網(wǎng)絡(luò)服務(wù)器進(jìn)行直接通信,將N個(gè)登錄賬號(hào)的用戶(hù)名和密碼信息打包發(fā)送至社會(huì)網(wǎng)絡(luò)服務(wù)器端,通過(guò)驗(yàn)證后實(shí)現(xiàn)N個(gè)用戶(hù)登錄。
[0019]其中,步驟S4中所述群組為每個(gè)登錄賬號(hào)通過(guò)網(wǎng)頁(yè)解析的方式添加的關(guān)注,被關(guān)注者為參與社會(huì)網(wǎng)絡(luò)事件的傳播用戶(hù)。
[0020]其中,步驟S5和步驟S6中所述用戶(hù)關(guān)系網(wǎng)絡(luò)為所述社會(huì)網(wǎng)絡(luò)事件的傳播用戶(hù)之間,通過(guò)關(guān)注和粉絲兩種連接關(guān)系形成的節(jié)點(diǎn)網(wǎng)絡(luò)拓?fù)洹?br>
[0021]第二方面,本發(fā)明還提供了一種社會(huì)網(wǎng)絡(luò)傳播拓?fù)渲杏脩?hù)關(guān)系構(gòu)建系統(tǒng),所述系統(tǒng)包括:
[0022]種子列表獲取模塊,用于根據(jù)某一社會(huì)網(wǎng)絡(luò)事件,獲取一個(gè)以上所述社會(huì)網(wǎng)絡(luò)事件的轉(zhuǎn)發(fā)頁(yè)面的鏈接作為種子列表;
[0023]社會(huì)網(wǎng)絡(luò)事件的傳播用戶(hù)獲取模塊,用于根據(jù)社會(huì)網(wǎng)絡(luò)事件獲取模塊發(fā)送的種子列表,通過(guò)網(wǎng)頁(yè)解析方式獲取所述社會(huì)網(wǎng)絡(luò)事件的傳播用戶(hù);
[0024]關(guān)注任務(wù)分配模塊,用于將所述社會(huì)網(wǎng)絡(luò)事件的傳播用戶(hù)作為關(guān)注任務(wù)分為N組,將N組關(guān)注任務(wù)分配給N個(gè)登錄賬號(hào);
[0025]關(guān)注模塊,用于使預(yù)設(shè)的N個(gè)登錄賬號(hào)模擬N個(gè)用戶(hù)登錄,分別對(duì)N組關(guān)注任務(wù)執(zhí)行關(guān)注操作,將每個(gè)登錄賬號(hào)得到的用戶(hù)關(guān)注列表作為一個(gè)群組;
[0026]共同關(guān)注獲取模塊,用于依次進(jìn)入各群組中用戶(hù)的共同關(guān)注頁(yè)面,并將共同關(guān)注的用戶(hù)信息存儲(chǔ)至所述群組的用戶(hù)關(guān)注列表中,通過(guò)用戶(hù)之間的關(guān)注信息,構(gòu)建群組內(nèi)的用戶(hù)關(guān)系網(wǎng)絡(luò);
[0027]二級(jí)關(guān)注獲取模塊,用于使每個(gè)登錄賬號(hào)依次訪問(wèn)其他登錄賬號(hào)得到的群組中的用戶(hù),通過(guò)用戶(hù)之間的關(guān)注信息,構(gòu)建本群組內(nèi)的用戶(hù)與其他群組的用戶(hù)關(guān)系網(wǎng)絡(luò)。
[0028]其中,所述系統(tǒng)還包括重復(fù)項(xiàng)識(shí)別模塊,用于對(duì)社會(huì)網(wǎng)絡(luò)事件的傳播用戶(hù)獲取模塊獲取的社會(huì)網(wǎng)絡(luò)事件的傳播用戶(hù)進(jìn)行去重。
[0029]其中,社會(huì)網(wǎng)絡(luò)事件的傳播用戶(hù)獲取模塊中所述社會(huì)網(wǎng)絡(luò)事件的傳播用戶(hù)包括社會(huì)網(wǎng)絡(luò)事件的原創(chuàng)用戶(hù)和轉(zhuǎn)發(fā)用戶(hù)。
[0030]其中,共同關(guān)注獲取模塊和二級(jí)關(guān)注獲取模塊中的所述用戶(hù)關(guān)系網(wǎng)絡(luò)為所述社會(huì)網(wǎng)絡(luò)事件的傳播用戶(hù)之間,通過(guò)關(guān)注和粉絲兩種連接關(guān)系形成的節(jié)點(diǎn)網(wǎng)絡(luò)拓?fù)洹?br>
[0031]由上述技術(shù)方案可知,
[0032]本發(fā)明的社會(huì)網(wǎng)絡(luò)傳播拓?fù)渲杏脩?hù)關(guān)系構(gòu)建方法及系統(tǒng),采用了一個(gè)有效且高效的框架構(gòu)建轉(zhuǎn)發(fā)網(wǎng)絡(luò)信息的用戶(hù)之間的關(guān)系,設(shè)計(jì)了一種基于共同關(guān)注的方法對(duì)未知關(guān)系的兩個(gè)用戶(hù)進(jìn)行邊連接,識(shí)別其是否存在關(guān)注屬性,同時(shí)可以采用多線程的方式并發(fā)實(shí)現(xiàn)關(guān)注操作,即保證了系統(tǒng)的執(zhí)行效率又防止了社會(huì)網(wǎng)絡(luò)的異常用戶(hù)審查機(jī)制。
【專(zhuān)利附圖】
【附圖說(shuō)明】
[0033]為了更清楚地說(shuō)明本發(fā)明實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對(duì)實(shí)施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡(jiǎn)單地介紹,顯而易見(jiàn)地,下面描述中的附圖是本發(fā)明的一些實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來(lái)講,在不付出創(chuàng)造性勞動(dòng)的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
[0034]圖1是本發(fā)明實(shí)施例一提供的社會(huì)網(wǎng)絡(luò)傳播拓?fù)渲杏脩?hù)關(guān)系構(gòu)建方法的流程圖;
[0035]圖2是社會(huì)網(wǎng)絡(luò)事件傳播拓?fù)渲杏脩?hù)關(guān)系示例圖;
[0036]圖3是社會(huì)網(wǎng)絡(luò)事件傳播拓?fù)涫纠龍D;
[0037]圖4是本發(fā)明實(shí)施例三提供的社會(huì)網(wǎng)絡(luò)傳播拓?fù)渲杏脩?hù)關(guān)系構(gòu)建系統(tǒng)結(jié)構(gòu)示意圖。
【具體實(shí)施方式】
[0038]為使本發(fā)明實(shí)施例的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整的描述,顯然,所描述的實(shí)施例是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例。基于本發(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒(méi)有作出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
[0039]圖1示出了本發(fā)明實(shí)施例一提供的社會(huì)網(wǎng)絡(luò)傳播拓?fù)渲杏脩?hù)關(guān)系構(gòu)建方法的流程圖,圖2和圖3分別示出了社會(huì)網(wǎng)絡(luò)事件傳播拓?fù)渲杏脩?hù)關(guān)系示例圖和社會(huì)網(wǎng)絡(luò)事件傳播拓?fù)涫纠龍D。
[0040]如圖1所示,本實(shí)施例的社會(huì)網(wǎng)絡(luò)傳播拓?fù)渲杏脩?hù)關(guān)系構(gòu)建方法如下所述。
[0041]步驟101:根據(jù)某一社會(huì)網(wǎng)絡(luò)事件,獲取一個(gè)以上所述社會(huì)網(wǎng)絡(luò)事件的轉(zhuǎn)發(fā)頁(yè)面的鏈接作為種子列表。
[0042]步驟102:根據(jù)所述種子列表,通過(guò)網(wǎng)頁(yè)解析方式獲取所述社會(huì)網(wǎng)絡(luò)事件的傳播用戶(hù)。
[0043]在本步驟中,根據(jù)所述種子列表,通過(guò)網(wǎng)頁(yè)解析方式獲取所述社會(huì)網(wǎng)絡(luò)事件的傳播用戶(hù),并將其加入到用戶(hù)列表中,所述用戶(hù)列表包括用戶(hù)ID、用戶(hù)名稱(chēng)、主頁(yè)鏈接等。
[0044]其中,所述社會(huì)網(wǎng)絡(luò)事件的傳播用戶(hù)包括社會(huì)網(wǎng)絡(luò)事件的原創(chuàng)用戶(hù)和轉(zhuǎn)發(fā)用戶(hù)。
[0045]優(yōu)選地,在所述通過(guò)網(wǎng)頁(yè)解析方式獲取所述社會(huì)網(wǎng)絡(luò)事件的傳播用戶(hù)之后,對(duì)所述社會(huì)網(wǎng)絡(luò)事件的傳播用戶(hù)進(jìn)行去重。
[0046]步驟103:將所述社會(huì)網(wǎng)絡(luò)事件的傳播用戶(hù)作為關(guān)注任務(wù),并將所述關(guān)注任務(wù)分為N組。
[0047]步驟104:預(yù)設(shè)的N個(gè)登錄賬號(hào)模擬N個(gè)用戶(hù)登錄,執(zhí)行關(guān)注操作。
[0048]在本步驟中,首先需要?jiǎng)?chuàng)建N個(gè)登錄賬號(hào),將用戶(hù)名和密碼存儲(chǔ)至數(shù)組中,以post請(qǐng)求形式與社會(huì)網(wǎng)絡(luò)服務(wù)器進(jìn)行直接通信,將N個(gè)登錄賬號(hào)的用戶(hù)名和密碼信息打包發(fā)送至社會(huì)網(wǎng)絡(luò)服務(wù)器端,通過(guò)驗(yàn)證后實(shí)現(xiàn)N個(gè)用戶(hù)登錄,上述步驟103中已經(jīng)為每個(gè)登錄賬號(hào)分配好關(guān)注任務(wù),關(guān)注任務(wù)為所述社會(huì)網(wǎng)絡(luò)事件的傳播用戶(hù)。
[0049]步驟105:判斷是否產(chǎn)生驗(yàn)證碼,若是,產(chǎn)生驗(yàn)證碼的登錄賬號(hào)開(kāi)始休眠;否則執(zhí)行步驟106。
[0050]在本步驟中,若某登錄賬號(hào)在登錄時(shí)產(chǎn)生驗(yàn)證碼,則統(tǒng)計(jì)該登錄賬號(hào)出現(xiàn)驗(yàn)證碼的次數(shù)N,并計(jì)算本次線程休眠時(shí)間,休眠結(jié)束后執(zhí)行步驟104。
[0051]步驟106:更新該登錄賬號(hào)完成關(guān)注任務(wù)的標(biāo)志位,等待其他登錄賬號(hào)的結(jié)束,當(dāng)所述登錄賬號(hào)均完成關(guān)注任務(wù)后,執(zhí)行步驟107。
[0052]步驟107:將每個(gè)登錄賬號(hào)得到的用戶(hù)關(guān)注列表作為一個(gè)群組,依次進(jìn)入各群組中用戶(hù)的共同關(guān)注頁(yè)面,并將共同關(guān)注的用戶(hù)信息存儲(chǔ)至所述群組的用戶(hù)關(guān)注列表中,通過(guò)用戶(hù)之間的關(guān)注信息,構(gòu)建群組內(nèi)的用戶(hù)關(guān)系網(wǎng)絡(luò)。
[0053]步驟108:每個(gè)登錄賬號(hào)依次訪問(wèn)其他登錄賬號(hào)得到的群組中的用戶(hù),通過(guò)用戶(hù)之間的關(guān)注信息,構(gòu)建本群組內(nèi)的用戶(hù)與其他群組的用戶(hù)關(guān)系網(wǎng)絡(luò)。
[0054]通過(guò)步驟107和108,最終實(shí)現(xiàn)參與事件傳播的用戶(hù)之間的關(guān)系拓?fù)渚W(wǎng)絡(luò)。
[0055]由此本實(shí)施例的社會(huì)網(wǎng)絡(luò)傳播拓?fù)渲杏脩?hù)關(guān)系構(gòu)建方法,采用了一個(gè)有效且高效的框架構(gòu)建轉(zhuǎn)發(fā)網(wǎng)絡(luò)信息的用戶(hù)之間的關(guān)系,設(shè)計(jì)了一種基于共同關(guān)注的方法對(duì)未知關(guān)系的兩個(gè)用戶(hù)進(jìn)行邊連接,識(shí)別其是否存在關(guān)注屬性,同時(shí)可以采用多線程的方式并發(fā)實(shí)現(xiàn)關(guān)注操作,即保證了系統(tǒng)的執(zhí)行效率又防止了社會(huì)網(wǎng)絡(luò)的異常用戶(hù)審查機(jī)制。
[0056]本實(shí)施例的社會(huì)網(wǎng)絡(luò)傳播拓?fù)渲杏脩?hù)關(guān)系構(gòu)建方法,創(chuàng)新性地采用基于共同關(guān)注、關(guān)注的關(guān)注、網(wǎng)頁(yè)解析登錄等方法實(shí)現(xiàn)對(duì)網(wǎng)絡(luò)事件傳播中用戶(hù)之間的關(guān)系進(jìn)行構(gòu)建,確保了用戶(hù)關(guān)系網(wǎng)絡(luò)的真實(shí)性與準(zhǔn)確性。
[0057]本實(shí)施例二以新浪微博為例,說(shuō)明本發(fā)明的技術(shù)方案。本實(shí)施例二的事件傳播中用戶(hù)關(guān)系的構(gòu)建方法包括步驟與上述實(shí)施例一的【具體實(shí)施方式】相同,由于新浪微博對(duì)于用戶(hù)的批量關(guān)注操作具有審查機(jī)制,并嚴(yán)格限制網(wǎng)頁(yè)機(jī)器人行為,當(dāng)進(jìn)行單一關(guān)注操作到達(dá)一定次數(shù)后將返回驗(yàn)證碼,因此需要等待一段時(shí)間后再執(zhí)行相關(guān)動(dòng)作。
[0058]在獲取轉(zhuǎn)發(fā)用戶(hù)列表過(guò)程中,會(huì)遇到翻頁(yè)問(wèn)題。當(dāng)某個(gè)事件轉(zhuǎn)發(fā)量較大時(shí),無(wú)法一次性返回全部用戶(hù)信息,而是采用翻頁(yè)形式,每次翻頁(yè)會(huì)得到最多20條用戶(hù)信息,最終將全部獲取的信息去重后融合到一起,因此需要針對(duì)當(dāng)前頁(yè)號(hào)、翻頁(yè)次數(shù)等現(xiàn)象進(jìn)行判斷。
[0059]通過(guò)網(wǎng)頁(yè)解析方式實(shí)現(xiàn)新浪微博的登錄,并新浪中若干熱門(mén)微博為種子節(jié)點(diǎn),經(jīng)過(guò)系統(tǒng)的用戶(hù)關(guān)系構(gòu)建方法,最終實(shí)現(xiàn)了將參與事件轉(zhuǎn)發(fā)的用戶(hù)通過(guò)“關(guān)注、粉絲”的關(guān)系連接起來(lái)。在采用多賬號(hào)多線程同步執(zhí)行關(guān)注操作的情況下,程序的時(shí)間復(fù)雜度為0(m*n),其中m代表登錄賬號(hào)的個(gè)數(shù),η代表時(shí)間傳播過(guò)程中參與用戶(hù)的人數(shù)。
[0060]圖4示出了實(shí)施例三提供的社會(huì)網(wǎng)絡(luò)傳播拓?fù)渲杏脩?hù)關(guān)系構(gòu)建系統(tǒng)的結(jié)構(gòu)圖,如圖4所示,本實(shí)施例的社會(huì)網(wǎng)絡(luò)傳播拓?fù)渲杏脩?hù)關(guān)系構(gòu)建系統(tǒng)包括種子列表獲取模塊401、社會(huì)網(wǎng)絡(luò)事件的傳播用戶(hù)獲取模塊402、關(guān)注任務(wù)分配模塊403、關(guān)注模塊404、共同關(guān)注獲取模塊405和二級(jí)關(guān)注獲取模塊406 ;
[0061]其中,
[0062]種子列表獲取模塊401,用于根據(jù)某一社會(huì)網(wǎng)絡(luò)事件,獲取一個(gè)以上所述社會(huì)網(wǎng)絡(luò)事件的轉(zhuǎn)發(fā)頁(yè)面的鏈接作為種子列表;
[0063]社會(huì)網(wǎng)絡(luò)事件的傳播用戶(hù)獲取模塊402,用于根據(jù)社會(huì)網(wǎng)絡(luò)事件獲取模塊發(fā)送的種子列表,通過(guò)網(wǎng)頁(yè)解析方式獲取所述社會(huì)網(wǎng)絡(luò)事件的傳播用戶(hù);
[0064]關(guān)注任務(wù)分配模塊403,用于將所述社會(huì)網(wǎng)絡(luò)事件的傳播用戶(hù)作為關(guān)注任務(wù)分為N組,將N組關(guān)注任務(wù)分配給N個(gè)登錄賬號(hào);
[0065]關(guān)注模塊404,用于使預(yù)設(shè)的N個(gè)登錄賬號(hào)模擬N個(gè)用戶(hù)登錄,分別對(duì)N組關(guān)注任務(wù)執(zhí)行關(guān)注操作,將每個(gè)登錄賬號(hào)得到的用戶(hù)關(guān)注列表作為一個(gè)群組;
[0066]共同關(guān)注獲取模塊405,用于依次進(jìn)入各群組中用戶(hù)的共同關(guān)注頁(yè)面,并將共同關(guān)注的用戶(hù)信息存儲(chǔ)至所述群組的用戶(hù)關(guān)注列表中,通過(guò)用戶(hù)之間的關(guān)注信息,構(gòu)建群組內(nèi)的用戶(hù)關(guān)系網(wǎng)絡(luò);
[0067]二級(jí)關(guān)注獲取模塊406,用于使每個(gè)登錄賬號(hào)依次訪問(wèn)其他登錄賬號(hào)得到的群組中的用戶(hù),通過(guò)用戶(hù)之間的關(guān)注信息,構(gòu)建本群組內(nèi)的用戶(hù)與其他群組的用戶(hù)關(guān)系網(wǎng)絡(luò)。
[0068]其中,所述系統(tǒng)還包括重復(fù)項(xiàng)識(shí)別模塊407,用于對(duì)社會(huì)網(wǎng)絡(luò)事件的傳播用戶(hù)獲取模塊獲取的社會(huì)網(wǎng)絡(luò)事件的傳播用戶(hù)進(jìn)行去重。
[0069]其中,會(huì)網(wǎng)絡(luò)事件的傳播用戶(hù)獲取模塊中所述社會(huì)網(wǎng)絡(luò)事件的傳播用戶(hù)包括社會(huì)網(wǎng)絡(luò)事件的原創(chuàng)用戶(hù)和轉(zhuǎn)發(fā)用戶(hù)。
[0070]其中,共同關(guān)注獲取模塊和二級(jí)關(guān)注獲取模塊中的所述用戶(hù)關(guān)系網(wǎng)絡(luò)為所述社會(huì)網(wǎng)絡(luò)事件的傳播用戶(hù)之間,通過(guò)關(guān)注和粉絲兩種連接關(guān)系形成的節(jié)點(diǎn)網(wǎng)絡(luò)拓?fù)洹?br>
[0071]本實(shí)施例所述的系統(tǒng),可以用于執(zhí)行圖1所示方法實(shí)施例的技術(shù)方案,其實(shí)現(xiàn)原理和技術(shù)效果類(lèi)似,此處不再贅述。
[0072]以上實(shí)施例僅用于說(shuō)明本發(fā)明的技術(shù)方案,而非對(duì)其限制;盡管參照前述實(shí)施例對(duì)本發(fā)明進(jìn)行了詳細(xì)的說(shuō)明,本領(lǐng)域的普通技術(shù)人員應(yīng)當(dāng)理解:其依然可以對(duì)前述各實(shí)施例所記載的技術(shù)方案進(jìn)行修改,或者對(duì)其中部分技術(shù)特征進(jìn)行等同替換;而這些修改或替換,并不使相應(yīng)技術(shù)方案的本質(zhì)脫離本發(fā)明各實(shí)施例技術(shù)方案的精神和范圍。
【權(quán)利要求】
1.一種社會(huì)網(wǎng)絡(luò)傳播拓?fù)渲杏脩?hù)關(guān)系構(gòu)建方法,其特征在于,所述方法包括: 51.根據(jù)某一社會(huì)網(wǎng)絡(luò)事件,獲取一個(gè)以上所述社會(huì)網(wǎng)絡(luò)事件的轉(zhuǎn)發(fā)頁(yè)面的鏈接作為種子列表; 52.根據(jù)所述種子列表,通過(guò)網(wǎng)頁(yè)解析方式獲取所述社會(huì)網(wǎng)絡(luò)事件的傳播用戶(hù); 53.將所述社會(huì)網(wǎng)絡(luò)事件的傳播用戶(hù)作為關(guān)注任務(wù),并將所述關(guān)注任務(wù)分為N組; 54.預(yù)設(shè)的N個(gè)登錄賬號(hào)模擬N個(gè)用戶(hù)登錄,分別對(duì)N組關(guān)注任務(wù)執(zhí)行關(guān)注操作,將每個(gè)登錄賬號(hào)得到的用戶(hù)關(guān)注列表作為一個(gè)群組; 55.依次進(jìn)入各群組中用戶(hù)的共同關(guān)注頁(yè)面,并將共同關(guān)注的用戶(hù)信息存儲(chǔ)至所述群組的用戶(hù)關(guān)注列表中,通過(guò)用戶(hù)之間的關(guān)注信息,構(gòu)建群組內(nèi)的用戶(hù)關(guān)系網(wǎng)絡(luò); 56.每個(gè)登錄賬號(hào)依次訪問(wèn)其他登錄賬號(hào)得到的群組中的用戶(hù),通過(guò)用戶(hù)之間的關(guān)注信息,構(gòu)建本群組內(nèi)的用戶(hù)與其他群組的用戶(hù)關(guān)系網(wǎng)絡(luò)。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,步驟S2中所述社會(huì)網(wǎng)絡(luò)事件的傳播用戶(hù)包括社會(huì)網(wǎng)絡(luò)事件的原創(chuàng)用戶(hù)和轉(zhuǎn)發(fā)用戶(hù)。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述方法還包括:步驟S2中,在所述通過(guò)網(wǎng)頁(yè)解析方式獲取所述社會(huì)網(wǎng)絡(luò)事件的傳播用戶(hù)之后,對(duì)所述社會(huì)網(wǎng)絡(luò)事件的傳播用戶(hù)進(jìn)行去重。
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,步驟S4中所述預(yù)設(shè)的N個(gè)登錄賬號(hào)模擬N個(gè)用戶(hù)登錄為: 通過(guò)模擬瀏覽器的形式,以post請(qǐng)求形式與社會(huì)網(wǎng)絡(luò)服務(wù)器進(jìn)行直接通信,將N個(gè)登錄賬號(hào)的用戶(hù)名和密碼信息打包發(fā)送至社會(huì)網(wǎng)絡(luò)服務(wù)器端,通過(guò)驗(yàn)證后實(shí)現(xiàn)N個(gè)用戶(hù)登錄。
5.根據(jù)權(quán)利要求1所述的方法,其特征在于,步驟S4中所述群組為每個(gè)登錄賬號(hào)通過(guò)網(wǎng)頁(yè)解析的方式添加的關(guān)注,被關(guān)注者為參與社會(huì)網(wǎng)絡(luò)事件的傳播用戶(hù)。
6.根據(jù)權(quán)利要求5所述的方法,其特征在于,步驟S5和步驟S6中所述用戶(hù)關(guān)系網(wǎng)絡(luò)為所述社會(huì)網(wǎng)絡(luò)事件的傳播用戶(hù)之間,通過(guò)關(guān)注和粉絲兩種連接關(guān)系形成的節(jié)點(diǎn)網(wǎng)絡(luò)拓?fù)洹?br>
7.—種社會(huì)網(wǎng)絡(luò)傳播拓?fù)渲杏脩?hù)關(guān)系構(gòu)建系統(tǒng),其特征在于,所述系統(tǒng)包括: 種子列表獲取模塊,用于根據(jù)某一社會(huì)網(wǎng)絡(luò)事件,獲取一個(gè)以上所述社會(huì)網(wǎng)絡(luò)事件的轉(zhuǎn)發(fā)頁(yè)面的鏈接作為種子列表; 社會(huì)網(wǎng)絡(luò)事件的傳播用戶(hù)獲取模塊,用于根據(jù)社會(huì)網(wǎng)絡(luò)事件獲取模塊發(fā)送的種子列表,通過(guò)網(wǎng)頁(yè)解析方式獲取所述社會(huì)網(wǎng)絡(luò)事件的傳播用戶(hù); 關(guān)注任務(wù)分配模塊,用于將所述社會(huì)網(wǎng)絡(luò)事件的傳播用戶(hù)作為關(guān)注任務(wù)分為N組,將N組關(guān)注任務(wù)分配給N個(gè)登錄賬號(hào); 關(guān)注模塊,用于使預(yù)設(shè)的N個(gè)登錄賬號(hào)模擬N個(gè)用戶(hù)登錄,分別對(duì)N組關(guān)注任務(wù)執(zhí)行關(guān)注操作,將每個(gè)登錄賬號(hào)得到的用戶(hù)關(guān)注列表作為一個(gè)群組; 共同關(guān)注獲取模塊,用于依次進(jìn)入各群組中用戶(hù)的共同關(guān)注頁(yè)面,并將共同關(guān)注的用戶(hù)信息存儲(chǔ)至所述群組的用戶(hù)關(guān)注列表中,通過(guò)用戶(hù)之間的關(guān)注信息,構(gòu)建群組內(nèi)的用戶(hù)關(guān)系網(wǎng)絡(luò); 二級(jí)關(guān)注獲取模塊,用于使每個(gè)登錄賬號(hào)依次訪問(wèn)其他登錄賬號(hào)得到的群組中的用戶(hù),通過(guò)用戶(hù)之間的關(guān)注信息,構(gòu)建本群組內(nèi)的用戶(hù)與其他群組的用戶(hù)關(guān)系網(wǎng)絡(luò)。
8.根據(jù)權(quán)利要求7所述的系統(tǒng),其特征在于,所述系統(tǒng)還包括重復(fù)項(xiàng)識(shí)別模塊,用于對(duì)社會(huì)網(wǎng)絡(luò)事件的傳播用戶(hù)獲取模塊獲取的社會(huì)網(wǎng)絡(luò)事件的傳播用戶(hù)進(jìn)行去重。
9.根據(jù)權(quán)利要求7所述的系統(tǒng),其特征在于,社會(huì)網(wǎng)絡(luò)事件的傳播用戶(hù)獲取模塊中所述社會(huì)網(wǎng)絡(luò)事件的傳播用戶(hù)包括社會(huì)網(wǎng)絡(luò)事件的原創(chuàng)用戶(hù)和轉(zhuǎn)發(fā)用戶(hù)。
10.根據(jù)權(quán)利要求7所述的系統(tǒng),其特征在于,共同關(guān)注獲取模塊和二級(jí)關(guān)注獲取模塊中的所述用戶(hù)關(guān)系網(wǎng)絡(luò)為所述社會(huì)網(wǎng)絡(luò)事件的傳播用戶(hù)之間,通過(guò)關(guān)注和粉絲兩種連接關(guān)系形成的節(jié)點(diǎn)網(wǎng)絡(luò)拓?fù)洹?br>
【文檔編號(hào)】H04L29/08GK104243234SQ201410461022
【公開(kāi)日】2014年12月24日 申請(qǐng)日期:2014年9月11日 優(yōu)先權(quán)日:2014年9月11日
【發(fā)明者】薛一波, 姜京池, 易成岐 申請(qǐng)人:清華大學(xué)