使用加權(quán)分析動(dòng)態(tài)確定社交數(shù)據(jù)網(wǎng)絡(luò)中影響者的系統(tǒng)和方法
【專利摘要】本發(fā)明提供了通過服務(wù)器實(shí)施的、用于確定社交網(wǎng)絡(luò)中的加權(quán)影響的系統(tǒng)和方法,包括:確定與話題相關(guān)的帖子;將每個(gè)帖子描述成以下各項(xiàng)中的一項(xiàng)或多項(xiàng):回復(fù)帖子、提及帖子以及轉(zhuǎn)帖;生成用戶賬戶組,所述用戶賬戶組中包括創(chuàng)作被回復(fù)的帖子、在所述提及帖子中被提及的帖子,發(fā)布被轉(zhuǎn)帖的內(nèi)容,以及/或者創(chuàng)作與所述話題相關(guān)的一個(gè)或多個(gè)帖子的任何用戶賬戶;在相連圖中將每個(gè)所述用戶賬戶表示成所述組中的節(jié)點(diǎn),并且在一個(gè)或多個(gè)節(jié)點(diǎn)對(duì)之間存在追隨者?被追隨者關(guān)系時(shí),在所述節(jié)點(diǎn)之間建立邊緣;以及對(duì)于節(jié)點(diǎn)之間的每個(gè)邊緣,確定加權(quán),所述加權(quán)是以下各項(xiàng)中的一項(xiàng)或多項(xiàng)的函數(shù):提及帖子的數(shù)量、回復(fù)帖子的數(shù)量以及轉(zhuǎn)帖的數(shù)量。
【專利說明】使用加權(quán)分析動(dòng)態(tài)確定社交數(shù)據(jù)網(wǎng)絡(luò)中影響者的系統(tǒng)和方法
相關(guān)申請(qǐng)的交叉引用:
[0001 ]本申請(qǐng)請(qǐng)求于2013年10月25日遞交的、標(biāo)題為“確定社交數(shù)據(jù)網(wǎng)絡(luò)中的影響者的系統(tǒng)和方法,,(Systems and Methods for Determining Influencers in a Social DataNetwork)的第61/895,539號(hào)美國臨時(shí)專利申請(qǐng)、于2013年11月22日遞交的標(biāo)題為“確定社交數(shù)據(jù)網(wǎng)絡(luò)中的影響者及其社區(qū)的系統(tǒng)和方法”(Systems and Methods for IdentifyingInfluencers and Their Communities in a Social Data Network)的第61/907,878號(hào)美國臨時(shí)專利申請(qǐng),以及于2014年7月3日遞交的標(biāo)題為“使用加權(quán)分析動(dòng)態(tài)地確定社交數(shù)據(jù)網(wǎng)絡(luò)中的影響者的系統(tǒng)和方法”(Systems and Methods for Dynamically DeterminingInfluencers in a Social Data Network Using Weighted Analysis)的第62/020,833號(hào)美國臨時(shí)專利申請(qǐng)的優(yōu)先權(quán),并且該專利申請(qǐng)以引用方式全文并入本文。
技術(shù)領(lǐng)域
[0002]以下內(nèi)容總體上涉及分析社交網(wǎng)絡(luò)數(shù)據(jù)。
背景
[0001]近年來,社交媒體已經(jīng)成為個(gè)人和消費(fèi)者在線(例如,在互聯(lián)網(wǎng)上)交互的流行方式。社交媒體還影響企業(yè)目的在于和其客戶、粉絲、和潛在客戶在線交互的方式。
[0002]獲得廣泛關(guān)注的一些特定話題的博客被識(shí)別并且用于為特定產(chǎn)品提供支持或者贊助。例如,熱門博客網(wǎng)站中的廣告位被用于推廣相關(guān)的產(chǎn)品和服務(wù)。
[0003]社交網(wǎng)絡(luò)平臺(tái)被用于影響用戶群體。社交網(wǎng)絡(luò)平臺(tái)的示例包括臉譜網(wǎng)(Facebook)、推特(Twitter)、領(lǐng)英(LinkedIn)、湯博樂(Tumblr)和拼趣(Pinterest)等熟知的品牌。社交網(wǎng)絡(luò)平臺(tái)內(nèi)的熱門或者專家人士可用于向其他人進(jìn)行推廣。隨著社交網(wǎng)絡(luò)用戶數(shù)量的增長(zhǎng),迅速識(shí)別熱門或者有影響力的個(gè)人變得更加困難。此外,也難以識(shí)別特定話題的有影響力的個(gè)人。在本文中,社交網(wǎng)絡(luò)中的專家或者熱門用戶均可替換地稱為“影響者”。
附圖簡(jiǎn)要說明
[0004]現(xiàn)在參考附圖僅通過舉例方式來描述實(shí)施例,在附圖中:
[0005]圖1是社交數(shù)據(jù)網(wǎng)絡(luò)中的彼此關(guān)聯(lián)的用戶的圖示。
[0006]圖2是與計(jì)算裝置通信的服務(wù)器的示意圖。
[0007]圖3是用于基于加權(quán)關(guān)系,確定指定話題的用戶與影響者社區(qū)之間的加權(quán)關(guān)系的計(jì)算機(jī)可執(zhí)行指令的示例性實(shí)施例的流程圖。
[0008]圖4是用于基于加權(quán)關(guān)系,確定影響者的社區(qū)的計(jì)算機(jī)可執(zhí)行指令的另一個(gè)示例性實(shí)施例的流程圖。
[0009]圖5是用于基于加權(quán)關(guān)系,確定影響者的社區(qū)的計(jì)算機(jī)可執(zhí)行指令的另一個(gè)示例性實(shí)施例的流程圖。
[0010]圖6是用于獲取和存儲(chǔ)社交網(wǎng)絡(luò)數(shù)據(jù)的計(jì)算機(jī)可執(zhí)行指令的示例性實(shí)施例的流程圖。
[0011]圖7是索引存儲(chǔ)器中的示例性數(shù)據(jù)分量的框圖。
[0012]圖8是簡(jiǎn)檔存儲(chǔ)器中的示例性數(shù)據(jù)分量的框圖。
[0013]圖9是話題“麥咖啡”(McCafe)的示例性話題網(wǎng)絡(luò)圖的圖解。
[0014]圖10是圖9中的話題網(wǎng)絡(luò)圖的圖解,其示出了主集群和離群值集群的分解。
[0015]圖11是用于基于社區(qū)的分解,識(shí)別和過濾話題網(wǎng)絡(luò)中的離群值的計(jì)算機(jī)可執(zhí)行指令的示例性實(shí)施例的流程圖。
[0016]圖12是用于從每個(gè)話題網(wǎng)絡(luò)識(shí)別和提供社區(qū)集群的計(jì)算機(jī)可執(zhí)行指令的示例性實(shí)施例的流程圖。
[0017]圖13A和13B示出了用于與顯示話題網(wǎng)絡(luò)內(nèi)的影響者社區(qū)的GUI進(jìn)行交互的示例性屏幕截圖,其中圖13A示出了不使用加權(quán)分析的結(jié)果,而圖13B示出了使用加權(quán)分析的結(jié)果。
[0018]圖14示出了用于使用加權(quán)分析與顯示話題網(wǎng)絡(luò)內(nèi)的影響者社區(qū)的GUI進(jìn)行交互的示例性屏幕截圖。
[0019]圖15A和15B示出了用于與顯示話題網(wǎng)絡(luò)內(nèi)的影響者社區(qū)的GUI進(jìn)行交互的示例性屏幕截圖,其中圖15A示出了不使用加權(quán)分析的結(jié)果,而圖15B示出了使用加權(quán)分析的結(jié)果。
附圖詳細(xì)說明
[0020]應(yīng)當(dāng)認(rèn)識(shí)的是,為了說明的簡(jiǎn)化和清晰,在認(rèn)為適當(dāng)時(shí),參考數(shù)字可在圖中被重復(fù)以指示相應(yīng)或相似的元件。此外,陳述了許多特定細(xì)節(jié),以提供對(duì)本文中所描述的實(shí)施例的透徹理解。然而,本領(lǐng)域的普通技術(shù)人員將理解的是,沒有這些特定細(xì)節(jié)也可以實(shí)踐本文中所描述的實(shí)施例。在其他情形下,沒有詳細(xì)描述公知方法、程序和部件,以不使本文中所描述的實(shí)施例難理解。并且,本說明不被認(rèn)為是限制本文中所描述的實(shí)施例的范圍。
[0021]社交聯(lián)網(wǎng)平臺(tái)包括(例如,經(jīng)由通過與社交聯(lián)網(wǎng)平臺(tái)關(guān)聯(lián)的網(wǎng)站通信的計(jì)算裝置的網(wǎng)絡(luò))生成和發(fā)布內(nèi)容供他人查看、收聽等的用戶。社交聯(lián)網(wǎng)平臺(tái)的非限定性實(shí)施例包括Facebook、Twitter、LinkedIn、Pinterest、Tumblr、博客空間、網(wǎng)站、協(xié)作性維基網(wǎng)站、在線新聞組、在線論壇、電子郵件和即時(shí)消息服務(wù)。當(dāng)前已知和未來已知的社交聯(lián)網(wǎng)平臺(tái)適用于本說明書中所述的原理。社交聯(lián)網(wǎng)平臺(tái)可以用于向平臺(tái)的用戶進(jìn)行市場(chǎng)營銷和廣告宣傳。已經(jīng)認(rèn)識(shí)到,難以識(shí)別與指定話題相關(guān)的用戶。這包括識(shí)別指定話題的具有影響力的用戶。
[0022]此外,還認(rèn)識(shí)到,社交網(wǎng)絡(luò)為各品牌和公司提供了向該等品牌的影響者傳達(dá)消息的巨大潛力。影響者是指對(duì)品牌感興趣,并且他們的觀點(diǎn)可以影響社交網(wǎng)絡(luò)中的大量受眾的人員。找到適當(dāng)?shù)挠绊懻咧?,這些影響者可以傳播、支持,或者甚至擁護(hù)該等品牌的消息。
[0023]借助社交網(wǎng)絡(luò),影響者可以輕松地向其所有追隨者(例如,使用Twitter轉(zhuǎn)發(fā)推文或者提醒回復(fù))或朋友(例如,使用Facebook分享)傳遞信息。但是,獲得顯著提醒的關(guān)鍵在于識(shí)別正確的影響者。一些圖表分析方法使用關(guān)鍵字查詢來識(shí)別在指定時(shí)間范圍內(nèi)就某品牌生成內(nèi)容(例如,推文或者帖子)的影響者。該方法考慮個(gè)人之間的追隨者-追隨(或朋友)關(guān)系,同時(shí)還識(shí)別這些個(gè)人之間的群組。使用群組,品牌可向不同受眾發(fā)送自定義消息。但是,并非所有追隨者(或者朋友)都會(huì)重視并且傳播某個(gè)人對(duì)于品牌的意見。計(jì)算機(jī)難以基于典型的數(shù)據(jù)度量來理解關(guān)注者與被關(guān)注者之間關(guān)系的重要性或者特性。
[0024]本文中還認(rèn)識(shí)到,如果將網(wǎng)絡(luò)中的所有鏈接視作同等重要,那么該等方法就無法抓住人類心理的一個(gè)重要方面。人的“信任”趨于隨時(shí)間推移而變化。例如,Amy關(guān)注Ann和Zoe (圖1)的同時(shí),在指定時(shí)間范圍內(nèi)選擇轉(zhuǎn)發(fā)Ann的帖子,并且可能在未來的某一時(shí)候轉(zhuǎn)發(fā)Zoe的帖子。因此,即便代表的是相同的關(guān)系,但是并非網(wǎng)絡(luò)中的所有鏈接都具有同等重要性。
[0025]術(shù)語“帖子”或者“發(fā)帖”是指通過社交數(shù)據(jù)網(wǎng)絡(luò)與他人共享的內(nèi)容。帖子或者發(fā)帖可以通過向服務(wù)器或者網(wǎng)站或者網(wǎng)絡(luò)提交內(nèi)容以供他人訪問來進(jìn)行傳輸。帖子或者發(fā)帖還可以作為消息在兩個(gè)裝置之間傳輸。帖子或者發(fā)帖包括發(fā)送消息、電子郵件,在網(wǎng)站上發(fā)布評(píng)論,在博客上發(fā)布內(nèi)容,在視頻共享網(wǎng)絡(luò)中發(fā)布內(nèi)容,以及在聯(lián)網(wǎng)應(yīng)用程序中發(fā)布內(nèi)容。帖子形式包括文本、圖片、視頻、音頻及其組合。
[0026]如本文中所使用的,術(shù)語“影響者”是指主要產(chǎn)生并共享與話題相關(guān)的內(nèi)容的用戶賬戶并且被認(rèn)為對(duì)社交數(shù)據(jù)網(wǎng)絡(luò)中的其他用戶是有影響的。更具體來說,影響者是指具備以下條件的社交數(shù)據(jù)網(wǎng)絡(luò)中的個(gè)人或者實(shí)體:被視作對(duì)該話題感興趣或者生成關(guān)于該話題的內(nèi)容;擁有大量追隨者(例如,或者讀者、朋友或者訂閱者),其中的大部分對(duì)該話題感興趣,并且顯著百分?jǐn)?shù)的對(duì)該話題感興趣的關(guān)注者重視影響者對(duì)于該話題的觀點(diǎn)。話題的非限制性示例包括品牌、公司、產(chǎn)品、活動(dòng)、位置和個(gè)人。
[0027]如本文中所使用的,術(shù)語“追隨者”是指追隨第二用戶賬戶(例如,與第一用戶賬戶的至少一個(gè)社交聯(lián)網(wǎng)平臺(tái)相關(guān)聯(lián)并且經(jīng)由計(jì)算裝置訪問的第二用戶賬戶)的第一用戶賬戶(例如,與一個(gè)或多個(gè)社交聯(lián)網(wǎng)平臺(tái)相關(guān)聯(lián)的經(jīng)由計(jì)算裝置訪問的第一用戶賬戶),這樣使得第二用戶賬戶所發(fā)帖的內(nèi)容被發(fā)布以供第一用戶賬戶閱讀、消費(fèi)等。例如,當(dāng)?shù)谝挥脩糇冯S第二用戶時(shí),第一用戶(即,追隨者)將接收第二用戶發(fā)布的內(nèi)容。對(duì)特定話題“感興趣”的用戶在本文中是指追隨特定話題的若干專家(例如,與社交聯(lián)網(wǎng)平臺(tái)相關(guān)聯(lián))的用戶賬戶。在某些情況下,追隨者與其他用戶所發(fā)帖的內(nèi)容交互(例如,通過分享或轉(zhuǎn)帖該內(nèi)容)。
[0028]公司需要識(shí)別關(guān)鍵影響者以便,例如,定位能夠潛在地傳播和支持某個(gè)品牌的消息的個(gè)人。與這些個(gè)人交互可實(shí)現(xiàn)控制某個(gè)品牌的在線消息,并且可以減少可能發(fā)生的潛在負(fù)面觀點(diǎn)。謹(jǐn)慎地管理本過程可實(shí)現(xiàn)在線思維占有率的指數(shù)增長(zhǎng),例如,在病毒式營銷活動(dòng)的情況下。
[0029]確定影響者的大多數(shù)傳統(tǒng)方法關(guān)注的是簡(jiǎn)便的可計(jì)算度量,例如追隨者或者朋友的數(shù)量,或者帖子的數(shù)量。盡管追隨者或者朋友總數(shù)可能近似于整個(gè)社交網(wǎng)絡(luò),但是就指示某個(gè)用戶或者個(gè)人相對(duì)于公司或者品牌的影響的計(jì)算度量而言,它提供的數(shù)據(jù)極少。這導(dǎo)致影響者結(jié)果存在干擾,并且篩選大量潛在用戶也較為耗時(shí)。
[0030]若干社交媒體分析公司聲稱為社交網(wǎng)絡(luò)提供影響者分?jǐn)?shù)。但是,本文中認(rèn)識(shí)到,許多公司使用的度量并不是真實(shí)的影響者度量,而是追隨者數(shù)量以及提及(例如,Twitter的“推文”、帖子、消息等)數(shù)量的代數(shù)公式。例如,一些已知方法使用這些數(shù)字的對(duì)數(shù)正態(tài)化,將大約80 %的權(quán)重分配給追隨者數(shù)量,剩余的分配給提及的數(shù)量。
[0031]使用代數(shù)公式的原因在于追隨者和提及的計(jì)數(shù)或者點(diǎn)數(shù)會(huì)在社交網(wǎng)絡(luò)的用戶簡(jiǎn)檔中即時(shí)更新。因此,計(jì)算非常迅速并且易于匯報(bào)。這通常稱為權(quán)威度量或者權(quán)威分?jǐn)?shù),以便從實(shí)際影響者分析中區(qū)分出來。
[0032]在示例性實(shí)施例中,權(quán)威分?jǐn)?shù),例如,是使用若干參數(shù)的線性組合計(jì)算的,包括用戶發(fā)帖數(shù)量以及追隨同一用戶的追隨者的數(shù)量。在示例性實(shí)施例中,該線性組合還可以基于同一用戶追隨的輔助用戶的數(shù)量。
[0033]然而,權(quán)威分?jǐn)?shù)方法存在若干顯著缺點(diǎn)。本文中認(rèn)識(shí)到,該權(quán)威分?jǐn)?shù)是不易受情境的影響。這是與話題或者查詢無關(guān)的靜態(tài)度量。例如,不考慮話題,如紐約時(shí)報(bào)(New YorkTimes)或者美國有線電視新聞網(wǎng)(CNN)等大眾媒體渠道將獲得最高排名,因?yàn)樗鼈兙陀袛?shù)百萬追隨者。因此,權(quán)威分?jǐn)?shù)不易受情境的影響。
[0034]本文中還認(rèn)識(shí)到,該權(quán)威度量具有高的追隨者計(jì)數(shù)偏向。如果存在特定領(lǐng)域中具有有限數(shù)量的追隨者的定義明確的專家,但是這些追隨者也全部都是專家,則由于追隨者數(shù)量較小,他們不可能出現(xiàn)在100個(gè)結(jié)果中的前20個(gè)結(jié)果中,實(shí)際上,所有追隨者均視作擁有相等的權(quán)重,這被證實(shí)是網(wǎng)絡(luò)分析研究中的不當(dāng)假設(shè)。
[0035]如本文所述,所提出的系統(tǒng)和方法可以相對(duì)于查詢?cè)掝}動(dòng)態(tài)地計(jì)算影響者,并且可以說明其追隨者的影響。
[0036]還認(rèn)識(shí)到,影響者關(guān)系的遞歸性質(zhì)是大范圍實(shí)施影響者識(shí)別中的一項(xiàng)挑戰(zhàn)。例如,考慮包括個(gè)人A、B和C的情境,其中:A追隨B和C;B追隨C和A;并且C僅追隨A13A的影響取決于C,而C的影響又取決于A和B,等等。這樣,影響者關(guān)系具有遞歸性質(zhì)。
[0037]更一般地說,所提出的系統(tǒng)和方法提供了一種確定社交數(shù)據(jù)網(wǎng)絡(luò)中的影響者的方式。在本發(fā)明的示例性系統(tǒng)和方法中,加權(quán)邊緣或者連接被用于開發(fā)網(wǎng)絡(luò)圖,并且在社交數(shù)據(jù)網(wǎng)絡(luò)中的不同用戶節(jié)點(diǎn)(例如,用戶賬戶)之間考慮了若干不同類型的邊緣或連接。這些類型的邊緣或者連接包括:(a)追隨者關(guān)系,即用戶追隨另一個(gè)用戶;(b)轉(zhuǎn)帖關(guān)系,即用戶重新發(fā)送或者轉(zhuǎn)帖來自另一個(gè)用戶的相同內(nèi)容;(C)回復(fù)關(guān)系,即用戶回復(fù)另一個(gè)用戶發(fā)布或者發(fā)送的內(nèi)容;以及(d)提及關(guān)系,即用戶在發(fā)帖中提及另一個(gè)用戶。
[0038]在品牌名Twitter旗下的社交網(wǎng)絡(luò)的非限定性示例中,這些關(guān)系如下:
[0039]轉(zhuǎn)推(RT):當(dāng)一個(gè)用戶分享了另一個(gè)用戶的推文時(shí)發(fā)生。記作“RT”,后跟一個(gè)空格,后跟符號(hào)@,并且后跟Twitter用戶句柄,例如“RTOABC",后跟ABC的推文。
[0040]提醒回復(fù):用戶明確回復(fù)另一個(gè)用戶的推文時(shí)發(fā)生。記作符號(hào)后跟Twitter用戶句柄,例如用戶名”,后跟任何消息。
[0041]提醒提及:一個(gè)用戶在推文中包括了另一個(gè)用戶句柄,而不打算明確回復(fù)時(shí)發(fā)生。用戶在其推文中的某個(gè)地方添加@,后跟某個(gè)Twitter用戶句柄,例如“你好0ΧΥΖ,一起聚會(huì)吧@DEF@TUV”(H1XYZ let’s partyiDEFiTUV)ο
[0042]這些關(guān)系表明了源用戶句柄對(duì)目標(biāo)用戶句柄的明確興趣。源是轉(zhuǎn)推或者提醒回復(fù)或者提醒提及的用戶句柄,目標(biāo)是消息中包含的用戶句柄。
[0043]在使用加權(quán)邊緣以識(shí)別排名最高影響者及其社區(qū)的示例中,對(duì)網(wǎng)絡(luò)鏈接加權(quán)以創(chuàng)建鏈接重要性概念,并且進(jìn)一步地,識(shí)別外部源并將其合并到社交數(shù)據(jù)網(wǎng)絡(luò)中。外部源的示例包括用戶及其轉(zhuǎn)帖舊消息或內(nèi)容發(fā)帖的活動(dòng)、或用戶及其參考或提及舊消息或內(nèi)容發(fā)帖的活動(dòng)。外部源的另一示例是用戶及其提及社交數(shù)據(jù)網(wǎng)絡(luò)中的話題的活動(dòng),但該話題源自另一個(gè)或輔助社交數(shù)據(jù)網(wǎng)絡(luò)。
[0044]舉例來講,在圖1考慮了特定話題的簡(jiǎn)化追隨者網(wǎng)絡(luò)。圖1示出了具有若干類型的鏈接的社交網(wǎng)絡(luò):追隨者-追隨關(guān)系;轉(zhuǎn)帖關(guān)系,并且另一個(gè)是回復(fù)關(guān)系。盡管圖1中未示出具體示例,但是提及關(guān)系是適用的。如圖所示,由于Ray在網(wǎng)絡(luò)中具有最多數(shù)量的追隨者,因此非常具有影響力。但是,由于Ray追隨了Rick和Brie,因此他們也具有重要的影響力。在Rick與Brie之間,Rick可能是較強(qiáng)的影響者,因?yàn)镽ay還轉(zhuǎn)帖并且回復(fù)了Rick的帖子(例如,推文或者消息)。在指定的網(wǎng)絡(luò)中,影響者可能是Rick和Ray。
[0045]如圖1中所示,考慮轉(zhuǎn)帖和回復(fù)關(guān)系(或者共享)以及追隨者(或朋友)信息可提供真實(shí)影響者的更準(zhǔn)確圖像,并且也改善了所識(shí)別的群組。
[0046]可以認(rèn)識(shí)到的是,圖中的節(jié)點(diǎn)代表不同的用戶賬戶,一個(gè)是Ray的用戶賬戶,另一個(gè)是Rick的用戶賬戶。箭頭方向也用于指示誰是主用戶(例如,作者、發(fā)起人、另一個(gè)人提及的人或者賬戶,被追隨者等)以及誰是二級(jí)用戶(例如,轉(zhuǎn)帖者、追隨者、回復(fù)者、進(jìn)行提及操作的人等)。例如,箭頭的頭部代表主用戶,并且箭頭的尾部代表二級(jí)用戶。
[0047]除了圖1中的每個(gè)用戶賬戶之外,提供了網(wǎng)頁排名分?jǐn)?shù)。網(wǎng)頁排名算法是谷歌用來衡量網(wǎng)絡(luò)中網(wǎng)頁的重要性的一種已知算法并且還可以應(yīng)用于衡量社交數(shù)據(jù)網(wǎng)絡(luò)中的用戶的重要性。
[0048]直覺是如果幾個(gè)專家認(rèn)為某人是專家,則她/他也是專家。然而,網(wǎng)頁排名算法得出比僅對(duì)追隨者的數(shù)量計(jì)數(shù)更好的影響力衡量。如將在下文描述的,本文中所描述的所提出的系統(tǒng)和方法可以使用網(wǎng)頁排名算法和其他類似排名算法。
[0049]所提出的系統(tǒng)和方法還認(rèn)識(shí)到,影響者可能來自外部源?!巴獠俊痹吹母拍羁刹捎脙煞N形式。首先,即便影響者最近可能未發(fā)布指定話題的推文,但鑒于她在該話題上的影響,推特圈(Twi tter-sphere)可能繼續(xù)提及她,或者重新轉(zhuǎn)推她的一篇舊帖子。例如,運(yùn)動(dòng)專家可能分享他/她對(duì)于超級(jí)足球杯(Super Bowl)的觀點(diǎn),并且該觀點(diǎn)在實(shí)際比賽之后的數(shù)月被持續(xù)討論。
[0050]第二,人們通常談?wù)撏耆珌碜跃W(wǎng)絡(luò)外部的來源的話題。例如,YouTube上托管的視頻可能被發(fā)推。在這兩種情況下,所提出的系統(tǒng)和方法旨在捕獲作為影響者的視頻/觀點(diǎn)源。
[0051]在一般性示例性實(shí)施例中,提供了一種加權(quán)網(wǎng)絡(luò)分析方法,以通過(I)加權(quán)網(wǎng)絡(luò)鏈接以構(gòu)成“鏈接重要性”的概念,以及(2)識(shí)別并且將一些關(guān)鍵“外部”源并入網(wǎng)絡(luò)中來識(shí)別社區(qū)及其排名最高影響者。此外,提供了所有社區(qū)的排名最高影響者的匯總列表,該列表用于幫助確定所有影響者的相對(duì)次序。社區(qū)和影響者的可視化使得最終用戶能夠了解每個(gè)影響者的規(guī)模和相對(duì)重要性以及這些影響者在其社區(qū)中的相互聯(lián)系。
[0052]轉(zhuǎn)到圖2,其中示出了所提出的系統(tǒng)的示意圖。服務(wù)器100通過網(wǎng)絡(luò)102與計(jì)算裝置101通信。服務(wù)器100獲取和分析社交網(wǎng)絡(luò)數(shù)據(jù),并且通過網(wǎng)絡(luò)將結(jié)果提供給計(jì)算裝置101。計(jì)算裝置101可以通過GUI接收用戶輸入以控制分析的參數(shù)。
[0053]可以認(rèn)識(shí)到,社交網(wǎng)絡(luò)數(shù)據(jù)包括關(guān)于社交網(wǎng)絡(luò)平臺(tái)的用戶的數(shù)據(jù),以及用戶生成或整理,或用戶生成并整理的內(nèi)容。社交網(wǎng)絡(luò)數(shù)據(jù)的非限定性示例包括用戶賬戶ID或用戶名、用戶或者用戶賬戶描述、用戶發(fā)布的消息或者其他數(shù)據(jù)、用戶與其他用戶之間的聯(lián)系、本地信息等。聯(lián)系的示例是“用戶列表”,本文中也稱為“列表”,其包括列表名稱、列表描述以及指定用戶追隨的一個(gè)或多個(gè)其他用戶。該用戶列表,例如,是由指定用戶創(chuàng)建的。
[0054]繼續(xù)圖2,服務(wù)器100包括處理器103和存儲(chǔ)裝置104。在一個(gè)示例性實(shí)施例中,該服務(wù)器包括一個(gè)或多個(gè)處理器以及大量存儲(chǔ)容量。在另一個(gè)示例性實(shí)施例中,存儲(chǔ)裝置104或者多個(gè)存儲(chǔ)裝置是用于更高讀/寫性能的固態(tài)驅(qū)動(dòng)器。在另一個(gè)示例性實(shí)施例中,多個(gè)服務(wù)器被用于實(shí)施本文所描述的方法。換言之,在一個(gè)示例性實(shí)施例中,服務(wù)器100是指服務(wù)器系統(tǒng)。在另一個(gè)示例性實(shí)施例中,使用其他當(dāng)前已知的計(jì)算硬件或者未來已知的計(jì)算硬件,或者使用這兩者。
[0055]服務(wù)器100還包括通信裝置105,用于通過網(wǎng)絡(luò)102通信。網(wǎng)絡(luò)102可以是有線或者無線網(wǎng)絡(luò),或者這兩者。服務(wù)器100還包括GUI模塊106,用于通過計(jì)算裝置101顯示并且接收數(shù)據(jù)。服務(wù)器還包括:社交聯(lián)網(wǎng)數(shù)據(jù)模塊107、索引器模塊108、用戶賬戶關(guān)系模塊109、社區(qū)識(shí)別模塊112以及特征識(shí)別模塊113。如下所述,社區(qū)識(shí)別模塊112被配置成基于網(wǎng)絡(luò)圖界定社區(qū)或者數(shù)據(jù)集群。
[0056]服務(wù)器100還包括若干數(shù)據(jù)庫,包括數(shù)據(jù)存儲(chǔ)器116、索引存儲(chǔ)器117、社交圖的數(shù)據(jù)庫118、簡(jiǎn)檔存儲(chǔ)器119、用于存儲(chǔ)社區(qū)圖信息的數(shù)據(jù)庫128,以及用于存儲(chǔ)每個(gè)社區(qū)的熱門特征的并且用于存儲(chǔ)在每個(gè)社區(qū)中搜索的預(yù)定義特征的數(shù)據(jù)庫129,這些社區(qū)由社區(qū)識(shí)別豐旲塊112界定。
[0057]社交聯(lián)網(wǎng)數(shù)據(jù)模塊107被用于接收社交聯(lián)網(wǎng)數(shù)據(jù)流。在一個(gè)示例性實(shí)施例中,數(shù)百萬新消息每天實(shí)時(shí)地輸送給社交聯(lián)網(wǎng)數(shù)據(jù)模塊107。社交聯(lián)網(wǎng)數(shù)據(jù)模塊107接收的社交聯(lián)網(wǎng)數(shù)據(jù)存儲(chǔ)在數(shù)據(jù)存儲(chǔ)器116中。
[0058]索引器模塊108對(duì)數(shù)據(jù)存儲(chǔ)器116中的數(shù)據(jù)執(zhí)行索引器進(jìn)程,并且將索引的數(shù)據(jù)存儲(chǔ)在索引存儲(chǔ)器117中。在一個(gè)示例性實(shí)施例中,索引存儲(chǔ)器117中的索引數(shù)據(jù)可以被更容易地搜索,并且索引存儲(chǔ)器中的標(biāo)識(shí)符可以用于檢索實(shí)際數(shù)據(jù)(例如,全部消息)。
[0059]社交圖也從社交聯(lián)網(wǎng)平臺(tái)服務(wù)器獲取到(未圖示),并且存儲(chǔ)在社交圖數(shù)據(jù)庫118中。在指定作為查詢的輸入的用戶時(shí),社交圖可被用于返回追隨被查詢用戶的所有用戶。
[0060]簡(jiǎn)檔存儲(chǔ)器119存儲(chǔ)與用戶簡(jiǎn)檔相關(guān)的元數(shù)據(jù)。與簡(jiǎn)檔相關(guān)的元數(shù)據(jù)的示例包括指定用戶的追隨者總數(shù),指定用戶自行公開的個(gè)人信息,指定用戶的位置信息等。簡(jiǎn)檔存儲(chǔ)器119中的數(shù)據(jù)可以被查詢。
[0061]在一個(gè)示例性的實(shí)施例中,用戶賬戶關(guān)系模塊109可以使用社交圖118和簡(jiǎn)檔存儲(chǔ)器119來確定哪些用戶正在追隨特定用戶。模塊109還被配置成確定用戶賬戶之間的關(guān)系,包括回復(fù)關(guān)系、提及關(guān)系以及轉(zhuǎn)帖關(guān)系。
[0062]再次參見圖2,服務(wù)器100進(jìn)一步包括社區(qū)識(shí)別模塊112,該社區(qū)識(shí)別模塊被配置成識(shí)別話題網(wǎng)絡(luò)內(nèi)的社區(qū)(例如,話題A等被查詢?cè)掝}內(nèi)的信息集群)以及相關(guān)的影響者。如下文關(guān)于圖3所述,話題網(wǎng)絡(luò)示出了有影響力用戶及其關(guān)系(例如,如社交圖118所定義)的圖。社區(qū)識(shí)別模塊112的輸出包括集群(例如,編碼的顏色)的視覺識(shí)別,這些集群被定義成包含共同特征并且/或者相對(duì)于另一個(gè)社區(qū)中的實(shí)體而言,更易于受同一社區(qū)中的其他實(shí)體(例如,影響者)影響(例如,被如追隨者-被追隨者關(guān)系影響)的話題網(wǎng)絡(luò)的社區(qū)。服務(wù)器100進(jìn)一步包括特征識(shí)別t吳塊113。
[0063]特征識(shí)別模塊113被配置成從社區(qū)識(shí)別模塊112接收識(shí)別出的社區(qū),并且提供社區(qū)成員中的熱門特征(例如,談話話題)的識(shí)別。特征識(shí)別模塊113的結(jié)果可以與社區(qū)識(shí)別模塊112中提供的社區(qū)的對(duì)應(yīng)可視化在視覺上鏈接。如下所述,一方面,社區(qū)識(shí)別模塊112(例如,多個(gè)社區(qū))以及/或者特征識(shí)別模塊113(例如,每個(gè)社區(qū)內(nèi)的多個(gè)熱門特征)的結(jié)果顯示在顯示屏125上,作為對(duì)計(jì)算裝置101的輸出。另一方面,GUI模塊106被配置成從計(jì)算裝置101接收輸入,以選擇社區(qū)識(shí)別模塊112識(shí)別的特定社區(qū)。GUI模塊106之后被配置成與特征識(shí)別模塊113通信,以提供與所選社區(qū)(例如,對(duì)于所選社區(qū)內(nèi)的所有有影響力的用戶)關(guān)聯(lián)的特定特征(例如,定義熱門談話)的結(jié)果的輸出。特征識(shí)別模塊112(例如,可視化地界定所選社區(qū)的用戶中的熱門談話的關(guān)鍵字云)的結(jié)果可以與特定的所選社區(qū)以及/或者特定所選社區(qū)內(nèi)的用戶列表并排地顯示在顯示屏125上。
[0064]繼續(xù)圖2,計(jì)算裝置101包括用于通過網(wǎng)絡(luò)102與服務(wù)器100通信的通信裝置122、處理器123、存儲(chǔ)裝置124、顯示屏125以及互聯(lián)網(wǎng)瀏覽器126。在一個(gè)示例性實(shí)施例中,服務(wù)器100提供的GUI由計(jì)算裝置101通過互聯(lián)網(wǎng)瀏覽器顯示。在另一個(gè)示例性實(shí)施例中,計(jì)算裝置101上具有可用的分析應(yīng)用程序127,⑶I由計(jì)算裝置通過分析應(yīng)用程序127顯示??烧J(rèn)識(shí)到,顯示裝置125可以是計(jì)算裝置(例如,移動(dòng)裝置、平板設(shè)備、膝上型計(jì)算機(jī))的一部分,或者可以與計(jì)算裝置(例如,臺(tái)式機(jī)等)相分離。
[0065]盡管未圖示,但是各種用戶輸入裝置(例如,觸摸屏、滾動(dòng)球、光學(xué)鼠標(biāo)、按鈕、鍵盤、麥克風(fēng)等)可以用于促進(jìn)用戶與計(jì)算裝置101之間的交互。
[0066]應(yīng)認(rèn)識(shí)到,在另一個(gè)示例性實(shí)施例中,系統(tǒng)包括多個(gè)服務(wù)器。在另一個(gè)示例性實(shí)施例中,有多個(gè)計(jì)算裝置與一個(gè)或多個(gè)服務(wù)器通信。
[0067]應(yīng)認(rèn)識(shí)到,本文中例示的執(zhí)行指令的任何模塊或部件可以包括或以其他方式訪問計(jì)算機(jī)可讀介質(zhì),如存儲(chǔ)介質(zhì)、計(jì)算機(jī)存儲(chǔ)介質(zhì)、或如例如磁盤、光盤或磁帶的數(shù)據(jù)存儲(chǔ)裝置(可移除和/或不可移除)。計(jì)算機(jī)存儲(chǔ)介質(zhì)可以包括在任何方法或技術(shù)中實(shí)現(xiàn)的用于存儲(chǔ)信息(如計(jì)算機(jī)可讀指令、數(shù)據(jù)結(jié)構(gòu)、程序模塊、或其他數(shù)據(jù))的易失性和非易失性、可移除和不可移除的介質(zhì)。計(jì)算機(jī)存儲(chǔ)介質(zhì)的示例包括RAM、R0M、EEPR0M、閃存或其他存儲(chǔ)器技術(shù)、CD-ROM、數(shù)字多功能盤(DVD)或其他光存儲(chǔ)裝置、磁帶盒、磁帶、磁盤存儲(chǔ)裝置或其他磁性存儲(chǔ)裝置、或者能夠用于存儲(chǔ)所需信息且可以由應(yīng)用程序、模塊或兩者訪問的任何其他介質(zhì)。任何這類計(jì)算機(jī)存儲(chǔ)介質(zhì)可以是服務(wù)器100或者計(jì)算裝置101的一部分、或者可由其訪問或與其連接。本文中所描述的任何應(yīng)用程序或模塊可以使用計(jì)算機(jī)可讀/可執(zhí)行指令來實(shí)現(xiàn),這些指令可以由這類計(jì)算機(jī)可讀介質(zhì)存儲(chǔ)或以其他方式保留。
[0068]轉(zhuǎn)至圖3,其中示出了計(jì)算機(jī)可執(zhí)行指令的示例性實(shí)施例,用于確定指定話題的一個(gè)或多個(gè)影響者。圖3中所示的過程假設(shè)社交網(wǎng)絡(luò)數(shù)據(jù)可提供給服務(wù)器100,并且社交網(wǎng)絡(luò)數(shù)據(jù)包括多個(gè)用戶。在框301中,服務(wù)器100獲取表示為T的話題。例如,用戶可以通過顯示在計(jì)算裝置101處的GUI來進(jìn)入話題,并且計(jì)算裝置101將該話題發(fā)送到服務(wù)器100。在框302中,服務(wù)器使用該話題以識(shí)別與該話題相關(guān)的所有帖子。這些帖子集合共同地被表示為Pt。在示例實(shí)施例中,使用一個(gè)或多個(gè)附加搜索標(biāo)準(zhǔn),如規(guī)定時(shí)期。換言之,服務(wù)器可以僅檢查給定時(shí)段內(nèi)與話題相關(guān)的帖子。查找與特定話題相關(guān)的帖子可以用不同的方式實(shí)施,并且將在下文進(jìn)行詳細(xì)討論。
[0069]繼續(xù)圖3,服務(wù)器獲取帖子Pt的作者,并且基于排名(框303)識(shí)別前N個(gè)作者。排名最高的作者的集合由At表示。在示例實(shí)施例中,使用權(quán)威分?jǐn)?shù)識(shí)別前N個(gè)作者。其他方法和過程可以用于對(duì)作者進(jìn)行排名。例如,服務(wù)器使用網(wǎng)頁排名衡量話題網(wǎng)絡(luò)內(nèi)的用戶的重要性并且基于該衡量對(duì)用戶進(jìn)行排名??墒褂玫呐琶惴ǖ钠渌窍薅ㄐ允纠?特征向量中心性、加權(quán)度、中間狀態(tài)、樞紐和權(quán)威度量。
[0070]應(yīng)認(rèn)識(shí)到,作者是在社交網(wǎng)絡(luò)中創(chuàng)作帖子的用戶。還應(yīng)認(rèn)識(shí)到,N是自然數(shù)。N的非限制性示例值包括在3,000至5,000范圍內(nèi)的那些值??梢允褂肗的其他值。
[0071]在框304中,服務(wù)器將每個(gè)帖子Pt表征為‘回復(fù)’、‘提及’、或‘轉(zhuǎn)帖’,并且分別識(shí)別被回復(fù)的用戶、被提及的用戶、和首創(chuàng)的被轉(zhuǎn)帖(例如,被分組為回復(fù)用戶Ur、提及的用戶Um、和內(nèi)容被轉(zhuǎn)帖的用戶Urp)內(nèi)容的用戶。還可以記錄每個(gè)回復(fù)、提及、轉(zhuǎn)帖等的時(shí)間戳以便確定用戶之間的交互是否是最近的、或確定‘最近的’分級(jí)。
[0072]在框305中,服務(wù)器生成被稱為‘有興趣的用戶’的列表,該列表組合了前N個(gè)作者At和用戶Ur、Um和Urp?!信d趣的用戶’列表或組中的用戶數(shù)量的非限制性不例包括在3,000至10,000范圍內(nèi)的那些數(shù)量。將認(rèn)識(shí)到,‘有興趣的用戶’組或列表中的用戶數(shù)量可以是其他值。
[0073]對(duì)于‘有興趣的用戶’列表中的每個(gè)用戶,服務(wù)器識(shí)別了每個(gè)用戶的追隨者(框306)。在框307中,服務(wù)器去除沒有列在該‘有興趣的用戶’列表中的追隨者,同時(shí)仍然識(shí)別出作為‘有興趣的用戶’的一部分的那些用戶之間的追隨者關(guān)系。
[0074]在框306的非限定性示例實(shí)施中,發(fā)現(xiàn)當(dāng)考慮與‘有興趣的用戶’相關(guān)聯(lián)的所有追隨者時(shí),存在幾百萬條追隨者連接或邊緣??紤]所有這些追隨者邊緣可能耗費(fèi)大量計(jì)算并且可能不揭示有影響力的交互。為了減少追隨者邊緣的數(shù)量,按照框307廢棄不是‘有興趣的用戶’的一部分的那些追隨者。
[0075]在框306和307的替代性實(shí)施例中,服務(wù)器識(shí)別局限于僅‘有興趣的用戶’組中列出的用戶的追隨者關(guān)系。
[0076]在框308中,服務(wù)器在‘有興趣的用戶’列表中的每個(gè)用戶與其追隨者之間創(chuàng)建鏈接。這樣可創(chuàng)建所有鏈接均具有相同權(quán)重(例如,1.0的權(quán)重)的追隨者-追隨網(wǎng)絡(luò)。
[0077]在框309中,在‘有興趣的用戶’列表中的每個(gè)用戶對(duì)(例如,A、B)之間,服務(wù)器識(shí)別A提及B的實(shí)例數(shù)量,A回復(fù)B的實(shí)例數(shù)量,以及A轉(zhuǎn)帖B的內(nèi)容的實(shí)例數(shù)量??烧J(rèn)識(shí)到,用戶對(duì)不是一定要具有追隨者-被追隨者關(guān)系。例如,用戶A可以不追隨用戶B,但是用戶A可以提及用戶B,或者可以轉(zhuǎn)帖用戶B的內(nèi)容,或者可以回復(fù)用戶B的發(fā)帖。因此,用戶對(duì)(A、B)之間可能存在邊緣或者鏈接,即使一者不是另一者的追隨者。
[0078]此外,在框310中,在每個(gè)用戶對(duì)(例如,A,B)之間,服務(wù)器計(jì)算與用戶對(duì)A、B之間的鏈接或邊緣相關(guān)聯(lián)的權(quán)重,其中權(quán)重是至少A提及B的實(shí)例的數(shù)量、A回復(fù)B的實(shí)例的數(shù)量,以及A轉(zhuǎn)帖B的內(nèi)容的實(shí)例的數(shù)量的函數(shù)。例如,實(shí)例數(shù)量越高,加權(quán)權(quán)重越大。
[0079]在示例實(shí)施例中,在框308,如果存在追隨者-被追隨者鏈接,則邊緣的加權(quán)初始化于第一值(例如,1.0值),而如果沒有追隨者-被追隨者鏈接,則該邊緣初始化于第二值(例如,O值),其中第二值小于第一值。兩個(gè)用戶之間的每個(gè)附加活動(dòng)(例如,回復(fù)、轉(zhuǎn)帖、提及)將使邊緣權(quán)重增加至最大加權(quán)值4.0。其他數(shù)量或者范圍可以被用于表示加權(quán)。
[0080]在示例實(shí)施例中,活動(dòng)或?qū)嵗龜?shù)量的增加與加權(quán)的增加之間的關(guān)系的特征在于指數(shù)下降規(guī)模。例如,對(duì)于用戶對(duì)A、B,其中A追隨B,如果存在2個(gè)轉(zhuǎn)帖,則加權(quán)是2.0。如果有20個(gè)轉(zhuǎn)帖,則加權(quán)為3.9 ο如果有400個(gè)轉(zhuǎn)帖,則加權(quán)為4.0 ο應(yīng)認(rèn)識(shí)到,這些數(shù)量?jī)H是示例,并且可以使用不同的數(shù)量和范圍。
[0081 ]在一個(gè)示例性實(shí)施例中,加權(quán)也基于交互(例如,轉(zhuǎn)帖、提及、回復(fù)等)發(fā)生的最近分級(jí)??梢酝ㄟ^確定進(jìn)行查詢的日期與發(fā)生交互的日期之間的時(shí)間差來計(jì)算‘最近’分級(jí)。例如,如果交互發(fā)生得更近,則例如加權(quán)更高。
[0082]繼續(xù)圖3,在框311中,服務(wù)器計(jì)算分別與‘有興趣的用戶’列表中的用戶及其關(guān)系對(duì)應(yīng)的節(jié)點(diǎn)和邊緣的網(wǎng)絡(luò)圖,其中,對(duì)這些關(guān)系或邊緣加權(quán)(例如,又稱為話題網(wǎng)絡(luò))??梢哉J(rèn)識(shí)到,本文應(yīng)用了圖論的原理。
[0083]在框312中,服務(wù)器在話題網(wǎng)絡(luò)中的用戶當(dāng)中識(shí)別社區(qū)(例如,C^C2,...,(:?)。這些社區(qū)的識(shí)別可以取決于,與另一個(gè)社區(qū)內(nèi)的節(jié)點(diǎn)相比較,一個(gè)社區(qū)內(nèi)的節(jié)點(diǎn)之間的連通性程度。也就是,社區(qū)是由,相對(duì)于所定義的社區(qū)外部的實(shí)體,內(nèi)部(例如,相對(duì)于同一社區(qū)中的其他節(jié)點(diǎn))具有更高連通性程度的實(shí)體或節(jié)點(diǎn)定義的。如下定義,用于分離不同社區(qū)的連通性程度的值或閾值可以預(yù)定義(例如,社區(qū)圖數(shù)據(jù)庫128提供并且/或者從計(jì)算裝置101進(jìn)行用戶定義)。該解決方案因此定義了社區(qū)內(nèi)的節(jié)點(diǎn)的互連性密度。每個(gè)識(shí)別的社區(qū)圖因此是每個(gè)社區(qū)節(jié)點(diǎn)和邊緣(話題網(wǎng)絡(luò))的網(wǎng)絡(luò)圖的子集。一方面,社區(qū)圖進(jìn)一步顯示了社區(qū)(例如,作為節(jié)點(diǎn))內(nèi)的用戶的視覺表示(用社區(qū)圖)和社區(qū)(例如,提供到圖1中的顯示屏125)內(nèi)的用戶的文本列表兩者。另一方面,根據(jù)在社區(qū)內(nèi)和/或在話題T(例如,提供到圖1中的顯示屏125)的所有社區(qū)內(nèi)的影響度,對(duì)社區(qū)內(nèi)的用戶列表的顯示進(jìn)行排名。根據(jù)框312,用戶Ut于是被分成其社區(qū)圖類別,如Uq、Uc2、...Ucn。
[0084]在框313中,針對(duì)每個(gè)給定社區(qū)(例如,C1),服務(wù)器基于給定社區(qū)內(nèi)的用戶(例如,Uc1)的社交網(wǎng)絡(luò)數(shù)據(jù)確定與該用戶相關(guān)聯(lián)的預(yù)定義特征(例如,以下各項(xiàng)中的一項(xiàng)或多項(xiàng):常見的詞和短語、談話的話題、常見的位置、常見的圖片、常見的元數(shù)據(jù))的熱門特征值。所選擇的特征(例如,話題或位置)可以是用戶定義的(例如,通過從計(jì)算裝置101的輸入)和/或自動(dòng)生成的(例如,基于同一話題網(wǎng)絡(luò)內(nèi)的其他社區(qū)的特征、或基于同一話題T的之前使用的特征)。在框314中,服務(wù)器輸出所識(shí)別的社區(qū)(例如,&Χ2、...Χη)以及與每個(gè)給定社區(qū)相關(guān)聯(lián)的熱門特征。所識(shí)別的社區(qū)可以作為與每個(gè)社區(qū)的預(yù)定義特征的特征值視覺關(guān)聯(lián)的社區(qū)圖輸出(例如,通過服務(wù)器以顯示在顯示屏125上)。
[0085]轉(zhuǎn)至圖4,提供了計(jì)算機(jī)可執(zhí)行指令或者處理器實(shí)施指令的另一個(gè)示例性實(shí)施例。執(zhí)行框301到311。框311之后,在框401中,服務(wù)器隨后對(duì)話題網(wǎng)絡(luò)內(nèi)的用戶進(jìn)行排名。例如,服務(wù)器使用網(wǎng)頁排名衡量話題網(wǎng)絡(luò)內(nèi)的用戶的重要性并且基于該衡量對(duì)用戶進(jìn)行排名??墒褂玫呐琶惴ǖ钠渌窍薅ㄐ允纠?特征向量中心性、加權(quán)度、中間狀態(tài)、樞紐和權(quán)威度量。
[0086]服務(wù)器識(shí)別并過濾掉話題網(wǎng)絡(luò)內(nèi)的離群值節(jié)點(diǎn)(框402)。離群值節(jié)點(diǎn)是被認(rèn)為與話題網(wǎng)絡(luò)中的較大的人群或用戶集群分開的離群值用戶。話題網(wǎng)絡(luò)中的離群值用戶或節(jié)點(diǎn)的集合被表示為Uo,其中Uo是‘有興趣的用戶’的子集。下文描述了關(guān)于識(shí)別和過濾離群值節(jié)點(diǎn)的更多的細(xì)節(jié)。
[0087]本過程繼續(xù)執(zhí)行框312到314,由此在去除離群值用戶Uo之后形成社區(qū)。
[0088]轉(zhuǎn)至圖5,提供了計(jì)算機(jī)可執(zhí)行指令或者處理器實(shí)施指令的另一個(gè)示例性實(shí)施例。執(zhí)行框301到311。在框311之后,服務(wù)器使用第一排名方法(框501)對(duì)話題網(wǎng)絡(luò)內(nèi)的用戶進(jìn)行排名。第一排名方法可以與或可以不與框401中使用的排名方法相同。完成該排名以識(shí)別針對(duì)給定話題在給定話題網(wǎng)絡(luò)中哪些用戶最有影響力。
[0089]在框502,服務(wù)器識(shí)別并過濾掉話題網(wǎng)絡(luò)內(nèi)的離群值節(jié)點(diǎn)(用戶Uo),其中Uo是‘有興趣的用戶’的子集。在框503,服務(wù)器使用基于在某一時(shí)期內(nèi)來自用戶的帖子的數(shù)量的第二排名方法來調(diào)整用戶Uo被去除的用戶的排名。例如,服務(wù)器確定如果與在同一時(shí)期內(nèi)第二用戶的帖子數(shù)量相比,第一用戶在上兩個(gè)月內(nèi)具有更高的帖子數(shù)量,則第一用戶的原始排名(從框501)可以提升,而第二用戶的排名保持不變或降低。
[0090]應(yīng)認(rèn)識(shí)到,基于所有用戶的網(wǎng)絡(luò)圖可以非常大。例如,可能存在數(shù)億用戶。分析用戶的整個(gè)數(shù)據(jù)集可能造成計(jì)算量非常大且耗時(shí)。因此,使用以上方法找出與話題T相關(guān)的更小的用戶集合減少了待分析的數(shù)據(jù)量。這也減少了處理時(shí)間。在示例實(shí)施例中,當(dāng)分析推特的整個(gè)社交網(wǎng)絡(luò)平臺(tái)時(shí),已經(jīng)產(chǎn)生影響者的近實(shí)時(shí)結(jié)果。使用更小的用戶集合及相關(guān)聯(lián)的數(shù)據(jù),計(jì)算新話題網(wǎng)絡(luò)。該話題網(wǎng)絡(luò)比包含所有用戶的社交網(wǎng)絡(luò)圖更小(即,更少的節(jié)點(diǎn)和更少的邊緣)?;谠掝}網(wǎng)絡(luò)對(duì)用戶進(jìn)行排名比基于包括所有用戶的社交網(wǎng)絡(luò)圖對(duì)用戶排名快得多。
[0091]此外,識(shí)別和過濾話題網(wǎng)絡(luò)中的離群值節(jié)點(diǎn)有助于進(jìn)一步提高結(jié)果的品質(zhì)。
[0092]在框504之后,執(zhí)行框312到314。
[0093]圖2到圖5中所述的方法的更多細(xì)節(jié)如下所述。
[0094]獲取社交網(wǎng)絡(luò)數(shù)據(jù):
[0095]對(duì)于獲取社交網(wǎng)絡(luò)數(shù)據(jù),在一個(gè)示例性實(shí)施例中,盡管圖3到圖5中未圖示,但是服務(wù)器100獲取社交網(wǎng)絡(luò)數(shù)據(jù)。社交網(wǎng)絡(luò)數(shù)據(jù)可以使用各種方式獲取。以下是獲取社交網(wǎng)絡(luò)數(shù)據(jù)的非限定示例實(shí)施例。
[0096]轉(zhuǎn)至圖5,示出了用于獲取社交網(wǎng)絡(luò)數(shù)據(jù)的計(jì)算機(jī)可執(zhí)行指令的示例實(shí)施例。數(shù)據(jù),包括消息和元數(shù)據(jù),可以由服務(wù)器作為數(shù)據(jù)流實(shí)時(shí)(框600)地接收。例如,該數(shù)據(jù)使用壓縮行格式(框601)存儲(chǔ)在數(shù)據(jù)存儲(chǔ)器116中。在一個(gè)非限定性示例實(shí)施例中,使用MySQL數(shù)據(jù)庫。例如,框600和601由社交聯(lián)網(wǎng)數(shù)據(jù)模塊107實(shí)施。
[0097]在一個(gè)示例性實(shí)施例中,復(fù)制社交聯(lián)網(wǎng)模塊107接收的社交網(wǎng)絡(luò)數(shù)據(jù),并且社交網(wǎng)絡(luò)數(shù)據(jù)的副本存儲(chǔ)在多個(gè)服務(wù)器中。這有助于在分析社交網(wǎng)絡(luò)數(shù)據(jù)時(shí)進(jìn)行并行處理。換言之,一個(gè)服務(wù)器可以分析社交網(wǎng)絡(luò)數(shù)據(jù)的一個(gè)方面,而另一個(gè)服務(wù)器可以分析社交網(wǎng)絡(luò)數(shù)據(jù)的另一個(gè)方面。
[0098]服務(wù)器100使用索引器進(jìn)程(框602)對(duì)消息編制索引。例如,索引器進(jìn)程是獨(dú)立于存儲(chǔ)過程的單獨(dú)過程,該存儲(chǔ)過程包括消息在數(shù)據(jù)存儲(chǔ)器116中具體化的同時(shí)掃描消息。在一個(gè)示例性實(shí)施例中,索引器進(jìn)程自行在單獨(dú)的服務(wù)器上運(yùn)行。這有助于并行處理。例如,索引器進(jìn)程是具體化每一天,或者其他指定時(shí)間段的索引數(shù)據(jù)表的多線程進(jìn)程。索引數(shù)據(jù)輸出并且存儲(chǔ)在索引存儲(chǔ)器117(框604)中。
[0099]簡(jiǎn)要地轉(zhuǎn)向圖7,其中示出了示例性索引存儲(chǔ)器117,表中的每一行是唯一的用戶賬戶標(biāo)識(shí)符以及該天,或者該指定時(shí)間段內(nèi)產(chǎn)生的所有消息標(biāo)識(shí)符的對(duì)應(yīng)列表。除了天之夕卜,還使用其他時(shí)間段。在一個(gè)示例性實(shí)施例中,索引存儲(chǔ)器117中每天可讀取和寫入數(shù)百萬數(shù)據(jù)行,并且該過程可以在新數(shù)據(jù)被具體化或者添加到數(shù)據(jù)存儲(chǔ)器116中時(shí)發(fā)生。在一個(gè)示例性實(shí)施例中,索引存儲(chǔ)器117中使用了壓縮行格式。在另一個(gè)示例性實(shí)施例中,通過運(yùn)行松弛的事物語義來避免死鎖,因?yàn)檫@樣可增加讀寫該表時(shí)多個(gè)線程的吞吐量。從背景因素來看,當(dāng)兩個(gè)或更多任務(wù)中的每個(gè)任務(wù)對(duì)其他任務(wù)嘗試鎖定的資源施加鎖定,以此來永久地彼此封鎖時(shí),發(fā)生死鎖。
[0100]轉(zhuǎn)回圖6,服務(wù)器100進(jìn)一步獲取關(guān)于哪些用戶賬戶追隨其他用戶賬戶的信息(框603)。該過程包括識(shí)別與簡(jiǎn)檔關(guān)聯(lián)的元數(shù)據(jù),以及將其存儲(chǔ)在簡(jiǎn)檔存儲(chǔ)器中(塊605)。
[0101]在圖8中,簡(jiǎn)檔存儲(chǔ)器119的示例示出了對(duì)于每個(gè)用戶賬戶,具有相關(guān)聯(lián)的與簡(jiǎn)檔相關(guān)聯(lián)的元數(shù)據(jù)。例如,與簡(jiǎn)檔相關(guān)的元數(shù)據(jù)包括用戶追隨者的總數(shù)、自我公開的個(gè)人信息、位置信息以及用戶列表。
[0102]數(shù)據(jù)獲取并且存儲(chǔ)之后,例如,可以分析該數(shù)據(jù),以識(shí)別專家和興趣。
[0103]確定與話題相關(guān)的帖子:
[0104]對(duì)于確定話題相關(guān)的帖子,依據(jù)框302,應(yīng)認(rèn)識(shí)到,該操作可以以多種方式發(fā)生。以下是可用于確定話題相關(guān)帖子的非限定性示例實(shí)施例。
[0?05]在一個(gè)示例性實(shí)施例中,確定與話題(例如,框302)相關(guān)帖子的操作基于Sysomos搜索引擎,并且在2009年7月10日提交的標(biāo)題為“信息發(fā)現(xiàn)和文本分析的方法和系統(tǒng)(Method and System for Informat1n Discovery and Text Analysis),,的第2009/0319518號(hào)美國專利申請(qǐng)公開案中有所描述,該專利申請(qǐng)以引用方式全文并入本文中。根據(jù)第2009/0319518號(hào)美國專利申請(qǐng)公開案中所述的過程,話題被用于識(shí)別特定時(shí)間間隔內(nèi)的熱門文件。具體來說,當(dāng)向第2009/0319518號(hào)美國專利申請(qǐng)公開案的系統(tǒng)提供話題(例如,關(guān)鍵字)時(shí),該系統(tǒng)返回與該話題相關(guān)且熱門的相關(guān)文件(例如,帖子、推文、消息、文章等)。使用本文中所述的所提出的系統(tǒng)和方法,可執(zhí)行指令包括確定熱門文件的一個(gè)或多個(gè)作者的服務(wù)器100。這樣,一個(gè)或多個(gè)作者被識(shí)別為與指定話題相關(guān)的排名最高用戶。
[0106]對(duì)于框303,可以提供上限N以識(shí)別與指定話題相關(guān)聯(lián)的前N個(gè)用戶,其中N是自然數(shù)。在一個(gè)示例性實(shí)施例中,N是5000,但也可以使用其他數(shù)量。該前N個(gè)用戶可以根據(jù)已知或者未來已知的排名算法確定,或者使用社交媒體分析的已知或者未來已知的權(quán)威記分算法。
[0107]應(yīng)認(rèn)識(shí)到,其他示例性實(shí)施例中可以使用其他已知的以及未來已知的方式來識(shí)別與話題相關(guān)的帖子。
[0108]識(shí)別和過濾話題網(wǎng)絡(luò)中的離群值用戶:
[0109]對(duì)于識(shí)別和過濾話題網(wǎng)絡(luò)內(nèi)的離群值節(jié)點(diǎn)(例如,用戶),根據(jù)框402和502,應(yīng)認(rèn)識(shí)至|J,可以使用不同的計(jì)算。以下是實(shí)施框402和502的非限定示例實(shí)施例。
[0110]應(yīng)認(rèn)識(shí)到,可以通過去除有問題的離群值改進(jìn)來自話題網(wǎng)絡(luò)的數(shù)據(jù)。例如,也發(fā)生使用指麥當(dāng)勞(McDonalds)咖啡品牌的話題“麥咖啡(McCafe)”的查詢以將來自菲律賓的是具有相同名稱的卡拉ok酒吧/咖啡館的粉絲的一些用戶召回。因?yàn)樗鼈兣銮墒蔷o密的社區(qū),所以其影響者分?jǐn)?shù)經(jīng)常高到足以排名在關(guān)鍵的前十列表中。
[0111]轉(zhuǎn)到圖9,其中示出了展示未過濾的結(jié)果的話題網(wǎng)絡(luò)901的示例實(shí)施例的圖示。節(jié)點(diǎn)表示與話題McCafe相關(guān)的用戶集合。一些節(jié)點(diǎn)902或用戶來自菲律賓,是具有相同名稱McCafe的卡拉ok酒吧/咖啡館的粉絲。
[0112]這種現(xiàn)象有時(shí)在測(cè)試案例中發(fā)生,但不局限于話題McCafe的測(cè)試案例。在本文中應(yīng)認(rèn)識(shí)到,尋找McCafe的用戶沒有尋找McDonalds咖啡和菲律賓卡拉ok酒吧兩者,并且因此這個(gè)子網(wǎng)絡(luò)1302被認(rèn)為有噪聲。
[0113]為了實(shí)現(xiàn)降噪,在示例實(shí)施例中,服務(wù)器使用作為模塊性算法的變型的網(wǎng)絡(luò)社區(qū)檢測(cè)算法來識(shí)別和過濾話題查詢中的這些類型的離群值集群。在引用的紐曼M.E.J.(Newman,M.E.J.)(2006)的文章“網(wǎng)絡(luò)中的模塊性和社區(qū)結(jié)構(gòu)(Modularity and communitystructure in networks)”(美國國家科學(xué)院論文集103(23):8577-8696)中描述模塊性算法,其全部?jī)?nèi)容通過引用并入本文。具體來說,該變型是考慮每個(gè)邊緣或者鏈接加權(quán)的模塊性算法的加權(quán)版本。這提高了所檢測(cè)社區(qū)的質(zhì)量,因?yàn)樗蓪⑷朔纸M成社區(qū),不僅僅因?yàn)樗麄冏冯S他人或者被社區(qū)中的人追隨,還因?yàn)榭赡艽嬖谥T如回復(fù)、轉(zhuǎn)帖和提及的其他交互。
[0114]將認(rèn)識(shí)到,可以應(yīng)用其他類型的集群和社區(qū)檢測(cè)算法來確定話題網(wǎng)絡(luò)中的離群值。過濾幫助去除尋找與話題相關(guān)聯(lián)的影響者的用戶無意的或?qū)で蟮慕Y(jié)果。
[0115]如圖10中所示,相對(duì)于話題網(wǎng)絡(luò)901中的主要集群1002識(shí)別離群值集群1001。從話題網(wǎng)絡(luò)中去除用戶Uo離群值集群1001,并且主要集群1002中的剩余的用戶用于形成所輸出的影響者的排名列表。
[0116]在示例實(shí)施例中,服務(wù)器100計(jì)算以下指令以過濾掉離群值:
[0117]1.在話題網(wǎng)絡(luò)上執(zhí)行模塊性算法。
[0118]2.模塊性功能將話題網(wǎng)絡(luò)分解成多個(gè)模塊化社區(qū)或子網(wǎng)絡(luò),并且將每個(gè)節(jié)點(diǎn)加標(biāo)至IJX個(gè)集群/社區(qū)之一中。在示例實(shí)施例中,X〈n/2,因?yàn)樯鐓^(qū)具有不只一個(gè)成員,并且η是用戶數(shù)量,例如‘有興趣的用戶’列表中的用戶數(shù)量。
[0119]3.按社區(qū)內(nèi)的用戶的數(shù)量對(duì)社區(qū)分類,并且接受人口最多的社區(qū)。
[0120]4.當(dāng)節(jié)點(diǎn)人口的累積總和超過總數(shù)的80%時(shí),從話題網(wǎng)絡(luò)中去除剩余的最小的社區(qū)。
[0121]關(guān)于圖11描述了用于識(shí)別并過濾話題網(wǎng)絡(luò)的計(jì)算機(jī)可執(zhí)行指令的一般示例實(shí)施例??梢哉J(rèn)識(shí)到,這些指令可以用于執(zhí)行框402和502。
[0122]在框1101中,服務(wù)器100將社區(qū)查找算法應(yīng)用于話題網(wǎng)絡(luò)從而將網(wǎng)絡(luò)分解為多個(gè)社區(qū)。用于找出社區(qū)的算法的非限制性示例包括最小割除法、分級(jí)群聚、格文-紐曼算法(Girvan-Newman algorithm)、以上參考的模塊性算法,以及基于團(tuán)集(Clique-based)的方法。
[0123]在框1102中,服務(wù)器將每個(gè)節(jié)點(diǎn)(S卩,用戶)加標(biāo)到X個(gè)社區(qū)之一中,其中X〈n/2,并且η是話題網(wǎng)絡(luò)中的節(jié)點(diǎn)的數(shù)量。
[0124]在框1103中,服務(wù)器識(shí)別每個(gè)社區(qū)內(nèi)的節(jié)點(diǎn)的數(shù)量。
[0125]如果節(jié)點(diǎn)數(shù)量最大的社區(qū)還沒有被添加至經(jīng)過濾的話題網(wǎng)絡(luò)(框1104),則服務(wù)器將該社區(qū)添加至經(jīng)過濾的話題網(wǎng)絡(luò)??梢哉J(rèn)識(shí)到,首先,經(jīng)過濾的話題網(wǎng)絡(luò)包括零社區(qū),并且添加至經(jīng)過濾的話題網(wǎng)絡(luò)的第一社區(qū)是最大的社區(qū)。來自未經(jīng)過濾的話題網(wǎng)絡(luò)的同一社區(qū)不能不止一次被添加至經(jīng)過濾的話題網(wǎng)絡(luò)。
[0126]在框1105中,服務(wù)器確定經(jīng)過濾的話題網(wǎng)絡(luò)的中的節(jié)點(diǎn)的數(shù)量是否超過或大于原始或未經(jīng)過濾的話題網(wǎng)絡(luò)中的節(jié)點(diǎn)的數(shù)量的Y %。在示例實(shí)施例中,Y %是80 %。Y的其他百分比值也是適用的。如果沒有超過,則該過程環(huán)回到框1104。當(dāng)框1105的條件是真的時(shí),該過程前進(jìn)到框1106。
[0127]通常,當(dāng)經(jīng)過濾的話題網(wǎng)絡(luò)中的節(jié)點(diǎn)的數(shù)量達(dá)到或超過未經(jīng)過濾的話題網(wǎng)絡(luò)中的節(jié)點(diǎn)的總數(shù)的多數(shù)百分比時(shí),則已經(jīng)識(shí)別出主集群并且也識(shí)別出是離群值節(jié)點(diǎn)(例如,U0)的剩余節(jié)點(diǎn)。
[0128]在框1106中,輸出不包括離群值用戶Uo的經(jīng)過濾的話題網(wǎng)絡(luò)。
[0129]識(shí)別社區(qū)
[0130]轉(zhuǎn)至圖12,提供了用于從社交網(wǎng)絡(luò)數(shù)據(jù)識(shí)別社區(qū)的計(jì)算機(jī)可執(zhí)行指令的示例性實(shí)施例。
[0131]社交網(wǎng)絡(luò)平臺(tái)的特征是用戶追隨(或定義為朋友)另一個(gè)用戶。如之前所描述的,話題網(wǎng)絡(luò)內(nèi)的多個(gè)節(jié)點(diǎn)和邊緣圖示的用戶之間可存在其他類型的關(guān)系或互連性。在話題網(wǎng)絡(luò)內(nèi),影響者可以在不同程度上影響不同的用戶集群。也就是,基于關(guān)于圖12所描述的用于識(shí)別社區(qū)的過程,服務(wù)器被配置成用于識(shí)別單個(gè)話題網(wǎng)絡(luò)內(nèi)的被稱為社區(qū)的多個(gè)集群。由于影響在社交網(wǎng)絡(luò)平臺(tái)上不均勻,所以關(guān)于圖12定義的社區(qū)識(shí)別過程是有利的,因?yàn)槠渥R(shí)別每個(gè)影響者(例如,通過使一個(gè)社區(qū)與另一個(gè)社區(qū)相關(guān)聯(lián))在話題網(wǎng)絡(luò)上的影響程度或深度。
[0132]如將在圖12中定義的,服務(wù)器被配置成用于提供不同的社區(qū)集合(例如,Cl,…,Cn)以及每個(gè)社區(qū)內(nèi)的排名最高影響者。在另一個(gè)優(yōu)選方面,服務(wù)器被配置成用于提供所有社區(qū)上的排名最高影響者的匯總列表,從而提供所有影響者的相對(duì)順序。
[0133]在框1201中,服務(wù)器被配置成用于從如之前描述的(例如,圖3到圖5)社交聯(lián)網(wǎng)數(shù)據(jù)獲取話題網(wǎng)絡(luò)圖信息。話題網(wǎng)絡(luò)以視覺方式圖示了節(jié)點(diǎn),即‘有興趣的用戶’列表中的用戶集合之間的關(guān)系,該用戶集合各自被表示為話題網(wǎng)絡(luò)圖中的節(jié)點(diǎn)并且通過邊緣連接以表明話題網(wǎng)絡(luò)圖中的兩個(gè)用戶之間的關(guān)系(例如,追隨者關(guān)系、回復(fù)關(guān)系、提及關(guān)系、轉(zhuǎn)帖關(guān)系等)。在框1202中,服務(wù)器獲取內(nèi)部和/或外部互連性(例如,分辨率)的預(yù)定義的程度或衡量值用于定義社區(qū)之間的邊界。
[0134]在框1203中,服務(wù)器被配置成用于根據(jù)預(yù)定義的互連性程度(例如,分辨率)計(jì)算每個(gè)節(jié)點(diǎn)(例如,影響者)和邊緣的得分。也就是,在一個(gè)示例中,每個(gè)用戶句柄被分配一個(gè)模塊性類別標(biāo)識(shí)符(Mod ID)和一個(gè)頁面等級(jí)分?jǐn)?shù)(定義影響程度)。一方面,分辨率參數(shù)被配置成用于控制所識(shí)別的社區(qū)的密度和數(shù)量。在優(yōu)選方面,服務(wù)器利用提供2到10個(gè)社區(qū)的默認(rèn)分辨率值2。在另一方面,分辨率值是由用戶定義的(例如,通過圖2中的計(jì)算裝置101),以根據(jù)社區(qū)信息的可視化需要生成更高或更低的社區(qū)粒度。
[0135]在框1204中,服務(wù)器被配置成用于定義并輸出不同的社區(qū)集群(例如,C1J2,…,Cn),由此將用戶分區(qū)成Ucr-Ucn,這樣使得由網(wǎng)絡(luò)中的節(jié)點(diǎn)定義的每個(gè)用戶映射到相應(yīng)的社區(qū)。在一個(gè)示例性方面,模塊性分析用于定義社區(qū),這樣使得每個(gè)社區(qū)在社區(qū)內(nèi)的節(jié)點(diǎn)集群之間具有稠密的連接(高連接性),但與不同的社區(qū)中的節(jié)點(diǎn)具有稀疏的連接(低連接性)。在一個(gè)示例性方面,可以利用模塊性算法和/或密度算法(其衡量?jī)?nèi)部連接性)實(shí)施社區(qū)檢測(cè)方法步驟1603-1606。此外,在一個(gè)方面,使用開源圖分析包Gephi以及/或者Javascript庫來實(shí)施結(jié)果的可視化。
[0136]在框1205中,服務(wù)器被配置成用于定義并輸出所有社區(qū)上的排名最高影響者和/或每個(gè)社區(qū)內(nèi)的排名最高影響者并且提供所有影響者的相對(duì)排序。在一個(gè)示例性方面,當(dāng)選定特定社區(qū)時(shí),排名最高影響者在視覺上與其社區(qū)并排顯示。在又一個(gè)進(jìn)一步示例性方面,在框1205中,服務(wù)器被配置成用于提供所有社區(qū)上的所有排名最高影響者的匯總列表,以提供所有影響者的相對(duì)順序。
[0137]在框1206中,服務(wù)器被配置用于視覺上描繪并且區(qū)分每個(gè)社區(qū)集群(例如,通過顏色編碼、相對(duì)位置或者用于區(qū)分不同社區(qū)的其他視覺識(shí)別方法)。在進(jìn)一步方面,在框1206中,服務(wù)器被配置用于提供與對(duì)應(yīng)社區(qū)視覺上關(guān)聯(lián)的每個(gè)社區(qū)的排名最高影響者的集合。在又一個(gè)進(jìn)一步方面,在框1206中,服務(wù)器被配置用于改變社區(qū)圖的每個(gè)節(jié)點(diǎn)的大小以與對(duì)應(yīng)響應(yīng)者的分?jǐn)?shù)(例如,影響分?jǐn)?shù))對(duì)應(yīng)。作為框1206的輸出,節(jié)點(diǎn)的邊緣示出了每個(gè)用戶在其社區(qū)以及在不同社區(qū)之間的連接。
[0138]因此,如圖13到圖15中所示,社區(qū)和影響者(例如,每個(gè)社區(qū)內(nèi)排名的排名最高影響者以及/或者所有社區(qū)上的排名最高影響者的列表)的可視化可使得終端用戶(例如,圖2中的計(jì)算裝置101的用戶)能夠可視化其相關(guān)社區(qū)中的每個(gè)影響者的規(guī)模和相對(duì)重要性。
[0139]識(shí)別指定社區(qū)內(nèi)的熱門特征
[0140]如相對(duì)于圖3到圖5所述,在又一個(gè)進(jìn)一步方面,服務(wù)器被配置成用于,針對(duì)框1204提供的每個(gè)指定社區(qū)(例如,Cl),基于該指定社區(qū)(例如,C1)內(nèi)的用戶(例如,UCl)的社交網(wǎng)絡(luò)數(shù)據(jù),確定與其相關(guān)聯(lián)的預(yù)定義特征(例如,常見的關(guān)鍵字和短語、談話的話題、常見的位置、常見的圖像、常見的元數(shù)據(jù))的熱門特征值。因此,可以通過檢查每個(gè)社區(qū)&內(nèi)的用戶Uc1的預(yù)定義特征集合(例如,談話的話題)來定義趨勢(shì)或者共同性。在一個(gè)示例性方面,排名最高特征值的列表(例如,每個(gè)社區(qū)的所有用戶中的排名最高談話話題)在框1205中描繪,并且輸出到計(jì)算裝置101(如圖2所示),用于與每個(gè)社區(qū)關(guān)聯(lián)地顯示。
[0141]顯示社區(qū)和熱門特征
[0142]參見圖13到圖15,其中示出了從服務(wù)器的GUI模塊106提供并且輸出到計(jì)算裝置(如圖2中所示)的顯示屏125以可視化來自話題網(wǎng)絡(luò)的社區(qū)集群并且可視化每個(gè)社區(qū)中的熱門特征的屏幕截圖。服務(wù)器提供了用于選擇社區(qū)和/或話題網(wǎng)絡(luò)/特定社區(qū)內(nèi)的節(jié)點(diǎn)以可視化地展示每個(gè)節(jié)點(diǎn)(例如,用戶、社區(qū)信息以及影響程度)的詳情的交互式接口。因此,圖13到圖15示出了影響者社區(qū)及其特征(例如,在WordCloud可視化技術(shù)中的每個(gè)社區(qū)的談話)的交互式可視化。同樣如圖13到圖15中所示,每個(gè)社區(qū)(例如,由邊緣和節(jié)點(diǎn)組成)被可視化地與另一個(gè)社區(qū)區(qū)分開來(例如,通過顏色編碼),并且每個(gè)節(jié)點(diǎn)依據(jù)整個(gè)話題網(wǎng)絡(luò)內(nèi)的影響程序進(jìn)行大小調(diào)整。例如,用戶的影響程序?qū)?yīng)于社區(qū)或者話題網(wǎng)絡(luò)內(nèi)的用戶賬戶的排名。此外,通過選擇特定社區(qū)(例如,使用鼠標(biāo)或者指針視覺地選擇話題網(wǎng)絡(luò)中的社區(qū)),隨之描繪了社區(qū)值(例如,高亮顯示話題網(wǎng)絡(luò)圖內(nèi)的社區(qū),展示社區(qū)內(nèi)的排名最高影響者,并且展示所選社區(qū)的排名最高談話話題的熱門特征)。在圖13到圖15中,顯示屏(例如,圖2中的計(jì)算裝置101的屏幕)上熱門特征值的可視化被顯示成詞云,該詞云描繪了所選社區(qū)內(nèi)的排名最高談話話題以及特定社區(qū)的所有用戶中對(duì)每個(gè)話題的使用頻率指征。
[0143]例如,節(jié)點(diǎn)被進(jìn)行顏色編碼,以可視化地將其與其對(duì)應(yīng)的社區(qū)關(guān)聯(lián),并且每個(gè)節(jié)點(diǎn)的大小與其社區(qū)(顏色編碼)內(nèi)相對(duì)于整個(gè)話題網(wǎng)絡(luò)的影響者分?jǐn)?shù)成比例。選擇節(jié)點(diǎn)(例如,將鼠標(biāo)指針懸停在節(jié)點(diǎn)上方)時(shí),Twitter句柄彈出,并且該句柄的信息顯示在屏幕上。
[0144]在另一個(gè)示例中,選擇子圖時(shí),其可視化地高亮顯示該所選社區(qū)中的排名最高影響者,并且在屏幕上提供可視化呈現(xiàn)(例如,該社區(qū)的談話詞云)。其示出對(duì)社區(qū)行為、正面/負(fù)面情緒的見解。
[0145]示例情境:個(gè)人護(hù)理品品牌
[0146]在一個(gè)示例性實(shí)施例中,向圖3中所示的過程中輸入個(gè)人護(hù)理品品牌的名稱。圖13b中示出了使用加權(quán)分析的展示了影響者的社區(qū)網(wǎng)絡(luò)圖形輸出。個(gè)人護(hù)理品公司發(fā)布YouTube視頻,作為其一個(gè)廣告活動(dòng)的一部分。該廣告活動(dòng)的成功在于數(shù)百人通過Twitter分享了該YouTube視頻。圖13a示出了針對(duì)未加權(quán)的影響者圖獲取的結(jié)果的比較分析,而圖13b示出了使用加權(quán)分析的影響者圖。加權(quán)分析能夠?qū)ⅰ癥ouTube”識(shí)別成重要影響者,而未加權(quán)分析無法識(shí)別Youtube。對(duì)于將YouTube看作影響者的個(gè)人護(hù)理品公司,立即顯示該視頻廣告活動(dòng)很受歡迎。
[0147]示例情境:制藥公司
[0148]在一個(gè)示例性實(shí)施例中,向圖3中所示的過程中輸入制藥公司的名稱。圖14中示出了使用加權(quán)分析的展示了影響者的社區(qū)網(wǎng)絡(luò)圖形輸出。對(duì)于制藥公司,當(dāng)出現(xiàn)重大公共關(guān)系錯(cuò)誤(例如,循環(huán)出現(xiàn)關(guān)于其一種藥品的不當(dāng)信息)時(shí),該公司需要識(shí)別出能夠幫助盡快處理該情況的影響者。例如,制藥公司已經(jīng)宣布該公司不再花錢雇傭醫(yī)生或者其他保健專家來宣傳該公司產(chǎn)品。關(guān)于該公司決定的文章出現(xiàn)在多個(gè)網(wǎng)站上:Dr.Merco Ia網(wǎng)站、紐約時(shí)報(bào)暢銷書作家,以及時(shí)代雜志(TIME)、洛杉磯時(shí)報(bào)(LA Times)、美國有線電視新聞網(wǎng)絡(luò)(CNN)、??怂剐侣?Fox News)、美國廣播公司新聞網(wǎng)(ABC News)和今日秀(Today Show)特輯中。
[0149]在圖14中,加權(quán)影響者過程將Omercola(該網(wǎng)站的推特句柄)視作該社區(qū)中談?wù)撛撛掝}的排名最高影響者之一。因此,在必要時(shí),該制藥公司可以將‘mercola’的網(wǎng)站或者網(wǎng)站平臺(tái)視作傳播任何重要信息的重要影響者。
[0150]示例情境:超級(jí)足球杯(Super Bowl)
[0151]在一個(gè)示例性實(shí)施例中,向圖3中所示的過程中輸入話題“超級(jí)足球杯”。圖15b中示出了使用加權(quán)分析的展示了影響者的社區(qū)網(wǎng)絡(luò)圖形輸出。從背景來看,超級(jí)足球杯是美國的熱門體育事件。許多大品牌和電視頻道想要通過組織與其關(guān)聯(lián)的公共關(guān)系事件來利用超級(jí)足球杯。例如,在上一屆超級(jí)足球杯之前,脫口秀節(jié)目“艾倫秀(Ellen show)”或者“艾倫.德杰尼勒斯秀(Ellen DeGeneres Show)”將為一些賽事的獲勝者送出超級(jí)足球杯的免費(fèi)門票。當(dāng)該秀的官方推特句柄“Otheellenshow”作為排名最高影響者出現(xiàn),并且存在談?wù)撛摴碴P(guān)系活動(dòng)的整個(gè)社區(qū)時(shí),可以看到該賽事的成功。圖15示出了未加權(quán)分析(圖15a)和加權(quán)分析(圖15b)獲取的結(jié)果的比較分析。加權(quán)和未加權(quán)版本均識(shí)別了談?wù)撢A得超級(jí)足球杯的免費(fèi)門票的社區(qū),但是加權(quán)分析還能夠識(shí)別來源或者影響者“Otheellenshow”,如圖15b中所示。
[0152]超級(jí)足球杯案例研究。(A)描繪了識(shí)別主要談?wù)摮?jí)足球杯、丹佛野馬(Broncos)與西雅圖海鷹(Seahawks)或者免費(fèi)門票的影響者的舊方法。(B)描繪了除此之外還識(shí)別“theellenshow”的新方法的結(jié)果。
[0153]因此,提供了用于針對(duì)指定查詢?cè)掝}識(shí)別其社交社區(qū)(基于所獲取的社交聯(lián)網(wǎng)數(shù)據(jù))內(nèi)的影響者的系統(tǒng)和方法??梢粤私獾?,影響者的特征不一,并且實(shí)際上,即便在指定的話題網(wǎng)絡(luò)內(nèi),也存在影響者的社區(qū)。本文提供的系統(tǒng)和方法被用于在可視化于網(wǎng)絡(luò)圖中的計(jì)算裝置(例如,計(jì)算裝置101)上輸出可視化以展示實(shí)體或者個(gè)人的相對(duì)影響者以及它們的對(duì)應(yīng)社區(qū)。此外,熱門特征值(例如,基于預(yù)定義的特征,例如談話的話題)被可視化地描繪在展示排名最高的或者相關(guān)的話題的每個(gè)社區(qū)的計(jì)算裝置的顯示屏上。這些話題可以描繪成每個(gè)社區(qū)談話的詞云,以可視化地展示各個(gè)社區(qū)的行為特征。
[0154]以下描述了所提出的計(jì)算系統(tǒng)和方法的一般性示例實(shí)施例。
[0155]在一個(gè)示例性實(shí)施例中,提供了一種由服務(wù)器執(zhí)行的、用于針對(duì)話題確定至少一個(gè)用戶賬戶的加權(quán)影響的方法。在另一個(gè)示例性實(shí)施例中,提供了一種服務(wù)器系統(tǒng)或者服務(wù)器,用于針對(duì)話題確定至少一個(gè)用戶賬戶的加權(quán)影響,該服務(wù)器系統(tǒng)包括處理器、存儲(chǔ)器和存儲(chǔ)在存儲(chǔ)器上的可執(zhí)行指令。所述方法或者指令,或者這兩者,包括:所述服務(wù)器獲取所述話題;確定一個(gè)或多個(gè)社交數(shù)據(jù)網(wǎng)絡(luò)內(nèi)與所述話題相關(guān)的帖子,所述服務(wù)器有權(quán)限訪問來自一個(gè)或多個(gè)社交數(shù)據(jù)網(wǎng)絡(luò)的數(shù)據(jù);將每個(gè)帖子描述成以下各項(xiàng)中的一項(xiàng)或多項(xiàng):另一個(gè)發(fā)帖的回復(fù)帖子,另一個(gè)用戶賬戶的提及帖子,以及原始發(fā)帖的轉(zhuǎn)帖;生成用戶賬戶組,其中所述用戶賬戶組包括創(chuàng)作在所述提及帖子中被提及的發(fā)帖,發(fā)布原始發(fā)帖,創(chuàng)作與所述話題相關(guān)的一個(gè)或多個(gè)帖子,或者其任何組合的用戶賬戶;將所述組中的每個(gè)所述用戶賬戶表示成相連圖中的節(jié)點(diǎn)并且在一個(gè)或多個(gè)節(jié)點(diǎn)對(duì)之間建立邊緣;對(duì)于指定節(jié)點(diǎn)對(duì)之間的每個(gè)邊緣,確定加權(quán),該加權(quán)是以下各項(xiàng)中的一項(xiàng)或多項(xiàng)的函數(shù):是否存在追隨者-被追隨者關(guān)系,涉及指定節(jié)點(diǎn)對(duì)的提及帖子的數(shù)量、回復(fù)帖子的數(shù)量和轉(zhuǎn)帖的數(shù)量;并且使用每個(gè)所述節(jié)點(diǎn)和所述邊緣計(jì)算話題網(wǎng)絡(luò)圖,每個(gè)邊緣與加權(quán)關(guān)聯(lián)。
[0156]在一個(gè)示例性方面,當(dāng)指定節(jié)點(diǎn)對(duì)之間存在追隨者-被追隨者關(guān)系,則將邊緣的加權(quán)初始化成默認(rèn)值,并且基于以下各項(xiàng)中的任一項(xiàng)或者更多項(xiàng)進(jìn)一步調(diào)整加權(quán):涉及指定節(jié)點(diǎn)對(duì)的提及帖子的數(shù)量、回復(fù)帖子的數(shù)量以及轉(zhuǎn)帖的數(shù)量。
[0157]在一個(gè)示例性方面,所述方法或者指令,或者這兩者,進(jìn)一步包括:在話題網(wǎng)絡(luò)圖中對(duì)用戶賬戶進(jìn)行排名,以過濾掉話題網(wǎng)絡(luò)圖內(nèi)的離群值節(jié)點(diǎn);在經(jīng)過濾的話題網(wǎng)絡(luò)圖內(nèi)的用戶賬戶之間識(shí)別出至少兩個(gè)不同的社區(qū),每個(gè)社區(qū)與用戶賬戶的子集關(guān)聯(lián);識(shí)別與每個(gè)社區(qū)關(guān)聯(lián)的屬性;以及輸出與對(duì)應(yīng)屬性關(guān)聯(lián)的每個(gè)社區(qū)。
[0158]在一個(gè)示例性方面,所述方法或者指令或者這兩者進(jìn)一步包括:對(duì)每個(gè)社區(qū)內(nèi)的用戶賬戶進(jìn)行排名;以及對(duì)于每個(gè)社區(qū),提供映射到對(duì)應(yīng)社區(qū)的用戶賬戶的已排名列表。
[0159]在一個(gè)示例性方面,對(duì)用戶賬戶進(jìn)行排名進(jìn)一步包括:將每個(gè)已排名的用戶賬戶映射到對(duì)應(yīng)的社區(qū);以及輸出至少兩個(gè)社區(qū)的用戶賬戶的已排名列表。
[0160]在一個(gè)示例性方面,所述屬性與每個(gè)用戶賬戶與社交數(shù)據(jù)網(wǎng)絡(luò)的交互相關(guān)聯(lián)。
[0161]在一個(gè)示例性方面,所述屬性與用戶賬戶的屬性的組合頻率關(guān)聯(lián)地顯示。
[0162]在一個(gè)示例性方面,所述屬性是特定社區(qū)內(nèi)的用戶的談話話題的頻率。
[0163]在另一個(gè)示例性實(shí)施例中,方法由服務(wù)器實(shí)施,用于確定對(duì)話題具有影響力的至少一個(gè)用戶賬戶。所述方法包括:獲取所述話題;確定社交數(shù)據(jù)網(wǎng)絡(luò)內(nèi)與所述話題相關(guān)的多個(gè)用戶賬戶;將每個(gè)所述用戶賬戶表示成相連圖中的節(jié)點(diǎn),并且確定每個(gè)所述用戶賬戶之間是否存在關(guān)系;通過將每個(gè)所述用戶賬戶用作節(jié)點(diǎn)并且將對(duì)應(yīng)關(guān)系用作每個(gè)所述節(jié)點(diǎn)之間的邊緣,計(jì)算話題網(wǎng)絡(luò)圖;對(duì)話題網(wǎng)絡(luò)圖內(nèi)的用戶賬戶進(jìn)行排名,以過濾掉所述話題網(wǎng)絡(luò)圖內(nèi)的離群值節(jié)點(diǎn);在經(jīng)過濾的話題網(wǎng)絡(luò)圖內(nèi)的用戶賬戶中識(shí)別出至少兩個(gè)不同的社區(qū),每個(gè)社區(qū)與用戶賬戶的子集關(guān)聯(lián);識(shí)別與每個(gè)社區(qū)關(guān)聯(lián)的屬性;以及輸出與對(duì)應(yīng)的屬性關(guān)聯(lián)的每個(gè)社區(qū)。
[0164]在一個(gè)示例性方面,所述方法進(jìn)一步包括:對(duì)每個(gè)社區(qū)內(nèi)的用戶賬戶進(jìn)行排名;以及對(duì)于每個(gè)社區(qū),提供映射到對(duì)應(yīng)社區(qū)的用戶賬戶的已排名列表。
[0165]在一個(gè)示例性方面,其中對(duì)用戶賬戶進(jìn)行排名進(jìn)一步包括:將每個(gè)已排名的用戶賬戶映射到對(duì)應(yīng)的社區(qū);以及輸出至少兩個(gè)社區(qū)的用戶賬戶的已排名列表。
[0166]在一個(gè)示例性方面,其中所述屬性與每個(gè)用戶賬戶與社交數(shù)據(jù)網(wǎng)絡(luò)的交互相關(guān)聯(lián)。
[0167]在一個(gè)示例性方面,其中所述屬性與用戶賬戶的屬性的組合頻率關(guān)聯(lián)地顯示。
[0168]在一個(gè)示例性方面,其中所述屬性是特定社區(qū)內(nèi)的用戶的談話話題的頻率。
[0169]在一個(gè)示例性實(shí)施例中,所述方法進(jìn)一步包括:在圖形用戶界面中顯示至少兩個(gè)不同的社區(qū),這兩個(gè)不同的社區(qū)包括顏色編碼的節(jié)點(diǎn)和邊緣,其中所述顏色編碼的節(jié)點(diǎn)和邊緣的至少第一部分是與第一社區(qū)關(guān)聯(lián)的第一顏色,并且所述顏色編碼的節(jié)點(diǎn)和邊緣的至少第二部分是與第二社區(qū)關(guān)聯(lián)的第二顏色。
[0170]在一個(gè)示例性方面,其中指定顏色編碼的節(jié)點(diǎn)的大小與指定顏色編碼的節(jié)點(diǎn)所代表的指定用戶賬戶的影響程度相關(guān)聯(lián)。
[0171]在一個(gè)示例性方面,所述方法進(jìn)一步包括顯示與指定社區(qū)關(guān)聯(lián)的詞語,這些詞語與指定社區(qū)的屬性相對(duì)應(yīng)。
[0172]在一個(gè)示例性方面,所述方法進(jìn)一步包括:在圖形用戶界面中檢測(cè)與指定社區(qū)交互的用戶控制的指針;以及以下各項(xiàng)中的至少一項(xiàng):顯示指定社區(qū)中的一個(gè)或多個(gè)排名最高的用戶賬戶;可視化地高亮顯示指定社區(qū);以及顯示與指定社區(qū)相關(guān)聯(lián)的詞語,這些詞語與指定社區(qū)的屬性相對(duì)應(yīng)。
[0173]在另一個(gè)示例性實(shí)施例中,提供了一種用于確定對(duì)話題具有影響力的至少一個(gè)用戶賬戶的計(jì)算系統(tǒng)。所述計(jì)算系統(tǒng)包括:通信裝置;存儲(chǔ)器;以及處理器,所述處理器被配置用于至少:獲取所述話題;確定社交數(shù)據(jù)網(wǎng)絡(luò)內(nèi)與所述話題相關(guān)的多個(gè)用戶賬戶;將每個(gè)所述用戶賬戶表示成相連圖中的節(jié)點(diǎn),并且確定每個(gè)所述用戶賬戶之間是否存在關(guān)系;通過將每個(gè)所述用戶賬戶用作節(jié)點(diǎn)并且將對(duì)應(yīng)關(guān)系用作每個(gè)所述節(jié)點(diǎn)之間的邊緣,計(jì)算話題網(wǎng)絡(luò)圖;對(duì)話題網(wǎng)絡(luò)圖內(nèi)的用戶賬戶進(jìn)行排名,以過濾掉所述話題網(wǎng)絡(luò)圖內(nèi)的離群值節(jié)點(diǎn);在經(jīng)過濾的話題網(wǎng)絡(luò)圖內(nèi)的用戶賬戶中識(shí)別出至少兩個(gè)不同的社區(qū),每個(gè)社區(qū)與用戶賬戶的子集關(guān)聯(lián);識(shí)別與每個(gè)社區(qū)關(guān)聯(lián)的屬性;以及輸出與對(duì)應(yīng)的屬性關(guān)聯(lián)的每個(gè)社區(qū)。
[0174]在另一個(gè)示例性實(shí)施例中,提供了一種由服務(wù)器實(shí)施、用于確定對(duì)話題具有影響力的一個(gè)或多個(gè)用戶的方法。所述方法包括:獲取話題;確定社交數(shù)據(jù)網(wǎng)絡(luò)內(nèi)與所述話題相關(guān)的用戶;將每個(gè)所述用戶建模成節(jié)點(diǎn),并且確定每個(gè)所述用戶之間的關(guān)系;通過將所述用戶用作節(jié)點(diǎn)并且將所述關(guān)系用作邊緣,計(jì)算話題網(wǎng)絡(luò)圖;對(duì)所述話題網(wǎng)絡(luò)圖內(nèi)的用戶進(jìn)行排名;識(shí)別并且過濾掉所述話題網(wǎng)絡(luò)圖內(nèi)的離群值節(jié)點(diǎn);以及根據(jù)其關(guān)聯(lián)的排名,輸出所述話題網(wǎng)絡(luò)圖內(nèi)剩余的用戶。
[0175]在一個(gè)示例性方面,對(duì)包含所述話題的內(nèi)容進(jìn)行消耗以及生成中的至少一者的用戶被視作與所述話題相關(guān)的用戶。
[0176]在另一個(gè)示例性方面,在所述話題網(wǎng)絡(luò)圖中,至少兩個(gè)用戶之間定義的邊緣代表所述至少兩個(gè)用戶之間的朋友連接。
[0177]在另一個(gè)示例性方面,在所述話題網(wǎng)絡(luò)圖中,至少兩個(gè)用戶之間定義的邊緣代表所述至少兩個(gè)用戶之間的追隨者-被追隨者連接,并且其中所述至少兩個(gè)用戶中的一個(gè)用戶是追隨者,而所述至少兩個(gè)用戶中的另一個(gè)用戶是被追隨者。
[0178]在另一個(gè)示例性方面,在所述話題網(wǎng)絡(luò)圖中,至少兩個(gè)用戶之間定義的邊緣代表所述至少兩個(gè)用戶之間的回復(fù)連接,并且其中所述至少兩個(gè)用戶中的一個(gè)用戶對(duì)所述至少兩個(gè)用戶中的另一個(gè)用戶的發(fā)帖做出回復(fù)。
[0179]在另一個(gè)示例性方面,在所述話題網(wǎng)絡(luò)圖中,至少兩個(gè)用戶之間定義的邊緣代表所述至少兩個(gè)用戶之間的轉(zhuǎn)帖連接,并且其中所述至少兩個(gè)用戶中的一個(gè)用戶對(duì)所述至少兩個(gè)用戶中的另一個(gè)用戶的發(fā)帖進(jìn)行轉(zhuǎn)帖。
[0180]在另一個(gè)示例性方面,所述排名包括使用頁面等級(jí)算法衡量所述話題網(wǎng)絡(luò)內(nèi)的指定用戶的重要性。
[0181]在另一個(gè)示例性方面,所述排名包括使用以下各項(xiàng)中的至少一項(xiàng):特征向量中心性、加權(quán)度、中間狀態(tài)、樞紐以及權(quán)威度量。
[0182]在另一個(gè)示例性方面,識(shí)別和過濾掉所述話題網(wǎng)絡(luò)圖內(nèi)的離群值節(jié)點(diǎn)包括:對(duì)所述話題網(wǎng)絡(luò)圖應(yīng)用集群算法、模塊性算法以及社區(qū)檢測(cè)算法中的至少一個(gè),以輸出多個(gè)社區(qū);按照所述多個(gè)社區(qū)中的每個(gè)社區(qū)內(nèi)的用戶數(shù)量對(duì)所述多個(gè)社區(qū)進(jìn)行排序;選擇用戶數(shù)量最大的數(shù)量η的社區(qū),其中所述η數(shù)量的社區(qū)中的用戶累加和至少滿足所述話題網(wǎng)絡(luò)圖中的用戶總數(shù)的百分?jǐn)?shù)閾值;以及將未選擇社區(qū)中的用戶建立為離群值節(jié)點(diǎn)。
[0183]在另一個(gè)示例性實(shí)施例中,提供了一種用于確定對(duì)話題具有影響力的一個(gè)或多個(gè)用戶的計(jì)算系統(tǒng)。所述計(jì)算系統(tǒng)包括:通信裝置;存儲(chǔ)器;以及處理器。所述處理器被配置用于至少:獲取話題;確定社交數(shù)據(jù)網(wǎng)絡(luò)內(nèi)與所述話題相關(guān)的用戶;將每個(gè)所述用戶建模成節(jié)點(diǎn),并且確定每個(gè)所述用戶之間的關(guān)系;通過將所述用戶用作節(jié)點(diǎn)并且將所述關(guān)系用作邊緣,計(jì)算話題網(wǎng)絡(luò)圖;對(duì)所述話題網(wǎng)絡(luò)圖內(nèi)的用戶進(jìn)行排名;識(shí)別并且過濾掉所述話題網(wǎng)絡(luò)圖內(nèi)的離群值節(jié)點(diǎn);以及根據(jù)其關(guān)聯(lián)的排名,輸出所述話題網(wǎng)絡(luò)圖內(nèi)剩余的用戶。
[0184]將認(rèn)識(shí)到,本文中所描述的系統(tǒng)和方法的示例實(shí)施例的不同特征可以用不同的方式相互組合。換言之,盡管沒有具體闡明,但根據(jù)其他示例實(shí)施例,不同的模塊、操作和部件可以一起使用。
[0185]本文中描述的所流程圖中的步驟或操作僅是示例。在不脫離本發(fā)明或這些發(fā)明的精神的情況下,這些步驟或操作可以有許多變化。例如,這些步驟可以按不同的順序進(jìn)行,或者可以添加、刪除或修改步驟。
[0186]本文所述的GUI和屏幕截圖僅用于示例說明。在不脫離本發(fā)明或這些發(fā)明的精神的情況下,圖形和交互式元素可以有許多變化。例如,該等元素可以位于不同地方,或者可以添加、刪除或者修改。
[0187]盡管已經(jīng)參照某些特定實(shí)施例對(duì)以上內(nèi)容進(jìn)行了描述,但在不脫離所附權(quán)利要求書的范圍的情況下,其各種修改對(duì)于本領(lǐng)域的技術(shù)人員而言將是明顯的。
【主權(quán)項(xiàng)】
1.一種通過服務(wù)器執(zhí)行的方法,所述方法用于針對(duì)話題確定至少一個(gè)用戶賬戶的加權(quán)影響,所述方法包括: 所述服務(wù)器獲取所述話題; 確定一個(gè)或多個(gè)社交數(shù)據(jù)網(wǎng)絡(luò)內(nèi)與所述話題相關(guān)的帖子,所述服務(wù)器有權(quán)限訪問來自所述一個(gè)或多個(gè)社交數(shù)據(jù)網(wǎng)絡(luò)的數(shù)據(jù); 將每個(gè)帖子描述成以下各項(xiàng)中的一項(xiàng)或多項(xiàng):另一個(gè)發(fā)帖的回復(fù)帖子、另一個(gè)用戶賬戶的提及帖子,以及原始發(fā)帖的轉(zhuǎn)帖; 生成用戶賬戶組,所述用戶賬戶組中包括創(chuàng)作在所述提及帖子中被提及的帖子、發(fā)布所述原始帖子、創(chuàng)作與所述話題相關(guān)的一個(gè)或多個(gè)帖子,或者其任何組合的任何用戶賬戶; 將所述組中的每個(gè)所述用戶賬戶表示成相連圖中的節(jié)點(diǎn),并且在一個(gè)或多個(gè)節(jié)點(diǎn)對(duì)之間建立邊緣; 對(duì)于指定節(jié)點(diǎn)對(duì)之間的每個(gè)邊緣,確定加權(quán),所述加權(quán)是以下各項(xiàng)中的一項(xiàng)或多項(xiàng)的函數(shù): 是否存在追隨者-被追隨者關(guān)系,涉及所述指定節(jié)點(diǎn)對(duì)的提及帖子的數(shù)量、回復(fù)帖子的數(shù)量以及轉(zhuǎn)帖的數(shù)量;以及 計(jì)算利用每個(gè)所述節(jié)點(diǎn)和所述邊緣的話題網(wǎng)絡(luò)圖,每個(gè)邊緣與加權(quán)關(guān)聯(lián)。2.根據(jù)權(quán)利要求1所述的方法,其中,如果所述指定節(jié)點(diǎn)對(duì)之間存在所述追隨者-被追隨者關(guān)系,則將所述邊緣的所述加權(quán)初始化成默認(rèn)值,并且基于以下各項(xiàng)中的任一項(xiàng)或者更多項(xiàng)進(jìn)一步調(diào)整所述加權(quán):涉及所述指定節(jié)點(diǎn)對(duì)的所述提及帖子的數(shù)量、所述回復(fù)帖子的數(shù)量以及所述轉(zhuǎn)帖的數(shù)量。3.根據(jù)權(quán)利要求1所述的方法,其進(jìn)一步包括: 對(duì)所述話題網(wǎng)絡(luò)圖內(nèi)的所述用戶賬戶進(jìn)行排名,以過濾掉所述話題網(wǎng)絡(luò)圖內(nèi)的離群值節(jié)點(diǎn); 在經(jīng)過濾的話題網(wǎng)絡(luò)圖內(nèi)的所述用戶賬戶中識(shí)別出至少兩個(gè)不同的社區(qū),每個(gè)社區(qū)與所述用戶賬戶的子集關(guān)聯(lián); 識(shí)別與每個(gè)社區(qū)關(guān)聯(lián)的屬性;以及 輸出與對(duì)應(yīng)屬性關(guān)聯(lián)的每個(gè)社區(qū)。4.根據(jù)權(quán)利要求3所述的方法,其進(jìn)一步包括:對(duì)每個(gè)社區(qū)內(nèi)的所述用戶賬戶進(jìn)行排名;以及對(duì)于每個(gè)社區(qū),提供映射到對(duì)應(yīng)社區(qū)的所述用戶賬戶的已排名列表。5.根據(jù)權(quán)利要求4所述的方法,其中對(duì)所述用戶賬戶進(jìn)行排名進(jìn)一步包括:將每個(gè)已排名的用戶賬戶映射到對(duì)應(yīng)的社區(qū);以及輸出所述至少兩個(gè)社區(qū)的所述用戶賬戶的已排名列表。6.根據(jù)權(quán)利要求3所述的方法,其中所述屬性與每個(gè)用戶賬戶與所述社交數(shù)據(jù)網(wǎng)絡(luò)的交互相關(guān)聯(lián)。7.根據(jù)權(quán)利要求3所述的方法,其中所述屬性與所述用戶賬戶的所述屬性的組合頻率關(guān)聯(lián)地顯不。8.根據(jù)權(quán)利要求3所述的方法,其中所述屬性是特定社區(qū)內(nèi)的用戶的談話話題的頻率。9.根據(jù)權(quán)利要求3所述的方法,其進(jìn)一步包括:在圖形用戶界面中顯示所述至少兩個(gè)不同的社區(qū),所述至少兩個(gè)不同的社區(qū)包括顏色編碼的節(jié)點(diǎn)和邊緣,其中所述顏色編碼的節(jié)點(diǎn)和邊緣的至少第一部分是與第一社區(qū)關(guān)聯(lián)的第一顏色,并且所述顏色編碼的節(jié)點(diǎn)和邊緣的至少第二部分是與第二社區(qū)關(guān)聯(lián)的第二顏色。10.根據(jù)權(quán)利要求9所述的方法,其中指定顏色編碼的節(jié)點(diǎn)的大小與所述指定顏色編碼的節(jié)點(diǎn)所代表的指定用戶賬戶的影響程度相關(guān)聯(lián)。11.一種用于針對(duì)話題確定至少一個(gè)用戶賬戶的加權(quán)影響的計(jì)算系統(tǒng),所述計(jì)算系統(tǒng)包括: 通信裝置; 存儲(chǔ)器;以及 處理器,所述處理器被配置用于至少: 獲取所述話題; 確定一個(gè)或多個(gè)社交數(shù)據(jù)網(wǎng)絡(luò)內(nèi)與所述話題相關(guān)的帖子,所述計(jì)算系統(tǒng)有權(quán)限訪問來自所述一個(gè)或多個(gè)社交數(shù)據(jù)網(wǎng)絡(luò)的數(shù)據(jù); 將每個(gè)帖子描述成以下各項(xiàng)中的一項(xiàng)或多項(xiàng):另一個(gè)發(fā)帖的回復(fù)帖子、另一個(gè)用戶賬戶的提及帖子,以及原始發(fā)帖的轉(zhuǎn)帖; 生成用戶賬戶組,所述用戶賬戶組中包括創(chuàng)作在所述提及帖子中被提及的帖子、發(fā)布所述原始帖子、創(chuàng)作與所述話題相關(guān)的一個(gè)或多個(gè)帖子,或者其任何組合的任何用戶賬戶;將所述組中的每個(gè)所述用戶賬戶表示成相連圖中的節(jié)點(diǎn),并且在一個(gè)或多個(gè)節(jié)點(diǎn)對(duì)之間建立邊緣; 對(duì)于指定節(jié)點(diǎn)對(duì)之間的每個(gè)邊緣,確定加權(quán),所述加權(quán)是以下各項(xiàng)中的一項(xiàng)或多項(xiàng)的函數(shù): 是否存在追隨者-被追隨者關(guān)系,涉及所述指定節(jié)點(diǎn)對(duì)的提及帖子的數(shù)量、回復(fù)帖子的數(shù)量以及轉(zhuǎn)帖的數(shù)量;以及 計(jì)算利用每個(gè)所述節(jié)點(diǎn)和所述邊緣的話題網(wǎng)絡(luò)圖,每個(gè)邊緣與加權(quán)關(guān)聯(lián)。12.根據(jù)權(quán)利要求11所述的計(jì)算系統(tǒng),其中,如果所述指定節(jié)點(diǎn)對(duì)之間存在所述追隨者-被追隨者關(guān)系,則將所述邊緣的所述加權(quán)初始化成默認(rèn)值,并且基于以下各項(xiàng)中的任一項(xiàng)或者更多項(xiàng)進(jìn)一步調(diào)整所述加權(quán):涉及所述指定節(jié)點(diǎn)對(duì)的所述提及帖子的數(shù)量、所述回復(fù)帖子的數(shù)量以及所述轉(zhuǎn)帖的數(shù)量。13.根據(jù)權(quán)利要求11所述的計(jì)算系統(tǒng),其中所述處理器進(jìn)一步被配置用于: 對(duì)所述話題網(wǎng)絡(luò)圖內(nèi)的所述用戶賬戶進(jìn)行排名,以過濾掉所述話題網(wǎng)絡(luò)圖內(nèi)的離群值節(jié)點(diǎn); 在經(jīng)過濾的話題網(wǎng)絡(luò)圖內(nèi)的所述用戶賬戶中識(shí)別出至少兩個(gè)不同的社區(qū),每個(gè)社區(qū)與所述用戶賬戶的子集關(guān)聯(lián); 識(shí)別與每個(gè)社區(qū)關(guān)聯(lián)的屬性;以及 輸出與對(duì)應(yīng)屬性關(guān)聯(lián)的每個(gè)社區(qū)。14.根據(jù)權(quán)利要求13所述的計(jì)算系統(tǒng),其中所述處理器進(jìn)一步用于:對(duì)每個(gè)社區(qū)內(nèi)的所述用戶賬戶進(jìn)行排名;以及對(duì)于每個(gè)社區(qū),提供映射到對(duì)應(yīng)社區(qū)的所述用戶賬戶的已排名列表。15.根據(jù)權(quán)利要求14所述的計(jì)算系統(tǒng),其中對(duì)所述用戶賬戶進(jìn)行排名進(jìn)一步包括:將每個(gè)已排名的用戶賬戶映射到對(duì)應(yīng)的社區(qū);以及輸出所述至少兩個(gè)社區(qū)的所述用戶賬戶的已排名列表。16.根據(jù)權(quán)利要求13所述的計(jì)算系統(tǒng),其中所述屬性與每個(gè)用戶賬戶與所述社交數(shù)據(jù)網(wǎng)絡(luò)的交互相關(guān)聯(lián)。17.根據(jù)權(quán)利要求13所述的計(jì)算系統(tǒng),其中所述屬性與所述用戶賬戶的所述屬性的組合頻率關(guān)聯(lián)地顯不。18.根據(jù)權(quán)利要求13所述的計(jì)算系統(tǒng),其中所述屬性是特定社區(qū)內(nèi)的用戶的談話話題的頻率。19.根據(jù)權(quán)利要求13所述的計(jì)算系統(tǒng),其進(jìn)一步包括顯示裝置,并且其中所述處理器進(jìn)一步被配置用于:在圖形用戶界面中顯示所述至少兩個(gè)不同的社區(qū),所述至少兩個(gè)不同的社區(qū)包括顏色編碼的節(jié)點(diǎn)和邊緣,其中所述顏色編碼的節(jié)點(diǎn)和邊緣的至少第一部分是與第一社區(qū)關(guān)聯(lián)的第一顏色,并且所述顏色編碼的節(jié)點(diǎn)和邊緣的至少第二部分是與第二社區(qū)關(guān)聯(lián)的第二顏色。20.根據(jù)權(quán)利要求19所述的計(jì)算系統(tǒng),其中指定顏色編碼的節(jié)點(diǎn)的大小與所述指定顏色編碼的節(jié)點(diǎn)所代表的指定用戶賬戶的影響程度相關(guān)聯(lián)。
【文檔編號(hào)】G06Q50/00GK105849763SQ201480070176
【公開日】2016年8月10日
【申請(qǐng)日】2014年10月23日
【發(fā)明人】愛德華·東晉·金, 布萊恩·佳利·耿, 干乍那·帕德馬納班
【申請(qǐng)人】西斯摩斯公司