国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      社交網(wǎng)絡(luò)群體識(shí)別方法和系統(tǒng)的制作方法

      文檔序號(hào):6545996閱讀:241來(lái)源:國(guó)知局
      社交網(wǎng)絡(luò)群體識(shí)別方法和系統(tǒng)的制作方法
      【專利摘要】本發(fā)明涉及一種社交網(wǎng)絡(luò)群體識(shí)別方法和系統(tǒng),其中方法包括:獲取社交網(wǎng)絡(luò)中多個(gè)待識(shí)別的用戶以及每個(gè)待識(shí)別用戶對(duì)應(yīng)的用戶消息;用戶消息包括消息內(nèi)容和感染狀態(tài);對(duì)于每個(gè)待識(shí)別的用戶,根據(jù)各個(gè)待識(shí)別用戶對(duì)應(yīng)的用戶消息中的消息內(nèi)容,確定各個(gè)用戶消息所屬的主題以及各個(gè)用戶消息屬于對(duì)應(yīng)主題的概率;對(duì)于每個(gè)待識(shí)別的用戶,根據(jù)各個(gè)用戶消息屬于對(duì)應(yīng)主題的概率,以及各個(gè)用戶消息中的感染狀態(tài),計(jì)算各個(gè)主題被待識(shí)別的用戶感染的概率,從而根據(jù)各個(gè)主題被待識(shí)別的用戶感染的概率,能夠確定各個(gè)主題對(duì)應(yīng)的用戶群體,能夠?qū)?dǎo)致消息傳播的范圍、路徑和影響進(jìn)行預(yù)測(cè),進(jìn)而對(duì)消息的傳播進(jìn)行有效的控制。
      【專利說(shuō)明】社交網(wǎng)絡(luò)群體識(shí)別方法和系統(tǒng)
      【技術(shù)領(lǐng)域】
      [0001]本發(fā)明涉及通信【技術(shù)領(lǐng)域】,尤其涉及一種社交網(wǎng)絡(luò)群體識(shí)別方法和系統(tǒng)。
      【背景技術(shù)】
      [0002]現(xiàn)有技術(shù)中,在webl.0時(shí)期,網(wǎng)絡(luò)中消息的傳播模式主要為:發(fā)布者編輯發(fā)布消息,大眾瀏覽消息。而用戶與用戶之間的交互活動(dòng)很少,因此,消息傳播的范圍、路徑和影響是可以準(zhǔn)確預(yù)測(cè)的。
      [0003]然而,在web2.0時(shí)期,隨著微博、QQ、人人網(wǎng)、Face book等社交網(wǎng)絡(luò)的發(fā)展,用戶與用戶之間的交互活動(dòng)大量增加,每個(gè)用戶都可以成為消息的傳播源,導(dǎo)致消息傳播的范圍、路徑和影響難以預(yù)測(cè),難以從社交網(wǎng)絡(luò)中識(shí)別出使得消息廣泛傳播的關(guān)鍵用戶群體,從而難以對(duì)消息的傳播進(jìn)行有效的控制。

      【發(fā)明內(nèi)容】

      [0004]本發(fā)明提供一種社交網(wǎng)絡(luò)群體識(shí)別方法和系統(tǒng),用于解決現(xiàn)有技術(shù)中難以從社交網(wǎng)絡(luò)中識(shí)別出使得消息廣泛傳播的關(guān)鍵用戶群體的問(wèn)題。
      [0005]本發(fā)明的第一個(gè)方面是提供一種社交網(wǎng)絡(luò)群體識(shí)別方法,包括:
      [0006]獲取社交網(wǎng)絡(luò)中多個(gè)待識(shí)別的用戶以及每個(gè)待識(shí)別用戶對(duì)應(yīng)的用戶消息;所述用戶消息包括消息內(nèi)容和感染狀態(tài);
      [0007]對(duì)于每個(gè)待識(shí)別的用戶,根據(jù)各個(gè)待識(shí)別用戶對(duì)應(yīng)的用戶消息中的消息內(nèi)容,確定所述各個(gè)用戶消息所屬的主題以及所述各個(gè)用戶消息屬于對(duì)應(yīng)主題的概率;
      [0008]對(duì)于每個(gè)待識(shí)別的用戶,根據(jù)所述各個(gè)用戶消息屬于對(duì)應(yīng)主題的概率,以及所述各個(gè)用戶消息中的感染狀態(tài),計(jì)算各個(gè)主題被所述待識(shí)別的用戶感染的概率;
      [0009]對(duì)于每個(gè)待識(shí)別的用戶,根據(jù)各個(gè)主題被所述待識(shí)別的用戶感染的概率,確定所述待識(shí)別的用戶所屬的與主題對(duì)應(yīng)的用戶群體。
      [0010]本發(fā)明的另一個(gè)方面提供一種社交網(wǎng)絡(luò)群體識(shí)別系統(tǒng),包括:
      [0011]獲取模塊,用于獲取社交網(wǎng)絡(luò)中多個(gè)待識(shí)別的用戶以及每個(gè)待識(shí)別用戶對(duì)應(yīng)的用戶消息;所述用戶消息包括消息內(nèi)容和感染狀態(tài);
      [0012]確定模塊,用于對(duì)于每個(gè)待識(shí)別的用戶,根據(jù)各個(gè)待識(shí)別用戶對(duì)應(yīng)的用戶消息中的消息內(nèi)容,確定所述各個(gè)用戶消息所屬的主題以及所述各個(gè)用戶消息屬于對(duì)應(yīng)主題的概率;
      [0013]計(jì)算模塊,用于對(duì)于每個(gè)待識(shí)別的用戶,根據(jù)所述各個(gè)用戶消息屬于對(duì)應(yīng)主題的概率,以及所述各個(gè)用戶消息中的感染狀態(tài),計(jì)算各個(gè)主題被所述待識(shí)別的用戶感染的概率;
      [0014]所述確定模塊,還用于對(duì)于每個(gè)待識(shí)別的用戶,根據(jù)各個(gè)主題被所述待識(shí)別的用戶感染的概率,確定所述待識(shí)別的用戶所屬的與主題對(duì)應(yīng)的用戶群體。
      [0015]本發(fā)明中,通過(guò)獲取社交網(wǎng)絡(luò)中多個(gè)待識(shí)別的用戶以及每個(gè)待識(shí)別用戶對(duì)應(yīng)的用戶消息;用戶消息包括消息內(nèi)容和感染狀態(tài);對(duì)于每個(gè)待識(shí)別的用戶,根據(jù)各個(gè)待識(shí)別用戶對(duì)應(yīng)的用戶消息中的消息內(nèi)容,確定各個(gè)用戶消息所屬的主題以及各個(gè)用戶消息屬于對(duì)應(yīng)主題的概率;對(duì)于每個(gè)待識(shí)別的用戶,根據(jù)各個(gè)用戶消息屬于對(duì)應(yīng)主題的概率,以及各個(gè)用戶消息中的感染狀態(tài),計(jì)算各個(gè)主題被待識(shí)別的用戶感染的概率,從而根據(jù)各個(gè)主題被待識(shí)別的用戶感染的概率,能夠確定各個(gè)主題對(duì)應(yīng)的用戶群體,能夠?qū)?dǎo)致消息傳播的范圍、路徑和影響進(jìn)行預(yù)測(cè),進(jìn)而對(duì)消息的傳播進(jìn)行有效的控制。
      【專利附圖】

      【附圖說(shuō)明】
      [0016]圖1為本發(fā)明提供的社交網(wǎng)絡(luò)群體識(shí)別方法一個(gè)實(shí)施例的流程圖;
      [0017]圖2為本發(fā)明提供的社交網(wǎng)絡(luò)群體識(shí)別方法又一個(gè)實(shí)施例的流程圖;
      [0018]圖3為關(guān)系網(wǎng)絡(luò)的不意圖;
      [0019]圖4為本發(fā)明提供的社交網(wǎng)絡(luò)群體識(shí)別系統(tǒng)一個(gè)實(shí)施例的結(jié)構(gòu)示意圖;
      [0020]圖5為本發(fā)明提供的社交網(wǎng)絡(luò)群體識(shí)別系統(tǒng)又一個(gè)實(shí)施例的結(jié)構(gòu)示意圖。
      【具體實(shí)施方式】
      [0021]為使本發(fā)明實(shí)施例的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒(méi)有做出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
      [0022]圖1為本發(fā)明提供的社交網(wǎng)絡(luò)群體識(shí)別方法一個(gè)實(shí)施例的流程圖,如圖1所示,包括:
      [0023]101、獲取社交網(wǎng)絡(luò)中多個(gè)待識(shí)別的用戶以及每個(gè)待識(shí)別用戶對(duì)應(yīng)的用戶消息,用戶消息包括消息內(nèi)容和感染狀態(tài)。
      [0024]本發(fā)明提供的社交網(wǎng)絡(luò)群體識(shí)別方法的執(zhí)行主體可以為社交網(wǎng)絡(luò)群體識(shí)別系統(tǒng),社交網(wǎng)絡(luò)群體識(shí)別系統(tǒng)具體為位于社交網(wǎng)絡(luò)中服務(wù)器上的軟件工具。
      [0025]由于社交網(wǎng)絡(luò)中的用戶數(shù)量極大,用戶消息的數(shù)量也極大,社交網(wǎng)絡(luò)群體識(shí)別系統(tǒng)難以獲取所有用戶對(duì)應(yīng)的用戶消息進(jìn)行分析,而社交網(wǎng)絡(luò)中影響較大的用戶一般為粉絲數(shù)、被關(guān)注數(shù)和消息發(fā)送次數(shù)較多的用戶。因此,社交網(wǎng)絡(luò)群體識(shí)別系統(tǒng)可以根據(jù)用戶的粉絲數(shù)、被關(guān)注數(shù)或者消息發(fā)送次數(shù)等來(lái)選擇待識(shí)別的用戶。例如,社交網(wǎng)絡(luò)群體識(shí)別系統(tǒng)可以選擇粉絲數(shù)大于預(yù)設(shè)粉絲數(shù)的用戶作為待識(shí)別的用戶,或者,選擇被關(guān)注數(shù)大于預(yù)設(shè)被關(guān)注數(shù)的用戶作為待識(shí)別的用戶。
      [0026]社交網(wǎng)絡(luò)群體識(shí)別系統(tǒng)獲取待識(shí)別的用戶后,可以利用社交網(wǎng)絡(luò)中的爬蟲(chóng)工具或者社交網(wǎng)站提供的應(yīng)用編程接口(Applicat1n Programming Interface, API)來(lái)獲取用戶轉(zhuǎn)載、發(fā)送和評(píng)論的所有消息。結(jié)合所有待識(shí)別的用戶轉(zhuǎn)載、發(fā)送和評(píng)論的所有消息,得到每個(gè)待識(shí)別用戶對(duì)應(yīng)的用戶消息。用戶發(fā)送的消息可以包括用戶發(fā)送給其他用戶的消息以及用戶轉(zhuǎn)發(fā)給其他用戶的消息。例如,當(dāng)待識(shí)別用戶包括用戶A、用戶B和用戶C,且用戶A轉(zhuǎn)載、發(fā)送或評(píng)論的消息包括:消息a和消息b ;用戶B轉(zhuǎn)載、發(fā)送或評(píng)論的消息包括:消息c和消息d ;用戶C轉(zhuǎn)載、發(fā)送或評(píng)論的消息包括:消息e。則此時(shí)用戶A對(duì)應(yīng)的用戶消息包括:消息a、消息b、消息C、消息d和消息e。其中,感染狀態(tài)指的是用戶是否轉(zhuǎn)載、發(fā)送和評(píng)論過(guò)所述消息,若用戶轉(zhuǎn)載、發(fā)送或評(píng)論過(guò)所述消息,則感染狀態(tài)為I;若用戶未轉(zhuǎn)載、未發(fā)送且未評(píng)論過(guò)所述消息,則感染狀態(tài)為O。例如,消息a和消息b為用戶A轉(zhuǎn)載、發(fā)送或評(píng)論的消息,因此消息a和消息b中的感染狀態(tài)為I ;消息C、消息d和消息e為用戶B或用戶C轉(zhuǎn)載、發(fā)送或評(píng)論的消息,因此消息C、消息d和消息e中的感染狀態(tài)為O。
      [0027]其中,消息內(nèi)容指的是用戶轉(zhuǎn)載或發(fā)送的所述消息的具體內(nèi)容。若所述消息為用戶評(píng)論的消息,則消息內(nèi)容除了包括所述消息的具體內(nèi)容外,還包括用戶對(duì)所述消息所進(jìn)行的評(píng)論以及其他用戶之前對(duì)所述消息所進(jìn)行的評(píng)論。
      [0028]102、對(duì)于每個(gè)待識(shí)別的用戶,根據(jù)各個(gè)待識(shí)別用戶對(duì)應(yīng)的用戶消息中的消息內(nèi)容,確定各個(gè)用戶消息所屬的主題以及各個(gè)用戶消息屬于對(duì)應(yīng)主題的概率。
      [0029]具體地,社交網(wǎng)絡(luò)群體識(shí)別系統(tǒng)可以獲取消息內(nèi)容中的所有詞匯,根據(jù)消息內(nèi)容中的詞匯來(lái)確定消息所屬的主題。其中,主題具體可以指消息內(nèi)容的主要意思,例如,主題可以為:財(cái)經(jīng)、政治、體育、科學(xué)和地理等等,主題的數(shù)量和種類可以由社交網(wǎng)絡(luò)群體識(shí)別系統(tǒng)預(yù)先設(shè)置。當(dāng)消息內(nèi)容的主要意思涉及兩種或多種主題時(shí),可以根據(jù)消息內(nèi)容中各個(gè)主題對(duì)應(yīng)的詞匯數(shù)量來(lái)確定消息屬于對(duì)應(yīng)主題的概率。
      [0030]103、對(duì)于每個(gè)待識(shí)別的用戶,根據(jù)各個(gè)用戶消息屬于對(duì)應(yīng)主題的概率,以及各個(gè)用戶消息中的感染狀態(tài),計(jì)算各個(gè)主題被待識(shí)別的用戶感染的概率。
      [0031]104、對(duì)于每個(gè)待識(shí)別的用戶,根據(jù)各個(gè)主題被待識(shí)別的用戶感染的概率,確定待識(shí)別的用戶所屬的與主題對(duì)應(yīng)的用戶群體。
      [0032]具體地,假設(shè)用戶對(duì)應(yīng)的用戶消息涉及到的主題有3種,分別為:財(cái)經(jīng)、政治和體育,則根據(jù)各個(gè)主題被待識(shí)別的用戶感染的概率,確定待識(shí)別的用戶所屬的與主題對(duì)應(yīng)的用戶群體的其中一種可選的方式為:若主題“財(cái)經(jīng)”被用戶感染的概率超值預(yù)設(shè)財(cái)經(jīng)閾值,則確定所述用戶屬于與“財(cái)經(jīng)”對(duì)應(yīng)的用戶群體;若主題“政治”被用戶感染的概率超值預(yù)設(shè)政治閾值,則確定所述用戶屬于與“政治”對(duì)應(yīng)的用戶群體;若主題“體育”被用戶感染的概率超值預(yù)設(shè)體育閾值,則確定所述用戶屬于與“體育”對(duì)應(yīng)的用戶群體。
      [0033]進(jìn)一步地,對(duì)于每個(gè)待識(shí)別的用戶,根據(jù)各個(gè)主題被待識(shí)別的用戶感染的概率,確定待識(shí)別的用戶所屬的與主題對(duì)應(yīng)的用戶群體之后,還包括:
      [0034]獲取待分析消息的消息內(nèi)容;根據(jù)待分析消息的消息內(nèi)容,確定待分析消息所屬的主題以及屬于對(duì)應(yīng)主題的概率;獲取待分析消息所屬的主題中概率值最大的主題;將與概率值最大的主題對(duì)應(yīng)的用戶群體,確定為傳播待分析消息的用戶群體,以便對(duì)待分析消息的傳播進(jìn)行控制。
      [0035]其中,待分析消息可以為廣泛傳播的熱門消息。
      [0036]本實(shí)施例中,通過(guò)獲取社交網(wǎng)絡(luò)中多個(gè)待識(shí)別的用戶以及每個(gè)待識(shí)別用戶對(duì)應(yīng)的用戶消息;用戶消息包括消息內(nèi)容和感染狀態(tài);對(duì)于每個(gè)待識(shí)別的用戶,根據(jù)各個(gè)待識(shí)別用戶對(duì)應(yīng)的用戶消息中的消息內(nèi)容,確定各個(gè)用戶消息所屬的主題以及各個(gè)用戶消息屬于對(duì)應(yīng)主題的概率;對(duì)于每個(gè)待識(shí)別的用戶,根據(jù)各個(gè)用戶消息屬于對(duì)應(yīng)主題的概率,以及各個(gè)用戶消息中的感染狀態(tài),計(jì)算各個(gè)主題被待識(shí)別的用戶感染的概率,從而根據(jù)各個(gè)主題被待識(shí)別的用戶感染的概率,能夠確定各個(gè)主題對(duì)應(yīng)的用戶群體,能夠?qū)?dǎo)致消息傳播的范圍、路徑和影響進(jìn)行預(yù)測(cè),進(jìn)而對(duì)消息的傳播進(jìn)行有效的控制。
      [0037]圖2為本發(fā)明提供的社交網(wǎng)絡(luò)群體識(shí)別方法又一個(gè)實(shí)施例的流程圖,如圖2所示,在圖1所示實(shí)施例的基礎(chǔ)上,步驟102具體可以包括:
      [0038]1021、對(duì)于每個(gè)待識(shí)別的用戶,對(duì)用戶消息中的消息內(nèi)容進(jìn)行分詞,獲取用戶消息中的關(guān)鍵詞以及關(guān)鍵詞的詞頻。
      [0039]其中,對(duì)消息內(nèi)容進(jìn)行分詞的過(guò)程指的是獲取消息內(nèi)容中所有詞匯的過(guò)程,獲取消息內(nèi)容中的所有詞匯后,刪除詞匯中的無(wú)具體含義的詞匯,例如停用詞等,得到用戶消息中的關(guān)鍵詞;統(tǒng)計(jì)用戶消息中各個(gè)關(guān)鍵詞的出現(xiàn)次數(shù),得到關(guān)鍵詞的詞頻。
      [0040]需要進(jìn)行說(shuō)明的是,當(dāng)社交網(wǎng)絡(luò)群體識(shí)別系統(tǒng)預(yù)設(shè)詞匯表時(shí),關(guān)鍵詞詞頻的表示方式可以如表1所示。其中,η為消息內(nèi)容中關(guān)鍵詞出現(xiàn)的總次數(shù),word η表示關(guān)鍵詞為詞匯表中的第η個(gè)詞,count η表示關(guān)鍵詞在所述消息中出現(xiàn)的次數(shù)。
      [0041]表1
      [0042]
      【權(quán)利要求】
      1.一種社交網(wǎng)絡(luò)群體識(shí)別方法,其特征在于,包括: 獲取社交網(wǎng)絡(luò)中多個(gè)待識(shí)別的用戶以及每個(gè)待識(shí)別用戶對(duì)應(yīng)的用戶消息;所述用戶消息包括消息內(nèi)容和感染狀態(tài); 對(duì)于每個(gè)待識(shí)別的用戶,根據(jù)各個(gè)待識(shí)別用戶對(duì)應(yīng)的用戶消息中的消息內(nèi)容,確定所述各個(gè)用戶消息所屬的主題以及所述各個(gè)用戶消息屬于對(duì)應(yīng)主題的概率; 對(duì)于每個(gè)待識(shí)別的用戶,根據(jù)所述各個(gè)用戶消息屬于對(duì)應(yīng)主題的概率,以及所述各個(gè)用戶消息中的感染狀態(tài),計(jì)算各個(gè)主題被所述待識(shí)別的用戶感染的概率; 對(duì)于每個(gè)待識(shí)別的用戶,根據(jù)各個(gè)主題被所述待識(shí)別的用戶感染的概率,確定所述待識(shí)別的用戶所屬的與主題對(duì)應(yīng)的用戶群體。
      2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述對(duì)于每個(gè)待識(shí)別的用戶,根據(jù)各個(gè)待識(shí)別用戶對(duì)應(yīng)的用戶消息中的消息內(nèi)容,確定所述各個(gè)用戶消息所屬的主題以及所述各個(gè)用戶消息屬于對(duì)應(yīng)主題的概率,包括: 對(duì)于每個(gè)待識(shí)別的用戶,對(duì)所述用戶消息中的消息內(nèi)容進(jìn)行分詞,獲取所述用戶消息中的關(guān)鍵詞以及所述關(guān)鍵詞的詞頻; 根據(jù)所述關(guān)鍵詞查詢預(yù)設(shè)的詞匯表,確定所述用戶消息所屬的主題; 根據(jù)所述關(guān)鍵詞的詞頻,確定所述用戶消息屬于對(duì)應(yīng)主題的概率。
      3.根據(jù)權(quán)利要求1或2所述的方法,其特征在于,所述對(duì)于每個(gè)待識(shí)別的用戶,根據(jù)所述各個(gè)用戶消息屬于對(duì)應(yīng)主題的概率,以及所述各個(gè)用戶消息中的感染狀態(tài),計(jì)算各個(gè)主題的消息被所述待識(shí)別的用戶感染的概率,包括: 對(duì)于每個(gè)待識(shí)別的用戶,針對(duì)每個(gè)主題,根據(jù)所述各個(gè)用戶消息屬于對(duì)應(yīng)主題的概率,以及所述各個(gè)用戶消息中的感染狀態(tài),計(jì)算所述各個(gè)用戶消息中所述主題被所述待識(shí)別的用戶感染的概率; 根據(jù)所述各個(gè)用戶消息中所述主題被所述待識(shí)別的用戶感染的概率,確定所述主題被所述待識(shí)別的用戶感染的概率。
      4.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述對(duì)于每個(gè)待識(shí)別的用戶,根據(jù)各個(gè)主題被所述待識(shí)別的用戶感染的概率,確定所述待識(shí)別的用戶所屬的與主題對(duì)應(yīng)的用戶群體,包括: 對(duì)于每個(gè)待識(shí)別的用戶,獲取所述待識(shí)別用戶的關(guān)注對(duì)象、好友列表以及消息發(fā)送對(duì)象,構(gòu)建關(guān)系網(wǎng)絡(luò); 針對(duì)每個(gè)主題,根據(jù)所述主題被所述待識(shí)別的用戶感染的概率,確定所述關(guān)系網(wǎng)絡(luò)中具有連接關(guān)系的任意兩個(gè)待識(shí)別用戶之間的連接距離; 若具有連接關(guān)系的兩個(gè)待識(shí)別用戶之間的連接距離小于預(yù)設(shè)值,則確定所述兩個(gè)待識(shí)別用戶屬于所述主題對(duì)應(yīng)的用戶群體。
      5.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述對(duì)于每個(gè)待識(shí)別的用戶,根據(jù)各個(gè)主題被所述待識(shí)別的用戶感染的概率,確定所述待識(shí)別的用戶所屬的與主題對(duì)應(yīng)的用戶群體之后,還包括: 獲取待分析消息的消息內(nèi)容; 根據(jù)所述待分析消息的消息內(nèi)容,確定所述待分析消息所屬的主題以及屬于對(duì)應(yīng)主題的概率;獲取所述待分析消息所屬的主題中概率值最大的主題; 將與所述概率值最大的主題對(duì)應(yīng)的用戶群體,確定為傳播所述待分析消息的用戶群體,以便對(duì)所述待分析消息的傳播進(jìn)行控制。
      6.一種社交網(wǎng)絡(luò)群體識(shí)別系統(tǒng),其特征在于,包括: 獲取模塊,用于獲取社交網(wǎng)絡(luò)中多個(gè)待識(shí)別的用戶以及每個(gè)待識(shí)別用戶對(duì)應(yīng)的用戶消息;所述用戶消息包括消息內(nèi)容和感染狀態(tài);確定模塊,用于對(duì)于每個(gè)待識(shí)別的用戶,根據(jù)各個(gè)待識(shí)別用戶對(duì)應(yīng)的用戶消息中的消息內(nèi)容,確定所述各個(gè)用戶消息所屬的主題以及所述各個(gè)用戶消息屬于對(duì)應(yīng)主題的概率;計(jì)算模塊,用于對(duì)于每個(gè)待識(shí)別的用戶,根據(jù)所述各個(gè)用戶消息屬于對(duì)應(yīng)主題的概率,以及所述各個(gè)用戶消息中的感染狀態(tài),計(jì)算各個(gè)主題被所述待識(shí)別的用戶感染的概率;所述確定模塊,還用于對(duì)于每個(gè)待識(shí)別的用戶,根據(jù)各個(gè)主題被所述待識(shí)別的用戶感染的概率,確定所述待識(shí)別的用戶所屬的與主題對(duì)應(yīng)的用戶群體。
      7.根據(jù)權(quán)利要求6所述 的系統(tǒng),其特征在于,所述確定模塊還包括: 分詞單元,用于對(duì)于每個(gè)待識(shí)別的用戶,對(duì)所述用戶消息中的消息內(nèi)容進(jìn)行分詞,獲取所述用戶消息中的關(guān)鍵詞以及所述關(guān)鍵詞的詞頻; 查詢單元,用于根據(jù)所述關(guān)鍵詞查詢預(yù)設(shè)的詞匯表,確定所述用戶消息所屬的主題; 確定單元,用于根據(jù)所述關(guān)鍵詞的詞頻,確定所述用戶消息屬于對(duì)應(yīng)主題的概率。
      8.根據(jù)權(quán)利要求6或7所述的系統(tǒng),其特征在于,所述計(jì)算模塊具體用于, 對(duì)于每個(gè)待識(shí)別的用戶,針對(duì)每個(gè)主題,根據(jù)所述各個(gè)用戶消息屬于對(duì)應(yīng)主題的概率,以及所述各個(gè)用戶消息中的感染狀態(tài),計(jì)算所述各個(gè)用戶消息中所述主題被所述待識(shí)別的用戶感染的概率; 根據(jù)所述各個(gè)用戶消息中所述主題被所述待識(shí)別的用戶感染的概率,確定所述主題被所述待識(shí)別的用戶感染的概率。
      9.根據(jù)權(quán)利要求8所述的系統(tǒng),其特征在于,所述確定模塊還包括: 構(gòu)建單元,用于對(duì)于每個(gè)待識(shí)別的用戶,獲取所述待識(shí)別用戶的關(guān)注對(duì)象、好友列表以及消息發(fā)送對(duì)象,構(gòu)建關(guān)系網(wǎng)絡(luò); 確定單元,還用于針對(duì)每個(gè)主題,根據(jù)所述主題被所述待識(shí)別的用戶感染的概率,確定所述關(guān)系網(wǎng)絡(luò)中具有連接關(guān)系的任意兩個(gè)待識(shí)別用戶之間的連接距離; 確定單元,還用于若具有連接關(guān)系的兩個(gè)待識(shí)別用戶之間的連接距離小于預(yù)設(shè)值,則確定所述兩個(gè)待識(shí)別用戶屬于所述主題對(duì)應(yīng)的用戶群體。
      10.根據(jù)權(quán)利要求6所述的系統(tǒng),其特征在于,所述獲取模塊還用于,獲取待分析消息的消息內(nèi)容; 所述確定模塊還用于,根據(jù)所述待分析消息的消息內(nèi)容,確定所述待分析消息所屬的主題以及屬于對(duì)應(yīng)主題的概率; 所述獲取模塊還用于,獲取所述待分析消息所屬的主題中概率值最大的主題; 所述確定模塊還用于,將與所述概率值最大的主題對(duì)應(yīng)的用戶群體,確定為傳播所述待分析消息的用戶群體,以便對(duì)所述待分析消息的傳播進(jìn)行控制。
      【文檔編號(hào)】G06F17/27GK104035961SQ201410194361
      【公開(kāi)日】2014年9月10日 申請(qǐng)日期:2014年5月9日 優(yōu)先權(quán)日:2014年5月9日
      【發(fā)明者】懷進(jìn)鵬, 武南南, 李建欣, 張日崇 申請(qǐng)人:北京航空航天大學(xué)
      網(wǎng)友詢問(wèn)留言 已有0條留言
      • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
      1