信息處理方法及系統(tǒng)的制作方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及通信技術(shù)領(lǐng)域,尤其涉及一種信息處理方法及系統(tǒng)。
【背景技術(shù)】
[0002]微博作為一種新興的網(wǎng)絡(luò)社交平臺(tái),一時(shí)間受到大量互聯(lián)網(wǎng)網(wǎng)民的追捧。對(duì)于一副關(guān)于某事件的微博帖子,如果短時(shí)間內(nèi)轉(zhuǎn)發(fā)或評(píng)論該事件的網(wǎng)民越多,這說(shuō)明該社會(huì)事件關(guān)注的人就越多,該事件的關(guān)注度就越高,那么就會(huì)引起相關(guān)人員的重視。但隨之也出現(xiàn)了大量灌水的人員,他們?yōu)榱诉_(dá)到某種利益,往往一個(gè)人就注冊(cè)上百個(gè)甚至于上千個(gè)用戶ID,然后使用這些用戶ID發(fā)送或轉(zhuǎn)發(fā)帖子,故意炒作某事件,而影響了該事件的真實(shí)關(guān)注度。
【發(fā)明內(nèi)容】
[0003]本發(fā)明提供一種信息處理方法及系統(tǒng),用以解決現(xiàn)有微博用戶中出現(xiàn)大量灌水的人員。
[0004]本發(fā)明提供一種信息處理方法,包括:DPI設(shè)備獲取通信網(wǎng)絡(luò)中傳輸?shù)奈⒉?shù)據(jù)包;KDPI設(shè)備從所述微博數(shù)據(jù)包中獲取終端設(shè)備標(biāo)識(shí)、微博ID以及微博內(nèi)容;并將所述終端設(shè)備標(biāo)識(shí)、微博ID以及微博內(nèi)容三者的對(duì)應(yīng)關(guān)系發(fā)送至分析單元;所述分析單元根據(jù)收集到的對(duì)應(yīng)關(guān)系,確定是否存在滿足如下條件的微博ID:同一終端設(shè)備標(biāo)識(shí)對(duì)應(yīng)不同微博ID的總數(shù)超過(guò)預(yù)設(shè)閾值,且所述不同微博ID對(duì)應(yīng)的微博內(nèi)容一致;所述分析單元確定滿足上述條件的微博ID為水軍ID。
【具體實(shí)施方式】
[0005]本發(fā)明提供的信息處理方法實(shí)施例流程為:
[0006]SlOU DPI設(shè)備獲取通信網(wǎng)絡(luò)中傳輸?shù)奈⒉?shù)據(jù)包;
[0007]具體來(lái)說(shuō),DPI設(shè)備從通信網(wǎng)絡(luò)中抓取數(shù)據(jù)包;根據(jù)數(shù)據(jù)包中包含的應(yīng)用標(biāo)識(shí)從抓取的數(shù)據(jù)包中篩選出微博數(shù)據(jù)包,微博數(shù)據(jù)包中包含的應(yīng)用標(biāo)識(shí)為微博應(yīng)用標(biāo)識(shí)。,移動(dòng)終端設(shè)備在上網(wǎng)時(shí),發(fā)送的數(shù)據(jù)包首先通過(guò)服務(wù)支持節(jié)點(diǎn)(Serving Gprs Support Node,以下簡(jiǎn)稱SGSN),然后通過(guò)Gn接口到達(dá)網(wǎng)關(guān)支持節(jié)點(diǎn)(Gateway Gprs Support Node,以下簡(jiǎn)稱GGSN),然后由GGSN傳送至互聯(lián)網(wǎng)。因此,可以在SGSN和GGSN間之間的Gn接口處部署深度包檢測(cè)設(shè)備(Deep Packet Inspect1n,以下簡(jiǎn)稱DPI)。
[0008]DPI設(shè)備可以在Gn接口處抓取到移動(dòng)終端設(shè)備發(fā)送的數(shù)據(jù)包,然后解析數(shù)據(jù)包,解析數(shù)據(jù)包報(bào)文頭信息,從報(bào)文頭有信息中可以獲取到微博應(yīng)用標(biāo)識(shí),進(jìn)而可以根據(jù)數(shù)據(jù)包中包含的應(yīng)用標(biāo)識(shí)從抓取的數(shù)據(jù)包中篩選出微博數(shù)據(jù)包。
[0009]需要說(shuō)明的是,本實(shí)施例中所涉及到的發(fā)送數(shù)據(jù)包的終端設(shè)備均指移動(dòng)終端設(shè)備。
[0010]S102、DPI設(shè)備從微博數(shù)據(jù)包中獲取終端設(shè)備標(biāo)識(shí)、微博ID以及微博內(nèi)容;并將終端設(shè)備標(biāo)識(shí)、微博ID以及微博內(nèi)容三者的對(duì)應(yīng)關(guān)系發(fā)送至分析單元;需要說(shuō)明的是,終端設(shè)備標(biāo)識(shí)可以為終端設(shè)備上網(wǎng)時(shí)用的上網(wǎng)號(hào)碼,也可以為終端設(shè)備的設(shè)備標(biāo)識(shí),或者,同時(shí)包括上網(wǎng)號(hào)碼以及設(shè)備標(biāo)識(shí)。
[0011 ] 具體來(lái)說(shuō),DPI設(shè)備獲取到微博數(shù)據(jù)包之后,進(jìn)一步解析數(shù)據(jù)包報(bào)文頭信息以及報(bào)文信息。從數(shù)據(jù)包報(bào)文頭信息可以獲取到微博ID,發(fā)送數(shù)據(jù)包的源IP地址,由于移動(dòng)終端設(shè)備例如手機(jī)在上網(wǎng)時(shí),網(wǎng)絡(luò)會(huì)給該上網(wǎng)的終端設(shè)備分配一個(gè)固定的IP地址,并將該IP地址與終端設(shè)備標(biāo)識(shí)綁定在一起,例如,將IP地址與手機(jī)上網(wǎng)時(shí)用的手機(jī)號(hào)碼以及手機(jī)MEI號(hào)綁定,存儲(chǔ)在網(wǎng)絡(luò)側(cè),使移動(dòng)終端設(shè)備在發(fā)送數(shù)據(jù)包時(shí)使用該IP地址,因此,DPI設(shè)備可以根據(jù)源IP地址確定發(fā)送微博數(shù)據(jù)包的終端設(shè)備所用的手機(jī)號(hào)碼以及移動(dòng)終端設(shè)備的頂EI號(hào)即終端設(shè)備標(biāo)識(shí),并從數(shù)據(jù)包報(bào)文信息中獲取發(fā)送數(shù)據(jù)包的微博內(nèi)容,例如可以為關(guān)鍵字,將獲取的終端設(shè)備標(biāo)識(shí)、微博ID以及微博內(nèi)容三者的對(duì)應(yīng)關(guān)系發(fā)送至分析單元。
[0012]S103分析單元根據(jù)收集到的對(duì)應(yīng)關(guān)系,確定是否存在滿足如下條件的微博ID:同一終端設(shè)備標(biāo)識(shí)對(duì)應(yīng)不同微博ID的總數(shù)超過(guò)預(yù)設(shè)閾值,且不同微博ID對(duì)應(yīng)的微博內(nèi)容一致;分析單元根據(jù)收集到的對(duì)應(yīng)關(guān)系,分析同一終端設(shè)備標(biāo)識(shí)對(duì)應(yīng)不同微博ID的總數(shù)是否超過(guò)預(yù)設(shè)閾值,且這些不同的微博ID對(duì)應(yīng)的微博內(nèi)容是否一致。其中,預(yù)設(shè)閾值可以根據(jù)不同的情況來(lái)進(jìn)行設(shè)置。
[0013]具體來(lái)說(shuō),如果終端設(shè)備標(biāo)識(shí)為移動(dòng)終端設(shè)備上網(wǎng)時(shí)用的上網(wǎng)號(hào)碼,則查找該上網(wǎng)號(hào)碼下對(duì)應(yīng)的不同微博ID的總數(shù)是否超過(guò)預(yù)設(shè)閾值,并分析所發(fā)送的微博內(nèi)容是否一致;如果終端設(shè)備標(biāo)識(shí)為移動(dòng)終端設(shè)備的設(shè)備標(biāo)識(shí),例如為手機(jī)IMEI號(hào),則查找該設(shè)備標(biāo)識(shí)下對(duì)應(yīng)的不同微博ID的總數(shù)是否超過(guò)預(yù)設(shè)閾值,并分析所發(fā)送的微博內(nèi)容是否一致。
[0014]S104分析單元確定滿足上述條件的微博ID為水軍ID。
[0015]如果確定同一終端設(shè)備標(biāo)識(shí)對(duì)應(yīng)不同微博ID的總數(shù)超過(guò)預(yù)設(shè)閾值,且這些不同的微博ID對(duì)應(yīng)的微博內(nèi)容一致,則說(shuō)明這些不同的微博ID是為了炒作而故意發(fā)送帖子或轉(zhuǎn)賬帖子而申請(qǐng)的微博ID,進(jìn)而確定該微博ID為水軍ID。
[0016]本實(shí)施例通過(guò)DPI設(shè)備從微博數(shù)據(jù)包中獲取終端設(shè)備標(biāo)識(shí)、微博ID以及微博內(nèi)容,并建立三者的對(duì)應(yīng)關(guān)系,進(jìn)而使分析單元根據(jù)收集到的三種對(duì)應(yīng)關(guān)系,確定是否是水軍ID:如果同一終端設(shè)備標(biāo)識(shí)對(duì)應(yīng)不同微博ID的總數(shù)超過(guò)預(yù)設(shè)閾值,且不同微博ID對(duì)應(yīng)的微博內(nèi)容一致;則確定該多個(gè)不同的微博ID為水軍ID。通過(guò)上述方法可以判斷出由同一個(gè)終端設(shè)備發(fā)出相似內(nèi)容的那些微博ID是水軍ID,從而可以判斷該條微博內(nèi)容的真實(shí)關(guān)注度。
[0017]以上實(shí)施例僅用以說(shuō)明本發(fā)明的技術(shù)方案,而非對(duì)其限制;其依然可以對(duì)前述各實(shí)施例所記載的技術(shù)方案進(jìn)行修改,或者對(duì)其中部分技術(shù)特征進(jìn)行等同替換;而這些修改或者替換,并不使相應(yīng)技術(shù)方案的本質(zhì)脫離本發(fā)明各實(shí)施例技術(shù)方案的精神和范圍。
【主權(quán)項(xiàng)】
1.一種信息處理方法,其特征在于,包括:DPI設(shè)備獲取通信網(wǎng)絡(luò)中傳輸?shù)奈⒉?shù)據(jù)包;所述DPI設(shè)備從所述微博數(shù)據(jù)包中獲取終端設(shè)備標(biāo)識(shí)、微博ID以及微博內(nèi)容;并將所述終端設(shè)備標(biāo)識(shí)、微博ID以及微博內(nèi)容三者的對(duì)應(yīng)關(guān)系發(fā)送至分析單元;所述分析單元根據(jù)收集到的對(duì)應(yīng)關(guān)系,確定是否存在滿足如下條件的微博ID:同一終端設(shè)備標(biāo)識(shí)對(duì)應(yīng)的不同微博ID的總數(shù)超過(guò)預(yù)設(shè)閾值,且所述不同微博ID對(duì)應(yīng)的微博內(nèi)容一致;所述分析單元確定滿足上述條件的微博ID為水軍ID。2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述DPI設(shè)備獲取通信網(wǎng)絡(luò)中傳輸?shù)奈⒉?shù)據(jù)包包括:所述DPI設(shè)備從通信網(wǎng)絡(luò)中抓取數(shù)據(jù)包;所述DPI設(shè)備根據(jù)數(shù)據(jù)包中包含的應(yīng)用標(biāo)識(shí),從抓取的數(shù)據(jù)包中篩選出微博數(shù)據(jù)包,所述微博數(shù)據(jù)包中包含的應(yīng)用標(biāo)識(shí)為微博應(yīng)用標(biāo)識(shí)。
【專利摘要】本發(fā)明公開(kāi)了一種信息處理方法及系統(tǒng),其中方法包括:DPI設(shè)備獲取通信網(wǎng)絡(luò)中傳輸?shù)奈⒉?shù)據(jù)包;DPI設(shè)備從微博數(shù)據(jù)包中獲取終端設(shè)備標(biāo)識(shí)、微博ID以及微博內(nèi)容;并將終端設(shè)備標(biāo)識(shí)、微博ID以及微博內(nèi)容三者的對(duì)應(yīng)關(guān)系發(fā)送至分析單元;分析單元根據(jù)收集到的對(duì)應(yīng)關(guān)系,確定是否存在同一終端設(shè)備標(biāo)識(shí)對(duì)應(yīng)不同微博ID的總數(shù)超過(guò)預(yù)設(shè)閾值,且所述不同微博ID對(duì)應(yīng)的微博內(nèi)容一致;若存在則確定上述微博ID為水軍ID。本發(fā)明通過(guò)上述方法可以判斷出發(fā)出相似內(nèi)容的哪些微博ID是同一個(gè)終端設(shè)備發(fā)出的,從而判斷出該微博ID為水軍ID,進(jìn)而可以正確判斷該條微博內(nèi)容的社會(huì)關(guān)注度。
【IPC分類】H04L12/58
【公開(kāi)號(hào)】CN105634906
【申請(qǐng)?zhí)枴緾N201410583509
【發(fā)明人】李 東
【申請(qǐng)人】青島金訊網(wǎng)絡(luò)工程有限公司
【公開(kāi)日】2016年6月1日
【申請(qǐng)日】2014年10月27日