專利名稱:通信網(wǎng)絡(luò)中識別點對點業(yè)務(wù)的方法及裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及通信技術(shù)領(lǐng)域,尤其涉及在通信網(wǎng)絡(luò)中對點對點業(yè)務(wù)進行識 別的方法及裝置。
背景技術(shù):
在傳統(tǒng)模式下,典型的互聯(lián)網(wǎng)傳輸形式是客戶端對服務(wù)器的形式。如網(wǎng)
頁瀏覽,客戶端的PC機要先發(fā)出請求,然后從網(wǎng)站服務(wù)器上下載網(wǎng)頁或程
序。這種模式在網(wǎng)頁瀏覽時代尚可滿足。但是隨著音頻、視頻的大量出現(xiàn), 服務(wù)器由于受制于帶寬,便無法同時對更多的用戶提供服務(wù)。點對點
(peer-to-peer, P2P )技術(shù)的出現(xiàn)解決了這個問題。P2P技術(shù),即端到端對 等網(wǎng)絡(luò)技術(shù),是指網(wǎng)絡(luò)主機在充當(dāng)客戶端獲取資源的同時充當(dāng)服務(wù)器向其它 對等體(Peer)提供服務(wù)。
然而,隨著P2P技術(shù)應(yīng)用的不斷擴展,特別是用于基于P2P系統(tǒng)的文件 共享業(yè)務(wù),P2P通信會占用較多的網(wǎng)絡(luò)帶寬,從而易于消耗大量的網(wǎng)絡(luò)資源, 引起網(wǎng)絡(luò)的擁塞。因此,需要對網(wǎng)絡(luò)中的P2P業(yè)務(wù)進行控制,而對P2P業(yè)務(wù) 進行控制的前提是對P2P業(yè)務(wù)進行有效的識別。 目前有三種常用的P2P業(yè)務(wù)識別方法
方法一基于端口號來識別P2P業(yè)務(wù)。這是由于早期的P2P業(yè)務(wù)是通過 固定的端口號發(fā)送數(shù)據(jù)。例如,商用的Gnutella軟件是通過6346或6347 端口號發(fā)送數(shù)據(jù)的,而另 一種商用軟件DirectConnect是通過411或412端口 號發(fā)送數(shù)據(jù)的。因此,只需對P2P業(yè)務(wù)所采用的固定端口進行監(jiān)控就能識別 出P2P數(shù)據(jù)流。不過,目前大多數(shù)P2P業(yè)務(wù)已使用動態(tài)隨機端口號發(fā)送數(shù)據(jù), 因此通過簡單地基于端口號的分析方法很難識別、跟蹤或控制P2P通信。
方法二基于網(wǎng)絡(luò)流量的統(tǒng)計特征來識別P2P業(yè)務(wù)。這是由于純P2P 流量有其獨特的分布特征,具體表現(xiàn)為純P2P業(yè)務(wù)的流量不但比傳統(tǒng)業(yè)務(wù)的 流量大,而且在業(yè)務(wù)開始時會較為迅速地增加,并在穩(wěn)定在一個較高的值附 近的一段時間后又急劇下降。因此根據(jù)P2P流量的獨特分布特征,通常利用
網(wǎng)絡(luò)流量統(tǒng)計中的一些分布變化情況來衡量P2P流量特征的信息量。目前一
些公司仍在使用這種技術(shù)。然而,當(dāng)其他非P2P業(yè)務(wù)也產(chǎn)生較大流量時,會 對純P2P業(yè)務(wù)流量的統(tǒng)計量產(chǎn)生影響。因此通過這種方式識別P2P業(yè)務(wù)會有
一定的誤差。
方法三基于協(xié)議來識別P2P業(yè)務(wù)。這是由于每個P2P業(yè)務(wù)都有一個自 己的協(xié)議,每個協(xié)議都有其特定的協(xié)議標(biāo)識符。因此,可通過檢測網(wǎng)絡(luò)中每 個數(shù)據(jù)包中的協(xié)議標(biāo)識符來識別P2P業(yè)務(wù)。但是,這種方式需要對網(wǎng)絡(luò)中每 一個數(shù)據(jù)包進行檢測,因此會進一步加劇網(wǎng)絡(luò)的延遲。
發(fā)明內(nèi)容
基于上述問題,本發(fā)明提供了一種對等網(wǎng)絡(luò)中對點對點業(yè)務(wù)識別技術(shù)。 通過此技術(shù),能夠準(zhǔn)確并快速地識別點對點業(yè)務(wù)。
根據(jù)本發(fā)明的一個方面,本發(fā)明公開了 一種通信網(wǎng)絡(luò)中識別點對點業(yè)務(wù) 的方法,包括
收集TCP (transmission control protocol,傳輸控制協(xié)i義)連才妻信息; 對所述TCP連接信息進行TCP連接數(shù)特性分析; 根據(jù)分析結(jié)果判斷所述TCP連接所對應(yīng)的業(yè)務(wù)是否為點對點業(yè)務(wù)。 其中,所述收集TCP連接信息的步驟可以包括以時間段為單位分組
統(tǒng)計TCP數(shù)據(jù)包,根據(jù)TCP數(shù)據(jù)包的包頭信息獲取TCP連接信息;所述
TCP連接信息包括TCP連接數(shù)、上傳流量及總流量。 優(yōu)選的,所述TCP連接數(shù)特性分析步驟包括
根據(jù)所述TCP連接信息生成用于TCP連接數(shù)特性分析的因素,所述因 素包括TCP連接數(shù)變化率、上傳流量占總流量的平均百分比及上傳流量。 可以利用模糊運算法則對所述因素進行TCP連接數(shù)特性分析。 優(yōu)選的,所述利用模糊運算法則對所述因素進行TCP連接數(shù)特性分析 的步驟包括
對所述因素分別進行相應(yīng)的隸屬度函數(shù)運算,得到因素評估值矩陣; 將所述因素評估值矩陣和各相應(yīng)的因素權(quán)值相乘,得到分析結(jié)果。 其中,通過柯西分布確定所述隸屬度函數(shù)。
優(yōu)選的,根據(jù)分析結(jié)果來判斷所述TCP連接所對應(yīng)的業(yè)務(wù)是否為點對 點業(yè)務(wù)的步驟包括
將分析結(jié)果與評估閾值比較,如果所述分析結(jié)果大于該閾值,則是點對 點業(yè)務(wù);否則,不是點對點業(yè)務(wù)。
其中,在所述利用模糊運算法則對所述因素進行TCP連接數(shù)特性分析 步驟之前,還包括
判斷TCP連接數(shù)變化率與變化率閾值的大小,如果所述TCP連接數(shù)變 化率大于該閾值,則保存并執(zhí)行后面的步驟;否則,返回至收集TCP連接
信息步驟。
優(yōu)選的,對所述TCP連接信息進行TCP連接數(shù)特性分析;根據(jù)分析結(jié) 果判斷所述TCP連接所對應(yīng)的業(yè)務(wù)是否為點對點業(yè)務(wù),包括 比較TCP連接數(shù)與連接數(shù)閾值的大??;
如果所述TCP連接數(shù)大于該閾值,則是點對點業(yè)務(wù);否則,不是點對 點業(yè)務(wù)。
其中,所述根據(jù)分析結(jié)果判斷所述TCP連接所對應(yīng)的業(yè)務(wù)是否為點對 點業(yè)務(wù)步驟之后還包括
若是P2P業(yè)務(wù),將分析結(jié)果輸出; 否則,返回至收集TCP連接信息步驟。
另 一方面,本發(fā)明還公開了 一種在通信網(wǎng)絡(luò)中對點對點業(yè)務(wù)進行識別的 裝置,包括數(shù)據(jù)收集單元、數(shù)據(jù)分析單元及評估單元;其中,
所述的數(shù)據(jù)收集單元可以為一個數(shù)據(jù)接收器,用于接收并收集TCP連 接信息;
數(shù)據(jù)分析單元對從所述數(shù)據(jù)收集單元收集到的TCP連接信息進行TCP 連接數(shù)特性分析;
所述評估單元根據(jù)所述數(shù)據(jù)分析單元的分析結(jié)果判斷所述TCP連接所
對應(yīng)的業(yè)務(wù)是否為點對點業(yè)務(wù)。
優(yōu)選的,所述數(shù)據(jù)分析單元包括數(shù)據(jù)處理模塊,數(shù)據(jù)分析模塊。 所述的數(shù)據(jù)處理模塊可以根據(jù)所述TCP連接信息生成用于TCP連接數(shù)
特性分析的因素。
所述的數(shù)據(jù)分析模塊可以利用模糊運算法則對所述因素進行TCP連接 數(shù)特性分析。
優(yōu)選地,所述數(shù)據(jù)分析模塊包括評估值矩陣生成模塊、分析結(jié)果生成 模塊;
評估值矩陣生成^f莫塊對所述因素分別進行相應(yīng)的隸屬度函數(shù)運算,得到
因素評估值矩陣;
分析結(jié)果生成模塊將所述因素評估值矩陣和各相應(yīng)的因素權(quán)值相乘,得
到分析結(jié)果。
其中,所述因素可以包括TCP連接數(shù)變化率。
所述裝置還可包括判斷模塊,將由數(shù)據(jù)處理模塊生成的TCP連接數(shù)變 化率與變化率閾值比較大小。如果所述TCP連接數(shù)變化率大于該閾值,則 將所述因素通過數(shù)據(jù)存儲單元發(fā)送至數(shù)據(jù)分析模塊;否則,指令數(shù)據(jù)收集單 元繼續(xù)收集TCP連接信息。
其中,所述TCP連接信息可以包括TCP連接數(shù)。
所述數(shù)據(jù)分析單元將從數(shù)據(jù)收集單元收集到的TCP連接數(shù)與連接數(shù)閾 值比較大?。?br>
所述評估單元根據(jù)所述數(shù)據(jù)分析單元的分析結(jié)果判斷所述TCP連接所 對應(yīng)的業(yè)務(wù)是否為點對點業(yè)務(wù)。
通過上述技術(shù)方案,本發(fā)明能夠達到以下技術(shù)效果
首先,本發(fā)明的利用對對等網(wǎng)絡(luò)中的TCP連接數(shù)量的統(tǒng)計特征進行點 對點的流量識別的手段。由于P2P通信的每一組連接都是TCP連接,因此 通過對數(shù)據(jù)包的識別可以較容易地獲取到TCP連接信息。
其次,開始P2P業(yè)務(wù)時,由于節(jié)點和大量的節(jié)點建立連接,而每建立一 組連接往往都會發(fā)送大量的TCP連接請求數(shù)據(jù)包,因此會產(chǎn)生大量的TCP 連接數(shù)。所以通過對網(wǎng)絡(luò)中TCP連接數(shù)特性分析能夠準(zhǔn)確的識別P2P業(yè)務(wù)。 尤其是,本發(fā)明采用了模糊運算法則,通過對TCP連接數(shù)等信息的綜合評 估,使識別精度進一步提高。
最后,由于節(jié)點間可以通過發(fā)送同步比特/確認(rèn)比特包(SYN/ACK)而 建立TCP連接,而本發(fā)明的方法和裝置通過對網(wǎng)絡(luò)中的SYN/ACK包的數(shù)量 進行統(tǒng)計從而得出TCP連接數(shù),這種統(tǒng)計是實時并快速的,不會造成網(wǎng)絡(luò) 的延遲。
圖1為本發(fā)明P2P管理流程示意圖2為本發(fā)明可管理P2P業(yè)務(wù)的IP網(wǎng)絡(luò)結(jié)構(gòu)圖3為本發(fā)明P2P業(yè)務(wù)識別優(yōu)選實施例一的流程示意圖; 圖4為本發(fā)明P2P業(yè)務(wù)識別優(yōu)選實施例一的裝置結(jié)構(gòu)圖; 圖5為本發(fā)明P2P業(yè)務(wù)識別優(yōu)選實施例二的流程示意圖; 圖6為本發(fā)明P2P業(yè)務(wù)識別優(yōu)選實施例二的裝置結(jié)構(gòu)圖。
具體實施例方式
分布式P2P通信根據(jù)其工作原理可劃分成四個階段,分別為發(fā)現(xiàn)和啟 動階段、共享階段、查詢和尋找階段,以及下載階段。在前三個階段,節(jié)點 和目錄服務(wù)器建立連接并加入P2P網(wǎng)絡(luò)、發(fā)送上傳文件列表、向目錄服務(wù)器 查詢并尋找存有感興趣文件的其他節(jié)點。在下載階段,所述節(jié)點根據(jù)目錄服 務(wù)器提供的列表上的所感興趣的其他節(jié)點信息, 一一建立連接,以完成文件 的互傳。
一般情況下,為了保證P2P網(wǎng)絡(luò)的正常工作,P2P協(xié)議會設(shè)置一個最大 連接數(shù)。在下載階段,如果節(jié)點的連接數(shù)沒有達到預(yù)置的最大連接數(shù),那么 該節(jié)點就可以繼續(xù)與更多的節(jié)點建立連接。通常,由于網(wǎng)絡(luò)的延遲或丟包等 現(xiàn)象,或者由于用戶的使用習(xí)慣, 一個節(jié)點在與多個節(jié)點建立連接時要發(fā)送 大量的連接請求信息。因而,當(dāng)進行P2P業(yè)務(wù)時,節(jié)點間的TCP連接請求 信息數(shù)會明顯上升。同時,由于節(jié)點與其他節(jié)點建立連接是在P2P業(yè)務(wù)開始 不久進行的,并且節(jié)點在建立起連接之后,不會再發(fā)送連接請求信息。因此, P2P業(yè)務(wù)的TCP連接數(shù)峰值出現(xiàn)在P2P業(yè)務(wù)開始不久。由于該峰值是由P2P 業(yè)務(wù)產(chǎn)生的,所以可通過該峰值來反映包括P2P文件共享及P2P流的特性。
本發(fā)明利用了 TCP的連接特性來識別并管理P2P業(yè)務(wù)。請參見圖1所 示的本發(fā)明P2P管理流程示意圖;其具體的P2P管理過程為
步驟101:收集用戶終端的TCP連接信息;
步驟102:分析并判斷所述用戶終端的TCP連接是否為P2P業(yè)務(wù)的TCP 連接特性。若是,進入步驟103;否則,返回步驟101;
步驟103:認(rèn)為用戶終端為P2P用戶,發(fā)送P2P分析結(jié)果;
步驟104:根據(jù)分析結(jié)果建立所述P2P用戶終端策略,并控制服務(wù)質(zhì)量;
步驟105:發(fā)送相關(guān)策略;
步驟106:根據(jù)所述策略進行付費、認(rèn)證等相關(guān)管理。
請參見圖2,在IP網(wǎng)絡(luò)中,可通過三個邏輯功能模塊來完成上述P2P
管理流程,即P2P識別模塊201、 P2P策略與控制模塊202、 P2P管理模塊 203。其中,P2P識別模塊201用來監(jiān)控用戶終端的TCP連接特性,判斷所 述TCP連接所對應(yīng)的業(yè)務(wù)是否為P2P業(yè)務(wù),并將P2P業(yè)務(wù)的分析結(jié)果發(fā)送 至P2P策略與控制模塊202, P2P策略與控制模塊202根據(jù)該分析結(jié)果建立 所述P2P用戶終端策略,控制通信的服務(wù)質(zhì)量,并將相應(yīng)的P2P用戶終端策 略發(fā)送至P2P管理模塊203。 P2P管理模塊203根據(jù)從P2P策略與控制模塊 202發(fā)來的P2P用戶終端策略來完成付費、認(rèn)證等相關(guān)的管理。
由上述描述可知,若對IP網(wǎng)絡(luò)中的P2P業(yè)務(wù)的流量進行管理和控制, 需要先對P2P業(yè)務(wù)進行識別,然后再根據(jù)生成的P2P分析結(jié)果進行相應(yīng)的管 理控制,以便保證網(wǎng)絡(luò)的服務(wù)質(zhì)量。
本發(fā)明提供的一種點對點業(yè)務(wù)識別的技術(shù)方案是收集TCP連接信息; 對所述TCP連接信息進行TCP連接數(shù)特性分析;根據(jù)分析結(jié)果判斷所述TCP 連接所對應(yīng)的業(yè)務(wù)是否為點對點業(yè)務(wù)。
請參見圖3所示的本發(fā)明P2P通信流量識別方法的優(yōu)選實施例一的流程 示意圖。具體地,可以通過以下步驟完成本發(fā)明的方法
步驟301:收集TCP連接信息。
TCP連接信息包括用戶終端在當(dāng)前時段的TCP連接數(shù),上傳流量數(shù)和 總流量數(shù)。所述TCP連接信息有多種收集方式,例如可以在用戶終端、網(wǎng) 關(guān)、路由器或者移動通信網(wǎng)絡(luò)中的GGSN ( Gateway GPRS Support Node,即 網(wǎng)關(guān)GPRS支持節(jié)點)上,安裝一個用于數(shù)據(jù)包分析的軟件開發(fā)包SDK (Software Development Kit ),如優(yōu)選的winPcap庫欠件包。然后,利用該壽欠件 包對數(shù)據(jù)包的包頭信息進行分析,收集TCP連接信息。若本發(fā)明應(yīng)用在IMS 網(wǎng)絡(luò)中,由于建立TCP連接之前要建立IMS會話,而IMS網(wǎng)絡(luò)中的在線服 務(wù)器(Presence Server)能夠記錄在線用戶的信息,因此可以在IMS網(wǎng)絡(luò)中 通過在線服務(wù)器所記錄的在線用戶信息來獲取TCP連接信息。
基于P2P通信的工作原理,在P2P業(yè)務(wù)開始后,該業(yè)務(wù)發(fā)起用戶會和大 量其他用戶建立TCP連接,發(fā)送建立TCP連接所需的連接請求包,例如同 步比特/確認(rèn)比特包(SYN/ACK)。本發(fā)明通過對所述連接請求包的數(shù)量進行 統(tǒng)計來獲取TCP連接數(shù),并根據(jù)所述連接請求包的包頭數(shù)據(jù)信息獲取到上 傳數(shù)據(jù)流量數(shù)和總流量數(shù)。本發(fā)明的收集方式優(yōu)選地以時間段為單位進行收 集,所述時間段可根據(jù)實測數(shù)據(jù)預(yù)先設(shè)置,例如將30秒設(shè)為一個間隔。
步驟302 ~步驟303:處理TCP連接信息并判斷保存。
首先,根據(jù)收集到的TCP連接信息生成TCP連接數(shù)變化率和平均百分 比,其中,所述TCP連接數(shù)變化率為當(dāng)前時段的連接數(shù)與前一時段的連接 數(shù)的比值,平均百分比為相臨幾個時段的平均上傳流量與總流量的百分比。
本發(fā)明取平均上傳流量是因為,本領(lǐng)域技術(shù)人員知道,所有P2P業(yè)務(wù), 尤其是P2P流媒體業(yè)務(wù),其特點是用戶只有在建立TCP連接并獲得一定數(shù) 據(jù)后,才能夠進行上傳,并且上傳流量增大至穩(wěn)定是在用戶的TCP連接數(shù) 趨于穩(wěn)定之后,因此上傳流量的增大并趨于穩(wěn)定通常要晚于TCP連接數(shù)峰 值,所以為了使測量的數(shù)據(jù)更有利于準(zhǔn)確判斷,將上傳流量測量的時間段設(shè) 置在TCP連接數(shù)峰值后不久,并取相臨幾個時間段的連接數(shù)的平均值,因 此所述平均百分比不是在TCP連接峰值出現(xiàn)時的上傳流量與總流量的百分 比,而是在TCP連接峰值之后很短的時間內(nèi)的幾個時段的上傳流量的平均 值與總流量的百分比。
其次,判斷TCP連接數(shù)變化率與變化率閾值的大小,所述閾值是預(yù)先 設(shè)置的,其閾值范圍優(yōu)選地為大于等于4,本發(fā)明將變化率閾值優(yōu)選設(shè)置為 4。當(dāng)生成的TCP連接數(shù)變化率大于該閾值時,則保存所述TCP連接數(shù)變化 率、平均百分比以及上傳流量值,并執(zhí)行步驟304;否則,將處理結(jié)果丟棄 后返回步驟301。
步驟304:對變化率、百分比及上傳流量值進行分析。
為了更好地進行分析,利用模糊運算法則對TCP連接數(shù)變化率、平均 百分比及上傳流量值這三個因素進行分析,為了便于說明,這里將TCP連 接數(shù)變化率表示為Cr、平均百分比為^ 、上傳流量值為tu。
首先,用相應(yīng)的隸屬度函數(shù)分別計算上述三個因素的數(shù)值。每一個函數(shù) 的結(jié)果包括兩個值,分別表示是P2P業(yè)務(wù)的可能性及不是P2P業(yè)務(wù)的可能性。
為方便說明,定義U為上述三個因素組成的一個因素集,即"={紅"2,"3}, 其中,u,為Cr, U2為",U3為tu。同時,定義V為每個因素的評估集,即 1/ =卜'",其中,v,表示是P2P業(yè)務(wù)的可能性,V2表示不是P2P業(yè)務(wù)的可能 性。
利用相應(yīng)的隸屬度函數(shù)通過對每個因素從U到V的模糊映射,得到每 個因素的評估集
即
根據(jù)模糊識別的不同問題,可以有不同的隸屬度函數(shù)設(shè)定方法。 一般來
說,主要有三種方法,即F統(tǒng)計方法、三分法、及通過F分布來確定隸屬度
函數(shù)。由于此問題中需要構(gòu)建兩相函數(shù),建議采用通過F分布來確定隸屬度
函數(shù)。常見的分布包括矩形分布或半矩形分布、半梯形分布或梯形分布、拋
物形分布、正態(tài)分布、柯西分布與嶺形分布。建i義選耳又4可西分布來確定隸屬
度函數(shù),這樣可以獲得較好的評判結(jié)果。
下文以Cr與"為例,根據(jù)實驗獲得數(shù)據(jù)選取柯西分布構(gòu)建隸屬度函數(shù)。
因素tu的隸屬度函數(shù)也可以通過類似的方法獲得。 例如,將Cr的經(jīng)驗性隸屬度函數(shù)定義為
() "4
-^ Cr > 4
1 + 4(c「4)—2
通過對因素Cr的隸屬度函數(shù)的計算,得到結(jié)果m,其值表示是P2P業(yè)
務(wù)的可能性。同時,將l-卬的結(jié)果作為不是P2P業(yè)務(wù)的可能性,即1"12,則
根據(jù)rn 、 1"12可得到因素0的評估集V,。
同樣,可以如下定義因素^的經(jīng)驗性的隸屬度函數(shù)
1 + 0.01(<9-0.25)一
61 S 25% S > 25%
通過對因素^的隸屬度函數(shù)的計算,將其結(jié)果按照上述方法得到r21 、 r22 兩個值分別表示是P2P業(yè)務(wù)的可能性和不是P2P業(yè)務(wù)的可能性,從而再根據(jù) r21 、 r22得到因素^的評估集V2。
對于因素tu ,可同樣按照上述方法,通過柯西分布構(gòu)建的隸屬度函數(shù)得
到因素tu的評估集V3,這里不再贅述。
再根據(jù)所述三個隸屬度函數(shù)的結(jié)果生成一個評估值矩陣,即
<formula>formula see original document page 13</formula>
對于P2P業(yè)務(wù)的冷門文件,由于參與該文件互傳的用戶數(shù)量較少,導(dǎo)致 用戶建立的TCP連接數(shù)較少,因此這類冷門文件的TCP連接數(shù)峰值不如P2P 業(yè)務(wù)中熱門文件的TCP連接數(shù)峰值明顯。而在一些極端情況下,某些非P2P 業(yè)務(wù)(例如web業(yè)務(wù))也有可能在短時間內(nèi)由于打開大量的網(wǎng)頁而建立較多 的TCP連接,這時在連接數(shù)特性上會與冷門P2P業(yè)務(wù)的TCP連接特性較為 接近。這時單純依賴TCP連接數(shù)變化率會難以準(zhǔn)確區(qū)分。而根據(jù)P2P業(yè)務(wù) 特性,由于web業(yè)務(wù)所產(chǎn)生的上傳流量遠小于P2P業(yè)務(wù),所以可通過因素 、,在流量上加以區(qū)分。由于因素tu只針對特殊情況,所以tu的權(quán)值低于其他 兩個因素的權(quán)值。
由于所述三個因素的重要性不同,因此其權(quán)值不同,如可將三個因素的 權(quán)值分別設(shè)置為0.4、 0.4和0.2。定義A為所述三個因素的權(quán)值集,即 '4 = ("',"2'"力,其中,"'為Cr的權(quán)值,"2為S的權(quán)值,"3為、的權(quán)值。
最后,通過S-4^計算三個因素的權(quán)值向量和評估值矩陣,得到一個綜 合評估結(jié)果B。所述B有兩個分量值,即"=(&62),其中,/^表示是P2P業(yè) 務(wù)的可能性,^表示不是P2P業(yè)務(wù)的可能性。
步驟305:評估分析結(jié)果,判斷所述TCP連接所對應(yīng)的業(yè)務(wù)是否是P2P 業(yè)務(wù)。
根據(jù)生成的綜合評估結(jié)果B并做出最終識別。識別的精度可以根據(jù)用戶 的需要,通過調(diào)整其評估閾值來決定如果采用較低的精度,只需6'>&, 即此時所述評估閾值可設(shè)為0.5。當(dāng)6'>0.5,則認(rèn)為有關(guān)業(yè)務(wù)是P2P業(yè)務(wù);反 之,則認(rèn)為不是P2P業(yè)務(wù)。如果要提高精度,可適當(dāng)提高評估閾值。當(dāng)&大 于該評估閾值,則可認(rèn)為有關(guān)業(yè)務(wù)是P2P業(yè)務(wù);否則,不為P2P業(yè)務(wù)。
當(dāng)分析結(jié)果表明有關(guān)業(yè)務(wù)是P2P業(yè)務(wù)時,執(zhí)行步驟306;否則返回至步 驟301。
步驟306:將分析結(jié)果輸出。
將是P2P業(yè)務(wù)的分析結(jié)果輸出,然后P2P系統(tǒng)可根據(jù)所述分析結(jié)果建立 P2P策略并進行相應(yīng)管理,進而控制服務(wù)質(zhì)量。由于輸出分析結(jié)果之后的管
理等工作不是本發(fā)明的保護內(nèi)容,所以這里不再贅述。
基于上述技術(shù)方案,本發(fā)明還提供了一種用于實現(xiàn)點對點業(yè)務(wù)識別的裝
置,包括數(shù)據(jù)收集單元401、數(shù)據(jù)分析單元402、及評估單元409。其中, 數(shù)據(jù)收集單元401將收集到的TCP連4妄信息llr出至凄t據(jù)分析單元402;所述 數(shù)據(jù)分析單元402對所述TCP連接信息進行TCP連接數(shù)特性分析;評估單 元409根據(jù)所述數(shù)據(jù)分析單元402的分析結(jié)果判斷所述TCP連接所對應(yīng)的 業(yè)務(wù)是否為點對點業(yè)務(wù)。
圖4為本發(fā)明用于實現(xiàn)P2P業(yè)務(wù)識別的方法的實施例一的裝置結(jié)構(gòu)圖。 所述裝置包括數(shù)據(jù)收集單元401、數(shù)據(jù)分析單元402、存儲單元405、評估 單元409,以及調(diào)節(jié)單元410。
其中,所述數(shù)據(jù)分析單元402包括數(shù)據(jù)處理模塊403、判斷模塊404、 數(shù)據(jù)分析模塊407;所述數(shù)據(jù)分析模塊407包括評估值矩陣生成模塊406、 分析結(jié)果生成模塊408。
數(shù)據(jù)收集單元401用于檢查數(shù)據(jù)包頭,將TCP連接請求數(shù)據(jù)包以時間 段為單位分組收集,并將收集到的TCP連接信息輸出至數(shù)據(jù)分析單元402 進行處理分析,所述TCP連接信息包括用戶終端的TCP連接數(shù)、上傳流量 數(shù)和總流量數(shù)。所述數(shù)據(jù)處理模塊403根據(jù)所收集到的TCP連接信息生成 用于TCP連接數(shù)特性分析的因素,所述因素包括TCP連接數(shù)變化率和上傳 流量占總流量的平均百分比。其中,所述TCP連接數(shù)變化率為當(dāng)前時段的 連接數(shù)與前一時段的連接數(shù)的比值,平均百分比為相鄰幾個時間段的平均上 傳流量與總流量的百分比。所述判斷模塊404 一艮據(jù)TCP連接數(shù)變化率與調(diào) 節(jié)單元410預(yù)先設(shè)置的變化率閾值的大小關(guān)系,來判斷是否保存處理結(jié)果。 如果所述TCP連接數(shù)變化率大于變化率閾值,則將所述因素通過存儲單元 405發(fā)送至數(shù)據(jù)分析模塊407;否則,指令數(shù)據(jù)收集單元401繼續(xù)收集TCP 連接信息。
數(shù)據(jù)分析模塊407利用模糊運算法則將存儲單元405中的因素進行TCP 連接數(shù)特性分析。所述的分析過程包括,評估值矩陣生成模塊406對所述因 素分別進行相應(yīng)的隸屬度函數(shù)運算,得到因素評估值矩陣;分析結(jié)果生成模 塊408將所述因素評估值矩陣和因素權(quán)值相乘,將生成的分析結(jié)果輸出至評 估單元409。所述評估單元409根據(jù)調(diào)節(jié)單元410預(yù)置的評估閾值對該結(jié)果 進行最終分析,判斷所述TCP連接所對應(yīng)的業(yè)務(wù)是否為點對點業(yè)務(wù)。當(dāng)是P2P業(yè)務(wù)時,所述評估單元409將P2P業(yè)務(wù)的結(jié)果輸出;否則,指令數(shù)據(jù)收
集單元401繼續(xù)收集TCP連接信息。
調(diào)節(jié)單元410用于設(shè)置收集時間段,以及調(diào)整所述三個因素的隸屬度函 數(shù)、權(quán)值、變化率閾值及評估閾值。
本發(fā)明對P2P業(yè)務(wù)識別的方法,除了采用上述模糊算法對TCP連接數(shù) 變化率等因素進行分析外,還可以單純通過對TCP連接數(shù)的分析來識別。 這是由于進行P2P業(yè)務(wù)時,業(yè)務(wù)節(jié)點會和其他節(jié)點建立大量的TCP連接進 行文件互傳,P2P業(yè)務(wù)的TCP連接數(shù)要比其他非P2P業(yè)務(wù)的連接數(shù)多。所 以如果在一段時間內(nèi)的TCP連接數(shù)比前一時段的數(shù)量大,則認(rèn)為此刻大量 的TCP連接數(shù)為P2P連接數(shù),該時段運行的業(yè)務(wù)為P2P業(yè)務(wù)。
圖5為本發(fā)明對P2P業(yè)務(wù)識別的實施例二的流程示意圖。該流程的具體 步驟為
步驟501:收集TCP連接數(shù)。
所述TCP連接信息包括用戶終端在當(dāng)前時段的TCP連接數(shù)、上傳流量 數(shù)和總流量數(shù)。所述TCP連接信息有多種收集方式,例如可以在用戶終端、 網(wǎng)關(guān)、路由器或者移動通信網(wǎng)絡(luò)中的網(wǎng)關(guān)GPRS支持節(jié)點(Gateway GPRS S叩port Node, GGSN )上,安裝一個用于數(shù)據(jù)包分析的軟件開發(fā)包SDK (Software Development Kit),如一個優(yōu)選的winPcap 4欠件包。然后,利用該 軟件包對數(shù)據(jù)包的包頭信息進行分析,收集TCP連接信息。本發(fā)明通過對 TCP的連接請求包數(shù)量進行統(tǒng)計來獲取TCP連接數(shù)。收集的優(yōu)選方式為以 一個時間段為單位收集,所述時間段可根據(jù)實測數(shù)據(jù)預(yù)先設(shè)置,如30秒為 一間隔。
若在IMS網(wǎng)絡(luò)中,由于建立TCP連接之前要建立IMS會議,而IMS網(wǎng) 絡(luò)中的在線服務(wù)器(Presence Server)能夠記錄在線用戶的信息。因此,在 IMS網(wǎng)絡(luò)中可通過在線服務(wù)器上記錄的在線用戶信息獲取TCP連接數(shù)。
步驟502 ~步驟503:分析TCP連接數(shù)特性并判斷所述TCP連接所對應(yīng) 的業(yè)務(wù)是否為P2P業(yè)務(wù)。
對收集的P2P連接數(shù)與預(yù)置的連接數(shù)閾值進行比較分析,并根據(jù)分析結(jié) 果判斷所述TCP連接所對應(yīng)的業(yè)務(wù)是否為P2P業(yè)務(wù)。如果在一段時間內(nèi)的 TCP連接數(shù)大于所述連接數(shù)閾值,則認(rèn)為該時段運行的業(yè)務(wù)是P2P業(yè)務(wù);否 則,不是P2P業(yè)務(wù)。
其中,所述連接數(shù)閾值可根據(jù)用戶對識別精度的要求,經(jīng)驗性地進行設(shè) 置。例如,可以采集多組P2P業(yè)務(wù)的連接數(shù)據(jù),取其中TCP連接數(shù)峰值較
低,但仍高于大多數(shù)非P2P業(yè)務(wù)的連接數(shù)峰值的數(shù)作為連接數(shù)閾值。上述提 供的設(shè)置方法只是其中一個實施例,其i殳置思想是,只要介于非P2P業(yè)務(wù) TCP連接數(shù)峰值和P2P業(yè)務(wù)的TCP連接數(shù)峰值之間的數(shù)值,都能夠作為連 接數(shù)閾值。由于所述閾值屬于經(jīng)驗性設(shè)置,其設(shè)置方法不是唯一的,因此所 述閾值及其設(shè)置方法只要是基于上述思想的,都屬于本發(fā)明所保護的范圍。
當(dāng)是P2P業(yè)務(wù)時,執(zhí)行步驟504;否則返回至步驟501。
步驟504:將分析結(jié)果輸出。
將是P2P業(yè)務(wù)的分析結(jié)果輸出,然后P2P系統(tǒng)可#4居所述分析結(jié)果建立 P2P策略并進行相應(yīng)管理,進而控制服務(wù)質(zhì)量。將分析結(jié)果輸出之后的管理 等工作不是本發(fā)明的保護內(nèi)容,所以這里不再贅述。
基于上述技術(shù)方案,本發(fā)明還提供了一種用于實現(xiàn)P2P業(yè)務(wù)識別的方法 實施例二的裝置,請參見圖6。圖6為本發(fā)明用于實現(xiàn)P2P業(yè)務(wù)識別的方法 實施例二的裝置結(jié)構(gòu)圖。所述裝置包括數(shù)據(jù)收集單元601 、數(shù)據(jù)分析單元602、 評估單元603以及調(diào)節(jié)單元604。其中,數(shù)據(jù)收集單元601用于檢查數(shù)據(jù)包 頭,并根據(jù)TCP連接請求數(shù)據(jù)包以時間段為單位分組收集TCP連接數(shù),并 將收集到的TCP連接信息輸出至數(shù)據(jù)分析單元602。所述數(shù)據(jù)分析單元602 通過對TCP連接數(shù)與連接數(shù)閾值比較大小,來進行TCP連接數(shù)特性分析。 評估單元603根據(jù)所述數(shù)據(jù)分析單元602的分析結(jié)果判斷所述TCP連接所 對應(yīng)的業(yè)務(wù)是否為點對點業(yè)務(wù)。如果在一段時間內(nèi)的TCP連接數(shù)大于所述 連接數(shù)闊值,則所述評估單元603認(rèn)為該時段所運行的業(yè)務(wù)是P2P業(yè)務(wù),同 時將所述P2P業(yè)務(wù)的結(jié)果輸出;否則,所述評估單元603指令數(shù)據(jù)收集單元 601繼續(xù)收集TCP連接信息。
所述調(diào)節(jié)單元604用于設(shè)置收集時間段及連接數(shù)閾值。
以上所述的本發(fā)明實施方式,并不構(gòu)成對本發(fā)明保護范圍的限定。任何
在本發(fā)明的精神和原則之內(nèi)所作的修改、等同替換和改進等,均應(yīng)包含在本 發(fā)明保護范圍之內(nèi)。
權(quán)利要求
1、一種通信網(wǎng)絡(luò)中識別點對點業(yè)務(wù)的方法,其特征在于包括收集TCP連接信息;對所述TCP連接信息進行TCP連接數(shù)特性分析;根據(jù)分析結(jié)果判斷所述TCP連接所對應(yīng)的業(yè)務(wù)是否為點對點業(yè)務(wù)。
2、 如權(quán)利要求1所述的方法,其特征在于,所述收集TCP連接信息包括以時間段為單位分組統(tǒng)計TCP數(shù)據(jù)包,根據(jù)TCP數(shù)據(jù)包的包頭信息獲 取TCP連接信息;所述TCP連接信息包括TCP連接數(shù)、上傳流量及總流量。
3、 如權(quán)利要求l所述的方法,其特征在于,所述TCP連接數(shù)特性分析 包括根據(jù)所述TCP連接信息生成用于TCP連接數(shù)特性分析的因素,所述因 素包括TCP連接數(shù)變化率、上傳流量占總流量的平均百分比及上傳流量; 利用模糊運算法則對所述因素進行TCP連接數(shù)特性分析。
4、 如權(quán)利要求3所述的方法,其特征在于,所述利用模糊運算法則對 所述因素進行TCP連接數(shù)特性分析包括對所述因素分別進行相應(yīng)的隸屬度函數(shù)運算,得到因素評估值矩陣; 將所述因素評估值矩陣和各相應(yīng)的因素權(quán)值相乘,得到分析結(jié)果。
5、 如權(quán)利要求4所述的方法,其特征在于,通過柯西分布確定隸屬度 函數(shù)。
6、 如權(quán)利要求1或4所述的方法,其特征在于,所述根據(jù)分析結(jié)果判 斷所述TCP連接所對應(yīng)的業(yè)務(wù)是否為點對點業(yè)務(wù)的步驟包括將分析結(jié)果與評估閾值比較,如果所述分析結(jié)果大于該閾值,則是點對 點業(yè)務(wù);否則,不是點對點業(yè)務(wù)。
7、 如權(quán)利要求3所述的方法,其特征在于,在所述利用模糊運算法則 對所述因素進行TCP連接數(shù)特性分析步驟之前,還包括判斷TCP連接數(shù)變化率與變化率閾值的大小,如果所述TCP連接數(shù)變 化率大于該閾值,則保存并執(zhí)行后面的步驟;否則,返回至收集TCP連接 信息步驟。
8、 如權(quán)利要求2所述的方法,其特征在于,對所述TCP連接信息進行 TCP連接數(shù)特性分析;根據(jù)分析結(jié)果判斷所述TCP連接所對應(yīng)的業(yè)務(wù)是否 為點對點業(yè)務(wù),包括比較TCP連接數(shù)與連接數(shù)閾值的大小;如果所述TCP連接數(shù)大于該閾值,則是點對點業(yè)務(wù);否則,不是點對 點業(yè)務(wù)。
9、 如權(quán)利要求6或8所述的方法,其特征在于,所述根據(jù)分析結(jié)果判 斷所述TCP連接所對應(yīng)的業(yè)務(wù)是否為點對點業(yè)務(wù)步驟之后還包括若是點對點業(yè)務(wù),將分析結(jié)果輸出; 否則,返回至收集TCP連接信息步驟。
10、 一種通信網(wǎng)絡(luò)中識別點對點業(yè)務(wù)的裝置,其特征在于包括數(shù)據(jù)收集 單元、數(shù)據(jù)分析單元及評估單元;其中,所述的數(shù)據(jù)收集單元收集TCP連接信息;所述的數(shù)據(jù)分析單元對從所述數(shù)據(jù)收集單元收集到的TCP連接信息進 行TCP連接數(shù)特性分析;所述的評估單元根據(jù)所述數(shù)據(jù)分析單元的分析結(jié)果判斷所述TCP連接 所對應(yīng)的業(yè)務(wù)是否為點對點業(yè)務(wù)。
11、 如權(quán)利要求IO所述的裝置,其特征在于,所述數(shù)據(jù)分析單元包括 數(shù)據(jù)處理模塊,數(shù)據(jù)分析模塊;數(shù)據(jù)處理模塊根據(jù)所述TCP連接信息生成用于TCP連接數(shù)特性分析的因素;數(shù)據(jù)分析模塊利用模糊運算法則對所述因素進行TCP連接數(shù)特性分析。
12、 如權(quán)利要求11所述的裝置,其特征在于,所述數(shù)據(jù)分析模塊包括: 評估值矩陣生成模塊、分析結(jié)果生成模塊;評估值矩陣生成模塊對所述因素分別進行相應(yīng)的隸屬度函數(shù)運算,得到 因素評估值矩陣;分析結(jié)果生成模塊將所述因素評估值矩陣和各相應(yīng)的因素權(quán)值相乘,得到分析結(jié)果。
13、 如權(quán)利要求11所述的裝置,其特征在于,所述因素包括TCP連接數(shù)變化率;所述裝置還包括判斷模塊,將由數(shù)據(jù)處理模塊生成的TCP連接數(shù)變化 率與變化率閾值比較大小,如果所述TCP連接數(shù)變化率大于該閾值,則將 所述因素通過數(shù)據(jù)存儲單元發(fā)送至數(shù)據(jù)分析模塊;否則,指令數(shù)據(jù)收集單元 繼纟賣收集TCP連接信息。
14、如權(quán)利要求IO所述的裝置,其特征在于,所述TCP連接信息包括 TCP連接數(shù);所述數(shù)據(jù)分析單元將從數(shù)據(jù)收集單元收集到的TCP連接數(shù)與連接數(shù)閾 值比較大小;對應(yīng)的業(yè)務(wù)是否為點對點業(yè)務(wù)。
全文摘要
本發(fā)明公開了一種在通信網(wǎng)絡(luò)中識別點對點業(yè)務(wù)的方法,包括收集TCP連接信息;對所述TCP連接信息進行TCP連接數(shù)特性分析;根據(jù)分析結(jié)果判斷所述TCP連接所對應(yīng)的業(yè)務(wù)是否為點對點業(yè)務(wù)。本發(fā)明還公開了一種在通信網(wǎng)絡(luò)中用于識別點對點業(yè)務(wù)的裝置,包括數(shù)據(jù)收集單元、數(shù)據(jù)分析單元及評估單元;其中,數(shù)據(jù)收集單元收集TCP連接信息;數(shù)據(jù)分析單元對從所述數(shù)據(jù)收集單元收集到的TCP連接信息進行TCP連接數(shù)特性分析;評估單元根據(jù)所述數(shù)據(jù)分析單元的分析結(jié)果判斷有關(guān)業(yè)務(wù)是否為點對點業(yè)務(wù)。通過上述技術(shù)方案能夠準(zhǔn)確并快速地識別點對點業(yè)務(wù)。
文檔編號H04L29/02GK101184081SQ200610148469
公開日2008年5月21日 申請日期2006年11月14日 優(yōu)先權(quán)日2006年11月14日
發(fā)明者楊 劉, 穎 劉, 疆 常 申請人:西門子公司