1.一種基于融合用戶行為和迅雷ID的NAT檢測(cè)方法,其步驟為:
1)流量處理平臺(tái)從捕獲的網(wǎng)絡(luò)流量中提取User-Agent、Cookie ID、和迅雷ID信息,并將提取出的信息拼接成JSON串;
2)根據(jù)網(wǎng)絡(luò)流量的五元組將JSON串負(fù)載均衡到流量處理平臺(tái)中相應(yīng)的服務(wù)器進(jìn)行處理;該五元組包括源IP、源端口、目的IP、目的端口和協(xié)議;
3)所述服務(wù)器根據(jù)五元組對(duì)數(shù)據(jù)進(jìn)行分類,當(dāng)判斷某一五元組對(duì)應(yīng)的TCP流結(jié)束時(shí);對(duì)該TCP流進(jìn)行在線處理;其中,在線處理方法為:根據(jù)五元組計(jì)算客戶端IP的主機(jī)出度、主機(jī)入度,判定該客戶端IP的NAT屬性,并計(jì)算該客戶端IP的主機(jī)規(guī)模。
2.如權(quán)利要求1所述的方法,其特征在于,所述主機(jī)出度為:主機(jī)向其他主機(jī)發(fā)出的TCP連接數(shù);所述主機(jī)入度為:主機(jī)接收其他主機(jī)的TCP連接數(shù)。
3.如權(quán)利要求2所述的方法,其特征在于,判定該客戶端IP的NAT屬性的方法為:當(dāng)主機(jī)連續(xù)活躍程度>4小時(shí),且從所述流量處理平臺(tái)檢測(cè)到該主機(jī)開(kāi)始的連續(xù)24小時(shí)之內(nèi)該主機(jī)總活躍程度>8小時(shí),并且該主機(jī)出度/入度的比值>1.4時(shí),將該主機(jī)標(biāo)記為NAT主機(jī)。
4.如權(quán)利要求1所述的方法,其特征在于,計(jì)算該客戶端IP的主機(jī)規(guī)模的方法為:根據(jù)該客戶端IP的JSON串計(jì)算以User-Agent和Cookie ID組合鍵的數(shù)據(jù)量大小N1;將具有相同User-Agent的JSON串放入同一Cookie ID集合E,遍歷集合E,找出不同User-Agent下具有相同的Cookie ID的User-Agent規(guī)模N2;以迅雷ID為Key計(jì)算Json串中去重的迅雷ID數(shù)量N3;主機(jī)規(guī)模計(jì)算為N1-N2+N3。
5.如權(quán)利要求1所述的方法,其特征在于,步驟3)中,所述服務(wù)器對(duì)收到的數(shù)據(jù)進(jìn)行清洗,過(guò)濾掉沒(méi)有User-Agent、Cookie ID、和迅雷ID特征的TCP連接數(shù)據(jù),將屬于同一五元組的數(shù)據(jù)進(jìn)行集中。
6.如權(quán)利要求1所述的方法,其特征在于,所述流量處理平臺(tái)為每一五元組對(duì)應(yīng)的TCP流數(shù)據(jù)設(shè)置一個(gè)超時(shí)時(shí)間,當(dāng)某一五元組在該超時(shí)時(shí)間內(nèi)沒(méi)有得到更新,則判定該五元組對(duì)應(yīng)的TCP流結(jié)束。
7.如權(quán)利要求1所述的方法,其特征在于,根據(jù)網(wǎng)絡(luò)流量的五元組將JSON串負(fù)載均衡到流量處理平臺(tái)中相應(yīng)的服務(wù)器進(jìn)行處理的方法為:將五元組作為hash函數(shù)的key進(jìn)行計(jì)算得到一索引值index,每一索引值index對(duì)應(yīng)一不同的服務(wù)器;根據(jù)索引值index將JSON串負(fù)載均衡到相應(yīng)的服務(wù)器,實(shí)現(xiàn)負(fù)載均衡。