專利名稱:一種基于信令分析的手機連接pc上網(wǎng)識別方法
技術(shù)領(lǐng)域:
本發(fā)明涉及移動通信領(lǐng)域,特別涉及一種基于信令分析的手機連接PC上網(wǎng)識別方法。
背景技術(shù):
調(diào)查結(jié)果表明,現(xiàn)網(wǎng)中存在一部分使用手機連接PC上網(wǎng)的用戶群體,這種用戶行為的出現(xiàn)說明有一部分用戶在特定的區(qū)域內(nèi)有使用PC上網(wǎng)的強烈需求。但是由于這些區(qū)域的寬帶接入不發(fā)達、WIFI熱點覆蓋不到位等問題,造成了用戶只能選擇使用手機連接PC上網(wǎng)。因此,實現(xiàn)一種識別手機連接PC上網(wǎng)的方法,通過定位這種用戶行為的多發(fā)區(qū)域,有助于運營商更準確地選擇WIFI熱點建設(shè)的區(qū)域,更好地為網(wǎng)絡(luò)運維提供支撐。
目前,可以通過IMEI和User-Agent兩種方法實現(xiàn)識別手機連接PC上網(wǎng)(I)基于 IMEI (International Mobile Equipment Identity,國際移動設(shè)備身份碼)的移動臺識別技術(shù)IMEI是由15位數(shù)字組成的〃電子串號〃,它與每臺手機一一對應(yīng),而且該碼是全世界唯一的,從手機的生產(chǎn)到交付使用都將被制造商所記錄。通過MEI識別終端類型,首先需要采集Gb和IuPS接口數(shù)據(jù),并通過解析鑒權(quán)響應(yīng)消息中的MEISV信元獲取移動臺的MEI標識,再通過查找MEI與終端的對應(yīng)關(guān)系表來最終確認終端類型。在目前的移動網(wǎng)絡(luò)中,基于MEI的識別方法可以準確識別出用戶在網(wǎng)絡(luò)接入階段所使用的終端類型(手機、上網(wǎng)卡、上網(wǎng)本)、品牌、及型號。(2)基于User Agent (用戶代理)的移動臺識別技術(shù)User Agent是一個特殊字符串頭,使得服務(wù)器能夠識別客戶使用的操作系統(tǒng)及版本、CPU類型、瀏覽器及版本、瀏覽器渲染引擎、瀏覽器語言、瀏覽器插件等。在移動網(wǎng)絡(luò)中,可以通過解析用戶HTTP請求中的User-Agent字段內(nèi)容來獲取用戶使用的手機終端型號。通過User Agent識別終端類型,首先需要采集Gb、IuPS接口數(shù)據(jù),并通過解析HTTP請求消息中的User Agent字段獲取用戶在上網(wǎng)時所使用的終端品牌、終端型號、操作系統(tǒng)、瀏覽器等信息。但是,在基于MEI的識別技術(shù)中,只能夠識別用戶在網(wǎng)絡(luò)接入過程中使用的終端類型,而無法對網(wǎng)絡(luò)接入后的特殊用戶行為進行分析,如用戶使用手機終端連接PC上網(wǎng)等;基于User Agent的識別技術(shù)只能夠?qū)κ謾C終端進行識別,但在識別準確性上也存在問題,用戶如果自行修改了手機終端的默認User Agent信息,則無法通過該方法正確獲取終端型號等信息。
發(fā)明內(nèi)容
針對現(xiàn)有技術(shù)中存在的缺陷,本發(fā)明的目的是提供一種基于信令分析的手機連接PC上網(wǎng)識別方法,用于實現(xiàn)手機連接PC上網(wǎng)識別的準確性和全面性。為達到以上目的,本發(fā)明采用的技術(shù)方案是
一種基于信令分析的手機連接PC上網(wǎng)識別方法,包括以下步驟采集移動互聯(lián)網(wǎng)上所有用戶行為的原始數(shù)據(jù),解析所述原始數(shù)據(jù)信令和協(xié)議,獲取終端識別信息,利用所述終端識別信息過濾掉使用手機終端發(fā)起的上網(wǎng)請求以及使用山寨機發(fā)起的上網(wǎng)請求,得到直接使用PC操作系統(tǒng)發(fā)起的上網(wǎng)請求,從所述直接使用PC操作系統(tǒng)發(fā)起的上網(wǎng)請求中進一步過濾掉使用上網(wǎng)本及上網(wǎng)卡發(fā)起的上網(wǎng)請求,剩下的上網(wǎng)請求為使用手機連接PC上網(wǎng)。本發(fā)明通過利用移動網(wǎng)絡(luò)中的HTTP協(xié)議特征,通過采集2/3G網(wǎng)絡(luò)中用戶上網(wǎng)的業(yè)務(wù)流程,并對HTTP協(xié)議中的User-Agent字段進行解析和分析,最后結(jié)合終端特征庫準確判斷發(fā)起業(yè)務(wù)的終端類型(移動終端、上網(wǎng)卡、上網(wǎng)本、PC )。
圖I為本發(fā)明實施例提供的基于信令分析的手機連接PC上網(wǎng)識別方法流程圖;圖2為本發(fā)明實施例中某小區(qū)手機連接筆記本上網(wǎng)的用戶分布區(qū)域抽樣分析示意圖。
具體實施例方式下面結(jié)合附圖和具體實施方式
對本發(fā)明作進一步描述。本發(fā)明實施例提供的識別手機連接PC上網(wǎng)的方法主要是利用移動網(wǎng)絡(luò)中的HTTP協(xié)議特征,通過采集2/3G網(wǎng)絡(luò)中用戶上網(wǎng)的業(yè)務(wù)流程,并對HTTP協(xié)議中的User-Agent字段進行解析和分析,最后結(jié)合終端特征庫判斷發(fā)起業(yè)務(wù)的終端類型(移動終端、上網(wǎng)卡、上網(wǎng)本、PC)。如果在用戶使用數(shù)據(jù)業(yè)務(wù)提交HTTP請求中的User-Agent信息中不包含手機廠商/型號/操作系統(tǒng)、上網(wǎng)本及上網(wǎng)卡廠商/型號,也不是山寨機的情況下,可以判斷該用戶是使用手機連接PC上網(wǎng)。如圖I所示,本實施例提供了一種基于信令分析的手機連接PC上網(wǎng)識別方法,包括步驟101、采集原始數(shù)據(jù)。采集原始數(shù)據(jù)是指對移動互聯(lián)網(wǎng)上的所有用戶行為進行采集,這些數(shù)據(jù)主要包括移動網(wǎng)絡(luò)移動性管理流程、會話管理流程以及用戶與媒體網(wǎng)關(guān)、SP服務(wù)器的交互過程。本實施例基于對GPRS和TD網(wǎng)絡(luò)的Gb、IuPS接口數(shù)據(jù)單獨分析實現(xiàn),只需采集任一個接口的原始數(shù)據(jù)即可。使用業(yè)務(wù)交換機鏡像方式進行數(shù)據(jù)采集,即在現(xiàn)網(wǎng)業(yè)務(wù)交換上將所需接口數(shù)據(jù)鏡像到空余端口輸出,以供采集使用。此方式只需在交換機上做好鏡像數(shù)據(jù),無需中斷業(yè)務(wù)及新增分光類設(shè)備,且便于后期維護,如在鏡像端口操作或中斷將不會影響原端口現(xiàn)網(wǎng)業(yè)務(wù),對現(xiàn)網(wǎng)運行最為安全。步驟102、解析信令和協(xié)議。解析信令和協(xié)議主要是指對原始數(shù)據(jù)進行解析,并從中獲取對終端識別有用的重要信息。具體來講,解析的內(nèi)容主要包括(l)Gb/IuPS接口信令流程包括分組鑒權(quán)流程、創(chuàng)建rop (用戶動態(tài)上下文)流程,目的是從這兩個流程中獲取用戶終端的MEIJMSI (國際移動用戶識別碼)、IP地址三個信息。解析的方法是對Gb/IuPS接口 GMM消息類型為0x13的信令消息進行過濾,并截取該消息的GMM(管理層協(xié)議)層第9至第20個字節(jié),獲取MEI信息;對Gb/IuPS接口 SM (會話管理)消息類型為0x10的信令消息進行過濾,并截取該消息中從Od 88兩個字節(jié)向后的第I至第8個字節(jié),獲取IMSI信息;截取該消息中從2b 06兩個字節(jié)向后的第3至第6個字節(jié),獲取用戶的IP地址信息。(2) Gb/IuPS/Gn接口 HTTP業(yè)務(wù)流程目的是從HTTP請求中獲取用戶終端的代理(User-Agent)信息。解析的方法是首先識別出攜帶504f和4745兩個連續(xù)字節(jié)的消息,分別為HTTP Post和HTTP Get消息,然后從這兩類消息中截取從5573到Od Oa之間的字節(jié),為User-Agent信息。步驟103、過濾使用手機終端發(fā)起的上網(wǎng)請求。步驟1031、過濾終端廠商。如果用戶使用正規(guī)廠商的移動終端訪問GPRS網(wǎng) 絡(luò)使用數(shù)據(jù)業(yè)務(wù)(2G與3G網(wǎng)絡(luò)過濾方法相同),則在用戶發(fā)起的HTTP請求的User-Agent信息中可以匹配出明確的終端廠商名稱(如“Nokia”、“TCL”等),若匹配出任何一個終端廠家,則將此HTTP請求標記為“手機終端發(fā)起”。步驟1032、過濾終端操作系統(tǒng)。特定的情況下,一些手機在發(fā)起HTTP請求的User-Agent信息中不會上報終端廠家和型號,只上報瀏覽器和操作系統(tǒng),此時就需要對手機的操作系統(tǒng)進行匹配,以確定是否為手機終端發(fā)起的業(yè)務(wù)請求。目前應(yīng)用在手機上的操作系統(tǒng)有 PalmOS、Symbian、Windows mobile> Linux 和 Android、iPhoneOS、bada、MeeGo、黑莓九種,因此可以將其所屬HTTP請求標記為“手機終端發(fā)起”。步驟104、過濾使用山寨機發(fā)起的上網(wǎng)請求。若用戶使用山寨機上網(wǎng)時,在HTTP請求的User-Agent信息中不會看到任何手機制造廠商、手機型號、手機操作系統(tǒng)的信息。用戶使用山寨機上網(wǎng)時,User-Agent信息中上報的是“MAUI WAP Browser”,這也是通用的山寨機標識。因此,本實施例將UA中包含“MAUI WAP Browser”的用戶標識為“山寨機上網(wǎng)用戶”。步驟105、過濾得到直接使用PC操作系統(tǒng)發(fā)起的上網(wǎng)請求。當用戶使用上網(wǎng)本、上網(wǎng)卡或者手機連接PC上網(wǎng)的情況下,在HTTP請求的User-Agent信息中只能看到瀏覽器和PC操作系統(tǒng)版本相關(guān)信息。對User-Agent字段進行字符串匹配,如果匹配到PC的操作系統(tǒng),該請求一定不是手機終端發(fā)起的。該步驟是進一步確認HTTP請求是由PC發(fā)起的,而不是除手機外的其他終端設(shè)備發(fā)起。但具體是上網(wǎng)本/上網(wǎng)卡發(fā)起,還是手機連接PC方式發(fā)起,還需做進一步區(qū)分。步驟106、過濾使用上網(wǎng)本/上網(wǎng)卡發(fā)起的上網(wǎng)請求。可以通過終端的MEI信息分析發(fā)起HTTP請求的用戶使用的是否是上網(wǎng)本或上網(wǎng)卡,具體方法如下步驟1061、根據(jù)HTTP請求中攜帶的用戶IP地址,通過用戶IP地址關(guān)聯(lián)TOP (用戶動態(tài)上下文)激活流程,可以獲取用戶的IMSI。步驟1062、根據(jù)MSI關(guān)聯(lián)Attach (附著)流程,在用戶發(fā)起的分組鑒權(quán)加密響應(yīng)消息中,獲取設(shè)備的頂EI信息。步驟1063、將獲取的MEI信息與中國移動終端設(shè)備MEI信息庫進行匹配分析,得到終端類型(上網(wǎng)本、上網(wǎng)卡、手機終端),將上網(wǎng)本、上網(wǎng)卡所屬業(yè)務(wù)請求標記為“上網(wǎng)本/上網(wǎng)卡發(fā)起”。經(jīng)過以上過濾,剩下的用戶是使用手機連接PC上網(wǎng)。
在對300個2G小區(qū)抽樣分析中,發(fā)現(xiàn)有22個小區(qū)存在手機連接筆記本上網(wǎng)的情況,占采樣總數(shù)的7. 3%。其中,有以下5個小區(qū)手機連接筆記本上網(wǎng)產(chǎn)生流量較大
小區(qū)名稱手機連接PC上網(wǎng)流量(Kbyte)~
嘉里中心Jl167851. 764
嘉里中心J3140699. 22
北京電視臺南G227788. 538
秀水街大廈M25914. 36怡禾國際大廈M17646. 378應(yīng)重點在手機連接筆記本上網(wǎng)現(xiàn)象較嚴重的小區(qū)進行WLAN網(wǎng)絡(luò)建設(shè)。本發(fā)明實施例通過IMEI和User-Agent關(guān)聯(lián)分析的方法解決了現(xiàn)有技術(shù)中存在的終端類型識別、用戶上網(wǎng)方式識別方面的缺點。與現(xiàn)有技術(shù)相比,本提案存在以下技術(shù)優(yōu)
占-
^ \\\ ·能夠全面地分析和識別網(wǎng)絡(luò)接入過程和業(yè)務(wù)使用過程中,用戶所使用的終端類型、終端品牌、終端型號等信息;能夠準確識別手機終端、上網(wǎng)卡、上網(wǎng)本、手機連接PC等多種用戶上網(wǎng)方式;能夠有效解決用戶修改手機UA信息后,無法通過User-Agent準確識別手機型號的問題。在一個具體的應(yīng)用實例中,某省數(shù)據(jù)業(yè)務(wù)優(yōu)化服務(wù)項目通過采集和分析Gb接口信令,對手機連接PC上網(wǎng)的熱點小區(qū)進行了定位,給運營商提供網(wǎng)絡(luò)建設(shè)和優(yōu)化參考。對2G小區(qū)中手機連接筆記本上網(wǎng)的用戶分布區(qū)域進行了抽樣分析,結(jié)果如圖2所示。本發(fā)明所述的方法并不限于具體實施方式
中所述的實施例,本領(lǐng)域技術(shù)人員根據(jù)本發(fā)明的技術(shù)方案得出其他的實施方式,同樣屬于本發(fā)明的技術(shù)創(chuàng)新范圍。
權(quán)利要求
1.一種基于信令分析的手機連接PC上網(wǎng)識別方法,其特征在于,包括以下步驟 采集移動互聯(lián)網(wǎng)上所有用戶行為的原始數(shù)據(jù),解析所述原始數(shù)據(jù)信令和協(xié)議,獲取終端識別信息,利用所述終端識別信息過濾掉使用手機終端發(fā)起的上網(wǎng)請求以及使用山寨機發(fā)起的上網(wǎng)請求,得到直接使用PC操作系統(tǒng)發(fā)起的上網(wǎng)請求,從所述直接使用PC操作系統(tǒng)發(fā)起的上網(wǎng)請求中進一步過濾掉使用上網(wǎng)本及上網(wǎng)卡發(fā)起的上網(wǎng)請求,剩下的上網(wǎng)請求為使用手機連接PC上網(wǎng)。
2.根據(jù)權(quán)利要求I所述的基于信令分析的手機連接PC上網(wǎng)識別方法,其特征在于,所述采集移動互聯(lián)網(wǎng)上所有用戶行為的原始數(shù)據(jù)的方法包括 使用業(yè)務(wù)交換機鏡像方式采集2G和3G網(wǎng)絡(luò)的Gb或IuPS接口數(shù)據(jù)。
3.根據(jù)權(quán)利要求I或2所述的方法,其特征在于,所述解析原始數(shù)據(jù)信令和協(xié)議的方法包括 對Gb/IuPS接口管理層協(xié)議GMM消息類型為0x13的信令消息進行過濾,并截取該消息的GMM層第9至第20個字節(jié),獲取MEI信息; 對Gb/IuPS接口會話管理SM消息類型為0x10的信令消息進行過濾,并截取該消息中從Od 88兩個字節(jié)向后的第I至第8個字節(jié),獲取IMSI信息;截取該消息中從2b 06兩個字節(jié)向后的第3至第6個字節(jié),獲取用戶的IP地址信息; 識別出HTTP Post和HTTP Get消息,從這兩類消息中截取從55 73到Od Oa之間的字節(jié),為User-Agent信息。
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述過濾掉使用手機終端發(fā)起的上網(wǎng)請求的方法具體包括 如果在用戶發(fā)起的HTTP請求的User-Agent信息中匹配出明確的終端廠商名稱,則將此HTTP請求標記為“手機終端發(fā)起”; 如果在用戶發(fā)起的HTTP請求的User-Agent信息中匹配出手機的操作系統(tǒng),則將此HTTP請求標記為“手機終端發(fā)起”。
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述過濾掉使用山寨機發(fā)起的上網(wǎng)請求的方法具體包括 如果在用戶發(fā)起的HTTP請求的User-Agent信息中匹配出“MAUI WAP Browser”,則將此HTTP請求標記為“山寨機上網(wǎng)用戶發(fā)起”。
6.根據(jù)權(quán)利要求5所述的方法,其特征在于,所述得到直接使用PC操作系統(tǒng)發(fā)起的上網(wǎng)請求的方法具體包括 如果在用戶發(fā)起的HTTP請求的User-Agent信息中匹配出PC的操作系統(tǒng),則該HTTP請求為直接使用PC操作系統(tǒng)發(fā)起的上網(wǎng)請求。
7.根據(jù)權(quán)利要求6所述的方法,其特征在于,所述過濾掉使用上網(wǎng)本及上網(wǎng)卡發(fā)起的上網(wǎng)請求的方法具體包括 根據(jù)用戶發(fā)起的HTTP請求中攜帶的用戶IP地址,通過用戶IP地址關(guān)聯(lián)用戶動態(tài)上下文PDP激活流程,獲取該用戶的IMSI ; 根據(jù)MSI關(guān)聯(lián)附著Attach流程,在用戶發(fā)起的分組鑒權(quán)加密響應(yīng)消息中,獲取設(shè)備的IMEI信息; 將獲取的MEI信息與中國移動終端設(shè)備MEI信息庫進行匹配分析,得到終端類型,將上網(wǎng)本、上網(wǎng)卡所屬的HTTP請求標記為“上網(wǎng)本/上網(wǎng)卡發(fā)起”。
全文摘要
本發(fā)明公開了一種基于信令分析的手機連接PC上網(wǎng)識別方法,屬于移動通信技術(shù)領(lǐng)域,該方法包括采集移動互聯(lián)網(wǎng)上所有用戶行為的原始數(shù)據(jù),解析原始數(shù)據(jù)信令和協(xié)議,獲取終端識別信息,利用終端識別信息過濾掉使用手機終端發(fā)起的上網(wǎng)請求以及使用山寨機發(fā)起的上網(wǎng)請求,得到直接使用PC操作系統(tǒng)發(fā)起的上網(wǎng)請求,進一步過濾掉使用上網(wǎng)本及上網(wǎng)卡發(fā)起的上網(wǎng)請求,剩下的上網(wǎng)請求為使用手機連接PC上網(wǎng)。本發(fā)明通過利用移動網(wǎng)絡(luò)中的HTTP協(xié)議特征,通過采集2/3G網(wǎng)絡(luò)中用戶上網(wǎng)的業(yè)務(wù)流程,并對HTTP協(xié)議中的User-Agent字段進行解析和分析,最后結(jié)合終端特征庫準確判斷發(fā)起業(yè)務(wù)的終端類型。
文檔編號H04L29/08GK102857917SQ20121030715
公開日2013年1月2日 申請日期2012年8月24日 優(yōu)先權(quán)日2012年8月24日
發(fā)明者安斌, 薛翔, 王廣善, 常青 申請人:北京拓明科技有限公司