網(wǎng)絡(luò)流量的數(shù)據(jù)處理方法及裝置的制造方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及互聯(lián)網(wǎng)技術(shù)領(lǐng)域,尤其涉及一種網(wǎng)絡(luò)流量的數(shù)據(jù)處理方法及裝置。
【背景技術(shù)】
[0002] 隨著互聯(lián)網(wǎng)的發(fā)展,越來越多的用戶通過互聯(lián)網(wǎng)查找自己想要的信息,同時(shí)也在 互聯(lián)網(wǎng)上留下大量的用戶行為數(shù)據(jù)。該些數(shù)據(jù)對電子商務(wù)、社區(qū)等類型的網(wǎng)站來說,是一塊 非常有價(jià)值的財(cái)富,但是如何準(zhǔn)確、全面獲取用戶的該些數(shù)據(jù),是一個(gè)比較困難的問題。
[0003]cookie是網(wǎng)站或應(yīng)用程序?yàn)榱吮鎰e用戶身份、進(jìn)行會話session跟蹤、提高訪問 性能而儲存在用戶本地終端上的數(shù)據(jù)?,F(xiàn)有獲取用戶行為數(shù)據(jù)的方法,一般為網(wǎng)站通過網(wǎng) 絡(luò)跟蹤器cookie來進(jìn)行跟蹤和記錄用戶行為,廣告中間商(demandsideplat化rm,DSP)根 據(jù)超文本傳輸協(xié)議(Hype;rtexttransferprotocol,HTTP)協(xié)議采集用戶的cookie數(shù)據(jù), 通過cookie關(guān)聯(lián)數(shù)據(jù),DSP無需知道用戶的手機(jī)號碼,可W避免安全隱私問題。DSP將關(guān)聯(lián) 好的數(shù)據(jù)進(jìn)行用戶數(shù)據(jù)的交易,提供給電子商務(wù)等網(wǎng)站。
[0004] 然而,出于安全性的考慮,cookie只能針對一個(gè)網(wǎng)站域名生效,不同網(wǎng)站之間 不能共享cookie數(shù)據(jù),每個(gè)應(yīng)用程序只能獲取自己的cookie,無法讀取其他應(yīng)用程序的 cookie,而且,cookie不能保持連續(xù),例如:一個(gè)人清除電腦cookie后就不能連續(xù)識別該個(gè) 用戶了。因而現(xiàn)有的方法無法全面了解用戶的行為,無法跟蹤用戶的完整行為。
【發(fā)明內(nèi)容】
[0005] 本發(fā)明提供一種網(wǎng)絡(luò)流量的數(shù)據(jù)處理方法及裝置,能夠完整地跟蹤用戶的行為, 全面了解用戶的行為。
[0006] 本發(fā)明第一方面提供了一種網(wǎng)絡(luò)流量的數(shù)據(jù)處理方法,所述方法包括:
[0007] 從網(wǎng)絡(luò)流量數(shù)據(jù)中獲取超文本傳輸協(xié)議HTTP頭信息和用戶賬戶信息,所述用戶 賬戶信息包括用戶的手機(jī)號碼或者上網(wǎng)賬號;
[0008] 從所述HTTP頭信息中提取用戶訪問的網(wǎng)站的網(wǎng)絡(luò)跟蹤器cookie信息,將所述 cookie信息與所述用戶賬戶信息進(jìn)行關(guān)聯(lián),并保存至用戶信息數(shù)據(jù)庫,其中,一個(gè)所述用戶 賬戶信息與至少一個(gè)網(wǎng)站的所述cookie信息相關(guān)聯(lián)。
[0009] 結(jié)合第一方面,在第一方面的第一種可能的實(shí)施方式中,所述從所述HTTP頭信息 中提取用戶訪問的網(wǎng)站的網(wǎng)絡(luò)跟蹤器cookie信息,具體包括:
[0010] 根據(jù)預(yù)先配置的網(wǎng)站列表,從所述HTTP頭信息中提取所述網(wǎng)站列表中的網(wǎng)站的 所述cookie信息。
[0011] 結(jié)合第一方面或第一方面的第一種可能的實(shí)施方式,在第一方面的第二種可能的 實(shí)施方式中,所述cookie信息包括用戶訪問的網(wǎng)站信息、用戶在訪問的網(wǎng)站中的身份標(biāo)識 cookieID和/或用戶在訪問的網(wǎng)站中的用戶數(shù)據(jù)。
[0012] 結(jié)合第一方面,在第一方面的第H種可能的實(shí)施方式中,在所述從網(wǎng)絡(luò)流量數(shù)據(jù) 中獲取HTTP頭信息和用戶賬戶信息之前,還包括:
[0013] 從所述網(wǎng)絡(luò)流量數(shù)據(jù)中解析得到用戶訪問的網(wǎng)站;
[0014] 驗(yàn)證所述用戶訪問的網(wǎng)站是否已經(jīng)簽訂安全協(xié)議,如果是,則執(zhí)行所述從網(wǎng)絡(luò)流 量數(shù)據(jù)中獲取HTTP頭信息和用戶信息。
[0015] 結(jié)合第一方面,在第一方面的第四種可能的實(shí)施方式中,在所述用戶信息數(shù)據(jù)庫 中,如果多個(gè)所述用戶賬戶信息屬于同一個(gè)用戶,則將屬于同一個(gè)用戶的多個(gè)所述用戶賬 戶信息進(jìn)行關(guān)聯(lián)。
[0016] 結(jié)合第一方面或第一方面的第一種至第四種任一可能的實(shí)施方式,在第一方面的 第五種可能的實(shí)施方式中,所述方法還包括:
[0017] 當(dāng)接收到HTTP請求時(shí),獲取所述HTTP請求中的cookie信息;
[0018] 從所述用戶信息數(shù)據(jù)庫中匹配得到與所述HTTP請求中的cookie信息相關(guān)聯(lián)的用 戶賬戶信息,并提取得到與所述用戶賬戶信息相關(guān)聯(lián)的用戶數(shù)據(jù)。
[0019] 結(jié)合第一方面的第五種可能的實(shí)施方式,在第一方面的第六種可能的實(shí)施方式 中,在所述提取得到與所述用戶賬戶信息相關(guān)聯(lián)的用戶數(shù)據(jù)之后,還包括:
[0020] 將所述用戶數(shù)據(jù)提供給所述HTTP請求中訪問的網(wǎng)站,W便所述網(wǎng)站根據(jù)所述用 戶數(shù)據(jù),將符合該用戶偏好的內(nèi)容組裝成廣告內(nèi)容推送給所述用戶。
[0021] 第二方面,本發(fā)明還提供了一種網(wǎng)絡(luò)流量的數(shù)據(jù)處理裝置,所述裝置包括:
[0022] 第一處理模塊,用于從網(wǎng)絡(luò)流量數(shù)據(jù)中獲取HTTP頭信息和用戶賬戶信息,所述用 戶賬戶信息包括用戶的手機(jī)號碼或者上網(wǎng)賬號;
[0023] 信息提取模塊,用于從所述第一處理模塊獲取的所述HTTP頭信息中提取網(wǎng)絡(luò)跟 蹤器cookief旨息;
[0024] 信息管理模塊,用于將所述信息提取模塊提取的所述cookie信息與所述第一處 理模塊獲取的所述用戶賬戶信息進(jìn)行關(guān)聯(lián),并保存至用戶信息數(shù)據(jù)庫,其中,一個(gè)所述用戶 賬戶信息與至少一個(gè)所述cookie信息相關(guān)聯(lián)。
[0025] 結(jié)合第二方面,在第二方面的第一種可能的實(shí)施方式中,所述信息提取模塊具體 用于根據(jù)預(yù)先配置的網(wǎng)站列表,從所述第一處理模塊獲取的所述HTTP頭信息中提取所述 網(wǎng)站列表中的網(wǎng)站的所述cookie信息。
[0026] 結(jié)合第二方面或第二方面的第一種可能的實(shí)施方式,在第二方面的第二種可能的 實(shí)施方式中,所述cookie信息包括用戶訪問的網(wǎng)站信息、用戶在訪問的網(wǎng)站中的身份標(biāo)識 cookieID和/或用戶在訪問的網(wǎng)站中的用戶數(shù)據(jù)。
[0027] 結(jié)合第二方面,在第二方面的第H種可能的實(shí)施方式中,所述第一處理模塊還用 于從所述網(wǎng)絡(luò)流量數(shù)據(jù)中解析得到用戶訪問的網(wǎng)站;
[0028] 所述裝置還包括:
[0029] 驗(yàn)證模塊,用于驗(yàn)證所述第一處理模塊解析得到的所述用戶訪問的網(wǎng)站是否已經(jīng) 簽訂安全協(xié)議,如果是,則進(jìn)入所述信息提取模塊。
[0030] 結(jié)合第二方面,在第二方面的第四種可能的實(shí)施方式中,所述信息管理模塊還用 于判斷所述用戶信息數(shù)據(jù)庫中的多個(gè)所述用戶賬戶信息是否屬于同一個(gè)用戶,如果多個(gè) 所述用戶賬戶信息屬于同一個(gè)用戶,則將屬于同一個(gè)用戶的多個(gè)所述用戶賬戶信息進(jìn)行關(guān) 聯(lián)。
[0031] 結(jié)合第二方面或第二方面的第一種至第四種任一可能的實(shí)施方式,在第二方面的 第五種可能的實(shí)施方式中,所述裝置還包括:
[0032] 第二處理模塊,用于當(dāng)接收到HTTP請求時(shí),獲取所述HTTP請求中的cookie信息;
[0033] 匹配模塊,用于從所述用戶信息數(shù)據(jù)庫中匹配得到與所述第二處理模塊獲取的所 述cookie信息相關(guān)聯(lián)的用戶賬戶信息,并提取得到與所述用戶賬戶信息相關(guān)聯(lián)的用戶數(shù) 據(jù)。
[0034] 結(jié)合第二方面的第五種可能的實(shí)施方式,在第二方面的第六種可能的實(shí)施方式 中,所述裝置還包括:
[0035] 發(fā)送模塊,用于將所述匹配模塊得到的所述用戶數(shù)據(jù)提供給所述HTTP請求中訪 問的網(wǎng)站,W便所述網(wǎng)站根據(jù)所述匹配模塊得到的所述用戶數(shù)據(jù),將符合該用戶偏好的內(nèi) 容組裝成廣告內(nèi)容推送給所述用戶。
[0036] 本發(fā)明提供的網(wǎng)絡(luò)流量的數(shù)據(jù)處理方法及裝置,通過解析用戶的HTTP流量數(shù)據(jù), 從網(wǎng)絡(luò)流量數(shù)據(jù)中針對不同網(wǎng)站提取網(wǎng)站的cookie,將cookie信息與用戶手機(jī)號碼或上 網(wǎng)賬號相關(guān)聯(lián),根據(jù)手機(jī)號碼或上網(wǎng)賬號從用戶數(shù)據(jù)庫中找出不同網(wǎng)站的任意cookie對 應(yīng)的用戶數(shù)據(jù),可W更完整、準(zhǔn)確地收集用戶行為數(shù)據(jù)。
【附圖說明】
[0037] 圖1是本發(fā)明實(shí)施例一提供的網(wǎng)絡(luò)流量的數(shù)據(jù)處理的一種應(yīng)用場景;
[0038] 圖2為本發(fā)明實(shí)施例一提供的網(wǎng)絡(luò)流量的數(shù)據(jù)處理方法流程圖;
[0039] 圖3為本發(fā)明實(shí)施例一提供的網(wǎng)絡(luò)流量的數(shù)據(jù)處理方法流程圖;
[0040] 圖4為本發(fā)明實(shí)施例二提供的網(wǎng)絡(luò)流量的數(shù)據(jù)處理裝置示意圖;
[0041] 圖5為本發(fā)明實(shí)施例二提供的網(wǎng)絡(luò)流量的數(shù)據(jù)處理裝置示意圖;
[0042] 圖6是本發(fā)明實(shí)施例H提供的網(wǎng)絡(luò)流量的數(shù)據(jù)處理裝置的組成結(jié)構(gòu)示意圖。
【具體實(shí)施方式】
[0043] 下面通過附圖和實(shí)施例,對本發(fā)明的技術(shù)方案做進(jìn)一步的詳細(xì)描述。
[0044] 本發(fā)明實(shí)施例提供的網(wǎng)絡(luò)流量的數(shù)據(jù)處理方法及裝置,適用于需要收集用戶互聯(lián) 網(wǎng)行為數(shù)據(jù)、獲取用戶偏好的場合,可W用于網(wǎng)絡(luò)運(yùn)營商、互聯(lián)網(wǎng)服務(wù)提供商(ISP)等的網(wǎng) 關(guān)設(shè)備中,如深度數(shù)據(jù)包檢測(Deep Packet Inspection, DPI)等流量檢測設(shè)備或模塊,尤 其適用于網(wǎng)絡(luò)運(yùn)營商收集用戶數(shù)據(jù)。運(yùn)營商作為互聯(lián)網(wǎng)接入的唯一管道,通過運(yùn)營商的網(wǎng) 關(guān)設(shè)備可W獲取所有用戶的流量數(shù)據(jù),對該些流量數(shù)據(jù)進(jìn)行處理可W得到較為完整、準(zhǔn)確 的用戶偏好數(shù)據(jù),供W電子商務(wù)等網(wǎng)站提供較為準(zhǔn)確的個(gè)性化推薦的廣