網(wǎng)絡(luò)行為日志時(shí)間校正方法和裝置的制造方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及互聯(lián)網(wǎng)領(lǐng)域,尤其涉及一種網(wǎng)絡(luò)行為日志時(shí)間校正方法和裝置。
【背景技術(shù)】
[0002] 在互聯(lián)網(wǎng)應(yīng)用領(lǐng)域,網(wǎng)絡(luò)媒體經(jīng)常需要互聯(lián)網(wǎng)數(shù)據(jù)公司使用技術(shù)手段收集用戶行 為數(shù)據(jù)。例如用戶訪問的網(wǎng)頁,用戶在該網(wǎng)頁中的行為類型,用戶訪問該網(wǎng)頁的時(shí)間等。對(duì) 這些網(wǎng)絡(luò)行為數(shù)據(jù)進(jìn)行分析并分類,以日志的形式保存。通過分析這些數(shù)據(jù)不斷地改進(jìn)網(wǎng) 絡(luò)媒體的服務(wù),例如更新媒體的網(wǎng)站和軟件,或是通過這些數(shù)據(jù)進(jìn)行網(wǎng)絡(luò)活動(dòng)的監(jiān)測(cè)等。
[0003] 在這些數(shù)據(jù)中,用戶行為時(shí)間數(shù)據(jù)不同于其他行為數(shù)據(jù)。多種外界因素可導(dǎo)致行 為時(shí)間數(shù)據(jù)的采集出現(xiàn)誤差。例如,一個(gè)用戶在訪問互聯(lián)網(wǎng)的網(wǎng)頁時(shí),不同的監(jiān)測(cè)系統(tǒng)所監(jiān) 測(cè)到的時(shí)間信息可能存在差異。系統(tǒng)產(chǎn)生的行為日志記錄的既有可能是客戶端的當(dāng)前時(shí) 間,亦有可能是服務(wù)器的當(dāng)前時(shí)間。對(duì)于互聯(lián)網(wǎng)用戶的網(wǎng)絡(luò)行為,若監(jiān)測(cè)系統(tǒng)沒有讀取客戶 端時(shí)間的權(quán)限,則此監(jiān)測(cè)系統(tǒng)無法記錄網(wǎng)絡(luò)行為發(fā)生時(shí)的客戶端時(shí)間;而如果一個(gè)監(jiān)測(cè)系 統(tǒng)無法在用戶行為發(fā)生時(shí)即時(shí)地向服務(wù)器發(fā)送日志數(shù)據(jù),而是采用延后傳輸?shù)姆绞剑瑒t此 監(jiān)測(cè)系統(tǒng)無法記錄網(wǎng)絡(luò)行為發(fā)生時(shí)的服務(wù)器時(shí)間。一般而言,用戶客戶端的當(dāng)前時(shí)間會(huì)由 于客戶所在地域,或人為修改等原因而與服務(wù)器的當(dāng)前時(shí)間不一致。由于這個(gè)因素導(dǎo)致收 集到的行為時(shí)間數(shù)據(jù)的誤差,會(huì)嚴(yán)重影響數(shù)據(jù)分析的準(zhǔn)確度。錯(cuò)誤的行為時(shí)間收集會(huì)導(dǎo)致 數(shù)據(jù)匹配不統(tǒng)一,或網(wǎng)絡(luò)行為分類錯(cuò)誤,進(jìn)而誤導(dǎo)媒體進(jìn)行互聯(lián)網(wǎng)服務(wù)系統(tǒng)更新的方向,產(chǎn) 生利益損害。
[0004] 目前現(xiàn)有的時(shí)間對(duì)齊技術(shù)主要通過數(shù)據(jù)包傳輸對(duì)客戶端時(shí)間進(jìn)行校正??蛻舳?發(fā)送請(qǐng)求從服務(wù)器端獲取服務(wù)器的當(dāng)前時(shí)間,并根據(jù)這個(gè)時(shí)間和自身的當(dāng)前時(shí)間之間的差 值,對(duì)自身的當(dāng)前時(shí)間進(jìn)行調(diào)整。通常,網(wǎng)絡(luò)行為的監(jiān)測(cè)系統(tǒng)并不具有修改客戶端時(shí)間的權(quán) 限。同時(shí),以監(jiān)測(cè)為目的的系統(tǒng)也不應(yīng)該隨意修改客戶端時(shí)間。因此,我們急需一種技術(shù)手 段來解決在不修改客戶端時(shí)間的情況下,自動(dòng)校正日志中的行為訪問時(shí)間的問題。
【發(fā)明內(nèi)容】
[0005] 本發(fā)明提供了一種網(wǎng)絡(luò)行為日志時(shí)間校正方法和裝置,解決了校正日志中的行為 訪問時(shí)間的問題。
[0006] -種網(wǎng)絡(luò)行為日志時(shí)間校正方法,包括;
[0007] 服務(wù)器采集接收到的日志數(shù)據(jù)包的時(shí)間數(shù)據(jù)信息,所述時(shí)間數(shù)據(jù)信息包括用戶行 為發(fā)生時(shí)客戶端的時(shí)間、客戶端上傳所述數(shù)據(jù)包的日志上傳時(shí)客戶端時(shí)間和服務(wù)器日志上 傳時(shí)間;
[0008] 將所述用戶行為發(fā)生時(shí)客戶端的時(shí)間轉(zhuǎn)換為用戶行為發(fā)生時(shí)服務(wù)器的時(shí)間;
[0009] 根據(jù)所述服務(wù)器和標(biāo)準(zhǔn)服務(wù)器之間的時(shí)間差,將所述用戶行為發(fā)生時(shí)服務(wù)器的時(shí) 間轉(zhuǎn)化得到日志的標(biāo)準(zhǔn)時(shí)間。
[0010] 優(yōu)選的,所述采集服務(wù)器接收到的日志數(shù)據(jù)包的時(shí)間數(shù)據(jù)信息的步驟之前,還包 括:
[0011] 客戶端采集樣本日志數(shù)據(jù)包,所述樣本日志數(shù)據(jù)包包括用戶網(wǎng)絡(luò)活動(dòng)時(shí)的用戶機(jī) ID、訪問頁面和用戶行為發(fā)生時(shí)客戶端的時(shí)間;
[0012] 所述客戶端將所述樣本日志數(shù)據(jù)包以日志數(shù)據(jù)包的形式上傳至所述服務(wù)器;
[0013] 所述服務(wù)器接收到所述日志數(shù)據(jù)包時(shí),為所述日志數(shù)據(jù)包附上所述服務(wù)器當(dāng)前的 本地時(shí)間,作為日志上傳時(shí)服務(wù)器時(shí)間。
[0014] 優(yōu)選的,該方法還包括:
[0015] 所述服務(wù)器存儲(chǔ)接收到的日志數(shù)據(jù)包。
[0016] 優(yōu)選的,將所述用戶行為發(fā)生時(shí)客戶端的時(shí)間轉(zhuǎn)換為用戶行為發(fā)生時(shí)服務(wù)器的時(shí) 間包括:
[0017] 提取用戶行為發(fā)生時(shí)客戶端的時(shí)間,記做客戶端日志時(shí)間;
[0018] 提取行為日志上傳時(shí)的服務(wù)器時(shí)間,記做服務(wù)器日志上傳時(shí)間;
[0019] 提取所述行為日志上傳時(shí)客戶端的時(shí)間,記做客戶端日志上傳時(shí)間;
[0020] 根據(jù)以下表達(dá)式計(jì)算服務(wù)器日志時(shí)間:
[0021] 服務(wù)器日志時(shí)間=客戶端日志時(shí)間+服務(wù)器日志上傳時(shí)間-客戶端日志上傳時(shí) 間;
[0022] 提取所述服務(wù)器日志時(shí)間,并將所述服務(wù)器日志時(shí)間存儲(chǔ)于日志數(shù)據(jù)包中。
[0023] 優(yōu)選的,所述根據(jù)所述服務(wù)器和標(biāo)準(zhǔn)服務(wù)器之間的時(shí)間差,將所述用戶行為發(fā)生 時(shí)服務(wù)器的時(shí)間轉(zhuǎn)化得到日志的標(biāo)準(zhǔn)時(shí)間包括:
[0024] 采集標(biāo)準(zhǔn)服務(wù)器及所述服務(wù)器的當(dāng)前時(shí)間,作為臨時(shí)數(shù)據(jù),存儲(chǔ)于日志數(shù)據(jù)包 中;
[0025]提取所述服務(wù)器日志時(shí)間;
[0026] 利用以下表達(dá)式計(jì)算日志標(biāo)準(zhǔn)時(shí)間:
[0027] 日志標(biāo)準(zhǔn)時(shí)間=服務(wù)器日志時(shí)間+標(biāo)準(zhǔn)服務(wù)器時(shí)間一服務(wù)器時(shí)間;
[0028] 提取所述日志標(biāo)準(zhǔn)時(shí)間,并將所述日志標(biāo)準(zhǔn)時(shí)間存儲(chǔ)于日志數(shù)據(jù)包中;
[0029] 從日志數(shù)據(jù)包中刪除標(biāo)準(zhǔn)服務(wù)器時(shí)間及存儲(chǔ)服務(wù)器時(shí)間。
[0030] 本發(fā)明還提供了一種網(wǎng)絡(luò)行為日志時(shí)間校正裝置,包括:
[0031] 數(shù)據(jù)信息采集模塊,用于采集接收到的日志數(shù)據(jù)包的時(shí)間數(shù)據(jù)信息,所述時(shí)間數(shù) 據(jù)信息包括用戶行為發(fā)生時(shí)客戶端的時(shí)間、客戶端上傳所述數(shù)據(jù)包的日志上傳時(shí)客戶端時(shí) 間和服務(wù)器日志上傳時(shí)間;
[0032] 第一時(shí)間轉(zhuǎn)換模塊,用于將所述用戶行為發(fā)生時(shí)客戶端的時(shí)間轉(zhuǎn)換為用戶行為發(fā) 生時(shí)服務(wù)器的時(shí)間;
[0033] 第二時(shí)間轉(zhuǎn)換模塊,用于根據(jù)服務(wù)器和標(biāo)準(zhǔn)服務(wù)器之間的時(shí)間差,將所述用戶行 為發(fā)生時(shí)服務(wù)器的時(shí)間轉(zhuǎn)化得到日志的標(biāo)準(zhǔn)時(shí)間。
[0034] 優(yōu)選的,該裝置還包括:
[0035]日志上傳時(shí)服務(wù)器時(shí)間標(biāo)定模塊,用于在接收到客戶端上傳的日志數(shù)據(jù)包時(shí),為 所述日志數(shù)據(jù)包附上所述服務(wù)器當(dāng)前的本地時(shí)間,作為日志上傳時(shí)服務(wù)器時(shí)間。
[0036] 優(yōu)選的,該裝置還包括:
[0037] 存儲(chǔ)模塊,用于存儲(chǔ)接收到的日志數(shù)據(jù)包。
[0038] 優(yōu)選的,所述第一時(shí)間轉(zhuǎn)換模塊包括:
[0039] 客戶端日志時(shí)間提取單元,用于提取用戶行為發(fā)生時(shí)客戶端的時(shí)間,記做客戶端 日志時(shí)間;
[0040] 服務(wù)器日志上傳時(shí)間提取單元,用于提取行為日志上傳時(shí)的服務(wù)器時(shí)間,記做服 務(wù)器日志上傳時(shí)間;
[0041] 客戶端日志上傳時(shí)間提取單元,用于提取所述行為日志上傳時(shí)客戶端的時(shí)間,記 做客戶端日志上傳時(shí)間;
[0042] 服務(wù)器日志時(shí)間計(jì)算單元,用于根據(jù)以下表達(dá)式計(jì)算服務(wù)器日志時(shí)間:
[0043] 服務(wù)器日志時(shí)間=客戶端日志時(shí)間+服務(wù)器日志上傳時(shí)間-客戶端日志上傳時(shí) 間;
[0044] 服務(wù)器日志時(shí)間存儲(chǔ)單元,用于提取所述服務(wù)器日志時(shí)間,并將所述服務(wù)器日志 時(shí)間存儲(chǔ)于日志數(shù)據(jù)包中。
[0045] 優(yōu)選的,所述第二時(shí)間轉(zhuǎn)換模塊包括:
[0046] 臨時(shí)數(shù)據(jù)采集單元,用于采集標(biāo)準(zhǔn)服務(wù)器及所述服務(wù)器的當(dāng)前時(shí)間,作為臨時(shí)數(shù) 據(jù),存儲(chǔ)于日志數(shù)據(jù)包中;
[0047] 服務(wù)器日志時(shí)間提取單元,用于提取所述服務(wù)器日志時(shí)間;
[0048] 日志標(biāo)準(zhǔn)時(shí)間計(jì)算單元,用于利用以下表達(dá)式計(jì)算日志標(biāo)準(zhǔn)時(shí)間:
[0049] 日志標(biāo)準(zhǔn)時(shí)間=服務(wù)器日志時(shí)間+標(biāo)準(zhǔn)服務(wù)器時(shí)間一服務(wù)器時(shí)間;
[0050] 日志標(biāo)準(zhǔn)時(shí)間提取單元,用于提取所述日志標(biāo)準(zhǔn)時(shí)間,并將所述日志標(biāo)準(zhǔn)時(shí)間存 儲(chǔ)于日志數(shù)據(jù)包中;
[0051] 數(shù)據(jù)清除單元,用于從日志數(shù)據(jù)包中刪除標(biāo)準(zhǔn)服務(wù)器時(shí)間及存儲(chǔ)服務(wù)器時(shí)間。
[0052] 本發(fā)明提供了一種網(wǎng)絡(luò)行為日志時(shí)間校正方法和裝置,服務(wù)器采集接收到的日志 數(shù)據(jù)包的時(shí)間數(shù)據(jù)信息,所述時(shí)間數(shù)據(jù)信息包括用戶行為發(fā)生時(shí)客戶端的時(shí)間、客戶端上 傳所述數(shù)據(jù)包的日志上傳時(shí)客戶端時(shí)間和服務(wù)器日志上傳時(shí)間,將所述用戶行為發(fā)生時(shí)客 戶端的時(shí)間轉(zhuǎn)換為用戶行為發(fā)生時(shí)服務(wù)器的時(shí)間,根據(jù)所述服務(wù)器和標(biāo)準(zhǔn)服務(wù)器之間的時(shí) 間差,將所述用戶行為發(fā)生時(shí)服務(wù)器的時(shí)間轉(zhuǎn)化得到日志的標(biāo)準(zhǔn)時(shí)間,實(shí)現(xiàn)了在不修改客 戶端時(shí)間的前提下對(duì)日志中的行為訪問時(shí)間進(jìn)行校正,使得不同來源的日志數(shù)據(jù)中的時(shí)間 信息統(tǒng)一到一個(gè)標(biāo)準(zhǔn)的時(shí)間軸上,解決了校正日志中的行為訪問時(shí)間的問題。
【附圖說明】
[0053] 圖1為本發(fā)明的實(shí)施例一提供的一種網(wǎng)絡(luò)行為日志時(shí)間校正方法的流程圖;
[0054] 圖2為本發(fā)明的實(shí)施例三提供的一種網(wǎng)絡(luò)行為日志時(shí)間校正裝置的結(jié)構(gòu)示意圖;
[0055] 圖3為圖2中第一時(shí)間轉(zhuǎn)換模塊202的結(jié)構(gòu)示意圖;
[0056] 圖4為圖2中第二時(shí)間轉(zhuǎn)換模塊203的結(jié)構(gòu)示意圖。
【具體實(shí)施方式】
[0057]目前現(xiàn)有的時(shí)間對(duì)齊技術(shù)主要通過數(shù)據(jù)包傳輸對(duì)客戶端時(shí)間進(jìn)行校正。客戶端 發(fā)送請(qǐng)求從服務(wù)器端獲取服務(wù)器的當(dāng)前時(shí)間,并根據(jù)這個(gè)時(shí)間和自身的當(dāng)前時(shí)間之間的差 值,對(duì)自身的當(dāng)前時(shí)間進(jìn)行調(diào)整。通常,網(wǎng)絡(luò)行為的監(jiān)測(cè)系統(tǒng)并不具有修改客戶端時(shí)間的權(quán) 限。同時(shí),以監(jiān)測(cè)為目的的系統(tǒng)也不應(yīng)該隨意修改客戶端時(shí)間。因此,我們急需一種技術(shù)手 段來解決在不修改客戶端時(shí)間的情況下,自動(dòng)校正日志中的行為訪問時(shí)間的問題。
[0058] 為了解決上述問題,本發(fā)明的實(shí)施例提供了一種網(wǎng)絡(luò)行為日志時(shí)間校正方法。下 文中將結(jié)合附圖對(duì)本發(fā)明的實(shí)施例進(jìn)行詳細(xì)說明。需要說明的是,在不沖突的情況下,本申 請(qǐng)中的實(shí)施例及實(shí)施例中的特征可以相互任意組合。
[0059] 本發(fā)明的實(shí)施例提供了一種網(wǎng)絡(luò)行為日志時(shí)間校正方法。首先采集樣本日志數(shù)據(jù) 包,然后統(tǒng)計(jì)所述樣本日志數(shù)據(jù)包中的時(shí)間信息,其中包括網(wǎng)絡(luò)行為發(fā)生時(shí),用戶客戶端的 當(dāng)前時(shí)間,以及用戶行為數(shù)據(jù)上傳服務(wù)器時(shí),攜帶的客戶端的當(dāng)前時(shí)間。通過時(shí)間差補(bǔ)償?shù)?方法,將各個(gè)數(shù)據(jù)源時(shí)間映射到統(tǒng)一的標(biāo)準(zhǔn)服務(wù)器時(shí)間軸上,從達(dá)到通過標(biāo)準(zhǔn)時(shí)間進(jìn)行不 同日志的時(shí)間對(duì)齊。
[0060] 下面結(jié)合附圖,對(duì)本發(fā)明的實(shí)施例一進(jìn)行說明。
[0061] 本發(fā)明實(shí)施例提出了一種網(wǎng)絡(luò)行為日志時(shí)間校正方法,使用該方法完成對(duì)日志時(shí) 間校正的流程如圖1所示,包括:
[0062] 步驟101、客戶端采集樣本日志數(shù)據(jù)包;
[0063] 本步驟中,采集用戶客戶端數(shù)據(jù)源的時(shí)間數(shù)據(jù)及服務(wù)器端的時(shí)間數(shù)據(jù)。
[0064] 具體的,通過在網(wǎng)絡(luò)行為發(fā)生的網(wǎng)頁中、訪問頁面中的Flash動(dòng)畫、JavaScript腳 本中嵌入代碼,也可以在用戶機(jī)瀏覽器上安裝插件,亦或是在客戶端植入模塊等技術(shù)方案, 收集到用戶網(wǎng)絡(luò)活動(dòng)的一組數(shù)據(jù),其中包括用戶機(jī)ID、訪問頁面、用戶行為發(fā)生時(shí)客戶端的 當(dāng)前時(shí)間等。
[0065]