本申請(qǐng)涉及互聯(lián)網(wǎng)領(lǐng)域,具體而言,涉及一種轉(zhuǎn)載回流數(shù)據(jù)的檢測(cè)方法和裝置。
背景技術(shù):
網(wǎng)站的轉(zhuǎn)載回流指的是網(wǎng)民通過(guò)點(diǎn)擊其它網(wǎng)站對(duì)該網(wǎng)站的內(nèi)容引用或轉(zhuǎn)載鏈接,來(lái)到目標(biāo)網(wǎng)站,在相關(guān)技術(shù),一般采用分享插件的形式將網(wǎng)站內(nèi)容分享出去,由于每次進(jìn)行分享的統(tǒng)一資源定位符(即URL)都會(huì)包含特定的參數(shù),這樣,其它用戶通過(guò)分享的URL訪問(wèn)網(wǎng)站時(shí),網(wǎng)站服務(wù)器均會(huì)識(shí)別出URL中的特定參數(shù),從而記錄這次訪問(wèn)的數(shù)據(jù)為一次有效的回流數(shù)據(jù)。
目前,大部分網(wǎng)站都需要統(tǒng)計(jì)網(wǎng)站的轉(zhuǎn)載回流數(shù)據(jù),網(wǎng)站的轉(zhuǎn)載回流數(shù)據(jù)是統(tǒng)計(jì)網(wǎng)站在互聯(lián)網(wǎng)中影響力的重要指標(biāo),在實(shí)際應(yīng)用中,有的網(wǎng)站由于包含敏感性信息而不適合嵌入上述分享插件,且當(dāng)該網(wǎng)站被以一些其它形式(即不是通過(guò)分享插件進(jìn)行分享或者轉(zhuǎn)載)分享時(shí),由于分享的URL中不包含上述的特定的參數(shù),當(dāng)用戶通過(guò)分享的URL訪問(wèn)該網(wǎng)站時(shí),這次訪問(wèn)的數(shù)據(jù)就不會(huì)被認(rèn)為是有效的回流數(shù)據(jù),從而造成統(tǒng)計(jì)數(shù)據(jù)不準(zhǔn)確。
針對(duì)相關(guān)技術(shù)中檢測(cè)網(wǎng)站回流數(shù)據(jù)的準(zhǔn)確度較低的技術(shù)問(wèn)題,目前尚未提出有效的解決方案。
技術(shù)實(shí)現(xiàn)要素:
本申請(qǐng)實(shí)施例提供了一種轉(zhuǎn)載回流數(shù)據(jù)的檢測(cè)方法和裝置,以至少解決相關(guān)技術(shù)中檢測(cè)網(wǎng)站回流數(shù)據(jù)的準(zhǔn)確度較低的技術(shù)問(wèn)題。
根據(jù)本申請(qǐng)實(shí)施例的一個(gè)方面,提供了一種轉(zhuǎn)載回流數(shù)據(jù)的檢測(cè)方法,該檢測(cè)方法包括:獲取第一網(wǎng)站的地址,其中,第一網(wǎng)站設(shè)置有第二網(wǎng)站的鏈接;獲取經(jīng)由鏈接訪問(wèn)第二網(wǎng)站產(chǎn)生的訪問(wèn)數(shù)據(jù);根據(jù)第一網(wǎng)站的地址判斷第一網(wǎng)站是否在預(yù)設(shè)網(wǎng)站集合內(nèi);如果判斷出第一網(wǎng)站不在預(yù)設(shè)網(wǎng)站集合內(nèi),則確定訪問(wèn)數(shù)據(jù)為轉(zhuǎn)載回流數(shù)據(jù)。
進(jìn)一步地,根據(jù)第一網(wǎng)站的地址判斷第一網(wǎng)站是否在預(yù)設(shè)網(wǎng)站集合內(nèi)包括:解析第一網(wǎng)站的地址,得到第一網(wǎng)站的域名標(biāo)識(shí);獲取預(yù)設(shè)網(wǎng)站集合內(nèi)網(wǎng)站的域名標(biāo)識(shí); 判斷預(yù)設(shè)網(wǎng)站集合內(nèi)是否存在域名標(biāo)識(shí)與第一網(wǎng)站的域名標(biāo)識(shí)相匹配的網(wǎng)站,其中,如果判斷出預(yù)設(shè)網(wǎng)站集合內(nèi)不存在域名標(biāo)識(shí)與第一網(wǎng)站的域名標(biāo)識(shí)相匹配的網(wǎng)站,則確定第一網(wǎng)站不在預(yù)設(shè)網(wǎng)站集合內(nèi)。
進(jìn)一步地,訪問(wèn)數(shù)據(jù)記錄有第二網(wǎng)站中被訪問(wèn)過(guò)的網(wǎng)頁(yè)地址,其中,如果判斷出第一網(wǎng)站不在預(yù)設(shè)網(wǎng)站集合內(nèi),則該檢測(cè)方法還包括:從訪問(wèn)數(shù)據(jù)中獲取網(wǎng)頁(yè)地址;判斷通過(guò)網(wǎng)頁(yè)地址所訪問(wèn)的網(wǎng)頁(yè)是否為第二網(wǎng)站的網(wǎng)站首頁(yè)或者欄目首頁(yè),其中,如果判斷出網(wǎng)頁(yè)地址所訪問(wèn)的網(wǎng)頁(yè)不為第二網(wǎng)站的網(wǎng)站首頁(yè)或者欄目首頁(yè),則確定訪問(wèn)數(shù)據(jù)為轉(zhuǎn)載回流數(shù)據(jù)。
進(jìn)一步地,訪問(wèn)數(shù)據(jù)還記錄有通過(guò)鏈接訪問(wèn)第二網(wǎng)站的用戶的ID,其中,在確定訪問(wèn)數(shù)據(jù)為轉(zhuǎn)載回流數(shù)據(jù)之后,該檢測(cè)方法還包括:從訪問(wèn)數(shù)據(jù)中獲取用戶的ID;判斷預(yù)設(shè)數(shù)據(jù)庫(kù)中是否存在與用戶的ID相匹配的預(yù)存用戶ID,其中,預(yù)設(shè)數(shù)據(jù)庫(kù)用于存儲(chǔ)已統(tǒng)計(jì)的轉(zhuǎn)載回流數(shù)據(jù)、預(yù)存用戶ID以及已統(tǒng)計(jì)的轉(zhuǎn)載回流數(shù)據(jù)與預(yù)存用戶ID的對(duì)應(yīng)關(guān)系;如果判斷出預(yù)設(shè)數(shù)據(jù)庫(kù)中不存在與用戶的ID相匹配的預(yù)存用戶ID,則將訪問(wèn)數(shù)據(jù)、用戶的ID以及訪問(wèn)數(shù)據(jù)與用戶的ID的對(duì)應(yīng)關(guān)系存入預(yù)設(shè)數(shù)據(jù)庫(kù)。
進(jìn)一步地,獲取第一網(wǎng)站的地址包括:獲取經(jīng)由第一網(wǎng)站訪問(wèn)第二網(wǎng)站的訪問(wèn)日志,其中,訪問(wèn)日志用于存儲(chǔ)通過(guò)第二網(wǎng)站的追蹤插件獲取到的訪問(wèn)數(shù)據(jù);從訪問(wèn)數(shù)據(jù)中獲取第一網(wǎng)站的地址。
根據(jù)本申請(qǐng)實(shí)施例的另一方面,還提供了一種轉(zhuǎn)載回流數(shù)據(jù)的檢測(cè)裝置,該檢測(cè)裝置包括:第一獲取單元,用于獲取第一網(wǎng)站的地址,其中,第一網(wǎng)站設(shè)置有第二網(wǎng)站的鏈接;第二獲取單元,用于獲取經(jīng)由鏈接訪問(wèn)第二網(wǎng)站產(chǎn)生的訪問(wèn)數(shù)據(jù);第一判斷單元,用于根據(jù)第一網(wǎng)站的地址判斷第一網(wǎng)站是否在預(yù)設(shè)網(wǎng)站集合內(nèi);確定單元,用于當(dāng)?shù)谝慌袛鄦卧袛喑龅谝痪W(wǎng)站不在預(yù)設(shè)網(wǎng)站集合內(nèi)時(shí),確定訪問(wèn)數(shù)據(jù)為轉(zhuǎn)載回流數(shù)據(jù)。
進(jìn)一步地,第一判斷單元包括:解析模塊,用于解析第一網(wǎng)站的地址,得到第一網(wǎng)站的域名標(biāo)識(shí);域名獲取模塊,用于獲取預(yù)設(shè)網(wǎng)站集合內(nèi)網(wǎng)站的域名標(biāo)識(shí);判斷模塊,用于判斷預(yù)設(shè)網(wǎng)站集合內(nèi)是否存在域名標(biāo)識(shí)與第一網(wǎng)站的域名標(biāo)識(shí)相匹配的網(wǎng)站,其中,如果判斷出預(yù)設(shè)網(wǎng)站集合內(nèi)不存在域名標(biāo)識(shí)與第一網(wǎng)站的域名標(biāo)識(shí)相匹配的網(wǎng)站,則確定第一網(wǎng)站不在預(yù)設(shè)網(wǎng)站集合內(nèi)。
進(jìn)一步地,訪問(wèn)數(shù)據(jù)記錄有第二網(wǎng)站中被訪問(wèn)過(guò)的網(wǎng)頁(yè)地址,該檢測(cè)裝置還包括:第三獲取單元,用于當(dāng)?shù)谝慌袛鄦卧袛喑龅谝痪W(wǎng)站不在預(yù)設(shè)網(wǎng)站集合內(nèi)時(shí),從訪問(wèn)數(shù)據(jù)中獲取網(wǎng)頁(yè)地址;第二判斷單元,用于判斷通過(guò)網(wǎng)頁(yè)地址所訪問(wèn)的網(wǎng)頁(yè)是否為第 二網(wǎng)站的網(wǎng)站首頁(yè)或者欄目首頁(yè),其中,確定單元還用于當(dāng)?shù)诙袛鄦卧袛喑鼍W(wǎng)頁(yè)地址所訪問(wèn)的網(wǎng)頁(yè)不為第二網(wǎng)站的網(wǎng)站首頁(yè)或者欄目首頁(yè)時(shí),確定訪問(wèn)數(shù)據(jù)為轉(zhuǎn)載回流數(shù)據(jù)。
進(jìn)一步地,訪問(wèn)數(shù)據(jù)還記錄有通過(guò)鏈接訪問(wèn)第二網(wǎng)站的用戶的ID,該檢測(cè)裝置還包括:標(biāo)識(shí)獲取單元,用于在確定訪問(wèn)數(shù)據(jù)為轉(zhuǎn)載回流數(shù)據(jù)之后,從訪問(wèn)數(shù)據(jù)中獲取用戶的ID;標(biāo)識(shí)判斷單元,用于判斷預(yù)設(shè)數(shù)據(jù)庫(kù)中是否存在與用戶的ID相匹配的預(yù)存用戶ID,其中,預(yù)設(shè)數(shù)據(jù)庫(kù)用于存儲(chǔ)已統(tǒng)計(jì)的轉(zhuǎn)載回流數(shù)據(jù)、預(yù)存用戶ID以及已統(tǒng)計(jì)的轉(zhuǎn)載回流數(shù)據(jù)與預(yù)存用戶ID的對(duì)應(yīng)關(guān)系;處理單元,用于如果判斷出預(yù)設(shè)數(shù)據(jù)庫(kù)中不存在與用戶的ID相匹配的預(yù)存用戶ID,則將訪問(wèn)數(shù)據(jù)、用戶的ID以及訪問(wèn)數(shù)據(jù)與用戶的ID的對(duì)應(yīng)關(guān)系存入預(yù)設(shè)數(shù)據(jù)庫(kù)。
進(jìn)一步地,第一獲取單元包括:日志獲取模塊,用于獲取經(jīng)由第一網(wǎng)站訪問(wèn)第二網(wǎng)站的訪問(wèn)日志,其中,訪問(wèn)日志用于存儲(chǔ)通過(guò)第二網(wǎng)站的追蹤插件獲取到的訪問(wèn)數(shù)據(jù);地址獲取模塊,用于從訪問(wèn)數(shù)據(jù)中獲取第一網(wǎng)站的地址。
通過(guò)本申請(qǐng),采用如下步驟,獲取第一網(wǎng)站的地址,其中,第一網(wǎng)站設(shè)置有第二網(wǎng)站的鏈接;獲取經(jīng)由鏈接訪問(wèn)第二網(wǎng)站產(chǎn)生的訪問(wèn)數(shù)據(jù);根據(jù)第一網(wǎng)站的地址判斷第一網(wǎng)站是否在預(yù)設(shè)網(wǎng)站集合內(nèi);如果判斷出第一網(wǎng)站不在預(yù)設(shè)網(wǎng)站集合內(nèi),則確定訪問(wèn)數(shù)據(jù)為轉(zhuǎn)載回流數(shù)據(jù),通過(guò)對(duì)訪問(wèn)行為的來(lái)源網(wǎng)站(即第一網(wǎng)站)的分析來(lái)確定訪問(wèn)行為產(chǎn)生的訪問(wèn)數(shù)據(jù)是否轉(zhuǎn)載回流數(shù)據(jù),從而解決了相關(guān)技術(shù)中檢測(cè)網(wǎng)站回流數(shù)據(jù)的準(zhǔn)確度較低的技術(shù)問(wèn)題,提高了網(wǎng)站回流數(shù)據(jù)的檢測(cè)準(zhǔn)確度。
附圖說(shuō)明
此處所說(shuō)明的附圖用來(lái)提供對(duì)本申請(qǐng)的進(jìn)一步理解,構(gòu)成本申請(qǐng)的一部分,本申請(qǐng)的示意性實(shí)施例及其說(shuō)明用于解釋本申請(qǐng),并不構(gòu)成對(duì)本申請(qǐng)的不當(dāng)限定。在附圖中:
圖1是根據(jù)本申請(qǐng)實(shí)施例的轉(zhuǎn)載回流數(shù)據(jù)的檢測(cè)方法的流程圖;以及
圖2是根據(jù)本申請(qǐng)實(shí)施例的轉(zhuǎn)載回流數(shù)據(jù)的檢測(cè)裝置的示意圖。
具體實(shí)施方式
為了使本技術(shù)領(lǐng)域的人員更好地理解本申請(qǐng)方案,下面將結(jié)合本申請(qǐng)實(shí)施例中的附圖,對(duì)本申請(qǐng)實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是本申請(qǐng)一部分的實(shí)施例,而不是全部的實(shí)施例?;诒旧暾?qǐng)中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒(méi)有做出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都應(yīng)當(dāng)屬于 本申請(qǐng)保護(hù)的范圍。
需要說(shuō)明的是,本申請(qǐng)的說(shuō)明書(shū)和權(quán)利要求書(shū)及上述附圖中的術(shù)語(yǔ)“第一”、“第二”等是用于區(qū)別類似的對(duì)象,而不必用于描述特定的順序或先后次序。應(yīng)該理解這樣使用的數(shù)據(jù)在適當(dāng)情況下可以互換,以便這里描述的本申請(qǐng)的實(shí)施例能夠以除了在這里圖示或描述的那些以外的順序?qū)嵤4送猓g(shù)語(yǔ)“包括”和“具有”以及他們的任何變形,意圖在于覆蓋不排他的包含,例如,包含了一系列步驟或單元的過(guò)程、方法、系統(tǒng)、產(chǎn)品或設(shè)備不必限于清楚地列出的那些步驟或單元,而是可包括沒(méi)有清楚地列出的或?qū)τ谶@些過(guò)程、方法、產(chǎn)品或設(shè)備固有的其它步驟或單元。
首先,在對(duì)本申請(qǐng)實(shí)施例進(jìn)行描述的過(guò)程中出現(xiàn)的部分名詞或術(shù)語(yǔ)適用于如下解釋:
統(tǒng)一資源定位符:Uniform Resource Locator,簡(jiǎn)稱URL,是對(duì)可以從互聯(lián)網(wǎng)上得到的資源的位置和訪問(wèn)方法的一種簡(jiǎn)潔的表示,是互聯(lián)網(wǎng)上標(biāo)準(zhǔn)資源的地址。
JS:Javascript,一種直譯式腳本語(yǔ)言,是一種動(dòng)態(tài)類型、弱類型、基于原型的語(yǔ)言,內(nèi)置支持類型。它的解釋器被稱為Javascript引擎,為瀏覽器的一部分,廣泛用于客戶端的腳本語(yǔ)言,最早是在HTML(標(biāo)準(zhǔn)通用標(biāo)記語(yǔ)言下的一個(gè)應(yīng)用)網(wǎng)頁(yè)上使用,用來(lái)給HTML網(wǎng)頁(yè)增加動(dòng)態(tài)功能。
Tracker:用于收集對(duì)目標(biāo)網(wǎng)頁(yè)的訪問(wèn)行為所產(chǎn)生的信息。
根據(jù)本申請(qǐng)實(shí)施例,提供了一種轉(zhuǎn)載回流數(shù)據(jù)的檢測(cè)方法的方法實(shí)施例,需要說(shuō)明的是,在附圖的流程圖示出的步驟可以在諸如一組計(jì)算機(jī)可執(zhí)行指令的計(jì)算機(jī)系統(tǒng)中執(zhí)行,并且,雖然在流程圖中示出了邏輯順序,但是在某些情況下,可以以不同于此處的順序執(zhí)行所示出或描述的步驟。
圖1是根據(jù)本申請(qǐng)實(shí)施例的轉(zhuǎn)載回流數(shù)據(jù)的檢測(cè)方法的流程圖,如圖1所示,該檢測(cè)方法包括如下步驟:
步驟S102,獲取第一網(wǎng)站的地址,其中,第一網(wǎng)站設(shè)置有第二網(wǎng)站的鏈接。
步驟S104,獲取經(jīng)由鏈接訪問(wèn)第二網(wǎng)站產(chǎn)生的訪問(wèn)數(shù)據(jù)。
步驟S106,根據(jù)第一網(wǎng)站的地址判斷第一網(wǎng)站是否在預(yù)設(shè)網(wǎng)站集合內(nèi)。
步驟S108,如果判斷出第一網(wǎng)站不在預(yù)設(shè)網(wǎng)站集合內(nèi),則確定訪問(wèn)數(shù)據(jù)為轉(zhuǎn)載回流數(shù)據(jù)。
通過(guò)上述實(shí)施例,采用如下步驟,獲取第一網(wǎng)站的地址,其中,第一網(wǎng)站設(shè)置有 第二網(wǎng)站的鏈接;獲取經(jīng)由鏈接訪問(wèn)第二網(wǎng)站產(chǎn)生的訪問(wèn)數(shù)據(jù);根據(jù)第一網(wǎng)站的地址判斷第一網(wǎng)站是否在預(yù)設(shè)網(wǎng)站集合內(nèi);如果判斷出第一網(wǎng)站不在預(yù)設(shè)網(wǎng)站集合內(nèi),則確定訪問(wèn)數(shù)據(jù)為轉(zhuǎn)載回流數(shù)據(jù),通過(guò)對(duì)訪問(wèn)行為的來(lái)源網(wǎng)站(即第一網(wǎng)站)的分析來(lái)確定訪問(wèn)行為產(chǎn)生的訪問(wèn)數(shù)據(jù)是否轉(zhuǎn)載回流數(shù)據(jù),從而解決了相關(guān)技術(shù)中檢測(cè)網(wǎng)站回流數(shù)據(jù)的準(zhǔn)確度較低的技術(shù)問(wèn)題,提高了網(wǎng)站回流數(shù)據(jù)的檢測(cè)準(zhǔn)確度。
可選地,步驟S102的獲取第一網(wǎng)站的地址可以包括:獲取經(jīng)由第一網(wǎng)站訪問(wèn)第二網(wǎng)站的訪問(wèn)日志,其中,訪問(wèn)日志用于存儲(chǔ)通過(guò)第二網(wǎng)站的追蹤插件獲取到的訪問(wèn)數(shù)據(jù);從訪問(wèn)數(shù)據(jù)中獲取第一網(wǎng)站的地址。
需要說(shuō)明的是,上述的網(wǎng)站的地址或者鏈接可以是網(wǎng)站的URL,由于網(wǎng)站可能具有多個(gè)網(wǎng)頁(yè),因此,可能存在多個(gè)不同的URL對(duì)應(yīng)于一個(gè)網(wǎng)站;上述的第一網(wǎng)站即來(lái)源網(wǎng)站,第二網(wǎng)站即目標(biāo)網(wǎng)站。
具體地,為了收集用戶在目標(biāo)網(wǎng)站(即上述第二網(wǎng)站)的訪問(wèn)行為所產(chǎn)生的訪問(wèn)信息,可以先在目標(biāo)網(wǎng)站部署用JS腳本語(yǔ)言編寫(xiě)的Tracker插件,以統(tǒng)計(jì)用戶在目標(biāo)網(wǎng)站中的各種訪問(wèn)行為,例如:當(dāng)用戶通過(guò)點(diǎn)擊外部鏈接(如第一網(wǎng)站中分享的鏈接)跳轉(zhuǎn)到目標(biāo)網(wǎng)站時(shí),插件會(huì)在跳轉(zhuǎn)到著陸的目標(biāo)網(wǎng)頁(yè)時(shí)自動(dòng)收集來(lái)源網(wǎng)站(即第一網(wǎng)站)的URL,即來(lái)源URL,然后將記錄有來(lái)源URL的訪問(wèn)數(shù)據(jù)發(fā)送到指定的服務(wù)器中,在服務(wù)器端收到上述訪問(wèn)數(shù)據(jù)后,將訪問(wèn)數(shù)據(jù)保存到訪問(wèn)日志中。
通過(guò)上述實(shí)施例,利用Tracker插件可以準(zhǔn)確地收集用戶的訪問(wèn)行為所產(chǎn)生的各種訪問(wèn)數(shù)據(jù)。
下面將詳述步驟S104的獲取經(jīng)由鏈接訪問(wèn)第二網(wǎng)站產(chǎn)生的訪問(wèn)數(shù)據(jù)所記載的實(shí)施例。
在用戶瀏覽網(wǎng)頁(yè)時(shí),可以通過(guò)不同的方式訪問(wèn)目標(biāo)網(wǎng)站,如直接在瀏覽器中輸入地址訪問(wèn)、通過(guò)瀏覽器的歷史記錄訪問(wèn)、通過(guò)收藏夾訪問(wèn)、通過(guò)其它網(wǎng)站的分享鏈接訪問(wèn),當(dāng)用戶通過(guò)輸入地址、歷史記錄、收藏夾等方式訪問(wèn)時(shí),該訪問(wèn)行為沒(méi)有對(duì)應(yīng)的來(lái)源URL,而轉(zhuǎn)載回流數(shù)據(jù)必然是包含來(lái)源URL的數(shù)據(jù),因此,在檢測(cè)轉(zhuǎn)載回流數(shù)據(jù)時(shí),需要過(guò)濾掉訪問(wèn)日志中不包含來(lái)源URL的訪問(wèn)數(shù)據(jù),具體是逐條分析服務(wù)器端的訪問(wèn)日志,從訪問(wèn)日志中解析出某個(gè)時(shí)間段內(nèi)的所有訪問(wèn)數(shù)據(jù),再逐個(gè)檢測(cè)訪問(wèn)數(shù)據(jù),從中篩選出包含來(lái)源URL的訪問(wèn)數(shù)據(jù)。
通過(guò)上述實(shí)施例,可以實(shí)現(xiàn)過(guò)濾掉不包含來(lái)源URL的訪問(wèn)數(shù)據(jù)。
在一個(gè)可選的實(shí)施例中,步驟S106的根據(jù)第一網(wǎng)站的地址判斷第一網(wǎng)站是否在預(yù)設(shè)網(wǎng)站集合內(nèi)可以包括:解析第一網(wǎng)站的地址,得到第一網(wǎng)站的域名標(biāo)識(shí);獲取預(yù)設(shè) 網(wǎng)站集合內(nèi)網(wǎng)站的域名標(biāo)識(shí);判斷預(yù)設(shè)網(wǎng)站集合內(nèi)是否存在域名標(biāo)識(shí)與第一網(wǎng)站的域名標(biāo)識(shí)相匹配的網(wǎng)站,其中,如果判斷出預(yù)設(shè)網(wǎng)站集合內(nèi)不存在域名標(biāo)識(shí)與第一網(wǎng)站的域名標(biāo)識(shí)相匹配的網(wǎng)站,則確定第一網(wǎng)站不在預(yù)設(shè)網(wǎng)站集合內(nèi)。
需要說(shuō)明的是,上述預(yù)設(shè)網(wǎng)站集合可以包括目標(biāo)網(wǎng)站自身、合作網(wǎng)站、各類搜索引擎(如百度、谷歌)等,當(dāng)用戶通過(guò)目標(biāo)網(wǎng)站首頁(yè)的導(dǎo)航鏈接、合作網(wǎng)站的友情鏈接、搜索引擎中搜索出來(lái)的鏈接來(lái)訪問(wèn)目標(biāo)網(wǎng)站時(shí),該訪問(wèn)行為所產(chǎn)生的訪問(wèn)數(shù)據(jù)不屬于回流數(shù)據(jù)。
具體地,從訪問(wèn)數(shù)據(jù)中獲取來(lái)源網(wǎng)站的URL,并對(duì)來(lái)源URL進(jìn)行解析以得到域名標(biāo)識(shí),如對(duì)“http://www.phperz.com/web‐design/javascript/12345.html”進(jìn)行解析,即能得到該來(lái)源URL的域名標(biāo)識(shí)為“phperz.com”,同樣的,也可以利用相同的方法得到網(wǎng)站集合中各個(gè)網(wǎng)站的域名標(biāo)識(shí),然后將“phperz.com”與網(wǎng)站集合中各個(gè)網(wǎng)站的域名標(biāo)識(shí)進(jìn)行對(duì)比,若網(wǎng)站集合中沒(méi)有域名標(biāo)識(shí)與“phperz.com”相同的網(wǎng)站,則確定來(lái)源網(wǎng)站不在預(yù)設(shè)網(wǎng)站集合內(nèi)。
通過(guò)上述實(shí)施例,可以濾除訪問(wèn)數(shù)據(jù)中來(lái)源于目標(biāo)網(wǎng)站、搜索引擎以及合作網(wǎng)站的訪問(wèn)所產(chǎn)生的訪問(wèn)數(shù)據(jù)。
在一個(gè)可選的實(shí)施例中,訪問(wèn)數(shù)據(jù)記錄有第二網(wǎng)站中被訪問(wèn)過(guò)的網(wǎng)頁(yè)地址,其中,如果判斷出第一網(wǎng)站不在預(yù)設(shè)網(wǎng)站集合內(nèi),則本申請(qǐng)的檢測(cè)方法還可以包括:從訪問(wèn)數(shù)據(jù)中獲取網(wǎng)頁(yè)地址;判斷通過(guò)網(wǎng)頁(yè)地址所訪問(wèn)的網(wǎng)頁(yè)是否為第二網(wǎng)站的網(wǎng)站首頁(yè)或者欄目首頁(yè),其中,如果判斷出網(wǎng)頁(yè)地址所訪問(wèn)的網(wǎng)頁(yè)不為第二網(wǎng)站的網(wǎng)站首頁(yè)或者欄目首頁(yè),則確定訪問(wèn)數(shù)據(jù)為轉(zhuǎn)載回流數(shù)據(jù)。
具體地,當(dāng)用戶只是訪問(wèn)目標(biāo)網(wǎng)站的首頁(yè)或者欄目首頁(yè)時(shí),所產(chǎn)生的訪問(wèn)數(shù)據(jù)也不是有效的轉(zhuǎn)載回流數(shù)據(jù),因此,在檢測(cè)轉(zhuǎn)載回流數(shù)據(jù)還需要濾除訪問(wèn)網(wǎng)站首頁(yè)或者欄目首頁(yè)的這一部分訪問(wèn)數(shù)據(jù),具體是從訪問(wèn)數(shù)據(jù)中獲取用戶的訪問(wèn)行為所訪問(wèn)的具體網(wǎng)頁(yè)的URL,如“http://www.phperz.com/”,通過(guò)對(duì)該URL進(jìn)行分析可知,該URL只包含域名部分(即“phperz.com”),即該頁(yè)面為目標(biāo)網(wǎng)站的首頁(yè),因此,用戶訪問(wèn)該URL所產(chǎn)生的訪問(wèn)數(shù)據(jù)不為轉(zhuǎn)載回流數(shù)據(jù)。
又如“http://www.phperz.com/web‐design/javascript/12345.html”,對(duì)該URL分析可知,該URL除了包括域名外,還包括其它參數(shù)(即“web-design/javascript/12345.html”),經(jīng)過(guò)對(duì)該參數(shù)的分析可知,通過(guò)該URL所訪問(wèn)的網(wǎng)頁(yè)并不是欄目首頁(yè),而是“web-design”欄目下的一個(gè)子網(wǎng)頁(yè),因此,可以確定通過(guò)該URL進(jìn)行訪問(wèn)所產(chǎn)生的訪問(wèn)數(shù)據(jù)為有效的轉(zhuǎn)載回流數(shù)據(jù)。
通過(guò)上述實(shí)施例,可以濾除訪問(wèn)網(wǎng)站首頁(yè)或者欄目首頁(yè)所產(chǎn)生的無(wú)效數(shù)據(jù)。
進(jìn)一步地,訪問(wèn)數(shù)據(jù)還記錄有通過(guò)鏈接訪問(wèn)第二網(wǎng)站的用戶的ID,其中,在確定訪問(wèn)數(shù)據(jù)為轉(zhuǎn)載回流數(shù)據(jù)之后,本申請(qǐng)的檢測(cè)方法還可以包括:從訪問(wèn)數(shù)據(jù)中獲取用戶的ID;判斷預(yù)設(shè)數(shù)據(jù)庫(kù)中是否存在與用戶的ID相匹配的預(yù)存用戶ID,其中,預(yù)設(shè)數(shù)據(jù)庫(kù)用于存儲(chǔ)已統(tǒng)計(jì)的轉(zhuǎn)載回流數(shù)據(jù)、預(yù)存用戶ID以及已統(tǒng)計(jì)的轉(zhuǎn)載回流數(shù)據(jù)與預(yù)存用戶ID的對(duì)應(yīng)關(guān)系;如果判斷出預(yù)設(shè)數(shù)據(jù)庫(kù)中不存在與用戶的ID相匹配的預(yù)存用戶ID,則將訪問(wèn)數(shù)據(jù)、用戶的ID以及訪問(wèn)數(shù)據(jù)與用戶的ID的對(duì)應(yīng)關(guān)系存入預(yù)設(shè)數(shù)據(jù)庫(kù)。
具體地,確定上述訪問(wèn)行為所產(chǎn)生的訪問(wèn)數(shù)據(jù)為有效的轉(zhuǎn)載回流數(shù)據(jù)之后,可以利用得到的結(jié)果進(jìn)一步地統(tǒng)計(jì)回流人次、回流人數(shù)、來(lái)源網(wǎng)站排名等各項(xiàng)指標(biāo)。下面以計(jì)算回流人數(shù)為例詳細(xì)說(shuō)明:
在確定訪問(wèn)數(shù)據(jù)為轉(zhuǎn)載回流數(shù)據(jù)之后,可以將訪問(wèn)數(shù)據(jù)中記載的用戶的ID與已統(tǒng)計(jì)的轉(zhuǎn)載回流數(shù)據(jù)對(duì)應(yīng)的預(yù)存用戶ID逐個(gè)作對(duì)比,若存在相同的預(yù)存用戶ID,則說(shuō)明該用戶為老用戶,即回流人數(shù)未產(chǎn)生變化,若不存在相同的預(yù)存用戶ID,則說(shuō)明該用戶為新用戶,即回流人數(shù)增加一位,若判斷出為新用戶,還需要將產(chǎn)生的訪問(wèn)數(shù)據(jù)和對(duì)應(yīng)的用戶ID存入數(shù)據(jù)庫(kù)中。
可選地,上述回流人次可以直接根據(jù)轉(zhuǎn)載回流數(shù)據(jù)的數(shù)量確定,將回流數(shù)據(jù)中為同一用戶進(jìn)行訪問(wèn)所產(chǎn)生的回流數(shù)據(jù)統(tǒng)計(jì)為一人次的回流人數(shù),即可根據(jù)回流數(shù)據(jù)統(tǒng)計(jì)出回流人數(shù),來(lái)源網(wǎng)站排名可以根據(jù)通過(guò)統(tǒng)計(jì)由該來(lái)源網(wǎng)站的分享鏈接而產(chǎn)生的訪問(wèn)數(shù)據(jù)的數(shù)量來(lái)確定。
需要說(shuō)明的是,在統(tǒng)計(jì)回流人數(shù)時(shí),可以根據(jù)回流數(shù)據(jù)中用于標(biāo)識(shí)用戶的標(biāo)識(shí)字符串確定是否將該用戶統(tǒng)計(jì)為有效的回流人數(shù)。
通過(guò)上述實(shí)施例,由于采用直接對(duì)來(lái)源URL進(jìn)行分析的技術(shù)方案,即使不是通過(guò)分享插件進(jìn)行分享或者轉(zhuǎn)載的回流也能被檢測(cè)到,從而解決了相關(guān)技術(shù)中檢測(cè)網(wǎng)站回流數(shù)據(jù)的準(zhǔn)確度較低的技術(shù)問(wèn)題,提高了網(wǎng)站回流數(shù)據(jù)的檢測(cè)準(zhǔn)確度。
需要說(shuō)明的是,對(duì)于前述的各方法實(shí)施例,為了簡(jiǎn)單描述,故將其都表述為一系列的動(dòng)作組合,但是本領(lǐng)域技術(shù)人員應(yīng)該知悉,本申請(qǐng)并不受所描述的動(dòng)作順序的限制,因?yàn)橐罁?jù)本申請(qǐng),某些步驟可以采用其他順序或者同時(shí)進(jìn)行。其次,本領(lǐng)域技術(shù)人員也應(yīng)該知悉,說(shuō)明書(shū)中所描述的實(shí)施例均屬于優(yōu)選實(shí)施例,所涉及的動(dòng)作和模塊并不一定是本申請(qǐng)所必須的。
本申請(qǐng)實(shí)施例還提供了一種轉(zhuǎn)載回流數(shù)據(jù)的檢測(cè)裝置。需要說(shuō)明的是,本申請(qǐng)實(shí) 施例的轉(zhuǎn)載回流數(shù)據(jù)的檢測(cè)裝置可以用于執(zhí)行本申請(qǐng)實(shí)施例所提供的轉(zhuǎn)載回流數(shù)據(jù)的檢測(cè)方法,本申請(qǐng)實(shí)施例的轉(zhuǎn)載回流數(shù)據(jù)的檢測(cè)方法也可以通過(guò)本申請(qǐng)實(shí)施例所提供的轉(zhuǎn)載回流數(shù)據(jù)的檢測(cè)裝置來(lái)執(zhí)行。
圖2是根據(jù)本申請(qǐng)實(shí)施例的轉(zhuǎn)載回流數(shù)據(jù)的檢測(cè)裝置的示意圖。如圖2所示,該轉(zhuǎn)載回流數(shù)據(jù)的檢測(cè)裝置可以包括:第一獲取單元10、第二獲取單元20、第一判斷單元30以及確定單元40。第一獲取單元10用于獲取第一網(wǎng)站的地址,其中,第一網(wǎng)站設(shè)置有第二網(wǎng)站的鏈接;第二獲取單元20用于獲取經(jīng)由鏈接訪問(wèn)第二網(wǎng)站產(chǎn)生的訪問(wèn)數(shù)據(jù);第一判斷單元30用于根據(jù)第一網(wǎng)站的地址判斷第一網(wǎng)站是否在預(yù)設(shè)網(wǎng)站集合內(nèi);確定單元40用于當(dāng)?shù)谝慌袛鄦卧袛喑龅谝痪W(wǎng)站不在預(yù)設(shè)網(wǎng)站集合內(nèi)時(shí),確定訪問(wèn)數(shù)據(jù)為轉(zhuǎn)載回流數(shù)據(jù)。
通過(guò)上述實(shí)施例,通過(guò)第一獲取單元10獲取第一網(wǎng)站的地址,其中,第一網(wǎng)站設(shè)置有第二網(wǎng)站的鏈接;第二獲取單元20獲取經(jīng)由鏈接訪問(wèn)第二網(wǎng)站產(chǎn)生的訪問(wèn)數(shù)據(jù);根據(jù)第一網(wǎng)站的地址判斷第一網(wǎng)站是否在預(yù)設(shè)網(wǎng)站集合內(nèi);然后第一判斷單元30根據(jù)第一網(wǎng)站的地址判斷第一網(wǎng)站是否在預(yù)設(shè)網(wǎng)站集合內(nèi),如果第一判斷單元30判斷出第一網(wǎng)站不在預(yù)設(shè)網(wǎng)站集合內(nèi),確定單元40則確定訪問(wèn)數(shù)據(jù)為轉(zhuǎn)載回流數(shù)據(jù),通過(guò)對(duì)訪問(wèn)行為的來(lái)源網(wǎng)站(即第一網(wǎng)站)的分析來(lái)確定訪問(wèn)行為產(chǎn)生的訪問(wèn)數(shù)據(jù)是否轉(zhuǎn)載回流數(shù)據(jù),從而解決了相關(guān)技術(shù)中檢測(cè)網(wǎng)站回流數(shù)據(jù)的準(zhǔn)確度較低的技術(shù)問(wèn)題,提高了網(wǎng)站回流數(shù)據(jù)的檢測(cè)準(zhǔn)確度。
可選地,第一判斷單元可以包括:解析模塊,用于解析第一網(wǎng)站的地址,得到第一網(wǎng)站的域名標(biāo)識(shí);域名獲取模塊,用于獲取預(yù)設(shè)網(wǎng)站集合內(nèi)網(wǎng)站的域名標(biāo)識(shí);判斷模塊,用于判斷預(yù)設(shè)網(wǎng)站集合內(nèi)是否存在域名標(biāo)識(shí)與第一網(wǎng)站的域名標(biāo)識(shí)相匹配的網(wǎng)站,其中,如果判斷出預(yù)設(shè)網(wǎng)站集合內(nèi)不存在域名標(biāo)識(shí)與第一網(wǎng)站的域名標(biāo)識(shí)相匹配的網(wǎng)站,則確定第一網(wǎng)站不在預(yù)設(shè)網(wǎng)站集合內(nèi)。
通過(guò)上述實(shí)施例,可以濾除訪問(wèn)數(shù)據(jù)中來(lái)源于目標(biāo)網(wǎng)站、搜索引擎以及合作網(wǎng)站的訪問(wèn)所產(chǎn)生的訪問(wèn)數(shù)據(jù)。
可選地,訪問(wèn)數(shù)據(jù)記錄有第二網(wǎng)站中被訪問(wèn)過(guò)的網(wǎng)頁(yè)地址,檢測(cè)裝置還可以包括:第三獲取單元,用于當(dāng)?shù)谝慌袛鄦卧袛喑龅谝痪W(wǎng)站不在預(yù)設(shè)網(wǎng)站集合內(nèi)時(shí),從訪問(wèn)數(shù)據(jù)中獲取網(wǎng)頁(yè)地址;第二判斷單元,用于判斷通過(guò)網(wǎng)頁(yè)地址所訪問(wèn)的網(wǎng)頁(yè)是否為第二網(wǎng)站的網(wǎng)站首頁(yè)或者欄目首頁(yè),其中,確定單元還用于當(dāng)?shù)诙袛鄦卧袛喑鼍W(wǎng)頁(yè)地址所訪問(wèn)的網(wǎng)頁(yè)不為第二網(wǎng)站的網(wǎng)站首頁(yè)或者欄目首頁(yè)時(shí),確定訪問(wèn)數(shù)據(jù)為轉(zhuǎn)載回流數(shù)據(jù)。
通過(guò)上述實(shí)施例,可以濾除訪問(wèn)網(wǎng)站首頁(yè)或者欄目首頁(yè)所產(chǎn)生的無(wú)效數(shù)據(jù)。
可選地,訪問(wèn)數(shù)據(jù)還記錄有通過(guò)鏈接訪問(wèn)第二網(wǎng)站的用戶的ID,本申請(qǐng)的檢測(cè)裝置還可以包括:標(biāo)識(shí)獲取單元,用于在確定訪問(wèn)數(shù)據(jù)為轉(zhuǎn)載回流數(shù)據(jù)之后,從訪問(wèn)數(shù)據(jù)中獲取用戶的ID;標(biāo)識(shí)判斷單元,用于判斷預(yù)設(shè)數(shù)據(jù)庫(kù)中是否存在與用戶的ID相匹配的預(yù)存用戶ID,其中,預(yù)設(shè)數(shù)據(jù)庫(kù)用于存儲(chǔ)已統(tǒng)計(jì)的轉(zhuǎn)載回流數(shù)據(jù)、預(yù)存用戶ID以及已統(tǒng)計(jì)的轉(zhuǎn)載回流數(shù)據(jù)與預(yù)存用戶ID的對(duì)應(yīng)關(guān)系;處理單元,用于如果判斷出預(yù)設(shè)數(shù)據(jù)庫(kù)中不存在與用戶的ID相匹配的預(yù)存用戶ID,則將訪問(wèn)數(shù)據(jù)、用戶的ID以及訪問(wèn)數(shù)據(jù)與用戶的ID的對(duì)應(yīng)關(guān)系存入預(yù)設(shè)數(shù)據(jù)庫(kù)。
通過(guò)上述實(shí)施例,由于采用直接對(duì)來(lái)源URL進(jìn)行分析的技術(shù)方案,即使不是通過(guò)分享插件進(jìn)行分享或者轉(zhuǎn)載的回流也能被檢測(cè)到,從而解決了相關(guān)技術(shù)中檢測(cè)網(wǎng)站回流數(shù)據(jù)的準(zhǔn)確度較低的技術(shù)問(wèn)題,提高了網(wǎng)站回流數(shù)據(jù)的檢測(cè)準(zhǔn)確度。
可選地,第一獲取單元可以包括:日志獲取模塊,用于獲取經(jīng)由第一網(wǎng)站訪問(wèn)第二網(wǎng)站的訪問(wèn)日志,其中,訪問(wèn)日志用于存儲(chǔ)通過(guò)第二網(wǎng)站的追蹤插件獲取到的訪問(wèn)數(shù)據(jù);地址獲取模塊,用于從訪問(wèn)數(shù)據(jù)中獲取第一網(wǎng)站的地址。
通過(guò)上述實(shí)施例,利用Tracker插件可以準(zhǔn)確地收集用戶的訪問(wèn)行為產(chǎn)生的各種訪問(wèn)數(shù)據(jù)。
本實(shí)施例中所提供的各個(gè)模塊與方法實(shí)施例對(duì)應(yīng)步驟所提供的使用方法相同、應(yīng)用場(chǎng)景也可以相同。當(dāng)然,需要注意的是,上述模塊涉及的方案可以不限于上述實(shí)施例中的內(nèi)容和場(chǎng)景,且上述模塊可以運(yùn)行在計(jì)算機(jī)終端或移動(dòng)終端,可以通過(guò)軟件或硬件實(shí)現(xiàn)。
上述本申請(qǐng)實(shí)施例序號(hào)僅僅為了描述,不代表實(shí)施例的優(yōu)劣。
在本申請(qǐng)的上述實(shí)施例中,對(duì)各個(gè)實(shí)施例的描述都各有側(cè)重,某個(gè)實(shí)施例中沒(méi)有詳述的部分,可以參見(jiàn)其他實(shí)施例的相關(guān)描述。
在本申請(qǐng)所提供的幾個(gè)實(shí)施例中,應(yīng)該理解到,所揭露的技術(shù)內(nèi)容,可通過(guò)其它的方式實(shí)現(xiàn)。其中,以上所描述的裝置實(shí)施例僅僅是示意性的,例如所述單元的劃分,可以為一種邏輯功能劃分,實(shí)際實(shí)現(xiàn)時(shí)可以有另外的劃分方式,例如多個(gè)單元或組件可以結(jié)合或者可以集成到另一個(gè)系統(tǒng),或一些特征可以忽略,或不執(zhí)行。另一點(diǎn),所顯示或討論的相互之間的耦合或直接耦合或通信連接可以是通過(guò)一些接口,單元或模塊的間接耦合或通信連接,可以是電性或其它的形式。
在本申請(qǐng)各個(gè)實(shí)施例中的各功能單元可以集成在一個(gè)處理單元中,也可以是各個(gè) 單元單獨(dú)物理存在,也可以兩個(gè)或兩個(gè)以上單元集成在一個(gè)單元中。上述集成的單元既可以采用硬件的形式實(shí)現(xiàn),也可以采用軟件功能單元的形式實(shí)現(xiàn)。
所述集成的單元如果以軟件功能單元的形式實(shí)現(xiàn)并作為獨(dú)立的產(chǎn)品銷售或使用時(shí),可以存儲(chǔ)在一個(gè)計(jì)算機(jī)可讀取存儲(chǔ)介質(zhì)中?;谶@樣的理解,本申請(qǐng)的技術(shù)方案本質(zhì)上或者說(shuō)對(duì)現(xiàn)有技術(shù)做出貢獻(xiàn)的部分或者該技術(shù)方案的全部或部分可以以軟件產(chǎn)品的形式體現(xiàn)出來(lái),該計(jì)算機(jī)軟件產(chǎn)品存儲(chǔ)在一個(gè)存儲(chǔ)介質(zhì)中,包括若干指令用以使得一臺(tái)計(jì)算機(jī)設(shè)備(可為個(gè)人計(jì)算機(jī)、服務(wù)器或者網(wǎng)絡(luò)設(shè)備等)執(zhí)行本申請(qǐng)各個(gè)實(shí)施例所述方法的全部或部分步驟。而前述的存儲(chǔ)介質(zhì)包括:U盤(pán)、只讀存儲(chǔ)器(ROM,Read-Only Memory)、隨機(jī)存取存儲(chǔ)器(RAM,Random Access Memory)、移動(dòng)硬盤(pán)、磁碟或者光盤(pán)等各種可以存儲(chǔ)程序代碼的介質(zhì)。
以上所述僅是本申請(qǐng)的優(yōu)選實(shí)施方式,應(yīng)當(dāng)指出,對(duì)于本技術(shù)領(lǐng)域的普通技術(shù)人員來(lái)說(shuō),在不脫離本申請(qǐng)?jiān)淼那疤嵯拢€可以做出若干改進(jìn)和潤(rùn)飾,這些改進(jìn)和潤(rùn)飾也應(yīng)視為本申請(qǐng)的保護(hù)范圍。