專利名稱:一種在Web頁(yè)面中添加標(biāo)簽的方法及其系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及互聯(lián)網(wǎng)數(shù)據(jù)分析領(lǐng)域,特別涉及一種在Web頁(yè)面中添加標(biāo)簽 的方法及其系統(tǒng)。
背景技術(shù):
隨著互聯(lián)網(wǎng)上信息服務(wù)的發(fā)展,許多政府部門、公司、大專院校、科研院 所等都已經(jīng)擁有或正在建設(shè)自己的網(wǎng)站。每個(gè)網(wǎng)站的后面都運(yùn)行著一個(gè)Web 服務(wù)器,Web服務(wù)器也稱為WWW (WorldWideWeb)服務(wù)器,主要功能是提 供網(wǎng)上信息瀏覽服務(wù)。WWW是互聯(lián)網(wǎng)Internet的多媒體信息查詢工具,是 Internet近年才發(fā)展起來(lái)的服務(wù),也是發(fā)展最快和目前應(yīng)用最廣泛的服務(wù)。 WWW采用的是客戶端/服務(wù)器結(jié)構(gòu),WEB服務(wù)器的作用是整理和儲(chǔ)存各種 WW資源,并響應(yīng)客戶端請(qǐng)求,把用戶所需的資源傳送到Windows95、 Windows98、 WindowsNT、 UNIX或Linux等平臺(tái)上;如Web服務(wù)器負(fù)責(zé)管理 Web頁(yè)面,在接收用戶請(qǐng)求后將相應(yīng)的頁(yè)面通過(guò)本地網(wǎng)絡(luò)或Internet傳送至客 戶端Web瀏覽器以供用戶使用?,F(xiàn)在較常用的Web服務(wù)器包括Apache服務(wù)器、 Microsoft IIS服務(wù)器和Iplanet的Enterprise服務(wù)器。
對(duì)網(wǎng)站的管理,要求不僅僅關(guān)注Web服務(wù)器每天的吞吐量,還要了解網(wǎng)站 各頁(yè)面的訪問(wèn)情況,根據(jù)各頁(yè)面的點(diǎn)擊頻率來(lái)改善網(wǎng)頁(yè)的內(nèi)容和質(zhì)量、提高信 息的可讀性,跟蹤包含有商業(yè)交易的步驟以及管理網(wǎng)站的后臺(tái)數(shù)據(jù)等,尤其是 以電子商務(wù)或搜索引擎為業(yè)務(wù)的網(wǎng)絡(luò)公司,更是需要對(duì)Web服務(wù)器的運(yùn)行和訪 問(wèn)情況進(jìn)行詳細(xì)而周全的分析以跟蹤用戶的行為;而這些要求都可以通過(guò)對(duì) Web服務(wù)器的日志文件進(jìn)行統(tǒng)計(jì)和分析來(lái)做到。
目前,市場(chǎng)上有兩種較為流行的日志文件的生成方式。 一種方式是由Web服務(wù)器直接生成日志文件。參閱圖l所示,用戶通過(guò) 客戶機(jī)發(fā)送Web頁(yè)面瀏覽請(qǐng)求到Web服務(wù)器;Web服務(wù)器接收該請(qǐng)求后,將 用戶請(qǐng)求瀏覽的Web頁(yè)面返回給客戶端,并記錄對(duì)應(yīng)的訪問(wèn)日志;最后由日志 文件服務(wù)器統(tǒng)一收集分歉在各個(gè)Web服務(wù)器上的訪問(wèn)日志并進(jìn)行分析、整理。
這種方法的主要缺點(diǎn)是,日志文件分散在各臺(tái)Web服務(wù)器上,如果要進(jìn)行 分析,需要收集日志文件并進(jìn)行處理。 一般的以電子商務(wù)為主的網(wǎng)站,如果日 瀏覽量超過(guò)五千萬(wàn),就需要上百臺(tái)Web服務(wù)器為其提供服務(wù);收集上百臺(tái)機(jī)器 的訪問(wèn)日志,需要花費(fèi)較長(zhǎng)時(shí)間,又會(huì)影響Web服務(wù)器的負(fù)載,同時(shí),由于 Web服務(wù)器數(shù)量太多,日志文件服務(wù)器很容易遺漏部分訪問(wèn)日志,導(dǎo)致數(shù)據(jù)分 析結(jié)果的不可靠。
另一種方式是采用標(biāo)簽(Tag)生成日志文件。用戶通過(guò)客戶端發(fā)送Web 頁(yè)面瀏覽請(qǐng)求到Web服務(wù)器;Web服務(wù)器將相應(yīng)的已嵌入Tag的Web頁(yè)面發(fā) 送給客戶端,所述Tag為一小段代碼, 一般為Javascript代碼;客戶端根據(jù)所 述Web頁(yè)面上嵌入的Tag生成對(duì)應(yīng)的訪問(wèn)信息,并將該訪問(wèn)信息發(fā)送給日志文 件服務(wù)器;日志文件服務(wù)器根據(jù)所述訪問(wèn)信息生成相應(yīng)的訪問(wèn)日志并向客戶端 返回請(qǐng)求結(jié)果,接著對(duì)所述訪問(wèn)日志進(jìn)行分析、整理。
這種方式直接將需要分析的訪問(wèn)日志集中生成在日志文件服務(wù)器,減少了 日志收集的過(guò)程。但是,對(duì)于Tag的生成方式,現(xiàn)有技術(shù)還存在不足之處。
一般來(lái)說(shuō),用戶訪問(wèn)的Web頁(yè)面分為靜態(tài)頁(yè)面和動(dòng)態(tài)頁(yè)面兩種。所述靜態(tài) 頁(yè)面是指該頁(yè)面只對(duì)應(yīng)一個(gè)固定的頁(yè)面內(nèi)容;所述動(dòng)態(tài)頁(yè)面是指該頁(yè)面可以依 據(jù)預(yù)先設(shè)定的頁(yè)面程序,根據(jù)用戶的不同請(qǐng)求返回相應(yīng)的數(shù)據(jù)。
對(duì)于靜態(tài)頁(yè)面,網(wǎng)站工程師先在頁(yè)面代碼中確定Tag的指定嵌入位置,再 將Tag手工嵌入到所述位置上,有多少個(gè)靜態(tài)頁(yè)面網(wǎng)站工程師就需要手工嵌入 Tag代碼多少次;如果一個(gè)網(wǎng)站有較多的靜態(tài)頁(yè)面,那么手工嵌入Tag需要的 工作量和日后維護(hù)的工作量將是非常大的,而且如果某些靜態(tài)頁(yè)面在手工嵌入 Tag時(shí)被遺漏,那么這些頁(yè)面的訪問(wèn)統(tǒng)計(jì)將不會(huì)被傳送至日志文件服務(wù)器,從
而導(dǎo)致日志文件數(shù)據(jù)分析結(jié)果不準(zhǔn)確。
對(duì)于動(dòng)態(tài)頁(yè)面,網(wǎng)站工程師將Tag代碼做成公用才莫板,并在頁(yè)面代碼中的 指定位置加入調(diào)用命令,這樣,Web服務(wù)器上的動(dòng)態(tài)應(yīng)用程序在生成動(dòng)態(tài)頁(yè)面 時(shí)便根據(jù)所述命令調(diào)用對(duì)應(yīng)的公用模板,將Tag嵌入動(dòng)態(tài)頁(yè)面中; 一般一個(gè)大 型的網(wǎng)站會(huì)有很多動(dòng)態(tài)應(yīng)用程序,若要在所有的動(dòng)態(tài)頁(yè)面中嵌入Tag,就需要 手工修改所有的動(dòng)態(tài)應(yīng)用程序,其工作量和日后維護(hù)的工作量也將是非常大 的,而且網(wǎng)絡(luò)工程師可能會(huì)忘記修改新上線的動(dòng)態(tài)應(yīng)用程序,使得新生成的動(dòng) 態(tài)頁(yè)面中沒(méi)有嵌入Tag,那么這些頁(yè)面的訪問(wèn)統(tǒng)計(jì)將同樣不會(huì)被傳送至日志文 件服務(wù)器,從而導(dǎo)致日志文件數(shù)據(jù)分析結(jié)果不準(zhǔn)確。
發(fā)明內(nèi)容
本發(fā)明提供一種在Web頁(yè)面中添加標(biāo)簽的方法及其系統(tǒng),用以解決現(xiàn)有技 術(shù)中在Web頁(yè)面中嵌入標(biāo)簽存在工作量大和容易出錯(cuò)的問(wèn)題。 本發(fā)明技術(shù)方案如下
一種在Web頁(yè)面中添加標(biāo)簽的方法,包括 Web服務(wù)器根據(jù)客戶端的請(qǐng)求獲取需要發(fā)送給該客戶端的頁(yè)面; 所述Web服務(wù)器掃描所述頁(yè)面的代碼以定位到插入標(biāo)簽的指定位置,并在 該指定位置嵌入標(biāo)簽代碼;
所述Web服務(wù)器將嵌入標(biāo)識(shí)代碼的頁(yè)面發(fā)送給所述客戶端。 根據(jù)上述方法
所述Web服務(wù)器獲取的頁(yè)面包括靜態(tài)頁(yè)面和動(dòng)態(tài)頁(yè)面。 所述客戶端在接收到嵌入標(biāo)簽的頁(yè)面后,根據(jù)該標(biāo)簽將相應(yīng)的訪問(wèn)信息發(fā) 送給日志文件服務(wù)器。
所述日志文件服務(wù)器才艮據(jù)所述訪問(wèn)信息生成相應(yīng)的訪問(wèn)日志。 一種Web服務(wù)器,包括
用于接》1^戶端發(fā)送的Web頁(yè)面瀏覽請(qǐng)求的單元;
用于獲取需要發(fā)送給客戶端的頁(yè)面的單元;
用于掃描所述頁(yè)面代碼以定位插入標(biāo)簽的指定位置,并在該指定位置嵌入
標(biāo)簽代碼的單元;
用于向客戶端發(fā)送嵌入標(biāo)識(shí)^^碼的頁(yè)面的單元。 一種網(wǎng)站系統(tǒng),其特征在于,包括
客戶端,用于向Web服務(wù)器發(fā)送Web頁(yè)面瀏覽請(qǐng)求、接收Web服務(wù)器發(fā) 送的嵌入標(biāo)簽的頁(yè)面,并根據(jù)所述標(biāo)簽向日志文件服務(wù)器發(fā)送相應(yīng)的訪問(wèn)信 命
Web服務(wù)器,用于根據(jù)客戶端的請(qǐng)求獲取需要發(fā)送給該客戶端的頁(yè)面,掃 描所述頁(yè)面的代碼以定位到插入標(biāo)簽的指定位置并在該指定位置嵌入標(biāo)簽代 碼,以及將嵌入標(biāo)識(shí)代碼的頁(yè)面發(fā)送給所述客戶端。
日志文件服務(wù)器,用于根據(jù)客戶端發(fā)送的訪問(wèn)信息生成相應(yīng)的訪問(wèn)日志。
本發(fā)明有益效果如下
本發(fā)明通過(guò)Web服務(wù)器在發(fā)送Web頁(yè)面前先掃描該頁(yè)面的代碼以確定嵌 入標(biāo)簽的指定位置,并在所述位置添加標(biāo)簽代碼。這樣,既保留了通過(guò)標(biāo)簽生 成訪問(wèn)日志的優(yōu)點(diǎn),又防止了部分Web頁(yè)面在嵌入標(biāo)簽時(shí)被遺漏,從而確保了 日志文件數(shù)據(jù)分析結(jié)果的準(zhǔn)確性;同時(shí),對(duì)于靜態(tài)頁(yè)面,不再需要手工插入標(biāo) 簽,對(duì)于動(dòng)態(tài)頁(yè)面不再需要手工修改程序代碼來(lái)調(diào)用公共模板,從而大幅度地 降低了工作量。
圖1為采用Web服務(wù)器直接生成日志文件的系統(tǒng)體系結(jié)構(gòu)圖; 圖2A為本發(fā)明實(shí)施例中網(wǎng)站系統(tǒng)體系結(jié)構(gòu)圖; 圖2B為本發(fā)明實(shí)施例中Web服務(wù)器結(jié)構(gòu)圖3為本發(fā)明實(shí)施例中Web服務(wù)器在Web頁(yè)面中嵌入標(biāo)簽的流程圖。
具體實(shí)施例方式
本發(fā)明通過(guò)Web服務(wù)器在向客戶端發(fā)送Web頁(yè)面前先掃描所述頁(yè)面的代 碼以確定插入標(biāo)簽Tag的指定位置,并在該位置嵌入標(biāo)簽代碼,以減少工作量 和避免頁(yè)面遺漏標(biāo)簽。
參閱圖2A所示,本發(fā)明實(shí)施例中的網(wǎng)站系統(tǒng)包括客戶端20、 Web服務(wù)器 21和日志文件服務(wù)器22。所迷客戶端20用于向Web服務(wù)器21發(fā)送Web頁(yè)面 瀏覽請(qǐng)求、接收Web服務(wù)器21發(fā)送的嵌入Tag的頁(yè)面,并根據(jù)所述Tag向日 志文件服務(wù)器22發(fā)送相應(yīng)的訪問(wèn)信息;所述Web服務(wù)器21用于根據(jù)客戶端 20的請(qǐng)求獲取需要發(fā)送給客戶端20的頁(yè)面,掃描所述頁(yè)面的代碼以定位到插 入Tag的指定位置并在該指定位置嵌入標(biāo)簽代碼,以及將嵌入Tag的頁(yè)面發(fā)送 給所M戶端20;所述日志文件服務(wù)器用于根據(jù)客戶端發(fā)送的訪問(wèn)信息生成相 應(yīng)的訪問(wèn)日志。
參閱圖2B所示,所述Web服務(wù)器21包括接收單元210、選取單元211、 處理單元212和發(fā)送單元213。所迷接收單元210用于接收客戶端發(fā)送的Web 頁(yè)面瀏覽請(qǐng)求;所述選取單元211用于根據(jù)所述Web頁(yè)面瀏覽請(qǐng)求選取相應(yīng)的 靜態(tài)頁(yè)面或動(dòng)態(tài)頁(yè)面;所述處理單元212用于掃描所述選取的靜態(tài)頁(yè)面或動(dòng)態(tài) 頁(yè)面的代碼以確定嵌入Tag的指定位置,并在該位置添加標(biāo)簽代碼;所述發(fā)送 單元213用于將嵌入Tag的靜態(tài)頁(yè)面或動(dòng)態(tài)頁(yè)面發(fā)送給客戶端20,所述標(biāo)簽代 碼由網(wǎng)站工程師預(yù)先定義并存儲(chǔ)在Web服務(wù)器21上,并根據(jù)實(shí)際需要定期進(jìn) 行更新。
Web頁(yè)面中插入Tag可以根據(jù)實(shí)際需要來(lái)指定,如頁(yè)面代碼中〈body〉部分 的前面或后面(通過(guò)掃描代理中的"<body>"進(jìn)行定位),或者頁(yè)面中的其他 位置。
參閱圖3所示,Web服務(wù)器21在Web頁(yè)面中嵌入Tag的詳細(xì)流程如下
步驟300:用戶通過(guò)客戶端20向Web服務(wù)器21發(fā)送Web頁(yè)面瀏覽請(qǐng)求。 步驟301: Web服務(wù)器21根據(jù)所述請(qǐng)求在本地選取相應(yīng)的靜態(tài)頁(yè)面或在數(shù)
據(jù)庫(kù)中選M目關(guān)數(shù)據(jù)生成相應(yīng)的動(dòng)態(tài)頁(yè)面。
步驟302: Web服務(wù)器21掃描所述靜態(tài)頁(yè)面或動(dòng)態(tài)頁(yè)面的頁(yè)面代碼,確定
該頁(yè)面代碼中〈body〉部分的位置,并將標(biāo)簽代碼嵌入所述〈body〉部分的前面或后面。
步驟303: Web服務(wù)器21將含有Tag的靜態(tài)頁(yè)面或動(dòng)態(tài)頁(yè)面發(fā)送給客戶端20。
客戶端20接收到Web服務(wù)器21發(fā)送的靜態(tài)頁(yè)面或動(dòng)態(tài)頁(yè)面后,通過(guò)Web瀏覽器將所述頁(yè)面呈現(xiàn)給用戶,并根據(jù)該頁(yè)面中嵌入的Tag將所述用戶的訪問(wèn)
信息發(fā)送給日志文件服務(wù)器22,由日志文件服務(wù)器22根據(jù)所述訪問(wèn)信息生成
相應(yīng)的日志文件并統(tǒng)一進(jìn)行數(shù)據(jù)分析。
例如 一個(gè)Web頁(yè)面的代碼如下 <!DOCnTEHIMLPUBLIC'VAV3a/DTDHIML4jM//EN" 'TittiK/ www.w3^oi^nMitaiM^rictdfer^
<formula>formula see original document page 9</formula>Web服務(wù)器21掃描到該頁(yè)面的代碼中的〈Body〉部分后,將Tag代碼嵌入 到〈Body〉部分的后面,嵌入Tag代碼后Web頁(yè)面的代碼如下
這樣,所有由Web服務(wù)器21發(fā)送的靜態(tài)頁(yè)面或動(dòng)態(tài)頁(yè)面都會(huì)被嵌入Tag 而不會(huì)被遺漏,其相應(yīng)的訪問(wèn)信息也會(huì)由客戶端20發(fā)送至日志文件服務(wù)器22。通過(guò)Web服務(wù)器21在發(fā)送Web頁(yè)面時(shí)在頁(yè)面的指定位置添加標(biāo)簽代碼, 既保留了通過(guò)標(biāo)簽生成訪問(wèn)日志的優(yōu)點(diǎn),又防止了部分Web頁(yè)面在嵌入標(biāo)簽時(shí) 被遺漏,從而確保了日志文件數(shù)據(jù)分析結(jié)果的準(zhǔn)確性;同時(shí),對(duì)于靜態(tài)頁(yè)面, 不再需要手工插入標(biāo)簽,對(duì)于動(dòng)態(tài)頁(yè)面不再需要手工修改程序代碼來(lái)調(diào)用公共 模板,從而大幅度地降低了工作量。顯然,本領(lǐng)域的技術(shù)人員可以對(duì)本發(fā)明進(jìn)行各種改動(dòng)和變型而不脫離本發(fā)明的精神和范圍。這樣,倘若本發(fā)明的這些修改和變型屬于本發(fā)明權(quán)利要求及 其等同技術(shù)的范圍之內(nèi),則本發(fā)明也意圖包含這些改動(dòng)和變型在內(nèi)。
權(quán)利要求
1、 一種在Web頁(yè)面中添加標(biāo)簽的方法,其特征在于,包括 Web服務(wù)器根據(jù)客戶端的請(qǐng)求獲取需要發(fā)送給該客戶端的頁(yè)面;所述Web ^^務(wù)器掃描所述頁(yè)面的代碼以定位到插入標(biāo)簽的指定位置,并在 該指定位置嵌入標(biāo)簽代碼;所述Web服務(wù)器將嵌入標(biāo)識(shí)代碼的頁(yè)面發(fā)送給所述客戶端。
2、 如權(quán)利要求l所述的方法,其特征在于,所述Web服務(wù)器獲取的頁(yè)面 包括靜態(tài)頁(yè)面和動(dòng)態(tài)頁(yè)面。
3、 如權(quán)利要求1或2所述的方法,其特征在于,所述客戶端在接收到嵌 入標(biāo)簽的頁(yè)面后,根據(jù)該標(biāo)簽將相應(yīng)的訪問(wèn)信息發(fā)送給日志文件服務(wù)器。
4、 如權(quán)利要求3所述的方法,其特征在于,所述日志文件服務(wù)器根據(jù)所 述訪問(wèn)信息生成相應(yīng)的訪問(wèn)日志。
5、 一種Web服務(wù)器,其特征在于,包括 用于接4i^戶端發(fā)送的Web頁(yè)面瀏覽請(qǐng)求的單元; 用于獲取需要發(fā)送給客戶端的頁(yè)面的單元;用于掃描所述頁(yè)面的代碼以定位插入標(biāo)簽的指定位置,并在該指定位置嵌 入標(biāo)簽代碼的單元;用于向客戶端發(fā)送嵌入標(biāo)識(shí)代碼的頁(yè)面的單元。
6、 如權(quán)利要求5所述的Web服務(wù)器,其特征在于,所述Web服務(wù)器獲取 的頁(yè)面包括靜態(tài)頁(yè)面和動(dòng)態(tài)頁(yè)面。
7、 一種網(wǎng)站系統(tǒng),其特征在于,包括客戶端,用于向Web服務(wù)器發(fā)送Web頁(yè)面瀏覽請(qǐng)求、接收Web服務(wù)器發(fā) 送的嵌入標(biāo)簽的頁(yè)面,并根據(jù)所述標(biāo)簽向日志文件服務(wù)器發(fā)送相應(yīng)的訪問(wèn)信 息;德b服務(wù)器,用于根據(jù)客戶端的請(qǐng)求獲取需要發(fā)送給該客戶端的頁(yè)面,掃 描所迷頁(yè)面的代碼以定位到插入標(biāo)簽的指定位置并在該指定位置嵌入標(biāo)簽代 碼,以及將嵌入標(biāo)識(shí)代碼的頁(yè)面發(fā)送給所述客戶端。
8、 如權(quán)利要求7所述的網(wǎng)站系統(tǒng),其特征在于,還包括日志文件服務(wù)器,用于根據(jù)客戶端發(fā)送的訪問(wèn)信息生成相應(yīng)的訪問(wèn)日志。
9、 如權(quán)利要求7所述的網(wǎng)站系統(tǒng),其特征在于,所述Web服務(wù)器包括 用于接4^1戶端發(fā)送的Web頁(yè)面瀏覽請(qǐng)求的單元;用于獲取需要發(fā)送給客戶端的頁(yè)面的單元;用于掃描所述頁(yè)面代碼以定位插入標(biāo)簽的指定位置,并在該指定位置嵌入 標(biāo)簽代碼的單元;用于向客戶端發(fā)送嵌入標(biāo)識(shí)代碼的頁(yè)面的單元。
全文摘要
本發(fā)明公開了一種在Web頁(yè)面中添加標(biāo)簽的方法,該方法為Web服務(wù)器根據(jù)客戶端的請(qǐng)求獲取需要發(fā)送給該客戶端的頁(yè)面,掃描所述頁(yè)面的代碼以定位到插入標(biāo)簽的指定位置并在該指定位置嵌入標(biāo)簽代碼,以及將嵌入標(biāo)識(shí)代碼的頁(yè)面發(fā)送給客戶端。這樣,便解決了現(xiàn)有技術(shù)下Web服務(wù)器向客戶端發(fā)送的Web頁(yè)面中有部分頁(yè)面沒(méi)有嵌入標(biāo)簽,從而導(dǎo)致日志文件數(shù)據(jù)分析結(jié)果不準(zhǔn)確的問(wèn)題;既保留了通過(guò)標(biāo)簽生成訪問(wèn)日志的優(yōu)點(diǎn),又防止了部分Web頁(yè)面在嵌入標(biāo)簽時(shí)被遺漏,同時(shí)也減少了網(wǎng)站工程師的工作量。本發(fā)明還公開了一種Web服務(wù)器和一種網(wǎng)站系統(tǒng)。
文檔編號(hào)H04L12/24GK101145936SQ20061012721
公開日2008年3月19日 申請(qǐng)日期2006年9月12日 優(yōu)先權(quán)日2006年9月12日
發(fā)明者張金銀, 昂 李, 李江華 申請(qǐng)人:阿里巴巴公司