專利名稱:用于數(shù)據(jù)獲取和分析的系統(tǒng)和方法
技術(shù)領(lǐng)域:
本公開涉及捕獲數(shù)據(jù),以及更具體地,涉及捕獲由web服務(wù)器所 接收和傳送的數(shù)據(jù)。
背景技術(shù):
可以通過多種技術(shù)測試web應(yīng)用的安全問題,這些技術(shù)確定被測 試web應(yīng)用的弱點(diǎn)。例如,當(dāng)前的技術(shù)可以使用例如"爬蟲(spider)" 或"代理服務(wù)器,,以通過web應(yīng)用記錄多種^各徑,并可以分析并生成 用于測試該web站點(diǎn)的腳本。
雖然這些方式可以產(chǎn)生有效用于測試不同安全"漏洞"的腳本, 但其中存在著缺陷。例如,使用"爬蟲"來評估web應(yīng)用可能產(chǎn)生數(shù)
據(jù),其包括該web應(yīng)用可能的交互的許多組合。不利地,這可能導(dǎo)致 許多非典型實(shí)際使用的應(yīng)用流程。而且,它們可能錯(cuò)過通過應(yīng)用的關(guān) 鍵流程,因?yàn)檩斔徒o爬蟲的輸入數(shù)據(jù)不夠完整以致無法驅(qū)動(dòng)完整的應(yīng)用。
而且,雖然使用"代理服務(wù)器"來記錄實(shí)際的(執(zhí)行實(shí)際活動(dòng)的) "人類,,用戶可能生成模仿現(xiàn)實(shí)生活的交互流程,但是執(zhí)行測試的測 試者可能沒有充分地記錄所有適當(dāng)?shù)牧鞒獭2焕?,這可能產(chǎn)生對涉 及web站點(diǎn)質(zhì)量的4普誤認(rèn)識(shí)。
發(fā)明內(nèi)容
在本公開的第一實(shí)施方式中, 一種捕獲數(shù)據(jù)的方法包括監(jiān)控由服 務(wù)于web站點(diǎn)的web服務(wù)器接收的多個(gè)引入數(shù)據(jù)元。將該多個(gè)引入 數(shù)據(jù)元的至少一部分寫入用于web站點(diǎn)的日志文件。監(jiān)控多個(gè)引出數(shù) 據(jù)元,該多個(gè)引出數(shù)據(jù)元由所述web服務(wù)器至少部分地響應(yīng)于所述引
入數(shù)據(jù)元而傳送。將該多個(gè)引出數(shù)據(jù)元的至少一部分寫入用于web站 點(diǎn)的日志文件。
也可以包括下列一個(gè)或多個(gè)特征??蓪?huì)話標(biāo)識(shí)符指派給引入和 引出數(shù)據(jù)元的一個(gè)或多個(gè)??蓪?huì)話標(biāo)識(shí)符寫入用于web站點(diǎn)的日志 文件??蓪r(shí)間戳指派給引入和引出數(shù)據(jù)元的一個(gè)或多個(gè)??蓪r(shí)間 戳寫入用于web站點(diǎn)的日志文件。引出數(shù)據(jù)元可包括JavaScript;、 cookies、 POST數(shù)據(jù)、HTML代碼、ASCII文本、圖形單元、二進(jìn)制 數(shù)據(jù)、可執(zhí)行數(shù)據(jù)、XML格式的數(shù)據(jù)以及格式化的SOAP請求/響應(yīng) 中的一個(gè)或多個(gè)。引出數(shù)據(jù)元可以定義由web服務(wù)器所服務(wù)并包含于 該web站點(diǎn)內(nèi)的web頁的至少 一部分。
在本公開的另一個(gè)實(shí)施方式中, 一種計(jì)算機(jī)程序產(chǎn)品包括具有計(jì) 算機(jī)可讀程序的計(jì)算機(jī)可用介質(zhì)。當(dāng)在計(jì)算機(jī)上執(zhí)行時(shí),該計(jì)算機(jī)程 序產(chǎn)品使該計(jì)算機(jī)監(jiān)控由服務(wù)于web站點(diǎn)的web服務(wù)器接收的多個(gè) 引入數(shù)據(jù)元。將該多個(gè)引入數(shù)據(jù)元的至少一部分寫入用于web站點(diǎn)的 日志文件。監(jiān)控多個(gè)引出數(shù)據(jù)元,該多個(gè)數(shù)據(jù)元由所述web服務(wù)器至 少部分地響應(yīng)于所述引入數(shù)據(jù)元而傳送。將該多個(gè)引出數(shù)據(jù)元的至少 一部分寫入用于web站點(diǎn)的日志文件。
也可以包括下列一個(gè)或多個(gè)特征??蓪?huì)話標(biāo)識(shí)符指派給引入和 引出數(shù)據(jù)元的一個(gè)或多個(gè)??蓪?huì)話標(biāo)識(shí)符寫入用于web站點(diǎn)的日志 文件??蓪r(shí)間戳指派給引入和引出數(shù)據(jù)元的一個(gè)或多個(gè)。可將時(shí)間 戳寫入用于web站點(diǎn)的日志文件。引出數(shù)據(jù)元可包括JavaScript, cookies、 POST數(shù)據(jù)、HTML代碼、ASCII文本、圖形單元、二進(jìn)制 數(shù)據(jù)、可執(zhí)行數(shù)據(jù)、XML格式的數(shù)據(jù)以及格式化的SOAP請求/響應(yīng) 中的一個(gè)或多個(gè)。引出數(shù)據(jù)元可以定義由web服務(wù)器所服務(wù)并且包含 于該web站點(diǎn)內(nèi)的web頁的至少一部分。
在本公開的另一個(gè)實(shí)施方式中, 一種分析數(shù)據(jù)的方法包括定義日 志文件,其包括由web服務(wù)器接收的多個(gè)引入數(shù)據(jù)元,以及該多個(gè)引
將日志文件解析為單獨(dú)的會(huì)話。
也可以包括下列一個(gè)或多個(gè)特征。引出數(shù)據(jù)元可包括JavaScript、 cookies、 POST數(shù)據(jù)、HTML代碼、ASCII文本、圖形單元、二進(jìn)制 數(shù)據(jù)、可執(zhí)行數(shù)據(jù)、XML格式的數(shù)據(jù)以及格式化的SOAP請求/響應(yīng) 中的一個(gè)或多個(gè)。引出數(shù)據(jù)元可以定義由web服務(wù)器所服務(wù)的web 頁的至少一部分。日志文件可以包括一個(gè)或多個(gè)會(huì)話標(biāo)識(shí)符,以及一 個(gè)或多個(gè)時(shí)間戳??梢源_定該web站點(diǎn)的一個(gè)或多個(gè)部分的一個(gè)或多 個(gè)使用參數(shù)??梢源_定該web站點(diǎn)的一個(gè)或多個(gè)部分的一個(gè)或多個(gè)弱 點(diǎn)。在本公開的另一個(gè)實(shí)施方式中, 一種計(jì)算機(jī)程序產(chǎn)品包括具有計(jì) 算機(jī)可讀程序的計(jì)算機(jī)可用介質(zhì)。當(dāng)在計(jì)算機(jī)上執(zhí)行時(shí),該計(jì)算機(jī)可 讀程序使該計(jì)算機(jī)定義日志文件,其包括由web服務(wù)器接收的多個(gè)引 入數(shù)據(jù)元,以及該多個(gè)引出數(shù)據(jù)元由所述web服務(wù)器至少部分地響應(yīng) 于所述引入數(shù)據(jù)元而傳送。將日志文件解析到單獨(dú)的會(huì)話。也可以包括下列一個(gè)或多個(gè)特征。引出數(shù)據(jù)元可包括JavaScript、 cookies、 POST數(shù)據(jù)、HTML代碼、ASCII文本、圖形單元、二進(jìn)制 數(shù)據(jù)、可執(zhí)行數(shù)據(jù)、XML格式的數(shù)據(jù)以及格式化的SOAP請求/響應(yīng) 中的一個(gè)或多個(gè)。引出數(shù)據(jù)元可以定義由web服務(wù)器所服務(wù)的web 頁的至少一部分。日志文件可以包括一個(gè)或多個(gè)會(huì)話標(biāo)識(shí)符,以及一 個(gè)或多個(gè)時(shí)間戳??梢源_定該web站點(diǎn)的一個(gè)或多個(gè)部分的一個(gè)或多 個(gè)使用參數(shù)。可以確定該web站點(diǎn)的一個(gè)或多個(gè)部分的一個(gè)或多個(gè)弱 點(diǎn)。根據(jù)附圖和下文的說明書列出一個(gè)或多個(gè)實(shí)現(xiàn)的細(xì)節(jié)。從說明 書、附圖和權(quán)利要求中,其他特征和優(yōu)點(diǎn)將變得顯而易見。
圖l是整體上或部分地由耦接到分布式計(jì)算網(wǎng)絡(luò)中的計(jì)算機(jī)所執(zhí) 行的數(shù)據(jù)獲取進(jìn)程的示意圖;圖2是由圖1的計(jì)算機(jī)作為主機(jī)的web站點(diǎn)的示意圖; 圖3是圖1的數(shù)據(jù)獲取進(jìn)程的流程圖; 圖4是由圖1的數(shù)據(jù)獲取進(jìn)程生成的日志文件的示意圖;圖5是由圖1的數(shù)據(jù)獲取進(jìn)程生成的經(jīng)修改的日志文件的示意圖;圖6是會(huì)話流程的圖示; 圖7是會(huì)話流程的圖示; 圖8是會(huì)話流程的圖示; 圖9是會(huì)話流程的圖示;以及 圖IO是會(huì)話流程的圖示。
具體實(shí)施方式
綜述正如下文將要更詳細(xì)討論的,本公開可利用完全地硬件實(shí)施方 式、完全地軟件實(shí)施方式或包含硬件單元和軟件單元二者的實(shí)施方式 的形式。在優(yōu)選的實(shí)施方式中,本公開可用軟件實(shí)現(xiàn),該軟件可包括 但不限于固件、駐留軟件、微代碼等。而且,本公開可利用從計(jì)算機(jī)可用或計(jì)算機(jī)可讀介質(zhì)上可訪問的 計(jì)算機(jī)程序產(chǎn)品的形式,該計(jì)算機(jī)可用或計(jì)算機(jī)可讀介質(zhì)提供了由計(jì) 算機(jī)或任何指令執(zhí)行系統(tǒng)所使用或與它們有關(guān)的程序代碼。為了本說 明的目的,計(jì)算機(jī)可用或計(jì)算機(jī)可讀介質(zhì)可以是能夠包含、存儲(chǔ)、通 信、傳播或傳輸程序的任何器件,該程序由指令執(zhí)行系統(tǒng)、器件或設(shè) 備使用或與它們相關(guān)。該介質(zhì)可以是電、磁、光、電磁、紅外或半導(dǎo)體系統(tǒng)(或器件或 設(shè)備)或傳播媒介。計(jì)算機(jī)可讀介質(zhì)的例子包括半導(dǎo)體或固態(tài)存儲(chǔ)器、 磁帶、可移除計(jì)算機(jī)磁盤、隨機(jī)訪問存儲(chǔ)器(RAM)、只讀存儲(chǔ)器 (ROM)、剛性磁盤和光盤。光盤的當(dāng)前的例子可以包括但不限于, 壓縮盤只讀存儲(chǔ)器(CD-ROM)、壓縮盤讀/寫(CD-R/W)和DVD。適合于存儲(chǔ)和/或執(zhí)行程序代碼的數(shù)據(jù)處理系統(tǒng)可以包括通過系 統(tǒng)總線直接或間接耦接到存儲(chǔ)器單元的至少一個(gè)處理器。存儲(chǔ)器單元
儲(chǔ)設(shè)備以及高速緩沖存儲(chǔ)器,其可以提供至少 一 些程序代碼的臨時(shí)存 儲(chǔ)設(shè)備以便減少在執(zhí)行期間必須從大容量存儲(chǔ)設(shè)備重新取得代碼的 次數(shù)。可將輸入/輸出或1/0設(shè)備(包括但不限于鍵盤、顯示器、指點(diǎn)設(shè) 備等)直接或通過居間的1/0控制器耦接到系統(tǒng)。也可將網(wǎng)絡(luò)適配器耦接到系統(tǒng),以支持?jǐn)?shù)據(jù)處理系統(tǒng)變?yōu)橥ㄟ^居 間的私有或公共網(wǎng)絡(luò)耦接到其他數(shù)據(jù)處理系統(tǒng)或遠(yuǎn)程打印機(jī)或存儲(chǔ) 設(shè)備。調(diào)制解調(diào)器、電纜調(diào)制解調(diào)器和以太網(wǎng)網(wǎng)卡正是一些當(dāng)前網(wǎng)絡(luò) 適配器的可用類型。參考圖1,示出了 (整體或部分地)駐留于服務(wù)器計(jì)算機(jī)12 (例 如,單一服務(wù)器計(jì)算機(jī)、多個(gè)服務(wù)器計(jì)算機(jī)或通用目的計(jì)算機(jī))之中,并由服務(wù)器計(jì)算機(jī)12 (整體或部分地)運(yùn)行的數(shù)據(jù)獲取進(jìn)程10。正 如將在下文更詳細(xì)討論的,數(shù)據(jù)獲取進(jìn)程IO可以監(jiān)控由服務(wù)器計(jì)算 機(jī)12接收并傳送的全部數(shù)據(jù)元,并將其記入日志??蓪⒎?wù)器計(jì)算機(jī)12耦接到分布式計(jì)算網(wǎng)絡(luò)14(例如,因特網(wǎng))。 計(jì)算機(jī)系統(tǒng)12可以是例如運(yùn)行網(wǎng)絡(luò)操作系統(tǒng)的web服務(wù)器,對其的 舉例可以包括^旦不限于Microsoft Windows XP Server 或Redhat LinuTM服務(wù)器計(jì)算機(jī)12也可以執(zhí)行web服務(wù)器應(yīng)用,對其的舉例可以 包括但不限于Microsoft IISTM,或Apache Webserver ,其允許經(jīng)由 網(wǎng)絡(luò)14對服務(wù)器計(jì)算機(jī)12進(jìn)行HTTP (即,超文本傳輸協(xié)議)訪問。 可以將網(wǎng)絡(luò)14耦接到一個(gè)或多個(gè)次級網(wǎng)絡(luò)(例如網(wǎng)絡(luò)16),諸如作 為舉例,局域網(wǎng)、廣域網(wǎng)或企業(yè)內(nèi)部網(wǎng)。此外或可選地,如用虛鏈路 線18所示出的,可將服務(wù)器計(jì)算機(jī)12通過次級網(wǎng)絡(luò)16耦接到網(wǎng)絡(luò) 14??梢源鎯?chǔ)在耦接到服務(wù)器計(jì)算機(jī)12的存儲(chǔ)設(shè)備20中的數(shù)據(jù)獲取 進(jìn)程10的指令集合和子程序可以由合并到服務(wù)器計(jì)算機(jī)12的一個(gè)或 多個(gè)處理器(未示出)以及一種或多種存儲(chǔ)器架構(gòu)(未示出)來執(zhí)行。 存儲(chǔ)設(shè)備20可以包括但不限于硬盤驅(qū)動(dòng)器、磁帶驅(qū)動(dòng)器、光驅(qū)、RAID
陣列、隨機(jī)訪問存儲(chǔ)器(RAM)或只讀存儲(chǔ)器(ROM)??蓪?shù)據(jù) 獲取進(jìn)程10合并到上述web服務(wù)器應(yīng)用的小應(yīng)用程序中。再參考圖2,服務(wù)器計(jì)算機(jī)12可以作為一個(gè)或多個(gè)web站點(diǎn)(例 如web站點(diǎn)100)的主機(jī),其可以包括以可用層次化樣式(hierarchical fashion)布置的一個(gè)或多個(gè)web頁。用戶22、 24、 26、 28可以使用 一個(gè)或多個(gè)用戶計(jì)算設(shè)備訪問一個(gè)或多個(gè)web站點(diǎn)(例如web站點(diǎn) 100),用戶計(jì)算設(shè)備的例子包括但不限于例如,用戶計(jì)算機(jī)30、 用戶計(jì)算機(jī)32、個(gè)人數(shù)字助理34、支持?jǐn)?shù)據(jù)的蜂窩電話36、膝上計(jì) 算機(jī)(未示出)、筆記本計(jì)算機(jī)(未示出)、電纜盒(未示出)、電 視(未示出)、游戲控制臺(tái)(未示出)以及專用網(wǎng)絡(luò)用具(未示出)。各用戶計(jì)算機(jī)30、用戶計(jì)算機(jī)32、個(gè)人數(shù)字助理34和支持?jǐn)?shù)據(jù) 的蜂窩電話36可(分別地)執(zhí)行客戶端應(yīng)用38、 40、 42、 44,該客 戶端應(yīng)用允許例如用戶22、 24、 26、 28訪問服務(wù)器計(jì)算機(jī)12以及由 服務(wù)器計(jì)算機(jī)12作為主機(jī)的一個(gè)或多個(gè)web站點(diǎn)(例如web站點(diǎn) 100)??蛻舳藨?yīng)用38、 40、 42、 44的例子可以包括^旦不限于諸如 Microsoft Internet Explorer TM、 Mozilla Firefox 和Netscape Navigator tm的web瀏覽器應(yīng)用。可以存儲(chǔ)在(分別)耦接到用戶計(jì)算機(jī)30、 32、個(gè)人數(shù)字助理 34和支持?jǐn)?shù)據(jù)的蜂窩電話36的存儲(chǔ)設(shè)備46、 48、 50、 52的客戶端應(yīng) 用38、 40、 42、 44的指令集合和子程序可以由合并入用戶計(jì)算機(jī)30、 32、個(gè)人數(shù)字助理34和支持?jǐn)?shù)據(jù)的蜂窩電話36的一個(gè)或多個(gè)處理器 (未示出)以及一個(gè)或多個(gè)存儲(chǔ)器架構(gòu)(未示出)來執(zhí)行。存儲(chǔ)設(shè)備 46、 48、 50、 52可以包括但不限于硬盤驅(qū)動(dòng)器、磁帶驅(qū)動(dòng)器、光驅(qū)、 RAID陣列、隨機(jī)訪問存儲(chǔ)器(RAM)、只讀存儲(chǔ)器(ROM)、壓縮 閃速(CF)存儲(chǔ)設(shè)備、安全數(shù)字(SD)存儲(chǔ)設(shè)備和記憶棒存儲(chǔ)設(shè)備。用戶計(jì)算機(jī)30、 32、個(gè)人數(shù)字助理34和支持?jǐn)?shù)據(jù)的蜂窩電話36 可以執(zhí)行操作系統(tǒng),對其的舉例可以包括但不限于Microsoft Windows XPTM, Microsoft Windows Mobile 以及Redhat Linux 。各種計(jì)算設(shè)備(例如,用戶計(jì)算機(jī)30、 32;個(gè)人數(shù)字助理34和
支持?jǐn)?shù)據(jù)的蜂窩電話36)可以直接或間接地耦接到網(wǎng)絡(luò)14 (或網(wǎng)絡(luò) 16)。例如,示出了將用戶計(jì)算機(jī)32、 34經(jīng)由硬接線網(wǎng)絡(luò)連接直接 耦接到網(wǎng)絡(luò)14。此外,示出經(jīng)由建立在個(gè)人數(shù)字助理34和無線接入 點(diǎn)(即,WAP) 56的無線通信信道54而耦接到網(wǎng)絡(luò)14的個(gè)人數(shù)字 助理34,所示出的無線接入點(diǎn)56被直接耦接到網(wǎng)絡(luò)14。另外,示出 了將蜂窩電話36無線地耦接到蜂窩網(wǎng)絡(luò)/橋58,所示出的蜂窩網(wǎng)絡(luò)/ 橋58被直接耦接到網(wǎng)絡(luò)14。WAP 56可以是例如IEEE 802.1 la、 802.1 lb、 802.1 lg、 Wi-Fi和/ 或藍(lán)牙設(shè)備,其能夠建立在個(gè)人數(shù)字助理34和WAP 56之間的安全 通信信道54。眾所周知,所有的IEEE802.11x規(guī)范使用以太網(wǎng)協(xié)議以及具有碰 撞避免的載波偵聽多路訪問(即,CSMA/CA)用于路徑共享。各種 802.11x規(guī)范可以使用例如移相鍵控(即,PSK)調(diào)制或補(bǔ)碼鍵控(即, CCK)調(diào)制。眾所周知,藍(lán)牙是電信產(chǎn)業(yè)標(biāo)準(zhǔn),其允許例如移動(dòng)電話、 計(jì)算機(jī)和個(gè)人數(shù)字助理使用短距離無線連接互連。 數(shù)據(jù)獲取進(jìn)程操作正如上文所討論的,數(shù)據(jù)獲取進(jìn)程IOO可以監(jiān)控由服務(wù)器計(jì)算機(jī) 12接收并傳送的數(shù)據(jù)元,并將其記入日志。當(dāng)用戶22、 24、 26、 28 訪問例如web站點(diǎn)100 (例如,分別地經(jīng)由客戶端應(yīng)用38、 40、 42、 44)的多個(gè)部分時(shí),用戶計(jì)算機(jī)30、 32、個(gè)人數(shù)字助理34和支持?jǐn)?shù) 據(jù)的蜂窩電話36 (分別地)可以向服務(wù)器計(jì)算機(jī)12提供引入數(shù)據(jù)元 (例如,數(shù)據(jù)元60、 62、 64、 66)。這些引入數(shù)據(jù)元的例子可以包括 但不限于web頁請求、被鍵入到包括在例如web站點(diǎn)100的web頁 內(nèi)的表單的表單數(shù)據(jù)、JavaScript、 cookies、 POST數(shù)據(jù)、HTML代碼、 ASCII文本、圖形單元、二進(jìn)制數(shù)據(jù)、可執(zhí)行數(shù)據(jù)、XML格式的數(shù) 據(jù)以及格式化的SOAP請求/響應(yīng)。再參看圖3,數(shù)據(jù)獲取進(jìn)程10可以監(jiān)控150由可以服務(wù)于web 站點(diǎn)100的服務(wù)器計(jì)算機(jī)12所接收的這些引入數(shù)據(jù)元(例如,單元 60、 62、 64、 66)。可將多個(gè)引入數(shù)據(jù)元(例如,單元60、 62、 64、66)的至少一部分寫入日志文件68,其可以關(guān)聯(lián)于正在進(jìn)行的數(shù)據(jù)獲 取所用于的web站點(diǎn)(例如,web站點(diǎn)100 )。曰志文件68可以用多種方式結(jié)構(gòu)化,所有這些方式都被考慮在 本公開范圍內(nèi)。例如,日志文件68可以是表格式的ASCII文件,其 定義了由數(shù)據(jù)獲取進(jìn)程IO監(jiān)控150、 154的多種數(shù)據(jù)元??蛇x地,日 志文件68可以是數(shù)據(jù)庫,其中,例如,為每個(gè)獨(dú)特的會(huì)話建立記錄 (將在下文更加詳細(xì)地討論)。可將日志文件68存儲(chǔ)在耦接到服務(wù) 器計(jì)算機(jī)12的存儲(chǔ)設(shè)備20上。響應(yīng)于由服務(wù)器計(jì)算機(jī)12所接收的數(shù)據(jù)元(例如,單元60、 62、 64、 66),服務(wù)器計(jì)算機(jī)12 (特別地,以及上文描述的web服務(wù)器 應(yīng)用)通??梢韵蜻m當(dāng)?shù)慕邮斩?例如,用戶計(jì)算機(jī)30、用戶計(jì)算機(jī) 32、個(gè)人數(shù)字助理34、支持?jǐn)?shù)據(jù)的蜂窩電話36)傳送多個(gè)引出數(shù)據(jù) 元(例如,單元70、 72、 74、 76)。數(shù)據(jù)獲取進(jìn)程10可以監(jiān)控154所傳送的數(shù)據(jù)元(例如,單元70、 72、 74、 76)??蓪⒍鄠€(gè)引出數(shù)據(jù)元(例如,單元70、 72、 74、 76) 的至少一部分寫入156日志文件68,其可以關(guān)聯(lián)于正在進(jìn)行的數(shù)據(jù)獲 取所針對的web站點(diǎn)(例如,web站點(diǎn)100)。這些引出數(shù)據(jù)元的例 子可以包括但不限于JavaScript、 cookies、 POST數(shù)據(jù)、HTML代碼、 ASCII文本、圖形單元、二進(jìn)制數(shù)據(jù)、可執(zhí)行數(shù)據(jù)、XML格式的數(shù) 據(jù)以及格式化的SOAP請求/響應(yīng)。例如,假設(shè)用戶22 (經(jīng)由計(jì)算機(jī)30)希望訪問web站點(diǎn)100的 主頁102。用戶22可以向客戶端應(yīng)用38(其由用戶計(jì)算機(jī)30所執(zhí)行) 輸入例如"www.homepage.com"。通過^f吏用多種網(wǎng)絡(luò)i殳備(例如, DNA服務(wù)器和中間網(wǎng)絡(luò)設(shè)備),可由例如服務(wù)器計(jì)算機(jī)12接收適當(dāng) 的引入數(shù)據(jù)元(例如,數(shù)據(jù)元60)。當(dāng)數(shù)據(jù)獲取進(jìn)程IO正在監(jiān)控150 由服務(wù)器計(jì)算機(jī)12接收的引入數(shù)據(jù)元時(shí),數(shù)據(jù)獲取進(jìn)程IO可以將所 接收的引入數(shù)據(jù)元寫入152日志文件68。日志文件68可以包含例如 所接收的實(shí)際數(shù)據(jù)元(例如,對主頁200的請求,被輸入到包括在例 如web站點(diǎn)100的web頁中的表單的數(shù)據(jù),JavaScript, cookies, POST
數(shù)據(jù),HTML代碼,ASCII文本,圖形單元,二進(jìn)制數(shù)據(jù),可執(zhí)行數(shù) 據(jù),XML格式的數(shù)據(jù),以及格式化的SOAP請求/響應(yīng))或定位所接 收的數(shù)據(jù)元的指針(其可以被存儲(chǔ)在例如耦接到服務(wù)器計(jì)算機(jī)12的 存儲(chǔ)設(shè)備20中)。再參看圖4,當(dāng)寫入152、 156日志文件68時(shí),可以用由服務(wù)器 計(jì)算機(jī)12所接收的數(shù)據(jù)元逐條列記的條目來添加日志文件68。例如, 行項(xiàng)目200是對由服務(wù)器計(jì)算機(jī)12所接收的來自用戶計(jì)算機(jī)30的請 求的示出,其請求web站點(diǎn)100的主頁102。數(shù)據(jù)獲取進(jìn)程100可以向在用戶計(jì)算機(jī)30和服務(wù)器計(jì)算機(jī)12之 間建立的通信會(huì)話指派158會(huì)話標(biāo)識(shí)符202。例如,假設(shè)為上文所述 的通信會(huì)話指派158會(huì)話標(biāo)識(shí)符"01"。數(shù)據(jù)獲取進(jìn)程10可以向日 志文件68 (在行項(xiàng)目200內(nèi))寫入160會(huì)話標(biāo)識(shí)符202。數(shù)據(jù)獲取進(jìn)程IO還可以向由例如服務(wù)器計(jì)算機(jī)12所接收的引入 數(shù)據(jù)元(例如,數(shù)據(jù)元60)的一個(gè)或多個(gè)指派162時(shí)間戳204。時(shí)間 戳204可以是例如一天的實(shí)際時(shí)間或者允許生成對由服務(wù)器計(jì)算機(jī) 12接收并傳送的數(shù)據(jù)元的時(shí)間記錄的順序編號(hào)方式系統(tǒng)。數(shù)據(jù)獲取進(jìn) 程10可以向日志文件68 (在行項(xiàng)目200內(nèi))寫入64時(shí)間戳204 (例 如,時(shí)間00: 00)。正如上文所討論的,響應(yīng)于由服務(wù)器計(jì)算機(jī)12接收到引入數(shù)據(jù) 元(例如,單元60、 62、 64、 66),服務(wù)器計(jì)算沖幾12可以向適當(dāng)?shù)?接收端傳送多個(gè)引出數(shù)據(jù)元(例如,單元70、 72、 74、 76)。使用上 文所述的例子繼續(xù),當(dāng)用戶計(jì)算機(jī)30請求web站點(diǎn)100的主頁102 時(shí)(在行項(xiàng)目200中),web服務(wù)器應(yīng)用可以通過提供到用戶計(jì)算機(jī) 30的引出數(shù)據(jù)元70 (例如,主頁102的JavaScript, cookies、 POST 數(shù)據(jù)、HTML代碼、ASCII文本,圖形單元、二進(jìn)制數(shù)據(jù)、可執(zhí)行數(shù) 據(jù)、XML格式的數(shù)據(jù)和格式化的SOAP請求/響應(yīng))而完成該請求。 當(dāng)數(shù)據(jù)獲取進(jìn)程10正在監(jiān)控154由服務(wù)器計(jì)算機(jī)12傳送的引出數(shù)據(jù) 元時(shí),數(shù)據(jù)獲取進(jìn)程10可以向日志文件68寫入156所傳送的引出數(shù) 據(jù)元。由于使用了上文討論的所接收的數(shù)據(jù)元,日志文件68可包含 例如所傳送的實(shí)際數(shù)據(jù)元(例如,主頁102的JavaScript、 cookies、 POST數(shù)據(jù)、HTML代碼、ASCII文本,圖形單元、二進(jìn)制數(shù)據(jù)、可 執(zhí)行數(shù)據(jù)、XML格式的數(shù)據(jù)和格式化的SOAP請求/響應(yīng))或定位所 傳送的數(shù)據(jù)元的指針(其可以被存儲(chǔ)于例如耦接到服務(wù)器計(jì)算機(jī)12 的存儲(chǔ)設(shè)備20上)。可以用逐條列記了由服務(wù)器計(jì)算機(jī)12傳送的數(shù)據(jù)元的條目向日 志文件68添加。例如,行項(xiàng)目202是對響應(yīng)于前面所接收的對主頁 102的請求(如在行條目200中定義的)而由服務(wù)器計(jì)算機(jī)12所傳送 的數(shù)據(jù)元(例如,引出數(shù)據(jù)元70)的示出。以上文所述的例子繼續(xù),假設(shè)在服務(wù)器計(jì)算機(jī)12向用戶計(jì)算機(jī) 30傳送數(shù)據(jù)元70(如同在行條目202中定義的)之前,/人也請求web 站點(diǎn)100的"主頁"102的用戶計(jì)算機(jī)32接收請求。數(shù)據(jù)獲取進(jìn)程 10可以指派158可向日志文件68 (在行項(xiàng)目204內(nèi))寫入160的會(huì) 話標(biāo)識(shí)符202。因?yàn)檫@是新的通信會(huì)話(即,在服務(wù)器計(jì)算機(jī)12和用 戶計(jì)算機(jī)32之間的),可指派158新的會(huì)話標(biāo)識(shí)符(即,"02")。 數(shù)據(jù)獲取進(jìn)程10可以進(jìn)一步指派162可向日志文件68(在行項(xiàng)目204 內(nèi))寫入164的時(shí)間戳204 (即,00: 03 )。監(jiān)控150所接收的引入數(shù)據(jù)元、向引入數(shù)據(jù)元指派158、 162會(huì) 話標(biāo)識(shí)符和時(shí)間戳,并向日志文件68寫入152引入數(shù)據(jù)元(如由例 如行條目200、 204所示出的)的這種過程可以為由服務(wù)器計(jì)算機(jī)12 所接收的全部引入數(shù)據(jù)元而重復(fù)。而且,監(jiān)控154所傳送的引出數(shù)據(jù) 元、向引出數(shù)據(jù)元指派158、 162會(huì)話標(biāo)識(shí)符和時(shí)間戳、并寫156該 引出數(shù)據(jù)元(如同由行條目202所示出的)的過程可為由服務(wù)器計(jì)算 機(jī)12所傳送的全部數(shù)據(jù)元而重復(fù)。由于包括在日志文件68內(nèi)的每個(gè)"引入,,行項(xiàng)目(例如,行項(xiàng) 目200)定義了所接收的引入數(shù)據(jù)元(例如,引入數(shù)據(jù)元60),其被 接收的時(shí)間(通過時(shí)間戳204)以及用于特定通信會(huì)話的會(huì)話標(biāo)識(shí)符 202,所以包括在日志文件68內(nèi)的"引入"行項(xiàng)目的總和形成了由服 務(wù)器計(jì)算機(jī)12所接收的全部引入數(shù)據(jù)元的按時(shí)間順序的排列。
而且,由于包括在日志文件68內(nèi)的每個(gè)"引出"行項(xiàng)目(例如, 行項(xiàng)目202)定義了所傳送的引出數(shù)據(jù)元(例如,引出數(shù)據(jù)元70)、 其被接收的時(shí)間(通過時(shí)間戳204)以及用于特定通信會(huì)話的會(huì)話標(biāo) 識(shí)符202,所以包括在日志文件68內(nèi)的"引出"行項(xiàng)目的總和形成了 由服務(wù)器計(jì)算機(jī)12所傳送的全部引出數(shù)據(jù)元的按時(shí)間順序的排列。因而,在日志文件68內(nèi)的全部"引入"和"引出,,行項(xiàng)目的組 合形成了由服務(wù)器計(jì)算機(jī)12所接收和傳送的全部數(shù)據(jù)元的按時(shí)間順 序的排列。例如,對于會(huì)話"01"(即,在用戶計(jì)算機(jī)30和服務(wù)器計(jì)算機(jī) 12之間的會(huì)話),用戶22首先請求"主頁,,102 (見行項(xiàng)目200); 然后,服務(wù)器計(jì)算機(jī)12提供"主頁"102 (見行項(xiàng)目202);然后, 用戶22請求"照片頁"104 (見行項(xiàng)目206);然后,服務(wù)器計(jì)算機(jī) 12提供"照片頁"104 (見行項(xiàng)目208 );然后,用戶22請求"照片 1" 106(見行項(xiàng)目210);然后,服務(wù)器計(jì)算機(jī)12提供"照片1" 106 (見行項(xiàng)目212);然后,用戶22請求"照片2" 108(見行項(xiàng)目214); 以及,然后,服務(wù)器計(jì)算機(jī)12提供"照片2" 108 (見行項(xiàng)目216)。數(shù)據(jù)獲取進(jìn)程10可以解析166日志文件68,以輔助對日志文件 68的處理。作為舉例,并再參看圖5,可根據(jù)會(huì)話標(biāo)識(shí)符將日志文件 68解析166為分類的日志文件68,繼而,生成經(jīng)修改的日志文件68,。再參看圖5,經(jīng)修改的日志文件68,可以允許該日志文件的查閱者 來快速地確定在每個(gè)通信會(huì)話期間,由服務(wù)器計(jì)算機(jī)接收并傳送了哪 些數(shù)據(jù)元。例如,示出了經(jīng)修改的日志文件68,,以包括五個(gè)分開的 會(huì)話段250、 252、 254、 256、 258,其中每個(gè)分別用于通信會(huì)話"01"、 "02" 、"03" 、"04"和"05"。通過查閱經(jīng)修改的日志文件68,的特定會(huì)話段(例如,會(huì)話段250、 252、 254、 256、 258 ),查閱者可以容易地確定在特定通信會(huì)話期間, 由服務(wù)器計(jì)算機(jī)12傳送和接收了什么。作為舉例,并且在會(huì)話段252中示出的,在通信會(huì)話"02"(即, 在用戶計(jì)算機(jī)32和服務(wù)器計(jì)算機(jī)12之間的會(huì)話)期間用戶計(jì)算機(jī)32請求"主頁"102(見行項(xiàng)目204);然后,服務(wù)器計(jì)算機(jī)12提供"主頁"102 (見項(xiàng)目262);然后,用戶計(jì)算機(jī)32請求"新聞頁" IIO(見行項(xiàng)目264);以及,然后,服務(wù)器計(jì)算機(jī)12提供"新聞頁" 110 (見行項(xiàng)目266)。如同在會(huì)話段254中示出的,在通信會(huì)話"03"(即,在個(gè)人數(shù) 字助理34和服務(wù)器計(jì)算機(jī)12之間的會(huì)話)期間個(gè)人數(shù)字助理34 請求"主頁"102(見行項(xiàng)目268 );然后,服務(wù)器計(jì)算機(jī)12提供"主 頁"102(見項(xiàng)目270);然后,個(gè)人數(shù)字助理34請求"博客頁"112(見行項(xiàng)目272);以及,然后,服務(wù)器計(jì)算機(jī)12提供"博客頁,,112(見行項(xiàng)目274 )。如同在會(huì)話段256中示出的,在通信會(huì)話"04"(即,在支持?jǐn)?shù) 據(jù)的蜂窩電話36和服務(wù)器計(jì)算機(jī)12之間的會(huì)話)期間支持?jǐn)?shù)據(jù)的 蜂窩電話36請求"搜索頁,,114 (見行條目276);以及,然后,服 務(wù)器計(jì)算機(jī)12提供"搜索頁"114(見項(xiàng)目278 )。會(huì)話段258可以表示在服務(wù)器計(jì)算機(jī)12和第五用戶計(jì)算設(shè)備(未 示出)之間建立的通信會(huì)話??蛇x地,會(huì)話段258可以表示在服務(wù)器 計(jì)算機(jī)12和例如個(gè)人數(shù)字助理34之間建立的后續(xù)的通信會(huì)話。例如, 假設(shè),在行項(xiàng)目274 (即,服務(wù)器計(jì)算機(jī)12向個(gè)人數(shù)字助理34提供"博客頁,,108)之后,個(gè)人數(shù)字助理34終止了會(huì)話"03"。進(jìn)一步 假設(shè),在時(shí)刻01: 51(大約32分鐘后),個(gè)人數(shù)字助理34為了另外 的數(shù)據(jù)而聯(lián)系服務(wù)器計(jì)算機(jī)12。因而,以及如同在會(huì)話段258中示出 的,在通信會(huì)話"05"(即,在個(gè)人數(shù)字助理34和服務(wù)器計(jì)算機(jī)12 之間的第二通信會(huì)話)期間個(gè)人數(shù)字助理34請求"新聞頁"IIO(見 行項(xiàng)目280);然后,服務(wù)器計(jì)算機(jī)12提供"新聞頁"IIO(見項(xiàng)目 282);然后,個(gè)人數(shù)字助理34請求"新聞2" 116(見行項(xiàng)目284); 以及,然后,服務(wù)器計(jì)算機(jī)12提供"新聞2" 116(見行項(xiàng)目286)。 通過處理包括在日志文件68或經(jīng)修改的日志文件68'中的數(shù)據(jù), 數(shù)據(jù)獲取進(jìn)程10可以確定168例如web站點(diǎn)100的使用參數(shù)。例如, 在11次的服務(wù)器計(jì)算機(jī)12提供例如web頁、照片和新聞文章(例如
通過引出數(shù)據(jù)元70、 72、 74、 76)中"主頁"102被提供3次(即, 27.27%);"照片頁"104被提供1次(即,9.09%);"照片1" 106 被提供1次(即,9.09% );"照片2" 108被提供1次(即,9.09% ),"新聞頁,,110被提供2次(即,18.18°/。);"博客頁,,112被提供 1次(即,9.09%);"搜索頁,,114被提供1次(即,9.090/。);以 及"新聞頁2" 116被提供1次(即,9.09%)。因而,例如,如果 web站點(diǎn)IOO的維護(hù)者具有將花費(fèi)在維護(hù)web站點(diǎn)IOO上的有限數(shù)量 的資源,該web站點(diǎn)100的維護(hù)者可以關(guān)注于維護(hù)"主頁"102和"新 聞頁"110,因?yàn)樗鼈兊南鄬Φ母咚降氖褂寐?。此外,通過分析日志文件68和/或經(jīng)修改的日志文件68,,數(shù)據(jù) 獲取進(jìn)程10可以確定在每個(gè)通信會(huì)話期間,web站點(diǎn)100的哪個(gè)部 分被使用。作為舉例,并再參看圖6的會(huì)話"01"的流程圖300,針 對在用戶計(jì)算機(jī)30和服務(wù)器計(jì)算機(jī)12之間建立的通信會(huì)話"01", 由服務(wù)器計(jì)算機(jī)12提供與"主頁"102,"照片頁"104,"照片1" 106,"照片2" 108相關(guān)聯(lián)的數(shù)據(jù)元。作為舉例,并再參看圖7的會(huì) 話"02"的流程圖350,針對在用戶計(jì)算機(jī)32和服務(wù)器計(jì)算機(jī)12之 間建立的通信會(huì)話"02",由服務(wù)器計(jì)算機(jī)12提供同"主頁"102,"新聞頁"110相關(guān)聯(lián)的數(shù)據(jù)元。作為舉例,并再參看圖8的會(huì)話"03" 的流程圖400針對在個(gè)人數(shù)字助理34和服務(wù)器計(jì)算機(jī)12之間建立的 通信會(huì)話"03",由服務(wù)器計(jì)算機(jī)12提供與"主頁"102,"博客頁" 112相關(guān)聯(lián)的數(shù)據(jù)元。作為舉例,并再參看圖9的會(huì)話"04"的流程 圖450針對在支持?jǐn)?shù)據(jù)的蜂窩電話36和服務(wù)器計(jì)算機(jī)12之間建立的 通信會(huì)話"04",由服務(wù)器計(jì)算機(jī)12提供與"搜索頁"114相關(guān)聯(lián)的 數(shù)據(jù)元。作為舉例,并再參看圖10的會(huì)話"05"的流程圖500針對 通信會(huì)話"05"(在個(gè)人數(shù)字助理34和服務(wù)器計(jì)算機(jī)12之間建立的 第二通信會(huì)話),由服務(wù)器計(jì)算機(jī)12提供與"新聞頁"IIO和"新聞 2" 116相關(guān)聯(lián)的數(shù)據(jù)元。通過處理包括在日志文件68或經(jīng)修改的日志文件68,中的數(shù)據(jù), 數(shù)據(jù)獲取進(jìn)程IO可以確定170例如web站點(diǎn)IOO的一個(gè)或多個(gè)安全弱點(diǎn)。應(yīng)用安全性測試通過例如模擬黑客攻擊來評估web站點(diǎn)的安全 性。通過評估例如日志文件68和/或經(jīng)^^改的日志文件68,,可以對 在例如web站點(diǎn)100內(nèi)的可能的流量^=莫式加以評估和區(qū)分優(yōu)先次序。 例如,對于包括上萬數(shù)據(jù)的頁面的大型站點(diǎn),評估每個(gè)頁面的安全弱 點(diǎn)可能不是對資源的有效使用。例如,假設(shè)web站點(diǎn)100有100000 個(gè)頁面(而不是圖2中示出的15個(gè)頁面)。而且,假設(shè)由服務(wù)器計(jì) 算機(jī)12為web站點(diǎn)100所服務(wù)的全部頁面中,它們中的65.00%涉及"主頁"102。而且,假設(shè)由服務(wù)器計(jì)算機(jī)12服務(wù)的頁面的30.00% 涉及"新聞頁"110,而余下的5%分布于余下的全部的999998個(gè)web 頁中。當(dāng)執(zhí)行用于web站點(diǎn)100的應(yīng)用安全性測試時(shí),由于其高水平 的使用率,可能希望比包含在web站點(diǎn)100內(nèi)的其他頁面更徹底地測 試"主頁"102和"新聞頁"110的安全性。因而,通過分析日志文 件68和/或經(jīng)修改的日志文件68,,可以確定由服務(wù)器計(jì)算機(jī)12所接 收的引入數(shù)據(jù)元(例如,數(shù)據(jù)元60、 62、 64、 66),以及由服務(wù)器計(jì) 算機(jī)12提供的引出數(shù)據(jù)元(例如,數(shù)據(jù)元70、 72、 74、 76)。因而, 接下來,如同由日志文件68 (圖4 ),經(jīng)修改的日志文件68,(圖5 ), 會(huì)話"01"流程圖300 (圖6),會(huì)話"02"流程圖350 (圖7),會(huì) 話"03"流程圖400 (圖8),會(huì)話"04"流程圖450 (圖9),會(huì)話"05"流程圖500 (圖10)中所描繪的,允許生成通過web站點(diǎn)100 的"真實(shí)世界,,流程。繼而,可使用這些"真實(shí)世界,,流程,以制作 應(yīng)用安全性測試流程/腳本,其可在上文討論的自動(dòng)和/或手工測試過 程("爬蟲"和"代理服務(wù)器")中使用。雖然,上文將數(shù)據(jù)獲取進(jìn)程10描述成生成日志文件68,該日志 文件可被用于確定168例如web站點(diǎn)IOO的使用參數(shù),以及確定170 例如web站點(diǎn)100的一個(gè)或多個(gè)安全性弱點(diǎn),但這并非意在限制本公 開,而且將日志文件68的其他使用也考慮在本公開的范圍內(nèi)。例如, 可將日志文件68用于性能測試(測試多種工作負(fù)載場景),退化測 試(測試曾經(jīng)工作的特征是否依然工作),以及功能測試(測試應(yīng)用
的功能性)。已經(jīng)描述了大量的實(shí)現(xiàn)。然而,應(yīng)該理解,可以做出多種修改。 因而,其他實(shí)現(xiàn)均落在后面的權(quán)利要求書范圍內(nèi)。
權(quán)利要求
1.一種捕獲數(shù)據(jù)的方法,包括監(jiān)控由服務(wù)于web站點(diǎn)的web服務(wù)器所接收的多個(gè)引入數(shù)據(jù)元;將所述多個(gè)引入數(shù)據(jù)元的至少一部分寫入用于所述web站點(diǎn)的日志文件;監(jiān)控多個(gè)引出數(shù)據(jù)元,所述多個(gè)引出數(shù)據(jù)元由所述web服務(wù)器至少部分地響應(yīng)于所述引入數(shù)據(jù)元而傳送;以及將所述引出數(shù)據(jù)元的至少一部分寫入用于所述web站點(diǎn)的所述日志文件。
2. 根據(jù)權(quán)利要求1所述的方法,進(jìn)一步包括 向所述引入數(shù)據(jù)元和所述引出數(shù)據(jù)元的一個(gè)或多個(gè)指派會(huì)話標(biāo)識(shí)符;以及向用于所述web站點(diǎn)的所述日志文件寫入所述會(huì)話標(biāo)識(shí)符。
3. 根據(jù)權(quán)利要求1所述的方法,進(jìn)一步包括 向所述引入數(shù)據(jù)元和所述引出數(shù)據(jù)元的一個(gè)或多個(gè)指派時(shí)間戳;以及向用于所述web站點(diǎn)的所述日志文件寫入所述時(shí)間戳。
4. 根據(jù)權(quán)利要求1所述的方法,其中所述引出數(shù)據(jù)元包括以下的一 個(gè)或多個(gè)JavaScript、 cookies、 POST數(shù)據(jù)、HTML代碼、ASCII文本、 圖形單元、二進(jìn)制數(shù)據(jù)、可執(zhí)行數(shù)據(jù)、XML格式的數(shù)據(jù)以及格式化的 SOAP請求/響應(yīng)。
5. 根據(jù)權(quán)利要求1所述的方法,其中所述引出數(shù)據(jù)元定義了由所述 web服務(wù)器所服務(wù)并被包括在所述web站點(diǎn)內(nèi)的web頁的至少一部分。
6. —種數(shù)據(jù)獲取系統(tǒng),包括用于監(jiān)控由服務(wù)于web站點(diǎn)的web服務(wù)器所接收的多個(gè)引入數(shù)據(jù)元 的裝置;用于將所述多個(gè)引入數(shù)據(jù)元的至少 一部分寫入用于所述web站點(diǎn)的 日志文件的裝置;用于監(jiān)控多個(gè)引出數(shù)據(jù)元的裝置,所述多個(gè)引出數(shù)據(jù)元由所述web 服務(wù)器至少部分地響應(yīng)于所述引入數(shù)據(jù)元而傳送;以及用于將所述多個(gè)引出數(shù)據(jù)元的至少一部分寫入用于所述web站點(diǎn)的 所述日志文件的裝置。
7. 根據(jù)權(quán)利要求6所述的數(shù)據(jù)獲取系統(tǒng),進(jìn)一步包括 用于向所述引入數(shù)據(jù)元和所述引出數(shù)據(jù)元的一個(gè)或多個(gè)指派會(huì)話標(biāo)識(shí)符的裝置;以及用于向用于所述web站點(diǎn)的所述日志文件寫入所述會(huì)話標(biāo)識(shí)符的裝置。
8. 根據(jù)權(quán)利要求6所述的數(shù)據(jù)獲取系統(tǒng),進(jìn)一步包括用于向所述引入數(shù)據(jù)元和所述引出數(shù)據(jù)元的 一 個(gè)或多個(gè)指派時(shí)間 戳的裝置;以及用于向用于所述web站點(diǎn)的所述日志文件寫入所述時(shí)間戳的裝置。
9. 根據(jù)權(quán)利要求6所述的數(shù)據(jù)獲取系統(tǒng),其中所述引出數(shù)據(jù)元包括 以下的一個(gè)或多個(gè)JavaScript、 cookies、 POST數(shù)據(jù)、HTML代碼、ASCII 文本、圖形單元、二進(jìn)制數(shù)據(jù)、可執(zhí)行數(shù)據(jù)、XML格式的數(shù)據(jù)以及格式 化的SOAP請求/響應(yīng)。
10. 根據(jù)權(quán)利要求6所述的數(shù)據(jù)獲取系統(tǒng),其中所述引出數(shù)據(jù)元定 義了由所述web服務(wù)器所服務(wù)并被包括在所述web站點(diǎn)內(nèi)的web頁的 至少一部分。
11. 一種分析數(shù)據(jù)的方法,包括 定義日志文件,所述日志文件包括由web服務(wù)器所接收的多個(gè)引入數(shù)據(jù)元;以及 多個(gè)引出數(shù)據(jù)元,所述多個(gè)引出數(shù)據(jù)元作由所述web服務(wù)器至少部 分地響應(yīng)于所述引入數(shù)據(jù)元而傳送; 以及將所述日志文件解析為單獨(dú)的會(huì)話。
12. 根據(jù)權(quán)利要求11所述的方法,其中所述引出數(shù)據(jù)元包括以下的 一個(gè)或多個(gè)JavaScript, cookies、 POST數(shù)據(jù)、HTML代碼、ASCII文 本、圖形單元、二進(jìn)制數(shù)據(jù)、可執(zhí)行數(shù)據(jù)、XML格式的數(shù)據(jù)以及格式化 的SOAP請求/響應(yīng)。
13. 根據(jù)權(quán)利要求11所述的方法,其中所述引出數(shù)據(jù)元定義了由所 述web服務(wù)器所服務(wù)的web頁的至少一部分。
14. 根據(jù)權(quán)利要求11所述的方法,其中所述日志文件包括一個(gè)或多 個(gè)會(huì)話標(biāo)識(shí)符以及一個(gè)或多個(gè)時(shí)間戳。
15. 根據(jù)權(quán)利要求11所述的方法,進(jìn)一步包括 確定針對所述web站點(diǎn)的一個(gè)或多個(gè)部分的一個(gè)或多個(gè)使用參數(shù)。
16. 根據(jù)權(quán)利要求11所述的方法,進(jìn)一步包括確定針對所述web站點(diǎn)的一個(gè)或多個(gè)部分的一個(gè)或多個(gè)弱點(diǎn)。
17. —種數(shù)據(jù)分析系統(tǒng),包括 用于定義日志文件的裝置,所述日志文件包括 由web服務(wù)器所接收的多個(gè)引入數(shù)據(jù)元;以及多個(gè)引出數(shù)據(jù)元,所述多個(gè)引出數(shù)據(jù)元由所述web服務(wù)器至少部分 地響應(yīng)于所述引入^:據(jù)元而傳送; 以及用于將所述日志文件解析為單獨(dú)的會(huì)話的裝置。
18. 根據(jù)權(quán)利要求17所述的數(shù)據(jù)分析系統(tǒng),其中所述引出數(shù)據(jù)元包 括以下的一個(gè)或多個(gè)JavaScript, cookies、 POST數(shù)據(jù)、HTML代碼、 ASCII文本、圖形單元、二進(jìn)制數(shù)據(jù)、可執(zhí)行數(shù)據(jù)、XML格式的數(shù)據(jù)以 及格式化的SOAP請求/響應(yīng)。
19. 根據(jù)權(quán)利要求17所述的數(shù)據(jù)分析系統(tǒng),其中所述引出數(shù)據(jù)元定 義了由所述web服務(wù)器所服務(wù)的web頁的至少一部分。
20. 根據(jù)權(quán)利要求17所述的數(shù)據(jù)分析系統(tǒng),其中所述日志文件包括 一個(gè)或多個(gè)會(huì)話標(biāo)識(shí)符以及一個(gè)或多個(gè)時(shí)間戳。
21. 根據(jù)權(quán)利要求17所述的數(shù)據(jù)分析系統(tǒng),進(jìn)一步包括用于確定針對所述web站點(diǎn)的一個(gè)或多個(gè)部分的一個(gè)或多個(gè)使用參 數(shù)的裝置。
22. 根據(jù)權(quán)利要求17所述的數(shù)據(jù)分析系統(tǒng),進(jìn)一步包括用于確定針對所述web站點(diǎn)的一個(gè)或多個(gè)部分的一個(gè)或多個(gè)弱點(diǎn)的裝置。
全文摘要
本發(fā)明涉及用于數(shù)據(jù)獲取和分析的系統(tǒng)和方法,尤其是一種用于捕獲數(shù)據(jù)的方法和計(jì)算機(jī)程序產(chǎn)品,包括監(jiān)控由服務(wù)于web站點(diǎn)的web服務(wù)器所接收的多個(gè)引入數(shù)據(jù)元。將該多個(gè)引入數(shù)據(jù)元的至少一部分寫入用于web站點(diǎn)的日志文件。監(jiān)控多個(gè)引出數(shù)據(jù)元,該引出數(shù)據(jù)由所述web服務(wù)器至少部分地響應(yīng)于所述引入數(shù)據(jù)元而傳送。將該多個(gè)引出數(shù)據(jù)元的至少一部分寫入用于web站點(diǎn)的日志文件。
文檔編號(hào)H04L12/24GK101212353SQ20071019274
公開日2008年7月2日 申請日期2007年11月16日 優(yōu)先權(quán)日2006年12月28日
發(fā)明者D·A·斯科特 申請人:國際商業(yè)機(jī)器公司