本發(fā)明涉及計算機技術(shù)領(lǐng)域,尤其涉及一種行為數(shù)據(jù)的獲取方法和裝置。
背景技術(shù):
現(xiàn)有技術(shù)中,為獲取用戶在終端上使用應用程序產(chǎn)生的行為數(shù)據(jù)主要采用以下三種方法:
方法一:開發(fā)人員在各自的應用程序中本地記錄用戶行為的日志數(shù)據(jù),按照約定協(xié)議上傳日志數(shù)據(jù);
方法二:將專業(yè)的移動應用統(tǒng)計分析平臺公司發(fā)布的軟件開發(fā)工具包(SDK,Software Development Kit)在開發(fā)階段集成到應用程序的代碼中,幫助移動應用開發(fā)商統(tǒng)計和分析流量來源、內(nèi)容使用、用戶屬性和行為數(shù)據(jù),以便移動應用開發(fā)商利用獲取的信息和數(shù)據(jù)進行產(chǎn)品、運營、推廣策略的決策;
方法三:在各種網(wǎng)站系統(tǒng)生成的超文本標記語言(HTML,HyperText Markup Language)網(wǎng)頁中采用插碼方式,即在HTML頁面中植入javascript代碼,用戶通過終端的應用程序、瀏覽器等訪問網(wǎng)頁即觸發(fā)對應的事件,記錄用戶的行為、時間等信息,將記錄的信息實時或定期提交到服務(wù)器端進行統(tǒng)計分析。
上述三種行為數(shù)據(jù)的獲取方法,分別具有以下缺點:
方法一:碎片化情況嚴重,無法適用于通用的情況,且在終端上定制實施日志采集會影響應用程序的正常業(yè)務(wù)使用,帶來數(shù)據(jù)本地管理復雜、隱私問題等一系列問題。
方法二:需在開發(fā)應用程序的過程中集成移動應用統(tǒng)計分析平臺公司提供的SDK,并按要求在研發(fā)階段額外添加記錄用戶行為數(shù)據(jù)的代碼;另外,SDK通常需要在本地保存用戶行為數(shù)據(jù),而許多終端安裝的第三方安全類助手軟件可能將數(shù)據(jù)認定為不安全代碼和信息,對其進行攔截或刪除,從而導致部分行為數(shù)據(jù)無法采集;
方法三:HTML頁面插碼方式需在業(yè)務(wù)系統(tǒng)中進行額外插碼開發(fā)工作,容易被用戶在第三方瀏覽器查看到采集信息的源碼,因產(chǎn)生隱私泄露的擔憂而不愿意繼續(xù)訪問該類網(wǎng)站。
技術(shù)實現(xiàn)要素:
有鑒于此,本發(fā)明實施例期望提供一種行為數(shù)據(jù)的獲取方法和裝置,防止行為數(shù)據(jù)被攔截,保證行為數(shù)據(jù)中包含的用戶隱私的安全。
為達到上述目的,本發(fā)明的技術(shù)方案是這樣實現(xiàn)的:
本發(fā)明實施例提供了一種行為數(shù)據(jù)的獲取方法,所述方法包括:
獲取日志數(shù)據(jù),所述日志數(shù)據(jù)攜帶有標簽信息;
根據(jù)預設(shè)的匹配規(guī)則對所述日志數(shù)據(jù)的標簽信息進行特征匹配,對不符合所述預設(shè)的匹配規(guī)則的日志數(shù)據(jù)進行分割處理;對符合所述預設(shè)的匹配規(guī)則的日志數(shù)據(jù)進行分類;確定需加密的相應類別的日志數(shù)據(jù),根據(jù)設(shè)定的加密算法對需加密的相應類別的日志數(shù)據(jù)進行加密;
輸出包含加密處理后的所有日志數(shù)據(jù)。
上述方案中,所述標簽信息,包括以下信息的至少一種:時間戳、應用標識、當前網(wǎng)絡(luò)信息、日志級別、終端地址信息、接口標識;
所述符合預設(shè)的匹配規(guī)則,包括以下規(guī)則的至少之一:
所述日志數(shù)據(jù)的時間戳在設(shè)定時間段內(nèi);
所述日志數(shù)據(jù)的應用標識與設(shè)定的應用標識相同;
根據(jù)所述日志數(shù)據(jù)的當前網(wǎng)絡(luò)信息確定的網(wǎng)絡(luò)標識與設(shè)定的網(wǎng)絡(luò)標識相同;
所述日志數(shù)據(jù)的終端地址信息與設(shè)定的全球定位系統(tǒng)GPS地理標識相同;
所述日志數(shù)據(jù)的日志級別與設(shè)定的日志級別相同;
所述日志數(shù)據(jù)對應的接口標識與設(shè)定的接口標識相同。
上述方案中,所述對符合預設(shè)的匹配規(guī)則的日志數(shù)據(jù)進行分類;包括:
根據(jù)所述符合預設(shè)的匹配規(guī)則的日志數(shù)據(jù)所攜帶的標簽信息,對所述符合預設(shè)的匹配規(guī)則的日志數(shù)據(jù)進行分類,確定分類后的所述日志數(shù)據(jù)的類別。
上述方案中,所述輸出包含加密處理后的所有日志數(shù)據(jù);包括:
根據(jù)所述日志數(shù)據(jù)的類別確定所述日志數(shù)據(jù)對應的一個或多個輸出模式,根據(jù)所述輸出模式輸出加密后的日志數(shù)據(jù)和不需加密的日志數(shù)據(jù)。
上述方案中,所述日志數(shù)據(jù)還攜帶有輸出配置信息;
所述輸出包含加密處理后的所有日志數(shù)據(jù),還包括:
根據(jù)所述輸出配置信息確定所述日志數(shù)據(jù)的輸出模式,根據(jù)所述輸出模式輸出分割處理后的日志數(shù)據(jù)。
本發(fā)明實施例提供了一種行為數(shù)據(jù)的獲取裝置,所述裝置包括:日志代理模塊、特征匹配模塊、日志處理模塊、日志分揀模塊和日志輸出器;其中,
所述日志代理模塊,用于獲取日志數(shù)據(jù),所述日志數(shù)據(jù)攜帶有標簽信息;
所述特征匹配模塊,用于根據(jù)預設(shè)的匹配規(guī)則對所述日志數(shù)據(jù)的標簽信息進行特征匹配;
所述日志處理模塊,用于對不符合所述預設(shè)的匹配規(guī)則的日志數(shù)據(jù)進行分割處理;
所述日志分揀模塊,用于對符合所述預設(shè)的匹配規(guī)則的日志數(shù)據(jù)進行分類;確定需加密的相應類別的日志數(shù)據(jù),根據(jù)設(shè)定的加密算法對需加密的相應類別的日志數(shù)據(jù)進行加密;
所述日志輸出器,用于輸出包含加密處理后的所有日志數(shù)據(jù)。
上述方案中,所述標簽信息,包括以下信息的至少一種:時間戳、應用標識、當前網(wǎng)絡(luò)信息、日志級別、終端地址信息、接口標識;
所述符合預設(shè)的匹配規(guī)則,包括以下規(guī)則的至少之一:
所述日志數(shù)據(jù)的時間戳在設(shè)定時間段內(nèi);
所述日志數(shù)據(jù)的應用標識與設(shè)定的應用標識相同;
根據(jù)所述日志數(shù)據(jù)的當前網(wǎng)絡(luò)信息確定的網(wǎng)絡(luò)標識與設(shè)定的網(wǎng)絡(luò)標識相同;
所述日志數(shù)據(jù)的終端地址信息與設(shè)定的全球定位系統(tǒng)GPS地理標識相同;
所述日志數(shù)據(jù)的日志級別與設(shè)定的日志級別相同;
所述日志數(shù)據(jù)對應的接口標識與設(shè)定的接口標識相同。
上述方案中,所述日志分揀模塊,具體用于:根據(jù)所述符合預設(shè)的匹配規(guī)則的日志數(shù)據(jù)所攜帶的標簽信息,對所述符合預設(shè)的匹配規(guī)則的日志數(shù)據(jù)進行分類,確定分類后的所述日志數(shù)據(jù)的類別。
上述方案中,所述日志輸出器,具體用于:根據(jù)所述日志數(shù)據(jù)的類別確定所述日志數(shù)據(jù)對應的一個或多個輸出模式,根據(jù)所述輸出模式輸出加密后的日志數(shù)據(jù)和不需加密的日志數(shù)據(jù)。
上述方案中,所述日志數(shù)據(jù)還攜帶有輸出配置信息;
所述日志輸出器,還用于根據(jù)所述輸出配置信息確定所述日志數(shù)據(jù)的輸出模式,根據(jù)所述輸出模式輸出分割處理后的日志數(shù)據(jù)。
與現(xiàn)有技術(shù)相比,本發(fā)明提供的行為數(shù)據(jù)的獲取方法和裝置,獲取日志數(shù)據(jù),所述日志數(shù)據(jù)攜帶有標簽信息;根據(jù)預設(shè)的匹配規(guī)則對所述日志數(shù)據(jù)的標簽信息進行特征匹配,對不符合所述預設(shè)的匹配規(guī)則的日志數(shù)據(jù)進行分割處理;對符合所述預設(shè)的匹配規(guī)則的日志數(shù)據(jù)進行分類;確定需加密的相應類別的日志數(shù)據(jù),根據(jù)設(shè)定的加密算法對需加密的相應類別的日志數(shù)據(jù)進行加密;輸出包含加密處理后的所有日志數(shù)據(jù)。本發(fā)明實施例提供的方法和裝置,通過對標簽信息進行匹配、根據(jù)標簽信息進行日志數(shù)據(jù)的分類,實現(xiàn)對應用程序執(zhí)行過程中產(chǎn)生的日志數(shù)據(jù)按照指定的規(guī)則進行加密,減少用戶行為數(shù)據(jù)隱私泄露風險,且無需插入額外的代碼,不改變現(xiàn)有的日志整體管理機制。
附圖說明
圖1為現(xiàn)有技術(shù)中的行為數(shù)據(jù)的獲取裝置的結(jié)構(gòu)示意圖;
圖2為本發(fā)明實施例提供的行為數(shù)據(jù)的獲取方法的流程示意圖;
圖3為本發(fā)明實施例提供的行為數(shù)據(jù)的獲取裝置的結(jié)構(gòu)示意圖;
圖4為本發(fā)明實施例提供的行為數(shù)據(jù)的獲取系統(tǒng)的結(jié)構(gòu)示意圖。
具體實施方式
本發(fā)明實施例中,獲取日志數(shù)據(jù),所述日志數(shù)據(jù)攜帶有標簽信息;根據(jù)預設(shè)的匹配規(guī)則對所述日志數(shù)據(jù)的標簽信息進行特征匹配,對不符合所述預設(shè)的匹配規(guī)則的日志數(shù)據(jù)進行分割處理;對符合所述預設(shè)的匹配規(guī)則的日志數(shù)據(jù)進行分類;確定需加密的相應類別的日志數(shù)據(jù),根據(jù)設(shè)定的加密算法對需加密的相應類別的日志數(shù)據(jù)進行加密;輸出包含加密處理后的所有日志數(shù)據(jù)。
在結(jié)合實施例對本發(fā)明再作進一步詳細的說明之前,對現(xiàn)有技術(shù)中行為數(shù)據(jù)的獲取裝置進行說明。
目前研發(fā)人員在開發(fā)應用程序的時候,可以使用日志生成模塊來進行應用程序的日志記錄,以log4j等系統(tǒng)為例,在開發(fā)應用的工程中引入log4j開發(fā)包,使用標準接口生成日志,具體包括:加入log4j-XXX.jar到工程中的lib,配置log4j.properties文件,設(shè)置相關(guān)屬性等步驟。
應用程序可以設(shè)置日志數(shù)據(jù)的輸出目的地,如:本地終端存儲、管道輸出、云平臺系統(tǒng)、圖形用戶界面(GUI,Graphical User Interface)組件、套接口服務(wù)器、事件記錄器等;也可以設(shè)置每一條日志的輸出格式;還可以設(shè)置每一條日志數(shù)據(jù)的級別。
圖1為現(xiàn)有技術(shù)中行為數(shù)據(jù)的獲取裝置的結(jié)構(gòu)示意圖,如圖1所示,所述裝置包括:日志采集接口、日志處理模塊和日志輸出器;其中,
應用程序通過應用程序編程接口(API,Application Programming Interface)將需要記錄的日志數(shù)據(jù)提交給所述日志采集接口;
所述日志采集接口將用戶傳遞過來的日志數(shù)據(jù)傳遞給日志處理模塊;
所述日志處理模塊根據(jù)一定的規(guī)則對日志數(shù)據(jù)進行內(nèi)容分割、緩存等操作,所述日志數(shù)據(jù)攜帶有如時間戳、日志級別等標簽(Tag)信息;
所述日志處理模塊將日志數(shù)據(jù)提交給日志輸出器,由所述日志輸出器根據(jù)配置信息選擇:管道輸出、數(shù)據(jù)流、內(nèi)存塊、持久化存儲等方式進行輸出。
下面結(jié)合實施例對本發(fā)明再作進一步詳細的說明。
圖2為本發(fā)明實施例提供的行為數(shù)據(jù)的獲取方法的流程示意圖;如圖2所示,所述行為數(shù)據(jù)的獲取方法,包括:
步驟101:獲取日志數(shù)據(jù),所述日志數(shù)據(jù)攜帶有標簽信息;
具體地,終端通過數(shù)據(jù)采集接口從每個應用程序,如:應用程序一、應用程序二等,獲得所述應用程序生成的日志數(shù)據(jù)。
所述終端為獲取各個應用程序的日志數(shù)據(jù)的終端,可以包括:計算機、服務(wù)器等。
具體地,所述日志數(shù)據(jù)攜帶有的標簽信息,包括以下信息的至少一種:時間戳、應用標識(ID)、本地終端信息、當前網(wǎng)絡(luò)信息、終端地址信息、日志級別、接口標識等;其中,
所述時間戳,表示生成日志數(shù)據(jù)的時間;
所述應用標識,作為應用程序的唯一標識,根據(jù)所述應用標識可以確定對應的應用程序;
所述日志級別,可以依次包括:debug、info、warn、error、fatel五個等級;其中,debug表明細粒度信息事件對調(diào)試應用程序有幫助;info表明信息在粗粒度級別突出強調(diào)應用程序的運行過程;warn表明會出現(xiàn)潛在錯誤的情形;error指出雖然發(fā)送錯誤事件,但不影響系統(tǒng)的繼續(xù)運行;fatal指出每個嚴重的錯誤事件將會導致應用程序退出。
所述本地終端信息,可以包括:終端的廠家、型號等;
所述終端地址信息,表示應用程序產(chǎn)生日志數(shù)據(jù)時所處的位置;
所述當前網(wǎng)絡(luò)信息,可以包括:網(wǎng)絡(luò)標識,如采用無線網(wǎng)絡(luò)(wifi)、移動數(shù)據(jù)等;所述移動數(shù)據(jù),包括:通過通用分組無線服務(wù)技術(shù)(GPRS,General Packet Radio Service)、時分同步碼分多址(TD-SCDMA,Time Division-Synchronous Code Division Multiple Access)、高速下行分組接入(HSDPA,High Speed Downlink Packet Access)、長期演進(LTE,Long Term Evolution)等移動通信技術(shù)使用相關(guān)數(shù)據(jù)增值業(yè)務(wù)產(chǎn)生的數(shù)據(jù)。
步驟102:根據(jù)預設(shè)的匹配規(guī)則對所述日志數(shù)據(jù)的標簽信息進行特征匹配,對不符合所述預設(shè)的匹配規(guī)則的日志數(shù)據(jù)進行分割處理;對符合所述預設(shè)的匹配規(guī)則的日志數(shù)據(jù)進行分類;確定需加密的相應類別的日志數(shù)據(jù),根據(jù)設(shè)定的加密算法對需加密的相應類別的日志數(shù)據(jù)進行加密;
具體地,所述分割處理,包括日志內(nèi)容分割和緩存等;所述日志內(nèi)容分割,可以運用日志分割工具,如:cronolog等,根據(jù)日志數(shù)據(jù)的時間、大小等進行分割。
具體地,所述符合預設(shè)的匹配規(guī)則,包括以下規(guī)則的至少之一:
所述日志數(shù)據(jù)的時間戳在設(shè)定時間段內(nèi);
所述日志數(shù)據(jù)的應用標識與設(shè)定的應用標識相同;
根據(jù)所述日志數(shù)據(jù)的當前網(wǎng)絡(luò)信息確定的網(wǎng)絡(luò)標識與設(shè)定的網(wǎng)絡(luò)標識相同;
所述日志數(shù)據(jù)的終端地址信息與設(shè)定的全球定位系統(tǒng)(GPS,Global Positioning System)地理標識相同;
所述日志數(shù)據(jù)的日志級別與設(shè)定的日志級別相同;
所述日志數(shù)據(jù)對應的接口標識與設(shè)定的接口標識相同。
通過預設(shè)的匹配規(guī)則,可以選擇特定的日志數(shù)據(jù),例如:根據(jù)所述時間戳,選擇時間段如:每天19:00-22:00的日志數(shù)據(jù);根據(jù)所述應用標識,可以采集應用程序名稱為com.cmcc.cmri.ots的數(shù)據(jù);根據(jù)所述網(wǎng)絡(luò)標識,可以采集終端網(wǎng)絡(luò)環(huán)境在wifi下的數(shù)據(jù);根據(jù)所述終端地址信息,可以采集北京市內(nèi)的數(shù)據(jù);根據(jù)所述日志級別,可以采集日志級別為高于info的數(shù)據(jù);還可以根據(jù)所述接口標識,采集異常接口,如:crash類接口的數(shù)據(jù),從而獲得應用程序發(fā)生異常時的日志數(shù)據(jù)。當日志數(shù)據(jù)符合如上任一個或多個的匹配規(guī)則的時候,即可以認為符合預設(shè)的匹配規(guī)則。
具體地,所述對符合預設(shè)的匹配規(guī)則的日志數(shù)據(jù)進行分類,包括:
根據(jù)所述符合預設(shè)的匹配規(guī)則的日志數(shù)據(jù)所攜帶的標簽信息,對所述符合預設(shè)的匹配規(guī)則的日志數(shù)據(jù)進行分類,確定分類后的所述日志數(shù)據(jù)的類別。
所述類別,包括:用戶行為類、終端信息類、網(wǎng)絡(luò)信息類、應用信息類等。
這里,基于標簽信息確定對應的類別,一個類別的日志可以包含一個或多個標簽信息;例如:可以將網(wǎng)絡(luò)標識、終端地址信息、本地終端信息等歸屬到終端信息類,所有符合以上任一標簽的日志數(shù)據(jù)均歸為終端信息類。
確定所述日志數(shù)據(jù)的類別后,進一步確定所述類別是否需要加密,對于需加密的類別進一步確定對應的設(shè)定的加密算法和密鑰,根據(jù)設(shè)定的加密算法對需加密的相應類別的日志數(shù)據(jù)進行加密。這里,運用先分類再針對性加密的方法,對于部分與隱私關(guān)系不大的日志數(shù)據(jù),可以設(shè)置為不加密明文保存和傳輸;對于涉及用戶隱私的某一類日志數(shù)據(jù),可以針對性的單獨加密并傳輸,避免被第三方安全應用軟件截取。
步驟103:輸出包含加密處理后的所有日志數(shù)據(jù)。
具體地,所述輸出包含加密處理后的所有日志數(shù)據(jù),包括:
根據(jù)所述日志數(shù)據(jù)的類別確定所述日志數(shù)據(jù)對應的一個或多個輸出模式,根據(jù)所述輸出模式輸出加密后的日志數(shù)據(jù)和不需加密的日志數(shù)據(jù)。所述輸出模式,包括:本地終端存儲、管道輸出、云平臺系統(tǒng)等。
這里,可以預設(shè)有一個日志輸出匹配規(guī)則,所述日志輸出匹配規(guī)則根據(jù)日志數(shù)據(jù)的分類來指定,可以為每一個類別指定一到多個輸出模式。例如,所述日志輸出匹配規(guī)則可以包括:終端信息類的日志數(shù)據(jù)僅在本地管道輸出,用戶行為類的日志數(shù)據(jù)除在本地終端存儲外同時還上報到云平臺系統(tǒng)等。所述云平臺系統(tǒng),用于對日志數(shù)據(jù)進行解密、分析等操作。
以上所述標簽信息、所述標簽信息對應的預設(shè)的匹配規(guī)則、所述標簽信息對應的類別等可以是根據(jù)行為數(shù)據(jù)分析需要預先設(shè)定并保存。
需要說明的是,在傳統(tǒng)模式下的模塊,通過應用程序的日志配置文件決定該部分日志數(shù)據(jù)的輸出模式,即所述日志數(shù)據(jù)還攜帶有輸出配置信息,如管道輸出、本地終端存儲等。
這里,所述輸出包含加密處理后的所有日志數(shù)據(jù),包括:
對于不符合所述預設(shè)的匹配規(guī)則的日志數(shù)據(jù),獲取所述日志數(shù)據(jù)的輸出配置信息;根據(jù)所述輸出配置信息確定所述日志數(shù)據(jù)的輸出模式,根據(jù)所述輸出模式輸出分割處理后的日志數(shù)據(jù)。
圖3為本發(fā)明實施例提供的行為數(shù)據(jù)的獲取裝置的結(jié)構(gòu)示意圖;如圖3所示,所述行為數(shù)據(jù)的獲取裝置,包括:日志代理模塊、特征匹配模塊、日志處理模塊、日志分揀模塊和日志輸出器;其中,
所述日志代理模塊,用于獲取日志數(shù)據(jù),所述日志數(shù)據(jù)攜帶有標簽信息;
具體地,所述標簽信息,包括以下信息的至少一種:時間戳、應用標識、當前網(wǎng)絡(luò)信息、日志級別、終端地址信息、接口標識、本地終端信息等;
所述特征匹配模塊,用于根據(jù)預設(shè)的匹配規(guī)則對所述日志數(shù)據(jù)的標簽信息進行特征匹配;
具體地,所述符合預設(shè)的匹配規(guī)則,包括以下規(guī)則的至少之一:
所述日志數(shù)據(jù)的時間戳在設(shè)定時間段內(nèi);
所述日志數(shù)據(jù)的應用標識與設(shè)定的應用標識相同;
根據(jù)所述日志數(shù)據(jù)的當前網(wǎng)絡(luò)信息確定的網(wǎng)絡(luò)標識與設(shè)定的網(wǎng)絡(luò)標識相同;
所述日志數(shù)據(jù)的終端地址信息與設(shè)定的GPS地理標識相同;
所述日志數(shù)據(jù)的日志級別與設(shè)定的日志級別相同;
所述日志數(shù)據(jù)對應的接口標識與設(shè)定的接口標識相同。
這里,可以根據(jù)所述時間戳,選擇時間段如:每天19:00-22:00的數(shù)據(jù);根據(jù)所述應用標識,可以采集應用程序名稱為com.cmcc.cmri.ots的數(shù)據(jù);根據(jù)所述網(wǎng)絡(luò)標識,可以采集終端網(wǎng)絡(luò)環(huán)境在wifi下的數(shù)據(jù);根據(jù)所述終端地址信息,可以采集北京市內(nèi)的數(shù)據(jù);根據(jù)所述日志級別,可以采集日志級別為高于info的數(shù)據(jù);還可以根據(jù)所述接口標識,采集異常接口,如:crash類接口的數(shù)據(jù),從而獲得應用程序發(fā)生異常時的日志數(shù)據(jù)。
所述日志處理模塊,用于對不符合所述預設(shè)的匹配規(guī)則的日志數(shù)據(jù)進行分割處理;
具體地,所述日志處理模塊,具體用于運用日志分割工具,如:cronolog等,根據(jù)日志數(shù)據(jù)的時間、大小等進行日志內(nèi)容分割,及緩存等。
所述日志分揀模塊,用于對符合所述預設(shè)的匹配規(guī)則的日志數(shù)據(jù)進行分類;確定需加密的相應類別的日志數(shù)據(jù),根據(jù)設(shè)定的加密算法對需加密的相應類別的日志數(shù)據(jù)進行加密;
具體地,所述日志分揀模塊,具體用于:根據(jù)所述符合預設(shè)的匹配規(guī)則的日志數(shù)據(jù)所攜帶的標簽信息,對所述符合預設(shè)的匹配規(guī)則的日志數(shù)據(jù)進行分類,確定分類后的所述日志數(shù)據(jù)的類別。
所述日志輸出器,用于輸出包含加密處理后的所有日志數(shù)據(jù)。
具體地,所述日志輸出器,具體用于:根據(jù)所述日志數(shù)據(jù)的類別確定所述日志數(shù)據(jù)對應的一個或多個輸出模式,根據(jù)所述輸出模式輸出加密后的日志數(shù)據(jù)和不需加密的日志數(shù)據(jù)。所述輸出模式,包括:本地終端存儲、管道輸出、云平臺系統(tǒng)等。
所述日志數(shù)據(jù)還攜帶有輸出配置信息;所述日志輸出器,還用于根據(jù)所述輸出配置信息確定所述日志數(shù)據(jù)的輸出模式,根據(jù)所述輸出模式輸出分割處理后的日志數(shù)據(jù)。
這里,所述標簽信息、所述預設(shè)的匹配規(guī)則、所述標簽信息對應的類別、所述類別是否加密、所述類別的加密算法和密鑰等信息可以預先設(shè)置并保存在所述采集裝置中。
圖4為本發(fā)明實施例提供的行為數(shù)據(jù)的獲取系統(tǒng)的結(jié)構(gòu)示意圖,如圖4所示,所述行為數(shù)據(jù)的獲取系統(tǒng),包括:數(shù)據(jù)采集接口、日志代理模塊、特征匹配模塊、日志處理模塊、日志分揀模塊、日志輸出器、日志特征庫;其中,
所述數(shù)據(jù)采集接口,用于從各個應用程序中獲得相應的日志數(shù)據(jù),并將所述日志數(shù)據(jù)發(fā)送給日志代理模塊;
具體地,所述數(shù)據(jù)采集接口,可以重載現(xiàn)有的日志采集接口,從而使得采集系統(tǒng)對應用程序透明,避免被第三方安全類助手軟件發(fā)現(xiàn)、攔截或刪除。
所述日志代理模塊,用于獲取日志數(shù)據(jù),所述日志數(shù)據(jù)攜帶有標簽信息;
具體地,所述標簽信息,包括以下信息的至少一種:時間戳、應用標識、當前網(wǎng)絡(luò)信息、日志級別、終端地址信息、接口標識、本地終端信息等;
相應地,所述符合預設(shè)的匹配規(guī)則,包括以下規(guī)則的至少之一:
所述日志數(shù)據(jù)的時間戳在設(shè)定時間段內(nèi);
所述日志數(shù)據(jù)的應用標識與設(shè)定的應用標識相同;
根據(jù)所述日志數(shù)據(jù)的當前網(wǎng)絡(luò)信息確定的網(wǎng)絡(luò)標識與設(shè)定的網(wǎng)絡(luò)標識相同;
所述日志數(shù)據(jù)的終端地址信息與設(shè)定的GPS地理標識相同;
所述日志數(shù)據(jù)的日志級別與設(shè)定的日志級別相同;
所述日志數(shù)據(jù)對應的接口標識與設(shè)定的接口標識相同。
所述特征匹配模塊,用于從日志特征庫中獲取預設(shè)的匹配規(guī)則,根據(jù)所述預設(shè)的匹配規(guī)則對所述日志數(shù)據(jù)的標簽信息進行特征匹配;
所述日志處理模塊,用于對不符合所述預設(shè)的匹配規(guī)則的日志數(shù)據(jù)進行分割處理;
所述日志分揀模塊,用于對符合所述預設(shè)的匹配規(guī)則的日志數(shù)據(jù)進行分類;確定需加密的相應類別的日志數(shù)據(jù),根據(jù)設(shè)定的加密算法對需加密的相應類別的日志數(shù)據(jù)進行加密;
所述日志輸出器,用于輸出包含加密處理后的所有日志數(shù)據(jù);
具體地,所述日志數(shù)據(jù)還攜帶有輸出配置信息;
所述日志輸出器,具體用于根據(jù)所述日志數(shù)據(jù)的類別確定所述日志數(shù)據(jù)對應的一個或多個輸出模式,根據(jù)所述輸出模式輸出加密后的日志數(shù)據(jù)和不需加密的日志數(shù)據(jù);及,根據(jù)所述輸出配置信息確定所述日志數(shù)據(jù)的輸出模式,根據(jù)所述輸出模式輸出分割后的日志數(shù)據(jù)。
所述日志特征庫,用于保存預設(shè)的匹配規(guī)則、所述標簽信息對應的類別、所述類別是否加密、所述類別的加密算法和密鑰等預設(shè)的信息。
以上所述,僅為本發(fā)明的較佳實施例而已,并非用于限定本發(fā)明的保護范圍,凡在本發(fā)明的精神和原則之內(nèi)所作的任何修改、等同替換和改進等,均應包含在本發(fā)明的保護范圍之內(nèi)。