国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      一種瀏覽器內(nèi)核切換匹配庫數(shù)據(jù)更新的方法和裝置制造方法

      文檔序號:6523647閱讀:217來源:國知局
      一種瀏覽器內(nèi)核切換匹配庫數(shù)據(jù)更新的方法和裝置制造方法
      【專利摘要】本發(fā)明公開了一種瀏覽器內(nèi)核切換匹配庫數(shù)據(jù)更新的方法和裝置。涉及計算機【技術(shù)領(lǐng)域】。根據(jù)本發(fā)明的針對客戶端主動切換內(nèi)核的記錄,進行解析,然后進行歸并和篩選,根據(jù)篩選結(jié)果生對內(nèi)核切換匹配庫進行更新,可以解決現(xiàn)有技術(shù)中推出了一種可以切換內(nèi)核的瀏覽器,用戶可以在訪問網(wǎng)頁的過程中,瀏覽器根據(jù)匹配庫的設(shè)置首先選擇一個內(nèi)核打開網(wǎng)頁,但是該種預選的方式存在高概率的錯誤,用戶經(jīng)常需要手動切換。上述的匹配庫由于網(wǎng)頁與內(nèi)核的對應(yīng)關(guān)系是人為篩選,其錯誤率高、影響客戶端對網(wǎng)頁的展示,并且人工成本高昂的問題,取得了降低內(nèi)核匹配錯誤率、降低后臺人工分析成本的有益效果。
      【專利說明】—種瀏覽器內(nèi)核切換匹配庫數(shù)據(jù)更新的方法和裝置
      【技術(shù)領(lǐng)域】
      [0001]本發(fā)明涉及計算機【技術(shù)領(lǐng)域】,具體涉及一種瀏覽器內(nèi)核切換匹配庫數(shù)據(jù)更新的方法和裝置。
      【背景技術(shù)】
      [0002]隨著瀏覽器技術(shù)的發(fā)展,市場中存在越來越多的瀏覽器內(nèi)核,但是對于不同的瀏覽器內(nèi)核,其支持的網(wǎng)頁格式存在不兼容,比如Chrome內(nèi)核能夠解析的網(wǎng)頁,可能IE內(nèi)核的不能夠解析,為了解決該種情況,現(xiàn)有技術(shù)中推出了一種可以切換內(nèi)核的瀏覽器,用戶可以在訪問網(wǎng)頁的過程中,瀏覽器根據(jù)匹配庫的設(shè)置首先選擇一個內(nèi)核打開網(wǎng)頁,但是該種預選的方式存在高概率的錯誤,用戶經(jīng)常需要手動切換。上述的匹配庫由于網(wǎng)頁與內(nèi)核的對應(yīng)關(guān)系是人為篩選,其錯誤率高、影響客戶端對網(wǎng)頁的展示,并且人工成本高昂。

      【發(fā)明內(nèi)容】

      [0003]鑒于上述問題,提出了本發(fā)明以便提供一種克服上述問題或者至少部分地解決上述問題的瀏覽器內(nèi)核切換匹配庫數(shù)據(jù)更新的裝置和相應(yīng)的瀏覽器內(nèi)核切換匹配庫數(shù)據(jù)更新的方法。
      [0004]依據(jù)本發(fā)明的一個方面,提供了本發(fā)明公開了一種瀏覽器內(nèi)核切換匹配庫數(shù)據(jù)更新的方法,包括:
      [0005]獲取客戶端切換內(nèi)核后的切換記錄;
      [0006]解析每條切換記錄,獲得一條待篩選數(shù)據(jù);所述待篩選數(shù)據(jù)包括各篩選參數(shù),所述篩選參數(shù)包括URL、切換后的內(nèi)核標識;
      [0007]根據(jù)所述篩選參數(shù)對各待篩選數(shù)據(jù)歸并;
      [0008]基于內(nèi)核切換匹配庫對歸并后的待篩選數(shù)據(jù)進行篩選,并基于篩選結(jié)果生成驗證表;
      [0009]基于所述驗證表,更新所述內(nèi)核切換匹配庫。
      [0010]可選地,所述根據(jù)所述篩選參數(shù)對各待篩選數(shù)據(jù)歸并包括:
      [0011]針對具有同一 URL的各待篩選數(shù)據(jù),以所述內(nèi)核標識為標準歸并為一條待篩選數(shù)據(jù),并在該條數(shù)據(jù)中記錄對應(yīng)內(nèi)核標識的切換次數(shù)。
      [0012]可選地,所述基于內(nèi)核切換匹配庫對歸并后的待篩選數(shù)據(jù)進行篩選,并基于篩選結(jié)果生成驗證表包括:
      [0013]針對歸并后具有同一 URL的各條待篩選數(shù)據(jù),判斷內(nèi)核切換匹配庫中是否有對應(yīng)所述URL的記錄;
      [0014]如果沒有對應(yīng)所述URL的記錄,則根據(jù)對應(yīng)所述URL的各條待篩選數(shù)據(jù)在驗證表中進行記錄;
      [0015]如果有對應(yīng)所述URL的記錄,則確認已經(jīng)在內(nèi)核切換匹配庫記錄的內(nèi)核標識;
      [0016]刪除對應(yīng)該被確認的內(nèi)核標識的數(shù)據(jù),并將除該被確認的內(nèi)核標識之外的、切換次數(shù)大于第一閾值的各條待篩選數(shù)據(jù)在驗證表中進行記錄。
      [0017]可選地,針對歸并后具有同一 URL的各條待篩選數(shù)據(jù),判斷內(nèi)核切換匹配庫中是否有對應(yīng)所述URL的記錄包括:
      [0018]解析所述URL,確定對應(yīng)所述URL的主域名,匹配方式及對應(yīng)的匹配方式的匹配子串;
      [0019]根據(jù)對應(yīng)所述URL主域名,選擇內(nèi)核切換匹配庫中所有與所述主域名相同的所有記錄;
      [0020]在與所述主域名相同的所有記錄中,在與對應(yīng)所述URL的匹配方式相同的記錄中,進行匹配子串的比較;如果匹配子串匹配上,判斷內(nèi)核切換匹配庫中有對應(yīng)所述URL的記錄。
      [0021]可選地,所述匹配方式包括:
      [0022]主域名匹配方式、子網(wǎng)址匹配方式、字串匹配方式、正則表達式匹配方式其中的至少一個。
      [0023]可選地,所述針對具有同一 URL的各待篩選數(shù)據(jù),以所述內(nèi)核標識為標準歸并為一條待篩選數(shù)據(jù),并在該條數(shù)據(jù)中記錄對應(yīng)內(nèi)核標識的切換次數(shù)之后,還包括:
      [0024]去掉切換次數(shù)小于第二閾值的歸并后的待篩選數(shù)據(jù)。
      [0025]可選地,所述篩選參數(shù)還包括:用戶身份標識;
      [0026]進一步的,所述根據(jù)所述篩選參數(shù)對各待篩選數(shù)據(jù)歸并時還包括:
      [0027]將指定時間段內(nèi),同一用戶身份標識對同一 URL和同一內(nèi)核標識的切換記錄進行去重。
      [0028]可選地,上述方法還進一步包括:
      [0029]所述客戶端在針對一 URL切換后,將URL、身份標識進行加密,與切換后內(nèi)核標識一起構(gòu)造切換記錄,并發(fā)送至服務(wù)器。
      [0030]可選地,基于所述驗證表,更新所述內(nèi)核切換匹配庫包括:
      [0031]根據(jù)所述驗證表,確認最終待更新的URL記錄,并基于所述待更新的URL記錄,生成第一更新表;所述第一更新表的字段與所述內(nèi)核切換匹配庫的字段一致;所述字段包括:主域名、匹配子串、匹配方式、內(nèi)核標識;
      [0032]將所述第一更新表的待更新數(shù)據(jù)插入或者更新入所述內(nèi)核切換匹配庫。
      [0033]可選地,所述將所述第一更新表的待更新數(shù)據(jù)插入或者更新入所述內(nèi)核切換匹配庫包括:
      [0034]針對第一更新表的具有相同主域名的待更新數(shù)據(jù),判斷所述內(nèi)核切換匹配庫中是否存在相同的主域名的記錄;
      [0035]如果沒有相同的主域名的記錄,則直接將所述待更新數(shù)據(jù)插入內(nèi)核切換匹配庫;
      [0036]如果有相同的主域名的記錄,則將內(nèi)核切換匹配庫中所有所述主域名的記錄以匹配方式為排序字段進行排序;
      [0037]在排序后,根據(jù)所述待更新數(shù)據(jù)的匹配方式確定是否進行匹配子串的比較,如果需要,則根據(jù)比較結(jié)果判斷是否將待更新數(shù)據(jù)插入或者更新入所述內(nèi)核切換匹配庫,如果需要,則根據(jù)比較結(jié)果判斷是否將待更新數(shù)據(jù)插入或者更新入所述內(nèi)核切換匹配庫。
      [0038]可選地,所述在排序后,根據(jù)所述待更新數(shù)據(jù)的匹配方式確定是否進行匹配子串的比較,如果需要,則根據(jù)比較結(jié)果判斷是否將待更新數(shù)據(jù)插入或者更新入所述內(nèi)核切換匹配庫包括:
      [0039]將所述待更新數(shù)據(jù)的匹配方式與所述排序字段進行比較,當匹配方式不同時,直接跳過內(nèi)核切換匹配庫中的該條數(shù)據(jù);
      [0040]當匹配方式相同時,則將所述待更新數(shù)據(jù)的匹配子串,與內(nèi)核切換匹配庫中的該條數(shù)據(jù)的匹配子串進行比較;
      [0041]如果匹配子串相同,則判斷內(nèi)核標識是否相同;如果不同,則將內(nèi)核切換匹配庫中的更新為所述待更新數(shù)據(jù)的內(nèi)核標識;如果相同,則不做處理;
      [0042]如果待更新數(shù)據(jù)的匹配子串包含內(nèi)核切換匹配庫中的該條數(shù)據(jù)的匹配子串,則刪除內(nèi)核切換匹配庫中的該條數(shù)據(jù),插入待更新數(shù)據(jù);
      [0043]如果內(nèi)核切換匹配庫中的該條數(shù)據(jù)的匹配子串包含待更新數(shù)據(jù)的匹配子串,則判斷內(nèi)核標識是否相同,如果不同,則將內(nèi)核切換匹配庫中的更新為所述待更新數(shù)據(jù)的內(nèi)核標識;如果相同,則不做處理。
      [0044]依據(jù)本發(fā)明另一個方面,本發(fā)明公開了一種瀏覽器內(nèi)核切換匹配庫數(shù)據(jù)更新的裝置,包括:
      [0045]記錄獲取模塊,適于獲取客戶端切換內(nèi)核后的切換記錄;
      [0046]記錄解析模塊,適于解析每條切換記錄,獲得一條待篩選數(shù)據(jù);所述待篩選數(shù)據(jù)包括各篩選參數(shù),所述篩選參數(shù)包括URL、切換后的內(nèi)核標識;
      [0047]歸并模塊,適于根據(jù)所述篩選參數(shù)對各待篩選數(shù)據(jù)歸并;
      [0048]篩選模塊,適于基于內(nèi)核切換匹配庫對歸并后的待篩選數(shù)據(jù)進行篩選,并基于篩選結(jié)果生成驗證表;
      [0049]更新模塊,適于基于所述更新表,更新所述內(nèi)核切換匹配庫。
      [0050]可選地,所述歸并模塊包括:
      [0051]第一歸并模塊,適于針對具有同一 URL的各待篩選數(shù)據(jù),以所述內(nèi)核標識為標準歸并為一條待篩選數(shù)據(jù),并在該條數(shù)據(jù)中記錄對應(yīng)內(nèi)核標識的切換次數(shù)。
      [0052]可選地,所述篩選模塊包括:
      [0053]URL判斷模塊,適于針對歸并后具有同一 URL的各條待篩選數(shù)據(jù),判斷內(nèi)核切換匹配庫中是否有對應(yīng)所述URL的記錄;
      [0054]第一記錄模塊,適于如果沒有對應(yīng)所述URL的記錄,則根據(jù)對應(yīng)所述URL的各條待篩選數(shù)據(jù)在驗證表中進行記錄;
      [0055]內(nèi)核標識確認模塊,適于如果有對應(yīng)所述URL的記錄,則確認已經(jīng)在內(nèi)核切換匹配庫記錄的內(nèi)核標識;
      [0056]第二記錄模塊,適于刪除對應(yīng)該被確認的內(nèi)核標識的數(shù)據(jù),并將除該被確認的內(nèi)核標識之外的、切換次數(shù)大于第一閾值的各條待篩選數(shù)據(jù)在驗證表中進行記錄。
      [0057]可選地,所述URL判斷模塊包括:
      [0058]第一解析模塊,適于解析所述URL,確定對應(yīng)所述URL的主域名,匹配方式及對應(yīng)的匹配方式的匹配子串;
      [0059]主域名選擇模塊,適于根據(jù)對應(yīng)所述URL主域名,選擇內(nèi)核切換匹配庫中所有與所述主域名相同的所有記錄;[0060]第三記錄模塊,適于在與所述主域名相同的所有記錄中,在與對應(yīng)所述URL的匹配方式相同的記錄中,進行匹配子串的比較;如果匹配子串匹配上,判斷內(nèi)核切換匹配庫中有對應(yīng)所述URL的記錄。
      [0061]可選地,所述匹配方式包括:
      [0062]主域名匹配方式、子網(wǎng)址匹配方式、字串匹配方式、正則表達式匹配方式其中的至少一個。
      [0063]可選地,所述第一歸并模塊之后還包括:
      [0064]初步篩選模塊,適于去掉切換次數(shù)小于第二閾值的歸并后的待篩選數(shù)據(jù)。
      [0065]可選地,所述篩選參數(shù)還包括:用戶身份標識;
      [0066]進一步的,所述歸并模塊還包括:
      [0067]去重模塊,適于將指定時間段內(nèi),同一用戶身份標識對同一 URL和同一內(nèi)核標識的切換記錄進行去重。
      [0068]可選地,在客戶端,還包括:
      [0069]切換數(shù)據(jù)發(fā)送模塊,適于所述客戶端在針對一 URL切換后,將URL、身份標識進行加密,與切換后內(nèi)核標識一起構(gòu)造切換記錄,并發(fā)送至服務(wù)器。
      [0070]可選地,所述更新模塊包括:
      [0071]更新確認模塊,適于根據(jù)所述驗證表,確認最終待更新的URL記錄,并基于所述待更新的URL記錄,生成第一更新表;所述第一更新表的字段與所述內(nèi)核切換匹配庫的字段一致;所述字段包括:主域名、匹配子串、匹配方式、內(nèi)核標識;
      [0072]第二更新模塊,適于將所述第一更新表的待更新數(shù)據(jù)插入或者更新入所述內(nèi)核切換匹配庫。
      [0073]可選地,所述第二更新模塊包括:
      [0074]第一域名匹配模塊,適于針對第一更新表的具有相同主域名的待更新數(shù)據(jù),判斷所述內(nèi)核切換匹配庫中是否存在相同的主域名的記錄;
      [0075]第一插入模塊,適于如果沒有相同的主域名的記錄,則直接將所述待更新數(shù)據(jù)插入內(nèi)核切換匹配庫;
      [0076]排序模塊,適于如果有相同的主域名的記錄,則將內(nèi)核切換匹配庫中所有所述主域名的記錄以匹配方式為排序字段進行排序;
      [0077]第二插入模塊,適于在排序后,根據(jù)所述待更新數(shù)據(jù)的匹配方式確定是否進行匹配子串的比較,如果需要,則根據(jù)比較結(jié)果判斷是否將待更新數(shù)據(jù)插入或者更新入所述內(nèi)核切換匹配庫,如果需要,則根據(jù)比較結(jié)果判斷是否將待更新數(shù)據(jù)插入或者更新入所述內(nèi)核切換匹配庫。
      [0078]可選地,所述第二插入模塊包括:
      [0079]匹配方式比較模塊,適于將所述待更新數(shù)據(jù)的匹配方式與所述排序字段進行比較,當匹配方式不同時,直接跳過內(nèi)核切換匹配庫中的該條數(shù)據(jù);
      [0080]匹配子串比較模塊,適于當匹配方式相同時,則將所述待更新數(shù)據(jù)的匹配子串,與內(nèi)核切換匹配庫中的該條數(shù)據(jù)的匹配子串進行比較;
      [0081]第一內(nèi)核標識比較模塊,適于如果匹配子串相同,則判斷內(nèi)核標識是否相同;如果不同,則將內(nèi)核切換匹配庫中的更新為所述待更新數(shù)據(jù)的內(nèi)核標識;如果相同,則不做處理;
      [0082]第二內(nèi)核標識比較模塊,適于如果待更新數(shù)據(jù)的匹配子串包含內(nèi)核切換匹配庫中的該條數(shù)據(jù)的匹配子串,則刪除內(nèi)核切換匹配庫中的該條數(shù)據(jù),插入待更新數(shù)據(jù);
      [0083]第三內(nèi)核標識比較模塊,適于如果內(nèi)核切換匹配庫中的該條數(shù)據(jù)的匹配子串包含待更新數(shù)據(jù)的匹配子串,則判斷內(nèi)核標識是否相同,如果不同,則將內(nèi)核切換匹配庫中的更新為所述待更新數(shù)據(jù)的內(nèi)核標識;如果相同,則不做處理。
      [0084]根據(jù)本發(fā)明的針對客戶端主動切換內(nèi)核的記錄,進行解析,然后進行歸并和篩選,根據(jù)篩選結(jié)果生對內(nèi)核切換匹配庫進行更新,可以解決現(xiàn)有技術(shù)中推出了一種可以切換內(nèi)核的瀏覽器,用戶可以在訪問網(wǎng)頁的過程中,瀏覽器根據(jù)匹配庫的設(shè)置首先選擇一個內(nèi)核打開網(wǎng)頁,但是該種預選的方式存在高概率的錯誤,用戶經(jīng)常需要手動切換。上述的匹配庫由于網(wǎng)頁與內(nèi)核的對應(yīng)關(guān)系是人為篩選,其錯誤率高、影響客戶端對網(wǎng)頁的展示,并且人工成本高昂的問題,取得了降低內(nèi)核匹配錯誤率、降低后臺人工分析成本的有益效果。
      [0085]上述說明僅是本發(fā)明技術(shù)方案的概述,為了能夠更清楚了解本發(fā)明的技術(shù)手段,而可依照說明書的內(nèi)容予以實施,并且為了讓本發(fā)明的上述和其它目的、特征和優(yōu)點能夠更明顯易懂,以下特舉本發(fā)明的【具體實施方式】。
      【專利附圖】

      【附圖說明】
      [0086]通過閱讀下文優(yōu)選實施方式的詳細描述,各種其他的優(yōu)點和益處對于本領(lǐng)域普通技術(shù)人員將變得清楚明了。附圖僅用于示出優(yōu)選實施方式的目的,而并不認為是對本發(fā)明的限制。而且在整個附圖中,用相同的參考符號表示相同的部件。在附圖中:
      [0087]圖1示出了根據(jù)本發(fā)明一個實施例的一種瀏覽器內(nèi)核切換匹配庫數(shù)據(jù)更新的方法的流程示意圖;
      [0088]圖2示出了根據(jù)本發(fā)明一個實施例的一種瀏覽器內(nèi)核切換匹配庫數(shù)據(jù)更新的方法的流程示意圖;
      [0089]圖3示出了根據(jù)本發(fā)明一個實施例的一種瀏覽器內(nèi)核切換匹配庫數(shù)據(jù)更新的方法的流程示意圖;
      [0090]圖3a示出了根據(jù)本發(fā)明一個實施例的內(nèi)核切換匹配庫記錄示例;
      [0091]圖3b示出了根據(jù)本發(fā)明一個實施例的內(nèi)核切換匹配庫記錄排序后的示例;
      [0092]圖4示出了根據(jù)本發(fā)明一個實施例的一種瀏覽器內(nèi)核切換匹配庫數(shù)據(jù)更新的方法的流程示意圖;
      [0093]圖4a示出了根據(jù)本發(fā)明一個實施例的一個待更新數(shù)據(jù)示例;
      [0094]圖4b示出了根據(jù)本發(fā)明一個實施例的一個待更新數(shù)據(jù)示例;
      [0095]圖4c示出了根據(jù)本發(fā)明一個實施例的一個待更新數(shù)據(jù)示例;
      [0096]圖4d示出了根據(jù)本發(fā)明一個實施例的一個待更新數(shù)據(jù)示例;
      [0097]圖5示出了根據(jù)本發(fā)明一個實施例的示出了根據(jù)本發(fā)明一個實施例的一種瀏覽器內(nèi)核切換匹配庫數(shù)據(jù)更新的裝置的結(jié)構(gòu)示意圖;
      [0098]圖6示出了根據(jù)本發(fā)明一個實施例的示出了根據(jù)本發(fā)明一個實施例的一種瀏覽器內(nèi)核切換匹配庫數(shù)據(jù)更新的裝置的結(jié)構(gòu)示意圖;
      [0099]圖7示出了根據(jù)本發(fā)明一個實施例的示出了根據(jù)本發(fā)明一個實施例的一種瀏覽器內(nèi)核切換匹配庫數(shù)據(jù)更新的裝置的結(jié)構(gòu)示意圖;
      [0100]圖8示出了根據(jù)本發(fā)明一個實施例的示出了根據(jù)本發(fā)明一個實施例的一種瀏覽器內(nèi)核切換匹配庫數(shù)據(jù)更新的裝置的結(jié)構(gòu)示意圖。
      【具體實施方式】
      [0101]下面將參照附圖更詳細地描述本公開的示例性實施例。雖然附圖中顯示了本公開的示例性實施例,然而應(yīng)當理解,可以以各種形式實現(xiàn)本公開而不應(yīng)被這里闡述的實施例所限制。相反,提供這些實施例是為了能夠更透徹地理解本公開,并且能夠?qū)⒈竟_的范圍完整的傳達給本領(lǐng)域的技術(shù)人員。
      [0102]實施例一
      [0103]參照圖1,其示出了一種瀏覽器內(nèi)核切換匹配庫數(shù)據(jù)更新的方法的流程示意圖,具體可以包括:
      [0104]步驟102,獲取客戶端切換內(nèi)核后的切換記錄;
      [0105]在本發(fā)明實施例中,各個瀏覽器用戶在使用過程中可能進行內(nèi)核切換,那么奔放實施例則可對上述切換的記錄進行獲取。本發(fā)明實施例中切換記錄包括了 URL、切換后的內(nèi)核標識的數(shù)據(jù),當然還可包括其他數(shù)據(jù),比如用戶身份信息。
      [0106]實際中,瀏覽器用戶在點擊切換內(nèi)核時,本發(fā)明的瀏覽器會對網(wǎng)頁進行記錄,然后加密打點向服務(wù)器發(fā)送,在發(fā)送時可將加密后的用戶身份信息、內(nèi)核切換信息向服務(wù)器進行打點,然后向服務(wù)器發(fā)送。如客戶端打開某一網(wǎng)頁進行切換時打點如下: [0107]“http://seupdate.360safe.com/core.html?mid=7017fd5ed69d3661f136b2flb5726af&ver=5.0.0.202%argl=YB7h0/aprHlinsvYSxKzDlX+Hlodl2N5&arg2=&arg3=2”
      [0108]其中mid 為用戶身份唯一識別碼,argl 為 URL (Uniform/Universal ResourceLocator的縮寫,統(tǒng)一資源定位符)的加密后的數(shù)據(jù),arg3為內(nèi)核標識比如arg3=l表示chrome內(nèi)核,arg3=2表示ie標準內(nèi)核,arg3=2表示ie兼容內(nèi)核。arg2可以表示其他內(nèi)容??蛻舳舜螯c后即可將數(shù)據(jù)發(fā)送至服務(wù)器。當然發(fā)送至服務(wù)器的數(shù)據(jù)還可包括其他內(nèi)容,比如日期等。
      [0109]即所述客戶端在針對一 URL切換后,將URL、身份標識進行加密,與切換后內(nèi)核標識一起構(gòu)造切換記錄,并發(fā)送至服務(wù)器。
      [0110]在本發(fā)明實施例中,對于用戶的每次切換均會進行打點記錄,然后發(fā)送至服務(wù)器,那么服務(wù)器則可獲取客戶端切換內(nèi)核后的切換記錄。
      [0111]步驟104,解析每條切換記錄,獲得一條待篩選數(shù)據(jù);所述待篩選數(shù)據(jù)包括各篩選參數(shù),所述篩選參數(shù)包括URL、切換后的內(nèi)核標識;
      [0112]針對服務(wù)器接收到的海量數(shù)據(jù)中的每條數(shù)據(jù),本發(fā)明實施例都對其進行處理,獲得對應(yīng)的待篩選數(shù)據(jù)。比如解析前述的參數(shù)解析客戶端發(fā)送的數(shù)據(jù),比如argl的值URL,arg3的值對應(yīng)內(nèi)核標識,mid對應(yīng)的值為用戶身份標識等。得到篩選參數(shù),比如URL、內(nèi)核標識、用戶身份標識等。
      [0113]步驟106,根據(jù)所述篩選參數(shù)對各待篩選數(shù)據(jù)歸并;
      [0114]實際中,可能不同的用戶針對同一 URL切換的內(nèi)核可能不同,那么本發(fā)明實施例中由服務(wù)器首先解析得到的待篩選數(shù)據(jù)進行歸并,以針對同一 URL在不同的內(nèi)核標識下進行歸并,比如對某個URL,由500條chrome內(nèi)核的切換記錄,有700條IE標準內(nèi)核的切換記錄,有40條IE兼容內(nèi)核的切換記錄,那么則可對相應(yīng)得到的待篩選數(shù)據(jù)進行歸并。
      [0115]可選地,所述根據(jù)所述篩選參數(shù)對各待篩選數(shù)據(jù)歸并包括:
      [0116]步驟A10,針對具有同一 URL的各待篩選數(shù)據(jù),以所述內(nèi)核標識為標準歸并為一條待篩選數(shù)據(jù),并在該條數(shù)據(jù)中記錄對應(yīng)內(nèi)核標識的切換次數(shù)。
      [0117]比如對于前述對某個URL,由500條chrome內(nèi)核的切換記錄,有700條IE標準內(nèi)核的切換記錄,有40條IE兼容內(nèi)核的切換記錄,可在同一 URL+內(nèi)核標識下進行歸并,得到URL, (1,500), (2,700),(3,40),其中括號中的第一個數(shù)字為內(nèi)核標識。
      [0118]可選地,在篩選參數(shù)還包括:用戶身份標識的情況下,所述根據(jù)所述篩選參數(shù)對各待篩選數(shù)據(jù)歸并時還包括:
      [0119]步驟A12,將指定時間段內(nèi),同一用戶身份標識對同一 URL和同一內(nèi)核標識的切換
      記錄進行去重。
      [0120]實際中,同一瀏覽器用戶在同一時間段內(nèi)(比如一天,或者比如12小時),肯能針對同一 URL切換了同一內(nèi)核,那么如果同一瀏覽器用戶的切換量比較多,在最后進行統(tǒng)計時由于參與人次的偏差,可能影響最后第一更新表的準確率,因此在本發(fā)明實施例中可首先對原始的待篩選數(shù)據(jù)進行去重,即針對一段時間內(nèi),同一用戶身份標識對同一 URL切換到同一內(nèi)核時的記錄進行去重,只保留一條數(shù)據(jù)。如此可將待篩選數(shù)據(jù)歸一到人次這一概念上,提高了后續(xù)分析篩選的準確度。
      [0121]去重后,再對同一 URL的不同內(nèi)核標識進行歸并,得到不同內(nèi)核標識下的次數(shù)。
      [0122]另外在初次篩選時,還可設(shè)置初始閾值,當歸并后的某個內(nèi)核標識的次數(shù)低于初始閾值時,則剔除該歸并后的數(shù)據(jù),當然還可在內(nèi)核標識下將次數(shù)記錄為O。如此可以進一步避免人次過低的內(nèi)核切換記錄的核對,降低服務(wù)器的處理過程,提高資源利用率。
      [0123]步驟108,基于內(nèi)核切換匹配庫對歸并后的待篩選數(shù)據(jù)進行篩選,并基于篩選結(jié)果生成驗證表;
      [0124]在本發(fā)明實施例中,由于內(nèi)核切換匹配庫原來存在一批數(shù)據(jù),并且上述的待篩選數(shù)據(jù)需要確定URL具體對應(yīng)哪一個內(nèi)核更為準確,則需要基于內(nèi)核切換匹配庫對歸并后的待篩選數(shù)據(jù)進行篩選,獲得驗證表。比如可基于上述格式的歸并結(jié)果生成驗證表,驗證表的字段為:key (URL對應(yīng)的主域名)、URL、瀏覽器記錄日期、內(nèi)核標識I人數(shù)、內(nèi)核標識2人數(shù)……內(nèi)核標識η人數(shù)等等,該驗證表中針對每條URL進行記錄。
      [0125]可選地,所述基于內(nèi)核切換匹配庫對歸并后的待篩選數(shù)據(jù)進行篩選,并基于篩選結(jié)果生成驗證表包括:
      [0126]步驟Α20,針對歸并后具有同一 URL的各條待篩選數(shù)據(jù),判斷內(nèi)核切換匹配庫中是否有對應(yīng)所述URL的記錄;
      [0127]本發(fā)明實施例中通過內(nèi)核匹配庫確定是否存在與驗證表中相同的URL的記錄。在本發(fā)明中對于客戶端發(fā)送的完整URL,自動將網(wǎng)站和匹配子串中域名部分的大寫字母轉(zhuǎn)為小寫字母,自動去掉域名及子串里的url開頭的協(xié)議部分(http://)。
      `[0128]可選地,所述針對歸并后具有同一 URL的各條待篩選數(shù)據(jù),判斷內(nèi)核切換匹配庫中是否有對應(yīng)所述URL的記錄包括:
      [0129]子步驟S20,解析所述URL,確定對應(yīng)所述URL的主域名,匹配方式及對應(yīng)的匹配方式的匹配子串;
      [0130]在本發(fā)明實施例中,內(nèi)核切換匹配庫的數(shù)據(jù)結(jié)構(gòu)進行了針對性的設(shè)置,其字段結(jié)構(gòu)包括:key:主域名
      [0131]key:主域名;可設(shè)置為網(wǎng)站頂級域名,不帶http頭
      [0132]pattern:匹配子串;一般為URL的子串;
      [0133]type:匹配類型;可設(shè)置為整數(shù),O為相同即匹配,I為二級網(wǎng)址匹配,2為子串匹配,3為正則匹配;
      [0134]flag:內(nèi)核標識;可設(shè)置為整數(shù),O為未定義,I為chrome, 2為IE兼容模式,3為IE標準模式。
      [0135]當然還可包括其他字段結(jié)構(gòu)。
      [0136]本發(fā)明實施例在上述字段結(jié)構(gòu)下的匹配庫的基礎(chǔ)上,將URL與匹配庫進行匹配,判斷匹配庫中是否有該URL的記錄。
      [0137]在本發(fā)明實施例中,可解析所述URL,并解析該URL對應(yīng)的匹配方式,從而選擇相應(yīng)的匹配子串。在本發(fā)明中針對每個網(wǎng)站、其下屬的各級子網(wǎng)址,及具體的網(wǎng)頁,可預先設(shè)置解析規(guī)則,判斷其URL適用哪一種匹配方式,在本發(fā)明實施例中,所述匹配方式包括:
      [0138]主域名匹配方式、子網(wǎng)址匹配方式、字串匹配方式、正則表達式匹配方式其中的至少一個。
      [0139]主域名匹配方式,即對于一 URL只用進行主域名匹配,比如http://www.163.com/可只獲取主域名匹配。
      [0140]子網(wǎng)址匹配方式,即獲取URL的子網(wǎng)址匹配,比如二級域名、或者三級域名等,比如對于http://money.163.com/,可匹配二級域名。
      [0141]字串匹配方式,即獲取URL的部分或者全部字串進行匹配,比如http://quotes,money.163.com/#query=NODEAL_FXJS&DataType=HS_RANK&sort=PERCENT&order=desc&count=24&page=0&$3xdl3,可獲取 quotes, money.163.com/#query 字串進行匹配。
      [0142]正則表達式匹配方式,即查找對應(yīng)該URL的正則表達式去匹配庫查詢是否有相應(yīng)記錄,比如匹配網(wǎng)址URL的正則表達式:[a-zA_z] +://[~\s]*。
      [0143]那么在本發(fā)明實施例中,對URL,確定其主域名,匹配方式以及對應(yīng)的匹配子串(t匕如是正則表達式匹配,則匹配子串則為以該URL確認的正則表達式)。
      [0144]子步驟S22,根據(jù)對應(yīng)所述URL主域名,選擇內(nèi)核切換匹配庫中所有與所述主域名相同的所有記錄;
      [0145]本步驟則首先以key字段提取內(nèi)核切換匹配庫中所有的相同的記錄,以減少計算量,降低系統(tǒng)負荷。
      [0146]子步驟S24,在與所述主域名相同的所有記錄中,在與對應(yīng)所述URL的匹配方式相同的記錄中,進行匹配子串的比較;如果匹配子串匹配上,判斷內(nèi)核切換匹配庫中有對應(yīng)所述URL的記錄。
      [0147]下面以一個具體例子說明上述過程:比如“http://news.sina.com.cn/w/2010-07-22/024720730439.shtml,,,可解析其 key=163.com,
      [0148]SWtype==O,則為主域名匹配方式,表示pattern為空,也就是只要key相同就認為匹配成功;[0149]SWtype==I,則為子網(wǎng)址匹配方式,表示pattern為子網(wǎng)站.對此URL就是如果pattern== “news.sina.com.cn” 就認為匹配成功
      [0150]若以type==2,表示pattern為字串匹配方式,例如如果pattern== “.sina.com.cn/w/2010”,則此URL匹配成功
      [0151]若以type==3,則,正則表達式匹配方式,表示pattern為正則表達式。
      [0152]步驟A22,如果沒有對應(yīng)所述URL的記錄,則根據(jù)對應(yīng)所述URL的各條待篩選數(shù)據(jù)在驗證表中進行記錄;
      [0153]如果內(nèi)核切換匹配庫中未能匹配上數(shù)據(jù),則說明內(nèi)核切換匹配庫不存在相應(yīng)記錄,可將該URL的各記錄在驗證表中進行記錄。
      [0154]步驟A24,如果有對應(yīng)所述URL的記錄,則確認已經(jīng)在內(nèi)核切換匹配庫記錄的內(nèi)核標識;
      [0155]如果有URL記錄,說明已經(jīng)有匹配的內(nèi)核標識了,那么則確認內(nèi)核切換匹配庫已經(jīng)記錄的對應(yīng)該URL的內(nèi)核標識是什么。
      [0156]步驟A26,刪除對應(yīng)該被確認的內(nèi)核標識的數(shù)據(jù),并將除該被確認的內(nèi)核標識之外的、切換次數(shù)大于第一閾值的各條待篩選數(shù)據(jù)在驗證表中進行記錄。
      [0157]在本步驟中,比如對于某URL,其內(nèi)核標識I在內(nèi)存庫中有記錄,而前述步驟統(tǒng)計得打內(nèi)核標識I的次數(shù)為500次,內(nèi)核標識2的次數(shù)為100次,內(nèi)核標識3的次數(shù)為200次,100,200次均大于第一閾值(比如50),那么可將該URL對應(yīng)內(nèi)核標識2的次數(shù)為100次,內(nèi)核標識3的次數(shù)為200次的記錄在驗證表中記錄,內(nèi)核標識I的數(shù)據(jù)進行刪除,不用在驗證表中記錄;
      [0158]如果內(nèi)核標識2的次數(shù)為100次(大于50),內(nèi)核標識3的次數(shù)為O次(小于50),那么可將該URL對應(yīng)內(nèi)核標識2的次數(shù)為100次的記錄在驗證表中記錄,將內(nèi)核標識I的數(shù)據(jù)進行刪除,不用在驗證表中記錄,
      [0159]如果內(nèi)核標識2的次數(shù)為O次(小于20),內(nèi)核標識3的次數(shù)為O次(小于50),那么可以將內(nèi)核標識I的數(shù)據(jù)進行刪除,不用在驗證表中記錄。
      [0160]步驟110,基于所述驗證表,更新所述內(nèi)核切換匹配庫。
      [0161]得打所述驗證表后,則基于所述驗證表,更新所述內(nèi)核切換匹配庫。
      [0162]當然本發(fā)明中驗證表中可能針對同一 URL記錄了多個內(nèi)核及次數(shù),并且與內(nèi)核沖突,本發(fā)明可對該種URL進行后臺審核或者判斷確認具體選擇哪一種內(nèi)核在內(nèi)核切換匹配庫中記錄。
      [0163]根據(jù)本發(fā)明的針對客戶端主動切換內(nèi)核的記錄,進行解析,然后進行歸并和篩選,根據(jù)篩選結(jié)果生對內(nèi)核切換匹配庫進行更新,可以解決現(xiàn)有技術(shù)中推出了一種可以切換內(nèi)核的瀏覽器,用戶可以在訪問網(wǎng)頁的過程中,瀏覽器根據(jù)匹配庫的設(shè)置首先選擇一個內(nèi)核打開網(wǎng)頁,但是該種預選的方式存在高概率的錯誤,用戶經(jīng)常需要手動切換。上述的匹配庫由于網(wǎng)頁與內(nèi)核的對應(yīng)關(guān)系是人為篩選,其錯誤率高、影響客戶端對網(wǎng)頁的展示,并且人工成本高昂的問題,取得了降低內(nèi)核匹配錯誤率、降低后臺人工分析成本的有益效果。
      [0164]實施例二
      [0165]參照圖2,其示出了一種瀏覽器內(nèi)核切換匹配庫數(shù)據(jù)更新的方法的流程示意圖,具體可以包括:[0166]步驟202,獲取客戶端切換內(nèi)核后的切換記錄;
      [0167]步驟204,解析每條切換記錄,獲得一條待篩選數(shù)據(jù);所述待篩選數(shù)據(jù)包括各篩選參數(shù),所述篩選參數(shù)包括URL、切換后的內(nèi)核標識、用戶標識;
      [0168]步驟206,將指定時間段內(nèi),同一用戶身份標識對同一 URL和同一內(nèi)核標識的切換
      記錄進行去重;
      [0169]在本發(fā)明實施例中可由第一服務(wù)器執(zhí)行步驟206、步驟208,然后將得到的數(shù)據(jù)導出內(nèi)核切換匹配庫所在的第二服務(wù)器進行后續(xù)處理,導出的格式可為CSV格式文件,文件中每一行對應(yīng)一條記錄,記錄格式可包括:
      [0170]日期字段,URL字段,內(nèi)核標識i (i=0、l、2、3……)出現(xiàn)的記錄次數(shù),相同用戶身份標識的內(nèi)核標識i的記錄消重次數(shù)等。
      [0171]第二服務(wù)器得到上述CSV格式文件后,可依據(jù)字段含義進行解析。
      [0172]步驟208,針對具有同一 URL的各待篩選數(shù)據(jù),以所述內(nèi)核標識為標準歸并為一條待篩選數(shù)據(jù),并在該條數(shù)據(jù)中記錄對應(yīng)內(nèi)核標識的切換次數(shù),并刪除切換次數(shù)低于第二閾值數(shù)據(jù);
      [0173]步驟210,針對歸并后具有同一 URL的各條待篩選數(shù)據(jù),判斷內(nèi)核切換匹配庫中是否有對應(yīng)所述URL的記錄; [0174]步驟212,如果沒有對應(yīng)所述URL的記錄,則根據(jù)對應(yīng)所述URL的各條待篩選數(shù)據(jù)在驗證表中進行記錄;
      [0175]步驟214,如果有對應(yīng)所述URL的記錄,則確認已經(jīng)在內(nèi)核切換匹配庫記錄的內(nèi)核標識;
      [0176]步驟216,刪除對應(yīng)該被確認的內(nèi)核標識的數(shù)據(jù),并將除該被確認的內(nèi)核標識之外的、切換次數(shù)大于第一閾值的各條待篩選數(shù)據(jù)在驗證表中進行記錄;
      [0177]步驟218,基于所述驗證表,更新所述內(nèi)核切換匹配庫。
      [0178]本發(fā)明實施例在步驟208進行了初次篩選,在步驟216進行了再次篩選,進一步降低了低頻率數(shù)據(jù)的后續(xù)處理工作,降低了第二服務(wù)器的負荷。
      [0179]根據(jù)本發(fā)明的針對客戶端主動切換內(nèi)核的記錄,進行解析,然后進行歸并和篩選,根據(jù)篩選結(jié)果生對內(nèi)核切換匹配庫進行更新,可以解決現(xiàn)有技術(shù)中推出了一種可以切換內(nèi)核的瀏覽器,用戶可以在訪問網(wǎng)頁的過程中,瀏覽器根據(jù)匹配庫的設(shè)置首先選擇一個內(nèi)核打開網(wǎng)頁,但是該種預選的方式存在高概率的錯誤,用戶經(jīng)常需要手動切換。上述的匹配庫由于網(wǎng)頁與內(nèi)核的對應(yīng)關(guān)系是人為篩選,其錯誤率高、影響客戶端對網(wǎng)頁的展示,并且人工成本高昂的問題,取得了降低內(nèi)核匹配錯誤率、降低后臺人工分析成本的有益效果。
      [0180]實施例三
      [0181]參照圖3,其示出了一種瀏覽器內(nèi)核切換匹配庫數(shù)據(jù)更新的方法的流程示意圖,具體可以包括:
      [0182]步驟302,獲取客戶端切換內(nèi)核后的切換記錄;
      [0183]步驟304,解析每條切換記錄,獲得一條待篩選數(shù)據(jù);所述待篩選數(shù)據(jù)包括各篩選參數(shù),所述篩選參數(shù)包括URL、切換后的內(nèi)核標識;
      [0184]步驟306,根據(jù)所述篩選參數(shù)對各待篩選數(shù)據(jù)歸并;
      [0185]步驟308,基于內(nèi)核切換匹配庫對歸并后的待篩選數(shù)據(jù)進行篩選,并基于篩選結(jié)果生成驗證表;
      [0186]步驟310,根據(jù)所述驗證表,確認最終待更新的URL記錄,并基于所述待更新的URL記錄,生成第一更新表;所述第一更新表的字段與所述內(nèi)核切換匹配庫的字段一致;所述字段包括:主域名、匹配子串、匹配方式、內(nèi)核標識;
      [0187]在本發(fā)明實施例可如前述實施例中得到驗證表,而驗證表中的記錄中,對于一URL,可能本身的內(nèi)核標識即存在多個,可能與內(nèi)核切換匹配庫中記錄的內(nèi)核標識也存在沖突,而內(nèi)核切換匹配庫中對于同一 URL只能保留一個內(nèi)核標識,以便客戶端瀏覽器進行切換。那么本發(fā)明則需要給予驗證表進行最終確認,那些待更新的URL記錄可以進行更新。在本發(fā)明實施例中可進行后臺人工確認,也可根據(jù)其他方式確認。待更新的URL記錄確認后,基于所述待更新的URL記錄,生成第一更新表;所述第一更新表的字段與所述內(nèi)核切換匹配庫的字段一致;所述字段包括:主域名、匹配子串、匹配方式、內(nèi)核標識。
      [0188]內(nèi)核切換匹配庫的結(jié)構(gòu)與前述實施例類似,主域名、匹配子串、匹配方式、內(nèi)核標識也與前述實施例類似,在此不在詳述。
      [0189]步驟312,將所述第一更新表的待更新數(shù)據(jù)插入或者更新入所述內(nèi)核切換匹配庫。
      [0190]在確認了最終要導入內(nèi)核切換匹配庫的URL記錄后,由于內(nèi)核切換匹配庫中已經(jīng)有若干的域名記錄(比如圖3a庫中的記錄示例),要導入一批記錄到庫中,沖突經(jīng)常發(fā)生,為了保證內(nèi)核切換匹配庫庫最精簡,需要刪除或修改庫中已有的記錄或者插入新的記錄。
      [0191]可選地,所述將所述第一更新表的待更新數(shù)據(jù)插入或者更新入所述內(nèi)核切換匹配庫包括:
      [0192]步驟C12,針對第一更新表的具有相同主域名的待更新數(shù)據(jù),判斷所述內(nèi)核切換匹配庫中是否存在相同的主域名的記錄;
      [0193]步驟C14,如果沒有相同的主域名的記錄,則直接將所述待更新數(shù)據(jù)插入內(nèi)核切換匹配庫;
      [0194]比如對于xyz.com主域名的數(shù)據(jù),內(nèi)核切換匹配庫中沒有該主域名的任何記錄,則直接將這些待更新數(shù)據(jù)插入內(nèi)核切換匹配庫。
      [0195]步驟C16,如果有相同的主域名的記錄,則將內(nèi)核切換匹配庫中所有所述主域名的記錄以匹配方式為排序字段進行排序;
      [0196]比如對于baidu.com,圖3a中存在一系列記錄,那么首先按照其type值進行排列,排序后如圖3b不例。
      [0197]步驟C16,在排序后,根據(jù)所述待更新數(shù)據(jù)的匹配方式確定是否進行匹配子串的比較,如果需要,則根據(jù)比較結(jié)果判斷是否將待更新數(shù)據(jù)插入或者更新入所述內(nèi)核切換匹配庫,如果需要,則根據(jù)比較結(jié)果判斷是否將待更新數(shù)據(jù)插入或者更新入所述內(nèi)核切換匹配庫。
      [0198]然后根據(jù)匹配方式確定是否進行匹配子串比較,比如type=0,那么pattern為空,則可不比較,type>0,則存在相應(yīng)類型的匹配子串,需要進行比較,則根據(jù)比較結(jié)果判斷是否將待更新數(shù)據(jù)插入或者更新入所述內(nèi)核切換匹配庫。
      [0199]根據(jù)本發(fā)明的針對客戶端主動切換內(nèi)核的記錄,進行解析,然后進行歸并和篩選,根據(jù)篩選結(jié)果生對內(nèi)核切換匹配庫進行更新,可以解決現(xiàn)有技術(shù)中推出了一種可以切換內(nèi)核的瀏覽器,用戶可以在訪問網(wǎng)頁的過程中,瀏覽器根據(jù)匹配庫的設(shè)置首先選擇一個內(nèi)核打開網(wǎng)頁,但是該種預選的方式存在高概率的錯誤,用戶經(jīng)常需要手動切換。上述的匹配庫由于網(wǎng)頁與內(nèi)核的對應(yīng)關(guān)系是人為篩選,其錯誤率高、影響客戶端對網(wǎng)頁的展示,并且人工成本高昂的問題,可降低內(nèi)核匹配錯誤率、降低后臺人工分析成本。本發(fā)明實施例還可精簡內(nèi)核切換匹配庫,解決數(shù)據(jù)導入沖突問題。
      [0200]實施例四
      [0201]參照圖4,其示出了一種瀏覽器內(nèi)核切換匹配庫數(shù)據(jù)更新的方法的流程示意圖,具體可以包括:
      [0202]步驟402,獲取客戶端切換內(nèi)核后的切換記錄;
      [0203]步驟404,解析每條切換記錄,獲得一條待篩選數(shù)據(jù);所述待篩選數(shù)據(jù)包括各篩選參數(shù),所述篩選參數(shù)包括URL、切換后的內(nèi)核標識;
      [0204]步驟406,根據(jù)所述篩選參數(shù)對各待篩選數(shù)據(jù)歸并;
      [0205]步驟408,基于內(nèi)核切換匹配庫對歸并后的待篩選數(shù)據(jù)進行篩選,并基于篩選結(jié)果生成驗證表;
      [0206]步驟410,根據(jù)所述驗證表,確認最終待更新的URL記錄,并基于所述待更新的URL記錄,生成第一更新表;所述第一更新表的字段與所述內(nèi)核切換匹配庫的字段一致;所述字段包括:主域名、匹配子串、匹配方式、內(nèi)核標識;
      [0207]步驟412,針對第一更新表的具有相同主域名的待更新數(shù)據(jù),判斷所述內(nèi)核切換匹配庫中是否存在相同的主域名的記錄;
      [0208]步驟414,如果沒有`相同的主域名的記錄,則直接將所述待更新數(shù)據(jù)插入內(nèi)核切換匹配庫;
      [0209]步驟416,如果有相同的主域名的記錄,則將內(nèi)核切換匹配庫中所有所述主域名的記錄以匹配方式為排序字段進行排序;
      [0210]步驟418,將所述待更新數(shù)據(jù)的匹配方式與所述排序字段進行比較;當匹配方式不同時,直接跳過內(nèi)核切換匹配庫中的該條數(shù)據(jù);
      [0211]步驟420,當匹配方式相同時,則將所述待更新數(shù)據(jù)的匹配子串,與內(nèi)核切換匹配庫中的該條數(shù)據(jù)的匹配子串進行比較;
      [0212]步驟422,如果匹配子串相同,則判斷內(nèi)核標識是否相同;如果不同,則將內(nèi)核切換匹配庫中的更新為所述待更新數(shù)據(jù)的內(nèi)核標識;如果相同,則不做處理;
      [0213]步驟424,如果待更新數(shù)據(jù)的匹配子串包含內(nèi)核切換匹配庫中的該條數(shù)據(jù)的匹配子串,則刪除內(nèi)核切換匹配庫中的該條數(shù)據(jù),插入待更新數(shù)據(jù);
      [0214]步驟426,如果內(nèi)核切換匹配庫中的該條數(shù)據(jù)的匹配子串包含待更新數(shù)據(jù)的匹配子串,則判斷內(nèi)核標識是否相同,如果不同,則將內(nèi)核切換匹配庫中的更新為所述待更新數(shù)據(jù)的內(nèi)核標識;如果相同,則不做處理。
      [0215]下面舉例說明步驟412至426,本發(fā)明實施例的偽代碼如下
      [0216]
      for(new in待插入記錄集){ //循環(huán)I
      根據(jù)new key查找到庫存記錄集;
      [0217]
      【權(quán)利要求】
      1.一種瀏覽器內(nèi)核切換匹配庫數(shù)據(jù)更新的方法,包括: 獲取客戶端切換內(nèi)核后的切換記錄; 解析每條切換記錄,獲得一條待篩選數(shù)據(jù);所述待篩選數(shù)據(jù)包括各篩選參數(shù),所述篩選參數(shù)包括URL、切換后的內(nèi)核標識; 根據(jù)所述篩選參數(shù)對各待篩選數(shù)據(jù)歸并; 基于內(nèi)核切換匹配庫對歸并后的待篩選數(shù)據(jù)進行篩選,并基于篩選結(jié)果生成驗證表; 基于所述驗證表,更新所述內(nèi)核切換匹配庫。
      2.如權(quán)利要求1所述的方法,其特征在于,所述根據(jù)所述篩選參數(shù)對各待篩選數(shù)據(jù)歸并包括: 針對具有同一 URL的各待篩選數(shù)據(jù),以所述內(nèi)核標識為標準歸并為一條待篩選數(shù)據(jù),并在該條數(shù)據(jù)中記錄對應(yīng)內(nèi)核標識的切換次數(shù)。
      3.如權(quán)利要求2所述的方法,其特征在于,所述基于內(nèi)核切換匹配庫對歸并后的待篩選數(shù)據(jù)進行篩選,并基于篩選結(jié)果生成驗證表包括: 針對歸并后具有同一 URL的各條待篩選數(shù)據(jù),判斷內(nèi)核切換匹配庫中是否有對應(yīng)所述URL的記錄; 如果沒有對應(yīng)所述URL的記錄,則根據(jù)對應(yīng)所述URL的各條待篩選數(shù)據(jù)在驗證表中進行記錄; 如果有對應(yīng)所述URL的記錄,則確認已經(jīng)在內(nèi)核切換匹配庫記錄的內(nèi)核標識; 刪除對應(yīng)該被確認的內(nèi)核標識的數(shù)據(jù),并將除該被確認的內(nèi)核標識之外的、切換次數(shù)大于第一閾值的各條待篩選數(shù)據(jù)在驗證表中進行記錄。
      4.如權(quán)利要求3所述的方法,其特征在于,針對歸并后具有同一URL的各條待篩選數(shù)據(jù),判斷內(nèi)核切換匹配庫中是否有對應(yīng)所述URL的記錄包括: 解析所述URL,確定對應(yīng)所述URL的主域名,匹配方式及對應(yīng)的匹配方式的匹配子串; 根據(jù)對應(yīng)所述URL主域名,選擇內(nèi)核切換匹配庫中所有與所述主域名相同的所有記錄; 在與所述主域名相同的所有記錄中,在與對應(yīng)所述URL的匹配方式相同的記錄中,進行匹配子串的比較;如果匹配子串匹配上,判斷內(nèi)核切換匹配庫中有對應(yīng)所述URL的記錄。
      5.如權(quán)利要求4所述的方法,其特征在于,所述匹配方式包括: 主域名匹配方式、子網(wǎng)址匹配方式、字串匹配方式、正則表達式匹配方式其中的至少一個。
      6.如權(quán)利要求2所述的方法,其特征在于,所述針對具有同一URL的各待篩選數(shù)據(jù),以所述內(nèi)核標識為標準歸并為一條待篩選數(shù)據(jù),并在該條數(shù)據(jù)中記錄對應(yīng)內(nèi)核標識的切換次數(shù)之后,還包括: 去掉切換次數(shù)小于第二閾值的歸并后的待篩選數(shù)據(jù)。
      7.如權(quán)利要求1所述的方法,其特征在于,所述篩選參數(shù)還包括:用戶身份標識; 進一步的,所述根據(jù)所述篩選參數(shù)對各待篩選數(shù)據(jù)歸并時還包括: 將指定時間段內(nèi),同一用戶身份標識對同一 URL和同一內(nèi)核標識的切換記錄進行去重。
      8.如權(quán)利要求1所述的方法,其特征在于,還包括:所述客戶端在針對一 URL切換后,將URL、身份標識進行加密,與切換后內(nèi)核標識一起構(gòu)造切換記錄,并發(fā)送至服務(wù)器。
      9.如權(quán)利要求1所述的方法,其特征在于,基于所述驗證表,更新所述內(nèi)核切換匹配庫包括: 根據(jù)所述驗證表,確認最終待更新的URL記錄,并基于所述待更新的URL記錄,生成第一更新表;所述第一更新表的字段與所述內(nèi)核切換匹配庫的字段一致;所述字段包括:主域名、匹配子串、匹配方式、內(nèi)核標識; 將所述第一更新表的待更新數(shù)據(jù)插入或者更新入所述內(nèi)核切換匹配庫。
      10.一種瀏覽器內(nèi)核切換匹配庫數(shù)據(jù)更新的裝置,包括: 記錄獲取模塊,適于獲取客戶端切換內(nèi)核后的切換記錄; 記錄解析模塊,適于解析每條切換記錄,獲得一條待篩選數(shù)據(jù);所述待篩選數(shù)據(jù)包括各篩選參數(shù),所述篩選參數(shù)包括URL、切換后的內(nèi)核標識; 歸并模塊,適于根據(jù)所述篩選參數(shù)對各待篩選數(shù)據(jù)歸并; 篩選模塊,適于基于內(nèi)核切換匹配庫對歸并后的待篩選數(shù)據(jù)進行篩選,并基于篩選結(jié)果生成驗證表; 更新模塊,適于基于所述 更新表,更新所述內(nèi)核切換匹配庫。
      【文檔編號】G06F17/30GK103631955SQ201310684117
      【公開日】2014年3月12日 申請日期:2013年12月12日 優(yōu)先權(quán)日:2013年12月12日
      【發(fā)明者】唐永剛, 任寰 申請人:北京奇虎科技有限公司, 奇智軟件(北京)有限公司
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會獲得點贊!
      1