国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      數(shù)據(jù)更新方法及裝置的制造方法

      文檔序號(hào):10552931閱讀:376來源:國知局
      數(shù)據(jù)更新方法及裝置的制造方法
      【專利摘要】本發(fā)明公開一種數(shù)據(jù)更新方法及裝置,方法包括:根據(jù)特征庫中存儲(chǔ)的第一網(wǎng)站的搜索關(guān)鍵字特征,生成包括第一網(wǎng)站的搜索關(guān)鍵字特征的最小完整統(tǒng)一資源定位符URL;特征庫用于存儲(chǔ)多個(gè)網(wǎng)站的搜索關(guān)鍵字特征;基于最小完整URL向第一網(wǎng)站的服務(wù)器發(fā)送訪問請(qǐng)求;接收服務(wù)器發(fā)送的狀態(tài)碼;對(duì)狀態(tài)碼進(jìn)行分析,確認(rèn)第一網(wǎng)站的搜索關(guān)鍵字特征發(fā)生變化時(shí),對(duì)特征庫中存儲(chǔ)的第一網(wǎng)站的搜索關(guān)鍵字特征進(jìn)行更新。采用本發(fā)明,能夠提高檢測搜索關(guān)鍵字特征發(fā)生變化的實(shí)時(shí)性和效率,降低人力成本。
      【專利說明】
      數(shù)據(jù)更新方法及裝置
      技術(shù)領(lǐng)域
      [0001]本發(fā)明涉及通信技術(shù)領(lǐng)域的網(wǎng)絡(luò)管理技術(shù),尤其涉及一種數(shù)據(jù)更新方法及裝置。
      【背景技術(shù)】
      [0002]隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展,各種網(wǎng)絡(luò)應(yīng)用層出不窮,其中搜索功能是人們?nèi)粘9ぷ魃钪惺褂米顬槠毡楹椭匾膽?yīng)用之一,與搜索功能緊密關(guān)聯(lián)的是搜索關(guān)鍵字,搜索關(guān)鍵字是指用戶在網(wǎng)頁的搜索框中鍵入的關(guān)鍵字,參見圖1示出的用戶的部分搜索記錄,其中“pq = zhongguo,,、“q = zhongguo,,、“wd = zhongguo,,、“wq = zhongguo,,、“q = zhongguo,,京尤是搜索關(guān)鍵字,基于搜索關(guān)鍵字的應(yīng)用范圍很多,例如,網(wǎng)站或商家可能會(huì)通過用戶的搜索記錄了解用戶感興趣的需求,為用戶提供更多的相關(guān)推送,或者,基于對(duì)用戶的搜索記錄的分析獲得產(chǎn)品研發(fā)銷售的新機(jī)會(huì);基于用戶搜索記錄進(jìn)行網(wǎng)站搜索關(guān)鍵詞的優(yōu)化等,可見,獲取搜索關(guān)鍵字是實(shí)現(xiàn)基于搜索關(guān)鍵字的應(yīng)用所必不可少的,為了獲取搜索關(guān)鍵字,常用的方法通過比較特定的字符串或者正則表達(dá)式匹配來獲取數(shù)據(jù),這些特定的字符串和正則表達(dá)式就是搜索關(guān)鍵字特征。
      [0003]由于搜索網(wǎng)站技術(shù)和業(yè)務(wù)范圍的變化和擴(kuò)展,當(dāng)網(wǎng)站內(nèi)部架構(gòu)、業(yè)務(wù)應(yīng)用或?qū)τ脩粜袨榈姆治龅冗M(jìn)行調(diào)整后,網(wǎng)站的域名及一些搜索參數(shù)可能會(huì)發(fā)生變化,就會(huì)導(dǎo)致搜索關(guān)鍵字特征也在持續(xù)地變化,此時(shí),需要及時(shí)更新搜索關(guān)鍵字特征,要不然就無法有效獲得搜索關(guān)鍵字。目前常用的檢查搜索關(guān)鍵字特征是否發(fā)生變化的方法包括:(I)通過周期性的檢查,逐個(gè)分析各個(gè)搜索網(wǎng)站的搜索行為是否發(fā)生變化,這種方法需要花費(fèi)大量的人工成本,效率低;(2)接收到用戶反饋后,分析相應(yīng)的搜索網(wǎng)站的搜索行為是否發(fā)生變化,這種方法被動(dòng)滯后,所維護(hù)數(shù)據(jù)的實(shí)時(shí)性差。

      【發(fā)明內(nèi)容】

      [0004]有鑒于此,本發(fā)明實(shí)施例期望提供一種數(shù)據(jù)更新方法及裝置,能夠提高檢測搜索關(guān)鍵字特征發(fā)生變化的效率,保證特征庫中所存儲(chǔ)的多個(gè)網(wǎng)站的搜索關(guān)鍵字特征的實(shí)時(shí)性,降低維護(hù)特征庫中數(shù)據(jù)所需的人力成本。
      [0005]為達(dá)到上述目的,本發(fā)明的技術(shù)方案是這樣實(shí)現(xiàn)的:
      [0006]本發(fā)明實(shí)施例提供一種數(shù)據(jù)更新方法,所述方法包括:
      [0007]根據(jù)特征庫中存儲(chǔ)的第一網(wǎng)站的搜索關(guān)鍵字特征,生成包括所述第一網(wǎng)站的搜索關(guān)鍵字特征的最小完整統(tǒng)一資源定位符(URL,Uniform Resource Locator);所述特征庫用于存儲(chǔ)多個(gè)網(wǎng)站的搜索關(guān)鍵字特征;
      [0008]基于所述最小完整URL向所述第一網(wǎng)站的服務(wù)器發(fā)送訪問請(qǐng)求;
      [0009]接收所述服務(wù)器發(fā)送的狀態(tài)碼;
      [0010]對(duì)所述狀態(tài)碼進(jìn)行分析,確認(rèn)所述第一網(wǎng)站的搜索關(guān)鍵字特征發(fā)生變化時(shí),對(duì)所述特征庫中存儲(chǔ)的所述第一網(wǎng)站的搜索關(guān)鍵字特征進(jìn)行更新。
      [0011]可選的,所述根據(jù)特征庫中存儲(chǔ)的第一網(wǎng)站的搜索關(guān)鍵字特征,生成包括所述第一網(wǎng)站的搜索關(guān)鍵字特征的最小完整統(tǒng)一資源定位符URL,包括:
      [0012]根據(jù)特征庫中存儲(chǔ)的第一網(wǎng)站的域名、路徑及搜索關(guān)鍵字,生成包括所述第一網(wǎng)站的域名、路徑及搜索關(guān)鍵字的最小完整URL。
      [0013]可選的,所述對(duì)所述狀態(tài)碼進(jìn)行分析,確認(rèn)所述第一網(wǎng)站的搜索關(guān)鍵字特征發(fā)生變化時(shí),對(duì)所述特征庫中存儲(chǔ)的所述第一網(wǎng)站的搜索關(guān)鍵字特征進(jìn)行更新,包括:
      [0014]基于預(yù)設(shè)處理?xiàng)l件對(duì)所述狀態(tài)碼進(jìn)行分析,當(dāng)確定所述狀態(tài)碼不是符合所述預(yù)設(shè)處理?xiàng)l件的狀態(tài)碼時(shí),確認(rèn)所述第一網(wǎng)站的搜索關(guān)鍵字特征發(fā)生變化;
      [0015]對(duì)所述特征庫中存儲(chǔ)的所述第一網(wǎng)站的搜索關(guān)鍵字特征進(jìn)行更新。
      [0016]可選的,所述對(duì)所述狀態(tài)碼進(jìn)行分析,確認(rèn)所述第一網(wǎng)站的搜索關(guān)鍵字特征發(fā)生變化時(shí),對(duì)所述特征庫中存儲(chǔ)的所述第一網(wǎng)站的搜索關(guān)鍵字特征進(jìn)行更新,包括:
      [0017]基于預(yù)設(shè)處理?xiàng)l件對(duì)所述狀態(tài)碼進(jìn)行分析,當(dāng)確定所述狀態(tài)碼是符合所述預(yù)設(shè)處理?xiàng)l件的狀態(tài)碼時(shí),變更所述最小完整URL中的搜索關(guān)鍵字特征;
      [0018]基于變更的最小完整URL訪問所述第一網(wǎng)站,并接收所述第一網(wǎng)站的服務(wù)器發(fā)送的與所述變更的最小完整URL對(duì)應(yīng)的狀態(tài)碼;
      [0019]基于所述預(yù)設(shè)處理?xiàng)l件對(duì)所述與所述變更的最小完整URL對(duì)應(yīng)的狀態(tài)碼進(jìn)行分析;當(dāng)確定所述與所述變更的最小完整URL對(duì)應(yīng)的狀態(tài)碼不是符合所述預(yù)設(shè)處理?xiàng)l件的狀態(tài)碼時(shí),確認(rèn)所述第一網(wǎng)站的搜索關(guān)鍵字特征沒有發(fā)生變化。
      [0020]可選的,所述對(duì)所述狀態(tài)碼進(jìn)行分析,確認(rèn)所述第一網(wǎng)站的搜索關(guān)鍵字特征發(fā)生變化時(shí),對(duì)所述特征庫中存儲(chǔ)的所述第一網(wǎng)站的搜索關(guān)鍵字特征進(jìn)行更新,包括:
      [0021]對(duì)所述狀態(tài)碼進(jìn)行分析,確認(rèn)所述第一網(wǎng)站的搜索關(guān)鍵字特征發(fā)生變化時(shí),基于所述第一網(wǎng)站的域名訪問所述第一網(wǎng)站,通過在所述第一網(wǎng)站的網(wǎng)頁進(jìn)行搜索獲得搜索記錄;
      [0022]對(duì)所述搜索記錄進(jìn)行分析,從所述搜索記錄中提取與所述第一網(wǎng)站的更新的搜索關(guān)鍵字特征;
      [0023]基于所述第一網(wǎng)站的更新的搜索關(guān)鍵字特征,對(duì)所述特征庫中存儲(chǔ)的所述第一網(wǎng)站的搜索關(guān)鍵字特征進(jìn)行更新。
      [0024]本發(fā)明實(shí)施例還提供一種數(shù)據(jù)更新裝置,所述裝置包括:
      [0025]生成模塊,用于根據(jù)特征庫中存儲(chǔ)的第一網(wǎng)站的搜索關(guān)鍵字特征,生成包括所述第一網(wǎng)站的搜索關(guān)鍵字特征的最小完整URL;所述特征庫用于存儲(chǔ)多個(gè)網(wǎng)站的搜索關(guān)鍵字特征;
      [0026]發(fā)送模塊,用于基于所述最小完整URL向所述第一網(wǎng)站的服務(wù)器發(fā)送訪問請(qǐng)求;
      [0027]接收模塊,用于接收所述服務(wù)器發(fā)送的狀態(tài)碼;
      [0028]更新模塊,用于對(duì)所述狀態(tài)碼進(jìn)行分析,確認(rèn)所述第一網(wǎng)站的搜索關(guān)鍵字特征發(fā)生變化時(shí),對(duì)所述特征庫中存儲(chǔ)的所述第一網(wǎng)站的搜索關(guān)鍵字特征進(jìn)行更新。
      [0029]可選的,所述生成模塊,具體用于根據(jù)特征庫中存儲(chǔ)的第一網(wǎng)站的域名、路徑及搜索關(guān)鍵字,生成包括所述第一網(wǎng)站的域名、路徑及搜索關(guān)鍵字的最小完整URL。
      [0030]可選的,所述更新模塊,具體用于:
      [0031]基于預(yù)設(shè)處理?xiàng)l件對(duì)所述狀態(tài)碼進(jìn)行分析,當(dāng)確定所述狀態(tài)碼不是符合所述預(yù)設(shè)處理?xiàng)l件的狀態(tài)碼時(shí),確認(rèn)所述第一網(wǎng)站的搜索關(guān)鍵字特征發(fā)生變化;
      [0032]對(duì)所述特征庫中存儲(chǔ)的所述第一網(wǎng)站的搜索關(guān)鍵字特征進(jìn)行更新。
      [0033]可選的,所述更新模塊,具體用于:
      [0034]基于預(yù)設(shè)處理?xiàng)l件對(duì)所述狀態(tài)碼進(jìn)行分析,當(dāng)確定所述狀態(tài)碼是符合所述預(yù)設(shè)處理?xiàng)l件的狀態(tài)碼時(shí),變更所述最小完整URL中的搜索關(guān)鍵字特征;
      [0035]基于變更的最小完整URL訪問所述第一網(wǎng)站,并接收所述第一網(wǎng)站的服務(wù)器發(fā)送的與所述變更的最小完整URL對(duì)應(yīng)的狀態(tài)碼;
      [0036]基于所述預(yù)設(shè)處理?xiàng)l件對(duì)所述與所述變更的最小完整URL對(duì)應(yīng)的狀態(tài)碼進(jìn)行分析;當(dāng)確定所述與所述變更的最小完整URL對(duì)應(yīng)的狀態(tài)碼不是符合所述預(yù)設(shè)處理?xiàng)l件的狀態(tài)碼時(shí),確認(rèn)所述第一網(wǎng)站的搜索關(guān)鍵字特征沒有發(fā)生變化。
      [0037]可選的,所述更新模塊,具體用于:
      [0038]對(duì)所述狀態(tài)碼進(jìn)行分析,確認(rèn)所述第一網(wǎng)站的搜索關(guān)鍵字特征發(fā)生變化時(shí),基于所述第一網(wǎng)站的域名訪問所述第一網(wǎng)站,通過在所述第一網(wǎng)站的網(wǎng)頁進(jìn)行搜索獲得搜索記錄;
      [0039]對(duì)所述搜索記錄進(jìn)行分析,從所述搜索記錄中提取與所述第一網(wǎng)站的更新的搜索關(guān)鍵字特征;
      [0040]基于所述第一網(wǎng)站的更新的搜索關(guān)鍵字特征,對(duì)所述特征庫中存儲(chǔ)的所述第一網(wǎng)站的搜索關(guān)鍵字特征進(jìn)行更新。
      [0041]本發(fā)明實(shí)施例中,針對(duì)特征庫中存儲(chǔ)的任意一個(gè)網(wǎng)站的搜索關(guān)鍵字特征(以第一網(wǎng)站為例),基于第一網(wǎng)站的搜索關(guān)鍵字特征生成包括第一網(wǎng)站的搜索關(guān)鍵字特征的最小完整URL,該最小完整URL避免了搜索記錄中復(fù)雜網(wǎng)址形式和冗余信息,簡單直觀且易于維護(hù),通過訪問該最小完整URL得到第一網(wǎng)站的服務(wù)器發(fā)送的狀態(tài)碼,只需要分析狀態(tài)碼就能夠確認(rèn)第一網(wǎng)站的搜索關(guān)鍵字特征是否發(fā)生變化,提高了檢測搜索關(guān)鍵字特征是否發(fā)生變化的效率,降低了維護(hù)特征庫中數(shù)據(jù)所需的人力成本;本實(shí)施例可以通過自動(dòng)化工具(例如腳本)實(shí)現(xiàn),能夠及時(shí)檢測到所關(guān)注的各個(gè)網(wǎng)站的搜索關(guān)鍵字特征的變化并進(jìn)行更新,保證了特征庫中所存儲(chǔ)的多個(gè)網(wǎng)站的搜索關(guān)鍵字特征的實(shí)時(shí)性。
      【附圖說明】
      [0042]圖1為用戶的部分搜索記錄的舉例示意圖;
      [0043]圖2為本發(fā)明實(shí)施例中數(shù)據(jù)更新方法的流程示意圖一;
      [0044]圖3為狀態(tài)碼的應(yīng)用舉例示意圖;
      [0045]圖4為本發(fā)明實(shí)施例中數(shù)據(jù)更新方法的流程示意圖二;
      [0046]圖5為本發(fā)明實(shí)施例中URL的舉例示意圖一;
      [0047]圖6為本發(fā)明實(shí)施例中檢查最小完整URL的舉例示意圖一;
      [0048]圖7為本發(fā)明實(shí)施例中檢查查詢?cè)~變更的最小完整URL的舉例示意圖;
      [0049]圖8為本發(fā)明實(shí)施例中網(wǎng)頁搜索結(jié)果的舉例示意圖一;
      [0050]圖9為本發(fā)明實(shí)施例中URL的舉例示意圖二;
      [0051 ]圖10為本發(fā)明實(shí)施例中檢查最小完整URL的舉例示意圖二;
      [0052]圖11為本發(fā)明實(shí)施例中網(wǎng)頁搜索結(jié)果的舉例示意圖二;
      [0053]圖12為本發(fā)明實(shí)施例中URL的舉例示意圖三;
      [0054]圖13為本發(fā)明實(shí)施例中檢查最小完整URL的舉例示意圖三;
      [0055]圖14為本發(fā)明實(shí)施例中檢查搜索關(guān)鍵字特征變化后的最小完整URL的舉例示意圖—*.---,
      [0056]圖15為本發(fā)明實(shí)施例中檢查查詢?cè)~變更后的最小完整URL對(duì)應(yīng)的響應(yīng)標(biāo)題的舉例示意圖;
      [0057]圖16為本發(fā)明實(shí)施例中網(wǎng)頁搜索結(jié)果的舉例示意圖三;
      [0058]圖17為本發(fā)明實(shí)施例中檢查搜索關(guān)鍵字特征更新后的最小完整URL的舉例示意圖—*.---,
      [0059]圖18為本發(fā)明實(shí)施例中檢查搜索關(guān)鍵字特征更新后的最小完整URL對(duì)應(yīng)的響應(yīng)標(biāo)題的舉例示意圖;
      [0060]圖19為本發(fā)明實(shí)施例中數(shù)據(jù)更新裝置的結(jié)構(gòu)示意圖。
      【具體實(shí)施方式】
      [0061]下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述。
      [0062]首先對(duì)實(shí)施本發(fā)明實(shí)施例的裝置(在以下各具體實(shí)施例中即為數(shù)據(jù)更新裝置)進(jìn)行說明,數(shù)據(jù)更新裝置可以采用各種方式來實(shí)施,例如在網(wǎng)關(guān)、路由器、交換機(jī)等網(wǎng)絡(luò)設(shè)備中實(shí)施數(shù)據(jù)更新裝置的全部組件(比如,數(shù)據(jù)更新裝置可以集成于上述的網(wǎng)絡(luò)設(shè)備中),或者,在上述的網(wǎng)絡(luò)設(shè)備側(cè)以耦合的方式實(shí)施數(shù)據(jù)更新裝置中的組件。
      [0063]基于上述記載的數(shù)據(jù)更新裝置,提出以下各具體實(shí)施例。
      [0064]實(shí)施例一
      [0065]本實(shí)施例記載一種數(shù)據(jù)更新方法,可以應(yīng)用于如下場景中:希望能夠及時(shí)檢測到所關(guān)注的各個(gè)網(wǎng)站的搜索關(guān)鍵字特征的變化并進(jìn)行更新,提高檢測搜索關(guān)鍵字特征發(fā)生變化的效率,保證特征庫中所存儲(chǔ)的多個(gè)網(wǎng)站的搜索關(guān)鍵字特征的實(shí)時(shí)性,降低維護(hù)特征庫中數(shù)據(jù)所需的人力成本。
      [0066]參見圖2,本實(shí)施例記載的數(shù)據(jù)更新方法包括以下步驟:
      [0067]步驟201、根據(jù)特征庫中存儲(chǔ)的第一網(wǎng)站的搜索關(guān)鍵字特征,生成包括第一網(wǎng)站的搜索關(guān)鍵字特征的最小完整URL;特征庫用于存儲(chǔ)多個(gè)網(wǎng)站的搜索關(guān)鍵字特征。
      [0068]第一網(wǎng)站為多個(gè)網(wǎng)站中的任意一個(gè)網(wǎng)站;可選的,搜索關(guān)鍵字特征可以包括:域名、路徑及搜索關(guān)鍵字;相應(yīng)地,第一網(wǎng)站的搜索關(guān)鍵字特征可以包括:第一網(wǎng)站的域名、路徑及搜索關(guān)鍵字;具體地,數(shù)據(jù)更新裝置根據(jù)特征庫中存儲(chǔ)的第一網(wǎng)站的域名、路徑及搜索關(guān)鍵字,通過抽象分析,總結(jié)并生成包括第一網(wǎng)站的域名、路徑及搜索關(guān)鍵字的最小完整URL0
      [0069]最小完整URL的一般格式為(其中方括號(hào)[]內(nèi)為可選項(xiàng)):
      [0070]協(xié)議://域名[:端口]/路徑/[;參數(shù)][?查詢?cè)~]。
      [0071]—個(gè)包含搜索關(guān)鍵字的最小完整URL可以包括搜索網(wǎng)站的域名(例如,aaa.bbb.ccc)、搜索網(wǎng)站的路徑(例如,ddd)和搜索關(guān)鍵字(例如,keyword),包括搜索關(guān)鍵字的最小完整URL的格式舉例如下:
      [0072]http (s)://aaa.bbb.ccc/ddd? keyword;或者,http (s)://aaa.bbb.ccc/ddd/keyword;其中,搜索網(wǎng)站的域名用于區(qū)分不同網(wǎng)站,搜索網(wǎng)站的路徑一般用于區(qū)分不同應(yīng)用,搜索關(guān)鍵字一般出現(xiàn)在查詢?cè)~中,搜索記錄中的其他數(shù)據(jù)一般不會(huì)影響對(duì)URL進(jìn)行訪問的連通性。
      [0073]基于上述的最小完整URL基本結(jié)構(gòu),就可以避免構(gòu)造出形式復(fù)雜的網(wǎng)址類型,大大降低了檢測搜索特征是否變化的操作復(fù)雜性。
      [0074]步驟202、基于最小完整URL向第一網(wǎng)站的服務(wù)器發(fā)送訪問請(qǐng)求。
      [0075]對(duì)包括第一網(wǎng)站的搜索關(guān)鍵字特征的最小完整URL進(jìn)行訪問。
      [0076]步驟203、接收服務(wù)器發(fā)送的狀態(tài)碼(Status Code)。
      [0077]狀態(tài)碼可以為超文本傳輸協(xié)議(HTTP,HyperText Transfer Protocol)狀態(tài)碼,HTTP狀態(tài)碼是用以表示網(wǎng)站的網(wǎng)頁服務(wù)器的HTTP響應(yīng)狀態(tài)的3位數(shù)字代碼;參見圖3,狀態(tài)碼為2xx表示請(qǐng)求成功,可認(rèn)為原始特征沒有變更;而其它狀態(tài)碼如3xx,4xx,5xx,重定向、無法訪問、服務(wù)器出錯(cuò)等則表示訪問的URL可能存在問題,可能是業(yè)務(wù)調(diào)整或服務(wù)關(guān)閉等原因,從而確認(rèn)搜索關(guān)鍵字特征發(fā)生變化。
      [0078]步驟204、對(duì)狀態(tài)碼進(jìn)行分析,確認(rèn)第一網(wǎng)站的搜索關(guān)鍵字特征發(fā)生變化時(shí),對(duì)特征庫中存儲(chǔ)的第一網(wǎng)站的搜索關(guān)鍵字特征進(jìn)行更新。
      [0079]對(duì)包括第一網(wǎng)站的搜索關(guān)鍵字特征的最小完整URL進(jìn)行訪問,分析第一網(wǎng)站的服務(wù)器返回的HTTP狀態(tài)碼,確認(rèn)第一網(wǎng)站的搜索關(guān)鍵字特征是否發(fā)送變化。
      [0080]本實(shí)施例中,針對(duì)特征庫中存儲(chǔ)的任意一個(gè)網(wǎng)站的搜索關(guān)鍵字特征(以第一網(wǎng)站為例),基于第一網(wǎng)站的搜索關(guān)鍵字特征生成包括第一網(wǎng)站的搜索關(guān)鍵字特征的最小完整URL,該最小完整URL避免了搜索記錄中復(fù)雜網(wǎng)址形式和冗余信息,簡單直觀且易于維護(hù),通過訪問該最小完整URL得到第一網(wǎng)站的服務(wù)器發(fā)送的狀態(tài)碼,只需要分析狀態(tài)碼就能夠確認(rèn)第一網(wǎng)站的搜索關(guān)鍵字特征是否發(fā)生變化,提高了檢測搜索關(guān)鍵字特征是否發(fā)生變化的效率,降低了維護(hù)特征庫中數(shù)據(jù)所需的人力成本;本實(shí)施例可以通過自動(dòng)化工具(例如腳本)實(shí)現(xiàn),能夠及時(shí)檢測到所關(guān)注的各個(gè)網(wǎng)站的搜索關(guān)鍵字特征的變化并進(jìn)行更新,保證了特征庫中所存儲(chǔ)的多個(gè)網(wǎng)站的搜索關(guān)鍵字特征的實(shí)時(shí)性。
      [0081 ] 實(shí)施例二
      [0082]本實(shí)施例基于實(shí)施例一,本實(shí)施例記載的數(shù)據(jù)更新方法可以應(yīng)用于如下場景中:希望能夠及時(shí)檢測到所關(guān)注的各個(gè)網(wǎng)站的搜索關(guān)鍵字特征的變化并進(jìn)行更新,提高檢測搜索關(guān)鍵字特征發(fā)生變化的效率,保證特征庫中所存儲(chǔ)的多個(gè)網(wǎng)站的搜索關(guān)鍵字特征的實(shí)時(shí)性,降低維護(hù)特征庫中數(shù)據(jù)所需的人力成本;本實(shí)施例針對(duì)此情況的處理進(jìn)行說明。
      [0083]參見圖4,本實(shí)施例記載的數(shù)據(jù)更新方法包括以下步驟:
      [0084]步驟401、根據(jù)特征庫中存儲(chǔ)的第一網(wǎng)站的搜索關(guān)鍵字特征,生成包括第一網(wǎng)站的搜索關(guān)鍵字特征的最小完整統(tǒng)一資源定位符URL。
      [0085]特征庫用于存儲(chǔ)多個(gè)網(wǎng)站的搜索關(guān)鍵字特征。
      [0086]步驟402、基于最小完整URL向第一網(wǎng)站的服務(wù)器發(fā)送訪問請(qǐng)求。
      [0087]步驟403、接收服務(wù)器發(fā)送的狀態(tài)碼。
      [0088]步驟404、基于預(yù)設(shè)處理?xiàng)l件對(duì)狀態(tài)碼進(jìn)行分析。
      [0089]預(yù)設(shè)處理?xiàng)l件是指針對(duì)網(wǎng)站服務(wù)器返回的不同狀態(tài)碼,預(yù)先設(shè)定的數(shù)據(jù)更新裝置的不同的操作步驟。
      [0090]步驟405、確定狀態(tài)碼是否是符合預(yù)設(shè)處理?xiàng)l件的狀態(tài)碼;當(dāng)確定狀態(tài)碼是符合預(yù)設(shè)處理?xiàng)l件的狀態(tài)碼時(shí),執(zhí)行步驟406;當(dāng)確定狀態(tài)碼不是符合預(yù)設(shè)處理?xiàng)l件的狀態(tài)碼時(shí),執(zhí)行步驟411。
      [0091]這里,可選的,符合預(yù)設(shè)處理?xiàng)l件的狀態(tài)碼2xx,表示訪問請(qǐng)求成功。
      [0092]步驟406、變更最小完整URL中的搜索關(guān)鍵字特征。
      [0093]步驟407、基于變更的最小完整URL訪問第一網(wǎng)站,并接收第一網(wǎng)站的服務(wù)器發(fā)送的與變更的最小完整URL對(duì)應(yīng)的狀態(tài)碼。
      [0094]步驟408、基于預(yù)設(shè)處理?xiàng)l件對(duì)與變更的最小完整URL對(duì)應(yīng)的狀態(tài)碼進(jìn)行分析。
      [0095]步驟409、確定與變更的最小完整URL對(duì)應(yīng)的狀態(tài)碼是否是符合預(yù)設(shè)處理?xiàng)l件的狀態(tài)碼,若是,則執(zhí)行步驟411;否則,執(zhí)行步驟410。
      [0096]可選的,數(shù)據(jù)更新裝置當(dāng)確定與變更的最小完整URL對(duì)應(yīng)的狀態(tài)碼是否是符合預(yù)設(shè)處理?xiàng)l件的狀態(tài)碼;若是,則執(zhí)行步驟411;否則,獲取與變更的最小完整URL對(duì)應(yīng)的響應(yīng)標(biāo)題;確定響應(yīng)標(biāo)題中不包括變更的最小完整URL的搜索詞時(shí),執(zhí)行步驟410。
      [0097]步驟410、確認(rèn)第一網(wǎng)站的搜索關(guān)鍵字特征沒有發(fā)生變化;流程結(jié)束。
      [0098]步驟411、確認(rèn)第一網(wǎng)站的搜索關(guān)鍵字特征發(fā)生變化;對(duì)特征庫中存儲(chǔ)的第一網(wǎng)站的搜索關(guān)鍵字特征進(jìn)行更新。
      [0099]可選的,對(duì)特征庫中存儲(chǔ)的第一網(wǎng)站的搜索關(guān)鍵字特征進(jìn)行更新的實(shí)現(xiàn)方式可以包括:
      [0100]確認(rèn)第一網(wǎng)站的搜索關(guān)鍵字特征發(fā)生變化時(shí),基于第一網(wǎng)站的域名訪問第一網(wǎng)站,通過在第一網(wǎng)站的網(wǎng)頁進(jìn)行搜索獲得搜索記錄;
      [0101]對(duì)搜索記錄進(jìn)行分析,從搜索記錄中提取與第一網(wǎng)站的更新的搜索關(guān)鍵字特征;
      [0102]基于第一網(wǎng)站的更新的搜索關(guān)鍵字特征,對(duì)特征庫中存儲(chǔ)的第一網(wǎng)站的搜索關(guān)鍵字特征進(jìn)行更新。
      [0103]本實(shí)施例中,針對(duì)特征庫中存儲(chǔ)的任意一個(gè)網(wǎng)站的搜索關(guān)鍵字特征(以第一網(wǎng)站為例),基于第一網(wǎng)站的搜索關(guān)鍵字特征生成包括第一網(wǎng)站的搜索關(guān)鍵字特征的最小完整URL,該最小完整URL避免了搜索記錄中復(fù)雜網(wǎng)址形式和冗余信息,簡單直觀且易于維護(hù),通過訪問該最小完整URL得到第一網(wǎng)站的服務(wù)器返回的狀態(tài)碼,只需要分析狀態(tài)碼就能夠確認(rèn)第一網(wǎng)站的搜索關(guān)鍵字特征是否發(fā)生變化,提高了檢測搜索關(guān)鍵字特征是否發(fā)生變化的效率,降低了維護(hù)特征庫中數(shù)據(jù)所需的人力成本;考慮到實(shí)際中特征庫中存儲(chǔ)的海量的搜索關(guān)鍵字特征,本實(shí)施例還可以通過自動(dòng)化工具(例如腳本)實(shí)現(xiàn),能夠及時(shí)檢測到所關(guān)注的各個(gè)網(wǎng)站的搜索關(guān)鍵字特征的變化并進(jìn)行更新,保證了特征庫中所存儲(chǔ)的多個(gè)網(wǎng)站的搜索關(guān)鍵字特征的準(zhǔn)確性及實(shí)時(shí)性。
      [0104]實(shí)施例三
      [0105]本實(shí)施例基于實(shí)施例一、二,本實(shí)施例以實(shí)際中的一個(gè)搜索記錄為例對(duì)本發(fā)明實(shí)施例的數(shù)據(jù)更新方法的實(shí)現(xiàn)過程進(jìn)行說明;參見圖5至圖8,本實(shí)施例記載的數(shù)據(jù)更新方法,以訪問百度搜索引擎為例,在搜索框輸入某個(gè)關(guān)鍵字(11111111111111)并指示搜索,瀏覽器中顯示的URL如圖5所示,此URL的搜索關(guān)鍵字特征包括搜索關(guān)鍵字域名等信息,其他數(shù)據(jù)主要是用戶操作的一些上下文信息,能夠更精確分析用戶行為,但這些不是必須的,比如:
      [0106]Ie:搜索關(guān)鍵字的編碼格式;
      [0107]F:搜索判斷,f = 8用戶自主搜索,f = 3下拉框推薦,f = I相關(guān)搜索;
      [0108]rsv_bp:判斷是第幾次搜索,O為第一次搜索,I為第二次或者多次搜索;
      [0109]rsv_sug3:鍵盤重復(fù)速度;
      [0110]tn:搜索框所屬網(wǎng)站。
      [0111]URL中的路徑表示域名的具體業(yè)務(wù)內(nèi)容,多數(shù)情況下都是必須的,如果缺少會(huì)影響到相關(guān)業(yè)務(wù)訪問的連通性。
      [0112]根據(jù)上述邏輯,從圖5所示的URL中提取以下部分?jǐn)?shù)據(jù):
      [0113]域名:www.baidu.com;
      [0114]路徑:s;
      [0115]搜索關(guān)鍵字:Wd= Illlllllllllll;
      [0116]相應(yīng)的最小完整URL 為:www.baidu.com/s?wd = 11111111111111。
      [0117]然后,使用工具(例如腳本)來檢查包含搜索關(guān)鍵字特征的最小完整URL,參見圖6,HTTP狀態(tài)碼返回200;再將最小完整URL中的查詢?cè)~變化后進(jìn)行檢驗(yàn),參見圖7所示將wd變?yōu)閤y,返回狀態(tài)碼302,因此,判斷結(jié)果為:搜索關(guān)鍵字特征未發(fā)生變化;進(jìn)一步,參見圖8,網(wǎng)頁實(shí)際搜索的結(jié)果也對(duì)該判斷結(jié)果進(jìn)行了支撐。這里,關(guān)于工具的選擇,可以采用一些簡單明了的工具,比如Linux下的curl等,通過使用工具可以快速得到反饋結(jié)果,由于只需要判斷HTTP狀態(tài)碼,所以只獲取HTTP響應(yīng)頭,通過執(zhí)行命令“curl -1 aaa.bbb.ccc/ddd?keyword”即可,能夠提高檢測搜索關(guān)鍵字特征是否發(fā)生變化的效率,也便于轉(zhuǎn)化為自動(dòng)化方式檢查。
      [0118]實(shí)施例四
      [0119]本實(shí)施例基于實(shí)施例一、二,本實(shí)施例以實(shí)際中的一個(gè)搜索記錄為例對(duì)本發(fā)明實(shí)施例的數(shù)據(jù)更新方法的實(shí)現(xiàn)過程進(jìn)行說明;參見圖9至圖11,本實(shí)施例記載的數(shù)據(jù)更新方法,以圖9所示的URL(搜索記錄)為例,通過分析圖9的URL和相關(guān)搜索關(guān)鍵字特征獲得如下數(shù)據(jù):
      [0120]域名:www.s0.com;
      [0121]路徑:s;
      [0122]搜索關(guān)鍵字:q=
      [0123]其最小完整URL 為:www.s0.com/s ?q = 11111111111111。
      [0124]參見圖10所示的工具處理截圖,HTTP狀態(tài)碼返回302重定向,表示搜索關(guān)鍵字特征可能已經(jīng)發(fā)生變化;進(jìn)一步,參見圖11,網(wǎng)頁實(shí)際搜索的結(jié)果也對(duì)該判斷結(jié)果進(jìn)行了支撐,原搜索WWW.s0.com輸入后已跳轉(zhuǎn)變更為新鏈接,即搜索關(guān)鍵字特征已出現(xiàn)變化,需要進(jìn)行搜索關(guān)鍵字特征的更新。
      [0125]實(shí)施例五
      [0126]本實(shí)施例基于實(shí)施例一、二,本實(shí)施例以實(shí)際中的一個(gè)搜索記錄為例對(duì)本發(fā)明實(shí)施例的數(shù)據(jù)更新方法的實(shí)現(xiàn)過程進(jìn)行說明;參見圖12至圖18,本實(shí)施例記載的數(shù)據(jù)更新方法,以圖12所示的URL(搜索記錄)為例,
      [0127]通過分析原始URL和相關(guān)搜索關(guān)鍵字特征獲得如下數(shù)據(jù):
      [0128]域名:www.zhongsou.com;
      [0129]路徑:third,cgi ;
      [0130]搜索關(guān)鍵字:Wd= Illlllllllllll;[0131 ]其最小完整 URL 為:www.zhongsou.com/third.cgi?wd = 11111111111111 ο
      [0132]參見圖13所示的工具處理截圖,HTTP狀態(tài)碼返回200;再將最小完整URL中的查詢?cè)~變化后進(jìn)行檢驗(yàn),比如將wd變成aa,返回狀態(tài)碼仍然為200,參見圖14,說明搜索關(guān)鍵字特征發(fā)生變化。
      [0133]然后獲取查詢?cè)~變更后的最小完整URL對(duì)應(yīng)的響應(yīng)標(biāo)題,檢測響應(yīng)標(biāo)題當(dāng)中是否包括變更后的最小完整URL的關(guān)鍵字,如不包括,說明搜索關(guān)鍵字特征已發(fā)生變化,參見圖15,未查到關(guān)鍵字11111111111111,說明搜索關(guān)鍵字特征已發(fā)生變化;進(jìn)一步,參見圖16,網(wǎng)頁實(shí)際搜索的結(jié)果也對(duì)該判斷結(jié)果進(jìn)行了支撐,查詢?cè)~已變更為w;基于查詢?cè)~《,對(duì)特征庫中存儲(chǔ)的第一網(wǎng)站的搜索關(guān)鍵字特征進(jìn)行更新;生成搜索關(guān)鍵字特征更新后的最小完整URL,并通過工具檢驗(yàn)搜索關(guān)鍵字更新后的最小完整URL,參見圖17,返回狀態(tài)碼200;參見圖18,所示請(qǐng)求頁面返回的響應(yīng)標(biāo)題中包含搜索的關(guān)鍵字11111111111111,說明當(dāng)前的搜索關(guān)鍵字特征是正確的。
      [0134]實(shí)施例六
      [0135]與前述實(shí)施例的記載相對(duì)應(yīng),本實(shí)施例還記載一種數(shù)據(jù)更新裝置,數(shù)據(jù)更新裝置可以用于執(zhí)行本發(fā)明實(shí)施例的數(shù)據(jù)更新方法,數(shù)據(jù)更新裝置可以采用各種方式來實(shí)施,例如在網(wǎng)關(guān)、路由器、交換機(jī)等網(wǎng)絡(luò)設(shè)備中實(shí)施數(shù)據(jù)更新裝置的全部組件(比如,數(shù)據(jù)更新裝置可以集成于上述的網(wǎng)絡(luò)設(shè)備中),或者,在上述的網(wǎng)絡(luò)設(shè)備側(cè)以耦合的方式實(shí)施數(shù)據(jù)更新裝置中的組件;參見圖19,數(shù)據(jù)更新裝置包括:
      [0136]生成模塊1901,用于根據(jù)特征庫中存儲(chǔ)的第一網(wǎng)站的搜索關(guān)鍵字特征,生成包括第一網(wǎng)站的搜索關(guān)鍵字特征的最小完整統(tǒng)一資源定位符URL;特征庫用于存儲(chǔ)多個(gè)網(wǎng)站的搜索關(guān)鍵字特征;
      [0137]發(fā)送模塊1902,用于基于最小完整URL向第一網(wǎng)站的服務(wù)器發(fā)送訪問請(qǐng)求;
      [0138]接收模塊1903,用于接收服務(wù)器發(fā)送的狀態(tài)碼;
      [0139]更新模塊1904,用于對(duì)狀態(tài)碼進(jìn)行分析,確認(rèn)第一網(wǎng)站的搜索關(guān)鍵字特征發(fā)生變化時(shí),對(duì)特征庫中存儲(chǔ)的第一網(wǎng)站的搜索關(guān)鍵字特征進(jìn)行更新。
      [0140]上述方案中,數(shù)據(jù)更新裝置針對(duì)特征庫中存儲(chǔ)的任意一個(gè)網(wǎng)站的搜索關(guān)鍵字特征(以第一網(wǎng)站為例),基于第一網(wǎng)站的搜索關(guān)鍵字特征生成包括第一網(wǎng)站的搜索關(guān)鍵字特征的最小完整URL,該最小完整URL避免了搜索記錄中復(fù)雜網(wǎng)址形式和冗余信息,簡單直觀且易于維護(hù),通過訪問該最小完整URL得到第一網(wǎng)站的服務(wù)器發(fā)送的狀態(tài)碼,只需要分析狀態(tài)碼就能夠確認(rèn)第一網(wǎng)站的搜索關(guān)鍵字特征是否發(fā)生變化,提高了檢測搜索關(guān)鍵字特征是否發(fā)生變化的效率,降低了維護(hù)特征庫中數(shù)據(jù)所需的人力成本;本實(shí)施例可以通過自動(dòng)化工具(例如腳本)實(shí)現(xiàn),能夠及時(shí)檢測到所關(guān)注的各個(gè)網(wǎng)站的搜索關(guān)鍵字特征的變化并進(jìn)行更新,保證了特征庫中所存儲(chǔ)的多個(gè)網(wǎng)站的搜索關(guān)鍵字特征的實(shí)時(shí)性。
      [0141]在上述實(shí)施例的基礎(chǔ)上,生成模塊1901,具體用于根據(jù)特征庫中存儲(chǔ)的第一網(wǎng)站的域名、路徑及搜索關(guān)鍵字,生成包括第一網(wǎng)站的域名、路徑及搜索關(guān)鍵字的最小完整URL。
      [0142]在上述實(shí)施例的基礎(chǔ)上,更新模塊1904,具體用于:基于預(yù)設(shè)處理?xiàng)l件對(duì)狀態(tài)碼進(jìn)行分析,當(dāng)確定狀態(tài)碼不是符合預(yù)設(shè)處理?xiàng)l件的狀態(tài)碼時(shí),確認(rèn)第一網(wǎng)站的搜索關(guān)鍵字特征發(fā)生變化;對(duì)特征庫中存儲(chǔ)的第一網(wǎng)站的搜索關(guān)鍵字特征進(jìn)行更新。
      [0143]在上述實(shí)施例的基礎(chǔ)上,更新模塊1904,具體用于:基于預(yù)設(shè)處理?xiàng)l件對(duì)狀態(tài)碼進(jìn)行分析,當(dāng)確定狀態(tài)碼是符合預(yù)設(shè)處理?xiàng)l件的狀態(tài)碼時(shí),變更最小完整URL中的搜索關(guān)鍵字特征;基于變更的最小完整URL訪問第一網(wǎng)站,并接收第一網(wǎng)站的服務(wù)器發(fā)送的與變更的最小完整URL對(duì)應(yīng)的狀態(tài)碼;基于預(yù)設(shè)處理?xiàng)l件對(duì)與變更的最小完整URL對(duì)應(yīng)的狀態(tài)碼進(jìn)行分析;當(dāng)確定與變更的最小完整URL對(duì)應(yīng)的狀態(tài)碼不是符合預(yù)設(shè)處理?xiàng)l件的狀態(tài)碼時(shí),確認(rèn)第一網(wǎng)站的搜索關(guān)鍵字特征沒有發(fā)生變化。
      [0144]在上述實(shí)施例的基礎(chǔ)上,更新模塊1904,具體用于:對(duì)狀態(tài)碼進(jìn)行分析,確認(rèn)第一網(wǎng)站的搜索關(guān)鍵字特征發(fā)生變化時(shí),基于第一網(wǎng)站的域名訪問第一網(wǎng)站,通過在第一網(wǎng)站的網(wǎng)頁進(jìn)行搜索獲得搜索記錄;對(duì)搜索記錄進(jìn)行分析,從搜索記錄中提取與第一網(wǎng)站的更新的搜索關(guān)鍵字特征;基于第一網(wǎng)站的更新的搜索關(guān)鍵字特征,對(duì)特征庫中存儲(chǔ)的第一網(wǎng)站的搜索關(guān)鍵字特征進(jìn)行更新。
      [0145]實(shí)施例七
      [0146]本實(shí)施例記載一種計(jì)算機(jī)可讀介質(zhì),可以為ROM(例如,只讀存儲(chǔ)器、FLASH存儲(chǔ)器、轉(zhuǎn)移裝置等)、磁存儲(chǔ)介質(zhì)(例如,磁帶、磁盤驅(qū)動(dòng)器等)、光學(xué)存儲(chǔ)介質(zhì)(例如,CD-R0M、DVD-R0M、紙卡、紙帶等)以及其他熟知類型的程序存儲(chǔ)器;計(jì)算機(jī)可讀介質(zhì)中存儲(chǔ)有計(jì)算機(jī)可執(zhí)行指令(例如騰訊視頻等投射應(yīng)用的二進(jìn)制可執(zhí)行指令),當(dāng)執(zhí)行指令時(shí),引起至少一個(gè)處理器執(zhí)行包括以下的操作:
      [0147]根據(jù)特征庫中存儲(chǔ)的第一網(wǎng)站的搜索關(guān)鍵字特征,生成包括第一網(wǎng)站的搜索關(guān)鍵字特征的最小完整統(tǒng)一資源定位符URL;特征庫用于存儲(chǔ)多個(gè)網(wǎng)站的搜索關(guān)鍵字特征;
      [0148]基于最小完整URL向第一網(wǎng)站的服務(wù)器發(fā)送訪問請(qǐng)求;
      [0149]接收服務(wù)器發(fā)送的狀態(tài)碼;
      [0150]對(duì)狀態(tài)碼進(jìn)行分析,確認(rèn)第一網(wǎng)站的搜索關(guān)鍵字特征發(fā)生變化時(shí),對(duì)特征庫中存儲(chǔ)的第一網(wǎng)站的搜索關(guān)鍵字特征進(jìn)行更新。
      [0151]綜上,數(shù)據(jù)更新裝置針對(duì)特征庫中存儲(chǔ)的任意一個(gè)網(wǎng)站的搜索關(guān)鍵字特征(以第一網(wǎng)站為例),基于第一網(wǎng)站的搜索關(guān)鍵字特征生成包括第一網(wǎng)站的搜索關(guān)鍵字特征的最小完整URL,該最小完整URL避免了搜索記錄中復(fù)雜網(wǎng)址形式和冗余信息,簡單直觀且易于維護(hù),通過訪問該最小完整URL得到第一網(wǎng)站的服務(wù)器發(fā)送的狀態(tài)碼,只需要分析狀態(tài)碼就能夠確認(rèn)第一網(wǎng)站的搜索關(guān)鍵字特征是否發(fā)生變化,提高了檢測搜索關(guān)鍵字特征是否發(fā)生變化的效率,降低了維護(hù)特征庫中數(shù)據(jù)所需的人力成本;本實(shí)施例可以通過自動(dòng)化工具(例如腳本)實(shí)現(xiàn),能夠及時(shí)檢測到所關(guān)注的各個(gè)網(wǎng)站的搜索關(guān)鍵字特征的變化并進(jìn)行更新,保證了特征庫中所存儲(chǔ)的多個(gè)網(wǎng)站的搜索關(guān)鍵字特征的實(shí)時(shí)性。
      [0152]本領(lǐng)域內(nèi)的技術(shù)人員應(yīng)明白,本發(fā)明的實(shí)施例可提供為方法、系統(tǒng)、或計(jì)算機(jī)程序產(chǎn)品。因此,本發(fā)明可采用硬件實(shí)施例、軟件實(shí)施例、或結(jié)合軟件和硬件方面的實(shí)施例的形式。而且,本發(fā)明可采用在一個(gè)或多個(gè)其中包含有計(jì)算機(jī)可用程序代碼的計(jì)算機(jī)可用存儲(chǔ)介質(zhì)(包括但不限于磁盤存儲(chǔ)器和光學(xué)存儲(chǔ)器等)上實(shí)施的計(jì)算機(jī)程序產(chǎn)品的形式。
      [0153]本發(fā)明是參照根據(jù)本發(fā)明實(shí)施例的方法、設(shè)備(系統(tǒng))、和計(jì)算機(jī)程序產(chǎn)品的流程圖和/或方框圖來描述的。應(yīng)理解可由計(jì)算機(jī)程序指令實(shí)現(xiàn)流程圖和/或方框圖中的每一流程和/或方框、以及流程圖和/或方框圖中的流程和/或方框的結(jié)合。可提供這些計(jì)算機(jī)程序指令到通用計(jì)算機(jī)、專用計(jì)算機(jī)、嵌入式處理機(jī)或其他可編程數(shù)據(jù)處理設(shè)備的處理器以產(chǎn)生一個(gè)機(jī)器,使得通過計(jì)算機(jī)或其他可編程數(shù)據(jù)處理設(shè)備的處理器執(zhí)行的指令產(chǎn)生用于實(shí)現(xiàn)在流程圖一個(gè)流程或多個(gè)流程和/或方框圖一個(gè)方框或多個(gè)方框中指定的功能的裝置。
      [0154]這些計(jì)算機(jī)程序指令也可存儲(chǔ)在能引導(dǎo)計(jì)算機(jī)或其他可編程數(shù)據(jù)處理設(shè)備以特定方式工作的計(jì)算機(jī)可讀存儲(chǔ)器中,使得存儲(chǔ)在該計(jì)算機(jī)可讀存儲(chǔ)器中的指令產(chǎn)生包括指令裝置的制造品,該指令裝置實(shí)現(xiàn)在流程圖一個(gè)流程或多個(gè)流程和/或方框圖一個(gè)方框或多個(gè)方框中指定的功能。
      [0155]這些計(jì)算機(jī)程序指令也可裝載到計(jì)算機(jī)或其他可編程數(shù)據(jù)處理設(shè)備上,使得在計(jì)算機(jī)或其他可編程設(shè)備上執(zhí)行一系列操作步驟以產(chǎn)生計(jì)算機(jī)實(shí)現(xiàn)的處理,從而在計(jì)算機(jī)或其他可編程設(shè)備上執(zhí)行的指令提供用于實(shí)現(xiàn)在流程圖一個(gè)流程或多個(gè)流程和/或方框圖一個(gè)方框或多個(gè)方框中指定的功能的步驟。
      [0156]以上所述,僅為本發(fā)明的較佳實(shí)施例而已,并非用于限定本發(fā)明的保護(hù)范圍。
      【主權(quán)項(xiàng)】
      1.一種數(shù)據(jù)更新方法,其特征在于,所述方法包括: 根據(jù)特征庫中存儲(chǔ)的第一網(wǎng)站的搜索關(guān)鍵字特征,生成包括所述第一網(wǎng)站的搜索關(guān)鍵字特征的最小完整統(tǒng)一資源定位符URL;所述特征庫用于存儲(chǔ)多個(gè)網(wǎng)站的搜索關(guān)鍵字特征; 基于所述最小完整URL向所述第一網(wǎng)站的服務(wù)器發(fā)送訪問請(qǐng)求; 接收所述服務(wù)器發(fā)送的狀態(tài)碼; 對(duì)所述狀態(tài)碼進(jìn)行分析,確認(rèn)所述第一網(wǎng)站的搜索關(guān)鍵字特征發(fā)生變化時(shí),對(duì)所述特征庫中存儲(chǔ)的所述第一網(wǎng)站的搜索關(guān)鍵字特征進(jìn)行更新。2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述根據(jù)特征庫中存儲(chǔ)的第一網(wǎng)站的搜索關(guān)鍵字特征,生成包括所述第一網(wǎng)站的搜索關(guān)鍵字特征的最小完整統(tǒng)一資源定位符URL,包括: 根據(jù)特征庫中存儲(chǔ)的第一網(wǎng)站的域名、路徑及搜索關(guān)鍵字,生成包括所述第一網(wǎng)站的域名、路徑及搜索關(guān)鍵字的最小完整URL。3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述對(duì)所述狀態(tài)碼進(jìn)行分析,確認(rèn)所述第一網(wǎng)站的搜索關(guān)鍵字特征發(fā)生變化時(shí),對(duì)所述特征庫中存儲(chǔ)的所述第一網(wǎng)站的搜索關(guān)鍵字特征進(jìn)行更新,包括: 基于預(yù)設(shè)處理?xiàng)l件對(duì)所述狀態(tài)碼進(jìn)行分析,當(dāng)確定所述狀態(tài)碼不是符合所述預(yù)設(shè)處理?xiàng)l件的狀態(tài)碼時(shí),確認(rèn)所述第一網(wǎng)站的搜索關(guān)鍵字特征發(fā)生變化; 對(duì)所述特征庫中存儲(chǔ)的所述第一網(wǎng)站的搜索關(guān)鍵字特征進(jìn)行更新。4.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述對(duì)所述狀態(tài)碼進(jìn)行分析,確認(rèn)所述第一網(wǎng)站的搜索關(guān)鍵字特征發(fā)生變化時(shí),對(duì)所述特征庫中存儲(chǔ)的所述第一網(wǎng)站的搜索關(guān)鍵字特征進(jìn)行更新,包括: 基于預(yù)設(shè)處理?xiàng)l件對(duì)所述狀態(tài)碼進(jìn)行分析,當(dāng)確定所述狀態(tài)碼是符合所述預(yù)設(shè)處理?xiàng)l件的狀態(tài)碼時(shí),變更所述最小完整URL中的搜索關(guān)鍵字特征; 基于變更的最小完整URL訪問所述第一網(wǎng)站,并接收所述第一網(wǎng)站的服務(wù)器發(fā)送的與所述變更的最小完整URL對(duì)應(yīng)的狀態(tài)碼; 基于所述預(yù)設(shè)處理?xiàng)l件對(duì)所述與所述變更的最小完整URL對(duì)應(yīng)的狀態(tài)碼進(jìn)行分析;當(dāng)確定所述與所述變更的最小完整URL對(duì)應(yīng)的狀態(tài)碼不是符合所述預(yù)設(shè)處理?xiàng)l件的狀態(tài)碼時(shí),確認(rèn)所述第一網(wǎng)站的搜索關(guān)鍵字特征沒有發(fā)生變化。5.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述對(duì)所述狀態(tài)碼進(jìn)行分析,確認(rèn)所述第一網(wǎng)站的搜索關(guān)鍵字特征發(fā)生變化時(shí),對(duì)所述特征庫中存儲(chǔ)的所述第一網(wǎng)站的搜索關(guān)鍵字特征進(jìn)行更新,包括: 對(duì)所述狀態(tài)碼進(jìn)行分析,確認(rèn)所述第一網(wǎng)站的搜索關(guān)鍵字特征發(fā)生變化時(shí),基于所述第一網(wǎng)站的域名訪問所述第一網(wǎng)站,通過在所述第一網(wǎng)站的網(wǎng)頁進(jìn)行搜索獲得搜索記錄; 對(duì)所述搜索記錄進(jìn)行分析,從所述搜索記錄中提取與所述第一網(wǎng)站的更新的搜索關(guān)鍵字特征; 基于所述第一網(wǎng)站的更新的搜索關(guān)鍵字特征,對(duì)所述特征庫中存儲(chǔ)的所述第一網(wǎng)站的搜索關(guān)鍵字特征進(jìn)行更新。6.一種數(shù)據(jù)更新裝置,其特征在于,所述裝置包括: 生成模塊,用于根據(jù)特征庫中存儲(chǔ)的第一網(wǎng)站的搜索關(guān)鍵字特征,生成包括所述第一網(wǎng)站的搜索關(guān)鍵字特征的最小完整統(tǒng)一資源定位符URL;所述特征庫用于存儲(chǔ)多個(gè)網(wǎng)站的搜索關(guān)鍵字特征; 發(fā)送模塊,用于基于所述最小完整URL向所述第一網(wǎng)站的服務(wù)器發(fā)送訪問請(qǐng)求; 接收模塊,用于接收所述服務(wù)器發(fā)送的狀態(tài)碼; 更新模塊,用于對(duì)所述狀態(tài)碼進(jìn)行分析,確認(rèn)所述第一網(wǎng)站的搜索關(guān)鍵字特征發(fā)生變化時(shí),對(duì)所述特征庫中存儲(chǔ)的所述第一網(wǎng)站的搜索關(guān)鍵字特征進(jìn)行更新。7.根據(jù)權(quán)利要求6所述的裝置,其特征在于,所述生成模塊,具體用于根據(jù)特征庫中存儲(chǔ)的第一網(wǎng)站的域名、路徑及搜索關(guān)鍵字,生成包括所述第一網(wǎng)站的域名、路徑及搜索關(guān)鍵字的最小完整URL。8.根據(jù)權(quán)利要求6所述的裝置,其特征在于,所述更新模塊,具體用于: 基于預(yù)設(shè)處理?xiàng)l件對(duì)所述狀態(tài)碼進(jìn)行分析,當(dāng)確定所述狀態(tài)碼不是符合所述預(yù)設(shè)處理?xiàng)l件的狀態(tài)碼時(shí),確認(rèn)所述第一網(wǎng)站的搜索關(guān)鍵字特征發(fā)生變化; 對(duì)所述特征庫中存儲(chǔ)的所述第一網(wǎng)站的搜索關(guān)鍵字特征進(jìn)行更新。9.根據(jù)權(quán)利要求6所述的裝置,其特征在于,所述更新模塊,具體用于: 基于預(yù)設(shè)處理?xiàng)l件對(duì)所述狀態(tài)碼進(jìn)行分析,當(dāng)確定所述狀態(tài)碼是符合所述預(yù)設(shè)處理?xiàng)l件的狀態(tài)碼時(shí),變更所述最小完整URL中的搜索關(guān)鍵字特征; 基于變更的最小完整URL訪問所述第一網(wǎng)站,并接收所述第一網(wǎng)站的服務(wù)器發(fā)送的與所述變更的最小完整URL對(duì)應(yīng)的狀態(tài)碼; 基于所述預(yù)設(shè)處理?xiàng)l件對(duì)所述與所述變更的最小完整URL對(duì)應(yīng)的狀態(tài)碼進(jìn)行分析;當(dāng)確定所述與所述變更的最小完整URL對(duì)應(yīng)的狀態(tài)碼不是符合所述預(yù)設(shè)處理?xiàng)l件的狀態(tài)碼時(shí),確認(rèn)所述第一網(wǎng)站的搜索關(guān)鍵字特征沒有發(fā)生變化。10.根據(jù)權(quán)利要求6所述的裝置,其特征在于,所述更新模塊,具體用于: 對(duì)所述狀態(tài)碼進(jìn)行分析,確認(rèn)所述第一網(wǎng)站的搜索關(guān)鍵字特征發(fā)生變化時(shí),基于所述第一網(wǎng)站的域名訪問所述第一網(wǎng)站,通過在所述第一網(wǎng)站的網(wǎng)頁進(jìn)行搜索獲得搜索記錄; 對(duì)所述搜索記錄進(jìn)行分析,從所述搜索記錄中提取與所述第一網(wǎng)站的更新的搜索關(guān)鍵字特征; 基于所述第一網(wǎng)站的更新的搜索關(guān)鍵字特征,對(duì)所述特征庫中存儲(chǔ)的所述第一網(wǎng)站的搜索關(guān)鍵字特征進(jìn)行更新。
      【文檔編號(hào)】G06F17/30GK105912573SQ201610195331
      【公開日】2016年8月31日
      【申請(qǐng)日】2016年3月30日
      【發(fā)明人】張磊, 崔詠梅
      【申請(qǐng)人】北京網(wǎng)康科技有限公司
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
      1