數(shù)據(jù)更新方法及裝置的制造方法
【專利摘要】本發(fā)明公開一種數(shù)據(jù)更新方法及裝置,方法包括:根據(jù)特征庫中存儲(chǔ)的第一網(wǎng)站的搜索關(guān)鍵字特征,生成包括第一網(wǎng)站的搜索關(guān)鍵字特征的最小完整統(tǒng)一資源定位符URL;特征庫用于存儲(chǔ)多個(gè)網(wǎng)站的搜索關(guān)鍵字特征;基于最小完整URL向第一網(wǎng)站的服務(wù)器發(fā)送訪問請(qǐng)求;接收服務(wù)器發(fā)送的狀態(tài)碼;對(duì)狀態(tài)碼進(jìn)行分析,確認(rèn)第一網(wǎng)站的搜索關(guān)鍵字特征發(fā)生變化時(shí),對(duì)特征庫中存儲(chǔ)的第一網(wǎng)站的搜索關(guān)鍵字特征進(jìn)行更新。采用本發(fā)明,能夠提高檢測搜索關(guān)鍵字特征發(fā)生變化的實(shí)時(shí)性和效率,降低人力成本。
【專利說明】
數(shù)據(jù)更新方法及裝置
技術(shù)領(lǐng)域
[0001]本發(fā)明涉及通信技術(shù)領(lǐng)域的網(wǎng)絡(luò)管理技術(shù),尤其涉及一種數(shù)據(jù)更新方法及裝置。
【背景技術(shù)】
[0002]隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展,各種網(wǎng)絡(luò)應(yīng)用層出不窮,其中搜索功能是人們?nèi)粘9ぷ魃钪惺褂米顬槠毡楹椭匾膽?yīng)用之一,與搜索功能緊密關(guān)聯(lián)的是搜索關(guān)鍵字,搜索關(guān)鍵字是指用戶在網(wǎng)頁的搜索框中鍵入的關(guān)鍵字,參見圖1示出的用戶的部分搜索記錄,其中“pq = zhongguo,,、“q = zhongguo,,、“wd = zhongguo,,、“wq = zhongguo,,、“q = zhongguo,,京尤是搜索關(guān)鍵字,基于搜索關(guān)鍵字的應(yīng)用范圍很多,例如,網(wǎng)站或商家可能會(huì)通過用戶的搜索記錄了解用戶感興趣的需求,為用戶提供更多的相關(guān)推送,或者,基于對(duì)用戶的搜索記錄的分析獲得產(chǎn)品研發(fā)銷售的新機(jī)會(huì);基于用戶搜索記錄進(jìn)行網(wǎng)站搜索關(guān)鍵詞的優(yōu)化等,可見,獲取搜索關(guān)鍵字是實(shí)現(xiàn)基于搜索關(guān)鍵字的應(yīng)用所必不可少的,為了獲取搜索關(guān)鍵字,常用的方法通過比較特定的字符串或者正則表達(dá)式匹配來獲取數(shù)據(jù),這些特定的字符串和正則表達(dá)式就是搜索關(guān)鍵字特征。
[0003]由于搜索網(wǎng)站技術(shù)和業(yè)務(wù)范圍的變化和擴(kuò)展,當(dāng)網(wǎng)站內(nèi)部架構(gòu)、業(yè)務(wù)應(yīng)用或?qū)τ脩粜袨榈姆治龅冗M(jìn)行調(diào)整后,網(wǎng)站的域名及一些搜索參數(shù)可能會(huì)發(fā)生變化,就會(huì)導(dǎo)致搜索關(guān)鍵字特征也在持續(xù)地變化,此時(shí),需要及時(shí)更新搜索關(guān)鍵字特征,要不然就無法有效獲得搜索關(guān)鍵字。目前常用的檢查搜索關(guān)鍵字特征是否發(fā)生變化的方法包括:(I)通過周期性的檢查,逐個(gè)分析各個(gè)搜索網(wǎng)站的搜索行為是否發(fā)生變化,這種方法需要花費(fèi)大量的人工成本,效率低;(2)接收到用戶反饋后,分析相應(yīng)的搜索網(wǎng)站的搜索行為是否發(fā)生變化,這種方法被動(dòng)滯后,所維護(hù)數(shù)據(jù)的實(shí)時(shí)性差。
【發(fā)明內(nèi)容】
[0004]有鑒于此,本發(fā)明實(shí)施例期望提供一種數(shù)據(jù)更新方法及裝置,能夠提高檢測搜索關(guān)鍵字特征發(fā)生變化的效率,保證特征庫中所存儲(chǔ)的多個(gè)網(wǎng)站的搜索關(guān)鍵字特征的實(shí)時(shí)性,降低維護(hù)特征庫中數(shù)據(jù)所需的人力成本。
[0005]為達(dá)到上述目的,本發(fā)明的技術(shù)方案是這樣實(shí)現(xiàn)的:
[0006]本發(fā)明實(shí)施例提供一種數(shù)據(jù)更新方法,所述方法包括:
[0007]根據(jù)特征庫中存儲(chǔ)的第一網(wǎng)站的搜索關(guān)鍵字特征,生成包括所述第一網(wǎng)站的搜索關(guān)鍵字特征的最小完整統(tǒng)一資源定位符(URL,Uniform Resource Locator);所述特征庫用于存儲(chǔ)多個(gè)網(wǎng)站的搜索關(guān)鍵字特征;
[0008]基于所述最小完整URL向所述第一網(wǎng)站的服務(wù)器發(fā)送訪問請(qǐng)求;
[0009]接收所述服務(wù)器發(fā)送的狀態(tài)碼;
[0010]對(duì)所述狀態(tài)碼進(jìn)行分析,確認(rèn)所述第一網(wǎng)站的搜索關(guān)鍵字特征發(fā)生變化時(shí),對(duì)所述特征庫中存儲(chǔ)的所述第一網(wǎng)站的搜索關(guān)鍵字特征進(jìn)行更新。
[0011]可選的,所述根據(jù)特征庫中存儲(chǔ)的第一網(wǎng)站的搜索關(guān)鍵字特征,生成包括所述第一網(wǎng)站的搜索關(guān)鍵字特征的最小完整統(tǒng)一資源定位符URL,包括:
[0012]根據(jù)特征庫中存儲(chǔ)的第一網(wǎng)站的域名、路徑及搜索關(guān)鍵字,生成包括所述第一網(wǎng)站的域名、路徑及搜索關(guān)鍵字的最小完整URL。
[0013]可選的,所述對(duì)所述狀態(tài)碼進(jìn)行分析,確認(rèn)所述第一網(wǎng)站的搜索關(guān)鍵字特征發(fā)生變化時(shí),對(duì)所述特征庫中存儲(chǔ)的所述第一網(wǎng)站的搜索關(guān)鍵字特征進(jìn)行更新,包括:
[0014]基于預(yù)設(shè)處理?xiàng)l件對(duì)所述狀態(tài)碼進(jìn)行分析,當(dāng)確定所述狀態(tài)碼不是符合所述預(yù)設(shè)處理?xiàng)l件的狀態(tài)碼時(shí),確認(rèn)所述第一網(wǎng)站的搜索關(guān)鍵字特征發(fā)生變化;
[0015]對(duì)所述特征庫中存儲(chǔ)的所述第一網(wǎng)站的搜索關(guān)鍵字特征進(jìn)行更新。
[0016]可選的,所述對(duì)所述狀態(tài)碼進(jìn)行分析,確認(rèn)所述第一網(wǎng)站的搜索關(guān)鍵字特征發(fā)生變化時(shí),對(duì)所述特征庫中存儲(chǔ)的所述第一網(wǎng)站的搜索關(guān)鍵字特征進(jìn)行更新,包括:
[0017]基于預(yù)設(shè)處理?xiàng)l件對(duì)所述狀態(tài)碼進(jìn)行分析,當(dāng)確定所述狀態(tài)碼是符合所述預(yù)設(shè)處理?xiàng)l件的狀態(tài)碼時(shí),變更所述最小完整URL中的搜索關(guān)鍵字特征;
[0018]基于變更的最小完整URL訪問所述第一網(wǎng)站,并接收所述第一網(wǎng)站的服務(wù)器發(fā)送的與所述變更的最小完整URL對(duì)應(yīng)的狀態(tài)碼;
[0019]基于所述預(yù)設(shè)處理?xiàng)l件對(duì)所述與所述變更的最小完整URL對(duì)應(yīng)的狀態(tài)碼進(jìn)行分析;當(dāng)確定所述與所述變更的最小完整URL對(duì)應(yīng)的狀態(tài)碼不是符合所述預(yù)設(shè)處理?xiàng)l件的狀態(tài)碼時(shí),確認(rèn)所述第一網(wǎng)站的搜索關(guān)鍵字特征沒有發(fā)生變化。
[0020]可選的,所述對(duì)所述狀態(tài)碼進(jìn)行分析,確認(rèn)所述第一網(wǎng)站的搜索關(guān)鍵字特征發(fā)生變化時(shí),對(duì)所述特征庫中存儲(chǔ)的所述第一網(wǎng)站的搜索關(guān)鍵字特征進(jìn)行更新,包括:
[0021]對(duì)所述狀態(tài)碼進(jìn)行分析,確認(rèn)所述第一網(wǎng)站的搜索關(guān)鍵字特征發(fā)生變化時(shí),基于所述第一網(wǎng)站的域名訪問所述第一網(wǎng)站,通過在所述第一網(wǎng)站的網(wǎng)頁進(jìn)行搜索獲得搜索記錄;
[0022]對(duì)所述搜索記錄進(jìn)行分析,從所述搜索記錄中提取與所述第一網(wǎng)站的更新的搜索關(guān)鍵字特征;
[0023]基于所述第一網(wǎng)站的更新的搜索關(guān)鍵字特征,對(duì)所述特征庫中存儲(chǔ)的所述第一網(wǎng)站的搜索關(guān)鍵字特征進(jìn)行更新。
[0024]本發(fā)明實(shí)施例還提供一種數(shù)據(jù)更新裝置,所述裝置包括:
[0025]生成模塊,用于根據(jù)特征庫中存儲(chǔ)的第一網(wǎng)站的搜索關(guān)鍵字特征,生成包括所述第一網(wǎng)站的搜索關(guān)鍵字特征的最小完整URL;所述特征庫用于存儲(chǔ)多個(gè)網(wǎng)站的搜索關(guān)鍵字特征;
[0026]發(fā)送模塊,用于基于所述最小完整URL向所述第一網(wǎng)站的服務(wù)器發(fā)送訪問請(qǐng)求;
[0027]接收模塊,用于接收所述服務(wù)器發(fā)送的狀態(tài)碼;
[0028]更新模塊,用于對(duì)所述狀態(tài)碼進(jìn)行分析,確認(rèn)所述第一網(wǎng)站的搜索關(guān)鍵字特征發(fā)生變化時(shí),對(duì)所述特征庫中存儲(chǔ)的所述第一網(wǎng)站的搜索關(guān)鍵字特征進(jìn)行更新。
[0029]可選的,所述生成模塊,具體用于根據(jù)特征庫中存儲(chǔ)的第一網(wǎng)站的域名、路徑及搜索關(guān)鍵字,生成包括所述第一網(wǎng)站的域名、路徑及搜索關(guān)鍵字的最小完整URL。
[0030]可選的,所述更新模塊,具體用于:
[0031]基于預(yù)設(shè)處理?xiàng)l件對(duì)所述狀態(tài)碼進(jìn)行分析,當(dāng)確定所述狀態(tài)碼不是符合所述預(yù)設(shè)處理?xiàng)l件的狀態(tài)碼時(shí),確認(rèn)所述第一網(wǎng)站的搜索關(guān)鍵字特征發(fā)生變化;
[0032]對(duì)所述特征庫中存儲(chǔ)的所述第一網(wǎng)站的搜索關(guān)鍵字特征進(jìn)行更新。
[0033]可選的,所述更新模塊,具體用于:
[0034]基于預(yù)設(shè)處理?xiàng)l件對(duì)所述狀態(tài)碼進(jìn)行分析,當(dāng)確定所述狀態(tài)碼是符合所述預(yù)設(shè)處理?xiàng)l件的狀態(tài)碼時(shí),變更所述最小完整URL中的搜索關(guān)鍵字特征;
[0035]基于變更的最小完整URL訪問所述第一網(wǎng)站,并接收所述第一網(wǎng)站的服務(wù)器發(fā)送的與所述變更的最小完整URL對(duì)應(yīng)的狀態(tài)碼;
[0036]基于所述預(yù)設(shè)處理?xiàng)l件對(duì)所述與所述變更的最小完整URL對(duì)應(yīng)的狀態(tài)碼進(jìn)行分析;當(dāng)確定所述與所述變更的最小完整URL對(duì)應(yīng)的狀態(tài)碼不是符合所述預(yù)設(shè)處理?xiàng)l件的狀態(tài)碼時(shí),確認(rèn)所述第一網(wǎng)站的搜索關(guān)鍵字特征沒有發(fā)生變化。
[0037]可選的,所述更新模塊,具體用于:
[0038]對(duì)所述狀態(tài)碼進(jìn)行分析,確認(rèn)所述第一網(wǎng)站的搜索關(guān)鍵字特征發(fā)生變化時(shí),基于所述第一網(wǎng)站的域名訪問所述第一網(wǎng)站,通過在所述第一網(wǎng)站的網(wǎng)頁進(jìn)行搜索獲得搜索記錄;
[0039]對(duì)所述搜索記錄進(jìn)行分析,從所述搜索記錄中提取與所述第一網(wǎng)站的更新的搜索關(guān)鍵字特征;
[0040]基于所述第一網(wǎng)站的更新的搜索關(guān)鍵字特征,對(duì)所述特征庫中存儲(chǔ)的所述第一網(wǎng)站的搜索關(guān)鍵字特征進(jìn)行更新。
[0041]本發(fā)明實(shí)施例中,針對(duì)特征庫中存儲(chǔ)的任意一個(gè)網(wǎng)站的搜索關(guān)鍵字特征(以第一網(wǎng)站為例),基于第一網(wǎng)站的搜索關(guān)鍵字特征生成包括第一網(wǎng)站的搜索關(guān)鍵字特征的最小完整URL,該最小完整URL避免了搜索記錄中復(fù)雜網(wǎng)址形式和冗余信息,簡單直觀且易于維護(hù),通過訪問該最小完整URL得到第一網(wǎng)站的服務(wù)器發(fā)送的狀態(tài)碼,只需要分析狀態(tài)碼就能夠確認(rèn)第一網(wǎng)站的搜索關(guān)鍵字特征是否發(fā)生變化,提高了檢測搜索關(guān)鍵字特征是否發(fā)生變化的效率,降低了維護(hù)特征庫中數(shù)據(jù)所需的人力成本;本實(shí)施例可以通過自動(dòng)化工具(例如腳本)實(shí)現(xiàn),能夠及時(shí)檢測到所關(guān)注的各個(gè)網(wǎng)站的搜索關(guān)鍵字特征的變化并進(jìn)行更新,保證了特征庫中所存儲(chǔ)的多個(gè)網(wǎng)站的搜索關(guān)鍵字特征的實(shí)時(shí)性。
【附圖說明】
[0042]圖1為用戶的部分搜索記錄的舉例示意圖;
[0043]圖2為本發(fā)明實(shí)施例中數(shù)據(jù)更新方法的流程示意圖一;
[0044]圖3為狀態(tài)碼的應(yīng)用舉例示意圖;
[0045]圖4為本發(fā)明實(shí)施例中數(shù)據(jù)更新方法的流程示意圖二;
[0046]圖5為本發(fā)明實(shí)施例中URL的舉例示意圖一;
[0047]圖6為本發(fā)明實(shí)施例中檢查最小完整URL的舉例示意圖一;
[0048]圖7為本發(fā)明實(shí)施例中檢查查詢?cè)~變更的最小完整URL的舉例示意圖;
[0049]圖8為本發(fā)明實(shí)施例中網(wǎng)頁搜索結(jié)果的舉例示意圖一;
[0050]圖9為本發(fā)明實(shí)施例中URL的舉例示意圖二;
[0051 ]圖10為本發(fā)明實(shí)施例中檢查最小完整URL的舉例示意圖二;
[0052]圖11為本發(fā)明實(shí)施例中網(wǎng)頁搜索結(jié)果的舉例示意圖二;
[0053]圖12為本發(fā)明實(shí)施例中URL的舉例示意圖三;
[0054]圖13為本發(fā)明實(shí)施例中檢查最小完整URL的舉例示意圖三;
[0055]圖14為本發(fā)明實(shí)施例中檢查搜索關(guān)鍵字特征變化后的最小完整URL的舉例示意圖—*.---,
[0056]圖15為本發(fā)明實(shí)施例中檢查查詢?cè)~變更后的最小完整URL對(duì)應(yīng)的響應(yīng)標(biāo)題的舉例示意圖;
[0057]圖16為本發(fā)明實(shí)施例中網(wǎng)頁搜索結(jié)果的舉例示意圖三;
[0058]圖17為本發(fā)明實(shí)施例中檢查搜索關(guān)鍵字特征更新后的最小完整URL的舉例示意圖—*.---,
[0059]圖18為本發(fā)明實(shí)施例中檢查搜索關(guān)鍵字特征更新后的最小完整URL對(duì)應(yīng)的響應(yīng)標(biāo)題的舉例示意圖;
[0060]圖19為本發(fā)明實(shí)施例中數(shù)據(jù)更新裝置的結(jié)構(gòu)示意圖。
【具體實(shí)施方式】
[0061]下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述。
[0062]首先對(duì)實(shí)施本發(fā)明實(shí)施例的裝置(在以下各具體實(shí)施例中即為數(shù)據(jù)更新裝置)進(jìn)行說明,數(shù)據(jù)更新裝置可以采用各種方式來實(shí)施,例如在網(wǎng)關(guān)、路由器、交換機(jī)等網(wǎng)絡(luò)設(shè)備中實(shí)施數(shù)據(jù)更新裝置的全部組件(比如,數(shù)據(jù)更新裝置可以集成于上述的網(wǎng)絡(luò)設(shè)備中),或者,在上述的網(wǎng)絡(luò)設(shè)備側(cè)以耦合的方式實(shí)施數(shù)據(jù)更新裝置中的組件。
[0063]基于上述記載的數(shù)據(jù)更新裝置,提出以下各具體實(shí)施例。
[0064]實(shí)施例一
[0065]本實(shí)施例記載一種數(shù)據(jù)更新方法,可以應(yīng)用于如下場景中:希望能夠及時(shí)檢測到所關(guān)注的各個(gè)網(wǎng)站的搜索關(guān)鍵字特征的變化并進(jìn)行更新,提高檢測搜索關(guān)鍵字特征發(fā)生變化的效率,保證特征庫中所存儲(chǔ)的多個(gè)網(wǎng)站的搜索關(guān)鍵字特征的實(shí)時(shí)性,降低維護(hù)特征庫中數(shù)據(jù)所需的人力成本。
[0066]參見圖2,本實(shí)施例記載的數(shù)據(jù)更新方法包括以下步驟:
[0067]步驟201、根據(jù)特征庫中存儲(chǔ)的第一網(wǎng)站的搜索關(guān)鍵字特征,生成包括第一網(wǎng)站的搜索關(guān)鍵字特征的最小完整URL;特征庫用于存儲(chǔ)多個(gè)網(wǎng)站的搜索關(guān)鍵字特征。
[0068]第一網(wǎng)站為多個(gè)網(wǎng)站中的任意一個(gè)網(wǎng)站;可選的,搜索關(guān)鍵字特征可以包括:域名、路徑及搜索關(guān)鍵字;相應(yīng)地,第一網(wǎng)站的搜索關(guān)鍵字特征可以包括:第一網(wǎng)站的域名、路徑及搜索關(guān)鍵字;具體地,數(shù)據(jù)更新裝置根據(jù)特征庫中存儲(chǔ)的第一網(wǎng)站的域名、路徑及搜索關(guān)鍵字,通過抽象分析,總結(jié)并生成包括第一網(wǎng)站的域名、路徑及搜索關(guān)鍵字的最小完整URL0
[0069]最小完整URL的一般格式為(其中方括號(hào)[]內(nèi)為可選項(xiàng)):
[0070]協(xié)議://域名[:端口]/路徑/[;參數(shù)][?查詢?cè)~]。
[0071]—個(gè)包含搜索關(guān)鍵字的最小完整URL可以包括搜索網(wǎng)站的域名(例如,aaa.bbb.ccc)、搜索網(wǎng)站的路徑(例如,ddd)和搜索關(guān)鍵字(例如,keyword),包括搜索關(guān)鍵字的最小完整URL的格式舉例如下:
[0072]http (s)://aaa.bbb.ccc/ddd? keyword;或者,http (s)://aaa.bbb.ccc/ddd/keyword;其中,搜索網(wǎng)站的域名用于區(qū)分不同網(wǎng)站,搜索網(wǎng)站的路徑一般用于區(qū)分不同應(yīng)用,搜索關(guān)鍵字一般出現(xiàn)在查詢?cè)~中,搜索記錄中的其他數(shù)據(jù)一般不會(huì)影響對(duì)URL進(jìn)行訪問的連通性。
[0073]基于上述的最小完整URL基本結(jié)構(gòu),就可以避免構(gòu)造出形式復(fù)雜的網(wǎng)址類型,大大降低了檢測搜索特征是否變化的操作復(fù)雜性。
[0074]步驟202、基于最小完整URL向第一網(wǎng)站的服務(wù)器發(fā)送訪問請(qǐng)求。
[0075]對(duì)包括第一網(wǎng)站的搜索關(guān)鍵字特征的最小完整URL進(jìn)行訪問。
[0076]步驟203、接收服務(wù)器發(fā)送的狀態(tài)碼(Status Code)。
[0077]狀態(tài)碼可以為超文本傳輸協(xié)議(HTTP,HyperText Transfer Protocol)狀態(tài)碼,HTTP狀態(tài)碼是用以表示網(wǎng)站的網(wǎng)頁服務(wù)器的HTTP響應(yīng)狀態(tài)的3位數(shù)字代碼;參見圖3,狀態(tài)碼為2xx表示請(qǐng)求成功,可認(rèn)為原始特征沒有變更;而其它狀態(tài)碼如3xx,4xx,5xx,重定向、無法訪問、服務(wù)器出錯(cuò)等則表示訪問的URL可能存在問題,可能是業(yè)務(wù)調(diào)整或服務(wù)關(guān)閉等原因,從而確認(rèn)搜索關(guān)鍵字特征發(fā)生變化。
[0078]步驟204、對(duì)狀態(tài)碼進(jìn)行分析,確認(rèn)第一網(wǎng)站的搜索關(guān)鍵字特征發(fā)生變化時(shí),對(duì)特征庫中存儲(chǔ)的第一網(wǎng)站的搜索關(guān)鍵字特征進(jìn)行更新。
[0079]對(duì)包括第一網(wǎng)站的搜索關(guān)鍵字特征的最小完整URL進(jìn)行訪問,分析第一網(wǎng)站的服務(wù)器返回的HTTP狀態(tài)碼,確認(rèn)第一網(wǎng)站的搜索關(guān)鍵字特征是否發(fā)送變化。
[0080]本實(shí)施例中,針對(duì)特征庫中存儲(chǔ)的任意一個(gè)網(wǎng)站的搜索關(guān)鍵字特征(以第一網(wǎng)站為例),基于第一網(wǎng)站的搜索關(guān)鍵字特征生成包括第一網(wǎng)站的搜索關(guān)鍵字特征的最小完整URL,該最小完整URL避免了搜索記錄中復(fù)雜網(wǎng)址形式和冗余信息,簡單直觀且易于維護(hù),通過訪問該最小完整URL得到第一網(wǎng)站的服務(wù)器發(fā)送的狀態(tài)碼,只需要分析狀態(tài)碼就能夠確認(rèn)第一網(wǎng)站的搜索關(guān)鍵字特征是否發(fā)生變化,提高了檢測搜索關(guān)鍵字特征是否發(fā)生變化的效率,降低了維護(hù)特征庫中數(shù)據(jù)所需的人力成本;本實(shí)施例可以通過自動(dòng)化工具(例如腳本)實(shí)現(xiàn),能夠及時(shí)檢測到所關(guān)注的各個(gè)網(wǎng)站的搜索關(guān)鍵字特征的變化并進(jìn)行更新,保證了特征庫中所存儲(chǔ)的多個(gè)網(wǎng)站的搜索關(guān)鍵字特征的實(shí)時(shí)性。
[0081 ] 實(shí)施例二
[0082]本實(shí)施例基于實(shí)施例一,本實(shí)施例記載的數(shù)據(jù)更新方法可以應(yīng)用于如下場景中:希望能夠及時(shí)檢測到所關(guān)注的各個(gè)網(wǎng)站的搜索關(guān)鍵字特征的變化并進(jìn)行更新,提高檢測搜索關(guān)鍵字特征發(fā)生變化的效率,保證特征庫中所存儲(chǔ)的多個(gè)網(wǎng)站的搜索關(guān)鍵字特征的實(shí)時(shí)性,降低維護(hù)特征庫中數(shù)據(jù)所需的人力成本;本實(shí)施例針對(duì)此情況的處理進(jìn)行說明。
[0083]參見圖4,本實(shí)施例記載的數(shù)據(jù)更新方法包括以下步驟:
[0084]步驟401、根據(jù)特征庫中存儲(chǔ)的第一網(wǎng)站的搜索關(guān)鍵字特征,生成包括第一網(wǎng)站的搜索關(guān)鍵字特征的最小完整統(tǒng)一資源定位符URL。
[0085]特征庫用于存儲(chǔ)多個(gè)網(wǎng)站的搜索關(guān)鍵字特征。
[0086]步驟402、基于最小完整URL向第一網(wǎng)站的服務(wù)器發(fā)送訪問請(qǐng)求。
[0087]步驟403、接收服務(wù)器發(fā)送的狀態(tài)碼。
[0088]步驟404、基于預(yù)設(shè)處理?xiàng)l件對(duì)狀態(tài)碼進(jìn)行分析。
[0089]預(yù)設(shè)處理?xiàng)l件是指針對(duì)網(wǎng)站服務(wù)器返回的不同狀態(tài)碼,預(yù)先設(shè)定的數(shù)據(jù)更新裝置的不同的操作步驟。
[0090]步驟405、確定狀態(tài)碼是否是符合預(yù)設(shè)處理?xiàng)l件的狀態(tài)碼;當(dāng)確定狀態(tài)碼是符合預(yù)設(shè)處理?xiàng)l件的狀態(tài)碼時(shí),執(zhí)行步驟406;當(dāng)確定狀態(tài)碼不是符合預(yù)設(shè)處理?xiàng)l件的狀態(tài)碼時(shí),執(zhí)行步驟411。
[0091]這里,可選的,符合預(yù)設(shè)處理?xiàng)l件的狀態(tài)碼2xx,表示訪問請(qǐng)求成功。
[0092]步驟406、變更最小完整URL中的搜索關(guān)鍵字特征。
[0093]步驟407、基于變更的最小完整URL訪問第一網(wǎng)站,并接收第一網(wǎng)站的服務(wù)器發(fā)送的與變更的最小完整URL對(duì)應(yīng)的狀態(tài)碼。
[0094]步驟408、基于預(yù)設(shè)處理?xiàng)l件對(duì)與變更的最小完整URL對(duì)應(yīng)的狀態(tài)碼進(jìn)行分析。
[0095]步驟409、確定與變更的最小完整URL對(duì)應(yīng)的狀態(tài)碼是否是符合預(yù)設(shè)處理?xiàng)l件的狀態(tài)碼,若是,則執(zhí)行步驟411;否則,執(zhí)行步驟410。
[0096]可選的,數(shù)據(jù)更新裝置當(dāng)確定與變更的最小完整URL對(duì)應(yīng)的狀態(tài)碼是否是符合預(yù)設(shè)處理?xiàng)l件的狀態(tài)碼;若是,則執(zhí)行步驟411;否則,獲取與變更的最小完整URL對(duì)應(yīng)的響應(yīng)標(biāo)題;確定響應(yīng)標(biāo)題中不包括變更的最小完整URL的搜索詞時(shí),執(zhí)行步驟410。
[0097]步驟410、確認(rèn)第一網(wǎng)站的搜索關(guān)鍵字特征沒有發(fā)生變化;流程結(jié)束。
[0098]步驟411、確認(rèn)第一網(wǎng)站的搜索關(guān)鍵字特征發(fā)生變化;對(duì)特征庫中存儲(chǔ)的第一網(wǎng)站的搜索關(guān)鍵字特征進(jìn)行更新。
[0099]可選的,對(duì)特征庫中存儲(chǔ)的第一網(wǎng)站的搜索關(guān)鍵字特征進(jìn)行更新的實(shí)現(xiàn)方式可以包括:
[0100]確認(rèn)第一網(wǎng)站的搜索關(guān)鍵字特征發(fā)生變化時(shí),基于第一網(wǎng)站的域名訪問第一網(wǎng)站,通過在第一網(wǎng)站的網(wǎng)頁進(jìn)行搜索獲得搜索記錄;
[0101]對(duì)搜索記錄進(jìn)行分析,從搜索記錄中提取與第一網(wǎng)站的更新的搜索關(guān)鍵字特征;
[0102]基于第一網(wǎng)站的更新的搜索關(guān)鍵字特征,對(duì)特征庫中存儲(chǔ)的第一網(wǎng)站的搜索關(guān)鍵字特征進(jìn)行更新。
[0103]本實(shí)施例中,針對(duì)特征庫中存儲(chǔ)的任意一個(gè)網(wǎng)站的搜索關(guān)鍵字特征(以第一網(wǎng)站為例),基于第一網(wǎng)站的搜索關(guān)鍵字特征生成包括第一網(wǎng)站的搜索關(guān)鍵字特征的最小完整URL,該最小完整URL避免了搜索記錄中復(fù)雜網(wǎng)址形式和冗余信息,簡單直觀且易于維護(hù),通過訪問該最小完整URL得到第一網(wǎng)站的服務(wù)器返回的狀態(tài)碼,只需要分析狀態(tài)碼就能夠確認(rèn)第一網(wǎng)站的搜索關(guān)鍵字特征是否發(fā)生變化,提高了檢測搜索關(guān)鍵字特征是否發(fā)生變化的效率,降低了維護(hù)特征庫中數(shù)據(jù)所需的人力成本;考慮到實(shí)際中特征庫中存儲(chǔ)的海量的搜索關(guān)鍵字特征,本實(shí)施例還可以通過自動(dòng)化工具(例如腳本)實(shí)現(xiàn),能夠及時(shí)檢測到所關(guān)注的各個(gè)網(wǎng)站的搜索關(guān)鍵字特征的變化并進(jìn)行更新,保證了特征庫中所存儲(chǔ)的多個(gè)網(wǎng)站的搜索關(guān)鍵字特征的準(zhǔn)確性及實(shí)時(shí)性。
[0104]實(shí)施例三
[0105]本實(shí)施例基于實(shí)施例一、二,本實(shí)施例以實(shí)際中的一個(gè)搜索記錄為例對(duì)本發(fā)明實(shí)施例的數(shù)據(jù)更新方法的實(shí)現(xiàn)過程進(jìn)行說明;參見圖5至圖8,本實(shí)施例記載的數(shù)據(jù)更新方法,以訪問百度搜索引擎為例,在搜索框輸入某個(gè)關(guān)鍵字(11111111111111)并指示搜索,瀏覽器中顯示的URL如圖5所示,此URL的搜索關(guān)鍵字特征包括搜索關(guān)鍵字域名等信息,其他數(shù)據(jù)主要是用戶操作的一些上下文信息,能夠更精確分析用戶行為,但這些不是必須的,比如:
[0106]Ie:搜索關(guān)鍵字的編碼格式;
[0107]F:搜索判斷,f = 8用戶自主搜索,f = 3下拉框推薦,f = I相關(guān)搜索;
[0108]rsv_bp:判斷是第幾次搜索,O為第一次搜索,I為第二次或者多次搜索;
[0109]rsv_sug3:鍵盤重復(fù)速度;
[0110]tn:搜索框所屬網(wǎng)站。
[0111]URL中的路徑表示域名的具體業(yè)務(wù)內(nèi)容,多數(shù)情況下都是必須的,如果缺少會(huì)影響到相關(guān)業(yè)務(wù)訪問的連通性。
[0112]根據(jù)上述邏輯,從圖5所示的URL中提取以下部分?jǐn)?shù)據(jù):
[0113]域名:www.baidu.com;
[0114]路徑:s;
[0115]搜索關(guān)鍵字:Wd= Illlllllllllll;
[0116]相應(yīng)的最小完整URL 為:www.baidu.com/s?wd = 11111111111111。
[0117]然后,使用工具(例如腳本)來檢查包含搜索關(guān)鍵字特征的最小完整URL,參見圖6,HTTP狀態(tài)碼返回200;再將最小完整URL中的查詢?cè)~變化后進(jìn)行檢驗(yàn),參見圖7所示將wd變?yōu)閤y,返回狀態(tài)碼302,因此,判斷結(jié)果為:搜索關(guān)鍵字特征未發(fā)生變化;進(jìn)一步,參見圖8,網(wǎng)頁實(shí)際搜索的結(jié)果也對(duì)該判斷結(jié)果進(jìn)行了支撐。這里,關(guān)于工具的選擇,可以采用一些簡單明了的工具,比如Linux下的curl等,通過使用工具可以快速得到反饋結(jié)果,由于只需要判斷HTTP狀態(tài)碼,所以只獲取HTTP響應(yīng)頭,通過執(zhí)行命令“curl -1 aaa.bbb.ccc/ddd?keyword”即可,能夠提高檢測搜索關(guān)鍵字特征是否發(fā)生變化的效率,也便于轉(zhuǎn)化為自動(dòng)化方式檢查。
[0118]實(shí)施例四
[0119]本實(shí)施例基于實(shí)施例一、二,本實(shí)施例以實(shí)際中的一個(gè)搜索記錄為例對(duì)本發(fā)明實(shí)施例的數(shù)據(jù)更新方法的實(shí)現(xiàn)過程進(jìn)行說明;參見圖9至圖11,本實(shí)施例記載的數(shù)據(jù)更新方法,以圖9所示的URL(搜索記錄)為例,通過分析圖9的URL和相關(guān)搜索關(guān)鍵字特征獲得如下數(shù)據(jù):
[0120]域名:www.s0.com;
[0121]路徑:s;
[0122]搜索關(guān)鍵字:q=
[0123]其最小完整URL 為:www.s0.com/s ?q = 11111111111111。
[0124]參見圖10所示的工具處理截圖,HTTP狀態(tài)碼返回302重定向,表示搜索關(guān)鍵字特征可能已經(jīng)發(fā)生變化;進(jìn)一步,參見圖11,網(wǎng)頁實(shí)際搜索的結(jié)果也對(duì)該判斷結(jié)果進(jìn)行了支撐,原搜索WWW.s0.com輸入后已跳轉(zhuǎn)變更為新鏈接,即搜索關(guān)鍵字特征已出現(xiàn)變化,需要進(jìn)行搜索關(guān)鍵字特征的更新。
[0125]實(shí)施例五
[0126]本實(shí)施例基于實(shí)施例一、二,本實(shí)施例以實(shí)際中的一個(gè)搜索記錄為例對(duì)本發(fā)明實(shí)施例的數(shù)據(jù)更新方法的實(shí)現(xiàn)過程進(jìn)行說明;參見圖12至圖18,本實(shí)施例記載的數(shù)據(jù)更新方法,以圖12所示的URL(搜索記錄)為例,
[0127]通過分析原始URL和相關(guān)搜索關(guān)鍵字特征獲得如下數(shù)據(jù):
[0128]域名:www.zhongsou.com;
[0129]路徑:third,cgi ;
[0130]搜索關(guān)鍵字:Wd= Illlllllllllll;[0131 ]其最小完整 URL 為:www.zhongsou.com/third.cgi?wd = 11111111111111 ο
[0132]參見圖13所示的工具處理截圖,HTTP狀態(tài)碼返回200;再將最小完整URL中的查詢?cè)~變化后進(jìn)行檢驗(yàn),比如將wd變成aa,返回狀態(tài)碼仍然為200,參見圖14,說明搜索關(guān)鍵字特征發(fā)生變化。
[0133]然后獲取查詢?cè)~變更后的最小完整URL對(duì)應(yīng)的響應(yīng)標(biāo)題,檢測響應(yīng)標(biāo)題當(dāng)中是否包括變更后的最小完整URL的關(guān)鍵字,如不包括,說明搜索關(guān)鍵字特征已發(fā)生變化,參見圖15,未查到關(guān)鍵字11111111111111,說明搜索關(guān)鍵字特征已發(fā)生變化;進(jìn)一步,參見圖16,網(wǎng)頁實(shí)際搜索的結(jié)果也對(duì)該判斷結(jié)果進(jìn)行了支撐,查詢?cè)~已變更為w;基于查詢?cè)~《,對(duì)特征庫中存儲(chǔ)的第一網(wǎng)站的搜索關(guān)鍵字特征進(jìn)行更新;生成搜索關(guān)鍵字特征更新后的最小完整URL,并通過工具檢驗(yàn)搜索關(guān)鍵字更新后的最小完整URL,參見圖17,返回狀態(tài)碼200;參見圖18,所示請(qǐng)求頁面返回的響應(yīng)標(biāo)題中包含搜索的關(guān)鍵字11111111111111,說明當(dāng)前的搜索關(guān)鍵字特征是正確的。
[0134]實(shí)施例六
[0135]與前述實(shí)施例的記載相對(duì)應(yīng),本實(shí)施例還記載一種數(shù)據(jù)更新裝置,數(shù)據(jù)更新裝置可以用于執(zhí)行本發(fā)明實(shí)施例的數(shù)據(jù)更新方法,數(shù)據(jù)更新裝置可以采用各種方式來實(shí)施,例如在網(wǎng)關(guān)、路由器、交換機(jī)等網(wǎng)絡(luò)設(shè)備中實(shí)施數(shù)據(jù)更新裝置的全部組件(比如,數(shù)據(jù)更新裝置可以集成于上述的網(wǎng)絡(luò)設(shè)備中),或者,在上述的網(wǎng)絡(luò)設(shè)備側(cè)以耦合的方式實(shí)施數(shù)據(jù)更新裝置中的組件;參見圖19,數(shù)據(jù)更新裝置包括:
[0136]生成模塊1901,用于根據(jù)特征庫中存儲(chǔ)的第一網(wǎng)站的搜索關(guān)鍵字特征,生成包括第一網(wǎng)站的搜索關(guān)鍵字特征的最小完整統(tǒng)一資源定位符URL;特征庫用于存儲(chǔ)多個(gè)網(wǎng)站的搜索關(guān)鍵字特征;
[0137]發(fā)送模塊1902,用于基于最小完整URL向第一網(wǎng)站的服務(wù)器發(fā)送訪問請(qǐng)求;
[0138]接收模塊1903,用于接收服務(wù)器發(fā)送的狀態(tài)碼;
[0139]更新模塊1904,用于對(duì)狀態(tài)碼進(jìn)行分析,確認(rèn)第一網(wǎng)站的搜索關(guān)鍵字特征發(fā)生變化時(shí),對(duì)特征庫中存儲(chǔ)的第一網(wǎng)站的搜索關(guān)鍵字特征進(jìn)行更新。
[0140]上述方案中,數(shù)據(jù)更新裝置針對(duì)特征庫中存儲(chǔ)的任意一個(gè)網(wǎng)站的搜索關(guān)鍵字特征(以第一網(wǎng)站為例),基于第一網(wǎng)站的搜索關(guān)鍵字特征生成包括第一網(wǎng)站的搜索關(guān)鍵字特征的最小完整URL,該最小完整URL避免了搜索記錄中復(fù)雜網(wǎng)址形式和冗余信息,簡單直觀且易于維護(hù),通過訪問該最小完整URL得到第一網(wǎng)站的服務(wù)器發(fā)送的狀態(tài)碼,只需要分析狀態(tài)碼就能夠確認(rèn)第一網(wǎng)站的搜索關(guān)鍵字特征是否發(fā)生變化,提高了檢測搜索關(guān)鍵字特征是否發(fā)生變化的效率,降低了維護(hù)特征庫中數(shù)據(jù)所需的人力成本;本實(shí)施例可以通過自動(dòng)化工具(例如腳本)實(shí)現(xiàn),能夠及時(shí)檢測到所關(guān)注的各個(gè)網(wǎng)站的搜索關(guān)鍵字特征的變化并進(jìn)行更新,保證了特征庫中所存儲(chǔ)的多個(gè)網(wǎng)站的搜索關(guān)鍵字特征的實(shí)時(shí)性。
[0141]在上述實(shí)施例的基礎(chǔ)上,生成模塊1901,具體用于根據(jù)特征庫中存儲(chǔ)的第一網(wǎng)站的域名、路徑及搜索關(guān)鍵字,生成包括第一網(wǎng)站的域名、路徑及搜索關(guān)鍵字的最小完整URL。
[0142]在上述實(shí)施例的基礎(chǔ)上,更新模塊1904,具體用于:基于預(yù)設(shè)處理?xiàng)l件對(duì)狀態(tài)碼進(jìn)行分析,當(dāng)確定狀態(tài)碼不是符合預(yù)設(shè)處理?xiàng)l件的狀態(tài)碼時(shí),確認(rèn)第一網(wǎng)站的搜索關(guān)鍵字特征發(fā)生變化;對(duì)特征庫中存儲(chǔ)的第一網(wǎng)站的搜索關(guān)鍵字特征進(jìn)行更新。
[0143]在上述實(shí)施例的基礎(chǔ)上,更新模塊1904,具體用于:基于預(yù)設(shè)處理?xiàng)l件對(duì)狀態(tài)碼進(jìn)行分析,當(dāng)確定狀態(tài)碼是符合預(yù)設(shè)處理?xiàng)l件的狀態(tài)碼時(shí),變更最小完整URL中的搜索關(guān)鍵字特征;基于變更的最小完整URL訪問第一網(wǎng)站,并接收第一網(wǎng)站的服務(wù)器發(fā)送的與變更的最小完整URL對(duì)應(yīng)的狀態(tài)碼;基于預(yù)設(shè)處理?xiàng)l件對(duì)與變更的最小完整URL對(duì)應(yīng)的狀態(tài)碼進(jìn)行分析;當(dāng)確定與變更的最小完整URL對(duì)應(yīng)的狀態(tài)碼不是符合預(yù)設(shè)處理?xiàng)l件的狀態(tài)碼時(shí),確認(rèn)第一網(wǎng)站的搜索關(guān)鍵字特征沒有發(fā)生變化。
[0144]在上述實(shí)施例的基礎(chǔ)上,更新模塊1904,具體用于:對(duì)狀態(tài)碼進(jìn)行分析,確認(rèn)第一網(wǎng)站的搜索關(guān)鍵字特征發(fā)生變化時(shí),基于第一網(wǎng)站的域名訪問第一網(wǎng)站,通過在第一網(wǎng)站的網(wǎng)頁進(jìn)行搜索獲得搜索記錄;對(duì)搜索記錄進(jìn)行分析,從搜索記錄中提取與第一網(wǎng)站的更新的搜索關(guān)鍵字特征;基于第一網(wǎng)站的更新的搜索關(guān)鍵字特征,對(duì)特征庫中存儲(chǔ)的第一網(wǎng)站的搜索關(guān)鍵字特征進(jìn)行更新。
[0145]實(shí)施例七
[0146]本實(shí)施例記載一種計(jì)算機(jī)可讀介質(zhì),可以為ROM(例如,只讀存儲(chǔ)器、FLASH存儲(chǔ)器、轉(zhuǎn)移裝置等)、磁存儲(chǔ)介質(zhì)(例如,磁帶、磁盤驅(qū)動(dòng)器等)、光學(xué)存儲(chǔ)介質(zhì)(例如,CD-R0M、DVD-R0M、紙卡、紙帶等)以及其他熟知類型的程序存儲(chǔ)器;計(jì)算機(jī)可讀介質(zhì)中存儲(chǔ)有計(jì)算機(jī)可執(zhí)行指令(例如騰訊視頻等投射應(yīng)用的二進(jìn)制可執(zhí)行指令),當(dāng)執(zhí)行指令時(shí),引起至少一個(gè)處理器執(zhí)行包括以下的操作:
[0147]根據(jù)特征庫中存儲(chǔ)的第一網(wǎng)站的搜索關(guān)鍵字特征,生成包括第一網(wǎng)站的搜索關(guān)鍵字特征的最小完整統(tǒng)一資源定位符URL;特征庫用于存儲(chǔ)多個(gè)網(wǎng)站的搜索關(guān)鍵字特征;
[0148]基于最小完整URL向第一網(wǎng)站的服務(wù)器發(fā)送訪問請(qǐng)求;
[0149]接收服務(wù)器發(fā)送的狀態(tài)碼;
[0150]對(duì)狀態(tài)碼進(jìn)行分析,確認(rèn)第一網(wǎng)站的搜索關(guān)鍵字特征發(fā)生變化時(shí),對(duì)特征庫中存儲(chǔ)的第一網(wǎng)站的搜索關(guān)鍵字特征進(jìn)行更新。
[0151]綜上,數(shù)據(jù)更新裝置針對(duì)特征庫中存儲(chǔ)的任意一個(gè)網(wǎng)站的搜索關(guān)鍵字特征(以第一網(wǎng)站為例),基于第一網(wǎng)站的搜索關(guān)鍵字特征生成包括第一網(wǎng)站的搜索關(guān)鍵字特征的最小完整URL,該最小完整URL避免了搜索記錄中復(fù)雜網(wǎng)址形式和冗余信息,簡單直觀且易于維護(hù),通過訪問該最小完整URL得到第一網(wǎng)站的服務(wù)器發(fā)送的狀態(tài)碼,只需要分析狀態(tài)碼就能夠確認(rèn)第一網(wǎng)站的搜索關(guān)鍵字特征是否發(fā)生變化,提高了檢測搜索關(guān)鍵字特征是否發(fā)生變化的效率,降低了維護(hù)特征庫中數(shù)據(jù)所需的人力成本;本實(shí)施例可以通過自動(dòng)化工具(例如腳本)實(shí)現(xiàn),能夠及時(shí)檢測到所關(guān)注的各個(gè)網(wǎng)站的搜索關(guān)鍵字特征的變化并進(jìn)行更新,保證了特征庫中所存儲(chǔ)的多個(gè)網(wǎng)站的搜索關(guān)鍵字特征的實(shí)時(shí)性。
[0152]本領(lǐng)域內(nèi)的技術(shù)人員應(yīng)明白,本發(fā)明的實(shí)施例可提供為方法、系統(tǒng)、或計(jì)算機(jī)程序產(chǎn)品。因此,本發(fā)明可采用硬件實(shí)施例、軟件實(shí)施例、或結(jié)合軟件和硬件方面的實(shí)施例的形式。而且,本發(fā)明可采用在一個(gè)或多個(gè)其中包含有計(jì)算機(jī)可用程序代碼的計(jì)算機(jī)可用存儲(chǔ)介質(zhì)(包括但不限于磁盤存儲(chǔ)器和光學(xué)存儲(chǔ)器等)上實(shí)施的計(jì)算機(jī)程序產(chǎn)品的形式。
[0153]本發(fā)明是參照根據(jù)本發(fā)明實(shí)施例的方法、設(shè)備(系統(tǒng))、和計(jì)算機(jī)程序產(chǎn)品的流程圖和/或方框圖來描述的。應(yīng)理解可由計(jì)算機(jī)程序指令實(shí)現(xiàn)流程圖和/或方框圖中的每一流程和/或方框、以及流程圖和/或方框圖中的流程和/或方框的結(jié)合。可提供這些計(jì)算機(jī)程序指令到通用計(jì)算機(jī)、專用計(jì)算機(jī)、嵌入式處理機(jī)或其他可編程數(shù)據(jù)處理設(shè)備的處理器以產(chǎn)生一個(gè)機(jī)器,使得通過計(jì)算機(jī)或其他可編程數(shù)據(jù)處理設(shè)備的處理器執(zhí)行的指令產(chǎn)生用于實(shí)現(xiàn)在流程圖一個(gè)流程或多個(gè)流程和/或方框圖一個(gè)方框或多個(gè)方框中指定的功能的裝置。
[0154]這些計(jì)算機(jī)程序指令也可存儲(chǔ)在能引導(dǎo)計(jì)算機(jī)或其他可編程數(shù)據(jù)處理設(shè)備以特定方式工作的計(jì)算機(jī)可讀存儲(chǔ)器中,使得存儲(chǔ)在該計(jì)算機(jī)可讀存儲(chǔ)器中的指令產(chǎn)生包括指令裝置的制造品,該指令裝置實(shí)現(xiàn)在流程圖一個(gè)流程或多個(gè)流程和/或方框圖一個(gè)方框或多個(gè)方框中指定的功能。
[0155]這些計(jì)算機(jī)程序指令也可裝載到計(jì)算機(jī)或其他可編程數(shù)據(jù)處理設(shè)備上,使得在計(jì)算機(jī)或其他可編程設(shè)備上執(zhí)行一系列操作步驟以產(chǎn)生計(jì)算機(jī)實(shí)現(xiàn)的處理,從而在計(jì)算機(jī)或其他可編程設(shè)備上執(zhí)行的指令提供用于實(shí)現(xiàn)在流程圖一個(gè)流程或多個(gè)流程和/或方框圖一個(gè)方框或多個(gè)方框中指定的功能的步驟。
[0156]以上所述,僅為本發(fā)明的較佳實(shí)施例而已,并非用于限定本發(fā)明的保護(hù)范圍。
【主權(quán)項(xiàng)】
1.一種數(shù)據(jù)更新方法,其特征在于,所述方法包括: 根據(jù)特征庫中存儲(chǔ)的第一網(wǎng)站的搜索關(guān)鍵字特征,生成包括所述第一網(wǎng)站的搜索關(guān)鍵字特征的最小完整統(tǒng)一資源定位符URL;所述特征庫用于存儲(chǔ)多個(gè)網(wǎng)站的搜索關(guān)鍵字特征; 基于所述最小完整URL向所述第一網(wǎng)站的服務(wù)器發(fā)送訪問請(qǐng)求; 接收所述服務(wù)器發(fā)送的狀態(tài)碼; 對(duì)所述狀態(tài)碼進(jìn)行分析,確認(rèn)所述第一網(wǎng)站的搜索關(guān)鍵字特征發(fā)生變化時(shí),對(duì)所述特征庫中存儲(chǔ)的所述第一網(wǎng)站的搜索關(guān)鍵字特征進(jìn)行更新。2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述根據(jù)特征庫中存儲(chǔ)的第一網(wǎng)站的搜索關(guān)鍵字特征,生成包括所述第一網(wǎng)站的搜索關(guān)鍵字特征的最小完整統(tǒng)一資源定位符URL,包括: 根據(jù)特征庫中存儲(chǔ)的第一網(wǎng)站的域名、路徑及搜索關(guān)鍵字,生成包括所述第一網(wǎng)站的域名、路徑及搜索關(guān)鍵字的最小完整URL。3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述對(duì)所述狀態(tài)碼進(jìn)行分析,確認(rèn)所述第一網(wǎng)站的搜索關(guān)鍵字特征發(fā)生變化時(shí),對(duì)所述特征庫中存儲(chǔ)的所述第一網(wǎng)站的搜索關(guān)鍵字特征進(jìn)行更新,包括: 基于預(yù)設(shè)處理?xiàng)l件對(duì)所述狀態(tài)碼進(jìn)行分析,當(dāng)確定所述狀態(tài)碼不是符合所述預(yù)設(shè)處理?xiàng)l件的狀態(tài)碼時(shí),確認(rèn)所述第一網(wǎng)站的搜索關(guān)鍵字特征發(fā)生變化; 對(duì)所述特征庫中存儲(chǔ)的所述第一網(wǎng)站的搜索關(guān)鍵字特征進(jìn)行更新。4.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述對(duì)所述狀態(tài)碼進(jìn)行分析,確認(rèn)所述第一網(wǎng)站的搜索關(guān)鍵字特征發(fā)生變化時(shí),對(duì)所述特征庫中存儲(chǔ)的所述第一網(wǎng)站的搜索關(guān)鍵字特征進(jìn)行更新,包括: 基于預(yù)設(shè)處理?xiàng)l件對(duì)所述狀態(tài)碼進(jìn)行分析,當(dāng)確定所述狀態(tài)碼是符合所述預(yù)設(shè)處理?xiàng)l件的狀態(tài)碼時(shí),變更所述最小完整URL中的搜索關(guān)鍵字特征; 基于變更的最小完整URL訪問所述第一網(wǎng)站,并接收所述第一網(wǎng)站的服務(wù)器發(fā)送的與所述變更的最小完整URL對(duì)應(yīng)的狀態(tài)碼; 基于所述預(yù)設(shè)處理?xiàng)l件對(duì)所述與所述變更的最小完整URL對(duì)應(yīng)的狀態(tài)碼進(jìn)行分析;當(dāng)確定所述與所述變更的最小完整URL對(duì)應(yīng)的狀態(tài)碼不是符合所述預(yù)設(shè)處理?xiàng)l件的狀態(tài)碼時(shí),確認(rèn)所述第一網(wǎng)站的搜索關(guān)鍵字特征沒有發(fā)生變化。5.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述對(duì)所述狀態(tài)碼進(jìn)行分析,確認(rèn)所述第一網(wǎng)站的搜索關(guān)鍵字特征發(fā)生變化時(shí),對(duì)所述特征庫中存儲(chǔ)的所述第一網(wǎng)站的搜索關(guān)鍵字特征進(jìn)行更新,包括: 對(duì)所述狀態(tài)碼進(jìn)行分析,確認(rèn)所述第一網(wǎng)站的搜索關(guān)鍵字特征發(fā)生變化時(shí),基于所述第一網(wǎng)站的域名訪問所述第一網(wǎng)站,通過在所述第一網(wǎng)站的網(wǎng)頁進(jìn)行搜索獲得搜索記錄; 對(duì)所述搜索記錄進(jìn)行分析,從所述搜索記錄中提取與所述第一網(wǎng)站的更新的搜索關(guān)鍵字特征; 基于所述第一網(wǎng)站的更新的搜索關(guān)鍵字特征,對(duì)所述特征庫中存儲(chǔ)的所述第一網(wǎng)站的搜索關(guān)鍵字特征進(jìn)行更新。6.一種數(shù)據(jù)更新裝置,其特征在于,所述裝置包括: 生成模塊,用于根據(jù)特征庫中存儲(chǔ)的第一網(wǎng)站的搜索關(guān)鍵字特征,生成包括所述第一網(wǎng)站的搜索關(guān)鍵字特征的最小完整統(tǒng)一資源定位符URL;所述特征庫用于存儲(chǔ)多個(gè)網(wǎng)站的搜索關(guān)鍵字特征; 發(fā)送模塊,用于基于所述最小完整URL向所述第一網(wǎng)站的服務(wù)器發(fā)送訪問請(qǐng)求; 接收模塊,用于接收所述服務(wù)器發(fā)送的狀態(tài)碼; 更新模塊,用于對(duì)所述狀態(tài)碼進(jìn)行分析,確認(rèn)所述第一網(wǎng)站的搜索關(guān)鍵字特征發(fā)生變化時(shí),對(duì)所述特征庫中存儲(chǔ)的所述第一網(wǎng)站的搜索關(guān)鍵字特征進(jìn)行更新。7.根據(jù)權(quán)利要求6所述的裝置,其特征在于,所述生成模塊,具體用于根據(jù)特征庫中存儲(chǔ)的第一網(wǎng)站的域名、路徑及搜索關(guān)鍵字,生成包括所述第一網(wǎng)站的域名、路徑及搜索關(guān)鍵字的最小完整URL。8.根據(jù)權(quán)利要求6所述的裝置,其特征在于,所述更新模塊,具體用于: 基于預(yù)設(shè)處理?xiàng)l件對(duì)所述狀態(tài)碼進(jìn)行分析,當(dāng)確定所述狀態(tài)碼不是符合所述預(yù)設(shè)處理?xiàng)l件的狀態(tài)碼時(shí),確認(rèn)所述第一網(wǎng)站的搜索關(guān)鍵字特征發(fā)生變化; 對(duì)所述特征庫中存儲(chǔ)的所述第一網(wǎng)站的搜索關(guān)鍵字特征進(jìn)行更新。9.根據(jù)權(quán)利要求6所述的裝置,其特征在于,所述更新模塊,具體用于: 基于預(yù)設(shè)處理?xiàng)l件對(duì)所述狀態(tài)碼進(jìn)行分析,當(dāng)確定所述狀態(tài)碼是符合所述預(yù)設(shè)處理?xiàng)l件的狀態(tài)碼時(shí),變更所述最小完整URL中的搜索關(guān)鍵字特征; 基于變更的最小完整URL訪問所述第一網(wǎng)站,并接收所述第一網(wǎng)站的服務(wù)器發(fā)送的與所述變更的最小完整URL對(duì)應(yīng)的狀態(tài)碼; 基于所述預(yù)設(shè)處理?xiàng)l件對(duì)所述與所述變更的最小完整URL對(duì)應(yīng)的狀態(tài)碼進(jìn)行分析;當(dāng)確定所述與所述變更的最小完整URL對(duì)應(yīng)的狀態(tài)碼不是符合所述預(yù)設(shè)處理?xiàng)l件的狀態(tài)碼時(shí),確認(rèn)所述第一網(wǎng)站的搜索關(guān)鍵字特征沒有發(fā)生變化。10.根據(jù)權(quán)利要求6所述的裝置,其特征在于,所述更新模塊,具體用于: 對(duì)所述狀態(tài)碼進(jìn)行分析,確認(rèn)所述第一網(wǎng)站的搜索關(guān)鍵字特征發(fā)生變化時(shí),基于所述第一網(wǎng)站的域名訪問所述第一網(wǎng)站,通過在所述第一網(wǎng)站的網(wǎng)頁進(jìn)行搜索獲得搜索記錄; 對(duì)所述搜索記錄進(jìn)行分析,從所述搜索記錄中提取與所述第一網(wǎng)站的更新的搜索關(guān)鍵字特征; 基于所述第一網(wǎng)站的更新的搜索關(guān)鍵字特征,對(duì)所述特征庫中存儲(chǔ)的所述第一網(wǎng)站的搜索關(guān)鍵字特征進(jìn)行更新。
【文檔編號(hào)】G06F17/30GK105912573SQ201610195331
【公開日】2016年8月31日
【申請(qǐng)日】2016年3月30日
【發(fā)明人】張磊, 崔詠梅
【申請(qǐng)人】北京網(wǎng)康科技有限公司