国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      一種索引頁更新方法及裝置的制作方法

      文檔序號(hào):6601914閱讀:317來源:國知局
      專利名稱:一種索引頁更新方法及裝置的制作方法
      技術(shù)領(lǐng)域
      本發(fā)明涉及計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)領(lǐng)域,尤其涉及一種索引頁更新方法及裝置。
      背景技術(shù)
      互聯(lián)網(wǎng)上的網(wǎng)頁,分為索引頁和信息頁。索引頁,指網(wǎng)站內(nèi)不斷發(fā)布新內(nèi)容(新鏈接)的頁面,比如新聞?lì)l道首頁、體育頻道首頁、論壇版的頁面、博客日志列表頁等。信息頁,指包括文本信息的頁面,比如點(diǎn)擊新聞?lì)l道首頁的某鏈接而打開的頁面、點(diǎn)擊體育頻道首頁的某鏈接而打開的頁面、點(diǎn)擊博客日志列表頁中某列表而打開的某日志的頁面等。搜索引擎(search engine)指根據(jù)一定的策略,運(yùn)用特定的計(jì)算機(jī)程序搜集互聯(lián)網(wǎng)上的信息,對(duì)信息進(jìn)行組織和處理后,將處理后的信息顯示給用戶,并為用戶提供檢索服務(wù)。搜索引擎發(fā)現(xiàn)互聯(lián)網(wǎng)上出現(xiàn)的新頁面的主要途徑即是對(duì)索引頁的更新,當(dāng)搜索引擎預(yù)測到索引頁發(fā)生變化時(shí),及時(shí)從互聯(lián)網(wǎng)上獲取新內(nèi)容以更新索引頁,并提供給用戶檢索?,F(xiàn)有通過搜索引擎對(duì)索引頁更新的方案主要有兩種其一為搜索引擎根據(jù)經(jīng)驗(yàn)或統(tǒng)計(jì),將索引頁數(shù)據(jù)庫內(nèi)的各個(gè)索引頁分別預(yù)先設(shè)定更新頻率的簡單分級(jí),比如一分鐘一次、一小時(shí)一次、一天一次、一星期一次等多個(gè)級(jí)別,每個(gè)索引頁分別按各自的更新頻率進(jìn)行更新。這種更新方法采用固定頻率更新方式,由于索引頁的變化是動(dòng)態(tài)的,比如某索引頁可能一段時(shí)間更新變快或忽然變慢,采用固定頻率更新的方式顯然不符合對(duì)動(dòng)態(tài)變化的索引頁的更新,降低了用戶體驗(yàn)。其二為搜索引擎預(yù)先為每個(gè)索引頁設(shè)定一個(gè)更新頻率序列,比如為某索引頁預(yù)設(shè)等比的更新頻率序列5分鐘、10分鐘、20分鐘、40分鐘、80分鐘、160分鐘、320分
      鐘......,第一次更新該索引頁時(shí)采用一個(gè)默認(rèn)級(jí)別,比如160分鐘,當(dāng)本次更新索引頁
      后,將更新得到的索引頁內(nèi)容與上次的內(nèi)容對(duì)比,如果頁面有變化,則將更新頻率調(diào)整為80 分鐘,如果頁面沒有變化,則將更新頻率調(diào)整為320分鐘。這種更新方法采用動(dòng)態(tài)調(diào)整更新頻率的方式,對(duì)于變化頻率較低,比如一天變化一次的索引頁,或者在一天內(nèi)變化頻率比較均勻的索引頁,其更新效果較好,可以比較精確的預(yù)測索引變化的時(shí)間點(diǎn)。上述的索引頁的更新方案都是基于頻率的,發(fā)明人在實(shí)施本發(fā)明的過程中發(fā)現(xiàn), 現(xiàn)有的基于頻率的索引頁的更新方案主要存在以下缺陷1、存在更新時(shí)延,時(shí)效性差?,F(xiàn)有的方案并不適用于一天內(nèi)變化頻率較高,且在不同時(shí)間段變化頻率有明顯變化的索引頁的更新。比如大部分新聞?lì)l道首頁上午變化很快,但夜間基本不變化,采用現(xiàn)有的方案,由于在夜間長期探測到頁面沒有變化,多次探測以后,搜索引擎會(huì)將這個(gè)新聞?lì)l道首頁的更新頻率下調(diào)到很低,比如幾個(gè)小時(shí)才更新一次,第二天上午再更新這個(gè)新聞?lì)l道首頁時(shí),可能已經(jīng)產(chǎn)生了幾個(gè)小時(shí)的時(shí)延,甚至可能更早時(shí)發(fā)布的新聞已經(jīng)從該新聞?lì)l道的首頁上撤下,搜索引擎無法發(fā)現(xiàn)這個(gè)新聞,從而造成了更新時(shí)延,降低了搜索引擎的收錄時(shí)效性,同時(shí)降低了用戶體驗(yàn);2、耗費(fèi)資源。如1所述,大部分索引頁白天變化頻繁,夜間基本不變化;由于在白天探測到頁面頻繁變化,多次探測后,搜索引擎會(huì)將這個(gè)索引頁的更新頻率上調(diào)到很高,比如幾分鐘就更新一次,到夜晚時(shí),索引頁基本未變化,但依然會(huì)根據(jù)該頻率進(jìn)行多次更新, 造成搜索引擎的資源浪費(fèi),降低了對(duì)索引頁變化時(shí)間點(diǎn)的探測精確度。

      發(fā)明內(nèi)容
      本發(fā)明的目的在于,提供一種索引頁更新方法及裝置,采用基于概率和分時(shí)間段的更新方案,能夠精確預(yù)測索引頁變化時(shí)間點(diǎn),減少更新時(shí)延,提高時(shí)效性,提高用戶體驗(yàn)。為了實(shí)現(xiàn)上述目的,本發(fā)明實(shí)施例提供了一種索引頁更新方法,包括根據(jù)預(yù)設(shè)的周期,從索引頁數(shù)據(jù)庫讀取索引頁的相關(guān)信息,所述索引頁的相關(guān)信息包括索引頁的url,索引頁在各個(gè)預(yù)設(shè)時(shí)間段內(nèi)的頁面變化概率,索引頁的頁面指紋和索引頁的上次更新時(shí)間中的任一種或多種;根據(jù)所述相關(guān)信息,判斷所述索引頁當(dāng)前是否需要更新;當(dāng)所述判斷結(jié)果為是時(shí),根據(jù)所述相關(guān)信息更新所述索引頁。優(yōu)選地,所述根據(jù)所述相關(guān)信息,判斷所述索引頁當(dāng)前是否需要更新,包括根據(jù)所述相關(guān)信息,計(jì)算當(dāng)前時(shí)間與所述索引頁的上次更新時(shí)間之間所覆蓋的各個(gè)預(yù)設(shè)時(shí)間段內(nèi)所述索引頁的頁面變化概率的累積概率;判斷所述累積概率是否大于1 ;當(dāng)所述判斷結(jié)果為是時(shí),判定所述索引頁當(dāng)前需要更新。優(yōu)選地,所述根據(jù)所述相關(guān)信息更新所述索引頁,包括根據(jù)所述索引頁的url,從網(wǎng)絡(luò)中抓取所述url對(duì)應(yīng)的網(wǎng)頁源內(nèi)容;對(duì)所述抓取的網(wǎng)頁源內(nèi)容進(jìn)行抽取分析,獲得新的索引頁的主要內(nèi)容,所述主要內(nèi)容包括所述新的索引頁的文本信息和鏈接。優(yōu)選地,所述根據(jù)所述相關(guān)信息更新所述索引頁之后,還包括根據(jù)所述新的索引頁的主要內(nèi)容,計(jì)算所述新的索引頁的頁面指紋;判斷所述計(jì)算得到的新的索引頁的頁面指紋和從所述索引頁數(shù)據(jù)庫讀取的所述索引頁的頁面指紋是否相同;如果判斷結(jié)果為是,則將所述索引頁數(shù)據(jù)庫內(nèi)、所述當(dāng)前時(shí)間與所述索引頁的上次更新時(shí)間之間所覆蓋的各個(gè)預(yù)設(shè)時(shí)間段內(nèi)的頁面變化概率分別下調(diào);如果判斷結(jié)果為否,則將所述索引頁數(shù)據(jù)庫內(nèi)、所述當(dāng)前時(shí)間與所述索引頁的上次更新時(shí)間之間所覆蓋的各個(gè)預(yù)設(shè)時(shí)間段內(nèi)的頁面變化概率分別上調(diào),并用所述新的索引頁的頁面指紋替換所述索引頁數(shù)據(jù)庫內(nèi)的所述索引頁的頁面指紋。優(yōu)選地,所述根據(jù)預(yù)設(shè)的周期,從索引頁數(shù)據(jù)庫讀取索引頁的相關(guān)信息之前,還包括預(yù)先設(shè)定索引頁數(shù)據(jù)庫的訪問周期,所述索引頁數(shù)據(jù)庫包括多個(gè)索引頁以及各索引頁的相關(guān)信息;預(yù)先將一天分為多個(gè)預(yù)設(shè)時(shí)間段;預(yù)先設(shè)定索引頁在所述各個(gè)預(yù)設(shè)時(shí)間段內(nèi)的頁面變化概率。相應(yīng)地,本發(fā)明實(shí)施例還提供了一種索引頁更新裝置,包括調(diào)度模塊,用于根據(jù)預(yù)設(shè)的周期,從索引頁數(shù)據(jù)庫讀取索引頁的相關(guān)信息,并根據(jù)所述相關(guān)信息,判斷所述索引頁當(dāng)前是否需要更新;更新模塊,用于當(dāng)所述調(diào)度模塊判斷結(jié)果為是時(shí),根據(jù)所述相關(guān)信息更新所述索引頁。
      5
      優(yōu)選地,所述調(diào)度模塊包括讀取單元,用于根據(jù)預(yù)設(shè)的周期,從索引頁數(shù)據(jù)庫讀取索引頁的相關(guān)信息,所述索引頁的相關(guān)信息包括索引頁的url,索引頁在各個(gè)預(yù)設(shè)時(shí)間段內(nèi)的頁面變化概率,索引頁的頁面指紋和索引頁的上次更新時(shí)間中的任一種或多種;計(jì)算單元,用于根據(jù)所述讀取單元讀取的相關(guān)信息,計(jì)算當(dāng)前時(shí)間與所述索引頁的上次更新時(shí)間之間所覆蓋的各個(gè)預(yù)設(shè)時(shí)間段內(nèi)所述索引頁的頁面變化概率的累積概率;第一判斷單元,用于判斷所述計(jì)算單元計(jì)算的所述累積概率是否大于1 ;更新判定單元,用于當(dāng)所述第一判斷單元判斷結(jié)果為是時(shí),判定所述索引頁當(dāng)前
      需要更新。優(yōu)選地,所述更新模塊包括抓取單元,用于根據(jù)所述調(diào)度模塊讀取的所述索引頁的url,從網(wǎng)絡(luò)中抓取所述 url對(duì)應(yīng)的網(wǎng)頁源內(nèi)容;抽取單元,用于對(duì)所述抓取單元抓取的網(wǎng)頁源內(nèi)容進(jìn)行抽取分析,獲得新的索引頁的主要內(nèi)容,所述主要內(nèi)容包括所述新的索引頁的文本信息和鏈接。優(yōu)選地,所述裝置還包括回寫模塊,用于計(jì)算所述更新模塊更新后的新的索引頁的頁面指紋,對(duì)比所述調(diào)度模塊讀取的所述索引頁的頁面指紋,根據(jù)所述對(duì)比的結(jié)果調(diào)整所述當(dāng)前時(shí)間與所述索引頁的上次更新時(shí)間之間所覆蓋的各個(gè)預(yù)設(shè)時(shí)間段內(nèi)的頁面變化概率。優(yōu)選地,所述回寫模塊包括指紋計(jì)算單元,用于根據(jù)所述更新模塊更新后的新的索引頁的主要內(nèi)容,計(jì)算所述新的索引頁的頁面指紋;第二判斷單元,用于判斷所述指紋計(jì)算單元計(jì)算得到的新的索引頁的頁面指紋與所述調(diào)度模塊讀取的所述索引頁的頁面指紋是否相同;概率調(diào)整單元,用于當(dāng)所述第二判斷單元判斷結(jié)果為是時(shí),將所述索引頁數(shù)據(jù)庫內(nèi)、所述當(dāng)前時(shí)間與所述索引頁的上次更新時(shí)間之間所覆蓋的各個(gè)預(yù)設(shè)時(shí)間段內(nèi)的頁面變化概率分別下調(diào);或,當(dāng)所述第二判斷單元判斷結(jié)果為否時(shí),將所述索引頁數(shù)據(jù)庫內(nèi)、所述當(dāng)前時(shí)間與所述索引頁的上次更新時(shí)間之間所覆蓋的各個(gè)預(yù)設(shè)時(shí)間段內(nèi)的頁面變化概率分別上調(diào),并用所述指紋計(jì)算單元計(jì)算得到的新的索引頁的頁面指紋替換所述索引頁數(shù)據(jù)庫內(nèi)的所述索引頁的頁面指紋。優(yōu)選地,所述裝置還包括預(yù)設(shè)模塊,用于預(yù)先設(shè)定索引頁數(shù)據(jù)庫的訪問周期,預(yù)先將一天分為多個(gè)預(yù)設(shè)時(shí)間段,以及預(yù)先設(shè)定索引頁在所述各個(gè)預(yù)設(shè)時(shí)間段內(nèi)的頁面變化概率。本發(fā)明實(shí)施例通過定期從索引頁數(shù)據(jù)庫獲取索引頁的相關(guān)信息,并根據(jù)相關(guān)信息判斷該索引頁當(dāng)前時(shí)刻是否需要更新,當(dāng)該索引頁需要更新時(shí)才進(jìn)行更新,減少了更新時(shí)延,提高了時(shí)效性,提高了用戶體驗(yàn);通過預(yù)設(shè)時(shí)間段和各時(shí)間段內(nèi)的頁面變化概率,根據(jù)當(dāng)前時(shí)刻距離上一次更新時(shí)間之間所覆蓋的各時(shí)間段概率之和來判斷是否更新該索引頁,實(shí)現(xiàn)了對(duì)索引頁的更新采用基于概率和分時(shí)間段的方式,從而實(shí)現(xiàn)了精確預(yù)測索引頁變化時(shí)間點(diǎn);另外,每次更新結(jié)束后根據(jù)索引頁相對(duì)上次更新得到的頁面是否發(fā)生變化,對(duì)各時(shí)間段的頁面變化概率進(jìn)行動(dòng)態(tài)調(diào)整,使該索引頁在各時(shí)間段的頁面變化概率更符合實(shí)際變化情況,進(jìn)一步提高了預(yù)測索引頁變化時(shí)間點(diǎn)的精確度,提高了用戶體驗(yàn)。


      圖1為本發(fā)明的索引頁更新裝置的實(shí)施例的結(jié)構(gòu)示意圖;圖2為本發(fā)明的索引頁更新裝置的調(diào)度模塊的實(shí)施例的結(jié)構(gòu)示意圖;圖3為本發(fā)明的索引頁更新裝置的更新模塊的實(shí)施例的結(jié)構(gòu)示意圖;圖4為本發(fā)明的索引頁更新裝置的回寫模塊的實(shí)施例的結(jié)構(gòu)示意圖;圖5為本發(fā)明的索引頁更新方法的第一實(shí)施例的流程圖;圖6為本發(fā)明的索引頁更新方法的第二實(shí)施例的流程圖。
      具體實(shí)施例方式下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有作出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。請參見圖1,為本發(fā)明的索引頁更新裝置的實(shí)施例的結(jié)構(gòu)示意圖;具體實(shí)現(xiàn)中,圖 1所示的索引頁更新裝置可以為搜索引擎;如圖1所示,所述裝置包括調(diào)度模塊10和更新模塊20。所述調(diào)度模塊10,用于根據(jù)預(yù)設(shè)的周期,從索引頁數(shù)據(jù)庫讀取索引頁的相關(guān)信息, 并根據(jù)所述相關(guān)信息,判斷所述索引頁當(dāng)前是否需要更新;具體實(shí)現(xiàn)中,所述索引頁數(shù)據(jù)庫為搜索引擎自身的索引頁數(shù)據(jù)庫,所述索引頁數(shù)據(jù)庫包括多個(gè)索引頁以及各索引頁的相關(guān)信息;所述索引頁數(shù)據(jù)庫可以表的形式進(jìn)行索引頁數(shù)據(jù)的存儲(chǔ),如下表表一索引頁數(shù)據(jù)庫
      索引頁相關(guān)信息索引頁1索引頁1的相關(guān)信息索引頁2索引頁2的相關(guān)信息索引頁3索引頁3的相關(guān)信息 具體地,所述索引頁的相關(guān)信息包括索引頁的url (Uniform/UniversalResource Locator,統(tǒng)一資源定位符,又叫網(wǎng)頁地址),索引頁在各個(gè)預(yù)設(shè)時(shí)間段內(nèi)的頁面變化概率, 索引頁的頁面指紋和索引頁的上次更新時(shí)間中的任一種或多種。所述索引頁數(shù)據(jù)庫同樣可以表的形式進(jìn)行某索引頁的相關(guān)信息的存儲(chǔ),如下表表二 索引頁相關(guān)信息表
      權(quán)利要求
      1.一種索引頁更新方法,其特征在于根據(jù)預(yù)設(shè)的周期,從索引頁數(shù)據(jù)庫讀取索引頁的相關(guān)信息,所述索引頁的相關(guān)信息包括索引頁的url,索引頁在各個(gè)預(yù)設(shè)時(shí)間段內(nèi)的頁面變化概率,索引頁的頁面指紋和索引頁的上次更新時(shí)間中的任一種或多種;根據(jù)所述相關(guān)信息,判斷所述索引頁當(dāng)前是否需要更新; 當(dāng)所述判斷結(jié)果為是時(shí),根據(jù)所述相關(guān)信息更新所述索引頁。
      2.如權(quán)利要求1所述的方法,其特征在于,所述根據(jù)所述相關(guān)信息,判斷所述索引頁當(dāng)前是否需要更新,包括根據(jù)所述相關(guān)信息,計(jì)算當(dāng)前時(shí)間與所述索引頁的上次更新時(shí)間之間所覆蓋的各個(gè)預(yù)設(shè)時(shí)間段內(nèi)所述索引頁的頁面變化概率的累積概率; 判斷所述累積概率是否大于1 ; 當(dāng)所述判斷結(jié)果為是時(shí),判定所述索引頁當(dāng)前需要更新。
      3.如權(quán)利要求2所述的方法,其特征在于,所述根據(jù)所述相關(guān)信息更新所述索引頁,包括根據(jù)所述索引頁的url,從網(wǎng)絡(luò)中抓取所述url對(duì)應(yīng)的網(wǎng)頁源內(nèi)容; 對(duì)所述抓取的網(wǎng)頁源內(nèi)容進(jìn)行抽取分析,獲得新的索引頁的主要內(nèi)容,所述主要內(nèi)容包括所述新的索引頁的文本信息和鏈接。
      4.如權(quán)利要求3所述的方法,其特征在于,所述根據(jù)所述相關(guān)信息更新所述索引頁之后,還包括根據(jù)所述新的索引頁的主要內(nèi)容,計(jì)算所述新的索引頁的頁面指紋; 判斷所述計(jì)算得到的新的索引頁的頁面指紋和從所述索引頁數(shù)據(jù)庫讀取的所述索引頁的頁面指紋是否相同;如果判斷結(jié)果為是,則將所述索引頁數(shù)據(jù)庫內(nèi)、所述當(dāng)前時(shí)間與所述索引頁的上次更新時(shí)間之間所覆蓋的各個(gè)預(yù)設(shè)時(shí)間段內(nèi)的頁面變化概率分別下調(diào);如果判斷結(jié)果為否,則將所述索引頁數(shù)據(jù)庫內(nèi)、所述當(dāng)前時(shí)間與所述索引頁的上次更新時(shí)間之間所覆蓋的各個(gè)預(yù)設(shè)時(shí)間段內(nèi)的頁面變化概率分別上調(diào),并用所述新的索引頁的頁面指紋替換所述索引頁數(shù)據(jù)庫內(nèi)的所述索引頁的頁面指紋。
      5.如權(quán)利要求1-4任一項(xiàng)所述的方法,其特征在于,所述根據(jù)預(yù)設(shè)的周期,從索引頁數(shù)據(jù)庫讀取索引頁的相關(guān)信息之前,還包括預(yù)先設(shè)定索引頁數(shù)據(jù)庫的訪問周期,所述索引頁數(shù)據(jù)庫包括多個(gè)索引頁以及各索引頁的相關(guān)信息;預(yù)先將一天分為多個(gè)預(yù)設(shè)時(shí)間段;預(yù)先設(shè)定索引頁在所述各個(gè)預(yù)設(shè)時(shí)間段內(nèi)的頁面變化概率。
      6.一種索引頁更新裝置,其特征在于,包括調(diào)度模塊,用于根據(jù)預(yù)設(shè)的周期,從索引頁數(shù)據(jù)庫讀取索引頁的相關(guān)信息,并根據(jù)所述相關(guān)信息,判斷所述索引頁當(dāng)前是否需要更新;更新模塊,用于當(dāng)所述調(diào)度模塊判斷結(jié)果為是時(shí),根據(jù)所述相關(guān)信息更新所述索引頁。
      7.如權(quán)利要求6所述的裝置,其特征在于,所述調(diào)度模塊包括讀取單元,用于根據(jù)預(yù)設(shè)的周期,從索引頁數(shù)據(jù)庫讀取索引頁的相關(guān)信息,所述索引頁的相關(guān)信息包括索引頁的url,索引頁在各個(gè)預(yù)設(shè)時(shí)間段內(nèi)的頁面變化概率,索引頁的頁面指紋和索引頁的上次更新時(shí)間中的任一種或多種;計(jì)算單元,用于根據(jù)所述讀取單元讀取的相關(guān)信息,計(jì)算當(dāng)前時(shí)間與所述索引頁的上次更新時(shí)間之間所覆蓋的各個(gè)預(yù)設(shè)時(shí)間段內(nèi)所述索引頁的頁面變化概率的累積概率;第一判斷單元,用于判斷所述計(jì)算單元計(jì)算的所述累積概率是否大于1 ;更新判定單元,用于當(dāng)所述第一判斷單元判斷結(jié)果為是時(shí),判定所述索引頁當(dāng)前需要更新。
      8.如權(quán)利要求7所述的裝置,其特征在于,所述更新模塊包括抓取單元,用于根據(jù)所述調(diào)度模塊讀取的所述索引頁的url,從網(wǎng)絡(luò)中抓取所述url對(duì)應(yīng)的網(wǎng)頁源內(nèi)容;抽取單元,用于對(duì)所述抓取單元抓取的網(wǎng)頁源內(nèi)容進(jìn)行抽取分析,獲得新的索引頁的主要內(nèi)容,所述主要內(nèi)容包括所述新的索引頁的文本信息和鏈接。
      9.如權(quán)利要求8所述的裝置,其特征在于,還包括回寫模塊,用于計(jì)算所述更新模塊更新后的新的索引頁的頁面指紋,對(duì)比所述調(diào)度模塊讀取的所述索引頁的頁面指紋,根據(jù)所述對(duì)比的結(jié)果調(diào)整所述當(dāng)前時(shí)間與所述索引頁的上次更新時(shí)間之間所覆蓋的各個(gè)預(yù)設(shè)時(shí)間段內(nèi)的頁面變化概率。
      10.如權(quán)利要求9所述的裝置,其特征在于,所述回寫模塊包括指紋計(jì)算單元,用于根據(jù)所述更新模塊更新后的新的索引頁的主要內(nèi)容,計(jì)算所述新的索引頁的頁面指紋;第二判斷單元,用于判斷所述指紋計(jì)算單元計(jì)算得到的新的索引頁的頁面指紋與所述調(diào)度模塊讀取的所述索引頁的頁面指紋是否相同;概率調(diào)整單元,用于當(dāng)所述第二判斷單元判斷結(jié)果為是時(shí),將所述索引頁數(shù)據(jù)庫內(nèi)、所述當(dāng)前時(shí)間與所述索引頁的上次更新時(shí)間之間所覆蓋的各個(gè)預(yù)設(shè)時(shí)間段內(nèi)的頁面變化概率分別下調(diào);或,當(dāng)所述第二判斷單元判斷結(jié)果為否時(shí),將所述索引頁數(shù)據(jù)庫內(nèi)、所述當(dāng)前時(shí)間與所述索引頁的上次更新時(shí)間之間所覆蓋的各個(gè)預(yù)設(shè)時(shí)間段內(nèi)的頁面變化概率分別上調(diào),并用所述指紋計(jì)算單元計(jì)算得到的新的索引頁的頁面指紋替換所述索引頁數(shù)據(jù)庫內(nèi)的所述索引頁的頁面指紋。
      11.如權(quán)利要求6-10任一項(xiàng)所述的裝置,其特征在于,還包括預(yù)設(shè)模塊,用于預(yù)先設(shè)定索引頁數(shù)據(jù)庫的訪問周期,預(yù)先將一天分為多個(gè)預(yù)設(shè)時(shí)間段, 以及預(yù)先設(shè)定索引頁在所述各個(gè)預(yù)設(shè)時(shí)間段內(nèi)的頁面變化概率。
      全文摘要
      本發(fā)明公開了一種索引頁更新方法,包括根據(jù)預(yù)設(shè)的周期,從索引頁數(shù)據(jù)庫讀取索引頁的相關(guān)信息,所述索引頁的相關(guān)信息包括索引頁的url,索引頁在各個(gè)預(yù)設(shè)時(shí)間段內(nèi)的頁面變化概率,索引頁的頁面指紋和索引頁的上次更新時(shí)間中的任一種或多種;根據(jù)所述相關(guān)信息,判斷所述索引頁當(dāng)前是否需要更新;當(dāng)所述判斷結(jié)果為是時(shí),根據(jù)所述相關(guān)信息更新所述索引頁。相應(yīng)地,本發(fā)明還公開了一種索引頁更新裝置。本發(fā)明基于概率、分時(shí)間段的更新索引頁,能夠精確預(yù)測索引頁變化時(shí)間點(diǎn),減少更新時(shí)延,提高時(shí)效性,提高用戶體驗(yàn)。
      文檔編號(hào)G06F17/30GK102236674SQ20101016529
      公開日2011年11月9日 申請日期2010年4月29日 優(yōu)先權(quán)日2010年4月29日
      發(fā)明者文杰, 薛晶晶, 鄧大付, 顏俊偉 申請人:騰訊科技(深圳)有限公司
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
      1