技術(shù)編號:6397604
提示:您尚未登錄,請點 登 陸 后下載,如果您還沒有賬戶請點 注 冊 ,登陸完成后,請刷新本頁查看技術(shù)詳細信息。本發(fā)明涉及頁面抓取周期性探測規(guī)則的方法的,具體涉及。背景技術(shù)隨著網(wǎng)絡(luò)上海量信息的爆炸式增長,通用搜索引擎面臨著索引規(guī)模、更新速度和個性化需求等多方面的挑戰(zhàn)。面對這些挑戰(zhàn),適應特定主題和個性化搜索的主題網(wǎng)絡(luò)爬蟲(focused crawler or topical crawler)應運而生?;谥黝}網(wǎng)絡(luò)爬蟲的搜索引擎(即第四代搜索引擎)已經(jīng)成為當前搜索引擎和Web信息挖掘中的一個研究熱點和難點。通用網(wǎng)絡(luò)爬蟲的目標就是盡可能多地采集信息頁面,而在這一過程中它并...
注意:該技術(shù)已申請專利,請尊重研發(fā)人員的辛勤研發(fā)付出,在未取得專利權(quán)人授權(quán)前,僅供技術(shù)研究參考不得用于商業(yè)用途。
該專利適合技術(shù)人員進行技術(shù)研發(fā)參考以及查看自身技術(shù)是否侵權(quán),增加技術(shù)思路,做技術(shù)知識儲備,不適合論文引用。
請注意,此類技術(shù)沒有源代碼,用于學習研究技術(shù)思路。