1.一種網(wǎng)站排名數(shù)據(jù)處理方法,其特征在于,包括:
利用搜索引擎對目標(biāo)關(guān)鍵詞進(jìn)行搜索,得到所述目標(biāo)關(guān)鍵詞的搜索信息,其中,所述搜索信息包含與所述目標(biāo)關(guān)鍵詞關(guān)聯(lián)的目標(biāo)網(wǎng)站;
根據(jù)所述搜索信息,確定策略選擇指令,其中,所述策略選擇指令為:第一爬取策略,用于爬取所述搜索信息中排名在所述目標(biāo)網(wǎng)站以前的數(shù)據(jù),或者,第二爬取策略,用于爬取所述搜索信息中包含有所述目標(biāo)網(wǎng)站的預(yù)設(shè)數(shù)量的數(shù)據(jù);
響應(yīng)于所述策略選擇指令,對所述搜索信息中所述策略選擇指令所指示的數(shù)據(jù)進(jìn)行爬取,以得到所述目標(biāo)關(guān)鍵詞的數(shù)據(jù)爬取結(jié)果;
根據(jù)所述數(shù)據(jù)爬取結(jié)果,確定與所述目標(biāo)關(guān)鍵詞關(guān)聯(lián)的目標(biāo)網(wǎng)站的排名。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,根據(jù)所述數(shù)據(jù)爬取結(jié)果,確定與所述目標(biāo)關(guān)鍵詞關(guān)聯(lián)的目標(biāo)網(wǎng)站的排名包括:
獲取所述目標(biāo)網(wǎng)站的統(tǒng)一資源定位符;
按照所述搜索信息中網(wǎng)站的排名先后順序,將所述目標(biāo)網(wǎng)站的統(tǒng)一資源定位符與所述搜索信息中網(wǎng)站的統(tǒng)一資源定位符進(jìn)行匹配,記錄匹配到的統(tǒng)一資源定位符的排名序號,作為所述目標(biāo)網(wǎng)站在搜索信息中的排名序號。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述策略選擇指令為所述第一爬取策略,對所述搜索信息中所述策略選擇指令所指示的數(shù)據(jù)進(jìn)行爬取,以得到所述目標(biāo)關(guān)鍵詞的數(shù)據(jù)爬取結(jié)果包括:
按照所述搜索信息中網(wǎng)站的排名先后順序依次爬取網(wǎng)頁數(shù)據(jù),直到所述目標(biāo)網(wǎng)站的統(tǒng)一資源定位符第一次匹配到所述搜索信息中網(wǎng)站的統(tǒng)一資源定位符。
4.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述策略選擇指令為所述第二爬取策略,
對所述搜索信息中所述策略選擇指令所指示的數(shù)據(jù)進(jìn)行爬取,以得到所述目標(biāo)關(guān)鍵詞的數(shù)據(jù)爬取結(jié)果包括:從所述搜索信息中爬取所述預(yù)設(shè)數(shù)量的數(shù)據(jù);
其中,按照所述搜索信息中網(wǎng)站的排名先后順序,將所述目標(biāo)網(wǎng)站的統(tǒng)一資源定位符與所述搜索信息中網(wǎng)站的統(tǒng)一資源定位符進(jìn)行匹配,記錄匹配到的統(tǒng)一資源定位符的排名序號包括:按照所述搜索信息中網(wǎng)站的排名先后順序,將所述 目標(biāo)網(wǎng)站的統(tǒng)一資源定位符與爬取的所述預(yù)設(shè)數(shù)量的數(shù)據(jù)中網(wǎng)站的統(tǒng)一資源定位符進(jìn)行匹配,記錄匹配到的統(tǒng)一資源定位符的排名序號。
5.根據(jù)權(quán)利要求2所述的方法,其特征在于,在記錄匹配到的統(tǒng)一資源定位符的排名序號,作為所述目標(biāo)網(wǎng)站在搜索信息中的排名序號之后,所述方法還包括:
將所述數(shù)據(jù)爬取結(jié)果以及所述目標(biāo)網(wǎng)站的排名序號輸出展示。
6.一種網(wǎng)站排名數(shù)據(jù)處理裝置,其特征在于,包括:
搜索單元,用于利用搜索引擎對目標(biāo)關(guān)鍵詞進(jìn)行搜索,得到所述目標(biāo)關(guān)鍵詞的搜索信息,其中,所述搜索信息包含與所述目標(biāo)關(guān)鍵詞關(guān)聯(lián)的目標(biāo)網(wǎng)站;
第一確定單元,用于根據(jù)所述搜索信息,確定策略選擇指令,其中,所述策略選擇指令為:第一爬取策略用于爬取所述搜索信息中排名在所述目標(biāo)網(wǎng)站以前的數(shù)據(jù),或者,第二爬取策略用于爬取所述搜索信息中包含有所述目標(biāo)網(wǎng)站的預(yù)設(shè)數(shù)量的數(shù)據(jù);
爬取單元,用于響應(yīng)于所述策略選擇指令,對所述搜索信息中所述策略選擇指令所指示的數(shù)據(jù)進(jìn)行爬取,以得到所述目標(biāo)關(guān)鍵詞的數(shù)據(jù)爬取結(jié)果;以及
第二確定單元,用于根據(jù)所述數(shù)據(jù)爬取結(jié)果,確定與所述目標(biāo)關(guān)鍵詞關(guān)聯(lián)的目標(biāo)網(wǎng)站的排名。
7.根據(jù)權(quán)利要求6所述的裝置,其特征在于,所述第二確定單元包括:
獲取模塊,用于獲取所述目標(biāo)網(wǎng)站的統(tǒng)一資源定位符;
匹配模塊,用于按照所述搜索信息中網(wǎng)站的排名先后順序,將所述目標(biāo)網(wǎng)站的統(tǒng)一資源定位符與所述搜索信息中網(wǎng)站的統(tǒng)一資源定位符進(jìn)行匹配,記錄匹配到的統(tǒng)一資源定位符的排名序號,作為所述目標(biāo)網(wǎng)站在搜索信息中的排名序號。
8.根據(jù)權(quán)利要求7所述的裝置,其特征在于,所述策略選擇指令為所述第一爬取策略,所述爬取單元包括:
第一爬取模塊,用于按照所述搜索信息中網(wǎng)站的排名先后順序依次爬取網(wǎng)頁數(shù)據(jù),直到所述目標(biāo)網(wǎng)站的統(tǒng)一資源定位符第一次匹配到所述搜索信息中網(wǎng)站的統(tǒng)一資源定位符。
9.根據(jù)權(quán)利要求7所述的裝置,其特征在于,當(dāng)所述策略選擇指令為所述第二爬取策略時,
所述爬取單元包括:第二爬取模塊,用于從所述搜索信息中爬取所述預(yù)設(shè)數(shù)量的數(shù)據(jù);
其中,所述匹配模塊包括:匹配子模塊,用于按照所述搜索信息中網(wǎng)站的排名先后順序,將所述目標(biāo)網(wǎng)站的統(tǒng)一資源定位符與爬取的所述預(yù)設(shè)數(shù)量的數(shù)據(jù)中網(wǎng)站的統(tǒng)一資源定位符進(jìn)行匹配,記錄匹配到的統(tǒng)一資源定位符的排名序號。
10.根據(jù)權(quán)利要求7所述的裝置,其特征在于,所述裝置還包括:
顯示單元,用于在記錄匹配到的統(tǒng)一資源定位符的排名序號,作為所述目標(biāo)網(wǎng)站在搜索信息中的排名序號之后,將所述數(shù)據(jù)爬取結(jié)果以及所述目標(biāo)網(wǎng)站的排名序號輸出展示。