一種資源地址的嗅探方法、裝置及系統(tǒng)的制作方法
【專利說明】
【技術領域】
[0001]本發(fā)明涉及互聯(lián)網(wǎng)應用技術領域,尤其涉及一種資源地址的嗅探方法、裝置及系統(tǒng)。
【【背景技術】】
[0002]隨著互聯(lián)網(wǎng)技術的發(fā)展,各種提供頁面資源的網(wǎng)站越來越多,用戶可以通過第三方網(wǎng)站進行各種頁面資源的瀏覽。然而,現(xiàn)有的提供頁面資源的網(wǎng)站中,頁面資源的資源地址一般是由JavaScript動態(tài)產(chǎn)生的,通過內(nèi)容提取系統(tǒng),對靜態(tài)頁面分析無法得到動態(tài)產(chǎn)生的頁面資源真實的資源地址,通常頁面資源真實的資源地址只有在加載網(wǎng)頁后通過客戶端向服務器發(fā)起請求時才能獲得。因此,目前客戶端只能在第三方網(wǎng)站的相關網(wǎng)頁中獲得頁面資源,如網(wǎng)頁中播放的視頻、展現(xiàn)圖片或者音頻等,然而,從網(wǎng)頁中獲得頁面資源時,頁面資源的加載效果比較差,例如,播放視頻資源時往往有插入廣告或者視頻無法全屏播放等問題。
[0003]為了解決這一問題,現(xiàn)有技術中,服務器通過不斷訪問提供第三方網(wǎng)站,來嗅探頁面資源的資源地址,并將該頁面資源的資源地址存儲在本地的數(shù)據(jù)庫中,這樣,客戶端就可以從服務器獲得頁面資源的資源地址。然而,由于服務器的IP地址比較固定,容易被提供頁面資源的第三方網(wǎng)站封鎖,從而導致頁面資源的資源地址的嗅探失敗。
【
【發(fā)明內(nèi)容】
】
[0004]有鑒于此,本發(fā)明實施例提供了一種資源地址的嗅探方法、裝置及系統(tǒng),用以解決頁面資源的資源地址的嗅探失敗的問題。
[0005]本發(fā)明實施例的一方面,提供一種資源地址的嗅探方法,包括:
[0006]網(wǎng)絡視圖接收客戶端發(fā)送的網(wǎng)頁的統(tǒng)一資源定位符URL ;
[0007]網(wǎng)絡視圖利用所述URL,獲取網(wǎng)頁數(shù)據(jù),以及從所述網(wǎng)頁數(shù)據(jù)中獲取所述網(wǎng)頁所包含的頁面資源的資源地址;
[0008]所述網(wǎng)絡視圖將所述頁面資源的資源地址發(fā)送給所述客戶端,以使得所述客戶端利用所述頁面資源的資源地址,加載所述頁面資源。
[0009]如上所述的方面和任一可能的實現(xiàn)方式,進一步提供一種實現(xiàn)方式,所述網(wǎng)絡視圖從所述網(wǎng)頁數(shù)據(jù)中獲取所述網(wǎng)頁所包含的頁面資源的資源地址,包括:
[0010]所述網(wǎng)絡視圖對所述網(wǎng)頁數(shù)據(jù)進行解析,以獲取所述網(wǎng)頁的超文本標記語言HTML文件;
[0011]所述網(wǎng)絡視圖根據(jù)所述HTML文件,判斷所述網(wǎng)頁是否包含所述頁面資源;
[0012]若所述網(wǎng)頁包含所述頁面資源,所述網(wǎng)絡視圖從所述網(wǎng)頁數(shù)據(jù)中獲取所述網(wǎng)頁所包含的頁面資源的資源地址。
[0013]如上所述的方面和任一可能的實現(xiàn)方式,進一步提供一種實現(xiàn)方式,所述網(wǎng)絡視圖根據(jù)所述HTML文件,判斷所述網(wǎng)頁是否包含所述頁面資源,包括:
[0014]所述網(wǎng)絡視圖確定所述頁面資源的標簽;
[0015]所述網(wǎng)絡視圖判斷所述HTML文件中是否包含所述頁面資源的標簽;
[0016]所述網(wǎng)絡視圖根據(jù)所述HTML文件中是否包含所述頁面資源的標簽,判斷所述網(wǎng)頁是否包含所述頁面資源。
[0017]如上所述的方面和任一可能的實現(xiàn)方式,進一步提供一種實現(xiàn)方式,所述網(wǎng)絡視圖利用所述URL,獲取網(wǎng)頁數(shù)據(jù),包括:
[0018]所述網(wǎng)絡視圖向提供所述網(wǎng)頁的服務器發(fā)送針對所述URL的數(shù)據(jù)獲取請求,以使得提供所述網(wǎng)頁的服務器根據(jù)所述URL,獲得所述網(wǎng)頁數(shù)據(jù);
[0019]所述網(wǎng)絡視圖接收提供所述網(wǎng)頁的服務器發(fā)送的所述網(wǎng)頁數(shù)據(jù)。
[0020]如上所述的方面和任一可能的實現(xiàn)方式,進一步提供一種實現(xiàn)方式,所述網(wǎng)絡視圖將所述頁面資源的資源地址提供給服務器,以使得所述服務器對應存儲所述URL和頁面資源的資源地址。
[0021]本發(fā)明實施例的一方面,提供一種資源地址的嗅探方法,包括:
[0022]客戶端向網(wǎng)絡視圖發(fā)送網(wǎng)頁的統(tǒng)一資源定位符URL,以使得所述網(wǎng)絡視圖利用所述URL,獲取網(wǎng)頁數(shù)據(jù),以及從所述網(wǎng)頁數(shù)據(jù)中獲取所述網(wǎng)頁所包含的頁面資源的資源地址;
[0023]所述客戶端接收所述網(wǎng)絡視圖發(fā)送的所述頁面資源的資源地址;
[0024]所述客戶端利用所述頁面資源的資源地址,加載所述頁面資源。
[0025]本發(fā)明實施例的一方面,提供一種資源地址的嗅探裝置,包括:
[0026]接收單元,用于接收客戶端發(fā)送的網(wǎng)頁的統(tǒng)一資源定位符URL ;
[0027]處理單元,用于利用所述URL,獲取網(wǎng)頁數(shù)據(jù),以及從所述網(wǎng)頁數(shù)據(jù)中獲取所述網(wǎng)頁所包含的頁面資源的資源地址;
[0028]輸出單元,用于將所述頁面資源的資源地址發(fā)送給所述客戶端,以使得所述客戶端利用所述頁面資源的資源地址,加載所述頁面資源。
[0029]如上所述的方面和任一可能的實現(xiàn)方式,進一步提供一種實現(xiàn)方式,所述處理單元,具體用于:
[0030]對所述網(wǎng)頁數(shù)據(jù)進行解析,以獲取所述網(wǎng)頁的超文本標記語言HTML文件;
[0031]根據(jù)所述HTML文件,判斷所述網(wǎng)頁是否包含所述頁面資源;
[0032]若所述網(wǎng)頁包含所述頁面資源,從所述網(wǎng)頁數(shù)據(jù)中獲取所述網(wǎng)頁所包含的頁面資源的資源地址。
[0033]如上所述的方面和任一可能的實現(xiàn)方式,進一步提供一種實現(xiàn)方式,所述處理單元用于根據(jù)所述HTML文件,判斷所述網(wǎng)頁是否包含所述頁面資源時,具體用于:
[0034]確定所述頁面資源的標簽;
[0035]判斷所述HTML文件中是否包含所述頁面資源的標簽;
[0036]根據(jù)所述HTML文件中是否包含所述頁面資源的標簽,判斷所述網(wǎng)頁是否包含所述頁面資源。
[0037]如上所述的方面和任一可能的實現(xiàn)方式,進一步提供一種實現(xiàn)方式,所述處理單元,具體用于:
[0038]向提供所述網(wǎng)頁的服務器發(fā)送針對所述URL的數(shù)據(jù)獲取請求,以使得提供所述網(wǎng)頁的服務器根據(jù)所述URL,獲得所述網(wǎng)頁數(shù)據(jù);
[0039]接收提供所述網(wǎng)頁的服務器發(fā)送的所述網(wǎng)頁數(shù)據(jù)。
[0040]如上所述的方面和任一可能的實現(xiàn)方式,進一步提供一種實現(xiàn)方式,所述輸出單元還用于:
[0041]將所述頁面資源的資源地址提供給服務器,以使得所述服務器對應存儲所述URL和頁面資源的資源地址。
[0042]本發(fā)明實施例的一方面,提供一種資源地址的嗅探裝置,包括:
[0043]輸出單元,用于向網(wǎng)絡視圖發(fā)送網(wǎng)頁的統(tǒng)一資源定位符URL,以使得所述網(wǎng)絡視圖利用所述URL,獲取網(wǎng)頁數(shù)據(jù),以及從所述網(wǎng)頁數(shù)據(jù)中獲取所述網(wǎng)頁所包含的頁面資源的資源地址;
[0044]接收單元,用于接收所述網(wǎng)絡視圖發(fā)送的所述頁面資源的資源地址;
[0045]處理單元,用于利用所述頁面資源的資源地址,加載所述頁面資源。
[0046]本發(fā)明實施例的一方面,提供一種資源地址的嗅探系統(tǒng),包括客戶端和網(wǎng)絡視圖;其中,
[0047]所述客戶端,用于向所述網(wǎng)絡視圖發(fā)送的網(wǎng)頁的統(tǒng)一資源定位符URL ;
[0048]所述網(wǎng)絡視圖,用于利用所述URL,獲取網(wǎng)頁數(shù)據(jù),以及從所述網(wǎng)頁數(shù)據(jù)中獲取所述網(wǎng)頁所包含的頁面資源的資源地址,以及,將所述頁面資源的資源地址發(fā)送給所述客戶端;
[0049]所述客戶端,還用于利用所述頁面資源的資源地址,加載所述頁面資源。
[0050]由以上技術方案可以看出,本發(fā)明實施例具有以下有益效果:
[0051]本發(fā)明實施例提供的技術方案中,由網(wǎng)絡視圖進行頁面資源的資源地址的嗅探操作,并將其提供給客戶端。由于網(wǎng)絡視圖不會被第三方網(wǎng)站封鎖,因此網(wǎng)絡視圖能夠成功嗅探到頁面資源的資源地址,從而解決現(xiàn)有技術中,服務器嗅探頁面資源的資源地址失敗的冋題。
【【附圖說明