本發(fā)明涉及信息處理技術領域,尤其涉及一種展示信息的探測方法及裝置、計算機可讀存儲介質、終端。
背景技術:
在需求方平臺廣告投放系統(tǒng)(demand-sideplatform,dsp)中投放展示信息,例如廣告、通知時,由于dsp是通過實時競價的方式從媒體服務平臺(sell-sideplatform,ssp)(也稱為媒體聯盟)獲得展示位進行展示的,所以在成功獲得下一次展示位時,dsp需要探測和了解該ssp(或者網頁)該次展示的其他展示位的展示效果情況。上述數據可以用于分析各ssp的展示位質量和其他dsp的投放效果及投放策略,并據此調整投放策略,實現展示信息展示的效果最優(yōu)化。
現有技術中,為了獲取其他展示位的展示效果信息,通常使用爬蟲去訪問ssp,然后爬取相關展示位的信息。另一種方式是dsp訪問父頁面的文檔對象模型(documentobjectmodel,dom)元素去尋找其他展示位的iframe元素,然后再去訪問iframe元素嵌套網頁中的dom元素來獲取信息。例如,通過展示信息1的iframe1所嵌套的網頁找到父頁面parent,然后找到父頁面parent的子頁面中的展示信息2的iframe2,訪問iframe2所嵌套的網頁來獲取信息。
但是,通過爬蟲的方式獲取信息并不完善。因為爬蟲是機器行為,其他dsp可以在競價時通過技術手段過濾掉爬蟲的流量,所以通過爬蟲獲取信息失??;并且由于爬蟲的資源問題(例如ip資源和cookie資源),其獲得的信息錯誤率很高。通過iframe方式獲取信息時,由于ssp給予dsp渲染展示信息的方式被限制在安全沙箱內(也即iframe),而在跨域情況下是不允許dom元素的互相訪問的,因此無法探測和評估其他展示位的展示效果。
技術實現要素:
本發(fā)明解決的技術問題是如何實現展示信息的探測,以用于展示信息的展示效果評估。
為解決上述技術問題,本發(fā)明實施例提供一種展示信息的探測方法,展示信息的探測方法包括:在呈現待展示信息的第一嵌套網頁所在的頂層頁面中,確定嵌套網頁集合,所述嵌套網頁集合包括嵌套在所述頂層頁面中的所有嵌套網頁的窗口;通過所述第一嵌套網頁依次訪問所述嵌套網頁集合中的嵌套網頁的窗口;如果訪問成功,則判斷所述嵌套網頁呈現的信息是否是與所述待展示信息同類型的展示信息;如果判定為展示信息,則獲取所述嵌套網頁的至少一種統(tǒng)計數據。
可選的,所述判斷所述嵌套網頁呈現的信息是否是與所述待展示信息同類型的展示信息包括:獲取所述嵌套網頁的url地址;如果所述嵌套網頁的url地址包括設定字段,則確定所述嵌套網頁呈現的信息為展示信息。
可選的,所述至少一種統(tǒng)計數據選自:所述嵌套網頁的尺寸、所述嵌套網頁的素材數據、所述嵌套網頁的來源數據、所述嵌套網頁的點擊數據、所述嵌套網頁的可見數據。
可選的,所述嵌套網頁的窗口為所述嵌套網頁的window對象。
可選的,所述獲取所述嵌套網頁的至少一種統(tǒng)計數據包括:根據所述嵌套網頁的window對象的屬性信息確定所述嵌套網頁尺寸。
可選的,所述獲取所述嵌套網頁的至少一種統(tǒng)計數據包括:獲取所述嵌套網頁的window對象的html內容;通過以下一種或多種方式獲取所述素材數據:將所述html內容進行渲染,以得到所述嵌套網頁的素材數據;
獲取所述html內容中圖片的url地址或視頻文件的url地址,以作為所述嵌套網頁的素材數據。
可選的,所述獲取所述嵌套網頁的至少一種統(tǒng)計數據包括:獲取所述嵌套網頁的window對象的html內容;獲取所述html內容中的目標url地址;訪問所述目標url地址,并獲取目標頁域名;從所述目標頁域名提取得到所述嵌套網頁的來源數據;將所述html內容進行渲染,以得到渲染結果;訪問所述渲染結果,并獲取目標頁域名;從所述目標頁域名提取得到所述嵌套網頁的來源數據;
可選的,所述獲取所述嵌套網頁的至少一種統(tǒng)計數據包括:基于所述嵌套網頁的window對象綁定的點擊事件,確定所述嵌套網頁的點擊數據;或者,在設定時間間隔內,如果文件激活元素變更為內層iframe元素,則點擊數加一,并確定最終點擊數為所述嵌套網頁的點擊數據。
可選的,所述獲取所述嵌套網頁的至少一種統(tǒng)計數據包括:如果所述嵌套網頁的至少一部分處于可見區(qū)域,則可見數加一,并確定最終可見數作為所述嵌套網頁的可見數據,其中,所述可見區(qū)域處于呈現所述嵌套網頁的屏幕范圍內。
本發(fā)明實施例還公開了一種展示信息的探測裝置,展示信息的探測裝置包括:嵌套網頁集合確定模塊,適于在呈現待展示信息的第一嵌套網頁所在的頂層頁面中,確定嵌套網頁集合,所述嵌套網頁集合包括嵌套在所述頂層頁面中的所有嵌套網頁的窗口;訪問模塊,適于通過所述第一嵌套網頁依次訪問所述嵌套網頁集合中的嵌套網頁的窗口;判斷模塊,適于如果訪問成功,則判斷所述嵌套網頁呈現的信息是否是與所述待展示信息同類型的展示信息;獲取模塊,適于如果判定為展示信息,則獲取所述嵌套網頁的至少一種統(tǒng)計數據。
可選的,所述判斷模塊包括:url地址獲取單元,適于獲取所述嵌套網頁的url地址;判定單元,適于如果所述嵌套網頁的url地址包括設定字段,則確定所述嵌套網頁呈現的信息為展示信息。
可選的,所述至少一種統(tǒng)計數據選自:所述嵌套網頁的尺寸、所述嵌套網頁的素材數據、所述嵌套網頁的來源數據、所述嵌套網頁的點擊數據、所述嵌套網頁的可見數據。
可選的,所述嵌套網頁的窗口為嵌套網頁的window對象。
可選的,所述獲取模塊包括:尺寸確定單元,適于根據所述嵌套網頁的window對象的屬性信息確定所述嵌套網頁尺寸。根據權利要求15所述的展示信息的探測裝置,其特征在于,所述獲取模塊包括:第一html內容獲取單元,適于獲取所述嵌套網頁的window對象的html內容;第一渲染單元,適于將所述html內容進行渲染,以得到所述嵌套網頁的素材數據;地址獲取單元,適于獲取所述html內容中圖片的url地址或視頻文件的url地址,以作為所述嵌套網頁的素材數據。
可選的,所述獲取模塊包括:第二html內容獲取單元,適于獲取所述嵌套網頁的window對象的html內容;目標url地址獲取單元,適于獲取所述html內容中的目標url地址;訪問單元,適于訪問所述目標url地址,并獲取目標頁域名;第一提取單元,適于從所述目標頁域名提取得到所述嵌套網頁的來源數據;第二渲染單元,適于將所述html內容進行渲染,以得到渲染結果;目標域名獲取單元,適于訪問所述渲染結果,并獲取目標頁域名;第二提取單元,適于從所述目標頁域名提取得到所述嵌套網頁的來源數據。
可選的,所述獲取模塊包括:第一點擊數據確定單元,適于基于所述嵌套網頁的window對象綁定的點擊事件,確定所述嵌套網頁的點擊數據;第二點擊數據確定單元,適于在設定時間間隔內,如果文件激活元素變更為內層iframe元素,則點擊數加一,并確定最終點擊數為所述嵌套網頁的點擊數據。
可選的,所述獲取模塊包括:可見數據確定單元,適于如果所述嵌套網頁的至少一部分處于可見區(qū)域,則可見數加一,并確定最終可見數作為所述嵌套網頁的可見數據,其中,所述可見區(qū)域處于呈現所述嵌套網頁的屏幕范圍內。
本發(fā)明實施例還公開了一種計算機可讀存儲介質,其上存儲有計算機指令,所述計算機指令運行時執(zhí)行所述展示信息的探測方法的步驟。
本發(fā)明實施例還公開了一種終端,包括存儲器和處理器,所述存儲器上存儲有可在所述處理器上運行的計算機指令,所述處理器運行所述計算機指令時執(zhí)行所述展示信息的探測方法的步驟。
與現有技術相比,本發(fā)明實施例的技術方案具有以下有益效果:
本發(fā)明技術方案在呈現待展示信息的第一嵌套網頁所在的頂層頁面中,確定嵌套網頁集合,所述嵌套網頁集合包括嵌套在所述頂層頁面中的所有嵌套網頁的窗口;通過所述第一嵌套網頁依次訪問所述嵌套網頁集合中的嵌套網頁的窗口;如果訪問成功,則判斷所述嵌套網頁呈現的信息是否是與所述待展示信息同類型的展示信息;如果判定為展示信息,則獲取所述嵌套網頁的至少一種統(tǒng)計數據。本發(fā)明技術方案通過第一嵌套網頁所在的頂層頁面確定嵌套網頁集合,然后通過所述第一嵌套網頁依次訪問所述嵌套網頁集合中的嵌套網頁的窗口,如果訪問成功,表示第一嵌套網頁與被訪問的嵌套網頁是同域,則在判定被訪問的嵌套網頁呈現的信息是與所述待展示信息同類型的展示信息時,獲取所述嵌套網頁的至少一種統(tǒng)計數據,以用于展示效果評估。相對于現有技術,本發(fā)明技術方案避免采用訪問iframe的方式,可以減小被拒絕訪問的風險,從而可以保證獲取統(tǒng)計數據,實現展示信息的探測,提高展示信息的探測效率。
進一步,所述至少一種統(tǒng)計數據選自:所述嵌套網頁的尺寸、所述嵌套網頁的素材數據、所述嵌套網頁的來源數據、所述嵌套網頁的點擊數據、所述嵌套網頁的可見數據。本發(fā)明技術方案通過采用多種類型的統(tǒng)計數據,可以從多個維度對嵌套網頁所呈現的展示信息的展示效果進行評估,可以進一步提高展示信息的探測效率。
附圖說明
圖1是本發(fā)明實施例一種展示信息的探測方法的流程圖;
圖2是本發(fā)明實施例一種展示信息的探測裝置的結構示意圖。
具體實施方式
如背景技術中所述,通過爬蟲的方式獲取信息并不完善。因為爬蟲是機器行為,其他dsp可以在競價時通過技術手段過濾掉爬蟲的流量,所以通過爬蟲獲取信息失敗;并且由于爬蟲的資源問題(例如ip資源和cookie資源),其獲得的信息錯誤率很高。通過框架(iframe)方式獲取信息時,由于ssp給予dsp渲染展示信息的方式被限制在安全沙箱內(也即iframe),而在跨域情況下是不允許dom元素的互相訪問的,因此無法探測和評估其他展示位的展示效果。
本申請發(fā)明人經過分析確定,由于同域的網頁(包括嵌套網頁與嵌套網頁、父網頁與子網頁)之間可以互相訪問,因此可以通過確定所有嵌套網頁,并嘗試訪問,然后收集各個不同維度的展示位信息,以用以評估其他展示位的投放效果。
本發(fā)明技術方案通過第一嵌套網頁所在的頂層頁面確定嵌套網頁集合,然后通過所述第一嵌套網頁依次訪問所述嵌套網頁集合中的嵌套網頁的窗口,如果訪問成功,表示第一嵌套網頁與被訪問的嵌套網頁是同域,則在判定被訪問的嵌套網頁呈現的信息是與所述待展示信息同類型的展示信息時,獲取所述嵌套網頁的至少一種統(tǒng)計數據,以用于展示效果評估。相對于現有技術,本發(fā)明技術方案避免采用訪問iframe的方式,可以減小被拒絕訪問的風險,從而可以保證獲取統(tǒng)計數據,實現展示信息的探測,提高展示信息的探測效率。
為使本發(fā)明的上述目的、特征和優(yōu)點能夠更為明顯易懂,下面結合附圖對本發(fā)明的具體實施例做詳細的說明。
圖1是本發(fā)明實施例一種展示信息的探測方法的流程圖。
圖1所示的展示信息的探測方法可以包括以下步驟:
步驟s101:在呈現待展示信息的第一嵌套網頁所在的頂層頁面中,確定嵌套網頁集合,所述嵌套網頁集合包括嵌套在所述頂層頁面中的所有嵌套網頁的窗口;
步驟s102:通過所述第一嵌套網頁依次訪問所述嵌套網頁集合中的嵌套網頁的窗口;
步驟s103:如果訪問成功,則判斷所述嵌套網頁呈現的信息是否是與所述待展示信息同類型的展示信息;
步驟s104:如果判定為展示信息,則獲取所述嵌套網頁的至少一種統(tǒng)計數據。
具體實施中,在步驟s101中,呈現待展示信息的第一嵌套網頁所在的頂層頁面中,確定嵌套網頁集合。嵌套網頁是指嵌套在另一網頁中的網頁。具體而言,網頁可以具有多層嵌套關系,第一嵌套網頁的父頁面也可能是嵌套網頁。頂層頁面則是指不具有父網頁的頁面,也即不是嵌套網頁的頁面。本實施例通過頂層頁面,可以確定頂層頁面所嵌套的所有嵌套網頁。每一網頁對應一個網頁窗口,則通過頂層頁面可以確定嵌套在所述頂層頁面中的所有嵌套網頁的窗口,也即嵌套網頁集合。之所以確定嵌套網頁集合,是因為通過嵌套網頁的窗口可以獲取該嵌套網頁的信息。
具體實施中,在步驟s102中,通過所述第一嵌套網頁依次訪問所述嵌套網頁集合中的嵌套網頁的窗口。具體而言,由于跨域訪問的限制,第一嵌套網頁僅能訪問與其同域的網頁。如果訪問失敗,則表示被訪問的嵌套網頁與第一嵌套網頁不同域。更具體地,如果訪問報錯,則表示訪問失敗;如果沒有報錯,則表示訪問成功。
需要說明的是,本實施例中通過第一嵌套網頁依次訪問所述嵌套網頁集合中的嵌套網頁的窗口是指,通過第一嵌套網頁獲取嵌套網頁的信息。
具體實施中,在步驟s103中,如果訪問成功,則需要判斷所述嵌套網頁呈現的信息是否是與所述待展示信息同類型的展示信息。也就是說,只有在嵌套網頁呈現的信息是與所述待展示信息同類型的展示信息時,獲取嵌套網頁的統(tǒng)計數據才能用于評估展示效果,否則,獲取到的統(tǒng)計數據是無效的。故為了提高探測效率,避免獲取無效數據,在步驟s103中對嵌套網頁呈現的信息的類型進行判斷。
例如,待展示信息的類型是廣告,如果嵌套網頁呈現的信息也是廣告,則獲取嵌套網頁的統(tǒng)計數據可以用于評估廣告的投放效果;如果嵌套網頁呈現的信息是通知,則獲取嵌套網頁的統(tǒng)計數據是無效的。
具體實施中,在步驟s104中,如果判定嵌套網頁呈現的信息為展示信息,則獲取所述嵌套網頁的至少一種統(tǒng)計數據。換言之,在步驟s103的判定結果表明嵌套網頁呈現的信息是與所述待展示信息同類型的展示信息時,則獲取所述嵌套網頁的至少一種統(tǒng)計數據,以用于對嵌套網頁(也即展示位)的投放效果進行評估。
本實施例中,待展示信息呈現在第一嵌套網頁(也即展示位)中,為了評估第一嵌套網頁的展示效果,可以對與第一嵌套網頁同域的網頁的展示效果進行評估,以便根據展示效果調整投放策略,使得下一次第一嵌套網頁呈現的展示信息可以有更好的展示效果。
本發(fā)明實施例避免采用訪問iframe的方式,可以減小被拒絕訪問的風險,從而可以保證獲取統(tǒng)計數據,提高展示信息的探測效率。
優(yōu)選地,步驟s103可以包括以下步驟:獲取所述嵌套網頁的url地址;如果所述嵌套網頁的url地址包括設定字段,則確定所述嵌套網頁呈現的信息為展示信息。具體而言,如果通過所述第一嵌套網頁訪問嵌套網頁的窗口成功,則表示可以獲取被訪問的嵌套網頁的信息;則為了判斷嵌套網頁呈現的信息是否是與所述待展示信息同類型的展示信息,可以獲取所述嵌套網頁的url地址。如果所述嵌套網頁的url地址包括設定字段,則確定所述嵌套網頁呈現的信息為展示信息,否則,所述嵌套網頁呈現的信息不是展示信息。
本領域技術人員可以理解的是,所述設定字段可以根據不同的應用環(huán)境以及不同的嵌套網頁進行配置。例如,在百度ssp中,嵌套網頁的url地址中包括設定字段baidu_ssp_define;在淘寶ssp中,嵌套網頁的url地址包括alicdn.com或taobaocdn.com。
可以理解的是,在判斷嵌套網頁呈現的信息是否是與所述待展示信息同類型的展示信息時,還可以結合其他方式:獲取所述嵌套網頁的url地址和超級文本標記語言(hypertextmarkuplanguage,html)內容;如果所述嵌套網頁的url地址包括設定字段,且html內容包括設定信息,則確定所述嵌套網頁呈現的信息為展示信息。例如,在googlessp中,嵌套網頁的url地址包括doubleclick.net或googlesyndication.com/safeframe,且嵌套網頁的html代碼中包括doubleclick.net/pagead/adview或“google提供的廣告”。
優(yōu)選地,所述嵌套網頁的窗口為所述嵌套網頁的window對象。具體而言,嵌套網頁在瀏覽器中顯示時,瀏覽器可以為嵌套網頁創(chuàng)建對應的window對象。通過window對象的屬性信息,可以獲取嵌套網頁的信息。例如,通過屬性信息window.location可以獲取嵌套網頁的url地址。
本領域技術人員應當理解的是,window對象具備屬性信息,屬性信息可以用以表征window對象的特性。例如,屬性信息innerheight可以表示窗口的文檔顯示區(qū)的高度;屬性信息innerwidth可以表示窗口的文檔顯示區(qū)的寬度;屬性信息length可以表示窗口中的框架數量等,此處不再贅述。
優(yōu)選地,所述至少一種統(tǒng)計數據選自:所述嵌套網頁的尺寸、所述嵌套網頁的素材數據、所述嵌套網頁的來源數據、所述嵌套網頁的點擊數據、所述嵌套網頁的可見數據。本發(fā)明實施例通過采用多種類型的統(tǒng)計數據,可以從多個維度對嵌套網頁所呈現的展示信息的展示效果進行評估,可以進一步提高展示信息的探測效率。
優(yōu)選地,步驟s104可以包括以下步驟:根據所述嵌套網頁的window對象的屬性信息確定所述嵌套網頁尺寸。具體而言,可以通過嵌套網頁的window對象的屬性信息window.document(也即document對象)來獲取嵌套網頁尺寸。嵌套網頁尺寸可以包括嵌套網頁的寬度和高度。更具體地,可以通過以下屬性信息的至少一種獲取到嵌套網頁的寬度和高度:innerwidth、document.body.offsetwidth、document.documentelement.clientwidth、innerheight、document.body.offsetheight、document.documentelement.clientheight。
優(yōu)選地,步驟s104可以包括以下步驟:獲取所述嵌套網頁的window對象的html內容;將所述html內容進行渲染,以得到所述嵌套網頁的素材數據。嵌套網頁的素材數據可以是指構成嵌套網頁所呈現的信息的素材。具體而言,可以通過嵌套網頁的window對象的屬性信息獲取html內容,對html內容進行渲染后,可以得到直觀顯示的數據,從而可以作為嵌套網頁的素材數據,以用于投放效果的評估。更具體地,可以使用無頭瀏覽器(headlessbrowser)對html內容批量進行渲染,然后進行截圖保存。本實施例可以獲取用于html5素材數據和iframe嵌套的素材數據。
優(yōu)選地,步驟s104可以包括以下步驟:獲取所述嵌套網頁的window對象的html內容;獲取所述html內容中圖片的url地址或視頻文件的url地址,以作為所述嵌套網頁的素材數據。具體而言,可以通過html內容分析其中的圖片和閃客(flash)文件的url地址,將url地址進行保存匯總。本實施例可以獲取圖片素材數據和flash素材數據。
優(yōu)選地,步驟s104可以包括以下步驟:獲取所述嵌套網頁的window對象的html內容;獲取所述html內容中的目標url地址;訪問所述目標url地址,并獲取目標頁域名;從所述目標頁域名提取得到所述嵌套網頁的來源數據。具體而言,可以通過html內容,分析其中所有a元素的href屬性,a元素的href屬性通常用于指定超鏈接目標的url地址,通過訪問href屬性中的url地址,得到最終的目標頁域名,通過域名可以獲取到嵌套網頁的來源數據。例如,a元素的href屬性為<ahref=”http://baidu.com”>,其中http://baidu.com表示目標url地址,訪問該url地址后,可以提取到廣告主信息。本實施例可以適用于帶有a元素的嵌套網頁的來源數據的獲取。
優(yōu)選地,步驟s104可以包括以下步驟:獲取所述嵌套網頁的window對象的html內容;將所述html內容進行渲染,以得到渲染結果;訪問所述渲染結果,并獲取目標頁域名;從所述目標頁域名提取得到所述嵌套網頁的來源數據。具體而言,通過對html內容進行渲染,訪問渲染結果后,可以跳轉到目標頁,從目標頁域名可以提取得到所述嵌套網頁的來源數據。更具體地,可以使用無頭瀏覽器將html內容批量進行渲染,然后進行點擊訪問。本實施例可以適用于不帶有a元素的嵌套網頁的來源數據的獲取。
優(yōu)選地,步驟s104可以包括以下步驟:基于所述嵌套網頁的window對象綁定的點擊事件,確定所述嵌套網頁的點擊數據;或者,在設定時間間隔內,如果文件激活元素變更為內層iframe元素,則點擊數加一,并確定最終點擊數為所述嵌套網頁的點擊數據。具體而言,點擊數據可以用于評估點擊效果??梢酝ㄟ^嵌套網頁的window對象綁定的點擊事件(clickevent)來獲取到相關點擊動作,如果點擊事件被觸發(fā),則判斷為點擊,從而獲取點擊數據。
但是,由于嵌套網頁的渲染普遍會再運用一層iframe來嵌套(dspiframe),并且此iframe與第一嵌套網頁是跨域的,所以無法使用點擊事件的方式來獲取點擊數據。這種情況下,可以通過嵌套網頁的文件激活元素(document.activeelement)來判斷該嵌套網頁是否被點擊。當點擊嵌套網頁時,文件激活元素會變更為內層iframe元素。更具體地,可以通過在設定時間間隔內,例如200毫秒內,判斷文件激活元素是否變更為內層iframe,如果為內層iframe則表示嵌套網頁被點擊,點擊數加一。
需要說明的是,設定時間間隔的時間長度可以根據實際的應用環(huán)境進行適應性的修改和配置,例如100毫秒或300毫秒,本發(fā)明實施例對此不做限制。
優(yōu)選地,步驟s104可以包括以下步驟:如果所述嵌套網頁的至少一部分處于可見區(qū)域,則可見數加一,并確定最終可見數作為所述嵌套網頁的可見數據,其中,所述可見區(qū)域處于呈現所述嵌套網頁的屏幕范圍內。具體而言,嵌套網頁的可見數據表示嵌套網頁是否處于用戶可見的區(qū)域,嵌套網頁的可見數據是評估嵌套網頁的展示效果的重要指標之一。
具體實施中,嵌套網頁可以被投放在終端設備上進行展示,終端設備可以具備中央處理器(centralprocessingunit,cpu)。而cpu在處理動畫時可以對動畫進行動畫渲染操作,且動畫渲染操作在動畫處于可見區(qū)域和不可見區(qū)域時,所消耗的cpu的處理空間不同,導致動畫播放的時頻不同。故利用動畫渲染在可見區(qū)域和不可見區(qū)域執(zhí)行時所消耗的cpu的處理空間不同,導致動畫播放的時頻不同的特性,通過在嵌套網頁所處區(qū)域中創(chuàng)建至少一個動畫,檢測每一動畫兩個播放動作之間的時間間隔,并與設定時間進行比較,確定展示信息是否處于可見區(qū)域。
圖2是本發(fā)明實施例一種展示信息的探測裝置的結構示意圖。
圖2所示的展示信息的探測裝置20可以包括嵌套網頁集合確定模塊201、訪問模塊202、判斷模塊203和獲取模塊204。
其中,嵌套網頁集合確定模塊201適于在呈現待展示信息的第一嵌套網頁所在的頂層頁面中,確定嵌套網頁集合,所述嵌套網頁集合包括嵌套在所述頂層頁面中的所有嵌套網頁的窗口;訪問模塊202適于通過所述第一嵌套網頁依次訪問所述嵌套網頁集合中的嵌套網頁的窗口;判斷模塊203適于如果訪問成功,則判斷所述嵌套網頁呈現的信息是否是與所述待展示信息同類型的展示信息;獲取模塊204適于如果判定為展示信息,則獲取所述嵌套網頁的至少一種統(tǒng)計數據。
相對于現有技術,本發(fā)明實施例避免采用訪問iframe的方式,可以減小被拒絕訪問的風險,從而可以保證獲取統(tǒng)計數據,提高展示信息的探測效率。
優(yōu)選地,判斷模塊203可以包括url地址獲取單元2031和判定單元2032。url地址獲取單元2031適于獲取所述嵌套網頁的url地址;判定單元2032適于如果所述嵌套網頁的url地址包括設定字段,則確定所述嵌套網頁呈現的信息為展示信息。
優(yōu)選地,所述至少一種統(tǒng)計數據選自:所述嵌套網頁的尺寸、所述嵌套網頁的素材數據、所述嵌套網頁的來源數據、所述嵌套網頁的點擊數據、所述嵌套網頁的可見數據。本發(fā)明實施例通過采用多種類型的統(tǒng)計數據,可以從多個維度對嵌套網頁所呈現的展示信息的展示效果進行評估,可以進一步提高展示信息的探測效率。
優(yōu)選地,所述嵌套網頁的窗口為嵌套網頁的window對象。
優(yōu)選地,獲取模塊204可以包括尺寸確定單元2041,尺寸確定單元2041適于根據所述嵌套網頁的window對象的屬性信息確定所述嵌套網頁尺寸。
優(yōu)選地,獲取模塊204可以包括第一html內容獲取單元2042和第一渲染單元2043,第一html內容獲取單元適于獲取所述嵌套網頁的window對象的html內容;第一渲染單元2043適于將所述html內容進行渲染,以得到所述嵌套網頁的素材數據。
優(yōu)選地,獲取模塊204還可以包括地址獲取單元2044,地址獲取單元2044適于獲取所述html內容中圖片的url地址或視頻文件的url地址,以作為所述嵌套網頁的素材數據。
優(yōu)選地,獲取模塊204可以包括第二html內容獲取單元2045、目標url地址獲取單元2046、訪問單元2047和第一提取單元2048。第二html內容獲取單元2045適于獲取所述嵌套網頁的window對象的html內容;目標url地址獲取單元2046適于獲取所述html內容中的目標url地址;訪問單元2047適于訪問所述目標url地址,并獲取目標頁域名;第一提取單元2048適于從所述目標頁域名提取得到所述嵌套網頁的來源數據。
優(yōu)選地,獲取模塊204可以包括第二渲染單元2049、目標域名獲取單元2050、第二提取單元2051。第二渲染單元2049適于將所述html內容進行渲染,以得到渲染結果;目標域名獲取單元2050適于訪問所述渲染結果,并獲取目標頁域名;第二提取單元2051適于從所述目標頁域名提取得到所述嵌套網頁的來源數據。
優(yōu)選地,獲取模塊204可以包括第一點擊數據確定單元2052和第二點擊數據確定單元2053。第一點擊數據確定單元2052適于基于所述嵌套網頁的window對象綁定的點擊事件,確定所述嵌套網頁的點擊數據;第二點擊數據確定單元2053適于在設定時間間隔內,如果文件激活元素變更為內層iframe元素,則點擊數加一,并確定最終點擊數為所述嵌套網頁的點擊數據。
優(yōu)選地,獲取模塊204可以包括可見數據確定單元2054,見數據確定單元2054適于如果所述嵌套網頁的至少一部分處于可見區(qū)域,則可見數加一,并確定最終可見數作為所述嵌套網頁的可見數據,其中,所述可見區(qū)域處于呈現所述嵌套網頁的屏幕范圍內。
關于所述展示信息的探測裝置20的工作原理、工作方式的更多內容,可以參照圖1中的相關描述,這里不再贅述。
本發(fā)明實施例還公開了一種可讀存儲介質,其上存儲有計算機指令,所述計算機指令運行時可以執(zhí)行圖1中所示的展示信息的探測方法的步驟。所述存儲介質可以包括rom、ram、磁盤或光盤等。
本發(fā)明實施例還公開了一種用戶設備,所述用戶設備可以包括存儲器和處理器,所述存儲器上存儲有可在所述處理器上運行的計算機指令。所述處理器運行所述計算機指令時可以執(zhí)行圖1中所示的展示信息的探測方法的步驟。所述用戶設備包括但不限于手機、計算機、平板電腦等終端設備。
雖然本發(fā)明披露如上,但本發(fā)明并非限定于此。任何本領域技術人員,在不脫離本發(fā)明的精神和范圍內,均可作各種更動與修改,因此本發(fā)明的保護范圍應當以權利要求所限定的范圍為準。