国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      網站分析方法及裝置與流程

      文檔序號:12596271閱讀:240來源:國知局
      網站分析方法及裝置與流程

      本申請涉及網站分析領域,具體而言,涉及一種網站分析方法及裝置。



      背景技術:

      目前,越來越多網站熱衷于進行網站訪客行為的研究,即網站分析。在進行網站分析時,往往需在客戶網站上部署第三方腳本,這些腳本記錄用戶的綜合瀏覽量(Page View)等行為,然后將這些信息發(fā)送到后端,形成IIS(Internet Information Services,互聯(lián)網信息服務)日志,并供其它程序對IIS日志進行解析、存儲。Page View等行為中常包含客戶網站ID、著陸頁URL等信息。由于一些原因,部分著陸頁URL丟失了其域名,即得到的IIS日志中有部分著陸頁URL為相對路徑,然后用戶希望看到的是絕對路徑。

      針對相關技術中在進行網站分析時由于著陸頁URL丟失了域名,導致不能在IIS日志中獲取到丟失了域名的著陸頁URL的絕對路徑的問題,目前尚未提出有效的解決方案。



      技術實現要素:

      本申請的主要目的在于提供一種網站分析方法及裝置,以解決相關技術中在進行網站分析時由于著陸頁URL丟失了域名,導致不能在IIS日志中獲取到丟失了域名的著陸頁URL的絕對路徑的問題。

      為了實現上述目的,根據本申請的一個方面,提供了一種網站分析方法。該方法包括:獲取目標綜合瀏覽量,其中,目標綜合瀏覽量中記錄有目標網站ID和目標網站ID對應的著陸頁URL;判斷目標網站ID對應的著陸頁URL是否為絕對路徑;如果目標網站ID對應的著陸頁URL不是絕對路徑,從預設數據庫中查找目標網站ID對應的域名;以及將目標網站ID對應的域名與目標網站ID對應的著陸頁URL進行拼接,得到目標URL。

      進一步地,在獲取目標綜合瀏覽量之前,該方法還包括:在目標網站上布署預設腳本代碼,其中,預設腳本代碼用于采集目標網站的綜合瀏覽量;通過目標網站上預設腳本代碼采集目標網站的綜合瀏覽量;以及將采集到的目標網站的綜合瀏覽量作為目標綜合瀏覽量。

      進一步地,在將目標網站ID對應的域名與目標網站ID對應的著陸頁URL進行拼接,得到目標URL之后,該方法還包括:將目標URL發(fā)送至目標地址;在目標地址上根據目標URL生成目標IIS日志;以及在目標IIS日志中獲取目標URL的絕對路徑。

      進一步地,在從預設數據庫中查找目標網站ID對應的域名之前,該方法還包括:獲取目標時間段內的網站歷史數據;從網站歷史數據中分別統(tǒng)計每個目標網站ID和每個目標網站ID對應的域名,得到網站數據集合;以及將網站數據集合存儲至預設數據庫。

      進一步地,在判斷目標網站ID對應的著陸頁URL是否為絕對路徑之后,該方法還包括:如果目標網站ID對應的著陸頁URL是絕對路徑,獲取目標網站ID對應的著陸頁URL中的域名;以及將目標網站ID對應的著陸頁URL中的域名存儲至預設數據庫,以更新預設數據庫中目標網站ID對應的域名。

      為了實現上述目的,根據本申請的另一方面,提供了一種網站分析裝置。該裝置包括:第一獲取單元,用于獲取目標綜合瀏覽量,其中,目標綜合瀏覽量中記錄有目標網站ID和目標網站ID對應的著陸頁URL;判斷單元,用于判斷目標網站ID對應的著陸頁URL是否為絕對路徑;查找單元,用于在目標網站ID對應的著陸頁URL不是絕對路徑的情況下,從預設數據庫中查找目標網站ID對應的域名;以及第二獲取單元,用于將目標網站ID對應的域名與目標網站ID對應的著陸頁URL進行拼接,得到目標URL。

      進一步地,該裝置還包括:布署單元,用于在目標網站上布署預設腳本代碼,其中,預設腳本代碼用于采集目標網站的綜合瀏覽量;采集單元,用于通過目標網站上預設腳本代碼采集目標網站的綜合瀏覽量;以及確定單元,用于將采集到的目標網站的綜合瀏覽量作為目標綜合瀏覽量。

      進一步地,該裝置還包括:發(fā)送單元,用于將目標URL發(fā)送至目標地址;生成單元,用于在目標地址上根據目標URL生成目標IIS日志;以及第三獲取單元,用于在目標IIS日志中獲取目標URL的絕對路徑。

      進一步地,該裝置還包括:第四獲取單元,用于獲取目標時間段內的網站歷史數據;統(tǒng)計單元,用于從網站歷史數據中分別統(tǒng)計每個目標網站ID和每個目標網站ID對應的域名,得到網站數據集合;以及存儲單元,用于將網站數據集合存儲至預設數據庫。

      進一步地,該裝置還包括:第五獲取單元,用于在目標網站ID對應的著陸頁URL是絕對路徑的情況下,獲取目標網站ID對應的著陸頁URL中的域名;以及更新單元, 用于將目標網站ID對應的著陸頁URL中的域名存儲至預設數據庫,以更新預設數據庫中目標網站ID對應的域名。

      通過本申請,采用以下步驟:獲取目標綜合瀏覽量,其中,目標綜合瀏覽量中記錄有目標網站ID和目標網站ID對應的著陸頁URL;判斷目標網站ID對應的著陸頁URL是否為絕對路徑;如果目標網站ID對應的著陸頁URL不是絕對路徑,從預設數據庫中查找目標網站ID對應的域名;以及將目標網站ID對應的域名與目標網站ID對應的著陸頁URL進行拼接,得到目標URL,解決了相關技術中在進行網站分析時由于著陸頁URL丟失了域名,導致不能在IIS日志中獲取到丟失了域名的著陸頁URL的絕對路徑的問題,根據目標網站ID對應的域名與目標網站ID對應的著陸頁URL進行拼接得到的目標URL為絕對路徑,進而實現了在IIS日志中能夠獲取到丟失了域名的著陸頁URL的絕對路徑的效果。

      附圖說明

      構成本申請的一部分的附圖用來提供對本申請的進一步理解,本申請的示意性實施例及其說明用于解釋本申請,并不構成對本申請的不當限定。在附圖中:

      圖1是根據本申請實施例的網站分析方法的流程圖;以及

      圖2是根據本申請實施例的網站分析裝置的示意圖。

      具體實施方式

      需要說明的是,在不沖突的情況下,本申請中的實施例及實施例中的特征可以相互組合。下面將參考附圖并結合實施例來詳細說明本申請。

      為了使本技術領域的人員更好地理解本申請方案,下面將結合本申請實施例中的附圖,對本申請實施例中的技術方案進行清楚、完整地描述,顯然,所描述的實施例僅僅是本申請一部分的實施例,而不是全部的實施例?;诒旧暾堉械膶嵤├?,本領域普通技術人員在沒有做出創(chuàng)造性勞動前提下所獲得的所有其他實施例,都應當屬于本申請保護的范圍。

      需要說明的是,本申請的說明書和權利要求書及上述附圖中的術語“第一”、“第二”等是用于區(qū)別類似的對象,而不必用于描述特定的順序或先后次序。應該理解這樣使用的數據在適當情況下可以互換,以便這里描述的本申請的實施例。此外,術語“包括”和“具有”以及他們的任何變形,意圖在于覆蓋不排他的包含,例如,包含了一系列步驟或單元的過程、方法、系統(tǒng)、產品或設備不必限于清楚地列出的那些步驟或單元,而是可包括沒有清楚地列出的或對于這些過程、方法、產品或設備固有的 其它步驟或單元。

      為了便于描述,以下對本申請實施例涉及的部分術語進行說明:

      統(tǒng)一資源定位符(Uniform Resource Locator,簡稱URL)也被稱為網頁地址,是因特網上標準的資源的地址。通俗地說,URL是Internet上用來描述信息資源的字符串,主要用在各種WWW客戶程序和服務器程序上,特別是著名的Mosaic。采用URL可以用一種統(tǒng)一的格式來描述各種信息資源,包括文件、服務器的地址和目錄等。URL的格式由下列三部分組成:第一部分是協(xié)議(或稱為服務方式);第二部分是存有該資源的主機IP地址(有時也包括端口號);第三部分是主機資源的具體地址,例如目錄和文件名等。第一部分和第二部分之間用“://”符號隔開,第二部分和第三部分用“/”符號隔開。第一部分和第二部分是不可缺少的,第三部分有時可以省略。

      綜合瀏覽量(Page View,簡稱PV):為網站各網頁被瀏覽的總次數。一個訪客有可能創(chuàng)造十幾個甚至更多的Pageviews。綜合瀏覽量是目前判斷網站訪問流量最常用的計算方式,也是反映一個網站受歡迎程度的重要指標之一。

      IIS日志,默認格式:ex+年份的末兩位數字+月份+日期,文件后綴為“.log”,例如,2010年7月30日的日志生成文件是ex100730.log。服務器的一些狀況和訪問IP的來源都會記錄在IIS日志中,方便網站管理人員查看網站的運營情況。

      絕對路徑是指文件在硬盤上真正存在的路徑。例如“bg.jpg”這個圖片是存放在硬盤的“E:\book\網頁布局代碼\第2章”目錄下,那么“bg.jpg”這個圖片的絕對路徑就是“E:\book\網頁布\代碼\第2章\bg.GIF"。那么如果要使用絕對路徑指定網頁的背景圖片就應該使用以下語句:<body backround="E:\book\網頁布局\代碼\第2章\bg.GIF">。

      事實上,在網頁編程時,很少會使用絕對路徑,如果使用“E:\book\網頁布\代碼\第2章\bg.jpg”來指定背景圖片的位置,在自己的計算機上瀏覽可能會一切正常,但是上傳到Web服務器上瀏覽就很有可能不會顯示圖片了。因為上傳到Web服務器上時,可能整個網站并沒有放在Web服務器的E盤,有可能是D盤或H盤。即使放在Web服務器的E盤里,Web服務器的E盤里也不一定會存在“E:\book\網頁布局\代碼\第2章”這個目錄,因此在瀏覽網頁時是不會顯示圖片的。為了避免這種隋況發(fā)生,通常在網頁里指定文件時,都會選擇使用相對路徑。所謂相對路徑,就是相對于自己的目標文件位置。例如,上面的例子,“s1.htm”文件里引用了“bg.jpg”圖片,由于“bg.jpg”圖片相對于“s1.htm”來說,是在同一個目錄的,那么要在“s1.htm”文件里使用以下代碼后,只要這兩個文件的相對位置沒有變(也就是說還是在同一個目錄內),那么無論上傳到Web服務器的哪個位置,在瀏覽器里都能正確地顯示圖片。<body background="bg.GIF">。再例如,假設“s1.htm”文件所在目錄為“E:\book\網頁布局\ 代碼\第2章”,而“bg.jpg”圖片所在目錄為“E:\book\網頁布局\代碼\第2章\img”,那么“bg.jpg”圖片相對于“s1.htm”文件來說,是在其所在目錄的“img”子目錄里,則引用圖片的語句應該為:<body background="img/bg.GIF">。

      注意:相對路徑使用“/”字符作為目錄的分隔字符,而絕對路徑可以使用“\”或“/”字符作為目錄的分隔字符。由于“img”目錄是“第2章”目錄下的子目錄,因此在“img”前不用再加上“/”字符。

      在相對路徑里常使用“../”來表示上一級目錄。如果有多個上一級目錄,可以使用多個“../”,例如“http://www.cnblogs.com/”代表上上級目錄。假設“s1.htm”文件所在目錄為“E:\book\網頁布局\代碼\第2章”,而“bg.jpg”圖片所在目錄為“E:\book\網頁布局\代碼”,那么“bg.jpg”圖片相對于“s1.htm”文件來說,是在其所在目錄的上級目錄里,則引用圖片的語句應該為:<body background="../bg.GIF">。

      根據本申請的實施例,提供了一種網站分析方法。

      圖1是根據本申請實施例的網站分析方法的流程圖。如圖1所示,該方法包括以下步驟:

      步驟S101,獲取目標綜合瀏覽量,其中,目標綜合瀏覽量中記錄有目標網站ID和目標網站ID對應的著陸頁統(tǒng)一資源定位符URL。

      可選地,在本申請實施例提供的網站分析方法中,在獲取目標綜合瀏覽量之前,該方法還包括:在目標網站上布署預設腳本代碼,其中,預設腳本代碼用于采集目標網站的綜合瀏覽量;通過目標網站上預設腳本代碼采集目標網站的綜合瀏覽量;以及將采集到的目標網站的綜合瀏覽量作為目標綜合瀏覽量。

      在本申請中的,獲取目標網站上各網頁被瀏覽的總次數,得到目標綜合瀏覽量。其中,目標綜合瀏覽量中記錄有目標網站ID和目標網站ID對應的著陸頁URL等信息。

      步驟S102,判斷目標網站ID對應的著陸頁URL是否為絕對路徑。

      步驟S103,如果目標網站ID對應的著陸頁URL不是絕對路徑,從預設數據庫中查找目標網站ID對應的域名。

      可選地,在本申請實施例提供的網站分析方法中,在從預設數據庫中查找目標網站ID對應的域名之前,該方法還包括:獲取目標時間段內的網站歷史數據;從網站歷史數據中分別統(tǒng)計每個目標網站ID和每個目標網站ID對應的域名,得到網站數據集合;以及將網站數據集合存儲至預設數據庫。

      通過上述步驟,在預設數據庫中存儲有(int,string)型鍵值對,int表示網站ID,string表示網站ID對應的域名。如果目標網站ID對應的著陸頁URL不是絕對路徑,從預設數據庫中查找目標網站ID對應的域名。

      步驟S104,將目標網站ID對應的域名與目標網站ID對應的著陸頁URL進行拼接,得到目標URL。

      可選地,在本申請實施例提供的網站分析方法中,在將目標網站ID對應的域名與目標網站ID對應的著陸頁URL進行拼接,得到目標URL之后,該方法還包括:將目標URL發(fā)送至目標地址;在目標地址上根據目標URL生成目標IIS日志;以及在目標IIS日志中獲取目標URL的絕對路徑。

      將目標網站ID對應的域名與目標網站ID對應的著陸頁URL進行拼接,得到完整的著陸頁URL(即目標URL)。根據完整的著陸頁URL即可獲取其絕對路徑,解決了相關技術中在進行網站分析時由于著陸頁URL丟失了域名,導致不能在IIS日志中獲取到丟失了域名的著陸頁URL的絕對路徑的問題。

      可選地,在本申請實施例提供的網站分析方法中,在判斷目標網站ID對應的著陸頁URL是否為絕對路徑之后,該方法還包括:如果目標網站ID對應的著陸頁URL是絕對路徑,獲取目標網站ID對應的著陸頁URL中的域名;以及將目標網站ID對應的著陸頁URL中的域名存儲至預設數據庫,以更新預設數據庫中目標網站ID對應的域名。

      如果目標網站ID對應的著陸頁URL是絕對路徑,根據目標網站ID對應的著陸頁URL中的域名更新預設數據庫中目標網站ID對應的域名。通過對預設數據庫中的信息進行更新,保證了后續(xù)在預設數據庫中獲取到的網站ID對應的域名的準確性。

      本申請實施例提供的網站分析方法,通過獲取目標綜合瀏覽量,其中,目標綜合瀏覽量中記錄有目標網站ID和目標網站ID對應的著陸頁URL;判斷目標網站ID對應的著陸頁URL是否為絕對路徑;如果目標網站ID對應的著陸頁URL不是絕對路徑,從預設數據庫中查找目標網站ID對應的域名;以及將目標網站ID對應的域名與目標網站ID對應的著陸頁URL進行拼接,得到目標URL,解決了相關技術中在進行網站分析時由于著陸頁URL丟失了域名,導致不能在IIS日志中獲取到丟失了域名的著陸頁URL的絕對路徑的問題,根據目標網站ID對應的域名與目標網站ID對應的著陸頁URL進行拼接得到的目標URL為絕對路徑,進而實現了在IIS日志中能夠獲取到丟失了域名的著陸頁URL的絕對路徑的效果。

      需要說明的是,在附圖的流程圖示出的步驟可以在諸如一組計算機可執(zhí)行指令的計算機系統(tǒng)中執(zhí)行,并且,雖然在流程圖中示出了邏輯順序,但是在某些情況下,可 以以不同于此處的順序執(zhí)行所示出或描述的步驟。

      本申請實施例還提供了一種網站分析裝置,需要說明的是,本申請實施例的網站分析裝置可以用于執(zhí)行本申請實施例所提供的用于網站分析方法。以下對本申請實施例提供的網站分析裝置進行介紹。

      圖2是根據本申請實施例的網站分析裝置的示意圖。如圖2所示,該裝置包括:第一獲取單元10、判斷單元20、查找單元30和第二獲取單元40。

      第一獲取單元10,用于獲取目標綜合瀏覽量,其中,目標綜合瀏覽量中記錄有目標網站ID和目標網站ID對應的著陸頁URL。

      判斷單元20,用于判斷目標網站ID對應的著陸頁URL是否為絕對路徑。

      查找單元30,用于在目標網站ID對應的著陸頁URL不是絕對路徑的情況下,從預設數據庫中查找目標網站ID對應的域名。

      第二獲取單元40,用于將目標網站ID對應的域名與目標網站ID對應的著陸頁URL進行拼接,得到目標URL。

      可選地,在本申請實施例提供的網站分析裝置中,該裝置還包括:布署單元,用于在目標網站上布署預設腳本代碼,其中,預設腳本代碼用于采集目標網站的綜合瀏覽量;采集單元,用于通過目標網站上預設腳本代碼采集目標網站的綜合瀏覽量;以及確定單元,用于將采集到的目標網站的綜合瀏覽量作為目標綜合瀏覽量。

      可選地,在本申請實施例提供的網站分析裝置中,該裝置還包括:發(fā)送單元,用于將目標URL發(fā)送至目標地址;生成單元,用于在目標地址上根據目標URL生成目標IIS日志;以及第三獲取單元,用于在目標IIS日志中獲取目標URL的絕對路徑。

      可選地,在本申請實施例提供的網站分析裝置中,該裝置還包括:第四獲取單元,用于獲取目標時間段內的網站歷史數據;統(tǒng)計單元,用于從網站歷史數據中分別統(tǒng)計每個目標網站ID和每個目標網站ID對應的域名,得到網站數據集合;以及存儲單元,用于將網站數據集合存儲至預設數據庫。

      可選地,在本申請實施例提供的網站分析裝置中,該裝置還包括:第五獲取單元,用于在目標網站ID對應的著陸頁URL是絕對路徑的情況下,獲取目標網站ID對應的著陸頁URL中的域名;以及更新單元,用于將目標網站ID對應的著陸頁URL中的域名存儲至預設數據庫,以更新預設數據庫中目標網站ID對應的域名。

      本申請實施例提供的網站分析裝置,通過第一獲取單元10獲取目標綜合瀏覽量,其中,目標綜合瀏覽量中記錄有目標網站ID和目標網站ID對應的著陸頁URL;判斷 單元20判斷目標網站ID對應的著陸頁URL是否為絕對路徑;查找單元30在目標網站ID對應的著陸頁URL不是絕對路徑的情況下,從預設數據庫中查找目標網站ID對應的域名;以及第二獲取單元40將目標網站ID對應的域名與目標網站ID對應的著陸頁URL進行拼接,得到目標URL,解決了相關技術中在進行網站分析時由于著陸頁URL丟失了域名,導致不能在IIS日志中獲取到丟失了域名的著陸頁URL的絕對路徑的問題,根據目標網站ID對應的域名與目標網站ID對應的著陸頁URL進行拼接得到的目標URL為絕對路徑,進而實現了在IIS日志中能夠獲取到丟失了域名的著陸頁URL的絕對路徑的效果。

      所述網站分析裝置包括處理器和存儲器,上述第一獲取單元、判斷單元、查找單元和第二獲取單元等均作為程序單元存儲在存儲器中,由處理器執(zhí)行存儲在存儲器中的上述程序單元實現相應功能。上述預設數據庫、預設腳本代碼都可以存儲在存儲器中。

      處理器中包含內核,由內核去存儲器中調取相應的程序單元。內核可以設置一個或以上,通過調整內核參數進行網站分析。

      存儲器可能包括計算機可讀介質中的非永久性存儲器,隨機存取存儲器(RAM)和/或非易失性內存等形式,如只讀存儲器(ROM)或閃存(flash RAM),存儲器包括至少一個存儲芯片。

      本申請還提供了一種計算機程序產品的實施例,當在數據處理設備上執(zhí)行時,適于執(zhí)行初始化有如下方法步驟的程序代碼:獲取目標綜合瀏覽量,其中,目標綜合瀏覽量中記錄有目標網站ID和目標網站ID對應的著陸頁URL;判斷目標網站ID對應的著陸頁URL是否為絕對路徑;如果目標網站ID對應的著陸頁URL不是絕對路徑,從預設數據庫中查找目標網站ID對應的域名;以及將目標網站ID對應的域名與目標網站ID對應的著陸頁URL進行拼接,得到目標URL。

      需要說明的是,對于前述的各方法實施例,為了簡單描述,故將其都表述為一系列的動作組合,但是本領域技術人員應該知悉,本申請并不受所描述的動作順序的限制,因為依據本申請,某些步驟可以采用其他順序或者同時進行。其次,本領域技術人員也應該知悉,說明書中所描述的實施例均屬于優(yōu)選實施例,所涉及的動作和模塊并不一定是本申請所必須的。

      在上述實施例中,對各個實施例的描述都各有側重,某個實施例中沒有詳述的部分,可以參見其他實施例的相關描述。

      在本申請所提供的幾個實施例中,應該理解到,所揭露的裝置,可通過其它的方式實現。例如,以上所描述的裝置實施例僅僅是示意性的,例如所述單元的劃分,僅 僅為一種邏輯功能劃分,實際實現時可以有另外的劃分方式,例如多個單元或組件可以結合或者可以集成到另一個系統(tǒng),或一些特征可以忽略,或不執(zhí)行。

      所述作為分離部件說明的單元可以是或者也可以不是物理上分開的,作為單元顯示的部件可以是或者也可以不是物理單元,即可以位于一個地方,或者也可以分布到多個網絡單元上。可以根據實際的需要選擇其中的部分或者全部單元來實現本實施例方案的目的。

      另外,在本申請各個實施例中的各功能單元可以集成在一個處理單元中,也可以是各個單元單獨物理存在,也可以兩個或兩個以上單元集成在一個單元中。上述集成的單元既可以采用硬件的形式實現,也可以采用軟件功能單元的形式實現。

      顯然,本領域的技術人員應該明白,上述的本申請的各模塊或各步驟可以用通用的計算裝置來實現,它們可以集中在單個的計算裝置上,或者分布在多個計算裝置所組成的網絡上,可選地,它們可以用計算裝置可執(zhí)行的程序代碼來實現,從而,可以將它們存儲在存儲裝置中由計算裝置來執(zhí)行,或者將它們分別制作成各個集成電路模塊,或者將它們中的多個模塊或步驟制作成單個集成電路模塊來實現。這樣,本申請不限制于任何特定的硬件和軟件結合。

      以上所述僅為本申請的優(yōu)選實施例,并不用于限制本申請,對于本領域的技術人員來說,本申請可以有各種更改和變化。凡在本申請的精神和原則之內,所作的任何修改、等同替換、改進等,均應包含在本申請的保護范圍之內。

      當前第1頁1 2 3 
      網友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會獲得點贊!
      1