本申請涉及網(wǎng)站分析領域,具體而言,涉及一種統(tǒng)一資源定位符獲取方法及裝置。
背景技術:
統(tǒng)一資源定位符(Uniform Resource Locator,簡稱URL)也被稱為網(wǎng)頁地址,是因特網(wǎng)上標準的資源的地址。通常,URL中包含許多部分。例如,域名、Query等等。用戶獲取到的URL為完整的URL,然而,用戶有時并不關注完整的URL中各部分的所有參數(shù)。例如,在網(wǎng)站分析領域,他們不會關注URL中的中的廣告參數(shù)(utm參數(shù))。由于相關技術中對用戶顯示的URL均為完整的URL,用戶需要從該完整的URL中去排除不關注的參數(shù),獲取自己關注的參數(shù),即不能直接的獲取到關注的參數(shù),導致用戶體驗度較低。
針對相關技術中在網(wǎng)站分析時無法直接獲取到只包含用戶關注的參數(shù)的URL,導致用戶體驗度較低的問題,目前尚未提出有效的解決方案。
技術實現(xiàn)要素:
本申請的主要目的在于提供一種統(tǒng)一資源定位符獲取方法及裝置,以解決相關技術中在網(wǎng)站分析時無法直接獲取到只包含用戶關注的參數(shù)的URL,導致用戶體驗度較低的問題。
為了實現(xiàn)上述目的,根據(jù)本申請的一個方面,提供了一種統(tǒng)一資源定位符獲取方法。該方法包括:確定待處理的統(tǒng)一資源定位符URL中的目標處理部分;對目標處理部分進行分解,得到多個參數(shù);按照預設過濾條件分別對多個參數(shù)中每個參數(shù)進行過濾處理;以及對過濾后的每個參數(shù)進行拼接處理,得到目標URL。
進一步地,確定待處理的統(tǒng)一資源定位符URL中的目標處理部分包括:獲取待處理的統(tǒng)一資源定位符URL;根據(jù)待處理的統(tǒng)一資源定位符URL創(chuàng)建Uri類實例;以及從Uri類實例中提取Query成員屬性,作為待處理的統(tǒng)一資源定位符URL中的目標處理部分。
進一步地,對過濾后的每個參數(shù)進行拼接處理,得到目標URL包括:將過濾后的每個參數(shù)進行拼接處理,得到參數(shù)串;以及將參數(shù)串與預設參數(shù)進行拼接處理,得到目標URL。
進一步地,將過濾后的每個參數(shù)進行拼接處理為通過string.Join方法使用預設字符對過濾后的每個參數(shù)進行拼接處理。
進一步地,按照預設過濾條件分別對多個參數(shù)中每個參數(shù)進行過濾處理包括:確定預設過濾條件,其中,預設過濾條件為參數(shù)名中不包含utm字符串;獲取多個參數(shù)中包含utm字符串的參數(shù);以及在多個參數(shù)中對包含utm字符串的參數(shù)進行過濾處理。
進一步地,對目標處理部分進行分解,得到多個參數(shù)包括:確定目標處理部分中包含的預設字符;以及在目標處理部分中提取每個預設字符兩側的參數(shù),得到多個參數(shù)。
為了實現(xiàn)上述目的,根據(jù)本申請的另一方面,提供了一種統(tǒng)一資源定位符獲取裝置。該裝置包括:確定單元,用于確定待處理的統(tǒng)一資源定位符URL中的目標處理部分;分解單元,用于對目標處理部分進行分解,得到多個參數(shù);第一處理單元,用于按照預設過濾條件分別對多個參數(shù)中每個參數(shù)進行過濾處理;以及第二處理單元,用于對過濾后的每個參數(shù)進行拼接處理,得到目標URL。
進一步地,確定單元包括:第一獲取模塊,用于獲取待處理的統(tǒng)一資源定位符URL;創(chuàng)建模塊,用于根據(jù)待處理的統(tǒng)一資源定位符URL創(chuàng)建Uri類實例;以及第一確定模塊,用于從Uri類實例中提取Query成員屬性,作為待處理的統(tǒng)一資源定位符URL中的目標處理部分。
進一步地,第二處理單元包括:第一處理模塊,用于將過濾后的每個參數(shù)進行拼接處理,得到參數(shù)串;以及第二處理模塊,用于將參數(shù)串與預設參數(shù)進行拼接處理,得到目標URL。
進一步地,第一處理單元包括:第二確定模塊,用于確定預設過濾條件,其中,預設過濾條件為參數(shù)名中不包含utm字符串;第二獲取模塊,用于獲取多個參數(shù)中包含utm字符串的參數(shù);以及第三處理模塊,用于在多個參數(shù)中對包含utm字符串的參數(shù)進行過濾處理。
通過本申請,采用以下步驟:確定待處理的統(tǒng)一資源定位符URL中的目標處理部分;對目標處理部分進行分解,得到多個參數(shù);按照預設過濾條件分別對多個參數(shù)中每個參數(shù)進行過濾處理;以及對過濾后的每個參數(shù)進行拼接處理,得到目標URL,解決了相關技術中在網(wǎng)站分析時無法直接獲取到只包含用戶關注的參數(shù)的URL,導致用戶體驗度較低的問題,對待處理的統(tǒng)一資源定位符URL進行分解,過濾,拼接處理,得到目標URL,該目標URL中將用戶不關注的參數(shù)過濾掉,呈現(xiàn)給用戶的URL中只包含用戶關注的參數(shù),進而實現(xiàn)能夠直接獲取到只包含用戶關注的參數(shù)的URL,提升用戶體驗度的效果。
附圖說明
構成本申請的一部分的附圖用來提供對本申請的進一步理解,本申請的示意性實施例及其說明用于解釋本申請,并不構成對本申請的不當限定。在附圖中:
圖1是根據(jù)本申請實施例的統(tǒng)一資源定位符獲取方法的流程圖;以及
圖2是根據(jù)本申請實施例的統(tǒng)一資源定位符獲取裝置的示意圖。
具體實施方式
需要說明的是,在不沖突的情況下,本申請中的實施例及實施例中的特征可以相互組合。下面將參考附圖并結合實施例來詳細說明本申請。
為了使本技術領域的人員更好地理解本申請方案,下面將結合本申請實施例中的附圖,對本申請實施例中的技術方案進行清楚、完整地描述,顯然,所描述的實施例僅僅是本申請一部分的實施例,而不是全部的實施例?;诒旧暾堉械膶嵤├?,本領域普通技術人員在沒有做出創(chuàng)造性勞動前提下所獲得的所有其他實施例,都應當屬于本申請保護的范圍。
需要說明的是,本申請的說明書和權利要求書及上述附圖中的術語“第一”、“第二”等是用于區(qū)別類似的對象,而不必用于描述特定的順序或先后次序。應該理解這樣使用的數(shù)據(jù)在適當情況下可以互換,以便這里描述的本申請的實施例。此外,術語“包括”和“具有”以及他們的任何變形,意圖在于覆蓋不排他的包含,例如,包含了一系列步驟或單元的過程、方法、系統(tǒng)、產(chǎn)品或設備不必限于清楚地列出的那些步驟或單元,而是可包括沒有清楚地列出的或?qū)τ谶@些過程、方法、產(chǎn)品或設備固有的其它步驟或單元。
為了便于描述,以下對本申請實施例涉及的術語進行說明:
統(tǒng)一資源定位符(Uniform Resource Locator,簡稱URL)也被稱為網(wǎng)頁地址,是因特網(wǎng)上標準的資源的地址。通俗地說,URL是Internet上用來描述信息資源的字符串,主要用在各種WWW客戶程序和服務器程序上,特別是著名的Mosaic。采用URL可以用一種統(tǒng)一的格式來描述各種信息資源,包括文件、服務器的地址和目錄等。URL的格式由下列三部分組成:第一部分是協(xié)議(或稱為服務方式);第二部分是存有該資源的主機IP地址(有時也包括端口號);第三部分是主機資源的具體地址,例如目錄和文件名等。第一部分和第二部分之間用“://”符號隔開,第二部分和第三部分用“/”符號隔開。第一部分和第二部分是不可缺少的,第三部分有時可以省略。
根據(jù)本申請的實施例,提供了一種統(tǒng)一資源定位符獲取方法。
圖1是根據(jù)本申請實施例的統(tǒng)一資源定位符獲取方法的流程圖。如圖1所示,該方法包括以下步驟:
步驟S101,確定待處理的統(tǒng)一資源定位符URL中的目標處理部分。
本申請中的待處理的統(tǒng)一資源定位符URL為原始URL,即完整的URL。待處理的統(tǒng)一資源定位符URL中包含許多部分。例如,Host、Path、Query部分等等,確定待處理的統(tǒng)一資源定位符URL中的目標處理部分,即后續(xù)需要對該部分進行過濾處理的部分。例如,確定待處理的統(tǒng)一資源定位符URL中的目標處理部分為Query部分,即后續(xù)需對Query部分進行去參處理。
可選地,在本申請實施例提供的統(tǒng)一資源定位符獲取方法中,確定待處理的統(tǒng)一資源定位符URL中的目標處理部分包括:獲取待處理的統(tǒng)一資源定位符URL;根據(jù)待處理的統(tǒng)一資源定位符URL創(chuàng)建Uri類實例;以及從Uri類實例中提取Query成員屬性,作為待處理的統(tǒng)一資源定位符URL中的目標處理部分。Uri類提供了分割URI(Uniform Resource Identifier,統(tǒng)一資源標識符)字符串的函數(shù)集合,Uri類定義了屬性和方法來處理URI。
例如,上述的Query成員屬性中包括name,age等參數(shù),將包括name,age等參數(shù)的Query成員屬性作為待處理的統(tǒng)一資源定位符URL中的目標處理部分。
步驟S102,對目標處理部分進行分解,得到多個參數(shù)。
可選地,在本申請實施例提供的統(tǒng)一資源定位符獲取方法中,對目標處理部分進行分解,得到多個參數(shù)包括:確定目標處理部分中包含的預設字符;以及在目標處理部分中提取每個預設字符兩側的參數(shù),得到多個參數(shù)。
例如,預設字符為“&”字符,Query成員屬性為:name=“張三”&age=“18”&utm source&……;確定Query成員屬性(目標處理部分)中的預設字符,提取name=“張三”&age=“18”&utm source&……中預設字符兩側的參數(shù),得到name=“張三”;age=“18”;utm source;等等。
步驟S103,按照預設過濾條件分別對多個參數(shù)中每個參數(shù)進行過濾處理。
可選地,在本申請實施例提供的統(tǒng)一資源定位符獲取方法中,按照預設過濾條件分別對多個參數(shù)中每個參數(shù)進行過濾處理包括:確定預設過濾條件,其中,預設過濾條件為參數(shù)名中不包含utm字符串;獲取多個參數(shù)中包含utm字符串的參數(shù);以及在多個參數(shù)中對包含utm字符串的參數(shù)進行過濾處理。
由于utm參數(shù)為廣告參數(shù),用戶并不關注廣告參數(shù),因此,在此步驟中,對多個參數(shù)中包含utm字符串的參數(shù)進行過濾處理,例如,多個參數(shù)為name=“張三”;age= “18”;utm source;等等,對其中包含utm字符串的參數(shù)進行過濾處理,即將utm source過濾掉,剩下name=“張三”;age=“18”等不包含utm字符串的參數(shù)。
需要說明的是,在本申請中的預設過濾條件并不僅限定于參數(shù)名中不包含utm字符串,還可以為其它用戶不關注URL中其它參數(shù)構成的過濾條件。
步驟S104,對過濾后的每個參數(shù)進行拼接處理,得到目標URL。
可選地,在本申請實施例提供的統(tǒng)一資源定位符獲取方法中,對過濾后的每個參數(shù)進行拼接處理,得到目標URL包括:將過濾后的每個參數(shù)進行拼接處理,得到參數(shù)串;以及將參數(shù)串與預設參數(shù)進行拼接處理,得到目標URL。
可選地,在本申請實施例提供的統(tǒng)一資源定位符獲取方法中,將過濾后的每個參數(shù)進行拼接處理為通過string.Join方法使用預設字符對過濾后的每個參數(shù)進行拼接處理。
例如,預設字符為“&”字符,將不包含utm字符串的參數(shù)進行拼接處理,得到參數(shù)串,即再將參數(shù)串與Uri實例的Schema、Host、Abosolutepath等參數(shù)進行拼接處理,得到目標URL,例如,得到的目標URL的格式為:$"{uri.Scheme}://{uri.Host}{u ri.AbsolutePath}?{updatedQueryString}"。
綜上所述,通過對待處理的統(tǒng)一資源定位符URL進行分解,過濾,拼接處理,得到目標URL,該目標URL中將用戶不關注的參數(shù)過濾掉,呈現(xiàn)給用戶的URL中只包含用戶關注的參數(shù),進而實現(xiàn)用戶能夠直接獲取到只包含用戶關注的參數(shù)的URL,提升用戶體驗度。
本申請實施例提供的統(tǒng)一資源定位符獲取方法,通過確定待處理的統(tǒng)一資源定位符URL中的目標處理部分;對目標處理部分進行分解,得到多個參數(shù);按照預設過濾條件分別對多個參數(shù)中每個參數(shù)進行過濾處理;以及對過濾后的每個參數(shù)進行拼接處理,得到目標URL,解決了相關技術中在網(wǎng)站分析時無法直接獲取到只包含用戶關注的參數(shù)的URL,導致用戶體驗度較低的問題,對待處理的統(tǒng)一資源定位符URL進行分解,過濾,拼接處理,得到目標URL,該目標URL中將用戶不關注的參數(shù)過濾掉,呈現(xiàn)給用戶的URL中只包含用戶關注的參數(shù),進而實現(xiàn)能夠直接獲取到只包含用戶關注的參數(shù)的URL,提升用戶體驗度的效果。
需要說明的是,在附圖的流程圖示出的步驟可以在諸如一組計算機可執(zhí)行指令的計算機系統(tǒng)中執(zhí)行,并且,雖然在流程圖中示出了邏輯順序,但是在某些情況下,可以以不同于此處的順序執(zhí)行所示出或描述的步驟。
本申請實施例還提供了一種統(tǒng)一資源定位符獲取裝置,需要說明的是,本申請實 施例的統(tǒng)一資源定位符獲取裝置可以用于執(zhí)行本申請實施例所提供的用于統(tǒng)一資源定位符獲取方法。以下對本申請實施例提供的統(tǒng)一資源定位符獲取裝置進行介紹。
圖2是根據(jù)本申請實施例的統(tǒng)一資源定位符獲取裝置的示意圖。如圖2所示,該裝置包括:確定單元10、分解單元20、第一處理單元30和第二處理單元40。
確定單元10,用于確定待處理的統(tǒng)一資源定位符URL中的目標處理部分。
分解單元20,用于對目標處理部分進行分解,得到多個參數(shù)。
第一處理單元30,用于按照預設過濾條件分別對多個參數(shù)中每個參數(shù)進行過濾處理。
第二處理單元40,用于對過濾后的每個參數(shù)進行拼接處理,得到目標URL。
本申請實施例提供的統(tǒng)一資源定位符獲取裝置,通過確定單元10確定待處理的統(tǒng)一資源定位符URL中的目標處理部分;分解單元20對目標處理部分進行分解,得到多個參數(shù);第一處理單元30按照預設過濾條件分別對多個參數(shù)中每個參數(shù)進行過濾處理;以及第二處理單元40對過濾后的每個參數(shù)進行拼接處理,得到目標URL,解決了相關技術中在網(wǎng)站分析時無法直接獲取到只包含用戶關注的參數(shù)的URL,導致用戶體驗度較低的問題,對待處理的統(tǒng)一資源定位符URL進行分解,過濾,拼接處理,得到目標URL,該目標URL中將用戶不關注的參數(shù)過濾掉,呈現(xiàn)給用戶的URL中只包含用戶關注的參數(shù),進而實現(xiàn)能夠直接獲取到只包含用戶關注的參數(shù)的URL,提升用戶體驗度的效果。
可選地,在本申請實施例提供的統(tǒng)一資源定位符獲取裝置中,確定單元10包括:第一獲取模塊,用于獲取待處理的統(tǒng)一資源定位符URL;創(chuàng)建模塊,用于根據(jù)待處理的統(tǒng)一資源定位符URL創(chuàng)建Uri類實例;以及第一確定模塊,用于從Uri類實例中提取Query成員屬性,作為待處理的統(tǒng)一資源定位符URL中的目標處理部分。
可選地,在本申請實施例提供的統(tǒng)一資源定位符獲取裝置中,第二處理單元40包括:第一處理模塊,用于將過濾后的每個參數(shù)進行拼接處理,得到參數(shù)串;以及第二處理模塊,用于將參數(shù)串與預設參數(shù)進行拼接處理,得到目標URL。
可選地,在本申請實施例提供的統(tǒng)一資源定位符獲取裝置中,第一處理單元10包括:第二確定模塊,用于確定預設過濾條件,其中,預設過濾條件為參數(shù)名中不包含utm字符串;第二獲取模塊,用于獲取多個參數(shù)中包含utm字符串的參數(shù);以及第三處理模塊,用于在多個參數(shù)中對包含utm字符串的參數(shù)進行過濾處理。
所述統(tǒng)一資源定位符獲取裝置包括處理器和存儲器,上述確定單元、分解單元、第一處理單元和第二處理單元等均作為程序單元存儲在存儲器中,由處理器執(zhí)行存儲 在存儲器中的上述程序單元實現(xiàn)相應功能。上述預設過濾條件、預設參數(shù)都可以存儲在存儲器中。
處理器中包含內(nèi)核,由內(nèi)核去存儲器中調(diào)取相應的程序單元。內(nèi)核可以設置一個或以上,通過調(diào)整內(nèi)核參數(shù)獲取目標URL。
存儲器可能包括計算機可讀介質(zhì)中的非永久性存儲器,隨機存取存儲器(RAM)和/或非易失性內(nèi)存等形式,如只讀存儲器(ROM)或閃存(flash RAM),存儲器包括至少一個存儲芯片。
本申請還提供了一種計算機程序產(chǎn)品的實施例,當在數(shù)據(jù)處理設備上執(zhí)行時,適于執(zhí)行初始化有如下方法步驟的程序代碼:確定待處理的統(tǒng)一資源定位符URL中的目標處理部分;對目標處理部分進行分解,得到多個參數(shù);按照預設過濾條件分別對多個參數(shù)中每個參數(shù)進行過濾處理;以及對過濾后的每個參數(shù)進行拼接處理,得到目標URL。
需要說明的是,對于前述的各方法實施例,為了簡單描述,故將其都表述為一系列的動作組合,但是本領域技術人員應該知悉,本申請并不受所描述的動作順序的限制,因為依據(jù)本申請,某些步驟可以采用其他順序或者同時進行。其次,本領域技術人員也應該知悉,說明書中所描述的實施例均屬于優(yōu)選實施例,所涉及的動作和模塊并不一定是本申請所必須的。
在上述實施例中,對各個實施例的描述都各有側重,某個實施例中沒有詳述的部分,可以參見其他實施例的相關描述。
在本申請所提供的幾個實施例中,應該理解到,所揭露的裝置,可通過其它的方式實現(xiàn)。例如,以上所描述的裝置實施例僅僅是示意性的,例如所述單元的劃分,僅僅為一種邏輯功能劃分,實際實現(xiàn)時可以有另外的劃分方式,例如多個單元或組件可以結合或者可以集成到另一個系統(tǒng),或一些特征可以忽略,或不執(zhí)行。
所述作為分離部件說明的單元可以是或者也可以不是物理上分開的,作為單元顯示的部件可以是或者也可以不是物理單元,即可以位于一個地方,或者也可以分布到多個網(wǎng)絡單元上??梢愿鶕?jù)實際的需要選擇其中的部分或者全部單元來實現(xiàn)本實施例方案的目的。
另外,在本申請各個實施例中的各功能單元可以集成在一個處理單元中,也可以是各個單元單獨物理存在,也可以兩個或兩個以上單元集成在一個單元中。上述集成的單元既可以采用硬件的形式實現(xiàn),也可以采用軟件功能單元的形式實現(xiàn)。
顯然,本領域的技術人員應該明白,上述的本申請的各模塊或各步驟可以用通用 的計算裝置來實現(xiàn),它們可以集中在單個的計算裝置上,或者分布在多個計算裝置所組成的網(wǎng)絡上,可選地,它們可以用計算裝置可執(zhí)行的程序代碼來實現(xiàn),從而,可以將它們存儲在存儲裝置中由計算裝置來執(zhí)行,或者將它們分別制作成各個集成電路模塊,或者將它們中的多個模塊或步驟制作成單個集成電路模塊來實現(xiàn)。這樣,本申請不限制于任何特定的硬件和軟件結合。
以上所述僅為本申請的優(yōu)選實施例,并不用于限制本申請,對于本領域的技術人員來說,本申請可以有各種更改和變化。凡在本申請的精神和原則之內(nèi),所作的任何修改、等同替換、改進等,均應包含在本申請的保護范圍之內(nèi)。