国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      獲取用戶網絡操作特征的方法及設備的制造方法

      文檔序號:10624842閱讀:165來源:國知局
      獲取用戶網絡操作特征的方法及設備的制造方法
      【專利摘要】本申請?zhí)峁┮环N獲取用戶網絡操作特征的方法及設備,本申請根據每個時刻下各個操作維度中的用戶網絡操作信息的累計數量確定對應的操作維度離散度,可以對每個用戶網絡操作信息出現時所對應的操作維度離散度進行精確地量化和直觀表現,量化值不依賴個人經驗,進而對量化后的各操作維度離散度進行比較來獲取各種用戶網絡操作特征。另外,本申請將各個操作維度中的用戶網絡操作信息的累計數量記錄于二叉樹或平衡二叉樹中,可以降低搜索樹的操作的時間復雜度。此外,本申請將操作維度熵值作為所述操作維度離散度,使所述操作維度離散度的確定更直觀、更便捷。
      【專利說明】
      獲取用戶網絡操作特征的方法及設備
      技術領域
      [0001] 本申請設及通信及計算機領域,尤其設及一種獲取用戶網絡操作特征的方法及設 備。
      【背景技術】
      [0002] 大數據統計,最基本的統計就是數據分布如用戶網絡操作信息的操作維度(分 布),通過分析數據分布,來獲得一些額外的知識與信息如用戶網絡操作特征。例如,當用戶 網絡操作信息的分布為用戶登錄時間點/登錄地的分布的實際應用場景中,由于用戶的時 間作息不同/地域不同,導致用戶登錄時間點/登錄地的分布,有獨特的分布規(guī)律。如果用 戶登錄賬號發(fā)生突發(fā)性的,偏離正常行為習慣,在不常登錄的時間點/不常登錄的地點,進 行登陸操作,那么該用戶賬號的行為,就很有可能是風險行為,比如存在賬號被盜的可能。 W登錄時間分布為例,假設某用戶歷史登錄分布(W下簡稱例一)如下:
      [0003]
      [0004] 該用戶在歷史上一共在11個小時時間點上有過登錄,分別是:7時/8時/9時/10 時/11時/12時/15時/18時/19時/20時/21時。可見,該用戶習慣的登錄時間點為:早 上9時/10時左右,晚上19時/20時左右。那么在此用戶發(fā)生新的登錄行為時,如何評估 登錄時間點不符合歷史習慣?或者說用戶登錄時間習慣,是否發(fā)生改變?發(fā)生了多大的改 變?如何評估與衡量改變的具體值?如果得到具體值,如何根據具體值得到用戶網絡操作 特征?運些都是目前亟待解決的問題。 陽(K)日]現有的兩種方案如下:
      [0006] 一、直方圖方案:
      [0007] 直方圖方案是目前最常用的,用于評估數據分布的方式,即為直方圖評估。例一的 直方圖如圖1所示,用直方圖方案來評估數據分布的集中度與離散度。比較直觀,但也存在 明顯的缺點:無法量化離散度值,即可W定性的觀察到分布情況,但是無法定量到有數據分 布有多集中、多離散。 陽00引 二、TOP值/TOP占比方案:
      [0009] 由于直方圖無法定量表示的缺點,也有用TOP值或TOP占比(概率)來進行量化。 比如例一中,按歷史登錄次數進行降序排序后,可W得到下表。
      [0010]
      陽cm]取 Τ0Ρ3(18 時、19 時、ζυ n、j ;:
      陽01引 貝1J T0P3的值=21+20+14 = 55,同樣T0P3的占比=55%
      [0013] 取 T0P5 (18 時、19 時、20 時、21 時、9 時):
      [0014] 貝 1J T0P5 的值=21 巧0+14+。+10 = 77,同樣 T0P5 的占比=77%
      [0015] TOP值/TOP占比方案,雖然有了量化的值,但是對于取TOP幾如運里的T0P3或 T0P5往往難W確認(T0PN的N值不確定)。雖然可W通過二八原則、個人經驗等方式幫助 確定闊值N,但是由于對經驗依賴過重,整體量化值的產生還是不確定。

      【發(fā)明內容】

      [0016] 本申請的目的是提供一種獲取用戶網絡操作特征的方法及設備,能夠解決操作維 度離散度的量化和根據操作維度離散度得到用戶網絡操作特征的問題。
      [0017] 有鑒于此,本申請?zhí)峁┮环N獲取用戶網絡操作特征的方法,包括:
      [0018] 根據每個時刻下各個操作維度中的用戶網絡操作信息的累計數量確定對應的操 作維度離散度,其中,每個時刻對應一個用戶網絡操作信息的生成時刻;
      [0019] 對所有操作維度離散度進行比較,根據比較的結果獲取篩選的對應于某個時刻的 用戶網絡操作特征。
      [0020] 進一步的,根據每個時刻下各個操作維度中的用戶網絡操作信息的累計數量確定 對應的操作維度離散度,包括:
      [0021] 每次在每個用戶網絡操作信息的生成時刻,根據當前所有操作維度中的用戶網絡 操作信息的累計數量確定對應的操作維度離散度。
      [0022] 進一步的,每個累計數量根據一用戶網絡操作信息的出現順序明細確定。
      [0023] 進一步的,各個操作維度中的用戶網絡操作信息的累計數量記錄于二叉樹中。
      [0024] 進一步的,所述二叉樹為平衡二叉樹。
      [0025] 進一步的,獲取篩選的對應于某個時刻的用戶網絡操作特征包括:
      [00%] 對所有操作維度離散度的值大小進行比較,根據值大小比較的結果獲取候選的對 應于某個時刻的用戶網絡操作特征;
      [0027] 對所有操作維度離散度的變化值大小進行比較,根據變化值大小比較的結果從所 有候選的對應于某個時刻的用戶網絡操作特征中獲取篩選的用戶網絡操作特征。
      [0028] 進一步的,所述操作維度離散度的變化值包括操作維度離散度的差值或操作維度 離散度的斜率。
      [0029] 進一步的,所述操作維度離散度為操作維度賭值。
      [0030] 進一步的,每個操作維度賭值根據如下公式確定:
      [0031]
      , 陽0巧其中,η為正整數,Η佩表示操作維度賭值,p(Xi)表示第i個操作維度中的用戶 網絡操作信息相對于η個操作維度中所有用戶網絡操作信息的出現概率。
      [0033] 根據本申請的另一面還提供一種用于獲取用戶網絡操作特征的設備,包括:
      [0034] 第一裝置,用于根據每個時刻下各個操作維度中的用戶網絡操作信息的累計數量 確定對應的操作維度離散度,其中,每個時刻對應一個用戶網絡操作信息的生成時刻;
      [0035] 第二裝置,用于對所有操作維度離散度進行比較,根據比較的結果獲取篩選的對 應于某個時刻的用戶網絡操作特征。
      [0036] 進一步的,所述第一裝置,用于每次在每個用戶網絡操作信息的生成時刻,根據當 前所有操作維度中的用戶網絡操作信息的累計數量確定對應的操作維度離散度。
      [0037] 進一步的,每個累計數量根據一用戶網絡操作信息的出現順序明細確定。
      [0038] 進一步的,各個操作維度中的用戶網絡操作信息的累計數量記錄于二叉樹中。
      [0039] 進一步的,所述二叉樹為平衡二叉樹。 W40] 進一步的,所述第二裝置,用于對所有操作維度離散度的值大小進行比較,根據值 大小比較的結果獲取候選的對應于某個時刻的用戶網絡操作特征,及對所有操作維度離散 度的變化值大小進行比較,根據變化值大小比較的結果從所有候選的對應于某個時刻的用 戶網絡操作特征中獲取篩選的用戶網絡操作特征。
      [0041] 進一步的,所述操作維度離散度的變化值包括操作維度離散度的差值或操作維度 離散度的斜率。
      [0042] 進一步的,所述操作維度離散度為操作維度賭值。
      [0043] 進一步的,每個操作維度賭值根據如下公式確定:
      [0044]
      W45] 其中,η為正整數,Η佩表示操作維度賭值,ρ(Χι)表示第i個操作維度中的用戶 網絡操作信息相對于η個操作維度中所有用戶網絡操作信息的出現概率。
      [0046]與現有技術相比,本申請根據每個時刻下各個操作維度中的用戶網絡操作信息的 累計數量確定對應的操作維度離散度,可w對每個用戶網絡操作信息出現時所對應的操作 維度離散度進行精確地量化和直觀表現,量化值不依賴個人經驗,進而對量化后的各操作 維度離散度進行比較來獲取各種用戶網絡操作特征。
      [0047] 進一步的,本申請將各個操作維度中的用戶網絡操作信息的累計數量記錄于二叉 樹或平衡二叉樹中,可W降低捜索樹的操作的時間復雜度。
      [0048] 進一步的,本申請通過所有操作維度離散度的值大小比較得到候選的對應于某個 用戶網絡操作信息出現時的用戶網絡操作特征,根據所有操作維度離散度的變化值的大小 比較從所有候選的對應于某個用戶網絡操作信息出現時的用戶網絡操作特征中獲取篩選 的用戶網絡操作特征,使得到的用戶網絡操作特征更為精確。
      [0049] 進一步的,本申請過將操作維度賭值作為所述操作維度離散度,使所述操作維度 離散度的確定更直觀、更便捷。
      【附圖說明】
      [0050] 通過閱讀參照W下附圖所作的對非限制性實施例所作的詳細描述,本申請的其它 特征、目的和優(yōu)點將會變得更明顯:
      [0051] 圖1示出現有的評估數據分布直方圖;
      [0052] 圖2示出本申請一個方面的獲取用戶網絡操作特征的方法流程圖;
      [0053] 圖3~5示出本申請一實施例的二叉樹的節(jié)點變化圖;
      [0054] 圖6示出本申請一優(yōu)選的實施例的獲取用戶網絡操作特征的方法流程圖;
      [0055] 圖7示出本申請的一實施例的操作維度賭值與登錄次數的分布圖;
      [0056] 圖8示出本申請另一個方面的用于獲取用戶網絡操作特征的設備圖;
      [0057] 附圖中相同或相似的附圖標記代表相同或相似的部件。
      【具體實施方式】
      [0058] 在本申請一個典型的配置中,終端、服務網絡的設備和可信方均包括一個或多個 處理器(CPU)、輸入/輸出接口、網絡接口和內存。
      [0059] 內存可能包括計算機可讀介質中的非永久性存儲器,隨機存取存儲器(RAM)和/ 或非易失性內存等形式,如只讀存儲器(ROM)或閃存(flash RAM)。內存是計算機可讀介質 的示例。
      [0060] 計算機可讀介質包括永久性和非永久性、可移動和非可移動媒體可W由任何方法 或技術來實現信息存儲。信息可W是計算機可讀指令、數據結構、程序的模塊或其他數據。 計算機的存儲介質的例子包括,但不限于相變內存(PRAM)、靜態(tài)隨機存取存儲器(SRAM)、 動態(tài)隨機存取存儲器值RAM)、其他類型的隨機存取存儲器(RAM)、只讀存儲器(ROM)、電 可擦除可編程只讀存儲器巧EPROM)、快閃記憶體或其他內存技術、只讀光盤只讀存儲器 (CD-ROM)、數字多功能光盤值VD)或其他光學存儲、磁盒式磁帶,磁帶磁盤存儲或其他磁性 存儲設備或任何其他非傳輸介質,可用于存儲可W被計算設備訪問的信息。按照本文中的 界定,計算機可讀介質不包括非暫存電腦可讀媒體(transitory media),如調制的數據信 號和載波。
      [OOW] 如圖2所示,本申請?zhí)峁┮环N獲取用戶網絡操作特征的方法,包括:
      [0062] 步驟Sl,根據每個時刻下各個操作維度中的用戶網絡操作信息的累計數量確定對 應的操作維度離散度,其中,每個時刻對應一個用戶網絡操作信息的生成時刻,在此,截止 每個用戶網絡操作信息的生成時刻,當前所有的用戶網絡操作信息都會有一個對應的操作 維度離散度,即該用戶網絡操作信息與于其之前出現的所有用戶網絡操作信息所對應的操 作維度離散度,后續(xù)針對每增加一個用戶網絡操作信息的時刻,當前所有的用戶網絡操作 信息所對應的操作維度離散度就會有變化,得到另一個操作維度離散度的值;
      [0063] 步驟S2,對所有操作維度離散度進行比較,根據比較的結果獲取篩選的對應于某 個時刻的用戶網絡操作特征。本實施例可W對每個用戶網絡操作信息出現時所對應的操作 維度離散度進行精確地量化和直觀表現,量化值不依賴個人經驗,進而對量化后的各操作 維度離散度進行比較來獲取各種用戶網絡操作特征,例如可W用來判斷是否是團伙操作, 具體如某個團伙的買家集中購買商家商品,則操作維度離散度較低,可W得到該團伙可能 在幫某個賣家刷信譽的用戶網絡操作特征,或者是可能在攻擊賣家的用戶網絡操作特征, 比如雙十一時某個團伙將賣家的商品拍下架,還可W用來判斷用戶的網絡操作是否是習慣 變異,具體如用戶的登錄地、登錄時間變異,如果操作維度離散度較高,則可W得到該用戶 可能存在被盜號的風險的用戶網絡操作特征。
      [0064] 本申請的獲取用戶網絡操作特征的方法的一優(yōu)選的實施例中,步驟S1包括: 陽0化]每次在每個用戶網絡操作信息的生成時刻,根據當前所有操作維度中的用戶網絡 操作信息的累計數量確定對應的操作維度離散度。在此,是實時地根據每次累計數量更新 對應得到一個操作維度離散度,每次在出現新的用戶網絡操作信息導致某個操作維度中的 用戶網絡操作信息的累計數量更新時,即有新的用戶網絡操作信息生成的時刻,根據當前 所有操作維度中的用戶網絡操作信息的累計數量確定對應的操作維度離散度,從而每次操 作維度離散度計算前后,都不用記錄用戶網絡操作信息的出現順序明細,W節(jié)約數據存儲 空間。
      [0066] 本申請的獲取用戶網絡操作特征的方法的一優(yōu)選的實施例中,步驟S1中的每個 時刻下各個操作維度中的用戶網絡操作信息的累計數量根據一用戶網絡操作信息的出現 順序明細確定。在此,出現順序明細如,浙江、上海、浙江、上海、北京…,運里并不是在每出 現一個新的用戶網絡操作信息實時地計算此時的操作維度離散度,而是在所有用戶網絡操 作信息的出現順序明細生成后,再根據所述出現順序明細統一進行計算。本領域技術人員 應能理解上述操作維度離散度的確定的描述僅為舉例,其他現有的或今后可能出現的維度 離散度的確定的描述如可適用于本申請,也應包含在本申請保護范圍W內,并在此W引用 方式包含于此。 陽067] 本申請的獲取用戶網絡操作特征的方法的一優(yōu)選的實施例中,各個操作維度中的 用戶網絡操作信息的累計數量記錄于二叉樹中。在此,將操作維度作為二叉樹的一個節(jié)點, 當有新的用戶網絡操作信息出現時,需要先查找新的用戶網絡操作信息的操作維度是否已 經二叉樹的一個已節(jié)點,如果是只要將該節(jié)點的累記數量加1即可,如果該操作維度在二 叉樹中還沒有現成的節(jié)點,則需要先在二叉樹增加該節(jié)點,然后將該新增節(jié)點的累記數量 記為1。查找一個操作維度時,用普通的數組或線性列表只能在η的時間復雜度內查找一個 操作維度,而二叉樹可W在log(n)的時間復雜度內更快速地查找到一個操作維度。
      [0068] 本申請的獲取用戶網絡操作特征的方法的一更優(yōu)的實施例中,所述二叉樹為平衡 二叉樹。在此,平衡二叉樹的左右子樹深度之差的絕對值不超過1,且左右子樹仍然為平衡 二叉樹。在平衡二叉捜索樹中,其高度一般都良好地維持在0 (log化),比起二叉樹可進一步 降低捜索的操作的時間復雜度。本領域技術人員應能理解上述累計數量的記錄方式的描述 僅為舉例,其他現有的或今后可能出現的累計數量的記錄方式的描述如可適用于本申請, 也應包含在本申請保護范圍W內,并在此W引用方式包含于此。
      [0069] 具體的,二叉樹或平衡二叉樹可用于在操作維度(分布)的數量不明確時,即操 作維度的數量還有可能增加時,實時地記錄各個操作維度中的用戶網絡操作信息的累計數 量,每次根據累計數量變化就可實時得到對應的操作維度離散度。
      [0070] 為了更好的描述"操作維度不明確"的情況,在此將上述例一中登錄的時間分布 (由于時間小時只有24個項,分布項已明確),改成地域分布(W下簡稱例二),如下:
      [0071]
      陽0。] 第一步,為了能夠處理"分布項不明確"的數據,采用平衡二叉樹或二叉樹來進行 "實時"匯總數據的分布明細,得到如圖3所示的平衡二叉樹,圖3中二叉樹要求為左葉子結 點 < 父結點 < 右葉子結點,按地域的字母順序進行排序,從而得到圖3中BJ<GD01LJ<W<ZJ ;
      [0073] 第二步,假設用戶突然在廣西又登錄1次,如下表:
      [0074]
      [007引那么,圖3的平衡二叉樹將發(fā)生如圖4所示的變化得到非平衡的二叉樹,圖4中, 同樣,二叉樹要求:左葉子結點 < 父結點 < 右葉子結點,如圖4中BJ<GD<GX01LJ<W<ZJ ;
      [0076] 第Ξ步,將圖4的非平衡的二叉樹進行平衡旋轉操作,得到如圖5所示的平衡二叉 樹,從而在保證BJ<GD<GX01LJ<W<ZJ的前提下,減少樹的深度。至此,得到了 "實時"匯總 數據的分布明細,如下:
      [0077]
      [007引在此,第Ξ步是可選的步驟,只用于提升樹的性能,可W只用二叉樹來進行"實時" 匯總數據的分布明細。
      [0079] 另外,上述每個時刻下各個操作維度中的用戶網絡操作信息的累計數量根據一用 戶網絡操作信息的出現順序明細確定的實施例中,可根據所述出現順序明細生成對應的二 叉樹或平衡二叉樹來記錄,各個操作維度中的用戶網絡操作信息的累計數量,W加快所述 累計數量的統計效率。
      [0080] 如圖6所示,本申請的獲取用戶網絡操作特征的方法的一優(yōu)選的實施例中,步驟 S2包括:
      [0081] 步驟S21,對所有操作維度離散度的值大小進行比較,根據值大小比較的結果獲取 候選的對應于某個時刻的用戶網絡操作特征;
      [0082] 步驟S22,對所有操作維度離散度的變化值大小進行比較,根據變化值大小比較 的結果從所有候選的對應于某個時刻的用戶網絡操作特征中獲取篩選的用戶網絡操作特 征。在此,通過所有操作維度離散度的值大小比較得到候選的對應于某個用戶網絡操作信 息出現時的用戶網絡操作特征,如判斷得到對應于某個用戶網絡操作信息出現時的可能是 刷信譽的用戶網絡操作特征,然后根據所有操作維度離散度的變化值的大小比較進一步對 可能是刷信譽的用戶網絡操作特征進行判斷,從中篩選得到確定是刷信譽的用戶網絡操作 特征,從而使得到的用戶網絡操作特征更為精確。本領域技術人員應能理解上述篩選的用 戶網絡操作特征的獲取描述僅為舉例,其他現有的或今后可能出現的篩選的用戶網絡操作 特征的獲取如可適用于本申請,也應包含在本申請保護范圍W內,并在此W引用方式包含 于此。
      [0083] 本申請的獲取用戶網絡操作特征的方法的一可選的實施例中,所述操作維度離散 度的變化值包括操作維度離散度的差值或操作維度離散度的斜率。
      [0084] 本申請的獲取用戶網絡操作特征的方法的一優(yōu)選的實施例中,所述操作維度離散 度為操作維度賭值,從而使所述操作維度離散度的確定更直觀、更便捷。在此,對應于步驟 S21,操作維度賭值越小,表示用戶網絡操作信息的分布越集中;反之,操作維度賭值越大, 表示用戶網絡操作信息的分布越離散。例如: 陽0財如果用戶只有一個登錄地,則操作維度賭值=-l*l〇g(2, 1) = 0 ;
      [0086] 如果用戶只有二個登錄地,各占50 %,則操作維度賭值 =-0. 5*log(2, 0. 5)+-0. 5*log(2, 0. 5) = -0. 5*-1+-0. 5*-1 = 1 ;
      [0087] 1〉0,可見2個登錄地的操作維度賭值〉1個登錄地的賭值。 陽0蝴 回到上述例二:
      [0089] 用戶在廣西登錄前,明細數據如下:
      [0090]
      陽091] 則操作維度賭值=2. 05
      [0092] 用戶在廣西登錄后,明細數據如下:
      [0093]
      [0094] 則操作維度賭值=2. 14
      [00巧]可見用戶在廣西登錄后,賭值有明顯變大,說明用戶的登錄地,變得越來越分散, 則此時可W判斷用戶登錄賬號可能存在盜號風險。
      [0096]另外,對應于步驟S22,操作維度賭值變化越快,表示分布變化越快,數據越集中; 反之,操作維度賭值變化越慢,表示分布變化越慢,數據越離散。例二中,假設用戶登錄地, 按上表,由左至右,逐個城市登錄(即在浙江登錄19次后,然后在上海登錄15次,然后北京 3次…),那么操作維度賭值與登錄次數的分布如圖7所示,當用戶有異地登錄時,賭值會有 明顯的睹坡式增長(即賭值變化快),例如此時可W判斷用戶登錄賬號可能存在盜號風險, 隨著用戶在新登錄地登錄次數的增加,賭值增長的坡度會隨之下降(即賭值變化變慢),例 如此時可W判斷用戶登錄正常。
      [0097] 對于上述是否是團伙操作的例子,具體如某個團伙的買家集中購買商家商品,貝U 操作維度賭值較小,可W得到該團伙可能在幫某個賣家刷信譽的用戶網絡操作特征,或者 是可能在攻擊賣家的用戶網絡操作特征,比如雙十一時某個團伙將賣家的商品拍下架,對 于判斷用戶的網絡操作是否是習慣變異的例子,具體如用戶的登錄地、登錄時間變異,如果 操作維度賭值較高,則可W得到該用戶可能存在被盜號的風險的用戶網絡操作特征。本領 域技術人員應能理解上述對操作維度賭值的判斷的描述僅為舉例,其他現有的或今后可能 出現的對操作維度賭值的判斷的描述如可適用于本申請,也應包含在本申請保護范圍W 內,并在此W引用方式包含于此。
      [0098] 本申請的獲取用戶網絡操作特征的方法的一更優(yōu)的實施例中,每個用戶操作維度 賭值根據如下公式確定:
      [0099]
      [0100] 其中,η為正整數,Η佩表示操作維度賭值,p(Xi)表示第i個操作維度中的用戶 網絡操作信息相對于η個操作維度中所有用戶網絡操作信息的出現概率。本領域技術人員 應能理解上述操作維度賭值的確定的描述僅為舉例,其他現有的或今后可能出現的操作維 度賭值的確定的描述如可適用于本申請,也應包含在本申請保護范圍W內,并在此W引用 方式包含于此。 陽101] 如圖8所示,根據本申請的另一面還提供一種用于獲取用戶網絡操作特征的設備 100,包括: 陽102] 第一裝置1,用于根據每個時刻下各個操作維度中的用戶網絡操作信息的累計數 量確定對應的操作維度離散度,其中,每個時刻對應一個用戶網絡操作信息的生成時刻,在 此,截止每個用戶網絡操作信息的生成時刻,當前所有的用戶網絡操作信息都會有一個對 應的操作維度離散度,即該用戶網絡操作信息與于其之前出現的所有用戶網絡操作信息所 對應的操作維度離散度,后續(xù)針對每增加一個用戶網絡操作信息的時刻,當前所有的用戶 網絡操作信息所對應的操作維度離散度就會有變化,得到另一個操作維度離散度的值; 陽103] 第二裝置2,用于對所有操作維度離散度進行比較,根據比較的結果獲取篩選的對 應于某個時刻的用戶網絡操作特征。本實施例可W對每個用戶網絡操作信息出現時所對應 的操作維度離散度進行精確地量化和直觀表現,量化值不依賴個人經驗,進而對量化后的 各操作維度離散度進行比較來獲取各種用戶網絡操作特征,例如可W用來判斷是否是團伙 操作,具體如某個團伙的買家集中購買商家商品,則操作維度離散度較低,可W得到該團伙 可能在幫某個賣家刷信譽的用戶網絡操作特征,或者是可能在攻擊賣家的用戶網絡操作特 征,比如雙十一時某個團伙將賣家的商品拍下架,還可W用來判斷用戶的網絡操作是否是 習慣變異,具體如用戶的登錄地、登錄時間變異,如果操作維度離散度較高,則可W得到該 用戶可能存在被盜號的風險的用戶網絡操作特征。
      [0104] 本申請用于獲取用戶網絡操作特征的設備的一優(yōu)選的實施例中,所述第一裝置, 用于每次在每個用戶網絡操作信息的生成時刻,根據當前所有操作維度中的用戶網絡操作 信息的累計數量確定對應的操作維度離散度。在此,是實時地根據每次累計數量更新對應 得到一個操作維度離散度,每次在出現新的用戶網絡操作信息導致某個操作維度中的用戶 網絡操作信息的累計數量更新時,即有新的用戶網絡操作信息生成的時刻,根據當前所有 操作維度中的用戶網絡操作信息的累計數量確定對應的操作維度離散度,從而每次操作維 度離散度計算前后,都不用記錄用戶網絡操作信息的出現順序明細,W節(jié)約數據存儲空間。 [01化]本申請的用于獲取用戶網絡操作特征的設備的一優(yōu)選的實施例中,每個時刻下各 個操作維度中的用戶網絡操作信息的累計數量根據一用戶網絡操作信息的出現順序明細 確定。在此,出現順序明細如,浙江、上海、浙江、上海、北京…,運里并不是在每出現一個新 的用戶網絡操作信息實時地計算此時的操作維度離散度,而是在所有用戶網絡操作信息的 出現順序明細生成后,再根據所述出現順序明細統一進行計算。本領域技術人員應能理解 上述操作維度離散度的確定的描述僅為舉例,其他現有的或今后可能出現的維度離散度的 確定的描述如可適用于本申請,也應包含在本申請保護范圍W內,并在此W引用方式包含 于此。 陽106] 本申請的用于獲取用戶網絡操作特征的設備的一優(yōu)選的實施例中,各個操作維度 中的用戶網絡操作信息的累計數量記錄于二叉樹中。在此,將操作維度作為二叉樹的一個 節(jié)點,當有新的用戶網絡操作信息出現時,需要先查找新的用戶網絡操作信息的操作維度 是否已經二叉樹的一個已節(jié)點,如果是只要將該節(jié)點的累記數量加1即可,如果該操作維 度在二叉樹中還沒有現成的節(jié)點,則需要先在二叉樹增加該節(jié)點,然后將該新增節(jié)點的累 記數量記為1。查找一個操作維度時,用普通的數組或線性列表只能在η的時間復雜度內查 找一個操作維度,而二叉樹可W在log(n)的時間復雜度內更快速地查找到一個操作維度。 陽107] 本申請的用于獲取用戶網絡操作特征的設備的一更優(yōu)的實施例中,所述二叉樹為 平衡二叉樹。在此,平衡二叉樹的左右子樹深度之差的絕對值不超過1,且左右子樹仍然為 平衡二叉樹。在平衡二叉捜索樹中,其高度一般都良好地維持在0 (log化),比起二叉樹可進 一步降低捜索的操作的時間復雜度。本領域技術人員應能理解上述累計數量的記錄方式的 描述僅為舉例,其他現有的或今后可能出現的累計數量的記錄方式的描述如可適用于本申 請,也應包含在本申請保護范圍W內,并在此W引用方式包含于此。
      [0108] 具體的,二叉樹或平衡二叉樹可用于在操作維度(分布)的數量不明確時,即操 作維度的數量還有可能增加時,實時地記錄各個操作維度中的用戶網絡操作信息的累計數 量,每次根據累計數量變化就可實時得到對應的操作維度離散度。
      [0109] 為了更好的描述"操作維度不明確"的情況,在此將上述例一中登錄的時間分布 (由于時間小時只有24個項,分布項已明確),改成地域分布(W下簡稱例二),如下: 陽110]
      陽111] 第一步,為了能夠處理"分布項不明確"的數據,采用平衡二叉樹或二叉樹來進行 "實時"匯總數據的分布明細,得到如圖3所示的平衡二叉樹,圖3中二叉樹要求為左葉子結 點 < 父結點 < 右葉子結點,按地域的字母順序進行排序,從而得到圖3中BJ<GD01LJ<W<ZJ ; [0112] 第二步,假設用戶突然在廣西又登錄1次,如下表: 陽11引
      [0114] 那么,圖3的平衡二叉樹將發(fā)生如圖4所示的變化得到非平衡的二叉樹,圖4中, 同樣,二叉樹要求:左葉子結點 < 父結點 < 右葉子結點,如圖4中BJ<GD<GX01LJ<W<ZJ ;
      [0115] 第Ξ步,將圖4的非平衡的二叉樹進行平衡旋轉操作,得到如圖5所示的平衡二叉 樹,從而在保證BJ<GD<GX01LJ<W<ZJ的前提下,減少樹的深度。至此,得到了 "實時"匯總 數據的分布明細,如下: 陽116]
      [0117] 在此,第Ξ步是可選的步驟,只用于提升樹的性能,可W只用二叉樹來進行"實時" 匯總數據的分布明細。
      [0118] 另外,上述每個時刻下各個操作維度中的用戶網絡操作信息的累計數量根據一用 戶網絡操作信息的出現順序明細確定的實施例中,可根據所述出現順序明細生成對應的二 叉樹或平衡二叉樹來記錄,各個操作維度中的用戶網絡操作信息的累計數量,W加快所述 累計數量的統計效率。
      [0119] 本申請的用于獲取用戶網絡操作特征的設備的一優(yōu)選的實施例中,所述第二裝置 2,用于對所有操作維度離散度的值大小進行比較,根據值大小比較的結果獲取候選的對應 于某個時刻的用戶網絡操作特征,及對所有操作維度離散度的變化值大小進行比較,根據 變化值大小比較的結果從所有候選的對應于某個時刻的用戶網絡操作特征中獲取篩選的 用戶網絡操作特征。在此,通過所有操作維度離散度的值大小比較得到候選的對應于某個 用戶網絡操作信息出現時的用戶網絡操作特征,如判斷得到對應于某個用戶網絡操作信息 出現時的可能是刷信譽的用戶網絡操作特征,然后根據所有操作維度離散度的變化值的大 小比較進一步對可能是刷信譽的用戶網絡操作特征進行判斷,從中篩選得到確定是刷信譽 的用戶網絡操作特征,從而使得到的用戶網絡操作特征更為精確。本領域技術人員應能理 解上述篩選的用戶網絡操作特征的獲取描述僅為舉例,其他現有的或今后可能出現的篩選 的用戶網絡操作特征的獲取如可適用于本申請,也應包含在本申請保護范圍W內,并在此 W引用方式包含于此。
      [0120] 本申請的用于獲取用戶網絡操作特征的設備的一可選的實施例中,所述操作維度 離散度的變化值包括操作維度離散度的差值或操作維度離散度的斜率。 陽121] 本申請的用于獲取用戶網絡操作特征的設備的一優(yōu)選的實施例中,所述操作維度 離散度為操作維度賭值,從而使所述操作維度離散度的確定更直觀、更便捷。在此,操作維 度賭值越小,表示用戶網絡操作信息的分布越集中;反之,操作維度賭值越大,表示用戶網 絡操作信息的分布越離散。例如: 陽12引如果用戶只有一個登錄地,則操作維度賭值=-l*l〇g(2, 1) = 0 ; 陽123] 如果用戶只有二個登錄地,各占50 %,則操作維度賭值 =-0. 5*log(2, 0. 5)+-0. 5*log(2, 0. 5) = -0. 5*-1+-0. 5*-1 = 1 ;
      [0124] 1〉0,可見2個登錄地的操作維度賭值〉1個登錄地的賭值。 陽125] 回到上述例二: 陽126] 用戶在廣西登錄前,明細數據如下: 陽 127]
      [0128] 則操作維度賭值=2. 05 陽129] 用戶在廣西登錄后,明細數據如下: 陽 130]
      陽131] 則操作維度賭值=2. 14
      [0132] 可見用戶在廣西登錄后,賭值有明顯變大,說明用戶的登錄地,變得越來越分散, 則此時可W判斷用戶登錄賬號可能存在盜號風險。 陽133]另外,操作維度賭值變化越快,表示分布變化越快,數據越集中;反之,操作維度賭 值變化越慢,表示分布變化越慢,數據越離散。例二中,假設用戶登錄地,按上表,由左至右, 逐個城市登錄(即在浙江登錄19次后,然后在上海登錄15次,然后北京3次…),那么操作 維度賭值與登錄次數的分布如圖7所示,當用戶有異地登錄時,賭值會有明顯的睹坡式增 長(即賭值變化快),例如此時可W判斷用戶登錄賬號可能存在盜號風險,隨著用戶在新登 錄地登錄次數的增加,賭值增長的坡度會隨之下降(即賭值變化變慢),例如此時可W判斷 用戶登錄正常。
      [0134] 對于上述是否是團伙操作的例子,具體如某個團伙的買家集中購買商家商品,貝U 操作維度賭值較小,可W得到該團伙可能在幫某個賣家刷信譽的用戶網絡操作特征,或者 是可能在攻擊賣家的用戶網絡操作特征,比如雙十一時某個團伙將賣家的商品拍下架,對 于判斷用戶的網絡操作是否是習慣變異的例子,具體如用戶的登錄地、登錄時間變異,如果 操作維度賭值較高,則可W得到該用戶可能存在被盜號的風險的用戶網絡操作特征。本領 域技術人員應能理解上述對操作維度賭值的判斷的描述僅為舉例,其他現有的或今后可能 出現的對操作維度賭值的判斷的描述如可適用于本申請,也應包含在本申請保護范圍W 內,并在此W引用方式包含于此。
      [0135] 本申請的用于獲取用戶網絡操作特征的設備的一更優(yōu)的實施例中,每個操作維度 賭值根據如下公式確定: 陽 136]
      陽137] 其中,η為正整數,HOC表示操作維度賭值,p(Xi)表示第i個操作維度中的用戶 網絡操作信息相對于η個操作維度中所有用戶網絡操作信息的出現概率。本領域技術人員 應能理解上述操作維度賭值的確定的描述僅為舉例,其他現有的或今后可能出現的操作維 度賭值的確定的描述如可適用于本申請,也應包含在本申請保護范圍W內,并在此W引用 方式包含于此。
      [0138] 綜上所述,本申請根據每個時刻下各個操作維度中的用戶網絡操作信息的累計數 量確定對應的操作維度離散度,可W對每個用戶網絡操作信息出現時所對應的操作維度離 散度進行精確地量化和直觀表現,量化值不依賴個人經驗,進而對量化后的各操作維度離 散度進行比較來獲取各種用戶網絡操作特征。
      [0139] 進一步的,本申請將各個操作維度中的用戶網絡操作信息的累計數量記錄于二叉 樹或平衡二叉樹中,可W降低捜索樹的操作的時間復雜度。
      [0140] 進一步的,本申請通過所有操作維度離散度的值大小比較得到候選的對應于某個 用戶網絡操作信息出現時的用戶網絡操作特征,根據所有操作維度離散度的變化值的大小 比較從所有候選的對應于某個用戶網絡操作信息出現時的用戶網絡操作特征中獲取篩選 的用戶網絡操作特征,使得到的用戶網絡操作特征更為精確。 陽141]進一步的,本申請將操作維度賭值作為所述操作維度離散度,使所述操作維度離 散度的確定更直觀、更便捷。 陽142] 顯然,本領域的技術人員可W對本申請進行各種改動和變型而不脫離本申請的精 神和范圍。運樣,倘若本申請的運些修改和變型屬于本申請權利要求及其等同技術的范圍 之內,則本申請也意圖包含運些改動和變型在內。 陽143] 需要注意的是,本申請可在軟件和/或軟件與硬件的組合體中被實施,例如,可采 用專用集成電路(ASIC)、通用目的計算機或任何其他類似硬件設備來實現。在一個實施例 中,本申請的軟件程序可W通過處理器執(zhí)行W實現上文所述步驟或功能。同樣地,本申請的 軟件程序(包括相關的數據結構)可W被存儲到計算機可讀記錄介質中,例如,RAM存儲器, 磁或光驅動器或軟磁盤及類似設備。另外,本申請的一些步驟或功能可采用硬件來實現,例 如,作為與處理器配合從而執(zhí)行各個步驟或功能的電路。
      [0144] 另外,本申請的一部分可被應用為計算機程序產品,例如計算機程序指令,當其被 計算機執(zhí)行時,通過該計算機的操作,可W調用或提供根據本申請的方法和/或技術方案。 而調用本申請的方法的程序指令,可能被存儲在固定的或可移動的記錄介質中,和/或通 過廣播或其他信號承載媒體中的數據流而被傳輸,和/或被存儲在根據所述程序指令運行 的計算機設備的工作存儲器中。在此,根據本申請的一個實施例包括一個裝置,該裝置包括 用于存儲計算機程序指令的存儲器和用于執(zhí)行程序指令的處理器,其中,當該計算機程序 指令被該處理器執(zhí)行時,觸發(fā)該裝置運行基于前述根據本申請的多個實施例的方法和/或 技術方案。
      [0145] 對于本領域技術人員而言,顯然本申請不限于上述示范性實施例的細節(jié),而且在 不背離本申請的精神或基本特征的情況下,能夠W其他的具體形式實現本申請。因此,無論 從哪一點來看,均應將實施例看作是示范性的,而且是非限制性的,本申請的范圍由所附權 利要求而不是上述說明限定,因此旨在將落在權利要求的等同要件的含義和范圍內的所有 變化涵括在本申請內。不應將權利要求中的任何附圖標記視為限制所設及的權利要求。此 夕F,顯然"包括"一詞不排除其他單元或步驟,單數不排除復數。裝置權利要求中陳述的多 個單元或裝置也可W由一個單元或裝置通過軟件或者硬件來實現。第一,第二等詞語用來 表示名稱,而并不表示任何特定的順序。
      【主權項】
      1. 一種獲取用戶網絡操作特征的方法,其中,包括: 根據每個時刻下各個操作維度中的用戶網絡操作信息的累計數量確定對應的操作維 度離散度,其中,每個時刻對應一個用戶網絡操作信息的生成時刻; 對所有操作維度離散度進行比較,根據比較的結果獲取篩選的對應于某個時刻的用戶 網絡操作特征。2. 如權利要求1所述的方法,其中,根據每個時刻下各個操作維度中的用戶網絡操作 信息的累計數量確定對應的操作維度離散度,包括: 每次在每個用戶網絡操作信息的生成時刻,根據當前所有操作維度中的用戶網絡操作 信息的累計數量確定對應的操作維度離散度。3. 如權利要求1所述的方法,其中,每個累計數量根據一用戶網絡操作信息的出現順 序明細確定。4. 如權利要求1至3任一項所述的方法,其中,各個操作維度中的用戶網絡操作信息的 累計數量記錄于二叉樹中。5. 如權利要求4所述的方法,其中,所述二叉樹為平衡二叉樹。6. 如權利要求1至5任一項所述的方法,其中,獲取篩選的對應于某個時刻的用戶網絡 操作特征包括: 對所有操作維度離散度的值大小進行比較,根據值大小比較的結果獲取候選的對應于 某個時刻的用戶網絡操作特征; 對所有操作維度離散度的變化值大小進行比較,根據變化值大小比較的結果從所有候 選的對應于某個時刻的用戶網絡操作特征中獲取篩選的用戶網絡操作特征。7. 如權利要求6所述的方法,其中,所述操作維度離散度的變化值包括操作維度離散 度的差值或操作維度離散度的斜率。8. 如權利要求1~7任一項所述的方法,其中,所述操作維度離散度為操作維度賭值。9. 如權利要求8所述的方法,其中,每個操作維度賭值根據如下公式確定:其中,n為正整數,HOO表示操作維度賭值,P(Xi)表示第i個操作維度中的用戶網絡 操作信息相對于n個操作維度中所有用戶網絡操作信息的出現概率。10. -種用于獲取用戶網絡操作特征的設備,其中,包括: 第一裝置,用于根據每個時刻下各個操作維度中的用戶網絡操作信息的累計數量確定 對應的操作維度離散度,其中,每個時刻對應一個用戶網絡操作信息的生成時刻; 第二裝置,用于對所有操作維度離散度進行比較,根據比較的結果獲取篩選的對應于 某個時刻的用戶網絡操作特征。11. 如權利要求10所述的設備,其中,所述第一裝置,用于每次在每個用戶網絡操作信 息的生成時刻,根據當前所有操作維度中的用戶網絡操作信息的累計數量確定對應的操作 維度離散度。12. 如權利要求10所述的設備,其中,每個累計數量根據一用戶網絡操作信息的出現 順序明細確定。13. 如權利要求10至12任一項所述的設備,其中,各個操作維度中的用戶網絡操作信 息的累計數量記錄于二叉樹中。14. 如權利要求13所述的設備,其中,所述二叉樹為平衡二叉樹。15. 如權利要求10至14任一項所述的設備,其中,所述第二裝置,用于對所有操作維度 離散度的值大小進行比較,根據值大小比較的結果獲取候選的對應于某個時刻的用戶網絡 操作特征,及對所有操作維度離散度的變化值大小進行比較,根據變化值大小比較的結果 從所有候選的對應于某個時刻的用戶網絡操作特征中獲取篩選的用戶網絡操作特征。16. 如權利要求15所述的設備,其中,所述操作維度離散度的變化值包括操作維度離 散度的差值或操作維度離散度的斜率。17. 如權利要求10~16任一項所述的設備,其中,所述操作維度離散度為操作維度賭 值。18. 如權利要求17所述的設備,其中,每個操作維度賭值根據如下公式確定:其中,n為正整數,HOO表示操作維度賭值,P(Xi)表示第i個操作維度中的用戶網絡 操作信息相對于n個操作維度中所有用戶網絡操作信息的出現概率。
      【文檔編號】G06F17/30GK105989071SQ201510069913
      【公開日】2016年10月5日
      【申請日】2015年2月10日
      【發(fā)明人】胡四海
      【申請人】阿里巴巴集團控股有限公司
      網友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會獲得點贊!
      1