国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      多個對象之間的相關性匹配分析方法

      文檔序號:6547670閱讀:545來源:國知局
      多個對象之間的相關性匹配分析方法
      【專利摘要】本發(fā)明公開了一種多個對象之間的相關性匹配分析方法,包括:步驟1,對給定的數(shù)據(jù)記錄集合進行整理,并根據(jù)應用場景定義記錄匹配判定法f;步驟2,對給定的n個對象和匹配次數(shù)m,根據(jù)能否從數(shù)據(jù)記錄集合中提取滿足匹配判定法f*的m組匹配記錄集,判斷所述n個對象是否符合相關性匹配判定法f(m)的要求,其中所述的n≥3,m≥2。
      【專利說明】多個對象之間的相關性匹配分析方法

      【技術領域】
      [0001] 本發(fā)明涉及計算機領域,尤其涉及一種多個對象之間的相關性匹配分析方法。

      【背景技術】
      [0002] 在包含交通往來或旅店入住等行蹤記錄的數(shù)據(jù)中,對象之間的相關性匹配分析方 法對分析哪些對象多次乘坐相同的車船、飛機班次,或在相近的時間經(jīng)過、入住或離開某一 場所這類同行同住問題具有重要意義。在反恐偵查、打擊販毒、傳銷網(wǎng)絡等領域,需要分析 和判斷達到一定規(guī)模的群體是否具有同行或同住關系或其他相關性行為,即研究多個對象 之間的相關性匹配問題。而當前的對象相關性匹配分析技術通常是指定一個對象,分析有 哪些對象與他匹配給定的次數(shù)以上,或在給定的范圍內(nèi),找出所有對象相關性匹配次數(shù)超 過給定值兩兩組合。這些分析方式都屬于二元關系分析,其核心是判斷兩個對象之間是否 匹配。由于對象之間分別匹配的參照點可能是不同的,即使對象兩兩匹配,也不能證明三個 以上的對象之間具有匹配關系。這意味著,現(xiàn)有的對象相關性匹配分析方法并不能滿足反 恐偵查、打擊販毒、傳銷網(wǎng)絡等領域?qū)Χ嗳送型⌒袨榉治雠袛嗟男枰?。因此,需要基?多個對象來研究相關性匹配問題。而研究多個對象之間的相關性匹配,面臨匹配判定法規(guī) 貝1J、匹配次數(shù)和對象數(shù)量的三重不確定及對象之間匹配組合的多樣性,且計算量隨數(shù)據(jù)的 規(guī)模呈指數(shù)級增長,需要本領域技術人員付出創(chuàng)造性勞動,才能解決相應的技術問題。


      【發(fā)明內(nèi)容】

      [0003] 本發(fā)明旨在至少解決現(xiàn)有技術中存在的技術問題,特別創(chuàng)新地提出了一種多個對 象之間的相關性匹配分析方法。
      [0004] 為了實現(xiàn)本發(fā)明的上述目的,本發(fā)明提供了一種多個對象之間的相關性匹配分析 方法,其關鍵在于:包括如下步驟:
      [0005] 步驟1,對給定的數(shù)據(jù)記錄集合進行整理,并根據(jù)應用場景定義記錄匹配判定法 f;
      [0006] 步驟2,對給定的η個對象和匹配次數(shù)m,根據(jù)能否從數(shù)據(jù)記錄集合中提取滿足匹 配判定法產(chǎn)的m組匹配記錄集,判斷所述η個對象是否符合相關性匹配判定法f (m)的要求, 其中所述的η彡3, m彡2。
      [0007] 上述技術方案的有益效果為:本發(fā)明通過精確的篩選匹配工作之后,能夠定位達 到閾值范圍的數(shù)據(jù),對應的對象會準確無誤的體現(xiàn)出來,無需人為操作即可實現(xiàn)準確匹配。
      [0008] 在數(shù)據(jù)匹配的過程中采用迭代方法進行計算,能夠更好地篩選對象數(shù)據(jù)進行相關 性匹配。
      [0009] 所述的多個對象之間的相關性匹配分析方法,優(yōu)選的,包括:所述數(shù)據(jù)記錄集合中 的每條數(shù)據(jù)記錄為其中一個對象P擁有,R(P)表示對象P擁有的數(shù)據(jù)記錄的集合;
      [0010] 記錄匹配判定法f為基于數(shù)據(jù)記錄的二元關系的布爾函數(shù),設兩條記錄分別為& 和r」,貝U f 0^,r」)=true表示和r」匹配,f 0^,r」)=false表示和r」不匹配,其中對 記錄匹配判定法f的定義應滿足自反性和對稱性,即對同一條數(shù)據(jù)記錄r, f (r, r) = true, 對任意兩條數(shù)據(jù)記錄A和rj,有f (1^, rp = f (rj, n); toon] 所述匹配判定法f"為基于數(shù)據(jù)記錄的多元關系的布爾函數(shù),其輸入為一記錄集, 要求記錄集中的各條數(shù)據(jù)記錄分屬不同的對象,對記錄集R,若R中的任意兩條記錄A和 都有fCt^rj) = true,則稱R滿足匹配判定法f*,記為f*(R) = true,并稱R為一組匹配 記錄集;
      [0012] 所述相關性匹配判定法f(m)為基于對象的多元關系的布爾函數(shù),其輸入為一對象 集合,設對象集合為P,若能找到m組不同的滿足匹配判定法f"的記錄集Ri,且Ri中的數(shù)據(jù) 記錄分別屬于P中的各個對象,即
      [0013] < i < m,/*(/?,) = true i?; Π = 0,1 玄 ?5/ S m5i # J ? ¥^,1 < I < i#i?Vp e P,Rt Π R(p) ^ 0
      [0014] 則稱P中的對象滿足相關性匹配判定法f(m),記為f(m)(P) = true。
      [0015] 上述技術方案的有益效果為:通過對象匹配法計算出需要匹配的數(shù)據(jù),對數(shù)據(jù)進 行運算,能夠更準確的進行對象匹配。
      [0016] 所述的多個對象之間的相關性匹配分析方法,優(yōu)選的,所述步驟2包括如下步驟: [0017] 步驟2-1,定義包含指定η個對象的集合P,從數(shù)據(jù)記錄集合中篩選出P中各個對 象的所有數(shù)據(jù)記錄,轉(zhuǎn)步驟2-2 ;
      [0018] 步驟2-2,如果某個對象擁有的數(shù)據(jù)記錄的數(shù)量小于m,則判斷這η個對象不滿足 相關性匹配判定法f (m),結(jié)束,否則轉(zhuǎn)步驟2-3 ;
      [0019] 步驟2-3,若基于數(shù)據(jù)記錄的匹配判定法f還滿足傳遞性,即對于任意3條數(shù)據(jù)記 ^r 1>r2>r3,W /(Γ"Γ2)=/ΓΜβ]
      [0020] j(rlfr3) = tme > j{r2,t\)^true\
      [0021] 則轉(zhuǎn)步驟2-4,否則轉(zhuǎn)步驟2-7 ;
      [0022] 步驟2-4,將篩選出的數(shù)據(jù)記錄劃分為若干子集,要求對每個子集氏,滿足產(chǎn)?。?=true,轉(zhuǎn)步驟 2-5 ;
      [0023] 步驟2-5,初始置計數(shù)為0,對每個子集氏,若對P中的任意對象p,均有 Λ(ρ) Π 尺^ 0,則計數(shù)加1,轉(zhuǎn)步驟2-6 ;
      [0024] 步驟2-6,根據(jù)總計數(shù)是否不小于m,判斷所述η個對象是否符合相關性匹配判定 法f (m)的要求,結(jié)束;
      [0025] 步驟2-7,從P中選擇一個對象,倉ll建臨時對象集合P' = {pj,為P。擁有的每條 數(shù)據(jù)記錄r分別創(chuàng)建一個匹配記錄集R = {r},轉(zhuǎn)步驟2-8 ;
      [0026] 步驟2-8,如果P' = P,則判斷該η個對象相關性匹配判定法f(m)的要求,否則從P 中再選擇另一對象P,轉(zhuǎn)步驟2-9 ;
      [0027] 步驟2-9,逐一檢查各匹配記錄集R,從R(p)中選擇一條數(shù)據(jù)記錄r滿足 f^RU {r}) =true,令R = RU {r},如果從R(p)中找不到這樣的數(shù)據(jù)記錄,貝U刪除R,待 所有匹配記錄集檢查完畢后轉(zhuǎn)步驟2-10 ;
      [0028] 步驟2-10,如果當前匹配記錄集的數(shù)量不小于m,則令P' =P' U {p},轉(zhuǎn)步驟2-8, 否則判斷這η個對象不符合相關性匹配要求,結(jié)束。
      [0029] 上述技術方案的有益效果為:通過精確的篩選匹配工作之后,能夠定位達到閾值 范圍的數(shù)據(jù),對應的對象會準確無誤的體現(xiàn)出來,無需人為操作即可實現(xiàn)準確匹配。運用多 個對象之間的相關性匹配分析方法,有利于發(fā)現(xiàn)對象之間密切相關的行為軌跡。
      [0030] 所述的多個對象之間的相關性匹配分析方法,優(yōu)選的,還包括:
      [0031] 把η個對象按包含記錄的數(shù)量從少到多排序,記錄較少的對象被先添加到臨時對 象集合Ρ'中。
      [0032] 上述技術方案的有益效果為:運用多個對象之間的相關性匹配分析方法,有利于 發(fā)現(xiàn)對象之間密切相關的行為軌跡。
      [0033] 所述的多個對象之間的相關性匹配分析方法,優(yōu)選的,還包括:
      [0034] 如果數(shù)據(jù)記錄匹配判定法f是基于時間相鄰原則進行判斷的,即每條數(shù)據(jù)記錄r 有時間屬性τ (r)和允許時間域δ (r),對于滿足= true的兩條數(shù)據(jù)記錄&和 僅當τ (r) e δ (r」)且τ (r」)e δ (rj,由此,為每組匹配記錄集R維護其中所有記錄 的允許時間域的交集δ ""(R),對任意記錄r判斷f^RU {r}) = true是否成立時先檢查是 否有τ (r) e S#(R),則可避免r與R中的記錄一一比較。
      [0035] 上述技術方案的有益效果為:運用多個對象之間的相關性匹配分析方法,有利于 發(fā)現(xiàn)對象之間密切相關的行為軌跡。
      [0036] 所述的多個對象之間的相關性匹配分析方法,優(yōu)選的,還包括:
      [0037] 在多線程或分布式環(huán)境中,把待判斷的對象劃分為若干子集分別判斷,再合并后 判斷所有對象是否符合相關性匹配要求。
      [0038] 綜上所述,由于采用了上述技術方案,本發(fā)明的有益效果是:
      [0039] 本發(fā)明通過精確的篩選匹配工作之后,能夠定位達到閾值范圍的數(shù)據(jù),對應的對 象會準確無誤的體現(xiàn)出來,無需人為操作即可實現(xiàn)準確匹配。
      [0040] 在數(shù)據(jù)匹配的過程中采用迭代方法進行計算,能夠更好地篩選對象數(shù)據(jù)進行相關 性匹配。
      [0041] 本發(fā)明已經(jīng)把多個對象相關性匹配分析應用到鐵路公安部門和網(wǎng)絡監(jiān)察公安部 門。
      [0042] 運用多個對象之間的相關性匹配分析方法,有利于發(fā)現(xiàn)對象之間密切相關的行為 軌跡。
      [0043] 本發(fā)明的附加方面和優(yōu)點將在下面的描述中部分給出,部分將從下面的描述中變 得明顯,或通過本發(fā)明的實踐了解到。

      【專利附圖】

      【附圖說明】
      [0044] 本發(fā)明的上述和/或附加的方面和優(yōu)點從結(jié)合下面附圖對實施例的描述中將變 得明顯和容易理解,其中:
      [0045] 圖1是本發(fā)明多個對象之間的相關性匹配分析方法的示意圖;
      [0046] 圖2是本發(fā)明多個對象之間的相關性匹配分析方法【具體實施方式】的示意圖。

      【具體實施方式】
      [0047] 下面詳細描述本發(fā)明的實施例,所述實施例的示例在附圖中示出,其中自始至終 相同或類似的標號表示相同或類似的元件或具有相同或類似功能的元件。下面通過參考附 圖描述的實施例是示例性的,僅用于解釋本發(fā)明,而不能理解為對本發(fā)明的限制。
      [0048] 在本發(fā)明的描述中,需要理解的是,術語"縱向"、"橫向"、"上"、"下"、"前"、"后"、 "左"、"右"、"堅直"、"水平"、"頂"、"底" "內(nèi)"、"外"等指示的方位或位置關系為基于附圖所 示的方位或位置關系,僅是為了便于描述本發(fā)明和簡化描述,而不是指示或暗示所指的裝 置或元件必須具有特定的方位、以特定的方位構(gòu)造和操作,因此不能理解為對本發(fā)明的限 制。
      [0049] 在本發(fā)明的描述中,除非另有規(guī)定和限定,需要說明的是,術語"安裝"、"相連"、 "連接"應做廣義理解,例如,可以是機械連接或電連接,也可以是兩個元件內(nèi)部的連通,可 以是直接相連,也可以通過中間媒介間接相連,對于本領域的普通技術人員而言,可以根據(jù) 具體情況理解上述術語的具體含義。
      [0050] 如圖1、2所示,本發(fā)明提供了一種多個對象之間的相關性匹配分析方法,其關鍵 在于:包括如下步驟:
      [0051] 步驟1,對給定的數(shù)據(jù)記錄集合進行整理,并根據(jù)應用場景定義記錄匹配判定法 f;
      [0052] 步驟2,對給定的η個對象和匹配次數(shù)m,根據(jù)能否從數(shù)據(jù)記錄集合中提取滿足匹 配判定法產(chǎn)的m組匹配記錄集,判斷所述η個對象是否符合相關性匹配判定法f (m)的要求, 其中所述的η彡3, m彡2。
      [0053] 上述技術方案的有益效果為:本發(fā)明通過精確的篩選匹配工作之后,能夠定位達 到閾值范圍的數(shù)據(jù),對應的對象會準確無誤的體現(xiàn)出來,無需人為操作即可實現(xiàn)準確匹配。
      [0054] 在數(shù)據(jù)匹配的過程中采用迭代方法進行計算,能夠更好地篩選對象數(shù)據(jù)進行相關 性匹配。
      [0055] 所述的多個對象之間的相關性匹配分析方法,優(yōu)選的,包括:所述數(shù)據(jù)記錄集合中 的每條數(shù)據(jù)記錄為其中一個對象P擁有,R(P)表示對象P擁有的數(shù)據(jù)記錄的集合;
      [0056] 所述記錄匹配判定法f為基于數(shù)據(jù)記錄的二元關系的布爾函數(shù),設兩條記錄分 別為A和1·』,則f (1^,γ』)=true表示和rj匹配,f (1^,γ』)=false表示和rj不 匹配,其中對記錄匹配判定法f的定義應滿足自反性和對稱性,即對同一條數(shù)據(jù)記錄r, f (r, r) ξ true,對任意兩條數(shù)據(jù)記錄&和γ』,有f (1^,rp ξ f (γ』,η);
      [0057] 所述匹配判定法f"為基于數(shù)據(jù)記錄的多元關系的布爾函數(shù),其輸入為一記錄集, 要求記錄集中的各條數(shù)據(jù)記錄分屬不同的對象,對記錄集R,若R中的任意兩條記錄A和 都有fCt^rj) = true,則稱R滿足匹配判定法f*,記為f*(R) = true,并稱R為一組匹配 記錄集;
      [0058] 所述相關性匹配判定法f(m)為基于對象的多元關系的布爾函數(shù),其輸入為一對象 集合,設對象集合為P,若能找到m組不同的滿足匹配判定法f"的記錄集氏,且氏中的數(shù)據(jù) 記錄分別屬于P中的各個對象,即
      [0059] ¥/?,.,!</< w,/*(/?/) = true ^ Π Λ, = 0,1 S /,J· S w-U 其 J- , νΛ,Ι < I < m.Vp ^P,Rtf] R(p) Ψ 0
      [0060] 則稱P中的對象滿足相關性匹配判定法f(m),記為f(m)⑵=true。
      [0061] 上述技術方案的有益效果為:通過對象匹配法計算出需要匹配的數(shù)據(jù),對數(shù)據(jù)進 行運算,能夠更準確的進行對象匹配。
      [0062] 所述的多個對象之間的相關性匹配分析方法,優(yōu)選的,所述步驟2包括如下步驟:
      [0063] 步驟2-1,定義包含指定η個對象的集合P,從數(shù)據(jù)記錄集合中篩選出P中各個對 象的所有數(shù)據(jù)記錄,轉(zhuǎn)步驟2-2 ;
      [0064] 步驟2-2,如果某個對象擁有的數(shù)據(jù)記錄的數(shù)量小于m,則判斷這η個對象不滿足 相關性匹配判定法f (m),結(jié)束,否則轉(zhuǎn)步驟2-3 ;
      [0065] 步驟2-3,若基于數(shù)據(jù)記錄的匹配判定法f還滿足傳遞性,即對于任意3條數(shù)據(jù)記 ^r1>r2>r3,W j\rx^\) = tnie\
      [0066] ' >=> /(/p/;) = tnie , f(r2,r3) = fruej '
      [0067] 則轉(zhuǎn)步驟2-4,否則轉(zhuǎn)步驟2-7 ;
      [0068] 步驟2-4,將篩選出的數(shù)據(jù)記錄劃分為若干子集,要求對每個子集氏,滿足f#?。?=true,轉(zhuǎn)步驟 2-5 ;
      [0069] 步驟2-5,初始置計數(shù)為0,對每個子集氏,若對P中的任意對象p,均有 調(diào)J?)門翠其0,則計數(shù)加1,轉(zhuǎn)步驟2-6 ;
      [0070] 步驟2-6,根據(jù)總計數(shù)是否不小于m,判斷所述η個對象是否符合相關性匹配判定 法f (m)的要求,結(jié)束;
      [0071] 步驟2-7,從P中選擇一個對象P(l,創(chuàng)建臨時對象集合P' = {P(l},為P(l擁有的每條 數(shù)據(jù)記錄r分別創(chuàng)建一個匹配記錄集R = {r},轉(zhuǎn)步驟2-8 ;
      [0072] 步驟2-8,如果P' = P,則判斷該η個對象相關性匹配判定法f(m)的要求,否則從P 中再選擇另一對象P,轉(zhuǎn)步驟2-9 ;
      [0073] 步驟2-9,逐一檢查各匹配記錄集R,從R(p)中選擇一條數(shù)據(jù)記錄r滿足 f^RU {r}) =true,令R = RU {r},如果從R(p)中找不到這樣的數(shù)據(jù)記錄,貝U刪除R,待 所有匹配記錄集檢查完畢后轉(zhuǎn)步驟2-10 ;
      [0074] 步驟2-10,如果當前匹配記錄集的數(shù)量不小于m,則令P' =P' U {p},轉(zhuǎn)步驟2-8, 否則判斷這η個對象不符合相關性匹配要求,結(jié)束。
      [0075] 上述技術方案的有益效果為:通過精確的篩選匹配工作之后,能夠定位達到閾值 范圍的數(shù)據(jù),對應的對象會準確無誤的體現(xiàn)出來,無需人為操作即可實現(xiàn)準確匹配。運用多 個對象之間的相關性匹配分析方法,有利于發(fā)現(xiàn)對象之間密切相關的行為軌跡。
      [0076] 所述的多個對象之間的相關性匹配分析方法,優(yōu)選的,還包括:
      [0077] 把η個對象按包含記錄的數(shù)量從少到多排序,記錄較少的對象被先添加到臨時對 象集合P'中。
      [0078] 上述技術方案的有益效果為:運用多個對象之間的相關性匹配分析方法,有利于 發(fā)現(xiàn)對象之間密切相關的行為軌跡。
      [0079] 所述的多個對象之間的相關性匹配分析方法,優(yōu)選的,還包括:
      [0080] 如果數(shù)據(jù)記錄匹配判定法f是基于時間相鄰原則進行判斷的,即每條數(shù)據(jù)記錄r 有時間屬性τ (r)和允許時間域δ (r),對于滿足= true的兩條數(shù)據(jù)記錄&和 僅當τ (r) e δ (r」)且τ (r」)e δ (rj,由此,為每組匹配記錄集R維護其中所有記錄 的允許時間域的交集δ ""(R),對任意記錄r判斷f^RU {r}) = true是否成立時先檢查是 否有τ (r) e S#(R),則可避免r與R中的記錄一一比較。
      [0081] 上述技術方案的有益效果為:運用多個對象之間的相關性匹配分析方法,有利于 發(fā)現(xiàn)對象之間密切相關的行為軌跡。
      [0082] 所述的多個對象之間的相關性匹配分析方法,優(yōu)選的,還包括:
      [0083] 在多線程或分布式環(huán)境中,把待判斷的對象劃分為若干子集分別判斷,再合并后 判斷所有對象是否符合相關性匹配要求。
      [0084] 所述步驟1之前包括:
      [0085] 在多個對象之間進行對象認證時,將對象認證信息傳輸?shù)皆贫朔掌?,所述云?服務器將所述多個對象的身份信息傳輸?shù)椒治鼋K端,由分析終端對所述多個對象進行行為 匹配。
      [0086] 在步驟2之后還包括:
      [0087] 將判斷匹配后的匹配記錄集中的數(shù)據(jù)傳輸?shù)焦芾斫K端,當所述多個對象匹配程度 達到相應閾值之后,提醒管理人員。
      [0088] 本發(fā)明創(chuàng)造是關于多個對象之間的相關性匹配分析方法。如果一組對象多次一同 乘坐相同的車船、飛機班次,或在相近的時間經(jīng)過、入住或離開某一場所(各次的班次、地 點可以不同),則我們稱該組對象具有記錄相關性匹配關系。判斷和發(fā)現(xiàn)多個對象之間的相 關性匹配關系的過程即為多個對象之間的相關性匹配分析方法。
      [0089] 多個對象之間的相關性匹配分析方法的條件如下:
      [0090] 1.被考察的所有對象的集合和所有對象行蹤的集合,每條行蹤記錄包含時間、地 點(或班次)等要素。如在公共上網(wǎng)場所匹配分析的數(shù)據(jù)中,每條記錄包含上網(wǎng)人身份信 息、上下網(wǎng)時間、所在網(wǎng)吧等信息。
      [0091] 2.任意兩條記錄是否滿足對象相關性匹配的判斷規(guī)則。如在航班同行分析中,判 斷規(guī)則通常為航班相同。又如在鐵路購票同行分析中,其中一種判斷規(guī)則為乘坐的火車班 次相同且購票時間相差30秒以內(nèi)。
      [0092] 3.記錄相關性匹配的最少次數(shù)(設為m),通常應在2次以上。
      [0093] 其中多個對象行為軌跡的數(shù)據(jù)采集到對象數(shù)據(jù)庫中,通過云端服務器隨時調(diào)用這 些對象數(shù)據(jù),而對象數(shù)據(jù)行為軌跡的采集通過,航班數(shù)據(jù)系統(tǒng)連接云端服務器,所述云端服 務器連接對象數(shù)據(jù)庫,鐵路數(shù)據(jù)系統(tǒng)連接云端服務器,所述云端服務器連接對象數(shù)據(jù)庫,客 運數(shù)據(jù)系統(tǒng)連接云端服務器,所述云端服務器連接對象數(shù)據(jù)庫,高速公路數(shù)據(jù)系統(tǒng)連接云 端服務器,所述云端服務器連接對象數(shù)據(jù)庫,銀行數(shù)據(jù)系統(tǒng)連接云端服務器,所述云端服務 器連接對象數(shù)據(jù)庫。
      [0094] 上述的數(shù)據(jù)系統(tǒng)采集對象的行為軌跡數(shù)據(jù)信息,傳輸?shù)綄ο髷?shù)據(jù)庫中,對象數(shù)據(jù) 庫根據(jù)用戶的需求,選擇出需要篩選匹配的對象,進行多個對象之間的相關性匹配分析。
      [0095] 上述對象的數(shù)據(jù)信息,能夠通過身份證掃描的信息,或者指紋信息,瞳孔信息進行 對象確認。
      [0096] 多個對象之間的相關性匹配分析方法的判斷方法如下:
      [0097] 1.對給定的一組對象,如果我們找出一一對應的一組行蹤記錄,且這些記錄中任 意兩條都滿足上述記錄相關性匹配的判斷規(guī)則,則我們稱該組人有過一次相關性匹配,稱 該組行蹤記錄為這組對象的一組匹配記錄集。
      [0098] 2.如果我們能為該組對象找出m組完全不同的匹配記錄集對應行蹤記錄,且每組 中的任意兩條都滿足上述記錄相關性匹配的判斷規(guī)則,則我們稱該組對象具有多個對象之 間的相關性匹配。
      [0099] 驗證多個對象(設為η)是否具有相關性匹配關系的判斷方法:
      [0100] 1.直接根據(jù)規(guī)則進行判斷,為這η個人依次找出m組匹配記錄集。
      [0101] 2.以迭代的方式進行判斷。
      [0102] 先判斷是否能為其中的2個對象找到至少m個匹配記錄集,然后再看添加另外一 個對象后,是否仍能為這些對象找到至少m個匹配記錄集。就這樣,把對象逐一添加到集合 中。如果始終能找到至少m個匹配記錄集,則我們判斷這η個對象具有多個對象之間的相 關性匹配分析。
      [0103] 現(xiàn)在我們來看添加一個對象后如何找匹配記錄集。設前k-Ι個對象有ml次相關 性匹配,即有ml組匹配記錄集(ml不小于m)?,F(xiàn)在我們來判斷這k個對象的相關性匹配關 系是否成立。對前k-Ι個對象的每組匹配記錄集,我們從后一個對象的行為軌跡記錄中,查 找與這組匹配記錄集中每條記錄都滿足的記錄。k大于等于1。
      [0104] 如果找得到,則把這條記錄與該組匹配記錄集中的其他記錄合在一起,作為這k 個對象的一組匹配記錄集。如果可找到至少m組匹配記錄集,則這k個對象的相關性匹配 關系成立。
      [0105] 整個判斷過程請參見圖2。
      [0106] S1,輸入待判定的η個對象,所述η大于等于3 ;
      [0107] S2,獲取每個對象的行為軌跡記錄;
      [0108] S3,設置k = 1,所述k為對象的行為軌跡記錄;
      [0109] S4,為每個對象每條記錄創(chuàng)建包含該記錄的匹配記錄集,設匹配記錄集數(shù)量為 ml ;
      [0110] 3.把這η個對象劃分為若干子集,先檢查各子集是否滿足多個對象之間的相關性 匹配分析的關系,然后再檢查子集之間的相關性匹配關系。這種方法便于實現(xiàn)并行計算。
      [0111] 根據(jù)使用環(huán)境的不同,判斷方法可以從以下幾個方面考慮進行優(yōu)化:
      [0112] 1.行蹤記錄可以按時間或班次進行排序,這意味著可以在瞬間定位指定時間范圍 或指定班次的行蹤記錄。
      [0113] 2.如果記錄之間的相關性匹配關系的判斷是基于班次的,則對應記錄數(shù)不足X條 的班次可以忽略掉。類似地,如果記錄之間的相關性匹配關系的判斷是基于時間相鄰原則 的,則相鄰時間范圍內(nèi)記錄數(shù)不足X條的記錄可以被忽略掉。所述X大于等于2。
      [0114] 3.通常情況下,行為軌跡較多的對象與其他對象相關性匹配的可能性更高。由此, 若判斷η個對象是否具有相關性匹配關系,可把這η個對象按行蹤記錄的數(shù)量從少到多排 序,先判斷記錄較少的對象之間是否具有相關性匹配關系。
      [0115] 4.如果記錄之間的相關性匹配關系的判斷是基于屬性(如日期、班次、地點)相等 原則的,則一組匹配記錄集中所有記錄的這些屬性是相同的。我們可以為每組匹配記錄集 記錄這些屬性。這樣,新添加一個對象時,我們只需要將他的行蹤記錄中的這些屬性與匹配 記錄集的這些屬性進行比較就可以了,而不需要與匹配記錄集中的記錄一一比較。
      [0116] 5.如果記錄之間的相關性匹配關系的判斷是基于時間相鄰原則的,則每條記錄都 對應一個允許時間范圍,在該范圍內(nèi)的記錄才能與之滿足相關性匹配關系。由此,我們可以 為每組匹配記錄集維護一個允許時間范圍,它是該記錄集中所有記錄的允許時間范圍的交 集。這樣,新添加一個對象時,我們只需要檢查該對象的行蹤記錄是否屬于前k-Ι對象的匹 配記錄集的允許時間范圍,而不需要與匹配記錄集中的記錄--比較。
      [0117] 本發(fā)明的有益效果是:
      [0118] 本發(fā)明通過精確的篩選匹配工作之后,能夠定位達到閾值范圍的數(shù)據(jù),對應的對 象會準確無誤的體現(xiàn)出來,無需人為操作即可實現(xiàn)準確匹配。
      [0119] 在數(shù)據(jù)匹配的過程中采用迭代方法進行計算,能夠更好地篩選對象數(shù)據(jù)進行相關 性匹配。
      [0120] 本發(fā)明已經(jīng)把多個對象相關性匹配分析應用到安全部門。
      [0121] 運用多個對象之間的相關性匹配分析方法,有利于發(fā)現(xiàn)對象之間密切相關的行為 軌跡,從而能準確無誤的判斷出相關性匹配數(shù)據(jù)。
      [0122] 現(xiàn)列舉如下實施例:
      [0123] 在行蹤記錄中,每條記錄包含3個字段:記錄編號、日期及記錄當事人姓名。其中 趙某、錢某、孫某、李某分別有6、6、5、4條記錄。設要求同行同住的最少次數(shù)為3,兩條記錄 之間具有同行同住關系的判斷標準有兩種情況:1、日期相同;2、日期相差一天以內(nèi)。通過 本發(fā)明能夠清晰的匹配出相應對象的行為軌跡,便于發(fā)現(xiàn)對象之間行為的匹配程度。
      [0124]

      【權(quán)利要求】
      1. 一種多個對象之間的相關性匹配分析方法,其特征在于:包括如下步驟: 步驟1,對給定的數(shù)據(jù)記錄集合進行整理,并根據(jù)應用場景定義記錄匹配判定法f ; 步驟2,對給定的η個對象和匹配次數(shù)m,根據(jù)能否從數(shù)據(jù)記錄集合中提取滿足匹配判 定法產(chǎn)的m組匹配記錄集,判斷所述η個對象是否符合相關性匹配判定法f(m)的要求,其中 所述的η彡3, m彡2。
      2. 根據(jù)權(quán)利要求1所述的多個對象之間的相關性匹配分析方法,其特征在于,包括:所 述數(shù)據(jù)記錄集合中的每條數(shù)據(jù)記錄為其中一個對象P擁有,R(P)表示對象P擁有的數(shù)據(jù)記 錄的集合; 記錄匹配判定法f為基于數(shù)據(jù)記錄的二元關系的布爾函數(shù),設兩條記錄分別為rdPrj, 貝1J f (Α,rj = true表示和rj匹配,f 0^,rj = false表示和rj不匹配,其中對記錄 匹配判定法f的定義應滿足自反性和對稱性,即對同一條數(shù)據(jù)記錄r,f (r, r) = true,對任 意兩條數(shù)據(jù)記錄A和γ」,有f (1^,rp = f (γ」,n); 所述匹配判定法f"為基于數(shù)據(jù)記錄的多元關系的布爾函數(shù),其輸入為一記錄集,要求 記錄集中的各條數(shù)據(jù)記錄分屬不同的對象,對記錄集R,若R中的任意兩條記錄^和rj,都 有fO^,r」)=true,則稱R滿足匹配判定法f%記為f^R) = true,并稱R為一組匹配記錄 集; 所述相關性匹配判定法f(m)為基于對象的多元關系的布爾函數(shù),其輸入為一對象集合, 設對象集合為P,若能找到m組不同的滿足匹配判定法f"的記錄集氏,且氏中的數(shù)據(jù)記錄 分別屬于P中的各個對象,即 iyRnl<i<= true j i?, Π = 0,1 ^ i,j ^ m,i Φ j , < I < m^p eP,Rt[] R(p) ^ 0 則稱P中的對象滿足相關性匹配判定法f(m),記為f(m) (P) = true。
      3. 根據(jù)權(quán)利要求1所述的多個對象之間的相關性匹配分析方法,其特征在于,所述步 驟2包括如下步驟: 步驟2-1,定義包含指定η個對象的集合P,從數(shù)據(jù)記錄集合中篩選出P中各個對象的 所有數(shù)據(jù)記錄,轉(zhuǎn)步驟2-2; 步驟2-2,如果某個對象擁有的數(shù)據(jù)記錄的數(shù)量小于m,則判斷這η個對象不滿足相關 性匹配判定法f(m),結(jié)束,否則轉(zhuǎn)步驟2-3 ; 步驟2-3,若基于數(shù)據(jù)記錄的匹配判定法f還滿足傳遞性,即對于任意3條數(shù)據(jù)記錄Γι、 r2、r3,有 f (κ,κ,) = true) . - true, 則轉(zhuǎn)步驟2-4,否則轉(zhuǎn)步驟2-7 ; 步驟2-4,將篩選出的數(shù)據(jù)記錄劃分為若干子集,要求對每個子集氏,滿足產(chǎn)(氏)= true,轉(zhuǎn)步驟2-5 ; 步驟2-5,初始置計數(shù)為0,對每個子集氏,若對P中的任意對象p,均有 /?(/>)門A弇0 ·則計數(shù)加1,轉(zhuǎn)步驟2-6 ; 步驟2-6,根據(jù)總計數(shù)是否不小于m,判斷所述η個對象是否符合相關性匹配判定法f(m) 的要求,結(jié)束; 步驟2-7,從P中選擇一個對象,倉ij建臨時對象集合P' = {pj,為擁有的每條數(shù)據(jù) 記錄r分別創(chuàng)建一個匹配記錄集R = {r},轉(zhuǎn)步驟2-8 ; 步驟2-8,如果P' = P,則判斷該η個對象相關性匹配判定法f(m)的要求,否則從P中 再選擇另一對象P,轉(zhuǎn)步驟2-9 ; 步驟2-9,逐一檢查各匹配記錄集R,從R(p)中選擇一條數(shù)據(jù)記錄r滿足f#(RU {r}) = true,令R = RU {r},如果從R(p)中找不到這樣的數(shù)據(jù)記錄,則刪除R,待所有匹配記錄 集檢查完畢后轉(zhuǎn)步驟2-10 ; 步驟2-10,如果當前匹配記錄集的數(shù)量不小于m,則令P' =P' U {p},轉(zhuǎn)步驟2-8,否 則判斷這η個對象不符合相關性匹配要求,結(jié)束。
      4. 根據(jù)權(quán)利要求3所述的多個對象之間的相關性匹配分析方法,其特征在于,還包括: 把η個對象按包含記錄的數(shù)量從少到多排序,記錄較少的對象被先添加到臨時對象集 合Ρ'中。
      5. 根據(jù)權(quán)利要求3所述的多個對象之間的相關性匹配分析方法,其特征在于,還包括: 如果數(shù)據(jù)記錄匹配判定法f是基于時間相鄰原則進行判斷的,即每條數(shù)據(jù)記錄r有時 間屬性τ (r)和允許時間域δ (r),對于滿足fCt^rj) =true的兩條數(shù)據(jù)記錄僅 當τ (r) e δ (r」)且τ (r」)e δ (rj,由此,為每組匹配記錄集R維護其中所有記錄的允 許時間域的交集δ ""(R),對任意記錄r判斷f^RU {r}) = true是否成立時先檢查是否有 τ (r) e S#(R),則可避免r與R中的記錄--比較。
      6. 根據(jù)權(quán)利要求3所述的多個對象之間的相關性匹配分析方法,其特征在于,還包括: 在多線程或分布式環(huán)境中,把待判斷的對象劃分為若干子集分別判斷,再合并后判斷 所有對象是否符合相關性匹配要求。
      【文檔編號】G06F17/30GK104050239SQ201410225694
      【公開日】2014年9月17日 申請日期:2014年5月27日 優(yōu)先權(quán)日:2014年5月27日
      【發(fā)明者】王小鑒, 艾彬, 曾勤, 楊煒明, 鄧新民, 李紅波 申請人:重慶愛思網(wǎng)安信息技術有限公司, 重慶智多信息發(fā)展有限公司
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會獲得點贊!
      1