基于fgak的異常軌跡檢測方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及一種異常軌跡檢測的方法,特別是一種能夠在多因素方面檢測異常軌 跡并且能夠應(yīng)用到軌跡長度差異較大的基于FGAK的異常軌跡檢測方法。
【背景技術(shù)】
[0002] 對(duì)于軌跡數(shù)據(jù)來說,除了空間位置上的經(jīng)煒度之外,軌跡點(diǎn)的速度、方向等其他屬 性也是不容忽視的重要因素,特別是在異常軌跡檢測領(lǐng)域?,F(xiàn)有異常軌跡檢測算法多數(shù)是 基于原始軌跡空間的空間位置進(jìn)行異常檢測的,但是空間位置屬性僅僅能代表移動(dòng)對(duì)象曾 經(jīng)在該區(qū)域活動(dòng)過。在原始軌跡空間中不能有效地提取軌跡的特征屬性,并且現(xiàn)有算法 不能很好地應(yīng)用到軌跡長度差異較大的軌跡數(shù)據(jù)集合中,需要事先對(duì)軌跡數(shù)據(jù)進(jìn)行重新采 樣,這就導(dǎo)致了軌跡數(shù)據(jù)特征被人為地破壞。
[0003] 在軌跡數(shù)據(jù)集合中,有些軌跡在空間位置形狀上很相似,但是它們的方向卻是相 反的,如果只考慮空間位置因素,這兩條軌跡都會(huì)被判定為正常軌跡,如果考慮了方向因 素,那么那條方向相反的軌跡就是異常軌跡,雖然它在空間位置上是正常的。
[0004] FGAK(Fast Global Alignment Kernels)由 Marco Cuturi 于 2011 年在第 28 屆國 際機(jī)器學(xué)習(xí)會(huì)議上提出并發(fā)表名為"Fast Global Alignment Kernels"的論文。文中詳述 了傳統(tǒng)的DTW核函數(shù)存在的不足,對(duì)GAK(Global Alignment Kernels)核函數(shù)的應(yīng)用做了 總結(jié),在GAK核函數(shù)的基礎(chǔ)上提出了 FGAK核函數(shù)用于加速GAK核函數(shù)的計(jì)算,同時(shí)證明了 FGAK核函數(shù)的正定性。
[0005] KPCA(Kernel Principal Component Analysis)是一種常用的降維方法,最初由 Smola A等人于1997年提出。傳統(tǒng)的PCA(Principal Component Analysis)降維方法在面 對(duì)高維數(shù)據(jù)時(shí)顯得力不從心,于是Smoba A等提出KPCA的解決辦法并給出了 KPCA的推導(dǎo) 過程。
[0006] 例如TRAOD算法在進(jìn)行軌跡異常檢測時(shí),僅僅考慮軌跡的空間位置因素對(duì)軌跡進(jìn) 行分段處理,對(duì)于一些存在回環(huán)的異常軌跡檢測效果很差;TOD-KPCA算法在進(jìn)行異常軌跡 檢測前,需要對(duì)軌跡數(shù)據(jù)進(jìn)行過采樣處理,以便所有軌跡具有相同的長度,這顯然會(huì)破壞軌 跡的原始數(shù)據(jù)。
【發(fā)明內(nèi)容】
[0007] 本發(fā)明的目的是要提供一種基于FGAK的異常軌跡檢測方法,能夠在多因素方面 檢測異常軌跡,并且能夠應(yīng)用到軌跡長度差異較大的軌跡數(shù)據(jù)集的異常檢測,解決現(xiàn)有異 常軌跡檢測方法主要考慮的是空間位置的異常,而其他因素考慮的很少的問題,以及在檢 測前需要對(duì)軌跡數(shù)據(jù)進(jìn)行重新采樣的缺陷。
[0008] 本發(fā)明的目的是這樣實(shí)現(xiàn)的:一種基于FGAK的異常軌跡檢測方法,能夠在多因素 方面檢測異常軌,并且能夠應(yīng)用到軌跡長度差異較大的軌跡數(shù)據(jù)集的異常檢測;該方法中, 利用FGAK核函數(shù)構(gòu)建核矩陣K,將原始軌跡空間中的軌跡點(diǎn)數(shù)據(jù)映射到高維軌跡特征空間 中,將原始非線性的軌跡數(shù)據(jù)轉(zhuǎn)換為高維特征空間中線性的特征數(shù)據(jù),以便更好地提取軌 跡數(shù)據(jù)特征;將軌跡數(shù)據(jù)映射到高維特征空間后,采用KPCA對(duì)軌跡數(shù)據(jù)核矩陣K進(jìn)行特征 提?。猾@得軌跡的特征數(shù)據(jù)后,利用一類支持向量機(jī)對(duì)軌跡進(jìn)行分類,通過設(shè)定核函數(shù)寬度 σ、三角參數(shù)T以及提取率P,對(duì)提取后的軌跡特征數(shù)據(jù)進(jìn)行無監(jiān)督學(xué)習(xí),在無監(jiān)督學(xué)習(xí)時(shí), 通過決策函數(shù)判斷某條軌跡是否為異常軌跡,具體步驟如下:
[0009] 步驟1)從軌跡數(shù)據(jù)集合中讀取每條軌跡的軌跡點(diǎn)數(shù)據(jù);
[0010] 步驟2)采用Min-max方法標(biāo)準(zhǔn)化每條軌跡;
[0011] 步驟3)利用核函數(shù)FGAK計(jì)算軌跡數(shù)據(jù)映射到高維特征空間后的特征矩陣,即核 矩陣K ;可以通過調(diào)節(jié)核函數(shù)FGAK的寬度〇來獲取不同的核矩陣;
[0012] 步驟4)中心化核矩陣Κ,得到核矩陣KL ;
[0013] 步驟5)計(jì)算核矩陣KL的特征值ep . . .,en及對(duì)應(yīng)的特征向量V ρ . . .,νη;
[0014] 步驟6)對(duì)特征值ep . . .,en進(jìn)行降序排序,對(duì)應(yīng)的特征向量也會(huì)自動(dòng)排序;
[0015] 步驟7)正交化特征向量,得到正交化后的特征向量a . . .,α n;
[0016] 步驟8)累加每個(gè)特征屬性的貢獻(xiàn)率P1, . . .,pn,對(duì)p進(jìn)行求和得到Pt (Pt = P1+. ..+Pt),根據(jù)給定的提取率P,如果Pt彡P(guān),則提取前t個(gè)主分量a i,...,at,也即前t 個(gè)正交化的特征向量;
[0017] 步驟9)計(jì)算特征空間上的投影Y = KL· a,其中,a = (ai,...,at);
[0018] 步驟10)通過步驟9得到新的軌跡特征數(shù)據(jù)集/= iZ.KU,其中x i代表一條軌跡 的特征向量,Xi= {a i,...,a t},其中a t代表軌跡X i的第t個(gè)主分量;
[0019] 步驟11)對(duì)于數(shù)據(jù)集XiE X中每條軌跡樣本X i,利用決策函數(shù)判斷Xi是否 為異常軌跡,如果是,則將軌跡X ^乍為一條異常軌跡輸出,并設(shè)置相應(yīng)的軌跡標(biāo)簽label i 為-Io
[0020] 有益效果,由于采用了上述方案,對(duì)移動(dòng)對(duì)象異常軌跡的檢測不僅僅局限于空間 位置屬性上,而是可以考慮軌跡點(diǎn)的方向、速度等其他重要特征。在進(jìn)行異常軌跡檢測的時(shí) 候首先需要將每條軌跡進(jìn)行標(biāo)準(zhǔn)化,將每個(gè)軌跡點(diǎn)的屬性值標(biāo)準(zhǔn)化到0和1之間,去除數(shù)據(jù) 的單位限制,轉(zhuǎn)換為無量綱的純數(shù)值,便于不同單位或量級(jí)的指標(biāo)能夠進(jìn)行比較。標(biāo)準(zhǔn)化軌 跡數(shù)據(jù)后,通過選定的核函數(shù)將軌跡數(shù)據(jù)映射到高維線性的特征空間中,根據(jù)給定的提取 率提取軌跡的主要特征分量,最后通過特征空間映射得到新的軌跡數(shù)據(jù)集合,再對(duì)每一條 軌跡進(jìn)行無監(jiān)督學(xué)習(xí),判定每條軌跡是否是異常軌跡。
[0021] 在進(jìn)行空間映射時(shí),可以通過控制核函數(shù)的寬度σ將原始軌跡數(shù)據(jù)映射到不同 的高維特征空間中。對(duì)軌跡的主要特征分量提取時(shí),可以控制提取率的大小以便得到不同 的主分量用于后續(xù)處理。
[0022] 優(yōu)點(diǎn):該方法對(duì)異常軌跡的檢測范圍在傳統(tǒng)的空間位置上進(jìn)行了擴(kuò)展,可以從軌 跡點(diǎn)的其他特性方面進(jìn)行異常檢測,例如軌跡點(diǎn)的速度、方向等,在加入額外檢測因素時(shí)不 需要對(duì)方法進(jìn)行任何改變,方法采用合適的核函數(shù),能夠有效地運(yùn)用到軌跡長度差異較大 的軌跡數(shù)據(jù)集中。最終異常軌跡檢測也更加準(zhǔn)確有效。
【附圖說明】
[0023] 圖1為本發(fā)明算法流程圖。
[0024] 圖2為本發(fā)明第二實(shí)施例算法流程圖。
[0025] 圖3為TOD-KPCA算法檢測效果圖。
[0026] 圖4為本發(fā)明算法檢測效果圖。
【具體實(shí)施方式】
[0027] 實(shí)施例1 : 一種能夠在多因素方面檢測異常軌跡,并且能夠應(yīng)用到軌跡長度差異 較大的軌跡數(shù)據(jù)集的異常檢測的方法;該方法中,利用FGAK核函數(shù)構(gòu)建核矩陣K,將原始軌 跡空間中的軌跡點(diǎn)數(shù)據(jù)映射到高維軌跡特征空間中,將原始非線性的軌跡數(shù)據(jù)轉(zhuǎn)換為高維 特征空間中線性的特征數(shù)據(jù),以便更好地提取軌跡數(shù)據(jù)特征;將軌跡數(shù)據(jù)映射到高維特征 空間后,采用KPCA對(duì)軌跡數(shù)據(jù)核矩陣K進(jìn)行特征提取;獲得軌跡的特征數(shù)據(jù)后,利用一類支 持向量機(jī)對(duì)軌跡進(jìn)行分類,通過設(shè)定核函數(shù)寬度σ、三角參數(shù)T以及提取率P,對(duì)提取后的 軌跡特征數(shù)據(jù)進(jìn)行無監(jiān)督學(xué)習(xí),在無監(jiān)督學(xué)習(xí)時(shí),通過決策函數(shù)判斷某條軌跡是否為異常 軌跡,以如下步驟實(shí)現(xiàn):
[0028] (1)從軌跡數(shù)據(jù)集合中讀取每條軌跡的軌跡點(diǎn)數(shù)據(jù);
[0029] (2)采用Min-max方法標(biāo)準(zhǔn)化每條軌跡;
[0030] (3)利用核函數(shù)FGAK計(jì)算軌跡數(shù)據(jù)映射到高維特征空間后的特征矩陣,即核矩陣 K ;可以通過調(diào)節(jié)核函數(shù)FGAK的寬度〇來獲取不同的核矩陣;
[0031] (4)中心化核矩陣Κ,得到核矩陣KL ;
[0032] (5)計(jì)算核矩陣KL的特征值…,en及對(duì)應(yīng)的特征向量V u…,νη;
[0033] (6)對(duì)特征值ei,…,%進(jìn)行降序排序;
[0034] (7)正交化特征向量,得到正交化后的特征向量V1, ...,Vn;
[0035] (8)累加每個(gè)特征屬性的貢獻(xiàn)率P1, ...,pn,根據(jù)給定的提取率P,如果Pt>P (Pt = P1+. . . +Pt),則提取前t個(gè)主分量α . . .,a t;
[0036] (9)計(jì)算特征空間上的投影Y = KL· α,其中,α = (Ci1,..., at)
[0037] (10)通過(9)得到新的軌跡數(shù)據(jù)集Z HZiKU,其中x i代表一條軌跡的特征向量, X i= { a . . .,a t},其中a A表軌跡X i的第t個(gè)主分量;
[0038] (11)對(duì)于數(shù)據(jù)集XiE X中每條軌跡樣本X i,利用決策函數(shù)判斷Xi是否為異常 軌跡,如果是,則將軌跡X ^乍為一條異常軌跡輸出,并設(shè)置相應(yīng)的軌跡標(biāo)簽label -1。
[0039] 具體方法如下:
[0040] 該基于FGAK的異常軌跡檢測方法,首先采用Min-max方法標(biāo)準(zhǔn)化每條軌跡。所 述軌跡點(diǎn)數(shù)據(jù)包括軌跡點(diǎn)的經(jīng)度X、煒度y、速度V和方向d ;Min-max方法就是將軌跡點(diǎn)
集合k V V 中的值映射到0和1之間,具體計(jì)算:公式為 \xnyt->vr<ath=i
[0041] 然后對(duì)標(biāo)準(zhǔn)化后的軌跡數(shù)據(jù)利用FGAK核函數(shù)進(jìn)行空間轉(zhuǎn)換,將原始軌