国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      基于夾角dtw距離的衛(wèi)星遙測數(shù)據(jù)自適應層次聚類方法

      文檔序號:9327377閱讀:586來源:國知局
      基于夾角dtw距離的衛(wèi)星遙測數(shù)據(jù)自適應層次聚類方法
      【技術領域】
      [0001] 本發(fā)明涉及一種基于夾角DTW距離的衛(wèi)星遙測數(shù)據(jù)自適應層次聚類方法。
      【背景技術】
      [0002] 聚類功能是數(shù)據(jù)挖掘領域中一項重要的基本功能,在聚類的基礎之上可以完成多 種數(shù)據(jù)挖掘任務,比如異常檢測、模式挖掘等等。同時,由于衛(wèi)星遙測數(shù)據(jù)有其自身特點,比 如:參數(shù)多、維度高、存在漂移等,這些特點致使在針對衛(wèi)星遙測數(shù)據(jù)的數(shù)據(jù)挖掘工作中需 要應用更為合理的時間序列相似性度量方法。針對一些復雜或者特點不盡相同的衛(wèi)星遙測 數(shù)據(jù),選取適當?shù)臅r間序列相似性度量方法,可以確保相應的模式挖掘取得更為良好的效 果。
      [0003] 衛(wèi)星遙測數(shù)據(jù)分段后的序列是典型的時間序列具有動態(tài)變化、存在微小偏差的特 點,而傳統(tǒng)的歐式距離是以點距離為基礎的,而點距離只能度量時間序列的靜態(tài)特性,無法 有效體現(xiàn)時間序列的動態(tài)特性,同時,針對存在偏差的時間序列需要采用能夠?qū)崿F(xiàn)異步度 量的度量方法,歐式距離同樣無法實現(xiàn),故傳統(tǒng)的歐式距離不適用于衛(wèi)星遙測數(shù)據(jù)分段后 的時間序列的相似性度量。
      [0004] 另一方面,傳統(tǒng)的層次聚類方法存在需要人工設定聚類數(shù)目的缺陷,若聚類數(shù)目 設定不當將會使得聚類結果不夠理想。

      【發(fā)明內(nèi)容】

      [0005] 本發(fā)明的目的是為了解決傳統(tǒng)的歐式距離存在不適用于衛(wèi)星遙測數(shù)據(jù)分段后的 時間序列的相似性度量和傳統(tǒng)的層次聚類方法存在需要人工設定聚類數(shù)目的問題,而提出 一種基于夾角DTW距離的衛(wèi)星遙測數(shù)據(jù)自適應層次聚類方法。
      [0006] 一種基于夾角DTW距離的衛(wèi)星遙測數(shù)據(jù)自適應層次聚類方法,所述聚類方法通過 以下步驟實現(xiàn):
      [0007] 步驟一、根據(jù)衛(wèi)星遙測數(shù)據(jù)的周期特性對衛(wèi)星遙測歷史數(shù)據(jù)進行分段,得到無類 別標簽的原始時間序列X。= {X(]1,,…,X1J ;其中,η為大于0的正整數(shù),表示時間序列數(shù) 目;
      [0008] 步驟二、依據(jù)原始時間序列的特征,引入時間變量,對無類別標簽的原始時間序列 重新進行表示,得到基于數(shù)值與時間表示的時間序列集合X= (X1,X2,…,XJ ;其中,
      [0009] Xi= {(X L),(xi2, ti2),…,(xim, tim)},表示用數(shù)值與時間表示的時間序列集合 X中的第i個序列,i = 1,2,···,η,πι表示時間序列長度;
      [0010] 步驟三、在數(shù)值與時間表示的時間序列集合X基礎上,用相鄰線段間的夾角構成 的角度序列近似表示得到角度表示的序列集合t ={Χ/,Χ2',···,Χη' };其中,
      [0011] X/ = {aj,αι2',···,Cii0ii2/ },表示角度表示的序列集合X'中的第i個 序列;
      [0012] 步驟四、將角度表示的序列集合t中的序列成員t p 作為計算序列成 員之間夾角DTW距離的輸入,得到序列成員之間夾角DTW距離Cllj= DTWla(X' u ρ, 遍歷所有成員,從而得到由所有的序列成員之間的夾角DTW距離構成的nXn距離矩陣
      [0013] 步驟五、將每個無類別標簽的角度表示的序列集合X'的成員歸為一個類,共得到 η個類,每個類僅包含一個對象,類與類之間的距離就是序列成員之間的夾角DTW距離,并 令R j (n) = 0以保證不會將類別數(shù)為η的情況視為最佳聚類數(shù)目,Rj為類間類內(nèi)距離比值 序列,用于評估聚類質(zhì)量,R 1序列長度為n,R : (η)表示R1中的第η個元素;
      [0014] 步驟六、將夾角DTW距離最小的兩個類作為最接近的兩個類進行合并,形成一個 新類,則類的總數(shù)減少一個,此時類別數(shù)目為j',計算加權類間夾角DTW距離與加權類內(nèi)夾 角DTW距離之間的比值,即類間類內(nèi)距離比R 1 (j');
      [0015] 步驟七、將步驟六中未合并的類作為舊類,重新計算新類與所有舊類之間的夾角 DTW距離,更新距離矩陣;
      [0016] 步驟八、重復步驟六和步驟七的過程,對所有可能的類別都遍歷一遍直到合并成 一個類別為止,并令R1(I) = 〇以避免將類別數(shù)為1的情況視為最佳聚類數(shù)目;
      [0017] 步驟九、獲取&序列中前半段序列
      的最大值I^(C);其 中,最大值R1 (C)對應的c即為最佳的聚類數(shù)目,并獲得對應c類的角度表示的序列集合X' 聚類后類別標簽L = ΙΛ,I2,…,IJ,完成自適應層次聚類過程。
      [0018] 本發(fā)明的有益效果為:
      [0019] 本文根據(jù)衛(wèi)星遙測數(shù)據(jù)的周期特性對衛(wèi)星遙測數(shù)據(jù)進行分段,分段后得到的子 序列具有存在微小偏差的特點;再采用能夠?qū)崿F(xiàn)異步度量的動態(tài)時間規(guī)整(Dynamic Time Warping,DTW)距離對衛(wèi)星遙測數(shù)據(jù)時間序列轉換后得到的夾角序列進行度量,結合自適應 層次聚類算法對衛(wèi)星遙測數(shù)據(jù)歷史數(shù)據(jù)進行聚類,得到衛(wèi)星正常運行模式。各部分的具體 發(fā)明效果如下:
      [0020] 首先,采用夾角DTW距離對衛(wèi)星遙測數(shù)據(jù)分段后的時間序列之間的距離進行度 量,能有效體現(xiàn)時間序列的動態(tài)特性同時實現(xiàn)異步度量,解決了由于時間序列存在微小偏 移而使度量結果不夠確的問題。
      [0021] 其次,針對層次聚類需要人工設定聚類數(shù)目的問題,提出了一種以類間類內(nèi)距離 比值為評價標準的自適應層次聚類方法,使層次聚類算法能夠自動確定最優(yōu)類別數(shù)目,避 免了由于人工設定聚類數(shù)目不當?shù)那闆r導致的聚類結果以及異常檢測結果不夠理想的問 題。
      【附圖說明】
      [0022] 圖1為本發(fā)明基于夾角DTW距離的衛(wèi)星遙測數(shù)據(jù)自適應層次聚類方法的流程框 圖;
      [0023] 圖2為選擇FaceUCR數(shù)據(jù)集對公開數(shù)據(jù)集進行驗證的結果;
      [0024] 圖3為選擇SonyAlBORobotSurface數(shù)據(jù)集對公開數(shù)據(jù)集進行驗證的結果;
      [0025] 圖4為選擇fish數(shù)據(jù)集對公開數(shù)據(jù)集進行驗證的結果;
      [0026] 圖5為選擇TwoLeadECG數(shù)據(jù)集對公開數(shù)據(jù)集進行驗證的結果;
      [0027] 圖6為進行自適應層次聚類方法的有效性驗證仿真數(shù)據(jù);
      [0028] 圖7為對仿真數(shù)據(jù)采用自適應層次聚類的處理結果的聚類質(zhì)量曲線;
      [0029] 圖8為仿真數(shù)據(jù)進行聚類的聚類結果;
      [0030] 圖9為針對衛(wèi)星遙測數(shù)據(jù)開展基于夾角DTW距離的自適應層次聚類方法應用實驗 數(shù)據(jù)示例;
      [0031] 圖10為采用基于夾角DTW距離的自適應層次聚類方法將飛輪轉速D測試參量的 20個時間序列識別為兩類的示意。
      【具體實施方式】
      【具體實施方式】 [0032] 一:
      [0033] 本實施方式的一種基于夾角DTW距離的衛(wèi)星遙測數(shù)據(jù)自適應層次聚類方法,如圖 1所示的流程圖,所述聚類方法通過以下步驟實現(xiàn):
      [0034] 步驟一、根據(jù)衛(wèi)星遙測數(shù)據(jù)的周期特性對衛(wèi)星遙測歷史數(shù)據(jù)進行分段,得到無類 別標簽的原始時間序列X。= {X(]1,,…,X1J ;其中,η為大于0的正整數(shù),表示時間序列數(shù) 目;
      [0035] 步驟二、依據(jù)原始時間序列的特征,引入時間變量,對無類別標簽的原始時間序列 重新進行表示,得到基于數(shù)值與時間表示的時間序列集合X= (X1, X2,…,XJ ;其中,
      [0036] Xi= {(X L),(xi2, ti2),…,(xim, tim)},表示用數(shù)值與時間表示的時間序列集合 X中的第i個序列,i = 1,2,···,η,πι表示時間序列長度;
      [0037] 步驟三、在數(shù)值與時間表示的時間序列集合X基礎上,用相鄰線段間的夾角構成 的角度序列近似表示得到角度表示的序列集合t ={Χ/,Χ2',···,Χη' };其中,
      [0038] X/ = {aj,αι2',···,Cil0ii2/ },表示角度表示的序列集合X'中的第i個 序列;
      [0039] 步驟四、將角度表示的序列集合t中的序列成員t p ^乍為計算序列成 員之間夾角DTW距離的輸入,得到序列成員之間夾角DTW距離Cllj= DTWla(X' u j), 遍歷所有成員,從而得到由所有的序列成員之間的夾角DTW距離構成的nXn距離矩陣
      [0040] 步驟五、將每個無類別標簽的角度表示的序列集合t的成員歸為一個類,共得到 η個類,每個類僅包含一個對象,類與類之間的距離就是序列成員之間的夾角DTW距離,并 令R j (n) = 0以保證不會將類別數(shù)為η的情況視為最佳聚類數(shù)目,Rj為類間類內(nèi)距離比值 序列,用于評估聚類質(zhì)量,R 1序列長度為n,R : (η)表示R1中的第η個元素;
      [0041] 步驟六、將夾角DTW距離最小的兩個類作為最接近的兩個類進行合并,形成一個 新類,則類的總數(shù)減少一個,此時類別數(shù)目為j',計算加權類間夾角DTW距離與加權類內(nèi)夾 角DTW距離之間的比值,即類間類內(nèi)距離比R 1 (j');
      當前第1頁1 2 3 
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會獲得點贊!
      1