一種基于神經(jīng)網(wǎng)絡(luò)自學(xué)習(xí)的故障識別方法及系統(tǒng)的制作方法
【專利摘要】本發(fā)明公開了一種基于神經(jīng)網(wǎng)絡(luò)自學(xué)習(xí)的故障識別方法及系統(tǒng)。本方法為:1)監(jiān)測和采集設(shè)定的軌道交通設(shè)備的各種監(jiān)測量,并將采集到的監(jiān)測數(shù)據(jù)轉(zhuǎn)化為適于神經(jīng)網(wǎng)絡(luò)訓(xùn)練的樣本數(shù)據(jù);2)根據(jù)故障類別對所述樣本數(shù)據(jù)進(jìn)行分類,得到每一故障類別對應(yīng)的樣本數(shù)據(jù)集;3)根據(jù)每一故障類別分別設(shè)計一神經(jīng)網(wǎng)絡(luò),然后利用該故障的樣本數(shù)據(jù)集進(jìn)行訓(xùn)練,得到該故障類別的識別模型;4)將所有故障類別的識別模型融合為一個神經(jīng)網(wǎng)絡(luò),對實時采集的監(jiān)測數(shù)據(jù)進(jìn)行故障識別。本發(fā)明可以從容的應(yīng)復(fù)雜的設(shè)備故障和行車事故原因。
【專利說明】—種基于神經(jīng)網(wǎng)絡(luò)自學(xué)習(xí)的故障識別方法及系統(tǒng)【技術(shù)領(lǐng)域】
[0001]本發(fā)明提供一種基于神經(jīng)網(wǎng)絡(luò)自學(xué)習(xí)的故障識別方法及系統(tǒng),涉及鐵路信號數(shù)據(jù)、鐵路通信數(shù)據(jù)、鐵路知識數(shù)據(jù)、系統(tǒng)報警數(shù)據(jù)、機(jī)器學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)、自學(xué)習(xí)、專家系統(tǒng)等【技術(shù)領(lǐng)域】,用以解決軌道交通監(jiān)測數(shù)據(jù)的數(shù)據(jù)分析所面臨的問題。
【背景技術(shù)】
[0002]為了提高我國鐵路信號系統(tǒng)設(shè)備的現(xiàn)代化維修水平,從90年代開始,先后自主研制了 Tjwx-1型和TJWX-2000型等不斷升級中的信號集中監(jiān)測CSM系統(tǒng)。目前大部分車站都采用了計算機(jī)監(jiān)測系統(tǒng),實現(xiàn)了對車站信號設(shè)備狀態(tài)的實時監(jiān)測,并通過監(jiān)測與記錄信號設(shè)備的主要運行狀態(tài),為電務(wù)部門掌握設(shè)備的當(dāng)前狀態(tài)和進(jìn)行事故分析提供了基本依據(jù),發(fā)揮了重要作用。并且,對城市軌道交通信號設(shè)備,集中監(jiān)測CSM系統(tǒng)也被廣泛部署在城軌集中站/車輛段等處,供城軌運維使用。
[0003]但是,針對很多復(fù)雜設(shè)備故障和行車事故原因的診斷方面,該系統(tǒng)卻無能為力,目前仍需依靠人工經(jīng)驗分析判斷,很多情況下只有在出現(xiàn)重大問題時才發(fā)現(xiàn)故障,不僅導(dǎo)致了人工診斷鐵路信號系統(tǒng)故障時工作量大、故障監(jiān)測與診斷效率低下等技術(shù)問題,而且增加了行車的危險。
[0004]神經(jīng)網(wǎng)絡(luò)又稱人工神經(jīng)網(wǎng)絡(luò),它是一種模仿動物神經(jīng)網(wǎng)絡(luò)行為特征,進(jìn)行分布式并行信息處理的算法學(xué)習(xí)模型。是由大量簡單的處理單元(神經(jīng)元)相互連接而形成的復(fù)雜網(wǎng)絡(luò),通過內(nèi)部復(fù)雜的連接,模擬出各種復(fù)雜的函數(shù)用于各類數(shù)據(jù)分析問題。神經(jīng)網(wǎng)絡(luò)一般分為輸入層、隱藏層和輸出層,輸入層包括大量的神經(jīng)元用于接受大量的非線性輸入信息;隱藏層包括一層或者多層神經(jīng)元,通過本層與其他層級的神經(jīng)元連接模擬各種模型;輸出層,信息在神經(jīng)元鏈接中傳輸、分析、權(quán)衡,形成輸出結(jié)果。神經(jīng)網(wǎng)絡(luò)按照隱藏層的層數(shù)又分為單層神經(jīng)網(wǎng)絡(luò)和多層神經(jīng)網(wǎng)絡(luò)。
【發(fā)明內(nèi)容】
[0005]為了解決現(xiàn)有技術(shù)中人工診斷鐵路信號系統(tǒng)故障時工作量大、效率低下、風(fēng)險性高等技術(shù)問題,本發(fā)明提供了一種基于神經(jīng)網(wǎng)絡(luò)自學(xué)習(xí)的故障識別方法及系統(tǒng)。系統(tǒng)包括數(shù)據(jù)采集、數(shù)據(jù)預(yù)處理、特征選擇、模型訓(xùn)練、實時數(shù)據(jù)分析和自學(xué)習(xí)六個部分。
[0006]本發(fā)明采用的技術(shù)方案如下:
[0007]一種基于神經(jīng)網(wǎng)絡(luò)自學(xué)習(xí)的故障識別方法,其步驟包括:
[0008]I)數(shù)據(jù)采集:系統(tǒng)首先通過CSM系統(tǒng)監(jiān)測和采集軌道交通設(shè)備的各種監(jiān)測量,得到系統(tǒng)在運行過程中的樣本數(shù)據(jù);CSM包括存儲的歷史采集數(shù)據(jù)及實時監(jiān)測數(shù)據(jù),歷史監(jiān)測數(shù)據(jù)包括故障以及在故障發(fā)生時各個監(jiān)測設(shè)備采集到的數(shù)據(jù),用于神經(jīng)網(wǎng)絡(luò)的訓(xùn)練;實時監(jiān)測數(shù)據(jù)用于故障分析和預(yù)警;
[0009]2)數(shù)據(jù)預(yù)處理:對于采集到的監(jiān)測數(shù)據(jù)首先要對數(shù)據(jù)進(jìn)行去噪、歸一化、VSM格式化預(yù)處理步驟,將采集到的監(jiān)測數(shù)據(jù)轉(zhuǎn)化為適于數(shù)據(jù)挖掘的數(shù)據(jù)格式;[0010]3)特征選擇:系統(tǒng)通過采集及預(yù)處理監(jiān)測數(shù)據(jù),得到大量的訓(xùn)練樣本數(shù)據(jù),對于一種故障來說,僅與部分監(jiān)測數(shù)據(jù)相關(guān),因此需要根據(jù)專家知識和實踐經(jīng)驗將相關(guān)的監(jiān)測數(shù)據(jù)抽取出來作為神經(jīng)網(wǎng)絡(luò)的輸入;
[0011]4)模型訓(xùn)練:神經(jīng)網(wǎng)絡(luò)包含輸入層、隱藏層和輸出層,通過系統(tǒng)內(nèi)各層之間神經(jīng)元之間的連接來逼近各種函數(shù)。步驟3)分析得到的樣本數(shù)據(jù)作為輸入,結(jié)合已有的各類專家知識,通過輸入層進(jìn)入神經(jīng)網(wǎng)絡(luò)系統(tǒng),然后根據(jù)輸出層的結(jié)果和樣本的校正來對各個層的權(quán)重進(jìn)行校正,從而建立模型。系統(tǒng)會根據(jù)每種故障分別設(shè)計一個神經(jīng)網(wǎng)絡(luò),然后利用該故障的數(shù)據(jù)進(jìn)行訓(xùn)練,得到相應(yīng)的模型,然后通過增加一個隱藏層的方式將所有的模型融合為一個神經(jīng)網(wǎng)絡(luò);
[0012]5)實時數(shù)據(jù)分析:CSM系統(tǒng)采集到的實時監(jiān)測數(shù)據(jù)經(jīng)過預(yù)處理、特征選擇等步驟后,作為步驟4)建立好的模型的輸入,經(jīng)過神經(jīng)網(wǎng)絡(luò)的各層神經(jīng)元的連接轉(zhuǎn)換后,通過輸出層將分析結(jié)果輸出,可以推算是是否出現(xiàn)故障以及故障的具體類型及原因;
[0013]6)自學(xué)習(xí):神經(jīng)網(wǎng)絡(luò)在經(jīng)過訓(xùn)練集訓(xùn)練之后并不是一成不變的,會根據(jù)實時監(jiān)測及故障的情況不斷的自我適應(yīng)及完善,如在不同的季節(jié)監(jiān)測數(shù)據(jù)會發(fā)生一定范圍的變化,為了更好的進(jìn)行故障預(yù)警和分析,就需要對模型進(jìn)行不斷的修正和完善。
[0014]進(jìn)一步地,步驟I)所述數(shù)據(jù)歸集組件包括歷史監(jiān)測數(shù)據(jù)歸集和實時數(shù)據(jù)歸集,用于對車站、電務(wù)段的集中監(jiān)測系統(tǒng)(CSM)中存儲的歷史監(jiān)測數(shù)據(jù)進(jìn)行采集。
[0015]進(jìn)一步地,步驟2)所述的數(shù)據(jù)預(yù)處理包括檢查并處理數(shù)據(jù)中的異常點、檢查數(shù)據(jù)的完整性、對不同車站、電務(wù)段的監(jiān)測信號進(jìn)行融合、對監(jiān)測數(shù)據(jù)進(jìn)行變換、歸一化等操作,統(tǒng)一數(shù)據(jù)的格式和取值范圍。將數(shù)據(jù)轉(zhuǎn)換為向量空間(VSM)格式的數(shù)據(jù),是便于神經(jīng)網(wǎng)絡(luò)對其進(jìn)行分析處理。
[0016]進(jìn)一步地,步驟2)所述的異常點檢查、數(shù)據(jù)完整性包括數(shù)據(jù)跳變、數(shù)據(jù)缺失等情況,但是鐵路監(jiān)測數(shù)據(jù)有時候會隨著季節(jié)溫度的變化出現(xiàn)不同程度的變化,如道岔電流會呈現(xiàn)周期性的曲線變化。進(jìn)一步地,步驟2)所述的數(shù)據(jù)歸一化因為監(jiān)測數(shù)據(jù)保證布爾、模擬量、正負(fù)值等情況,對監(jiān)測數(shù)據(jù)的歸一化需要特殊的處理,以保證神經(jīng)網(wǎng)絡(luò)的準(zhǔn)備性和收斂速度。
[0017]進(jìn)一步的,步驟3)利用利用經(jīng)驗或特征選擇算法選擇出與問題相關(guān)的數(shù)據(jù)。將這些數(shù)據(jù)從原始數(shù)據(jù)中抽取出來,針對每一類故障形成單獨的數(shù)據(jù)集。如分線盒故障,與該故障相關(guān)的包括分線盒受端電壓、刷開電纜端子電壓、送端電壓,通過對采集到的這三個電壓數(shù)據(jù)進(jìn)行預(yù)處理,就可以形成分線盒故障訓(xùn)練數(shù)據(jù),分析的結(jié)果包括無故障、室內(nèi)故障、室外故障、室內(nèi)開路。
[0018]進(jìn)一步地,步驟4)所述的神經(jīng)網(wǎng)絡(luò)分類三類包括前饋神經(jīng)網(wǎng)絡(luò)、反饋神經(jīng)網(wǎng)絡(luò)、自組織型神經(jīng)網(wǎng)絡(luò)。根據(jù)已有的專家知識,我們將故障分為三類,一類是已經(jīng)明確的故障和故障原因,通過前饋型神經(jīng)網(wǎng)絡(luò)建立確定的模型;第二種是部分已知的故障及原因,通過構(gòu)建反饋型神經(jīng)網(wǎng)絡(luò)建立模型,并利用反饋模型的特點,自學(xué)習(xí)的去分析故障及原因;第三者是未知的故障及原因,通過構(gòu)建自組織的神經(jīng)網(wǎng)絡(luò),通過網(wǎng)絡(luò)自身的學(xué)習(xí)建立模型,預(yù)測新的故障及原因。
[0019]更進(jìn)一步地,步驟4)所述的神經(jīng)網(wǎng)絡(luò)進(jìn)行模型訓(xùn)練,因為神經(jīng)網(wǎng)絡(luò)天然的支持并行計算,可以通過編寫并行處理算法來優(yōu)化和加快模型的訓(xùn)練及分析過程。[0020]進(jìn)一步地,步驟5)所述的實時數(shù)據(jù)分析可以通過內(nèi)存數(shù)據(jù)庫、緩存等方式加快計算速度,以提高故障預(yù)警及分析的速度。
[0021 ] 更進(jìn)一步地,步驟2 )到5 )可以利用云平臺對監(jiān)測數(shù)據(jù)進(jìn)行分布式存儲,并利用云平臺的并行計算架構(gòu)加快模型訓(xùn)練和故障分析的速度,也是的系統(tǒng)具有更好的伸縮性。
[0022]更進(jìn)一步地,該系統(tǒng)可以與專家系統(tǒng)相結(jié)合,利用專家系統(tǒng)已有知識庫的優(yōu)點,輔助分析。以實現(xiàn)精確的故障預(yù)警及分析并最大限度的利用已有資源。
[0023]與現(xiàn)有技術(shù)相比,該發(fā)明的優(yōu)點是:
[0024]本發(fā)明加快了故障識別的速度,采用自學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò)算法針對軌道交通監(jiān)測數(shù)據(jù)的分類特點進(jìn)行故障識別,可以加快故障識別的速度,通過對實時監(jiān)測數(shù)據(jù)進(jìn)行分析,可以快速的發(fā)現(xiàn)故障,并識別出故障的類型。
[0025]本發(fā)明通過使用模型識別故障,節(jié)省了大量的人力成本,不再需要人工的去觀察監(jiān)測信息然后進(jìn)行故障識別和分析。
[0026]本發(fā)明通過云平臺對監(jiān)測數(shù)據(jù)進(jìn)行分布式存儲和并行計算,可以解決不斷增加的軌道交通監(jiān)測數(shù)據(jù)的存儲和處理問題。從而可以比較從容的應(yīng)復(fù)雜的設(shè)備故障和行車事故原因。
[0027]在本發(fā)明的基礎(chǔ)上,加入算法的學(xué)習(xí)能力,則可以不斷的提高故障識別的能力,通過不斷的自學(xué)習(xí)可以發(fā)現(xiàn)人工還沒有總結(jié)出現(xiàn)的新故障,以及故障產(chǎn)生的新原因。并且因為部分監(jiān)測數(shù)據(jù)會隨著氣溫、季節(jié)等因素出現(xiàn)不同情況的波動,通過不斷的自學(xué)習(xí)可以更好的適應(yīng)數(shù)據(jù)變化的規(guī)律。
【專利附圖】
【附圖說明】
[0028]圖1是神經(jīng)網(wǎng)絡(luò)的基本流程圖。
[0029]圖2是神經(jīng)元示意圖。
[0030]圖3是本發(fā)明的軌道交通監(jiān)測故障數(shù)據(jù)分類識別分析的流程圖。
[0031]圖4是前反饋神經(jīng)網(wǎng)絡(luò)示意圖。
[0032]圖5是后反饋神經(jīng)網(wǎng)絡(luò)示意圖。
[0033]圖6是自組織神經(jīng)網(wǎng)絡(luò)示意圖。
[0034]圖7是云平臺的架構(gòu)圖。
[0035]圖8聚合形式的神經(jīng)網(wǎng)絡(luò)軌道交通監(jiān)測故障識別流程圖。
[0036]圖9是本發(fā)明實例運維級軌道故障分析的規(guī)則圖。
【具體實施方式】
[0037]下面通過具體實施例和附圖,對本發(fā)明做詳細(xì)的說明。
[0038]本實施例的一種基于神經(jīng)網(wǎng)絡(luò)自學(xué)習(xí)的故障識別方法及系統(tǒng)由以下部分組成:基于CSM的數(shù)據(jù)采集子系統(tǒng)、數(shù)據(jù)預(yù)處理子系統(tǒng)、特征選擇子系統(tǒng)、模型訓(xùn)練子系統(tǒng)、實時數(shù)據(jù)分析子系統(tǒng)及自學(xué)習(xí)子系統(tǒng)。用于解決現(xiàn)有技術(shù)中人工診斷鐵路信號系統(tǒng)故障時工作量大、效率低下、風(fēng)險性高等技術(shù)問題。
[0039]神經(jīng)網(wǎng)絡(luò)主要由神經(jīng)元構(gòu)成,神經(jīng)元的結(jié)構(gòu)如圖2所示,al?an為輸入向量的各個分量[0040]wl~wn為神經(jīng)元各個突觸的權(quán)值
[0041]b為偏置
[0042]f為傳遞函數(shù),通常為非線性函數(shù)。一般有sigmodO,traingd O , tansig O , hardlimO。以下默認(rèn)為 hardlimO。
[0043]t為神經(jīng)元輸出
[0044]數(shù)學(xué)表示t=f (WA'+b)
[0045]暫為權(quán)向量
[0046]瓦為輸入 向量,X,為X的轉(zhuǎn)置
[0047]b為偏置
[0048]f為傳遞函數(shù)
[0049]可見,一個神經(jīng)元的功能是求得輸入向量與權(quán)向量的內(nèi)積后,經(jīng)一個非線性傳遞函數(shù)得到一個標(biāo)量結(jié)果。
[0050]單個神經(jīng)元的作用:把一個η維向量空間用一個超平面分割成兩部分(稱之為判斷邊界),給定一個輸入向量,神經(jīng)元可以判斷出這個向量位于超平面的哪一邊。
[0051]該超平面的方程:\Vp+b=0
[0052]蕾權(quán)向量
[0053]b 偏置
[0054]P超平面上的向量
[0055]神經(jīng)網(wǎng)絡(luò)首先要以一定的學(xué)習(xí)準(zhǔn)則進(jìn)行學(xué)習(xí),然后才能工作。以神經(jīng)網(wǎng)絡(luò)對手寫
兩個字母的識別為例進(jìn)行說明,規(guī)定當(dāng)“A”輸入網(wǎng)絡(luò)時,應(yīng)該輸出“1”,而當(dāng)輸入為
“B”時,輸出為“O”。
[0056]所以網(wǎng)絡(luò)學(xué)習(xí)的準(zhǔn)則應(yīng)該是:如果網(wǎng)絡(luò)作出錯誤的判決,則通過網(wǎng)絡(luò)的學(xué)習(xí),應(yīng)使得網(wǎng)絡(luò)減少下次犯同樣錯誤的可能性。首先,給網(wǎng)絡(luò)的各連接權(quán)值賦予(0,1)區(qū)間內(nèi)的隨機(jī)值,將“A”所對應(yīng)的圖象模式輸入給網(wǎng)絡(luò),網(wǎng)絡(luò)將輸入模式加權(quán)求和、與門限比較、再進(jìn)行非線性運算,得到網(wǎng)絡(luò)的輸出。在此情況下,網(wǎng)絡(luò)輸出為“I”和“O”的概率各為50%,也就是說是完全隨機(jī)的。這時如果輸出為“I”(結(jié)果正確),則使連接權(quán)值增大,以便使網(wǎng)絡(luò)再次遇到“A”模式輸入時,仍然能作出正確的判斷。
[0057]神經(jīng)網(wǎng)絡(luò)通過學(xué)習(xí)和訓(xùn)練改變神經(jīng)元之間的連接,以及連接之間的權(quán)重,以適應(yīng)周圍的環(huán)境要求。使用相同的初始網(wǎng)絡(luò)配置通過不同的訓(xùn)練集進(jìn)行學(xué)習(xí),得到的神經(jīng)網(wǎng)絡(luò)是完全不同的。神經(jīng)網(wǎng)絡(luò)是一個具有學(xué)習(xí)能力的系統(tǒng),可以發(fā)展知識,以致超過設(shè)計者原有的知識水平。通常,它的學(xué)習(xí)訓(xùn)練方式可分為兩種,一種是有監(jiān)督的學(xué)習(xí),這時利用給定的樣本標(biāo)準(zhǔn)進(jìn)行分類或模仿;另一種是無監(jiān)督學(xué)習(xí)的學(xué)習(xí),這時,只規(guī)定學(xué)習(xí)方式或某些規(guī)貝U,則具體的學(xué)習(xí)內(nèi)容隨系統(tǒng)所處環(huán)境(即輸入信號情況)而異,系統(tǒng)可以自動發(fā)現(xiàn)環(huán)境特征和規(guī)律性,具有更近似人腦的功能。神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)特點決定了它比較適合使用分布式存儲及并行計算。
[0058]神經(jīng)網(wǎng)絡(luò)的這些特點很適合軌道交通的故障分析和預(yù)警,系統(tǒng)通過CSM可以獲取海量的監(jiān)測數(shù)據(jù)。并行神經(jīng)網(wǎng)絡(luò)的兩種學(xué)習(xí)方式可以訓(xùn)練已知的故障分析,也可以通過不斷的學(xué)習(xí)挖掘到新的故障類型和原因。
[0059]故障識別模型主要由三個步驟:一個是數(shù)據(jù)準(zhǔn)備階段,將原始的監(jiān)測數(shù)據(jù)進(jìn)行預(yù)處理、特征選擇和格式轉(zhuǎn)換,獲取神經(jīng)網(wǎng)絡(luò)可以處理的訓(xùn)練集;二是根據(jù)給定的訓(xùn)練集找到合適的神經(jīng)網(wǎng)絡(luò)層數(shù)及參數(shù);三是使用第一步訓(xùn)練完成的函數(shù)模型分析實時監(jiān)測數(shù)據(jù),以得到系統(tǒng)是否出現(xiàn)故障以及故障產(chǎn)生的原因。
[0060]1、數(shù)據(jù)采集子系統(tǒng)
[0061]數(shù)據(jù)采集子系統(tǒng)通過與鐵路總公司、鐵路局、電務(wù)段的CSM系統(tǒng)連接,獲取存儲在CSM中的歷史監(jiān)測數(shù)據(jù)及實時獲取的監(jiān)測數(shù)據(jù)。歷史監(jiān)測數(shù)據(jù)在模型訓(xùn)練階段使用,用于對模型進(jìn)行訓(xùn)練以得到分類模型;訓(xùn)練得到的模型用于對實時監(jiān)測數(shù)據(jù)進(jìn)行分類,以得到系統(tǒng)當(dāng)前的運行狀態(tài),如是否有故障以及故障的原因等。
[0062]2、數(shù)據(jù)預(yù)處理子系統(tǒng)
[0063]數(shù)據(jù)預(yù)處理子系統(tǒng)對采集到的監(jiān)測數(shù)據(jù)進(jìn)行處理,包括數(shù)據(jù)去噪、數(shù)據(jù)格式化、歸一化等操作,將數(shù)據(jù)轉(zhuǎn)化為空間向量格式的數(shù)據(jù)。這種格式的數(shù)據(jù)便于后續(xù)進(jìn)行特征選擇及神經(jīng)網(wǎng)絡(luò)處理。
[0064]監(jiān)測數(shù)據(jù)包括布爾量、模擬量,不同數(shù)據(jù)之間的差異較大,并且數(shù)據(jù)的取值范圍區(qū)別較大,而且部分監(jiān)測數(shù)據(jù)如氣溫、水溫等還包括負(fù)值。針對這種情況,針對不同的數(shù)據(jù)類型分別設(shè)計歸一化算法:
[0065](1)布爾量
[0066]當(dāng)數(shù)據(jù)的取值只包含兩個值時,將對應(yīng)的數(shù)據(jù)歸一化為_1、1兩個值;
[0067](2)僅包含正數(shù)的模擬量
[0068]y=2*(x-min)/(max-min) -1,這條公式將數(shù)據(jù)歸一化到[_1,I]區(qū)間。
[0069](3)包含正負(fù)數(shù)的模擬量
[0070]y=x/I max I,這條公式也將數(shù)據(jù)規(guī)劃到[_1,I]區(qū)間。
[0071]3、特征選擇子系統(tǒng)
[0072]CSM采集到的信號較多,并且有些信號屬于冗余信號。這些信號轉(zhuǎn)換為特征之后,對其進(jìn)行相似度計算,然后去除冗余特征,這樣可以很大程度上減少計算和處理量。
[0073]與一般的相似度計算方法不同,CSM采集到的很多都是電壓、電流信號,這些信號具有連續(xù)性和相關(guān)性,比如A點的電流增加,那么與其直接相連的B點的電流也會隨之增大。由此特點可知,A點的電流值可以代替B點的電流值的變化趨勢,則B為A的冗余特征。通過電壓、電流之間的相關(guān)性,來進(jìn)行特征選擇,具體的計算方法如下:
[0074]Va, Vb分別代表采集點a、b的值,首先對Va,Vb進(jìn)行歸一化,也就是兩個特征的取值范圍相同,限制在[0,I]。然后對特征進(jìn)行計算:
Ση j A' Cf..,
[0076]其中η為訓(xùn)練集中包含的Na、Vb的個數(shù),通過歸一化,Va和Vb的取值范圍相同,如果上述公式的值小于給定的閾值的話,則Va,Vb屬于冗余特征,可以去掉Vb值保留Va的值。閾值的選取主要取決于采集點噪音的情況,當(dāng)噪音較大且較多的時候,閾值需要設(shè)置的較大,反之亦然。通過上述步驟,可以大量減少冗余特征。[0077]特征選擇子系統(tǒng)用于對預(yù)處理之后的空間向量數(shù)據(jù)進(jìn)行處理,因為僅有部分監(jiān)測數(shù)據(jù)跟一個特定的故障相關(guān),需要根據(jù)已有的知識,整理出來與故障相關(guān)的特征,形成故障特征庫。對于未使用到的特征可以用于無監(jiān)督學(xué)習(xí),用于發(fā)現(xiàn)新的知識。
[0078]4、模型訓(xùn)練子系統(tǒng)
[0079]由本文前面的章節(jié)可知,本系統(tǒng)中神經(jīng)網(wǎng)絡(luò)分類三類:前饋神經(jīng)網(wǎng)絡(luò)、反饋神經(jīng)網(wǎng)絡(luò)、自組織神經(jīng)網(wǎng)絡(luò),三種模型的設(shè)計分別如下:
[0080](I)前饋神經(jīng)網(wǎng)絡(luò)
[0081]根據(jù)已有的專家知識,可以總結(jié)出一些確定的故障,以及引起該故障的具體原因,因此該模型的作用在于根據(jù)訓(xùn)練數(shù)據(jù)得到確定的模型及參數(shù),然后利用模型對實時監(jiān)測到的數(shù)據(jù)進(jìn)行分析和預(yù)警。前饋神經(jīng)網(wǎng)絡(luò)的模型如圖4所示。是一個3層的前饋神經(jīng)網(wǎng)絡(luò),其中第一層是輸入單兀,第二層稱為隱含層,第三層稱為輸出層。對于一個3層的前饋神經(jīng)網(wǎng)絡(luò),若用X表示網(wǎng)絡(luò)的輸入向量,Wl~W3表示網(wǎng)絡(luò)各層的連接權(quán)向量,f(x)示神經(jīng)網(wǎng)絡(luò)3層的作用函數(shù)。
[0082]W權(quán)重進(jìn)行隨機(jī)初始化;
[0083]隱含層對應(yīng)的神經(jīng)元節(jié)點輸出模型:0j=f ( Σ WijXX1-qj) ;ffij為第i層第j個節(jié)點的權(quán)重;
[0084]輸出節(jié)點輸出模型:Yk=f ( Σ TjkX0j-qk)其中Yk表示輸出層的第k個節(jié)點;Tjk表示的是隱含層節(jié)點j與輸出層節(jié)點k之間連接的權(quán)重;qk這里是正則因子,Xi為第i層的輸入數(shù)據(jù);
[0085]f_為非線形作用函數(shù):f(x)=l/(l+e-x)
[0086]誤差計算模型是反映神經(jīng)網(wǎng)絡(luò)期望輸出與計算輸出之間誤差大小的函數(shù):
[0087]其中幻為輸出層節(jié)點.?的預(yù)期值;oj為輸出層節(jié)點j的實際值;
[0088]通過誤差來重新調(diào)整權(quán)重:
[0089]Affij(n+l)=hXEpXOj+aX Affij (η)其中η表示迭代次數(shù),在訓(xùn)練的過程中η+1次的權(quán)重,是根據(jù)第η次迭代的權(quán)重以及輸出值與期望值之間的差別進(jìn)行計算的;Δ Wij (η)為第η此迭代時第i層第j個節(jié)點的權(quán)重變化量。
[0090]其中h-學(xué)習(xí)因子;Ep_輸出節(jié)點i的計算誤差;0j_輸出節(jié)點j的計算輸出;a-動
量因子。
[0091]通過上述步驟,可以得到確定的神經(jīng)網(wǎng)絡(luò)模型及參數(shù),這個神經(jīng)網(wǎng)絡(luò)可以針對任意確定的故障進(jìn)行訓(xùn)練,都可以得到針對本故障的分析模型。
[0092]如上述的分線盒故障是一類已知的故障,相應(yīng)的采集數(shù)據(jù)為分線盒受端電壓、刷開電纜端子電壓、送端電壓,通過對采集到的電壓數(shù)據(jù)進(jìn)行預(yù)處理,形成訓(xùn)練數(shù)據(jù)。
[0093]構(gòu)建三層神經(jīng)網(wǎng)絡(luò),電壓作為輸入層;
[0094]利用經(jīng)驗公式nl=sqrt(n+m)+d確定神經(jīng)元的個數(shù),nl為隱層單元數(shù)
[0095]η為輸入單元數(shù)
[0096]m為輸出單元數(shù)
[0097]d為O到10之間的常數(shù)[0098]該故障n=3,m=4, d設(shè)置為5。從而得到神經(jīng)元nl的個數(shù)為7。
[0099]輸入層與隱藏層以及隱藏層與輸出層之間的權(quán)重進(jìn)行隨機(jī)的初始化,取值范圍在(O, I)之間,傳遞函數(shù)使用sigmod函數(shù)。那么形成的即為一個三層神經(jīng)網(wǎng)絡(luò),輸入層包含三個階段、隱藏層包含7個節(jié)點、輸出層包含4個節(jié)點,然后利用訓(xùn)練數(shù)據(jù)進(jìn)行訓(xùn)練,得到神經(jīng)網(wǎng)絡(luò)的所有參數(shù)。神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)如圖9所示。
[0100]最后利用得到的神經(jīng)網(wǎng)絡(luò)對實時監(jiān)測的數(shù)據(jù),作為輸入,然后根據(jù)神經(jīng)網(wǎng)絡(luò)的輸出就可以進(jìn)行判斷是否有故障,以及故障的類型。
[0101](2)反饋神經(jīng)網(wǎng)絡(luò)。
[0102]根據(jù)現(xiàn)場技術(shù)人員已有的經(jīng)驗,可以知道一些故障,但是對故障產(chǎn)生的原因認(rèn)識不全面,只能夠了解產(chǎn)生故障的部分原因。這時候反饋神經(jīng)網(wǎng)絡(luò)的模型的作用就體現(xiàn)出來。
[0103]反饋神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)如圖5所示,假設(shè)有η個輸入(II,12..,In),m個輸出(01,o2,..0m),通過反饋計算每個輸入對不同類型故障輸出結(jié)果的影響。
[0104]R⑴+=(0「0Η)* (It-1w)其中,Ot為t時刻的輸出,It為t時刻的輸入值,通過訓(xùn)練集的計算,就可以得到一個向量,記錄了輸入數(shù)據(jù)a與輸出值ο之間的相關(guān)度,然后去掉相關(guān)度小的輸入數(shù)據(jù),不斷的進(jìn)行計算,不斷的去完善故障與特征的相關(guān)度,直到與故障相關(guān)的特征全部確定。這樣最終剩下的數(shù)據(jù)均是與該故障相關(guān)的數(shù)據(jù)。
[0105]輸入數(shù)據(jù)除了已知的相關(guān)數(shù)據(jù)外,盡可能多的使用可能相關(guān)的監(jiān)測數(shù)據(jù)作為輸入特征。
[0106]不僅可以根據(jù)已有的訓(xùn)練數(shù)據(jù)進(jìn)行模型的訓(xùn)練,還可以根據(jù)得到的實時數(shù)據(jù)和狀態(tài),不斷的去分析和挖掘故障與監(jiān)測數(shù)據(jù)之間的關(guān)系,從而不斷的改進(jìn)模型。圖5是反饋神經(jīng)網(wǎng)絡(luò)模型示意圖。
[0107]與前饋神經(jīng)網(wǎng)絡(luò)的最大卻別在于,它不僅會利用歷史監(jiān)測數(shù)據(jù)進(jìn)行學(xué)習(xí),而且會利用實時監(jiān)測數(shù)據(jù)進(jìn)行訓(xùn)練,當(dāng)出現(xiàn)故障的時候,人工對故障進(jìn)行標(biāo)注,形成故障樣本。圖5中的反饋數(shù)據(jù)作為模型的數(shù)據(jù),該模型就會自動的去學(xué)習(xí)和完善網(wǎng)絡(luò),以實現(xiàn)故障分析的能力。
[0108]( 3 )自組織神經(jīng)網(wǎng)絡(luò):
[0109]隨著鐵路監(jiān)測系統(tǒng)的不斷發(fā)展,會有更多的監(jiān)測數(shù)據(jù)產(chǎn)生,也可能會出現(xiàn)各類新的故障,為了能夠?qū)收媳U陷^強的識別能力,需要系統(tǒng)有自學(xué)習(xí)的能力,自組織神經(jīng)網(wǎng)絡(luò)通過自動尋找樣本中內(nèi)在的規(guī)律和本質(zhì)屬性,自組織、自適應(yīng)的改變網(wǎng)絡(luò)的參數(shù)與結(jié)果,從而具有新故障識別與分析的能力。
[0110]自組織神經(jīng)網(wǎng)絡(luò)是無導(dǎo)師學(xué)習(xí)網(wǎng)絡(luò)。它通過自動尋找樣本中的內(nèi)在規(guī)律和本質(zhì)屬性,自組織、自適應(yīng)地改變網(wǎng)絡(luò)參數(shù)與結(jié)構(gòu)。如圖6所示:該網(wǎng)絡(luò)包括輸入層和競爭層兩層,在無導(dǎo)師學(xué)習(xí)的情況下,模型具有聚類能力,根據(jù)這個特點系統(tǒng)設(shè)計為將無故障聚為一類,有故障聚類,這樣也可以對故障進(jìn)行識別。
[0111]聚類的目的是將相似的模式樣本劃歸一類,而將不相似的分離開來,實現(xiàn)模式樣本的類內(nèi)相似性和類間分離性。
[0112]這里將故障也作為一個特征進(jìn)行聚類,特征具有時序性,因為故障本身具有一定的時序性,當(dāng)一些采集點出現(xiàn)異常時,故障也才會隨之產(chǎn)生。特征聚類算法設(shè)計思路:
[0113] ?以故障特征作為中心特征進(jìn)行聚類,產(chǎn)生的聚類結(jié)果即為與該故障相關(guān)的特征;
[0114]?對于每個中心點計算所有非故障特征與中心點的相似度,當(dāng)相似度超過一定閾值的時候,該特征就聚為一類;
[0115]?因為有些特征可能與多個故障相關(guān),因此聚類的結(jié)果是可以交叉的,也就是一個特征可以屬于多個中心點;
[0116]?剩余未被分類的特征點直接選擇與其相關(guān)度最大的中心點作為一類即可;
[0117]相似度的計算公式為:
[0118]Cit代表故障i (中心點)在t時刻的取值;Fjt代表特征j在t時刻的取值;
【權(quán)利要求】
1.一種基于神經(jīng)網(wǎng)絡(luò)自學(xué)習(xí)的故障識別方法,其步驟為: 1)監(jiān)測和采集設(shè)定的軌道交通設(shè)備的各種監(jiān)測量,并將采集到的監(jiān)測數(shù)據(jù)轉(zhuǎn)化為適于神經(jīng)網(wǎng)絡(luò)訓(xùn)練的樣本數(shù)據(jù); 2)根據(jù)故障類別對所述樣本數(shù)據(jù)進(jìn)行分類,得到每一故障類別對應(yīng)的樣本數(shù)據(jù)集; 3)根據(jù)每一故障類別分別設(shè)計一神經(jīng)網(wǎng)絡(luò),然后利用該故障的樣本數(shù)據(jù)集進(jìn)行訓(xùn)練,得到該故障類別的識別模型; 4)將所有故障類別的識別模型融合為一個神經(jīng)網(wǎng)絡(luò),對實時采集的監(jiān)測數(shù)據(jù)進(jìn)行故障識別。
2.如權(quán)利要求1所述的方法,其特征在于所述故障類別包括三類,其中第一類為已知的故障及其原因;第二類為部分已知的故障及其原因;第三類為未知的故障及其原因;對于第一類故障類別,通過前饋型神經(jīng)網(wǎng)絡(luò)建立該故障類別的識別模型;對于第二類故障類另O,通過反饋型神經(jīng)網(wǎng)絡(luò)建立該故障類別的識別模型,并分析故障及原因;對于第三類故障類別,通過自組織神經(jīng)網(wǎng)絡(luò)建立該故障類別的識別模型,并分析故障及原因。
3.如權(quán)利要求2所述的方法,其特征在于所述前饋型神經(jīng)網(wǎng)絡(luò)包括三層--第一層是輸入單兀,第二層稱為隱含層,第三層稱為輸出層;其中,隱含層對應(yīng)的神經(jīng)元節(jié)點輸出模型為:Oj=f ( Σ WijXX1-qj),輸出層對應(yīng)的神經(jīng)元節(jié)點輸出模型:Yk=f( Σ TjkXOj-qk),函數(shù) f(x)=l/(l+e_x),誤差計算模型為:
4.如權(quán)利要求2所述的方法,其特征在于所述反饋型神經(jīng)網(wǎng)絡(luò)包括三層:第一層是輸入單元,第二層稱為隱含層,第三層稱為輸出層;所述反饋型神經(jīng)網(wǎng)絡(luò)通過公式R⑴+=(Ot-Cv1)* (It-1w)計算輸入數(shù)據(jù)I與輸出值ο之間的相關(guān)度R (I),去掉相關(guān)度小于設(shè)定閾值的輸入數(shù)據(jù),最終剩下與故障相關(guān)的數(shù)據(jù);其中,ot為t時刻的輸出,It為t時刻的輸入值。
5.如權(quán)利要求2所述的方法,其特征在于所述自組織神經(jīng)網(wǎng)絡(luò)包括輸入層和競爭層兩層;所述自組織神經(jīng)網(wǎng)絡(luò)以故障特征作為中心特征對屬于該故障類別的樣本數(shù)據(jù)集進(jìn)行聚類,其中對每一中心特征,計算所有非故障特征與中心特征的相似度,當(dāng)相似度超過一定閾值的時候,將該特征就聚為一類,最后得到與第三類故障類別相關(guān)的特征;其中,相似度的計算公式為
6.如權(quán)利要求1~5任一所述的方法,其特征在于根據(jù)監(jiān)測數(shù)據(jù)的連續(xù)性和相關(guān)性對所述監(jiān)測數(shù)據(jù)進(jìn)行過濾,其方法為:首先對Va、Vb進(jìn)行歸一化,將其取值范圍歸一化為相同的取值范圍;然后利用公式Va、Vb之間的相關(guān)性,如果計算結(jié)果小于設(shè)定閾值,則Va、Vb屬于冗余特征,去掉Vb、Va中的一個監(jiān)測數(shù)據(jù);其中,Va,Vb分別代表采集點a、b的監(jiān)測數(shù)據(jù)。
7.如權(quán)利要求6所述的方法,其特征在于所述監(jiān)測數(shù)據(jù)包括布爾量、模擬量,對所述監(jiān)測數(shù)據(jù)進(jìn)行歸一化處理;其中,對于布爾量監(jiān)測數(shù)據(jù),將對應(yīng)的數(shù)據(jù)歸一化為_1、1兩個值;對于包含正負(fù)數(shù)的模擬量監(jiān)測數(shù)據(jù),通過公式y(tǒng)=x/|max|將數(shù)據(jù)規(guī)劃到[_1,1]區(qū)間;對于僅包含正數(shù)的模擬量監(jiān)測數(shù)據(jù),通過公式y(tǒng)=2*(X-min)/(maX-min) -1將數(shù)據(jù)歸一化到[-1,I]區(qū)間,I為歸一化后的數(shù)據(jù),X為監(jiān)測數(shù)據(jù),max為監(jiān)測數(shù)據(jù)最大值,min為監(jiān)測數(shù)據(jù)最小值。
8.如權(quán)利要求1~5任一所述的方法,其特征在于將所有故障類別的識別模型融合為一個神經(jīng)網(wǎng)絡(luò)的方法為:對N個模型的輸出進(jìn)行編碼,有故障的表示為1,無故障表示為O ;然后使用一張Hash表對所有模型二進(jìn)制的狀態(tài)進(jìn)行映射,轉(zhuǎn)換為顯示的狀態(tài);其中,每一故障類別的識別模型包括一個或多個模型,N為模型總數(shù)。
9.一種基于神經(jīng)網(wǎng)絡(luò)自學(xué)習(xí)的故障識別系統(tǒng),其特征在于包括數(shù)據(jù)采集子系統(tǒng)、模型訓(xùn)練子系統(tǒng)、實時數(shù)據(jù)分析子系統(tǒng);其中, 所述數(shù)據(jù)采集子系統(tǒng),用于監(jiān)測和采集設(shè)定的軌道交通設(shè)備的各種監(jiān)測量,并將采集到的監(jiān)測數(shù)據(jù)轉(zhuǎn)化為適于神經(jīng)網(wǎng)絡(luò)訓(xùn)練的樣本數(shù)據(jù);并且根據(jù)故障類別對所述樣本數(shù)據(jù)進(jìn)行分類,得到每一故障類別對應(yīng)的樣本數(shù)據(jù)集; 模型訓(xùn)練子系統(tǒng),用于根據(jù)每一故障類別分別設(shè)計一神經(jīng)網(wǎng)絡(luò),然后利用該故障的樣本數(shù)據(jù)集進(jìn)行訓(xùn)練,得到 該故障類別的識別模型,并且將所有故障類別的識別模型融合為一個神經(jīng)網(wǎng)絡(luò);實時數(shù)據(jù)分析子系統(tǒng),用于根據(jù)融合后的神經(jīng)網(wǎng)絡(luò)對實時采集的監(jiān)測數(shù)據(jù)進(jìn)行故障識別。
10.如權(quán)利要求9所述的系統(tǒng),其特征在于還包括一特征選擇子系統(tǒng),用于根據(jù)監(jiān)測數(shù)據(jù)的連續(xù)性和相關(guān)性對所述監(jiān)測數(shù)據(jù)進(jìn)行過濾,所述特征選擇子系統(tǒng)首先對Va、Vb進(jìn)行歸一化,將其取值范圍歸一化為相同的取值范圍;然后利用公式計算Va、Vb之間的相關(guān)性,如果計算結(jié)果小于設(shè)定閾值,則Va、Vb屬于冗余特征,去掉Vb、Va中的一個監(jiān)測數(shù)據(jù);其中,Va,Vb分別代表采集點a、b的監(jiān)測數(shù)據(jù)。
11.如權(quán)利要求9所述的系統(tǒng),其特征在于所述故障類別包括三類,其中第一類為已知的故障及其原因;第二類為部分已知的故障及其原因;第三類為未知的故障及其原因;對于第一類故障類別,通過前饋型神經(jīng)網(wǎng)絡(luò)建立該故障類別的識別模型;對于第二類故障類另O,通過反饋型神經(jīng)網(wǎng)絡(luò)建立該故障類別的識別模型,并分析故障及原因;對于第三類故障類別,通過自組織神經(jīng)網(wǎng)絡(luò)建立該故障類別的識別模型,并分析故障及原因。
【文檔編號】G06N3/02GK103914735SQ201410154817
【公開日】2014年7月9日 申請日期:2014年4月17日 優(yōu)先權(quán)日:2014年4月17日
【發(fā)明者】鮑俠 申請人:北京泰樂德信息技術(shù)有限公司