本發(fā)明涉及數(shù)據(jù)處理,特別涉及一種基于聲紋識(shí)別的智能油氣診斷方法及系統(tǒng)。
背景技術(shù):
1、石油化工設(shè)備種類繁多、生產(chǎn)流程復(fù)雜、聯(lián)系緊密,運(yùn)行環(huán)境通常較為惡劣,高負(fù)荷地持續(xù)運(yùn)行是常態(tài)。其中不乏重要且敏感設(shè)備,在生產(chǎn)過(guò)程中一旦發(fā)生設(shè)備故障,輕則影響生產(chǎn)效率,重則導(dǎo)致整個(gè)系統(tǒng)非計(jì)劃停機(jī)、生產(chǎn)中斷,造成嚴(yán)重的經(jīng)濟(jì)損失,甚至出現(xiàn)安全事故,危及生命。
2、企業(yè)目前采取在線儀表監(jiān)測(cè)等方式對(duì)大型設(shè)備進(jìn)行監(jiān)控與實(shí)時(shí)報(bào)警,但設(shè)備部件磨損、變形帶來(lái)的故障隱患無(wú)法提前預(yù)測(cè),繼發(fā)性損壞難以控制。
技術(shù)實(shí)現(xiàn)思路
1、本發(fā)明提供一種基于聲紋識(shí)別的智能油氣診斷方法及系統(tǒng),能夠及時(shí)預(yù)見(jiàn)油氣設(shè)備的潛在故障因素。
2、鑒于此,本發(fā)明一方面提供一種基于聲紋識(shí)別的智能油氣診斷方法,所述方法包括:
3、獲取油氣設(shè)備樣本集群,針對(duì)所述油氣設(shè)備樣本集群中的任一油氣設(shè)備,在所述油氣設(shè)備運(yùn)行過(guò)程中,采集所述油氣設(shè)備的運(yùn)行聲紋數(shù)據(jù);
4、為所述油氣設(shè)備標(biāo)注故障信息,并建立所述運(yùn)行聲紋數(shù)據(jù)與所述故障信息之間的關(guān)聯(lián)關(guān)系;
5、通過(guò)故障預(yù)測(cè)模型對(duì)所述運(yùn)行聲紋數(shù)據(jù)進(jìn)行處理,以預(yù)測(cè)所述運(yùn)行聲紋數(shù)據(jù)表征的故障類型;
6、對(duì)比預(yù)測(cè)得到的故障類型與所述故障信息表征的故障類型,并基于對(duì)比結(jié)果對(duì)所述故障預(yù)測(cè)模型進(jìn)行校正;
7、利用校正后的故障預(yù)測(cè)類型對(duì)目標(biāo)油氣設(shè)備的運(yùn)行聲紋數(shù)據(jù)進(jìn)行處理,以輸出所述目標(biāo)油氣設(shè)備的潛在故障因素。
8、在一個(gè)實(shí)施方式中,在采集所述油氣設(shè)備的運(yùn)行聲紋數(shù)據(jù)之后,所述方法還包括:
9、將所述運(yùn)行聲紋數(shù)據(jù)從時(shí)域轉(zhuǎn)換至頻域,得到聲紋頻域數(shù)據(jù),并將所述聲紋頻域數(shù)據(jù)寫入kafka消息隊(duì)列中;
10、通過(guò)故障預(yù)測(cè)模型對(duì)所述運(yùn)行聲紋數(shù)據(jù)進(jìn)行處理包括:
11、按照預(yù)先設(shè)置的讀取窗口,從所述kafka消息隊(duì)列中讀取批次數(shù)據(jù);
12、遍歷每一條批次數(shù)據(jù),提取各個(gè)批次數(shù)據(jù)的數(shù)值特征,并匯總各個(gè)批次數(shù)據(jù)的數(shù)值特征,構(gòu)成所述聲紋頻域數(shù)據(jù)的聲紋特征;
13、其中,任意相鄰的兩個(gè)批次數(shù)據(jù)之間,至少存在部分交集數(shù)據(jù)。
14、在一個(gè)實(shí)施方式中,在采集所述油氣設(shè)備的運(yùn)行聲紋數(shù)據(jù)之后,所述方法還包括:
15、將各個(gè)油氣設(shè)備的運(yùn)行聲紋數(shù)據(jù)分配至不同的數(shù)據(jù)組合當(dāng)中;
16、選中一個(gè)數(shù)據(jù)組合并標(biāo)記為比對(duì)組合,并將所述比對(duì)組合中的運(yùn)行聲紋數(shù)據(jù)標(biāo)記為比對(duì)數(shù)據(jù);
17、判斷剩余的數(shù)據(jù)組合中是否存在與所述比對(duì)數(shù)據(jù)的相似度滿足要求的目標(biāo)數(shù)據(jù)組合,若存在,將所述目標(biāo)數(shù)據(jù)組合刪除,并從剩余的數(shù)據(jù)組合中重新選擇一個(gè)數(shù)據(jù)組合作為比對(duì)組合;
18、將最終剩余的數(shù)據(jù)組合中的運(yùn)行聲紋數(shù)據(jù)按照指定數(shù)據(jù)格式進(jìn)行封裝,并將封裝后的運(yùn)行聲紋數(shù)據(jù)輸入所述故障預(yù)測(cè)模型。
19、在一個(gè)實(shí)施方式中,在輸出所述目標(biāo)油氣設(shè)備的潛在故障因素之后,所述方法還包括:
20、獲取所述潛在故障因素對(duì)應(yīng)的歷史數(shù)據(jù)集合,并擬合所述歷史數(shù)據(jù)集合的故障趨勢(shì)曲線;
21、識(shí)別當(dāng)前時(shí)刻在所述故障趨勢(shì)曲線中所處的位置,并基于識(shí)別出的位置,生成針對(duì)所述潛在故障因素的處理策略。
22、本發(fā)明還提供一種基于聲紋識(shí)別的智能油氣診斷系統(tǒng),所述系統(tǒng)包括:
23、數(shù)據(jù)采集單元,用于獲取油氣設(shè)備樣本集群,針對(duì)所述油氣設(shè)備樣本集群中的任一油氣設(shè)備,在所述油氣設(shè)備運(yùn)行過(guò)程中,采集所述油氣設(shè)備的運(yùn)行聲紋數(shù)據(jù);
24、關(guān)聯(lián)單元,用于為所述油氣設(shè)備標(biāo)注故障信息,并建立所述運(yùn)行聲紋數(shù)據(jù)與所述故障信息之間的關(guān)聯(lián)關(guān)系;
25、預(yù)測(cè)單元,用于通過(guò)故障預(yù)測(cè)模型對(duì)所述運(yùn)行聲紋數(shù)據(jù)進(jìn)行處理,以預(yù)測(cè)所述運(yùn)行聲紋數(shù)據(jù)表征的故障類型;
26、校正單元,用于對(duì)比預(yù)測(cè)得到的故障類型與所述故障信息表征的故障類型,并基于對(duì)比結(jié)果對(duì)所述故障預(yù)測(cè)模型進(jìn)行校正;
27、因素輸出單元,用于利用校正后的故障預(yù)測(cè)類型對(duì)目標(biāo)油氣設(shè)備的運(yùn)行聲紋數(shù)據(jù)進(jìn)行處理,以輸出所述目標(biāo)油氣設(shè)備的潛在故障因素。
28、由于聲紋數(shù)據(jù)中可能存在其他噪聲干擾,可能會(huì)造成對(duì)所述目標(biāo)油氣設(shè)備的潛在故障因素的判斷失準(zhǔn),進(jìn)而可能會(huì)對(duì)后續(xù)的故障維修帶來(lái)一些列問(wèn)題,因此在對(duì)所述目標(biāo)油氣設(shè)備的潛在故障因素的判斷時(shí)采用如下算法:
29、步驟一:設(shè)對(duì)于故障因素a,其主要的聲紋參數(shù)特征有n個(gè),例如聲紋的頻率、振幅等,設(shè)第i個(gè)聲紋參數(shù)特征值為ki,目標(biāo)油氣設(shè)備的運(yùn)行聲紋數(shù)據(jù)第i個(gè)聲紋特征值為f?i,則目標(biāo)油氣設(shè)備的運(yùn)行聲紋數(shù)據(jù)第i個(gè)聲紋特征值和故障因素a的第i個(gè)聲紋參數(shù)特征值的相似度為:
30、
31、其中si為目標(biāo)油氣設(shè)備的運(yùn)行聲紋數(shù)據(jù)第i個(gè)聲紋特征值和故障因素a的第i個(gè)聲紋參數(shù)特征值的相似度。
32、步驟二:設(shè)第i個(gè)聲紋參數(shù)特征在故障因素a中的參考權(quán)重為qi,則目標(biāo)油氣設(shè)備的運(yùn)行聲紋數(shù)據(jù)第i個(gè)聲紋特征在故障因素a的權(quán)重得分為:
33、
34、其中pi為目標(biāo)油氣設(shè)備的運(yùn)行聲紋數(shù)據(jù)第i個(gè)聲紋特征在故障因素a的權(quán)重得分。
35、步驟三:根據(jù)步驟一和步驟二的計(jì)算結(jié)果,計(jì)算目標(biāo)油氣設(shè)備的運(yùn)行聲紋數(shù)據(jù)表明潛在的故障因素為a的概率,其計(jì)算公式如下:
36、
37、其中p(a)為目標(biāo)油氣設(shè)備的運(yùn)行聲紋數(shù)據(jù)表明潛在的故障因素為a的概率,pa為故障因素a的預(yù)設(shè)權(quán)重總分,其根據(jù)實(shí)際情況獲得并可以進(jìn)行調(diào)整。當(dāng)p(a)大于0.9時(shí)表明目標(biāo)油氣設(shè)備的運(yùn)行聲紋數(shù)據(jù)表明潛在的故障因素為a,當(dāng)p(a)小于等于0.9時(shí)表明目標(biāo)油氣設(shè)備的運(yùn)行聲紋數(shù)據(jù)表明潛在的故障因素為不為a,可能為其他故障因素。
38、本算法根據(jù)目標(biāo)故障因素的聲紋參數(shù)特征及目標(biāo)油氣設(shè)備的運(yùn)行聲紋數(shù)據(jù)中的聲紋參數(shù)特征對(duì)目標(biāo)油氣設(shè)備的運(yùn)行聲紋數(shù)據(jù)顯示的故障因素是否為目標(biāo)故障因素進(jìn)行了準(zhǔn)確判斷,避免了對(duì)所述目標(biāo)油氣設(shè)備的潛在故障因素的判斷失準(zhǔn)及為后續(xù)故障維修帶來(lái)一些列問(wèn)題的情況的發(fā)生。
39、在一個(gè)實(shí)施方式中,所述系統(tǒng)還包括:
40、數(shù)據(jù)轉(zhuǎn)換單元,用于將所述運(yùn)行聲紋數(shù)據(jù)從時(shí)域轉(zhuǎn)換至頻域,得到聲紋頻域數(shù)據(jù),并將所述聲紋頻域數(shù)據(jù)寫入kafka消息隊(duì)列中;
41、所述預(yù)測(cè)單元具體用于,按照預(yù)先設(shè)置的讀取窗口,從所述kafka消息隊(duì)列中讀取批次數(shù)據(jù);遍歷每一條批次數(shù)據(jù),提取各個(gè)批次數(shù)據(jù)的數(shù)值特征,并匯總各個(gè)批次數(shù)據(jù)的數(shù)值特征,構(gòu)成所述聲紋頻域數(shù)據(jù)的聲紋特征;其中,任意相鄰的兩個(gè)批次數(shù)據(jù)之間,至少存在部分交集數(shù)據(jù)。
42、在一個(gè)實(shí)施方式中,所述系統(tǒng)還包括:
43、數(shù)據(jù)分配單元,用于將各個(gè)油氣設(shè)備的運(yùn)行聲紋數(shù)據(jù)分配至不同的數(shù)據(jù)組合當(dāng)中;
44、選取單元,用于選中一個(gè)數(shù)據(jù)組合并標(biāo)記為比對(duì)組合,并將所述比對(duì)組合中的運(yùn)行聲紋數(shù)據(jù)標(biāo)記為比對(duì)數(shù)據(jù);
45、判斷單元,用于判斷剩余的數(shù)據(jù)組合中是否存在與所述比對(duì)數(shù)據(jù)的相似度滿足要求的目標(biāo)數(shù)據(jù)組合,若存在,將所述目標(biāo)數(shù)據(jù)組合刪除,并從剩余的數(shù)據(jù)組合中重新選擇一個(gè)數(shù)據(jù)組合作為比對(duì)組合;
46、格式轉(zhuǎn)換單元,用于將最終剩余的數(shù)據(jù)組合中的運(yùn)行聲紋數(shù)據(jù)按照指定數(shù)據(jù)格式進(jìn)行封裝,并將封裝后的運(yùn)行聲紋數(shù)據(jù)輸入所述故障預(yù)測(cè)模型。
47、在一個(gè)實(shí)施方式中,所述系統(tǒng)還包括:
48、趨勢(shì)擬合單元,用于獲取所述潛在故障因素對(duì)應(yīng)的歷史數(shù)據(jù)集合,并擬合所述歷史數(shù)據(jù)集合的故障趨勢(shì)曲線;
49、策略生成單元,用于識(shí)別當(dāng)前時(shí)刻在所述故障趨勢(shì)曲線中所處的位置,并基于識(shí)別出的位置,生成針對(duì)所述潛在故障因素的處理策略。
50、本發(fā)明提供的技術(shù)方案,基于運(yùn)行聲紋數(shù)據(jù),能夠?qū)τ蜌庠O(shè)備的狀態(tài)進(jìn)行綜合評(píng)價(jià)和智能推理,及時(shí)掌握設(shè)備的運(yùn)行狀態(tài),為設(shè)備維修決策提供重要依據(jù),從而防止惡性事故的發(fā)生,實(shí)現(xiàn)預(yù)知維修。
51、本發(fā)明的其它特征和優(yōu)點(diǎn)將在隨后的說(shuō)明書中闡述,并且,部分地從說(shuō)明書中變得顯而易見(jiàn),或者通過(guò)實(shí)施本發(fā)明而了解。本發(fā)明的目的和其他優(yōu)點(diǎn)可通過(guò)在所寫的說(shuō)明書、權(quán)利要求書、以及附圖中所特別指出的結(jié)構(gòu)來(lái)實(shí)現(xiàn)和獲得。
52、下面通過(guò)附圖和實(shí)施例,對(duì)本發(fā)明的技術(shù)方案做進(jìn)一步的詳細(xì)描述。