本發(fā)明涉及一種非線性過程監(jiān)控方法,適用于工業(yè)生產(chǎn)過程監(jiān)控。
背景技術(shù):
工業(yè)生產(chǎn)環(huán)境通常處于超高溫、超低溫、超高壓或真空等極端環(huán)境,如果因為人為原因操作不當(dāng)或客觀不可抵抗的自然因素所導(dǎo)致的生產(chǎn)故障,輕則生產(chǎn)被迫中斷,重則發(fā)生火災(zāi)、爆炸、泄露毒氣等重大生產(chǎn)事故,不僅給企業(yè)生產(chǎn)帶來了巨大的經(jīng)濟損失,而且嚴(yán)重危害人身安全、社會公共安全。因此,如何使這類工業(yè)生產(chǎn)過程安全正常地運行,早已是越來越多的人關(guān)注過程監(jiān)控技術(shù)的原因之一。然而,隨著生產(chǎn)過程日益復(fù)雜化,過程數(shù)據(jù)呈現(xiàn)“爆炸性”增長,現(xiàn)階段過程監(jiān)控面臨著如下一系列新問題:
(1)不確定性。現(xiàn)階段的工業(yè)過程普遍存在龐雜的生產(chǎn)機理,從而容易誘發(fā)許多干擾,在傳統(tǒng)監(jiān)控技術(shù)中大多數(shù)干擾無法測量,甚至沒辦法有效消除。一般來說,不確定的來源可分為兩類:不可預(yù)知輸入和不可預(yù)知動態(tài)。傳統(tǒng)過程監(jiān)控中所設(shè)計的數(shù)學(xué)模型通常都是被控對象的簡單近似,不僅會丟失部分影響生產(chǎn)的關(guān)鍵干擾因素,所會與實際工業(yè)生產(chǎn)情況相差較大,較難獲得好的監(jiān)控效果。
(2)多變量性和強耦合性?,F(xiàn)階段工業(yè)生產(chǎn)都會產(chǎn)生了數(shù)量非常龐大的過程變量,并且這些過程變量之間相互關(guān)系、相互影響,如果改變某些過程變量,有可能會導(dǎo)致其它過程變量發(fā)生變化,從而使工業(yè)生產(chǎn)過程更加復(fù)雜化,增加了過程監(jiān)控的難度。
(3)非線性。現(xiàn)階段幾乎所有的工業(yè)過程都存在非線性過程變量。對于存在非線性數(shù)據(jù)較少的系統(tǒng),在合理的范圍內(nèi)可以近似于線性系統(tǒng)來對待,而對于非線性數(shù)據(jù)較多的系統(tǒng),假如采取線性化的處理方法會容易產(chǎn)生較大誤差,導(dǎo)致故障識別和故障診斷失敗。
粒子群優(yōu)化算法是1995年j.kennedy和r.c.eberhart基于鳥群覓食過程中的遷徙和聚集的模擬而提出的一種群體智能性優(yōu)化算法,它收斂速度快,且只有少量參數(shù)需要根據(jù)實際情況調(diào)整,所以具有較高的可實現(xiàn)性。從一提出至今早已成為智能優(yōu)化與進(jìn)化計算領(lǐng)域研究中目標(biāo)函數(shù)優(yōu)化、神經(jīng)網(wǎng)絡(luò)訓(xùn)練、模糊控制系統(tǒng)的一個主要優(yōu)化工具,已被廣泛應(yīng)用于計算機工程、道路規(guī)劃工程、運輸組合工程等研究方向。
目前,基于粒子群優(yōu)化算法的工業(yè)過程監(jiān)控并沒有相應(yīng)的發(fā)展,pca在非線性情況下并沒有很好的解決特征空間內(nèi)數(shù)據(jù)的離散度和相關(guān)度問題。在現(xiàn)有的核函數(shù)優(yōu)化方法中,大部分都依賴于梯度已知,但是當(dāng)梯度未知時,粒子群優(yōu)化算法難以找到全局最優(yōu)解。
技術(shù)實現(xiàn)要素:
本發(fā)明基于粒子群優(yōu)化算法,采用fisher判別函數(shù)的思想構(gòu)建優(yōu)化核函數(shù)參數(shù)的目標(biāo)函數(shù),尋求目標(biāo)函數(shù)最優(yōu)解,確定核函數(shù)最優(yōu)參數(shù),提取導(dǎo)致過程監(jiān)控故障的主元,優(yōu)化減小主元的個數(shù),提高過程監(jiān)控的效率和準(zhǔn)確性。
本發(fā)明采用以下技術(shù)方案予以實現(xiàn):
一種非線性過程監(jiān)控方法,包括以下步驟:
(1)布置探測器獲取粒子群樣本數(shù)據(jù),樣本數(shù)據(jù)通過核函數(shù)的內(nèi)積運算形成一種非線性映射,再通過這一非線性映射將原空間的非線性數(shù)據(jù)轉(zhuǎn)換成特征空間的線性數(shù)據(jù);
(2)計算特征空間的類間平方和以及類內(nèi)離散度,根據(jù)fisher判別準(zhǔn)則建立關(guān)于核函數(shù)參數(shù)優(yōu)化的粒子群優(yōu)化模型的適應(yīng)度函數(shù);
(3)初始化粒子群參數(shù),計算適應(yīng)度函數(shù)初始適應(yīng)值,通過粒子群優(yōu)化算法迭代求取最優(yōu)解;
(4)最優(yōu)解作為核函數(shù)的最優(yōu)核參數(shù),確定特征空間的特征值和特征向量,根據(jù)累積貢獻(xiàn)率確定導(dǎo)致故障的特征值對應(yīng)的主元,優(yōu)化調(diào)整原樣本空間的主元個數(shù)。
作為進(jìn)一步的改進(jìn),步驟(1)中所述的核函數(shù)為滿足mercer條件的核函數(shù),包括多項式核函數(shù)、徑向基函數(shù)和simoid核函數(shù)。
作為進(jìn)一步的改進(jìn),所述的步驟(3)中初始化粒子群參數(shù),計算適應(yīng)度函數(shù)初始適應(yīng)值,通過粒子群優(yōu)化算法迭代求取最優(yōu)解;,其方法為:
在一個m個粒子組成的d維目標(biāo)搜索空間,初始化粒子群參數(shù),通過目標(biāo)函數(shù)令全部初始粒子都獲得一個初始適應(yīng)值,全部粒子在一個速度向量指引下跟蹤到目前為止空間中最優(yōu)的粒子進(jìn)行搜索,在搜索過程中,粒子通過速度和位置的迭代更新來求取最優(yōu)位置下的適應(yīng)值。
作為進(jìn)一步的改進(jìn),初始化參數(shù)包括權(quán)重系數(shù)γ,粒子初始位置xid,粒子初始速度vid,種族大小m,加速度常數(shù)c1、c2,最大限制速度vmax,最大迭代次數(shù)tmax,其中tmax為算法迭代的終止條件,
粒子的迭代更新方法為:
vid(t+1)=γvid(t)+c1r1(pid-xid(t))+c2r2(pgd-xid(t))
xid(t+1)=xid(t)+vid(t+1)
其中,取i=1,2,…,d,加速度常數(shù)c1、c2為非負(fù)常數(shù);r1、r2服從[0,1]上的均勻分布隨機數(shù);xid(t)是第i個粒子的當(dāng)前位置,pid是第i個粒子在局部至今為止搜索到的最優(yōu)位置,pgd是第i個粒子在全局至今為止搜索到的最優(yōu)位置;vid(t)是第i個粒子的當(dāng)前速度,vid(t)∈[-vmax,vmax],vmax為最大限制速度,vmax≥0。
作為進(jìn)一步的改進(jìn),迭代過程中,若vid(t)>vmax,取vid(t)=vmax;若vid(t)<-vmax,取vid(t)=-vmax。
作為進(jìn)一步的改進(jìn),令粒子群的加速度常數(shù)c1、c2隨迭代次數(shù)t線性化:
其中,r1、r2為初始化時的設(shè)置值,tmax為最大迭代次數(shù)。
作為進(jìn)一步的改進(jìn),提高搜索初期的空間搜索能力和增強進(jìn)化迭代中局部搜索能力,避免陷入局部最優(yōu)解:
r1+r2≤1.5。
作為進(jìn)一步的改進(jìn),步驟(4)中所述確定特征空間的特征值和特征向量,根據(jù)累積貢獻(xiàn)率確定導(dǎo)致故障的特征值對應(yīng)的主元,其方法為:根據(jù)核函數(shù)確定特征值λi和特征向量,特征向量經(jīng)非線性變化得到非線性主元分量,
選擇n使
即提取前n個最大特征值所對應(yīng)的非線性主元分量構(gòu)建n維特征子空間;以前n個最大特征值對應(yīng)的主元表征導(dǎo)致故障的主元。
本發(fā)明基于粒子群優(yōu)化算法提出的過程監(jiān)控方法,具有以下的改進(jìn):
1、優(yōu)化提取過程監(jiān)控中導(dǎo)致故障的主元,減少過程監(jiān)控的數(shù)據(jù)量,提高監(jiān)控的準(zhǔn)確度和效率。
2、利用粒子群優(yōu)化算法的數(shù)據(jù)處理方法,能夠快速準(zhǔn)確地對大量數(shù)據(jù)進(jìn)行處理,同時基于算法的迭代參數(shù)隨迭代次數(shù)線性化,在避免陷入局部最優(yōu)解的前提下極大地提高了優(yōu)化速度。
3、采用fisher判別函數(shù)的思想構(gòu)建優(yōu)化核函數(shù)參數(shù)的目標(biāo)函數(shù),克服了必須計算梯度的約束,降低數(shù)據(jù)處理難度。
4、本發(fā)明在大量非線性數(shù)據(jù)的情況下,能夠很好區(qū)分出故障類別之間的離散度和各特征值之間的相關(guān)度。
附圖說明
圖1是本發(fā)明的粒子群算法流程圖;
圖2為本發(fā)明實施例的故障1核參數(shù)優(yōu)化示意圖;
圖3為本發(fā)明實施例的故障2核參數(shù)優(yōu)化示意圖;
圖4為本發(fā)明實施例的故障3核參數(shù)優(yōu)化示意圖;
圖5-7為本發(fā)明實施例特征樣本的聚類對比圖。
具體實施方式
以下結(jié)合附圖對本發(fā)明的實施例作詳細(xì)描述。應(yīng)當(dāng)理解,此處描述的實施例僅用于解釋說明本發(fā)明,并非用于限定本發(fā)明。
一種非線性過程監(jiān)控方法,包括以下步驟:
(1)布置探測器獲取粒子群樣本數(shù)據(jù),樣本數(shù)據(jù)通過核函數(shù)的內(nèi)積運算形成一種非線性映射,再通過這一非線性映射將原空間的非線性數(shù)據(jù)轉(zhuǎn)換成特征空間的線性數(shù)據(jù)。假設(shè)某一粒子群樣本空間為x,經(jīng)過核函數(shù)的內(nèi)積運算非線性映射后為φ(x),再將φ(x)映射到高維空間中,此時的高維特征空間的協(xié)方差矩陣為:
(2)計算特征空間的類間平方和以及類內(nèi)離散度,根據(jù)fisher判別準(zhǔn)則建立關(guān)于核函數(shù)參數(shù)優(yōu)化的粒子群優(yōu)化模型的適應(yīng)度函數(shù)。fisher函數(shù)可適用于多種函數(shù)參數(shù)優(yōu)化,若是選擇含有多個參數(shù)的函數(shù)則要進(jìn)行多次參數(shù)優(yōu)化。
若x1(x11,x12,...,x1i),x2(x21,x22,...,x2j)(i=1,2,...,n1;j=1,2,...,n2)是特征空間中的兩類特征數(shù)據(jù),兩類數(shù)據(jù)在特征空間的均值向量分別為:
類間距離的平方和為:
xk內(nèi)離散度的平方為:
(3)初始化粒子群參數(shù),計算適應(yīng)度函數(shù)初始適應(yīng)值,通過粒子群優(yōu)化算法迭代求取最優(yōu)解。
在一個m個粒子組成的d維目標(biāo)搜索空間,初始化粒子群參數(shù),通過目標(biāo)函數(shù)令全部初始粒子都獲得一個初始適應(yīng)值,全部粒子在一個速度向量指引下跟蹤到目前為止空間中最優(yōu)的粒子進(jìn)行搜索,在搜索過程中,粒子通過速度和位置的迭代更新來求取最優(yōu)位置下的適應(yīng)值。
初始化參數(shù)包括權(quán)重系數(shù)γ,粒子初始位置xid,粒子初始速度vid,種族大小m,加速度常數(shù)c1、c2,最大限制速度vmax,最大迭代次數(shù)tmax,其中tmax為算法迭代的終止條件,
粒子的迭代更新方法為:
vid(t+1)=γvid(t)+c1r1(pid-xid(t))+c2r2(pgd-xid(t))
xid(t+1)=xid(t)+vid(t+1)
其中,取i=1,2,…,d,加速度常數(shù)c1、c2為非負(fù)常數(shù);r1、r2服從[0,1]上的均勻分布隨機數(shù);xid(t)是第i個粒子的當(dāng)前位置,pid是第i個粒子在局部至今為止搜索到的最優(yōu)位置,pgd是第i個粒子在全局至今為止搜索到的最優(yōu)位置;vid(t)是第i個粒子的當(dāng)前速度,vid(t)∈[-vmax,vmax],vmax為最大限制速度,vmax≥0。
迭代過程中,若vid(t)>vmax,取vid(t)=vmax;若vid(t)<-vmax,取vid(t)=-vmax。
作為進(jìn)一步的改進(jìn),令粒子群的加速度常數(shù)c1、c2隨迭代次數(shù)t線性化:
其中,r1、r2為初始化時的設(shè)置值,tmax為最大迭代次數(shù)。
作為進(jìn)一步的改進(jìn),提高搜索初期的空間搜索能力和增強進(jìn)化迭代中局部搜索能力,避免陷入局部最優(yōu)解:
r1+r2≤1.5
具體的迭代流程如圖所示,首先初始化粒子群參數(shù)γ、m、xid、vid、c1、c2、vmax、tmax,計算粒子當(dāng)前適應(yīng)度f(ω),根據(jù)迭代更新公式對粒子的當(dāng)前的速度vid(t)和位置進(jìn)xid(t)行更新;然后進(jìn)行判別,若當(dāng)前位置xid(t)下的粒子適應(yīng)度f(ω)優(yōu)于局部最優(yōu)位置pid,則局部最優(yōu)位置pid替換為當(dāng)前位置xid(t),反之保持當(dāng)前位置不變,即取適應(yīng)度值較小的位置;進(jìn)一步判別,若當(dāng)前位置xid(t)下的粒子適應(yīng)度f(ω)優(yōu)于全局最優(yōu)位置pgd,則全局最優(yōu)位置pgd替換為當(dāng)前位置xid(t),反之保持當(dāng)前位置不變,即取適應(yīng)度值較小的位置;更新迭代直至達(dá)到最大迭代次數(shù)tmax,最后輸出適應(yīng)度函數(shù)極小值對應(yīng)的極小值點ω。
(4)最優(yōu)解作為核函數(shù)的最優(yōu)核參數(shù),確定特征空間的特征值和特征向量,根據(jù)累積貢獻(xiàn)率確定導(dǎo)致故障的特征值對應(yīng)的主元,優(yōu)化調(diào)整原樣本空間的主元個數(shù)。
在本實施例中的核函數(shù)是指滿足mercer條件的核函數(shù),包括多項式核函數(shù)、徑向基函數(shù)和simoid核函數(shù)。
核函數(shù)形式的選取對于非線性系統(tǒng)的分析具有重要的影響.核函數(shù)一般有以下三種形式:
多項式核函數(shù)
k(x,y)=<xy>d
徑向基函數(shù):
simoid核函數(shù):
k(x,y)=tanh(βo<xy>+β1)
本實施例以徑向基核函數(shù)為例,尋求適應(yīng)度函數(shù)f(ω)的極小值,所得極小值點ω*為最優(yōu)核寬度,即最優(yōu)核參數(shù)。
由于k(x1i,x1i)和k(x1j,x1j)的值等于1,所以可以簡化為:
主元分析的任務(wù)即求出特征值λ與特征向量v,從而選擇提取出相關(guān)的特征值與特征向量。由λv=cv可得,由λ≠0時,v在φ(xi)(i=1,2,...,m)的空間中,存在αi(i=1,2,...m),滿足
在λv=cv兩邊同時與φ(xk)做內(nèi)積得
λ<φ(xk),v>=<φ(xk),cv>,k=1,2,...,m
將上兩式帶入后轉(zhuǎn)化為如下問題:
mλα=kα,k=(k(xi,xj))ij
其中,k是核矩陣,α=(α1,α2,...,αm)′??傻胢λ和α是對應(yīng)于k的特征值和特征向量。令大于0的特征值λ的特征向量v分別為αp,αp+1,...,αm,為了滿足<ν′,ν′>=1,取α′使得mλ<α′,α′>=1,則樣本φ(x)在ν′上的投影為:
其中,r=p,p+1,...,m。gr(x)為對應(yīng)于φ(x)的非線性主元分量,將所有投影值形成的向量(g1(x),g2(x),...,gl(x))′作為樣本x的新特征。
在特征提取過程中,非線性主元分量個數(shù)的確定至關(guān)重要,若保留的個數(shù)太多,則失去了特征選擇的意義;若提取的個數(shù)少了,特征屬性則不能完整地描述出原始數(shù)據(jù)含有的故障信息。因此,利用非線性主元分量貢獻(xiàn)比值
選擇n使
即提取前n個最大特征值所對應(yīng)的非線性主元分量構(gòu)建n維特征子空間;以前n個最大特征值對應(yīng)的主元表征導(dǎo)致故障的主元。降低了過程監(jiān)控中變量維度,提高了過程監(jiān)控的效率和準(zhǔn)確度。
在本發(fā)明的一個具體應(yīng)用實施例中,采用青霉素發(fā)酵仿真平臺pensim2.0對青霉素生產(chǎn)過程進(jìn)行模擬,利用本發(fā)明的過程監(jiān)控方法進(jìn)行優(yōu)化監(jiān)控。
模擬輸入?yún)?shù)如表1:
表1
選取4個批次數(shù)據(jù):
(1)正常工況運行300小時,采樣時間為0.5小時。
(2)故障1:空氣流量故障,階躍+10%,運行300小時,故障從100小時加入,采樣時間為0.5小時。
(3)故障2:攪拌功率故障,斜坡+10%,運行300小時,故障從100小時加入,采樣時間為0.5小時。
(4)故障3:底物流加速度故障,階躍+10%,運行300小時,故障從100小時加入,采樣時間為0.5小時。
任意選取4個批次的30個采樣點,以正常工況和不同故障采樣點進(jìn)行優(yōu)化,本實施例采用徑向基函數(shù)作為核函數(shù),取核函數(shù)參數(shù)寬度ω為粒子,初始參數(shù)如表2。
表2
由上圖2-4可知,當(dāng)?shù)螖?shù)在50以內(nèi)時,三種故障的核函數(shù)寬度都能穩(wěn)定到一個最優(yōu)值:圖2中故障1的核函數(shù)寬度優(yōu)化結(jié)果為0.6176,圖3中故障2的核函數(shù)寬度優(yōu)化結(jié)果為0.5254,圖4中故障3的核函數(shù)寬度優(yōu)化結(jié)果為0.3261。
如圖5-7所示,以正常工況的30個采樣點為原始特征集作為訓(xùn)練集,用3個故障的30個采用的作為樣本特征進(jìn)行測試,比較分析pca與kpca所得到的結(jié)果并分別提取第一至第二主元投影圖。pca的第一主元、第二主元投影圖上的主元特征混合在一起,根本無法看出正常工況的聚類中心和區(qū)分其中各類故障,而從kpca在第一主元、第二主元投影圖的三個主元特征區(qū)分清晰可見,可以區(qū)分正常工況和其他兩個故障的類別,由此可見kpca比pca在非線性分析上具有較大的優(yōu)勢。
累積貢獻(xiàn)率是指非線性主元分量所含有的原始特征向量的多少,累積貢獻(xiàn)率越大說明其對原始特征信息的描述效果越好,對原始特征信息的描述效果也越好,反之則越差。表3是本發(fā)明kpca和pca對上述采樣點的貢獻(xiàn)度分析對比結(jié)果:
表3
如表3,由于青霉素菌的底物消耗、代謝、合成等都是非線性行為,擅長處理線性行為的pca不再適用,導(dǎo)致其前5個主元特征向量的累積貢獻(xiàn)度小于kpca,而本發(fā)明kpca的貢獻(xiàn)率排行前5的特征向量的累積貢獻(xiàn)度已然超過了規(guī)定的85%,因此,將前5個特征值所相對的特征向量重構(gòu)為新的特征子空間,即可用這5個特征屬性取代原有的11個特征屬性,變量維度也就下降了6個。
表4是不同故障時各輸出參數(shù)作為特征值第一主元的投影值,以正常工況下的第一主元為標(biāo)準(zhǔn)值,以3種故障模式與正常工況下的第一主元作差的絕對值大小為評判標(biāo)準(zhǔn),絕對值越大說明該指標(biāo)偏離正常工況越嚴(yán)重,對故障的敏感度越高。
表4
按從大到小的順序?qū)⒔^對值較大的前5個特征值排列如表5所示,從表中可以看出,有的特征值對不同的故障模式都有不同的敏感度,有的特征值對多個故障模式都存在敏感度,有的則一個都沒有,因此,將存在敏感度的特征值用√標(biāo)示,如表6,故障模式所含√越多,則表明該特征值的敏感度越強。從表5可知,對3種故障都存在敏感度的參數(shù)有co2,對兩種故障都存在敏感度的參數(shù)有菌絲濃度、青霉素濃度、產(chǎn)生熱量、底物濃度,只對一種故障存在敏感度的參數(shù)有發(fā)酵罐體積、ph值。
表5
表6
因此,通過本發(fā)明可以區(qū)分出故障類別之間的離散度和各特征值之間的相關(guān)度,可以用敏感度從高到低的前5個特征值(co2、菌絲濃度、青霉素濃度、產(chǎn)生熱量、底物濃度)來取代原有的11個特征值,而且這5個特征值中保留了原有11個特征值的85%以上特征信息,能夠更進(jìn)一步地提高過程監(jiān)控的效率和精確度。
以上所述,僅為本發(fā)明較佳的具體實施方式,但本發(fā)明的保護(hù)范圍并不局限于此,凡在本發(fā)明的精神和原則之內(nèi)所作的任何修改、等同替換和改進(jìn)等,均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。