專利名稱:一種非線性過程質(zhì)量預(yù)報方法
技術(shù)領(lǐng)域:
本發(fā)明屬于質(zhì)量預(yù)報技術(shù)領(lǐng)域,特別涉及一種非線性過程質(zhì)量預(yù)報方法。
背景技術(shù):
在提取過程變量所包含的信息來建立經(jīng)驗預(yù)報模型用于監(jiān)測工業(yè)過程的性能有著很大的 利潤。偏最小二乘法巳廣泛應(yīng)用于許多工業(yè)生產(chǎn)過程,其中包括自變量共線性、測量數(shù)據(jù)含 噪、變量維數(shù)高,以及在描述潛在數(shù)據(jù)結(jié)構(gòu)時觀測值比自變量少的情況。偏最小二乘法的復(fù) 雜擴展已被提出并應(yīng)用。例如,幾種遞歸偏最小二乘(RPLS)算法被提出在線過程建模以適
應(yīng)過程變化,離線建模以處理大量的數(shù)據(jù)樣本。帶有滑動窗口和遺忘因子適應(yīng)方案的分塊
RPLS算法被提出。然而,偏最小二乘法不能表現(xiàn)出明顯的非線性特性,因為其假定過程數(shù)據(jù)
是線性的。多項式非線性映射的使用是基于這樣的假設(shè)自變量和響應(yīng)潛在變量之間的關(guān)系 可以通過多項式展開的方法建模。KPLS不同于以往提到的非線性PLS算法在于原始輸入
數(shù)據(jù)通過非線性映射,被非線性地轉(zhuǎn)變到任意維數(shù)的特征空間,然后,在特征空間上建立線
性PLS模型。通過找出潛在變量,KPLS提供了良好的預(yù)報模型,這些潛在變量與響應(yīng)變量 之間表現(xiàn)出一種很好的非線性關(guān)系同時改進了模型的可理解性。核方法己經(jīng)越來越多地應(yīng)用 在化學(xué)工業(yè)上。
在PLS和KPLS方法中,在輸入或特征空間里使用PCA方法把兩個標量矩陣分解成得分 向量和負載向量。PCA把數(shù)據(jù)投影到一個低維空間,其中包含了原始數(shù)據(jù)的最大變異方向和 說明了變量間的相關(guān)性。PCA只提取非相關(guān)成分而非獨立成分,因此對那些出現(xiàn)在工業(yè)數(shù)據(jù) 中的非高斯數(shù)據(jù)表現(xiàn)欠缺。最近,基于ICA的幾種多變量統(tǒng)計過程監(jiān)測(MSPM)方法被提出。 ICA的目標是把觀測數(shù)據(jù)分解成統(tǒng)計獨立成分(獨立元)的線性組合??ㄖZ等人還提出了基于 ICA和外部分析的一種新的MPSM方法,以改進監(jiān)測性能和從運行條件正常變化中識別出質(zhì) 量。Lee等人提出了基于ICA的統(tǒng)計過輕監(jiān)測方法。他們用ICA方法提取獨立成分,再把它 們劃分成主要獨立成分和次要獨立成分,這種方法適用于非高斯數(shù)據(jù)。這個基于ICA的監(jiān)測 方法已分別推廣到動態(tài)過程的監(jiān)測和間歇生產(chǎn)過程監(jiān)測。
像主元分析PCA和偏最小二乘PLS那樣的多元統(tǒng)計過程控制已經(jīng)被有效地應(yīng)用于改善 工業(yè)過程的產(chǎn)品質(zhì)量。然而PCA和PLS本質(zhì)上是線性方法,所以在大多數(shù)的化學(xué)和生物過 程的非線性上,PCA和PLS的實際應(yīng)用仍舊是一個重大問題。核方法是一種潛在的非常有效 的方法,它可以通過把原始輸入空間投影到高維特征空間來預(yù)報非線性過程的關(guān)鍵質(zhì)量變量。而且與其他的非線性方法相比,核方法的最大優(yōu)勢就是其不包含非線性優(yōu)化過程。核方法在 本質(zhì)上僅僅需要的是線性算法,使它們像線性多變量投影法一樣簡單。由于其可以使用不同 的核函數(shù),故它們可以處理大部分非線性過程。
眾所周知,許多被觀測的系統(tǒng)過程變量都是非獨立的??啥攘康倪^程變量可能是獨立變 量的組合,這些獨立變量不能被直接度量。獨立元分析(ICA)能從多元統(tǒng)計數(shù)據(jù)中有效地提取 潛在因子或成分(也稱作盲源)。
發(fā)明內(nèi)容
針對現(xiàn)有技術(shù)存在的不足,本發(fā)明提供一種非線性過程質(zhì)量預(yù)報方法,特別涉及一種基 于獨立元分析ICA改進型偏最小二乘法PLS或基于獨立元分析ICA改進型核心偏最小二乘法 KPLS的質(zhì)量預(yù)報方法。
本發(fā)明的非線性過程質(zhì)量預(yù)報方法包括以下步驟 步驟一 數(shù)據(jù)采集
采集的數(shù)據(jù)包括過程中相關(guān)的變量數(shù)據(jù),對于每個過程,均產(chǎn)生兩組數(shù)據(jù),即訓(xùn)練數(shù)據(jù) 和實時工況數(shù)據(jù);
步驟二利用獨立元分析ICA提取獨立元;即將輸入矩陣X和輸出矩陣Y分解成獨立成 分矩陣和殘差矩陣表示的線性關(guān)系;
步驟三對輸入矩陣X和輸出矩陣Y之間建立的關(guān)系模型進行RMSE評估;即利用改進型 PLS法或改進型KPLS法建立輸入矩陣X和輸出矩陣Y之間的回歸模型;
步驟四比較觀測的數(shù)據(jù)Y和利用回歸模型得出的數(shù)據(jù)f ,得出質(zhì)量預(yù)報效果,當Y=f
是表示過程不存在質(zhì)量問題,Y越趨近f值表示過程質(zhì)量的預(yù)報精度越高。
本發(fā)明的改進型PLS法被升級用于實現(xiàn)兩個主要目標以獨立成分為基礎(chǔ)精確近似X和 Y以及在輸入空間中建立X和Y間的關(guān)系模型。在新PLS法中標量矩陣X和Y表示為m (《cO 個獨立成分A,&,…,^的線性組合。因此,改進的PLS方法把具有零均值的輸入量X和輸出 量Y分解成如下形式
X-AS +五,/4^A^ (1)
y = GF + F, G = Z7 2 (2)
式中,S和V表示獨立成分矩陣,E和F表示殘差矩陣,G為非二次函數(shù),A為矩陣且 j-[a,,...,aje 代表A矩陣屬于dXm維的實數(shù)空間,其中a為d維列向量; 〃為特征向量的正交矩陣;J為特征值的對角矩陣,A, &代表白化后向量21112與獨立成分15之間的線性關(guān) 系。
改進的PLS回歸模型可以用回歸系數(shù)矩陣H和殘差陣L表示如下
<formula>formula see original document page 6</formula> (3)
其中 <formula>formula see original document page 6</formula>(4)
<formula>formula see original document page 6</formula> (5)
<formula>formula see original document page 6</formula>(6) 式中,s, ir和r均為自定義的變量。
本發(fā)明的改進型KPLS方法被升級用于實現(xiàn)兩個主要目標以獨立成分為基礎(chǔ)精確近似 X和Y以及在特征空間建立X和Y間的關(guān)系模型。當測試數(shù)據(jù)個數(shù)是",時,預(yù)報的訓(xùn)練數(shù)據(jù)
和測試數(shù)據(jù)可以得到如下,分別為
<formula>formula see original document page 6</formula>(8)
其中^是映射測試點矩陣,《eiT"是用于測試的核矩陣,它的構(gòu)成元素是 J^-A:(;c,,、),其中&O,力-〈0(jc),0Cy)〉,其中Xi, Xj表示第i次和第j次的采樣值。 一些
使用最廣泛的核函數(shù)如徑向基核函數(shù)<formula>formula see original document page 6</formula>
多項式核函數(shù)<formula>formula see original document page 6</formula>核函數(shù)<formula>formula see original document page 6</formula>其中o", r, / 。和/ ,為常數(shù)。 在應(yīng)用改進型KPLS之前,在高維空間應(yīng)該執(zhí)行均值中心化。
偏最小二乘法模型化方法的性能可以通過他們的預(yù)報精度和執(zhí)行特點進行評估。在根均 方誤差(RMSE)的標準下,對每一個模型的性能都進行了評估。RMSE性能指標的定義是
<formula>formula see original document page 6</formula>
(9)
其中^是參考值,j),是預(yù)報值,w是樣本總數(shù)。
本發(fā)明的優(yōu)點在于采用基于ICA方法改進的KPLS方法進行質(zhì)量預(yù)報提高了質(zhì)量預(yù)報的 能力和精確度,同時降低了高價統(tǒng)計的依賴關(guān)系,能夠有效的去除非依賴信息,該方法不需要非線性優(yōu)化過程,該方法的計算量簡單.。本文的創(chuàng)新點在于利用ICA而非PCA作為PLS 和KPLS的有效處理手段,提取了獨立成分而非主成分,攜帶了更多的原系統(tǒng)的重要信息, 使得ICA-PLS和ICA-KPLS的產(chǎn)品質(zhì)量預(yù)報方法更能精確的匹配觀測數(shù)據(jù),提高了質(zhì)量預(yù)報 精度和能力。其表現(xiàn)在于有了ICA作為處理手段,使得本方法可以應(yīng)用到了非高斯過程(因 為工業(yè)領(lǐng)域過程有很多都是非高斯過程),ICA合并PLS可以處理類似的線性過程,而ICA 合并KPLS可以處理大多數(shù)的非線性過程。從實施實例中可以看到這種方法應(yīng)用到過程檢測 的質(zhì)量預(yù)報是有很大前景的。
圖1使用改進型PLS法模擬仿真得到的測試數(shù)據(jù)響應(yīng)變量Yi預(yù)報值與觀測值之間關(guān)系圖2使用改進型KPLS法仿真得到的測試數(shù)據(jù)響應(yīng)變量Y,預(yù)報值與觀測值之間的關(guān)系圖; 圖3使用改進型PLS法得到的測試數(shù)據(jù)響應(yīng)變量Y2預(yù)報值與觀測值之間關(guān)系圖; 圖4使用改進型KPLS法得到的測試數(shù)據(jù)響應(yīng)變量Y2預(yù)報值與觀測值之間的關(guān)系圖; 圖5田納西伊斯曼過程工藝布局;
圖6田納西過程中使用改進PLS法得到測試數(shù)據(jù)響應(yīng)變量i;的預(yù)報值與觀測值之間關(guān)系
圖7田納西過程中使用改進KPLS法得到測試數(shù)據(jù)響應(yīng)變量預(yù)報值與觀測值間的關(guān)系圖;
具體實施例方式
實施例1將本發(fā)明的非線性過程質(zhì)量預(yù)報方法用于模擬仿真過程
該方法在模擬裝置中的操作步驟包括 步驟一 采集數(shù)據(jù)
該模擬裝置有三個輸入義、兩個輸出F和一個B矩陣B= [1 2; 5 1; 3 7],輸入義是具有零 均值和單位方差的白噪聲,例如AT* ^^randn(100,3)+C0,其中CO = [1 3 6; 2 1 7; 3 8 4]。
步驟二 利用獨立元分析ICA提取獨立元;即將輸入矩陣X和輸出矩陣Y分解成獨立成 分矩陣和殘差矩陣表示的線性關(guān)系;輸入X和輸出r變量間的線性關(guān)系從F* =5」\:*中計算得 到,已記錄的變量為r-;P + e和A^", e的均值為零方差為O.l,即eeW0,0.1"。
步驟三對輸入矩陣X和輸出矩陣Y之間建立的關(guān)系模型進行RMSE評估;即利用改進型 PLS法或改進型KPLS法建立輸入矩陣X和輸出矩陣Y之間的回歸模型;即
<formula>formula see original document page 7</formula> (7)《=承,好=;s:,s((t/,A^)rKs)H (8)
使用了兩組數(shù)據(jù), 一個是訓(xùn)練集有100個記錄,另一個是實時工況數(shù)據(jù)有30個記錄。
步驟四比較觀測的數(shù)據(jù)Y和利用回歸模型得出的數(shù)據(jù)f,得出質(zhì)量預(yù)報效果。為比較 兩種方法的預(yù)報質(zhì)量(ICA-PLS和ICA-KPLS),繪制出了預(yù)報值對比觀測數(shù)據(jù)的圖形?;谒?有響應(yīng)變量的兩種回歸方法的預(yù)報特性如圖1和圖2所示。性能對比如表1所示
表l:簡單例子中的建模和測試數(shù)據(jù)概要
ModelRMSE TrainingRMSE Test
PLS (30)0.19620.2251
KPLS (30)0.07190.1045
PLS (50)0.28690.4563
KPLS (50)0.10580.1072
表中顯示用PLS得到的RMSE值為0.2251, KPLS得到的RMSE值為0.1045,這時用
KPLS法建立的模型幾乎完美地匹配訓(xùn)練數(shù)據(jù),表示該過程生產(chǎn)的產(chǎn)品質(zhì)量好。顯然,使用 KPLS替代PLS極大地提高了預(yù)報精度。
當訓(xùn)練集有100個記錄,實時工況數(shù)據(jù)有40個記錄。基于所有響應(yīng)變量的兩個回歸方法 的預(yù)報特性示于圖3和圖4。由表1 ,用PLS得到的RMSE值為0.4563,用KPLS得到的RMSE 值為0.1072,這時用KPLS建立的回歸模型也近乎完美地匹配訓(xùn)練數(shù)據(jù),說明應(yīng)用KPLS法 建立的模型預(yù)報質(zhì)量的精度比應(yīng)用PLS法建立的回歸模型預(yù)報質(zhì)量的精度高,且計算量小。 如圖1和圖3所示,PLS模型并不是充分地匹配數(shù)據(jù),因為數(shù)據(jù)分布幾乎垂直于水平軸,這 說明PLS回歸模型的預(yù)報精度低,不能準確的預(yù)報過程是否發(fā)生變化。另一方面,KPLS數(shù) 據(jù)漂移到一個更接近對角線的分布(圖2和圖4),顯然使用KPLS回歸模型提高了預(yù)報能力。
實施例2將本發(fā)明的非線性過程質(zhì)量預(yù)報方法用于田納西伊斯曼過程工藝
田納西伊士曼過程是一個復(fù)雜的非線性過程,它是由伊士曼化學(xué)公司提供的一個切合實 際的工業(yè)過程以評價過程控制和監(jiān)測方法。測試過程是基于模擬實際工業(yè)過程的,其中成分、 動力學(xué)、操作條件被修改以適合專有原因。該控制結(jié)構(gòu)示意圖顯示在圖5。
步驟一 采集數(shù)據(jù)
在本過程有5個主要單元過程 一個反應(yīng)器、 一個冷凝器、 一個循環(huán)壓縮機、 一個分離 器和一個汽提塔;它包含了 8個成分A,B,C,D,E,F,G和H。四種反應(yīng)物A、 C、 D以及E和惰 性物B—起被加進反應(yīng)器里,形成產(chǎn)品G和H,還有副產(chǎn)品F。田納西過程包括22個連續(xù) 過程測量,12個控制變量,和19個不須頻繁采樣的成分測量。Chiang等人很好的描述了此過程的細節(jié)。共52個變量用于本研究的監(jiān)測。我們排除了所有的成分測量,因為它們難以在 實際中在線測量。使用三分鐘采樣間隔來收集訓(xùn)練和測試集的仿真數(shù)據(jù)。對于每一個質(zhì)量, 都會生成兩組數(shù)據(jù)。訓(xùn)練數(shù)據(jù)用來建立模型,驗證數(shù)據(jù)用來驗證模型。每個質(zhì)量的訓(xùn)練數(shù)據(jù) 集由480個觀測值組成。每個質(zhì)量的測試數(shù)據(jù)集是由960個觀測值組成。測試數(shù)據(jù)集中所有 的質(zhì)量都從第160次采樣得到的。
步驟二利用獨立元分析ICA提取獨立元;即將輸入矩陣X和輸出矩陣Y分解成獨立成 分矩陣和殘差矩陣表示的線性關(guān)系;輸入X和輸出7變量間的線性關(guān)系從y* =丑義*中計算得 到,已記錄的變量為i^:P + e和JV^J^, e的均值為零方差為O.l,艮卩eeA^0,0.1/)。
步驟三在田納西過程中兩種回歸方法的預(yù)報特性考慮了所有的輸入和輸出值。響應(yīng)變 量示于圖6-7中。性能參數(shù)總結(jié)于表2中。
表2:田納西伊斯曼過程中的建模和測試數(shù)據(jù)概要
ModelRMSE TrainingRMSE Test
PLS (variable 44)0.25490.4983
KPLS (variable 44)0.19450.3034
PLS (variable 47)0.28790.5997
KPLS (variable 47)0.20580.3194
步驟四比較觀測的數(shù)據(jù)Y和利用回歸模型得出的數(shù)據(jù)f,得出質(zhì)量預(yù)報效果。
對于變量44,用PLS法的RMSE值為0.4983,用KPLS法得到的RMSE值為0.3034, 使用KPLS提高了預(yù)報能力。如圖6所示,PLS模型沒有充分地匹配數(shù)據(jù),因為數(shù)據(jù)分布幾 乎是垂直的。如圖7所示,KPLS模型充分地匹配訓(xùn)練數(shù)據(jù)。
對于變量47,用PLS的RMSE值為0.5997,用KPLS得到的RMSE值為0.3194 ,這也意 味著使用KPLS替代PLS極大地提高了預(yù)報能力。顯然,應(yīng)用顯示上面提出的方法有效地捕 捉到了過程變量間的線性和非線性關(guān)系以及用KPLS改進了預(yù)報能力。
權(quán)利要求
1. 一種非線性過程質(zhì)量預(yù)報方法,其特征在于該預(yù)報方法包括以下步驟步驟一數(shù)據(jù)采集采集過程中相關(guān)的變量數(shù)據(jù),對于每個過程,均產(chǎn)生兩組數(shù)據(jù),即訓(xùn)練數(shù)據(jù)和實時工況數(shù)據(jù);步驟二利用獨立元分析法ICA提取獨立元,將輸入矩陣X和輸出矩陣Y分解成獨立成分矩陣和殘差矩陣表示的線性關(guān)系;步驟三對輸入矩陣X和輸出矩陣Y之間建立的關(guān)系模型進行RMSE評估;即對利用改進型PLS法或改進型KPLS法建立的輸入變量X和輸出變量Y之間的回歸模型進行評估;步驟四比較觀測到的數(shù)據(jù)Y和回歸模型得出的數(shù)據(jù)得出質(zhì)量預(yù)報效果。
2. 根據(jù)權(quán)利要求l所述的一種非線性過程質(zhì)量預(yù)報方法,其特征在于步驟二所述的輸入矩陣X 和輸出矩陣Y分解為其中,S和V表示獨立成分矩陣,E和F表示殘差矩陣,G為非二次函數(shù),A為矩陣且 j二[a,,…,aje及",代表的是A矩陣屬于dXm維的實數(shù)空間,其中a為d維列向量;t/為特征向量的正交矩陣;/f為特征值的對角矩陣,A、 &代表白化后的向量2與獨立成分^之間的線 性關(guān)系。 _
3. 根據(jù)權(quán)利要求l所述的一種非線性過程質(zhì)量預(yù)報方法,其特征在于步驟三所述的改進型PLS 法建立的回歸關(guān)系模型用回歸系數(shù)矩陣H和殘差陣L表示為-式中, 孖-s(iTs)-'rr,n = ;r([/,A;賜f/,A;5,;rcz7^B,))-' r = r(f/^,)((i/'A^,式中,s, rr和r均為自定義的變量。
4.根據(jù)權(quán)利要求i所述的一種非線性過程質(zhì)量預(yù)報方法,其特征在于步驟三所述的改進型KPLS法建立的回歸模型為f'=承,開=《S((C/'A^fKS)H式中,A為映射測試點矩陣,^ef"為用于測試的核矩陣,^=^乂,,^.)為它的構(gòu)成元素,其中A(a:,力二〈0(;c),必O;)〉,且在應(yīng)用改進型KPLS法前先在高維空間執(zhí)行均值中心化,其中XuXj表示第i次和第j次的采樣值。
全文摘要
本發(fā)明涉及一種非線性過程質(zhì)量預(yù)報方法,包括以下步驟步驟一數(shù)據(jù)采集,采集的數(shù)據(jù)包括過程中相關(guān)的變量數(shù)據(jù),對于每個故障,均產(chǎn)生兩組數(shù)據(jù),即訓(xùn)練數(shù)據(jù)和實時工況數(shù)據(jù);步驟二利用獨立元分析ICA提取獨立元;將輸入矩陣X和輸出矩陣Y分解成獨立成分矩陣和殘差矩陣表示的線性關(guān)系;步驟三對輸入矩陣X和輸出矩陣Y之間建立的關(guān)系模型進行RMSE評估;步驟四比較觀測的數(shù)據(jù)Y和回歸模型得出的數(shù)據(jù)Y,得出質(zhì)量預(yù)報效果。本發(fā)明的優(yōu)點是提高了質(zhì)量預(yù)報的能力和精確度,降低了高價統(tǒng)計的依賴關(guān)系,能夠有效的去除非依賴信息,且不需要非線性優(yōu)化過程,計算量簡單。
文檔編號G05B19/418GK101446828SQ20081024692
公開日2009年6月3日 申請日期2008年12月30日 優(yōu)先權(quán)日2008年12月30日
發(fā)明者劉建昌, 張穎偉, 杜萬亮, 亮 金 申請人:東北大學(xué)