專利名稱:基于自學習統(tǒng)計分析的聚丙烯生產(chǎn)過程半監(jiān)督監(jiān)測方法
技術領域:
本發(fā)明屬于聚丙烯工業(yè)生產(chǎn)過程的安全監(jiān)測和質(zhì)量控制領域,特別涉及一種基于自學習統(tǒng)計分析的半監(jiān)督過程監(jiān)測方法。
背景技術:
作為一種重要的材料,聚丙烯在很多工業(yè)中都有著非常廣泛的應用。近年來,隨著聚丙烯生產(chǎn)過程自動化水平的進一步提升,過程的安全可靠性以及產(chǎn)品的質(zhì)量問題日益引起人們的關注。以主元分析模型為代表的數(shù)據(jù)驅(qū)動方法開始在聚丙烯生產(chǎn)過程的監(jiān)測中得到應用。但是,傳統(tǒng)的數(shù)據(jù)模型均假設過程的數(shù)據(jù)是完好并且是經(jīng)過嚴格鑒定為正常的數(shù) 據(jù)。然而,在實際過程中,數(shù)據(jù)正常與否通常需要經(jīng)過嚴格的篩選和剔除,步驟往往很復雜,某些變量的鑒定可能非常昂貴,這就需要企業(yè)投入一定的人力、物力和財力。因此,如果能同時針對已經(jīng)鑒定的少量數(shù)據(jù)和大量未經(jīng)鑒定的數(shù)據(jù)進行建模,不僅能有效挖掘未鑒定數(shù)據(jù)集中的有用信息來改善統(tǒng)計分析模型的不足,企業(yè)又能節(jié)省不少人力、物力和財力。半監(jiān)督學習是解決該問題的一個有效方法,其中,自學習又是半監(jiān)督學習中最簡單實用的一種技術。因此,如果能將自學習方法和傳統(tǒng)的主元分析模型相結合,不僅能對聚丙烯生產(chǎn)過程進行有效的監(jiān)測,而且由于該方法簡單實用,非常有利于過程自動化技術的整合。
發(fā)明內(nèi)容
本發(fā)明的目的在于針對現(xiàn)有聚丙烯過程監(jiān)測方法的不足,提供一種基于自學習統(tǒng)計分析的半監(jiān)督監(jiān)測方法。本發(fā)明的目的是通過以下技術方案來實現(xiàn)的一種基于自學習統(tǒng)計分析的聚丙烯生產(chǎn)過程半監(jiān)督監(jiān)測方法,包括以下步驟(I)利用集散控制系統(tǒng)收集聚丙烯生產(chǎn)過程的數(shù)據(jù)組成建模用的二維訓練樣本集=XeRnx'其中,η為樣本數(shù)據(jù)集的個數(shù),m為樣本數(shù)據(jù)集的變量個數(shù)。將這些數(shù)據(jù)存入歷史數(shù)據(jù)庫。(2)將數(shù)據(jù)集分為兩個不同的部分,其中一個部分是經(jīng)過人為鑒定為正常的過程數(shù)據(jù),記為X1 e Vxw,其中ηι為已鑒定樣本數(shù)據(jù)集的個數(shù),m為該樣本數(shù)據(jù)集的變量個數(shù);另一部分為未鑒定的過程數(shù)據(jù),記為X2 eiT’·,其中n2為未鑒定樣本數(shù)據(jù)集的個數(shù),m為該樣本數(shù)據(jù)集的變量個數(shù)。(3)針對已鑒定的數(shù)據(jù)樣本集,對其進行歸一化處理,建立基于主元分析的數(shù)據(jù)統(tǒng)計監(jiān)測模型,確定主元的方向和個數(shù)。(4)在分析主元和殘差的基礎上,建立監(jiān)測統(tǒng)計量,并確定相應的統(tǒng)計限。(5)基于初始的主元統(tǒng)計分析模型,對未鑒定數(shù)據(jù)集中的數(shù)據(jù)進行自動標記,計算相應的主元和監(jiān)測統(tǒng)計量值。(6)在監(jiān)測統(tǒng)計量的基礎上,建立未鑒定樣本的置信度指標,衡量其在上一步主元分析模型中的可信程度。
(7)基于樣本的置信度分析結果,選取部分具有高置信度的樣本進入下一輪的自學習建模,并調(diào)整鑒定樣本集和未鑒定樣本集的數(shù)據(jù)庫。(8)經(jīng)過多輪自學習建模和模型參數(shù)調(diào)整,得到最終的主元統(tǒng)計分析模型。(9)收集新的過程數(shù)據(jù),并對其進行預處理和歸一化。(10)利用自學習得到的最終主元分析模型計算新數(shù)據(jù)的主元,并得到監(jiān)測統(tǒng)計量的值,判斷當前過程的運行狀態(tài)。本發(fā)明的有益效果是本發(fā)明通過引入自學習策略,將傳統(tǒng)聚丙烯過程的數(shù)據(jù)統(tǒng)計分析方法擴展為半監(jiān)督的形式。在過程只有少量經(jīng)過鑒定的樣本數(shù)據(jù)情況下,通過同時引入大量未鑒定的過程數(shù)據(jù),實現(xiàn)聚丙烯過程的半監(jiān)督建模和監(jiān)測。相比目前的其它過程監(jiān)測方法,本發(fā)明不僅可以大大提高聚丙烯生產(chǎn)過程的故障誤報率和監(jiān)測效果,而且在很大程度上降低了聚丙烯過程監(jiān)測的復雜性,可以大量減少人力、物力和財力,對聚丙烯過程 的工業(yè)自動化實施無疑是非常有利的。
圖I是本發(fā)明方法中初始主元分析模型對聚丙烯生產(chǎn)過程測試數(shù)據(jù)的監(jiān)測結果;圖2本發(fā)明方法中最終主元分析模型對聚丙烯生產(chǎn)過程測試數(shù)據(jù)的監(jiān)測結果;圖3是自學習過程中得到的所有主元分析模型對應于測試數(shù)據(jù)集的誤報率;
具體實施例方式本發(fā)明針對聚丙烯生產(chǎn)過程的監(jiān)測問題,首先利用集散控制系統(tǒng)收集該過程的數(shù)據(jù),對其進行必要的預處理和歸一化,然后將整個數(shù)據(jù)集分為鑒定數(shù)據(jù)集和未鑒定數(shù)據(jù)集。針對鑒定數(shù)據(jù)集,建立一個初始的主元分析模型,并建立監(jiān)測統(tǒng)計量的控制限?;谧詫W習半監(jiān)督建模策略,不斷地對未鑒定數(shù)據(jù)集中的樣本進行評價,利用其監(jiān)測統(tǒng)計量建立置信度衡量指標。在每一步迭代學習過程中,選取置信度高的樣本進入下一輪自學習建模,不斷地更新主元分析模型,直到整個自學習過程結束。對新的批次數(shù)據(jù)進行監(jiān)測的時候,首先利用建模數(shù)據(jù)的均值和標準差對其進行歸一化處理,得到標準數(shù)據(jù)之后,再利用自學習建模得到的最終主元分析模型提取該數(shù)據(jù)的主元,計算監(jiān)測統(tǒng)計量的值,實現(xiàn)對聚丙烯生產(chǎn)過程的在線監(jiān)測。本發(fā)明采用的技術方案的主要步驟分別如下第一步利用集散控制系統(tǒng)收集聚丙烯生產(chǎn)過程的數(shù)據(jù)組成建模用的二維訓練樣本集XeRnXn。其中,n為樣本數(shù)據(jù)集的個數(shù),m為樣本數(shù)據(jù)集的變量個數(shù)。將這些數(shù)據(jù)存入歷史數(shù)據(jù)庫。第二步將數(shù)據(jù)集分為兩個不同的部分,其中一個部分是經(jīng)過人為鑒定為正常的過程數(shù)據(jù),記為X1 ,其中ηι為已鑒定樣本數(shù)據(jù)集的個數(shù),m為該樣本數(shù)據(jù)集的變量個數(shù);另一部分為未鑒定的過程數(shù)據(jù),記為X2 ,其中%為未鑒定樣本數(shù)據(jù)集的個數(shù),m為該樣本數(shù)據(jù)集的變量個數(shù)。第三步針對已鑒定的數(shù)據(jù)樣本集X1,對其進行歸一化處理,建立基于主元分析的數(shù)據(jù)統(tǒng)計監(jiān)測模型,確定主元的方向和個數(shù)。對鑒定樣本集數(shù)據(jù)進行預處理和歸一化,即使得各個過程變量的均值為零,方差為1,得到新的數(shù)據(jù)矩陣集。該步驟的主要目的是為了使得過程數(shù)據(jù)的尺度不會影響到監(jiān)測的結果。通過歸一化之后,不同過程變量的數(shù)據(jù)就處在相同的尺度之下,既而不會影響到后續(xù)的監(jiān)控效果。然后,對該數(shù)據(jù)集進行主元分析,把原空間分為主元空間和殘差空間,選取合適的主元個數(shù),得到的載荷矩陣P和得分矩陣T,并獲得建模的殘差,即
權利要求
1.一種基于自學習統(tǒng)計分析的聚丙烯生產(chǎn)過程半監(jiān)督監(jiān)測方法,其特征在于,包括以下步驟 (1)利用集散控制系統(tǒng)收集聚丙烯生產(chǎn)過程的數(shù)據(jù)組成建模用的二維訓練樣本集X e Rnx'其中,η為樣本數(shù)據(jù)集的個數(shù),m為樣本數(shù)據(jù)集的變量個數(shù)。將這些數(shù)據(jù)存入歷史數(shù)據(jù)庫。
(2)將數(shù)據(jù)集分為兩個不同的部分,其中一個部分是經(jīng)過人為鑒定為正常的過程數(shù)據(jù),記為X1其中&為已鑒定樣本數(shù)據(jù)集的個數(shù),m為該樣本數(shù)據(jù)集的變量個數(shù);另一部分為未鑒定的過程數(shù)據(jù),記為其中%為未鑒定樣本數(shù)據(jù)集的個數(shù),m為該樣本數(shù)據(jù)集的變量個數(shù)。
(3)針對已鑒定的數(shù)據(jù)樣本集,對其進行歸一化處理,建立基于主元分析的數(shù)據(jù)統(tǒng)計監(jiān)測模型,確定主元的方向和個數(shù)。
(4)在分析主元和殘差的基礎上,建立監(jiān)測統(tǒng)計量,并確定相應的統(tǒng)計限。
(5)基于初始的主元統(tǒng)計分析模型,對未鑒定數(shù)據(jù)集中的數(shù)據(jù)進行自動標記,計算相應的主元和監(jiān)測統(tǒng)計量值。
(6)在監(jiān)測統(tǒng)計量的基礎上,建立未鑒定樣本的置信度指標,衡量其在上一步主元分析模型中的可信程度。
(7)基于樣本的置信度分析結果,選取部分具有高置信度的樣本進入下一輪的自學習建模,并調(diào)整鑒定樣本集和未鑒定樣本集的數(shù)據(jù)庫。
(8)經(jīng)過多輪自學習建模和模型參數(shù)調(diào)整,得到最終的主元統(tǒng)計分析模型。
(9)收集新的過程數(shù)據(jù),并對其進行預處理和歸一化。
(10)利用自學習得到的最終主元分析模型計算新數(shù)據(jù)的主元,并得到監(jiān)測統(tǒng)計量的值,判斷當前過程的運行狀態(tài)。
2.根據(jù)權利要求I所述基于自學習統(tǒng)計分析的聚丙烯生產(chǎn)過程半監(jiān)督監(jiān)測方法,其特征在于,所述步驟3具體為針對已鑒定的程數(shù)據(jù)集,首先對其進行歸一化處理,即去掉每個數(shù)據(jù)變量的均值和方差,然后建立主元分析模型,具體可以通過對協(xié)方差矩陣Z=XfX! A , -I琎行特征值分解實現(xiàn)。通過主元分析,可以把原空間分為主元空間和殘差空間,得到的載荷矩陣P e Rnxk和得分矩陣Te"M如下
3.根據(jù)權利要求I所述基于自學習統(tǒng)計分析的聚丙烯生產(chǎn)過程半監(jiān)督監(jiān)測方法,其特征在于,所述步驟4具體為在主元分析模型的基礎上,通過構造以下兩個統(tǒng)計量來實現(xiàn)對過程的監(jiān)測
4.根據(jù)權利要求I所述基于自學習統(tǒng)計分析的聚丙烯生產(chǎn)過程半監(jiān)督監(jiān)測方法,其特征在于,所述步驟5具體為基于初始的主元分析模型,計算未鑒定數(shù)據(jù)集中樣本X2的主元和殘差,即
5.根據(jù)權利要求I所述基于自學習統(tǒng)計分析的聚丙烯生產(chǎn)過程半監(jiān)督監(jiān)測方法,其特征在于,所述步驟(6)具體為在監(jiān)測統(tǒng)計量的基礎上,建立未鑒定樣本的置信度指標Q,定義如下
6.根據(jù)權利要求I所述基于自學習統(tǒng)計分析的聚丙烯生產(chǎn)過程半監(jiān)督監(jiān)測方法,其特征在于,所述步驟10具體為基于自學習建模所得到的最終主元分析模型,計算新數(shù)據(jù)樣本Xnew的主元和殘差,即
全文摘要
本發(fā)明公開了一種基于自學習統(tǒng)計分析的聚丙烯生產(chǎn)過程半監(jiān)督監(jiān)測方法,本發(fā)明通過引入自學習策略,將傳統(tǒng)聚丙烯過程的數(shù)據(jù)統(tǒng)計分析方法擴展為半監(jiān)督的形式。在過程只有少量經(jīng)過鑒定的樣本數(shù)據(jù)情況下,通過同時引入大量未鑒定的過程數(shù)據(jù),實現(xiàn)聚丙烯過程的半監(jiān)督建模和監(jiān)測。相比目前的其它過程監(jiān)測方法,本發(fā)明不僅可以大大提高聚丙烯生產(chǎn)過程的故障誤報率和監(jiān)測效果,而且在很大程度上降低了聚丙烯過程監(jiān)測的復雜性,可以大量減少人力、物力和財力,對聚丙烯過程的工業(yè)自動化實施無疑是非常有利的。
文檔編號G05B13/04GK102830624SQ20121033204
公開日2012年12月19日 申請日期2012年9月10日 優(yōu)先權日2012年9月10日
發(fā)明者葛志強, 宋執(zhí)環(huán) 申請人:浙江大學