結合過程先驗和數(shù)據(jù)驅動模型的混合建模方法及系統(tǒng)的制作方法
【技術領域】
[0001] 本發(fā)明屬于化工過程建模領域,涉及一種過程建模方法,尤其涉及一種結合過程 先驗和數(shù)據(jù)驅動模型的混合建模方法;同時,本發(fā)明還涉及一種結合過程先驗和數(shù)據(jù)驅動 模型的混合模型。
【背景技術】
[0002] 傳統(tǒng)的機理信息建模方法必須對建模的系統(tǒng)有足夠的了解,并且通過質量能量方 程、反應動力學方程等公式建立精確的描述模型。但是,實際工業(yè)過程復雜度高、反應機理 多,難以準確把握,導致機理信息建模常難以達到過程系統(tǒng)模型的精度要求。基于數(shù)據(jù)驅動 的方法迅速發(fā)展,并廣泛應用于化工過程建模與優(yōu)化。數(shù)據(jù)驅動建模方法的優(yōu)點在于僅依 托于歷史數(shù)據(jù)或現(xiàn)場實時數(shù)據(jù),不需要明確的機理信息。對于復雜的非線性過程,在能夠獲 取充足的輸入輸出樣本下,數(shù)據(jù)驅動建模常具有較好的效果。然而,數(shù)據(jù)驅動建模方法也有 明顯的缺點,如機理表達的模糊,外延特性不好,以及在小樣本建模中常見的過擬合現(xiàn)象。
[0003] 目前的主要避免過擬合的方法主要利用樣本自身信息(如外部檢驗法、引導重采 樣和噪聲注入技術擴充樣本法)實現(xiàn)對過擬合現(xiàn)象的一定制約,但研宄表明小樣本建模作 用有限。過程對象本身存在諸多的機理信息難以應用,例如過程中大量的可以分析得到的 一階信息(表現(xiàn)為單調性)、二階信息(表現(xiàn)為凹凸性)和輸出限制信息。一些學者也提 出綜合過程機理的數(shù)據(jù)驅動建模方法(如帶有機理的代理模型方法、輸出增益檢測的神經 網絡模型、合概率密度估計的建模方法和單調神經網絡),但是綜合建模方法也存在一些缺 陷,要么模型結構過于簡單,要么建模對象約束較高。
[0004] 傳統(tǒng)的機理信息結合樣本信息的建模方法在克服過擬合問題上存在諸多的缺陷, 容易對部分有用信息進行舍棄。有鑒于此,如今迫切需要設計一種新的建模方法和模型,綜 合利用機理信息和樣本信息,客服小樣本建模的過擬合問題。
【發(fā)明內容】
[0005] 本發(fā)明所要解決的技術問題是:提供一種結合過程先驗和數(shù)據(jù)驅動模型的混合建 模方法,可以在少量數(shù)據(jù)樣本的神經網絡訓練下得到更符合先驗知識的模型,避免過擬合 現(xiàn)象的發(fā)生。
[0006] 此外,本發(fā)明還提供一種結合過程先驗和數(shù)據(jù)驅動模型的混合系統(tǒng),可以在少量 數(shù)據(jù)樣本的情形下訓練得到更符合先驗知識的數(shù)據(jù)驅動模型,避免過擬合現(xiàn)象的發(fā)生和提 尚豐旲型魯棒性。
[0007] 為解決上述技術問題,本發(fā)明采用如下技術方案:
[0008] -種結合過程先驗和數(shù)據(jù)驅動模型的混合建模方法,所述方法包括如下步驟:
[0009] 步驟S1、從已知的數(shù)據(jù)驅動模型中選擇合適的數(shù)據(jù)驅動模型和合適的模型結構, 建立對應模型的數(shù)學關系表達式,將所有的模型參數(shù)按照一定的順序排列;
[0010] 步驟S2、定步掃描方法對模型過程先驗(主要包括輸出響應信息、輸出響應的一 階信息(表現(xiàn)為單調性)和二階信息(表現(xiàn)為凹凸性)進行驗證,得到檢驗模型違反過程 先驗程度的約束方程;
[0011] 步驟S3、將樣本的模型輸出和觀測值比較,根據(jù)均方差公式和正則化方法建立檢 驗模型擬合訓練樣本程度的優(yōu)化目標方程;
[0012] 步驟S4、將約束方程和優(yōu)化目標方程聯(lián)合,構建約束優(yōu)化問題,采用約束處理智能 算法求解最優(yōu)參數(shù)解;
[0013] 步驟S5、將求解得到的最優(yōu)參數(shù)解,作為Sl的模型參數(shù)解,代入原模型中,用于模 型預測或模型優(yōu)化。
[0014] 作為本發(fā)明的一種優(yōu)選方案,所述步驟Sl的模型數(shù)學關系表達式和模型參數(shù)排 列:選擇某一數(shù)據(jù)驅動模型,一般的我們常選擇BP神經網絡模型、響應曲面模型、支持向量 機等。
[0015] 對于BP神經網絡模型,其模型輸入輸出關系式為:
[0016]
[0017]其中:
[0018] par為模型參數(shù)排列,在BP網絡模型中為所有權值和閾值的一種固定排列,包括 所有的Wij, Tli, 和Θ p
[0019] X為輸入向量組合,也可表示成(X1, X2,…,X1),
[0020] Wu為輸入層到隱含層的權值系數(shù),
[0021] Θ」為隱含層各神經元的閾值系數(shù),
[0022] Tli為隱含層到輸出層的權值系數(shù),
[0023] Θ 輸出層神經元的閾值系數(shù),
[0024] L為輸入層神經元數(shù),由實際系統(tǒng)的輸入變量決定,
[0025] H為隱含層神經元數(shù),為建模者根據(jù)經驗或者試湊法不確定方法來決定,
[0026] B為輸出層神經元數(shù),由于研宄對象為多輸入單輸出對象,輸出層神經元數(shù)取1,
[0027] fi_h為隱含層激活函數(shù),激活函數(shù)種類繁多,簡單線性函數(shù)(purelin)、有sigmoid 函數(shù)(tansig和logsig)、正弦函數(shù)、雙曲正切和反正切,自適應多項式函數(shù)等。常用的包括 tansig,Iogsig 和 purelin 三種,一般隱含層選取 tansig 或 logsig,
[0028] fh_。為隱含層激活函數(shù),一般選取purelin ;
[0029] 類似的,對于響應曲面模型,其模型輸入輸出關系式為:
[0030]
[0031] 其中:
[0032] par表不模型參數(shù)組合,包含b。、t^、bjk和b p
[0033] Idci為常數(shù)項,
[0034] bi為輸入Xi的一階項,
[0035] bjk為輸入X』和X k的相關系數(shù)項,
[0036] Id1為輸入X1的二階項,
[0037] Xi為第i個輸入變量,共計L維;
[0038] 作為本發(fā)明的一種優(yōu)選方案,所述步驟S2通過以下3個子步驟獲得模型的約束方 程表達式:
[0039] 步驟S2. 1、檢測點采樣:在整個空間用固定步長Au將整個空間進行劃分成多個 子空間,分別在子空間內采樣,作為輸出范圍先驗的多次檢測。同樣的,用固采定步長Aij 將已知的單調性先驗和凹凸性先驗的區(qū)間劃分成個更小的M,7子區(qū)間,標記為
[0040] 步驟S2. 2、采樣點的先驗檢測:對于整個對象輸入空間內的輸出范圍檢測,可通 過采樣點的輸出值與輸出上下限比較得到,已知輸出上限為yH,下限為5^,比較檢驗模型 輸出值與它們的關系,當且僅當Λ {^,辦時,輸出范圍先驗正確,否則在該小區(qū)域內 違反輸出范圍先驗。若所有采樣點均符合輸出范圍檢驗結果,則近似認為模型對該條單調 先驗無違反。對于該小區(qū)間內的單調信息正確性檢驗可通過多次固定其他輸入變量值,僅 求解區(qū)間兩端點(和的輸出值,比較大小檢驗單調性信息,若輸出值比較結果與 單調信息符合,近似認為該小區(qū)間符合單調信息。例如,若該區(qū)間為單調遞增區(qū)間,必有 λ >iu,若為單調遞減區(qū)間,必有λ <?,"ρ若所有小區(qū)間均符合單調信息檢驗結果,則 近似認為模型對該條單調先驗無違反。同理,檢驗該小區(qū)間的凹凸性可采用兩端點 和^ )和中點的輸出值比較,近似檢驗小區(qū)間的凹凸信息。例如,若該區(qū)間為嚴 格凸區(qū)間,必有+ > 2 X ,若為嚴格凹區(qū)間,必有+ y< 2 X 。可用符號 函數(shù)表示每一條先驗的每一次檢驗結果,如公式(3)、公式(4)和公式(5),公式(3)用于檢 驗輸出范圍,公式(4)用于檢驗單調性先驗,公式(5)用于檢驗凹凸性先驗;
[0041]
[0042]
[0043]
[0044] 其中,h(i,j,m)為第i維上第j條已知先驗的第m次檢測結果;
[0045] 如果每一個h(i,j,m)對應的值均為"1",則近似認為模型完全符合對應先驗; h (i,j,m)為"-1",模型在對應的小區(qū)間內必然違背對應先驗知識;
[0046] 步驟S2. 3、違反程度統(tǒng)計:根據(jù)統(tǒng)計"-1"的次數(shù)占所有掃描檢驗次數(shù)的比例 viol,刻畫模型的先驗機理違反程度,計算公式如下:
[0047]
[0048] 如果系統(tǒng)模型完全符合所有過程先驗,viol值為0。viol值較小代表模型輕微違 反已知的過程先驗;Viol越接近1,表示模型違反過程的程度越大。
[0049] 作為本發(fā)明的一種優(yōu)選方案,所述步驟S3通過以下2個子步驟獲得模型的優(yōu)化目 標函數(shù)F(W):
[0050] 步驟S3. 1、構建數(shù)據(jù)驅動模型輸出值與測量值的均方差模型,見公式(7):
[0051]
(7)
[0052] 為第k個樣本的模型輸出,計算公式參考模型數(shù)學關系式,例如若是選擇BP網 絡則參考公式(1),若是選擇響應曲面模型則選擇公式(2),選擇其他數(shù)據(jù)驅動建模方法則 建立對應的模型數(shù)學關系式,
[0053