本發(fā)明涉及基于數(shù)據(jù)驅(qū)動的質(zhì)量指標監(jiān)測,特別是涉及一種針對污水處理過程的水質(zhì)指標bod5監(jiān)測技術(shù)。具體而言,本發(fā)明涉及一種基于特征增強提取的寬度學(xué)習(xí)模型,用于在污水處理過程中進行水質(zhì)指標監(jiān)測的技術(shù)。在污水處理過程中,對水質(zhì)指標五日生化需氧量(five-day?biochemical?oxygen?demand,bod5)的準確監(jiān)測至關(guān)重要。傳統(tǒng)的水質(zhì)指標監(jiān)測方法難以應(yīng)用于復(fù)雜的污水處理過程,因此需要一種新穎的數(shù)據(jù)驅(qū)動方法來提高水質(zhì)指標監(jiān)測方法的性能和準確度。本發(fā)明旨在通過2
背景技術(shù):
1、污水處理廠通過有效處理污水,降低水體中的污染物濃度,按照嚴格的出水排放標準在最大限度減少了水體污染并保護了水資源的可持續(xù)利用。其中,水質(zhì)指標五日生化需氧量(bod5)是衡量污水處理效果的關(guān)鍵參數(shù)之一,反映了水中生物可分解有機物的濃度。通過監(jiān)測出水的bod5濃度,可以有效評估污水處理廠對有機污染物處理的效率,確保處理后的水質(zhì)符合環(huán)保標準并能夠安全地重新進入自然水體或被再利用。然而,目前實際應(yīng)用的bod5測量方法具有一定的局限性,包括長時間的測定周期(通常需要5天)、操作繁瑣以及對環(huán)境條件的高度依賴性,這些因素均可能影響測量的效率和準確性。因此,盡管bod5是評估污水處理效果的重要指標,但它的這些測量特性限制了其在實時監(jiān)控和快速決策中的應(yīng)用。面對這些挑戰(zhàn),軟測量技術(shù)被提出作為一種替代方案。該技術(shù)核心是通過易測量的過程變量構(gòu)成數(shù)學(xué)模型來估計難以直接測量的性能指標。在污水領(lǐng)域,軟測量的建模方法主要分為基于過程機理分析和基于數(shù)據(jù)驅(qū)動的兩種方法。機理模型在建立時通常需要對污水處理過程有深入理解,并涉及復(fù)雜的生物、化學(xué)或物理方程描述,因此建模過程既復(fù)雜又耗時。相比之下,基于數(shù)據(jù)驅(qū)動軟測量模型僅通過分析歷史數(shù)據(jù)識別輸入與輸出之間的映射關(guān)系,以其快速的建模速度和高準確性在污水軟測量領(lǐng)域受到了廣泛關(guān)注。
2、目前,應(yīng)用于污水處理過程和其他復(fù)雜工業(yè)過程的數(shù)據(jù)驅(qū)動水質(zhì)指標監(jiān)測模型,較為經(jīng)典的方法包括主成分回歸(principal?component?regression,pcr)、核偏最小二乘(kernel?partial?least?squares,kpls)、支持向量機(support?vector?machine,svm)和人工神經(jīng)網(wǎng)絡(luò)(artificial?neural?network,ann)。然而,上述方法受限于淺層網(wǎng)絡(luò)結(jié)構(gòu),在處理復(fù)雜的污水處理過程數(shù)據(jù)時效果并不理想。近年來的研究表明基于深度神經(jīng)網(wǎng)絡(luò)的方法相對于淺層神經(jīng)網(wǎng)絡(luò)具有更強的表達能力,在建模中能夠更好地捕捉輸入復(fù)雜數(shù)據(jù)的非線性特征。常見的深度神經(jīng)網(wǎng)絡(luò)包括堆疊自動編碼器、卷積神經(jīng)網(wǎng)絡(luò)和深度置信網(wǎng)絡(luò)在污水處理過程和其他復(fù)雜工業(yè)過程的建模中均取得了優(yōu)越的性能。然而,上述的深度神經(jīng)網(wǎng)絡(luò)通常假設(shè)樣本是獨立的,忽略了污水處理過程時序數(shù)據(jù)的時間相關(guān)特征。此外,由于其深度的網(wǎng)絡(luò)結(jié)構(gòu)和復(fù)雜超參數(shù)導(dǎo)致模型在訓(xùn)練過程也非常的耗時,無法滿足污水處理過程實時測量水質(zhì)指標的需求。
3、針對上述深度學(xué)習(xí)的不足,寬度學(xué)習(xí)系統(tǒng)(broad?learning?system,bls)的出現(xiàn)為深度神經(jīng)網(wǎng)絡(luò)訓(xùn)練和更新耗時的難題提供了解決方案。bls的基本思路是將數(shù)據(jù)映射為特征節(jié)點和增強節(jié)點,并合并為一層直接連接到輸出層。與深度神經(jīng)網(wǎng)絡(luò)通過疊加網(wǎng)絡(luò)層數(shù)提高模型精度不同,bls通過增加節(jié)點個數(shù)橫向擴展網(wǎng)絡(luò)只需要訓(xùn)練該層與輸出層的連接權(quán)重。這種扁平化的網(wǎng)絡(luò)結(jié)構(gòu)使bls避免了復(fù)雜的訓(xùn)練過程,大大減少了網(wǎng)絡(luò)訓(xùn)練的時間開銷。此外,訓(xùn)練好的bls可以在不重新訓(xùn)練網(wǎng)絡(luò)的前提下,進行快速更新增加節(jié)點提高模型精度,其普遍逼近能力和非線性特征提取能力在理論上也得到了保證。然而,bls雖然保證了網(wǎng)絡(luò)訓(xùn)練的時間開銷且可以在線快速更新網(wǎng)絡(luò)結(jié)構(gòu),但不能同時有效地處理污水?dāng)?shù)據(jù)的非線性、時間相關(guān)性和非高斯性特征。如果忽略數(shù)據(jù)的多重特征信息,都將導(dǎo)致對數(shù)據(jù)特征提取的不充分,模型的監(jiān)測精度下降。此外,通過上述分析可知bls的結(jié)構(gòu)靈活。因此,為了獲得更好的網(wǎng)絡(luò)性能,本方法將bls的特征窗口進行循環(huán)連接改進為rbls,并通過oica算法構(gòu)建一種基于特征增強提取的寬度學(xué)習(xí)系統(tǒng)水質(zhì)指標bod5的監(jiān)測方法改。該方法通過學(xué)習(xí)污水?dāng)?shù)據(jù)的時間相關(guān)性特征、非高斯型特征,進而提取數(shù)據(jù)中有效的工藝信息提高水質(zhì)指標bod5的監(jiān)測精度。本發(fā)明的水質(zhì)指標監(jiān)測技術(shù)可廣泛應(yīng)用于污水處理廠和相關(guān)領(lǐng)域,用于對水質(zhì)指標進行在線監(jiān)測。通過該技術(shù),操作人員可以更好地了解處理過程中的水質(zhì)狀況,及時采取必要的措施,以確保污水處理過程的高效運行和水質(zhì)達標。
技術(shù)實現(xiàn)思路
1、為了解決由于污水處理過程數(shù)據(jù)的非線性、時間相關(guān)性和非高斯性特征導(dǎo)致的水質(zhì)指標bod5的監(jiān)測結(jié)果不準確的問題,本發(fā)明提出了一種基于特征增強的寬度學(xué)習(xí)系統(tǒng)(feature?augmented?extraction?broad?learning?system,fae-bls)的水質(zhì)指標監(jiān)測方法。該方法在深度循環(huán)網(wǎng)絡(luò)rnn的啟發(fā)下,將bls的特征窗口進行遞歸級聯(lián)形成rbls,以有效地提取污水?dāng)?shù)據(jù)的時間相關(guān)性特征。與此同時,為了增強rbls對污水?dāng)?shù)據(jù)的非高斯性特征的提取,利用oica算法構(gòu)建非高斯性特征的提取窗口,豐富bls模型對污水?dāng)?shù)據(jù)的過程特性的學(xué)習(xí)能力。此外,寬度學(xué)習(xí)系統(tǒng)的非線性激活函數(shù)還可以提取數(shù)據(jù)的非線性特征。最后,當(dāng)該網(wǎng)絡(luò)在面對污水處理環(huán)境變化或異常工況發(fā)生時預(yù)測精度持續(xù)下降不滿足實際工業(yè)需求時,該網(wǎng)絡(luò)可以橫向擴展增加增強節(jié)點快速調(diào)整模型結(jié)構(gòu),在不需要重新訓(xùn)練網(wǎng)絡(luò)的情況下提高模型的監(jiān)測精度。綜上,本發(fā)明提供了一種針對污水處理過程的新型水質(zhì)指標監(jiān)測技術(shù),基于特征增強的寬度學(xué)習(xí)系統(tǒng)來實現(xiàn)對污水處理過程水質(zhì)指標bod5的準確實時監(jiān)測。這項技術(shù)的應(yīng)用將有助于提高水處理廠的運行效率和水質(zhì)監(jiān)測的可靠性。
2、本發(fā)明采用了如下的技術(shù)方案及實現(xiàn)步驟:
3、假設(shè)輸入的過程變量原始數(shù)據(jù)為x∈rn×d,n代表樣本數(shù)量,d是每個樣本所包含的過程變量個數(shù)。所對應(yīng)的水質(zhì)指標輸出數(shù)據(jù)為y∈rn×m,m是水質(zhì)指標的個數(shù)。
4、a.離線訓(xùn)練階段:
5、1)采用時間窗口對原始數(shù)據(jù)x進行序列化,得到序列化后的數(shù)據(jù)集xp=[x1,...,xt],t=1,…,p。xt∈r(n-p+1)×d是每個特征窗口的輸入數(shù)據(jù),p是特征窗口的個數(shù),m=n-p+1是時間窗口的步長。
6、2)將經(jīng)過時間窗口掃描處理后的數(shù)據(jù)xp輸入到基于循環(huán)結(jié)構(gòu)的特征窗口中,所
7、生成第t個窗口的構(gòu)造公式如下:
8、zt=σ(xtwz+zt-1u+b0)??(1)
9、其中,第t個特征窗口zt不僅從當(dāng)前輸入的xt提取淺層特征,還通過學(xué)習(xí)第t-1個特征窗口zt-1來提取不同時間步下數(shù)據(jù)的時間相關(guān)性特征,以形成具有循
10、環(huán)結(jié)構(gòu)的特征窗口。σ是激活函數(shù)sigmoid,初始狀態(tài)z0設(shè)置為0。每個特征窗
11、口在進行遞歸級聯(lián)時關(guān)聯(lián)到的權(quán)重與偏差都是共享的,即利用均勻分布隨機生成的權(quán)重wz、權(quán)重u和偏置b0。
12、3)重復(fù)步驟2完成全部提取數(shù)據(jù)時間相關(guān)性的特征窗口zt的生成,將這些窗口進行連結(jié)表示為zp=[z1,z2,…,zp],p代表網(wǎng)絡(luò)中所包含特征窗口的總個數(shù)。
13、隨后,為了增強模型對數(shù)據(jù)不同過程特性的學(xué)習(xí),創(chuàng)建了基于oica的非高
14、斯特征提取窗口。該窗口應(yīng)用的oica算法的核心思想是將訓(xùn)練數(shù)據(jù)x的d維過程變量通過混合矩陣d∈rd×k分解為k個具有高階特征的獨立元(k>d)
15、以提取其中的非高斯信息。
16、xt=dα?(2)
17、其中,xt∈rd×n為x的轉(zhuǎn)置矩陣,α=[α1,…,αk]是獨立元矩陣,k是d維過程變量分解后的獨立元維度,代表第i個獨立元,n是樣本數(shù)量。
18、4)對混合矩陣d進行求解主要分為兩個步驟。首先是通過x構(gòu)造由原子張成的近似子空間w=span{n1,n2,…,ns},span是數(shù)學(xué)符號表示由矩陣所張成的空間。隨后,近似計算中的原子
19、對進行特征值分解,其中最大特征值所對應(yīng)的特征向量即為混合矩陣d
20、中向量的近似解,按照編號i=1,…k順序進行組合即可得到混合矩陣d。獲
21、取混合矩陣d后,數(shù)據(jù)的非高斯特征提取如下所示:
22、g=xd??(3)
23、其中,g∈rn×k代表了基于oica的特征窗口所提取到的數(shù)據(jù)非高斯的信息。5)在創(chuàng)建完提取數(shù)據(jù)時間相關(guān)性和非高斯性的特征窗口,為了保證該方法可以
24、提取到輸入數(shù)據(jù)的原始非線性特征,因此不同于經(jīng)典bls通過特征窗口映射增強窗口,該方法將原始數(shù)據(jù)x輸入到增強窗口進行非線性特征的提取,具
25、體如下:
26、hj=ξ(xwhj+βhj)j=1,2,…,j??(4)
27、6)其中,ξ是非線性激活函數(shù)tanh,whj和βhj是由均勻分布隨機生成的權(quán)重和偏
28、置。重復(fù)步驟5完成全部提取數(shù)據(jù)非線性的增強窗口的生成,將這些窗口進行連結(jié)表示為hj=[h1,h2,…,hj],j代表網(wǎng)絡(luò)中所包含的增強窗口的總個數(shù)。
29、最后,將所有提取不同數(shù)據(jù)特征的窗口合并為輸入層:
30、aj=[z1,z2,…,zp|g|h1,h2,…,hj]??(5)7)得到輸入層后,構(gòu)建多重特征增強提取的寬度學(xué)習(xí)系統(tǒng),可用如下公式表示:
31、y=ajwj??(6)
32、其中,wj=[wz|wg|wh]是網(wǎng)絡(luò)的輸出連接權(quán)重,wz、wg和wh分別代表污水?dāng)?shù)據(jù)的時間相關(guān)性特征、非高斯性特征和非線性特征信息的輸出權(quán)重。連接權(quán)值wj=[aj]+y,[·]+表示求某矩陣的偽逆,具體的計算過程如下:
33、
34、其中,λ2為l2正則化參數(shù),i為單位矩陣,可求得寬度學(xué)習(xí)系統(tǒng)的輸出網(wǎng)絡(luò)權(quán)重wj,從而獲得水質(zhì)指標bod5的監(jiān)測結(jié)果。
35、b.在線監(jiān)測階段:
36、8)采集當(dāng)前時刻的樣本數(shù)據(jù)xnew,參考步驟1對新采集數(shù)據(jù)利用時間窗口進行
37、序列化為
38、9)隨后,將輸入到訓(xùn)練好的特征增強提取的寬度學(xué)習(xí)系統(tǒng)中,其中模型參數(shù)由離線建模訓(xùn)練得到,模型的最終輸出為污水處理過程的水質(zhì)指標。
39、10)當(dāng)該方法應(yīng)用于污水處理現(xiàn)場在線預(yù)測精度不夠時,可以在不重新訓(xùn)練網(wǎng)絡(luò)的前提下,進行快速更新增加增強節(jié)點以提高模型精度。增強節(jié)點的增加不需要復(fù)雜的計算,通過偽逆可以簡單地獲得權(quán)值。增加增強節(jié)點后的輸入層
40、表示為:
41、aj+1=[aj∣∣ξ(xwhj+1+βhj+1)]??(8)
42、其中權(quán)值whj+1和βhj+1均為隨機生成的權(quán)重和偏置。
43、11)新輸入層與輸出層的連接表達式為y=aj+1wj+1,連接權(quán)值wj+1=[aj+1]+y其中[aj+1]+的計算過程如下:
44、
45、c=ξ(xwhj+1+βhj+1)-ajd
46、最后,增加增強節(jié)點厚望的新連接權(quán)重wj+1為:
47、
48、12)通過步驟11更新網(wǎng)絡(luò)參數(shù)并保存,將在線數(shù)據(jù)輸入到更新好的網(wǎng)絡(luò),模型的最終輸出為水質(zhì)指標的測量結(jié)果。
49、有益效果
50、與現(xiàn)有技術(shù)相比,本發(fā)明利用多重特征增強提取的寬度學(xué)習(xí)模型對采集到的正常數(shù)據(jù)進行離線訓(xùn)練,然后利用訓(xùn)練獲得的模型參數(shù)對在線水質(zhì)指標進行測量。不同于現(xiàn)有技術(shù),本發(fā)明提出的方法可以同時學(xué)習(xí)污水處理數(shù)據(jù)所具有的非高斯性特征、時間相關(guān)性特征、非線性特征,彌補了bls在提取污水處理過程數(shù)據(jù)多重特征方面的不足,實現(xiàn)了高精度監(jiān)測污水處理過程的水質(zhì)指標。此外,該方法可以在線快速更新方法,在面對環(huán)境動態(tài)復(fù)雜的污水處理工業(yè)過程,模型精度下降時,可以在無需重新訓(xùn)練網(wǎng)絡(luò)的前提下,進行快速更新提高模型的效率,更適合應(yīng)用于實際的污水處理工業(yè)過程。