一種生化需氧量參數(shù)在線軟測(cè)量方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明屬于數(shù)據(jù)測(cè)量技術(shù)領(lǐng)域,涉及一種生化需氧量參數(shù)在線軟測(cè)量方法。
【背景技術(shù)】
[0002] B0D是指污水出水指標(biāo)之生化需氧量,在污水處理過(guò)程中,生化需氧量(B0D)是評(píng) 價(jià)水質(zhì)好壞和處理效果的關(guān)鍵參數(shù)之一。由于其涉及很多復(fù)雜的生化反應(yīng)過(guò)程,因此長(zhǎng)期 以來(lái)B0D的測(cè)量都存在著很多問(wèn)題,具體表現(xiàn)在:國(guó)際通用的標(biāo)準(zhǔn)檢測(cè)方法測(cè)量滯后性較 大,快速檢測(cè)方法測(cè)量成本過(guò)高且測(cè)量不準(zhǔn)確。
[0003] 污水處理過(guò)程高度復(fù)雜,測(cè)量參數(shù)眾多,現(xiàn)場(chǎng)測(cè)試的數(shù)據(jù)由于受測(cè)量?jī)x表精度、可 靠性和現(xiàn)場(chǎng)測(cè)量環(huán)境等因素的影響,會(huì)帶有各種各樣的測(cè)量誤差,若數(shù)據(jù)不經(jīng)過(guò)進(jìn)一步處 理,采集到的低精度或失效的數(shù)據(jù)會(huì)導(dǎo)致測(cè)量精度大幅度下降,甚至?xí)苯訉?dǎo)致污水處理 軟測(cè)量模型的失效。同時(shí),通常需要采集更多的參數(shù)數(shù)據(jù)信息以更好的反映污水處理過(guò)程 狀態(tài),但是過(guò)多的參數(shù)數(shù)據(jù)使得后續(xù)的模型非常復(fù)雜。因此,如何保證采集數(shù)據(jù)的有效性, 以及如何剔除冗余信息是B0D參數(shù)軟測(cè)量首先要解決的關(guān)鍵技術(shù)問(wèn)題。
[0004] 目前市場(chǎng)上的B0D檢測(cè)儀表采用的主要是測(cè)壓差法和生物傳感器法為原理制作 的。例如美國(guó)哈希BODTrakTMlI分析儀,德國(guó)LovibondB0D分析儀等,采用的是測(cè)壓差法; 日本CKC公司的α1000型B0D測(cè)量?jī)x采用的是生物傳感器方法制作的。采用壓差法的測(cè) 量?jī)x器測(cè)量時(shí)間過(guò)長(zhǎng),需要5天,遠(yuǎn)遠(yuǎn)無(wú)法滿足污水處理過(guò)程實(shí)時(shí)控制的需要;采用生物傳 感器法的B0D測(cè)量?jī)x器存在著儀器生物傳感器制作困難,測(cè)量范圍較窄,相關(guān)的膜材料容 易損壞從而導(dǎo)致儀器的使用壽命不足,使用成本過(guò)高,因而也無(wú)法廣泛應(yīng)用。
【發(fā)明內(nèi)容】
[0005] 本發(fā)明的目的在于提供一種生化需氧量參數(shù)在線軟測(cè)量方法,解決了現(xiàn)有的測(cè)量 方法時(shí)間長(zhǎng),成本高的問(wèn)題。
[0006] 本發(fā)明所采用的技術(shù)方案是按照以下步驟進(jìn)行:
[0007] 步驟1 :樣本數(shù)據(jù)預(yù)處理,得到有效樣本數(shù)據(jù);
[0008] (1)樣本數(shù)據(jù)歸一化處理,使得樣本數(shù)據(jù)處于[-1,1]之間;
[0009] (2)利用主元分析解耦和降維;
[0010] (3)利用Jolliffe參數(shù)剔除和主體數(shù)據(jù)不相符的離群點(diǎn),以提高數(shù)據(jù)的可靠性;
[0011] (4)利用中值濾波器去除數(shù)據(jù)生成和采集過(guò)程中的噪聲干擾;
[0012] 步驟2 :局部線性回歸預(yù)測(cè)模型的建立及其訓(xùn)練;
[0013] (1)確定局部線性回歸模型;
[0014] ⑵權(quán)值初始化;
[0015] (3)模型輸出預(yù)測(cè),給定一個(gè)新的數(shù)據(jù)輸入點(diǎn),計(jì)算K個(gè)線性輸入模型并得到預(yù)測(cè) 值;
[0016] (4)模型訓(xùn)練,利用代價(jià)函數(shù)通過(guò)梯度下降法來(lái)調(diào)整半正定距離矩陣D得到權(quán)值;
[0017] (5)如果代價(jià)函數(shù)不滿足要求,則調(diào)整矩陣D進(jìn)而修改權(quán)值,回到第(3)步,直至代 價(jià)函數(shù)滿足要求,則模型訓(xùn)練結(jié)束,權(quán)值確定;
[0018] 步驟3 :B0D參數(shù)在線軟測(cè)量輸出;將有效樣本數(shù)據(jù)通過(guò)訓(xùn)練好的局部線性回歸預(yù) 測(cè)模型進(jìn)行在線B0D參數(shù)軟測(cè)量。
[0019] 進(jìn)一步,所述在線B0D參數(shù)軟測(cè)量中,對(duì)實(shí)時(shí)檢測(cè)到的輔助變量進(jìn)行預(yù)處理,包括 如歸一化、主元分析、判斷是否為離群點(diǎn)、噪聲濾波。
[0020] 進(jìn)一步,所述步驟2中,權(quán)值初始化,權(quán)值wjlj用高斯核得到:
[0021]Wi=exp(_0·5 (X「xc)TD(x「xc)),W=diag{w!,…,wM}
[0022] 其中D為半正定距離矩陣,它決定了數(shù)據(jù)點(diǎn)x。附近數(shù)據(jù)集的大小和形狀;
[0023] 模型輸出預(yù)測(cè),給定一個(gè)新的數(shù)據(jù)輸入點(diǎn),計(jì)算K個(gè)線性輸入模型并得到預(yù)測(cè)值 &5總的輸出則是根據(jù)權(quán)值進(jìn)行線性平均:
[0025] 模型訓(xùn)練,利用式(8)所示的代價(jià)函數(shù)通過(guò)梯度下降法來(lái)調(diào)整矩陣D從而學(xué)習(xí)得 到權(quán)值;
[0027] 其中Μ是數(shù)據(jù)集合中數(shù)據(jù)點(diǎn)的個(gè)數(shù),參數(shù)γ通過(guò)經(jīng)驗(yàn)試湊的方式獲得。
[0028] 本發(fā)明的有益效果是可以實(shí)現(xiàn)在線預(yù)測(cè),而且只需檢測(cè)一些容易測(cè)量的輔助變 量,成本較低。
【附圖說(shuō)明】
[0029] 圖1是數(shù)據(jù)預(yù)處理流程圖;
[0030] 圖2是模型訓(xùn)練流程圖;
[0031] 圖3是活性污泥污水處理流程;
[0032] 圖4是基于Jolliffe參數(shù)的測(cè)試數(shù)據(jù)的離群點(diǎn)檢測(cè);
[0033] 圖5是LWPR算法預(yù)測(cè)效果圖。
【具體實(shí)施方式】
[0034] 下面結(jié)合【具體實(shí)施方式】對(duì)本發(fā)明進(jìn)行詳細(xì)說(shuō)明。
[0035] 步驟1 :樣本數(shù)據(jù)預(yù)處理;
[0036] 如圖1所示,樣本數(shù)據(jù)預(yù)處理的具體步驟為:
[0037] (1)樣本數(shù)據(jù)歸一化處理,使得樣本數(shù)據(jù)處于[-1,1]之間。
[0038] (2)利用主元分析(PCA)解耦和降維。例如給定一組Μ個(gè)已經(jīng)中心化的觀測(cè)值, 其標(biāo)準(zhǔn)方差為σ,同時(shí)每個(gè)變量Xk都是m維數(shù)據(jù),x(k) = (xk(l); : : : ;xk(m))其中m <Μ。主元分析將變量xk映射成另外一個(gè)變量tk:
[0039]tk=pTxk (1)
[0040] 其中P是mXm的正交矩陣,它的第1列\(zhòng)是協(xié)方差矩陣c的第i個(gè)特征向量。 換句話說(shuō)PCA必須先解決特征值問(wèn)題:
[0041] 入;\^=(^;,1 = 1,··.,!]! (2)
[0042] 其中λ1是C的第i個(gè)特征值,vi則是與這個(gè)特征值相關(guān)的特征向量。基于v^口 Xk的正交變換可以得到主元tk,如以下公式所示:
[0044] 經(jīng)過(guò)PCA變換,前幾個(gè)特征向量根據(jù)特征值降序的方式排列出來(lái)。以此獲得比較 重要的特征值、特征向量和主元,而忽視無(wú)關(guān)緊要的變量。以此同時(shí),原始數(shù)據(jù)間的耦合性 也得到了消除。
[0045] (3)利用Jolliffe參數(shù)剔除和主體數(shù)據(jù)不相符的離群點(diǎn),以提高數(shù)據(jù)的可靠性。
[0047] 其中tlk是第k個(gè)主元的第i個(gè)觀測(cè)值,Μ變量的個(gè)數(shù),即是屬性個(gè)數(shù),q代表了小 方差主元的個(gè)數(shù)(例如方差< 1),R代表大方差主元個(gè)數(shù),σ是第k個(gè)主元的標(biāo)準(zhǔn)差,統(tǒng)計(jì) 量1和d2l主要用于檢測(cè)偏離主體結(jié)構(gòu)的數(shù)據(jù),而d3l用于檢測(cè)劇烈影響主體結(jié)構(gòu)方差的數(shù) 據(jù),設(shè)置4、d2l和d3l的閾值即可剔除離群點(diǎn)。
[0048] (4)利用中值濾波器去除數(shù)據(jù)生成和采集過(guò)程中的噪聲干擾。
[0049] 本發(fā)明對(duì)樣本數(shù)據(jù)預(yù)處理目的是為了得到干凈有效的數(shù)據(jù),它是建立軟測(cè)量輸出 模型的一個(gè)必要環(huán)節(jié),其主要作用有:①利用主元分析(PCA)解耦和降低樣本數(shù)據(jù)以獲得 重要的主元即后續(xù)模型的輸入輔助變量,忽略無(wú)關(guān)精要的輔助變量,從而減少數(shù)據(jù)維數(shù),減 小模型處理的復(fù)雜度;②剔除和主體數(shù)據(jù)不相符的離群點(diǎn),以提高數(shù)據(jù)的可靠性,離群點(diǎn)主 要來(lái)源于儀表的故障或者維護(hù),它的存在極易導(dǎo)致后續(xù)建模的偏離甚至失敗;③濾波去除 數(shù)據(jù)生成和采集過(guò)程中的噪聲干擾,噪聲干擾主要由于儀表本身問(wèn)題以及周圍環(huán)境對(duì)儀表 和傳感器的干擾和影響而產(chǎn)生的,它惡化了數(shù)據(jù)的質(zhì)量,甚至淹沒(méi)了目標(biāo)特征,給后續(xù)分析 處理帶來(lái)了困難。經(jīng)過(guò)預(yù)處理后的數(shù)據(jù)可靠性得到了明顯提升。
[0050] 步驟2 :局部線性回歸預(yù)測(cè)模型的建立及其訓(xùn)練;
[0051] (1)局部線性回歸(LWPR)模型的確定。LWPR算法考慮的仍然是標(biāo)準(zhǔn)的回歸模型:
[0052] y=f(x) +e (5)
[0053] 其中,x表示d維的輸入數(shù)據(jù),y表示標(biāo)準(zhǔn)化的輸出,同時(shí)e是〇均值隨機(jī)噪聲