專利名稱:基于獨立子空間虛假鄰點判別的混合輔助變量的分離及降維的制作方法
技術領域:
本發(fā)明屬于軟測量技術領域,具體涉及一種基于獨立子空間虛假鄰點判別的混合輔助變量的分離及降維方法,用于指導混合輔助變量的分離及復雜軟測量模型的降維。
背景技術:
工業(yè)生產(chǎn)中一些關鍵參數(shù)以常規(guī)的測量手段往往不能準確得到,采用軟測量技術可有效地解決這個問題。然而,軟測量方法的原始輔助變量數(shù)目冗余龐雜,呈現(xiàn)出混合信號的特點,導致模型的復雜度隨原始輔助變量的增加而呈指數(shù)增長,出現(xiàn)模型的維度災難問題。因此,如何選擇原始輔助變量的最優(yōu)特征子集,使其含較少的輔助變量數(shù)量,同時又能夠盡可能地保持原來完整數(shù)據(jù)集的多元結構,成為了軟測量中輔助變量選擇、降低信息冗余的關鍵。由于輔助變量通常是多因素的混雜信號,在原始特征空間很難進行原始特征約簡。本發(fā)明提出的基于獨立子空間虛假鄰點判別的軟測量原始混合輔助變量的分離策略,首先利用ICA進行原始特征的獨立成分分析,去除混雜信號間的高階冗余并提取獨立分量,將原始特征空間映射成獨立特征子空間;接下來,受高維相空間混沌運動軌跡恢復的啟示,對虛假最近鄰點法進行逆向分析,在特征子空間利用FNN進行余弦測度的判別,通過計算原始特征參量剔除前后的余弦測度,可以有效地剔除冗余特征,降低模型復雜度。為原始輔助變量的選擇,減少檢測系統(tǒng)中傳感器的數(shù)目提供一種有效的方法。
發(fā)明內(nèi)容
本發(fā)明的目的 在于提供基于獨立子空間虛假鄰點判別的混合輔助變量的分離及降維方法,能夠在建模效果最佳的準則上找出獨立的輔助變量,實現(xiàn)對主導變量軟測量的降維。本發(fā)明的技術方案如下:基于獨立子空間虛假鄰點判別的混合輔助變量的分離及降維,其關鍵在于按如下步驟進行:步驟一:確定與主導變量可能相關的n個原始輔助變量,采集n個原始輔助變量和主導變量的取值,組成樣本集,樣本集大小為m ;將n個原始輔助變量數(shù)據(jù)寫成矩陣X= [Xl,…,Xi,…XdJt形式,主導變量數(shù)據(jù)寫成矩陣 Y =Iiy1,…,yi;…,ym]T,其中,Xi G RnX1,yi G R,i = 1,2,…,m,并將 X, Y 進行標準化處理;步驟二:基于獨立子空間虛假鄰點判別的方法,主要是在獨立成分分析ICA(Independent Components Analysis)的基礎上,借助虛假最近鄰點 FNN(FalseNearest Neighbors)方法,分別計算n個原始輔助變量的權重值,包括兩部分:(一 )混合輔助變量的獨立成分分析ICA第一步:輸入數(shù)據(jù)X = [X1, Xi,…Xm]T, Xij 是一個樣本,i = 1,2,…,n,j =1,2,…,m ;第二步:數(shù)據(jù)中心化A = X11 - Xlj ;第三步:由&構成中心化數(shù)據(jù)矩陣;^,計算文的協(xié)方差Cx -.CX = E{XTX);第四步:計算協(xié)方差Cx的特征值X j和特征向量Si:cxai = A ;第五步:計算白化矩陣M:M = D_1/2VT,D為特征值入i組成的對角陣,V為特征向量Bi組成的矩陣;第六步:對中心化后的數(shù)據(jù)進行白化:I = M$ ;第七步:初始化分離矩陣W, W由Wi構成,其中所有的Wi都具有單位范數(shù),i = I,2,…,m;第八步:更新
權利要求
1.基于獨立子空間虛假鄰點判別的混合輔助變量的分離及降維,其特征在于按如下步驟進行: 步驟一:確定與主導變量可能相關的n個原始輔助變量,采集n個原始輔助變量和主導變量的取值,組成樣本集,樣本集大小為m ; 將n個原始輔助變量數(shù)據(jù)寫成矩陣X= [Xl,…,Xi,…XiJt形式,主導變量數(shù)據(jù)寫成矩陣 Y=[yi,-, Yi,…,ym]T,其中,Xi G RnX1,yi G R,i = 1,2,…,m,并將 X,Y 進行標準化處理; 步驟二:基于獨立子空間虛假鄰點判別的方法,主要是在獨立成分分析ICA(Independent Components Analysis)的基礎上,借助虛假最近鄰點 FNN(FalseNearest Neighbors)方法,分別計算n個原始輔助變量的權重值; 步驟三:按照權重值,將n個原始輔助變量組成原始輔助變量序列; 步驟四:確定最佳輔助變量集; 步驟五:以步驟四中對應的最佳輔助變量集為自變量對系統(tǒng)進行最小二乘回歸建模,得到混合輔助變量的分離及降維模型。
2.根據(jù)權利要求1所述的基于獨立子空間虛假鄰點判別的混合輔助變量的分離及降維,其特征在于步驟二中的獨立子空間虛假鄰點判別的輔助變量權重判別方法,包括兩部分: (一)混合輔助變量的獨立成分分析ICA 第一步:輸入數(shù)據(jù) X = [X1,…,Xi,."Xm]1, Xij 是一個樣本,i = 1,2,…,n, j = I,2,…,m ; 第二步:數(shù)據(jù)中心化&
3.根據(jù)權利要求1所述的基于獨立子空間虛假鄰點判別的混合輔助變量的分離及降維,其特征在于步驟四中確定最佳輔助變量集,按如下步驟進行: 第一步,設定循環(huán)次數(shù)N = n ; 第二步,隨機從樣本集中選擇P個樣本作為訓練樣本,剩下的m-p個樣本作為檢驗樣本; 第三步,根據(jù)所述訓練樣本,利用最小二乘回歸建立當前的輔助變量序列中所包含變量的非線性模型; 第四步,將所述檢驗樣本當前的輔助變量值輸入至所述非線性模型,得到m-p個檢驗樣本對應的主導變量預測值; 第五步,計算m-p個檢驗樣本預測值的均方誤差MSE ; 第六步,刪除當前原始輔助變量序列中權重值最小的原始輔助變量,組成新的原始輔助變量序列,并設定N = N-1,判斷此時N是否為0: 如果N古0,則回到第三步; 如果N = 0,則最小的檢驗樣本預測值的均方誤差MSE對應原始輔助變量序列即為最佳輔助變量集。
全文摘要
本發(fā)明公開了基于獨立子空間虛假鄰點判別的混合輔助變量的分離及降維,其特征在于按如下步驟進行一、確定與主導變量可能相關的n個原始輔助變量,采集n個原始輔助變量和主導變量取值數(shù)據(jù)并組成樣本集;二、通過獨立子空間虛假鄰點判別,分別計算n個原始輔助變量的權重值;三、組成原始輔助變量序列;四、利用最小二乘回歸方法進行建模,并根據(jù)最小均方誤差MSE確定最佳輔助變量;五、得到分離后的獨立信號軟測量模型。本發(fā)明能夠在建模效果最佳的基礎上找出含混合輔助變量的變量集進行分離,實現(xiàn)其降維,達到對輔助變量信息的精簡,同時降低模型復雜度,提高軟測量實效性的目的。
文檔編號G06F19/00GK103207945SQ20131006850
公開日2013年7月17日 申請日期2013年3月5日 優(yōu)先權日2013年3月5日
發(fā)明者蘇盈盈, 劉興華, 葛繼科, 顏克勝, 曾誠 申請人:重慶科技學院