專利名稱:基于改進型模擬退火算法的近紅外光譜特征波長選擇方法
技術(shù)領(lǐng)域:
本發(fā)明涉及近紅外光譜技術(shù)領(lǐng)域,尤其涉及一種基于改進型模擬退火算法的近紅外光譜特征波長選擇方法。
背景技術(shù):
近年來,近紅外光譜作為一種定量和定性分析方法,在農(nóng)業(yè)、環(huán)境、制藥等許多領(lǐng)域得到了成功運用。近紅外光譜分析方法首先獲取待測樣本在特定近紅外波段下(通常為70(T2500nm)的光譜信息,然后利用光譜信息對樣本進行定量或定性分析。近紅外光譜分析的基本原理是近紅外光譜能夠記錄化學鍵基頻震動的倍頻和合頻信息,主要表征了含氫基團X-H (X主要為C、N、0)震動的倍頻和合頻吸收。由于樣本的成分大多是由這些基團構(gòu)成 的,因此近紅外光譜信息可以對樣本進行定性和定量分析。借助現(xiàn)代近紅外光譜儀器,可以在短時間(一般小于I分鐘)內(nèi)獲得大量的近紅外光譜信息(樣本在成百上千甚至上萬個波長下的光譜信息)??紤]到模型的穩(wěn)定性和復(fù)雜性,近紅外定量、定性分析過程中僅將少數(shù)特征變量(一般少于10個)用于建立模型。因此如何從大量的光譜信息中挑選與待測樣本最相關(guān)的特征波長是近紅外分析技術(shù)中的關(guān)鍵步驟之一。國內(nèi)外專家、學者在近紅外光譜特征波長選擇方面做了大量工作,提出了主成分分析法、間隔偏最小二乘法、遺傳算法等特征波長選擇方法,研究結(jié)果表明與全光譜模型相比,特征波長選擇方法能夠有效提高模型精度和降低模型復(fù)雜度。在發(fā)明專利“基于模擬退火算法的近紅外光譜特征波長的選擇方法”(申請?zhí)?01010123934. 6)公開了一種基于傳統(tǒng)模擬退火算法的近紅外光譜特征波長選擇方法。該方法在選擇特征波長時,以Metropolis準則判斷舊解和新解的重要性,但效果并不理想。有鑒于此,有必要提出了一種基于改進型模擬退火算法的近紅外光譜特征波長選擇方法。
發(fā)明內(nèi)容
本發(fā)明的目的在于提供一種基于改進型模擬退火算法的近紅外光譜特征波長選擇方法,提高了傳統(tǒng)模擬退火算法選擇近紅外光譜特征波長的效果。本發(fā)明的一種基于改進型模擬退火算法的近紅外光譜特征波長選擇方法,所述方法包括以下步驟SI、輸入近紅外光譜數(shù)據(jù)集,隨機初始化當前解S,初始化全局變量S_global的值為當前解S,初始化溫度參數(shù)t的值為起始溫度tQ ;S2、判斷溫度參數(shù)t是否大于結(jié)束溫度tf,若是,則執(zhí)行步驟S3 ;若否,則執(zhí)行步驟S9 ;S3、初始化馬爾可夫鏈長度參數(shù)L的值為I ;S4、判斷馬爾可夫鏈長度參數(shù)L是否小于最大馬爾科夫鏈長度L_max,若是,則執(zhí)行步驟S5 ;若否,則執(zhí)行步驟S8 ;
S5、在當前解S的基礎(chǔ)上產(chǎn)生新解S’,如果f (S’)< f(S_global),S_global被更新為新解S’ ;S6、根據(jù)改進型Metropolis接受準則判斷當前解S和新解S’的重要性;S7、馬爾可夫鏈長度參數(shù)L的值遞增1,并返回步驟S4 ;S8、溫度參數(shù)t的值遞減I,并返回步驟S2 ;S9、返回S_global,建立PLS模型,給出模型的交互驗證均方根誤差、校正集相關(guān)系數(shù)、預(yù)測集均方根誤差和預(yù)測集相關(guān)系數(shù)。作為本發(fā)明的進一步改進,所述步驟S6中“改進型Metropolis接受準則”具體 為計算當前解S和新解S’的目標函數(shù)f (S)和f (S’),其中f (S)為當前解S中選中波長對應(yīng)的PLS校正模型的交互驗證均方根誤差,f (S’ )為新解S’中選中波長對應(yīng)的PLS校正模型的交互驗證均方根誤差;
res)- fcsi判斷expf"_ ^ .入> 〃是否成立,其中!·為[d,l]范圍內(nèi)的一個隨機數(shù),α為
范圍內(nèi)的一個常數(shù);若expf腦-) >『成立則判定新解S,為重要解,并將當前解S更新為新解S,的值,若expf f(S)-f(S^)> r不成立則判定當前解S為重要解,并保持當前解S的值不變。作為本發(fā)明的進一步改進,所述改進型Metropolis接受準則判斷當前解S和新解S’的重要性的過程包括 若與當前解S相比,新解S’為優(yōu)化解,且滿足f (S) -f (S’)> O,exp〈 f(S)1、S) )> I,則expf0 r—定成立,即新解的接受概率P (S’ )為100%;若與當前解S相比,新解S’為惡化解,且滿足expf f(S)1(S’) ) Ε[α,I],則exPff⑶_『'))> r有一定的概率成立,即新解的接受概率P (S’ )為
呵(ΜιΜλ)—α——_丨!___犠;
I —a若與當前解S相比,新解S’為惡化解,且滿足expi f(S)^f(S'} ) € [O , aj則
exp( f⑶.)>丨'一定不·,即新解的接受概率P (S’ )為O。作為本發(fā)明的進一步改進,所述步驟SI前需確定以下參數(shù)起始溫度V對應(yīng)于溫度參數(shù)t的初始值,為大于O的常數(shù);結(jié)束溫度tf,對應(yīng)于溫度參數(shù)t的結(jié)束值,為比起始溫度h小的常數(shù);參數(shù)a和β,參數(shù)a為
范圍內(nèi)的常數(shù),β為大于O的常數(shù);
參數(shù)h,對應(yīng)于在當前解S的基礎(chǔ)上產(chǎn)生新解S’過程中改變的列數(shù),為大于I的常數(shù);最大馬爾科夫鏈長度L_max,為大于I的整數(shù)。作為本發(fā)明的進一步改進,所述近紅外光譜數(shù)據(jù)集包括校正集近紅外光譜Xcal、校正集化學值Ycal、預(yù)測集近紅外光譜Xpre和預(yù)測集化學值Ypre。作為本發(fā)明的進一步改進,所述校正集近紅外光譜Xcal和校正集化學值Ycal、預(yù)測集近紅外光譜Xpre和預(yù)測集化學值Ypre的光譜和化學值分別一一對應(yīng)。本發(fā)明的有益效果是通過對傳統(tǒng)模擬退火算法中Metropolis接受準則的改進, 使得改進型模擬退火算法不僅提高了選擇近紅外光譜特征波長的效果、簡化了模擬退火算法的參數(shù)設(shè)置,而且保留了傳統(tǒng)模擬退火算法跳出局部最優(yōu)解和快速收斂的特點。
圖I為本發(fā)明基于改進型模擬退火算法的近紅外光譜特征波長選擇方法的流程示意圖;圖2為本發(fā)明改進型Metropolis接受準則的流程示意圖;圖3(a)和3(b)為本發(fā)明中參數(shù)α、β與惡化解接受概率的關(guān)系圖。
具體實施例方式以下將結(jié)合附圖所示的各實施方式對本發(fā)明進行詳細描述。但這些實施方式并不限制本發(fā)明,本領(lǐng)域的普通技術(shù)人員根據(jù)這些實施方式所做出的結(jié)構(gòu)、方法、或功能上的變換均包含在本發(fā)明的保護范圍內(nèi)。參圖I所示為本發(fā)明一種基于改進型模擬退火算法的近紅外光譜特征波長選擇方法的流程示意圖,包括以下步驟SI、輸入近紅外光譜數(shù)據(jù)集,隨機初始化當前解S,初始化全局變量S_global的值為當前解S,初始化溫度參數(shù)t的值為起始溫度tQ ;S2、判斷溫度參數(shù)t是否大于結(jié)束溫度tf,若是,則執(zhí)行步驟S3 ;若否,則執(zhí)行步驟S9 ;S3、初始化馬爾可夫鏈長度參數(shù)L的值為I ;S4、判斷馬爾可夫鏈長度參數(shù)L是否小于最大馬爾科夫鏈長度L_max,若是,則執(zhí)行步驟S5 ;若否,則執(zhí)行步驟S8 ;S5、在當前解S的基礎(chǔ)上產(chǎn)生新解S’,如果f(S’)〈f(S_global),S_global被更新為新解S’ ;S6、根據(jù)改進型Metropolis接受準則判斷當前解S和新解S’的重要性;S7、馬爾可夫鏈長度參數(shù)L的值遞增1,并返回步驟S4 ;S8、溫度參數(shù)t的值遞減1,并返回步驟S2 ;S9、返回S_global,建立PLS模型,給出模型的交互驗證均方根誤差(RMSECV)、校正集相關(guān)系數(shù)(Real)、預(yù)測集均方根誤差(RMSEP)和預(yù)測集相關(guān)系數(shù)(Rpre)。本發(fā)明中的近紅外光譜數(shù)據(jù)集包含校正集近紅外光譜Xcal (Hi1Xn)、校正集化學值Ycal Oii1X I)、預(yù)測集近紅外光譜Xpre (m2 X η)和預(yù)測集化學值Ypre (m2 X I);其中ml為校正集樣本數(shù),m2為預(yù)測集樣本數(shù),η為近紅外光譜的波長數(shù);校正集中的光譜和化學值、預(yù)測集的光譜和化學值分別一一對應(yīng)。當前解S是一個IXn的一維數(shù)組,代表了一種入選特征波長的組合,該數(shù)組的長度與近紅外光譜的波長數(shù)一致,當前解S的第i列Si (i e [I, η])與近紅外光譜中的第i個波長相對應(yīng)。隨機初始化當前解S指當前解S的每一列隨機賦值O或1,若SiQ e [I,η])的值為0,表示第i個波長沒有被選中;若Si(i e [I, η])的值為1,則表示第i個波長被選中。當前解S只在算法剛開始運行的時候被初始化一次,隨后當前解S根據(jù)改進型Metropolis接受準則進行更新。溫度參數(shù)t是對固體退火過程中溫度的模擬,控制算法的開始和結(jié)束。在算法剛開始的時候,t被賦值為起始溫度,隨后每次冷卻I度,當t冷卻至結(jié)束溫度時,算法結(jié)束。馬爾可夫鏈長度參數(shù)L指參數(shù)t時算法的迭代次數(shù)。 新解S’是在當前解S的基礎(chǔ)上產(chǎn)生的一組解,代表了一種入選特征波長的組合。首選將新解S’賦值為當前解S ;然后隨機選擇新解S’的h(h e [I, η])列;最后逐一改變新解S’中上述h列的值,若當前解S的h列中第i列Si (i e [l,h])的值為0,則將新解S’的h列中第i列S’di e [l,h])的值設(shè)置為1,若當前解S的h列中第i列Si (i e [I,h])的值為1,則將新解S’的h列中第i列S\(i e [l,h])的值設(shè)置為O。當前解S和新解S’的區(qū)別是被選中的上述h列的值不同。改進型Metropo Iis接受準則是在傳統(tǒng)Metropo Iis接受準則的基礎(chǔ)上去除參數(shù)t,引入?yún)?shù)α和β。參圖2所示“改進型Metropolis接受準則”具體為計算當前解S和新解S,的目標函數(shù)f (S)和f (S’),其中f (S)為當前解S中選中波長對應(yīng)的PLS校正模型的交互驗證均方根誤差(RMSECV),計算方法為根據(jù)S中選中的波長,提取校正集光譜Xcal中選中波長對應(yīng)的光譜信息,與校正集的化學值Ycal建立PLS模型,該PLS模型對應(yīng)的交互驗證均方根誤差(RMSECV) Sf(S) ;f(S’)為新解S’中選中波長對應(yīng)的PLS校正模型的交互驗證均方根誤差(RMSECV),計算方法為根據(jù)S’中選中的波長,提取校正集光譜Xcal中選中波長對應(yīng)的光譜信息,與校正集的化學值Ycal建立PLS模型,該PLS模型對應(yīng)的交互驗證均方根誤差(RMSECV)為f(S’);判斷exp〈',」是否成立,其中r為[α,I]范圍內(nèi)的一個隨機數(shù),α為
范圍內(nèi)的一個常數(shù);若expf燜了) )> r成立則判定新解S,為重要解,并將當前解S更新為新解S,的值,若r不成立則判定當前解S為重要解,并保持當前解S的值不變。改進型Metropolis接受準則判斷當前解S和新解S’的重要性的過程包括
/V rt J若與當前解S相比,新解S’為優(yōu)化解,且滿足f (S)-f (S’)>0,expr ' 'R 1J )>\,
P
則expf f⑶-『))>r一定蚊,即新解的接受概率P (s’ )為100%;
若與當前解S相比,新解s’為惡化解,且滿足e[a,I]則
expf f⑶-廠)) > "有一定的概率成立,即新解的接受概率P (S’ )為倘-購)—a--*100%;
I—a若與當前解S相比,新解S’為惡化解,且滿足G
,則expf f⑶-廣)) > 〃 一定不成立,即新解的接受概率P(S’ )為O。本發(fā)明在返回最優(yōu)特征波長及最優(yōu)特征波長對應(yīng)模型的效果是指在算法剛開始時,設(shè)立一個全局變量S_global用于記錄算法運行過程中得到的最優(yōu)特征波長組合,該全局變量S_global的初始值等于當前解S的初始值,每當算法得到新解S’優(yōu)于S_global時(即滿足條件f (S’)〈f (S_global)), S_global被更新為新解S’。當溫度控制參數(shù)t達到·設(shè)定的結(jié)束溫度時,返回S_global選中的特征波長組合并對選中的特征波長組合建立PLS模型,并給出PLS模型對應(yīng)的交互驗證均方根誤差(RMSECV)、校正集相關(guān)系數(shù)(Real)、預(yù)測集均方根誤差(RMSEP)和預(yù)測集相關(guān)系數(shù)(Rpre)。本發(fā)明采用改進型模擬退火算法選擇特征波長前需確定以下參數(shù)(I)起始溫度h :對應(yīng)于溫度參數(shù)t的初始值,為大于O的常數(shù);(2)結(jié)束溫度tf :對應(yīng)于溫度參數(shù)t的結(jié)束值,為比起始溫度h小的常數(shù);(3)參數(shù)α和β :參數(shù)α為
范圍內(nèi)的常數(shù),β為大于O的常數(shù);由于參數(shù)α和β是改進型Metropolis接受準則的重要參數(shù),分2種情況討論α和β的大小與惡化解接受概率的關(guān)系情況(I),保持參數(shù)β的取值不變,讓參數(shù)α在
范圍內(nèi)遞增,如圖3(a)所示,假設(shè)取β=5,而α的3個取值αCi3逐漸遞增,圖3(a)中橫坐標X=f (S)-f (S’),X e [-5,5],縱坐標P (S’)=exp(X/i3),X的值越小代表新解S’比當前解S越差,當X小于O時新解S’為惡化解;由圖3(a)可以看出,α的3個取值a ^ α 2〈 α 3逐漸遞增時,對應(yīng)X的取值&<&<&逐漸遞增,表明隨著α的遞增,惡化解的接受概率呈遞減趨勢;情況(2),保持參數(shù)α的取值不變,讓參數(shù)β遞增,如圖3(b)所示,假設(shè)取α=0.5,而β的3個取值^〈^〈^逐漸遞增,圖3(b)中橫坐標X=f(S)_f(S’),X e [-5,1],縱坐標P(S’)=exp(X/i3),由圖3(b)可以看出,β的3個取值β逐漸遞增,對應(yīng)X的取值X1 > X2 > X3逐漸遞減,表明隨著β的遞增,惡化解的接受概率呈遞增趨勢;(4)參數(shù)h :對應(yīng)于在當前解S的基礎(chǔ)上產(chǎn)生新解S’過程中改變的列數(shù),為大于I的常數(shù);(5)最大馬爾科夫鏈長度L_max :為大于I的整數(shù)。本發(fā)明中對近紅外光譜數(shù)據(jù)集,首先隨機初始化當前解S ;然后在溫度參數(shù)t和馬爾可夫鏈長度參數(shù)L的控制下,以當前解S的基礎(chǔ)上產(chǎn)生新解S’,并以改進型Metropolis接受準則判斷當前解S和新解S’的重要性;最后當溫度控制參數(shù)t達到設(shè)定的結(jié)束溫度時,返回最優(yōu)特征波長及最優(yōu)特征波長對應(yīng)模型的效果。
有益效果是通過對傳統(tǒng)模擬退火算法中Metropolis接受準則的改進,使得改進型模擬退火算法不僅提高了選擇近紅外光譜特征波長的效果、簡化了模擬退火算法的參數(shù)設(shè)置,而且保留了傳統(tǒng)模擬退火算法跳出局部最優(yōu)解和快速收斂的特點。應(yīng)當理解,雖然本說明書按照實施方式加以描述,但并非每個實施方式僅包含一個獨立的技術(shù)方案,說明書的這種敘述方式僅僅是為清楚起見,本領(lǐng)域技術(shù)人員應(yīng)當將說明書作為一個整體,各實施方式中的技術(shù)方案也可以經(jīng)適當組合,形成本領(lǐng)域技術(shù)人員可以理解的其他實施方式。上文所列出的一系列的詳細說明僅僅是針對本發(fā)明的可行性實施方式的具體說明,它們并非用以限制本發(fā)明的保護范圍,凡未脫離本發(fā)明技藝精神所作的等效實施方式或變更均應(yīng)包含在本發(fā)明的保護范圍之內(nèi)。
權(quán)利要求
1.一種基于改進型模擬退火算法的近紅外光譜特征波長選擇方法,其特征在于,所述方法包括以下步驟 51、輸入近紅外光譜數(shù)據(jù)集,隨機初始化當前解S,初始化全局變量S_global的值為當前解S,初始化溫度參數(shù)t的值為起始溫度tQ ; 52、判斷溫度參數(shù)t是否大于結(jié)束溫度tf,若是,則執(zhí)行步驟S3;若否,則執(zhí)行步驟S9 ; 53、初始化馬爾可夫鏈長度參數(shù)L的值為I; 54、判斷馬爾可夫鏈長度參數(shù)L是否小于最大馬爾科夫鏈長度L_max,若是,則執(zhí)行步驟S5 ;若否,則執(zhí)行步驟S8 ; 55、在當前解S的基礎(chǔ)上產(chǎn)生新解S’,如果f(S’)<f (S_global),S_global被更新為新解S,; 56、根據(jù)改進型Metropolis接受準則判斷當前解S和新解S’的重要性; 57、馬爾可夫鏈長度參數(shù)L的值遞增1,并返回步驟S4; 58、溫度參數(shù)t的值遞減1,并返回步驟S2; 59、返回S_global,建立PLS模型,給出模型的交互驗證均方根誤差、校正集相關(guān)系數(shù)、預(yù)測集均方根誤差和預(yù)測集相關(guān)系數(shù)。
2.根據(jù)權(quán)利要求I所述的方法,其特征在于,所述步驟S6中“改進型Metropolis接受準則”具體為 計算當前解S和新解S’的目標函數(shù)f (S)和f (S’),其中f (S)為當前解S中選中波長對應(yīng)的PLS校正模型的交互驗證均方根誤差,f (S’)為新解S’中選中波長對應(yīng)的PLS校正模型的交互驗證均方根誤差; 判斷exp〈 .f(Sh廣) > 〃是否成立,其中r為[α,1]范圍內(nèi)的一個隨機數(shù),α為
范圍內(nèi)的一個常數(shù); 若哪(糾-廣)> /·成立則判定新解S’為重要解,并將當前解S更新為新解S,的值,若哪( f(s)-fs'})>r不成立則判定當前解S為重要解,并保持當前解S的值不變。β
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述改進型Metropolis接受準則判斷當前解S和新解S’的重要性的過程包括 若與當前解S相比,新解S,為優(yōu)化解,且滿足f(s)-f (S’)>0,expf麗產(chǎn)^>1,則exP^ i(S)'^(S } ) > 一定成立,即新解的接受概率P (S’ )為100%; 若與當前解S相比,新解S’為惡化解,且滿足exp"尚廣I],則exp( /(S)-Z(Sr) } > r有一定的概率成立,即新解的接受概率P (S’ )為 -丨丄-* 100% I —a若與當前解S相比,新解S’為惡化解,且滿足
4.根據(jù)權(quán)利要求I所述的方法,其特征在于,所述步驟SI前需確定以下參數(shù) 起始溫度h,對應(yīng)于溫度參數(shù)t的初始值,為大于O的常數(shù); 結(jié)束溫度tf,對應(yīng)于溫度參數(shù)t的結(jié)束值,為比起始溫度h小的常數(shù); 參數(shù)α和β,參數(shù)α為[O,I]范圍內(nèi)的常數(shù),β為大于O的常數(shù); 參數(shù)h,對應(yīng)于在當前解S的基礎(chǔ)上產(chǎn)生新解S’過程中改變的列數(shù),為大于I的常數(shù); 最大馬爾科夫鏈長度L_max,為大于I的整數(shù)。
5.根據(jù)權(quán)利要求I所述的方法,其特征在于,所述近紅外光譜數(shù)據(jù)集包括校正集近紅外光譜Xcal、校正集化學值Ycal、預(yù)測集近紅外光譜Xpre和預(yù)測集化學值Ypre。
6.根據(jù)權(quán)利要求6所述的方法,其特征在于,所述校正集近紅外光譜Xcal和校正集化學值Ycal、預(yù)測集近紅外光譜Xpre和預(yù)測集化學值Ypre的光譜和化學值分別一一對應(yīng)。
全文摘要
本發(fā)明提供了一種基于改進型模擬退火算法的近紅外光譜特征波長選擇方法,首先對近紅外光譜數(shù)據(jù)集隨機初始化當前解S;然后在溫度參數(shù)t和馬爾可夫鏈長度參數(shù)L的控制下,在當前解S的基礎(chǔ)上產(chǎn)生新解S’,并以改進型Metropolis接受準則判斷當前解S和新解S’的重要性;最后當溫度控制參數(shù)t達到設(shè)定的結(jié)束溫度時,返回最優(yōu)特征波長及最優(yōu)特征波長對應(yīng)模型的效果。通過對傳統(tǒng)模擬退火算法中Metropolis接受準則的改進,使得改進型模擬退火算法不僅提高了選擇近紅外光譜特征波長的效果、簡化了模擬退火算法的參數(shù)設(shè)置,而且保留了傳統(tǒng)模擬退火算法跳出局部最優(yōu)解和快速收斂的特點。
文檔編號G01N21/35GK102928382SQ201210451289
公開日2013年2月13日 申請日期2012年11月12日 優(yōu)先權(quán)日2012年11月12日
發(fā)明者鄒小波, 石吉勇, 趙杰文, 黃曉瑋, 黃星奕, 蔡健榮, 陳全勝, 孫宗保, 林顥 申請人:江蘇大學