本發(fā)明屬于神經網絡優(yōu)化技術領域,具體涉及一種基于改進qpso算法的rbf神經網絡優(yōu)化方法的設計。
背景技術:
對于施工過程中的安全性來說,變形觀測具有舉足輕重的地位。一旦形變值不在規(guī)定的限度之內,就會對工程本身產生一定影響,嚴重時還會危及安全,對人民和社會造成不可估量的損失。為了降低甚至是避免出現損失,對各類工程中的變形趨勢的形變預測就變得非常重要了。在一定的技術條件下,如何科學、準確、合理的預測變形趨勢,已經成為了一個具有戰(zhàn)略意義的研究方向。
由于變形趨勢的時間序列數據有很強的非線性性,而在當前背景下,神經網絡的技術與應用正處于飛速發(fā)展之中,因此,我們可以利用神經網絡的特性,充分學習已有的先驗知識,并拓展之,尋求一個合適的神經網絡模型,來對變形趨勢進行有效的模擬與預測。因此,我們在選擇徑向基函數(radialbasisfunction,rbf)神經網絡的同時,針對其劣性,引入了粒子群優(yōu)化(particleswarmoptimization,pso)算法,將二者相結合組成了組合預測模型——基于pso算法的rbf神經網絡模型,旨在盡可能的降低對變形趨勢的預測結果所帶來的誤差。
當前的學術背景下,各學科之間相互融合、相互滲透、相互取長補短,越來越多的研究人員為了彌補人工神經網絡(artificialneuralnetwork,ann)在參數選取上的隨機性,開始將智能優(yōu)化算法應用于優(yōu)化人工神經網絡的參數中去。因此,ann與智能優(yōu)化算法的相互融合與滲透,必然成為一個研究熱點。常見的智能優(yōu)化算法有模擬退火算法(simulatedannealing,sa)、粒子群優(yōu)化(particleswarmoptimization,pso)、混沌理論(chaostheory)等,將二者有機的結合便形成了具有柔性信息處理能力的“混合神經網絡(hybridartificialneuralnetwork,hann)”。
目前,我們對hann的研究主要著重于不同方法的融合改進與應用實踐領域方面。在應用實踐中hann廣泛應用于各行各業(yè),諸如心理學、材料學、化學、軍事、航天航空、社會學、經濟學等。在改進與應用方面,hann的最關鍵最核心的問題是如何提高hann的性能。pso算法是智能優(yōu)化算法中的一個分支,它源于對生物聚集性的行為,如鳥群捕食行為。與其他優(yōu)化算法比較,pso算法具有結構簡單易懂、參數較之少、易于模擬實現等優(yōu)點。正是由于這些便利性,pso算法被廣泛應用于函數優(yōu)化、函數極值尋優(yōu)、多目標問題求解等各個領域。越來越多的實驗表明,pso算法尤其適用于非線性系統(tǒng)與多極值的復雜問題的解決。因此,pso算法也尤其適用于ann性能的優(yōu)化,即組成了pso算法優(yōu)化ann的hann。
對于pso算法優(yōu)化ann來說,最重要的一點就是探討出如何高效的訓練出hann。盡管如此,pso算法仍存在一些問題。pso算法只是一種概率算法,缺乏系統(tǒng)化、規(guī)范化的理論基礎,因而從數學的角度來證明pso算法的正確性與可靠性是十分困難的;而且參數的設置也沒有定性的規(guī)定,往往因不同的優(yōu)化問題根據經驗值進行設置,加大了工作量,如若能對參數的選取規(guī)律有一個定性的認識,那么pso算法的準確率會大大提升。pso算法在尋優(yōu)早期收斂速度比較快,但是到尋優(yōu)后期,算法缺乏有效的機制跳出極小點使其收斂結果不理想。最后,pso算法還存在一個最致命的缺陷——易陷入局部極值點,比如在優(yōu)化高維度的復雜問題上,粒子群在搜索過程中常常在迭代初期就聚集到某一點停滯不動,搜索不到最優(yōu)值點,這就是早熟現象。早熟現象即粒子群在搜索到全局最優(yōu)值之前就停滯不動。也就是說,早熟現象使得算法不能以最大概率收斂到全局最優(yōu)值。同時,在pso算法粒子搜尋最優(yōu)值的過程中,在最優(yōu)值附近表現出收斂速度變慢的現象,換言之,粒子在后期時尋優(yōu)能力變差,限制了pso算法的應用。這些缺點使得我們不得不探索出具有更優(yōu)性能的算法。
2004年,junsun等在研究了clerc等人的關于粒子收斂行為的研究成果后,從量子力學的角度出發(fā)提出了一種新的pso算法模型。這種模型是以delta勢阱為基礎,認為粒子具有量子的行為,并根據這種模型提出了量子粒子群優(yōu)化算法(quantum-behavedparticleswarmoptimization)。
qpso算法與pso算法最大的不同之處在于更新粒子的方式不同。對于pso算法來說,為了確保群體聚集性,搜索范圍必須加以限制,這樣才能使得算法收斂,否則會發(fā)散。但是在qpso算法中,粒子的狀態(tài)只用位置向量進行描述,且粒子可以以一定概率出現在空間內的任何地方,因此全局能力更加優(yōu)秀,更容易找到群體最優(yōu)位置。
qpso算法雖然較pso算法已經有很大的改善,但是仍然沒有解決最根本的問題,缺乏跳出局部極值點的策略。qpso算法在進行搜尋全局最優(yōu)位置后期,群體的多樣性降低,粒子逐漸收斂,開始聚集在小范圍的區(qū)域內不停的徘徊,而以極小的概率現在其他區(qū)域,因此算法的全局尋優(yōu)能力不斷減弱。如若全局最優(yōu)位置不是在這一小范圍區(qū)域內,那么便出現了局部極值現象,換言之,qpso算法雖然使粒子能以一定概率出現在區(qū)域內任意位置,卻在仍然逃不過后期全局搜索能力減弱的缺陷。qpso算法中的粒子在迭代過程中都是通過與其他粒子信息的共享和協(xié)作來進行下一步的進化,反反復復不斷迭代,直到達到最大迭代次數或滿足最佳適應值,并沒有細化到每一個維度,因而這種粗糙的更新方式容易誤導粒子的進化方向,陷入局部最優(yōu)。如果算法初期就出現收斂狀態(tài),那么所得到的全局最優(yōu)位置一定只是局部最優(yōu)值。也就是說如果每個粒子的歷史最優(yōu)位置在較長時間內沒有改變,且粒子在整體上很接近全局最優(yōu)位置,在慣性權重不斷減小的情況下速度越來越小,那么就是陷入了局部最優(yōu)狀態(tài)。因此需要一種算法,使得qpso算法能夠跳出該局部極值點,既發(fā)揮了粒子群算法簡單易實現、收斂速度快的特性,同時增強了后期的全局搜索能力,避免陷入局部最優(yōu)位置無法跳出。
技術實現要素:
本發(fā)明的目的是為了解決利用現有的qpso算法優(yōu)化rbf神經網絡時,缺少一個逃離局部極值點的機制,容易陷入局部最優(yōu)位置無法跳出的問題,提出了一種基于改進qpso算法的rbf神經網絡優(yōu)化方法。
本發(fā)明的技術方案為:一種基于改進qpso算法的rbf神經網絡優(yōu)化方法,包括以下步驟:
s1、設定改進qpso算法的種群規(guī)模、理想適應值以及最大迭代次數,并將rbf神經網絡的待優(yōu)化參數編碼成實數碼串表示粒子個體,同時隨機產生一定規(guī)模的粒子,組成初始的粒子群,均勻分布在搜索空間;同時初始化粒子的最優(yōu)位置和全局的最優(yōu)位置;
s2、把粒子映射為rbf神經網絡的一組參數值,組成rbf神經網絡;
s3、向rbf神經網絡輸入訓練樣本進行訓練,根據適應度函數計算粒子的當前適應值;
s4、將當前適應值與前一次迭代的適應值進行對比,根據對比結果更新粒子當前所經歷的最優(yōu)位置;
s5、確定粒子的當前全局最優(yōu)位置;
s6、將當前全局最優(yōu)位置與前一次迭代的全局最優(yōu)位置進行對比,如果當前全局最優(yōu)位置更優(yōu),則更新全局最優(yōu)位置,否則保持前一次迭代的全局最優(yōu)位置不變;
s7、計算粒子的適應度標準差σ,并與預先設置的閾值ξ進行比較,若σ<ξ,則判定為出現早熟現象,進入步驟s8,否則進入步驟s9;
s8、對于判定為早熟的粒子,將慣性權重增大至初始值,繼續(xù)進行搜索;
s9、更新粒子位置;
s10、判斷粒子適應值是否達到理想適應值,若是則迭代結束并將全局最優(yōu)位置對應的適應值作為全局極值輸出,否則進入步驟s11;
s11、判斷是否達到設定的最大迭代次數,若是則迭代結束并將全局最優(yōu)位置對應的適應值作為全局極值輸出,否則返回步驟s2。
本發(fā)明的有益效果是:本發(fā)明通過引入慣性權重變異策略,與qpso算法結合,并將改進后的qpso算法作為rbf神經網絡的優(yōu)化算法對變形體的變形趨勢進行擬合預測。本發(fā)明首先判斷qpso算法中哪些粒子出現早熟收斂現象,然后將判定為早熟的粒子的慣性權重增大至初值,讓其有能力繼續(xù)在空間內進行搜索,跳出了這個聚集區(qū)域,重新增大了種群的多樣性,增強了全局搜索能力。
進一步地,步驟s1中rbf神經網絡的待優(yōu)化參數包括中心矢量、基寬向量和網絡權值。
上述進一步方案的有益效果為:rbf神經網絡的學習目標是經過訓練算法解決以下幾個問題:隱含層單元中心點、徑向基函數寬度參數以及隱含層到輸出層的權值,與之對應的三個參數即為中心矢量、基寬向量和網絡權值。因此,確定這3個參數即是確定了整個rbf神經網絡。
進一步地,步驟s7中粒子的適應度標準差σ的計算公式為:
式中n為種群規(guī)模,fi為第i個粒子的適應值,favg為粒子群當前的平均適應值。
上述進一步方案的有益效果為:若qpso算法中的粒子出現早熟收斂現象,那么整個群體的粒子就會聚集在一個或多個特定的區(qū)域,這時粒子的適應度標準差σ便會趨向于0。因此設定一個閾值ξ,當σ<ξ時即可判斷粒子出現早熟收斂現象。
附圖說明
圖1所示為本發(fā)明實施例提供的一種基于改進qpso算法的rbf神經網絡優(yōu)化方法流程圖。
具體實施方式
現在將參考附圖來詳細描述本發(fā)明的示例性實施方式。應當理解,附圖中示出和描述的實施方式僅僅是示例性的,意在闡釋本發(fā)明的原理和精神,而并非限制本發(fā)明的范圍。
本發(fā)明實施例提供了一種基于改進qpso算法的rbf神經網絡優(yōu)化方法,如圖1所示,該實施例具體包括以下步驟s1-s11:
s1、對改進qpso算法的參數進行初始化:設定種群規(guī)模(種群粒子總數)n、理想適應值pi以及最大迭代次數itermax。并將rbf神經網絡的待優(yōu)化參數編碼成實數碼串表示粒子個體,同時隨機產生一定規(guī)模的粒子,組成初始的粒子群,均勻分布在搜索空間;同時初始化粒子的最優(yōu)位置和全局的最優(yōu)位置。
其中,rbf神經網絡的待優(yōu)化參數包括中心矢量、基寬向量和網絡權值。rbf神經網絡的學習目標是經過訓練算法解決以下幾個問題:隱含層單元中心點、徑向基函數寬度參數以及隱含層到輸出層的權值,與之對應的三個參數即為中心矢量、基寬向量和網絡權值。因此,確定這3個參數即是確定了整個rbf神經網絡。
s2、把粒子映射為rbf神經網絡的一組參數值,組成rbf神經網絡。
s3、向rbf神經網絡輸入訓練樣本(輸入向量)進行訓練,根據適應度函數計算粒子的當前適應值。本發(fā)明實施例中,適應度函數采用均方根誤差函數,具體公式為:
式中f(·)為適應度函數,x表示粒子位置向量,
s4、將當前適應值與前一次迭代的適應值進行對比,根據公式(2)更新粒子當前所經歷的最優(yōu)位置:
式中pi(t)表示粒子i當前所經歷的最優(yōu)位置,xi(t)表示粒子i的當前位置,t為迭代次數,f(·)為適應度函數。
即對于粒子i來說,若其當前位置的適應值小于前一次迭代得到的最優(yōu)位置的適應值,則該粒子當前所經歷的最優(yōu)位置即為當前位置;反之若其當前位置的適應值大于或等于前一次迭代得到的最優(yōu)位置的適應值,則該粒子當前所經歷的最優(yōu)位置仍然為前一次迭代所經歷的最優(yōu)位置。
s5、根據公式(3)確定粒子的當前全局最優(yōu)位置pg(t):
s6、將當前全局最優(yōu)位置與前一次迭代的全局最優(yōu)位置進行對比,如果當前全局最優(yōu)位置更優(yōu),則更新全局最優(yōu)位置為當前的全局最優(yōu)位置,否則保持前一次迭代的全局最優(yōu)位置不變。
s7、計算粒子的適應度標準差σ:
式中n為種群規(guī)模,fi為第i個粒子的適應值,favg為粒子群當前的平均適應值。
由公式(4)可以看出,種群適應度標準差σ實際上反映粒子群所有粒子的聚集程度,聚集程度越大,標準差取值反而越小。如果σ小于給定閾值ξ時,則可判定為出現早熟收斂現象,進入步驟s8,否則進入步驟s9。閾值ξ通常通過實驗所得。
s8、對于判定為早熟的粒子,將慣性權重增大至初始值,繼續(xù)進行搜索。
慣性權重ω的計算公式為:
式中ωmax,ωmin分別表示慣性權重ω的最大值和最小值,通常取值為0.9和0.4;iter表示當前迭代次數,itermax表示最大迭代次數。
慣性權重(inertiaweight)一般設置為隨著迭代次數的增加而線性減小,慣性權重的存在主要是粒子在空間內飛行時保持一定的慣性,使其能在空間的更多地方進行搜索,有能力對未達到的新區(qū)域進行探索。
ω越大,粒子在整個搜索空間內的搜索能力越強,ω越小,就是在局部位置搜索能力越強。因此將判定為早熟的粒子,將其慣性權重增到至初始值(最大值),讓其有能力繼續(xù)在空間內進行搜索,跳出了這個聚集區(qū)域,重新增大了種群的多樣性,增強了全局搜索能力。
s9、根據公式(6)更新粒子位置:
式中p=(p1,p2,...,pn)為粒子的隨機位置,μ為區(qū)間(0,1)上均勻分布隨機數,即μ~∪(0,1),l為delta勢阱的特征長度,其計算公式為:
l=2β|pmbest-x(t)|(7)
式中pmbest為所有粒子個體最好位置的平均值,β為收縮-擴張系數(constraction-expansion,ce因子),它是除了群體規(guī)模和迭代次數以外唯一的一個參數。研究表明,β從1.0線性減小到0.5可以普遍取得較好效果,即:
β=0.5+0.5(itermax-t)/itermax(8)
式中t為迭代次數,itermax表示最大迭代次數。
s10、判斷粒子適應值是否達到理想適應值pi,若是則迭代結束并將全局最優(yōu)位置對應的適應值作為全局極值輸出,否則進入步驟s11。
s11、判斷是否達到設定的最大迭代次數itermax,若是則迭代結束并將全局最優(yōu)位置對應的適應值作為全局極值輸出,否則返回步驟s2。
本領域的普通技術人員將會意識到,這里所述的實施例是為了幫助讀者理解本發(fā)明的原理,應被理解為本發(fā)明的保護范圍并不局限于這樣的特別陳述和實施例。本領域的普通技術人員可以根據本發(fā)明公開的這些技術啟示做出各種不脫離本發(fā)明實質的其它各種具體變形和組合,這些變形和組合仍然在本發(fā)明的保護范圍內。