專利名稱:一種人口數(shù)據(jù)空間化動態(tài)建模方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種人口數(shù)據(jù)空間化動態(tài)建模方法,可用于環(huán)境健康風(fēng)險診斷、自然災(zāi)害損失評估和現(xiàn)場抽樣調(diào)查等項目中的人口信息精確獲取。
背景技術(shù):
人口增長已經(jīng)給全球資源、環(huán)境承載能力造成了巨大壓力耕地和林地面積驟減,生態(tài)多樣性破壞嚴(yán)重,人類生存條件日益惡化等。及時獲取不同尺度上精確的人口空間分布及其變化信息對于解決這些社會、經(jīng)濟和環(huán)境問題,提高人口、資源和環(huán)境的綜合管理能力有著重要意義。而人口數(shù)據(jù)通常是按照行政單元來逐級統(tǒng)計和匯總的。這種統(tǒng)計方法往往造成研究中人口和其它數(shù)據(jù)所依附的空間單元尺度不同,使得數(shù)據(jù)間融合成為難題。另外由于人口的增長和遷移,還需要大量的精力和財力來維持人口信息的實時性。因此非常必要將人口普查數(shù)據(jù)進行空間化,通過建模來模擬人口真實的空間分布狀況和動態(tài)變遷的過程。自從1857年第一張人口密度等值線圖產(chǎn)生之后,人口數(shù)據(jù)空間化研究迅速發(fā)展起來。人口數(shù)據(jù)空間化研究方法分為兩大類面插值和曲面建模。面插值是將人口數(shù)據(jù)在不同的面域單元內(nèi)進行轉(zhuǎn)換,目的是將源區(qū)(source zone)的人口普查數(shù)據(jù)轉(zhuǎn)換到目標(biāo)區(qū)(target zone)上。而人口分布曲面建模則是利用適當(dāng)?shù)墓綄⑵詹閿?shù)據(jù)分配到一個規(guī)則的格網(wǎng)系統(tǒng)中去,系統(tǒng)中的每個格網(wǎng)都包含了一個其特定位置的人口估算值。
雖然人口空間化方法能提供大量人口空間分布和變化信息,但是它們都不可避免地存在一個難題-尋找影響因子和人口數(shù)據(jù)之間的數(shù)學(xué)關(guān)系。在國內(nèi)外很多此類研究中是通過建立因子和人口之間線性或非線性回歸模型的方法來實現(xiàn)人口空間化的。逐步回歸是求取回歸模型最為常用的方法之一。它是一種“有進有出”的許算方法,按照變量的重要性來逐一選出重要變量,而且還考慮到已入選回歸方程的某些變量有可能隨著其后另一些變量選入而失去原有的重要性,及時地把這些變量從回歸方程中剔除出去,最終的回歸方程只保留重要的變量。逐步回歸分析等常用的建模方法雖然操作簡單,結(jié)果便于解釋,但是要求預(yù)先定義模型結(jié)構(gòu)和模型參數(shù),這個往往是很難確定。另外,還有一些其它學(xué)科的成熟模型,例如物理學(xué)上的重力模型被成功用來人口數(shù)據(jù)空間化。重力模型在人口空間化中運用的前提是假設(shè)人們都趨于在或靠近城市的地方生活,不然其生活區(qū)域與城市中心有很好的連接;即使在農(nóng)村,人口密集區(qū)多靠近交通干線,而且越靠近城區(qū),人口密度越要比腹地高。這種建模方法雖然只要對重力模型進行略微調(diào)整就能以此得到每個格網(wǎng)上的人口數(shù),但是選擇哪些人口分布影響因子變量輸入模型同樣也是個難題。如果集中分析模型中某一因子變量,往往容易引入偏倚。
總體來說,上述有關(guān)人口數(shù)據(jù)空間化的建模方法具有精度低、模型優(yōu)化效果差的不足。
發(fā)明內(nèi)容
本發(fā)明的技術(shù)解決問題是克服現(xiàn)有人口數(shù)據(jù)空間化建模精度低、模型優(yōu)化效果差的不足,提供一種在遺傳規(guī)劃算法和改進遺傳算法相嵌套基礎(chǔ)上的人口數(shù)據(jù)空間化動態(tài)建模方法,該方法具有建模精度高,模型優(yōu)化效果好的優(yōu)點。
本發(fā)明的技術(shù)解決方案為一種人口數(shù)據(jù)空間化動態(tài)建模方法,其特點在于首先處理對人口空間分布產(chǎn)生影響的n種自然和社會經(jīng)濟因素的原始數(shù)據(jù),得出這些數(shù)據(jù)的歸一化值;后將影響因素歸一化值作為遺傳規(guī)劃算法(genetic programming,GP)輸入,組成搜索空間,來快速求解具有最佳適應(yīng)度的人口數(shù)據(jù)空間化模型;在GP算法每代個體選擇復(fù)制操作過程中利用改進遺傳算法(genetic algorithms,GA)對待復(fù)制個體進行優(yōu)化,最終實現(xiàn)人口數(shù)據(jù)空間化動態(tài)建模的目的,其具體步驟如下
(1)利用GIS技術(shù)獲取對人口分布具有影響的自然和社會經(jīng)濟因素的原始數(shù)據(jù),對這些數(shù)據(jù)進行歸一化處理;(2)初始化遺傳規(guī)劃算法和改進遺傳算法參數(shù);(3)將各種影響因素的歸一化值作為遺傳規(guī)劃算法的輸入,組成搜索空間,來求解具有最佳適應(yīng)度的人口數(shù)據(jù)空間化模型;在遺傳規(guī)劃算法每代個體選擇復(fù)制操作過程中利用改進遺傳算法對待復(fù)制個體進行快速精確優(yōu)化,最終實現(xiàn)人口數(shù)據(jù)空間化動態(tài)建模。
所述的初始化遺傳規(guī)劃算法參數(shù)有種群規(guī)模,即種群中的個體數(shù)GP_Size、樣本量GP_N、遺傳代數(shù)GP_Gen、最大生成深度Max_Dep、最大交叉深度Max_CDep、交叉概率GP_Pc和變異概率GP_Pm;初始化改進遺傳算法參數(shù)有種群規(guī)模,即種群中的個體數(shù)GA_Size、樣本數(shù)目GA_N和遺傳代數(shù)GA_Gen;然后用遺傳規(guī)劃算法和改進遺傳算法相嵌套的方法快速求解具有最佳適應(yīng)度的人口數(shù)據(jù)空間化模型,即A.首先確定遺傳規(guī)劃算法搜索空間中的基本組成單元,包括n種影響因素歸一化值的基本算子(f1,f2,...,fn)和基本算術(shù)運算符,再由基本組成單元隨機形成GP_Size個個體。這些個體都是人口數(shù)據(jù)空間化模型的備選方案,即人口分布和輸入影響因素變量之間的可能的數(shù)學(xué)關(guān)系表達式,一般具有以下函數(shù)形式POPU=f(X1f1,X2f2,...,Xnfn)(1)式中POPU為人口數(shù)據(jù)變量;(f1,f2,...,fn)和(X1,X2,...,Xn)分別為各類輸入影響因素變量及其系數(shù)。
B.計算針對個體Kpid(i)_GP(1≤i≤GP_Size)的所有樣本計算理論值與實測值之間的決定系數(shù),將其作為第t代(1≤t≤GP_Gen)中該個體的適應(yīng)度BsJi(i,t)_GP,其計算公式為
BsJi(i,t)_GP=Σj=1GP_N(P_GP(j)-P‾)(P′_GP(j)-P′‾)Σj=1GP_N(P_GP(j)-P‾)2Σj=1GP_N(P′_GP(j)-P′‾)2---(2)]]>式中 和 分別為所有樣本實測值和計算理論值的平均值;P′_GP(j)為個體Kpid(i)_GP在樣本j(1≤j≤GP_N)的計算理論值;P_GP(j)為樣本j的實測值;C.根據(jù)公式(2)所確定的適應(yīng)度,采取競爭選擇策略來選擇復(fù)制個體以產(chǎn)生新個體,即隨機從群體中選取一組個體,比較該組每個成員的適應(yīng)度,選出實際最好的個體Kpid(BesOpt)_GP,即POPU=f(XB1f1,XB2f2,...,XBnfn),在利用改進遺傳算法對其進行快速精確地優(yōu)化后,復(fù)制優(yōu)化后的個體以取代該組最差的。用改進遺傳算法對個體組中最優(yōu)個體進行優(yōu)化的步驟如下a.首先對模型結(jié)構(gòu)進行判別,若屬于已經(jīng)優(yōu)化過的結(jié)構(gòu)則不再優(yōu)化。
b.采用實數(shù)編碼方式,直接用樣本中實際數(shù)據(jù)的實數(shù)類型,根據(jù)整體誤差模型中待優(yōu)化的模型系數(shù)(XB1,XB2,...,XBn),隨機生成初始群體中GA_Size個個體;c.建立改進遺傳算法的適應(yīng)度評價函數(shù),計算針對個體Kpid(i)_GA(1≤i≤GA_Size)的所有樣本的計算理論值與實測值之間方差的總和,將其作為第t代(1≤t≤GA_Gen)中該個體的適應(yīng)度BsJi(i,t)_GA,計算公式為BsJi(i,t)_GA=1GA_Size×Σj=1GA_GN(P′_GA(j)-P_GA(j))2Σi=1GA_SizeΣj=1GA_GN(P′_GA(j)-P_GA(j))2+10-10---(2)]]>式中P_GA(j)為個體Kpid(i)_GA在樣本j(1≤j≤GA_N)的計算理論值;P_GA(j)為樣本j的實測值。
d.根據(jù)公式(2)所確定的適應(yīng)度評價函數(shù)計算群體中每個個體所對應(yīng)的適應(yīng)度。對其按升序排序,通過優(yōu)(適應(yīng)度小)勝劣(適應(yīng)度大)汰,對排序后的個體采用比例選擇模式來挑選復(fù)制。為了避免計算中適應(yīng)度比例取整時可能會造成新舊種群個體數(shù)目不一致問題,對復(fù)制前后所有個體數(shù)目差異也進行排序,依次對損失較大的個體加1直到差異為0。隨后通過在每個待交叉?zhèn)€體上選取兩個交叉點,互換兩個待交叉?zhèn)€體的交叉點之間部分來實現(xiàn)個體交叉操作。變異操作采用多級變異,變異概率GA_Pm也是一個間于(0,0.1)的不確定值。
e.對子代群體重復(fù)步驟c的操作,進行新一輪遺傳進化過程,直到達到所設(shè)定的遺傳代數(shù)t=GA_Gen或適應(yīng)度最好值等于預(yù)先設(shè)定值時,則適應(yīng)度最好的個體為最優(yōu)個體,即為最優(yōu)解。
D.遺傳規(guī)劃算法對選擇復(fù)制后的新個體進行交換和變異操作。
E.以最大生成深度Max_Dep、最大交叉深度Max_CDep、交叉概率GP_Pc和變異概率GP_Pm為遺傳規(guī)劃算法運行的約束條件,循環(huán)運行步驟C、D,直到遺傳代數(shù)t=GP_Gen或適應(yīng)度最好值等于預(yù)先設(shè)定值時,所得的最優(yōu)個體Kpid(Best)_GP,即POPU=f(Xe1f1,Xe2f2,...,Xenfn),便為具有最佳適應(yīng)度的人口數(shù)據(jù)空間化模型;其中f1,f2,...,fn分別為n種影響因素歸一化值的基本算子,Xe1,Xe2,...,Xen分別為基本算子所對應(yīng)的系數(shù)。
本發(fā)明與現(xiàn)有技術(shù)相比的優(yōu)點在于本發(fā)明克服了傳統(tǒng)上對人口數(shù)據(jù)空間化建模精度低、模型優(yōu)化效果差的缺點,將遺傳規(guī)劃算法和改進遺傳算法相嵌套,引入到人口數(shù)據(jù)空間化的建模和優(yōu)化中,以遺傳程序設(shè)計優(yōu)化模型結(jié)構(gòu),以遺傳算法優(yōu)化模型參數(shù),成功地實現(xiàn)了人口數(shù)據(jù)空間化建模過程自動化。
圖1為本發(fā)明的一種人口數(shù)據(jù)空間化動態(tài)建模方法的流程圖。
具體實施例方式
如圖1所示,本發(fā)明的具體實施方法如下
1、為了增強算法的精度和效率,對遺傳規(guī)劃算法和改進遺傳算法的參數(shù)進行初始化;初始化遺傳規(guī)劃算法的參數(shù)主要有種群規(guī)模GP_Size(≥10)、樣本量GP_N(≥100)、遺傳代數(shù)GP_Gen(≥200)、最大生成深度Max_Dep(≤15)、最大交叉深度Max_CDep(≤10)、交叉概率GP_Pc(≤1)和變異概率GP_Pm(≤1);初始化改進遺傳算法參數(shù)有種群規(guī)模,即種群中的個體數(shù)GA_Size(≥10)、樣本數(shù)目GA_N(≥100)、遺傳代數(shù)GA_Gen(≥200)。
2、利用空間分析等GIS技術(shù)計算出坡度、河流、交通設(shè)施、土地覆被和鄰近村鎮(zhèn)五種人口分布影響因素的原始屬性值,對這些值進行歸一化處理。歸一化處理的公式是fjk=orgjkΣj=1GP_N(orgjk)2---(1)]]>式中orgjk和fjk分別表示樣本j(1≤j≤GP_N)第k(1≤k≤5)類影響因素屬性的原始值和歸一化值。
3、完成上面兩步后,最后用遺傳規(guī)劃算法和改進遺傳算法相嵌套的進化建模算法快速求解具有最佳適應(yīng)度的人口數(shù)據(jù)空間化模型,其步驟如下(1)先確定遺傳規(guī)劃算法搜索空間中的基本組成單元,包括五種影響因素歸一化值的基本算子(f1,f2,f3,f4,f5)和基本算術(shù)運算符{+,-,*,/,ln(),exp()};后由基本組成單元隨機形成GP_Size個個體。對個體進行規(guī)范化處理,所有系數(shù)項均位于運算符的右邊,這樣有利于對同類模型結(jié)構(gòu)的識別。
(2)計算個體Kpid(i)_GP(1≤i≤GP_Size)的所有樣本計算理論值與實測值之間的決定系數(shù),將其作為第t代(1≤t≤GP_Gen)中該個體的適應(yīng)度BsJi(i,t)_GP,其計算公式為BsJi(i,t)_GP=Σj=1GP_N(P_GP(j)-P‾)(P′_GP(j)-P′‾)Σj=1GP_N(P_GP(j)-P‾)2Σj=1GP_N(P′_GP(j)-P′‾)2---(2)]]>
式中 和 分別為所有樣本實測值和計算理論值的平均值;P′_GP(j)為個體Kpid(i)_GP在樣本j(1≤j≤GP_N)的計算理論值;P_GP(j)為樣本j的實測值;(3)根據(jù)公式(2)所確定的適應(yīng)度,采取競爭選擇策略來選擇復(fù)制個體以產(chǎn)生新個體,即隨機從群體中選一組個體,比較該組每個成員的適應(yīng)度,選出實際最好的個體Kpid(BesOpt)_GP,即POPU=f(XB1f1,XB2f2XB3f3,XB4f4,XB5f5)在利用改進遺傳算法對其進行快速精確地優(yōu)化后,復(fù)制優(yōu)化后的個體以取代該組最差的。需要說明的是,當(dāng)代個體是有放回的選取,所以同一個體可能會被多次選中或復(fù)制。用改進遺傳算法對個體組中最優(yōu)個體進行優(yōu)化的步驟如下①首先對模型結(jié)構(gòu)進行判別,若屬于已經(jīng)優(yōu)化過的結(jié)構(gòu)則不再優(yōu)化。
②采用實數(shù)編碼方式,直接用樣本中實際數(shù)據(jù)的實數(shù)類型,根據(jù)整體誤差模型中待優(yōu)化的模型系數(shù)(XB1,XB2,XB3,XB4,XB5),隨機生成初始群體中GA_Size個個體;③建立改進遺傳算法的適應(yīng)度評價函數(shù),計算針對個體Kpid(i)_GA(1≤i≤GA_Size)的所有樣本的計算理論值與實測值之間方差的總和,將其作為第t代(1≤t≤GA_Gen)中該個體的適應(yīng)度BsJi(i,t)_GA,計算公式為BsJi(i,t)_GA=1GA_Size×Σj=1GA_GN(P′_GA(j)-P_GA(j))2Σi=1GA_SizeΣj=1GA_GN(P′_GA(j)-P_GA(j))2+10-10---(3)]]>式中P′_GA(j)為個體Kpid(i)_GA在樣本j(1≤j≤GA_N)的計算理論值;P_GA(j)為樣本j的實測值。
④根據(jù)公式(3)所確定的適應(yīng)度計算群體中每個個體所對應(yīng)的適應(yīng)度。對其按升序排序,通過優(yōu)(適應(yīng)度小)勝劣(適應(yīng)度大)汰,對排序后的個體采用比例選擇模式來挑選復(fù)制。為了避免計算中適應(yīng)度比例取整時可能會造成新舊種群個體數(shù)目不一致問題,對復(fù)制前后所有個體數(shù)目差異也進行排序,依次對損失較大的個體加1直到差異為0。隨后通過在每個待交叉?zhèn)€體上選取兩個交叉點,互換兩個待交叉?zhèn)€體的交叉點之間部分來實現(xiàn)個體交叉操作。與簡單遺傳算法設(shè)置固定交叉概率的做法不同,所用改進遺傳算法的交叉概率GA_Pc是一個位于(0.8,1)之間的隨機值。由于所有個體都表現(xiàn)為一個5維向量,因此在保證變異后的個體仍在搜索范圍內(nèi)的前提下,用給所選個體加噪聲的方法來實行個體變異。變異操作采用多級變異,變異概率GA_Pm也是一個間于(0,0.1)的不確定值。
⑤對子代群體重復(fù)步驟④的操作,進行新一輪遺傳進化過程,直到達到所設(shè)定的遺傳代數(shù)t=GA_Gen或適應(yīng)度最好值等于預(yù)先設(shè)定值時,則適應(yīng)度最好的個體為最優(yōu)個體,即為最優(yōu)解。
(4)遺傳規(guī)劃算法對選擇復(fù)制后的新個體進行交換和變異操作。交叉操作就是隨機選取兩個個體的交叉點,然后相互交換這兩個交叉點以下的子樹來生成兩個新個體。而變異操作則是隨機選定父代個體的變異點及其下屬分支子樹后,刪除突變點,再用其下屬分支子樹來代替它。
(5)以最大生成深度Max_Dep、最大交叉深度Max_CDep、交叉概率GP_Pc和變異概率GP_Pm為遺傳規(guī)劃算法運行的約束條件,循環(huán)運行步驟(3)、(4),直到遺傳代數(shù)t=GP_Gen或適應(yīng)度最好值等于預(yù)先設(shè)定值時,所得的最優(yōu)個體Kpid(Best)_GP,即POPU=f(Xe1f1,Xe2f2,Xe3f3,Xe4f4,Xe5f5)為具有最佳適應(yīng)度的人口數(shù)據(jù)空間化模型;其中f1,f2,f3,f4,f5分別為五種影響因素歸一化值的基本算子,Xe1,Xe2,Xe3,Xe4,Xe5分別為基本算子所對應(yīng)的系數(shù)。
本發(fā)明說明書中未作詳細(xì)描述的內(nèi)容屬于本領(lǐng)域?qū)I(yè)技術(shù)人員公知的現(xiàn)有技術(shù)。
權(quán)利要求
1.一種人口數(shù)據(jù)空間化動態(tài)建模方法,其特征在于包括以下步驟(1)利用GIS技術(shù)獲取對人口分布具有影響的自然和社會經(jīng)濟因素的原始數(shù)據(jù),對這些數(shù)據(jù)進行歸一化處理;(2)初始化遺傳規(guī)劃算法和改進遺傳算法參數(shù);(3)將步驟(1)歸一化值后的有關(guān)原始數(shù)據(jù)作為遺傳規(guī)劃算法的輸入,組成搜索空間,來求解具有最佳適應(yīng)度的人口數(shù)據(jù)空間化模型;在遺傳規(guī)劃算法每代個體選擇復(fù)制操作過程中利用改進遺傳算法對待復(fù)制個體進行快速精確優(yōu)化,最終實現(xiàn)人口數(shù)據(jù)空間化動態(tài)建模。
2.根據(jù)權(quán)利要求1所述的一種人口數(shù)據(jù)空間化動態(tài)建模方法,其特征在于所述的步驟(2)中初始化遺傳規(guī)劃算法參數(shù)有種群規(guī)模,即種群中的個體數(shù)GP_Size、樣本量GP_N、遺傳代數(shù)GP_Gen、最大生成深度Max_Dep、最大交叉深度Max_CDep、交叉概率GP_Pc和變異概率GP_Pm。
3.根據(jù)權(quán)利要求1所述的一種人口數(shù)據(jù)空間化動態(tài)建模方法,其特征在于所述的步驟(2)中初始化改進遺傳算法參數(shù)有種群規(guī)模,即種群中的個體數(shù)GA_Size、樣本數(shù)目GA_N和遺傳代數(shù)GA_Gen。
4.根據(jù)權(quán)利要求1所述的一種人口數(shù)據(jù)空間化動態(tài)建模方法,其特征在于所述的步驟(3)中人口數(shù)據(jù)空間化模型的建立方法如下(1)首先確定遺傳規(guī)劃算法搜索空間中的基本組成單元,包括n種影響因素歸一化值的基本算子(f1,f2,...,fn)和基本算術(shù)運算符,再由基本組成單元隨機形成GP_Size個個體;(2)計算針對個體Kpid(i)_GP(1≤i≤GP_Size)的所有樣本計算理論值與實測值之間的決定系數(shù),將其作為第t代(1≤t≤GP_Gen)中該個體的適應(yīng)度BsJi(i,t)_GP,t為遺傳代數(shù),其計算公式為BsJi(i,t)_GP=Σj=1GP_N(P_GP(j)-P‾)(P′_GP(j)-P′‾)Σj=1GP_N(P_GP(j)-P‾)2Σj=1GP_N(P′_GP(j)-P′‾)2---(2)]]>式中 和 分別為所有樣本實測值和計算理論值的平均值;P′_GP(j)為個體Kpid(i)_GP在樣本j(1≤j≤GP_N)的計算理論值;P_GP(j)為樣本j的實測值;(3)根據(jù)公式(2)所確定的適應(yīng)度,采取競爭選擇策略來選擇復(fù)制個體以產(chǎn)生新個體,即隨機從群體中選取一組個體,比較該組每個成員的適應(yīng)度,選出實際最好的個體Kpid(BesOpt)_GP,即POPU=f(XB1f1,XB2f2,...,XBnfn),再利用改進遺傳算法對個體里面的系數(shù)進行快速精確地優(yōu)化,復(fù)制優(yōu)化后的個體以取代該組最差的;(4)遺傳規(guī)劃算法對選擇復(fù)制后的新個體進行交叉和變異操作;(5)以最大生成深度Max_Dep、最大交叉深度Max_CDep、交叉概率GP_Pc和變異概率GP_Pm為遺傳規(guī)劃算法運行的約束條件,循環(huán)運行步驟(3)、(4),直到遺傳代數(shù)t=GP_Gen或適應(yīng)度最好值等于預(yù)先設(shè)定值時,所得的最優(yōu)個體Kpid(Best)_GP,即POPU=f(Xe1f1,Xe2f2,...,Xenfn),為具有最佳適應(yīng)度的人口數(shù)據(jù)空間化模型。
5.根據(jù)權(quán)利要求1或4所述的一種人口數(shù)據(jù)空間化動態(tài)建模方法,其特征在于所述的采用改進遺傳算法對個體組中最優(yōu)個體進行優(yōu)化的步驟如下(1)首先對模型結(jié)構(gòu)進行判別,若屬于已經(jīng)優(yōu)化過的結(jié)構(gòu)則不再優(yōu)化;(2)采用實數(shù)編碼方式,直接用樣本中實際數(shù)據(jù)的實數(shù)類型,根據(jù)整體誤差模型中待優(yōu)化的模型系數(shù)(XB1,XB2,...,XBn),隨機生成初始群體中GA_Size個個體;(3)建立改進遺傳算法的適應(yīng)度評價函數(shù),計算針對個體Kpid(i)_GA(1≤i≤GA_Size),的所有樣本的計算理論值與實測值之間方差的總和,將其作為第t代(1≤≤GA_Gen)中該個體的適應(yīng)度BsJi(i,t)_GA,計算公式為BsJi(i,t)_GA=1GA_Size×Σj=1GA_GN(P′_GA(j)-P_GA(j))2Σi=1GA_SizeΣj=1GA_GN(P′_GA(j)-P_GA(j))2+10-10---(3)]]>式中P′_GA(j)為個體Kpid(i)_GA在樣本j(1≤j≤GA_N)的計算理論值;P_GA(j)為樣本j的實測值;(4)根據(jù)公式(3)所確定的適應(yīng)度評價函數(shù)計算群體中每個個體所對應(yīng)的適應(yīng)度,對其按適應(yīng)度小-大升序排序,對排序后的個體采用比例選擇模式來挑選復(fù)制,對復(fù)制前后所有個體數(shù)目差異也進行排序,依次對損失較大的個體加1直到差異為0,隨后通過在每個待交叉?zhèn)€體上選取兩個交叉點,互換兩個待交叉?zhèn)€體的交叉點之間部分來實現(xiàn)個體交叉操作,變異操作采用多級變異;(5)對子代群體重復(fù)步驟(4)的操作,進行新一輪遺傳進化過程,直到達到所設(shè)定的遺傳代數(shù)t=GA_Gen或適應(yīng)度最好值等于預(yù)先設(shè)定值時,則適應(yīng)度最好的個體為最優(yōu)個體,即為最優(yōu)解。
6.根據(jù)權(quán)利要求1所述的一種人口數(shù)據(jù)空間化動態(tài)建模方法,其特征在于所述的變異概率GA_Pm為一個間于(0,0.1)的不確定值。
7.根據(jù)權(quán)利要求1所述的一種人口數(shù)據(jù)空間化動態(tài)建模方法,其特征在于所述的交叉概率GA_Pc為一個位于(0.8,1)之間的隨機值。
8.根據(jù)權(quán)利要求1所述的一種人口數(shù)據(jù)空間化動態(tài)建模方法,其特征在于所述步驟(1)中的人口分布影響因素數(shù)據(jù)歸一化處理的公式是fjk=orgjkΣj=1GP_N(orgjk)2---(1)]]>式中orgjk和fjk分別表示樣本j(1≤j≤GP_N)第k(1≤j≤n)類影響因素屬性的原始值和歸一化值。
9.根據(jù)權(quán)利要求4所述的一種人口數(shù)據(jù)空間化動態(tài)建模方法,其特征在于所述步驟(1)中對由基本組成單元隨機形成的個體GP_Size進行規(guī)范化處理,所有系數(shù)項均位于運算符的右邊,這樣有利于對同類模型結(jié)構(gòu)的識別。
全文摘要
一種人口數(shù)據(jù)空間化動態(tài)建模方法,基于各種人口分布影響因素數(shù)據(jù),利用遺傳規(guī)劃算法GP與改進遺傳算法GA相嵌套的方法進行統(tǒng)一快速人口數(shù)據(jù)空間化建模及優(yōu)化,具體實現(xiàn)為首先歸一化處理影響因素數(shù)據(jù);后將影響因素歸一化值作為GP輸入,組成搜索空間,來快速求解具有最佳適應(yīng)度的模型結(jié)構(gòu);在GP每代個體選擇復(fù)制操作過程中利用改進GA對待復(fù)制個體進行快速精確優(yōu)化。本發(fā)明具有建模智能化與自動化、擬合和預(yù)測精度高、方法適應(yīng)性廣等優(yōu)點;可用于環(huán)境健康風(fēng)險診斷、自然災(zāi)害損失評估和現(xiàn)場抽樣調(diào)查等項目中的人口信息精確獲取。
文檔編號G06N3/12GK101089884SQ20071011869
公開日2007年12月19日 申請日期2007年7月12日 優(yōu)先權(quán)日2007年7月12日
發(fā)明者王勁峰, 廖一蘭 申請人:中國科學(xué)院地理科學(xué)與資源研究所