專利名稱:一種大規(guī)模虛擬個(gè)體基礎(chǔ)屬性逆向生成方法
技術(shù)領(lǐng)域:
本發(fā)明涉及社會(huì)仿真領(lǐng)域,尤其是涉及一種社會(huì)仿真中大規(guī)模虛擬個(gè)體基礎(chǔ)屬性的逆向生成方法(Attribute Utility Choice Model簡(jiǎn)稱AUCM)。
背景技術(shù):
在大型綜合社會(huì)仿真系統(tǒng)、大規(guī)模群體行為建模等復(fù)雜大系統(tǒng)建模仿真中,初始數(shù)據(jù)產(chǎn)生問題是人們長(zhǎng)期關(guān)注的問題。比如,要建立一個(gè)虛擬北京,虛擬北京中的人口數(shù)據(jù)我們只能從社會(huì)抽樣調(diào)查或相關(guān)部門的普查結(jié)果中獲得一些宏觀統(tǒng)計(jì)數(shù)據(jù),如年齡、職業(yè)、居住地等的統(tǒng)計(jì)分布情況,但是具體到一個(gè)虛擬個(gè)體,如何為他取定具體的年齡、職業(yè)、居住地、婚因狀況、學(xué)歷、收入情況等等的初始值?我們不可能去調(diào)查現(xiàn)實(shí)社會(huì)中的每個(gè)北京人,只能根據(jù)這些宏觀統(tǒng)計(jì)分布反過來產(chǎn)生相對(duì)應(yīng)的虛擬個(gè)體初始數(shù)據(jù)。目前人們普遍采用的是迭代比例擬合(IPF)技術(shù)。然而,迭代比例擬合只能使生成的虛擬人口總體上符合現(xiàn)實(shí)社會(huì)的宏觀統(tǒng)計(jì)分布,但生成的虛擬人口個(gè)體的多個(gè)屬性之間有時(shí)會(huì)出現(xiàn)一些不協(xié)調(diào),例如IPF可能會(huì)生成的某個(gè)這樣的虛擬個(gè)體年齡15-19歲,婚姻狀況已婚...在這個(gè)年齡段結(jié)婚的個(gè)體顯然不符合現(xiàn)實(shí)。這通常會(huì)導(dǎo)致虛擬人在仿真運(yùn)行過程中表現(xiàn)出一些異乎尋常的行為。
國(guó)內(nèi)外現(xiàn)有的大規(guī)模虛擬個(gè)體基礎(chǔ)屬性初始數(shù)據(jù)生成的技術(shù)主要是迭代比例擬合IPF(Iterative Proportional Fitting)方法。該技術(shù)是由Deming和Stephan提出的,主要思想在二維表(或多維表)行列邊際值的約束下,快速調(diào)整求得單元格值,是從兩個(gè)或多個(gè)數(shù)據(jù)集中得到聯(lián)合數(shù)據(jù)(分布)的迭代計(jì)算過程。例如表1所示,已知年齡和婚姻狀況(未婚、已婚和離婚寡居)的邊際分布(統(tǒng)計(jì)規(guī)律),需要計(jì)算所有格子(個(gè)體屬性)。表中虛線框?yàn)檫呺H約束,是某地區(qū)人口統(tǒng)計(jì)部門得到的真實(shí)值,右圖中實(shí)線框內(nèi)為經(jīng)IPF法求出的各個(gè)格子的數(shù)據(jù)。再逐一生成相應(yīng)的個(gè)體,例如,我們得出30-44歲的未婚人數(shù)(即第三行第一列V(4,2)格子的值)是165,那么就將165個(gè)虛擬個(gè)體的年齡設(shè)為30-44歲之間、婚姻狀況設(shè)為未婚,如此逐步生成所有的個(gè)體及其所有屬性。
表1已知邊際分布求聯(lián)合分布的示例 (1.1) (1.2)
此后,IPF法經(jīng)Finberg、Bishop和wong分別針對(duì)具體應(yīng)用進(jìn)行了研究和改進(jìn)。其符號(hào)描述如下 符號(hào)約定用θ表示所有足標(biāo)的全集,用θq表示某一具體的輪廓下標(biāo)。
表示多維表的s個(gè)輪廓(邊際),該值應(yīng)為已獲取的值。
表示格子內(nèi)的值(邊際值)。mθ(0)表示初始估計(jì)值,通常取為1或者平均數(shù)。
表示初值mθ(0)的某一邊際值。其具體過程如下 步驟1將初始值依次匹配到每一個(gè)邊際約束,按下述比例進(jìn)行處理 然后依次處理所有的邊際約束(2,…,s),總處理完共s步,為一個(gè)周期。一般的,在第t步有 步驟2然后進(jìn)行迭代,當(dāng)計(jì)算完第r周期后,有 步驟3在第r個(gè)周期的最后一步時(shí)(步數(shù)為t=rs),擬合計(jì)算 如果δθ上限小于給定的停止條件δ,便終止計(jì)算,否則轉(zhuǎn)到步驟1,進(jìn)行新一周期的迭代,新的迭代的初始值就是上一周期結(jié)果值。
IPF技術(shù)目前得到了廣泛應(yīng)用。由Purdue大學(xué)Krannert管理學(xué)院的SEAS實(shí)驗(yàn)室開發(fā)的基于Agent的大規(guī)模分布式建模與仿真環(huán)境(SyntheticEnvironment for Analysis and Simulation簡(jiǎn)稱SEAS)中融合了政治、經(jīng)濟(jì)、軍事、社會(huì)、信息、基礎(chǔ)設(shè)施的多領(lǐng)域模型支持政治、經(jīng)濟(jì)、軍事、國(guó)家安全、社會(huì)突發(fā)應(yīng)急事件等領(lǐng)域的多方對(duì)抗與協(xié)作推演。目前已經(jīng)被廣泛應(yīng)用于商業(yè)企業(yè)、經(jīng)濟(jì)、國(guó)土安全仿真分析、軍事領(lǐng)域的非軍事仿真分析(EBO,ONA)、社會(huì)突發(fā)危機(jī)事件決策分析,反恐怖作戰(zhàn)等。其中,人口生成算法采用的就是IPF技術(shù)。
但I(xiàn)PF技術(shù)的迭代比例擬合的過程是一個(gè)只關(guān)注宏觀統(tǒng)計(jì)分布的數(shù)學(xué)過程。其成功的方面是所生成的大量虛擬個(gè)體數(shù)據(jù)的宏觀統(tǒng)計(jì)規(guī)律與外部現(xiàn)實(shí)世界能較好的逼近,比如,就表一而言,最后生成18324個(gè)虛擬個(gè)體,其年齡段與婚姻狀況的分布規(guī)律與已知數(shù)據(jù)基本吻合。但是,卻有86.7個(gè)已婚的15-19歲之間的虛擬個(gè)體,如果再增加虛擬個(gè)體的屬性,例如教育程度、職業(yè)、收入情況等等,還會(huì)出現(xiàn)更多的類似于“小學(xué)文化月收入800元已婚的15-19歲的大學(xué)教授”這樣的“怪異虛擬個(gè)體”,出現(xiàn)這種情況的原因在于IPF法的只是像攤面餅一樣使大量個(gè)體在宏觀統(tǒng)計(jì)上符合現(xiàn)實(shí),卻沒有考慮單個(gè)個(gè)體的內(nèi)部多個(gè)屬性之間的聯(lián)系是否合理、是否現(xiàn)實(shí)。這通常會(huì)對(duì)仿真結(jié)果產(chǎn)生影響。
為此,我們需要在實(shí)際的社會(huì)仿真系統(tǒng)開發(fā)過程中解決這一突出問題,即如何生成即符合統(tǒng)計(jì)分布,又符合實(shí)際情況的個(gè)體基礎(chǔ)屬性數(shù)據(jù)。
發(fā)明內(nèi)容
本發(fā)明是鑒于上述技術(shù)問題而產(chǎn)生的。本發(fā)明的一個(gè)目的是提出一種大規(guī)模虛擬個(gè)體基礎(chǔ)屬性逆向生成方法。
在一個(gè)方面中,根據(jù)本發(fā)明的大規(guī)模虛擬個(gè)體基礎(chǔ)屬性逆向生成方法包括步驟A、抽取并定義虛擬個(gè)體Agent的屬性集合A={A1,A2,...,An};B、確定各個(gè)屬性的屬性值集合;C、確定屬性集合中任意兩個(gè)屬性值集合Ai={a1,a2,...,am}和Aj={b1,b2,...,bn}的統(tǒng)計(jì)分布F(xi)以及其聯(lián)合概率分布f(xi);D、進(jìn)行屬性自選擇。
在這個(gè)方面中,其中步驟C進(jìn)一步包括對(duì)屬性按類型進(jìn)行分組以描述諸多屬性的內(nèi)在依賴關(guān)系,即聯(lián)合概率分布函數(shù)。
在這個(gè)方面中,其中在步驟D中對(duì)屬性全集中的第i個(gè)屬性執(zhí)行以下處理,i從0開始D1、對(duì)第j個(gè)虛擬個(gè)體進(jìn)行效用評(píng)估,其中j初始化等于0;D2、使j加1,并且判斷j是否等于虛擬個(gè)體數(shù)目,若等于則轉(zhuǎn)入步驟D3,否則轉(zhuǎn)到步驟D1;D3、通過全局統(tǒng)計(jì)得到屬性臨時(shí)統(tǒng)計(jì)分布
D4、按下式進(jìn)行宏觀約束,如果 則i增加1,并轉(zhuǎn)到步驟D1處理下一個(gè)屬性,否則進(jìn)行步驟D5,如果i等于屬性總數(shù),即屬性全集中所有屬性處理完,則該處理結(jié)束;D5、按下式對(duì)效用評(píng)估函數(shù)U(x(a,b))進(jìn)行調(diào)整,并轉(zhuǎn)到步驟D2 在這個(gè)方面中,其中 其中
為外部屬性效用,
為內(nèi)部效用。
在這個(gè)方面中,其中 其中預(yù)定邊界值
指屬性A的取值集合中取an時(shí)對(duì)應(yīng)的邊界值,
為已經(jīng)取該值的Agent個(gè)數(shù)。
在這個(gè)方面中,其中
為聯(lián)合概率分布。
通過本發(fā)明,克服了IPF技術(shù)的不足,很好的保持了仿真社會(huì)中虛擬個(gè)體初始屬性數(shù)據(jù)在宏觀與微觀兩個(gè)方面與現(xiàn)實(shí)數(shù)據(jù)的一致性,從而使社會(huì)仿真運(yùn)行時(shí)結(jié)果更加理想,提高社會(huì)仿真的現(xiàn)實(shí)意義。
結(jié)合隨后的附圖,從下面的詳細(xì)說明中可顯而易見的得出本發(fā)明的上述及其他目的、特征及優(yōu)點(diǎn)。在附圖中 圖1示出了根據(jù)本發(fā)明的AUCM逆向生成方法的流程圖; 圖2示出了根據(jù)本發(fā)明的AUCM逆向生成方法的子流程圖; 圖3示出了根據(jù)本發(fā)明的AUCM方法生成數(shù)據(jù)與IPF算法生成數(shù)據(jù)及現(xiàn)實(shí)宏觀統(tǒng)計(jì)數(shù)據(jù)對(duì)比圖。
具體實(shí)施例方式 為了更全面地理解本發(fā)明及其優(yōu)點(diǎn),下面結(jié)合附圖及具體實(shí)施例對(duì)本發(fā)明做進(jìn)一步詳細(xì)地說明。
為了便于理解,首先對(duì)幾個(gè)定義進(jìn)行簡(jiǎn)單地描述。
定義一屬性全集定義,A={A1,A2,A3,....An}是由虛擬社會(huì)中所有的虛擬個(gè)體所具有的屬性組成的屬性全集,它必須具備三個(gè)性質(zhì)1完備性,所有可供選擇的選擇項(xiàng)都必須包含在集合中;2有限性,選擇集合中的選擇項(xiàng)的數(shù)量必須是有限的;3獨(dú)立性,屬性之間相對(duì)獨(dú)立。
定義二屬性值集合定義,Ai={a1,a2,a3,....am}是屬性全集中的某個(gè)屬性的所有可能取值。假設(shè)屬性全集為A={年齡,性別,收入...},則例如年齡屬性的屬性值集合可以為{1,2,3,...,150}。
定義三決策者定義,每一個(gè)虛擬個(gè)體被設(shè)計(jì)為一個(gè)所有初始屬性值為空的能完成一定操作的智能Agent,每一個(gè)Agent是在初始屬性集中選擇自己初始屬性時(shí)就是一個(gè)決策者。決策者集合用E={e1,e2,...,en}表示,且對(duì)于任意的決策者ei(即
)有
表示決策者ei的屬性選擇集。
定義四效用定義,決策者e選擇選項(xiàng)an的效用值用
表示,效用可以分解成兩部分,即 其中,
為效用的外在因素部分,又稱為外部屬性效用,
為效用的內(nèi)在因素部分,又稱為內(nèi)部效用。
為當(dāng)決策者e從屬性A的取值集合中選擇一個(gè)屬性值時(shí),對(duì)該屬性集預(yù)定邊界值
的貢獻(xiàn),
計(jì)算公式如下 其中預(yù)定邊界值
指屬性A的取值集合中取an時(shí)對(duì)應(yīng)的邊界值,根據(jù)從人口統(tǒng)計(jì)部門或統(tǒng)計(jì)樣本中得到的統(tǒng)計(jì)數(shù)據(jù)確定,例如我們查得某地區(qū)15-19歲年齡的總?cè)藬?shù)是1412,則1412就是年齡屬性對(duì)應(yīng)的15-19歲年齡段人數(shù)的一個(gè)預(yù)定邊界值,
為已經(jīng)取該值的Agent個(gè)數(shù)。
為e選擇屬性an后,對(duì)該個(gè)體其他屬性取值的影響。通常將其看作是聯(lián)合概率項(xiàng)和多維約束向量εn=<εn1,...,εnj>的聯(lián)合概率密度函數(shù)f(εn)。確定f(εn)的具體方法請(qǐng)見后文中步驟C。
決策者e將在屬性A取值集合的j個(gè)選項(xiàng)中進(jìn)行選擇,無論他選擇哪一個(gè)選項(xiàng)都可以獲得一定水平的效用。由于決策者進(jìn)行的是效用最大化的選擇,因而選擇模型為決策者e選擇選項(xiàng)ai,當(dāng)且僅當(dāng)
效用最大。
因而決策者e選擇ai的概率形式可表示為 由于概率pni服從累積分布,因而,其中I(●)表示的是指示性函數(shù)(Indicative Function),當(dāng)括號(hào)內(nèi)的項(xiàng)為真時(shí),等于1;否則,為0。式(4)是關(guān)于效用的多屬性之間的聯(lián)合概率分布密度函數(shù)f(εn)的一個(gè)多維積分。
下面,參考圖1,對(duì)根據(jù)本發(fā)明的AUCM逆向生成方法進(jìn)行詳細(xì)地說明。
如圖1所示,根據(jù)本發(fā)明的方法包括步驟 步驟A抽取并定義虛擬個(gè)體Agent的屬性集合A={A1,A2,...,An}。
具體地說,括號(hào)內(nèi)的A1,A2,...,An例如分別對(duì)應(yīng)社會(huì)仿真中民眾個(gè)體的性別、年齡、民族、婚姻狀況、受教育時(shí)間、學(xué)歷、黨派組織、家庭住址、家庭角色、行業(yè)、工作單位、職務(wù)等級(jí)、工作狀況收入水平、信仰教派、以及政治傾向等屬性,這些屬性分別與Agent的變量相對(duì)應(yīng)。
例如,在虛擬戰(zhàn)爭(zhēng)空間(virtual Global War Space,GWS)的虛擬社會(huì)個(gè)體基礎(chǔ)屬性生成應(yīng)用中,針對(duì)本發(fā)明的仿真需要以及某城市的人口特點(diǎn),歸納出兩類共計(jì)15種屬性一類是基本屬性,另一類是特征屬性。基本屬性比較固定,其包括性別、年齡、民族、婚姻狀況、受教育時(shí)間、學(xué)歷、黨派組織、家庭住址、家庭角色、行業(yè)、工作單位、職務(wù)等等?;緦傩栽诿總€(gè)具體仿真實(shí)例中都有一定意義,對(duì)虛擬個(gè)體的決策有一定的影響量,但權(quán)重不高,基本屬性是長(zhǎng)期的。特征屬性則不同,與具體事件相關(guān),對(duì)虛擬個(gè)體決策產(chǎn)生權(quán)重較大的影響,例如收入水平、信仰教派、政治傾向。因此,屬性全集例如為 A={Gender,Age,Nation,Marriage,SchoolTime,Degree,Party,Home,F(xiàn)amilyRoleIndustry,Company,DutyGrade,Salary,Belief,PolityTendency} 注Gender性別,Age年齡,Nation民族,Marriage婚姻狀況,SchoolTime受教育時(shí)間,Degree學(xué)歷,Party黨派組織,Home家庭住址,F(xiàn)amilyRole家庭角色,Industry行業(yè),Company工作單位,DutyGrade職務(wù)等級(jí),Salsry收入水平,Belief信仰教派,PolityTendency政治傾向。
當(dāng)然應(yīng)該清楚的是屬性并不局限于此,而可以是任何適當(dāng)?shù)膶傩浴?br>
步驟B確定各個(gè)屬性的屬性值集合。
例如,就步驟A的GWS應(yīng)用示例而言,依次確定各個(gè)屬性的屬性值集合 Gender={0,1}(0女,1男) Age={1,2,3,…,150},(數(shù)字表示歲數(shù)) Nation={1,2,3},(1X民族,2Y民族,3Z民族) Marriage={1,2,3,4},(1未婚,2已婚,3離異,4喪偶) SchoolTime={1,2,3,4,…40},(分別表示1年,2年,3年,一直到40年,1年對(duì)應(yīng)一個(gè)值) Degree={1,2,3,4,5,6,7,8,9},(1幼兒園,2小學(xué),3初中,4高中,5大專,6本科,7碩士,8博士) Party={0,1,2},(0無黨派,1X黨,2Y黨) Home={1,2,3,4,5},(各數(shù)字對(duì)應(yīng)系統(tǒng)中行政區(qū)的編號(hào)) FamilyRole={1,2,3},(1戶主,2配偶,3成員) Industry={0,1,2,3,4,5},(0無業(yè),1工業(yè),2農(nóng)業(yè),3商業(yè),4教育產(chǎn)業(yè),5服務(wù)業(yè)) Company={1,2,3…200},(分別表示200個(gè)工作單位的編號(hào),單位名稱不重要) DutyGrade={0,1,2,3},(0無職務(wù),1級(jí)別較低,2中層級(jí)別,3高級(jí)) Salary={0,1,2,3,4},(0無收入,1低保線以下,2地區(qū)人均收入數(shù)字以內(nèi),3中等收入,4高收入) Belief={1,2,3},(1不信教,2X宗教,3Y宗教) PolityTendency={-1,0,1},(1支持X黨,0中立,1支持Y黨) 步驟C確定屬性集合中任意兩個(gè)屬性Ai={a1,a2,...,am}和Aj={b1,b2,...,bn}(am,bn為屬性Ai,Aj的值)的統(tǒng)計(jì)分布F(xi)以及其聯(lián)合概率分布f(xi)。
具體地說,確定各個(gè)屬性的屬性值集合,并通過社會(huì)公開數(shù)據(jù)源(例如美國(guó)的PUMS(Public Use Micro-data Samples)、英國(guó)SAR(Samples ofAnonymised Records)數(shù)據(jù)、以及政府發(fā)布的人口普查數(shù)據(jù))抽樣調(diào)查獲取虛擬個(gè)體Agent某屬性Ai={a1,a2,...,am}的統(tǒng)計(jì)分布F(xi),該統(tǒng)計(jì)分布可以是用分段函數(shù)表示的邊界值,也可以是連續(xù)函數(shù),如正態(tài)分布函數(shù)等,并且從公開數(shù)據(jù)源獲取或由領(lǐng)域?qū)<?從事人口統(tǒng)計(jì)學(xué)領(lǐng)域有較深入研究的人員)確定屬性全集中若干個(gè)屬性如Ai={a1,a2,...,am}和Aj={b1,b2,...,bn}(am,bn為屬性Ai,Aj的值)取值的聯(lián)合概率分布f(xi)。
例如,從城市的計(jì)劃生育部門、人口普查部門等權(quán)威部門等公開數(shù)據(jù)源,獲取該城市人口的部分屬性的統(tǒng)計(jì)分布F(x),如Gender中男和女的比例為1.15∶1。如果按照應(yīng)用系統(tǒng)建模分辨率的要求計(jì)劃為該城市生成20000個(gè)虛擬民眾個(gè)體,那么應(yīng)該有10698個(gè)Gender=1的Agent和9302個(gè)Gender=0的Agent,即Gender1的邊界值
Gender0的邊界值
再如從公開數(shù)據(jù)源獲得年齡Age的宏觀分布規(guī)律符合正態(tài)分布。類似地,從公開數(shù)據(jù)源查得Nation,Marriage,Degree,Party,Belief等的宏觀統(tǒng)計(jì)規(guī)律,并按照生成20000個(gè)虛擬個(gè)體的需求和各屬性值集合的定義,確定相應(yīng)的邊界值。
如果有些屬性無法從公開數(shù)據(jù)源獲得其分布規(guī)律,那么可通過進(jìn)行抽樣方法獲得。例如,就PolityTendency而言,利用《社會(huì)行為研究法》(郭靜晃洪葉文化事業(yè)有限公司2007年8月出版發(fā)行,P157-169)中的抽樣方法,獲取了PolityTendency的分布數(shù)據(jù)支持X黨的約占27.9%,支持Y黨的約占31.3%,其余為中立,從而可得到PolityTendency-1=5580,PolityTendency0=8160,PolityTendency+1=6260。
確定了各屬性的統(tǒng)計(jì)分布之后,對(duì)屬性按類型進(jìn)行分組,以便描述諸多屬性的內(nèi)在依賴關(guān)系,即聯(lián)合概率分布函數(shù)f(xi)。例如以(Gender,Age,Nation)為一組,這一組的屬性與其他屬性關(guān)聯(lián)不大;(Marriage,Home,F(xiàn)amilyRole)為一組屬于家庭類的。類似地將其他屬性歸類分組。以(Gender,Age,Nation)組為例,計(jì)算聯(lián)合概率分布的公式如下 f(xGender,xAge,xNation)=f(xGender)*f(xAge|xGender)*f(xNation|xGender,xAge) 應(yīng)該注意的是該公式可參閱任何一本《概率論》得到。
依據(jù)Agent相關(guān)理論(例如參見《智能主體及其應(yīng)用》史忠植著,科學(xué)出版社2001年版),生成由例如20000個(gè)Agent組成的Agent_list列表。(請(qǐng)給出該列表一部分的示例,例如包含4個(gè)agent的列表)。Agent的上述屬性暫賦值,這些Agent組成數(shù)目例如為20000的決策者集合。
步驟D屬性自選擇。
具體地說,如圖2所示,對(duì)屬性全集中的第i(從0開始)個(gè)屬性執(zhí)行以下處理 步驟D1對(duì)第j(j初始化等于0)個(gè)虛擬個(gè)體Agent進(jìn)行效用評(píng)估。具體地說,按公式5計(jì)算U(x(a,b)),按照效用最大化原則選擇一個(gè)屬性值。
步驟D2使j加1,并且判斷j是否等于虛擬個(gè)體數(shù)目(例如20000),若等于則轉(zhuǎn)入步驟D3,否則轉(zhuǎn)到步驟D1; 步驟D3通過全局統(tǒng)計(jì)得到屬性臨時(shí)統(tǒng)計(jì)分布
具體地說,以一定步長(zhǎng)(為1或0.1,根據(jù)屬性值集合的情況而定)的形式,求得近似統(tǒng)計(jì)分布曲線,例如Age屬性,令A(yù)ge==1時(shí),統(tǒng)計(jì)有多少個(gè)Agent的Age為1,然后Age增加1,再統(tǒng)計(jì)有多少個(gè)Agent的Age為2,一直達(dá)到Age的最大值為止。
步驟D4按如下方式進(jìn)行宏觀約束,如果 則i增加1,并轉(zhuǎn)到步驟D1處理下一個(gè)屬性,否則進(jìn)行步驟D5。如果i等于屬性總數(shù)(例如在上述示例中是15),即屬性全集中所有屬性處理完,則處理結(jié)束。其中
表示對(duì)每個(gè)取值點(diǎn)(即每個(gè)屬性)的F(xi)與
的比值求平方和后再開方得到的均值,ξ為容差(根據(jù)仿真的需求及不同屬性值而定); 步驟D5按下式對(duì)效用評(píng)估函數(shù)U(x(a,b))進(jìn)行調(diào)整,并轉(zhuǎn)到步驟D2。
在GWS應(yīng)用中,通過本發(fā)明為某城市生成了20000個(gè)虛擬個(gè)體,宏觀統(tǒng)計(jì)規(guī)律符合該城市現(xiàn)實(shí)情況,并且系統(tǒng)運(yùn)行中虛擬個(gè)體的決策、行為等都比較合理,表明生成的虛擬個(gè)體的內(nèi)部屬性也是相融洽的。
例如AUCM法生成的虛擬個(gè)體的SchoolTime即“受教育時(shí)間”這一屬性的宏觀分布(圖中用O表示)與現(xiàn)實(shí)統(tǒng)計(jì)分布(圖中用實(shí)線表示)以及IPF生成的屬性宏觀分布(圖中用+表示)的對(duì)比如附圖3所示??梢钥闯?,AUCM具有與IPF在生成的虛擬個(gè)體群體的宏觀屬性統(tǒng)計(jì)結(jié)果方面都具有較好的表現(xiàn)。
但是通過對(duì)生成的虛擬個(gè)體進(jìn)行人工觀察并根據(jù)常識(shí)進(jìn)行分析,發(fā)現(xiàn)生成不合理個(gè)體的數(shù)目?jī)烧哂泻艽蟮牟顒e,下述表2是人工分析出的不合理虛擬個(gè)體的數(shù)量。顯然,AUCM算法優(yōu)于IPF算法,當(dāng)生成虛擬個(gè)體數(shù)達(dá)到20000個(gè)時(shí),產(chǎn)生的不合理個(gè)體數(shù)前者僅6人,而IPF算法多達(dá)1581人??梢娚梢话銛?shù)量規(guī)模的個(gè)體時(shí),AUCM基本上不會(huì)出現(xiàn)不合理個(gè)體,即使在生成大規(guī)模數(shù)量的個(gè)體時(shí),AUCM生成的不合理個(gè)體數(shù)也遠(yuǎn)遠(yuǎn)少于IPF生成的不合理個(gè)體數(shù)目。從數(shù)據(jù)分析以及實(shí)際仿真應(yīng)用表明,AUCM算法具有良好的表現(xiàn)。
表2
通過上述可知,本發(fā)明能使生成的大量虛擬民眾與被仿真的現(xiàn)實(shí)社會(huì)民眾之間不僅在宏觀上具有相近的統(tǒng)計(jì)規(guī)律特性,而且使生成的虛擬民眾個(gè)體內(nèi)部的多個(gè)屬性也是合理的、現(xiàn)實(shí)的和相融洽的。本發(fā)明通過提取歸納出各類屬性,并將這些屬性進(jìn)行分類,對(duì)每個(gè)屬性進(jìn)行定量描述處理,將這些屬性及其可能取值放入一個(gè)個(gè)“抽屜”,評(píng)估擁有屬性A的人同時(shí)擁有屬性B的可能性取值范圍。再從提取歸納的各類屬性中選出最基本的一個(gè)屬性,逐一賦予各個(gè)虛擬實(shí)體,并使大規(guī)模虛擬實(shí)體在宏觀統(tǒng)計(jì)符合現(xiàn)實(shí)世界的統(tǒng)計(jì)規(guī)律,以此為基礎(chǔ),我們讓虛擬所有虛擬實(shí)體依次根據(jù)自身已有的屬性取值,即根據(jù)內(nèi)因從“抽屜”中選擇另一個(gè)屬性,然后,根據(jù)所獲取的外部統(tǒng)計(jì)規(guī)律從宏觀進(jìn)行整體調(diào)控,從而實(shí)現(xiàn)內(nèi)外部因素的兼顧。
本發(fā)明的顯著特征個(gè)體屬性值的確定是在受宏觀約束的情況下由虛擬個(gè)體自己選擇,且其選擇依賴于該個(gè)體已確定的其他屬性的值。虛擬個(gè)體被設(shè)計(jì)成能完成一定的操作的智能Agent,Agent先從一個(gè)具體的屬性的值集合中選擇一個(gè)值(對(duì)于第一個(gè)屬性第一步處理時(shí),使用平均概率選擇),然后進(jìn)行臨時(shí)統(tǒng)計(jì)得到臨時(shí)統(tǒng)計(jì)規(guī)律,再與宏觀現(xiàn)實(shí)統(tǒng)計(jì)規(guī)律進(jìn)行對(duì)比,得到偏差,根據(jù)偏差對(duì)調(diào)整效用值,重新進(jìn)行該屬性的選擇,即進(jìn)行新的循環(huán),直到得到滿意效果。
本發(fā)明的顯著優(yōu)勢(shì)是克服了IPF技術(shù)的不足,較好的保持了仿真社會(huì)中虛擬個(gè)體初始屬性數(shù)據(jù)在宏觀與微觀兩個(gè)方面與現(xiàn)實(shí)數(shù)據(jù)的一致性,從而使社會(huì)仿真運(yùn)行時(shí)結(jié)果更加理想,提高社會(huì)仿真的現(xiàn)實(shí)意義。
對(duì)于本領(lǐng)域的普通技術(shù)人員來說可顯而易見的得出其他優(yōu)點(diǎn)和修改。因此,具有更廣方面的本發(fā)明并不局限于這里所示出的并且所描述的具體說明及示例性實(shí)施例。因此,在不脫離由隨后權(quán)利要求及其等價(jià)體所定義的一般發(fā)明構(gòu)思的精神和范圍的情況下,可對(duì)其做出各種修改。
權(quán)利要求
1.一種大規(guī)模虛擬個(gè)體基礎(chǔ)屬性逆向生成方法包括步驟
A、抽取并定義虛擬個(gè)體Agent的屬性集合A={A1,A2,...,An};
B、確定各個(gè)屬性的屬性值集合;
C、確定屬性集合中任意兩個(gè)屬性值集合Ai={a1,a2,...,am}和Aj={b1,b2,...,bn}的統(tǒng)計(jì)分布F(xi)以及其聯(lián)合概率分布f(xi);
D、進(jìn)行屬性自選擇。
2.根據(jù)權(quán)利要求1的方法,其中步驟C進(jìn)一步包括對(duì)屬性按類型進(jìn)行分組以描述諸多屬性的內(nèi)在依賴關(guān)系,即聯(lián)合概率分布函數(shù)。
3.根據(jù)權(quán)利要求2的方法,其中在步驟D中對(duì)屬性全集中的第i個(gè)屬性執(zhí)行以下處理,i從0開始
D1、對(duì)第j個(gè)虛擬個(gè)體進(jìn)行效用評(píng)估,其中j初始化等于0;
D2、使j加1,并且判斷j是否等于虛擬個(gè)體數(shù)目,若等于則轉(zhuǎn)入步驟D3,否則轉(zhuǎn)到步驟D1;
D3、通過全局統(tǒng)計(jì)得到屬性臨時(shí)統(tǒng)計(jì)分布
D4、按下式進(jìn)行宏觀約束,如果
則i增加1,并轉(zhuǎn)到步驟D1處理下一個(gè)屬性,否則進(jìn)行步驟D5,如果i等于屬性總數(shù),即屬性全集中所有屬性處理完,則該處理結(jié)束;
D5、按下式對(duì)效用評(píng)估函數(shù)U(x(a,b))進(jìn)行調(diào)整,并轉(zhuǎn)到步驟D2
4.根據(jù)權(quán)利要求3的方法,其中
其中
為外部屬性效用,
為內(nèi)部效用。
5.根據(jù)權(quán)利要求4的方法,其中
其中預(yù)定邊界值
指屬性A的取值集合中取an時(shí)對(duì)應(yīng)的邊界值,
為已經(jīng)取該值的Agent個(gè)數(shù)。
6.根據(jù)權(quán)利要求4的方法,其中
為聯(lián)合概率分布。
全文摘要
提出了一種大規(guī)模虛擬個(gè)體基礎(chǔ)屬性逆向生成方法。該方法包括步驟A、抽取并定義虛擬個(gè)體的屬性集合;B、確定各個(gè)屬性的屬性值集合;C、確定屬性集合中任意兩個(gè)屬性值集合的統(tǒng)計(jì)分布F(xi)以及其聯(lián)合概率分布f(xi);D、進(jìn)行屬性自選擇。通過本發(fā)明,很好的保持了仿真社會(huì)中虛擬個(gè)體初始屬性數(shù)據(jù)在宏觀與微觀兩個(gè)方面與現(xiàn)實(shí)數(shù)據(jù)的一致性,從而使社會(huì)仿真運(yùn)行時(shí)結(jié)果更加理想。
文檔編號(hào)G06F17/50GK101719179SQ200910238109
公開日2010年6月2日 申請(qǐng)日期2009年11月18日 優(yōu)先權(quán)日2009年11月18日
發(fā)明者司光亞, 胡曉峰, 楊志謀, 羅批, 張明智, 李志強(qiáng) 申請(qǐng)人:司光亞, 胡曉峰, 楊志謀, 羅批, 張明智, 李志強(qiáng)