本發(fā)明涉及空中交通流量管理技術(shù)領(lǐng)域,具體而言,涉及一種機(jī)場(chǎng)到達(dá)率預(yù)測(cè)方法及裝置。
背景技術(shù):
隨著航空業(yè)務(wù)的不斷增加,有限的民航空域內(nèi)飛行流量日益增大,空域資源日趨緊張,這使得空域系統(tǒng)更容易受到天氣的影響。大氣環(huán)境瞬息萬(wàn)變,天氣對(duì)航班運(yùn)行的影響貫穿飛行的各個(gè)階段,從機(jī)場(chǎng)起降時(shí)的低能見(jiàn)度、地面風(fēng)、低云到航路飛行階段的航路積冰、急流等等,這導(dǎo)致了飛行距離的增加、機(jī)場(chǎng)和空域的容量減少以及航班延誤,甚至有可能引發(fā)安全事故,在相當(dāng)程度上降低了空域系統(tǒng)的運(yùn)行效率,給航空公司和社會(huì)帶來(lái)較大的經(jīng)濟(jì)損失。當(dāng)前,絕大部分與天氣有關(guān)的空中交通管理決策都是全部由人工來(lái)完成,決策者無(wú)法直接獲取天氣對(duì)航班運(yùn)行造成的影響結(jié)果,而是需要通過(guò)查看各種天氣信息,通過(guò)經(jīng)驗(yàn)對(duì)天氣信息進(jìn)行分析,并對(duì)其影響進(jìn)行消除,這種方式效率較低,且隨著個(gè)人經(jīng)驗(yàn)不同而變化。
技術(shù)實(shí)現(xiàn)要素:
有鑒于此,本發(fā)明實(shí)施例的目的在于提供一種機(jī)場(chǎng)到達(dá)率預(yù)測(cè)方法及裝置,以解決在空中交通管理決策中,決策者無(wú)法直接獲取天氣對(duì)航班運(yùn)行造成的影響。
第一方面,本發(fā)明實(shí)施例提供了一種機(jī)場(chǎng)到達(dá)率預(yù)測(cè)方法,所述方法包括:
獲取選定區(qū)域在預(yù)設(shè)時(shí)間段內(nèi)的環(huán)境數(shù)據(jù)以及與所述預(yù)設(shè)時(shí)間段對(duì)應(yīng)的實(shí)際機(jī)場(chǎng)到達(dá)率數(shù)據(jù);
基于所述環(huán)境數(shù)據(jù)及預(yù)設(shè)的數(shù)據(jù)屬性提取規(guī)則,將所述環(huán)境數(shù)據(jù)轉(zhuǎn)換為環(huán)境屬性數(shù)據(jù),所述環(huán)境屬性數(shù)據(jù)包括環(huán)境屬性訓(xùn)練數(shù)據(jù),所述實(shí)際機(jī)場(chǎng)到達(dá)率數(shù)據(jù)包括第一實(shí)際機(jī)場(chǎng)到達(dá)率;
基于所述第一實(shí)際機(jī)場(chǎng)到達(dá)率及預(yù)設(shè)的分類閾值規(guī)則,獲得第一實(shí)際機(jī)場(chǎng)到達(dá)率分類數(shù)據(jù);
基于所述預(yù)設(shè)時(shí)間段、所述環(huán)境屬性訓(xùn)練數(shù)據(jù)、所述第一實(shí)際機(jī)場(chǎng)到達(dá)率分類數(shù)據(jù)以及回歸算法,建立機(jī)場(chǎng)到達(dá)率預(yù)測(cè)模型;
基于所述機(jī)場(chǎng)到達(dá)率預(yù)測(cè)模型,計(jì)算所述選定區(qū)域的第一預(yù)測(cè)機(jī)場(chǎng)到達(dá)率。
第二方面,本發(fā)明實(shí)施例提供了一種機(jī)場(chǎng)到達(dá)率預(yù)測(cè)裝置,所述裝置包括:
獲取原始數(shù)據(jù)單元,用于獲取選定區(qū)域在預(yù)設(shè)時(shí)間段內(nèi)的環(huán)境數(shù)據(jù)以及與所述預(yù)設(shè)時(shí)間段對(duì)應(yīng)的實(shí)際機(jī)場(chǎng)到達(dá)率數(shù)據(jù);
獲取環(huán)境屬性數(shù)據(jù)單元,用于基于所述環(huán)境數(shù)據(jù)及預(yù)設(shè)的數(shù)據(jù)屬性提取規(guī)則,將所述環(huán)境數(shù)據(jù)轉(zhuǎn)換為環(huán)境屬性數(shù)據(jù),所述環(huán)境屬性數(shù)據(jù)包括環(huán)境屬性訓(xùn)練數(shù)據(jù),所述實(shí)際機(jī)場(chǎng)到達(dá)率數(shù)據(jù)包括第一實(shí)際機(jī)場(chǎng)到達(dá)率;
獲取第一實(shí)際機(jī)場(chǎng)到達(dá)率分類單元,用于基于所述第一實(shí)際機(jī)場(chǎng)到達(dá)率及預(yù)設(shè)的分類閾值規(guī)則,獲得第一實(shí)際機(jī)場(chǎng)到達(dá)率分類數(shù)據(jù);
建立機(jī)場(chǎng)到達(dá)率預(yù)測(cè)模型單元,用于基于所述預(yù)設(shè)時(shí)間段、所述環(huán)境屬性訓(xùn)練數(shù)據(jù)、所述第一實(shí)際機(jī)場(chǎng)到達(dá)率分類數(shù)據(jù)以及回歸算法建立機(jī)場(chǎng)到達(dá)率預(yù)測(cè)模型;
計(jì)算第一預(yù)測(cè)機(jī)場(chǎng)到達(dá)率單元,用于基于所述機(jī)場(chǎng)到達(dá)率預(yù)測(cè)模型,計(jì)算所述選定區(qū)域的第一預(yù)測(cè)機(jī)場(chǎng)到達(dá)率。
本發(fā)明的其他特征和優(yōu)點(diǎn)將在隨后的說(shuō)明書闡述,并且,部分地從說(shuō)明書中變得顯而易見(jiàn),或者通過(guò)實(shí)施本發(fā)明實(shí)施例了解。本發(fā)明的目的和其他優(yōu)點(diǎn)可通過(guò)在所寫的說(shuō)明書、權(quán)利要求書、以及附圖中所特別指出的結(jié)構(gòu)來(lái)實(shí)現(xiàn)和獲得。
附圖說(shuō)明
為了更清楚地說(shuō)明本發(fā)明實(shí)施例的技術(shù)方案,下面將對(duì)實(shí)施例中所需要使用的附圖作簡(jiǎn)單地介紹,應(yīng)當(dāng)理解,以下附圖僅示出了本發(fā)明的某些實(shí)施例,因此不應(yīng)被看作是對(duì)范圍的限定,對(duì)于本領(lǐng)域普通技術(shù)人員來(lái)講,在不付出創(chuàng)造性勞動(dòng)的前提下,還可以根據(jù)這些附圖獲得其他相關(guān)的附圖。
圖1為一種可應(yīng)用于本發(fā)明實(shí)施例中的電子設(shè)備的結(jié)構(gòu)框圖;
圖2為本發(fā)明第一實(shí)施例提供的機(jī)場(chǎng)到達(dá)率預(yù)測(cè)方法的流程圖;
圖3為本發(fā)明第一實(shí)施例提供的機(jī)場(chǎng)到達(dá)率預(yù)測(cè)方法的已獲取的環(huán)境數(shù)據(jù)示意圖;
圖4為本發(fā)明第一實(shí)施例提供的機(jī)場(chǎng)到達(dá)率預(yù)測(cè)方法的METAR報(bào)文(北美地區(qū))及解碼舉例的示意圖;
圖5為本發(fā)明第一實(shí)施例提供的機(jī)場(chǎng)到達(dá)率頻數(shù)分布直方圖;
圖6為本發(fā)明第一實(shí)施例提供的第一機(jī)場(chǎng)到達(dá)率分類數(shù)據(jù)示意圖;
圖7為本發(fā)明第一實(shí)施例中所述機(jī)場(chǎng)到達(dá)率預(yù)測(cè)模型的回歸系數(shù)示意圖;
圖8本發(fā)明第二實(shí)施例提供的機(jī)場(chǎng)到達(dá)率預(yù)測(cè)方法的流程圖;
圖9為本發(fā)明第二實(shí)施例提供的第二混淆矩陣的示意圖;
圖10為本發(fā)明第三實(shí)施例提供的機(jī)場(chǎng)到達(dá)率預(yù)測(cè)方法的流程圖;
圖11為本發(fā)明第三實(shí)施例提供的第一混淆矩陣示意圖;
圖12為本發(fā)明第四實(shí)施例提供的機(jī)場(chǎng)到達(dá)率預(yù)測(cè)裝置;
圖13為本發(fā)明第五實(shí)施例提供的機(jī)場(chǎng)到達(dá)率預(yù)測(cè)裝置。
具體實(shí)施方式
下面將結(jié)合本發(fā)明實(shí)施例中附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例。通常在此處附圖中描述和示出的本發(fā)明實(shí)施例的組件可以以各種不同的配置來(lái)布置和設(shè)計(jì)。因此,以下對(duì)在附圖中提供的本發(fā)明的實(shí)施例的詳細(xì)描述并非旨在限制要求保護(hù)的本發(fā)明的范圍,而是僅僅表示本發(fā)明的選定實(shí)施例?;诒景l(fā)明的實(shí)施例,本領(lǐng)域技術(shù)人員在沒(méi)有做出創(chuàng)造性勞動(dòng)的前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
應(yīng)注意到:相似的標(biāo)號(hào)和字母在下面的附圖中表示類似項(xiàng),因此,一旦某一項(xiàng)在一個(gè)附圖中被定義,則在隨后的附圖中不需要對(duì)其進(jìn)行進(jìn)一步定義和解釋。同時(shí),在本發(fā)明的描述中,術(shù)語(yǔ)“第一”、“第二”等僅用于區(qū)分描述,而不能理解為指示或暗示相對(duì)重要性。
請(qǐng)參閱圖1,圖1示出了一種可應(yīng)用于本申請(qǐng)實(shí)施例中的電子設(shè)備100的結(jié)構(gòu)框圖。該電子設(shè)備100可以作為用戶終端、計(jì)算機(jī)或服務(wù)器。如圖1所示,電子設(shè)備100可以包括存儲(chǔ)器110、存儲(chǔ)控制器111、處理器112和機(jī)場(chǎng)到達(dá)率預(yù)測(cè)裝置。
存儲(chǔ)器110、存儲(chǔ)控制器111、處理器112各元件之間直接或間接地電連接,以實(shí)現(xiàn)數(shù)據(jù)的傳輸或交互。例如,這些元件之間可以通過(guò)一條或多條通訊總線或信號(hào)總線實(shí)現(xiàn)電連接。所述機(jī)場(chǎng)到達(dá)率預(yù)測(cè)方法分別包括至少一個(gè)可以以軟件或固件(firmware)的形式存儲(chǔ)于存儲(chǔ)器110中的軟件功能模塊,例如所述機(jī)場(chǎng)到達(dá)率預(yù)測(cè)裝置包括的軟件功能模塊或計(jì)算機(jī)程序。
存儲(chǔ)器110可以存儲(chǔ)各種軟件程序以及模塊,如本申請(qǐng)實(shí)施例提供的機(jī)場(chǎng)到達(dá)率方法及裝置對(duì)應(yīng)的程序指令/模塊。處理器112通過(guò)運(yùn)行存儲(chǔ)在存儲(chǔ)器110中的軟件程序以及模塊,從而執(zhí)行各種功能應(yīng)用以及數(shù)據(jù)處理,即實(shí)現(xiàn)本申請(qǐng)實(shí)施例中的機(jī)場(chǎng)到達(dá)率預(yù)測(cè)方法。存儲(chǔ)器110可以包括但不限于隨機(jī)存取存儲(chǔ)器(Random Access Memory,RAM),只讀存儲(chǔ)器(Read Only Memory,ROM),可編程只讀存儲(chǔ)器(Programmable Read-Only Memory,PROM),可擦除只讀存儲(chǔ)器(Erasable Programmable Read-Only Memory,EPROM),電可擦除只讀存儲(chǔ)器(Electric Erasable Programmable Read-Only Memory,EEPROM)等。
處理器112可以是一種集成電路芯片,具有信號(hào)處理能力。上述處理器可以是通用處理器,包括中央處理器(Central Processing Unit,簡(jiǎn)稱CPU)、網(wǎng)絡(luò)處理器(Network Processor,簡(jiǎn)稱NP)等;還可以是數(shù)字信號(hào)處理器(DSP)、專用集成電路(ASIC)、現(xiàn)成可編程門陣列(FPGA)或者其他可編程邏輯器件、分立門或者晶體管邏輯器件、分立硬件組件。其可以實(shí)現(xiàn)或者執(zhí)行本申請(qǐng)實(shí)施例中的公開的各方法、步驟及邏輯框圖。通用處理器可以是微處理器或者該處理器也可以是任何常規(guī)的處理器等。
第一實(shí)施例
請(qǐng)參閱圖2,本發(fā)明實(shí)施例提供了一種機(jī)場(chǎng)到達(dá)率預(yù)測(cè)方法,本實(shí)施例描述的是針對(duì)于選定區(qū)域在預(yù)設(shè)時(shí)間段內(nèi)的環(huán)境與交通數(shù)據(jù)的處理流程,所述方法包括:
步驟S210:獲取選定區(qū)域在預(yù)設(shè)時(shí)間段內(nèi)的環(huán)境數(shù)據(jù)以及與所述預(yù)設(shè)時(shí)間段對(duì)應(yīng)的實(shí)際機(jī)場(chǎng)到達(dá)率數(shù)據(jù);
基于步驟S210,關(guān)于選定區(qū)域的選取原則,優(yōu)選地,選擇受天氣影響較頻繁的地區(qū)性或國(guó)家級(jí)的樞紐型機(jī)場(chǎng)。其交通量大,對(duì)周邊地區(qū)影響較大,受到天氣影響較為嚴(yán)重和頻繁,且具有足夠的歷史交通數(shù)據(jù)以及天氣數(shù)據(jù)以供分析研究。國(guó)內(nèi)機(jī)場(chǎng)歷史交通數(shù)據(jù)難以獲取(某些機(jī)場(chǎng)在其官網(wǎng)公布每日航班實(shí)時(shí)到達(dá)及離場(chǎng)信息,數(shù)據(jù)量太少)。其次,由于天氣在我國(guó)暫時(shí)還不是影響空中交通的首要因素,所以本文決定初步選取國(guó)外機(jī)場(chǎng)進(jìn)行案例研究。費(fèi)城國(guó)際機(jī)場(chǎng)對(duì)于美國(guó)東部沿海地區(qū)的延誤具有主要的作用,由于不利天氣較多且交通量較大,位于繁忙的東部海岸空中走廊的中間位置,引起了全美范圍內(nèi)的延誤。
優(yōu)選地,本發(fā)明實(shí)施例選擇費(fèi)城國(guó)際機(jī)場(chǎng)(KPHL)作為選定區(qū)域,預(yù)設(shè)時(shí)間段為當(dāng)?shù)貢r(shí)間早晨7點(diǎn)到晚間22點(diǎn),2011年到2014年的數(shù)據(jù),其中2011年到2013年三年的數(shù)據(jù)作為訓(xùn)練數(shù)據(jù),2014年的數(shù)據(jù)作為測(cè)試數(shù)據(jù)。機(jī)場(chǎng)到達(dá)率(Airport Arrival/Acceptance Rates,AAR)是一個(gè)機(jī)場(chǎng)運(yùn)行狀況的指標(biāo),表示在一定條件下,機(jī)場(chǎng)每小時(shí)可以安全著陸的飛機(jī)數(shù)量,代表著一個(gè)機(jī)場(chǎng)可以接收的飛機(jī)數(shù)量,可以作為機(jī)場(chǎng)吞吐量的指標(biāo)。通過(guò)機(jī)場(chǎng)到達(dá)率可以對(duì)機(jī)場(chǎng)容量進(jìn)行推測(cè),進(jìn)一步與機(jī)場(chǎng)延誤進(jìn)行關(guān)聯(lián),結(jié)合決策支持工具的開發(fā),機(jī)場(chǎng)到達(dá)率分類預(yù)測(cè)可以用來(lái)預(yù)測(cè)延誤以及地面等待程序的實(shí)施狀況。
步驟S220:基于所述環(huán)境數(shù)據(jù)及預(yù)設(shè)的數(shù)據(jù)屬性提取規(guī)則,將所述環(huán)境數(shù)據(jù)轉(zhuǎn)換為環(huán)境屬性數(shù)據(jù),所述環(huán)境屬性數(shù)據(jù)包括環(huán)境屬性訓(xùn)練數(shù)據(jù),所述實(shí)際機(jī)場(chǎng)到達(dá)率數(shù)據(jù)包括第一實(shí)際機(jī)場(chǎng)到達(dá)率;
基于步驟S220,所述環(huán)境數(shù)據(jù)包括METAR報(bào)文天氣信息;所述基于所述環(huán)境數(shù)據(jù)及預(yù)設(shè)的數(shù)據(jù)屬性提取規(guī)則,將所述環(huán)境數(shù)據(jù)轉(zhuǎn)換為環(huán)境屬性數(shù)據(jù),包括:
基于所述METAR報(bào)文天氣信息及預(yù)設(shè)的數(shù)據(jù)屬性提取規(guī)則,提取風(fēng)速屬性數(shù)據(jù)、能見(jiàn)度屬性數(shù)據(jù)、雷暴屬性數(shù)據(jù)及云低高屬性數(shù)據(jù)。
選取風(fēng)速、能見(jiàn)度、是否有雷暴、云底高這幾個(gè)常見(jiàn)天氣現(xiàn)象,這些屬性和機(jī)場(chǎng)到達(dá)率相關(guān),且所有的環(huán)境屬性可以從機(jī)場(chǎng)日常航空天氣報(bào)告及天氣預(yù)報(bào)中獲取。本發(fā)明實(shí)施例的天氣信息從歷史METAR報(bào)文中獲取,報(bào)文記錄從氣象資源網(wǎng)站獲取(http://www.ogimet.com/metars.phtml.en)。請(qǐng)參閱圖3,圖3為本發(fā)明第一實(shí)施例提供的機(jī)場(chǎng)到達(dá)率預(yù)測(cè)方法的已獲取的環(huán)境數(shù)據(jù)示意圖。請(qǐng)參閱圖4,圖4為本發(fā)明第一實(shí)施例提供的機(jī)場(chǎng)到達(dá)率預(yù)測(cè)方法的METAR報(bào)文(北美地區(qū))及解碼舉例的示意圖。
對(duì)原始METAR報(bào)文進(jìn)行處理,提取所需天氣要素和天氣現(xiàn)象的數(shù)據(jù),由于METAR報(bào)文是文本格式,數(shù)據(jù)量較大,并且文字描述和數(shù)據(jù)的出現(xiàn)形式和位置具有一定的變化性,所以可以利用編程如Perl實(shí)現(xiàn)按照下文規(guī)則進(jìn)行的天氣信息提取,為了方便后續(xù)數(shù)據(jù)處理,生成逗號(hào)分隔值文件格式(Comma-Separated Values,CSV)的數(shù)據(jù)文件。
首先判定時(shí)間為當(dāng)?shù)貢r(shí)間早晨7點(diǎn)到晚間22,需要注意的是,METAR報(bào)文按照世界協(xié)調(diào)時(shí)編報(bào),則提取本條METAR報(bào)文信息。依據(jù)報(bào)文編組的先后順序,依次提取風(fēng)速、能見(jiàn)度、是否有雷暴出現(xiàn)、云底高。
提取風(fēng)向以及風(fēng)速,風(fēng)向風(fēng)速編組格式為dddffGfmfmKMH或MPS或KT,其中ddd表示觀測(cè)前10分鐘的平均風(fēng)向,ff表示平均風(fēng)速,“G”為陣風(fēng)指示碼,無(wú)陣風(fēng)時(shí)略去,“fmfm”為大于平均風(fēng)速5米/秒的陣風(fēng),當(dāng)出現(xiàn)陣風(fēng)時(shí),本發(fā)明實(shí)施例提取“fmfm”作為風(fēng)速。
提取能見(jiàn)度組中的能見(jiàn)度值,以及天氣現(xiàn)象組中的雷暴信息。當(dāng)天氣現(xiàn)象編組中出現(xiàn)“TS”字符時(shí),表示機(jī)場(chǎng)附近有雷暴天氣出現(xiàn),則對(duì)雷暴信息記為“1”,表示有雷暴,否則為“0”。
云組采用NsNsNshshshs(CC)的格式進(jìn)行編報(bào),本組可以編報(bào)若干組,按云底高度從低到高順次編報(bào),其中“NsNsNs”為云量,需用簡(jiǎn)語(yǔ)“FEW”(1/8~2/8云量,少云),“SCT”(3/8~4/8云量,疏云),“BKN”(5/8~7/8,云量,多云),“OVC”(8/8,陰天)。“hshshs”為云底高,為電碼乘以30m或100ft(北美地區(qū))。“CC”為云狀,只對(duì)積雨云(Cb)以及濃積云(TCu)進(jìn)行編報(bào)。
對(duì)云量的觀測(cè):云量是指云遮蓋天空視野的份數(shù)。地面觀測(cè)時(shí),全部天空呈半球狀。民航部門規(guī)定把天空分成八個(gè)等份,其中被云遮蓋的份數(shù)就是云量,比如6/8的天空被云層遮蓋,云量就是6。根據(jù)云對(duì)航班運(yùn)行影響分析,本文僅提取BKN以及OVC對(duì)應(yīng)高度為本小時(shí)云底高度(按出現(xiàn)順序提取較低值)。特別的,當(dāng)報(bào)文中出現(xiàn)對(duì)積雨云(Cb)的編報(bào)時(shí),如果積雨云云量為SCT時(shí),云底高以SCT后的電碼高度為準(zhǔn),而舍棄BKN以及OVC。在積雨云內(nèi)以及積雨云區(qū)禁止飛行,所以當(dāng)出現(xiàn)積雨云云狀時(shí),對(duì)其云底高進(jìn)行特別處理。當(dāng)不出現(xiàn)以上的云量以及云狀時(shí),則認(rèn)為云底高因素對(duì)航班運(yùn)行影響忽略,將云底高度記為一個(gè)遠(yuǎn)大于正常云底高的值,以示不影響航班運(yùn)行,記為99900。
步驟S230:基于所述第一實(shí)際機(jī)場(chǎng)到達(dá)率及預(yù)設(shè)的分類閾值規(guī)則,獲得第一實(shí)際機(jī)場(chǎng)到達(dá)率分類數(shù)據(jù);
基于步驟S230,基于所述第一實(shí)際機(jī)場(chǎng)到達(dá)率數(shù)據(jù),獲得所述第一實(shí)際機(jī)場(chǎng)到達(dá)率數(shù)據(jù)的頻數(shù)分布直方圖;基于所述頻數(shù)分布直方圖及所述預(yù)設(shè)的分類閾值規(guī)則,獲得所述第一機(jī)場(chǎng)到達(dá)率分類數(shù)據(jù)。對(duì)所述第一機(jī)場(chǎng)到達(dá)率進(jìn)行離散化處理,選取三個(gè)值高中低進(jìn)行替代。需要注意的是,少數(shù)情況下有可能會(huì)一小時(shí)有兩個(gè)METAR,或者缺少某個(gè)小時(shí)的METAR數(shù)據(jù),對(duì)應(yīng)機(jī)場(chǎng)到達(dá)率時(shí)候要注意,需要按每個(gè)月進(jìn)行校正。如果某天缺少某小時(shí)的數(shù)據(jù),為了不影響小時(shí)這個(gè)自變量,將該天全天數(shù)據(jù)刪除。
首先需要基于一定的閾值將機(jī)場(chǎng)到達(dá)率(AAR)分類到不同的水平中,定義水平的閾值選擇基于以下幾點(diǎn)考慮:
1)機(jī)場(chǎng)AAR分布;
2)區(qū)分出可能導(dǎo)致機(jī)場(chǎng)堵塞或延誤的AAR水平;
3)回歸變量即環(huán)境變量的可預(yù)測(cè)性。
作為機(jī)場(chǎng)到達(dá)率水平分類的出發(fā)點(diǎn),首先通過(guò)直方圖分析幾年之內(nèi)機(jī)場(chǎng)到達(dá)率的分布及其出現(xiàn)頻率,請(qǐng)參閱圖5,圖5為本發(fā)明第一實(shí)施例提供的機(jī)場(chǎng)到達(dá)率頻數(shù)分布直方圖,基于直方圖和對(duì)需求以及交通堵塞可能性的考慮,選擇將數(shù)值機(jī)場(chǎng)到達(dá)率值分為三個(gè)水平。本發(fā)明實(shí)施例沒(méi)有開發(fā)選擇機(jī)場(chǎng)到達(dá)率分類的系統(tǒng)過(guò)程,未來(lái)的研究中可以進(jìn)一步開發(fā)此過(guò)程。本發(fā)明實(shí)施例采用頻數(shù)分布直方圖對(duì)歷史數(shù)據(jù)中的實(shí)際機(jī)場(chǎng)到達(dá)率進(jìn)行分布觀察,并作為確定分類閾值的基礎(chǔ)。優(yōu)選地,請(qǐng)參照?qǐng)D6,圖6為本發(fā)明第一實(shí)施例提供的第一機(jī)場(chǎng)到達(dá)率分類數(shù)據(jù)示意圖。結(jié)合對(duì)交通運(yùn)行影響的分析,將機(jī)場(chǎng)到達(dá)率分為低、中、高三個(gè)檔次,機(jī)場(chǎng)到達(dá)率的接收范圍小于或等于35對(duì)應(yīng)為低水平分類,大于35且小于或等于50為中水平分類,大于50為高水平分類,對(duì)應(yīng)賦值為1、2、3。
另外,需要說(shuō)明的是,本發(fā)明實(shí)施例的交通數(shù)據(jù)獲取自美國(guó)ASPM(Aviation System Performance Metrics)數(shù)據(jù)庫(kù),按照系統(tǒng)提示進(jìn)行選擇,可以獲取具體機(jī)場(chǎng)的歷史每小時(shí)交通狀況統(tǒng)計(jì),由于對(duì)公眾開放的數(shù)據(jù)是77個(gè)主要機(jī)場(chǎng)之間的往來(lái)交通狀況統(tǒng)計(jì),而不是該機(jī)場(chǎng)當(dāng)時(shí)的全部交通量。
步驟S240:基于所述預(yù)設(shè)時(shí)間段、所述環(huán)境屬性訓(xùn)練數(shù)據(jù)、所述第一實(shí)際機(jī)場(chǎng)到達(dá)率分類數(shù)據(jù)以及回歸算法,建立機(jī)場(chǎng)到達(dá)率預(yù)測(cè)模型;
基于步驟S240,利用多項(xiàng)邏輯斯諦回歸算法、以所述預(yù)設(shè)時(shí)間段、所述環(huán)境屬性訓(xùn)練數(shù)據(jù)為回歸量,以所述第一實(shí)際機(jī)場(chǎng)到達(dá)率分類數(shù)據(jù)為分類量,建立機(jī)場(chǎng)到達(dá)率預(yù)測(cè)模型。
邏輯斯諦回歸算法可以依據(jù)多個(gè)獨(dú)立屬性預(yù)測(cè)感興趣的分類變量,獨(dú)立屬性可以為數(shù)值量或者分類量。使用多項(xiàng)邏輯斯諦回歸分析法的幾個(gè)動(dòng)機(jī)如下:首先,這個(gè)技術(shù)很好的適用于粗略估計(jì)機(jī)場(chǎng)到達(dá)率分類的目標(biāo),特別是可用數(shù)據(jù)有限時(shí)。預(yù)測(cè)AAR水平或者分類的潛在屬性極有可能是一些多個(gè)數(shù)值屬性的混合(如能見(jiàn)度以及風(fēng)速)以及分類屬性(例如是否有雷暴),而多項(xiàng)邏輯斯諦回歸算法允許分類型和數(shù)值型回歸量的同時(shí)使用。邏輯回歸可以快速產(chǎn)生一個(gè)機(jī)場(chǎng)到達(dá)率分類的隨機(jī)模型,并給出回歸參數(shù)。此外,多元邏輯回歸模型的理論前提相對(duì)判別分析法要寬松得多,且沒(méi)有關(guān)于分布類型、協(xié)方差陣等方面的嚴(yán)格假定。
接下來(lái)對(duì)多項(xiàng)邏輯斯諦回歸分析法進(jìn)行簡(jiǎn)要介紹,并討論使用回歸技術(shù)對(duì)機(jī)場(chǎng)到達(dá)率分類進(jìn)行建模。模型首先假設(shè)將被建模的量Y(本文指機(jī)場(chǎng)到達(dá)率)有k個(gè)不同的分類(之后稱做“水平”,并記為1,K,k)。這些水平概率依賴于m個(gè)回歸量(本發(fā)明實(shí)施例指環(huán)境屬性),記為x1,x2,...,xm。邏輯斯諦回歸指定了給定屬性值時(shí),Y的每個(gè)分類的概率。具體來(lái)說(shuō),如果X=[x1 x2…xm],Y在水平j(luò)≠k中的概率表述為X的函數(shù),如下公式一所示:
其中,cj是一個(gè)常量,Bj=[b1 b2…bm]T是將被決定的水平j(luò)的系數(shù)列向量。Y在水平k中的概率可由得到。如果某種屬性是分類類型時(shí),比如當(dāng)xi可以假設(shè)為m個(gè)不同值之一,即則算法將用m個(gè)假設(shè)的二進(jìn)制變量替換這個(gè)屬性,這些二進(jìn)制變量可以取為0或者1。這樣,算法就為上述公式一中的每個(gè)假設(shè)變量分配了一個(gè)邏輯系數(shù)。
常數(shù)參數(shù)cj通常稱為截距參數(shù),當(dāng)屬性x1,x2,...,xm為0時(shí),可以通過(guò)截距參數(shù)獲取Pj(X)。這種情況下,在水平j(luò)中的概率為:
接下來(lái),令Xi=[xi,1…xi,m]為n個(gè)歷史記錄中的第i個(gè),Y的歷史數(shù)據(jù)對(duì)應(yīng)為Yi。多項(xiàng)邏輯斯諦回歸算法通過(guò)最小化負(fù)相關(guān)多項(xiàng)對(duì)數(shù)似然函數(shù)L,并估計(jì)得到每個(gè)j=1,...,k-1的邏輯系數(shù)向量Bj以及截距參數(shù)cj:
優(yōu)選地,邏輯斯諦回歸學(xué)習(xí)中通常采用梯度下降法以及擬牛頓法對(duì)目標(biāo)函數(shù)L進(jìn)行最優(yōu)化。
邏輯系數(shù)捕獲了預(yù)測(cè)Y中的每個(gè)屬性的相對(duì)重要性,對(duì)于給定的某個(gè)水平Y(jié),高系數(shù)指示了屬性和水平之間的高相關(guān)性。簡(jiǎn)而言之,一個(gè)特定的水平,比如Y中的水平p∈{1,...,k},如果對(duì)于p水平,屬性xj有正(或者負(fù))系數(shù),那么xj值的增加(或者減少)會(huì)增大Y屬于p水平的幾率。系數(shù)的大小指示了隨著xj中的單位增加量,將會(huì)導(dǎo)致所觀測(cè)Y在p水平中的幾率增加(或減少)的決定因素。
多項(xiàng)邏輯回歸分析法是一種在多個(gè)領(lǐng)域較為廣泛使用的技術(shù),多種軟件都可以通過(guò)歷史數(shù)據(jù)構(gòu)建模型。目前可以進(jìn)行數(shù)據(jù)挖掘的軟件種類較多,Orange、RapidMiner、jHepWork、KNIME、Weka等都是開源免費(fèi)的數(shù)據(jù)挖掘軟件。本文選擇使用Weka,除了多項(xiàng)邏輯回歸算法,該軟件同時(shí)提供數(shù)據(jù)處理以及過(guò)濾的方法,同時(shí)還有模型測(cè)試選項(xiàng)。Weka的全名是懷卡托智能分析環(huán)境,是一款基于JAVA環(huán)境下開源的機(jī)器學(xué)習(xí)以及數(shù)據(jù)挖掘軟件,其源代碼可在其官方網(wǎng)站下載。作為一個(gè)公開的數(shù)據(jù)挖掘工作平臺(tái),Weka集合了大量能承擔(dān)數(shù)據(jù)挖掘任務(wù)的機(jī)器學(xué)習(xí)算法,包括對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,分類,回歸、聚類、關(guān)聯(lián)規(guī)則以及在新的交互式界面上的可視化,同時(shí)該環(huán)境還可以比較和評(píng)估不同的學(xué)習(xí)算法的性能,是現(xiàn)今最完備的數(shù)據(jù)挖掘工具之一。
Weka的專用數(shù)據(jù)格式是ARFF(Attribute-Relation File Format),該文件是ASCII文本文件,描述共享一組屬性結(jié)構(gòu)的實(shí)例列表,由獨(dú)立且無(wú)序的實(shí)例組成,是Weka表示數(shù)據(jù)集的標(biāo)準(zhǔn)方法。Weka提供對(duì)CSV文件的支持,而且這種格式是被很多其他軟件所支持的,本發(fā)明實(shí)施例處理產(chǎn)生CSV格式的數(shù)據(jù)文件,并通過(guò)Weka將其轉(zhuǎn)換為ARFF格式。在Weka中,待預(yù)測(cè)的輸出目標(biāo)被稱作Class屬性,即分類任務(wù)的“類”,最后一個(gè)聲明的屬性被稱作class屬性,在分類任務(wù)中,它是默認(rèn)的目標(biāo)變量(本發(fā)明實(shí)施例為機(jī)場(chǎng)到達(dá)率)。
一天中隨著小時(shí)的變化,機(jī)場(chǎng)到達(dá)率會(huì)呈現(xiàn)出一些變化模式,為了獲取一天中由于機(jī)場(chǎng)的運(yùn)行規(guī)程(比如計(jì)劃跑道維護(hù)或者配置變化)而導(dǎo)致的機(jī)場(chǎng)到達(dá)率隨時(shí)間變化的模式,增加當(dāng)?shù)貢r(shí)間作為機(jī)場(chǎng)到達(dá)率分類的一個(gè)回歸量。
本發(fā)明實(shí)施例中的所述環(huán)境屬性訓(xùn)練數(shù)據(jù)包括預(yù)設(shè)時(shí)間段、風(fēng)速屬性數(shù)據(jù)、能見(jiàn)度屬性數(shù)據(jù)、雷暴屬性數(shù)據(jù)及云低高屬性數(shù)據(jù)作為回歸量,第一時(shí)間機(jī)場(chǎng)到達(dá)率分類數(shù)據(jù)作為分類量,建立了多項(xiàng)邏輯斯蒂回歸模型。
預(yù)設(shè)時(shí)間段,指預(yù)測(cè)時(shí)間的小時(shí)指示,(分類型,早上7點(diǎn)到晚上22點(diǎn),共16類);雷暴屬性數(shù)據(jù),指預(yù)測(cè)時(shí)間內(nèi)在終端區(qū)有無(wú)雷暴出現(xiàn),(分類型屬性,分別為0、1,共2類);風(fēng)速屬性數(shù)據(jù),指預(yù)測(cè)時(shí)間內(nèi)的風(fēng)速,(數(shù)值型屬性);能見(jiàn)度屬性數(shù)據(jù),指預(yù)測(cè)時(shí)間內(nèi)的能見(jiàn)度(數(shù)值型屬性);云低高屬性數(shù)據(jù),指預(yù)測(cè)時(shí)間內(nèi)的云底高(數(shù)值型屬性)。
本發(fā)明實(shí)施例應(yīng)用Weka軟件進(jìn)行機(jī)場(chǎng)到達(dá)率分類的多項(xiàng)邏斯諦回歸建模,通過(guò)三年的訓(xùn)練數(shù)據(jù)獲取模型參數(shù)。在Weka中產(chǎn)生的多項(xiàng)邏輯回歸算法在回歸公式中產(chǎn)生了回歸系數(shù),即上述公式一中的向量Bj以及截距參數(shù)cj。模型結(jié)果給出了算法中對(duì)應(yīng)于三個(gè)給定水平中的低和中水平產(chǎn)生的系數(shù),由其可以得出總的概率,所以未給出高水平對(duì)應(yīng)系數(shù)。請(qǐng)參照?qǐng)D7,圖7為本發(fā)明第一實(shí)施例中所述機(jī)場(chǎng)到達(dá)率預(yù)測(cè)模型的回歸系數(shù)示意圖。每一行表示各個(gè)回歸量,每一類代表分類量,其數(shù)值表示每個(gè)分類量對(duì)每個(gè)回歸量的回歸系數(shù)值,即依賴性?;貧w系數(shù)獲取了每個(gè)機(jī)場(chǎng)到達(dá)率水平對(duì)多種屬性可能性的依懶性。對(duì)于特定機(jī)場(chǎng)到達(dá)率水平的正系數(shù)說(shuō)明了屬性值的增加有利于這個(gè)機(jī)場(chǎng)到達(dá)率水平的出現(xiàn)。相似的,一個(gè)負(fù)系數(shù)說(shuō)明了屬性值的減少有利于這個(gè)機(jī)場(chǎng)到達(dá)率水平。如圖7可知,HOUR表示時(shí)間,WS表示風(fēng)速,VIS表示能見(jiàn)度,TS表示風(fēng)暴,CEILING表示云底高;Class表示分類,1表示機(jī)場(chǎng)到達(dá)率(AAR)低水平,2表示機(jī)場(chǎng)到達(dá)率(AAR)中水平。風(fēng)速的回歸系數(shù)0.0383和0.0108,風(fēng)速的增加導(dǎo)致了低AAR狀況更容易出現(xiàn),能見(jiàn)度的減少同樣也會(huì)導(dǎo)致低AAR事件發(fā)生。系數(shù)的大小指示了相關(guān)因素,通過(guò)相關(guān)因素,某個(gè)屬性值一個(gè)單位的變化增加(或者減少)了某個(gè)特定機(jī)場(chǎng)到達(dá)率水平的趨勢(shì)。其中,正數(shù)表示增加,負(fù)數(shù)表示減少。比如,通過(guò)系數(shù)的比較,可以得出能見(jiàn)度的減少(-0.2103)相比于風(fēng)速的增加(0.0383),會(huì)使得低機(jī)場(chǎng)到達(dá)率事件變得更嚴(yán)重、更容易出現(xiàn)。這樣,通過(guò)邏輯斯諦回歸模型,對(duì)具體機(jī)場(chǎng)不同天氣狀況對(duì)交通狀況的影響有了進(jìn)一步的定量分析。
另外,由于獲取的數(shù)據(jù)是主要機(jī)場(chǎng)之間的往來(lái)交通狀況統(tǒng)計(jì),而不是該機(jī)場(chǎng)當(dāng)時(shí)的全部交通量,當(dāng)天氣狀況發(fā)生變化時(shí),此部分交通量受到影響而發(fā)生改變的幅度較小,導(dǎo)致天氣相比于小時(shí)量系數(shù)較小。
需要注意的是,雖然是針對(duì)于某個(gè)具體分類,但是邏輯斯諦回歸可以對(duì)任何分類使用。另外,如果需要完善機(jī)場(chǎng)到達(dá)率分類,如以上所描述,回歸的結(jié)果是可以反復(fù)使用的。
步驟S250:基于所述機(jī)場(chǎng)到達(dá)率預(yù)測(cè)模型,計(jì)算所述選定區(qū)域的第一預(yù)測(cè)機(jī)場(chǎng)到達(dá)率。
基于獲取回歸系數(shù)后的所述機(jī)場(chǎng)到達(dá)率預(yù)測(cè)模型,將所述環(huán)境屬性訓(xùn)練數(shù)據(jù)帶入獲取回歸系數(shù)后的所述機(jī)場(chǎng)到達(dá)率預(yù)測(cè)模型,計(jì)算并獲得所述選定區(qū)域的第一預(yù)測(cè)機(jī)場(chǎng)到達(dá)率。
本發(fā)明實(shí)施例提供了一種機(jī)場(chǎng)到達(dá)率預(yù)測(cè)方法,通過(guò)對(duì)獲取的環(huán)境數(shù)據(jù)和實(shí)際機(jī)場(chǎng)到達(dá)率數(shù)據(jù)作為訓(xùn)練數(shù)據(jù),以回歸分析算法建立機(jī)場(chǎng)到達(dá)率預(yù)測(cè)模型,獲取了模型參數(shù),獲得預(yù)測(cè)機(jī)場(chǎng)到達(dá)率值,將環(huán)境數(shù)據(jù)對(duì)機(jī)場(chǎng)到達(dá)率影響初步做了量化分析,可以預(yù)測(cè)未來(lái)環(huán)境影響機(jī)場(chǎng)到達(dá)率,給在空中交通管理決策中的決策者提供建議。
第二實(shí)施例
請(qǐng)參閱圖8,本發(fā)明實(shí)施例提供了一種機(jī)場(chǎng)到達(dá)率預(yù)測(cè)方法,本實(shí)施例描述的是針對(duì)于選定區(qū)域在預(yù)設(shè)時(shí)間段內(nèi)的環(huán)境與交通數(shù)據(jù)的處理流程,所述方法包括:
步驟S310:獲取選定區(qū)域在預(yù)設(shè)時(shí)間段內(nèi)的環(huán)境數(shù)據(jù)以及與所述預(yù)設(shè)時(shí)間段對(duì)應(yīng)的實(shí)際機(jī)場(chǎng)到達(dá)率數(shù)據(jù);
步驟S320:基于所述環(huán)境數(shù)據(jù)及預(yù)設(shè)的數(shù)據(jù)屬性提取規(guī)則,將所述環(huán)境數(shù)據(jù)轉(zhuǎn)換為環(huán)境屬性數(shù)據(jù),所述環(huán)境屬性數(shù)據(jù)包括環(huán)境屬性訓(xùn)練數(shù)據(jù),所述實(shí)際機(jī)場(chǎng)到達(dá)率數(shù)據(jù)包括第一實(shí)際機(jī)場(chǎng)到達(dá)率;
步驟S330:基于所述第一實(shí)際機(jī)場(chǎng)到達(dá)率及預(yù)設(shè)的分類閾值規(guī)則,獲得第一實(shí)際機(jī)場(chǎng)到達(dá)率分類數(shù)據(jù);
步驟S340:基于所述預(yù)設(shè)時(shí)間段、所述環(huán)境屬性訓(xùn)練數(shù)據(jù)、所述第一實(shí)際機(jī)場(chǎng)到達(dá)率分類數(shù)據(jù)以及回歸算法,建立機(jī)場(chǎng)到達(dá)率預(yù)測(cè)模型;
步驟S350:基于所述機(jī)場(chǎng)到達(dá)率預(yù)測(cè)模型,計(jì)算所述選定區(qū)域的第一預(yù)測(cè)機(jī)場(chǎng)到達(dá)率。
步驟S360:基于所述機(jī)場(chǎng)到達(dá)率預(yù)測(cè)模型及所述環(huán)境屬性預(yù)測(cè)數(shù)據(jù),驗(yàn)證所述機(jī)場(chǎng)到達(dá)率預(yù)測(cè)模型的性能。
基于步驟S360,所述實(shí)際機(jī)場(chǎng)到達(dá)率還包括第二實(shí)際機(jī)場(chǎng)到達(dá)率,基于所述第二實(shí)際機(jī)場(chǎng)到達(dá)率及所述預(yù)設(shè)的分類閾值規(guī)則,獲得第二實(shí)際機(jī)場(chǎng)到達(dá)率分類數(shù)據(jù);所述基于所述機(jī)場(chǎng)到達(dá)率預(yù)測(cè)模型及所述環(huán)境屬性預(yù)測(cè)數(shù)據(jù),驗(yàn)證所述機(jī)場(chǎng)到達(dá)率預(yù)測(cè)模型的性能,包括:
基于所述預(yù)設(shè)時(shí)間段、所述環(huán)境屬性預(yù)測(cè)數(shù)據(jù)、所述第二實(shí)際機(jī)場(chǎng)到達(dá)率分類數(shù)據(jù)以及所述機(jī)場(chǎng)到達(dá)率預(yù)測(cè)模型,獲得第二預(yù)測(cè)機(jī)場(chǎng)到達(dá)率;
基于所述第二預(yù)測(cè)機(jī)場(chǎng)到達(dá)率與所述第二實(shí)際機(jī)場(chǎng)達(dá)到率,獲得第二混淆矩陣;
基于所述第二混淆矩陣,計(jì)算第二分類性能指標(biāo),從而驗(yàn)證所述機(jī)場(chǎng)到達(dá)率預(yù)測(cè)回歸模型的性能,其中,所述第二分類性能指標(biāo)包括第二總體分類準(zhǔn)確率。
本發(fā)明實(shí)施例使用2014年的數(shù)據(jù)驗(yàn)證了邏輯回歸模型的性能。對(duì)于2014年數(shù)據(jù)集中的每一條記錄,回歸模型基于屬性值預(yù)測(cè)了機(jī)場(chǎng)到達(dá)率的水平,并將這些預(yù)測(cè)結(jié)果和實(shí)際的機(jī)場(chǎng)到達(dá)率水平進(jìn)行了比較。
本發(fā)明實(shí)施例通過(guò)混淆矩陣對(duì)模型的性能進(jìn)行了表示,其中每一列代表了預(yù)測(cè)類別,指示了測(cè)試數(shù)據(jù)的分類結(jié)果,每一列的總數(shù)表示預(yù)測(cè)為該類別的數(shù)據(jù)的數(shù)目;每一行代表了數(shù)據(jù)的真實(shí)歸屬類別,每一行的數(shù)據(jù)總數(shù)表示該類別的數(shù)據(jù)實(shí)例的數(shù)目?;煜仃噷?duì)角線值越大,表示分類準(zhǔn)確度越高。
請(qǐng)參閱圖9,圖9為本發(fā)明第二實(shí)施例中提供的第二混淆矩陣的示意圖,每一行表示第二實(shí)際機(jī)場(chǎng)到達(dá)率(3類),每一類表示第二預(yù)測(cè)機(jī)場(chǎng)到達(dá)率(3類),例如在第一行,記錄了2014年的1409+144+8=1561個(gè)低機(jī)場(chǎng)到達(dá)率記錄,模型正確確認(rèn)了1409條記錄,同時(shí)錯(cuò)誤判斷了144條中等水平記錄,8條高水平記錄,這一類的準(zhǔn)確率為對(duì)角線位置的分類表明第二實(shí)際機(jī)場(chǎng)到達(dá)率和第二預(yù)測(cè)機(jī)場(chǎng)到達(dá)率分類一致,有1409+681+240=2330,3類總數(shù)為1409+681+240+144+8+87+136+111=2816,第二總體分類準(zhǔn)確率為2330/2816=82.7%,這個(gè)結(jié)果說(shuō)明了模型的性能在統(tǒng)計(jì)和數(shù)據(jù)挖掘文獻(xiàn)中是符合標(biāo)準(zhǔn)的//小標(biāo)。回歸量的混淆矩陣指示了機(jī)場(chǎng)到達(dá)率水平通過(guò)回歸得到了有效的區(qū)分,尤其是低機(jī)場(chǎng)到達(dá)率水平可以有效的得到預(yù)測(cè)。
可以理解,本實(shí)施例與第一實(shí)施例提供的機(jī)場(chǎng)到達(dá)率預(yù)測(cè)方法最主要的區(qū)別在于,本實(shí)施例提供的機(jī)場(chǎng)到達(dá)率預(yù)測(cè)方法還包括基于所述機(jī)場(chǎng)到達(dá)率預(yù)測(cè)模型及所述環(huán)境屬性預(yù)測(cè)數(shù)據(jù),驗(yàn)證所述機(jī)場(chǎng)到達(dá)率預(yù)測(cè)模型性能。其他的數(shù)據(jù)處理原理與第一實(shí)施例中的原理相似,相似之處可以參考第一實(shí)施例中的內(nèi)容,本實(shí)施例中不再贅述。
本發(fā)明實(shí)施例提供了一種機(jī)場(chǎng)到達(dá)率預(yù)測(cè)方法,通過(guò)對(duì)獲取的環(huán)境數(shù)據(jù)和實(shí)際機(jī)場(chǎng)到達(dá)率數(shù)據(jù)作為訓(xùn)練數(shù)據(jù),以回歸分析算法建立機(jī)場(chǎng)到達(dá)率預(yù)測(cè)模型,獲取了模型參數(shù),并驗(yàn)證了所述機(jī)場(chǎng)到達(dá)率模型性能,可以預(yù)測(cè)未來(lái)環(huán)境影響機(jī)場(chǎng)到達(dá)率,給在空中交通管理決策中的決策者提供建議。
第三實(shí)施例
請(qǐng)參閱圖10,圖10為本發(fā)明第三實(shí)施例提供的機(jī)場(chǎng)到達(dá)率預(yù)測(cè)方法的流程圖,本實(shí)施例描述的是針對(duì)于選定區(qū)域在預(yù)設(shè)時(shí)間段內(nèi)的環(huán)境與交通數(shù)據(jù)的處理流程,所述方法包括:
步驟S310:獲取選定區(qū)域在預(yù)設(shè)時(shí)間段內(nèi)的環(huán)境數(shù)據(jù)以及與所述預(yù)設(shè)時(shí)間段對(duì)應(yīng)的實(shí)際機(jī)場(chǎng)到達(dá)率數(shù)據(jù);
步驟S320:基于所述環(huán)境數(shù)據(jù)及預(yù)設(shè)的數(shù)據(jù)屬性提取規(guī)則,將所述環(huán)境數(shù)據(jù)轉(zhuǎn)換為環(huán)境屬性數(shù)據(jù),所述環(huán)境屬性數(shù)據(jù)包括環(huán)境屬性訓(xùn)練數(shù)據(jù),所述實(shí)際機(jī)場(chǎng)到達(dá)率數(shù)據(jù)包括第一實(shí)際機(jī)場(chǎng)到達(dá)率;
步驟S330:基于所述第一實(shí)際機(jī)場(chǎng)到達(dá)率及預(yù)設(shè)的分類閾值規(guī)則,獲得第一實(shí)際機(jī)場(chǎng)到達(dá)率分類數(shù)據(jù);
步驟S340:基于所述預(yù)設(shè)時(shí)間段、所述環(huán)境屬性訓(xùn)練數(shù)據(jù)、所述第一實(shí)際機(jī)場(chǎng)到達(dá)率分類數(shù)據(jù)以及回歸算法,建立機(jī)場(chǎng)到達(dá)率預(yù)測(cè)模型;
步驟S350:基于所述機(jī)場(chǎng)到達(dá)率預(yù)測(cè)模型,計(jì)算所述選定區(qū)域的第一預(yù)測(cè)機(jī)場(chǎng)到達(dá)率。
步驟S360:基于所述機(jī)場(chǎng)到達(dá)率預(yù)測(cè)模型及所述環(huán)境屬性預(yù)測(cè)數(shù)據(jù),驗(yàn)證所述機(jī)場(chǎng)到達(dá)率預(yù)測(cè)模型的性能;
基于步驟S360,所述實(shí)際機(jī)場(chǎng)到達(dá)率還包括第二實(shí)際機(jī)場(chǎng)到達(dá)率,基于所述第二實(shí)際機(jī)場(chǎng)到達(dá)率及所述預(yù)設(shè)的分類閾值規(guī)則,獲得第二實(shí)際機(jī)場(chǎng)到達(dá)率分類數(shù)據(jù);所述基于所述機(jī)場(chǎng)到達(dá)率預(yù)測(cè)模型及所述環(huán)境屬性預(yù)測(cè)數(shù)據(jù),驗(yàn)證所述機(jī)場(chǎng)到達(dá)率預(yù)測(cè)模型的性能,包括:
基于所述預(yù)設(shè)時(shí)間段、所述環(huán)境屬性預(yù)測(cè)數(shù)據(jù)、所述第二實(shí)際機(jī)場(chǎng)到達(dá)率分類數(shù)據(jù)以及所述機(jī)場(chǎng)到達(dá)率預(yù)測(cè)模型,獲得第二預(yù)測(cè)機(jī)場(chǎng)到達(dá)率;
基于所述第二預(yù)測(cè)機(jī)場(chǎng)到達(dá)率與所述第二實(shí)際機(jī)場(chǎng)達(dá)到率,獲得第二混淆矩陣;
基于所述第二混淆矩陣,計(jì)算第二分類性能指標(biāo),從而驗(yàn)證所述機(jī)場(chǎng)到達(dá)率預(yù)測(cè)回歸模型性能,其中,所述第二分類性能指標(biāo)包括第二總體分類準(zhǔn)確率。
步驟S370:基于所述機(jī)場(chǎng)到達(dá)率預(yù)測(cè)模型、所述環(huán)境屬性預(yù)測(cè)數(shù)據(jù)級(jí)及所述環(huán)境屬性預(yù)測(cè)數(shù)據(jù),獲得所述機(jī)場(chǎng)到達(dá)率預(yù)測(cè)模型的穩(wěn)定性。
基于所述第一實(shí)際機(jī)場(chǎng)到達(dá)率與所述第一預(yù)測(cè)機(jī)場(chǎng)達(dá)到率,獲得第一混淆矩陣;
基于所述第一混淆矩陣,計(jì)算第一分類性能指標(biāo),其中,所述第一分類性能指標(biāo)包括第一總體分類準(zhǔn)確率;
基于所述第一總體分類準(zhǔn)確率及所述第二總體分類準(zhǔn)確率,獲得所述第一總體分類準(zhǔn)確率與所述第二總體分類準(zhǔn)確率的計(jì)算差距,如果所述計(jì)算差距大于預(yù)設(shè)差值,則表示所述機(jī)場(chǎng)到達(dá)率預(yù)測(cè)模型不穩(wěn)定,不斷修改所述回歸算法的回歸系數(shù),得到修改后的回歸算法,再基于所述修改后的回歸算法、所述預(yù)設(shè)時(shí)間段、所述環(huán)境屬性訓(xùn)練數(shù)據(jù)、所述第一實(shí)際機(jī)場(chǎng)到達(dá)率分類數(shù)據(jù),建立機(jī)場(chǎng)到達(dá)率預(yù)測(cè)模型,直到所述計(jì)算差距不大于所述預(yù)設(shè)差值,從而獲得所述機(jī)場(chǎng)到達(dá)率模型的穩(wěn)定性。
請(qǐng)參閱圖11,圖11為本發(fā)明第三實(shí)施例提供的第一混淆矩陣示意圖,即2011年到2013年的環(huán)境屬性數(shù)據(jù)及第一實(shí)際機(jī)場(chǎng)到達(dá)率,基于已經(jīng)獲取回歸系數(shù)的所述機(jī)場(chǎng)到達(dá)率模型,獲得了第一預(yù)測(cè)機(jī)場(chǎng)到達(dá)率。對(duì)角線表示第一實(shí)際機(jī)場(chǎng)到達(dá)率和第一預(yù)測(cè)機(jī)場(chǎng)到達(dá)率同時(shí)分類正確,4028+2000+902=6930,總體記錄了4028+317+12+207+2000+175+3+308+902=7952,第一總體分類準(zhǔn)確率為6930/7952=87.1%。請(qǐng)參閱圖9,同理,得到第二總體分類準(zhǔn)確率為82.7%。
一個(gè)模型的穩(wěn)定性也是一個(gè)需要考慮的因素,穩(wěn)定性指訓(xùn)練樣本和測(cè)試樣本的預(yù)測(cè)準(zhǔn)確率之間的差距。準(zhǔn)確率相差越小,模型越穩(wěn)定。越穩(wěn)定的模型,用在新數(shù)據(jù)上的預(yù)測(cè)效果越好,更能產(chǎn)生和訓(xùn)練樣本集同樣的分類和預(yù)測(cè)效果。請(qǐng)結(jié)合參照?qǐng)D11和圖9,可以得到第一總體分類準(zhǔn)確率與第二總體分類準(zhǔn)確的差距為87.1%-82.7%=4.4%,比較計(jì)算差距與預(yù)設(shè)差值的大小,優(yōu)選地,預(yù)設(shè)差值為5%,4.4%<5%,屬于可接受的范圍,證明所述機(jī)場(chǎng)到達(dá)率預(yù)測(cè)模型的穩(wěn)定性良好。
可以理解,本實(shí)施例與第一實(shí)施例提供的機(jī)場(chǎng)到達(dá)率預(yù)測(cè)方法最主要的區(qū)別在于,本實(shí)施例提供的機(jī)場(chǎng)到達(dá)率預(yù)測(cè)方法還包括基于所述機(jī)場(chǎng)到達(dá)率預(yù)測(cè)模型及所述環(huán)境屬性預(yù)測(cè)數(shù)據(jù),驗(yàn)證所述機(jī)場(chǎng)到達(dá)率預(yù)測(cè)模型性能;基于所述機(jī)場(chǎng)到達(dá)率預(yù)測(cè)模型、所述環(huán)境屬性預(yù)測(cè)數(shù)據(jù)級(jí)及所述環(huán)境屬性預(yù)測(cè)數(shù)據(jù),獲得所述機(jī)場(chǎng)到達(dá)率預(yù)測(cè)模型的穩(wěn)定性。其他的數(shù)據(jù)處理原理與第一實(shí)施例中的原理相似,相似之處可以參考第一實(shí)施例中的內(nèi)容,本實(shí)施例中不再贅述。
本發(fā)明實(shí)施例提供了一種機(jī)場(chǎng)到達(dá)率預(yù)測(cè)方法,通過(guò)對(duì)獲取的環(huán)境數(shù)據(jù)和實(shí)際機(jī)場(chǎng)到達(dá)率數(shù)據(jù)作為訓(xùn)練數(shù)據(jù),以回歸分析算法建立機(jī)場(chǎng)到達(dá)率預(yù)測(cè)模型,獲取了模型參數(shù),并驗(yàn)證了所述機(jī)場(chǎng)到達(dá)率模型性能,并獲得所述機(jī)場(chǎng)到達(dá)率模型良好的穩(wěn)定性,可以預(yù)測(cè)未來(lái)環(huán)境影響機(jī)場(chǎng)到達(dá)率,給在空中交通管理決策中的決策者提供建議。
第四實(shí)施例
請(qǐng)參閱圖12,本發(fā)明第四實(shí)施例提供了一種機(jī)場(chǎng)到達(dá)率預(yù)測(cè)裝置400,所述裝置400包括:
獲取原始數(shù)據(jù)單元410,用于獲取選定區(qū)域在預(yù)設(shè)時(shí)間段內(nèi)的環(huán)境數(shù)據(jù)以及與所述預(yù)設(shè)時(shí)間段對(duì)應(yīng)的實(shí)際機(jī)場(chǎng)到達(dá)率數(shù)據(jù);
獲取環(huán)境屬性數(shù)據(jù)單元420,用于基于所述環(huán)境數(shù)據(jù)及預(yù)設(shè)的數(shù)據(jù)屬性提取規(guī)則,將所述環(huán)境數(shù)據(jù)轉(zhuǎn)換為環(huán)境屬性數(shù)據(jù),所述環(huán)境屬性數(shù)據(jù)包括環(huán)境屬性訓(xùn)練數(shù)據(jù),所述實(shí)際機(jī)場(chǎng)到達(dá)率數(shù)據(jù)包括第一實(shí)際機(jī)場(chǎng)到達(dá)率;
獲取第一實(shí)際機(jī)場(chǎng)到達(dá)率分類單元430,用于基于所述第一實(shí)際機(jī)場(chǎng)到達(dá)率及預(yù)設(shè)的分類閾值規(guī)則,獲得第一實(shí)際機(jī)場(chǎng)到達(dá)率分類數(shù)據(jù);
建立機(jī)場(chǎng)到達(dá)率預(yù)測(cè)模型單元440,用于基于所述預(yù)設(shè)時(shí)間段、所述環(huán)境屬性訓(xùn)練數(shù)據(jù)、所述第一實(shí)際機(jī)場(chǎng)到達(dá)率分類數(shù)據(jù)以及回歸算法,建立機(jī)場(chǎng)到達(dá)率預(yù)測(cè)模型;
計(jì)算第一預(yù)測(cè)機(jī)場(chǎng)到達(dá)率單元450,用于基于所述機(jī)場(chǎng)到達(dá)率預(yù)測(cè)模型,計(jì)算所述選定區(qū)域的第一預(yù)測(cè)機(jī)場(chǎng)到達(dá)率。
需要說(shuō)明的是,本實(shí)施例中的各單元可以是由軟件代理實(shí)現(xiàn),以上各單元同樣可以由硬件例如集成電路芯片實(shí)現(xiàn)。
第五實(shí)施例
請(qǐng)參閱圖13,本發(fā)明第五實(shí)施例提供了一種機(jī)場(chǎng)到達(dá)率預(yù)測(cè)裝置500,所述裝置500包括:
獲取原始數(shù)據(jù)單元510,于獲取選定區(qū)域在預(yù)設(shè)時(shí)間段內(nèi)的環(huán)境數(shù)據(jù)以及與所述預(yù)設(shè)時(shí)間段對(duì)應(yīng)的實(shí)際機(jī)場(chǎng)到達(dá)率數(shù)據(jù);
獲取環(huán)境屬性數(shù)據(jù)單元520,于基于所述環(huán)境數(shù)據(jù)及預(yù)設(shè)的數(shù)據(jù)屬性提取規(guī)則,將所述環(huán)境數(shù)據(jù)轉(zhuǎn)換為環(huán)境屬性數(shù)據(jù),所述環(huán)境屬性數(shù)據(jù)包括環(huán)境屬性訓(xùn)練數(shù)據(jù),所述實(shí)際機(jī)場(chǎng)到達(dá)率數(shù)據(jù)包括第一實(shí)際機(jī)場(chǎng)到達(dá)率;
獲取第一實(shí)際機(jī)場(chǎng)到達(dá)率分類單元530,于基于所述第一實(shí)際機(jī)場(chǎng)到達(dá)率及預(yù)設(shè)的分類閾值規(guī)則,獲得第一實(shí)際機(jī)場(chǎng)到達(dá)率分類數(shù)據(jù);
建立機(jī)場(chǎng)到達(dá)率預(yù)測(cè)模型單元540,于基于所述預(yù)設(shè)時(shí)間段、所述環(huán)境屬性訓(xùn)練數(shù)據(jù)、所述第一實(shí)際機(jī)場(chǎng)到達(dá)率分類數(shù)據(jù)以及回歸算法,建立機(jī)場(chǎng)到達(dá)率預(yù)測(cè)模型;
計(jì)算第一預(yù)測(cè)機(jī)場(chǎng)到達(dá)率單元550,用于基于所述機(jī)場(chǎng)到達(dá)率預(yù)測(cè)模型,計(jì)算所述選定區(qū)域的第一預(yù)測(cè)機(jī)場(chǎng)到達(dá)率;
驗(yàn)證所述機(jī)場(chǎng)到達(dá)率預(yù)測(cè)模型單元560,用于所述環(huán)境屬性數(shù)據(jù)還包括環(huán)境屬性預(yù)測(cè)數(shù)據(jù),基于所述機(jī)場(chǎng)到達(dá)率預(yù)測(cè)模型及所述環(huán)境屬性預(yù)測(cè)數(shù)據(jù),驗(yàn)證所述機(jī)場(chǎng)到達(dá)率預(yù)測(cè)模型的性能。
獲得所述機(jī)場(chǎng)到達(dá)率預(yù)測(cè)模型穩(wěn)定性單元570,用于基于所述機(jī)場(chǎng)到達(dá)率預(yù)測(cè)模型、所述環(huán)境屬性訓(xùn)練數(shù)據(jù)以及所述環(huán)境屬性預(yù)測(cè)數(shù)據(jù),從而獲得所述機(jī)場(chǎng)到達(dá)率模型的穩(wěn)定性。
本申請(qǐng)所提供的幾個(gè)實(shí)施例中,應(yīng)該理解到,所揭露的裝置和方法,也可以通過(guò)其它的方式實(shí)現(xiàn)。以上所描述的裝置實(shí)施例僅僅是示意性的,例如,附圖中的流程圖和框圖顯示了根據(jù)本發(fā)明的多個(gè)實(shí)施例的裝置、方法和計(jì)算機(jī)程序產(chǎn)品的可能實(shí)現(xiàn)的體系架構(gòu)、功能和操作。在這點(diǎn)上,流程圖或框圖中的每個(gè)方框可以代表一個(gè)模塊、程序段或代碼的一部分,所述模塊、程序段或代碼的一部分包含一個(gè)或多個(gè)用于實(shí)現(xiàn)規(guī)定的邏輯功能的可執(zhí)行指令。也應(yīng)當(dāng)注意,在有些作為替換的實(shí)現(xiàn)方式中,方框中所標(biāo)注的功能也可以以不同于附圖中所標(biāo)注的順序發(fā)生。例如,兩個(gè)連續(xù)的方框?qū)嶋H上可以基本并行地執(zhí)行,它們有時(shí)也可以按相反的順序執(zhí)行,這依所涉及的功能而定。也要注意的是,框圖和/或流程圖中的每個(gè)方框、以及框圖和/或流程圖中的方框的組合,可以用執(zhí)行規(guī)定的功能或動(dòng)作的專用的基于硬件的系統(tǒng)來(lái)實(shí)現(xiàn),或者可以用專用硬件與計(jì)算機(jī)指令的組合來(lái)實(shí)現(xiàn)。
另外,在本發(fā)明各個(gè)實(shí)施例中的各功能模塊可以集成在一起形成一個(gè)獨(dú)立的部分,也可以是各個(gè)模塊單獨(dú)存在,也可以兩個(gè)或兩個(gè)以上模塊集成形成一個(gè)獨(dú)立的部分。
所述功能如果以軟件功能模塊的形式實(shí)現(xiàn)并作為獨(dú)立的產(chǎn)品銷售或使用時(shí),可以存儲(chǔ)在一個(gè)計(jì)算機(jī)可讀取存儲(chǔ)介質(zhì)中。基于這樣的理解,本發(fā)明的技術(shù)方案本質(zhì)上或者說(shuō)對(duì)現(xiàn)有技術(shù)做出貢獻(xiàn)的部分或者該技術(shù)方案的部分可以以軟件產(chǎn)品的形式體現(xiàn)出來(lái),該計(jì)算機(jī)軟件產(chǎn)品存儲(chǔ)在一個(gè)存儲(chǔ)介質(zhì)中,包括若干指令用以使得一臺(tái)計(jì)算機(jī)設(shè)備(可以是個(gè)人計(jì)算機(jī),服務(wù)器,或者網(wǎng)絡(luò)設(shè)備等)執(zhí)行本發(fā)明各個(gè)實(shí)施例所述方法的全部或部分步驟。而前述的存儲(chǔ)介質(zhì)包括:U盤、移動(dòng)硬盤、只讀存儲(chǔ)器(ROM,Read-Only Memory)、隨機(jī)存取存儲(chǔ)器(RAM,Random Access Memory)、磁碟或者光盤等各種可以存儲(chǔ)程序代碼的介質(zhì)。需要說(shuō)明的是,在本文中,諸如第一和第二等之類的關(guān)系術(shù)語(yǔ)僅僅用來(lái)將一個(gè)實(shí)體或者操作與另一個(gè)實(shí)體或操作區(qū)分開來(lái),而不一定要求或者暗示這些實(shí)體或操作之間存在任何這種實(shí)際的關(guān)系或者順序。而且,術(shù)語(yǔ)“包括”、“包含”或者其任何其他變體意在涵蓋非排他性的包含,從而使得包括一系列要素的過(guò)程、方法、物品或者設(shè)備不僅包括那些要素,而且還包括沒(méi)有明確列出的其他要素,或者是還包括為這種過(guò)程、方法、物品或者設(shè)備所固有的要素。在沒(méi)有更多限制的情況下,由語(yǔ)句“包括一個(gè)……”限定的要素,并不排除在包括所述要素的過(guò)程、方法、物品或者設(shè)備中還存在另外的相同要素。
以上所述僅為本發(fā)明的優(yōu)選實(shí)施例而已,并不用于限制本發(fā)明,對(duì)于本領(lǐng)域的技術(shù)人員來(lái)說(shuō),本發(fā)明可以有各種更改和變化。凡在本發(fā)明的精神和原則之內(nèi),所作的任何修改、等同替換、改進(jìn)等,均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。應(yīng)注意到:相似的標(biāo)號(hào)和字母在下面的附圖中表示類似項(xiàng),因此,一旦某一項(xiàng)在一個(gè)附圖中被定義,則在隨后的附圖中不需要對(duì)其進(jìn)行進(jìn)一步定義和解釋。
以上所述,僅為本發(fā)明的具體實(shí)施方式,但本發(fā)明的保護(hù)范圍并不局限于此,任何熟悉本技術(shù)領(lǐng)域的技術(shù)人員在本發(fā)明揭露的技術(shù)范圍內(nèi),可輕易想到變化或替換,都應(yīng)涵蓋在本發(fā)明的保護(hù)范圍之內(nèi)。因此,本發(fā)明的保護(hù)范圍應(yīng)所述以權(quán)利要求的保護(hù)范圍為準(zhǔn)。
需要說(shuō)明的是,在本文中,諸如第一和第二等之類的關(guān)系術(shù)語(yǔ)僅僅用來(lái)將一個(gè)實(shí)體或者操作與另一個(gè)實(shí)體或操作區(qū)分開來(lái),而不一定要求或者暗示這些實(shí)體或操作之間存在任何這種實(shí)際的關(guān)系或者順序。而且,術(shù)語(yǔ)“包括”、“包含”或者其任何其他變體意在涵蓋非排他性的包含,從而使得包括一系列要素的過(guò)程、方法、物品或者設(shè)備不僅包括那些要素,而且還包括沒(méi)有明確列出的其他要素,或者是還包括為這種過(guò)程、方法、物品或者設(shè)備所固有的要素。在沒(méi)有更多限制的情況下,由語(yǔ)句“包括一個(gè)……”限定的要素,并不排除在包括所述要素的過(guò)程、方法、物品或者設(shè)備中還存在另外的相同要素。