本發(fā)明涉及智能交通領(lǐng)域,尤其涉及一種地理信息數(shù)據(jù)的處理方法及裝置。
背景技術(shù):
1、現(xiàn)有的特征選擇方法常用的為過濾式方法。具體的,過濾式方法是在模型訓(xùn)練和運算前,對數(shù)據(jù)進行特征篩選,特征篩選與建模過程不存在交互。該種方式可以避免模型數(shù)據(jù)對原有數(shù)據(jù)的污染。過濾式方法的篩選標準主要包括距離準則、信息準則、相關(guān)性準則和一致性準則。距離準則采用距離度量數(shù)據(jù)集中各樣本間的相似程度,進而刻畫特征集中各個特征對目標特征的貢獻程度或作用大小。信息準則采用信息熵等屬性衡量數(shù)據(jù)集中各個特征對于目標特征的不確定性程度,特征所擁有的不確定性程度越高,對目標變量的幫助也越大。相關(guān)性準則通過衡量特征與目標特征之間的相關(guān)性程度,實現(xiàn)對各個特征的重要性度量。一致性準則采用數(shù)據(jù)樣本的不一致率衡量候選特征子集的分辨能力,不一致率是不一致樣本個數(shù)與總體樣本數(shù)的比率。
2、過濾式特征選擇方法存在時間和空間復(fù)雜度高的問題,不利于衛(wèi)星星上計算等資源有限的場景。
技術(shù)實現(xiàn)思路
1、現(xiàn)有技術(shù)從數(shù)據(jù)處理角度出發(fā),存在時間和空間復(fù)雜度高的缺點,不利于衛(wèi)星星上計算等資源有限的場景。
2、為了解決上述技術(shù)問題,本發(fā)明第一方面提供一種地理信息數(shù)據(jù)的處理方法,包括:
3、獲取目標區(qū)域在預(yù)定時間范圍內(nèi)的地理信息數(shù)據(jù);
4、根據(jù)所述地理信息數(shù)據(jù),計算得到交通特征集的多個數(shù)據(jù)集及各數(shù)據(jù)集的目標特征值;
5、利用預(yù)先確定的物理知識庫,對所述交通特征集中的特征進行一次篩選得到備用交通特征集,所述物理知識庫包括具有物理關(guān)聯(lián)關(guān)系的多個特征集合;
6、根據(jù)所述備用交通特征集中特征間的強相關(guān)性以及所述備用交通特征集中特征與目標特征間的強相關(guān)性,對所述備用交通特征集中的特征進行二次篩選,得到最優(yōu)交通特征集,根據(jù)所述最優(yōu)交通特征集及目標特征建立目標特征預(yù)測模型。
7、作為本發(fā)明的進一步實施例中,根據(jù)所述備用交通特征集中特征間的強相關(guān)性以及所述備用交通特征集中特征與目標特征間的強相關(guān)性,對所述備用交通特征集中的特征進行二次篩選包括:
8、對于所述備用交通特征集中每一第一交通特征,根據(jù)所述第一交通特征的數(shù)據(jù)集及該數(shù)據(jù)集的目標特征值確定所述第一交通特征與所述目標特征之間的相關(guān)性;在所述第一交通特征與所述目標特征不相關(guān)時,從所述備用交通特征集中刪除所述第一交通特征;
9、對于所述備用交通特征集中的每兩個交通特征,根據(jù)所述兩個交通特征的數(shù)據(jù)集確定所述兩個交通特征之間的相關(guān)性;在所述兩個交通特征相關(guān)時,從所述兩個交通特征中刪除其中一交通特征。
10、作為本發(fā)明進一步實施例中,在所述第一交通特征與所述目標特征相關(guān)時,從所述備用交通特征集中遍歷交通特征,將遍歷到的交通特征作為第二交通特征;
11、將所述第一交通特征及所述第二交通特征作為所述兩個交通特征,計算所述兩個交通特征之間的相關(guān)性,并在所述兩個交通特征相關(guān)時,從所述備用交通特征集中刪除所述第一交通特征。
12、作為本發(fā)明的進一步實施例中,在所述兩個交通特征不相關(guān)時,重復(fù)從所述備用交通特征集中遍歷下個第二交通特征及其之后的步驟,直至無法遍歷到第二交通特征時,從所述備用交通特征集中遍歷下個第一交通特征并重復(fù)確定該第一交通特征與目標特征之間的相關(guān)性。
13、作為本發(fā)明的進一步實施例中,所述交通特征集合中的交通特征至少包括:時刻t的路段i對應(yīng)的交通運行特征,時刻t的路段i對應(yīng)的交通設(shè)計特征及時刻t的路段i對應(yīng)的交通設(shè)施特征;
14、所述目標特征包括:時刻t+1的路段i行程時間或交通狀態(tài)。
15、作為本發(fā)明的進一步實施例中,所述物理知識庫建立過程包括:
16、獲取所述交通特征的物理知識信息及所述目標特征的物理知識信息;
17、對獲取的物理知識信息進行去重處理;
18、從去重后物理知識信息中篩選出目標物理知識信息,所述目標物理知識信息至少包含兩個交通特征,和/或一個交通特征及目標特征;
19、從所述目標物理知識信息中提取物理量間的關(guān)聯(lián)關(guān)系;
20、將具有物理量關(guān)聯(lián)關(guān)系的交通特征,以及具有物理量關(guān)聯(lián)關(guān)系的交通特征和目標特征構(gòu)成一物理知識集合。
21、作為本發(fā)明的進一步實施例中,利用預(yù)先確定的物理知識庫,對所述交通特征集中的特征進行一次篩選,包括:
22、將所述交通特征集中的交通特征逐一匹配所述物理知識庫的特征集合中的特征,并記錄交通特征匹配的次數(shù);
23、對于所述物理知識庫中的每一特征集合,若該特征集合存在至少兩個匹配的交通特征,則在交通特征集中保留匹配次數(shù)最小的交通特征。
24、作為本發(fā)明的進一步實施例中,進行一次篩選之前,還包括:
25、從所述交通特征集中隨機選擇預(yù)定數(shù)量的交通特征組成候選特征子集,并將所述候選特征子集中的交通特征從所述交通特征集中刪除;
26、將所述一次篩選及二次篩選過程替換為:
27、對所述候選特征子集中的特征進行一次篩選以及二次篩選,并記錄刪除交通特征個數(shù);
28、在所述候選特征子集中所有特征均已分析且所述交通特征集不為空時,從所述交通特征集中隨機選擇所述刪除交通特征個數(shù)的交通特征移動至所述候選特征子集中,并對刪除交通特征個數(shù)進行歸零處理,重復(fù)對所述候選特征子集進行一次篩選及二次篩選的過程。
29、作為本發(fā)明的進一步實施例中,在所述候選特征子集中所有特征均已分析且所述刪除交通特征個數(shù)為零以及所述交通特征集不為空時,從所述交通特征集中選擇至少一個交通特征移動至所述候選特征子集中,并將選擇的交通特征從所述交通特征集中刪除,重復(fù)對所述候選特征子集進行一次篩選及二次篩選的過程。
30、作為本發(fā)明的進一步實施例中,從交通特征集中隨機選擇預(yù)定數(shù)量的交通特征組成候選特征子集,包括:
31、獲取分布式服務(wù)器的性能數(shù)據(jù);
32、根據(jù)各服務(wù)器的性能數(shù)據(jù),確定各服務(wù)器的特征處理量;
33、根據(jù)各服務(wù)器的特征處理量,從交通特征集獲取特征得到各服務(wù)器的候選特征子集;
34、將各服務(wù)器的候選特征子集發(fā)送至各服務(wù)器進行分析,以由各服務(wù)器對候選特征子集進行篩選,并統(tǒng)計候選特征子集中刪除交通特征的數(shù)量,根據(jù)各服務(wù)器刪除交通特征的數(shù)量及各服務(wù)器的性能從交通特征集中獲取交通特征。
35、作為本發(fā)明的進一步實施例中,得到地理信息數(shù)據(jù)之后,還包括:
36、對地理信息數(shù)據(jù)進行預(yù)處理,其中,預(yù)處理包括:
37、對地理信息數(shù)據(jù)中的非二值數(shù)據(jù)進行平滑處理;
38、對地理信息數(shù)據(jù)中的空間數(shù)據(jù)進行坐標系轉(zhuǎn)化理;
39、對地理信息數(shù)據(jù)中的時變數(shù)據(jù)進行時空冗余清洗;
40、對缺省數(shù)據(jù)進行數(shù)據(jù)補全處理。
41、本發(fā)明第二方面提供一種地理信息數(shù)據(jù)的處理裝置,包括:
42、數(shù)據(jù)獲取單元,用于獲取目標區(qū)域在預(yù)定時間范圍內(nèi)的地理信息數(shù)據(jù);
43、計算單元,用于根據(jù)所述地理信息數(shù)據(jù),計算得到交通特征集的多個數(shù)據(jù)集及各數(shù)據(jù)集的目標特征值;
44、第一篩選單元,用于利用預(yù)先確定的物理知識庫,對所述交通特征集中的特征進行一次篩選得到備用交通特征集,所述物理知識庫包括具有物理關(guān)聯(lián)關(guān)系的多個特征集合;
45、第二篩選單元,用于根據(jù)所述備用交通特征集中特征間的強相關(guān)性以及所述備用交通特征集中特征與目標特征間的強相關(guān)性,對所述備用交通特征集中的特征進行二次篩選,得到最優(yōu)交通特征集,根據(jù)所述最優(yōu)交通特征集及目標特征建立目標特征預(yù)測模型。
46、本發(fā)明第三方面提供一種導(dǎo)航系統(tǒng),包括:無人飛行設(shè)備、衛(wèi)星服務(wù)器及客戶端;
47、所述無人飛行設(shè)備及衛(wèi)星服務(wù)器上安裝有行程時間預(yù)測模型,所述行程時間預(yù)測模型的目標特征為路段的行程時間,所述行程時間預(yù)測模型的交通特征集利用前述任一實施例所述的方法確定;
48、所述客戶端用于供用戶輸入目的地及檢測衛(wèi)星信號,在檢測到衛(wèi)星信號時,發(fā)送目的地信息至衛(wèi)星服務(wù)器,以由所述衛(wèi)星服務(wù)器利用所述行程時間預(yù)測模型計算得到距離目的地的行程時間,并返回至所述客戶端;在未檢測到衛(wèi)星信號時,發(fā)送目的地信息至附近無人飛行設(shè)備,以由所述無人飛行設(shè)備利用所述行程時間預(yù)測模型計算得到距離目的地的行程時間,并返回至所述客戶端。
49、本發(fā)明提供的地理信息數(shù)據(jù)的處理方法及裝置,通過利用物理知識庫對交通特征集中的特征進行一次篩選得到備用交通特征集,根據(jù)備用交通特征集中特征間的強相關(guān)性以及所述備用交通特征集中特征與目標特征間的強相關(guān)性,對備用交通特征集中的特征進行二次篩選得到最優(yōu)交通特征集,根據(jù)最優(yōu)交通特征集及目標特征建立目標特征預(yù)測模型,能夠降低地理信息數(shù)據(jù)的交通特征選擇算法復(fù)雜度,增加其適用場景,在有限資源下保證計算精度,減少特征冗余。
50、為讓本發(fā)明的上述和其他目的、特征和優(yōu)點能更明顯易懂,下文特舉較佳實施例,并配合所附圖式,作詳細說明如下。