一種空間數(shù)據(jù)訪問規(guī)律動態(tài)統(tǒng)計及信息壓縮的方法及系統(tǒng)的制作方法
【專利摘要】本發(fā)明針對空間數(shù)據(jù)訪問規(guī)律統(tǒng)計信息具有的離散性、無結(jié)構(gòu)性,設(shè)計了一種空間數(shù)據(jù)訪問規(guī)律動態(tài)統(tǒng)計及信息壓縮的方法及系統(tǒng),通過空間數(shù)據(jù)訪問規(guī)律統(tǒng)計信息的點云表達(dá)、聚類梯度計算與聚類區(qū)域提取,實現(xiàn)偶發(fā)性訪問的無效空間數(shù)據(jù)訪問規(guī)律統(tǒng)計信息剔除,減少信息基量;通過對每個聚類點云集區(qū)域,按照點云差數(shù)和訪問次數(shù)的點云序列用1個字節(jié)編碼形成最終壓縮統(tǒng)計數(shù)據(jù)輸出,減少信息總量。本發(fā)明相對于現(xiàn)有技術(shù),解決了由于全局動態(tài)統(tǒng)計帶來的不可承載的網(wǎng)絡(luò)流量問題,實現(xiàn)了實時動態(tài)跟蹤空間數(shù)據(jù)訪問全局分布規(guī)律,大大改善了空間數(shù)據(jù)系統(tǒng)公眾服務(wù)能力。
【專利說明】一種空間數(shù)據(jù)訪問規(guī)律動態(tài)統(tǒng)計及信息壓縮的方法及系統(tǒng)
【技術(shù)領(lǐng)域】
[0001]本發(fā)明屬于大規(guī)模分布式環(huán)境下空間地理信息系統(tǒng)【技術(shù)領(lǐng)域】,尤其涉及海量空間信息存儲、訪問、緩存和控制應(yīng)用【技術(shù)領(lǐng)域】,具體涉及一種云計算環(huán)境下空間數(shù)據(jù)訪問規(guī)律動態(tài)統(tǒng)計及信息壓縮的方法及系統(tǒng)。
【背景技術(shù)】
[0002]隨著高精度遙感影像技術(shù)的提高,對空間數(shù)據(jù)(D0M/DEM/DLG/DRG)的開發(fā)和利用,已經(jīng)被廣泛重視并應(yīng)用到眾多領(lǐng)域。數(shù)字地球中的空間信息服務(wù)質(zhì)量問題,即如何支持大規(guī)模、高強度的并發(fā)用戶訪問以提供高可靠、高可用的空間信息服務(wù)以及如何最快速地將空間數(shù)據(jù)傳輸并顯示在數(shù)字地球的客戶端,成為工業(yè)界和學(xué)術(shù)界的關(guān)注熱點。隨著互聯(lián)網(wǎng)絡(luò)技術(shù)的發(fā)展和寬帶網(wǎng)絡(luò)的普及,空間數(shù)據(jù)的服務(wù)形式從桌面轉(zhuǎn)變到分布式網(wǎng)絡(luò)環(huán)境中,新的服務(wù)形式迫切需要將空間數(shù)據(jù)服務(wù)和網(wǎng)絡(luò)通信技術(shù)融合到一起,從而在分布式網(wǎng)絡(luò)環(huán)境下為用戶各種空間數(shù)據(jù)瀏覽、分析、查詢、漫游等服務(wù)提供高效的平臺支持??臻g信息服務(wù)的質(zhì)量,對于加速推廣和普及空間信息服務(wù)和提升數(shù)字地球用戶的服務(wù)體驗,具有重要意義,相關(guān)的研究也就成為熱點。
[0003]空間數(shù)據(jù)訪問規(guī)律的動態(tài)統(tǒng)計,可有效的為空間數(shù)據(jù)的存儲組織、副本數(shù)量及其存儲分布提供依據(jù),而動態(tài)統(tǒng)計所產(chǎn)生的海量空間數(shù)據(jù)訪問規(guī)律統(tǒng)計信息將帶來不可承載的網(wǎng)絡(luò)流量,既而有算法研究如何通過P2P的方式,減少統(tǒng)計信息融合的副本數(shù)量。但由于統(tǒng)計信息基本量巨大,簡單的代理分發(fā)和融合依然難以滿足要求。
[0004]研究表明,空間用戶訪問統(tǒng)計信息存在由于用戶興趣、地區(qū)熱點等引發(fā)的用戶訪問特征行為,也存在用戶隨意訪問等偶發(fā)性行為。針對用戶特征訪問行為,其對應(yīng)瓦片被再次訪問的可能性大,而對偶發(fā)性訪問行為,其行為準(zhǔn)則難以判斷,對應(yīng)瓦片被再次訪問的可能性不可預(yù)測。針對偶發(fā)性訪問而進行空間數(shù)據(jù)瓦片的存儲組織調(diào)整,將變得非常頻繁和低效,不但很難有效提高空間信息服務(wù)系統(tǒng)的性能,相反,這種頻繁的無序調(diào)整還將額外增加系統(tǒng)的計算和傳輸開銷因此,如何減少偶發(fā)性訪問形成的空間數(shù)據(jù)訪問規(guī)律信息,成為問題的關(guān)鍵之一。
[0005]針對空間數(shù)據(jù)的壓縮有很多研究,包括刪格數(shù)據(jù)的壓縮、矢量數(shù)據(jù)的壓縮等。將空間數(shù)據(jù)映射成空間點云進行數(shù)據(jù)壓縮處理的研究相對較少。純粹的基于點云處理的研究包括邊界提取、表面重建以及模型簡化處理等,而點云去噪是基于點云測量和處理的重要過程之一,應(yīng)用領(lǐng)域較廣,包括地形測量,如利用地面三維激光掃描進行地形測量數(shù)據(jù)去噪,三維重構(gòu)和曲面擬合等。
[0006]不同應(yīng)用目的,點去噪算法也存在差異,對于有序或者部分有序的點云來說,可以采用的去噪算法有很多,如基于最小二乘估計的維納濾波、卡爾曼濾波等。針對無序點云,一般是先利用相關(guān)規(guī)則建立其相互之間的拓?fù)潢P(guān)系,如八叉樹法、k-d tree法以及空間單元格法等。海量空間統(tǒng)計數(shù)據(jù)點云規(guī)模巨大,數(shù)據(jù)映射到點云后,其點云基本是無序的,相互之間沒有拓?fù)潢P(guān)系或很難確定其拓?fù)潢P(guān)系,針對這種無序海量點云,目前的研究算法較少。
[0007]所以,解決由于海量空間數(shù)據(jù)訪問規(guī)律統(tǒng)計信息傳輸帶來的不可承載的網(wǎng)絡(luò)流量問題,從而實現(xiàn)能實時動態(tài)跟蹤空間數(shù)據(jù)訪問全局分布規(guī)律、大大改善空間數(shù)據(jù)系統(tǒng)公眾服務(wù)能力的方法及系統(tǒng),是目前該領(lǐng)域的重要研究方向。
【發(fā)明內(nèi)容】
[0008]本發(fā)明目的在于解決現(xiàn)有技術(shù)不足,提供一種能解決由于海量空間數(shù)據(jù)訪問規(guī)律統(tǒng)計信息傳輸帶來的不可承載的網(wǎng)絡(luò)流量問題、能實時動態(tài)跟蹤空間數(shù)據(jù)訪問全局分布規(guī)律、大大改善空間數(shù)據(jù)系統(tǒng)公眾服務(wù)能力的空間數(shù)據(jù)訪問規(guī)律動態(tài)統(tǒng)計及信息壓縮的方法及系統(tǒng)。
[0009]本發(fā)明的方法所采用的技術(shù)方案是:一種空間數(shù)據(jù)訪問規(guī)律動態(tài)統(tǒng)計及信息壓縮的方法,其特征在于,包括以下步驟:
[0010]步驟1:空間數(shù)據(jù)訪問規(guī)律統(tǒng)計信息點云輸出:將空間數(shù)據(jù)訪問規(guī)律信息按照每塊瓦片數(shù)據(jù)的空間位置及其被訪問下載次數(shù),形成空間數(shù)據(jù)訪問規(guī)律統(tǒng)計信息點云輸出;
[0011]步驟2:空間數(shù)據(jù)訪問規(guī)律統(tǒng)計信息聚類計算:根據(jù)獲取的聚類計算半徑參數(shù)計算空間數(shù)據(jù)訪問規(guī)律統(tǒng)計信息點云聚類梯度,根據(jù)計算得到的聚類梯度剔除偶發(fā)性的離散訪問點云,保留有效特征訪問點云,減少空間數(shù)據(jù)訪問規(guī)律統(tǒng)計信息基量;
[0012]步驟3:空間數(shù)據(jù)訪問規(guī)律統(tǒng)計信息區(qū)域提取:根據(jù)獲取的聚類區(qū)域提取擴散半徑、聚類區(qū)域內(nèi)點云差數(shù)量參數(shù)計算聚類內(nèi)點云歐式距離,將特征訪問點云進行聚類分組,形成聚類點云集,對空間數(shù)據(jù)訪問規(guī)律統(tǒng)計信息進行聚類區(qū)域劃分和分類提取;
[0013]步驟4:空間數(shù)據(jù)訪問規(guī)律統(tǒng)計信息聚類壓縮:根據(jù)每個聚類點云集區(qū)域,計算聚類區(qū)域內(nèi)點云差,按照點云差數(shù)和訪問次數(shù)的點云序列用I個字節(jié)編碼形成最終壓縮統(tǒng)計數(shù)據(jù)輸出。
[0014]作為優(yōu)選,所述的空間數(shù)據(jù)按照金子塔瓦片的形式存儲,每塊瓦片的被訪問次數(shù)為空間數(shù)據(jù)訪問規(guī)律統(tǒng)計信息;空間數(shù)據(jù)訪問規(guī)律統(tǒng)計信息包括空間數(shù)據(jù)的位置坐標(biāo)和訪問次數(shù)。
[0015]作為優(yōu)選,所述的空間數(shù)據(jù)訪問規(guī)律統(tǒng)計信息空間坐標(biāo)范圍、空間數(shù)據(jù)塊數(shù)量參數(shù)通過系統(tǒng)計算自動獲取;聚類梯度計算參數(shù)、聚類區(qū)域提取擴散半徑、聚類區(qū)域內(nèi)點云差數(shù)量通過配置參數(shù)設(shè)置。
[0016]本發(fā)明的系統(tǒng)所采用的技術(shù)方案是:一種空間數(shù)據(jù)訪問規(guī)律動態(tài)統(tǒng)計及信息壓縮的系統(tǒng),其特征在于,包括:空間數(shù)據(jù)訪問規(guī)律統(tǒng)計信息表達(dá)單元、空間數(shù)據(jù)訪問規(guī)律統(tǒng)計信息聚類計算單元、空間數(shù)據(jù)訪問規(guī)律統(tǒng)計信息區(qū)域提取單元和空間數(shù)據(jù)訪問規(guī)律統(tǒng)計信息聚類壓縮單元;
[0017]所述的空間數(shù)據(jù)訪問規(guī)律統(tǒng)計信息表達(dá)單元用于將空間數(shù)據(jù)訪問規(guī)律信息按照每塊瓦片數(shù)據(jù)的空間位置及其被訪問下載次數(shù),形成空間數(shù)據(jù)訪問規(guī)律統(tǒng)計信息點云表達(dá);
[0018]所述的空間數(shù)據(jù)訪問規(guī)律統(tǒng)計信息聚類計算單元用于根據(jù)獲取的聚類計算半徑參數(shù)計算空間數(shù)據(jù)訪問規(guī)律統(tǒng)計信息點云聚類梯度,剔除偶發(fā)性的離散訪問點云,保留有效特征訪問點云,減少空間數(shù)據(jù)訪問規(guī)律統(tǒng)計信息基量;[0019]所述的空間數(shù)據(jù)訪問規(guī)律統(tǒng)計信息區(qū)域提取單元用于根據(jù)獲取的聚類區(qū)域提取擴散半徑、聚類區(qū)域內(nèi)點云差數(shù)量參數(shù)計算聚類內(nèi)點云歐式距離,將特征訪問點云進行聚類分組,形成聚類點云集,達(dá)到對空間數(shù)據(jù)訪問規(guī)律統(tǒng)計信息進行聚類區(qū)域劃分和提?。?br>
[0020]所述的空間數(shù)據(jù)訪問規(guī)律統(tǒng)計信息聚類壓縮單元用于對提取的每個聚類點云集區(qū)域,按照點云差數(shù)和訪問次數(shù)的點云序列用I個字節(jié)編碼形成最終壓縮統(tǒng)計數(shù)據(jù)輸出。
[0021]作為優(yōu)選,所述的空間數(shù)據(jù)訪問規(guī)律統(tǒng)計信息表達(dá)單元包括空間參數(shù)獲取模塊、點云表達(dá)調(diào)節(jié)因子計算模塊和空間點云輸出模塊;
[0022]所述的空間參數(shù)獲取模塊用于獲取空間數(shù)據(jù)訪問規(guī)律統(tǒng)計信息空間坐標(biāo)范圍、空間數(shù)據(jù)塊數(shù)量、空間數(shù)據(jù)被訪問或下載最大次數(shù)參數(shù);
[0023]所述的點云表達(dá)調(diào)節(jié)因子計算模塊用于計算空間數(shù)據(jù)訪問規(guī)律統(tǒng)計信息中空間數(shù)據(jù)點云輸出調(diào)節(jié)因子;
[0024]所述的空間點云輸出模塊用于根據(jù)空間數(shù)據(jù)位置和調(diào)節(jié)因子輸出將空間數(shù)據(jù)訪問規(guī)律輸出成空間點云。
[0025]作為優(yōu)選,所述的空間數(shù)據(jù)訪問規(guī)律統(tǒng)計信息聚類計算單元包括:聚類梯度計算參數(shù)輸入模塊和聚類梯度計算模塊;
[0026]所述的聚類梯度計算參數(shù)輸入模塊用于控制聚類計算半徑;
[0027]所述的聚類梯度計算模塊用于區(qū)域內(nèi)聚類梯度計算。
[0028]作為優(yōu)選,所述的空間數(shù)據(jù)訪問規(guī)律統(tǒng)計信息區(qū)域提取單元包括聚類區(qū)域提取參數(shù)輸入模塊和聚類區(qū)域提取模塊;
[0029]所述的聚類區(qū)域提取參數(shù)輸入模塊用于限制聚類區(qū)域提取擴散半徑、限制聚類區(qū)域內(nèi)點云差數(shù)量;
[0030]所述的聚類區(qū)域提取模塊用于提取聚類區(qū)域。
[0031]作為優(yōu)選,所述的空間數(shù)據(jù)訪問規(guī)律統(tǒng)計信息聚類壓縮單元包括聚類區(qū)域點云差計算模塊、點云序列組織模塊和點云序列游程編碼壓縮模塊;
[0032]所述的聚類區(qū)域點云差計算模塊用于計算聚類區(qū)域內(nèi)點云差;
[0033]所述的點云序列組織模塊用于將聚類區(qū)域按照坐標(biāo)順序和點云差數(shù)量依序組織;
[0034]所述的點云序列游程編碼壓縮模塊用于按照游程編碼規(guī)則,將按序組織的點云序列進行編碼壓縮。
[0035]本發(fā)明具有的有益效果是:空間數(shù)據(jù)訪問規(guī)律統(tǒng)計信息存在由于用戶興趣、地區(qū)熱點等引發(fā)的用戶訪問特征行為,也存在用戶隨意訪問等偶發(fā)性行為;針對用戶特征訪問行為,其對應(yīng)空間數(shù)據(jù)瓦片被再次訪問的可能性大,而對偶發(fā)性訪問行為,其行為準(zhǔn)則難以判斷,對應(yīng)瓦片被再次訪問的可能性不可預(yù)測;本發(fā)明能在空間數(shù)據(jù)訪問規(guī)律統(tǒng)計信息中,剔除偶發(fā)性訪問形成的統(tǒng)計信息,并對點云數(shù)據(jù)根據(jù)歐式距離形成聚類集后壓縮編碼,形成最終統(tǒng)計信息輸出,大大減少實際需要傳輸分發(fā)的空間數(shù)據(jù)訪問規(guī)律統(tǒng)計信息總量;解決了由于海量空間數(shù)據(jù)訪問規(guī)律統(tǒng)計信息傳輸帶來的不可承載的網(wǎng)絡(luò)流量問題,能實時動態(tài)跟蹤空間數(shù)據(jù)訪問全局分布規(guī)律,大大改善空間數(shù)據(jù)系統(tǒng)公眾服務(wù)能力。
【專利附圖】
【附圖說明】[0036]附圖1:是本發(fā)明的方法流程圖。
[0037]附圖2:是本發(fā)明實施例中系統(tǒng)的結(jié)構(gòu)示意圖。
[0038]附圖3:是本發(fā)明實施例中空間數(shù)據(jù)訪問規(guī)律統(tǒng)計信息表達(dá)單元的功能模塊圖。
[0039]附圖4:是本發(fā)明實施例中空間數(shù)據(jù)訪問規(guī)律統(tǒng)計信息聚類計算單元的功能模塊圖。
[0040]附圖5:是本發(fā)明實施例中空間數(shù)據(jù)訪問規(guī)律統(tǒng)計信息區(qū)域提取單元的功能模塊圖。
[0041]附圖6:是本發(fā)明實施例中空間數(shù)據(jù)訪問規(guī)律統(tǒng)計信息聚類壓縮單元的功能模塊圖。
【具體實施方式】
[0042]以下結(jié)合附圖和【具體實施方式】對本發(fā)明做進一步的闡述,本實施例主要以地理信息系統(tǒng)作為載體進行具體說明。
[0043]針對空間數(shù)據(jù)訪問分布規(guī)律,微軟研究院通過Hotmap模型得到數(shù)字地球系統(tǒng)中的影像瓦片請求符合冪律(Power-1aw)訪問分布,但這種局部、靜態(tài)的訪問分布規(guī)律,不能真正實時、動態(tài)的反映訪問分布規(guī)律的全局信息,從而制約了系統(tǒng)服務(wù)能力的提高。一方面,由于存在地形區(qū)域的差異(海洋、沙漠、城市)、時事熱點的差異(海灣戰(zhàn)爭、朝韓沖突、臺海問題)等,針對空間數(shù)據(jù)的訪問是高度分布不均的,而且國際時事風(fēng)云變幻,熱點區(qū)域經(jīng)常轉(zhuǎn)移,導(dǎo)致空間數(shù)據(jù)的訪問規(guī)律也動態(tài)變化;另一方面,分布式空間信息服務(wù)環(huán)境下的異構(gòu)服務(wù)器也存在更新替換、性能老化,導(dǎo)致這種分布不均和設(shè)備性能差異(處理能力的差異(內(nèi)存、CPU)、存儲能力的差異(存儲聚合速度、存儲容量、容錯能力)、有效傳輸帶寬的差異)是經(jīng)常變化的;因此需要對這些要素信息進行動態(tài)統(tǒng)計和分發(fā),以便跟蹤這些變化,及時調(diào)整地形數(shù)據(jù)的存儲組織策略和預(yù)取、緩存策略。
[0044]通過簡單的同步、復(fù)制機制進行異構(gòu)服務(wù)器的全局、動態(tài)統(tǒng)計和獲取空間數(shù)據(jù)訪問分布規(guī)律,將帶來的不可承載的網(wǎng)絡(luò)流量。以SRTM90地形數(shù)據(jù)為例,共3538890塊瓦片,若每個字節(jié)表示一個瓦片的訪問次數(shù),則每個字節(jié)可以代表最大255次訪問,可以計算,當(dāng)服務(wù)器數(shù)量達(dá)到1000個時,一次統(tǒng)計分發(fā),由于沒有信息壓縮,每個服務(wù)器產(chǎn)生的數(shù)據(jù)都將分發(fā)999次,總共將分發(fā)3292.55GB的總數(shù)據(jù)量,通過這種方式實時、動態(tài)統(tǒng)計將持續(xù)產(chǎn)生大量的統(tǒng)計流量,從而擠占用戶服務(wù)帶寬,影響服務(wù)體驗。因此,如何有效的減少空間數(shù)據(jù)訪問規(guī)律動態(tài)統(tǒng)計信息總量成為關(guān)鍵。
[0045]請見圖1、圖2、圖4、圖5和圖6,本發(fā)明的方法所采用的技術(shù)方案是:一種空間數(shù)據(jù)訪問規(guī)律動態(tài)統(tǒng)計及信息壓縮的方法,包括以下步驟:
[0046]步驟1:空間數(shù)據(jù)訪問規(guī)律統(tǒng)計信息點云輸出:將空間數(shù)據(jù)訪問規(guī)律信息按照每塊瓦片數(shù)據(jù)的空間位置及其被訪問下載次數(shù),形成空間數(shù)據(jù)訪問規(guī)律統(tǒng)計信息點云輸出;
[0047]步驟2:空間數(shù)據(jù)訪問規(guī)律統(tǒng)計信息聚類計算:根據(jù)獲取的聚類計算半徑參數(shù)計算空間數(shù)據(jù)訪問規(guī)律統(tǒng)計信息點云聚類梯度,根據(jù)計算得到的聚類梯度剔除偶發(fā)性的離散訪問點云,保留有效特征訪問點云,減少空間數(shù)據(jù)訪問規(guī)律統(tǒng)計信息基量;
[0048]步驟3:空間數(shù)據(jù)訪問規(guī)律統(tǒng)計信息區(qū)域提取:根據(jù)獲取的聚類區(qū)域提取擴散半徑、聚類區(qū)域內(nèi)點云差數(shù)量參數(shù)計算聚類內(nèi)點云歐式距離,將特征訪問點云進行聚類分組,形成聚類點云集,對空間數(shù)據(jù)訪問規(guī)律統(tǒng)計信息進行聚類區(qū)域劃分和分類提??;
[0049]步驟4:空間數(shù)據(jù)訪問規(guī)律統(tǒng)計信息聚類壓縮:根據(jù)每個聚類點云集區(qū)域,計算聚類區(qū)域內(nèi)點云差,按照點云差數(shù)和訪問次數(shù)的點云序列用I個字節(jié)編碼形成最終壓縮統(tǒng)計數(shù)據(jù)輸出。
[0050]其中,空間數(shù)據(jù)按照金子塔瓦片的形式存儲,每塊瓦片的被訪問次數(shù)為空間數(shù)據(jù)訪問規(guī)律統(tǒng)計信息;空間數(shù)據(jù)訪問規(guī)律統(tǒng)計信息包括空間數(shù)據(jù)的位置坐標(biāo)和訪問次數(shù);空間數(shù)據(jù)訪問規(guī)律統(tǒng)計信息空間坐標(biāo)范圍、空間數(shù)據(jù)塊數(shù)量參數(shù)通過系統(tǒng)計算自動獲取;聚類梯度計算參數(shù)、聚類區(qū)域提取擴散半徑、聚類區(qū)域內(nèi)點云差數(shù)量通過配置參數(shù)設(shè)置。
[0051]請見圖2、本發(fā)明的系統(tǒng)所采用的技術(shù)方案是:一種空間數(shù)據(jù)訪問規(guī)律動態(tài)統(tǒng)計及信息壓縮的系統(tǒng),包括:空間數(shù)據(jù)訪問規(guī)律統(tǒng)計信息表達(dá)單元100、空間數(shù)據(jù)訪問規(guī)律統(tǒng)計信息聚類計算單元200、空間數(shù)據(jù)訪問規(guī)律統(tǒng)計信息區(qū)域提取單元300和空間數(shù)據(jù)訪問規(guī)律統(tǒng)計信息聚類壓縮單元400 ;空間數(shù)據(jù)訪問規(guī)律統(tǒng)計信息表達(dá)單元100用于將空間數(shù)據(jù)訪問規(guī)律信息按照每塊瓦片數(shù)據(jù)的空間位置及其被訪問下載次數(shù),形成空間數(shù)據(jù)訪問規(guī)律統(tǒng)計信息點云表達(dá);空間數(shù)據(jù)訪問規(guī)律統(tǒng)計信息聚類計算單元200用于根據(jù)獲取的聚類計算半徑參數(shù)計算空間數(shù)據(jù)訪問規(guī)律統(tǒng)計信息點云聚類梯度,剔除偶發(fā)性的離散訪問點云,保留有效特征訪問點云,減少空間數(shù)據(jù)訪問規(guī)律統(tǒng)計信息基量;空間數(shù)據(jù)訪問規(guī)律統(tǒng)計信息區(qū)域提取單元300用于根據(jù)獲取的聚類區(qū)域提取擴散半徑、聚類區(qū)域內(nèi)點云差數(shù)量參數(shù)計算聚類內(nèi)點云歐式距離,將特征訪問點云進行聚類分組,形成聚類點云集,達(dá)到對空間數(shù)據(jù)訪問規(guī)律統(tǒng)計信息進行聚類區(qū)域劃分和提?。豢臻g數(shù)據(jù)訪問規(guī)律統(tǒng)計信息聚類壓縮單元400用于對提取的每個聚類點云集區(qū)域,按照點云差數(shù)和訪問次數(shù)的點云序列用I個字節(jié)編碼形成最終壓縮統(tǒng)計數(shù)據(jù)輸出。
[0052]空間數(shù)據(jù)訪問規(guī)律統(tǒng)計信息表達(dá)單元100包括空間參數(shù)獲取模塊101、點云表達(dá)調(diào)節(jié)因子計算模塊102和空間點云輸出模塊103 ;空間參數(shù)獲取模塊101用于獲取空間數(shù)據(jù)訪問規(guī)律統(tǒng)計信息空間坐標(biāo)范圍、空間數(shù)據(jù)塊數(shù)量、空間數(shù)據(jù)被訪問或下載最大次數(shù)參數(shù);點云表達(dá)調(diào)節(jié)因子計算模塊102用于計算空間數(shù)據(jù)訪問規(guī)律統(tǒng)計信息中空間數(shù)據(jù)點云輸出調(diào)節(jié)因子;
[0053]空間點云輸出模塊103用于根據(jù)空間數(shù)據(jù)位置和調(diào)節(jié)因子輸出將空間數(shù)據(jù)訪問規(guī)律輸出成空間點云。
[0054]其中,空間數(shù)據(jù)訪問規(guī)律統(tǒng)計信息聚類計算單元200包括:聚類梯度計算參數(shù)輸入模塊201和聚類梯度計算模塊202 ;聚類梯度計算參數(shù)輸入模塊201用于控制聚類計算半徑;聚類梯度計算模塊202用于區(qū)域內(nèi)聚類梯度計算。空間數(shù)據(jù)訪問規(guī)律統(tǒng)計信息區(qū)域提取單元300包括聚類區(qū)域提取參數(shù)輸入模塊301和聚類區(qū)域提取模塊302 ;聚類區(qū)域提取參數(shù)輸入模塊301用于限制聚類區(qū)域提取擴散半徑、限制聚類區(qū)域內(nèi)點云差數(shù)量;聚類區(qū)域提取模塊302用于提取聚類區(qū)域。空間數(shù)據(jù)訪問規(guī)律統(tǒng)計信息聚類壓縮單元400包括聚類區(qū)域點云差計算模塊401、點云序列組織模塊402和點云序列游程編碼壓縮模塊403 ;聚類區(qū)域點云差計算模塊401用于計算聚類區(qū)域內(nèi)點云差;點云序列組織模塊402用于將聚類區(qū)域按照坐標(biāo)順序和點云差數(shù)量依序組織;點云序列游程編碼壓縮模塊403用于按照游程編碼規(guī)則,將按序組織的點云序列進行編碼壓縮。
[0055]本系統(tǒng)實際工作時的具體流程為:[0056](I)空間數(shù)據(jù)訪問規(guī)律統(tǒng)計信息點云輸出:通過所述空間數(shù)據(jù)訪問規(guī)律統(tǒng)計信息表達(dá)單元100將空間數(shù)據(jù)訪問規(guī)律信息按照每塊瓦片數(shù)據(jù)的空間位置及其被訪問下載次數(shù),形成空間數(shù)據(jù)訪問規(guī)律統(tǒng)計信息點云輸出;在這一過程,包括以下方面:
[0057]①利用所述的空間參數(shù)獲取模塊101獲取空間數(shù)據(jù)訪問規(guī)律統(tǒng)計信息空間坐標(biāo)范圍、空間數(shù)據(jù)塊數(shù)量、空間數(shù)據(jù)被訪問或下載最大次數(shù)參數(shù);
[0058]空間數(shù)據(jù)訪問規(guī)律統(tǒng)計信息的空間坐標(biāo)范圍根據(jù)所有統(tǒng)計的空間數(shù)據(jù)坐標(biāo),分別選擇最大坐標(biāo)和最小坐標(biāo)作為空間坐標(biāo)范圍;
[0059]空間數(shù)據(jù)塊數(shù)量N依據(jù)空間坐標(biāo)范圍計算面積可得,即連續(xù)空間坐標(biāo)范圍內(nèi),每個點代表一塊空間數(shù)據(jù);
[0060]空間數(shù)據(jù)被訪問或下載最大次數(shù)參數(shù)只需要依次獲取每塊空間數(shù)據(jù)塊i的被訪問或下載次數(shù)ki,取最大值即可。
[0061]②利用所述的點云表達(dá)調(diào)節(jié)因子計算模塊102計算空間數(shù)據(jù)訪問規(guī)律統(tǒng)計信息中空間數(shù)據(jù)點云輸出調(diào)節(jié)因子;
[0062]若空間瓦片總個數(shù)為N,每個瓦片的訪問次數(shù)分別為L則調(diào)節(jié)因子α要求滿足式(I)限制;
[0063]a ≤ 255-max(kj), i=l, 2, — ,N (I)
[0064]其中255表示最大訪問次數(shù)必須不大于255,對于大于255的空間數(shù)據(jù),通過拆分成多份數(shù)據(jù)進行壓縮處理,最大訪問次數(shù)必須小于255的限制,是為了滿足后續(xù)處理中游程編碼運算效率要求。
[0065]③利用所述的空間點云輸出模塊103將空間數(shù)據(jù)訪問規(guī)律信息根據(jù)空間數(shù)據(jù)位置和調(diào)節(jié)因子輸出成空間點云;
[0066]首先將地理信息系統(tǒng)的每個瓦片看成一個點,所有瓦片形成一個空間連續(xù)點集,沒有被訪問的空間瓦片稱為“虛點”,被訪問的瓦片稱“實點”;
[0067]同時,“虛點”以顏色RGB (255,255,255)表示,實點i根據(jù)其訪次數(shù),分別按照顏色RGB (ki+α,0,0)表示,其中ki為空間數(shù)據(jù)實點i被訪問或下載次數(shù),最大不超過255次;
[0068]最后,按照“虛點”、“實點”的相對坐標(biāo),將空間數(shù)據(jù)訪問映射成空間點云,其中“實點”代表被訪問的瓦片,點云顏色深淺表示被訪問的次數(shù)。
[0069](2)空間數(shù)據(jù)訪問規(guī)律統(tǒng)計信息聚類計算:通過所述空間數(shù)據(jù)訪問規(guī)律統(tǒng)計信息聚類計算單元200,根據(jù)獲取的聚類計算半徑參數(shù)計算空間數(shù)據(jù)訪問規(guī)律統(tǒng)計信息點云聚類梯度,根據(jù)計算得到的聚類梯度剔除偶發(fā)性的離散訪問點云,保留有效特征訪問點云,減
少空間數(shù)據(jù)訪問規(guī)律統(tǒng)計信息基量;在這一過程,包括以下方面:
[0070]①利用所述的聚類梯度計算參數(shù)輸入模塊201獲取用于控制聚類計算半徑參數(shù);
[0071]控制聚類計算半徑參數(shù)r和空間訪問聚類梯度閥值T通過配置管理輸入。
[0072]②利用所述的聚類梯度計算模塊202進行區(qū)域內(nèi)聚類梯度計算;
[0073]考察一段時間t,設(shè)某瓦片“實點”Pi的訪問次數(shù)為ki;以Pi為中心,邊長r的區(qū)域內(nèi),其ni個鄰居“實點”瓦片p' i;J(j=l, 2,..., Iii)的訪問次數(shù)分別為k'
訪問聚類梯度表示某“實點”瓦片被訪問的聚集程度,聚集程度越低,是偶發(fā)性訪問的可能性越大,定義瓦片Pi的訪問聚類梯度為T(Pi),則有:
【權(quán)利要求】
1.一種空間數(shù)據(jù)訪問規(guī)律動態(tài)統(tǒng)計及信息壓縮的方法,其特征在于,包括以下步驟: 步驟1:空間數(shù)據(jù)訪問規(guī)律統(tǒng)計信息點云輸出:將空間數(shù)據(jù)訪問規(guī)律信息按照每塊瓦片數(shù)據(jù)的空間位置及其被訪問下載次數(shù),形成空間數(shù)據(jù)訪問規(guī)律統(tǒng)計信息點云輸出; 步驟2:空間數(shù)據(jù)訪問規(guī)律統(tǒng)計信息聚類計算:根據(jù)獲取的聚類計算半徑參數(shù)計算空間數(shù)據(jù)訪問規(guī)律統(tǒng)計信息點云聚類梯度,根據(jù)計算得到的聚類梯度剔除偶發(fā)性的離散訪問點云,保留有效特征訪問點云,減少空間數(shù)據(jù)訪問規(guī)律統(tǒng)計信息基量; 步驟3:空間數(shù)據(jù)訪問規(guī)律統(tǒng)計信息區(qū)域提取:根據(jù)獲取的聚類區(qū)域提取擴散半徑、聚類區(qū)域內(nèi)點云差數(shù)量參數(shù)計算聚類內(nèi)點云歐式距離,將特征訪問點云進行聚類分組,形成聚類點云集,對空間數(shù)據(jù)訪問規(guī)律統(tǒng)計信息進行聚類區(qū)域劃分和分類提??; 步驟4:空間數(shù)據(jù)訪問規(guī)律統(tǒng)計信息聚類壓縮:根據(jù)每個聚類點云集區(qū)域,計算聚類區(qū)域內(nèi)點云差,按照點云差數(shù)和訪問次數(shù)的點云序列用I個字節(jié)編碼形成最終壓縮統(tǒng)計數(shù)據(jù)輸出。
2.根據(jù)權(quán)利要求1所述的空間數(shù)據(jù)訪問規(guī)律動態(tài)統(tǒng)計及信息壓縮的方法,其特征在于:所述的空間數(shù)據(jù)按照金子塔瓦片的形式存儲,每塊瓦片的被訪問次數(shù)為空間數(shù)據(jù)訪問規(guī)律統(tǒng)計信息;空間數(shù)據(jù)訪問規(guī)律統(tǒng)計信息包括空間數(shù)據(jù)的位置坐標(biāo)和訪問次數(shù)。
3.根據(jù)權(quán)利要求1所述的空間數(shù)據(jù)訪問規(guī)律動態(tài)統(tǒng)計及信息壓縮的方法,其特征在于:所述的空間數(shù)據(jù)訪問規(guī)律統(tǒng)計信息空間坐標(biāo)范圍、空間數(shù)據(jù)塊數(shù)量參數(shù)通過系統(tǒng)計算自動獲??;聚類梯度計算參數(shù)、聚類區(qū)域提取擴散半徑、聚類區(qū)域內(nèi)點云差數(shù)量通過配置參數(shù)設(shè)置。
4.一種空間數(shù)據(jù)訪問規(guī)律動態(tài)統(tǒng)計及信息壓縮的系統(tǒng),其特征在于,包括:空間數(shù)據(jù)訪問規(guī)律統(tǒng)計信息表達(dá)單元(100)、空間數(shù)據(jù)訪問規(guī)律統(tǒng)計信息聚類計算單元(200)、空間數(shù)據(jù)訪問規(guī)律統(tǒng)計信息區(qū)域提取單元(300)和空間數(shù)據(jù)訪問規(guī)律統(tǒng)計信息聚類壓縮單元(400); 所述的空間數(shù)據(jù)訪問規(guī)律統(tǒng)計信息表達(dá)單元(100)用于將空間數(shù)據(jù)訪問規(guī)律信息按照每塊瓦片數(shù)據(jù)的空間位置及其被訪問下載次數(shù),形成空間數(shù)據(jù)訪問規(guī)律統(tǒng)計信息點云表達(dá); 所述的空間數(shù)據(jù)訪問規(guī)律統(tǒng)計信息聚類計算單元(200)用于根據(jù)獲取的聚類計算半徑參數(shù)計算空間數(shù)據(jù)訪問規(guī)律統(tǒng)計信息點云聚類梯度,剔除偶發(fā)性的離散訪問點云,保留有效特征訪問點云,減少空間數(shù)據(jù)訪問規(guī)律統(tǒng)計信息基量; 所述的空間數(shù)據(jù)訪問規(guī)律統(tǒng)計信息區(qū)域提取單元(300)用于根據(jù)獲取的聚類區(qū)域提取擴散半徑、聚類區(qū)域內(nèi)點云差數(shù)量參數(shù)計算聚類內(nèi)點云歐式距離,將特征訪問點云進行聚類分組,形成聚類點云集,達(dá)到對空間數(shù)據(jù)訪問規(guī)律統(tǒng)計信息進行聚類區(qū)域劃分和提??; 所述的空間數(shù)據(jù)訪問規(guī)律統(tǒng)計信息聚類壓縮單元(400)用于對提取的每個聚類點云集區(qū)域,按照點云差數(shù)和訪問次數(shù)的點云序列用I個字節(jié)編碼形成最終壓縮統(tǒng)計數(shù)據(jù)輸出。
5.根據(jù)權(quán)利要求4所述的空間數(shù)據(jù)訪問規(guī)律動態(tài)統(tǒng)計及信息壓縮的系統(tǒng),其特征在于:所述的空間數(shù)據(jù)訪問規(guī)律統(tǒng)計信息表達(dá)單元(100)包括空間參數(shù)獲取模塊(101)、點云表達(dá)調(diào)節(jié)因子計算模塊(102)和空間點云輸出模塊(103); 所述的空間參數(shù)獲取模塊(101)用于獲取空間數(shù)據(jù)訪問規(guī)律統(tǒng)計信息空間坐標(biāo)范圍、空間數(shù)據(jù)塊數(shù)量、空間數(shù)據(jù)被訪問或下載最大次數(shù)參數(shù);所述的點云表達(dá)調(diào)節(jié)因子計算模塊(102)用于計算空間數(shù)據(jù)訪問規(guī)律統(tǒng)計信息中空間數(shù)據(jù)點云輸出調(diào)節(jié)因子; 所述的空間點云輸出模塊(103)用于根據(jù)空間數(shù)據(jù)位置和調(diào)節(jié)因子輸出將空間數(shù)據(jù)訪問規(guī)律輸出成空間點云。
6.根據(jù)權(quán)利要求4所述的空間數(shù)據(jù)訪問規(guī)律動態(tài)統(tǒng)計及信息壓縮的系統(tǒng),其特征在于:所述的空間數(shù)據(jù)訪問規(guī)律統(tǒng)計信息聚類計算單元(200)包括:聚類梯度計算參數(shù)輸入模塊(201)和聚類梯度計算模塊(202); 所述的聚類梯度計算參數(shù)輸入模塊(201)用于控制聚類計算半徑; 所述的聚類梯度計算模塊(202 )用于區(qū)域內(nèi)聚類梯度計算。
7.根據(jù)權(quán)利要求4所述的空間數(shù)據(jù)訪問規(guī)律動態(tài)統(tǒng)計及信息壓縮的系統(tǒng),其特征在于:所述的空間數(shù)據(jù)訪問規(guī)律統(tǒng)計信息區(qū)域提取單元(300)包括聚類區(qū)域提取參數(shù)輸入模塊(301)和聚類區(qū)域提取模塊(302); 所述的聚類區(qū)域提取參數(shù)輸入模塊(301)用于限制聚類區(qū)域提取擴散半徑、限制聚類區(qū)域內(nèi)點云差數(shù)量; 所述的聚類區(qū)域提取模塊(302)用于提取聚類區(qū)域。
8.根據(jù)權(quán)利要求4所述的空間數(shù)據(jù)訪問規(guī)律動態(tài)統(tǒng)計及信息壓縮的系統(tǒng),其特征在于:所述的空間數(shù)據(jù)訪問規(guī)律統(tǒng)計信息聚類壓縮單元(400)包括聚類區(qū)域點云差計算模塊(401)、點云序列組織模塊(402)和點云序列游程編碼壓縮模塊(403); 所述的聚類區(qū)域點云差計算 模塊(401)用于計算聚類區(qū)域內(nèi)點云差; 所述的點云序列組織模塊(402)用于將聚類區(qū)域按照坐標(biāo)順序和點云差數(shù)量依序組織; 所述的點云序列游程編碼壓縮模塊(403)用于按照游程編碼規(guī)則,將按序組織的點云序列進行編碼壓縮。
【文檔編號】H04L12/24GK103458032SQ201310396525
【公開日】2013年12月18日 申請日期:2013年9月3日 優(yōu)先權(quán)日:2013年9月3日
【發(fā)明者】潘少明, 李紅, 湯戈 申請人:武漢大學(xué)