本發(fā)明涉及一種信息分析方法,尤其是涉及一種一種基于信息內(nèi)涵度的數(shù)據(jù)分析及預(yù)警方法。
背景技術(shù):
通信信息的研究起步較早,上世紀(jì)中葉香農(nóng)提出的信息理論,提供給通信領(lǐng)域一個(gè)較為完整的信息概念,也為通信奠定了理論基礎(chǔ)。
香農(nóng)首先指出信息是可度量的,并給出了信息量的明確定義。他認(rèn)為信息量H與消息出現(xiàn)的概率p(x)的關(guān)系應(yīng)反映如下規(guī)律:
H=loga[1/p(x)]=-loga p(x) a=2,H單位為比特
這一理論揭示了信息的屬性定義,并且明確了信息可度量的先見,在其通信模型學(xué)說(shuō)中,又提到信息通常可利用電信信號(hào)傳輸,當(dāng)p(x)=1/4時(shí),I=2bit,需用2位二進(jìn)制脈沖傳送??梢姰?dāng)消息的信息量用比特表示時(shí),可以用最少二進(jìn)制脈沖數(shù)來(lái)表示。在此,信息就轉(zhuǎn)換成電信號(hào)的比特流了。信息的采集、傳輸、處理、存儲(chǔ)、加工、顯示,即通信系統(tǒng)的工作過程。
在香農(nóng)提出的通信理論的第二定理中,C=B·log2(1+S/N),其中C為信道容量,B為帶寬,S/N為信噪比。
由此得出:當(dāng)信道的信息傳輸率小于信道容量時(shí),采用合適的信道編碼方法可以實(shí)現(xiàn)任意高的傳輸可靠性(或誤差率接近0),反之也然;若在信道容量一定的條件下,要增加通信帶寬,則必須減少信噪強(qiáng)度,反之也然。
香農(nóng)提出的通信系統(tǒng)模型,如附圖1,明確定義了從信源到信宿的模塊功能及系統(tǒng)組成,成為通信理論的經(jīng)典學(xué)說(shuō)和基礎(chǔ)知識(shí)。然而隨著現(xiàn)代信息數(shù)據(jù)爆炸式的增長(zhǎng),相應(yīng)的模塊功能內(nèi)涵也有了極大變化。從早先點(diǎn)對(duì)點(diǎn)的通信模式,已演進(jìn)為單點(diǎn)對(duì)多點(diǎn),多點(diǎn)(群)對(duì)多點(diǎn)(群),多點(diǎn)對(duì)單點(diǎn)的信息交互模式;信源和信宿也已發(fā)展成為全雙工的兼有收發(fā)功能或含原單工的單元模塊;從通信量有限的單信道的傳輸已變成為網(wǎng)絡(luò)交換的海量信息傳遞交互。現(xiàn)代信息通信的理論研究已經(jīng)落后于時(shí)代的狀況和社會(huì)的需求,尤其是信息內(nèi)涵及度量成為了大數(shù)據(jù)通信應(yīng)用的主要瓶頸,多媒體通信、移動(dòng)互動(dòng)應(yīng)用、社交平臺(tái)、位置服務(wù)等新型應(yīng)用的推進(jìn),使信息內(nèi)涵確定、預(yù)知信息發(fā)生可能趨勢(shì),以及使用信息內(nèi)涵進(jìn)行分析、預(yù)測(cè)、預(yù)警等成為需要解決的問題。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明的目的就是為了克服上述現(xiàn)有技術(shù)存在的缺陷而提供一種能夠從海量信息中提取事物特征的基于信息內(nèi)涵度的數(shù)據(jù)分析及預(yù)警方法。
本發(fā)明的目的可以通過以下技術(shù)方案來(lái)實(shí)現(xiàn):
一種基于信息內(nèi)涵度的數(shù)據(jù)分析方法,包括以下步驟:
S1,采集一段時(shí)間內(nèi)的信息數(shù)據(jù),所述的信息數(shù)據(jù)為待分析事物的信源點(diǎn)在不同時(shí)間點(diǎn)依次發(fā)送的數(shù)據(jù)。
S2,對(duì)信息數(shù)據(jù)進(jìn)行處理、存儲(chǔ),并計(jì)算每個(gè)信息數(shù)據(jù)的信息內(nèi)涵度,對(duì)于某信息數(shù)據(jù),其信息內(nèi)涵度計(jì)算式為:
其中,I為信息內(nèi)涵度,m為信息數(shù)據(jù)的信息量,單位為bit,t為采集本信息數(shù)據(jù)到采集下個(gè)信息數(shù)據(jù)之間的時(shí)間間隔,單位為s(秒),μ為信息安全因子,p為事物信息的出現(xiàn)概率;
上述計(jì)算式理論依據(jù)包括以下:
1)基于信息是被反映的物質(zhì)屬性原理以及事物信息可用最小單位bit表述,而事物的消息m(massage)是由許多bit組成,由此顯見,m隨bit的增加而增大,即m與bit成正比關(guān)系。
2)事物的信息I(information)是由許多事物消息m而形成,當(dāng)m增加,則I也會(huì)增加,即I與m成正比關(guān)系。
3)由香農(nóng)理論可知,事物的信息與其發(fā)生的概率為反向關(guān)系,即發(fā)生概率越小的事件,一當(dāng)真正發(fā)生,其信息量是非常巨大,即信息I與其事件發(fā)生的概率p成反比關(guān)系。
4)由信息論學(xué)說(shuō)可知,事物的信息更新周期越快(時(shí)間t越短),即此事物的信息量則越大,反之則越小,故推導(dǎo)出I與t成反比。
5)事物的(若干或許多)消息只有安全地被信宿所接收和存儲(chǔ),才能更全面地表述該事物的屬性,由此產(chǎn)生出事物信息的安全因子μ,信息安全因子越高,事物信息越全,即演繹出事物信息I與μ成正比關(guān)系。
由上述多維度考慮和結(jié)合,從而設(shè)計(jì)推導(dǎo)出,信息內(nèi)涵度量公式如上(1)。它能更加全面反映信息是客觀事物普遍屬性的表征。
S3,根據(jù)步驟S2的結(jié)果進(jìn)行數(shù)據(jù)統(tǒng)計(jì)分析,得到信息內(nèi)涵度I的統(tǒng)計(jì)趨勢(shì),作為信息數(shù)據(jù)所反映的事物特征。
所述的步驟S2中,所述的事物信息出現(xiàn)的概率p符合香農(nóng)信息理論:H=-log2 p。其中H為信息量。
所述的信息安全因子μ根據(jù)國(guó)際信息安全等級(jí)的規(guī)則確定。
一種基于信息內(nèi)涵度的預(yù)警方法,包括以下步驟:
S1,采集待分析事物的信源的當(dāng)前信息數(shù)據(jù),所述的信息數(shù)據(jù)為當(dāng)前一段時(shí)間內(nèi)不同時(shí)間點(diǎn)由信源依次發(fā)送的數(shù)據(jù);
S2,對(duì)信息數(shù)據(jù)進(jìn)行處理、存儲(chǔ),并計(jì)算每個(gè)信息數(shù)據(jù)的信息內(nèi)涵度,對(duì)于某個(gè)信息數(shù)據(jù),所述的信息內(nèi)涵度計(jì)算式為:
其中,I為信息內(nèi)涵度,m為數(shù)據(jù)的信息量,單位為bit,t為采集本數(shù)據(jù)到采集下個(gè)數(shù)據(jù)之間的時(shí)間間隔,單位為s(秒),μ為信息安全因子,p為信息出現(xiàn)概率;
S3,將步驟S2的結(jié)果與根據(jù)歷史信息數(shù)據(jù)得到的信息內(nèi)涵度統(tǒng)計(jì)趨勢(shì)進(jìn)行對(duì)比,若當(dāng)前一段時(shí)間內(nèi)的信息內(nèi)涵度變化趨勢(shì)與歷史數(shù)據(jù)信息差異超過設(shè)定范圍,一般前后兩次數(shù)據(jù)差異>20%時(shí),就認(rèn)為差異較大,發(fā)出預(yù)警。
所述的步驟S2中,所述的p符合香農(nóng)信息理論。
所述的信息安全因子μ根據(jù)國(guó)際信息安全等級(jí)的規(guī)則確定。
與現(xiàn)有技術(shù)相比,本發(fā)明具有以下優(yōu)點(diǎn):
(1)首次提出的信息歸集定義和表達(dá)式,即:信息是客觀事物普遍屬性的表征;信息是被反映的物質(zhì)屬性;信息出現(xiàn)的幾率越低,其信息內(nèi)涵值就越高;信息內(nèi)涵隨著信息的安全越高而增長(zhǎng)。其信息內(nèi)涵歸集表達(dá)式為:I::={Mc,Mt,Mq,Ms}。而Mc、Mt、Mq、Ms分別表示為信息的內(nèi)容、信息的傳遞對(duì)象、信息的幾率、信息的安全。由此歸集定義更能反映出信息多維度的特征。
(2)采用信息內(nèi)涵度計(jì)算結(jié)果及其統(tǒng)計(jì)分析得到的統(tǒng)計(jì)趨勢(shì),全面地表示了現(xiàn)代信息通信時(shí)代的信息內(nèi)涵特征,該特征考慮了信息量、出現(xiàn)概率等因素,準(zhǔn)確反映出事物的特征及變化規(guī)律,使信息具體化、數(shù)字化、可視化。
(3)對(duì)香農(nóng)信息理論中的信息量加以利用,具有良好的理論基礎(chǔ)。
(4)信息安全因子μ根據(jù)國(guó)際信息安全等級(jí)的規(guī)則確定,符合信息化時(shí)代數(shù)據(jù)安全的量定。
(5)首次提出的信息內(nèi)涵度量技術(shù),用數(shù)學(xué)語(yǔ)言簡(jiǎn)潔明了給出了信息內(nèi)涵值與信息量、出現(xiàn)幾率、出現(xiàn)時(shí)間及安全因子之間的關(guān)系,直觀、易用。
附圖說(shuō)明
圖1為香農(nóng)提出的通信系統(tǒng)模型;
圖2為本實(shí)施例1道路交通擁塞信息管理系統(tǒng)布置圖;
圖3為本實(shí)施例1道路交通擁塞信息管理系統(tǒng)A道區(qū)在8時(shí)前后數(shù)據(jù)趨勢(shì);
圖4為本實(shí)施例1道路交通擁塞信息管理系統(tǒng)A道區(qū)在14時(shí)前后數(shù)據(jù)趨勢(shì);
圖5為本實(shí)施例2山體及橋梁信息監(jiān)測(cè)報(bào)警系統(tǒng)布置圖;
圖6為本發(fā)明預(yù)警方法流程圖。
附圖標(biāo)記:1為數(shù)據(jù)采集器;2為圖像采集器;3為集中轉(zhuǎn)發(fā)器;4為山體;5為橋梁。
具體實(shí)施方式
下面結(jié)合附圖和具體實(shí)施例對(duì)本發(fā)明進(jìn)行詳細(xì)說(shuō)明。本實(shí)施例以本發(fā)明技術(shù)方案為前提進(jìn)行實(shí)施,給出了詳細(xì)的實(shí)施方式和具體的操作過程,但本發(fā)明的保護(hù)范圍不限于下述的實(shí)施例。
實(shí)施例1
如圖2所示,在道路交通擁塞信息管理系統(tǒng)中,設(shè)定在某一主要道路口四條道路上,各距道口50米范圍,每條路上在相隔10米處,安置線圈感應(yīng)傳感器,每當(dāng)車輛經(jīng)過這些傳感器時(shí),獲得電磁感應(yīng)信號(hào),表示通過的車輛數(shù),在一個(gè)傳感器上,車輛經(jīng)過的時(shí)間間隔越大,則車速越慢,反之亦然。此感應(yīng)信號(hào)通過網(wǎng)絡(luò)傳至交通管理中心,加以分析比較,進(jìn)行實(shí)時(shí)交通管理。
采用流程如圖6所示的預(yù)警方法,對(duì)道路交通擁塞進(jìn)行預(yù)警,包括以下步驟:
S1,采集信息數(shù)據(jù),信息數(shù)據(jù)為針對(duì)待分析事物依次采集的數(shù)據(jù),傳感器將經(jīng)過其的車輛信息數(shù)據(jù)經(jīng)網(wǎng)絡(luò)回傳至管理中心。
S2,對(duì)信息數(shù)據(jù)進(jìn)行處理、存儲(chǔ),并計(jì)算每個(gè)信息數(shù)據(jù)的信息內(nèi)涵度,對(duì)于收到的車輛信息數(shù)據(jù),由電腦通過信息內(nèi)涵度量公式做運(yùn)算,公式如下:
其中,I為信息內(nèi)涵度,m為數(shù)據(jù)的信息量,單位為bit,在此,每個(gè)傳感器回傳數(shù)據(jù)設(shè)定為500bit;t為采集本數(shù)據(jù)到采集下個(gè)數(shù)據(jù)之間的時(shí)間間隔,單位為秒s,在此設(shè)定兩個(gè)時(shí)段作為樣本信息分析運(yùn)算:7時(shí)到9時(shí)、13時(shí)到15時(shí);μ為信息安全因子,根據(jù)信息安全標(biāo)準(zhǔn)設(shè)置為C2級(jí),取值為3;p為信息的出現(xiàn)概率,根據(jù)交通擁塞業(yè)務(wù)特性為高幾率事件,p取0.8。由此得到運(yùn)算結(jié)果如下:
S2.1,A道區(qū)在8時(shí)前后,從各點(diǎn)傳感器傳出的信號(hào)時(shí)間間隔而得到對(duì)應(yīng)的In值分別為:31.25,20.83,15.63,12.50,10.42。In值趨小,車輛速度減慢,擁塞趨勢(shì)增加。數(shù)據(jù)趨勢(shì)如圖3所示,其中縱軸為In值,橫軸為信號(hào)回傳間隔(單位:秒)。
S2.2,A道區(qū)在14時(shí)前后,從各點(diǎn)傳感器傳出的信號(hào)時(shí)間間隔而得到對(duì)應(yīng)的In值分別為:20.83;25.00;31.25;37.50;46.88。In值趨大,車輛速度增加,路況趨勢(shì)正常。如圖4所示。
S2.3,此上為簡(jiǎn)單起見,均采集兩整點(diǎn)予以運(yùn)算分析。同理可得到8點(diǎn)(或14點(diǎn))前后十分鐘,二十分鐘,三十分鐘等等的相關(guān)In值。
S2.4,同樣,可獲得B道區(qū),C道區(qū),D道區(qū)的各In值,得知道路擁塞與否的情況。
S3,根據(jù)步驟S2的結(jié)果進(jìn)行數(shù)據(jù)統(tǒng)計(jì)分析,得到信息內(nèi)涵度I的統(tǒng)計(jì)趨勢(shì),作為信息數(shù)據(jù)所反映的事物特征。I值通過μ、p、t和m的四個(gè)維度考量,較全面反映事物特征;考慮事件出現(xiàn)的概率,這一特性更結(jié)合實(shí)際應(yīng)用的行業(yè)不同屬性。通過I趨勢(shì)值可判斷,及與歷史數(shù)據(jù)比較,可預(yù)知事件趨勢(shì)性方向。
S3.1,交通信息管理中心計(jì)算機(jī)通過長(zhǎng)期的存儲(chǔ)In值數(shù)據(jù)比較分析,得到相應(yīng)A道區(qū)的擁塞狀況統(tǒng)計(jì)規(guī)律,即7時(shí)到9時(shí)和下午16時(shí)到18時(shí)為擁塞嚴(yán)重時(shí)段。
S3.2,同樣,得到B,C和D道區(qū)的相應(yīng)數(shù)據(jù)統(tǒng)計(jì)規(guī)律。
S3.3,如將四個(gè)道區(qū)的歷史數(shù)據(jù)作比較,在同樣時(shí)段均為In值為低值,說(shuō)明整個(gè)區(qū)域交通擁塞情況嚴(yán)重;反之亦然。
由此可見,一個(gè)交通擁塞的社會(huì)現(xiàn)象,通過信息傳遞和運(yùn)算,變成一個(gè)數(shù)字現(xiàn)象;又經(jīng)過I數(shù)據(jù)庫(kù)的比較、分析,變成一個(gè)信息特征現(xiàn)象;得到事物的規(guī)律性內(nèi)涵。所以信息內(nèi)涵度量對(duì)于物聯(lián)網(wǎng)大數(shù)據(jù)時(shí)代的應(yīng)用具有非常大的現(xiàn)實(shí)意義。
實(shí)施例2
將本發(fā)明的預(yù)警方法運(yùn)用于山體及橋梁信息監(jiān)測(cè)報(bào)警系統(tǒng)中,此山情包括塌方,地震,泥石流等及橋梁受力等情況。
山體橋梁信息監(jiān)測(cè)報(bào)警系統(tǒng)包括依次連接的四個(gè)單元,A單元:信源接入部分/前端子系統(tǒng);B單元:交互通信網(wǎng)絡(luò);C單元:信宿接入部分;D單元:信息監(jiān)測(cè)中心。
如圖5所示,現(xiàn)設(shè)定在山體4相應(yīng)重要部位安置數(shù)據(jù)采集器1(即壓力傳感器)十個(gè),用于監(jiān)測(cè)各點(diǎn)受力狀況信息,同樣橋梁5各關(guān)鍵位置安置八個(gè)數(shù)據(jù)采集器1,觀測(cè)各支點(diǎn)和節(jié)點(diǎn)的受力信息。為對(duì)山體4和橋梁5重要部位的裂縫加以監(jiān)測(cè),設(shè)置共十個(gè)圖像采集器2(即圖像傳感器)于相應(yīng)部位。并在此區(qū)域安置一集中轉(zhuǎn)發(fā)器3,由此構(gòu)成山情橋梁信息傳輸及監(jiān)測(cè)系統(tǒng)的前端子系統(tǒng)。
在整個(gè)信息監(jiān)測(cè)報(bào)警系統(tǒng)中,A單元的信源接入部分主要用于前端數(shù)據(jù)及圖像的采集和發(fā)送,并通過集中轉(zhuǎn)發(fā)器將所有信息傳輸?shù)紹單元交互通信網(wǎng)絡(luò),經(jīng)過網(wǎng)絡(luò)傳輸,信息進(jìn)入C單元的信宿接入部分,然后,所有信息傳輸?shù)紻單元信息監(jiān)測(cè)中心,將數(shù)據(jù)圖像分離,并作信息分析和度量計(jì)算,在屏幕上顯示數(shù)據(jù)、圖像、統(tǒng)計(jì)趨勢(shì),以管理山體橋梁信息,達(dá)到安全預(yù)防和運(yùn)行的目的??紤]到信息安全地傳輸至中心,而且根據(jù)數(shù)據(jù)流量和圖像流量的大小和差異性,設(shè)計(jì)十八路數(shù)據(jù)信息通過通信網(wǎng)中的無(wú)線網(wǎng)如GPRS傳輸至后端子系統(tǒng),而圖像信息則通過通信網(wǎng)中的互聯(lián)網(wǎng)傳輸至后端子系統(tǒng),雙網(wǎng)備份,增加信息通信可靠性。
具體實(shí)施步驟:
S1,安置各帶有編號(hào)的采集器于相應(yīng)重要位置,各路數(shù)據(jù)和圖像采集器將變化的信息傳輸?shù)郊衅鳌?/p>
S2,集中器對(duì)數(shù)據(jù)和圖像信息進(jìn)行相應(yīng)編碼和調(diào)制技術(shù)處理,并作分離后,傳至通信網(wǎng)中的GPRS網(wǎng)和互聯(lián)網(wǎng)。
S3,通信網(wǎng)再將此技術(shù)處理后的信號(hào)傳輸交換至后端子系統(tǒng)。
S4,后端子系統(tǒng)經(jīng)過對(duì)收到的信號(hào)作解調(diào)和解碼,傳到信息監(jiān)測(cè)中心。數(shù)據(jù)信息傳至m類電腦,圖像信息至n類電腦。
S5,電腦對(duì)收到的信息進(jìn)行度量技術(shù)作運(yùn)算,例如受力大小、裂縫長(zhǎng)度、寬度計(jì)算等,并作分析統(tǒng)計(jì),顯示監(jiān)測(cè)的信息和趨勢(shì)。
在此案例中,山體橋梁實(shí)際情況為十年內(nèi)無(wú)發(fā)生重大災(zāi)情,二十年內(nèi)則有一次發(fā)生的背景,信息監(jiān)測(cè)中心根據(jù)此應(yīng)用業(yè)務(wù),設(shè)定信息幾率系數(shù)p為低類,取系數(shù)值為0.3;根據(jù)業(yè)務(wù)性質(zhì)和國(guó)際信息安全規(guī)則,設(shè)定安全因子μ為B1級(jí),取值為4;時(shí)間t為二次上傳的間隔長(zhǎng)度,即顯示時(shí)長(zhǎng),此設(shè)定為三天,即通常三天采集傳輸一次數(shù)據(jù),但遇到數(shù)據(jù)變化較大時(shí),如5-10%變化,即刻回傳變化的數(shù)據(jù)。通常此可由傳感器靈敏度調(diào)節(jié)設(shè)置。每條信息m設(shè)定為數(shù)據(jù)為10Kb,圖像為500Kb。由此計(jì)算機(jī)根據(jù)上述信息內(nèi)涵度量公式進(jìn)行相應(yīng)計(jì)算,得出度量值并作分析對(duì)比。具體實(shí)施步驟如下:
S5.1,計(jì)算機(jī)將收到的數(shù)據(jù)信息存儲(chǔ),并根據(jù)I公式,計(jì)算出該采集點(diǎn)的I1d值約為5.1。對(duì)該點(diǎn)做出受力變化判斷。
S5.2,同理,計(jì)算機(jī)對(duì)收到的其他采集點(diǎn)作運(yùn)算,得出相應(yīng)Imd值。作出各點(diǎn)受力變化判斷。
S5.3,計(jì)算機(jī)將收到的圖像信息存儲(chǔ),并根據(jù)I公式,計(jì)算出該采集點(diǎn)的I1p值約為257.2。對(duì)該點(diǎn)做出裂縫變化判斷。
S5.4,同理,計(jì)算機(jī)對(duì)收到的其他采集點(diǎn)作運(yùn)算,得出相應(yīng)Inp值。對(duì)各點(diǎn)做出裂縫變化判斷。
S5.5,同樣,計(jì)算機(jī)對(duì)該次收到的所有采集點(diǎn)作統(tǒng)計(jì),得出總的Imd值,對(duì)整個(gè)山體橋梁受力作出判斷。
S5.6,同樣,計(jì)算機(jī)對(duì)該次收到的所有采集點(diǎn)作統(tǒng)計(jì),得出總的Inp值,對(duì)整個(gè)山體橋梁作出裂縫判斷。
S5.7,如表1所示,I1d點(diǎn)的值在二天內(nèi)和24小時(shí)內(nèi)分別跳變到7.8和15.5,電腦則可判斷該點(diǎn)會(huì)發(fā)生事故,發(fā)出黃色警示標(biāo)記,提醒現(xiàn)場(chǎng)處置。由下表可見,傳感器回傳間隔由大至小,說(shuō)明該點(diǎn)山體活動(dòng)越頻繁,I1d和I1p的壓力和裂縫變化越大,發(fā)生重大災(zāi)害幾率越大。
表1 I1d和I1p變化趨勢(shì)
S5.8,當(dāng)某時(shí)段頻繁收到整個(gè)區(qū)域信息,而且信息變化較大,即可判斷整體監(jiān)測(cè)區(qū)將會(huì)發(fā)生重大的災(zāi)害,電腦閃爍紅色告警,管理人員啟動(dòng)安全預(yù)案機(jī)制,實(shí)施區(qū)域安全緊急管理。
由此可見,本專利通過多維度模型,度量計(jì)算技術(shù),獲得信息內(nèi)涵值,使事物信息更加反映事物的特征,使信息具體化,數(shù)字化,可視化。對(duì)于當(dāng)今信息社會(huì)和數(shù)字時(shí)代,具有極大的應(yīng)用意義。