本發(fā)明涉及大數(shù)據(jù)領(lǐng)域,特別是一種基于多源物聯(lián)網(wǎng)位置感知的時(shí)空關(guān)系分析系統(tǒng)。
背景技術(shù):
:隨著物聯(lián)網(wǎng)技術(shù)的不斷發(fā)展,基于物聯(lián)網(wǎng)的視頻、卡口、門禁、停車場(chǎng)、Wifi、IC卡等物聯(lián)網(wǎng)的信息資源智能化采集成為了可能,利用多網(wǎng)絡(luò)、多終端的智能數(shù)據(jù)感知采集模式收集海量的時(shí)空信息資源。針對(duì)上述物聯(lián)網(wǎng)技術(shù)發(fā)展,如何利用大數(shù)據(jù)實(shí)現(xiàn)公安工作效能提升,是目前大數(shù)據(jù)應(yīng)用的熱點(diǎn)、也是研究的熱點(diǎn)問題。因此需要提供一種能夠完成對(duì)該時(shí)空信息數(shù)據(jù)進(jìn)行分析處理的系統(tǒng)。技術(shù)實(shí)現(xiàn)要素:本發(fā)明的目的在于克服現(xiàn)有技術(shù)的缺點(diǎn)與不足,提供了一種基于多源物聯(lián)網(wǎng)位置感知的時(shí)空關(guān)系分析系統(tǒng)。本發(fā)明通過以下的方案實(shí)現(xiàn):一種基于多源物聯(lián)網(wǎng)位置感知的時(shí)空關(guān)系分析系統(tǒng),包括數(shù)據(jù)接收模塊,用于接收物聯(lián)網(wǎng)設(shè)備終端的時(shí)空數(shù)據(jù);數(shù)據(jù)轉(zhuǎn)換模塊,用于接收的數(shù)據(jù)轉(zhuǎn)換為統(tǒng)一格式的數(shù)據(jù);數(shù)據(jù)存儲(chǔ)模塊,用于對(duì)數(shù)據(jù)進(jìn)行分布式存儲(chǔ);數(shù)據(jù)過濾模塊,用于對(duì)數(shù)據(jù)進(jìn)行過濾;數(shù)據(jù)挖掘模塊,用于對(duì)數(shù)據(jù)進(jìn)行關(guān)聯(lián)規(guī)則進(jìn)行數(shù)據(jù)挖掘,獲得時(shí)空關(guān)聯(lián)數(shù)據(jù);關(guān)系數(shù)據(jù)庫模塊,用于存儲(chǔ)經(jīng)過數(shù)據(jù)挖掘的時(shí)空關(guān)聯(lián)數(shù)據(jù)和物聯(lián)網(wǎng)設(shè)備終端的時(shí)空數(shù)據(jù)。進(jìn)一步,所述數(shù)據(jù)轉(zhuǎn)換模塊將物聯(lián)網(wǎng)設(shè)備終端的數(shù)據(jù)轉(zhuǎn)換為xml文件。進(jìn)一步,所述數(shù)據(jù)過濾模塊包括:異常過濾器,用于將重復(fù)的冗余數(shù)據(jù)進(jìn)行過濾;業(yè)務(wù)過濾器,用于根據(jù)業(yè)務(wù)需要對(duì)數(shù)據(jù)進(jìn)行過濾;時(shí)間過濾器,用于根據(jù)設(shè)定的時(shí)間范圍進(jìn)行數(shù)據(jù)過濾。進(jìn)一步,所述數(shù)據(jù)挖掘模塊包括:數(shù)據(jù)處理模塊,用于處理數(shù)據(jù)挖掘所采用的訓(xùn)練數(shù)據(jù)的信息;模型訓(xùn)練模塊,用于對(duì)數(shù)據(jù)挖掘模型的算法進(jìn)行訓(xùn)練;模式測(cè)試模塊,用于驗(yàn)證模型輸出結(jié)果;模型運(yùn)行模塊,用于對(duì)測(cè)試成功的模型進(jìn)行運(yùn)行;結(jié)果輸出模塊,用于對(duì)模型輸出結(jié)果進(jìn)行輸出展示。進(jìn)一步,所述數(shù)據(jù)處理模塊包括:維度信息確定模塊,用于確定訓(xùn)練數(shù)據(jù)所包含的屬性信息;數(shù)據(jù)均值化處理模塊,用于訓(xùn)練數(shù)據(jù)的各個(gè)維度統(tǒng)一離散到[0,1]的取值范圍;交叉驗(yàn)證參數(shù)確定模塊,用于確定進(jìn)行模型結(jié)果驗(yàn)證的參數(shù)。進(jìn)一步,所述模型運(yùn)行模塊包括:任務(wù)調(diào)度參數(shù)設(shè)置模塊,用于設(shè)置任務(wù)名稱、執(zhí)行方式、開始執(zhí)行時(shí)間和資源占用,并保存在任務(wù)列表中;任務(wù)運(yùn)行模塊,用于根據(jù)任務(wù)列表,按時(shí)運(yùn)行模型任務(wù);監(jiān)控模塊,用于在模型運(yùn)行中進(jìn)行監(jiān)控,包括監(jiān)控當(dāng)前任務(wù)中的信息、當(dāng)前任務(wù)運(yùn)行狀態(tài)、反饋信息以及任務(wù)運(yùn)行歷史記錄。進(jìn)一步,所述執(zhí)行方式包括:立即執(zhí)行、定時(shí)執(zhí)行和周期執(zhí)行。進(jìn)一步,所述結(jié)果輸出模塊包括:數(shù)據(jù)集存儲(chǔ)模塊,用于將數(shù)據(jù)結(jié)果結(jié)合形成數(shù)據(jù)集,并存儲(chǔ)在數(shù)據(jù)資源池中;推送封裝模塊,用于將分析結(jié)果推送封裝為發(fā)布服務(wù)接口。進(jìn)一步,所述關(guān)系數(shù)據(jù)庫模塊的在對(duì)物聯(lián)網(wǎng)設(shè)備終端的時(shí)空數(shù)據(jù)進(jìn)行存儲(chǔ)時(shí),按照網(wǎng)點(diǎn)編號(hào),存儲(chǔ)每個(gè)網(wǎng)點(diǎn)的空間數(shù)據(jù)和屬性數(shù)據(jù);所述空間數(shù)據(jù)包括:網(wǎng)點(diǎn)位置和坐標(biāo);所述屬性數(shù)據(jù)包括:設(shè)備類型、采集信息類型、采集信息的頻率和采集信息的空間覆蓋范圍。進(jìn)一步,所述關(guān)系數(shù)據(jù)庫模塊還根據(jù)空間和時(shí)間分析,確定每個(gè)物聯(lián)網(wǎng)網(wǎng)點(diǎn)的時(shí)空依賴關(guān)系,并進(jìn)行儲(chǔ)存。相比于現(xiàn)有技術(shù),本發(fā)明提供了一種分析系統(tǒng),可以利用這些時(shí)空數(shù)據(jù),從時(shí)間和空間兩個(gè)維度梳理、挖掘、分析其時(shí)空關(guān)聯(lián)關(guān)系。將海量、雜亂的時(shí)空數(shù)據(jù),按照其內(nèi)部的時(shí)空關(guān)系、時(shí)空關(guān)聯(lián)規(guī)則進(jìn)行存儲(chǔ),為公安的情報(bào)分析、犯罪挖掘、案件偵破提供線索、拓展情報(bào)分析手段、提高破案率、輔助警務(wù)策略的制定等,提供精準(zhǔn)、科學(xué)、高效的大數(shù)據(jù)支持依據(jù)。為了更好地理解和實(shí)施,下面結(jié)合附圖詳細(xì)說明本發(fā)明。附圖說明圖1是本發(fā)明的時(shí)空關(guān)系分析系統(tǒng)的模塊框圖。圖2是本發(fā)明的數(shù)據(jù)轉(zhuǎn)換模塊的處理流程圖。圖3是本發(fā)明的數(shù)據(jù)過濾模塊的內(nèi)部連接框圖。圖4是本發(fā)明的數(shù)據(jù)挖掘模塊的內(nèi)部連接框圖。圖5是本發(fā)明的數(shù)據(jù)處理模塊的內(nèi)部連接框圖。圖6是本發(fā)明的模型運(yùn)行模塊的內(nèi)部連接框圖。圖7是結(jié)果輸出模塊的連接框圖。圖8是主要設(shè)計(jì)的關(guān)系表及關(guān)系表屬性結(jié)構(gòu)示意圖。圖9是對(duì)象時(shí)空關(guān)系管理關(guān)系表結(jié)構(gòu)圖。圖10是對(duì)象分類關(guān)系管理關(guān)系表結(jié)構(gòu)圖。具體實(shí)施方式以下結(jié)合實(shí)施例及附圖對(duì)本發(fā)明作進(jìn)一步詳細(xì)的描述,但本發(fā)明的實(shí)施方式不限于此。請(qǐng)參閱圖1,其為本發(fā)明的時(shí)空關(guān)系分析系統(tǒng)的模塊框圖。本發(fā)明提供了一種基于多源物聯(lián)網(wǎng)位置感知的時(shí)空關(guān)系分析系統(tǒng),包括數(shù)據(jù)接收模塊1、數(shù)據(jù)轉(zhuǎn)換模塊2、數(shù)據(jù)存儲(chǔ)模塊3、數(shù)據(jù)過濾模塊4、數(shù)據(jù)挖掘模塊5和關(guān)系數(shù)據(jù)庫模塊6。所述數(shù)據(jù)接收模塊1,用于接收物聯(lián)網(wǎng)設(shè)備終端的時(shí)空數(shù)據(jù)。具體的,以公安偵查中常用的物聯(lián)網(wǎng)設(shè)備終端為例,所述數(shù)據(jù)接收模塊所接收的物聯(lián)網(wǎng)設(shè)備終端可以包括監(jiān)控視頻、門禁系統(tǒng)、WiFi、IC卡和停車場(chǎng)監(jiān)控視頻等。所述數(shù)據(jù)轉(zhuǎn)換模塊2,用于接收的數(shù)據(jù)轉(zhuǎn)換為統(tǒng)一格式的數(shù)據(jù)。由于智能采集網(wǎng)點(diǎn)物聯(lián)網(wǎng)終端采集設(shè)備的多樣性,必然存在數(shù)據(jù)異構(gòu)的問題。本發(fā)明的數(shù)據(jù)轉(zhuǎn)換模塊旨在將不同終端設(shè)備采集到海量數(shù)據(jù)統(tǒng)一到一致的格式標(biāo)準(zhǔn)之下,便于系統(tǒng)的后續(xù)處理。而為了將不同數(shù)據(jù)統(tǒng)一為相同的格式標(biāo)準(zhǔn),本實(shí)施例中采用的為xml格式文件。而目前在互聯(lián)網(wǎng)領(lǐng)域,已存在一個(gè)廣泛應(yīng)用的數(shù)據(jù)交換接口標(biāo)準(zhǔn)XML(ExtensibleMarkupLanguange擴(kuò)展標(biāo)記語言)。XML文件的可讀性極強(qiáng)。具體的請(qǐng)同時(shí)參閱圖2,其為本發(fā)明的數(shù)據(jù)轉(zhuǎn)換模塊的處理流程圖。在制定好XML文件的格式標(biāo)準(zhǔn)之后,根據(jù)不同的智能終端設(shè)備感知層協(xié)議,編寫相應(yīng)的接口,就可以把相應(yīng)智能終端設(shè)備的數(shù)據(jù)轉(zhuǎn)換為系統(tǒng)統(tǒng)一識(shí)別的XML文件。而在本實(shí)施例中,所采用的的系統(tǒng)xml文件格式規(guī)范如下表1所示:表1節(jié)點(diǎn)名稱說明device設(shè)備屬性name代表名稱,coordinate代表坐標(biāo)times監(jiān)控時(shí)間表time監(jiān)控時(shí)刻INFOS獲取信息列表INFO獲取信息,屬性name為信息唯一標(biāo)識(shí)所述數(shù)據(jù)存儲(chǔ)模塊3,用于對(duì)數(shù)據(jù)進(jìn)行分布式存儲(chǔ)。在本發(fā)明中,采用云計(jì)算中的Hadoop分布式框架進(jìn)行分布式數(shù)據(jù)處理。由于Hadoop分布式文件系統(tǒng)HDFS是以支持大數(shù)據(jù)集合為目標(biāo)的,故利用HDFS對(duì)物聯(lián)網(wǎng)產(chǎn)生的異構(gòu)海量數(shù)據(jù)進(jìn)行分布式存儲(chǔ)。所述數(shù)據(jù)過濾模塊4,用于對(duì)數(shù)據(jù)進(jìn)行過濾。在本發(fā)明中,根據(jù)具體需求,采用基于Spark編程模型的Hive分布式數(shù)據(jù)倉庫對(duì)智能終端采集的數(shù)據(jù)進(jìn)行數(shù)據(jù)清洗過濾、刪除兀余信息。進(jìn)一步,請(qǐng)參閱圖3,其為本發(fā)明的數(shù)據(jù)過濾模塊的內(nèi)部連接框圖。根據(jù)物聯(lián)網(wǎng)時(shí)空數(shù)據(jù)關(guān)聯(lián)規(guī)則挖掘的需求,所述數(shù)據(jù)過濾模塊4包括:異常過濾器41、業(yè)務(wù)過濾器42和時(shí)間過濾器43。所述異常過濾器41,用于將重復(fù)的冗余數(shù)據(jù)進(jìn)行過濾。對(duì)于待清洗數(shù)據(jù),首先進(jìn)行異常冗余數(shù)據(jù)的檢驗(yàn),這里主要對(duì)于數(shù)據(jù)是否完全重復(fù)且基于服務(wù)的數(shù)據(jù)長(zhǎng)度是否一致進(jìn)行判斷。所述業(yè)務(wù)過濾器42,用于根據(jù)業(yè)務(wù)需要對(duì)數(shù)據(jù)進(jìn)行過濾。這里應(yīng)與具體支撐應(yīng)用平臺(tái)密切相關(guān),在數(shù)據(jù)挖掘模型的具體應(yīng)用中,業(yè)務(wù)需求可能只包括某一限定范圍的信息。例如可以定義以下幾個(gè)規(guī)則:只選定某個(gè)型號(hào)的智能終端的數(shù)據(jù),產(chǎn)品號(hào)及版本號(hào)等信息;限定具體時(shí)間,地點(diǎn)以及應(yīng)用人及相關(guān)信息。對(duì)于可能存在異常的孤立數(shù)據(jù)進(jìn)行業(yè)務(wù)判定。對(duì)于不匹配的數(shù)據(jù)進(jìn)行過濾處理。所述時(shí)間過濾器43,用于根據(jù)設(shè)定的時(shí)間范圍進(jìn)行數(shù)據(jù)過濾。根據(jù)數(shù)據(jù)的時(shí)間記錄進(jìn)行過濾,可以根據(jù)業(yè)務(wù)要求指定時(shí)間范圍。對(duì)不在該時(shí)間范圍的數(shù)據(jù)進(jìn)行過濾。所述數(shù)據(jù)挖掘模塊5,用于對(duì)數(shù)據(jù)進(jìn)行關(guān)聯(lián)規(guī)則進(jìn)行數(shù)據(jù)挖掘,獲得時(shí)空關(guān)聯(lián)數(shù)據(jù)。時(shí)空數(shù)據(jù)挖掘的過程分三個(gè)階段:時(shí)空數(shù)據(jù)的準(zhǔn)備階段、時(shí)空數(shù)據(jù)的挖掘階段和時(shí)空數(shù)據(jù)結(jié)果的解釋和評(píng)估階段。進(jìn)一步請(qǐng)同時(shí)參閱圖4,其為本發(fā)明的數(shù)據(jù)挖掘模塊的內(nèi)部連接框圖。所述數(shù)據(jù)挖掘模塊5包括:數(shù)據(jù)處理模塊51、模型訓(xùn)練模塊52、模式測(cè)試模塊53、模型運(yùn)行模塊54和結(jié)果輸出模塊55。所述數(shù)據(jù)處理模塊51,用于處理數(shù)據(jù)挖掘所采用的訓(xùn)練數(shù)據(jù)的信息。這里主要應(yīng)用在前期的數(shù)據(jù)準(zhǔn)備階段。進(jìn)一步請(qǐng)參閱圖5,其為本發(fā)明的數(shù)據(jù)處理模塊的內(nèi)部連接框圖。所述數(shù)據(jù)處理模塊51包括:維度信息確定模塊511、數(shù)據(jù)均值化處理模塊512和交叉驗(yàn)證參數(shù)確定模塊513。所述維度信息確定模塊511,用于確定訓(xùn)練數(shù)據(jù)所包含的屬性信息。所述數(shù)據(jù)均值化處理模塊512,用于訓(xùn)練數(shù)據(jù)的各個(gè)維度統(tǒng)一離散到[0,1]的取值范圍。所述交叉驗(yàn)證參數(shù)確定模塊513,用于確定進(jìn)行模型結(jié)果驗(yàn)證的參數(shù)。一般訓(xùn)練樣本分為訓(xùn)練數(shù)據(jù)和驗(yàn)證數(shù)據(jù)兩個(gè)部分,直接用驗(yàn)證數(shù)據(jù)去驗(yàn)證訓(xùn)練出來的模型效果。所述模型訓(xùn)練模塊52,用于對(duì)數(shù)據(jù)挖掘模型的算法進(jìn)行訓(xùn)練。在本實(shí)施例中,所采用的訓(xùn)練模型見下表2所示:表2以下針對(duì)上述表格中的5中算法模型進(jìn)行具體的介紹,具體如下:第一、時(shí)空關(guān)聯(lián)關(guān)聯(lián)規(guī)則(AssociationRules)的概念首先由R.Agrawal等人于1993年提出的,是反映一個(gè)事物與其他事物之間的相互依賴性或相互關(guān)聯(lián)性。關(guān)聯(lián)規(guī)則數(shù)據(jù)挖掘(簡(jiǎn)稱關(guān)聯(lián)規(guī)則挖掘)就是從大量的數(shù)據(jù)中挖掘出有價(jià)值的描述數(shù)據(jù)項(xiàng)之間相互聯(lián)系的有關(guān)知識(shí)。隨著收集和存儲(chǔ)的數(shù)據(jù)規(guī)模越來越大,特別是類似于Hadoop這樣的分布式數(shù)據(jù)處理系統(tǒng)的誕生,使得數(shù)據(jù)處理的規(guī)模呈指數(shù)及增長(zhǎng),人們對(duì)從這些數(shù)據(jù)中挖掘相應(yīng)的關(guān)聯(lián)規(guī)則越來越感興趣,關(guān)聯(lián)規(guī)則挖掘也倍受數(shù)據(jù)挖掘領(lǐng)域?qū)<业年P(guān)注,得到了深入的研究和發(fā)展。時(shí)空關(guān)聯(lián)規(guī)則的理論是在關(guān)聯(lián)規(guī)則的基礎(chǔ)之上發(fā)展而來,特制那些既有空間約束又有時(shí)態(tài)約束的關(guān)聯(lián)規(guī)則。其主要意義在于研究空間對(duì)象隨時(shí)間變化的規(guī)律,以發(fā)現(xiàn)海量時(shí)空數(shù)據(jù)中處于一定時(shí)間間隔的空間位置的關(guān)聯(lián)規(guī)則。本發(fā)明中所采用的算法為:目前關(guān)聯(lián)規(guī)則挖掘算法中最為流行的是Apriori算法。其核心思想是通過候選集生成和情節(jié)的向下封閉檢測(cè)兩個(gè)階段來挖掘頻繁項(xiàng)集,其實(shí)現(xiàn)過程主要分為兩個(gè)步驟:1.依據(jù)支持度找出所有頻繁項(xiàng)集(頻度)2.依據(jù)置信度產(chǎn)生關(guān)聯(lián)規(guī)則(強(qiáng)度)Apriori算法的應(yīng)用非常廣泛,但其所挖掘的關(guān)聯(lián)規(guī)則一般都假定為永遠(yuǎn)有效。針對(duì)時(shí)空關(guān)聯(lián)規(guī)則挖掘,需要在算法中加入時(shí)間約束和空間約束。其基本思路是將含有時(shí)間約束和空間約束的數(shù)據(jù)源首先按照空間位置進(jìn)行整理,生成信息一地址對(duì),然后根據(jù)Apriori算法生成侯選集,由侯選項(xiàng)集生成頻繁項(xiàng)集,直到頻繁項(xiàng)集不能生成更長(zhǎng)的侯選為止。再把時(shí)間因素加入進(jìn)去,將時(shí)間區(qū)間用一個(gè)適宜的推廣因子進(jìn)行推廣,得出相應(yīng)的含有地址約束的項(xiàng)目與擴(kuò)展時(shí)間區(qū)間的元素對(duì),當(dāng)(項(xiàng)目一地址)對(duì)落入相同的推廣時(shí)間區(qū)間內(nèi),則產(chǎn)生關(guān)聯(lián)規(guī)則,即含有時(shí)空約束的關(guān)聯(lián)規(guī)則。第二、時(shí)空同現(xiàn)時(shí)空同現(xiàn)模式挖掘是針對(duì)復(fù)雜時(shí)空數(shù)據(jù)提取同現(xiàn)模式的過程。時(shí)空同現(xiàn)模式是在同位模式的基礎(chǔ)上添加了時(shí)空符合興趣度形成的模式??臻g同位模式是從地理空間中發(fā)現(xiàn)的那些頻繁的且緊密相鄰的空間特征的集合,同位規(guī)則試圖將關(guān)聯(lián)規(guī)則泛化為空間索引的點(diǎn)集合數(shù)據(jù)集。時(shí)空同現(xiàn)模式就是在時(shí)空維下,不同對(duì)象類型子集的實(shí)例在一些時(shí)間段中在空間上是相互鄰近的(或符合某種空間關(guān)系的)。同現(xiàn)模式是在同位模式的基礎(chǔ)上,提出時(shí)空復(fù)合興趣度的概念作為同現(xiàn)模式的判斷標(biāo)準(zhǔn)。時(shí)空復(fù)合興趣度是將空間興趣度和時(shí)間興趣度相結(jié)合本發(fā)明采用的算法為:依據(jù)時(shí)空同現(xiàn)模式挖掘的基本理論,要進(jìn)行時(shí)空同現(xiàn)模式的挖掘,首先需要挖掘同一時(shí)間段內(nèi)的同位模式??臻g同位模式數(shù)據(jù)挖掘方法依然是基于Apriori算法思想。其基本思路為:1、遍歷計(jì)算空間內(nèi)不同特征類型下,每?jī)蓚€(gè)實(shí)例(分屬于不同的特征類型)之間的期望距離(初步將期望距離定義為歐氏距離)。以任意兩個(gè)實(shí)例間的期望距離為例,可分別計(jì)算出實(shí)例一的不確定點(diǎn)群到實(shí)例二中心點(diǎn)的期望距離,和實(shí)例二的不確定點(diǎn)群到實(shí)例一中心點(diǎn)的期望距離。2、這兩個(gè)實(shí)例間的期望距離便是這兩個(gè)期望距離中的最大值。若實(shí)例間的期望距離小于等于距離閾值,則把該實(shí)例對(duì)作為候選實(shí)例對(duì)。遍歷所有類型下的所有實(shí)例對(duì),直至不再產(chǎn)生候選實(shí)例對(duì)。得到所有的候選實(shí)例對(duì)之后,便需要計(jì)算候選實(shí)例對(duì)中每種特征類型所對(duì)應(yīng)的空間參與度。在得出模式的空間參與度之后,同空間參與度閾值做比較,若前者大于等于后者,那么該模式即為空間同位模式。在確定所有的空間同位模式后,再計(jì)算時(shí)空同現(xiàn)模式。先計(jì)算空間同位模式的時(shí)間參與度,若大于等于時(shí)間參與度閾值,則該模式為時(shí)空同現(xiàn)模式。第三、時(shí)空聚類時(shí)空聚類就是指基于空間和時(shí)間相似度把具有相似行為的時(shí)空對(duì)象劃分到同一組中,使組間差別盡量大,而組內(nèi)差別盡量小。時(shí)空聚類分析能夠更好地發(fā)現(xiàn)和分析地理現(xiàn)象發(fā)展變化的規(guī)律與本質(zhì)特征并預(yù)測(cè)其發(fā)展趨勢(shì)。時(shí)空聚類分析是一種非監(jiān)督分類的方法,它依據(jù)判斷相似性準(zhǔn)則將所有時(shí)空實(shí)體劃分成一系列時(shí)空簇。同一時(shí)空簇內(nèi),對(duì)象之間的差異要盡量小于不同時(shí)空簇的對(duì)象間的差異。我們采用時(shí)空密度聚類的算法來進(jìn)行基于智能采集網(wǎng)點(diǎn)的時(shí)空聚類分析。時(shí)空密度聚類是空間密度聚類在時(shí)空域上的擴(kuò)展,其采用密度作為實(shí)體間相似性的度量標(biāo)準(zhǔn),將時(shí)空簇視為一系列被低密度區(qū)域(噪聲)分割的高密度連通區(qū)域。DBSCAN(Density-BasedSpatialClusteringofApplicationswithNoise)是一個(gè)比較有代表性的基于密度的聚類算法。與劃分和層次聚類方法不同,它將簇定義為密度相連的點(diǎn)的最大集合,能夠把具有足夠高密度的區(qū)域劃分為簇,并可在噪聲的空間數(shù)據(jù)集中發(fā)現(xiàn)任意形狀的聚類。DBSCAN中的幾個(gè)定義:E鄰域:給定對(duì)象半徑為E內(nèi)的區(qū)域稱為該對(duì)象的E鄰域;核心對(duì)象:如果給定對(duì)象E鄰域內(nèi)的樣本點(diǎn)數(shù)大于等于MinPts,則稱該對(duì)象為核心對(duì)象;直接密度可達(dá):對(duì)于樣本集合D,如果樣本點(diǎn)Q在P的E鄰域內(nèi),并且P為核心對(duì)象,那么對(duì)象Q從對(duì)象P直接密度可達(dá);密度可達(dá):對(duì)于樣本集合D,給定一串樣本點(diǎn)Pi,Pv...Pn,P=P1,假如對(duì)象Pi從Pi-l直接密度可達(dá),那么對(duì)象Q從對(duì)象P密度可達(dá);密度相連:存在樣本集合D中的一點(diǎn)0,如果對(duì)象0到對(duì)象P和對(duì)象Q都是密度可達(dá)的,那么P和Q密度相聯(lián)ST-DBSCAN聚類是DBSCAN聚類在時(shí)間維上的擴(kuò)展。擴(kuò)展的方面是:E鄰域擴(kuò)展為時(shí)空鄰域;直接密度可達(dá)擴(kuò)展為時(shí)空直接密度可達(dá)。除了時(shí)空鄰域定義的改變,顧及非空間屬性的ST-DBSCAN聚類還需要定義算法中的其他概念:時(shí)空對(duì)象、屬性差函數(shù)判定閾值e、時(shí)空直接密度可達(dá)、時(shí)空核心對(duì)象判定閾值MinPts等第四、時(shí)空分類時(shí)空分類主要是基于時(shí)空對(duì)象特征構(gòu)建分類模型來預(yù)測(cè)時(shí)空對(duì)象所屬類別或所在具體空間位置。與時(shí)空聚類不同,時(shí)空分類是一種監(jiān)督分類算法。是以建立統(tǒng)計(jì)識(shí)別函數(shù)為理論基礎(chǔ),依據(jù)典型樣本訓(xùn)練方法進(jìn)行分類的技術(shù)。即根據(jù)已知訓(xùn)練區(qū)提供的樣本,通過選擇特征參數(shù),求出特征參數(shù)作為決策規(guī)則,建立判別函數(shù)以對(duì)各待分類數(shù)據(jù)進(jìn)行分類。適用于監(jiān)督分類的算法很多,如SVM支持向量機(jī)、BP神經(jīng)網(wǎng)絡(luò)、貝葉斯統(tǒng)計(jì)、決策樹建模等。針對(duì)智能采集網(wǎng)點(diǎn)時(shí)空數(shù)據(jù)的數(shù)值多樣性的特征,我們考慮采用BP神經(jīng)網(wǎng)絡(luò)算法構(gòu)建監(jiān)督分類的預(yù)測(cè)模型。BP神經(jīng)網(wǎng)絡(luò)首先構(gòu)造一個(gè)包含輸入層、輸出層和隱藏層的多層網(wǎng)絡(luò)結(jié)構(gòu)。其中輸入層為經(jīng)處理的智能網(wǎng)點(diǎn)時(shí)空特征數(shù)據(jù),輸出層為時(shí)空數(shù)據(jù)的目標(biāo)類別。其基本特征包括:1、網(wǎng)絡(luò)中每個(gè)神經(jīng)元包含一個(gè)連續(xù)可微的非線性激活函數(shù)2、網(wǎng)絡(luò)展示高度的連接線,其強(qiáng)度由網(wǎng)絡(luò)的突觸權(quán)值確定BP神經(jīng)網(wǎng)絡(luò)應(yīng)用反向傳播的方法,訓(xùn)練網(wǎng)絡(luò)的各個(gè)突觸權(quán)值。訓(xùn)練過程分為如下兩個(gè)階段:1、前向階段:網(wǎng)絡(luò)的突觸權(quán)值是固定的,輸入信號(hào)在網(wǎng)絡(luò)中一層層傳播,直到達(dá)到突出端。2、反向階段:通過比較網(wǎng)絡(luò)的輸出和期望輸出產(chǎn)生的誤差信號(hào),將誤差信號(hào)再次通過網(wǎng)絡(luò)一層層傳播,并對(duì)網(wǎng)絡(luò)的突觸權(quán)值進(jìn)行不斷的修正第五、時(shí)空軌跡頻繁人們感興趣的是從一個(gè)時(shí)空序列里發(fā)現(xiàn)頻繁重復(fù)的路徑,即時(shí)空軌跡頻繁模式。這些軌跡頻繁重復(fù)模式能協(xié)助完成關(guān)于移動(dòng)對(duì)象的分析、預(yù)測(cè)等任務(wù),進(jìn)而可將其應(yīng)用于經(jīng)營商業(yè)、旅游業(yè)和管理城市交通等方面的決策。除了對(duì)軌跡數(shù)據(jù)之外,序列挖掘?qū)ο筮€包括諸如時(shí)空事件數(shù)據(jù)集等其他時(shí)空數(shù)據(jù),在這些事件數(shù)據(jù)集中不包含對(duì)象的軌跡數(shù)據(jù),而是由不同類型事件序列組成的集合。通過掃描時(shí)空數(shù)據(jù)庫產(chǎn)生映射圖和軌跡信息列表,在映射圖上進(jìn)行深度優(yōu)先遍歷以尋找頻繁軌跡模式。許多移動(dòng)對(duì)象(包括交通工具、動(dòng)物、移動(dòng)電話用戶等),在固定的時(shí)間區(qū)間內(nèi)總是遵循相同或近似相同的路線,展現(xiàn)出一定的周期性規(guī)律,這些周期模式不僅可用于壓縮移動(dòng)數(shù)據(jù),還可用來預(yù)測(cè)對(duì)象未來的移動(dòng)方向,這種周期模式隱含在時(shí)空數(shù)據(jù)中需要挖掘才能發(fā)現(xiàn)。根據(jù)現(xiàn)有頻繁模式挖掘的理論成果,采用一種基于后綴樹的時(shí)空軌跡頻繁模式挖掘算法結(jié)合DBSCAN算法較為符合物聯(lián)網(wǎng)時(shí)空數(shù)據(jù)關(guān)聯(lián)挖掘的項(xiàng)目需求。后綴樹是一種數(shù)據(jù)結(jié)構(gòu),能快速解決很多關(guān)于字符串的問題。時(shí)空軌跡頻繁模式挖掘可以轉(zhuǎn)換為頻繁序列模式的挖掘,而后綴樹作為一種數(shù)據(jù)結(jié)構(gòu),可以存儲(chǔ)序列數(shù)據(jù)并且其查詢性能較好。通過對(duì)后綴樹進(jìn)行改進(jìn)使其可以存儲(chǔ)興趣區(qū)域序列和時(shí)間信息,而且可以減少數(shù)據(jù)的存儲(chǔ),并可以增量挖掘軌跡模式。算法實(shí)現(xiàn)的具體步驟為:首先通過后綴樹挖掘出候選的軌跡頻繁模式,然后進(jìn)一步對(duì)產(chǎn)生的結(jié)果進(jìn)行挖掘,通過聚類的方式提取出帶有停留時(shí)間的頻繁模式。對(duì)于軌跡化,Tb定義軌跡間的距離,若二者有著不同的置序列,則距離為正無窮,若二者之間有著相同的位置序列,則計(jì)算其距離。最后通過基于密度的DBSCAN算法迸行軌跡頻繁項(xiàng)聚類。所述模式測(cè)試模塊53,用于驗(yàn)證模型輸出結(jié)果。本模塊主要對(duì)已保存的模型作驗(yàn)證,通常采用訓(xùn)練樣本數(shù)據(jù)集交叉驗(yàn)證的方法,驗(yàn)證數(shù)據(jù)模型是否符合訓(xùn)練數(shù)據(jù)的期望輸出。所述模型運(yùn)行模塊54,用于對(duì)測(cè)試成功的模型進(jìn)行運(yùn)行。進(jìn)一步請(qǐng)參閱圖6,其為本發(fā)明的模型運(yùn)行模塊的內(nèi)部連接框圖。所述模型運(yùn)行模塊54包括:任務(wù)調(diào)度參數(shù)設(shè)置模塊541、任務(wù)運(yùn)行模塊542和監(jiān)控模塊543。所述任務(wù)調(diào)度參數(shù)設(shè)置模塊541,用于設(shè)置任務(wù)名稱、執(zhí)行方式、開始執(zhí)行時(shí)間和資源占用,并保存在任務(wù)列表中。其中,所述執(zhí)行方式包括:立即執(zhí)行、定時(shí)執(zhí)行和周期執(zhí)行。所述任務(wù)運(yùn)行模塊542,用于根據(jù)任務(wù)列表,按時(shí)運(yùn)行模型任務(wù)。所述監(jiān)控模塊543,用于在模型運(yùn)行中進(jìn)行監(jiān)控,包括監(jiān)控當(dāng)前任務(wù)中的信息、當(dāng)前任務(wù)運(yùn)行狀態(tài)、反饋信息以及任務(wù)運(yùn)行歷史記錄。所述結(jié)果輸出模塊55,用于對(duì)模型輸出結(jié)果進(jìn)行輸出展示。進(jìn)一步請(qǐng)同時(shí)參閱圖7,其為結(jié)果輸出模塊的連接框圖。所述結(jié)果輸出模塊55包括:數(shù)據(jù)集存儲(chǔ)模塊551和推送封裝模塊552。所述數(shù)據(jù)集存儲(chǔ)模塊551,用于將數(shù)據(jù)結(jié)果結(jié)合形成數(shù)據(jù)集,并存儲(chǔ)在數(shù)據(jù)資源池中。其中,有權(quán)限的用戶可直接到資源池中查詢查看。所述推送封裝模塊552,用于將分析結(jié)果推送封裝為發(fā)布服務(wù)接口。該推送的內(nèi)容可以為預(yù)警內(nèi)容。這里的預(yù)警推送方式可以通過與當(dāng)前分析總線進(jìn)行對(duì)接,將分析結(jié)果中預(yù)警信息推送封裝為預(yù)警發(fā)布服務(wù)接口,各警種業(yè)務(wù)系統(tǒng)可調(diào)用該接口,查詢數(shù)據(jù)挖掘分析推送發(fā)布的結(jié)果數(shù)據(jù)集。所述關(guān)系數(shù)據(jù)庫模塊6,用于存儲(chǔ)經(jīng)過數(shù)據(jù)挖掘的時(shí)空關(guān)聯(lián)數(shù)據(jù)和物聯(lián)網(wǎng)設(shè)備終端的時(shí)空數(shù)據(jù)。進(jìn)一步,所述關(guān)系數(shù)據(jù)庫模塊的在對(duì)物聯(lián)網(wǎng)設(shè)備終端的時(shí)空數(shù)據(jù)進(jìn)行存儲(chǔ)時(shí),按照網(wǎng)點(diǎn)編號(hào),存儲(chǔ)每個(gè)網(wǎng)點(diǎn)的空間數(shù)據(jù)和屬性數(shù)據(jù);所述空間數(shù)據(jù)包括:網(wǎng)點(diǎn)位置和坐標(biāo);所述屬性數(shù)據(jù)包括:設(shè)備類型、采集信息類型、采集信息的頻率和采集信息的空間覆蓋范圍。進(jìn)一步請(qǐng)同時(shí)參閱圖8,其為主要設(shè)計(jì)的關(guān)系表及關(guān)系表屬性結(jié)構(gòu)示意圖。所述關(guān)系數(shù)據(jù)庫模塊還根據(jù)空間和時(shí)間分析,確定每個(gè)物聯(lián)網(wǎng)網(wǎng)點(diǎn)的時(shí)空依賴關(guān)系,并進(jìn)行儲(chǔ)存。本發(fā)明中利用空間鄰接分析,結(jié)合時(shí)間服務(wù)半徑,確定每個(gè)物聯(lián)網(wǎng)點(diǎn)間的時(shí)空依賴關(guān)系,并按其時(shí)空依賴關(guān)系存儲(chǔ)物聯(lián)網(wǎng)點(diǎn)間關(guān)系,為物聯(lián)網(wǎng)感知數(shù)據(jù)處理、數(shù)據(jù)挖掘做準(zhǔn)備。另外,所述關(guān)系數(shù)據(jù)庫模塊在對(duì)經(jīng)過數(shù)據(jù)挖掘的時(shí)空關(guān)聯(lián)數(shù)據(jù)進(jìn)行儲(chǔ)存時(shí),包括以下兩種情況:第一、對(duì)象時(shí)空關(guān)聯(lián)關(guān)系存儲(chǔ)請(qǐng)參閱圖9,其為對(duì)象時(shí)空關(guān)系管理關(guān)系表結(jié)構(gòu)圖。以感知對(duì)象人、車為例,從人、地、車、時(shí)間四個(gè)維度描述對(duì)象的時(shí)空關(guān)系。主要關(guān)系分為:1、人員時(shí)空行為挖掘與存儲(chǔ)。2、車輛時(shí)空行為挖掘與存儲(chǔ)。3、人員與車輛時(shí)空關(guān)系挖掘與存儲(chǔ)。4、人員與人員時(shí)空關(guān)系挖掘與存儲(chǔ)。5、車輛與車輛時(shí)空關(guān)系挖掘與存儲(chǔ)。第二、對(duì)象分類關(guān)系存儲(chǔ)請(qǐng)參閱圖10,其為對(duì)象分類關(guān)系管理關(guān)系表結(jié)構(gòu)圖。對(duì)象分類關(guān)系存儲(chǔ)主要管理某一時(shí)間段內(nèi)、針對(duì)某一具體警情時(shí)間所做的聚類分析、分類分析結(jié)果。相比于現(xiàn)有技術(shù),本發(fā)明提供了一種分析系統(tǒng),可以利用這些時(shí)空數(shù)據(jù),從時(shí)間和空間兩個(gè)維度梳理、挖掘、分析其時(shí)空關(guān)聯(lián)關(guān)系。將海量、雜亂的時(shí)空數(shù)據(jù),按照其內(nèi)部的時(shí)空關(guān)系、時(shí)空關(guān)聯(lián)規(guī)則進(jìn)行存儲(chǔ),為公安的情報(bào)分析、犯罪挖掘、案件偵破提供線索、拓展情報(bào)分析手段、提高破案率、輔助警務(wù)策略的制定等,提供精準(zhǔn)、科學(xué)、高效的大數(shù)據(jù)支持依據(jù)。上述實(shí)施例為本發(fā)明較佳的實(shí)施方式,但本發(fā)明的實(shí)施方式并不受上述實(shí)施例的限制,其他的任何未背離本發(fā)明的精神實(shí)質(zhì)與原理下所作的改變、修飾、替代、組合、簡(jiǎn)化,均應(yīng)為等效的置換方式,都包含在本發(fā)明的保護(hù)范圍之內(nèi)。當(dāng)前第1頁1 2 3