本發(fā)明涉及卷積神經(jīng)網(wǎng)絡(luò)圖像識(shí)別方法,尤其是一種通過(guò)云計(jì)算進(jìn)行卷積神經(jīng)網(wǎng)絡(luò)圖像識(shí)別方法。
背景技術(shù):
隨著視頻監(jiān)控?cái)?shù)據(jù)量的快速增長(zhǎng),以及攝像頭高清化、超高清化的趨勢(shì)的加強(qiáng),監(jiān)控視頻在違法人員的追捕中發(fā)揮著越來(lái)越重要的作用。隨著視頻監(jiān)控?cái)?shù)據(jù)量的飛速增長(zhǎng),工作人員在用傳統(tǒng)方式對(duì)視頻進(jìn)行分析和檢索的時(shí)候遇到了很大的挑戰(zhàn)。而大數(shù)據(jù)技術(shù)可以重構(gòu)傳統(tǒng)視頻數(shù)據(jù)處理的架構(gòu),讓公安系統(tǒng)可以更快速地分析監(jiān)控視頻。同時(shí)基于深度學(xué)習(xí)的cnn(卷積神經(jīng)網(wǎng)絡(luò))已經(jīng)在高級(jí)視覺(jué)領(lǐng)域取得了前所未有的成功,并廣泛應(yīng)用于圖像分類、人臉識(shí)別、物體檢測(cè)等領(lǐng)域中。
本發(fā)明主要利用深度學(xué)習(xí)方法結(jié)合云計(jì)算,將攝像頭采集的視頻數(shù)據(jù)進(jìn)行云存儲(chǔ)和管理,利用hadoop的mapreduce并行化編程模型結(jié)合深度學(xué)習(xí)對(duì)視頻進(jìn)行數(shù)據(jù)識(shí)別挖掘,實(shí)現(xiàn)對(duì)目標(biāo)人員的模糊檢索。本發(fā)明旨在大幅度提高監(jiān)控視頻的人員目標(biāo)識(shí)別自動(dòng)化程度、速率和準(zhǔn)確率以及提高監(jiān)控視頻數(shù)據(jù)的利用率。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明針對(duì)現(xiàn)有技術(shù)中的不足,提供了基于深度學(xué)習(xí)的監(jiān)控視頻人員模糊檢索方法,本發(fā)明提出了一種以深度學(xué)習(xí)為基礎(chǔ)、以云計(jì)算為支撐的監(jiān)控視頻人員模糊檢索方法。將攝像頭采集的視頻數(shù)據(jù)進(jìn)行云存儲(chǔ)和管理,利用hadoop的mapreduce并行化編程模型結(jié)合深度學(xué)習(xí)對(duì)視頻進(jìn)行數(shù)據(jù)識(shí)別挖掘,實(shí)現(xiàn)對(duì)目標(biāo)人員的快速準(zhǔn)確的模糊檢索。
為了解決上述技術(shù)問(wèn)題,本發(fā)明通過(guò)下述技術(shù)方案得以解決:基于深度學(xué)習(xí)的監(jiān)控視頻人員模糊檢索方法,應(yīng)用在監(jiān)控系統(tǒng),所述的監(jiān)控系統(tǒng)包括卷積神經(jīng)網(wǎng)絡(luò)系統(tǒng)和云平臺(tái)系統(tǒng),其特征為包括以下幾個(gè)步驟:步驟(a):通過(guò)云平臺(tái)系統(tǒng)收集視頻數(shù)據(jù),并將視頻數(shù)據(jù)進(jìn)行云存儲(chǔ);步驟(b):使用者建立訓(xùn)練條目數(shù)據(jù)庫(kù),每個(gè)訓(xùn)練條目由文字進(jìn)行描述;步驟(c):根據(jù)云存儲(chǔ)內(nèi)容以及訓(xùn)練條目數(shù)據(jù)庫(kù)選取樣本圖片建立訓(xùn)練數(shù)據(jù)庫(kù);步驟(d):卷積神經(jīng)網(wǎng)絡(luò)系統(tǒng)通過(guò)云平臺(tái)系統(tǒng)的并行計(jì)算進(jìn)行深度學(xué)習(xí)訓(xùn)練,以訓(xùn)練出用于識(shí)別的網(wǎng)絡(luò)模型;步驟(e):訓(xùn)練完成后卷積神經(jīng)網(wǎng)絡(luò)系統(tǒng)通過(guò)云平臺(tái)系統(tǒng)的并行計(jì)算進(jìn)行識(shí)別,識(shí)別時(shí)輸入模糊描述后,卷積神經(jīng)網(wǎng)絡(luò)系統(tǒng)調(diào)取與模糊描述相關(guān)的若干個(gè)特征模型進(jìn)行計(jì)算然后得到識(shí)別結(jié)果。
上述技術(shù)方案中,優(yōu)選的,所述的卷積神經(jīng)網(wǎng)絡(luò)系統(tǒng)為fasterr-cnn網(wǎng)絡(luò)結(jié)構(gòu)。
上述技術(shù)方案中,優(yōu)選的,所述的卷積神經(jīng)網(wǎng)絡(luò)系統(tǒng)為fastr-cnn網(wǎng)絡(luò)結(jié)構(gòu)。
上述技術(shù)方案中,優(yōu)選的,在步驟d和步驟e中的并行計(jì)算為利用hadoop的mapreduce并行化編程模型的計(jì)算。
上述技術(shù)方案中,優(yōu)選的,在步驟c中對(duì)每個(gè)樣本圖片進(jìn)行標(biāo)簽,每個(gè)標(biāo)簽只標(biāo)定唯一的特征信息,單個(gè)樣本圖片可具有多個(gè)標(biāo)簽。
上述技術(shù)方案中,優(yōu)選的,在步驟d中,通過(guò)訓(xùn)練條目描述的內(nèi)容,選取相應(yīng)的至少一個(gè)標(biāo)簽,然后選取通標(biāo)簽下若干個(gè)樣本圖片進(jìn)行訓(xùn)練,在訓(xùn)練前通過(guò)標(biāo)簽上的特征信息,對(duì)樣本圖片進(jìn)行預(yù)處理,預(yù)處理包括消除噪聲、校正失真、變換標(biāo)準(zhǔn)形式,預(yù)處理后使樣本圖片標(biāo)簽上所描述的特征信息更容易提取。
上述技術(shù)方案中,優(yōu)選的,在步驟d中,每次訓(xùn)練后卷積神經(jīng)網(wǎng)絡(luò)系統(tǒng)都會(huì)建立相應(yīng)的特征模型,如果訓(xùn)練結(jié)果為合格,則保留此特征模型,如果訓(xùn)練結(jié)果為不合格則對(duì)此特征模型進(jìn)行自動(dòng)修改,直至訓(xùn)練結(jié)果為合格,此特征模型才保持穩(wěn)定。
上述技術(shù)方案中,優(yōu)選的,在步驟d中,訓(xùn)練合格的標(biāo)準(zhǔn)由進(jìn)行判斷。
上述技術(shù)方案中,優(yōu)選的,在步驟e中,對(duì)模糊描述進(jìn)行分析,然后從模糊描述中提取至少一個(gè)特征信息,然后根據(jù)特征信息選取相對(duì)應(yīng)的特征模型,最后根據(jù)若干個(gè)特征模型的組合進(jìn)行識(shí)別。
本發(fā)明的主要步驟為通過(guò)卷積神經(jīng)網(wǎng)絡(luò)系統(tǒng)不斷采集攝像頭視頻數(shù)據(jù)并將視頻數(shù)據(jù)進(jìn)行云存儲(chǔ)。卷積神經(jīng)網(wǎng)絡(luò)系統(tǒng)的深度學(xué)習(xí)子系統(tǒng)從歷史數(shù)據(jù)中選取樣本圖片構(gòu)建訓(xùn)練數(shù)據(jù)庫(kù),結(jié)合對(duì)應(yīng)的深度學(xué)習(xí)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,不斷優(yōu)化識(shí)別模型。最后用戶通過(guò)輸入目標(biāo)人員的描述時(shí),卷積神經(jīng)網(wǎng)絡(luò)系統(tǒng)根據(jù)用戶的模糊描述,在海量歷史數(shù)據(jù)中檢索具有該特征屬性的人員。傳統(tǒng)統(tǒng)計(jì)學(xué)習(xí)算法建立在特征提取的基礎(chǔ)上,在進(jìn)行算法訓(xùn)練之前,需要建立樣本的特征空間。對(duì)于復(fù)雜的識(shí)別問(wèn)題無(wú)法直接提取到反映分類目標(biāo)的特征時(shí),就需要可以自動(dòng)學(xué)習(xí)特征空間和其對(duì)應(yīng)分類器的算法。深度學(xué)習(xí)的本質(zhì)是通過(guò)構(gòu)建具有多個(gè)隱層的機(jī)器學(xué)習(xí)模型,建立、模擬人腦進(jìn)行分析學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò),它模仿人腦的機(jī)制來(lái)解釋數(shù)據(jù),從海量的訓(xùn)練數(shù)據(jù)中學(xué)習(xí)更有用的特征,從而最終提升分類或預(yù)測(cè)的準(zhǔn)確性。本發(fā)明將深度學(xué)習(xí)技術(shù)應(yīng)用于目標(biāo)檢測(cè)識(shí)別領(lǐng)域,通過(guò)組合低層特征形成更加抽象的高層表示屬性類別或特征,以發(fā)現(xiàn)數(shù)據(jù)的分布式特征表示,刻畫出數(shù)據(jù)中更豐富的內(nèi)在信息。深度學(xué)習(xí)采用了神經(jīng)網(wǎng)絡(luò)相似的分層結(jié)構(gòu),系統(tǒng)由卷積層、池化層、全連接層等多層網(wǎng)絡(luò)組成,不同的網(wǎng)絡(luò)層對(duì)應(yīng)實(shí)現(xiàn)不同的功能。在目標(biāo)檢測(cè)識(shí)別領(lǐng)域中,深度學(xué)習(xí)技術(shù)在準(zhǔn)確性、魯棒性等方面具有優(yōu)勢(shì),由r-cnn催生出適于不同需求的fastr-cnn、fasterr-cnn等網(wǎng)絡(luò)結(jié)構(gòu),網(wǎng)絡(luò)的性能高,檢測(cè)準(zhǔn)確率和檢測(cè)效率也有大幅提升。因此本發(fā)明通過(guò)實(shí)現(xiàn)主流深度學(xué)習(xí)網(wǎng)絡(luò)結(jié)構(gòu),并調(diào)整優(yōu)化各層結(jié)構(gòu),從而使得對(duì)監(jiān)控視頻中人物細(xì)節(jié)的檢測(cè)準(zhǔn)確率大幅提升。
與現(xiàn)有技術(shù)相比,本發(fā)明提出了一種以深度學(xué)習(xí)為基礎(chǔ)、以云計(jì)算為支撐的監(jiān)控視頻人員模糊檢索方法。將攝像頭采集的視頻數(shù)據(jù)進(jìn)行云存儲(chǔ)和管理,利用hadoop的mapreduce并行化編程模型結(jié)合深度學(xué)習(xí)對(duì)視頻進(jìn)行數(shù)據(jù)識(shí)別挖掘,實(shí)現(xiàn)對(duì)目標(biāo)人員的快速準(zhǔn)確的模糊檢索。
附圖說(shuō)明
圖1為本發(fā)明實(shí)施例流程示意圖。
具體實(shí)施方式
為使本發(fā)明的目的、技術(shù)方案及優(yōu)點(diǎn)更加清楚明白,以下參照附圖并舉實(shí)施例,對(duì)本發(fā)明進(jìn)一步詳細(xì)說(shuō)明。
本實(shí)施例提供了基于深度學(xué)習(xí)的監(jiān)控視頻人員模糊檢索方法,其具體步驟為視頻人員模糊監(jiān)控系統(tǒng)利用opencv,流媒體服務(wù)器,webcamcapture等技術(shù)手段,不斷采集攝像頭的視頻數(shù)據(jù)。將不同攝像頭不同時(shí)間段的視頻數(shù)據(jù)進(jìn)行編碼壓縮,存儲(chǔ)到hdfs中。利用hbase存儲(chǔ)視頻的索引,首先建立元數(shù)據(jù)的配置信息,其中包含hbase中存放數(shù)據(jù)的表信息、需要存入hdfs視頻的存儲(chǔ)位置、命名規(guī)則及文件數(shù)據(jù)字段的描述與配置信息、文件字段與表字段的關(guān)系等。將視頻分段存儲(chǔ)到sequencefile的鍵值對(duì)中,并將視頻索引數(shù)據(jù)用hbaseapi以put方式存儲(chǔ)。利用深度學(xué)習(xí)子系統(tǒng),從海量的視頻監(jiān)控?cái)?shù)據(jù)中篩選出海量的訓(xùn)練樣本組成訓(xùn)練數(shù)據(jù)庫(kù),對(duì)相應(yīng)的cnn神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,通過(guò)不斷的采集數(shù)據(jù),不斷的修改網(wǎng)絡(luò)模型,改善識(shí)別效果。以深度神經(jīng)網(wǎng)絡(luò)為核心的訓(xùn)練學(xué)習(xí)過(guò)程,該過(guò)程首先將收集整理的人物特征圖像庫(kù)以及監(jiān)控實(shí)際圖像作為原始數(shù)據(jù),為訓(xùn)練原始圖片添加相應(yīng)標(biāo)簽,標(biāo)注出圖像中感興趣的部分,然后對(duì)獲取的圖像進(jìn)行適當(dāng)?shù)念A(yù)處理,這是因?yàn)闊o(wú)論是圖像數(shù)據(jù)庫(kù)中的樣本圖像,還是實(shí)時(shí)采集的圖像,其質(zhì)量都會(huì)對(duì)識(shí)別的結(jié)果有很大影響。為了快速、穩(wěn)定地進(jìn)行特征抽取,就必須消除噪聲,校正失真,把圖像變換成標(biāo)準(zhǔn)形式,使圖像能夠很容易地抽取特征。設(shè)計(jì)fasterr-cnn網(wǎng)絡(luò)結(jié)構(gòu),并且利用上述構(gòu)建的數(shù)據(jù)集對(duì)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,得到最優(yōu)的網(wǎng)絡(luò)模型。
訓(xùn)練完成后,開始識(shí)別操作,對(duì)用戶輸入的人員描述進(jìn)行檢索,具體步驟如下:a)
利用fasterr-cnn檢測(cè)出視頻幀中的人員;b)利用先驗(yàn)知識(shí)切分人員的褲子和上衣,利用快速主題色分析算法確定衣物的顏色;c)利用人臉識(shí)別算法輔助頭發(fā)檢測(cè)識(shí)別人員的性別,利用先驗(yàn)知識(shí)識(shí)別出高矮以及胖瘦。上述步驟嚴(yán)格按照順序執(zhí)行,在不滿足前一個(gè)條件的情況下,不進(jìn)行后續(xù)步驟,以加速算法執(zhí)行速度。