專利名稱:一種入侵檢測和識別方法
技術領域:
本發(fā)明涉及視頻監(jiān)控技術領域,特別是一種集成多種識別技術的視頻監(jiān)控方法。
技術背景
目前,視頻監(jiān)控應用非常廣泛。家庭、辦公樓、社區(qū)等等,通過視頻自動監(jiān)控,大量的節(jié)省了人力物力。但是,不足是現(xiàn)在的大部分視頻監(jiān)控只能對監(jiān)控區(qū)域內(nèi)的環(huán)境進行錄像監(jiān)控,而無法對區(qū)域內(nèi)的人進行自動識別,無法自動識別陌生人,然后采取相應的安防措施。
進行人自動識別,常用的技術包括人體識別、人臉識別。其中人臉識別識別率比較高,但是往往需要被識別人擺正姿勢,然后正對攝像頭進行拍照/錄像才能進行準確識別, 但是對于小偷、恐怖分子等入侵人員,要實現(xiàn)完成的標準臉部照相,然后識別是不可能的。 所以,實時的視頻監(jiān)控中僅采用人臉識別技術,所取得的識別率準確率是非常有限的。相對于人臉識別,人體識別它利用了人體肩部及以上區(qū)域的輪廓形狀基本穩(wěn)定,不易受到遮擋等優(yōu)勢,考慮不變矩具有平移、旋轉(zhuǎn)和縮放不變性,用以處理不同側而肩部形狀的變化,建立人體頭部和肩部形狀的二維識別模型,然后再進行識別。但是,僅使用人體識別,對于實時的動態(tài)入侵檢測和識別,還是不夠的。發(fā)明內(nèi)容
本發(fā)明的目的針對上述的現(xiàn)有問題,提出一種應用于視頻監(jiān)控領域的入侵檢測和識別方法,它可以集成多種人識別技術,同時充分發(fā)揮分布式協(xié)作技術,用以提高識別效率,提高家庭、社區(qū)等的安全防護效率。
本發(fā)明通過如下方案實現(xiàn)
一種入侵檢測和識別方法,為依次通過視頻數(shù)據(jù)采集、圖像識別、最后根據(jù)識別結果進行安全控制的方法,其特征在于,還包括步驟
a).通過圖像傳感器采集視野區(qū)域內(nèi)的實時視頻;
b).劃分視頻段,并從視頻段中分離出每幀的圖像,利用背景差分檢測出運動目標和區(qū)域,然后通過過濾器從視頻段內(nèi)選出記錄的運動目標的大小/形狀最接近閥值的代表幀圖像;
c).利用背景差分從該代表幀圖像提取運動目標,然后建立運動人體的頭肩二維模型并計算模型輪廓的不變矩形成特征向量;利用第一分類器進行人體目標的識別;
d).根據(jù)人體目標識別的結果,如果可判定為陌生人,則主控系統(tǒng)通過控制總線啟動本地或網(wǎng)絡報警裝置進行報警;如果不能準確判斷是否為陌生人,則進行人臉識別步驟;
e).進行人臉識別時,從代表幀圖像內(nèi)提取人臉的全局或局部特征;
如果能提取人臉的全局或局部特征,則通過第二分類器判斷主控系統(tǒng)數(shù)據(jù)庫內(nèi)是否存在與運動目標的人臉相同的圖像;存在,則主控系統(tǒng)為該人進行授權允許其進行與其相關的操作;否則啟動本地或網(wǎng)絡報警裝置進行報警;
若無法從代表幀圖像內(nèi)提取人臉的全局或局部特征,則主控系統(tǒng)啟動云識別步驟;
f).云識別步驟,主控系統(tǒng)將該代表幀圖像發(fā)送到云平臺,然后再由云平臺轉(zhuǎn)發(fā)到用戶的網(wǎng)絡終端;用戶利用網(wǎng)絡終端,通過人眼進行人工識別,如果判斷為認識的人,允許主控系統(tǒng)對該運動目標進行操作授權,否則判定為入侵的陌生人,用戶通過網(wǎng)絡終端控制主控系統(tǒng)報警或停止該運動目標在系統(tǒng)的操作。
作為優(yōu)選,所述的圖像傳感器以5 15幀/秒的速度進行視頻圖像采集;所述的視頻段長度為1 5分鐘。
進一步,所述的運動人體的頭肩二維模型建立時,先計算運動目標的寬高比,并判斷是否在0. 28 0. 36 ;計算垂直方向投影直方圖,找出頭頂附近的局部最大值,確定頭部寬度;最后計算頭肩長度,然后建立頭肩模型;當抽取頭肩模型失敗時,則認為屬于非人體的活動目標。
更進一步,所述的人臉識別時,所用的第二分類器為由全局分類器和局部分類器通過加權求和的方式進行并行集成得到整體分類器。所述的用戶的網(wǎng)絡終端通過本地安裝的客戶端進行接收來自云平臺的圖像,同時進行控制信號交互和數(shù)據(jù)傳輸。
綜上所述,本發(fā)明具有如下顯著特點
1.采用多種技術,集成了人體識別、人臉識別、云識別和人工輔助識別,可有效提高識別效率和準確率。
2.通過劃分視頻段、選取代表幀圖像等技術手段,可以降低視頻處理量,提高實時識別、實時報警的效率。
圖1是發(fā)明方法的核心步驟組成示意圖2是人體識別框圖3是發(fā)明方法的具體流程圖。
具體實施方式
參考圖1,本發(fā)明方法集成了人體識別、人臉識別、云識別技術。在實現(xiàn)入侵檢測和識別時,首先通過進行實時的視頻采集,對區(qū)域內(nèi)的進行運動目標進行監(jiān)控,同時為識別提供素材。然后,對視頻進行預處理,包括劃分視頻段,分離出每幀的圖像、選代表幀圖像等,最后,依次通過人體識別、人臉識別、云識別及用戶人工協(xié)助識別。
參考圖3,為本發(fā)明的實現(xiàn)的主要流程。首先
見步驟101,通過圖像傳感器采集視野區(qū)域內(nèi)的實時視頻;采集速率以5 15幀/ 秒的速度為適宜,其中優(yōu)選方案為10幀/秒。與傳統(tǒng)的為了提高實時性,而強調(diào)采集速率不同,本發(fā)明采集的視頻為了滿足后期的多重識別處理,所以采集速率不必太高,如果太高必定加大識別的計算量,反而不利于識別準確率和效率的提高;
步驟102,主控系統(tǒng)的視頻處理模塊將采集的實時視頻輸入進行分割劃分為視頻段。劃分時候可以批量劃分,也可以按順序進行按需劃分。視頻段長度為1 5分鐘。具體可以根據(jù)圖像傳感器或攝像設備所覆蓋的區(qū)域,然后估算人正常走過該區(qū)域所需要的時間來決定視頻段的長度。
步驟103,從視頻段中分離出每幀的圖像,然后利用背景差分檢測出運動目標和區(qū)域,提取運動目標。步驟104,當采用背景差分無法從該視頻段內(nèi)提取運動目標時,也就說明該時間段內(nèi)沒有運動目標也就沒有進行識別的對象、沒有入侵者,所以可以進行下一視頻段處理,轉(zhuǎn)回到102 ;當提出到運動目標時候,進入步驟105 ;
步驟105,通過主控系統(tǒng)的過濾器從視頻段內(nèi)選出記錄的運動目標的大小/形狀最接近閥值的代表幀圖像。代表幀圖像可以是該視頻段內(nèi)記錄的運動目標最大的幀,也可以是記錄的運動目標元素最多、輪廓最清楚的一幀。具體實施可以做進一步定義。
步驟106,從代表幀圖像中提取運動目標;
步驟107,主控系統(tǒng)內(nèi)的人體識別模塊將建立該運動人體的頭肩二維模型并計算模型輪廓的不變矩形成特征向量。參考圖2,為進行人體識別的時候的整個流程框圖。特征向量提取后,將通過第一分類器即BP網(wǎng)絡分配器進行識別并輸出分類結果;其中BP網(wǎng)絡分配器從樣本集中,通過BP網(wǎng)絡訓練來不斷更新或修正。運動人體的頭肩二維模型建立時, 先計算運動目標的寬高比,并判斷是否在0. 28 0. 36 ;計算垂直方向投影直方圖,找出頭頂附近的局部最大值,確定頭部寬度;最后計算頭肩長度,然后建立頭肩模型;當抽取頭肩模型失敗時,則認為屬于非人體的活動目標。
步驟108,判斷是否能夠從代表幀圖像形成頭肩二維模型或能否提取特征向量,如果可以則通過第一分類器進行人體識別,轉(zhuǎn)到109 ;否則說明運動目標不是人,不需要進行下一步的人臉識別。
步驟109,第一分類器進行人體識別,如果識別結果是陌生人,則轉(zhuǎn)到步驟110,主控系統(tǒng)通過控制總線啟動本地或網(wǎng)絡報警裝置進行報警,并禁止其后續(xù)的各類操作。如果無法進行準確識別,則啟動人臉識別程序,進入步驟111.
步驟111,系統(tǒng)從代表幀圖像內(nèi)提取人臉的全局或局部特征;
步驟112,判斷能否提取人臉的全局或局部特征,如果能提取則轉(zhuǎn)到113,否則啟動云識別,進入115;
步驟113,利用第二分類器進行人臉識別。第二分類器判斷主控系統(tǒng)數(shù)據(jù)庫內(nèi)是否存在與運動目標的人臉相同的圖像;存在,則轉(zhuǎn)到步驟114,主控系統(tǒng)為該人進行授權允許其進行與其相關的操作;否則啟動本地或網(wǎng)絡報警裝置進行報警。如果根據(jù)提取到的人臉特征無法進行判斷,則啟動云識別。第二分類器為由全局分類器和局部分類器通過加權求和的方式進行并行集成得到整體分類器。
步驟115,主控系統(tǒng)通過網(wǎng)絡將代表幀對應的圖像發(fā)送到云平臺。
步驟116,云平臺根據(jù)主控系統(tǒng)之間協(xié)定的轉(zhuǎn)發(fā)機制,將該圖像轉(zhuǎn)發(fā)到一個或多個用戶對應的網(wǎng)絡終端,通過人工實現(xiàn)識別。
步驟117,用戶應的網(wǎng)絡終端收到該圖像,用戶判斷是否為熟悉的人,如果是則直接或間接反饋至主控系統(tǒng),允許對該目標授權(步驟119);否則禁止其后續(xù)的操作,通過啟動本地或網(wǎng)絡報警裝置進行報警(步驟120)。用戶的網(wǎng)絡終端可以通過本地安裝的客戶端進行接收來自云平臺的圖像,同時進行控制信號交互和數(shù)據(jù)傳輸。
權利要求
1.一種入侵檢測和識別方法,為依次通過視頻數(shù)據(jù)采集、圖像識別、最后根據(jù)識別結果進行安全控制的方法,其特征在于,還包括步驟a).通過圖像傳感器采集視野區(qū)域內(nèi)的實時視頻;b).劃分視頻段,并從視頻段中分離出每幀的圖像,利用背景差分檢測出運動目標和區(qū)域,然后通過過濾器從視頻段內(nèi)選出記錄的運動目標的大小/形狀最接近閥值的代表幀圖像;c).利用背景差分從該代表幀圖像提取運動目標,然后建立運動人體的頭肩二維模型并計算模型輪廓的不變矩形成特征向量;利用第一分類器進行人體目標的識別;d).根據(jù)人體目標識別的結果,如果可判定為陌生人,則主控系統(tǒng)通過控制總線啟動本地或網(wǎng)絡報警裝置進行報警;如果不能準確判斷是否為陌生人,則進行人臉識別步驟;e).進行人臉識別時,從代表幀圖像內(nèi)提取人臉的全局或局部特征;如果能提取人臉的全局或局部特征,則通過第二分類器判斷主控系統(tǒng)數(shù)據(jù)庫內(nèi)是否存在與運動目標的人臉相同的圖像;存在,則主控系統(tǒng)為該人進行授權允許其進行與其相關的操作;否則啟動本地或網(wǎng)絡報警裝置進行報警;若無法從代表幀圖像內(nèi)提取人臉的全局或局部特征,則主控系統(tǒng)啟動云識別步驟;f).云識別步驟,主控系統(tǒng)將該代表幀圖像發(fā)送到云平臺,然后再由云平臺轉(zhuǎn)發(fā)到用戶的網(wǎng)絡終端;用戶利用網(wǎng)絡終端,通過人眼進行人工識別,如果判斷為認識的人,允許主控系統(tǒng)對該運動目標進行操作授權,否則判定為入侵的陌生人,用戶通過網(wǎng)絡終端控制主控系統(tǒng)報警或停止該運動目標在系統(tǒng)的操作。
2.如權利要求1所述的入侵檢測和識別方法,其特征在于,所述的圖像傳感器以5 15幀/秒的速度進行視頻圖像采集。
3.如權利要求1或2所述的入侵檢測和識別方法,其特征在于,所述的視頻段長度為 1 5分鐘。
4.如權利要求3所述的入侵檢測和識別方法,其特征在于,所述的運動人體的頭肩二維模型建立時,先計算運動目標的寬高比,并判斷是否在0. 28 0. 36 ;計算垂直方向投影直方圖,找出頭頂附近的局部最大值,確定頭部寬度;最后計算頭肩長度,然后建立頭肩模型;當抽取頭肩模型失敗時,則認為屬于非人體的活動目標。
5.如權利要求4所述的入侵檢測和識別方法,其特征在于,所述的人臉識別時,所用的第二分類器為由全局分類器和局部分類器通過加權求和的方式進行并行集成得到整體分類器。
6.如權利要求1、2、4、5任一所述的入侵檢測和識別方法,其特征在于,所述的用戶的網(wǎng)絡終端通過本地安裝的客戶端進行接收來自云平臺的圖像,同時進行控制信號交互和數(shù)據(jù)傳輸。
全文摘要
本發(fā)明公開一種應用于視頻監(jiān)控領域的入侵檢測和識別方法,它可以集成了人體識別、人臉識別、云識別和人工輔助識別,采用了劃分視頻段、選取代表幀圖像;利用背景差分檢測出運動目標和區(qū)域,然后通過過濾器從視頻段內(nèi)選出記錄的運動目標的大小/形狀最接近閥值的代表幀圖像;利用背景差分從該代表幀圖像提取運動目標,然后建立運動人體的頭肩二維模型并計算模型輪廓的不變矩形成特征向量;利用第一分類器進行人體目標的識別等技術授權,從而可以降低視頻處理量,提高實時識別、實時報警的效率,提高家庭、社區(qū)等的安全防護效率。
文檔編號G06K9/00GK102521578SQ201110427589
公開日2012年6月27日 申請日期2011年12月19日 優(yōu)先權日2011年12月19日
發(fā)明者盧林發(fā), 葉燦才, 黃家祺 申請人:中山愛科數(shù)字科技股份有限公司