基于深度學(xué)習(xí)和大規(guī)模集群的智能人臉追逃系統(tǒng)及方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明屬于安防監(jiān)控領(lǐng)域,具體來說涉及一種基于深度學(xué)習(xí)和大規(guī)模集群的人臉 追逃系統(tǒng)及方法。
【背景技術(shù)】
[0002] 隨著經(jīng)濟的高速發(fā)展以及城鎮(zhèn)建設(shè)速度的加快,導(dǎo)致城市中人口密集,流動人口 增加,社會犯罪率呈逐年上升的趨勢,引發(fā)了城市建設(shè)中的交通、社會治安、重點區(qū)域防范 等城市管理問題。因此,近年來,針對犯罪分子流動性較強,情況比較復(fù)雜,重點人員布控困 難等情況,人臉智能布控和追逃系統(tǒng)應(yīng)運而生。此類系統(tǒng)可應(yīng)用于傳統(tǒng)視頻布控網(wǎng)絡(luò),并且 無需使用者配合,因而操作隱蔽性強,特別適合于公安部門的安全防范、罪犯監(jiān)控、罪犯抓 捕等。為公安防范體系提供簡單且高效的技術(shù)手段。此外,隨著大眾的安全意識的增強,以 及對個人生命財產(chǎn)的自我保護,現(xiàn)在商業(yè)中民用的安全保護體系也快速發(fā)展,基于人臉識 別的智能安全系統(tǒng)也得到越來越廣泛的應(yīng)用。
[0003] 現(xiàn)有的人臉識別技術(shù),對于限定在一定條件下的人臉圖像,例如,正面人臉、光照 條件良好、無遮擋物體、無眼鏡反光情況下獲取的人臉圖像,其識別率可以滿足一些民用領(lǐng) 域的低端應(yīng)用(如門禁、考勤等)的要求。然而,現(xiàn)有的人臉視頻布控主要利用城市中已有的 監(jiān)控攝像機采集人臉圖像,因此很容易受到光照、姿態(tài)、遮擋、外表附屬物以及圖像采集設(shè) 備的影響。當(dāng)上述一個或多個條件發(fā)生變化時,識別效果會大大降低。再者,當(dāng)數(shù)據(jù)庫規(guī)模 達到一定數(shù)量級后(如百萬級),目前人臉識別系統(tǒng)的誤報警率與漏檢率會大幅升高,造成 不法份子躲過檢查的幾率大大提高。因此,很大程度上限制了基于人臉識別的智能監(jiān)控系 統(tǒng)在公共安全防范領(lǐng)域的大規(guī)模應(yīng)用。此外,隨著視頻監(jiān)控的廣泛普及,大規(guī)模視頻監(jiān)控網(wǎng) 絡(luò)已在全國各地建成。這給人臉追逃系統(tǒng)布控的實時性,準(zhǔn)確性,可擴展性等提出了非常高 的要求。
【發(fā)明內(nèi)容】
[0004] 本發(fā)明為了有效地解決上述問題,提出了一種基于深度學(xué)習(xí)的智能人臉追逃系 統(tǒng)。
[0005] 本發(fā)明設(shè)計的基于深度學(xué)習(xí)和大規(guī)模集群的智能人臉追逃系統(tǒng),包括:視頻輸入 單元,分發(fā)服務(wù)器,人臉識別服務(wù)器集群,
[0006] 所述視頻輸入單元,主要對多路網(wǎng)絡(luò)攝像頭采集的視頻流進行解碼,分析處理,并 將處理后的視頻幀傳送給分發(fā)服務(wù)器,
[0007] 所述分發(fā)服務(wù)器,將從所述視頻輸入單元獲取的視頻幀分發(fā)給所述人臉識別服務(wù) 器集群中的人臉識別服務(wù)器進行分析,
[0008] 人臉識別服務(wù)器集群,包含多個人臉識別服務(wù)器,每個人臉識別服務(wù)器對接入的 視頻幀調(diào)用基于深度學(xué)習(xí)的人臉識別算法進行分析處理,并將處理的結(jié)果發(fā)送到輸出服務(wù) 器上。
[0009] 本發(fā)明還涉及一種基于深度學(xué)習(xí)和大規(guī)模集群的智能人臉追逃方法,該方法的步 驟包括:
[0010] 步驟S1,視頻輸入單元從多路網(wǎng)絡(luò)攝像頭采集視頻流,并對所述視頻流進行解碼, 分析處理,并將處理后的視頻幀傳送給分發(fā)服務(wù)器;
[0011] 步驟S2,所述分發(fā)服務(wù)器將從視頻輸入單元獲取的視頻幀分發(fā)給特定的人臉識別 服務(wù)器進行分析;
[0012] 步驟S3,人臉識別服務(wù)器對接入的視頻幀調(diào)用基于深度學(xué)習(xí)的人臉識別算法進行 分析處理;
[0013] 步驟S4,人臉識別服務(wù)器將處理的結(jié)果發(fā)送到相關(guān)的輸出服務(wù)器上。
[0014]本發(fā)明通過深度學(xué)習(xí) (deep learning),能夠在圖像質(zhì)量下降的情況下依然保持 較高的識別率,更重要的是在大規(guī)模數(shù)據(jù)庫中保持較低的誤報率與漏檢率,從而保證智能 追逃系統(tǒng)的可靠性與魯棒性,使基于人臉識別的智能追逃系統(tǒng)在安防領(lǐng)域達到真實可用。
[0015] 此外,本發(fā)明的基于深度學(xué)習(xí)和大規(guī)模集群的人臉追逃系統(tǒng)可以提供對多機多路 和一機多路的靈活支持。當(dāng)人臉數(shù)據(jù)庫較大,為了提高處理效率,可將人臉識別服務(wù)器部署 在不同的物理服務(wù)器上,從而實現(xiàn)多機多路。由于采用了大規(guī)模集群方式,使得本系統(tǒng)能實 時處理成百上千路視頻并且擁有良好的可擴展性。
【附圖說明】
[0016] 圖1是基于深度學(xué)習(xí)和大規(guī)模集群智能人臉追逃系統(tǒng)框架圖;
[0017] 圖2是人臉識別服務(wù)器的內(nèi)部結(jié)構(gòu)圖;
[0018] 圖3是基于深度學(xué)習(xí)和大規(guī)模集群智能人臉追逃方法流程圖。
【具體實施方式】
[0019] 以下結(jié)合附圖1-3對本發(fā)明的各個實施例進行詳細的說明。
[0020] 如圖1所示,基于深度學(xué)習(xí)和大規(guī)模集群的智能人臉追逃系統(tǒng)包括:視頻輸入單元 10、分發(fā)服務(wù)器20、人臉識別服務(wù)器集群30、流媒體服務(wù)器40、分布式文件服務(wù)器50、消息中 心服務(wù)器60、數(shù)據(jù)庫70、Web前端服務(wù)器80和前端輸出90。
[0021] 所述視頻輸入單元10,主要對多路網(wǎng)絡(luò)攝像頭采集的視頻流進行解碼,分析處理, 并將處理后的視頻幀傳送給分發(fā)服務(wù)器20。
[0022] 在一個優(yōu)選的實施例中,所述視頻輸入單元10進一步包括圖像采集單元11,視頻 解碼單元12和圖像預(yù)處理單元13。
[0023] 其中,圖像采集單元11,從多路網(wǎng)絡(luò)攝像頭采集已編碼視頻流信號,并將該信號輸 入至視頻解碼單元12。
[0024] 視頻解碼單元12,對接收到的視頻流信號進行解碼,并將解碼后的信息輸入至圖 像預(yù)處理單元13。視頻解碼單元12將接收到視頻流信號解碼為視頻幀,并將視頻幀輸入至 圖像預(yù)處理單元13。
[0025]圖像預(yù)處理單元13,對解碼后的視頻幀進行預(yù)處理,如畫定熱區(qū),圖像去噪,圖像 去模糊等操作,最后將預(yù)處理后的視頻幀作為結(jié)果傳送至分發(fā)服務(wù)器20。
[0026]所述分發(fā)服務(wù)器20,將從視頻輸入單元10獲取的視頻幀分發(fā)給特定的人臉識別服 務(wù)器進行分析。分發(fā)服務(wù)器20管理著所有的人臉識別服務(wù)器,每當(dāng)有新的視頻幀需要接入 到人臉識別服務(wù)器進行分析時,都會先向分發(fā)服務(wù)器20請求一個可用的人臉識別服務(wù)器。 該請求過程可由管理員在Web前端添加頻道時實現(xiàn),并把該頻道的配置參數(shù)都發(fā)到請求到 的對應(yīng)的人臉識別服務(wù)器上。
[0027] 所述人臉識別服務(wù)器集群30,包含多個人臉識別服務(wù)器。每個人臉識別服務(wù)器都 支持多路視頻接入。每個人臉識別服務(wù)器對接入的視頻幀調(diào)用基于深度學(xué)習(xí)的人臉識別算 法進行分析處理,并將處理的結(jié)果發(fā)送到相關(guān)的服務(wù)器上,如流媒體服務(wù)器40,分布式文件 服務(wù)器50,消息中心服務(wù)器60。處理的結(jié)果可以為事件,圖片或視頻等。發(fā)送的方式可以為 通過網(wǎng)絡(luò)模塊。
[0028] 在一個具體的實施例中,人臉識別服務(wù)器對分發(fā)服務(wù)器20輸入的視頻幀圖像,檢 測人臉,并進行質(zhì)量判斷,挑選滿足要求的若干幀作為關(guān)鍵幀,并提取每一幀的人臉特征。 所述人臉特征使用多維特征向量表示,在一個實施例中,使用約180維特征向量來表示人臉 特征。在對圖像進行檢測時,提取圖像中的人臉位置、人臉關(guān)鍵點信息,所述人臉關(guān)鍵點信 息可包括眼角、眉毛的末端、嘴角、鼻尖等位置信息。當(dāng)所述若干幀為單幀時,該圖像本身為 關(guān)鍵幀;所述若干幀為多幀時,從該序列中挑選質(zhì)量好的N幀作為關(guān)鍵幀。其中,質(zhì)量的判斷 可以通過對后述指標(biāo)進行打分后,選取得分高的前N幀作為關(guān)鍵幀。所述指標(biāo)包括人臉圖片 清晰度、大小、真實人臉、遮擋、光照等等。對已檢測到人臉,在后續(xù)幀中進行跟蹤。
[0029] 在一個優(yōu)選的實施例中,所述質(zhì)量判斷的方法,包括下述步驟:
[0030] S11、對每個檢測到的人臉圖像,首先判斷兩眼間距是否滿足設(shè)定要求,若滿足要 求則執(zhí)行步驟S12;否則,舍棄該檢測到的人臉圖像;
[0031] S12、計算檢測到的人臉圖像的人臉置信度得分是否滿足設(shè)定要求,若滿足要求則 執(zhí)行步驟S13;否則,舍棄該檢測到的人臉圖像;
[0032] S13、計算正臉得分是否滿足設(shè)定要求,如滿足則判斷該幀能夠用于識別人臉;否 貝1J,舍棄該檢測到的人臉圖像。
[0033]在這個實施例中,對單個跟蹤抓拍的人臉,根據(jù)兩眼間距>25,人臉置信度得分〉 0.95,正臉得分的標(biāo)準(zhǔn),判斷該幀是否