專利名稱:基于深度信息聚類的復雜場景人數(shù)統(tǒng)計方法
技術領域:
本發(fā)明屬于視頻智能監(jiān)控技術領域,涉及一種基于深度信息聚類的復雜場景人數(shù)統(tǒng)計方法。
背景技術:
目前人數(shù)統(tǒng)計方法主要有基于紅外感應器,基于單目相機和基于雙目相機三種不同的硬件?;诩t外感應器的人數(shù)統(tǒng)計方法主要是利用有人體經(jīng)過時,會阻斷紅外信號的接受,從而實現(xiàn)計數(shù)功能,但由于紅外信號阻斷時,無法準確統(tǒng)計經(jīng)過的人數(shù),所以如果多人統(tǒng)計經(jīng)過感應器,則會產(chǎn)生漏檢,此方法的整體統(tǒng)計精度在80%左右。·基于單目的人數(shù)統(tǒng)計算法主要依靠常見的圖像處理算法以及模式識別方法,對經(jīng)過場景的人頭進行檢測跟蹤,從而達到人數(shù)統(tǒng)計的目的,這種方法由于計算機視覺算法的成熟度原因,無法很好的處理光照,陰影等干擾,統(tǒng)計精度一般只能達到90%左右,如果遇到多人擁擠通過的情況,性能會更低。而基于雙目的人數(shù)統(tǒng)計算法,利用立體視覺的特性,可將拍攝場景中的深度信息計算出來,從而能對人頭位置有更好的估計和檢測,但由于現(xiàn)有深度信息的精度較低,因此對其如何利用就成為影響統(tǒng)計精度的關鍵,目前一般是以簡單的閾值來區(qū)分人頭和頭肩位置,從而檢測人頭的個數(shù),但這種方法在人數(shù)十分擁擠,或者人體互相遮擋嚴重時,性能下降會比較厲害,一般統(tǒng)計精度能在95%左右。
發(fā)明內(nèi)容
本發(fā)明是以雙目相機為硬件,在深度信息的基礎上,采用了深度信息聚類分割的方法,將復雜場景下的人群進行很好的獨立分割,即使在多人擁擠的情況下,也能較好的區(qū)分每個人體的位置,然后對每個人體進行跟蹤,從而達到很高的人數(shù)統(tǒng)計精度。本發(fā)明解決技術問題所采取的技術方案為
步驟I :采用雙目相機作為深度信息的獲取設備,輸出為幀率25FPS的CIF分辨率的深度圖,深度圖中,每個像素的取值范圍為0-255,值越大表示該像素所代表的目標距離鏡頭越近;
步驟2 :對深度圖進行背景建模,并隨著場景的變化,學習更新每個像素的混合高斯模型,確定背景分布,具體是
首先對深度圖進行背景建模,用由^個高斯成分組成的混合高斯模型表示像素在時間域上的概率分布模型,即深度圖中像素J·在 時刻取值為
的概率為
權利要求
1.基于深度信息聚類的復雜場景人數(shù)統(tǒng)計方法,其特征在于該方法包括以下步驟 步驟I :采用雙目相機作為深度信息的獲取設備,輸出為幀率25FPS的CIF分辨率的深度圖,深度圖中,每個像素的取值范圍為0-255,值越大表示該像素所代表的目標距離鏡頭越近; 步驟2 :對深度圖進行背景建模,并隨著場景的變化,學習更新每個像素的混合高斯模型,確定背景分布,具體是 首先對深度圖進行背景建模,用由^個高斯成分組成的混合高斯模型表示像素在時間域上的概率分布模型,即深度圖中像素J·在 時刻取值為 的概率為
2.根據(jù)權利要求I所述的基于深度信息聚類的復雜場景人數(shù)統(tǒng)計方法,其特征在于步驟2中的學習更新方法是將混合高斯模型中的^個高斯成分按由大到小排序, / crJJ然后用像素的當前值\與其混合高斯模型中的K個高斯成分逐一比較,若4與第i個高斯成分的均值/4之間的差小于5倍的該高斯成分的標準差則該高斯成分被~更新,其余高斯成分保持不變,更新方程如下
3.根據(jù)權利要求I所述的基于深度信息聚類的復雜場景人數(shù)統(tǒng)計方法,其特征在于步驟4中全局密度函數(shù)的核估計具體是空間任一點X的概率密度可估計為
4.根據(jù)權利要求I所述的基于深度信息聚類的復雜場景人數(shù)統(tǒng)計方法,其特征在于步驟4中密度吸引子和密度吸引具體是已知全局密度函數(shù)的局部極大值點Y ,對任意的JC e Ω,如果存在點集( .巧,使得4 A 4 = ^且A位于I -I的梯度方向上,則稱X被/密度吸引,而稱/為X的密度吸引;如果核函數(shù)在空間中的每一點都連續(xù)、可微,密度吸引子可以采用梯度方向指引的爬山法來搜索。
5.根據(jù)權利要求I所述的基于深度信息聚類的復雜場景人數(shù)統(tǒng)計方法,其特征在于步驟4中基于中心的聚類具體是已知密度吸引子如果存在Ce D使得VzeC , X都被/密度吸引且/ 4,則稱C為以/為中心的聚類,其中 力τ頁設的密度門限值。
6.根據(jù)權利要求3所述的基于深度信息聚類的復雜場景人數(shù)統(tǒng)計方法,其特征在于窗寬σ的選取直接會影響全局密度的估計結果,從而影響聚類數(shù)目σ的取值應和實際目標的大小一致,由于本方法應用在拍攝角度垂直向下的客流統(tǒng)計場學所以人體目標在深度圖中的大小,是可以根據(jù)人體的高度估計出來的,所以這里的τ的取值為估計人體寬度的一半。
7.根據(jù)權利要求5所述的基于深度信息聚類的復雜場景人數(shù)統(tǒng)計方法,其特征在于 用于過濾噪聲產(chǎn)生的影響,在相機高度已確定的情況下,可以計算出需要關注的人體高度所對應的深度圖灰度值,只要按此深度圖灰度值來設置 ,即可把不要的噪聲過濾。
全文摘要
本發(fā)明涉及一種基于深度信息聚類的復雜場景人數(shù)統(tǒng)計方法?,F(xiàn)有技術一般采用簡單的深度圖閾值化來實現(xiàn)對人頭的檢測,這樣做雖然簡單,計算速度快,但沒有完全利用好深度信息,導致人體過于擁擠時性能會下降。本發(fā)明是以雙目相機為硬件,在深度信息的基礎上,采用了深度信息聚類分割的方法,將復雜場景下的人群進行很好的獨立分割,即使在多人擁擠的情況下,也能較好的區(qū)分每個人體的位置,然后對每個人體進行跟蹤。本發(fā)明利用DENCLUE的聚類方法,充分利用了人體全局的聚類信息,包括深度差,人體先驗尺度等,從而可以將人體進行較好的檢測和分割,即使在人群擁擠,互相遮擋的復雜環(huán)境下也能達到98%以上統(tǒng)計準確率。
文檔編號G06M11/00GK102890791SQ20121031778
公開日2013年1月23日 申請日期2012年8月31日 優(yōu)先權日2012年8月31日
發(fā)明者尚凌輝, 王弘玥, 張兆生, 余天明, 高勇 申請人:浙江捷尚視覺科技有限公司