述檢測(cè)區(qū)域在Y、U、V三個(gè)通道上的第一邊緣圖,所述Y、U、V通道分別對(duì)應(yīng)一個(gè)第 一邊緣圖,生成一個(gè)第三邊緣圖,所述第三邊緣圖各位置的數(shù)據(jù)為0,所述三個(gè)第一邊緣圖 以及第三邊緣圖大小相同,都為所述檢測(cè)區(qū)域的四分之一大小,將所述三個(gè)第一邊緣圖和 所述第三邊緣圖的拼接圖作為所述第三通道的輸出數(shù)據(jù)。
3. 根據(jù)權(quán)利要求2所述的方法,其特征在于,所述部位檢測(cè)層包括三個(gè)子層,分別為 第一子層、第二子層和第三子層,所述部位檢測(cè)層的第一子層包括Ml個(gè)過濾器,所述部位 檢測(cè)層的第二子層包括M2個(gè)過濾器,所述部位檢測(cè)層的第三子層包括M3個(gè)過濾器,其中, M1+M2+M3=M ; 所述部位檢測(cè)層的第一子層的Ml個(gè)過濾器分別檢測(cè)所述檢測(cè)區(qū)域內(nèi)的Ml個(gè)部位,得 到Ml個(gè)響應(yīng)圖; 所述部位檢測(cè)層的第二子層的M2個(gè)過濾器分別檢測(cè)所述檢測(cè)區(qū)域內(nèi)的M2個(gè)部位,得 到M2個(gè)響應(yīng)圖; 所述部位檢測(cè)層的第三子層的M3個(gè)過濾器分別檢測(cè)所述檢測(cè)區(qū)域內(nèi)的M3個(gè)部位,得 到M3個(gè)響應(yīng)圖。
4. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述形變處理層根據(jù)所述M個(gè)部位對(duì)應(yīng)的 響應(yīng)圖分別確定所述M個(gè)部位的形變,并根據(jù)所述M個(gè)部位的形變確定所述M個(gè)部位的得 分圖,包括: 所述形變處理層根據(jù)所述M個(gè)部位對(duì)應(yīng)的響應(yīng)圖,分別按照公式(1)得到所述第P個(gè) 部位的形變得分圖:
(1) 其中,Bp表示第p個(gè)部分的形變得分圖,I < p < M,Mp表示所述第p個(gè)部分對(duì)應(yīng) 的響應(yīng)圖,N表示所述第p個(gè)部位的限制條件,Dn,p表示第η個(gè)限制條件對(duì)應(yīng)的得分圖, I < η < N,Cn,p表示第η個(gè)限制條件對(duì)應(yīng)的權(quán)重; 所述形變處理層根據(jù)所述形變得分圖,按照公式(2 )確定所述第P部位的得分圖:
(2) 其中,^表示(X,y)位置上Bp的值。
5. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述遮擋處理層包括三個(gè)子層,分別為第 一子層、第二子層、第三子層,所述遮擋處理層根據(jù)所述M個(gè)部位的得分圖確定所述M個(gè)部 位對(duì)應(yīng)的遮擋,包括: 所述遮擋處理層確定所述M個(gè)部位在所述遮擋處理層的子層上的得分圖和可視性; 所述遮擋處理層的第一子層、第二子層、第三子層分別按照公式(3)、(4)、(5)計(jì)算所述 各個(gè)部位的可視性:
其中,4表示第P個(gè)部位在所述遮擋處理層的第1層上的得分圖,4表示4的權(quán) 重矩陣,<表示&的偏置,<表示第P個(gè)部位在所述遮擋處理層的第1層上的可視性, 〇 (tMl+expK))' <表示第P個(gè)部位在所述遮擋處理層的第1子層上可視性,用W1表 示h1和h 1+1之間的傳遞矩陣,表示W(wǎng)1的第j列,Wds表示隱含變量爐τ的線性分類器的參 數(shù),(x)T表示矩陣X的轉(zhuǎn)置,5^表示所述卷積神經(jīng)網(wǎng)絡(luò)的輸出結(jié)果。
6. -種卷積神經(jīng)網(wǎng)絡(luò),其特征在于,包括: 特征提取層,用于根據(jù)提取圖像中檢測(cè)區(qū)域的像素值,對(duì)所述檢測(cè)區(qū)域的像素值進(jìn)行 預(yù)處理,并對(duì)所述預(yù)處理后的圖像進(jìn)行特征提取,得到所述檢測(cè)區(qū)域的特征圖; 部位檢測(cè)層,用于通過M個(gè)過濾器分別檢測(cè)所述檢測(cè)區(qū)域的特征圖,輸出所述檢測(cè)區(qū) 域的M個(gè)部位對(duì)應(yīng)的響應(yīng)圖,每個(gè)過濾器用于檢測(cè)一個(gè)部位,每個(gè)部位對(duì)應(yīng)一個(gè)響應(yīng)圖; 形變處理層,用于根據(jù)所述M個(gè)部位對(duì)應(yīng)的響應(yīng)圖分別確定所述M個(gè)部位的形變,并根 據(jù)所述N個(gè)部位的形變確定所述M個(gè)部位的得分圖; 遮擋處理層,用于根據(jù)所述M個(gè)部位的得分圖確定所述M個(gè)部位對(duì)應(yīng)的遮擋; 分類器,用于根據(jù)所述遮擋處理層的輸出結(jié)果,確定所述檢測(cè)區(qū)域內(nèi)是否有目標(biāo)物體。
7. 根據(jù)權(quán)利要求6所述的卷積神經(jīng)網(wǎng)絡(luò),其特征在于,所述特征提取層包括三個(gè)通道, 分別為第一通道、第二通道、第三通道; 其中,所述第一通道的輸出數(shù)據(jù)對(duì)應(yīng)所述檢測(cè)區(qū)域內(nèi)的YUV像素值的Y通道數(shù)據(jù); 所述第二通道,用于將所述檢測(cè)區(qū)域的大小縮小為原大小的四分之一,并將所述縮小 后的檢測(cè)區(qū)域轉(zhuǎn)換成YUV格式,通過Sobel邊緣算子過濾所述轉(zhuǎn)換為YUV格式的檢測(cè)區(qū)域, 分別得到所述檢測(cè)區(qū)域在Y、U、V三個(gè)通道上第一邊緣圖,所述Y、U、V通道分別對(duì)應(yīng)一個(gè)第 一邊緣圖,取所述三個(gè)第一邊緣圖中各位置上的最大值,組成一個(gè)第二邊緣圖,所述三個(gè)第 一邊緣圖以及第二邊緣圖大小相同,都為所述檢測(cè)區(qū)域的四分之一大小,將所述三個(gè)第一 邊緣圖和所述第二邊緣圖的拼接圖作為所述第二通道的輸出數(shù)據(jù); 所述第三通道,用于將所述檢測(cè)區(qū)域的大小縮小為原大小的四分之一,并將所述縮小 后的檢測(cè)區(qū)域轉(zhuǎn)換成YUV格式,通過Sobel邊緣算子過濾所述轉(zhuǎn)換為YUV格式的檢測(cè)區(qū)域, 分別得到所述檢測(cè)區(qū)域在Y、U、V三個(gè)通道上的第一邊緣圖,所述Y、U、V通道分別對(duì)應(yīng)一個(gè) 第一邊緣圖,生成一個(gè)第三邊緣圖,所述第三邊緣圖各位置的數(shù)據(jù)為0,所述三個(gè)第一邊緣 圖以及第三邊緣圖大小相同,都為所述檢測(cè)區(qū)域的四分之一大小,將所述三個(gè)第一邊緣圖 和所述第三邊緣圖的拼接圖作為所述第三通道的輸出數(shù)據(jù)。
8. 根據(jù)權(quán)利要求7所述的卷積神經(jīng)網(wǎng)絡(luò),其特征在于,所述部位檢測(cè)層包括三個(gè)子層, 分別為第一子層、第二子層和第三子層,所述部位檢測(cè)層的第一子層包括Ml個(gè)過濾器,所 述部位檢測(cè)層的第二子層包括M2個(gè)過濾器,所述部位檢測(cè)層的第三子層包括M3個(gè)過濾器, 其中,M1+M2+M3=M ; 所述部位檢測(cè)層的第一子層,用于通過Ml個(gè)過濾器分別檢測(cè)所述檢測(cè)區(qū)域內(nèi)的Ml個(gè) 部位,得到Ml個(gè)響應(yīng)圖; 所述部位檢測(cè)層的第二子層,用于通過M2個(gè)過濾器分別檢測(cè)所述檢測(cè)區(qū)域內(nèi)的M2個(gè) 部位,得到M2個(gè)響應(yīng)圖; 所述部位檢測(cè)層的第三子層,用于通過M3個(gè)過濾器分別檢測(cè)所述檢測(cè)區(qū)域內(nèi)的M3個(gè) 部位,得到M3個(gè)響應(yīng)圖。
9. 根據(jù)權(quán)利要求8所述卷積神經(jīng)網(wǎng)絡(luò),其特征在于,所述形變處理層具體用于: 所述形變處理層根據(jù)所述M個(gè)部位對(duì)應(yīng)的響應(yīng)圖,分別按照公式(1)得到所述第P個(gè) 部位的形變得分圖:
(1) 其中,Bp表示第P個(gè)部分的形變得分圖,I < P < M,Mp表示所述第P個(gè)部分對(duì)應(yīng) 的響應(yīng)圖,N表示所述第p個(gè)部位的限制條件,Dn,p表示第η個(gè)限制條件對(duì)應(yīng)的得分圖, I < η < N,Cn,p表示第η個(gè)限制條件對(duì)應(yīng)的權(quán)重; 所述形變處理層根據(jù)所述形變得分圖,按照公式(2 )確定所述第P部位的得分圖:
(2) 其中,f '1表示(X,y)位置上Bp的值。
10. 根據(jù)權(quán)利要求8所述卷積神經(jīng)網(wǎng)絡(luò),其特征在于,所述遮擋處理層包括三個(gè)子層, 分別為第一子層、第二子層、第三子層; 所述遮擋處理層的第一子層、第二子層、第三子層分別按照公式(3)、(4)、(5)計(jì)算所述 各個(gè)部位的可視性:
其中,4表示第P個(gè)部位在所述遮擋處理層的第1層上的得分圖,< 表示4的權(quán) 重矩陣,表示&的偏置,< 表示第P個(gè)部位在所述遮擋處理層的第i層上的可視性, 〇 (tMl+expK))' <表示第P個(gè)部位在所述遮擋處理層的第1子層上可視性,用W1表 示h1和h 1+1之間的傳遞矩陣,表示W(wǎng)1的第j列,Wds表示隱含變量p的線性分類器的 參數(shù),(x) T表示矩陣X的轉(zhuǎn)置,5表示所述卷積神經(jīng)網(wǎng)絡(luò)的輸出結(jié)果。
【專利摘要】本發(fā)明提供一種卷積神經(jīng)網(wǎng)絡(luò)和基于卷積神經(jīng)網(wǎng)絡(luò)的目標(biāo)物體檢測(cè)方法,所述卷積神經(jīng)網(wǎng)絡(luò)包括:特征提取層、部位檢測(cè)層、形變處理層、遮擋處理層和分類器,本發(fā)明實(shí)施例提供的卷積神經(jīng)網(wǎng)絡(luò),聯(lián)合了優(yōu)化特征提取、部位檢測(cè)、形變處理、遮擋處理和分類器學(xué)習(xí),通過形變處理層使得卷積神經(jīng)網(wǎng)絡(luò)能夠?qū)W習(xí)目標(biāo)物體的形變,并且形變學(xué)習(xí)和遮擋處理進(jìn)行交互,這種交互能提高分類器根據(jù)所學(xué)習(xí)到的特征分辨目標(biāo)物體和非目標(biāo)物體的能力。
【IPC分類】G06T7-00
【公開號(hào)】CN104680508
【申請(qǐng)?zhí)枴緾N201310633797
【發(fā)明人】歐陽萬里, 許春景, 劉健莊, 王曉剛
【申請(qǐng)人】華為技術(shù)有限公司
【公開日】2015年6月3日
【申請(qǐng)日】2013年11月29日
【公告號(hào)】WO2015078185A1