完成所有隱含層的預(yù)訓(xùn)練為止,得到ir,,r;,rs的初始 值; (4. 3. 4)將最后一個(gè)隱含層的輸出作為softmax層的輸入,并且初始化softmax層的參 數(shù)。
[0019] 優(yōu)選的,其中步驟(5)具體為: (5.1)對(duì)輸入圖形E進(jìn)行灰度圖像轉(zhuǎn)換,得到輸入灰度圖像,對(duì)其進(jìn)行高斯金字塔縮 放,縮放比例為L,f) <。r;試,直到最小的灰度圖像的寬大于10 個(gè)像素且高大于25個(gè)像素,共得到0+1個(gè)主尺度,輸入圖像E的寬大于20像素,高大于50 像素; (5. 2)在該0+1個(gè)主尺度灰度圖像上分別計(jì)算其對(duì)應(yīng)的梯度幅值特征圖像; (5. 3)通過Bi-化bic插值在該0+1個(gè)主尺度梯度幅值圖像的0個(gè)間隔中,W等間隔方 式在每個(gè)間隔中進(jìn)行中間尺度插入,每個(gè)間隔插入四個(gè)中間尺度,共得到0*5+1個(gè)尺度的 梯度幅值特征圖像,上述四個(gè)中間尺度由距離其最近的主尺度的梯度幅值特征圖像插值得 到; (5. 4)在每個(gè)尺度的梯度幅值特征圖像上進(jìn)行快速窗口掃描,使用10*25大小的窗口 在每個(gè)梯度幅值特征圖像上掃描,對(duì)掃描得到的每個(gè)10*25像素大小的梯度幅值特征窗 口,將其拉直為一個(gè)250維的列向量,計(jì)算其得分函數(shù)值; (5. 5)輸出大于檢測(cè)闊值的窗口,W該窗口所在的比例為的梯度幅值特征圖像 的比例倒數(shù)1T縮放該圖像,并W該窗口在該尺度的梯度幅值特征圖像上的相對(duì)位置進(jìn)行還 原,還原得到該窗口在輸入圖像E的灰度圖像上的相對(duì)位置,該灰度圖像的尺度為1,該位 置為一個(gè)寬高比為10:25的矩形框; (5. 6)將還原得到的所有該些矩形框縮放為10*25像素大小的灰度窗口圖像,輸入到 訓(xùn)練得到的作為精細(xì)行人檢測(cè)器的自動(dòng)編碼機(jī)進(jìn)行分類; (5. 7)保留輸出層輸出的置信度a的f大于0. 5的灰度窗口圖像,將其作為候選人體 框; (5. 8)為每個(gè)候選人體框標(biāo)記一個(gè)五元組標(biāo)簽.1',4 ?.斯/),分別對(duì)應(yīng)該候選人 體框左上頂點(diǎn)的橫坐標(biāo),縱坐標(biāo),該候選人體框的寬度,高度W及置信度; (5. 9)對(duì)該些候選人體框進(jìn)行聚類,輸出人體檢測(cè)框。
[0020] 優(yōu)選的,其中步驟(5. 9)具體為: (5. 9. 1)將所有候選人體框按照置信度排序,每個(gè)框標(biāo)記設(shè)置為0,形成候選人體框集 合H,設(shè)置集合R表示真實(shí)候選框集合,初始化R為空集; (5. 9.。在集合腫選擇置信度最大的候選人體框,記為露-U-I:,,.1'"》?,.,,為:,-CO巧/::,], 將焉從H中移除,加入集合R后將其標(biāo)記設(shè)置為1; (5. 9. 3)計(jì)算H中所有候選人體框和A的重合度,重合度的計(jì)算方法為;
即該兩個(gè)矩形框.'!,4的面積重合部分除W兩個(gè)矩形框的平均面積; (5. 9. 4)將重合度大于0. 8的候選人體框從H中移除并加入到集合R中,且將該些候選 人體框的標(biāo)記設(shè)置為1,此時(shí)集合R中的候選人體框可W記為:《[爲(wèi),巧,...馬,...馬.!, 其中A- 山聳?['巧 > 0; (5.9.5)計(jì)算3中每個(gè)候選人體框的權(quán)重,= ^:^對(duì)這化1個(gè)候選人體框進(jìn)行 加權(quán)融合,輸出人體檢測(cè)框位置記為
(5. 9. 6)判斷集合H中是否還有候選人體框,如果沒有,結(jié)束檢測(cè);如果集合H中還有 候選人體框,將集合R清空,在集合H中重復(fù)步驟巧.9. 2)-巧.9. 5)。
【附圖說明】
[0021] 圖1為行人數(shù)據(jù)集及行人樣本標(biāo)注示例圖 圖2為不包括行人的背景數(shù)據(jù)集圖片示例 圖3為主尺度梯度幅值特征圖像和加速的相鄰尺度插值實(shí)現(xiàn)示意圖 圖4為快速檢測(cè)器輸出的正例和反例樣本示例圖 圖5為自動(dòng)編碼機(jī)結(jié)構(gòu)圖 圖6為逐層無監(jiān)督Pre-Train示例圖 圖7為行人檢測(cè)流程圖。
【具體實(shí)施方式】
[0022] 為了使本發(fā)明的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面將結(jié)合附圖及具體實(shí)施例 對(duì)本發(fā)明做出進(jìn)一步地詳細(xì)描述。本發(fā)明提出的單幅圖像行人檢測(cè)方法由兩部分組成,第 一部分是行人檢測(cè)器訓(xùn)練,第二部分是行人檢測(cè)。
[0023] 首先,介紹行人檢測(cè)器訓(xùn)練部分。
[0024] 步驟1;數(shù)據(jù)準(zhǔn)備,設(shè)置行人數(shù)據(jù)集和背景數(shù)據(jù)集 1. 1;設(shè)置行人數(shù)據(jù)集并標(biāo)記人體矩形框 采集M幅圖像組成行人數(shù)據(jù)集,每幅圖像的寬均大于20像素,高均大于50像素,記為 ^ U乂i-….^自,…若#-,J' !二…J/,圖像上包含有A'j.個(gè)行人樣本,> 1,標(biāo)記圖像ii. 上第j個(gè)行人樣本的位置為:/j= ;A.,.r,;r,Aj,其中,J-)為矩形框左上頂點(diǎn) 坐標(biāo),?為矩形框?qū)挾?,WA為矩形框長度,表示完全包含該行人樣本輪廓的人體矩形 框。
[00巧]圖1所示為行人數(shù)據(jù)集及行人樣本標(biāo)注示例圖 1. 2;設(shè)置背景數(shù)據(jù)集 采集N幅不包含行人的圖像組成背景數(shù)據(jù)集,記為# :各致與=UV.-.V,圖 2所示為不包括行人的背景數(shù)據(jù)集圖片示例 步驟2;訓(xùn)練快速行人檢測(cè)器 2. 1;利用行人數(shù)據(jù)集獲取正例樣本的特征表示,具體為: 2. 1. 1;對(duì)行人數(shù)據(jù)集I中的每一幅圖像/,,根據(jù)圖像上每個(gè)人體矩形框的位置,截取 獲得對(duì)應(yīng)的人體子圖像,行人數(shù)據(jù)集I中所有圖像的所有人體子圖像構(gòu)成了正例樣本; 2. 1. 2;將截取的正例人體子圖像轉(zhuǎn)換為對(duì)應(yīng)的人體灰度子圖像,經(jīng)過歸一化處理得到 10*25像素大小的標(biāo)準(zhǔn)人體灰度子圖像; 2. 1. 3;計(jì)算該10*25像素大小的標(biāo)準(zhǔn)人體灰度子圖像的梯度幅值特征F e及"'-'>,將 該特征拉直為250維的列向量; 2.1.4;將所有正例樣本的特征記為:16^;,.#';..#-,,|61;?^,真中7' = |>,,/;表示 第i幅圖像的第j個(gè)人體矩形框的拉直梯度幅值特征; 2. 2;利用背景數(shù)據(jù)集獲取反例樣本的特征表示,具體為: 2. 2. 1;在訓(xùn)練集B中的圖像上,選擇寬高比例為10:25的背景圖像矩形框共10T個(gè),截 取后獲得對(duì)應(yīng)的背景子圖像,則該10T個(gè)背景子圖像構(gòu)成了反例樣本; 2. 2. 2;將截取的背景子圖像轉(zhuǎn)換為對(duì)應(yīng)的背景灰度子圖像,經(jīng)過歸一化處理得到10*25像素大小的標(biāo)準(zhǔn)背景灰度子圖像; 2. 2. 3;計(jì)算該10*25像素大小的標(biāo)準(zhǔn)背景灰度子圖像的梯度幅值特征/E 將 該特征拉直為250維的列向量; 2. 2. 4;將所有反例樣本的特征記為:
其中表示第a個(gè)反例樣本的拉直梯度幅值特 征; 2. 3;訓(xùn)練線性分類器作為快速行人檢測(cè)器 2. 3. 1;將所有正例樣本的標(biāo)簽設(shè)置為1,反例樣本的標(biāo)簽設(shè)置為0,訓(xùn)練一個(gè)二類線性 分類的SVM,得到判別投影!r6度39; 2. 3. 2;設(shè)置得分函數(shù)r =原>〇|'戶(是》= *寂,其中g(shù)表示任意10*25大小的灰度圖 像樣本經(jīng)過拉直后的梯度幅值特征,該拉直后的梯度幅值特征是250維的列向量; 2. 3. 3;計(jì)算每個(gè)正例樣本的標(biāo)準(zhǔn)人體灰度子圖像的得分函數(shù)值,進(jìn)行排序,設(shè)置檢測(cè) 闊值C7,使得該闊值大于99%的正例樣本的標(biāo)準(zhǔn)人體灰度子圖像的得分函數(shù)值。
[0026]步驟3;利用快速行人檢測(cè)器進(jìn)行快速行人檢測(cè)與行人樣本提取 3. 1;將行人訓(xùn)練集I中的每幅圖像進(jìn)行灰度處理,得到灰度圖像,對(duì)其進(jìn)行高斯金字 塔處理,縮放比例為L^'I: , 0 < ,/ <化C3 !,直到最小尺寸的灰度圖像 的寬大于10個(gè)像素且高大于25個(gè)像素,由于每幅圖像的寬都大于20像素,高都大于50像 素,因此每圖圖像至少經(jīng)過一次縮放,有兩個(gè)主尺度; 3. 2將上述D+1個(gè)尺度作為主尺度,計(jì)算每個(gè)主尺度灰幅圖像的梯度幅值特征圖像; 3. 3通過Bi-化bic插值在每兩個(gè)相鄰主尺度之間獲得中間尺度的梯度幅值特征圖像, 具體為: 3. 3. 1在相鄰的兩個(gè)主尺度之間等間隔的插入四個(gè)中間尺度,上述四個(gè)尺度可W由距 離其最近的主尺度的梯度幅值特征圖像插值得到,可W由距離其最近的相對(duì)大尺度的主尺 度下采樣得到,或者由距離其最近的相對(duì)小尺度的主尺度上采樣得到。
[0027] 例如,在尺度圖像和;尺度圖像之間等間隔的插入四個(gè)中間尺度,則每個(gè)中 -* ^ 間尺度可W表示為:
爲(wèi)申表示丄尺度圖像和........*........ -.>i -1 尺度圖像之間第q個(gè)中間尺度的縮放比例,0<<!<〇。
[0028] 圖3為主尺度梯度幅值特征圖像和加速的相鄰尺度插值實(shí)現(xiàn)示意圖,如圖3所示, 在1,1/2, 1/4該=個(gè)主尺度之間,存在兩個(gè)尺度間隔,在每個(gè)間隔中分別插入四個(gè)中間尺 度,即得到11個(gè)尺度的梯度幅值特征圖像; 3. 4在所有尺度的梯度幅值特征圖像上進(jìn)行窗口掃描,窗口大小為10*25像素,水平和 垂直方向的步長都是1; 3. 5對(duì)掃