基于OmapL138芯片的Haar檢測算法快速實現(xiàn)方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及一種haar檢測算法,具體地說,是涉及一種基于0mapL138芯片的Haar檢測算法快速實現(xiàn)方法。
【背景技術(shù)】
[0002]Haar檢測算法是根據(jù)預先訓練好的Haar特征表,在一副圖像中檢測物體的方法,其基本流程如圖1所示。Haar特征表由haar特征組成,即圖1中的矩陣特征。矩形特征值是指待測圖像中形狀相同的兩個或多個矩形內(nèi)灰度像素的差值,如圖2中的矩形特征值是指白色圖像內(nèi)的像素與黑色圖像內(nèi)的像素之差,圖3中的矩形特征值是指白色圖像內(nèi)的像素與黑色圖像內(nèi)的像素的2倍之差。
[0003]為了更快地對車輛進行檢測,研究人員對矩陣特征進行了歸納總結(jié),主要可分為以下三類:
(1)檢測邊緣,如圖2所示;
(2)檢測圖像的線性方向,如圖3所示;
(3 )檢測中心像素和周圍像素的區(qū)別,如圖4所示。
[0004]一幅MXM像素分辨率的檢測器,其內(nèi)部包含滿足條件的矩形數(shù)是非常多的,如果一個一個計算起來計算量是相當復雜的,計算量也是很大的。為此,專門設(shè)計了一種快速方便的算法,它對不同尺寸的矩形特征值的計算量是相同的,它就是積分圖的計算。而在一張圖像中,只有幾個車牌,但是掃描窗口確非常之多,在掃描的過程中,絕大部分的窗口均為非車牌,為了減少非必要窗口在分類器中的停留時間,又引入了級聯(lián)分類器的方法。
[0005]級聯(lián)分類器的訓練與其他分類器的訓練方法不同,它是一個階段一個階段依次進行的。訓練的第一個階段使用了所有的正樣本和負樣本,產(chǎn)生一個弱分類器;第二個階段使用了所有的正樣本,而負樣本并不是所有的負樣本,而是使用第一個弱分類器對負樣本進行分類,如果負樣本被分類為正樣本,則該負樣本參與到第二階段的訓練,否則該負樣本不再參與第二階段的訓練。按照這種方法進行后續(xù)階段的訓練,總共需要訓練多少個階段,由操作人員事先設(shè)定,一般在17個階段左右。這種逐步淘汰負樣本的方法,使得分類器從第一級到最后一級,其對負樣本識別能力逐步增強。從訓練的過程中,我們可以看到,第一級把分錯的負樣本留給第二級,而第二級把分錯的負樣本留給第三級,依次下去。在實際檢測車牌時,大部分的偽車牌在前面幾級就被排除掉,后面的幾級分類器就集中對付一些難以區(qū)分的負樣本,其基本流程示意圖圖如圖5所示。
[0006]但是,即使引入了積分圖和級聯(lián)分類器,隨著技術(shù)的不斷發(fā)展,haar檢測算法也越來越無法滿足當今社會的實際需求,急需對其進一步改進。
【發(fā)明內(nèi)容】
[0007]本發(fā)明的目的在于提供一種基于0mapL138芯片的Haar檢測算法快速實現(xiàn)方法,解決現(xiàn)有技術(shù)中haar檢測算法難以滿足實際需求的問題,提高其實用價值。
[0008]為了實現(xiàn)上述目的,本發(fā)明采用的技術(shù)方案如下:
基于0mapL138芯片的Haar檢測算法快速實現(xiàn)方法,包括以下步驟:
(1)對相機標定的結(jié)果,一次性計算出Haar算法的檢測區(qū)域,形成Haar檢測區(qū)域表,保存到DDR內(nèi)存中;
(2)ARM依據(jù)Haar檢測區(qū)域表和Haar參數(shù)表,從DDR中提取數(shù)據(jù),線性排列到L2內(nèi)存中;
(3)DSP依據(jù)Haar參數(shù)表,從L2中線性提取數(shù)據(jù),計算出結(jié)果,并把檢測結(jié)果更新到L2內(nèi)存中;
(4)ARM根據(jù)L2內(nèi)存保存的檢測結(jié)果組織下一批數(shù)據(jù),再傳遞給DSP計算,由DSP依據(jù)haar參數(shù)表提取數(shù)據(jù),并進行計算,如此反復執(zhí)行,直到所有圖像的檢測結(jié)果均保存于L2中;
(5)ARM從L2中提取檢測結(jié)果,得到整張圖像的Haar檢測結(jié)果。
[0009]進一步地,所述L2中單獨建立有一個BIT表,所述步驟(3)中DSP的計算結(jié)果保存于該BIT表中,且所述步驟(4)中ARM從該BIT表中提取檢測結(jié)果,得到haar檢測算法的結(jié)果。ARM和DSP直接在同一個表中進行取數(shù)與存數(shù),數(shù)據(jù)不需要進行多次轉(zhuǎn)存,能夠有效提高數(shù)據(jù)處理效率。
[0010]進一步地,所述步驟(2)中從DDR中提取的數(shù)據(jù)進行線性排列時每組數(shù)據(jù)大小相等。線性排列可以降低數(shù)據(jù)提取難度,為數(shù)據(jù)提取提供方便,而每組數(shù)據(jù)大小相等,則在提取數(shù)據(jù)時每次直接提取一組,無需費時去計算數(shù)據(jù)大小,提高了取數(shù)效率。
[0011]再進一步地,所述步驟(3)中DSP計算檢測結(jié)果采用純匯編方式進行。純匯編方式可以有效提高DSP的八個核心的利用率,避免DSP資源浪費。
[0012]更進一步地,在步驟(3)中DSP計算檢測結(jié)果的過程中,將權(quán)重、左節(jié)點、右節(jié)點和閾值分別設(shè)置成常數(shù)賦值給寄存器進行計算。采用本方式可以有效避免使用取數(shù)Load指令所增加的功能單元開銷,節(jié)省DSP資源。
[0013]本發(fā)明中,所述的0MAPL138芯片是TI公司推出的C6748浮點DSP內(nèi)核和ARM9內(nèi)核的雙核高速處理器,該器件集圖像、語音、網(wǎng)絡(luò)、存儲于一體,性價比高;其頻率最高達456MHz的C6748內(nèi)核提供浮點工作能力以及更高性能的定點工作能力;ARM9內(nèi)核具有高度的靈活性,開發(fā)人員可以在其上使用Linux等操作系統(tǒng),方便地為其應用添加人機接口、網(wǎng)絡(luò)功能、觸摸屏等。
[0014]0MAP-L138芯片的內(nèi)存和外設(shè)資源十分豐富,完全可以滿足混合高斯算法的系統(tǒng)設(shè)計要求,而且也方便將來進行系統(tǒng)的擴展和升級。
[0015]與現(xiàn)有技術(shù)相比,本發(fā)明具有以下有益效果:
本發(fā)明結(jié)合haar檢測算法的實際需要和0MAP-L138芯片的內(nèi)核特性,將兩者的供需特性充分揉合在一起,最大程度地發(fā)揮0MAP-L138芯片的兩個內(nèi)核的資源優(yōu)勢,從硬件和軟件兩個方面來進行設(shè)計,使haar檢測算法的實現(xiàn)速度得到了極大的提高,解決了現(xiàn)有haar檢測算法實現(xiàn)速度慢、無法滿足實際需求的問題,提高了 haar檢測算法的實用價值。
【附圖說明】
[0016]圖1為現(xiàn)有技術(shù)中Haar檢測算法的基本流程示意圖。
[0017]圖2為現(xiàn)有技術(shù)中矩陣特征的一種示意圖。
[0018]圖3為現(xiàn)有技術(shù)中矩陣特征的另一種示意圖。
[0019]圖4為現(xiàn)有技術(shù)中矩陣特征的又一種示意圖。
[0020]圖5為現(xiàn)有技術(shù)中級聯(lián)分類器訓練的流程示意圖。
[0021]圖6為本發(fā)明中數(shù)據(jù)線性排列的示意圖。
【具體實施方式】
[0022]下面結(jié)合附圖和實施例對本發(fā)明作進一步說明,本發(fā)明的實施方式包括但不限于下列實施例。
實施例
[0023]本實施例公開的基于0mapL138芯片的Haar檢測算法快速實現(xiàn)方法,其主要原理在于利用并充分發(fā)揮0mapL138芯片的雙內(nèi)核特性,將邏輯處理和具體計算分開,分別由一個內(nèi)核來完成,從而提高haar檢測算法的實現(xiàn)速度。
[0024]具體地說,OmapL138芯片中集成了 ARM和DSP兩個獨立核心,充分發(fā)揮兩個核心的各自特性,是實時Haar檢測的關(guān)鍵。其中,ARM作為控制器,利用Haar檢測模板,從DDR中提取、組織Haar的計算數(shù)據(jù),分批把組織好的數(shù)據(jù)送到DSP的L2中;而DSP則從L2中分段提取數(shù)據(jù),利用其中的八個計算核心,高速計算出Haar檢測結(jié)果;然后由DSP把檢測結(jié)果交給ARM,由ARM再組織下一批數(shù)據(jù);如此反復,直到最終在ARM