本發(fā)明涉及一種用于檢測圖像中的實體的設(shè)備和方法。
眾所周知,安全和安保在現(xiàn)代社會中非常重要。多年來,允許對數(shù)字圖像(像通常由攝像機(jī)獲取的數(shù)字圖像)中可能存在的實體(比如人和/或物體)進(jìn)行自動檢測的系統(tǒng)變得越來越廣泛。
安全系統(tǒng)的第一個示例由市面上現(xiàn)有的許多汽車中包含的行人檢測系統(tǒng)給出;這種系統(tǒng)從攝像機(jī)(通常定位在擋風(fēng)玻璃的上部)獲取數(shù)字圖像,并且對其進(jìn)行處理以檢測可能位于車輛前方的行人并估計與其的距離,以便能夠確定是否需要進(jìn)行輔助操作以保護(hù)行人(例如增加制動系統(tǒng)中的壓力、緊急制動、避讓行人等等)。
安保系統(tǒng)的示例由視頻監(jiān)控系統(tǒng)給出,該系統(tǒng)能夠自動檢測圖像中人和/或車輛的存在(甚至車輛的類型)并且采取必要的行動(例如,開始記錄視頻流,通過疊加在視頻流上的圖片突出顯示實體,警告監(jiān)控操作者等),因此不需要實際的監(jiān)控操作者持續(xù)觀看視頻流。
這兩個應(yīng)用都通過被配置為來執(zhí)行基于方向梯度直方圖(hog)和支持向量機(jī)(svm)技術(shù)的檢測方法的計算機(jī)設(shè)備來實現(xiàn)。
在這種應(yīng)用中,這些檢測方法的最重要的要求之一是產(chǎn)生盡可能少的誤報/漏報,因為誤報和漏報兩者都可能導(dǎo)致不良的后果;事實上,漏報可能導(dǎo)致例如行人被撞倒或者監(jiān)控操作者沒有受到有關(guān)入侵企圖的警告,而誤報可能導(dǎo)致例如不必要的緊急制動(具有追尾的風(fēng)險),或者向視頻監(jiān)控操作者發(fā)送太多假警報(具有降低操作者的注意力水平的風(fēng)險)。
減少由基于hog/svm的方法生成的誤報/漏報的數(shù)量的一種方式是提高由這些方法所處理的圖像的分辨率,以便能夠生成具有更多類別和/或在各個類別所包含的單元之間具有更大差異的方向梯度直方圖,從而確保了更高的實體檢測精度(減少誤報/漏報的數(shù)量)和/或?qū)Ω髷?shù)量的不同實體的識別;在后一種情況下,能夠使用基于hog/svm的方法來在穿越街道的行人和沿著街道邊緣行進(jìn)的人之間進(jìn)行區(qū)分,或者在正常著裝的人和戴著巴拉克拉法帽(可能為了在進(jìn)行犯罪行為時不被認(rèn)出)的人之間進(jìn)行識別。
然而,提高的分辨率意味著可用的計算能力相等而計算負(fù)荷增加,這限制了基于hog/svm的方法在如上所述的實際應(yīng)用中的使用,這是因為需要滿足使這些應(yīng)用成為實時應(yīng)用的嚴(yán)格的時間限制。
為了滿足這些時間限制,因此需要增加被配置來執(zhí)行實現(xiàn)基于hog/svm的圖像檢測方法的指令的設(shè)備在時間單位內(nèi)能夠處理的圖像的點(像素)的數(shù)量。
本發(fā)明旨在通過提供如所附權(quán)利要求書中所闡述的用于實體檢測的設(shè)備和方法來解決這些和其他問題。
本發(fā)明的基本思想是基于預(yù)定的分區(qū)元素(組)通過選擇一個數(shù)據(jù)(datum)來對圖像的至少一個點的梯度的角度進(jìn)行量化,所述數(shù)據(jù)標(biāo)識至少一個所述分區(qū)元素并且被包含在存儲器裝置中,所述存儲器裝置被配置為允許基于所述梯度的特性(優(yōu)選為所述梯度的水平和垂直分量)來訪問所述分區(qū)元素中的至少一個。
本發(fā)明的另一基本思想在于通過選擇所述存儲器裝置中所包含的第二數(shù)據(jù)來計算梯度的模在至少一個分區(qū)元素上的投影,所述存儲器裝置被配置為允許基于所述梯度的特性來訪問所述第二數(shù)據(jù)。
這些特征允許減少需要由硬件組件執(zhí)行的浮點運算的數(shù)量和/或?qū)⒃摂?shù)量減少為零,從而降低了根據(jù)本發(fā)明的方法的時間復(fù)雜度,即加快對與圖像的點相關(guān)的梯度的處理而計算能力相等。這增加了每時間單位能夠處理的圖像點的數(shù)量。
由這些技術(shù)特征產(chǎn)生的另一效果是減少了實現(xiàn)本發(fā)明的方法所需的電路組件的數(shù)量,使得電路的空間占用(也稱為硅占用)降低。
此外,所獲取的圖像的分辨率和可用計算能力相等,上述技術(shù)特征允許減少用于在照片中檢測特定實體所需的時間,從而使得本發(fā)明的設(shè)備和方法也特別適于數(shù)字?jǐn)z影應(yīng)用,其中對對象進(jìn)行自動對焦通常需要檢測其任一部分(例如臉部)。通過這種方式,能夠減少機(jī)器進(jìn)行對焦所花費的時間,從而也減少了獲得合適的對焦照片所需的時間。
本發(fā)明的其他有利特征將在所附權(quán)利要求書中進(jìn)行闡述。
從以下通過非限制性示例提供的附圖所示的其實施例的描述中,本發(fā)明的這些特征以及其他優(yōu)勢將變得更加明顯,其中:
圖1是根據(jù)本發(fā)明的電子設(shè)備的框圖;
圖2是示出能夠由圖1的電子設(shè)備執(zhí)行的、基于hog(方向梯度直方圖)和svm(支持向量機(jī))技術(shù)的檢測方法的各個階段的流程圖;
圖3示出一種可能的方式,其中在圖2的直方圖確定階段期間能夠計算圖像的水平和垂直梯度;
圖4示出依照本發(fā)明實現(xiàn)圖3的直方圖向量確定子階段的邏輯方案。
在本說明書中,對“實施例”的任何提及表示關(guān)于本發(fā)明的實施方式所描述的特定的配置、結(jié)構(gòu)或特征被包括在至少一個實施例中。因此,可能存在于本書明書的不同部分中的短語“在實施例中”或其他相似短語,未必都關(guān)于同一個實施例。此外,可以以任何被視為適合的方式來將任何特定的配置、結(jié)構(gòu)或特征在一個或更多個實施例中結(jié)合起來。因此,僅為了簡單的目的而使用以下參考,而不限制各個實施例的保護(hù)范圍或擴(kuò)展。
參照圖1,根據(jù)本發(fā)明的電子設(shè)備1包括以下組件:
-至少計算裝置11(例如,cpu、fpga、cpld等等),其被配置為讀取或計算表示圖像的梯度的數(shù)據(jù)并且執(zhí)行用于實施根據(jù)本發(fā)明的、用于檢測可能存在于所述圖像中的一個或更多個實體的方法的指令;特別地,計算裝置11檢測圖像中具有某些特征的一組點(或區(qū)域)的存在,例如,使得該組點(或區(qū)域)與預(yù)先定義的特定實體(例如,人、車輛等)相似的某種梯度角度分布;
-存儲器裝置12,其包含至少一個數(shù)據(jù)集,并且被配置為允許根據(jù)圖像的至少一個點的梯度的至少一個特征的值來訪問所述數(shù)據(jù)中的至少一個,其中所述數(shù)據(jù)中的每一個允許計算裝置11基于預(yù)定的分區(qū)元素(組)來對所述點的梯度的角度進(jìn)行量化;此外,所述數(shù)據(jù)中的每一個還可以允許計算梯度模在分區(qū)元素中的至少一個上的投影;
-圖像獲取裝置13,其被配置為獲取一個或更多個數(shù)字格式的圖像,所述圖像然后由計算裝置11進(jìn)行處理;這種圖像獲取裝置13可以包括例如usb、火線、rs232、ieee1284、以太網(wǎng)或wifi適配器等等。
-輸入/輸出(i/o)裝置14,其能夠例如用于連接到所述設(shè)備的人機(jī)界面外圍設(shè)備(也被稱為hid外圍設(shè)備,比如鍵盤、鼠標(biāo)等等),所述人機(jī)界面外圍設(shè)備允許操作人員控制設(shè)備1的運行(例如設(shè)置運行模式、選擇特定的視頻源等等);這種輸入/輸出裝置14可以包括例如usb、火線、rs232、ieee1284、以太網(wǎng)或wifi適配器等等;
-發(fā)信裝置15,其被配置為當(dāng)所述計算裝置11在通過圖像獲取裝置13獲取的圖像中檢測到具有與先前定義的實體的特征相似的特征的一組點的存在時由計算裝置11激活;這種發(fā)信裝置15可以包括被配置為發(fā)送數(shù)據(jù)總線(例如,汽車的can總線)上的中斷的聲音警報裝置、可以例如激活汽車的制動電路等等的激活裝置;
-通信總線16,其允許在計算裝置11、存儲器裝置12、圖像獲取裝置13、輸入/輸出裝置14和發(fā)信裝置15之間交換信息。
作為通信總線16的替代,計算裝置11、存儲器裝置12、圖像獲取裝置13、輸入/輸出裝置14和發(fā)信裝置15可以通過星形架構(gòu)連接。
此外,設(shè)備1可以優(yōu)選地還包括與至少計算裝置11和存儲器裝置12進(jìn)行信號通信的視頻適配器(附圖中未示出),其中所述視頻適配器能夠在顯示裝置(例如,lcd或等離子面板等等,未附圖中未示出)上顯示未處理的圖像和/或處理結(jié)果,例如通過以疊加在圖像上的亮色(例如紅色,綠色等等)連續(xù)線來突出顯示由計算裝置11所選擇的區(qū)域,以便允許設(shè)備1的操作者快速定位由計算裝置11執(zhí)行的本發(fā)明的方法所檢測到的實體。
存儲器裝置12可以包括關(guān)聯(lián)存儲器,即內(nèi)容可尋址存儲器(cam)或普通的ram存儲器;這種存儲器裝置12用于實現(xiàn)這樣的查找表,其組織為使得所述表的關(guān)鍵字包括梯度的特征,而與所述關(guān)鍵字相關(guān)聯(lián)的內(nèi)容包括數(shù)據(jù)集,所述數(shù)據(jù)集用于對梯度的角度進(jìn)行量化,并且還可選地用于計算所述梯度的模在預(yù)定分區(qū)元素中的至少一個上的投影。
如果存儲器裝置12包括ram存儲器,則可以通過使用本領(lǐng)域的技術(shù)人員的知識來有利地分配數(shù)據(jù)集的元素,以這種方式,使得能夠基于所述特征來確定與梯度的某些特征相關(guān)聯(lián)的數(shù)據(jù)的l值。此外,所述ram存儲器還可以優(yōu)選地包含用于實現(xiàn)本發(fā)明的方法的指令、優(yōu)選以二進(jìn)制格式表示所述圖像的至少一部分的圖像數(shù)據(jù)以及所述方法的指令的執(zhí)行結(jié)果;所述結(jié)果可以包括具有使得該組點(或區(qū)域集)與特定實體相似的某些特征(例如某些梯度角度分布)的圖像點,和/或包含所述點的圖像區(qū)域的輪廓,其中所述輪廓能夠被表示為一組點(例如包含定義區(qū)域的點的坐標(biāo)的數(shù)組),并且還能被表示為定義形狀(優(yōu)選矩形)的數(shù)學(xué)關(guān)系,以下將描述其生成。
在部脫離本發(fā)明的教導(dǎo)的情況下,本領(lǐng)域的技術(shù)人員還可以使用以上所述之外的存儲器裝置(例如rom,閃存等)。
同樣參照圖2,根據(jù)本發(fā)明的方法包括以下階段:
-采集階段p1,其中,通過圖像采集階段13,裝置1獲取將進(jìn)而由計算裝置11處理的電子圖像;
-選擇階段p2,其中設(shè)備1優(yōu)選地通過計算裝置11來選擇在階段p1期間獲取的圖像的一部分以通過所述計算裝置11進(jìn)行處理,其中所述部分通過形狀、尺寸和相對于圖像的給定點的位置來識別,并且其中每個形狀、尺寸和位置被包含在選擇集中,使得設(shè)備1能夠優(yōu)選地以順序方式選擇具有預(yù)定特征的圖像部分;這將使得實體的檢測時間是可預(yù)測的;
-直方圖生成階段p3,其中,通過計算裝置11,基于圖像部分的點來生成直方圖向量;
-實體檢測階段p4,其中,通過計算裝置11來驗證在階段p3期間生成的直方圖向量是否與必須(自動)檢測的實體之一的直方圖向量相似;
-實體存在發(fā)信階段p5,其中,如果在階段p4處在所選擇的圖像部分中檢測到實體,則將通過發(fā)信裝置15向操作人員和/或監(jiān)測系統(tǒng)和/或等等發(fā)出該實體存在的信號。
當(dāng)設(shè)備1進(jìn)入運行狀態(tài)時,其開始執(zhí)行階段p1以獲取圖像;然后其執(zhí)行階段p2以選擇第一圖像部分,接著執(zhí)行階段p3以確定直方圖向量,并且然后,基于所述直方圖向量,執(zhí)行階段p4。隨后,基于在階段p4期間獲得的結(jié)果,設(shè)備1進(jìn)行第一選擇s1:如果在階段p1期間獲取的圖像中存在至少一個實體,則裝置1將執(zhí)行階段p5以激活發(fā)信裝置15。此后,設(shè)備1將進(jìn)行第二選擇s2,驗證由選擇集中包含的信息所識別的所有圖像部分是否都已被選擇;如果不是,則其將再次執(zhí)行階段p2以選擇第二圖像部分;否則,所述設(shè)備1將進(jìn)行第三選擇s3。為了進(jìn)行該第三選擇s3,設(shè)備1驗證是否存在結(jié)束方法的執(zhí)行的條件;如果不存在這樣的條件(其可以例如通過輸入/輸出裝置14來生成),則其將再次執(zhí)行階段p1以獲取新的圖像;否則,其將結(jié)束方法的執(zhí)行。
必須指出的是,在本發(fā)明的實施方式中,能夠根據(jù)現(xiàn)有技術(shù)來執(zhí)行階段p1、p2和p4、p5。
還必須指出的是,根據(jù)本發(fā)明的方法的所有階段都能夠以重疊的順序方式執(zhí)行,即,在即使所述方法的先前階段的結(jié)果的僅僅一部分可用且是最終性的(即不再進(jìn)行改變)時,設(shè)備1就已經(jīng)開始執(zhí)行該方法的新階段。以這種方式,能夠增加并行度同時減少設(shè)備1在特定圖像或圖像集上執(zhí)行該方法所需的時間。
另外參照圖3,以下將描述設(shè)備1的優(yōu)選實施例如何能夠?qū)崿F(xiàn)根據(jù)本發(fā)明的直方圖生成階段p3。
階段p3可以優(yōu)選地包括梯度確定子階段p31,以確定先前在階段p1期間由圖像獲取裝置13獲取的圖像i(或其一部分)的梯度;在所述子階段p31期間,計算裝置11可以優(yōu)選地針對圖像i的每個點來計算水平梯度和垂直梯度,以便確定二維空間中的梯度向量。特別地,計算裝置11優(yōu)選地被配置為在優(yōu)選地具有3×3的值并且中間列的值全都等于零的第一矩陣mh和圖像i之間進(jìn)行空間卷積,以便生成具有與圖像i相同的維數(shù)的垂直梯度矩陣gv;此外,所述計算裝置11還優(yōu)選地被配置為在優(yōu)選地具有3×3的值并且中間行的值全都等于零的第二矩陣mv和圖像i之間進(jìn)行空間卷積,以便生成具有與圖像i相同的維數(shù)的水平梯度矩陣gh。
然而,本領(lǐng)域的技術(shù)人員能夠通過使用不同的技術(shù)(例如在圖像i和向量[+10-1]、[+10-1]t或[+1-1]、[+1-1]t中的每一個之間進(jìn)行卷積)來對水平和垂直梯度分量進(jìn)行計算而不脫離本發(fā)明的教導(dǎo)。
階段p3還包括直方圖向量確定子階段p32,其中通過計算裝置11基于矩陣gv和gh中包含的梯度值來計算直方圖向量h。
另外參照圖4,以下將詳細(xì)地描述設(shè)備1如何能夠在子階段p32期間計算直方圖向量h。
對于圖像i的每個點,設(shè)備1讀取所述點的梯度的水平和垂直分量,其中所述梯度分量在圖4中分別由符號gh(x,y)和gv(x,y)表示,其中x和y是圖像i的點的通用坐標(biāo);這些分量優(yōu)選地以二進(jìn)制方式編碼并且通過定點表示法來表示;此外,具有負(fù)值的分量可以以二進(jìn)制補(bǔ)碼來表示,從而有利地降低了所需電路和/或組件的復(fù)雜度。優(yōu)選地通過使用比用于表示圖像i中的點的值的位數(shù)大的位數(shù)n來表示梯度分量;更詳細(xì)地,表示每個梯度分量(沒有信息丟失)所需的附加位的數(shù)量等于從圖像i的點開始計算每個所述分量所需的加法和減法運算的數(shù)量。例如,如果使用圖3的mh和mv矩陣,則需要使用7個附加位,因為-2和2的乘積需要用于圖像i的每個點的五個附加位以及朝向最高有效位的兩位移位(注意,如果輸入數(shù)據(jù)已經(jīng)是以二進(jìn)制補(bǔ)碼的形式,則能夠在沒有任何信息丟失且不增加任何位的情況下執(zhí)行-1、1倍的乘積);相反,如果使用了上述向量,一個附加位就足夠了,因為對于圖像i的每個點,一次代數(shù)加法就足夠了。
設(shè)備1還可以包括標(biāo)準(zhǔn)化裝置41,其接收梯度分量gh(x,y)和gv(x,y)作為輸入并且輸出這些分量的標(biāo)準(zhǔn)化值gh(x,y)*和gv(x,y)*,其中所述標(biāo)準(zhǔn)化值由位數(shù)p表示,優(yōu)選為等于5位,其優(yōu)選為小于n,即通過比用于梯度分量gh(x,y)和gv(x,y)的位數(shù)小的位數(shù)來表示該標(biāo)準(zhǔn)化值。更詳細(xì)地,標(biāo)準(zhǔn)化裝置41被配置為執(zhí)行以下階段:
-移位階段n1,其中兩個梯度分量的絕對二進(jìn)制值(即,不以二進(jìn)制補(bǔ)碼表示的值)朝向最高有效位(即乘以210)對于兩個分量移位相同數(shù)量的位置,直到至少一個所述分量的最高有效位具有二進(jìn)制邏輯值“1”(注意在該階段中沒有發(fā)生信息丟失);還必須指出的是,如果以二進(jìn)制補(bǔ)碼表示負(fù)數(shù),則兩個分量都應(yīng)朝向最高有效位移位相同數(shù)量的位置,直到每個分量的最高有效位之間的異或(xor)運算的結(jié)果為“1”。
-截斷階段n2,其中從執(zhí)行階段n1之后所獲得的二進(jìn)制值中截斷最低有效位,以便獲得p位的長度。
必須強(qiáng)調(diào),重要的是通過考慮梯度的兩個分量來執(zhí)行上述過程,使得丟棄的位的數(shù)量對于兩個分量是相等的,并且丟棄的位對于兩個原始分量具有相同的權(quán)重。
能夠通過有待計算裝置11執(zhí)行的合適的指令序列或者通過合適的電路(無論是為此專門設(shè)計的還是集成到cpld、fpga等等中的)來實施標(biāo)準(zhǔn)化裝置41。
下面將說明由上述標(biāo)準(zhǔn)化裝置41產(chǎn)生的技術(shù)效果。
如上所述,存儲器裝置12用于實施查找表42,所述查找表42以如此方式組織,使得所述表的關(guān)鍵字包括梯度特征,在該實施例中所述梯度特征包括水平和垂直梯度分量,在圖4中表示為由符號gh*和gv*所標(biāo)識的列的內(nèi)容。與上述關(guān)鍵字相關(guān)聯(lián)的查找表42的內(nèi)容包括用于量化梯度角的數(shù)據(jù)集,其中所述數(shù)據(jù)集包括預(yù)定分區(qū)元素(組)的標(biāo)識符,其在圖4中表示為由詞“組”標(biāo)識的列的內(nèi)容;可選地,所述數(shù)據(jù)集還包括能夠用于計算與圖像i的點相關(guān)聯(lián)的梯度模的數(shù)據(jù)(也被稱為校正因子,其原因?qū)⒃谙旅骊U明),其中所述數(shù)據(jù)在圖4中表示為由詞組“校正”所標(biāo)識的列的內(nèi)容。
必須指出的是,構(gòu)成關(guān)鍵字的梯度分量gh*,gv*優(yōu)選地以二進(jìn)制形式表示為二進(jìn)制補(bǔ)碼,并且具有優(yōu)選地等于p位的長度,即等于由處理所述表42的標(biāo)準(zhǔn)化裝置41輸出的位;替代地,校正因子(其總為正數(shù))和分區(qū)元素的標(biāo)識符分別表示為具有c位和b位長度的二進(jìn)制形式。
當(dāng)設(shè)備1運行時,存儲器裝置12(優(yōu)選地為關(guān)聯(lián)型的)接收優(yōu)選地被標(biāo)準(zhǔn)化裝置41標(biāo)準(zhǔn)化的、圖像i的一個點的梯度的水平和垂直分量作為輸入,并且輸出對與梯度角相關(guān)聯(lián)的分區(qū)元素進(jìn)行識別的值,并且可選地輸出校正因子。
然后,由表42輸出的數(shù)據(jù)被用于計算直方圖向量h的各個分量,其中,實際上能夠基于分區(qū)元素的標(biāo)識符的值和梯度分量gh(x,y)和gv(x,y)的值來計算直方圖向量h。實際上能夠通過使用畢達(dá)哥拉斯定理基于分量gh(x,y)和gv(x,y)來計算梯度的模,同時能夠基于由表42輸出的分區(qū)元素的標(biāo)識符的值來選擇要添加所述模的值的直方圖向量h的分量。
為了執(zhí)行用于計算直方圖向量h的運算,設(shè)備1還可以包括多路分配器46和多個累加寄存器47(acc0,acc1,…,accq-1),其中所述累加寄存器47中的每一個都具有與所述多路分配器46的輸出進(jìn)行信號通信的其輸入,并且其中所述多路分配器46的輸入通過其數(shù)據(jù)端口來接收基于分量gh(x,y)、gv(x,y)所計算的梯度模的值,并且通過其選擇端口來接收分區(qū)元素的標(biāo)識符的值,使得所述多路分配器46能夠設(shè)置適當(dāng)?shù)睦奂蛹拇嫫?7的輸入處的模值,其在每個時鐘周期ck處將其輸入處的值與其存儲器中的值相加,并且然后更新其輸出值。
必須強(qiáng)調(diào)的是,累加寄存器的數(shù)量為q,q的值一定要小于2b,即b位可標(biāo)識的組的最大數(shù)目。
本領(lǐng)域的技術(shù)人員可以使用除了多路分配器46和累加寄存器47之外的替代方式(例如由計算裝置11執(zhí)行的一系列指令)而不脫離本發(fā)明的教導(dǎo)。
為了加速設(shè)備1所執(zhí)行的更多的實體檢測過程,可以通過使用查找表42及其中包含的校正因子代替畢達(dá)哥拉斯定理來進(jìn)行梯度模的計算,其中,如下所述,能夠在設(shè)備1不運行(離線)時計算校正因子。
事實上,已知能夠通過以下關(guān)系式來計算梯度分量:
其中,g(x,y)為圖像i中的具有坐標(biāo)x,y的一般點的梯度向量的模,而α為在梯度向量和橫坐標(biāo)的正半軸之間形成的角。
通過將水平分量gh(x,y)和垂直分量gv(x,y)相加,能夠?qū)懗鲆韵玛P(guān)系式:
gh(x,y)+gv(x,y)=g(x,y)·cos(α)+g(x,y)·sen(α)(2)
通過對梯度模進(jìn)行分組,能夠?qū)懗鲈摿硪魂P(guān)系式:
gh(x,y)+gv(x,y)=g(x,y)·(cos(α)+sen(α))(3)
通過對上述關(guān)系式關(guān)于梯度模進(jìn)行求解,能夠?qū)懗鲆韵鹿剑?/p>
在上述公式4中,能夠識別出兩個不同的部分:左邊的部分(即兩個梯度分量之和)表示當(dāng)設(shè)備1必須在運行(在線)時執(zhí)行的部分,而右邊的部分(角度α的余弦與所述角度α的正弦之和的倒數(shù))能夠在設(shè)備1不運行(離線)時被執(zhí)行。因此,能夠基于梯度角α(其轉(zhuǎn)而夠基于所述梯度的分量的值來確定)利用以下關(guān)系式來計算要輸入到存儲器裝置12中的校正因子:
其中g(shù)h和gv指示構(gòu)成查找表42的關(guān)鍵字的梯度的水平和垂直分量,并且因此可以取標(biāo)準(zhǔn)化的梯度分量gh(x,y)*和gv(x,y)*的所有值。
關(guān)于要分配給每對梯度分量的分區(qū)元素的標(biāo)識符,能夠通過以下關(guān)系式來計算所述標(biāo)識符:
其中符號“%”指在兩個運算對象之間相除的余數(shù)(即整數(shù)),而符號“numbin”指示所選擇的要使用的分區(qū)元素的數(shù)量,所述數(shù)量等于直方圖向量h的分量數(shù)q,優(yōu)選為8。必須指出,角度α被除以π,因為在使用svw來進(jìn)行實體檢測的那些應(yīng)用中,僅考慮0度和180度之間的梯度角,而不是0度到360度,因為目的是描畫物體的輪廓(其垂直于梯度),并且因此知道梯度方向(即,是“進(jìn)入”還是“離開”輪廓)是不重要的。
為了能夠計算梯度的模而不必進(jìn)行任何浮點運算,設(shè)備1還可以優(yōu)選地包括加法器43、乘法器44和截斷寄存器45,其中加法器43和乘法器44都優(yōu)選為定點型。
加法器43接收梯度分量gh(x,y)和gv(x,y)的值作為輸入,并且然后優(yōu)選地以異步方式(即不需要時鐘)來計算這些分量的代數(shù)和,從而輸出n+1位(即,優(yōu)選為10位)的結(jié)果。必須指出的是,以梯度分量的二進(jìn)制補(bǔ)碼的表示允許使用加法器來將具有不同符號的數(shù)字也加在一起,有利地不需要使用減法器和必要的選擇邏輯。
由加法器43輸出的值然后被輸入到乘法器44,由于該乘法器也接收由存儲器裝置12輸出的校正因子,因此提供梯度分量之和以及與這些分量相關(guān)聯(lián)的校正因子之間的乘積,其中所述乘積表示梯度的模,其需要多個n+1+c位,即優(yōu)選為22位,以便無精度損失地進(jìn)行表示。必須強(qiáng)調(diào)的是,乘法器44也優(yōu)選地以異步方式運行(即不需要時鐘),以下將進(jìn)一步闡明其原因。
由于對于根據(jù)本發(fā)明的方法的任何應(yīng)用而言,由乘法器44輸出的位數(shù)的精度通常過高,因此乘法器44的輸出被輸入到截斷寄存器45,其通過截斷最低有效位來將位數(shù)減少到m位(優(yōu)選為10)。然后將梯度模的該值輸入到多路分配器46,該多路分配器然后將該值尋址到通過分區(qū)元素的標(biāo)識符的b位所選擇的累加寄存器47,其通過標(biāo)準(zhǔn)化的梯度分量gh(x,y)*和gv(x,y)*的值來在存儲器裝置12中進(jìn)行選擇。
利用這種方法,當(dāng)設(shè)備1在運行時,不需要進(jìn)行浮點計算,從而能夠提高其在時間(即,處理圖像i的一個點所需的時間更少)和在空間(例如,更少的硅占用,因為不需要實施新的浮點分量或使用現(xiàn)有的浮點分量)方面的效率。以這種方式,能夠增加每時間單位由設(shè)備1處理的圖像的數(shù)量,或者在時間相等的情況下增加所述處理的圖像的分辨率,從而將在檢測圖像i中的實體時誤報/漏報的數(shù)量減少到最小。
此時,可以領(lǐng)會由標(biāo)準(zhǔn)化裝置41產(chǎn)生的技術(shù)效果。事實上,假設(shè)p為5,則能夠針對每個標(biāo)準(zhǔn)化的梯度分量gh(x,y)*、gv(x,y)*表示的值的數(shù)量為32(25);因此,當(dāng)計算兩個分量之間的每種可能的組合時,查找表42必須包含和管理的行數(shù)將等于1024(210)。相反,如果不使用標(biāo)準(zhǔn)化裝置41,則每個梯度分量gh(x,y)、gv(x,y)將由n位來表示,假設(shè)n為9,則其可以取512個不同的值,這將需要查找表42管理262144(218)行的數(shù)量,即上述優(yōu)選情況的256(28)倍。
因此,標(biāo)準(zhǔn)化裝置41的存在允許降低根據(jù)本發(fā)明的方法的該階段在時間和空間上的復(fù)雜度,有利地使得能夠增加每時間單位由設(shè)備1所處理的圖像的數(shù)量,或在時間相等的情況下增加所述處理的圖像的分辨率,從而將在檢測圖像i中的實體時誤報/漏報的數(shù)量減少到最小。
為了使由設(shè)備1執(zhí)行的實體檢測過程更加快速且更加準(zhǔn)確,梯度模的計算能夠被替換為通過梯度角標(biāo)識的、梯度在分區(qū)元素上的投影的計算。
為了實現(xiàn)該技術(shù)特征,如下計算(離線)查找表42的轉(zhuǎn)換因子就足夠了:
其中,β(bin(α))為必須與具有角度α的梯度相關(guān)聯(lián)的分區(qū)元素的角度,即具有角度α的梯度必須投影在其上的分區(qū)元素(組)的角度。以這種方式,能夠算出梯度模在適當(dāng)?shù)姆謪^(qū)元素上的投影,從而提高了根據(jù)本發(fā)明的方法的精度,這是因為能夠利用標(biāo)準(zhǔn)化的梯度分量gh(x,y)*和gv(x,y)*中包含的更大量的信息,從而將在檢測圖像i中的實體時誤報/漏報的數(shù)量減少到最小。
如以上部分描述的,組件41-46可以優(yōu)選地以異步方式來實施,即不需要時鐘來運行。當(dāng)將輸入應(yīng)用于這些組件中的一個時,這將在穩(wěn)定時間之后提供穩(wěn)定的輸出,所述穩(wěn)定時間是已知的并且取決于所使用的組件的類型或者能夠基于用于創(chuàng)建所述組件及其配置(布置,連接等等)的子組件來計算。一個可能的結(jié)果是,圖4的異步部分的總穩(wěn)定時間將等于標(biāo)準(zhǔn)化裝置、查找表42和多路分配器46的穩(wěn)定時間之和,或者加法器43、乘法器44、截斷寄存器45和多路分配器46的穩(wěn)定時間之和,以較大者為準(zhǔn)。
優(yōu)選地,總穩(wěn)定時間應(yīng)當(dāng)比時鐘周期或其部分短,使得當(dāng)累加寄存器47被時鐘ck(例如通過其前沿和/或后沿)激活時,多路分配器46的輸出將已經(jīng)變得穩(wěn)定。
本領(lǐng)域的技術(shù)人員可以采用同步組件41-46(例如通過流水線來實現(xiàn)本發(fā)明)而不脫離本發(fā)明的教導(dǎo)。
總之,當(dāng)設(shè)備1的實施例在運行中并且開始執(zhí)行直方圖向量確定子階段p32時,計算裝置1優(yōu)選地重置累加寄存器47(例如,通過改變合適的信號,例如通過在寄存器的端口上施加高或低輸入電壓等等),使得其中存儲的值將被設(shè)置為初始值(優(yōu)選為0)。之后或同時,圖像i的第一點的梯度的分量gh(x,y)和gv(x,y)的值被輸入到標(biāo)準(zhǔn)化裝置41和加法器43,使得標(biāo)準(zhǔn)化裝置能夠輸出標(biāo)準(zhǔn)化分量gh(x,y)*和gv(x,y)*,并且加法器43能夠輸出梯度分量gh(x,y)與gv(x,y)之和。此時,接收標(biāo)準(zhǔn)化分量gh(x,y)*和gv(x,y)*作為輸入的查找表42能夠輸出用于分區(qū)元素的標(biāo)識符和用于校正因子的有效值,使得輸入了有效校正因子的乘法器44能夠輸出表示梯度?;蛘咚瞿T谂c梯度向量的值相關(guān)聯(lián)的分區(qū)元素上的投影的有效值。因此,截斷寄存器因其接收到有效輸入而也可以產(chǎn)生有效的輸出,其允許多路分配器46產(chǎn)生用于累加寄存器47的有效輸出,隨后由時鐘ck激活的該累加寄存器將更新其內(nèi)部狀態(tài)并且因此更新直方圖向量h的各個分量。然后,循環(huán)將被重復(fù),標(biāo)準(zhǔn)化裝置41和加法器43被輸入圖像i的第二點的梯度的分量gh(x,y)和gv(x,y)的值,直到時鐘ck再次激活累加寄存器47等等,直到處理了圖像i的最后一點的梯度的分量。
當(dāng)然,到目前為止所描述的示例可以進(jìn)行許多變化。
上述優(yōu)選實施例的第一種變化允許不僅計算梯度模在通過梯度角標(biāo)識的第一分區(qū)元素上的投影,還計算梯度模在靠近第一分區(qū)元素的第二分區(qū)元素(即在平面中界定空間分區(qū)的另一單元(組))上的投影。
為了實現(xiàn)該特征,與前述實施例的設(shè)備1相似的設(shè)備必須包括優(yōu)選為關(guān)聯(lián)類型的存儲器裝置,其被配置為實施與前述實施例的表42相似的查找表,所述設(shè)備還包括與相同的關(guān)鍵字相關(guān)聯(lián)的兩個附加列;這些附加列包含第二分區(qū)元素的標(biāo)識符和用于計算梯度模在所述第二分區(qū)元素上的投影的校正因子。此外,為了更容易地處理這些附加數(shù)據(jù),該裝置還可以包括第二乘法器,其接收第二轉(zhuǎn)換因子和加法器43的輸出作為輸入;第二截斷寄存器,其接收第二加法器的輸出作為輸入;第二多路分配器,其接收截斷寄存器的輸出和第二分區(qū)元素的標(biāo)識符作為輸入。必須指出的是,為了將第二多路分配器添加到先前實施例中已經(jīng)包含的多路分配器,由于由查找表(即由存儲器裝置)同時輸出的分區(qū)元素的標(biāo)識符從不相同的事實,可以通過使用or邏輯端口將多路分配器的每個輸出連接到合適的累加寄存器47的相應(yīng)輸入。
該變體提高了根據(jù)本發(fā)明的方法的精度,因為其利用了標(biāo)準(zhǔn)化梯度分量gh(x,y)*和gv(x,y)*中存在的更大量的信息,從而將在檢測圖像i中的實體時誤報/漏報的數(shù)量減少到最小。
本說明書處理了一些可能的變體,但是對于本領(lǐng)域的技術(shù)人員來說顯而易見的是,也可以實現(xiàn)其他實施例,其中一些元件可以替換為技術(shù)上等效的其他元件。因此,本發(fā)明不限于本文所描述的示例性舉例,而可以在不脫離后附的權(quán)利要求書所闡述的基本發(fā)明構(gòu)思的情況下進(jìn)行許多修改、改進(jìn)或等價部件和元件的替換。