。由此,基于所述塊中與例如地平面的預(yù)定參考面相接觸的像素的坐標(biāo),確定在所述圖像中所述塊的尺寸信息,例如所述塊的寬度。進(jìn)一步地,基于所述塊在所述圖像中的寬度以及長(zhǎng)度,計(jì)算真實(shí)場(chǎng)景中所述塊的物理尺寸,例如寬度以及高度。更具體地,可以預(yù)先獲得所述圖像所對(duì)應(yīng)的真實(shí)場(chǎng)景的物理尺寸,并基于所述塊在所述圖像中的尺寸和預(yù)先獲得的真實(shí)場(chǎng)景的物理尺寸,計(jì)算得到所述塊的物理尺寸。
[0030]然后,可基于所述塊的物理尺寸,計(jì)算所述塊中可能存在的對(duì)象的數(shù)目的上限。例如,對(duì)于特定的對(duì)象,可預(yù)先設(shè)置所述對(duì)象的單位物理尺寸,如單位寬度。由此,可基于所述對(duì)象的單位物理尺寸和所述塊的物理尺寸,估計(jì)所述塊中可能存在的對(duì)象的數(shù)目的上限。此外,還可預(yù)設(shè)所述塊中對(duì)象的密度,并結(jié)合預(yù)設(shè)的密度來(lái)估計(jì)上限。示例性地,可假設(shè)所述塊中布滿所述對(duì)象,所述塊中對(duì)象的重疊率為120%、130%等等。此后,基于所述塊和所述上限,通過(guò)神經(jīng)網(wǎng)絡(luò)檢測(cè)所述塊中的對(duì)象,以得到對(duì)象檢測(cè)結(jié)果。
[0031]更具體地,所述神經(jīng)網(wǎng)絡(luò)可以為各種類型的神經(jīng)網(wǎng)絡(luò),例如,反饋神經(jīng)網(wǎng)絡(luò)。所述反饋神經(jīng)網(wǎng)絡(luò)可以采用各種結(jié)構(gòu),在此不作具體限定。可通過(guò)所述神經(jīng)網(wǎng)絡(luò)執(zhí)行多次檢測(cè)過(guò)程。對(duì)于每次檢測(cè)過(guò)程,將所述塊和所述上限輸入訓(xùn)練后的神經(jīng)網(wǎng)絡(luò),以得到所述塊中本次檢測(cè)過(guò)程所對(duì)應(yīng)的對(duì)象的位置以及所述位置處存在所述對(duì)象的置信度。多次檢測(cè)過(guò)程中所分別獲得的置信度可以以例如降序的特定順序排列。
[0032]然后,判斷是否達(dá)到結(jié)束條件。作為第一示例,可判斷檢測(cè)到的對(duì)象的數(shù)目是否到達(dá)所述上限。作為第二示例,例如在置信度降序排列的情況下,可判斷本次檢測(cè)過(guò)程所得到的置信度是否小于閾值。當(dāng)然,如上所述的結(jié)束條件僅為示例。本領(lǐng)域技術(shù)人員能夠在此基礎(chǔ)之上設(shè)計(jì)其他各種結(jié)束條件。
[0033]當(dāng)判斷沒(méi)有達(dá)到結(jié)束條件時(shí),繼續(xù)執(zhí)行下一次檢測(cè)過(guò)程。另一方面,當(dāng)判斷達(dá)到結(jié)束條件時(shí),將各次檢測(cè)過(guò)程所對(duì)應(yīng)的各個(gè)對(duì)象的位置及各自的置信度輸出作為對(duì)象檢測(cè)結(jié)果ο
[0034]以上,描述了通過(guò)神經(jīng)網(wǎng)絡(luò)檢測(cè)所述塊中的對(duì)象的處理。關(guān)于所述神經(jīng)網(wǎng)絡(luò)的訓(xùn)練,可預(yù)先將包含正樣本(即,包含對(duì)象的數(shù)據(jù))和負(fù)樣本(即,不包含對(duì)象的數(shù)據(jù))的多個(gè)訓(xùn)練數(shù)據(jù)輸入神經(jīng)網(wǎng)絡(luò)。每個(gè)訓(xùn)練數(shù)據(jù)可包含圖像以及圖像中對(duì)象的位置等的各種信息。然后,對(duì)標(biāo)定的真實(shí)數(shù)據(jù)(ground-truth)中的樣本與預(yù)測(cè)結(jié)果中的樣本通過(guò)諸如匈牙利算法等的各種算法進(jìn)行匹配,從而訓(xùn)練所述神經(jīng)網(wǎng)絡(luò)??蛇x地,在進(jìn)行所述匹配之后,還可基于匹配的準(zhǔn)確度以及輸出的結(jié)果在三維物理場(chǎng)景中的大小的可能性,計(jì)算出預(yù)測(cè)結(jié)果的損耗(loss) ο
[0035]需要指出的是,以上描述了神經(jīng)網(wǎng)絡(luò)的一種訓(xùn)練方式。本領(lǐng)域技術(shù)人員能夠理解,可通過(guò)其他各種方式對(duì)所述神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,在此不作具體限定。
[0036]以上,參照?qǐng)D1描述了本發(fā)明實(shí)施例的對(duì)象檢測(cè)方法。在本發(fā)明實(shí)施例的對(duì)象檢測(cè)方法中,對(duì)各幀圖像進(jìn)行分塊操作,通過(guò)神經(jīng)網(wǎng)絡(luò)檢測(cè)所得到的每個(gè)塊,從而即使在復(fù)雜的高密度場(chǎng)景中也能進(jìn)行準(zhǔn)確的對(duì)象檢測(cè),極大提高了對(duì)象檢測(cè)的準(zhǔn)確度。
[0037]而且,本發(fā)明實(shí)施例的對(duì)象檢測(cè)方法有廣泛的通用性,通過(guò)一次性地簡(jiǎn)單配置可以有效地應(yīng)用于各種智能監(jiān)控場(chǎng)景和領(lǐng)域,從而可以有效地節(jié)約人力資源,并且實(shí)時(shí)準(zhǔn)確地對(duì)于監(jiān)控中的安全問(wèn)題(如人流密度過(guò)高)給出分析和警報(bào)。
[0038]需要指出的是,在上面的描述中,有時(shí)以行人檢測(cè)為例說(shuō)明本發(fā)明實(shí)施例的對(duì)象檢測(cè)方法。然而,本領(lǐng)域技術(shù)人員能夠理解,本發(fā)明實(shí)施例的對(duì)象檢測(cè)方法不限于此,而是可以適當(dāng)?shù)貞?yīng)用于諸如車輛等的其他各種對(duì)象的檢測(cè)。
[0039]此外,本發(fā)明實(shí)施例的對(duì)象檢測(cè)方法還可應(yīng)用于對(duì)象跟蹤,S卩,本發(fā)明實(shí)施例的對(duì)象檢測(cè)方法可實(shí)現(xiàn)為一種對(duì)象跟蹤方法。圖2是圖示在此情況下的對(duì)象檢測(cè)方法的主要步驟的流程圖。
[0040]圖2中的步驟S210-S240的處理分別與圖1中的步驟S110-S140的處理相類似,在此不再重復(fù)。與圖1不同的是,在圖2中,在獲得對(duì)象檢測(cè)結(jié)果之后,在步驟S250,對(duì)至少兩幀圖像的對(duì)象檢測(cè)結(jié)果進(jìn)行匹配,以得到對(duì)象跟蹤結(jié)果。此時(shí),步驟S210中的至少一幀為不少于兩幀,步驟S250中的至少兩幀為步驟S210中的至少一幀的子集。
[0041]具體地,所述至少兩幀圖像可以為所述圖像序列中的任兩幀圖像??蛇x地,為使得對(duì)象跟蹤結(jié)果更加準(zhǔn)確,所述至少兩幀圖像為所述圖像序列中時(shí)間上比較接近的兩幀。例如,所述至少兩幀圖像可以為所述圖像序列中的相鄰兩幀。
[0042]更具體地,可以對(duì)于所述至少兩幀圖像中的每一幀圖像,提取所述圖像中檢測(cè)到的每個(gè)對(duì)象的特征信息。所述特征信息例如包括所述對(duì)象的位置信息、外觀信息和紋理信息中的至少一個(gè)。所述外觀信息例如為所述對(duì)象的顏色信息,如RGB或HSV直方圖、方向梯度直方圖等等。所述紋理信息例如為局部二值模式(local binary pattern)等等。
[0043]接下來(lái),對(duì)于所述至少兩幀圖像的其中一幀中每個(gè)對(duì)象,基于所述特征信息,對(duì)所述對(duì)象與所述至少兩幀圖像的其他幀中每個(gè)對(duì)象的對(duì)分配權(quán)重,所述權(quán)重表示所述對(duì)象與其他幀中每個(gè)對(duì)象之間相匹配的概率。例如:對(duì)于當(dāng)前幀中每個(gè)對(duì)象,基于所述特征信息,對(duì)所述對(duì)象與下一幀中每個(gè)對(duì)象的對(duì)分配權(quán)重。所述權(quán)重表示所述對(duì)象與下一幀中每個(gè)對(duì)象之間相匹配的概率。
[0044]在第一種方式中,可基于所述特征信息,通過(guò)諸如支持向量機(jī)、隨機(jī)分類器(random forest)、卷積神經(jīng)網(wǎng)絡(luò)等的各種方式,直接計(jì)算所述對(duì)象與下一幀中每個(gè)對(duì)象之間的對(duì)的權(quán)重。
[0045]在第二種方式中,可通過(guò)諸如支持向量機(jī)、隨機(jī)分類器(random forest)、卷積神經(jīng)網(wǎng)絡(luò)等的各種方式,計(jì)算所述對(duì)象與下一幀中每個(gè)對(duì)象之間的歐氏距離。然后,基于所述歐氏距離,對(duì)所述對(duì)象與下一幀中每個(gè)對(duì)象的對(duì)分配權(quán)重。所述歐氏距離越小,代表所述對(duì)象對(duì)中的兩個(gè)對(duì)象之間的相似度越高,從而對(duì)所述對(duì)象對(duì)所分配的權(quán)重越大。所述歐氏距離越大,代表所述對(duì)象對(duì)中的兩個(gè)對(duì)象之間的相似度越低,從而對(duì)所述對(duì)象對(duì)所分配的權(quán)重越小。
[0046]當(dāng)然,如上所述的兩種方式僅為示例。本領(lǐng)域技術(shù)人員可以在此基礎(chǔ)之上設(shè)計(jì)其他方式來(lái)計(jì)算權(quán)重。
[0047]然后,基于所述權(quán)重,對(duì)所述圖像序列中的所述至少兩幀圖像進(jìn)行匹配,以得到對(duì)象跟蹤結(jié)果。具體地,可通過(guò)諸如匈牙利算法、粒子濾波器、卡爾曼濾波器等的各種算法,對(duì)所述至少兩幀圖像之間進(jìn)行匹配,以得到對(duì)象跟蹤結(jié)果。
[0048]以上,描述了本發(fā)明實(shí)施例的對(duì)象檢測(cè)方法在對(duì)象跟蹤場(chǎng)景中的應(yīng)用。在本發(fā)明實(shí)施例的對(duì)象檢測(cè)方法中,對(duì)每幀圖像進(jìn)行分塊操作,通過(guò)神經(jīng)網(wǎng)絡(luò)檢測(cè)所得到的每個(gè)塊,并對(duì)至少兩幀之間的對(duì)象檢測(cè)結(jié)果進(jìn)行匹配從而得到對(duì)象跟蹤結(jié)果,從而即使在復(fù)雜的高密度場(chǎng)景中也能進(jìn)行準(zhǔn)確的對(duì)象檢測(cè)和跟蹤。
[0049]下面,將參照?qǐng)D3描述本發(fā)明實(shí)施例的對(duì)象檢測(cè)裝置。
[0050]圖3是圖示本發(fā)明實(shí)施例的對(duì)象檢測(cè)裝置的主要配置的框圖。如圖3所示,本發(fā)明實(shí)施例的對(duì)象檢測(cè)裝置300包括:三維坐標(biāo)獲取單元310、前景提取單元320、分塊單元330和檢測(cè)單元340。
[0051]具體地,所述三維坐標(biāo)獲取單元310將圖像序列中的至少一幀圖像映射到三維物理空間,以獲得所