本發(fā)明涉及圖像識(shí)別領(lǐng)域,更具體地涉及一種行人檢測(cè)的方法及裝置。
背景技術(shù):
行人檢測(cè)是通用物體檢測(cè)的子問(wèn)題,吸引了學(xué)術(shù)界和工業(yè)界的大量興趣。首先,行人檢測(cè)可以應(yīng)用于安防、自動(dòng)(輔助)駕駛、智能監(jiān)控和人機(jī)交互等多個(gè)領(lǐng)域,是一項(xiàng)基本且重要的技術(shù)。
現(xiàn)有的行人檢測(cè)無(wú)法解決遮擋、人體重疊等問(wèn)題。遮擋,指由于存在障礙物導(dǎo)致目標(biāo)只有部分可見(jiàn),常見(jiàn)的遮擋后果是人體只有上(下)半身或左(右)半身可見(jiàn)。人體重疊,指兩人及以上在圖片中的位置關(guān)系發(fā)生重合,常見(jiàn)的人體重疊多見(jiàn)于人群較為密集的場(chǎng)景。
遮擋及重疊是行人檢測(cè)中最棘手的兩個(gè)問(wèn)題。部分不可見(jiàn)會(huì)降低傳統(tǒng)行人檢測(cè)方法的檢出率;重疊對(duì)技術(shù)的要求則更高,因?yàn)閷?duì)于重疊的人,神經(jīng)網(wǎng)絡(luò)更傾向于將兩人(甚至多人)檢測(cè)為同一個(gè)人,即不能將重疊的目標(biāo)劃分開(kāi)來(lái)。同時(shí),現(xiàn)有的行人檢測(cè)技術(shù)通常需要在后期處理中運(yùn)用“非最大抑制”的方法。“非最大抑制”是為了處理神經(jīng)網(wǎng)絡(luò)對(duì)同一個(gè)人報(bào)出兩次(或多次)檢測(cè),因此需對(duì)多個(gè)空間位置接近的檢測(cè)結(jié)果進(jìn)行合并。在重疊的情況下,非最大抑制還會(huì)導(dǎo)致對(duì)不同目標(biāo)的檢測(cè)結(jié)果被誤合并。
技術(shù)實(shí)現(xiàn)要素:
考慮到上述問(wèn)題而提出了本發(fā)明。本發(fā)明提供了一種行人檢測(cè)的方法,能夠在基于待檢測(cè)圖片中的行人信息,得到行人檢測(cè)的結(jié)果,從而能夠提高行人檢測(cè)的精度。
根據(jù)本發(fā)明的第一方面,提供了一種行人檢測(cè)的方法,包括:
接收待檢測(cè)圖片;
采用神經(jīng)網(wǎng)絡(luò),確定所述待檢測(cè)圖片中的行人信息,所述行人信息包括行人的位置以及所述行人的關(guān)鍵點(diǎn)位置;
對(duì)所述待檢測(cè)圖片中的所述行人信息進(jìn)行后處理,得到所述行人檢測(cè)的結(jié)果。
示例性地,所述行人的關(guān)鍵點(diǎn)位置包括以下中的至少一項(xiàng):頭部位置、左肩位置、右肩位置、左膝位置、右膝位置、左腳位置、右腳位置。
示例性地,所述對(duì)所述待檢測(cè)圖片中的所述行人信息進(jìn)行后處理,得到所述行人檢測(cè)的結(jié)果,包括:
對(duì)所述待檢測(cè)圖片中的所述行人信息進(jìn)行過(guò)濾,得到所述行人信息中的高概率行人信息;
對(duì)所述高概率行人信息進(jìn)行處理,得到所述行人檢測(cè)的結(jié)果,
其中,所述高概率行人信息為概率值大于或等于概率閾值的行人信息,所述概率閾值為預(yù)設(shè)概率值。
示例性地,所述對(duì)所述高概率行人信息進(jìn)行處理,得到所述行人檢測(cè)的結(jié)果,包括:根據(jù)所述高概率行人信息中的所述行人的關(guān)鍵點(diǎn)位置,得到所述行人檢測(cè)的結(jié)果。
示例性地,所述根據(jù)所述高概率行人信息中的所述行人的關(guān)鍵點(diǎn)位置,得到所述行人檢測(cè)的結(jié)果,包括:根據(jù)所述高概率行人信息中的相鄰的兩個(gè)所述行人信息中所述關(guān)鍵點(diǎn)的空間位置與距離確定所述相鄰的兩個(gè)所述行人信息是否屬于同一行人,以得到所述行人檢測(cè)的結(jié)果。
示例性地,所述根據(jù)所述高概率行人信息中的所述行人的關(guān)鍵點(diǎn)位置,得到所述行人檢測(cè)的結(jié)果,包括:根據(jù)所述高概率行人信息中的相鄰的兩個(gè)所述行人信息中所述關(guān)鍵點(diǎn)的空間位置與距離確定所述相鄰的兩個(gè)所述行人信息是否屬于同一行人,若所述相鄰的兩個(gè)所述行人信息屬于同一行人,則利用非最大抑制方法,對(duì)所述相鄰的兩個(gè)所述行人信息進(jìn)行合并操作,得到所述行人檢測(cè)的結(jié)果。
示例性地,在所述方法之前,還包括:基于至少一張訓(xùn)練圖像,通過(guò)訓(xùn)練得到所述神經(jīng)網(wǎng)絡(luò);其中,所述訓(xùn)練圖像中標(biāo)注有行人信息。
根據(jù)本發(fā)明的第二方面,提供了一種行人檢測(cè)的裝置,包括:
接收模塊,用于接收待檢測(cè)圖片;
確定模塊,用于采用神經(jīng)網(wǎng)絡(luò),確定所述待檢測(cè)圖片中的行人信息,所述行人信息包括行人的位置以及所述行人的關(guān)鍵點(diǎn)位置;
后處理模塊,用于對(duì)所述待檢測(cè)圖片中的所述行人信息進(jìn)行后處理,得到所述行人檢測(cè)的結(jié)果。
示例性地,所述行人的關(guān)鍵點(diǎn)位置包括以下中的至少一項(xiàng):頭部位置、左肩位置、右肩位置、左膝位置、右膝位置、左腳位置、右腳位置。
示例性地,所述后處理模塊,包括:
過(guò)濾子模塊,用于對(duì)所述待檢測(cè)圖片中的所述行人信息進(jìn)行過(guò)濾,得到所述行人信息中的高概率行人信息;
處理子模塊,用于對(duì)所述高概率行人信息進(jìn)行處理,得到所述行人檢測(cè)的結(jié)果,
其中,所述高概率行人信息為概率值大于或等于概率閾值的行人信息,所述概率閾值為預(yù)設(shè)概率值。
示例性地,所述處理子模塊,用于:根據(jù)所述高概率行人信息中的所述行人的關(guān)鍵點(diǎn)位置,得到所述行人檢測(cè)的結(jié)果。
示例性地,所述處理子模塊,用于:根據(jù)所述高概率行人信息中的相鄰的兩個(gè)所述行人信息中所述關(guān)鍵點(diǎn)的空間位置與距離確定所述相鄰的兩個(gè)所述行人信息是否屬于同一行人,以得到所述行人檢測(cè)的結(jié)果。
示例性地,所述處理子模塊,用于:根據(jù)所述高概率行人信息中的相鄰的兩個(gè)所述行人信息中所述關(guān)鍵點(diǎn)的空間位置與距離確定所述相鄰的兩個(gè)所述行人信息是否屬于同一行人,若所述相鄰的兩個(gè)所述行人信息屬于同一行人,則利用非最大抑制方法,對(duì)所述相鄰的兩個(gè)所述行人信息進(jìn)行合并操作,得到所述行人檢測(cè)的結(jié)果。
示例性地,還包括訓(xùn)練模塊,用于:基于至少一張訓(xùn)練圖像,通過(guò)訓(xùn)練得到所述神經(jīng)網(wǎng)絡(luò);其中,所述訓(xùn)練圖像中標(biāo)注有行人信息。
第二方面所述的該裝置能夠用于實(shí)現(xiàn)前述第一方面的行人檢測(cè)的方法。
根據(jù)本發(fā)明的第三方面,提供了一種計(jì)算機(jī)芯片,該計(jì)算機(jī)芯片包括處理器和存儲(chǔ)器。所述存儲(chǔ)器存儲(chǔ)有指令代碼,所述處理器用于執(zhí)行所述指令代碼,且當(dāng)所述處理器執(zhí)行指令代碼時(shí),能夠?qū)崿F(xiàn)前述第一方面所述的行人檢測(cè)的方法。
由此可見(jiàn),本發(fā)明實(shí)施例對(duì)于待檢測(cè)圖片,可以采用神經(jīng)網(wǎng)絡(luò),得到行人位置和行人的關(guān)鍵點(diǎn)信息,這樣通過(guò)引入行人的關(guān)鍵點(diǎn)信息,解決了傳統(tǒng)行人檢測(cè)方法中難以解決的遮擋和重疊問(wèn)題,提升了檢測(cè)的精確度。
附圖說(shuō)明
通過(guò)結(jié)合附圖對(duì)本發(fā)明實(shí)施例進(jìn)行更詳細(xì)的描述,本發(fā)明的上述以及其它目的、特征和優(yōu)勢(shì)將變得更加明顯。附圖用來(lái)提供對(duì)本發(fā)明實(shí)施例的進(jìn)一步理解,并且構(gòu)成說(shuō)明書(shū)的一部分,與本發(fā)明實(shí)施例一起用于解釋本發(fā)明,并不構(gòu)成對(duì)本發(fā)明的限制。在附圖中,相同的參考標(biāo)號(hào)通常代表相同部件或步驟。
圖1是本發(fā)明實(shí)施例的電子設(shè)備的一個(gè)示意性框圖;
圖2是本發(fā)明實(shí)施例的行人檢測(cè)的方法的一個(gè)示意性流程圖;
圖3是本發(fā)明實(shí)施例的行人檢測(cè)的裝置的一個(gè)示意性框圖;
圖4是本發(fā)明實(shí)施例的行人檢測(cè)的裝置的另一個(gè)示意性框圖。
具體實(shí)施方式
為了使得本發(fā)明的目的、技術(shù)方案和優(yōu)點(diǎn)更為明顯,下面將參照附圖詳細(xì)描述根據(jù)本發(fā)明的示例實(shí)施例。顯然,所描述的實(shí)施例僅僅是本發(fā)明的一部分實(shí)施例,而不是本發(fā)明的全部實(shí)施例,應(yīng)理解,本發(fā)明不受這里描述的示例實(shí)施例的限制。基于本發(fā)明中描述的本發(fā)明實(shí)施例,本領(lǐng)域技術(shù)人員在沒(méi)有付出創(chuàng)造性勞動(dòng)的情況下所得到的所有其它實(shí)施例都應(yīng)落入本發(fā)明的保護(hù)范圍之內(nèi)。
本發(fā)明實(shí)施例可以應(yīng)用于電子設(shè)備,圖1所示為本發(fā)明實(shí)施例的電子設(shè)備的一個(gè)示意性框圖。圖1所示的電子設(shè)備10包括一個(gè)或多個(gè)處理器102、一個(gè)或多個(gè)存儲(chǔ)裝置104、輸入裝置106、輸出裝置108、圖像傳感器110以及一個(gè)或多個(gè)非圖像傳感器114,這些組件通過(guò)總線系統(tǒng)112和/或其它形式互連。應(yīng)當(dāng)注意,圖1所示的電子設(shè)備10的組件和結(jié)構(gòu)只是示例性的,而非限制性的,根據(jù)需要,所述電子設(shè)備也可以具有其他組件和結(jié)構(gòu)。
所述處理器102可以包括CPU 1021和GPU 1022或者具有數(shù)據(jù)處理能力和/或指令執(zhí)行能力的其它形式的處理單元,例如現(xiàn)場(chǎng)可編程門(mén)陣列(Field-Programmable Gate Array,F(xiàn)PGA)或進(jìn)階精簡(jiǎn)指令集機(jī)器(Advanced RISC(Reduced Instruction Set Computer)Machine,ARM)等,并且處理器102可以控制所述電子設(shè)備10中的其它組件以執(zhí)行期望的功能。
所述存儲(chǔ)裝置104可以包括一個(gè)或多個(gè)計(jì)算機(jī)程序產(chǎn)品,所述計(jì)算機(jī)程序產(chǎn)品可以包括各種形式的計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),例如易失性存儲(chǔ)器1041和/或非易失性存儲(chǔ)器1042。所述易失性存儲(chǔ)器1041例如可以包括隨機(jī)存取存儲(chǔ)器(Random Access Memory,RAM)和/或高速緩沖存儲(chǔ)器(cache)等。所述非易失性存儲(chǔ)器1042例如可以包括只讀存儲(chǔ)器(Read-Only Memory,ROM)、硬盤(pán)、閃存等。在所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)上可以存儲(chǔ)一個(gè)或多個(gè)計(jì)算機(jī)程序指令,處理器102可以運(yùn)行所述程序指令,以實(shí)現(xiàn)各種期望的功能。在所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)中還可以存儲(chǔ)各種應(yīng)用程序和各種數(shù)據(jù),例如所述應(yīng)用程序使用和/或產(chǎn)生的各種數(shù)據(jù)等。
所述輸入裝置106可以是用戶用來(lái)輸入指令的裝置,并且可以包括鍵盤(pán)、鼠標(biāo)、麥克風(fēng)和觸摸屏等中的一個(gè)或多個(gè)。
所述輸出裝置108可以向外部(例如用戶)輸出各種信息(例如圖像或聲音),并且可以包括顯示器、揚(yáng)聲器等中的一個(gè)或多個(gè)。
所述圖像傳感器110可以拍攝用戶期望的圖像(例如照片、視頻等),并且將所拍攝的圖像存儲(chǔ)在所述存儲(chǔ)裝置104中以供其它組件使用。
當(dāng)注意,圖1所示的電子設(shè)備10的組件和結(jié)構(gòu)只是示例性的,盡管圖1示出的電子設(shè)備10包括多個(gè)不同的裝置,但是根據(jù)需要,其中的一些裝置可以不是必須的,其中的一些裝置的數(shù)量可以更多等等,本發(fā)明對(duì)此不限定。
圖2是本發(fā)明實(shí)施例的行人檢測(cè)的方法的一個(gè)示意性流程圖。圖2所示的方法包括:
S101,接收待檢測(cè)圖片。
作為一例,該待檢測(cè)圖片可以是實(shí)時(shí)采集的圖片,具體地可以是由圖像采集裝置實(shí)時(shí)采集的圖片。例如可以是由攝像頭采集的視頻中的一幀圖像或多幀圖像,或者,可以是由照相機(jī)拍攝到的一張圖片。作為另一例,該待檢測(cè)圖片可以是從特定的源獲取的,例如可以從存儲(chǔ)器中獲取先前采集并存儲(chǔ)的圖片。本發(fā)明對(duì)此不限定。
S102,采用神經(jīng)網(wǎng)絡(luò),確定所述待檢測(cè)圖片中的行人信息,所述行人信息包括行人的位置以及所述行人的關(guān)鍵點(diǎn)位置。
示例性地,行人的關(guān)鍵點(diǎn)位置包括以下中的至少一項(xiàng):頭部位置、兩肩位置、兩膝位置、兩腳位置。
示例性地,所述行人的關(guān)鍵點(diǎn)位置包括以下中的至少一項(xiàng):頭部位置、左肩位置、右肩位置、左膝位置、右膝位置、左腳位置、右腳位置。
具體地,在S102中,可以將待檢測(cè)圖片輸入到神經(jīng)網(wǎng)絡(luò)中,經(jīng)由該神經(jīng)網(wǎng)絡(luò)得到行人信息。
與傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)不同,本發(fā)明實(shí)施例中的神經(jīng)網(wǎng)絡(luò)不僅能夠得到行人位置,并且能夠得到行人的關(guān)鍵點(diǎn)位置。另外,S102所得到的行人信息中,不僅包括該待檢測(cè)圖片的身體各個(gè)部位顯示完整的行人的行人信息,還包括身體部分區(qū)域被遮擋的行人的行人信息。
舉例來(lái)說(shuō),如果該待檢測(cè)圖片中包括行人A,由于被遮擋,該行人A只有部分身體可見(jiàn)。那么在S102中,基于該神經(jīng)網(wǎng)絡(luò),可以根據(jù)行人A可見(jiàn)的身體部分推測(cè)其他的身體部分。例如,如果行人A的頭部、左肩、左腿可見(jiàn),那么基于該神經(jīng)網(wǎng)絡(luò)不僅可以直接得到該行人A的頭部位置、左肩位置、左膝位置和左腳位置,并且能夠推測(cè)出該行人A的右肩位置、右膝位置和右腳位置。從而得到了行人A的關(guān)鍵點(diǎn)信息:頭部位置、兩肩位置、兩膝位置和兩腳位置。
作為一例,可以基于所得到的行人的關(guān)鍵點(diǎn)信息確定該行人所在的矩形區(qū)域,作為行人位置。作為另一例,可以采用神經(jīng)網(wǎng)絡(luò)提取該待檢測(cè)圖片的特征張量,并基于該特征張量確定行人所在的矩形區(qū)域,作為行人位置。本發(fā)明對(duì)此不限定。
由此可見(jiàn),本實(shí)施例中,基于神經(jīng)網(wǎng)絡(luò),能夠得到被遮擋的行人的行人信息,從而能夠避免信息丟失,保證處理的精度。
S103,對(duì)所述待檢測(cè)圖片中的所述行人信息進(jìn)行后處理,得到所述行人檢測(cè)的結(jié)果。
可選地,行人信息可以包括低概率行人信息和高概率行人信息。通過(guò)神經(jīng)網(wǎng)絡(luò)對(duì)接收到的圖像進(jìn)行識(shí)別,獲取圖像中的行人信息,對(duì)獲取到的行人信息進(jìn)行概率算法運(yùn)算,獲得行人信息的概率值,將獲得的行人信息的概率值與概率閾值進(jìn)行比對(duì),若行人信息的概率值大于或等于概率閾值,則判斷為高概率行人信息;若行人信息的概率值小于概率閾值,則判斷為低概率行人信息。其中,概率閾值可以為預(yù)先設(shè)定的概率值,可依據(jù)使用場(chǎng)景進(jìn)行設(shè)定。
示例性地,S103可以包括:對(duì)所述待檢測(cè)圖片中的所述行人信息進(jìn)行過(guò)濾,得到所述行人信息中的所述高概率行人信息;對(duì)所述高概率行人信息進(jìn)行處理,得到所述行人檢測(cè)的結(jié)果。其中,所述高概率行人信息為概率值大于或等于概率閾值的行人信息。
也就是說(shuō),可以過(guò)濾掉行人信息中的低概率行人信息,只包括高概率行人信息;并進(jìn)一步基于高概率行人信息得到行人檢測(cè)的結(jié)果。
示例性地,所述對(duì)所述過(guò)濾之后的所述行人信息進(jìn)行處理,得到所述行人檢測(cè)的結(jié)果,包括:根據(jù)所述高概率行人信息中的相鄰的兩個(gè)所述行人信息中所述關(guān)鍵點(diǎn)的空間位置與距離確定所述相鄰的兩個(gè)所述行人信息是否屬于同一行人,以得到所述行人檢測(cè)的結(jié)果。
也就是說(shuō),可以利用高概率行人信息中的關(guān)鍵點(diǎn)位置進(jìn)行判斷處理,從而得到行人檢測(cè)的結(jié)果。其中,關(guān)鍵點(diǎn)信息包括但不限于目標(biāo)頭部距離,目標(biāo)肩部重合度等??蛇x地,可在上述處理過(guò)程中輔助實(shí)施非最大抑制(Non-Maximum Suppression,NMS),根據(jù)所述高概率行人信息中的相鄰的兩個(gè)所述行人信息中所述關(guān)鍵點(diǎn)的空間位置與距離確定所述相鄰的兩個(gè)所述行人信息是否屬于同一行人,若所述相鄰的兩個(gè)所述行人信息屬于同一行人,則利用非最大抑制方法,對(duì)所述相鄰的兩個(gè)所述行人信息進(jìn)行合并操作,得到所述行人檢測(cè)的結(jié)果,從而進(jìn)一步提升檢測(cè)結(jié)果的精度。
利用高概率行人信息中的關(guān)鍵點(diǎn)位置進(jìn)行判斷處理得到行人檢測(cè)的結(jié)果,可采用如下方式之一進(jìn)行。
方式一:基于人體部位特征對(duì)高概率行人信息中的關(guān)鍵點(diǎn)進(jìn)行分類,例如,將行人信息關(guān)鍵點(diǎn)中屬于行人頭部的關(guān)鍵點(diǎn)分類識(shí)別為頭部關(guān)鍵點(diǎn),將屬于行人左肩的關(guān)鍵點(diǎn)分類識(shí)別為左肩關(guān)鍵點(diǎn);分析相鄰的同屬于一類的關(guān)鍵點(diǎn)之間的空間位置與距離,以區(qū)分遮擋和/或重疊的行人,例如,相鄰兩個(gè)頭部關(guān)鍵點(diǎn)之間的距離大于預(yù)設(shè)值,則判斷這兩個(gè)頭部關(guān)鍵點(diǎn)屬于兩個(gè)人,相鄰的兩個(gè)左肩關(guān)鍵點(diǎn)之間的距離小于預(yù)設(shè)值,則判斷這兩個(gè)左肩關(guān)鍵點(diǎn)屬于一個(gè)人。由于一個(gè)行人擁有多個(gè)關(guān)鍵點(diǎn),通過(guò)判斷每一個(gè)關(guān)鍵點(diǎn)與相鄰的同類關(guān)鍵點(diǎn)之間的空間位置與距離,避免了傳統(tǒng)行人檢測(cè)僅檢測(cè)行人整體產(chǎn)生的遮擋和重疊問(wèn)題,提升了檢測(cè)的精度;
方式二:基于人體部位特征對(duì)高概率行人信息中的關(guān)鍵點(diǎn)進(jìn)行分類,例如,將行人信息關(guān)鍵點(diǎn)中屬于行人頭部的關(guān)鍵點(diǎn)分類識(shí)別為頭部關(guān)鍵點(diǎn),將屬于行人左肩的關(guān)鍵點(diǎn)分類識(shí)別為左肩關(guān)鍵點(diǎn);分析相鄰行人信息中的關(guān)鍵點(diǎn)之間的空間位置與距離,以區(qū)分遮擋和/或重疊的行人,例如,相鄰的行人信息為行人信息A和行人信息B,判斷行人信息A中的左肩關(guān)鍵點(diǎn)與行人信息B中的頭部關(guān)鍵點(diǎn)和/或右肩關(guān)鍵點(diǎn)和/或左膝關(guān)鍵點(diǎn)和/或左腳關(guān)鍵點(diǎn)等關(guān)鍵點(diǎn)之間的空間位置與距離,當(dāng)行人信息A中的左肩關(guān)鍵點(diǎn)與行人信息B中的頭部關(guān)鍵點(diǎn)和/或右肩關(guān)鍵點(diǎn)、和/或左膝關(guān)鍵點(diǎn)、和/或左腳關(guān)鍵點(diǎn)等關(guān)鍵點(diǎn)之間的空間位置與距離符合預(yù)設(shè)條件時(shí),則判斷行人信息A和行人信息B屬于同一行人,其中,預(yù)設(shè)條件包括預(yù)設(shè)距離和/或預(yù)設(shè)相對(duì)位置等。
由此可見(jiàn),在S103的后處理過(guò)程中,可以綜合神經(jīng)網(wǎng)絡(luò)檢測(cè)或推測(cè)的所有行人信息,移除低置信度的行人信息而保留高置信度的行人信息,這樣能夠保證該處理過(guò)程的精度。
示例性地,本發(fā)明實(shí)施例中所采用的神經(jīng)網(wǎng)絡(luò)可以是在圖2所述的方法之前,通過(guò)訓(xùn)練的方法所得到的。
具體地,在圖2所示的方法之前,可以包括:基于至少一張訓(xùn)練圖像,通過(guò)訓(xùn)練得到所述神經(jīng)網(wǎng)絡(luò)。其中,所述訓(xùn)練圖像中標(biāo)注有行人信息。所述行人信息包括行人的位置以及所述行人的關(guān)鍵點(diǎn)位置。
可選地,在圖2所示的方法之前,可以包括:獲取至少一張訓(xùn)練圖像;對(duì)所述訓(xùn)練圖像進(jìn)行標(biāo)注;基于所述標(biāo)注的訓(xùn)練圖像,通過(guò)訓(xùn)練得到所述神經(jīng)網(wǎng)絡(luò)。
其中,對(duì)所述訓(xùn)練圖像進(jìn)行標(biāo)注包括:對(duì)每一張訓(xùn)練圖像中的每一個(gè)行人樣本,標(biāo)注該行人樣本的位置,并標(biāo)注該行人樣本的頭部位置、兩肩位置、兩膝位置和兩腳位置。其中,如果行人樣本的某個(gè)或某幾個(gè)部位被遮擋時(shí),對(duì)該某個(gè)或某幾個(gè)部位標(biāo)記為遮擋??梢?jiàn),標(biāo)注信息不僅包括行人位置、頭部位置、兩肩位置、兩膝位置和兩腳位置,還包括是否被遮擋的信息。示例性的,將行人B的關(guān)鍵點(diǎn)信息在圖片中進(jìn)行標(biāo)注,假設(shè)圖片中行人B的頭部位置、左肩位置、左膝位置和左腳位置未被遮擋,右肩位置、右膝位置和右腳位置被其他行人或物體遮擋,則可在行人B的頭部位置、左肩位置、左膝位置和左腳位置分別標(biāo)記為“頭部”、“左肩”、“左膝”、“左腳”;在被遮擋的行人B的右肩位置、右膝位置和右腳位置分別標(biāo)記為“右肩(遮擋)”、“右膝(遮擋)”、“右腳(遮擋)”,或在被遮擋的行人B的右肩位置、右膝位置和右腳位置統(tǒng)一標(biāo)記為“遮擋”。
進(jìn)一步地,所訓(xùn)練的神經(jīng)網(wǎng)絡(luò)不僅要學(xué)會(huì)如何檢測(cè)或推測(cè)行人位置(即行人整體的位置),還應(yīng)學(xué)會(huì)如何檢測(cè)或推測(cè)每個(gè)行人的關(guān)鍵點(diǎn)位置。
由此可見(jiàn),本發(fā)明實(shí)施例對(duì)于待檢測(cè)圖片,可以采用神經(jīng)網(wǎng)絡(luò),得到行人位置和行人的關(guān)鍵點(diǎn)信息,通過(guò)引入行人的關(guān)鍵點(diǎn)信息,解決了傳統(tǒng)行人檢測(cè)方法中難以解決的遮擋和重疊問(wèn)題,提升了檢測(cè)的精確度。另外,可理解,行人的關(guān)鍵點(diǎn)信息還可以用于人體姿態(tài)分析等其他的領(lǐng)域,本發(fā)明對(duì)此不限定。
圖3是本發(fā)明實(shí)施例的行人檢測(cè)的裝置的一個(gè)示意性框圖。圖3所示的裝置30包括:接收模塊301、確定模塊302和后處理模塊303。
接收模塊301,用于接收待檢測(cè)圖片;
確定模塊302,用于采用神經(jīng)網(wǎng)絡(luò),確定接收模塊301接收的所述待檢測(cè)圖片中的行人信息,所述行人信息包括行人的位置以及所述行人的關(guān)鍵點(diǎn)位置;
后處理模塊303,用于對(duì)確定模塊302確定的所述待檢測(cè)圖片中的所述行人信息進(jìn)行后處理,得到所述行人檢測(cè)的結(jié)果。
示例性地,所述行人的關(guān)鍵點(diǎn)位置包括以下中的至少一項(xiàng):頭部位置、左肩位置、右肩位置、左膝位置、右膝位置、左腳位置、右腳位置。
示例性地,后處理模塊303,包括過(guò)濾子模塊和處理子模塊。
過(guò)濾子模塊可以用于對(duì)所述待檢測(cè)圖片中的所述行人信息進(jìn)行過(guò)濾,得到所述行人信息中的高概率行人信息。處理子模塊可以用于對(duì)所述高概率行人信息進(jìn)行處理,得到所述行人檢測(cè)的結(jié)果。其中,所述高概率行人信息為概率值大于或等于概率閾值的行人信息,所述概率閾值為預(yù)設(shè)概率值。
示例性地,所述處理子模塊可以用于:根據(jù)所述高概率行人信息中的所述行人的關(guān)鍵點(diǎn)位置,得到所述行人檢測(cè)的結(jié)果。
示例性地,所述處理子模塊可以具體用于:根據(jù)所述高概率行人信息中的相鄰的兩個(gè)所述行人信息中所述關(guān)鍵點(diǎn)的空間位置與距離確定所述相鄰的兩個(gè)所述行人信息是否屬于同一行人,以得到所述行人檢測(cè)的結(jié)果。
示例性地,所述處理子模塊可以具體用于:根據(jù)所述高概率行人信息中的相鄰的兩個(gè)所述行人信息中所述關(guān)鍵點(diǎn)的空間位置與距離確定所述相鄰的兩個(gè)所述行人信息是否屬于同一行人,若所述相鄰的兩個(gè)所述行人信息屬于同一行人,則利用非最大抑制方法,對(duì)所述相鄰的兩個(gè)所述行人信息進(jìn)行合并操作,得到所述行人檢測(cè)的結(jié)果。
處理子模塊利用高概率行人信息中的關(guān)鍵點(diǎn)位置進(jìn)行判斷處理得到行人檢測(cè)的結(jié)果,可采用如下方式之一進(jìn)行。
方式一:處理子模塊基于人體部位特征對(duì)高概率行人信息中的關(guān)鍵點(diǎn)進(jìn)行分類,例如,將行人信息關(guān)鍵點(diǎn)中屬于行人頭部的關(guān)鍵點(diǎn)分類識(shí)別為頭部關(guān)鍵點(diǎn),將屬于行人左肩的關(guān)鍵點(diǎn)分類識(shí)別為左肩關(guān)鍵點(diǎn);分析相鄰的同屬于一類的關(guān)鍵點(diǎn)之間的空間位置與距離,以區(qū)分遮擋和/或重疊的行人,例如,相鄰兩個(gè)頭部關(guān)鍵點(diǎn)之間的距離大于預(yù)設(shè)值,則判斷這兩個(gè)頭部關(guān)鍵點(diǎn)屬于兩個(gè)人,相鄰的兩個(gè)左肩關(guān)鍵點(diǎn)之間的距離小于預(yù)設(shè)值,則判斷這兩個(gè)左肩關(guān)鍵點(diǎn)屬于一個(gè)人。由于一個(gè)行人擁有多個(gè)關(guān)鍵點(diǎn),通過(guò)判斷每一個(gè)關(guān)鍵點(diǎn)與相鄰的同類關(guān)鍵點(diǎn)之間的空間位置與距離,避免了傳統(tǒng)行人檢測(cè)僅檢測(cè)行人整體產(chǎn)生的遮擋和重疊問(wèn)題,提升了檢測(cè)的精度;
方式二:處理子模塊基于人體部位特征對(duì)高概率行人信息中的關(guān)鍵點(diǎn)進(jìn)行分類,例如,將行人信息關(guān)鍵點(diǎn)中屬于行人頭部的關(guān)鍵點(diǎn)分類識(shí)別為頭部關(guān)鍵點(diǎn),將屬于行人左肩的關(guān)鍵點(diǎn)分類識(shí)別為左肩關(guān)鍵點(diǎn);分析相鄰行人信息中的關(guān)鍵點(diǎn)之間的空間位置與距離,以區(qū)分遮擋和/或重疊的行人,例如,相鄰的行人信息為行人信息A和行人信息B,判斷行人信息A中的左肩關(guān)鍵點(diǎn)與行人信息B中的頭部關(guān)鍵點(diǎn)和/或右肩關(guān)鍵點(diǎn)和/或左膝關(guān)鍵點(diǎn)和/或左腳關(guān)鍵點(diǎn)等關(guān)鍵點(diǎn)之間的空間位置與距離,當(dāng)行人信息A中的左肩關(guān)鍵點(diǎn)與行人信息B中的頭部關(guān)鍵點(diǎn)和/或右肩關(guān)鍵點(diǎn)和/或左膝關(guān)鍵點(diǎn)和/或左腳關(guān)鍵點(diǎn)等關(guān)鍵點(diǎn)之間的空間位置與距離符合預(yù)設(shè)條件時(shí),則判斷行人信息A和行人信息B屬于同一行人,其中,預(yù)設(shè)條件包括預(yù)設(shè)距離和/或預(yù)設(shè)相對(duì)位置等。
由此可見(jiàn),處理子模塊可以綜合神經(jīng)網(wǎng)絡(luò)檢測(cè)或推測(cè)的所有行人信息,移除低置信度的行人信息而保留高置信度的行人信息,這樣能夠保證該處理過(guò)程的精度。
示例性地,如圖4所示,裝置30還包括訓(xùn)練模塊304。訓(xùn)練模塊304可以用于:基于至少一張訓(xùn)練圖像,通過(guò)訓(xùn)練得到所述神經(jīng)網(wǎng)絡(luò)。其中,所述訓(xùn)練圖像中標(biāo)注有行人信息。所標(biāo)注的行人信息可以包括行人的位置以及所述行人的關(guān)鍵點(diǎn)位置。
圖3或圖4所示的裝置30能夠用于實(shí)現(xiàn)前述圖2所示的行人檢測(cè)的方法。
另外,本發(fā)明實(shí)施例還提供了另一種行人檢測(cè)的裝置,該裝置可以包括處理器和存儲(chǔ)器,其中,存儲(chǔ)器用于存儲(chǔ)指令代碼,處理器執(zhí)行該指令代碼時(shí),可以實(shí)現(xiàn)前述圖2所示的行人檢測(cè)的方法。
另外,本發(fā)明實(shí)施例還提供了另一種行人檢測(cè)的裝置,該裝置可以包括處理器,其中,處理器能夠同時(shí)實(shí)現(xiàn)圖3中確定模塊302和后處理模塊303的功能,從而實(shí)現(xiàn)前述圖2所示的行人檢測(cè)的方法。
另外,本發(fā)明實(shí)施例還提供了一種電子設(shè)備,該電子設(shè)備可以包括圖3或圖4所示的裝置30。該電子設(shè)備可以實(shí)現(xiàn)前述圖2所示的行人檢測(cè)的方法。
由此可見(jiàn),本發(fā)明實(shí)施例對(duì)于待檢測(cè)圖片,可以采用神經(jīng)網(wǎng)絡(luò),得到行人位置和行人的關(guān)鍵點(diǎn)信息,通過(guò)引入行人的關(guān)鍵點(diǎn)信息,解決了傳統(tǒng)行人檢測(cè)方法中難以解決的遮擋和重疊問(wèn)題,提升了檢測(cè)的精確度。也就是說(shuō)本發(fā)明實(shí)施例的方法在行人檢測(cè)過(guò)程中能夠保證高精度和準(zhǔn)確度。另外,可理解,行人的關(guān)鍵點(diǎn)信息還可以用于人體姿態(tài)分析等其他的領(lǐng)域,本發(fā)明對(duì)此不限定。
盡管這里已經(jīng)參考附圖描述了示例實(shí)施例,應(yīng)理解上述示例實(shí)施例僅僅是示例性的,并且不意圖將本發(fā)明的范圍限制于此。本領(lǐng)域普通技術(shù)人員可以在其中進(jìn)行各種改變和修改,而不偏離本發(fā)明的范圍和精神。所有這些改變和修改意在被包括在所附權(quán)利要求所要求的本發(fā)明的范圍之內(nèi)。
本領(lǐng)域普通技術(shù)人員可以意識(shí)到,結(jié)合本文中所公開(kāi)的實(shí)施例描述的各示例的單元及算法步驟,能夠以電子硬件、或者計(jì)算機(jī)軟件和電子硬件的結(jié)合來(lái)實(shí)現(xiàn)。這些功能究竟以硬件還是軟件方式來(lái)執(zhí)行,取決于技術(shù)方案的特定應(yīng)用和設(shè)計(jì)約束條件。專業(yè)技術(shù)人員可以對(duì)每個(gè)特定的應(yīng)用來(lái)使用不同方法來(lái)實(shí)現(xiàn)所描述的功能,但是這種實(shí)現(xiàn)不應(yīng)認(rèn)為超出本發(fā)明的范圍。
在本申請(qǐng)所提供的幾個(gè)實(shí)施例中,應(yīng)該理解到,所揭露的設(shè)備和方法,可以通過(guò)其它的方式實(shí)現(xiàn)。例如,以上所描述的設(shè)備實(shí)施例僅僅是示意性的,例如,所述單元的劃分,僅僅為一種邏輯功能劃分,實(shí)際實(shí)現(xiàn)時(shí)可以有另外的劃分方式,例如多個(gè)單元或組件可以結(jié)合或者可以集成到另一個(gè)設(shè)備,或一些特征可以忽略,或不執(zhí)行。
在此處所提供的說(shuō)明書(shū)中,說(shuō)明了大量具體細(xì)節(jié)。然而,能夠理解,本發(fā)明的實(shí)施例可以在沒(méi)有這些具體細(xì)節(jié)的情況下實(shí)踐。在一些實(shí)例中,并未詳細(xì)示出公知的方法、結(jié)構(gòu)和技術(shù),以便不模糊對(duì)本說(shuō)明書(shū)的理解。
類似地,應(yīng)當(dāng)理解,為了精簡(jiǎn)本發(fā)明并幫助理解各個(gè)發(fā)明方面中的一個(gè)或多個(gè),在對(duì)本發(fā)明的示例性實(shí)施例的描述中,本發(fā)明的各個(gè)特征有時(shí)被一起分組到單個(gè)實(shí)施例、圖、或者對(duì)其的描述中。然而,并不應(yīng)將該本發(fā)明的方法解釋成反映如下意圖:即所要求保護(hù)的本發(fā)明要求比在每個(gè)權(quán)利要求中所明確記載的特征更多的特征。更確切地說(shuō),如相應(yīng)的權(quán)利要求書(shū)所反映的那樣,其發(fā)明點(diǎn)在于可以用少于某個(gè)公開(kāi)的單個(gè)實(shí)施例的所有特征的特征來(lái)解決相應(yīng)的技術(shù)問(wèn)題。因此,遵循具體實(shí)施方式的權(quán)利要求書(shū)由此明確地并入該具體實(shí)施方式,其中每個(gè)權(quán)利要求本身都作為本發(fā)明的單獨(dú)實(shí)施例。
本領(lǐng)域的技術(shù)人員可以理解,除了特征之間相互排斥之外,可以采用任何組合對(duì)本說(shuō)明書(shū)(包括伴隨的權(quán)利要求、摘要和附圖)中公開(kāi)的所有特征以及如此公開(kāi)的任何方法或者設(shè)備的所有過(guò)程或單元進(jìn)行組合。除非另外明確陳述,本說(shuō)明書(shū)(包括伴隨的權(quán)利要求、摘要和附圖)中公開(kāi)的每個(gè)特征可以由提供相同、等同或相似目的的替代特征來(lái)代替。
此外,本領(lǐng)域的技術(shù)人員能夠理解,盡管在此所述的一些實(shí)施例包括其它實(shí)施例中所包括的某些特征而不是其它特征,但是不同實(shí)施例的特征的組合意味著處于本發(fā)明的范圍之內(nèi)并且形成不同的實(shí)施例。例如,在權(quán)利要求書(shū)中,所要求保護(hù)的實(shí)施例的任意之一都可以以任意的組合方式來(lái)使用。
本發(fā)明的各個(gè)部件實(shí)施例可以以硬件實(shí)現(xiàn),或者以在一個(gè)或者多個(gè)處理器上運(yùn)行的軟件模塊實(shí)現(xiàn),或者以它們的組合實(shí)現(xiàn)。本領(lǐng)域的技術(shù)人員應(yīng)當(dāng)理解,可以在實(shí)踐中使用微處理器或者數(shù)字信號(hào)處理器(DSP)來(lái)實(shí)現(xiàn)根據(jù)本發(fā)明實(shí)施例的物品分析設(shè)備中的一些模塊的一些或者全部功能。本發(fā)明還可以實(shí)現(xiàn)為用于執(zhí)行這里所描述的方法的一部分或者全部的裝置程序(例如,計(jì)算機(jī)程序和計(jì)算機(jī)程序產(chǎn)品)。這樣的實(shí)現(xiàn)本發(fā)明的程序可以存儲(chǔ)在計(jì)算機(jī)可讀介質(zhì)上,或者可以具有一個(gè)或者多個(gè)信號(hào)的形式。這樣的信號(hào)可以從因特網(wǎng)網(wǎng)站上下載得到,或者在載體信號(hào)上提供,或者以任何其他形式提供。
應(yīng)該注意的是上述實(shí)施例對(duì)本發(fā)明進(jìn)行說(shuō)明而不是對(duì)本發(fā)明進(jìn)行限制,并且本領(lǐng)域技術(shù)人員在不脫離所附權(quán)利要求的范圍的情況下可設(shè)計(jì)出替換實(shí)施例。在權(quán)利要求中,不應(yīng)將位于括號(hào)之間的任何參考符號(hào)構(gòu)造成對(duì)權(quán)利要求的限制。單詞“包含”不排除存在未列在權(quán)利要求中的元件或步驟。位于元件之前的單詞“一”或“一個(gè)”不排除存在多個(gè)這樣的元件。本發(fā)明可以借助于包括有若干不同元件的硬件以及借助于適當(dāng)編程的計(jì)算機(jī)來(lái)實(shí)現(xiàn)。在列舉了若干裝置的單元權(quán)利要求中,這些裝置中的若干個(gè)可以是通過(guò)同一個(gè)硬件項(xiàng)來(lái)具體體現(xiàn)。單詞第一、第二、以及第三等的使用不表示任何順序??蓪⑦@些單詞解釋為名稱。
以上所述,僅為本發(fā)明的具體實(shí)施方式或?qū)唧w實(shí)施方式的說(shuō)明,本發(fā)明的保護(hù)范圍并不局限于此,任何熟悉本技術(shù)領(lǐng)域的技術(shù)人員在本發(fā)明揭露的技術(shù)范圍內(nèi),可輕易想到變化或替換,都應(yīng)涵蓋在本發(fā)明的保護(hù)范圍之內(nèi)。本發(fā)明的保護(hù)范圍應(yīng)以權(quán)利要求的保護(hù)范圍為準(zhǔn)。