行人檢測(cè)的方法及裝置與流程

文檔序號(hào)：12551322閱讀：166來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專利>計(jì)算;推算;計(jì)數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

本發(fā)明涉及圖像識(shí)別領(lǐng)域，更具體地涉及一種行人檢測(cè)的方法及裝置。

背景技術(shù)：

行人檢測(cè)是通用物體檢測(cè)的子問(wèn)題，吸引了學(xué)術(shù)界和工業(yè)界的大量興趣。首先，行人檢測(cè)可以應(yīng)用于安防、自動(dòng)(輔助)駕駛、智能監(jiān)控和人機(jī)交互等多個(gè)領(lǐng)域，是一項(xiàng)基本且重要的技術(shù)。

現(xiàn)有的行人檢測(cè)無(wú)法解決遮擋、人體重疊等問(wèn)題。遮擋，指由于存在障礙物導(dǎo)致目標(biāo)只有部分可見(jiàn)，常見(jiàn)的遮擋后果是人體只有上(下)半身或左(右)半身可見(jiàn)。人體重疊，指兩人及以上在圖片中的位置關(guān)系發(fā)生重合，常見(jiàn)的人體重疊多見(jiàn)于人群較為密集的場(chǎng)景。

遮擋及重疊是行人檢測(cè)中最棘手的兩個(gè)問(wèn)題。部分不可見(jiàn)會(huì)降低傳統(tǒng)行人檢測(cè)方法的檢出率；重疊對(duì)技術(shù)的要求則更高，因?yàn)閷?duì)于重疊的人，神經(jīng)網(wǎng)絡(luò)更傾向于將兩人(甚至多人)檢測(cè)為同一個(gè)人，即不能將重疊的目標(biāo)劃分開(kāi)來(lái)。同時(shí)，現(xiàn)有的行人檢測(cè)技術(shù)通常需要在后期處理中運(yùn)用“非最大抑制”的方法。“非最大抑制”是為了處理神經(jīng)網(wǎng)絡(luò)對(duì)同一個(gè)人報(bào)出兩次(或多次)檢測(cè)，因此需對(duì)多個(gè)空間位置接近的檢測(cè)結(jié)果進(jìn)行合并。在重疊的情況下，非最大抑制還會(huì)導(dǎo)致對(duì)不同目標(biāo)的檢測(cè)結(jié)果被誤合并。

技術(shù)實(shí)現(xiàn)要素：

考慮到上述問(wèn)題而提出了本發(fā)明。本發(fā)明提供了一種行人檢測(cè)的方法，能夠在基于待檢測(cè)圖片中的行人信息，得到行人檢測(cè)的結(jié)果，從而能夠提高行人檢測(cè)的精度。

根據(jù)本發(fā)明的第一方面，提供了一種行人檢測(cè)的方法，包括：

接收待檢測(cè)圖片；

采用神經(jīng)網(wǎng)絡(luò)，確定所述待檢測(cè)圖片中的行人信息，所述行人信息包括行人的位置以及所述行人的關(guān)鍵點(diǎn)位置；

對(duì)所述待檢測(cè)圖片中的所述行人信息進(jìn)行后處理，得到所述行人檢測(cè)的結(jié)果。

示例性地，所述行人的關(guān)鍵點(diǎn)位置包括以下中的至少一項(xiàng)：頭部位置、左肩位置、右肩位置、左膝位置、右膝位置、左腳位置、右腳位置。

示例性地，所述對(duì)所述待檢測(cè)圖片中的所述行人信息進(jìn)行后處理，得到所述行人檢測(cè)的結(jié)果，包括：

對(duì)所述待檢測(cè)圖片中的所述行人信息進(jìn)行過(guò)濾，得到所述行人信息中的高概率行人信息；

對(duì)所述高概率行人信息進(jìn)行處理，得到所述行人檢測(cè)的結(jié)果，

其中，所述高概率行人信息為概率值大于或等于概率閾值的行人信息，所述概率閾值為預(yù)設(shè)概率值。

示例性地，所述對(duì)所述高概率行人信息進(jìn)行處理，得到所述行人檢測(cè)的結(jié)果，包括：根據(jù)所述高概率行人信息中的所述行人的關(guān)鍵點(diǎn)位置，得到所述行人檢測(cè)的結(jié)果。

示例性地，所述根據(jù)所述高概率行人信息中的所述行人的關(guān)鍵點(diǎn)位置，得到所述行人檢測(cè)的結(jié)果，包括：根據(jù)所述高概率行人信息中的相鄰的兩個(gè)所述行人信息中所述關(guān)鍵點(diǎn)的空間位置與距離確定所述相鄰的兩個(gè)所述行人信息是否屬于同一行人，以得到所述行人檢測(cè)的結(jié)果。

示例性地，在所述方法之前，還包括：基于至少一張訓(xùn)練圖像，通過(guò)訓(xùn)練得到所述神經(jīng)網(wǎng)絡(luò)；其中，所述訓(xùn)練圖像中標(biāo)注有行人信息。

根據(jù)本發(fā)明的第二方面，提供了一種行人檢測(cè)的裝置，包括：

接收模塊，用于接收待檢測(cè)圖片；

確定模塊，用于采用神經(jīng)網(wǎng)絡(luò)，確定所述待檢測(cè)圖片中的行人信息，所述行人信息包括行人的位置以及所述行人的關(guān)鍵點(diǎn)位置；

后處理模塊，用于對(duì)所述待檢測(cè)圖片中的所述行人信息進(jìn)行后處理，得到所述行人檢測(cè)的結(jié)果。

示例性地，所述后處理模塊，包括：

過(guò)濾子模塊，用于對(duì)所述待檢測(cè)圖片中的所述行人信息進(jìn)行過(guò)濾，得到所述行人信息中的高概率行人信息；

處理子模塊，用于對(duì)所述高概率行人信息進(jìn)行處理，得到所述行人檢測(cè)的結(jié)果，

其中，所述高概率行人信息為概率值大于或等于概率閾值的行人信息，所述概率閾值為預(yù)設(shè)概率值。

示例性地，所述處理子模塊，用于：根據(jù)所述高概率行人信息中的所述行人的關(guān)鍵點(diǎn)位置，得到所述行人檢測(cè)的結(jié)果。

示例性地，所述處理子模塊，用于：根據(jù)所述高概率行人信息中的相鄰的兩個(gè)所述行人信息中所述關(guān)鍵點(diǎn)的空間位置與距離確定所述相鄰的兩個(gè)所述行人信息是否屬于同一行人，以得到所述行人檢測(cè)的結(jié)果。

示例性地，所述處理子模塊，用于：根據(jù)所述高概率行人信息中的相鄰的兩個(gè)所述行人信息中所述關(guān)鍵點(diǎn)的空間位置與距離確定所述相鄰的兩個(gè)所述行人信息是否屬于同一行人，若所述相鄰的兩個(gè)所述行人信息屬于同一行人，則利用非最大抑制方法，對(duì)所述相鄰的兩個(gè)所述行人信息進(jìn)行合并操作，得到所述行人檢測(cè)的結(jié)果。

示例性地，還包括訓(xùn)練模塊，用于：基于至少一張訓(xùn)練圖像，通過(guò)訓(xùn)練得到所述神經(jīng)網(wǎng)絡(luò)；其中，所述訓(xùn)練圖像中標(biāo)注有行人信息。

第二方面所述的該裝置能夠用于實(shí)現(xiàn)前述第一方面的行人檢測(cè)的方法。

根據(jù)本發(fā)明的第三方面，提供了一種計(jì)算機(jī)芯片，該計(jì)算機(jī)芯片包括處理器和存儲(chǔ)器。所述存儲(chǔ)器存儲(chǔ)有指令代碼，所述處理器用于執(zhí)行所述指令代碼，且當(dāng)所述處理器執(zhí)行指令代碼時(shí)，能夠?qū)崿F(xiàn)前述第一方面所述的行人檢測(cè)的方法。

由此可見(jiàn)，本發(fā)明實(shí)施例對(duì)于待檢測(cè)圖片，可以采用神經(jīng)網(wǎng)絡(luò)，得到行人位置和行人的關(guān)鍵點(diǎn)信息，這樣通過(guò)引入行人的關(guān)鍵點(diǎn)信息，解決了傳統(tǒng)行人檢測(cè)方法中難以解決的遮擋和重疊問(wèn)題，提升了檢測(cè)的精確度。

附圖說(shuō)明

通過(guò)結(jié)合附圖對(duì)本發(fā)明實(shí)施例進(jìn)行更詳細(xì)的描述，本發(fā)明的上述以及其它目的、特征和優(yōu)勢(shì)將變得更加明顯。附圖用來(lái)提供對(duì)本發(fā)明實(shí)施例的進(jìn)一步理解，并且構(gòu)成說(shuō)明書(shū)的一部分，與本發(fā)明實(shí)施例一起用于解釋本發(fā)明，并不構(gòu)成對(duì)本發(fā)明的限制。在附圖中，相同的參考標(biāo)號(hào)通常代表相同部件或步驟。

圖1是本發(fā)明實(shí)施例的電子設(shè)備的一個(gè)示意性框圖；

圖2是本發(fā)明實(shí)施例的行人檢測(cè)的方法的一個(gè)示意性流程圖；

圖3是本發(fā)明實(shí)施例的行人檢測(cè)的裝置的一個(gè)示意性框圖；

圖4是本發(fā)明實(shí)施例的行人檢測(cè)的裝置的另一個(gè)示意性框圖。

具體實(shí)施方式

為了使得本發(fā)明的目的、技術(shù)方案和優(yōu)點(diǎn)更為明顯，下面將參照附圖詳細(xì)描述根據(jù)本發(fā)明的示例實(shí)施例。顯然，所描述的實(shí)施例僅僅是本發(fā)明的一部分實(shí)施例，而不是本發(fā)明的全部實(shí)施例，應(yīng)理解，本發(fā)明不受這里描述的示例實(shí)施例的限制。基于本發(fā)明中描述的本發(fā)明實(shí)施例，本領(lǐng)域技術(shù)人員在沒(méi)有付出創(chuàng)造性勞動(dòng)的情況下所得到的所有其它實(shí)施例都應(yīng)落入本發(fā)明的保護(hù)范圍之內(nèi)。

本發(fā)明實(shí)施例可以應(yīng)用于電子設(shè)備，圖1所示為本發(fā)明實(shí)施例的電子設(shè)備的一個(gè)示意性框圖。圖1所示的電子設(shè)備10包括一個(gè)或多個(gè)處理器102、一個(gè)或多個(gè)存儲(chǔ)裝置104、輸入裝置106、輸出裝置108、圖像傳感器110以及一個(gè)或多個(gè)非圖像傳感器114，這些組件通過(guò)總線系統(tǒng)112和/或其它形式互連。應(yīng)當(dāng)注意，圖1所示的電子設(shè)備10的組件和結(jié)構(gòu)只是示例性的，而非限制性的，根據(jù)需要，所述電子設(shè)備也可以具有其他組件和結(jié)構(gòu)。

所述處理器102可以包括CPU 1021和GPU 1022或者具有數(shù)據(jù)處理能力和/或指令執(zhí)行能力的其它形式的處理單元，例如現(xiàn)場(chǎng)可編程門(mén)陣列(Field－Programmable Gate Array，F(xiàn)PGA)或進(jìn)階精簡(jiǎn)指令集機(jī)器(Advanced RISC(Reduced Instruction Set Computer)Machine，ARM)等，并且處理器102可以控制所述電子設(shè)備10中的其它組件以執(zhí)行期望的功能。

所述存儲(chǔ)裝置104可以包括一個(gè)或多個(gè)計(jì)算機(jī)程序產(chǎn)品，所述計(jì)算機(jī)程序產(chǎn)品可以包括各種形式的計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)，例如易失性存儲(chǔ)器1041和/或非易失性存儲(chǔ)器1042。所述易失性存儲(chǔ)器1041例如可以包括隨機(jī)存取存儲(chǔ)器(Random Access Memory，RAM)和/或高速緩沖存儲(chǔ)器(cache)等。所述非易失性存儲(chǔ)器1042例如可以包括只讀存儲(chǔ)器(Read-Only Memory，ROM)、硬盤(pán)、閃存等。在所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)上可以存儲(chǔ)一個(gè)或多個(gè)計(jì)算機(jī)程序指令，處理器102可以運(yùn)行所述程序指令，以實(shí)現(xiàn)各種期望的功能。在所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)中還可以存儲(chǔ)各種應(yīng)用程序和各種數(shù)據(jù)，例如所述應(yīng)用程序使用和/或產(chǎn)生的各種數(shù)據(jù)等。

所述輸入裝置106可以是用戶用來(lái)輸入指令的裝置，并且可以包括鍵盤(pán)、鼠標(biāo)、麥克風(fēng)和觸摸屏等中的一個(gè)或多個(gè)。

所述輸出裝置108可以向外部(例如用戶)輸出各種信息(例如圖像或聲音)，并且可以包括顯示器、揚(yáng)聲器等中的一個(gè)或多個(gè)。

所述圖像傳感器110可以拍攝用戶期望的圖像(例如照片、視頻等)，并且將所拍攝的圖像存儲(chǔ)在所述存儲(chǔ)裝置104中以供其它組件使用。

當(dāng)注意，圖1所示的電子設(shè)備10的組件和結(jié)構(gòu)只是示例性的，盡管圖1示出的電子設(shè)備10包括多個(gè)不同的裝置，但是根據(jù)需要，其中的一些裝置可以不是必須的，其中的一些裝置的數(shù)量可以更多等等，本發(fā)明對(duì)此不限定。

圖2是本發(fā)明實(shí)施例的行人檢測(cè)的方法的一個(gè)示意性流程圖。圖2所示的方法包括：

S101，接收待檢測(cè)圖片。

作為一例，該待檢測(cè)圖片可以是實(shí)時(shí)采集的圖片，具體地可以是由圖像采集裝置實(shí)時(shí)采集的圖片。例如可以是由攝像頭采集的視頻中的一幀圖像或多幀圖像，或者，可以是由照相機(jī)拍攝到的一張圖片。作為另一例，該待檢測(cè)圖片可以是從特定的源獲取的，例如可以從存儲(chǔ)器中獲取先前采集并存儲(chǔ)的圖片。本發(fā)明對(duì)此不限定。

S102，采用神經(jīng)網(wǎng)絡(luò)，確定所述待檢測(cè)圖片中的行人信息，所述行人信息包括行人的位置以及所述行人的關(guān)鍵點(diǎn)位置。

示例性地，行人的關(guān)鍵點(diǎn)位置包括以下中的至少一項(xiàng)：頭部位置、兩肩位置、兩膝位置、兩腳位置。

具體地，在S102中，可以將待檢測(cè)圖片輸入到神經(jīng)網(wǎng)絡(luò)中，經(jīng)由該神經(jīng)網(wǎng)絡(luò)得到行人信息。

與傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)不同，本發(fā)明實(shí)施例中的神經(jīng)網(wǎng)絡(luò)不僅能夠得到行人位置，并且能夠得到行人的關(guān)鍵點(diǎn)位置。另外，S102所得到的行人信息中，不僅包括該待檢測(cè)圖片的身體各個(gè)部位顯示完整的行人的行人信息，還包括身體部分區(qū)域被遮擋的行人的行人信息。

舉例來(lái)說(shuō)，如果該待檢測(cè)圖片中包括行人A，由于被遮擋，該行人A只有部分身體可見(jiàn)。那么在S102中，基于該神經(jīng)網(wǎng)絡(luò)，可以根據(jù)行人A可見(jiàn)的身體部分推測(cè)其他的身體部分。例如，如果行人A的頭部、左肩、左腿可見(jiàn)，那么基于該神經(jīng)網(wǎng)絡(luò)不僅可以直接得到該行人A的頭部位置、左肩位置、左膝位置和左腳位置，并且能夠推測(cè)出該行人A的右肩位置、右膝位置和右腳位置。從而得到了行人A的關(guān)鍵點(diǎn)信息：頭部位置、兩肩位置、兩膝位置和兩腳位置。

作為一例，可以基于所得到的行人的關(guān)鍵點(diǎn)信息確定該行人所在的矩形區(qū)域，作為行人位置。作為另一例，可以采用神經(jīng)網(wǎng)絡(luò)提取該待檢測(cè)圖片的特征張量，并基于該特征張量確定行人所在的矩形區(qū)域，作為行人位置。本發(fā)明對(duì)此不限定。

由此可見(jiàn)，本實(shí)施例中，基于神經(jīng)網(wǎng)絡(luò)，能夠得到被遮擋的行人的行人信息，從而能夠避免信息丟失，保證處理的精度。

S103，對(duì)所述待檢測(cè)圖片中的所述行人信息進(jìn)行后處理，得到所述行人檢測(cè)的結(jié)果。

可選地，行人信息可以包括低概率行人信息和高概率行人信息。通過(guò)神經(jīng)網(wǎng)絡(luò)對(duì)接收到的圖像進(jìn)行識(shí)別，獲取圖像中的行人信息，對(duì)獲取到的行人信息進(jìn)行概率算法運(yùn)算，獲得行人信息的概率值，將獲得的行人信息的概率值與概率閾值進(jìn)行比對(duì)，若行人信息的概率值大于或等于概率閾值，則判斷為高概率行人信息；若行人信息的概率值小于概率閾值，則判斷為低概率行人信息。其中，概率閾值可以為預(yù)先設(shè)定的概率值，可依據(jù)使用場(chǎng)景進(jìn)行設(shè)定。

示例性地，S103可以包括：對(duì)所述待檢測(cè)圖片中的所述行人信息進(jìn)行過(guò)濾，得到所述行人信息中的所述高概率行人信息；對(duì)所述高概率行人信息進(jìn)行處理，得到所述行人檢測(cè)的結(jié)果。其中，所述高概率行人信息為概率值大于或等于概率閾值的行人信息。

也就是說(shuō)，可以過(guò)濾掉行人信息中的低概率行人信息，只包括高概率行人信息；并進(jìn)一步基于高概率行人信息得到行人檢測(cè)的結(jié)果。

示例性地，所述對(duì)所述過(guò)濾之后的所述行人信息進(jìn)行處理，得到所述行人檢測(cè)的結(jié)果，包括：根據(jù)所述高概率行人信息中的相鄰的兩個(gè)所述行人信息中所述關(guān)鍵點(diǎn)的空間位置與距離確定所述相鄰的兩個(gè)所述行人信息是否屬于同一行人，以得到所述行人檢測(cè)的結(jié)果。

也就是說(shuō)，可以利用高概率行人信息中的關(guān)鍵點(diǎn)位置進(jìn)行判斷處理，從而得到行人檢測(cè)的結(jié)果。其中，關(guān)鍵點(diǎn)信息包括但不限于目標(biāo)頭部距離，目標(biāo)肩部重合度等?？蛇x地，可在上述處理過(guò)程中輔助實(shí)施非最大抑制(Non-Maximum Suppression，NMS)，根據(jù)所述高概率行人信息中的相鄰的兩個(gè)所述行人信息中所述關(guān)鍵點(diǎn)的空間位置與距離確定所述相鄰的兩個(gè)所述行人信息是否屬于同一行人，若所述相鄰的兩個(gè)所述行人信息屬于同一行人，則利用非最大抑制方法，對(duì)所述相鄰的兩個(gè)所述行人信息進(jìn)行合并操作，得到所述行人檢測(cè)的結(jié)果，從而進(jìn)一步提升檢測(cè)結(jié)果的精度。

利用高概率行人信息中的關(guān)鍵點(diǎn)位置進(jìn)行判斷處理得到行人檢測(cè)的結(jié)果，可采用如下方式之一進(jìn)行。

方式一：基于人體部位特征對(duì)高概率行人信息中的關(guān)鍵點(diǎn)進(jìn)行分類，例如，將行人信息關(guān)鍵點(diǎn)中屬于行人頭部的關(guān)鍵點(diǎn)分類識(shí)別為頭部關(guān)鍵點(diǎn)，將屬于行人左肩的關(guān)鍵點(diǎn)分類識(shí)別為左肩關(guān)鍵點(diǎn)；分析相鄰的同屬于一類的關(guān)鍵點(diǎn)之間的空間位置與距離，以區(qū)分遮擋和/或重疊的行人，例如，相鄰兩個(gè)頭部關(guān)鍵點(diǎn)之間的距離大于預(yù)設(shè)值，則判斷這兩個(gè)頭部關(guān)鍵點(diǎn)屬于兩個(gè)人，相鄰的兩個(gè)左肩關(guān)鍵點(diǎn)之間的距離小于預(yù)設(shè)值，則判斷這兩個(gè)左肩關(guān)鍵點(diǎn)屬于一個(gè)人。由于一個(gè)行人擁有多個(gè)關(guān)鍵點(diǎn)，通過(guò)判斷每一個(gè)關(guān)鍵點(diǎn)與相鄰的同類關(guān)鍵點(diǎn)之間的空間位置與距離，避免了傳統(tǒng)行人檢測(cè)僅檢測(cè)行人整體產(chǎn)生的遮擋和重疊問(wèn)題，提升了檢測(cè)的精度；

方式二：基于人體部位特征對(duì)高概率行人信息中的關(guān)鍵點(diǎn)進(jìn)行分類，例如，將行人信息關(guān)鍵點(diǎn)中屬于行人頭部的關(guān)鍵點(diǎn)分類識(shí)別為頭部關(guān)鍵點(diǎn)，將屬于行人左肩的關(guān)鍵點(diǎn)分類識(shí)別為左肩關(guān)鍵點(diǎn)；分析相鄰行人信息中的關(guān)鍵點(diǎn)之間的空間位置與距離，以區(qū)分遮擋和/或重疊的行人，例如，相鄰的行人信息為行人信息A和行人信息B，判斷行人信息A中的左肩關(guān)鍵點(diǎn)與行人信息B中的頭部關(guān)鍵點(diǎn)和/或右肩關(guān)鍵點(diǎn)和/或左膝關(guān)鍵點(diǎn)和/或左腳關(guān)鍵點(diǎn)等關(guān)鍵點(diǎn)之間的空間位置與距離，當(dāng)行人信息A中的左肩關(guān)鍵點(diǎn)與行人信息B中的頭部關(guān)鍵點(diǎn)和/或右肩關(guān)鍵點(diǎn)、和/或左膝關(guān)鍵點(diǎn)、和/或左腳關(guān)鍵點(diǎn)等關(guān)鍵點(diǎn)之間的空間位置與距離符合預(yù)設(shè)條件時(shí)，則判斷行人信息A和行人信息B屬于同一行人，其中，預(yù)設(shè)條件包括預(yù)設(shè)距離和/或預(yù)設(shè)相對(duì)位置等。

由此可見(jiàn)，在S103的后處理過(guò)程中，可以綜合神經(jīng)網(wǎng)絡(luò)檢測(cè)或推測(cè)的所有行人信息，移除低置信度的行人信息而保留高置信度的行人信息，這樣能夠保證該處理過(guò)程的精度。

示例性地，本發(fā)明實(shí)施例中所采用的神經(jīng)網(wǎng)絡(luò)可以是在圖2所述的方法之前，通過(guò)訓(xùn)練的方法所得到的。

具體地，在圖2所示的方法之前，可以包括：基于至少一張訓(xùn)練圖像，通過(guò)訓(xùn)練得到所述神經(jīng)網(wǎng)絡(luò)。其中，所述訓(xùn)練圖像中標(biāo)注有行人信息。所述行人信息包括行人的位置以及所述行人的關(guān)鍵點(diǎn)位置。

可選地，在圖2所示的方法之前，可以包括：獲取至少一張訓(xùn)練圖像；對(duì)所述訓(xùn)練圖像進(jìn)行標(biāo)注；基于所述標(biāo)注的訓(xùn)練圖像，通過(guò)訓(xùn)練得到所述神經(jīng)網(wǎng)絡(luò)。

其中，對(duì)所述訓(xùn)練圖像進(jìn)行標(biāo)注包括：對(duì)每一張訓(xùn)練圖像中的每一個(gè)行人樣本，標(biāo)注該行人樣本的位置，并標(biāo)注該行人樣本的頭部位置、兩肩位置、兩膝位置和兩腳位置。其中，如果行人樣本的某個(gè)或某幾個(gè)部位被遮擋時(shí)，對(duì)該某個(gè)或某幾個(gè)部位標(biāo)記為遮擋?？梢?jiàn)，標(biāo)注信息不僅包括行人位置、頭部位置、兩肩位置、兩膝位置和兩腳位置，還包括是否被遮擋的信息。示例性的，將行人B的關(guān)鍵點(diǎn)信息在圖片中進(jìn)行標(biāo)注，假設(shè)圖片中行人B的頭部位置、左肩位置、左膝位置和左腳位置未被遮擋，右肩位置、右膝位置和右腳位置被其他行人或物體遮擋，則可在行人B的頭部位置、左肩位置、左膝位置和左腳位置分別標(biāo)記為“頭部”、“左肩”、“左膝”、“左腳”；在被遮擋的行人B的右肩位置、右膝位置和右腳位置分別標(biāo)記為“右肩(遮擋)”、“右膝(遮擋)”、“右腳(遮擋)”，或在被遮擋的行人B的右肩位置、右膝位置和右腳位置統(tǒng)一標(biāo)記為“遮擋”。

進(jìn)一步地，所訓(xùn)練的神經(jīng)網(wǎng)絡(luò)不僅要學(xué)會(huì)如何檢測(cè)或推測(cè)行人位置(即行人整體的位置)，還應(yīng)學(xué)會(huì)如何檢測(cè)或推測(cè)每個(gè)行人的關(guān)鍵點(diǎn)位置。

由此可見(jiàn)，本發(fā)明實(shí)施例對(duì)于待檢測(cè)圖片，可以采用神經(jīng)網(wǎng)絡(luò)，得到行人位置和行人的關(guān)鍵點(diǎn)信息，通過(guò)引入行人的關(guān)鍵點(diǎn)信息，解決了傳統(tǒng)行人檢測(cè)方法中難以解決的遮擋和重疊問(wèn)題，提升了檢測(cè)的精確度。另外，可理解，行人的關(guān)鍵點(diǎn)信息還可以用于人體姿態(tài)分析等其他的領(lǐng)域，本發(fā)明對(duì)此不限定。

圖3是本發(fā)明實(shí)施例的行人檢測(cè)的裝置的一個(gè)示意性框圖。圖3所示的裝置30包括：接收模塊301、確定模塊302和后處理模塊303。

接收模塊301，用于接收待檢測(cè)圖片；

確定模塊302，用于采用神經(jīng)網(wǎng)絡(luò)，確定接收模塊301接收的所述待檢測(cè)圖片中的行人信息，所述行人信息包括行人的位置以及所述行人的關(guān)鍵點(diǎn)位置；

后處理模塊303，用于對(duì)確定模塊302確定的所述待檢測(cè)圖片中的所述行人信息進(jìn)行后處理，得到所述行人檢測(cè)的結(jié)果。

示例性地，后處理模塊303，包括過(guò)濾子模塊和處理子模塊。

過(guò)濾子模塊可以用于對(duì)所述待檢測(cè)圖片中的所述行人信息進(jìn)行過(guò)濾，得到所述行人信息中的高概率行人信息。處理子模塊可以用于對(duì)所述高概率行人信息進(jìn)行處理，得到所述行人檢測(cè)的結(jié)果。其中，所述高概率行人信息為概率值大于或等于概率閾值的行人信息，所述概率閾值為預(yù)設(shè)概率值。

示例性地，所述處理子模塊可以用于：根據(jù)所述高概率行人信息中的所述行人的關(guān)鍵點(diǎn)位置，得到所述行人檢測(cè)的結(jié)果。

示例性地，所述處理子模塊可以具體用于：根據(jù)所述高概率行人信息中的相鄰的兩個(gè)所述行人信息中所述關(guān)鍵點(diǎn)的空間位置與距離確定所述相鄰的兩個(gè)所述行人信息是否屬于同一行人，以得到所述行人檢測(cè)的結(jié)果。

示例性地，所述處理子模塊可以具體用于：根據(jù)所述高概率行人信息中的相鄰的兩個(gè)所述行人信息中所述關(guān)鍵點(diǎn)的空間位置與距離確定所述相鄰的兩個(gè)所述行人信息是否屬于同一行人，若所述相鄰的兩個(gè)所述行人信息屬于同一行人，則利用非最大抑制方法，對(duì)所述相鄰的兩個(gè)所述行人信息進(jìn)行合并操作，得到所述行人檢測(cè)的結(jié)果。

處理子模塊利用高概率行人信息中的關(guān)鍵點(diǎn)位置進(jìn)行判斷處理得到行人檢測(cè)的結(jié)果，可采用如下方式之一進(jìn)行。

方式一：處理子模塊基于人體部位特征對(duì)高概率行人信息中的關(guān)鍵點(diǎn)進(jìn)行分類，例如，將行人信息關(guān)鍵點(diǎn)中屬于行人頭部的關(guān)鍵點(diǎn)分類識(shí)別為頭部關(guān)鍵點(diǎn)，將屬于行人左肩的關(guān)鍵點(diǎn)分類識(shí)別為左肩關(guān)鍵點(diǎn)；分析相鄰的同屬于一類的關(guān)鍵點(diǎn)之間的空間位置與距離，以區(qū)分遮擋和/或重疊的行人，例如，相鄰兩個(gè)頭部關(guān)鍵點(diǎn)之間的距離大于預(yù)設(shè)值，則判斷這兩個(gè)頭部關(guān)鍵點(diǎn)屬于兩個(gè)人，相鄰的兩個(gè)左肩關(guān)鍵點(diǎn)之間的距離小于預(yù)設(shè)值，則判斷這兩個(gè)左肩關(guān)鍵點(diǎn)屬于一個(gè)人。由于一個(gè)行人擁有多個(gè)關(guān)鍵點(diǎn)，通過(guò)判斷每一個(gè)關(guān)鍵點(diǎn)與相鄰的同類關(guān)鍵點(diǎn)之間的空間位置與距離，避免了傳統(tǒng)行人檢測(cè)僅檢測(cè)行人整體產(chǎn)生的遮擋和重疊問(wèn)題，提升了檢測(cè)的精度；

方式二：處理子模塊基于人體部位特征對(duì)高概率行人信息中的關(guān)鍵點(diǎn)進(jìn)行分類，例如，將行人信息關(guān)鍵點(diǎn)中屬于行人頭部的關(guān)鍵點(diǎn)分類識(shí)別為頭部關(guān)鍵點(diǎn)，將屬于行人左肩的關(guān)鍵點(diǎn)分類識(shí)別為左肩關(guān)鍵點(diǎn)；分析相鄰行人信息中的關(guān)鍵點(diǎn)之間的空間位置與距離，以區(qū)分遮擋和/或重疊的行人，例如，相鄰的行人信息為行人信息A和行人信息B，判斷行人信息A中的左肩關(guān)鍵點(diǎn)與行人信息B中的頭部關(guān)鍵點(diǎn)和/或右肩關(guān)鍵點(diǎn)和/或左膝關(guān)鍵點(diǎn)和/或左腳關(guān)鍵點(diǎn)等關(guān)鍵點(diǎn)之間的空間位置與距離，當(dāng)行人信息A中的左肩關(guān)鍵點(diǎn)與行人信息B中的頭部關(guān)鍵點(diǎn)和/或右肩關(guān)鍵點(diǎn)和/或左膝關(guān)鍵點(diǎn)和/或左腳關(guān)鍵點(diǎn)等關(guān)鍵點(diǎn)之間的空間位置與距離符合預(yù)設(shè)條件時(shí)，則判斷行人信息A和行人信息B屬于同一行人，其中，預(yù)設(shè)條件包括預(yù)設(shè)距離和/或預(yù)設(shè)相對(duì)位置等。

由此可見(jiàn)，處理子模塊可以綜合神經(jīng)網(wǎng)絡(luò)檢測(cè)或推測(cè)的所有行人信息，移除低置信度的行人信息而保留高置信度的行人信息，這樣能夠保證該處理過(guò)程的精度。

示例性地，如圖4所示，裝置30還包括訓(xùn)練模塊304。訓(xùn)練模塊304可以用于：基于至少一張訓(xùn)練圖像，通過(guò)訓(xùn)練得到所述神經(jīng)網(wǎng)絡(luò)。其中，所述訓(xùn)練圖像中標(biāo)注有行人信息。所標(biāo)注的行人信息可以包括行人的位置以及所述行人的關(guān)鍵點(diǎn)位置。

圖3或圖4所示的裝置30能夠用于實(shí)現(xiàn)前述圖2所示的行人檢測(cè)的方法。

另外，本發(fā)明實(shí)施例還提供了另一種行人檢測(cè)的裝置，該裝置可以包括處理器和存儲(chǔ)器，其中，存儲(chǔ)器用于存儲(chǔ)指令代碼，處理器執(zhí)行該指令代碼時(shí)，可以實(shí)現(xiàn)前述圖2所示的行人檢測(cè)的方法。

另外，本發(fā)明實(shí)施例還提供了另一種行人檢測(cè)的裝置，該裝置可以包括處理器，其中，處理器能夠同時(shí)實(shí)現(xiàn)圖3中確定模塊302和后處理模塊303的功能，從而實(shí)現(xiàn)前述圖2所示的行人檢測(cè)的方法。

另外，本發(fā)明實(shí)施例還提供了一種電子設(shè)備，該電子設(shè)備可以包括圖3或圖4所示的裝置30。該電子設(shè)備可以實(shí)現(xiàn)前述圖2所示的行人檢測(cè)的方法。

由此可見(jiàn)，本發(fā)明實(shí)施例對(duì)于待檢測(cè)圖片，可以采用神經(jīng)網(wǎng)絡(luò)，得到行人位置和行人的關(guān)鍵點(diǎn)信息，通過(guò)引入行人的關(guān)鍵點(diǎn)信息，解決了傳統(tǒng)行人檢測(cè)方法中難以解決的遮擋和重疊問(wèn)題，提升了檢測(cè)的精確度。也就是說(shuō)本發(fā)明實(shí)施例的方法在行人檢測(cè)過(guò)程中能夠保證高精度和準(zhǔn)確度。另外，可理解，行人的關(guān)鍵點(diǎn)信息還可以用于人體姿態(tài)分析等其他的領(lǐng)域，本發(fā)明對(duì)此不限定。

盡管這里已經(jīng)參考附圖描述了示例實(shí)施例，應(yīng)理解上述示例實(shí)施例僅僅是示例性的，并且不意圖將本發(fā)明的范圍限制于此。本領(lǐng)域普通技術(shù)人員可以在其中進(jìn)行各種改變和修改，而不偏離本發(fā)明的范圍和精神。所有這些改變和修改意在被包括在所附權(quán)利要求所要求的本發(fā)明的范圍之內(nèi)。

本領(lǐng)域普通技術(shù)人員可以意識(shí)到，結(jié)合本文中所公開(kāi)的實(shí)施例描述的各示例的單元及算法步驟，能夠以電子硬件、或者計(jì)算機(jī)軟件和電子硬件的結(jié)合來(lái)實(shí)現(xiàn)。這些功能究竟以硬件還是軟件方式來(lái)執(zhí)行，取決于技術(shù)方案的特定應(yīng)用和設(shè)計(jì)約束條件。專業(yè)技術(shù)人員可以對(duì)每個(gè)特定的應(yīng)用來(lái)使用不同方法來(lái)實(shí)現(xiàn)所描述的功能，但是這種實(shí)現(xiàn)不應(yīng)認(rèn)為超出本發(fā)明的范圍。

在本申請(qǐng)所提供的幾個(gè)實(shí)施例中，應(yīng)該理解到，所揭露的設(shè)備和方法，可以通過(guò)其它的方式實(shí)現(xiàn)。例如，以上所描述的設(shè)備實(shí)施例僅僅是示意性的，例如，所述單元的劃分，僅僅為一種邏輯功能劃分，實(shí)際實(shí)現(xiàn)時(shí)可以有另外的劃分方式，例如多個(gè)單元或組件可以結(jié)合或者可以集成到另一個(gè)設(shè)備，或一些特征可以忽略，或不執(zhí)行。

在此處所提供的說(shuō)明書(shū)中，說(shuō)明了大量具體細(xì)節(jié)。然而，能夠理解，本發(fā)明的實(shí)施例可以在沒(méi)有這些具體細(xì)節(jié)的情況下實(shí)踐。在一些實(shí)例中，并未詳細(xì)示出公知的方法、結(jié)構(gòu)和技術(shù)，以便不模糊對(duì)本說(shuō)明書(shū)的理解。

類似地，應(yīng)當(dāng)理解，為了精簡(jiǎn)本發(fā)明并幫助理解各個(gè)發(fā)明方面中的一個(gè)或多個(gè)，在對(duì)本發(fā)明的示例性實(shí)施例的描述中，本發(fā)明的各個(gè)特征有時(shí)被一起分組到單個(gè)實(shí)施例、圖、或者對(duì)其的描述中。然而，并不應(yīng)將該本發(fā)明的方法解釋成反映如下意圖：即所要求保護(hù)的本發(fā)明要求比在每個(gè)權(quán)利要求中所明確記載的特征更多的特征。更確切地說(shuō)，如相應(yīng)的權(quán)利要求書(shū)所反映的那樣，其發(fā)明點(diǎn)在于可以用少于某個(gè)公開(kāi)的單個(gè)實(shí)施例的所有特征的特征來(lái)解決相應(yīng)的技術(shù)問(wèn)題。因此，遵循具體實(shí)施方式的權(quán)利要求書(shū)由此明確地并入該具體實(shí)施方式，其中每個(gè)權(quán)利要求本身都作為本發(fā)明的單獨(dú)實(shí)施例。

本領(lǐng)域的技術(shù)人員可以理解，除了特征之間相互排斥之外，可以采用任何組合對(duì)本說(shuō)明書(shū)(包括伴隨的權(quán)利要求、摘要和附圖)中公開(kāi)的所有特征以及如此公開(kāi)的任何方法或者設(shè)備的所有過(guò)程或單元進(jìn)行組合。除非另外明確陳述，本說(shuō)明書(shū)(包括伴隨的權(quán)利要求、摘要和附圖)中公開(kāi)的每個(gè)特征可以由提供相同、等同或相似目的的替代特征來(lái)代替。

此外，本領(lǐng)域的技術(shù)人員能夠理解，盡管在此所述的一些實(shí)施例包括其它實(shí)施例中所包括的某些特征而不是其它特征，但是不同實(shí)施例的特征的組合意味著處于本發(fā)明的范圍之內(nèi)并且形成不同的實(shí)施例。例如，在權(quán)利要求書(shū)中，所要求保護(hù)的實(shí)施例的任意之一都可以以任意的組合方式來(lái)使用。

本發(fā)明的各個(gè)部件實(shí)施例可以以硬件實(shí)現(xiàn)，或者以在一個(gè)或者多個(gè)處理器上運(yùn)行的軟件模塊實(shí)現(xiàn)，或者以它們的組合實(shí)現(xiàn)。本領(lǐng)域的技術(shù)人員應(yīng)當(dāng)理解，可以在實(shí)踐中使用微處理器或者數(shù)字信號(hào)處理器(DSP)來(lái)實(shí)現(xiàn)根據(jù)本發(fā)明實(shí)施例的物品分析設(shè)備中的一些模塊的一些或者全部功能。本發(fā)明還可以實(shí)現(xiàn)為用于執(zhí)行這里所描述的方法的一部分或者全部的裝置程序(例如，計(jì)算機(jī)程序和計(jì)算機(jī)程序產(chǎn)品)。這樣的實(shí)現(xiàn)本發(fā)明的程序可以存儲(chǔ)在計(jì)算機(jī)可讀介質(zhì)上，或者可以具有一個(gè)或者多個(gè)信號(hào)的形式。這樣的信號(hào)可以從因特網(wǎng)網(wǎng)站上下載得到，或者在載體信號(hào)上提供，或者以任何其他形式提供。

應(yīng)該注意的是上述實(shí)施例對(duì)本發(fā)明進(jìn)行說(shuō)明而不是對(duì)本發(fā)明進(jìn)行限制，并且本領(lǐng)域技術(shù)人員在不脫離所附權(quán)利要求的范圍的情況下可設(shè)計(jì)出替換實(shí)施例。在權(quán)利要求中，不應(yīng)將位于括號(hào)之間的任何參考符號(hào)構(gòu)造成對(duì)權(quán)利要求的限制。單詞“包含”不排除存在未列在權(quán)利要求中的元件或步驟。位于元件之前的單詞“一”或“一個(gè)”不排除存在多個(gè)這樣的元件。本發(fā)明可以借助于包括有若干不同元件的硬件以及借助于適當(dāng)編程的計(jì)算機(jī)來(lái)實(shí)現(xiàn)。在列舉了若干裝置的單元權(quán)利要求中，這些裝置中的若干個(gè)可以是通過(guò)同一個(gè)硬件項(xiàng)來(lái)具體體現(xiàn)。單詞第一、第二、以及第三等的使用不表示任何順序?？蓪⑦@些單詞解釋為名稱。

以上所述，僅為本發(fā)明的具體實(shí)施方式或?qū)唧w實(shí)施方式的說(shuō)明，本發(fā)明的保護(hù)范圍并不局限于此，任何熟悉本技術(shù)領(lǐng)域的技術(shù)人員在本發(fā)明揭露的技術(shù)范圍內(nèi)，可輕易想到變化或替換，都應(yīng)涵蓋在本發(fā)明的保護(hù)范圍之內(nèi)。本發(fā)明的保護(hù)范圍應(yīng)以權(quán)利要求的保護(hù)范圍為準(zhǔn)。

完整全部詳細(xì)技術(shù)資料下載

當(dāng)前第1頁(yè)1 2 3

該技術(shù)已申請(qǐng)專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：肖特特;茅佳源;
技術(shù)所有人：北京曠視科技有限公司;北京小孔科技有限公司;
我是此專利的發(fā)明人

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請(qǐng)點(diǎn)此查看客服電話進(jìn)行咨詢。
1、李老師：1.計(jì)算力學(xué) 2.無(wú)損檢測(cè)
2、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制
3、袁老師：1.計(jì)算機(jī)視覺(jué) 2.無(wú)線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計(jì)算機(jī)網(wǎng)絡(luò)安全 2.計(jì)算機(jī)仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢(shì)感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問(wèn)留言已有0條留言

還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

液晶屏檢測(cè)裝置及方法相關(guān)技術(shù)

行人檢測(cè)方法相關(guān)技術(shù)

檢測(cè)技術(shù)與自動(dòng)化裝置相關(guān)技術(shù)

防雷裝置檢測(cè)報(bào)告相關(guān)技術(shù)

壓力檢測(cè)裝置相關(guān)技術(shù)

防雷裝置檢測(cè)資格證相關(guān)技術(shù)

射頻輻射裝置檢測(cè)相關(guān)技術(shù)

工頻輻射裝置檢測(cè)相關(guān)技術(shù)

国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

行人檢測(cè)的方法及裝置與流程