>[0058]此處的附圖被并入說明書中并構(gòu)成本說明書的一部分,示出了符合本發(fā)明的實施例,并與說明書一起用于解釋本發(fā)明的原理。
[0059]圖1A是根據(jù)一示例性實施例示出的確定人體數(shù)量的方法的流程圖。
[0060]圖1B是根據(jù)一示例性實施例示出的確定人體數(shù)量的方法的場景圖。
[0061 ]圖2A是根據(jù)一示例性實施例一示出的對卷積神經(jīng)網(wǎng)絡(luò)訓(xùn)練的流程圖。
[0062I圖2B是根據(jù)一示例性實施例一示出的卷積神經(jīng)網(wǎng)絡(luò)的示意圖。
[0063]圖2C是根據(jù)一示例性實施例一示出的卷積神經(jīng)網(wǎng)絡(luò)進行訓(xùn)練的示意圖。
[0064]圖3是根據(jù)一示例性實施例二示出的確定人體數(shù)量的方法的流程圖。
[0065]圖4是根據(jù)一示例性實施例三示出的確定人體數(shù)量的方法的流程圖。
[0066]圖5是根據(jù)一示例性實施例示出的一種確定人體數(shù)量的裝置的框圖。
[0067]圖6是根據(jù)一示例性實施例示出的另一種確定人體數(shù)量的裝置的框圖。
[0068]圖7是根據(jù)一示例性實施例示出的再一種確定人體數(shù)量的裝置的框圖。
[0069]圖8是根據(jù)一示例性實施例示出的一種適用于確定人體數(shù)量的裝置的框圖。
【具體實施方式】
[0070]這里將詳細地對示例性實施例進行說明,其示例表示在附圖中。下面的描述涉及附圖時,除非另有表示,不同附圖中的相同數(shù)字表示相同或相似的要素。以下示例性實施例中所描述的實施方式并不代表與本發(fā)明相一致的所有實施方式。相反,它們僅是與如所附權(quán)利要求書中所詳述的、本發(fā)明的一些方面相一致的裝置和方法的例子。
[0071]圖1A是根據(jù)一示例性實施例示出的確定人體數(shù)量的方法的流程圖,圖1B是根據(jù)一示例性實施例示出的確定人體數(shù)量的方法的場景圖;該確定人體數(shù)量的方法可以應(yīng)用在攝像裝置或者與攝像裝置相連接的監(jiān)控設(shè)備上,如圖1A所示,該確定人體數(shù)量的方法包括以下步驟 S101-S104:
[0072]在步驟SlOl中,根據(jù)已訓(xùn)練的卷積神經(jīng)網(wǎng)絡(luò)的輸入維度對圖像采集模塊采集到的圖像進行縮放處理,控制縮放處理后的圖像的分辨率與卷積神經(jīng)網(wǎng)絡(luò)的輸入維度相同。
[0073]在一實施例中,由于攝像裝置所采集的視頻圖像的分辨率不同,而卷積神經(jīng)網(wǎng)絡(luò)的輸入維度在訓(xùn)練之后已經(jīng)固定不變,因此需要圖像采集模塊對攝像裝置所拍攝的視頻圖像進行歸一化處理,控制縮放處理后的圖像的分辨率與已訓(xùn)練的卷積神經(jīng)網(wǎng)絡(luò)的輸入維度相同,從而可以使圖像采集模塊處理后的圖像能夠輸入至已訓(xùn)練的卷積神經(jīng)網(wǎng)絡(luò),例如,對于輸入維度為227*227的卷積神經(jīng)網(wǎng)絡(luò),如果攝像裝置的視頻圖像為800*600,則圖像采集模塊采集到的圖像的分辨率也為800*600,此時需要將該800*600分辨率的圖像歸一化為227*227的圖像。
[0074]在步驟S102中,將縮放處理后的圖像輸入至已訓(xùn)練的卷積神經(jīng)網(wǎng)絡(luò),其中,已訓(xùn)練的卷積神經(jīng)網(wǎng)絡(luò)的各個卷積層和全連接層中的權(quán)值參數(shù)用于表示已訓(xùn)練的人體輪廓特征。
[0075]在一實施例中,卷積神經(jīng)網(wǎng)絡(luò)的訓(xùn)練過程可以參見下述圖2A所示實施例的描述,在此先不詳述。
[0076]在步驟S103中,通過已訓(xùn)練的卷積神經(jīng)網(wǎng)絡(luò)提取縮放處理后的圖像中的人體輪廓特征。
[0077]在一實施例中,卷積神經(jīng)網(wǎng)絡(luò)可以根據(jù)實際需要設(shè)置不同個數(shù)的卷積層和全連接層,通過卷積層和全連接層對縮放處理后的圖像進行特征提取,從而得到縮放處理后的圖像中的人體輪廓特征。
[0078]在步驟S104中,通過已訓(xùn)練的卷積神經(jīng)網(wǎng)絡(luò)對得到的人體輪廓特征進行回歸計算,得到縮放處理后的圖像上的人體數(shù)量。
[0079]在一實施例中,可以通過對已訓(xùn)練的卷積神經(jīng)網(wǎng)絡(luò)的全連接層輸出的人體輪廓特征進行回歸計算,得到一個一維的數(shù)值,該數(shù)值即可表示計算得到的縮放后的圖像中的人體數(shù)量。
[0080]作為一個示例性場景,如圖1B所示,當攝像裝置10設(shè)置在地鐵出入口或者商場出入口等人流量較大的公眾場合時,攝像裝置10會連續(xù)采集場景內(nèi)的視頻圖像,裝置11通過執(zhí)行本公開提供的確定人體數(shù)量的方法實現(xiàn)人體數(shù)量的識別,從而可以確定該場景中的人群數(shù)量。具體地,圖像采集模塊12可以通過預(yù)設(shè)的采樣周期采集攝像裝置10采集到的視頻圖像,預(yù)處理模塊13根據(jù)已訓(xùn)練的卷積神經(jīng)網(wǎng)絡(luò)的輸入維度對圖像采集模塊采集到的圖像進行縮放處理,以使縮放處理后的圖像的分辨率與卷積神經(jīng)網(wǎng)絡(luò)的輸入維度相同,預(yù)處理模塊13將縮放處理后的圖像輸入至已訓(xùn)練的卷積神經(jīng)網(wǎng)絡(luò)14,通過已訓(xùn)練的卷積神經(jīng)網(wǎng)絡(luò)14提取出縮放處理的圖像上的人體輪廓特征,結(jié)果輸出模塊15通過對卷積神經(jīng)網(wǎng)絡(luò)14的全連接層的人體輪廓特征進行回歸計算,得到縮放處理后的圖像上所包含的人體數(shù)量并輸出。如果攝像裝置10的用戶通過觀察的方式確定已訓(xùn)練的卷積神經(jīng)網(wǎng)絡(luò)14得到的人體數(shù)量與圖像上的實際人體數(shù)量相差較大,則用戶可以通過通信接口 16向提供已訓(xùn)練的卷積神經(jīng)網(wǎng)絡(luò)服務(wù)的服務(wù)器獲取權(quán)值參數(shù)更新后的卷積神經(jīng)網(wǎng)絡(luò),并對已訓(xùn)練的卷積神經(jīng)網(wǎng)絡(luò)14中的權(quán)值參數(shù)進行更新,從而確保已訓(xùn)練的卷積神經(jīng)網(wǎng)絡(luò)得到的人體數(shù)量的準確度。
[0081]本實施例中,通過將縮放處理后的圖像輸入已訓(xùn)練的卷積神經(jīng)網(wǎng)絡(luò),通過已訓(xùn)練的卷積神經(jīng)網(wǎng)絡(luò)得到關(guān)于圖像上的人體數(shù)量,由于已訓(xùn)練的卷積神經(jīng)網(wǎng)絡(luò)的各個卷積層和全連接層中的權(quán)值參數(shù)用于表示已訓(xùn)練的人體輪廓特征,因此即使圖像采集模塊采集到的圖像中會存在人與人之間相互遮擋的現(xiàn)象,也可以通過已訓(xùn)練的卷積神經(jīng)網(wǎng)絡(luò)中學(xué)習(xí)到縮放處理后的圖像中的人體輪廓特征,通過縮放后的圖像中的人體輪廓特征進行回歸計算后能夠準確地識別出縮放后的圖像中的人體數(shù)量,從而對人流量的管理提供精確的預(yù)警。
[0082]在一實施例中,方法進一步還可包括:
[0083]將包含有人體的未訓(xùn)練的的圖像樣本以及每一圖像樣本中所包含的人體數(shù)量輸入至未訓(xùn)練的卷積神經(jīng)網(wǎng)絡(luò),對未訓(xùn)練的卷積神經(jīng)網(wǎng)絡(luò)的卷積層和全連接層進行訓(xùn)練;
[0084]在確定卷積層和全連接層中各節(jié)點之間的連接的權(quán)重參數(shù)符合預(yù)設(shè)條件時,停止訓(xùn)練卷積神經(jīng)網(wǎng)絡(luò),得到已訓(xùn)練的卷積神經(jīng)網(wǎng)絡(luò)。
[0085]在一實施例中,方法進一步還可包括:
[0086]確定每一圖像樣本中的人體數(shù)量與每一圖像樣本中的實際人體數(shù)量之間的誤差是否小于預(yù)設(shè)閾值;
[0087]當每一圖像樣本中的人體數(shù)量與每一圖像樣本中的實際人體數(shù)量之間的誤差小于預(yù)設(shè)閾值時,確定卷積層和全連接層中各節(jié)點之間的連接的權(quán)重參數(shù)符合預(yù)設(shè)條件。
[0088]在一實施例中,方法進一步還可包括:
[0089]確定圖像中的實際人體數(shù)量;
[0090]計算實際人體數(shù)量與卷積神經(jīng)網(wǎng)絡(luò)得到的關(guān)于圖像上的人體數(shù)量之間的誤差;
[0091]根據(jù)誤差確定是否需要對已訓(xùn)練的卷積神經(jīng)網(wǎng)絡(luò)的權(quán)值參數(shù)進行更新。
[0092]在一實施例中,方法還可包括:
[0093]當需要對已訓(xùn)練的卷積神經(jīng)網(wǎng)絡(luò)的權(quán)值參數(shù)進行更新時,向提供卷積神經(jīng)網(wǎng)絡(luò)的服務(wù)器獲取更新后的卷積神經(jīng)網(wǎng)絡(luò)的權(quán)值參數(shù)。
[0094]在一實施例中,方法還可包括:
[0095]確定圖像采集模塊在設(shè)定時間段內(nèi)采集圖像的采集周期;
[0096]控制圖像采集模塊在采集周期從攝像裝置獲取圖像;
[0097]在設(shè)定時間段內(nèi)統(tǒng)計通過已訓(xùn)練的卷積神經(jīng)網(wǎng)絡(luò)得到的圖像上的人體數(shù)量的總和,得到設(shè)定時間段內(nèi)的人群密度。
[0098]具體如何實現(xiàn)確定人體數(shù)量的,請參考后續(xù)實施例。
[0099]至此,本公開實施例提供的上述方法,可以通過已訓(xùn)練的卷積神經(jīng)網(wǎng)絡(luò)提取圖像中的人體輪廓特征,通過圖像中的人體輪廓特征識別出圖像中的人體數(shù)量,從而可以對人流量的管理提供精確的預(yù)警。
[0100]下面以具體實施例來說明本公開實施例提供的技術(shù)方案。
[0101]圖2A是根據(jù)一示例性實施例一示出的對卷積神經(jīng)網(wǎng)絡(luò)訓(xùn)練的流程圖,圖2B是根據(jù)一示例性實施例一示出的卷積神經(jīng)網(wǎng)絡(luò)的示意圖,圖2C是根據(jù)一示例性實施例一示出的卷積神經(jīng)網(wǎng)絡(luò)進行訓(xùn)練的示意圖;本實施例利用本公開實施例提供的上述方法,以如何通過有標簽人體樣本對卷積神經(jīng)網(wǎng)絡(luò)進行訓(xùn)練為例進行示例性說明,如圖2A所示,包括如下步驟:
[0102]在步驟S201中,將包含有人體的設(shè)定數(shù)量的圖像樣本以及每一圖像樣本中所包含的人體數(shù)量輸入至未訓(xùn)練的卷積神經(jīng)網(wǎng)絡(luò),對未訓(xùn)練的卷積神經(jīng)網(wǎng)絡(luò)的卷積層和全連接層進行訓(xùn)練。
[0103 ]在步驟S202中,確定每一圖像樣本中的人體數(shù)量與每一圖像樣本中的實際人體數(shù)量之間的誤差是否小于預(yù)設(shè)