人臉識(shí)別方法及裝置的制造方法
【技術(shù)領(lǐng)域】
[0001]本公開涉及圖像識(shí)別技術(shù)領(lǐng)域,尤其涉及一種人臉識(shí)別方法及裝置。
【背景技術(shù)】
[0002]在以人臉為單位對(duì)用戶相冊進(jìn)行分類的過程中,首先需要獲取用戶手機(jī)上傳的全部照片,對(duì)全部照片進(jìn)行人臉檢測提取出人臉特征,將提取的人臉特征依次與已分類的人臉進(jìn)行相似性度量,將具有相似性特征的照片劃分到同一個(gè)人臉相冊中。在用戶連拍多張照片的情形下,如果其中7張照片的人臉比較清晰,但是另外3張照片由于姿勢以及光照等因素不能直接提取臉部特征,在此情形下,該3張照片的人臉識(shí)別會(huì)失敗,從而影響人臉的識(shí)別率。
【發(fā)明內(nèi)容】
[0003]為克服相關(guān)技術(shù)中存在的問題,本公開實(shí)施例提供一種人臉識(shí)別方法及裝置,用以提尚人臉識(shí)別的準(zhǔn)確率。
[0004]根據(jù)本公開實(shí)施例的第一方面,提供一種人臉識(shí)別方法,包括:
[0005]通過已訓(xùn)練的第一卷積神經(jīng)網(wǎng)絡(luò)提取照片中的第一人臉區(qū)域的第一組特征,所述第一組特征表示所述照片中的人臉特征,所述第一人臉區(qū)域由照片中的人臉?biāo)诘牡谝粎^(qū)域確定;
[0006]通過已訓(xùn)練的第二卷積神經(jīng)網(wǎng)絡(luò)提取所述照片中的第二人臉區(qū)域的第二組特征,所述第二人臉區(qū)域由照片中的人臉?biāo)诘牡诙^(qū)域確定,所述第二區(qū)域由所述第一區(qū)域向四周擴(kuò)張?jiān)O(shè)定像素寬度得到,所述第二組特征表示所述照片中的衣物特征;
[0007]合并所述第一組特征和所述第二組特征,對(duì)合并后的特征組合進(jìn)行降維處理,得到第三組特征,其中,所述第三組特征的維數(shù)小于所述合并后的特征組合的維數(shù);
[0008]根據(jù)所述第三組特征與已提取出的參考人臉特征的余弦距離確定所述照片中的人臉與所述參考人臉特征對(duì)應(yīng)的人臉是否為同一人臉。
[0009]在一實(shí)施例中,所述方法還可包括:
[0010]將設(shè)定數(shù)量的第一組有標(biāo)簽人臉樣本輸入至未訓(xùn)練的第一卷積神經(jīng)網(wǎng)絡(luò),對(duì)所述未訓(xùn)練的卷積神經(jīng)網(wǎng)絡(luò)的至少一個(gè)卷積層和至少一個(gè)全連接層進(jìn)行訓(xùn)練;
[0011]在確定所述未訓(xùn)練的第一卷積神經(jīng)網(wǎng)絡(luò)中各節(jié)點(diǎn)之間的連接的最佳權(quán)重參數(shù)時(shí),確定得到所述已訓(xùn)練的第一卷積神經(jīng)網(wǎng)絡(luò);
[0012]將所述設(shè)定數(shù)量的第一組有標(biāo)簽人臉樣本的四周進(jìn)行擴(kuò)張所述設(shè)定像素寬度的區(qū)域,得到第二組有標(biāo)簽人臉樣本;
[0013]將所述設(shè)定數(shù)量的所述第二組有標(biāo)簽人臉樣本輸入至未訓(xùn)練的第二卷積神經(jīng)網(wǎng)絡(luò),對(duì)所述未訓(xùn)練的第二卷積神經(jīng)網(wǎng)絡(luò)的至少一個(gè)卷積層和至少一個(gè)全連接層進(jìn)行訓(xùn)練;
[0014]在確定所述未訓(xùn)練的第二卷積神經(jīng)網(wǎng)絡(luò)中各節(jié)點(diǎn)之間的連接的最佳權(quán)重參數(shù)時(shí),確定得到所述已訓(xùn)練的第二卷積神經(jīng)網(wǎng)絡(luò)。
[0015]在一實(shí)施例中,所述方法還可包括:
[0016]通過所述已訓(xùn)練的第一卷積神經(jīng)網(wǎng)絡(luò)提取所述第一組有標(biāo)簽人臉樣本的第一設(shè)定長度的特征參數(shù);
[0017]通過所述已訓(xùn)練的第二卷積神經(jīng)網(wǎng)絡(luò)提取所述第二組有標(biāo)簽人臉樣本的第二設(shè)定長度的特征參數(shù);
[0018]合并所述第一設(shè)定長度的特征參數(shù)和所述第二設(shè)定長度的特征參數(shù),將合并后的特征參數(shù)進(jìn)行線性判別式分析LDA訓(xùn)練,得到所述LDA的第三設(shè)定長度的投影矩陣。
[0019]在一實(shí)施例中,所述根據(jù)所述第三組特征與已提取出的參考人臉特征的余弦距離確定所述照片中的人臉與所述參考人臉特征對(duì)應(yīng)的人臉是否為同一人臉,可包括:
[0020]將所述第三組特征與已提取出的參考人臉特征的余弦距離與預(yù)設(shè)閾值進(jìn)行比較;
[0021]如果所述余弦距離大于所述預(yù)設(shè)閾值,確定所述照片中的人臉與所述參考人臉特征對(duì)應(yīng)的人臉為同一人臉;
[0022]如果所述余弦距離小于或者等于所述預(yù)設(shè)閾值,確定所述照片中的人臉與所述參考人臉特征對(duì)應(yīng)的人臉為不同的人臉。
[0023]在一實(shí)施例中,所述方法還可包括:
[0024]檢測所述照片上的人臉的特征點(diǎn);
[0025]根據(jù)所述人臉的特征點(diǎn)從所述照片上確定所述人臉?biāo)诘乃龅谝粎^(qū)域以及對(duì)所述第一區(qū)域向四周擴(kuò)張?jiān)O(shè)定像素寬度得到第二區(qū)域;
[0026]根據(jù)預(yù)設(shè)參考特征點(diǎn)將所述第一區(qū)域進(jìn)行仿射變換得到所述第一人臉區(qū)域,所述第一人臉區(qū)域的大小與所述第一卷積神經(jīng)網(wǎng)絡(luò)的輸入層的維數(shù)相同;
[0027]根據(jù)所述預(yù)設(shè)參考特征點(diǎn)將所述第二區(qū)域進(jìn)行仿射變換得到所述第二人臉區(qū)域,所述第二人臉區(qū)域的大小與所述第二卷積神經(jīng)網(wǎng)絡(luò)的輸入層的維數(shù)相同。
[0028]根據(jù)本公開實(shí)施例的第二方面,提供一種人臉識(shí)別裝置,包括:
[0029]第一提取模塊,被配置為通過已訓(xùn)練的第一卷積神經(jīng)網(wǎng)絡(luò)提取照片中的第一人臉區(qū)域的第一組特征,所述第一組特征表示所述照片中的人臉特征,所述第一人臉區(qū)域由照片中的人臉?biāo)诘牡谝粎^(qū)域確定;
[0030]第二提取模塊,被配置為通過已訓(xùn)練的第二卷積神經(jīng)網(wǎng)絡(luò)提取所述照片中的第二人臉區(qū)域的第二組特征,所述第二人臉區(qū)域由照片中的人臉?biāo)诘牡诙^(qū)域確定,所述第二區(qū)域由所述第一區(qū)域向四周擴(kuò)張?jiān)O(shè)定像素寬度得到,所述第二組特征表示所述照片中的衣物特征;
[0031]第一處理模塊,被配置為合并所述第一提取模塊提取到的所述第一組特征和所述第二提取模塊提取到的所述第二組特征,對(duì)合并后的特征組合進(jìn)行降維處理,得到第三組特征,其中,所述第三組特征的維數(shù)小于所述合并后的特征組合的維數(shù);
[0032]第一確定模塊,被配置為根據(jù)所述第一處理模塊合并后的所述第三組特征與已提取出的參考人臉特征的余弦距離確定所述照片中的人臉與所述參考人臉特征對(duì)應(yīng)的人臉是否為同一人臉。
[0033]在一實(shí)施例中,所述裝置還可包括:
[0034]第一訓(xùn)練模塊,被配置為將設(shè)定數(shù)量的第一組有標(biāo)簽人臉樣本輸入至未訓(xùn)練的第一卷積神經(jīng)網(wǎng)絡(luò),對(duì)所述未訓(xùn)練的卷積神經(jīng)網(wǎng)絡(luò)的至少一個(gè)卷積層和至少一個(gè)全連接層進(jìn)行訓(xùn)練;
[0035]第二確定模塊,被配置為在確定所述未訓(xùn)練的第一卷積神經(jīng)網(wǎng)絡(luò)中各節(jié)點(diǎn)之間的連接的最佳權(quán)重參數(shù)時(shí),確定通過所述第一訓(xùn)練模塊得到所述已訓(xùn)練的第一卷積神經(jīng)網(wǎng)絡(luò);
[0036]區(qū)域擴(kuò)張模塊,被配置為將所述設(shè)定數(shù)量的第一組有標(biāo)簽人臉樣本的四周進(jìn)行擴(kuò)張所述設(shè)定像素寬度的區(qū)域,得到第二組有標(biāo)簽人臉樣本;
[0037]第二訓(xùn)練模塊,被配置為將所述設(shè)定數(shù)量的所述第二組有標(biāo)簽人臉樣本輸入至未訓(xùn)練的第二卷積神經(jīng)網(wǎng)絡(luò),對(duì)所述未訓(xùn)練的第二卷積神經(jīng)網(wǎng)絡(luò)的至少一個(gè)卷積層和至少一個(gè)全連接層進(jìn)行訓(xùn)練;
[0038]第三確定模塊,被配置為在確定所述未訓(xùn)練的第二卷積神經(jīng)網(wǎng)絡(luò)中各節(jié)點(diǎn)之間的連接的最佳權(quán)重參數(shù)時(shí),確定通過所述第二訓(xùn)練模塊得到所述已訓(xùn)練的第二卷積神經(jīng)網(wǎng)絡(luò)。
[0039]在一實(shí)施例中,所述裝置還可包括:
[0040]第三提取模塊,被配置為通過所述第二確定模塊確定的所述已訓(xùn)練的第一卷積神經(jīng)網(wǎng)絡(luò)提取所述第一組有標(biāo)簽人臉樣本的第一設(shè)定長度的特征參數(shù);
[0041]第四提取模塊,被配置為通過所述已訓(xùn)練的第二卷積神經(jīng)網(wǎng)絡(luò)提取所述第二組有標(biāo)簽人臉樣本的第二設(shè)定長度的特征參數(shù);
[0042]第二處理模塊,被配置為合并所述第三提取模塊提取的所述第一設(shè)定長度的特征參數(shù)和所述第四提取模塊提取的所述第二設(shè)定長度的特征參數(shù),將合并后的特征參數(shù)進(jìn)行線性判別式分析LDA訓(xùn)練,得到所述LDA的第三設(shè)定長度的投影矩陣。
[0043]在一實(shí)施例中,所述第一確定模塊可包括:
[0044]比較子模塊,被配置為將所述第一處理模塊合并后的所述第三組特征與已提取出的參考人臉特征的余弦距離與預(yù)設(shè)閾值進(jìn)行比較;
[0045]第一確定子模塊,被配置為如果所述比較子模塊的比較結(jié)果表示所述余弦距離大于所述預(yù)設(shè)閾值,確定所述照片中的人臉與所述參考人臉特征對(duì)應(yīng)的人臉為同一人臉;
[0046]第二確定子模塊,被配置為如果所述比較子模塊的比較結(jié)果表示所述余弦距離小于或者等于所述預(yù)設(shè)閾值,確定所述照片中的人臉與所述參考人臉特征對(duì)應(yīng)的人臉為不同的人臉。
[0047]在一實(shí)施例中,所述裝置還可包括:
[0048]檢測模塊,被配置為檢測所述照片上的人臉的特征點(diǎn);
[0049]第四確定模塊,被配置為根據(jù)所述檢測模塊檢測到的所述人臉的特征點(diǎn)從所述照片上確定所述人臉?biāo)诘乃龅谝粎^(qū)域以及對(duì)所述第一區(qū)域向四周擴(kuò)張?jiān)O(shè)定像素寬度得到所述第二區(qū)域;
[0050]第一變換模塊,被配置為根據(jù)預(yù)設(shè)參考特征點(diǎn)將所述第四確定模塊確定的所述第一區(qū)域進(jìn)行仿射變換得到所述第一人臉區(qū)域,所述第一人臉區(qū)域的大小與所述第一卷積神經(jīng)網(wǎng)絡(luò)的輸入層的維數(shù)相同;
[0051]第二變換模塊,被配置為根據(jù)所述預(yù)設(shè)參考特征點(diǎn)將所述第四確定模塊確定的所述第二區(qū)域進(jìn)行仿射變換得到所述第二人臉區(qū)域,所述第二人臉區(qū)域的大小與所述第二卷積神經(jīng)網(wǎng)絡(luò)的輸入層的維數(shù)相同。
[0052]根據(jù)本公開實(shí)施例的第三方面,提供一種人臉識(shí)別裝置,包括:
[0053]處理器;
[0054]用于存儲(chǔ)處理器可執(zhí)行指令的存儲(chǔ)器;
[0055]其中,所述處理器被配置為:
[0056]通過已訓(xùn)練的第一卷積神經(jīng)網(wǎng)絡(luò)提取照片中的第一人臉區(qū)域的第一組特征,所述第一組特征表示所述照片中的人臉特征,所述第一人臉區(qū)域由照片中的人臉?biāo)诘牡谝粎^(qū)域確定;
[0057]通過已訓(xùn)練的第二卷積神經(jīng)網(wǎng)絡(luò)提取所述照片中的第二人臉區(qū)域的第二組特征,所述第二人臉區(qū)域由照片中的人臉?biāo)诘牡诙^(qū)域確定,所述第二區(qū)域由所述第一區(qū)域向四周擴(kuò)張?jiān)O(shè)定像素寬度得到,所述第二組特征表示所述照片中的衣物特征;
[0058]合并所述第一組特征和所述第二組特征,對(duì)合并后的特征組合進(jìn)行降維處理,得到第三組特征,