本發(fā)明屬于圖片識別的,尤其涉及一種圖片方向識別方法、裝置、設(shè)備、存儲介質(zhì)及程序產(chǎn)品。
背景技術(shù):
1、人工智能圖片智能識別技術(shù)在網(wǎng)絡(luò)管理、it(information?technology,信息技術(shù))系統(tǒng)監(jiān)控等領(lǐng)域的應(yīng)用日益廣泛。這些技術(shù)需要智能識別日常運(yùn)維巡檢和用戶體驗(yàn)異常拍照等圖像,以便及時發(fā)現(xiàn)異常情況。然而,圖片在拍攝或傳輸過程中可能出現(xiàn)的90°、180°、270°旋轉(zhuǎn),可能會導(dǎo)致智能識別系統(tǒng)難以準(zhǔn)確識別圖像內(nèi)容,從而影響監(jiān)控效率。
2、為準(zhǔn)確識別圖像方向,一種常見的策略是利用圖片的可交換圖像文件格式(exchangeable?image?file?format,exif)信息來記錄和判斷圖片的正確方向。exif信息是一種用于存儲圖像元數(shù)據(jù)的標(biāo)準(zhǔn),包括拍攝信息、相機(jī)設(shè)置和圖像方向等數(shù)據(jù)。大多數(shù)智能手機(jī)和部分相機(jī)都能夠通過內(nèi)置的陀螺儀記錄拍照時照片的方向,為圖片的顯示和處理提供方向信息。
3、然而,exif信息的準(zhǔn)確性受限于多種因素。例如,當(dāng)手機(jī)水平放置并從上向下拍攝文檔時,內(nèi)置的陀螺儀可能無法準(zhǔn)確捕捉到實(shí)際拍攝方向,導(dǎo)致方向信息記錄出現(xiàn)偏差,進(jìn)而可能影響對圖片方向識別的準(zhǔn)確性。
技術(shù)實(shí)現(xiàn)思路
1、本發(fā)明實(shí)施例提供一種圖片方向識別方法、裝置、設(shè)備、存儲介質(zhì)及程序產(chǎn)品,能夠有效提高對圖片方向識別的準(zhǔn)確性。
2、第一方面,本申請實(shí)施例提供一種圖片方向識別方法,該方法包括:
3、獲取待識別圖片;
4、以預(yù)設(shè)參照為基準(zhǔn),對待識別圖片分別進(jìn)行n-1個預(yù)設(shè)角度的旋轉(zhuǎn),得到n-1張不同旋轉(zhuǎn)方向的參考圖片,n為大于或等于2的正整數(shù);
5、對每張目標(biāo)圖片分別進(jìn)行圖像卷積運(yùn)算,提取對應(yīng)的一組圖像特征,目標(biāo)圖片包括n-1張參考圖片和待識別圖片;
6、將每組圖像特征分別輸入到預(yù)先訓(xùn)練的對象識別模型中,得到識別結(jié)果,識別結(jié)果包括目標(biāo)圖片中存在的對象以及對象的位置信息;
7、根據(jù)每個識別結(jié)果,在n個識別結(jié)果中確定待識別圖片的實(shí)際方向。
8、第二方面,本申請實(shí)施例提供一種圖片方向識別裝置,該裝置包括:
9、第一獲取模塊,用于獲取待識別圖片;
10、第一旋轉(zhuǎn)模塊,用于以預(yù)設(shè)參照為基準(zhǔn),對待識別圖片分別進(jìn)行n-1個預(yù)設(shè)角度的旋轉(zhuǎn),得到n-1張不同旋轉(zhuǎn)方向的參考圖片,n為大于或等于2的正整數(shù);
11、第一提取模塊,用于對每張目標(biāo)圖片分別進(jìn)行圖像卷積運(yùn)算,提取對應(yīng)的一組圖像特征,目標(biāo)圖片包括n-1張參考圖片和待識別圖片;
12、第一確定模塊,用于將每組圖像特征分別輸入到預(yù)先訓(xùn)練的對象識別模型中,得到識別結(jié)果,識別結(jié)果包括目標(biāo)圖片中存在的對象以及對象的位置信息;
13、第二確定模塊,用于根據(jù)每個識別結(jié)果,在n個識別結(jié)果中確定待識別圖片的實(shí)際方向。
14、第三方面,本申請實(shí)施例提供一種電子設(shè)備,該電子設(shè)備包括:處理器以及存儲有計(jì)算機(jī)程序指令的存儲器;
15、處理器執(zhí)行計(jì)算機(jī)程序指令時實(shí)現(xiàn)如第一方面任意一項(xiàng)的圖片方向識別方法。
16、第四方面,本申請實(shí)施例提供一種計(jì)算機(jī)可讀存儲介質(zhì),該計(jì)算機(jī)可讀存儲介質(zhì)上存儲有計(jì)算機(jī)程序指令,計(jì)算機(jī)程序指令被處理器執(zhí)行時實(shí)現(xiàn)如第一方面任意一項(xiàng)的圖片方向識別方法。
17、第五方面,本申請實(shí)施例提供一種計(jì)算機(jī)程序產(chǎn)品,該計(jì)算機(jī)程序產(chǎn)品包括計(jì)算機(jī)程序,計(jì)算機(jī)程序被處理其執(zhí)行時實(shí)現(xiàn)第一方面任一項(xiàng)的圖片方向識別方法。
18、本申請實(shí)施例的圖片方向識別方法、裝置、設(shè)備、存儲介質(zhì)及程序產(chǎn)品,能夠通過獲取待識別圖片的n組圖像特征,可以捕捉待識別圖片在不同旋轉(zhuǎn)方向上的多角度的圖像特征。接著,將這些多角度的圖像特征輸入到預(yù)先訓(xùn)練的對象識別模型中,可以利用對象識別模型學(xué)習(xí)到的內(nèi)容對待識別圖片在不同方向上中包含的對象進(jìn)行準(zhǔn)確的分析和識別。進(jìn)一步地,通過對待識別圖片在多個方向的識別結(jié)果進(jìn)行分析,可以評估哪個方向的識別結(jié)果具有較高的一致性和準(zhǔn)確性,從而確定待識別圖片的實(shí)際方向。
19、該方法不依賴于圖片的exif信息或設(shè)備的陀螺儀,而是通過識別結(jié)果(對象及對象的位置信息),也即圖片內(nèi)容進(jìn)行方向判斷。具體地,通過對圖片在不同旋轉(zhuǎn)方向上的識別結(jié)果,能夠從多個角度評估圖片內(nèi)對象的方向,從而繞過了因硬件限制或信息丟失導(dǎo)致的方向識別偏差,有效提高了對待識別圖片方向識別的準(zhǔn)確率。
1.一種圖片方向識別方法,其特征在于,所述方法包括:
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述根據(jù)每個所述識別結(jié)果,在n個所述識別結(jié)果中確定所述待識別圖片的實(shí)際方向,包括:
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述根據(jù)每個所述識別結(jié)果,在n個所述識別結(jié)果中確定所述待識別圖片的實(shí)際方向,包括:
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述對于每個識別結(jié)果,根據(jù)所述識別結(jié)果中的每個對象對應(yīng)的旋轉(zhuǎn)權(quán)重,確定所述識別結(jié)果的總貢獻(xiàn)值,包括:
5.根據(jù)權(quán)利要求1至4任一項(xiàng)所述的方法,其特征在于,所述對每張目標(biāo)圖片分別進(jìn)行圖像卷積運(yùn)算,提取對應(yīng)的一組圖像特征,包括:
6.根據(jù)權(quán)利要求1至4任一項(xiàng)所述的方法,其特征在于,在所述將每組所述圖像特征分別輸入到預(yù)先訓(xùn)練的對象識別模型中,得到識別結(jié)果之前,所述方法還包括:
7.根據(jù)權(quán)利要求6所述的方法,其特征在于,所述初始識別模型基于卷積神經(jīng)網(wǎng)絡(luò)的架構(gòu)構(gòu)建,所述方法還包括:
8.根據(jù)權(quán)利要求7所述的方法,其特征在于,所述將所述圖片輸入到卷積神經(jīng)網(wǎng)絡(luò)的卷積層,利用所述卷積層中引入的旋轉(zhuǎn)不變性卷積核提取所述圖片的特征向量,包括:
9.一種圖片方向識別裝置,其特征在于,所述裝置包括:
10.一種電子設(shè)備,其特征在于,所述設(shè)備包括:處理器以及存儲有計(jì)算機(jī)程序指令的存儲器;
11.一種計(jì)算機(jī)可讀存儲介質(zhì),其特征在于,所述計(jì)算機(jī)可讀存儲介質(zhì)上存儲有計(jì)算機(jī)程序指令,所述計(jì)算機(jī)程序指令被處理器執(zhí)行時實(shí)現(xiàn)如權(quán)利要求1-8任意一項(xiàng)所述的圖片方向識別方法。
12.一種計(jì)算機(jī)程序產(chǎn)品,其特征在于,包括計(jì)算機(jī)程序,所述計(jì)算機(jī)程序被處理其執(zhí)行時實(shí)現(xiàn)權(quán)利要求1-8任一項(xiàng)所述的圖片方向識別方法。