本申請涉及模型優(yōu)化,尤其涉及一種模型量化結(jié)果的分析方法、裝置、電子設(shè)備及存儲介質(zhì)。
背景技術(shù):
1、隨著深度學(xué)習(xí)技術(shù)的發(fā)展和普及,神經(jīng)網(wǎng)絡(luò)模型已被廣泛地應(yīng)用到金融、醫(yī)療、教育、工業(yè)等各大領(lǐng)域中,例如對目標(biāo)的檢測和識別。為了提升神經(jīng)網(wǎng)絡(luò)模型對目標(biāo)的檢測和識別效果,所使用的神經(jīng)網(wǎng)絡(luò)模型層數(shù)越來越深,結(jié)構(gòu)也越來越復(fù)雜,相應(yīng)地,神經(jīng)網(wǎng)絡(luò)模型的參數(shù)規(guī)模也大幅度增加,這使得訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)模型在設(shè)備端進行部署時容易受到制約,導(dǎo)致部署難度大。模型量化是一種模型壓縮技術(shù),目前常采用模型量化處理的方式來解決神經(jīng)網(wǎng)絡(luò)模型部署難度大的問題,而模型量化的效果,通常是根據(jù)模型中通道的輸出結(jié)果來主觀判斷模型量化結(jié)果的好壞,不夠直觀,難以得到準(zhǔn)確地分析模型量化結(jié)果。由于難以客觀且準(zhǔn)確地分析模型量化結(jié)果,在對神經(jīng)網(wǎng)絡(luò)模型進行迭代優(yōu)化時難以快速定位問題所在,優(yōu)化效率低。
技術(shù)實現(xiàn)思路
1、有鑒于此,本申請實施例提供了一種模型量化結(jié)果的分析方法、裝置、電子設(shè)備及存儲介質(zhì),可以客觀且準(zhǔn)確地分析模型的量化結(jié)果。
2、本申請實施例的第一方面提供了一種模型量化結(jié)果的分析方法,包括:
3、分別采用浮點數(shù)數(shù)據(jù)類型和整數(shù)數(shù)據(jù)類型對訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)模型進行模型量化處理,獲得第一量化結(jié)果文件和第二量化結(jié)果文件;
4、根據(jù)所述第一量化結(jié)果文件和第二量化結(jié)果文件構(gòu)建量化結(jié)果對比圖;
5、對所述量化結(jié)果對比圖進行圖形分析,判斷所述神經(jīng)網(wǎng)絡(luò)模型的模型量化結(jié)果是否滿足模型量化要求。
6、結(jié)合第一方面,在第一方面的第一種可能實現(xiàn)方式中,所述第一量化結(jié)果文件和所述第二量化結(jié)果文件表示為二進制格式的張量數(shù)據(jù)文件。
7、結(jié)合第一方面的第一種可能實現(xiàn)方式,在第一方面的第二種可能實現(xiàn)方式中,所述根據(jù)所述第一量化結(jié)果文件和第二量化結(jié)果文件構(gòu)建量化結(jié)果對比圖的步驟,包括:
8、將所述第一量化結(jié)果文件中記載的所有數(shù)組各自對應(yīng)的張量數(shù)據(jù)按照由小到大進行排序,并根據(jù)排序先后對所述所有數(shù)組進行由小到大的標(biāo)號處理,其中,每個數(shù)組對應(yīng)一個標(biāo)號信息;
9、以張量為縱向數(shù)軸和以數(shù)組的標(biāo)號為橫向數(shù)軸構(gòu)建所述量化結(jié)果對比圖,所述量化結(jié)果對比圖中包含有由所述第一量化結(jié)果文件中所有張量數(shù)據(jù)對應(yīng)的坐標(biāo)點組成的第一量化結(jié)果圖形和由所述第二量化結(jié)果文件中所有張量數(shù)據(jù)對應(yīng)的坐標(biāo)點組成的第二量化結(jié)果圖形。
10、結(jié)合第一方面的第二種可能實現(xiàn)方式,在第一方面的第三種可能實現(xiàn)方式中,所述對所述量化結(jié)果對比圖進行圖形分析,判斷所述神經(jīng)網(wǎng)絡(luò)模型的模型量化結(jié)果是否滿足模型量化要求的步驟,包括:
11、根據(jù)所述第二量化結(jié)果圖形和所述第二量化結(jié)果圖形各自在所述量化結(jié)果對比圖的位置,判斷所述第二量化結(jié)果圖形是否在所述第一量化結(jié)果圖形的上下波動;
12、若所述第二量化結(jié)果圖形在所述第一量化結(jié)果圖形的上下波動,則判斷所述神經(jīng)網(wǎng)絡(luò)模型的模型量化結(jié)果滿足模型量化要求。
13、結(jié)合第一方面的第二種可能實現(xiàn)方式,在第一方面的第四種可能實現(xiàn)方式中,所述對所述量化結(jié)果對比圖進行圖形分析,判斷所述神經(jīng)網(wǎng)絡(luò)模型的模型量化結(jié)果是否滿足模型量化要求的步驟,包括:
14、根據(jù)所述量化結(jié)果對比圖,逐一將每個數(shù)組作為目標(biāo)數(shù)組,獲取所述一量化結(jié)果圖形中與所述目標(biāo)數(shù)組對應(yīng)的張量數(shù)據(jù)值所在的第一位置和所述第二量化結(jié)果圖形中與所述目標(biāo)數(shù)組對應(yīng)的張量數(shù)據(jù)值所在的第二位置;
15、計算所述第一位置與第二位置之間的位置距離;
16、將所述位置距離與預(yù)設(shè)的距離閾值進行比較,若所述位置距離小于預(yù)設(shè)的距離閾值,則判斷所述神經(jīng)網(wǎng)絡(luò)模型中目標(biāo)數(shù)組所對應(yīng)的通道的模型量化結(jié)果滿足模型量化要求。
17、結(jié)合第一方面的第四種可能實現(xiàn)方式,在第一方面的第五種可能實現(xiàn)方式中,所述第二量化結(jié)果圖形中與所述目標(biāo)數(shù)組對應(yīng)的張量數(shù)據(jù)值多于一個時,還包括:
18、將所述第二量化結(jié)果圖形中與所述目標(biāo)數(shù)組對應(yīng)的所有張量數(shù)據(jù)值進行大小比較,確定最大張量數(shù)據(jù)值和最小張量數(shù)據(jù)值;
19、獲取所述第二量化結(jié)果圖形中與所述目標(biāo)數(shù)組對應(yīng)的最大張量數(shù)據(jù)值所在的第三位置和最小張量數(shù)據(jù)值所在的第四位置,以將所述第三位置和所述第四位置共同作為第二位置。
20、結(jié)合第一方面的第五種可能實現(xiàn)方式,在第一方面的第六種可能實現(xiàn)方式中,所述第三位置和所述第四位置共同作為第二位置時,所述對所述量化結(jié)果對比圖進行圖形分析,判斷所述神經(jīng)網(wǎng)絡(luò)模型的模型量化結(jié)果是否滿足模型量化要求的步驟,包括:
21、計算所述第一位置與所述第三位置之間的第一位置距離和所述第一位置與所述第四位置之間的第二位置距離;
22、將所述第一位置距離和所述第二位置距離分別與預(yù)設(shè)的距離閾值進行比較,若所述第一位置距離和所述第二位置距離均小于預(yù)設(shè)的距離閾值且所述第一位置處于所述第三位置和所述第四位置之間,則判斷所述神經(jīng)網(wǎng)絡(luò)模型中目標(biāo)數(shù)組所對應(yīng)的通道的模型量化結(jié)果滿足模型量化要求。
23、本申請實施例的第二方面提供了一種模型量化結(jié)果的分析裝置,所述模型量化結(jié)果的分析裝置包括:
24、量化處理模塊,用于分別采用浮點數(shù)數(shù)據(jù)類型和整數(shù)數(shù)據(jù)類型對訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)模型進行模型量化處理,獲得第一量化結(jié)果文件和第二量化結(jié)果文件;
25、對比圖構(gòu)建模塊,用于根據(jù)所述第一量化結(jié)果文件和第二量化結(jié)果文件構(gòu)建可視化的量化結(jié)果對比圖;
26、量化結(jié)果分析模塊,用于對所述量化結(jié)果對比圖進行圖形分析,判斷所述神經(jīng)網(wǎng)絡(luò)模型的模型量化結(jié)果是否滿足模型量化要求。
27、本申請實施例的第三方面提供了一種電子設(shè)備,包括存儲器、處理器以及存儲在所述存儲器中并可在電子設(shè)備上運行的計算機程序,所述處理器執(zhí)行所述計算機程序時實現(xiàn)第一方面提供的模型量化結(jié)果的分析方法的各步驟。
28、本申請實施例的第四方面提供了一種計算機可讀存儲介質(zhì),所述計算機可讀存儲介質(zhì)存儲有計算機程序,所述計算機程序被處理器執(zhí)行時實現(xiàn)第一方面提供的模型量化結(jié)果的分析方法的各步驟。
29、本申請實施例提供的一種模型量化結(jié)果的分析方法、裝置、電子設(shè)備及存儲介質(zhì),具有以下有益效果:
30、本申請通過分別采用浮點數(shù)數(shù)據(jù)類型和整數(shù)數(shù)據(jù)類型對訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)模型進行模型量化處理,獲得第一量化結(jié)果文件和第二量化結(jié)果文件;根據(jù)所述第一量化結(jié)果文件和第二量化結(jié)果文件構(gòu)建量化結(jié)果對比圖;對所述量化結(jié)果對比圖進行圖形分析,判斷所述神經(jīng)網(wǎng)絡(luò)模型的模型量化結(jié)果是否滿足模型量化要求。該方法可以通過構(gòu)建量化結(jié)果對比圖可視化展示模型的量化結(jié)果,通過量化結(jié)果對比圖直觀地分析神經(jīng)網(wǎng)絡(luò)模型的模型量化結(jié)果是否滿足模型量化要求,客觀且準(zhǔn)確地分析模型的量化結(jié)果。
1.一種模型量化結(jié)果的分析方法,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的模型量化結(jié)果的分析方法,其特征在于,所述第一量化結(jié)果文件和所述第二量化結(jié)果文件表示為二進制格式的張量數(shù)據(jù)文件。
3.根據(jù)權(quán)利要求2所述的模型量化結(jié)果的分析方法,其特征在于,所述根據(jù)所述第一量化結(jié)果文件和第二量化結(jié)果文件構(gòu)建量化結(jié)果對比圖的步驟,包括:
4.根據(jù)權(quán)利要求3所述的模型量化結(jié)果的分析方法,其特征在于,所述對所述量化結(jié)果對比圖進行圖形分析,判斷所述神經(jīng)網(wǎng)絡(luò)模型的模型量化結(jié)果是否滿足模型量化要求的步驟,包括:
5.根據(jù)權(quán)利要求3所述的模型量化結(jié)果的分析方法,其特征在于,所述對所述量化結(jié)果對比圖進行圖形分析,判斷所述神經(jīng)網(wǎng)絡(luò)模型的模型量化結(jié)果是否滿足模型量化要求的步驟,包括:
6.根據(jù)權(quán)利要求5所述的模型量化結(jié)果的分析方法,其特征在于,所述第二量化結(jié)果圖形中與所述目標(biāo)數(shù)組對應(yīng)的張量數(shù)據(jù)值多于一個時,還包括:
7.根據(jù)權(quán)利要求6所述的模型量化結(jié)果的分析方法,其特征在于,所述第三位置和所述第四位置共同作為第二位置時,所述對所述量化結(jié)果對比圖進行圖形分析,判斷所述神經(jīng)網(wǎng)絡(luò)模型的模型量化結(jié)果是否滿足模型量化要求的步驟,包括:
8.一種模型量化結(jié)果的分析裝置,其特征在于,所述模型量化結(jié)果的分析裝置包括:
9.一種電子設(shè)備,包括存儲器、處理器以及存儲在所述存儲器中并可在所述處理器上運行的計算機程序,其特征在于,所述處理器執(zhí)行所述計算機程序時實現(xiàn)如權(quán)利要求1至7任一項所述方法的步驟。
10.一種計算機可讀存儲介質(zhì),所述計算機可讀存儲介質(zhì)存儲有計算機程序,其特征在于,所述計算機程序被處理器執(zhí)行時實現(xiàn)如權(quán)利要求1至7任一項所述方法的步驟。