本發(fā)明圖片處理神經網絡構建領域,具體涉及一種圖片標注神經網絡模型構建方法及系統。
背景技術:
1、在圖像處理與計算機視覺領域,圖片標注是一項至關重要的任務,它涉及對圖像內容進行自動識別和分類,并賦予相應的標簽或描述。傳統的圖片標注方式為純手工標注,這消耗大量人力且效率較低。隨著深度學習技術的快速發(fā)展,尤其是神經網絡模型在圖像識別與理解方面的廣泛應用,使用神經網絡模型對圖片進行標注成為可能,圖片標注的準確性和效率得到了顯著提升。然而,傳統的圖片標注神經網絡模型多依賴于連續(xù)激活函數,這些模型在處理復雜圖像特征時,往往存在難以有效捕捉圖像中的瞬態(tài)或突發(fā)特征等問題,使得圖片標注神經網絡魯棒性較差。
技術實現思路
1、為解決上述問題,本發(fā)明提供一種圖片標注神經網絡模型構建方法及系統,使用脈沖高斯線性誤差單元將原始圖片標注神經網絡模型轉換為脈沖神經網絡,利用脈沖高斯線性誤差單元非線性提高圖片標注神經網絡的魯棒性。
2、第一方面,本發(fā)明的技術方案提供一種圖片標注神經網絡模型構建方法,包括以下步驟:
3、構建原始圖片標注神經網絡模型,原始圖片標注神經網絡模型中的激活函數統一使用高斯線性誤差單元;
4、對原始圖片標注神經網絡模型進行訓練;
5、使用脈沖高斯線性誤差單元將訓練后的原始圖片標注神經網絡模型轉換為脈沖神經網絡,該脈沖神經網絡為最終構建的圖片標注神經網絡模型。
6、在一個可選的實施方式中,使用脈沖高斯線性誤差單元將訓練后的原始圖片標注神經網絡模型轉換為脈沖神經網絡,具體包括:
7、構建脈沖高斯線性誤差單元;
8、將原始圖片標注神經網絡模型的高斯線性誤差單元替換為所構建脈沖高斯線性誤差單元,獲得脈沖神經網絡。
9、在一個可選的實施方式中,脈沖高斯線性誤差單元為帶有縮放參數的脈沖高斯線性誤差單元;
10、構建脈沖高斯線性誤差單元,具體包括:
11、配置縮放參數;
12、通過以下公式計算脈沖高斯線性誤差單元的能量累加,
13、
14、式中,表示第n個時間步脈沖高斯線性誤差單元累積的能量,表示上一時間步步脈沖高斯線性誤差單元累積的能量,表示第n個時間步的輸入,表示標準正態(tài)分布的累計分布函數;
15、根據能量累加通過以下公式獲得脈沖值,表示若能量為正,則向下取整,反之向上取整,
16、
17、
18、根據縮放參數通過以下公式進行脈沖值縮放,獲得第n個時間步的輸出值,
19、
20、通過以下公式計算脈沖高斯線性誤差單元的能量衰減,
21、。
22、在一個可選的實施方式中,使用脈沖高斯線性誤差單元將訓練后的原始圖片標注神經網絡模型轉換為脈沖神經網絡,還包括:
23、通過以下公式計算脈沖神經網絡第n個時間步的脈沖稀疏度,
24、
25、
26、式中,表示脈沖神經網絡在第n個時間步的輸出掩碼,表示沖神經網絡在第n-1個時間步的輸出掩碼,表示輸出掩碼展開后的計算單元數量;
27、計算所有時間步脈沖稀疏度的平均值;
28、判斷脈沖稀疏度是否大于閾值;
29、若是,則按照預設步長減小縮放參數;否則,不做調整;
30、使用新的縮放參數重新構建脈沖高斯線性誤差單元,并獲得新的脈沖神經網絡,直到脈沖稀疏度滿足要求,獲得最終的脈沖神經網絡。
31、在一個可選的實施方式中,脈沖神經網絡在每個時間步的輸入均保持不變,其最終輸出結果為所有時間步輸出掩碼的平均值。
32、在一個可選的實施方式中,對原始圖片標注神經網絡模型進行訓練,具體包括:
33、使用高斯過程作為代理模型來近似目標函數,并利用代理模型指導下一步采樣以逐步逼近最優(yōu)解;
34、采用期望改進策略,將最小化損失函數作為最大化期望改進;
35、每次采樣后,根據新的采樣點計算損失函數的值,并更新代理模型;
36、使用貝葉斯優(yōu)化算法進行超參數調整,在每次迭代中,貝葉斯優(yōu)化器根據當前的代理模型和期望改進策略選擇下一個超參數組合進行評估,并更新代理模型,直到找到最優(yōu)的超參數組合。
37、在一個可選的實施方式中,原始圖片標注神經網絡模型為transformer模型,包括圖片編碼器、提示編碼器和掩碼解碼器;
38、圖片編碼器分別通過自注意力機制、多頭注意力機制、前饋神經網絡進行編碼;
39、提示編碼器接受用戶輸入的點提示信息、框提示信息和文本提示信息;
40、掩碼解碼器包括反卷積層、上采樣層和卷積層;
41、原始圖片標注神經網絡模型使用二元交叉熵損失和邊界損失的組合構造損失函數;
42、在原始圖片標注神經網絡模型訓練過程中加入模塊間的協同機制,包括在圖片編碼器中的注意力頭、前饋神經網絡以及掩碼解碼器中的各個卷積層中增加參數可學習的協調矩陣。
43、在一個可選的實施方式中,對原始圖片標注神經網絡模型進行訓練之后,還包括對訓練后圖片標注神經網絡模型進行模型壓縮的步驟,具體包括:
44、(1)對模型進行修剪:在模型的前向傳播過程中,收集每個注意力頭的注意力權重矩陣,對每個注意力頭的注意力權重矩陣進行平均,得到各個注意力頭的平均注意力權重,丟棄平均注意力權重低的若干注意力;
45、(2)對圖像編碼器和掩碼解碼器中的卷積層進行低秩分解:對每個目標卷積層的權重矩陣進行奇異值分解,對所計算奇異值進行截斷,保留最大的若干奇異值,使用截斷后的奇異值矩陣重構低秩矩陣,將原始卷積層的權重矩陣替換為重構的低秩矩陣;
46、(3)將模型的浮點數權重轉換為整數權重:
47、(a)計算每個浮點數權重的最小值和最大值,確定量化范圍,
48、
49、(b)根據范圍計算縮放因子,將32位浮點數映射到8位整數,對于8位整數, qmax與 qmin分別為128與-127,
50、
51、(c)使用縮放因子將浮點數權重轉換為整數權重,
52、
53、(d)將整數權重進行存儲。
54、第二方面,本發(fā)明的技術方案提供一種圖片標注神經網絡模型構建系統,包括,
55、原始模型構建模塊:構建原始圖片標注神經網絡模型,原始圖片標注神經網絡模型中的激活函數統一使用高斯線性誤差單元;
56、原始模型訓練模塊:對原始圖片標注神經網絡模型進行訓練;
57、脈沖神經網絡轉換模塊:使用脈沖高斯線性誤差單元將訓練后的原始圖片標注神經網絡模型轉換為脈沖神經網絡,該脈沖神經網絡為最終構建的圖片標注神經網絡模型。
58、在一個可選的實施方式中,該系統還包括模型壓縮模塊:對原始圖片標注神經網絡模型進行模型壓縮;
59、模型壓縮模塊包括:
60、模型修剪單元:對模型進行修剪,包括在模型的前向傳播過程中,收集每個注意力頭的注意力權重矩陣,對每個注意力頭的注意力權重矩陣進行平均,得到各個注意力頭的平均注意力權重,丟棄平均注意力權重低的若干注意力;
61、低秩分解單元:對圖像編碼器和掩碼解碼器中的卷積層進行低秩分解,包括對每個目標卷積層的權重矩陣進行奇異值分解,對所計算奇異值進行截斷,保留最大的若干奇異值,使用截斷后的奇異值矩陣重構低秩矩陣,將原始卷積層的權重矩陣替換為重構的低秩矩陣;
62、計算精度壓縮單元:將模型的浮點數權重轉換為整數權重,包括,
63、(a)計算每個浮點數權重的最小值和最大值,確定量化范圍,
64、
65、(b)根據范圍計算縮放因子,將32位浮點數映射到8位整數,對于8位整數, qmax與 qmin分別為128與-127,
66、
67、(c)使用縮放因子將浮點數權重轉換為整數權重,
68、
69、(d)將整數權重進行存儲。
70、本發(fā)明提供的一種圖片標注神經網絡模型構建方法及系統,相對于現有技術,具有以下有益效果:通過將傳統神經網絡中的連續(xù)激活函數替換為脈沖高斯線性誤差單元,模型能夠更有效地模擬神經元在處理圖像信息時的脈沖發(fā)放特性,從而更精確地捕捉圖像中的細節(jié)和動態(tài)變化,提升圖片標注的準確度。脈沖高斯線性誤差單元的使用,使得模型在處理未見過的圖像或復雜場景時,能夠展現出更強的適應性和魯棒性,提高模型的泛化能力。同時,脈沖神經網絡以其事件驅動和稀疏激活的特性,相較于傳統連續(xù)神經網絡,能夠顯著降低計算復雜度和內存占用,進而加速模型運行過程,提高圖片標注效率。