国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      一種基于VisionTransformer神經網絡的硬件友好的剪枝方法

      文檔序號:40280475發(fā)布日期:2024-12-11 13:19閱讀:來源:國知局

      技術特征:

      1.一種基于vision?transformer神經網絡的硬件友好的剪枝方法,其特征在于,包括如下步驟:

      2.根據(jù)權利要求1所述一種基于vision?transformer神經網絡的硬件友好的剪枝方法,其特征在于,所述步驟1根據(jù)預訓練權重計算神經網絡各層的平均海森跡,每層的平均海森跡包括:多頭自注意力模塊的平均海森跡和前饋模塊的平均海森跡,所述多頭自注意力模塊的平均海森跡包括輸入映射的平均海森跡和輸出映射的平均海森跡,所述前饋模塊的平均海森跡包括兩個全連接層的平均海森跡。

      3.根據(jù)權利要求2所述一種基于vision?transformer神經網絡的硬件友好的剪枝方法,其特征在于,所述步驟2根據(jù)各層平均海森跡的分布進行逐層n:m權重剪枝的具體方法為:根據(jù)各層多頭自注意力模塊平均海森跡的分布情況,確定各層多頭自注意力模塊平均海森跡的最優(yōu)數(shù)值區(qū)間劃分方式,依據(jù)最優(yōu)數(shù)值區(qū)間劃分方式為各層多頭自注意力模塊平均海森跡的各數(shù)值區(qū)間配置n:m的取值;采用同樣的方式為各層前饋模塊平均海森跡的各數(shù)值區(qū)間配置n:m的取值;按照配置的n:m對各層多頭自注意力模塊的權重矩陣以及各層前饋模塊的權重矩陣按列剪枝。

      4.根據(jù)權利要求3所述一種基于vision?transformer神經網絡的硬件友好的剪枝方法,其特征在于,所述步驟4對步驟3重訓練后的網絡進行非參數(shù)化的多階段自適應令牌剪枝的具體方法為:在網絡正向推理過程中選取令牌剪枝層,根據(jù)所述令牌剪枝層中多頭自注意力模塊所有頭的softmax函數(shù)輸出矩陣計算所述令牌剪枝層的每個圖像令牌分數(shù)以及剪枝閾值,對所述令牌剪枝層的各個圖像令牌分數(shù)進行降序排序,對降序排序后的各個圖像令牌分數(shù)按序進行部分和累加操作,在累加獲取的部分和大于所述令牌剪枝層的剪枝閾值時停止累加操作,并根據(jù)未參與部分和累加操作的圖像令牌生成剪枝決定指令,輸入至所述令牌剪枝層前饋模塊前的層歸一化模塊的圖像令牌執(zhí)行剪枝決定指令。

      5.根據(jù)權利要求3所述一種基于vision?transformer神經網絡的硬件友好的剪枝方法,其特征在于,按照配置的n:m對各層多頭自注意力模塊的權重矩陣以及各層前饋模塊的權重矩陣按列剪枝,具體為:按照m的數(shù)值對各列權重進行分組,每組權重中最大的n個權重保持原值且其它權重賦值為零。

      6.根據(jù)權利要求3所述一種基于vision?transformer神經網絡的硬件友好的剪枝方法,其特征在于,根據(jù)網絡精度和權重剪枝收益確定各層多頭自注意力模塊平均海森跡的最優(yōu)數(shù)值區(qū)間劃分方式以及各層前饋模塊平均海森跡的最優(yōu)數(shù)值區(qū)間劃分方式。

      7.根據(jù)權利要求4所述一種基于vision?transformer神經網絡的硬件友好的剪枝方法,其特征在于,所述根據(jù)所述令牌剪枝層中多頭自注意力模塊所有頭的softmax函數(shù)輸出矩陣計算所述令牌剪枝層的每個圖像令牌分數(shù)以及剪枝閾值,具體為:對所述令牌剪枝層中多頭自注意力模塊所有頭的softmax函數(shù)輸出矩陣的第一行數(shù)據(jù)求和,獲取一行新的數(shù)據(jù),所述一行新的數(shù)據(jù)中除去第一個元素剩下的元素對應所述令牌剪枝層的各個圖像令牌分數(shù),對所述令牌剪枝層的各個圖像令牌分數(shù)求和后乘以比例因子,獲取所述令牌剪枝層的剪枝閾值。

      8.根據(jù)權利要求7所述一種基于vision?transformer神經網絡的硬件友好的剪枝方法,其特征在于,所述令牌剪枝層的剪枝閾值為其中,threshold為令牌剪枝層的剪枝閾值,α為剪枝的比例因子,0<α<1,token?scorei為第i個圖像令牌的分數(shù),n為令牌剪枝層中輸入的圖像令牌的數(shù)量。

      9.根據(jù)權利要求1至8中任意一項所述一種基于vision?transformer神經網絡的硬件友好的剪枝方法,其特征在于,所述步驟5獲取的vision?transformer神經網絡包括至少一層網絡結構,各層網絡結構均包括串行執(zhí)行計算任務的多頭自注意力模塊和前饋模塊,令牌剪枝層還包括與該層多頭自注意力模塊并行執(zhí)行計算任務的自適應令牌剪枝模塊,所述自適應令牌剪枝模塊接收令牌剪枝層中多頭自注意力模塊所有頭的softmax函數(shù)輸出矩陣,自適應令牌剪枝模塊輸出剪枝決定指令至令牌剪枝層中前饋模塊前的層歸一化模塊的輸入端。

      10.根據(jù)權利要求9所述一種基于vision?transformer神經網絡的硬件友好的剪枝方法,其特征在于,所述自適應令牌剪枝模塊包括:


      技術總結
      本發(fā)明公開一種基于Vision?Transformer神經網絡的硬件友好的剪枝方法,屬于計算、推算或計數(shù)的技術領域。該剪枝方法是一種將逐層N:M權重剪枝和非參數(shù)化的多階段自適應令牌剪枝相結合的方案,包括:根據(jù)神經網絡和預訓練權重計算網絡各層的平均海森跡,根據(jù)平均海森跡的分布實現(xiàn)逐層N:M權重剪枝,進行權重剪枝的重訓練并更新權重,然后部署自適應令牌剪枝模塊,進行令牌剪枝的重訓練并更新權重,最后將采用了該剪枝方法的神經網絡部署到硬件平臺上。本發(fā)明利用硬件友好的權重和令牌結合剪枝的方法有效降低了ViT網絡的參數(shù)量和計算量,降低了ViT的推理延遲和硬件開銷并保持了高精度,為ViT網絡在資源受限的邊緣端的部署提供了優(yōu)化方法。

      技術研發(fā)人員:劉波,閆鑫明,楊光,張揚,蔡浩,楊軍
      受保護的技術使用者:東南大學
      技術研發(fā)日:
      技術公布日:2024/12/10
      當前第2頁1 2 
      網友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會獲得點贊!
      1