国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      用于整數(shù)深度學(xué)習(xí)原語的動(dòng)態(tài)精度管理的制作方法

      文檔序號(hào):40403293發(fā)布日期:2024-12-20 12:27閱讀:4來源:國(guó)知局
      用于整數(shù)深度學(xué)習(xí)原語的動(dòng)態(tài)精度管理的制作方法

      實(shí)施例通常涉及數(shù)據(jù)處理,并且更特別地涉及經(jīng)由通用圖形處理單元進(jìn)行數(shù)據(jù)處理。


      背景技術(shù):

      1、當(dāng)前的并行圖形數(shù)據(jù)處理包括被開發(fā)來對(duì)圖像數(shù)據(jù)執(zhí)行特定的操作(例如,線性內(nèi)插、曲面細(xì)分、光柵化、紋理映射、深度測(cè)試等)的系統(tǒng)和方法。在傳統(tǒng)上,圖形處理器使用固定功能計(jì)算單元來處理圖形數(shù)據(jù);然而,最近,圖形處理器的部分變得可編程,使這樣的處理器能夠支持用于處理頂點(diǎn)和片段數(shù)據(jù)的各種各樣的操作。

      2、為了進(jìn)一步增加性能,圖形處理器一般實(shí)現(xiàn)處理技術(shù),例如流水線,其試圖貫穿圖形流水線的不同部分并行地處理盡可能多的圖形數(shù)據(jù)。具有單指令多線程(simt)架構(gòu)的并行圖形處理器被設(shè)計(jì)為使得在圖形流水線中的并行處理的量最大化。在simt架構(gòu)中,幾組并行線程試圖盡可能經(jīng)常地一起同步地執(zhí)行程序指令以增加處理效率。可在shane?cook的“cuda?programming”(第3章,37-51頁(2013))和/或nicholas?wilt的cuda?handbook“acomprehensive?guide?to?gpu?programming”(章節(jié)2.6.2到3.1.2)(2013年6月)中找到simt架構(gòu)的軟件和硬件的一般概述。


      技術(shù)實(shí)現(xiàn)思路



      技術(shù)特征:

      1.一種用于執(zhí)行與神經(jīng)網(wǎng)絡(luò)相關(guān)聯(lián)的計(jì)算的圖形處理單元,所述圖形處理單元包括:

      2.如權(quán)利要求1所述的圖形處理單元,所述計(jì)算單元的動(dòng)態(tài)精度定點(diǎn)邏輯包括整數(shù)計(jì)算單元,所述整數(shù)計(jì)算單元包括乘法器、加法器、累加器、移位器、以及寄存器。

      3.如權(quán)利要求2所述的圖形處理單元,其中,所述寄存器用于存儲(chǔ)與所述一組動(dòng)態(tài)定點(diǎn)張量相關(guān)聯(lián)的共享指數(shù)。

      4.如權(quán)利要求1所述的圖形處理單元,所述計(jì)算單元還用于:

      5.如權(quán)利要求4所述的圖形處理單元,其中,調(diào)節(jié)與所述輸出張量相關(guān)聯(lián)的精度包括:針對(duì)所述輸出張量,調(diào)節(jié)右移位計(jì)數(shù)器內(nèi)的右移位值并且調(diào)節(jié)共享指數(shù)。

      6.如權(quán)利要求4所述的圖形處理單元,其中,調(diào)節(jié)與所述輸出張量相關(guān)聯(lián)的精度包括:響應(yīng)于確定所述前導(dǎo)零計(jì)數(shù)高于所述閾值而使右移位計(jì)數(shù)器內(nèi)的右移位值增加并且使共享指數(shù)遞增。

      7.如權(quán)利要求4所述的圖形處理單元,其中,調(diào)節(jié)與所述輸出張量相關(guān)聯(lián)的精度包括:響應(yīng)于確定所述前導(dǎo)零計(jì)數(shù)低于所述閾值而使右移位計(jì)數(shù)器內(nèi)的右移位值減少并且使共享指數(shù)遞減。

      8.如權(quán)利要求4所述的圖形處理單元,所述計(jì)算單元還用于:

      9.一種方法,包括:

      10.如權(quán)利要求9所述的方法,其中,對(duì)所述一組動(dòng)態(tài)定點(diǎn)張量執(zhí)行所述計(jì)算操作包括:

      11.如權(quán)利要求10所述的方法,其中,調(diào)節(jié)與所述輸出張量相關(guān)聯(lián)的精度包括:調(diào)節(jié)針對(duì)所述輸出張量的右移位計(jì)數(shù)器和共享指數(shù)。

      12.如權(quán)利要求10所述的方法,其中,調(diào)節(jié)與所述輸出張量相關(guān)聯(lián)的精度包括:響應(yīng)于確定所述前導(dǎo)零計(jì)數(shù)高于所述閾值而使右移位計(jì)數(shù)器增加并且使共享指數(shù)遞增。

      13.如權(quán)利要求10所述的方法,其中,調(diào)節(jié)與所述輸出張量相關(guān)聯(lián)的精度包括:響應(yīng)于確定所述前導(dǎo)零計(jì)數(shù)低于所述閾值而使右移位計(jì)數(shù)器減少并且使共享指數(shù)遞減。

      14.如權(quán)利要求10所述的方法,還包括:

      15.一種數(shù)據(jù)處理系統(tǒng),包括:

      16.如權(quán)利要求15所述的數(shù)據(jù)處理系統(tǒng),所述計(jì)算單元還用于:

      17.如權(quán)利要求16所述的數(shù)據(jù)處理系統(tǒng),其中,調(diào)節(jié)與所述輸出張量相關(guān)聯(lián)的精度包括:針對(duì)所述輸出張量,調(diào)節(jié)右移位計(jì)數(shù)器內(nèi)的右移位值并且調(diào)節(jié)共享指數(shù)。

      18.如權(quán)利要求16所述的數(shù)據(jù)處理系統(tǒng),其中,調(diào)節(jié)與所述輸出張量相關(guān)聯(lián)的精度包括:響應(yīng)于確定所述前導(dǎo)零計(jì)數(shù)高于所述閾值而使右移位計(jì)數(shù)器內(nèi)的右移位值增加并且使共享指數(shù)遞增。

      19.如權(quán)利要求16所述的數(shù)據(jù)處理系統(tǒng),其中,調(diào)節(jié)與所述輸出張量相關(guān)聯(lián)的精度包括:響應(yīng)于確定所述前導(dǎo)零計(jì)數(shù)低于所述閾值而使右移位計(jì)數(shù)器內(nèi)的右移位值減少并且使共享指數(shù)遞減。

      20.如權(quán)利要求16所述的數(shù)據(jù)處理系統(tǒng),所述計(jì)算單元還用于:


      技術(shù)總結(jié)
      一個(gè)實(shí)施例提供圖形處理單元以執(zhí)行與神經(jīng)網(wǎng)絡(luò)相關(guān)聯(lián)的計(jì)算,圖形處理單元包括:計(jì)算單元,其包括具有動(dòng)態(tài)精度定點(diǎn)邏輯的硬件邏輯單元;解碼單元,其對(duì)指令解碼以用于由計(jì)算單元執(zhí)行,指令使計(jì)算單元對(duì)一組動(dòng)態(tài)定點(diǎn)張量執(zhí)行矩陣算術(shù)運(yùn)算;以及動(dòng)態(tài)精度管理器,其動(dòng)態(tài)地調(diào)節(jié)在矩陣算術(shù)運(yùn)算期間由計(jì)算單元執(zhí)行的計(jì)算操作的精度,動(dòng)態(tài)精度管理器調(diào)節(jié),其調(diào)節(jié)計(jì)算操作的精度以防止算術(shù)溢出。

      技術(shù)研發(fā)人員:N·梅勒姆普迪,D·穆迪格雷,D·達(dá)斯,S·斯瑞哈蘭
      受保護(hù)的技術(shù)使用者:英特爾公司
      技術(shù)研發(fā)日:
      技術(shù)公布日:2024/12/19
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
      1