實(shí)施例通常涉及數(shù)據(jù)處理,并且更特別地涉及經(jīng)由通用圖形處理單元進(jìn)行數(shù)據(jù)處理。
背景技術(shù):
1、當(dāng)前的并行圖形數(shù)據(jù)處理包括被開發(fā)來對(duì)圖像數(shù)據(jù)執(zhí)行特定的操作(例如,線性內(nèi)插、曲面細(xì)分、光柵化、紋理映射、深度測(cè)試等)的系統(tǒng)和方法。在傳統(tǒng)上,圖形處理器使用固定功能計(jì)算單元來處理圖形數(shù)據(jù);然而,最近,圖形處理器的部分變得可編程,使這樣的處理器能夠支持用于處理頂點(diǎn)和片段數(shù)據(jù)的各種各樣的操作。
2、為了進(jìn)一步增加性能,圖形處理器一般實(shí)現(xiàn)處理技術(shù),例如流水線,其試圖貫穿圖形流水線的不同部分并行地處理盡可能多的圖形數(shù)據(jù)。具有單指令多線程(simt)架構(gòu)的并行圖形處理器被設(shè)計(jì)為使得在圖形流水線中的并行處理的量最大化。在simt架構(gòu)中,幾組并行線程試圖盡可能經(jīng)常地一起同步地執(zhí)行程序指令以增加處理效率。可在shane?cook的“cuda?programming”(第3章,37-51頁(2013))和/或nicholas?wilt的cuda?handbook“acomprehensive?guide?to?gpu?programming”(章節(jié)2.6.2到3.1.2)(2013年6月)中找到simt架構(gòu)的軟件和硬件的一般概述。
技術(shù)實(shí)現(xiàn)思路
1.一種用于執(zhí)行與神經(jīng)網(wǎng)絡(luò)相關(guān)聯(lián)的計(jì)算的圖形處理單元,所述圖形處理單元包括:
2.如權(quán)利要求1所述的圖形處理單元,所述計(jì)算單元的動(dòng)態(tài)精度定點(diǎn)邏輯包括整數(shù)計(jì)算單元,所述整數(shù)計(jì)算單元包括乘法器、加法器、累加器、移位器、以及寄存器。
3.如權(quán)利要求2所述的圖形處理單元,其中,所述寄存器用于存儲(chǔ)與所述一組動(dòng)態(tài)定點(diǎn)張量相關(guān)聯(lián)的共享指數(shù)。
4.如權(quán)利要求1所述的圖形處理單元,所述計(jì)算單元還用于:
5.如權(quán)利要求4所述的圖形處理單元,其中,調(diào)節(jié)與所述輸出張量相關(guān)聯(lián)的精度包括:針對(duì)所述輸出張量,調(diào)節(jié)右移位計(jì)數(shù)器內(nèi)的右移位值并且調(diào)節(jié)共享指數(shù)。
6.如權(quán)利要求4所述的圖形處理單元,其中,調(diào)節(jié)與所述輸出張量相關(guān)聯(lián)的精度包括:響應(yīng)于確定所述前導(dǎo)零計(jì)數(shù)高于所述閾值而使右移位計(jì)數(shù)器內(nèi)的右移位值增加并且使共享指數(shù)遞增。
7.如權(quán)利要求4所述的圖形處理單元,其中,調(diào)節(jié)與所述輸出張量相關(guān)聯(lián)的精度包括:響應(yīng)于確定所述前導(dǎo)零計(jì)數(shù)低于所述閾值而使右移位計(jì)數(shù)器內(nèi)的右移位值減少并且使共享指數(shù)遞減。
8.如權(quán)利要求4所述的圖形處理單元,所述計(jì)算單元還用于:
9.一種方法,包括:
10.如權(quán)利要求9所述的方法,其中,對(duì)所述一組動(dòng)態(tài)定點(diǎn)張量執(zhí)行所述計(jì)算操作包括:
11.如權(quán)利要求10所述的方法,其中,調(diào)節(jié)與所述輸出張量相關(guān)聯(lián)的精度包括:調(diào)節(jié)針對(duì)所述輸出張量的右移位計(jì)數(shù)器和共享指數(shù)。
12.如權(quán)利要求10所述的方法,其中,調(diào)節(jié)與所述輸出張量相關(guān)聯(lián)的精度包括:響應(yīng)于確定所述前導(dǎo)零計(jì)數(shù)高于所述閾值而使右移位計(jì)數(shù)器增加并且使共享指數(shù)遞增。
13.如權(quán)利要求10所述的方法,其中,調(diào)節(jié)與所述輸出張量相關(guān)聯(lián)的精度包括:響應(yīng)于確定所述前導(dǎo)零計(jì)數(shù)低于所述閾值而使右移位計(jì)數(shù)器減少并且使共享指數(shù)遞減。
14.如權(quán)利要求10所述的方法,還包括:
15.一種數(shù)據(jù)處理系統(tǒng),包括:
16.如權(quán)利要求15所述的數(shù)據(jù)處理系統(tǒng),所述計(jì)算單元還用于:
17.如權(quán)利要求16所述的數(shù)據(jù)處理系統(tǒng),其中,調(diào)節(jié)與所述輸出張量相關(guān)聯(lián)的精度包括:針對(duì)所述輸出張量,調(diào)節(jié)右移位計(jì)數(shù)器內(nèi)的右移位值并且調(diào)節(jié)共享指數(shù)。
18.如權(quán)利要求16所述的數(shù)據(jù)處理系統(tǒng),其中,調(diào)節(jié)與所述輸出張量相關(guān)聯(lián)的精度包括:響應(yīng)于確定所述前導(dǎo)零計(jì)數(shù)高于所述閾值而使右移位計(jì)數(shù)器內(nèi)的右移位值增加并且使共享指數(shù)遞增。
19.如權(quán)利要求16所述的數(shù)據(jù)處理系統(tǒng),其中,調(diào)節(jié)與所述輸出張量相關(guān)聯(lián)的精度包括:響應(yīng)于確定所述前導(dǎo)零計(jì)數(shù)低于所述閾值而使右移位計(jì)數(shù)器內(nèi)的右移位值減少并且使共享指數(shù)遞減。
20.如權(quán)利要求16所述的數(shù)據(jù)處理系統(tǒng),所述計(jì)算單元還用于: