用于具有指數(shù)按比例縮放的浮點融合乘法加法的微架構(gòu)的制作方法_3

文檔序號：8207696閱讀：來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>計算;推算;計數(shù)設(shè)備的制造及其應(yīng)用技術(shù)>用于具有指數(shù)按比例縮放的浮點融合乘法加法的微架構(gòu)的制作方法

45]用于FMASc指令的示例性格式可具有以下形式:Rd = Round (Scale [Rx土Rs*Rt，N]，rounding_mode)。因此，基于操作數(shù)N，可在上述雙重路徑FMA框架中并入比例值2N。在一個實施例中，N可為8位值，使得比例值在范圍[_128，127]內(nèi)。如先前所提到，負(fù)值N可被稱作將FM運算的結(jié)果Rd按比例縮小且正值N可被稱作將結(jié)果Rd按比例放大?？扇缦挛膶嵤├兴撌鰜響?yīng)用舍入模式。
[0046]如先前所論述，在其中結(jié)果Rd溢出或為亞正常的情況下，或如在例如巨大值消除、低于亞正常等極端情況下所描述，F(xiàn)MASc運算的常規(guī)實施方案可在指數(shù)按比例縮放之后導(dǎo)致精度損失。為了避免精度損失，實施例可提前認(rèn)識到FMASc運算的可能造成問題的某些輸入操作數(shù)。因此，實施例可在進入加法器塊220之前，及在操縱加法器塊220的輸出的歸一化塊224及舍入塊226之前，將中間結(jié)果與加數(shù)操作數(shù)預(yù)先對準(zhǔn)。因此，實施例可確保在按比例縮放運算在邏輯上完成之前不會發(fā)生舍入。確保此情形的一種方式是將歸一化塊224及舍入塊226加寬以在理論上保持FM運算的結(jié)果在執(zhí)行按比例縮放之前具有無限精度。然而，為了在邏輯上實現(xiàn)相同效果，可提供前導(dǎo)零計數(shù)器(LZC)塊230。下文描述塊230到236與上文所描述的雙重路徑FMA框架的合作。
[0047]首先將提供用于雙重路徑FM的基本框架且接著將涉及按比例縮放運算的塊230到234的功能性集成到所述描述中。這些塊230到234可經(jīng)配置以基于Ex及Em的相對值將比例因子作為用于Rx的預(yù)先對準(zhǔn)移位量并入，如以下情況中將論述。以此方式，在示例性實施例中，可避免基于將FM分階段后接續(xù)按比例縮放的實施方案。
[0048]如先前所提到，在示例性實施例中，Ex與Em之間的差的絕對值(| Ex-Em |)將控制雙重路徑FMA的運算。在圖3到6中說明基于(IEx-EmI)的特定值的各種情況。一般來說，可將Rx的尾數(shù)(Mx)分裂成高部分(在下文中為“HMx”)及低部分(在下文中為“LMx”)。可在兩個部分中計算FM結(jié)果Rd的尾數(shù)(在下文中為“Md” )，其中計算低部分(在下文中為“LMd”)，且來自LMd的進位(如在進位傳播加法中)可分別遞增Rd的尾數(shù)的高部分(在下文中為“HMd”)。(應(yīng)理解，具有Rx的減法的FMA( S卩，Rm-Rx)為類似的，且可在需要時按最少修改擴展關(guān)于其中將Rx與Rm相加(即，Rm+Rx)的FMA論述的一般原理。舉例來說，在減法的情況下，代替進位，可使用借位來遞減HMx而不是遞增)。在示例性實施例中，雙重路徑FMA的“相加部分”可指LMd的計算，且“增量部分”可指HMd的計算。
[0049]現(xiàn)在參看圖3，首先解釋未集成按比例縮放組成部分的雙重邏輯FMA。圖3說明表格，表I對應(yīng)于示例性雙重路徑FMA實施方案的第一種情況，其中Ex與Em之間的差在范圍3內(nèi)。應(yīng)理解，在示例性實施例中使用常數(shù)“3”，但其不應(yīng)被解釋為限制。在一些實施例中，可使用大于2的任何合適值。將針對表I中的這些情況描述增量部分及相加部分的計算。
[0050]參看第一行302，說明其中Ex-Em > 3且FMA涉及Rx的加法或減法的情況。在此情況下，計算相加部分(LMd)且可在必要時使用來自相加部分的進位來遞增增量部分(HMx)。在一個實施方案中，計算HMx及HMx+1兩者且使用進位來選擇HMd的正確值。表格中還展示對于輸出的對準(zhǔn)/歸一化來說可能為所需的移位量。在此情況下，將LMd右移位達在邏輯上被定義為Rx及Rm的位置之間的距離的量，即，Ex-Em。一旦經(jīng)歸一化，便可將經(jīng)歸一化的LMd(在下文中為“NLMd”)與HMd串接以便形成Md。可在將HMd及LMd串接以形成Md之后執(zhí)行舍入。在行304中，說明其中Ex及Em滿足條件Ex-Em = 3且FMA涉及Rx的加法的情況。此情況類似于上文在行302中所描述的情況，且進位有可能來自LMd，所述情形可導(dǎo)致將增量應(yīng)用到HMd。
[0051]參看306，說明其中Ex及Em滿足條件Ex-Em < 3且FMA涉及Rx的加法或減法的情形。在此情況下，增量部分HMx實際上具有值“O”且因此從相加部分LMx產(chǎn)生所有Md。存在(Mm土LMx)可能經(jīng)歷大值消除的可能性。因此，可將圖2的塊222中的前導(dǎo)零預(yù)測單元(LZA)與塊220中的加法器(將Mm及LMx相加)并行地提供以便計算用于LMd的移位量?？山又褂脧膲K222中的LZA導(dǎo)出的移位量將(Mm土LMx)的所得值歸一化(即，左移位)。此后可對所得Md執(zhí)行舍入。
[0052]在子情況306a中，說明需要特殊考慮的情形。在此情況下，滿足條件Ex-Em < 3，且另外，max (Ex，Em)彡47且FMA涉及Rx的減法。當(dāng)滿足這些條件時，很可能最終結(jié)果Md可能為亞正常的。如果最終結(jié)果Md為亞正常的，那么可標(biāo)記此條件且可對用于LMd的左移位量設(shè)置上限，其中將上限值選擇為max (Ex，Em)-1的值。
[0053]參看子情況306b，說明需要特殊考慮的又一種情形。在此情形中，Md為未對準(zhǔn)的，其將指示Rs及Rt中的一者且僅一者為亞正常值。在此情境中，可能需要LMd的移位量的值大于尾數(shù)的位數(shù)(對于單精度為24)。因此，歸一化過程可招致高達2*24-1或47位的左移位。大于尾數(shù)的位數(shù)的左移位量被稱作巨大值消除，這是因為保持相關(guān)數(shù)據(jù)的所有位將被移出。當(dāng)Ex-Em的值大于或等于-24時，可發(fā)生巨大值消除。如果Ex-Em =-24且將發(fā)生巨大值消除，那么可能需要額外的保護位以用于在歸一化期間將LMx的位值存儲在最低有效位(LSB)的右側(cè)。另一方面，如果Ex-Em<-24，那么無法發(fā)生巨大值消除，這是因為對于未對準(zhǔn)的結(jié)果，保證了 Mm的第一非零位位于Mm的位23或更高位(即，較高有效)處。將認(rèn)識到，此情形類似于涉及將移位量的上限設(shè)置為值max (Ex，Em)-1的情形，如關(guān)于行306a所描述。
[0054]在行308中，說明其中Ex及Em滿足條件Ex-Em = 3且FMA涉及Rx的減法的情況。此情形類似于行306，但將不會出現(xiàn)進位輸出，且可從LMd獲得結(jié)果。
[0055]現(xiàn)在轉(zhuǎn)向圖4，說明具有比例因子2N的雙重路徑FMA(FMASc)的示例性實施方案，其中滿足條件Ex-Em > 26。更確切地說，參看圖4的表2，說明FMASc運算的三種情形。情況402涉及對應(yīng)于N為正值(即，F(xiàn)MASc涉及按比例放大)且Rx為正常的情形。此情況實質(zhì)上對應(yīng)于無按比例縮放的FMA運算，如圖3中所描述。
[0056]根據(jù)情況404，其中N為正的，但Rx為亞正常的，可能需要將增量部分左移位達等于Rx的前導(dǎo)零及N的值的最小值的量(即，左移位=min (LZC(Rx)，N))，且可能需要將相加部分右移位達l_(Em+N)。返回參看圖2，可通過塊230來提供LZC(Rx)的值。對應(yīng)地，可能需要將“相加部分”右移位達等于EX-Em-min(LZC(RX，N))的量?？稍趬K214中執(zhí)行用于相加部分的移位/對準(zhǔn)且可在塊234中執(zhí)行用于增量部分的移位/對準(zhǔn)。
[0057]在上述情況404中，可歸因于在增量部分的左移位期間的Ex與Em之間的差而在Rx與Rm之間產(chǎn)生“間隙”。此間隙代表性地展示于針對此情況的表2的列“間隙”中。為了考慮此間隙，可將對應(yīng)于相關(guān)FMA運算的值(對于Rx的加法為“0”，且對于Rx的減法為“I”)插入到增量部分的LSB中。相加部分可保持對最終舍入有貢獻?？稍诤喜?串接增量部分之前，將相加部分右移位達值Ex-Em-min (LZC (Rx, N))。
[0058]在情況406中，其中N為負(fù)的(即，按比例縮小)，將Mx的增量部分右移位達等于(l-(Ex+N))的量。為了保留可能從增量部分損失的位，提供額外存儲裝置以用于保留例如保護位及舍入位等位。類似地，可提供用于相加部分的粘滯位。
[0059]現(xiàn)在轉(zhuǎn)向圖5，在表3中說明示例性FMASc實施方案的實施方案中的特定情況，其中滿足條件Ex-Em = 26?4或3。在情況502中，其中Rx為正常的且N為正的(S卩，按比例放大)，運算實質(zhì)上對應(yīng)于FM運算的運算，類似于圖4的情況402。
[0060]另一方面，當(dāng)Rx為亞正常的時，說明兩種子情況504a及504b。關(guān)于子情況504a，當(dāng) Ex-Em-min(LZC(Rx，N)) > 3 時，或當(dāng) Ex-Em-min(LZC(Rx，N)) = 3 且 FMASc 運算涉及Rx的加法時，將增量左移位達min(LZC(Rx)，N)的值?？蓪⑾嗉硬糠钟乙莆贿_量l-Em-min(LZC(Rx)，N)。然而，在子情況504b中，其中滿足以下條件中的一者:Ex-Em-min (LZC (Rx)，N) < 3，或 Ex-Em-min (LZC (Rx)，N) = 3 且 FMASc 運算涉及 Rx 的減法，增量部分為零，且因此，所得Mx全部來自相加部分。Rm的十進制(或二進制)點變成參考點且因此將所得相加部分左移位達LZC(Rx)且通過值(Em+N)對左移位設(shè)置上限。應(yīng)理解，在子情況504b中，Ex = 1，這是因為Rx為亞正常的。因此，不需要依賴于用于計算LZC(Rx)的塊230來計算前導(dǎo)零。可改為使用塊222中的LZA。另外，N的值將小于LZC(Rx)。對應(yīng)地，將滿足條件Em+N > -2ο Em+N可為負(fù)的，這是因為相加部分可處置較高有效位置中的三個額外位(與Rm的二進制點相比較)。
[0061]現(xiàn)在參看情況506，其中N為負(fù)的(即，按比例縮小)且FMA運算涉及從Rm進行的加數(shù)Rx的減法，可將增量部分右移位達量1-(Ex+N)，且還可將相加部分右移位，但量為l-(Em+N)。將需要存儲保護位及粘滯位以用于此右移位。此情形說明拐點情況，其中舍入之前的結(jié)果Mx為零，但保護位從“I”切換到“0”，這是因為來自相加部分的借位信號(對應(yīng)于Rx的減法)及增量部分的所有經(jīng)移出位為零。
[0062]現(xiàn)在參看圖6，說明

完整全部詳細(xì)技術(shù)資料下載

當(dāng)前第3頁1 2 3 4 5

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

浮點數(shù)加法相關(guān)技術(shù)

浮點數(shù)加減法相關(guān)技術(shù)

浮點數(shù)的加減法運算相關(guān)技術(shù)

浮點加法器相關(guān)技術(shù)

国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

用于具有指數(shù)按比例縮放的浮點融合乘法加法的微架構(gòu)的制作方法_3