45]用于FMASc指令的示例性格式可具有以下形式:Rd = Round (Scale [Rx土Rs*Rt,N],rounding_mode)。因此,基于操作數(shù)N,可在上述雙重路徑FMA框架中并入比例值2N。在一個實施例中,N可為8位值,使得比例值在范圍[_128,127]內(nèi)。如先前所提到,負(fù)值N可被稱作將FM運算的結(jié)果Rd按比例縮小且正值N可被稱作將結(jié)果Rd按比例放大??扇缦挛膶嵤├兴撌鰜響?yīng)用舍入模式。
[0046]如先前所論述,在其中結(jié)果Rd溢出或為亞正常的情況下,或如在例如巨大值消除、低于亞正常等極端情況下所描述,F(xiàn)MASc運算的常規(guī)實施方案可在指數(shù)按比例縮放之后導(dǎo)致精度損失。為了避免精度損失,實施例可提前認(rèn)識到FMASc運算的可能造成問題的某些輸入操作數(shù)。因此,實施例可在進入加法器塊220之前,及在操縱加法器塊220的輸出的歸一化塊224及舍入塊226之前,將中間結(jié)果與加數(shù)操作數(shù)預(yù)先對準(zhǔn)。因此,實施例可確保在按比例縮放運算在邏輯上完成之前不會發(fā)生舍入。確保此情形的一種方式是將歸一化塊224及舍入塊226加寬以在理論上保持FM運算的結(jié)果在執(zhí)行按比例縮放之前具有無限精度。然而,為了在邏輯上實現(xiàn)相同效果,可提供前導(dǎo)零計數(shù)器(LZC)塊230。下文描述塊230到236與上文所描述的雙重路徑FMA框架的合作。
[0047]首先將提供用于雙重路徑FM的基本框架且接著將涉及按比例縮放運算的塊230到234的功能性集成到所述描述中。這些塊230到234可經(jīng)配置以基于Ex及Em的相對值將比例因子作為用于Rx的預(yù)先對準(zhǔn)移位量并入,如以下情況中將論述。以此方式,在示例性實施例中,可避免基于將FM分階段后接續(xù)按比例縮放的實施方案。
[0048]如先前所提到,在示例性實施例中,Ex與Em之間的差的絕對值(| Ex-Em |)將控制雙重路徑FMA的運算。在圖3到6中說明基于(IEx-EmI)的特定值的各種情況。一般來說,可將Rx的尾數(shù)(Mx)分裂成高部分(在下文中為“HMx”)及低部分(在下文中為“LMx”)。可在兩個部分中計算FM結(jié)果Rd的尾數(shù)(在下文中為“Md” ),其中計算低部分(在下文中為“LMd”),且來自LMd的進位(如在進位傳播加法中)可分別遞增Rd的尾數(shù)的高部分(在下文中為“HMd”)。(應(yīng)理解,具有Rx的減法的FMA( S卩,Rm-Rx)為類似的,且可在需要時按最少修改擴展關(guān)于其中將Rx與Rm相加(即,Rm+Rx)的FMA論述的一般原理。舉例來說,在減法的情況下,代替進位,可使用借位來遞減HMx而不是遞增)。在示例性實施例中,雙重路徑FMA的“相加部分”可指LMd的計算,且“增量部分”可指HMd的計算。
[0049]現(xiàn)在參看圖3,首先解釋未集成按比例縮放組成部分的雙重邏輯FMA。圖3說明表格,表I對應(yīng)于示例性雙重路徑FMA實施方案的第一種情況,其中Ex與Em之間的差在范圍3內(nèi)。應(yīng)理解,在示例性實施例中使用常數(shù)“3”,但其不應(yīng)被解釋為限制。在一些實施例中,可使用大于2的任何合適值。將針對表I中的這些情況描述增量部分及相加部分的計算。
[0050]參看第一行302,說明其中Ex-Em > 3且FMA涉及Rx的加法或減法的情況。在此情況下,計算相加部分(LMd)且可在必要時使用來自相加部分的進位來遞增增量部分(HMx)。在一個實施方案中,計算HMx及HMx+1兩者且使用進位來選擇HMd的正確值。表格中還展示對于輸出的對準(zhǔn)/歸一化來說可能為所需的移位量。在此情況下,將LMd右移位達在邏輯上被定義為Rx及Rm的位置之間的距離的量,即,Ex-Em。一旦經(jīng)歸一化,便可將經(jīng)歸一化的LMd(在下文中為“NLMd”)與HMd串接以便形成Md。可在將HMd及LMd串接以形成Md之后執(zhí)行舍入。在行304中,說明其中Ex及Em滿足條件Ex-Em = 3且FMA涉及Rx的加法的情況。此情況類似于上文在行302中所描述的情況,且進位有可能來自LMd,所述情形可導(dǎo)致將增量應(yīng)用到HMd。
[0051]參看306,說明其中Ex及Em滿足條件Ex-Em < 3且FMA涉及Rx的加法或減法的情形。在此情況下,增量部分HMx實際上具有值“O”且因此從相加部分LMx產(chǎn)生所有Md。存在(Mm土LMx)可能經(jīng)歷大值消除的可能性。因此,可將圖2的塊222中的前導(dǎo)零預(yù)測單元(LZA)與塊220中的加法器(將Mm及LMx相加)并行地提供以便計算用于LMd的移位量??山又褂脧膲K222中的LZA導(dǎo)出的移位量將(Mm土LMx)的所得值歸一化(即,左移位)。此后可對所得Md執(zhí)行舍入。
[0052]在子情況306a中,說明需要特殊考慮的情形。在此情況下,滿足條件Ex-Em < 3,且另外,max (Ex,Em)彡47且FMA涉及Rx的減法。當(dāng)滿足這些條件時,很可能最終結(jié)果Md可能為亞正常的。如果最終結(jié)果Md為亞正常的,那么可標(biāo)記此條件且可對用于LMd的左移位量設(shè)置上限,其中將上限值選擇為max (Ex,Em)-1的值。
[0053]參看子情況306b,說明需要特殊考慮的又一種情形。在此情形中,Md為未對準(zhǔn)的,其將指示Rs及Rt中的一者且僅一者為亞正常值。在此情境中,可能需要LMd的移位量的值大于尾數(shù)的位數(shù)(對于單精度為24)。因此,歸一化過程可招致高達2*24-1或47位的左移位。大于尾數(shù)的位數(shù)的左移位量被稱作巨大值消除,這是因為保持相關(guān)數(shù)據(jù)的所有位將被移出。當(dāng)Ex-Em的值大于或等于-24時,可發(fā)生巨大值消除。如果Ex-Em =-24且將發(fā)生巨大值消除,那么可能需要額外的保護位以用于在歸一化期間將LMx的位值存儲在最低有效位(LSB)的右側(cè)。另一方面,如果Ex-Em<-24,那么無法發(fā)生巨大值消除,這是因為對于未對準(zhǔn)的結(jié)果,保證了 Mm的第一非零位位于Mm的位23或更高位(即,較高有效)處。將認(rèn)識到,此情形類似于涉及將移位量的上限設(shè)置為值max (Ex,Em)-1的情形,如關(guān)于行306a所描述。
[0054]在行308中,說明其中Ex及Em滿足條件Ex-Em = 3且FMA涉及Rx的減法的情況。此情形類似于行306,但將不會出現(xiàn)進位輸出,且可從LMd獲得結(jié)果。
[0055]現(xiàn)在轉(zhuǎn)向圖4,說明具有比例因子2N的雙重路徑FMA(FMASc)的示例性實施方案,其中滿足條件Ex-Em > 26。更確切地說,參看圖4的表2,說明FMASc運算的三種情形。情況402涉及對應(yīng)于N為正值(即,F(xiàn)MASc涉及按比例放大)且Rx為正常的情形。此情況實質(zhì)上對應(yīng)于無按比例縮放的FMA運算,如圖3中所描述。
[0056]根據(jù)情況404,其中N為正的,但Rx為亞正常的,可能需要將增量部分左移位達等于Rx的前導(dǎo)零及N的值的最小值的量(即,左移位=min (LZC(Rx),N)),且可能需要將相加部分右移位達l_(Em+N)。返回參看圖2,可通過塊230來提供LZC(Rx)的值。對應(yīng)地,可能需要將“相加部分”右移位達等于EX-Em-min(LZC(RX,N))的量??稍趬K214中執(zhí)行用于相加部分的移位/對準(zhǔn)且可在塊234中執(zhí)行用于增量部分的移位/對準(zhǔn)。
[0057]在上述情況404中,可歸因于在增量部分的左移位期間的Ex與Em之間的差而在Rx與Rm之間產(chǎn)生“間隙”。此間隙代表性地展示于針對此情況的表2的列“間隙”中。為了考慮此間隙,可將對應(yīng)于相關(guān)FMA運算的值(對于Rx的加法為“0”,且對于Rx的減法為“I”)插入到增量部分的LSB中。相加部分可保持對最終舍入有貢獻??稍诤喜?串接增量部分之前,將相加部分右移位達值Ex-Em-min (LZC (Rx, N))。
[0058]在情況406中,其中N為負(fù)的(即,按比例縮小),將Mx的增量部分右移位達等于(l-(Ex+N))的量。為了保留可能從增量部分損失的位,提供額外存儲裝置以用于保留例如保護位及舍入位等位。類似地,可提供用于相加部分的粘滯位。
[0059]現(xiàn)在轉(zhuǎn)向圖5,在表3中說明示例性FMASc實施方案的實施方案中的特定情況,其中滿足條件Ex-Em = 26?4或3。在情況502中,其中Rx為正常的且N為正的(S卩,按比例放大),運算實質(zhì)上對應(yīng)于FM運算的運算,類似于圖4的情況402。
[0060]另一方面,當(dāng)Rx為亞正常的時,說明兩種子情況504a及504b。關(guān)于子情況504a,當(dāng) Ex-Em-min(LZC(Rx,N)) > 3 時,或當(dāng) Ex-Em-min(LZC(Rx,N)) = 3 且 FMASc 運算涉及Rx的加法時,將增量左移位達min(LZC(Rx),N)的值??蓪⑾嗉硬糠钟乙莆贿_量l-Em-min(LZC(Rx),N)。然而,在子情況504b中,其中滿足以下條件中的一者:Ex-Em-min (LZC (Rx),N) < 3,或 Ex-Em-min (LZC (Rx),N) = 3 且 FMASc 運算涉及 Rx 的減法,增量部分為零,且因此,所得Mx全部來自相加部分。Rm的十進制(或二進制)點變成參考點且因此將所得相加部分左移位達LZC(Rx)且通過值(Em+N)對左移位設(shè)置上限。應(yīng)理解,在子情況504b中,Ex = 1,這是因為Rx為亞正常的。因此,不需要依賴于用于計算LZC(Rx)的塊230來計算前導(dǎo)零。可改為使用塊222中的LZA。另外,N的值將小于LZC(Rx)。對應(yīng)地,將滿足條件Em+N > -2ο Em+N可為負(fù)的,這是因為相加部分可處置較高有效位置中的三個額外位(與Rm的二進制點相比較)。
[0061]現(xiàn)在參看情況506,其中N為負(fù)的(即,按比例縮小)且FMA運算涉及從Rm進行的加數(shù)Rx的減法,可將增量部分右移位達量1-(Ex+N),且還可將相加部分右移位,但量為l-(Em+N)。將需要存儲保護位及粘滯位以用于此右移位。此情形說明拐點情況,其中舍入之前的結(jié)果Mx為零,但保護位從“I”切換到“0”,這是因為來自相加部分的借位信號(對應(yīng)于Rx的減法)及增量部分的所有經(jīng)移出位為零。
[0062]現(xiàn)在參看圖6,說明