專利名稱:使用單指令多數(shù)據(jù)(simd)運算來計算超越函數(shù)的制作方法
背景技術(shù):
本發(fā)明涉及超越函數(shù)的計算。在許多領(lǐng)域中非常需要諸如指數(shù)、對數(shù)和三角函數(shù)及它們的反函數(shù)之類的超越函數(shù)的快速而準確的求值。為了更快的求值,軟件實現(xiàn)在計算中通常使用查找表來逼近一個或多個中間值。
例如,實現(xiàn)浮點數(shù)學(xué)函數(shù)的標準方法是使用預(yù)先計算的值表并用基于表條目和較小的“被歸約的”自變量的簡單重構(gòu)公式在它們之間進行內(nèi)插。例如,浮點數(shù)x的正弦(sin)(x)可以使用下列重構(gòu)公式用預(yù)先計算的各個“斷點”的sin(A)和余弦(cos)(A)值表來計算sin(x)=sin(A)+sin(A)[cos(r)-1]+cos(A)sin(r) [1]其中r=x-A。通常,斷點均勻間隔一定距離d(例如,對于sin是π/32),因此對于n∈□,A=nd。在斷點間隔距離d的情況下,直接的余項運算能找到滿足|r|≤d/2的被歸約的自變量。如果此邊界相當小,例如在2-5的數(shù)量級,則可通過多項式來逼近sin(r)和cos(r)-1,從而收斂迅速且不需要多項式有許多項,并且與總的結(jié)果的大小相比,該多項式的大小較小。
后一特性意味著與總的結(jié)果相比,多項式中的舍入誤差相對較小,總的結(jié)果是由單個表條目(在上述例子中為sin(A))主導(dǎo)的。因此,計算可以被組織成表條目和相對較小項的最終相加,這使得總誤差接近0.5個理想最小單位(ulp)。
在浮點超越函數(shù)的許多應(yīng)用中,通常同時需要sin(x)和cos(x)。雖然提供能在單獨的計算中有效率地計算這兩者的組合sincos例程是合乎需要的,但上述的表驅(qū)動的技術(shù)引起嚴重的問題。因為當A較小時(例如當斷點為最小的非零值±d且r≈±d/2時),表條目主導(dǎo)的屬性趨向于崩潰,所以將執(zhí)行使用最初幾個表條目的較小的輸入的單獨路徑指令。此單獨路徑通常是純多項式,且常常相當長,因為求值是對遠遠大于d/2的x來求值的。
在兩條路徑之間有分支要選擇是相當不利的,因為難以通過重疊多個調(diào)用來實現(xiàn)軟件流水線處理,并且還可引起嚴重的誤預(yù)測懲罰。更嚴重的是,對于sin和cos的組合的單指令多數(shù)據(jù)(SIMD)實現(xiàn)困難將加劇,因為在兩種情形中對于不同種類的值運用特殊分支。對于sin,它發(fā)生在輸入接近π/2的偶數(shù)倍時,而對于cos,它發(fā)生在輸入接近π/2的奇數(shù)倍時。因此,特別是在SIMD實現(xiàn)中,需要計算超越函數(shù)的無分支方式。
附圖簡要說明
圖1為根據(jù)本發(fā)明的一個實施例的方法的流程圖。
圖2為根據(jù)本發(fā)明的一個實施例的確定sin(x)和cos(x)的方法的流程圖。
圖3為可配合本發(fā)明的實施例使用的計算機系統(tǒng)的框圖。
詳細說明可能需要大約同時為相同的x計算諸如sin(x)和cos(x)之類的浮點超越函數(shù)。在各種實施例中,能以與單個正弦或余弦的計算幾乎相同的效率來一起計算正弦和余弦。
在某些實現(xiàn)中,可以使用SIMD浮點運算。在某些此類實現(xiàn)中,可以使用包括對壓縮數(shù)據(jù)格式的運算并提供提高的SIMD計算性能的SIMD流擴展2(SSE2)指令。這些指令可以是IntelPENTIUM 4(英特爾奔騰4)處理器指令集或其它此類處理器指令集的一部分。
以這種方式,可以使用同一指令流分別在并行操作的一半中計算sin和cos。為了維持此并行性,根據(jù)本發(fā)明的一個實施例的算法可以使用“無分支”技術(shù)來避免要為小自變量提供專用代碼,不然它會在sin和cos指令流之間產(chǎn)生不對稱。結(jié)果,可以減少分支誤預(yù)測。
在本發(fā)明的各種實施例中,可以用三個基本步驟來計算超越函數(shù)歸約、逼近和重構(gòu)。歸約可用于根據(jù)預(yù)定等式來變換輸入自變量x以將其限制于預(yù)定范圍。接著,逼近是通過計算該歸約的被歸約的自變量的逼近多項式來執(zhí)行。最后,重構(gòu)使用該逼近多項式的結(jié)果和多項式余項來得到原始函數(shù)的最終結(jié)果。
現(xiàn)參見圖1,所示的是根據(jù)本發(fā)明的一個實施例的方法的流程圖。如圖1所示,方法10始于歸約給定函數(shù)的輸入自變量x(框20)。在一個實施例中,歸約可以取r=x-A的形式。接著,可以用具有主導(dǎo)項f(A)+σr的多項式來逼近已被歸約的自變量(框30)。在各種實施例中,不論輸入自變量的大小如何,這兩項總是主導(dǎo)最終結(jié)果。最終,可以通過對逼近結(jié)果和多項式余項求和來執(zhí)行重構(gòu)以得到最終結(jié)果(框40)。
本發(fā)明的實施例可適用于在x=0附近斜率大小接近2的冪的數(shù)學(xué)函數(shù)f(x)。此類函數(shù)包括例如在x=0處均具有接近1的斜率的sin(x)和正切(tan)(x),并通過使用cos(x)=sin(x+π/2)而包括cos(x)。
在這些實施例中,可以執(zhí)行歸約來得到用于計算逼近的范圍被歸約的自變量。在一個實施例中,逼近可以表示成 其中,對于某個α,|o|=±2α。盡管α可以變化,但是在某些實施例中它可以在大約-3和1之間,并且在特定的實施例中可以在大約1/8和1之間。在上述公式2中,f(A)和f′(A)可以從查找表中合適的斷點得到。在某些實施例中,α可以在x的范圍上變化,且可以制成類似于f(A)的查找表的形式的表格。
作為一個例子,對于正弦函數(shù),核心逼近可以采用下列形式sin(x)=(sin(A)+σr)+(cos(A)-σ)□r+sin(A)[cos(r)-1]+cos(A)[sin(r)-r][3]其中,σ為舍入到1位精度的cos(A)。sin(A)和cos(A)都可以通過找到存儲在查找表中的合適的斷點來獲得。其中A非常小,σ=±1。在其它實施例中,σ可以等于最接近的2的冪。
此逼近的重構(gòu)具有以下特性即使是對于很小的x,最前面的兩項f(A)+σr(在上述例子中,sin(A)+σr)總是構(gòu)成最終答案的主導(dǎo)部分。在多項式的低端|(f′(A)-σ)·r|遠遠小于|σr|,而在高端,f(A)大到足以主導(dǎo)該重構(gòu)。
因為乘以2的冪是準確的,所以總是可通過簡單的浮點乘法來準確地計算±σr。f(A)+σr的和則可以通過準確求和的技術(shù)分兩部分來計算。因為通常或者f(A)=0,或者|σr|≤|f(A)|,所以可以通過進行下列三個連續(xù)的加/減運算來獲得準確的和Hi=f(A)+σr [4]med=Hi-f(A) [5]Lo=σr-Med[6]這些運算準確地產(chǎn)生Hi+Lo=f(A)+σr,且Hi用作總的結(jié)果的高部分,而Lo可以被加入多項式和其它部分中。雖然上述求和需要幾次浮點運算,但是其等待時間通常大大低于完全多項式的等待時間,因此,對總的等待時間具有最小的影響。
在一個特定實施例中,上述一般方法可以理想地適用于sin和cos的組合實現(xiàn)。在這一實施例中,除了異常小或異常大的輸入的非常罕見的情形以外,除單個常數(shù)以外算法的兩“側(cè)”可以完全相同?,F(xiàn)在參見圖2,圖2示出根據(jù)本發(fā)明的一個實施例的確定sin(x)和cos(x)的方法的流程圖。如圖2所示,方法100始于接收對sin(x)和cos(x)的請求(框110)。例如,在某些實施例中,未編譯的程序可包括執(zhí)行sin(x)和cos(x)的計算的函數(shù)調(diào)用。在編譯期間,編譯器可使函數(shù)調(diào)用被對這里討論的組合sincos運算的函數(shù)調(diào)用所取代,因為該程序很可能會在對sin(x)的函數(shù)調(diào)用附近的代碼中包括對cos(x)的函數(shù)調(diào)用。
仍參見圖2,接著可以執(zhí)行x的歸約,例如,r=x-A(框120)。然后,可以根據(jù)多項式逼近來并行地逼近sin(A)和sin(A+π/2)使得f(A)+σr為該逼近的兩個主導(dǎo)項(框130)。最后,可以通過用逼近結(jié)果和多項式余項的求和來并行地重構(gòu)sin(x)和cos(x)。以這種方式,可以在與獲取sin(x)或cos(x)所需的時間量基本相同的時間量中獲得sin(x)和cos(x)(框140)。另外,這些結(jié)果可以通過利用使用SIMD指令的指令級并行性以無分支的方式取得。
因此,根據(jù)方法100的流程圖,從x至r的初始范圍歸約可以如下執(zhí)行x≈Nπ32+r---(7)]]>因此,|r|≤π64+TM,]]>其中TM為機器的單位舍入,例如,對于單精度是2-24或?qū)τ陔p精度是2-53。在此特定實施例中,輸入可限于在|N|≤932560的情況下的輸入,因為在此以外,范圍歸約可能不夠精確。因此,如果輸入超過該值,可以使用具有更精確的范圍歸約的替換算法。然而,應(yīng)理解在通常的應(yīng)用中預(yù)期這些值不常出現(xiàn)。
另外,在此特定實施例中,在所產(chǎn)生的近似為x4/7!的最小中間結(jié)果在雙精度下可能下溢的情況下的輸入也可能由此對|x|≤2-252引起走向?qū)S么a的分支。可以通過查看輸入的指數(shù)和最高幾位有效位來測試很小及很大自變量的不測事件。因此,對于2-252≤|x|≤90112可以取主路徑,它基本上可涵蓋所有這些輸入。
然而,對于異常輸入,放棄和使用替換算法是唯一需要的分支。根據(jù)此特定實施例的下列算法是無分支的,并且可以按需要計算正弦和余弦。雖然這里討論的算法是就正弦而給出的,但是也可以通過將N加上16(即,x加上 )來得到余弦。
為了避免分支,每次可以最高精度地執(zhí)行范圍歸約r=x-N(P1+P2+P3)[8]其中,P1和P2為32位的數(shù)(所以乘以N是精確的)而P3為53位的數(shù),每個數(shù)都是表示π/32的值的機器數(shù)。這些近似的π一起足以應(yīng)付受限制的范圍內(nèi)的所有情形。在此特定實施例的其它實現(xiàn)中,執(zhí)行下列兩個步驟r=x-N(P1+P2)[9]上式為多項式計算給出足夠好的r,并且甚至簡單的x-NP1做最高項也已足夠。因此,可以隱藏部分歸約的等待時間。
對于根據(jù)此特定實施例的算法,主歸約序列為·y=32πx]]>·N=integer(y)·m1=NP1m2=NP2
·r1=x-m1·r=r1-m2(它可用于大部分計算)·c1=r1-rm3=NP3·c2=c1-m2·c=c2m3可以用“移位器”法來舍入到整數(shù),即,N=(y+s)-s,其中,s=252+251。
接著,使用范圍被歸約的值,可以根據(jù)B=M{π/32}用查表來逼近sin(B),其中M=N mod64(注意,為了將此討論與上述一般實施例相關(guān),B=A)。在此特定實施例中,所存儲的值為σ,它是最接近cos(B)的2的冪;Chl,它是cos(B)-σ的53位的值;以及Shi和Slo,它們分別是sin(B)的(53和24)位的值。
所存儲的這些值可以被組織成4*64雙精度的數(shù)。即,可以在64個斷點處計算每個值(例如,Nπ/64,其中N=1到64)。然而,Slo和σ均可表示成單精度數(shù),所以在某些實施例中,這些值可被存儲為3*64個雙精度的數(shù)。
核心逼近的多項式可以如下組織sin(B+r+c)=[sin(B)+σr]+r(cos(B)-σ)+sin(B)[cos(r+c)-1]+cos(B)[sin(r+c)-r] [10]該式近似為[Shi+σr]+Chlr+Slo+Shi[(cos(r)-1)-rc]+(Chl+σ)[sin(r)-r+c] [11]實際所計算的可以是此多項式逼近。和可以分成四個部分hi+med+pols+corr,其中,hi=Shi+σr[12]med=Chlrpols=Shi(cos(r)-1)+(Chl+σ)(sin(r)-r)[13]corr=Slo+c□((Chl+σ)-Shl□r) [14]
應(yīng)注意,與最終結(jié)果相比,pols和corr非常小,而乘以σ是精確的,因為它是2的冪。因此,假設(shè)對各分量求和是精確的,只有med中有實質(zhì)性誤差,該誤差由Chl中定標的逼近誤差和乘法中的舍入誤差構(gòu)成。然而,Chl·r占最終結(jié)果的比例不大,因為此項中的誤差在最終結(jié)果中從未超過約0.02ulp。
然而,在對各分量求和時應(yīng)避免舍入誤差,因為它們可能會對最終誤差產(chǎn)生實質(zhì)性的影響。通常,σr相對于Shi可能非常大;對于B={π\(zhòng)32}且r≈-π/64,有σr≈B/2。因此,Shi不是結(jié)果的主導(dǎo)部分,并且必須精確地進行Shi+σr求和。
實際上,等待時間臨界部分是多項式計算,因此,在其被計算時,可以執(zhí)行兩次連續(xù)的補償求和,即,Shl+σr的第一次相加,以及其高部分和Chlr的下一次相加。在一些實施例中,后者不是必需的,但可能是適合的,因為它顯著提高準確度而不明顯影響總的等待時間。事實上,在某些實施例中,這種擴展的精度和并行性一起提高了逼近的性能,因為多項式的求值順序變得不重要。當能以任意順序來對多項式求值時,就可以充分地利用并行性,從而,甚至長多項式也可以用最小等待時間來求值。
當A變大時,不再需要如此介意f′(A)-σ應(yīng)很接近2的冪。在這一實施例中,可以使用σ=0。或者,當A很大并可接受σr中的舍入誤差時,可以用標準長度的浮點數(shù)替換σ。
在其它實施例中,如果已知r不具有完整個數(shù)的有效位,則可以使用更多位(例如2位或3位)而不是1位的σ的逼近而不會在乘積σr中引起舍入誤差。如果通過典型的余項運算來計算r,則可能出現(xiàn)這種情形。例如,如果r=x-Nd′被設(shè)置,其中 且d′為設(shè)計成允許精確地乘以N的d的短版本,則隨著N增大,r中的有效位將減少。因此,在更遠離0時,σ中的有效位數(shù)可能增加,這極佳地補償了f′(A)不能再被2的冪很好地逼近的事實。
實施例可以在代碼中實現(xiàn),并可以被存儲在其上已存儲有指令的存儲介質(zhì)上,這些指令能用于將計算機系統(tǒng)編程以執(zhí)行這些指令。該存儲介質(zhì)可包括但不限于任何類型的盤片,包括軟盤、光盤、光盤只讀存儲器(CD-ROM)、可重寫光盤(CD-RW)和磁光盤;半導(dǎo)體器件,例如只讀存儲器(ROM)、隨機存取存儲器(RAM)、可擦除可編程只讀存儲器(EPROM)、閃存、電可擦除可編程只讀存儲器(EEPROM);磁或光卡或任何類型的適合存儲電子指令的介質(zhì)。
示例性實施例可以在用于由用硬件設(shè)備的合適組合配置的合適的計算機系統(tǒng)執(zhí)行的軟件中實現(xiàn)。圖3為可以配合本發(fā)明的實施例使用的計算機系統(tǒng)400的框圖。
現(xiàn)參見圖3,在一個實施例中,計算機系統(tǒng)400包括處理器410,該處理器可包括通用或?qū)S锰幚砥?,例如微處理器、微控制器、可編程門陣列(PGA)等。如這里所使用的,“計算機系統(tǒng)”一詞可指任何類型的基于處理器的系統(tǒng),例如,臺式計算機、服務(wù)器計算機、膝上型計算機等。
在一個實施例中,處理器410可以通過主機總線415與存儲器集線器430耦合,該存儲器集線器可以通過存儲器總線425與系統(tǒng)存儲器420(例如,動態(tài)RAM)耦合。存儲器集線器430還可以通過高級圖形端口(AGP)總線433與視頻控制器435耦合,該視頻控制器可以與顯示器437耦合。AGP總線433可以符合由加利福尼亞的圣克拉拉的英特爾公司于1998年5月4日公布的加速圖形端口接口規(guī)范修訂版2.0。
存儲器集線器430還可以(通過集線器鏈路438)被耦合至與輸入/輸出(I/O)集線器440,而輸入/輸出(I/O)集線器440可與輸入/輸出(I/O)擴展總線442和如由PCI局部總線規(guī)范產(chǎn)品版本1995年6月的修訂版2.1所定義的外圍部件互連(PCI)總線444耦合。I/O擴展總線442可以與控制對一個或多個I/O設(shè)備的訪問的I/O控制器446耦合。如圖3所示,在一個實施例中這些設(shè)備可包括諸如軟盤驅(qū)動器450之類的存儲設(shè)備和諸如鍵盤452和鼠標454之類的輸入設(shè)備。如圖3所示,I/O集線器440還可與例如硬盤驅(qū)動器456和光盤(CD)驅(qū)動器458耦合。應(yīng)理解系統(tǒng)中還可以包括其它存儲介質(zhì)。
PCI總線444還可以與各種部件(例如與網(wǎng)絡(luò)端口(未示出)耦合的網(wǎng)絡(luò)控制器460)耦合。其它設(shè)備可以與I/O擴展總線442和PCI總線444耦合,這些設(shè)備有例如與并行端口、串行端口耦合的輸入/輸出控制電路、非易失性存儲器等。
雖然參照系統(tǒng)400的具體部件進行說明,但預(yù)期所述及所圖示的實施例的許多修改和變更是可能的。特別是,雖然圖3示出諸如個人計算機之類的系統(tǒng)的框圖,但是應(yīng)理解可以在諸如蜂窩電話、個人數(shù)字助理(PDA)等無線設(shè)備中實現(xiàn)本發(fā)明的實施例。
在某些實施例中,上述用于計算超越函數(shù)的無分支軟件方法可以用系統(tǒng)400的處理器410的匯編語言編寫。這種代碼可以是將以特定源代碼編寫的較高級的程序編譯成處理器410的機器代碼的編譯揣程序的一部分。
該編譯器可包括根據(jù)常規(guī)技術(shù)對源代碼進行語法分析并檢測對超越函數(shù)的引用的操作。然后,編譯器可以用合適的實現(xiàn)該超越函數(shù)的無分支方法的匯編語言指令序列來代替此高級函數(shù)調(diào)用的所有實例。特別是在某些實施例中,編譯器可檢測對正弦或余弦運算的調(diào)用,并用上述組合的sincos算法取代該調(diào)用。在其它實施例中,代碼可以是諸如數(shù)學(xué)函數(shù)庫等能用合乎需要的編程語言來調(diào)用的軟件庫的一部分。
雖然就有限數(shù)目的實施例說明了本發(fā)明,但本領(lǐng)域的技術(shù)人員將可理解源自本發(fā)明的許多修改和變更。旨在使所附權(quán)利要求書覆蓋落在本發(fā)明的精神和范圍內(nèi)的所有這些修改和變更。
權(quán)利要求
1.一種方法,包括根據(jù)第一歸約序列將函數(shù)的輸入自變量x歸約到范圍被歸約的值r;逼近具有主導(dǎo)部分f(A)+σr的對應(yīng)的r的函數(shù)的多項式;以及使用所述多項式來得到所述函數(shù)的第一結(jié)果。
2.如權(quán)利要求1所述的方法,其特征在于,所述主導(dǎo)部分包括第一項f(A)和第二項σr,其中A等于x減r,而σ的絕對值為2的冪。
3.如權(quán)利要求1所述的方法,其特征在于,逼近所述多項式包括執(zhí)行多個連續(xù)的加/減運算。
4.如權(quán)利要求1所述的方法,其特征在于,逼近所述多項式包括使用查找表來得到f(A)的斷點。
5.如權(quán)利要求1所述的方法,其特征在于,還包括將所述輸入自變量x限制于預(yù)定窗口內(nèi)的值。
6.如權(quán)利要求1所述的方法,其特征在于,還包括將所述輸入自變量x限制于2-252和90112之間的值。
7.如權(quán)利要求1所述的方法,其特征在于,得到所述函數(shù)的第一結(jié)果包括得到sin(x)。
8.如權(quán)利要求7所述的方法,其特征在于,還包括使用第二輸入y來得到所述函數(shù)的第二結(jié)果,其中y比x大π/2。
9.如權(quán)利要求8所述的方法,其特征在于,得到所述函數(shù)的第二結(jié)果包括得到cos(x)。
10.如權(quán)利要求9所述的方法,其特征在于,還包括使用單指令多數(shù)據(jù)(SIMD)浮點運算來得到sin(x)利cos(x)。
11.如權(quán)利要求9所述的方法,其特征在于,還包括并行地得到所述第一結(jié)果和所述第二結(jié)果。
12.一種包括機器可訪問存儲介質(zhì)的產(chǎn)品,所述機器可訪問存儲介質(zhì)包含在被執(zhí)行的情況下使系統(tǒng)能夠執(zhí)行以下方法的指令根據(jù)第一歸約序列將函數(shù)的輸入自變量x歸約到范圍被歸約的值r;逼近具有主導(dǎo)部分f(A)+σr的對應(yīng)的r的函數(shù)的多項式;以及使用所述多項式來得到所述函數(shù)的第一結(jié)果。
13.如權(quán)利要求12所述的產(chǎn)品,其特征在于,還包括在被執(zhí)行的情況下使所述系統(tǒng)能夠逼近所述多項式的指令,在所述多項式中,所述主導(dǎo)部分包括第一項f(A)和第二項σr,其中A等于x減r,而σ的絕對值為2的冪。
14.如權(quán)利要求12所述的產(chǎn)品,其特征在于,還包括在被執(zhí)行的情況下使所述系統(tǒng)能通過使用查表來得到f(A)的斷點以逼近所述多項式的指令。
15.如權(quán)利要求12所述的產(chǎn)品,其特征在于,還包括在被執(zhí)行的情況下使系統(tǒng)能得到等于cos(x)的所述函數(shù)的第二結(jié)果的指令,其中所述第一結(jié)果等于sin(x)。
16.如權(quán)利要求15所述的產(chǎn)品,其特征在于,還包括在被執(zhí)行的情況下使所述系統(tǒng)能使用單指令多數(shù)據(jù)(SIMD)浮點運算來得到sin(x)和cos(x)的指令。
17.如權(quán)利要求15所述的產(chǎn)品,其特征在于,還包括在被執(zhí)行的情況下使所述系統(tǒng)能并行地得到所述第一結(jié)果和所述第二結(jié)果的指令。
18.一種系統(tǒng),包括處理器;以及與所述處理器耦合的動態(tài)隨機存取存儲器,它包括在被執(zhí)行的情況下使所述系統(tǒng)能根據(jù)第一歸約序列將函數(shù)的輸入自變量x歸約到范圍被歸約的值r,逼近具有主導(dǎo)部分f(A)+σr的對應(yīng)的r的函數(shù)的多項式,并使用所述多項式來得到所述函數(shù)的第一結(jié)果的指令。
19.如權(quán)利要求18所述的系統(tǒng),其特征在于,所述動態(tài)隨機存取存儲器還包括在被執(zhí)行的情況下使所述系統(tǒng)能得到等于cos(x)的所述函數(shù)的第二結(jié)果的指令,其中所述第一結(jié)果等于sin(x)。
20.如權(quán)利要求19所述的系統(tǒng),其特征在于,所述動態(tài)隨機存取存儲器還包括在被執(zhí)行的情況下使所述系統(tǒng)能使用單指令多數(shù)據(jù)(SIMD)浮點運算來得到sin(x)和cos(x)的指令。
21.如權(quán)利要求20所述的系統(tǒng),其特征在于,所述動態(tài)隨機存取存儲器還包括在被執(zhí)行的情況下使所述系統(tǒng)在函數(shù)調(diào)用請求sin(x)或cos(x)中的任意一個時能使用單指令多數(shù)據(jù)(SIMD)浮點運算來得到sin(x)和cos(x)的指令。
22.如權(quán)利要求20所述的系統(tǒng),其特征在于,所述動態(tài)隨機存取存儲器還包括在被執(zhí)行的情況下使所述系統(tǒng)能并行地得到所述第一結(jié)果和所述第二結(jié)果的指令。
全文摘要
在一個實施例中,本發(fā)明包括一種根據(jù)第一歸約序列將函數(shù)的輸入自變量x歸約成范圍被歸約的值r,逼近具有主導(dǎo)部分f(A)+σr的對應(yīng)的r的函數(shù)的多項式,并使用該多項式來得到該函數(shù)的結(jié)果的方法。
文檔編號G06F7/548GK1918542SQ200580004840
公開日2007年2月21日 申請日期2005年3月4日 優(yōu)先權(quán)日2004年3月11日
發(fā)明者J·哈里森, P·P·T·唐 申請人:英特爾公司