專利名稱:基于混合壓縮結(jié)構(gòu)的部分積壓縮樹生成方法
技術(shù)領(lǐng)域:
本發(fā)明涉及的是一種基于混合壓縮結(jié)構(gòu)的部分積壓縮樹生成方法,用于數(shù)字信號(hào)處理器中的高速乘法器或高速乘加單元的設(shè)計(jì),屬于數(shù)字信號(hào)處理技術(shù)領(lǐng)域。
背景技術(shù):
乘法器或乘加單元是各種數(shù)字計(jì)算芯片,尤其是數(shù)字信號(hào)處理芯片(DSP)的關(guān)鍵運(yùn)算單元。Booth編碼的Wallace-tree乘法器或者非Booth編碼的Wallace-tree乘法器是各種廣泛應(yīng)用的乘法器架構(gòu)中最具有代表性的。乘法通??煞譃槿疆a(chǎn)生部分積;將部分積壓縮得到兩個(gè)中間結(jié)果;最后將兩個(gè)中間結(jié)果用加法器相加得到最后結(jié)果。其中部分積壓縮是整個(gè)乘法操作中花費(fèi)時(shí)間最長(zhǎng)的部分。2002年8月6日-8日國(guó)際電子電氣工程師協(xié)會(huì)專用集成電路亞太會(huì)議(ASIC,2002.2002 IEEE Asia-Pacific Conference on,6-8 Aug.2002.)論文集中《一種高性能基于乘法算術(shù)操作的函數(shù)生成器》(A HighPerformance Function Generator for Mulitplier-Based ArithmeticOperations)一文公開了采用基于3∶2壓縮器、4∶2壓縮器等壓縮器的Wallace-tree實(shí)現(xiàn)部分積壓縮樹程序生成方法?;?∶2壓縮器的部分積壓縮樹的壓縮比不夠高,且其部分積壓縮樹不夠規(guī)則4∶2壓縮器本質(zhì)上完成了兩個(gè)3∶2壓縮器串聯(lián)的功能。通過(guò)電路的優(yōu)化,通過(guò)一個(gè)4∶2壓縮器只需3個(gè)異或門的時(shí)延,而不需要兩個(gè)3∶2壓縮器的4個(gè)異或門的時(shí)延。此外用4∶2壓縮器生成的部分積壓縮樹較為規(guī)則。然而,用4∶2壓縮器并不保證使部分積壓縮樹的時(shí)延特性達(dá)到最佳;而基于其他壓縮器的部分積壓縮樹由于其電路的復(fù)雜,其時(shí)延特性不如基于3∶2壓縮器的部分積壓縮樹或者基于4∶2壓縮器的部分積壓縮樹。
發(fā)明內(nèi)容
本發(fā)明的目的在于克服現(xiàn)有技術(shù)的不足,提供一種基于混合壓縮結(jié)構(gòu)的部分積壓縮樹生成方法,基于3∶2壓縮器和4∶2壓縮器混合構(gòu)建的Wallace-tree結(jié)構(gòu),使得部分積壓縮樹可以充分利用3∶2壓縮器速度快,面積小的優(yōu)點(diǎn)和4∶2壓縮器結(jié)構(gòu)規(guī)則的特點(diǎn),盡可能減少部分積壓縮樹的時(shí)間和面積,減少乘法或乘加單元的總時(shí)延同時(shí)減少其面積,為大幅度提高數(shù)字信號(hào)處理器的頻率和性能,降低芯片成本提供可能。
為實(shí)現(xiàn)這樣的目的,本發(fā)明基于Wallace-tree結(jié)構(gòu),結(jié)合3∶2壓縮器和4∶2壓縮器的特點(diǎn),以生長(zhǎng)的觀點(diǎn)來(lái)構(gòu)造部分積壓縮樹。本發(fā)明以一個(gè)4∶2壓縮器作為整個(gè)部分積壓縮樹的根基,在這個(gè)基上可以向上生長(zhǎng)兩個(gè)分枝或者直接接受四個(gè)部分積信號(hào)和一個(gè)進(jìn)位輸入信號(hào)。若生長(zhǎng)分枝,根據(jù)所要壓縮的信號(hào)數(shù)確定采用4∶2壓縮器還是3∶2壓縮器,如果在這兩個(gè)分枝上可最多接受10個(gè)(4∶2壓縮器)或6個(gè)(3∶2壓縮器)的信號(hào)數(shù)目仍小于所要壓縮的信號(hào)數(shù),則在這些分枝上以各自的壓縮率繼續(xù)生長(zhǎng)分枝,直到頂部分枝所能接受的信號(hào)數(shù)達(dá)到或超過(guò)所要壓縮的信號(hào)數(shù)。同時(shí)為了保持部分積壓縮樹的規(guī)則性,規(guī)定只有部分積壓縮樹的最高層才有可能由3∶2壓縮器構(gòu)成,并且除了次高層以外,底下層上生長(zhǎng)的分枝是完備的,也就是說(shuō),該層上的所有單元都對(duì)應(yīng)兩個(gè)分枝,由此可確定不同列上壓縮樹的結(jié)構(gòu),完成整個(gè)部分積壓縮樹的生成過(guò)程。
本發(fā)明的具體步驟如下1.數(shù)據(jù)輸入及初始化根據(jù)所要實(shí)現(xiàn)的乘法器的位數(shù),確定乘法器部分積的總列數(shù)以及每一列上要壓縮的部分積的個(gè)數(shù),并初始化所有列和層上的進(jìn)位保留信號(hào)數(shù)與進(jìn)位輸出信號(hào)數(shù)以及當(dāng)前列序號(hào)和當(dāng)前層序號(hào)。
2.根基生長(zhǎng)從第一列開始,若所要壓縮的信號(hào)數(shù)小于4就以一個(gè)3∶2壓縮器作為整個(gè)部分積壓縮樹的根基,也就是整個(gè)壓縮樹的第一層,否則以一個(gè)4∶2壓縮器作根基。
一般情況下,所要壓縮的信號(hào)數(shù)大于4,本發(fā)明以一個(gè)4∶2壓縮器作為整個(gè)部分積壓縮樹的根基,在這個(gè)根基上可以向上生長(zhǎng)兩個(gè)分枝或者直接接受四個(gè)部分積信號(hào)和一個(gè)進(jìn)位輸入信號(hào)。
3.數(shù)據(jù)更新根據(jù)新生長(zhǎng)的層,更新當(dāng)前層所能接受的最大信號(hào)數(shù)以及當(dāng)前層產(chǎn)生的進(jìn)位保留信號(hào)數(shù)和進(jìn)位輸出信號(hào)數(shù);把當(dāng)前列要壓縮的部分積的個(gè)數(shù)加上前一列更高一層的進(jìn)位保留信號(hào)與進(jìn)位輸出信號(hào)的個(gè)數(shù)作為當(dāng)前列要壓縮的信號(hào)個(gè)數(shù)。如果所要壓縮的信號(hào)數(shù)大于當(dāng)前層所能接受的最大信號(hào)數(shù)以及當(dāng)前層產(chǎn)生的進(jìn)位保留信號(hào)數(shù)和進(jìn)位輸出信號(hào)數(shù),則需要生長(zhǎng)分枝。4∶2壓縮器可最多接受10個(gè)信號(hào),3∶2壓縮器可最多接受6個(gè)信號(hào)。
4.分枝生長(zhǎng)判斷當(dāng)前層要壓縮的信號(hào)個(gè)數(shù)是否大于由4∶2壓縮器構(gòu)成兩個(gè)分枝時(shí)所能接受的最大信號(hào)數(shù),如果大于,那么壓縮樹的當(dāng)前層采用4∶2壓縮器,否則判斷當(dāng)前層要壓縮的信號(hào)個(gè)數(shù)是否大于由3∶2壓縮器構(gòu)成兩個(gè)分枝時(shí)所能接受的最大信號(hào)數(shù),如果大于則當(dāng)前層采用4∶2壓縮器,否則當(dāng)前層采用3∶2壓縮器。如果在這兩個(gè)分枝上可最多接受的信號(hào)數(shù)目仍小于所要壓縮的信號(hào)數(shù),則需要在這些分枝上以各自的壓縮率繼續(xù)生長(zhǎng)分枝,直到頂部分枝所能接受的信號(hào)數(shù)達(dá)到或超過(guò)所要壓縮的信號(hào)數(shù)。然后將當(dāng)前列的序號(hào)加1,并令當(dāng)前層的序號(hào)為1,繼續(xù)下一列的壓縮樹的構(gòu)造。
5.重復(fù)上述步驟,直到所有列上的壓縮樹生長(zhǎng)完成,完成部分積壓縮樹構(gòu)造。
本發(fā)明采用的基于混合壓縮結(jié)構(gòu)的部分積壓縮樹生成方法,充分利用3∶2壓縮器速度快,面積小的優(yōu)點(diǎn)和4∶2壓縮器結(jié)構(gòu)規(guī)則的特點(diǎn),能避免基于3∶2壓縮器的部分積壓縮樹的壓縮比不夠高,所構(gòu)成的部分積壓縮樹也不夠規(guī)則的問(wèn)題,同時(shí)又能避免基于4∶2壓縮器的部分積壓縮樹不佳的時(shí)延特性等問(wèn)題,是一種有效和簡(jiǎn)捷的部分積壓縮樹生成方法。本發(fā)明減少了乘法或乘加單元的總時(shí)延,為大幅度提高數(shù)字信號(hào)處理器的頻率和性能,降低芯片成本提供可能。
圖1為本發(fā)明基于混合壓縮結(jié)構(gòu)的部分積壓縮樹生成方法流程圖。
圖2本發(fā)明基于混合壓縮結(jié)構(gòu)的部分積壓縮樹,基于3∶2壓縮器的部分積壓縮樹和基于4∶2壓縮器的部分積壓縮樹的時(shí)延特性比較圖。
具體實(shí)施例方式
為更好地理解本發(fā)明的技術(shù)方案,以下結(jié)合附圖及具體的實(shí)施例作進(jìn)一步描述。
圖1是本發(fā)明所涉及的基于混合壓縮結(jié)構(gòu)的部分積壓縮樹的方法流程圖。包括如下具體步驟1.數(shù)據(jù)輸入及初始化輸入乘法器部分積的總列數(shù),每一列上要壓縮的部分積的個(gè)數(shù),并初始化所有列和層上的進(jìn)位保留信號(hào)與進(jìn)位輸出信號(hào)數(shù)以及當(dāng)前列序號(hào)和當(dāng)前層序號(hào)。判斷當(dāng)前列數(shù)是否大于乘法器部分積的總列數(shù),如果大于,那么壓縮樹構(gòu)造結(jié)束,否則繼續(xù)執(zhí)行下一步。
2.根基生長(zhǎng)若所要壓縮的比特?cái)?shù)不小于4就以一個(gè)4∶2壓縮器作為整個(gè)部分積壓縮樹的根基,否則以一個(gè)3∶2壓縮器作根基。
3.數(shù)據(jù)準(zhǔn)備根據(jù)新生長(zhǎng)的層,更新當(dāng)前層所能接受的最大信號(hào)數(shù)以及當(dāng)前層產(chǎn)生的進(jìn)位保留信號(hào)數(shù)和進(jìn)位輸出信號(hào)數(shù);把當(dāng)前列要壓縮的部分積的個(gè)數(shù)加上前一列更高一層的進(jìn)位保留信號(hào)與進(jìn)位輸出信號(hào)的個(gè)數(shù)作為當(dāng)前列要壓縮的信號(hào)個(gè)數(shù)。
4.分枝生長(zhǎng)判斷要壓縮的信號(hào)個(gè)數(shù)是否大于當(dāng)前層由4∶2壓縮器構(gòu)成時(shí)所能接受的最大信號(hào)數(shù),如果大于,那么壓縮樹的當(dāng)前層采用4∶2壓縮器,同時(shí)當(dāng)前層的序號(hào)加1,然后跳轉(zhuǎn)到步驟3;否則判斷當(dāng)前層要壓縮的信號(hào)個(gè)數(shù)是否大于當(dāng)前層由3∶2壓縮器構(gòu)成時(shí)所能接受的最大信號(hào)數(shù),如果大于則當(dāng)前層采用4∶2壓縮器,否則當(dāng)前層采用3∶2壓縮器,然后將當(dāng)前列的序號(hào)加1,并令當(dāng)前層的序號(hào)為1,繼續(xù)下一列,跳轉(zhuǎn)到步驟2。
5.重復(fù)上述步驟,完成下一列的壓縮樹生長(zhǎng),直到所有列上的壓縮樹生長(zhǎng)完成,完成部分積壓縮樹構(gòu)造。
圖2是本發(fā)明基于混合壓縮結(jié)構(gòu)的部分積壓縮樹,基于3∶2壓縮器的部分積壓縮樹和基于4∶2壓縮器的部分積壓縮樹的時(shí)延特性比較圖。它描述了三種不同結(jié)構(gòu)的Wallace-tree在壓縮不同比特?cái)?shù)時(shí)的最大時(shí)延特性比較(已將相應(yīng)伴隨樹的進(jìn)位信號(hào)考慮在內(nèi))。圖2中以一個(gè)異或門的時(shí)延作為單位時(shí)延并假設(shè)每棵伴隨樹的結(jié)構(gòu)與當(dāng)前的部分積壓縮樹相同。可以發(fā)現(xiàn),當(dāng)部分積的個(gè)數(shù)大于7的情況下混合樹的時(shí)延是最小的。比如部分積個(gè)數(shù)為24時(shí),基于混合壓縮結(jié)構(gòu)的部分積壓縮樹相對(duì)于純3∶2結(jié)構(gòu)而言,速度提升了21.4%,相對(duì)于純4∶2結(jié)構(gòu)而言,速度提升了8.3%。
實(shí)施例實(shí)現(xiàn)一個(gè)8×8的乘法器,用非Booth編碼的Wallace-tree結(jié)構(gòu),這時(shí)乘法器部分積的總列數(shù)是15,每一列上要壓縮的部分積個(gè)數(shù)分別是1,2,3,4,5,6,7,8,7,6,5,4,3,2,1。以計(jì)算第8列為例步驟1當(dāng)前列序號(hào)為8,當(dāng)前層序號(hào)為1;當(dāng)前列序號(hào)小于乘法器部分積的總列數(shù)15,執(zhí)行下一步;步驟2當(dāng)前所要壓縮的比特?cái)?shù)為12不小于4,以一個(gè)4∶2壓縮器作為整個(gè)部分積壓縮樹的根基;步驟3當(dāng)前層能接受的最大信號(hào)數(shù)是5,產(chǎn)生的進(jìn)位保留信號(hào)數(shù)為1,進(jìn)位輸出信號(hào)數(shù)1,當(dāng)前列要壓縮的部分積的個(gè)數(shù)8加上前一列更高一層的進(jìn)位保留信號(hào)數(shù)2與進(jìn)位輸出信號(hào)的個(gè)數(shù)2作為要壓縮的信號(hào)個(gè)數(shù)12;步驟4要壓縮的信號(hào)個(gè)數(shù)大于當(dāng)前層由4∶2壓縮器構(gòu)成時(shí)所能接受的最大信號(hào)數(shù)5,所以壓縮樹的當(dāng)前層采用4∶2壓縮器,同時(shí)當(dāng)前層的序號(hào)加1,跳轉(zhuǎn)到步驟3;步驟3當(dāng)前層能接受的最大信號(hào)數(shù)是10,產(chǎn)生的進(jìn)位保留信號(hào)數(shù)為2,進(jìn)位輸出信號(hào)數(shù)2,當(dāng)前列要壓縮的部分積的個(gè)數(shù)8加上前一列更高一層的進(jìn)位保留信號(hào)數(shù)0與進(jìn)位輸出信號(hào)的個(gè)數(shù)0作為要壓縮的信號(hào)個(gè)數(shù)8;步驟4要壓縮的信號(hào)個(gè)數(shù)8小于當(dāng)前層由4∶2壓縮器構(gòu)成時(shí)所能接受的最大信號(hào)數(shù)10,同時(shí)要壓縮的信號(hào)個(gè)數(shù)8大于當(dāng)前層由3∶2壓縮器構(gòu)成時(shí)所能接受的最大信號(hào)數(shù)6,則當(dāng)前層采用4∶2壓縮器,將當(dāng)前列的序號(hào)加1,并令當(dāng)前層的序號(hào)為1,繼續(xù)下一列,即跳轉(zhuǎn)到步驟2。
最終壓縮樹結(jié)果輸出為第1列第一級(jí)用1個(gè)3∶2壓縮器第2列第一級(jí)用1個(gè)3∶2壓縮器第3列第一級(jí)用1個(gè)3∶2壓縮器第4列第一級(jí)用1個(gè)4∶2壓縮器第5列第一級(jí)用1個(gè)4∶2壓縮器第5列第二級(jí)用1個(gè)3∶2壓縮器第6列第一級(jí)用1個(gè)4∶2壓縮器第6列第二級(jí)用2個(gè)3∶2壓縮器第7列第一級(jí)用1個(gè)4∶2壓縮器第7列第二級(jí)用2個(gè)4∶2壓縮器第8列第一級(jí)用1個(gè)4∶2壓縮器第8列第二級(jí)用2個(gè)4∶2壓縮器第9列第一級(jí)用1個(gè)4∶2壓縮器第9列第二級(jí)用2個(gè)4∶2壓縮器第10列第一級(jí)用1個(gè)4∶2壓縮器第10列第二級(jí)用2個(gè)4∶2壓縮器第11列第一級(jí)用1個(gè)4∶2壓縮器第11列第二級(jí)用2個(gè)4∶2壓縮器第12列第一級(jí)用1個(gè)4∶2壓縮器第12列第二級(jí)用1個(gè)4∶2壓縮器第13列第一級(jí)用1個(gè)4∶2壓縮器第14列第一級(jí)用1個(gè)4∶2壓縮器第15列第一級(jí)用1個(gè)4∶2壓縮器可見,應(yīng)用本發(fā)明的方法,可以很快的生成不同位數(shù)乘法器的混合壓縮樹的結(jié)構(gòu)。
權(quán)利要求
1.一種基于混合壓縮結(jié)構(gòu)的部分積壓縮樹生成方法,其特征包括如下具體步驟1)數(shù)據(jù)輸入及初始化根據(jù)所要實(shí)現(xiàn)的乘法器的位數(shù),確定乘法器部分積的總列數(shù)以及每一列上要壓縮的部分積的個(gè)數(shù),并初始化所有列和層上的進(jìn)位保留信號(hào)數(shù)與進(jìn)位輸出信號(hào)數(shù)以及當(dāng)前列序號(hào)和當(dāng)前層序號(hào);2)根基生長(zhǎng)從第一列開始,若所要壓縮的信號(hào)數(shù)小于4就以一個(gè)3:2壓縮器作為整個(gè)部分積壓縮樹的根基,也就是整個(gè)壓縮樹的第一層,否則以一個(gè)4:2壓縮器作根基,在這個(gè)根基上向上生長(zhǎng)兩個(gè)分枝或者直接接受四個(gè)部分積信號(hào)和一個(gè)進(jìn)位輸入信號(hào);3)數(shù)據(jù)更新根據(jù)新生長(zhǎng)的層,更新當(dāng)前層所能接受的最大信號(hào)數(shù)以及當(dāng)前層產(chǎn)生的進(jìn)位保留信號(hào)數(shù)和進(jìn)位輸出信號(hào)數(shù),把當(dāng)前列要壓縮的部分積的個(gè)數(shù)加上前一列更高一層的進(jìn)位保留信號(hào)與進(jìn)位輸出信號(hào)的個(gè)數(shù)作為當(dāng)前列要壓縮的信號(hào)個(gè)數(shù),如果所要壓縮的信號(hào)數(shù)大于當(dāng)前層所能接受的最大信號(hào)數(shù)以及當(dāng)前層產(chǎn)生的進(jìn)位保留信號(hào)數(shù)和進(jìn)位輸出信號(hào)數(shù),則需要生長(zhǎng)分枝;4)分枝生長(zhǎng)判斷當(dāng)前層要壓縮的信號(hào)個(gè)數(shù)是否大于由4:2壓縮器構(gòu)成兩個(gè)分枝時(shí)所能接受的最大信號(hào)數(shù),如果大于則壓縮樹的當(dāng)前層采用4:2壓縮器,否則再判斷當(dāng)前層要壓縮的信號(hào)個(gè)數(shù)是否大于由3:2壓縮器構(gòu)成兩個(gè)分枝時(shí)所能接受的最大信號(hào)數(shù),如果大于則當(dāng)前層采用4:2壓縮器,否則當(dāng)前層采用3:2壓縮器,如果在這兩個(gè)分枝上可最多接受的信號(hào)數(shù)目仍小于所要壓縮的信號(hào)數(shù),則需要在這些分枝上以各自的壓縮率繼續(xù)生長(zhǎng)分枝,直到頂部分枝所能接受的信號(hào)數(shù)達(dá)到或超過(guò)所要壓縮的信號(hào)數(shù),然后將當(dāng)前列的序號(hào)加1,并令當(dāng)前層的序號(hào)為1,繼續(xù)下一列的壓縮樹的構(gòu)造。5)重復(fù)上述步驟,直到所有列上的壓縮樹生長(zhǎng)完成,完成部分積壓縮樹構(gòu)造。
全文摘要
一種基于混合壓縮結(jié)構(gòu)的部分積壓縮樹生成方法,結(jié)合3∶2壓縮器和4∶2壓縮器的特點(diǎn),以生長(zhǎng)的觀點(diǎn)來(lái)構(gòu)造部分積壓縮樹。以一個(gè)4∶2壓縮器作為壓縮樹的根基,在這個(gè)基上向上生長(zhǎng)兩個(gè)分枝或者直接接受四個(gè)部分積信號(hào)和一個(gè)進(jìn)位輸入信號(hào)。若生長(zhǎng)分枝,根據(jù)所要壓縮的信號(hào)數(shù)確定采用4∶2壓縮器還是3∶2壓縮器,如果在這兩個(gè)分枝上可最多接受的信號(hào)數(shù)目仍小于所要壓縮的信號(hào)數(shù),則在這些分枝上以各自的壓縮率繼續(xù)生長(zhǎng)分枝,直到頂部分枝所能接受的信號(hào)數(shù)達(dá)到或超過(guò)所要壓縮的信號(hào)數(shù)。本發(fā)明減少了部分積壓縮樹的時(shí)間和面積,減少乘法或乘加單元的總時(shí)延同時(shí)減少其面積,為大幅度提高數(shù)字信號(hào)處理器的頻率和性能,降低芯片成本提供可能。
文檔編號(hào)G06F7/48GK1556466SQ20041001573
公開日2004年12月22日 申請(qǐng)日期2004年1月9日 優(yōu)先權(quán)日2004年1月9日
發(fā)明者王田, 陳健, 王 田 申請(qǐng)人:上海交通大學(xué)