專利名稱:圖像處理設(shè)備、圖像處理方法和程序的制作方法
圖像處理設(shè)備、圖像處理方法和程序技術(shù)領(lǐng)域
本技術(shù)涉及一種圖像處理設(shè)備、圖像處理方法和程序,尤其涉及能夠減少正交變換處理或逆正交變換處理需要的計算量的圖像處理設(shè)備、圖像處理方法和程序。
背景技術(shù):
使用稱為旋轉(zhuǎn)變換(ROT)的正交變換的編碼方案已被認為是與下一代先進視頻編碼(AVC)方案相對應(yīng)的編碼方案(例如,參見專利文獻I)。被廣泛使用在視頻編碼中的傳統(tǒng)離散余弦變換(DCT)在某些情形下不是最佳的。
例如,當(dāng)變換目標(biāo)具有強方向分量時,DCT基本向量可能不令人滿意地表達了強方向分量。
一般來說,盡管方向變換(ROT)可以解決上述問題,但是因為所述ROT需要許多浮點操作并且需要變換目標(biāo)塊有正方形而難以執(zhí)行R0T。具體來說,當(dāng)存在大量塊尺寸時,應(yīng)用ROT會更難。
因此,已經(jīng)提出了這樣一種方法,在該方法中設(shè)計執(zhí)行具有少量塊尺寸的ROT的處理單元,并且僅對低頻分量執(zhí)行作為繼DCT后的第二變換的R0T。
圖I圖示在通過按照這種方法執(zhí)行正交變換來對已編碼圖像數(shù)據(jù)解碼的解碼器中的逆ROT的步驟的例子。
在左邊的白盒是作為從已編碼圖像數(shù)據(jù)中提取的殘差信息的圖像數(shù)據(jù)。該圖像數(shù)據(jù)對由4X4、8X8、16X16、32X32、64X64或128X128像素的像素值組成的各個塊反量化。而且,只有該反量化塊之中由低頻分量組成的4X4或8X8像素塊經(jīng)歷逆R0T,并且在逆ROT后獲得的系數(shù)和已反量化塊的剩余高頻分量經(jīng)歷逆DCT。
通過這樣做,在上述方法中,僅僅需要準(zhǔn)備4X4或8X8像素的塊尺寸作為用于 ROT和逆ROT的塊尺寸。
引用列表
非專利文獻
非專利文獻I :http://wp3. itu. int/av-arch/jctvc-site/2010_04_A_Dresden/ JCTVC-A124. zip (2010 年 10 月 28 日搜索)發(fā)明內(nèi)容
本發(fā)明要解決的問題
然而,在巾貞內(nèi)預(yù)測(intra prediction)的塊尺寸像4X4像素一樣小時出現(xiàn)問題。 具體來說,為了執(zhí)行各個塊的幀內(nèi)預(yù)測,由于需要包括與相應(yīng)塊的左邊的塊的相鄰塊的已解碼圖像數(shù)據(jù),所以難以并行執(zhí)行各個塊的幀內(nèi)預(yù)測。而且,在上述方法中,為了獲得已解碼圖像數(shù)據(jù),需要如DCT、R0T、量化、反量化、逆ROT和逆DCT之類的大量處理。
因此,當(dāng)幀內(nèi)預(yù)測的塊尺寸小時,為編碼和解碼宏塊(macroblock)或編碼單元 (CU)所需要的最長周期增加,并且在需要實時特性的應(yīng)用中非常難以使用上述方法。在此,所述CU與AVC方案中的宏塊具有相同的概念。
鑒于這樣的情形已經(jīng)做出本技術(shù),其旨在減少為ROT和DCT或逆DCT和逆ROT需要的處理量。
問題的解決方案
按照本技術(shù)的一個方面的圖像處理設(shè)備或程序是包括以下單元的一種圖像處理設(shè)備反量化單元,其反量化已量化圖像,以獲得通過在第一正交變換之后執(zhí)行第二正交變換獲得的、具有預(yù)定尺寸的圖像的低頻分量,并且獲得作為不同于圖像的低頻分量的分量并通過第一正交變換獲得的高頻分量;以及逆正交變換單元,其當(dāng)所述圖像的尺寸是預(yù)定尺寸時,對作為低頻分量的圖像執(zhí)行第三逆正交變換,該第三逆正交變換是對應(yīng)于所述第一正交變換的第一逆正交變換和對應(yīng)于所述第二正交變換的第二逆正交變換的組合變換, 并且其當(dāng)所述圖像的尺寸大于預(yù)定尺寸時,對該低頻分量執(zhí)行第二逆正交變換,并且對已經(jīng)經(jīng)歷第二逆正交變換的低頻分量和由該反量化單元獲得的高頻分量執(zhí)行第一逆正交變換,或者使得計算機用作所述圖像處理設(shè)備的一種程序。
按照本技術(shù)的一個方面的圖像處理方法是包括以下步驟的一種圖像處理方法反量化已量化圖像,以獲得通過在第一正交變換之后執(zhí)行第二正交變換獲得的、具有預(yù)定尺寸的圖像的低頻分量,并且獲得作為不同于圖像的低頻分量的分量并通過第一正交變換獲得的高頻分量;當(dāng)該圖像的尺寸是預(yù)定尺寸時,對作為低頻分量的該圖像執(zhí)行第三逆正交變換,該第三逆正交變換是對應(yīng)于所述第一正交變換的第一逆正交變換和對應(yīng)于所述第二正交變換的第二逆正交變換的組合變換;當(dāng)所述圖像的尺寸大于預(yù)定尺寸時,對該低頻分量執(zhí)行第二逆正交變換,并且對已經(jīng)經(jīng)歷第二逆正交變換的低頻分量和由該反量化單元獲得的高頻分量執(zhí)行第一逆正交變換,
在本技術(shù)的該方面,反量化已量化圖像,以獲得通過在第一正交變換之后執(zhí)行第二正交變換獲得的、具有預(yù)定尺寸的圖像的低頻分量,并且獲得作為不同于圖像的低頻分量的分量并通過第一正交變換獲得的高頻分量。當(dāng)該圖像的尺寸是預(yù)定尺寸時,對作為低頻分量的該圖像執(zhí)行第三逆正交變換,該第三逆正交變換是對應(yīng)于所述第一正交變換的第一逆正交變換和對應(yīng)于所述第二正交變換的第二逆正交變換的組合變換。當(dāng)所述圖像的尺寸大于預(yù)定尺寸時,對該低頻分量執(zhí)行第二逆正交變換,并且對已經(jīng)經(jīng)歷第二逆正交變換的低頻分量和由該反量化單元獲得的高頻分量執(zhí)行第一逆正交變換。
本發(fā)明的效果
按照本技術(shù)的方面,可以減少為ROT和DCT或逆DCT和逆ROT所需要的處理量。
圖I是圖示解碼器中的ROT的步驟的例子的示圖。
圖2是圖示AVC編碼器的配置例子的框圖。
圖3是圖示AVC解碼器的配置例子的框圖。
圖4是圖示當(dāng)引入ROT時與正交變換器、量化器、反量化器和逆正交變換器相對應(yīng)的各部分的配置例子的框圖。
圖5是描述在編碼器側(cè)ROT的改善的示圖。
圖6是圖示當(dāng)引入ROT時與反量化器和逆正交變換器相對應(yīng)的各部分的配置例子的框圖。
圖7是描述在解碼器側(cè)ROT的改善的示圖。
圖8是描述編碼器的處理的流程圖。
圖9是描述編碼器的處理的流程圖。
圖10是描述編碼器的處理的流程圖。
圖11是描述編碼器的處理的流程圖。
圖12是描述編碼器的處理的流程圖。
圖13是描述解碼器的處理的流程圖。
圖14是描述解碼器的處理的流程圖。
圖15是描述解碼器的處理的流程圖。
圖16是圖示應(yīng)用本技術(shù)的計算機的實施例的配置例子的框圖。
具體實施方式
<實施例>
[編碼器的配置例子]
圖2是圖示應(yīng)用本技術(shù)的AVC編碼器的實施例的配置例子的框圖。
圖2的編碼器包括Α/D轉(zhuǎn)換器101、幀重排緩存器102、計算設(shè)備103、正交變換器 104、量化器105、無損編碼器106、存儲緩存器107、反量化器108、逆正交變換器109、加法器110、去塊濾波器111、幀存儲器112、運動補償器113、幀內(nèi)預(yù)測器114、速率控制器115、 運動預(yù)測器116和選擇器117。圖I的編碼器按照AVC方案壓縮和編碼輸入圖像。
具體來說,編碼器的Α/D轉(zhuǎn)換器101對作為輸入信號輸入的基于幀的圖像執(zhí)行A/ D轉(zhuǎn)換,以獲得數(shù)字圖像數(shù)據(jù),并且輸出該數(shù)字圖像數(shù)據(jù)至存儲數(shù)字圖像數(shù)據(jù)的幀重排緩存器102。幀重排緩存器102按照圖像組(GOP)結(jié)構(gòu)以編碼的順序重排以用于顯示的存儲順序排列的圖像幀。
計算設(shè)備103按照需要從由幀重排緩存器102讀取的圖像中減去從選擇器117提供的預(yù)測圖像。計算設(shè)備103將作為減法的結(jié)果獲得的圖像輸出至正交變換器104作為殘差信息。當(dāng)預(yù)測圖像未從選擇器117提供時,計算設(shè)備103在沒有任何改變的情況下將從幀重排緩存器102讀取的圖像輸出至正交變換器104作為殘差信息。
正交變換器104對來自計算設(shè)備103的殘差信息執(zhí)行對應(yīng)于塊尺寸的正交變換。 具體來說,當(dāng)塊尺寸是4X4像素時,正交變換器104對所述殘差信息執(zhí)行DCT和ROT的組合變換。另一方面,當(dāng)塊尺寸是8X8像素時,正交變換器104對所述殘差信息執(zhí)行DCT,并對作為DCT的結(jié)果獲得的系數(shù)執(zhí)行R0T。而且,當(dāng)塊尺寸比8X8像素大時,正交變換器104 對殘差信息執(zhí)行DCT,對作為DCT結(jié)果獲得的系數(shù)之中的8X8像素的低頻分量執(zhí)行R0T,并使用作為ROT結(jié)果獲得的系數(shù)和剩余高頻分量作為最終系數(shù)。正交變換器104將作為正交變換的結(jié)果獲得的系數(shù)提供給量化器105。
量化器105量化從正交變換器104提供的系數(shù)。該已量化系數(shù)被輸入到無損編碼器 106。
無損編碼器106從幀內(nèi)預(yù)測器114采集指示最佳幀內(nèi)預(yù)測模式的信息(此后稱之為幀內(nèi)預(yù)測模式信息),并從運動預(yù)測器116采集指示最佳幀間預(yù)測模式、運動矢量信息等的信息(以后稱之為幀間預(yù)測模式信息)。
無損編碼器106對從量化器105提供的已量化系數(shù)執(zhí)行諸如可變長編碼(例如,上下文自適應(yīng)可變長編碼(CAVLC))或算術(shù)編碼(例如,上下文自適應(yīng)二進制編碼(CABAC))的無損編碼,以獲得作為編碼的結(jié)果所獲得的信息作為壓縮圖像。而且,無損編碼器106對幀內(nèi)預(yù)測模式信息、幀間預(yù)測模式信息、運動矢量信息等執(zhí)行無損編碼,以獲得作為編碼的結(jié)果所獲得的信息作為添加到壓縮圖像的標(biāo)頭信息。無損編碼器106將作為無損編碼的結(jié)果所獲得的標(biāo)頭信息添加到的壓縮圖像提供至存儲緩存器107作為圖像壓縮信息。
存儲緩存器107暫時存儲從無損編碼器106提供的圖像壓縮信息,并且輸出該圖像壓縮信息到例如在下游側(cè)的記錄設(shè)備(未示出)、輸出路徑(未示出)等。
而且,從量化器105輸出的已量化系數(shù)也被輸入到反量化器108,由反量化器108 反量化,并且被提供至逆正交變換器109。
逆正交變換器109對從反量化器108提供的系數(shù)執(zhí)行對應(yīng)于塊尺寸的逆正交變換。具體來說,當(dāng)塊尺寸是4X4像素時,逆正交變換器109對所述系數(shù)執(zhí)行逆ROT和逆DCT 的組合變換。另一方面,當(dāng)塊尺寸是8X8像素時,逆正交變換器109對所述系數(shù)執(zhí)行逆ROT 變換,并且對作為逆ROT的結(jié)果所獲得的系數(shù)執(zhí)行逆DCT。而且,當(dāng)塊尺寸大于8X8像素時,逆正交變換器109對所述系數(shù)的8 X 8低頻分量執(zhí)行逆R0T,并且對作為逆ROT的結(jié)果所獲得的系數(shù)和剩余高頻分量執(zhí)行逆DCT。逆正交變換器109將作為逆正交變換的結(jié)果所獲得的殘差信息提供給加法器110。
加法器110按照需要將從逆正交變換器109提供的殘差信息添加到從幀內(nèi)預(yù)測器 114或運動補償器113提供的預(yù)測圖像,并且獲得本地已解碼圖像。加法器110將所獲得的圖像提供給去塊濾波器111,并且將所獲得的圖像提供給幀內(nèi)預(yù)測器114作為參考圖像。
去塊濾波器111對從加法器110提供的本地已解碼圖像執(zhí)行濾波,由此移除塊失真(distortion)。去塊濾波器111將作為濾波的結(jié)果所獲得的圖像提供給存儲所述圖像的幀存儲器112。存儲在幀存儲器112中的圖像作為參考圖像被輸出至運動補償器113和運動預(yù)測器116。
運動補償器113基于從運動預(yù)測器116提供的運動矢量和幀間預(yù)測模式信息,對從幀存儲器112提供的參考圖像執(zhí)行壓縮處理,以產(chǎn)生預(yù)測圖像。運動補償器113將從運動預(yù)測器116提供的成本函數(shù)值(其細節(jié)隨后描述)和所產(chǎn)生的預(yù)測圖像提供給選擇器117。
成本函數(shù)值也被稱之為速率失真(RD)成本,并且例如基于按照作為AVC方案的參照軟件的聯(lián)合模型(JM)中所定義的高復(fù)雜性模式或低復(fù)雜性模式計算。
具體來說,在高復(fù)雜性模式被用作計算成本函數(shù)值的方法時,對所有候選的預(yù)測模式暫時執(zhí)行直到無損編碼的處理,并且對每個預(yù)測模式計算由下面的表達式(I)表示的成本函數(shù)值。
Cost (Mode)=D+A ·! ... (I)
這里,“D”是在正交圖像和已解碼圖像之間的差(失真),“R”是包括正交變換系數(shù)的發(fā)生編碼率,并且“ λ ”是給定為量化參數(shù)QP的函數(shù)的拉格朗日乘子。
另一方面,當(dāng)?shù)蛷?fù)雜性模式被用作計算成本函數(shù)值的方法時,對所有候選的預(yù)測模式執(zhí)行已解碼圖像的產(chǎn)生和諸如指示預(yù)測模式的信息的標(biāo)頭位的計算,并且對每個預(yù)測模式計算由下面的表達式(2)表示的成本函數(shù)。
Cost (Mode) =D+QPtoQuant (QP) · Header_Bit…(2)
這里,“D”是在正交圖像和已解碼圖像之間的差(失真),“Header_Bit〃是預(yù)測模式的標(biāo)頭位,并且“QPtoQuant”是給定為量化參數(shù)QP的函數(shù)的函數(shù)。
在低復(fù)雜性模式下,由于僅僅需要在所有預(yù)測模式下產(chǎn)生已解碼圖像,并且不需要執(zhí)行無損編碼,因此需要很小的計算量。在此例子中,假設(shè)高復(fù)雜性模式被用作計算成本函數(shù)值的方法。
幀內(nèi)預(yù)測器114基于從幀重排緩存器102讀取的圖像和從加法器110提供的參考圖像,以所有候選塊尺寸的塊為單位,在所有候選幀內(nèi)預(yù)測模式下執(zhí)行幀內(nèi)預(yù)測處理,以產(chǎn)生預(yù)測圖像。
而且,幀內(nèi)預(yù)測器114對于所有候選幀內(nèi)預(yù)測模式和所有候選塊尺寸計算成本函數(shù)值。而且,幀內(nèi)預(yù)測器114將其中成本函數(shù)值最小的幀內(nèi)預(yù)測模式和塊尺寸的組合確定為最佳幀內(nèi)預(yù)測模式。幀內(nèi)預(yù)測器114將在最佳幀內(nèi)預(yù)測模式下產(chǎn)生的預(yù)測圖像和相應(yīng)成本函數(shù)值提供給選擇器117。當(dāng)從選擇器117通知選擇在最佳幀內(nèi)預(yù)測模式下產(chǎn)生的預(yù)測圖像時,幀內(nèi)預(yù)測器114將幀內(nèi)預(yù)測模式信息提供給無損編碼器106。
運動預(yù)測器116基于從幀重排緩存器102提供的圖像和從幀存儲器112提供的參考圖像在所有候選幀間預(yù)測模式下執(zhí)行運動預(yù)測,以產(chǎn)生運動矢量。在此情形中,運動預(yù)測器116在所有候選幀間預(yù)測模式下計算成本函數(shù)值,并且將其中成本函數(shù)值最小的幀間預(yù)測模式確定為最佳幀間預(yù)測模式。而且,運動預(yù)測器116將幀間預(yù)測模式信息以及相應(yīng)運動矢量和成本函數(shù)值提供給運動補償器113。當(dāng)從選擇器117通知選擇在最佳幀間預(yù)測模式下產(chǎn)生的預(yù)測圖像時,運動預(yù)測器116將幀間預(yù)測模式信息、有關(guān)相應(yīng)運動矢量的信息等提供給無損編碼器106。
選擇器117基于從幀內(nèi)預(yù)測器114和運動補償器113提供的成本函數(shù)值將最佳幀內(nèi)預(yù)測模式和最佳幀間預(yù)測模式中的任何一個確定為最佳預(yù)測模式。而且,選擇器117將最佳預(yù)測模式下的預(yù)測圖像提供給計算設(shè)備103和加法器110。而且,選擇器117通知幀內(nèi)預(yù)測器114或運動預(yù)測器116選擇在最佳預(yù)測模式下的預(yù)測圖像。
速率控制器115基于存儲在存儲緩存器107中的圖像壓縮信息控制量化器105的量化操作的速率,以便過流或欠流不發(fā)生。
[解碼器的配置例子]
圖3是對應(yīng)于圖2的編碼器的AVC解碼器的框圖。
圖3的解碼器包括存儲緩存器216、無損解碼器217、反量化器218、逆正交變換器 219、加法器220、幀重排緩存器221、D/A轉(zhuǎn)換器222、幀存儲器223、運動補償器224、幀內(nèi)預(yù)測器225、去塊濾波器226和開關(guān)227。
存儲緩存器216存儲從圖2的編碼器發(fā)送的圖像壓縮信息。無損解碼器217從存儲緩存器216讀取并采集圖像壓縮信息,并且按照與圖2的無損編碼器106的無損編碼方案相對應(yīng)的方案,無損解碼圖像壓縮信息。
具體來說,無損解碼器217無損解碼圖像壓縮信息中的標(biāo)頭信息以采集幀內(nèi)預(yù)測模式信息、幀間預(yù)測模式信息、運動矢量信息等。而且,無損解碼器217無損解碼圖像壓縮信息中的壓縮圖像。
而且,無損解碼器217將作為壓縮圖像的無損解碼的結(jié)果所獲得的已量化系數(shù)提供給反量化器218。無損解碼器217將作為無損解碼的結(jié)果所獲得的幀內(nèi)預(yù)測模式信息提供給幀內(nèi)預(yù)測器225,并且將幀間預(yù)測模式信息、運動矢量信息等提供給運動補償器224。
反量化器218具有與圖2的反量化器108相同的配置,并且按照與圖2的量化器 105的量化方案相對應(yīng)的方案,對從無損解碼器217提供的已量化系數(shù)反量化。反量化器 218將作為反量化的結(jié)果所獲得的系數(shù)提供給逆正交變換器219。
逆正交變換器219以類似于圖2的逆正交變換器109的方式,對從反量化器218 提供的系數(shù)執(zhí)行對應(yīng)于塊尺寸的逆正交變換。逆正交變換器219將作為逆正交變換的結(jié)果所獲得的殘差信息提供給加法器220。
加法器220將從逆正交變換器219提供的殘差信息添加到從開關(guān)227提供的預(yù)測圖像,并且按照需要對添加結(jié)果解碼。加法器220將作為解碼的結(jié)果所獲得的已解碼圖像提供給幀內(nèi)預(yù)測器225和去塊濾波器226。
去塊濾波器226對從加法器220提供的已解碼圖像執(zhí)行濾波,由此移除塊失真。去塊濾波器226將作為濾波的結(jié)果所獲得的圖像提供給存儲所述圖像的幀存儲器223,并且將圖像輸出至幀重排緩存器221。
幀重排緩存器221重排從去塊濾波器226提供的圖像。具體來說,由圖2的幀重排緩存器102為編碼而排列的圖像的幀順序被重排為原始顯示順序。D/Α轉(zhuǎn)換器222對由幀重排緩存器221重排的圖像執(zhí)行D/Α轉(zhuǎn)換,并且將已轉(zhuǎn)換圖像輸出至顯示圖像的顯示器 (未示出)。
幀存儲器223讀取在此存儲的圖像作為參考圖像,并且將參考圖像輸出至運動補償器224。
幀內(nèi)預(yù)測器225基于從無損解碼器217提供的幀內(nèi)預(yù)測模式信息在由幀內(nèi)預(yù)測模式信息指示的最佳幀內(nèi)預(yù)測模式執(zhí)行幀內(nèi)預(yù)測處理,以產(chǎn)生預(yù)測圖像。幀內(nèi)預(yù)測器225將預(yù)測圖像提供給開關(guān)227。
運動補償器224基于從無損解碼器217提供的幀間預(yù)測模式信息、運動矢量信息等,對從幀存儲器223提供的參考圖像執(zhí)行運動補償處理,以產(chǎn)生預(yù)測圖像。運動補償器 224將預(yù)測圖像提供給開關(guān)227。
開關(guān)227選擇由運動補償器224或幀內(nèi)預(yù)測器225產(chǎn)生的預(yù)測圖像,并且將所選擇的預(yù)測圖像提供給加法器220。
正交變換和逆正交變換的描述
首先,圖4是圖示當(dāng)作為正交變換執(zhí)行DCT和ROT時傳統(tǒng)編碼器的正交變換器、量化器、反量化器和逆正交變換器的框圖。
如圖4所示,傳統(tǒng)編碼器的正交變換器包括4X4DCT411、8X8DCT412、 16 X 16DCT413、32 X 32DCT414、64X64DCT415、128 X 128DCT416、4 X 4R0T417 和 8X8R0T418。
按照塊尺寸將所述殘差信息輸入至4X4DCT411、8X8DCT412、16X 16DCT413、 32X32DCT414、64X64DCT415 和 128 X 128DCT416 并且經(jīng)歷 DCT。
具體來說,4X4DCT411對4X4像素殘差信息執(zhí)行DCT,對作為DCT的結(jié)果所獲得的4X4像素系數(shù)的計算精度取整(round off ),并且將4X4像素系數(shù)提供給4X4R0T417。
8 X 8DCT412對8 X 8像素殘差信息執(zhí)行DCT,對作為DCT的結(jié)果所獲得的8X8像素系數(shù)的計算精度取整,并且將8X8像素系數(shù)提供給8 X 8R0T418。16 X 16DCT413對16 X 16 像素殘差信息執(zhí)行DCT并對作為DCT的結(jié)果所獲得的16X 16像素系數(shù)的計算精度取整。 16 X 16DCT413將作為DCT的結(jié)果所獲得的16 X 16像素系數(shù)之中的8X8像素低頻分量提供給8 X 8R0T418,并將剩余高頻分量提供給量化器。
類似地,32X 32DCT414、64 X 64DCT415 和 128 X 128DCT416 分別對 32 X 32、64 X 64、 和128X 128像素殘差信息執(zhí)行DCT,對作為DCT的結(jié)果所獲得的系數(shù)的計算精度取整。而且,32X32DCT414、64X64DCT415和128 X 128DCT416只將作為DCT的結(jié)果所獲得的系數(shù)之中的8X8像素低頻分量提供給8X8R0T418,并將剩余高頻分量提供給量化器。
4X4R0T417使用角度索引對從4X4DCT411提供的4X4像素系數(shù)執(zhí)行R0T。
這里,ROT是使用如下面的表達式(I)圖示的關(guān)于垂直方向的旋轉(zhuǎn)矩陣R 關(guān)于水平方向的旋轉(zhuǎn)矩陣Rhwizmtal的旋轉(zhuǎn)變換,并且角度索引是表達式(I)中的
[數(shù)學(xué)公式I]zmamarMaicma2s\M 3 -湖觀a3 Sititt2Mfteosff!si瞞+si滅丨-si_si瞞-Sinff3WSff3sinffisinfficosflfisiiflficosft
cosff^sat-smffjcosffissifift, -smffiosftrcosff^cosffssiiiffo Sinff5Smtt6 cosffisinfti+sinffjcosascosffi, -si威)sinQ^+wsi^osascosi^ -SmaiQmai, SiW4Shtt5_4si_COSQf5vertical!至。和…(I)
8X8R0T418 對從 8X8DCT412、16X 16DCT413、32X32DCT414、64X64DCT415 和 128X 128DCT416提供的8 X 8像素系數(shù)執(zhí)行使用角度索引的R0T。
將作為4X4R0T417的ROT的結(jié)果所獲得的4X4像素系數(shù)和作為8X8R0T418的 ROT的結(jié)果所獲得的8X8像素系數(shù)以取整的計算精度提供給量化器。
量化器包括4X4Quant419、8X8Quant420、16X 16Quant421、32X32Quant422、 64X64Quant423 和 128 X 128Quant424。
4X4Quant419 量化從 4X4R0T417 提供的 4X4 像素系數(shù)。4X4Quant419 將已量化4X4像素系數(shù)提供給反量化器,并且將相同的系數(shù)提供給與圖2的無損編碼器106相同的無損編碼器(未示出)。
8X8Quant420 量化從 8X8R0T418 提供的 8X8 像素系數(shù)。8X8Quant420 將已量化8 X 8像素系數(shù)提供給反量化器,并且將相同的系數(shù)提供給與圖2的無損編碼器106相同的無損編碼器(未示出)。
16 X 16Quant421量化從8 X 8R0T418提供的8 X 8像素系數(shù)和作為關(guān)于從 16 X 16DCT413提供的16 X 16像素殘差信息的DCT的結(jié)果所獲得的系數(shù)之中不同于8 X 8像素低頻分量的高頻分量。16X 16Quant421將已量化16 X 16像素系數(shù)提供給反量化器,并且將相同的系數(shù)提供給與圖2的無損編碼器106相同的無損編碼器(未示出)。
類似地,32X32Quant422、64X64Quant423和 128 X 128Quant424 量化從8X8R0T418提供的8X8像素系數(shù)和作為關(guān)于32X32、64X64和128X 128像素殘差信息的DCT的結(jié)果所獲得的系數(shù)之中不同于8X8像素低頻分量的高頻分量。32X32Quant422、 64 X 64Quant423 和 128 X 128Quant424 將已量化 32 X 32、64 X 64 和 128 X 128 像素系數(shù)提供給反量化器,并且將相同的系數(shù)提供給與無損編碼器106相同的無損編碼器(未示出)。
反量化器包括4X4Inv Quant451、8X8Inv Quant452、16X 16Inv Quant453、 32 X 32Inv Quant454、64X64Inv Quant455 和 128 X 128Inv Quant456。
4 X 4Inv Quant451、8 X 8Inv Quant452、16 X 16Inv Quant453>32 X 32Inv Quant454、64X64Inv Quant455 和 128X128Inv Quant456 分別反量化從 4X4Quant419、 8X8Quant420、16 X16Quant421、32 X32Quant422、64X 64Quant423 和 128 X 128Quant424 提供的已量化系數(shù),并且將已反量化系數(shù)提供給逆正交變換器。
逆正交變換器包括4X4Inv R0T457、8X8Inv R0T458、4X4Inv DCT459、8X8Inv DCT460U6X 16Inv DCT461、32 X 32Inv DCT462、64X 64Inv DCT463 和 128X 128Inv DCT464。
4X4Inv R0T457使用角度索引對從4X4Inv Quant451提供的已反量化4X4像素系數(shù)執(zhí)行逆ROT。4X4Inv R0T457將作為逆ROT的結(jié)果所獲得的4X4像素系數(shù)提供給 4X4Inv DCT459。
8X8Inv R0T458使用角度索引對從8 X 8Inv Quant452提供的已反量化8 X 8像素系數(shù)執(zhí)行逆ROT,并且將作為逆ROT的結(jié)果所獲得的8 X 8像素系數(shù)提供給8 X 8Inv DCT460。
而且,8X8Inv R0T458使用角度索引對從16X 16Inv Quant453提供的已反量化 16 X 16像素系數(shù)之中的8X8像素低頻分量執(zhí)行逆R0T。而且,8 X8InvR0T458將作為逆ROT 的結(jié)果所獲得的8X8像素系數(shù)提供給16X 16Inv DCT461。
類似地,8X8InvR0T458使用角度索引分別對從32X32Inv Quant454、64X64Inv Quant455 和 128X128Inv Quant456 提供的已反量化的 32X32、64X64 和 128X128 像素系數(shù)之中的8X8像素低頻分量執(zhí)行逆R0T。而且,8X8Inv R0T458將作為關(guān)于已反量化 32X32,64X64和128X 128像素系數(shù)之中的8X8像素低頻分量的逆ROT的結(jié)果所獲得的 8X8像素系數(shù),分別提供給32X32Inv DCT462、64X64Inv DCT463和 128X 128Inv DCT464。
4X4Inv DCT459 對從4X4Inv R0T457 提供的 4X4 像素系數(shù)執(zhí)行逆DCT。4X4Inv DCT459將作為逆DCT的結(jié)果所獲得的4X4像素殘差信息提供給與圖2的加法器110相同的加法器(未示出)。
8X8Inv DCT460 對從8X8Inv R0T458 提供的 8X8 像素系數(shù)執(zhí)行逆DCT。8X8Inv DCT460將作為逆DCT的結(jié)果所獲得的8X8像素殘差信息提供給與加法器110相同的加法器(未示出)。16X 16Inv DCT461對從8X8Inv R0T458提供的8X8像素系數(shù)和從16X 16Inv Quant453提供的16X 16像素系數(shù)之中不同于8X8像素低頻分量的高頻分量執(zhí)行逆DCT。 16X16Inv DCT461將作為逆DCT的結(jié)果所獲得的16X 16像素殘差信息提供給與加法器110 相同的加法器(未示出)。
類似地,32X32InvDCT462、64X64Inv DCT463 和 128X128Inv DCT464 對從 8X8Inv R0T458 提供的 8X8 像素系數(shù)和從 32X32Inv Quant454、64X64Inv Quant455 和 128 X 128Inv Quant456提供的系數(shù)之中不同于8 X 8像素低頻分量的高頻分量執(zhí)行逆DCT。 32X32Inv DCT462、64X64Inv DCT463 和 128 X 128Inv DCT464 將作為逆 DCT 的結(jié)果所獲得的32 X 32、64 X 64和128 X 128像素殘差信息提供給與加法器110相同的加法器(未示出)。
按照這種方式,殘差信息被輸入給加法器(未示出),由此獲得已解碼圖像。
接著,圖5是圖示圖2的編碼器的正交變換器104、量化器105、反量化器108和逆正交變換器109的細節(jié)的框圖。
在圖5所示的配置中,與圖4的配置相同的配置用相同的附圖標(biāo)記表示。將在適當(dāng)時不提供其冗余描述。
圖5的配置與圖4的配置的主要不同在于提供4X4DCTXR0T501代替正交變換器104的4X4DCT411和4X4R0T417,并且提供4X4Inv ROTX InvDCT502代替逆正交變換器 109 的 4X4Inv R0T457 和 4X4Inv DCT459。
正交變換器104的4X4DCTXR0T501使用角度索引對從圖2的計算設(shè)備103提供的4 X 4像素殘差信息執(zhí)行DCT和ROT的組合變換。具體來說,4 X 4DCT X R0T501提供有對應(yīng)于角度索引的DCT和ROT的組合變換的矩陣,并且4X4DCTXR0T501通過使用該矩陣的一個變換來獲得DCT和ROT之后的4X4像素系數(shù)。4X4DCTXR0T501以取整的計算精度將 4X4像素系數(shù)提供給4X4Quant419。
DCT和ROT是一種正交變換并且通常通過矩陣運算來執(zhí)行。因此,用于DCT和ROT 的組合變換的矩陣是通過在DCT的矩陣運算中使用的矩陣和在ROT的矩陣運算中使用的矩陣的乘積獲得的矩陣。
如上所述,在正交變換器104中,由于可以通過一個變換來對4X4像素殘差信息執(zhí)行DCT和R0T,因此與圖4的正交變換器相比,可以減少正交變換所需的計算量。而且, 由于在DCT之后對計算精度的取整不必要,因此與圖4的正交變換器相比,可以提高計算精度。因此,圖4的4X4R0T417的輸出與圖5的4X4DCTXR0T501的輸出不相同。
而且,逆正交變換器109的4X4Inv ROTXInv DCT502使用角度索引對從4X4Inv Quant451提供的4X4像素系數(shù)執(zhí)行逆DCT和逆ROT的組合變換。具體來說,4X4Inv ROTXInv DCT502提供有用于與角度索引相對應(yīng)的逆DCT和逆ROT的組合變換的矩陣,并且 4X4Inv ROTXInv DCT502通過使用該矩陣的一個變換獲得在逆DCT和逆ROT之后的4X4 像素殘差信息。逆DCT和逆ROT的組合變換是由4X4DCTXR0T501執(zhí)行的變換的逆變換。 4X4InvR0TXInv DCT502將作為該變換的結(jié)果所獲得的4X4像素殘差信息提供給圖2的加法器110。
如上所述,在逆正交變換器109中,由于可以對4X4像素系數(shù)通過一個變換執(zhí)行逆DCT和逆R0T,因此與圖4的逆正交變換器相比,可以減少逆正交變換所需的計算量。而且,由于在逆ROT之后的計算精度的取整不必要,因此與圖4的逆正交變換器相比,可以提高計算精度。因此,圖4的4X4InvDCT459的輸出與圖5的4X4Inv ROTXInv DCT502的輸出不相同。
接著,圖6是圖示當(dāng)DCT和ROT作為正交變換執(zhí)行時傳統(tǒng)解碼器的反量化器和逆正交變換器的框圖。
圖6的傳統(tǒng)解碼器的反量化器具有與圖4的反量化器相同的配置,并且圖6的逆正交變換器具有與如圖4的逆正交變換器相同的配置。
具體來說,圖6的反量化器包括4X4Inv Quant601、8X8Inv Quant602、16X16Inv Quant603、32X32Inv Quant604、64X64Inv Quant605 和128X 128InvQuant606。4X4Inv Quant601 >8X8Inv Quant602、16X 16Inv Quant603、 32X32Inv Quant604、64X64Inv Quant605 和 128 X 128Inv Quant606 以與圖 4 的反量化器類似的方式,對作為從編碼器發(fā)送的已無損編碼圖像壓縮信息的無損解碼的結(jié)果所獲得的已量化系數(shù)執(zhí)行反量化。
而且,圖6 的逆正交變換器包括4X4Inv R0T607、8X8Inv R0T608、4X4Inv DCT609、8X8Inv DCT610、16X16Inv DCT61I、32X32InvDCT612、64X64Inv DCT613 和 128X128Inv DCT614。4X4Inv R0T607 和 8X8Inv R0T608 以與圖 4 的 4X4Inv R0T457 和 8X8Inv R0T458 類似的方式分別執(zhí)行逆 ROT。而且,4X4Inv DCT609、8X8Inv DCT610、 16X16Inv DCT611、32X32Inv DCT612、64X64Inv DCT613 和 128X128Inv DCT614 以與圖 4的相應(yīng)塊尺寸的Inv DCT類似的方式分別執(zhí)行逆DCT。
接著,圖7是圖示圖3的解碼器的反量化器218和逆正交變換器219的細節(jié)的框圖。
圖7的反量化器218具有與圖5的反量化器108相同的配置,并且圖7的逆正交變換器219具有與圖5的逆正交變換器109相同的配置。
在圖7圖示的配置之中,與圖6的配置相同的配置用相同的附圖標(biāo)記表示。在適當(dāng)時不提供其冗余描述。
圖7的配置與圖6的配置主要不同在于與逆正交變換器109類似,提供4X4Inv ROTXInv DCT701 代替逆正交變換器 219 的 4X4Inv R0T607 和 4X4Inv DCT609。
逆正交變換器219的4X4Inv ROTXInv DCT701 以類似于圖 5 的4X4InvR0TX Inv DCT502的方式,使用角度索引對從4X4Inv Quant601提供的4X4像素系數(shù)執(zhí)行逆DCT和逆ROT的組合變換。4X4Inv ROTXInv DCT701將作為該變換的結(jié)果所獲得的4X4像素殘差信息提供給圖3的加法器220。
角度索引例如由編碼器確定,并且由無損編碼器106包括在標(biāo)頭信息中,并被發(fā)送給解碼器。
在本實施例中,盡管對4X4像素殘差信息的DCT和ROT通過一個變換執(zhí)行,但是, 對8X8像素殘差信息以及4X4像素殘差信息的DCT和ROT也可以通過一次變換執(zhí)行。這對于逆DCT和逆ROT同樣成立。
而且,在本實施例中,盡管僅僅對作為DCT的結(jié)果所獲得的、具有8 X 8像素或更大的尺寸的系數(shù)之中的8X8像素的低頻分量執(zhí)行R0T,但是經(jīng)歷ROT的系數(shù)的最大尺寸可以不同于8X8像素的尺寸(例如4X4像素、16X 16像素等)。這對于逆ROT同樣成立。
編碼器處理的描述
圖8、圖9、圖10、圖11和圖12是圖2的編碼器的處理的流程圖。
圖8是描述宏塊(MB)編碼處理的流程圖。
在圖8的步驟S11,編碼器在使用幀間預(yù)測時計算RD成本(P)。將參照隨后描述的圖9說明當(dāng)使用幀間預(yù)測時計算RD成本(P)的處理的細節(jié)。
在步驟S12,編碼器在使用幀內(nèi)預(yù)測時計算RD成本(I)。將參照隨后描述的圖12 說明當(dāng)使用幀內(nèi)預(yù)測時計算RD成本(I)的處理的細節(jié)。
在步驟S13,選擇器117確定RD成本(I)是否大于RD成本(P)。
當(dāng)在步驟S13確定RD成本(I)不大于RD成本(P)時,即當(dāng)RD成本(I)等于或小于RD成本(P)時,選擇器117將最佳幀內(nèi)預(yù)測模式確定為最佳預(yù)測模式。而且,選擇器117 將在最佳幀內(nèi)預(yù)測模式下的預(yù)測圖像提供給計算設(shè)備103和加法器110。而且,選擇器117 將在最佳幀內(nèi)預(yù)測模式下的預(yù)測圖像的選擇通知給幀內(nèi)預(yù)測器114。按照這種方式,幀內(nèi)預(yù)測器114將幀內(nèi)預(yù)測模式信息提供給無損編碼器106。
在步驟S14,編碼器按照在最佳幀內(nèi)預(yù)測模式下的幀內(nèi)預(yù)測對當(dāng)前宏塊(該MB)編碼。具體來說,編碼器的計算設(shè)備103從由幀重排緩存器102讀取的圖像的當(dāng)前宏塊中減去從選擇器117提供的預(yù)測圖像,并且正交變換器104對作為減法的結(jié)果所獲得的殘差信息執(zhí)行正交變換。量化器105量化作為正交變換器104的正交變換的結(jié)果所獲得的系數(shù), 并且無損編碼器106無損編碼已量化系數(shù)并且無損編碼用作標(biāo)頭信息的幀內(nèi)預(yù)測模式信息等。存儲緩存器107暫時存儲其中添加了作為無損編碼的結(jié)果所獲得的標(biāo)頭信息的壓縮圖像,作為圖像壓縮信息,并且輸出該圖像壓縮信息。
另一方面,當(dāng)在步驟S13中確定RD成本(I)大于RD成本(P)時,選擇器117將最佳幀間預(yù)測模式確定為最佳預(yù)測模式。而且,選擇器117將在最佳幀間預(yù)測模式下的預(yù)測圖像提供給計算設(shè)備103和加法器110。而且,選擇器117將在最佳幀間預(yù)測模式下的預(yù)測圖像的選擇通知給運動預(yù)測器116。按照這種方式,運動預(yù)測器116將幀間預(yù)測模式信息、 相應(yīng)運動矢量信息等輸出至無損編碼器106。
在步驟S15,編碼器按照在最佳幀間預(yù)測模式下的幀間預(yù)測對當(dāng)前宏塊編碼。具體來說,編碼器的計算設(shè)備103從幀重排緩存器102讀取的圖像的當(dāng)前宏塊中減去從選擇器117提供的預(yù)測圖像,并且正交變換器104對作為減法的結(jié)果所獲得的殘差信息執(zhí)行正交變換。量化器105對作為正交變換器104的正交變換的結(jié)果所獲得的系數(shù)量化,并且無損編碼器106無損編碼已量化系數(shù),并且對用作標(biāo)頭信息的運動矢量信息和幀間預(yù)測模式信息等無損編碼。存儲緩存器107暫時存儲其中添加了作為無損編碼的結(jié)果所獲得的標(biāo)頭信息的壓縮圖像作為圖像壓縮信息,并且輸出該圖像壓縮信息。
圖9是描述在使用圖8的步驟Sll的幀間預(yù)測時計算RD成本(P)的處理的細節(jié)的流程圖。
在圖9的步驟S31中,運動預(yù)測器116將幀間預(yù)測的塊尺寸設(shè)置為在與各個幀間預(yù)測模式相對應(yīng)的4\4、8\8、16\16、32\32、64\64和128 X 128像素之中還沒有被設(shè)置的一個。
在步驟S32中,運動預(yù)測器116以步驟S31設(shè)置的尺寸執(zhí)行運動預(yù)測。具體來說, 運動預(yù)測器116使用從幀重排緩存器102提供的圖像和從幀存儲器112提供的參考圖像, 在步驟S31中設(shè)置的尺寸的各個塊中執(zhí)行運動預(yù)測。結(jié)果,獲得對于各個塊的運動矢量 (MV)0運動預(yù)測器116將該運動矢量提供給運動補償器113。
在步驟S33,運動補償器113按照從運動預(yù)測器116提供的運動矢量執(zhí)行運動補償 (MC)0具體來說,運動補償器113按照運動矢量從由幀存儲器112提供的參考圖像來產(chǎn)生預(yù)測圖像。運動補償器113將產(chǎn)生的預(yù)測圖像經(jīng)由選擇器117提供給計算設(shè)備103。
在步驟S34,計算設(shè)備103計算與輸入信號相對應(yīng)的圖像與MC圖像(預(yù)測圖像)之間的差。計算設(shè)備103將作為該計算的結(jié)果所獲得的差作為殘差信息提供給正交變換器 104。
在步驟S35,正交變換器104將角度索引設(shè)置為在索引編號0、1、2和3的角度索引之中還沒有被設(shè)置的一個。索引編號是對角度索引\至06的組合獨一無二的編號,并且在本實施例中準(zhǔn)備了編號O至3的4個角度索引的組合。
在步驟S36,正交變換器104執(zhí)行作為相對于從計算設(shè)備103提供的殘差信息(差信息)按照角度索引執(zhí)行ROT的處理的ROT處理等。將參照隨后所述的圖10來描述步驟 S36的細節(jié)。
在步驟S37,量化器105執(zhí)行作為量化作為在步驟S36中的ROT處理等的結(jié)果所獲得的系數(shù)的處理的量化處理。具體來說,與量化器105的幀間預(yù)測的塊尺寸相對應(yīng)的 4X4Quant419、8X8Quant420、16X16Quant421、32X32Quant422、64X64Quant423 或 128X 128Quant424量化從正交變換器104提供的系數(shù)。量化器105將作為量化處理的結(jié)果所獲得的系數(shù)提供給無損編碼器106和反量化器108。
在步驟S38,無損編碼器106對從量化器105提供的系數(shù)(已量化系數(shù))無損編碼, 以獲得壓縮圖像。
在步驟S39,反量化器108執(zhí)行作為對從量化器105提供的系數(shù)反量化的處理的反量化處理。具體來說,與反量化器108的巾貞間預(yù)測的塊尺寸相對應(yīng)的4X4Inv Quant451、 8X 8Inv Quant452、16 X 16Inv Quant453、32X 32InvQuant454、64X64Inv Quant455 或 128X 128Inv Quant456反量化從量化器105提供的系數(shù)。作為反量化器處理的結(jié)果所獲得的系數(shù)被提供給逆正交變換器109。
在步驟S40,逆正交變換器109執(zhí)行作為關(guān)于與殘差信息(差信息)相對應(yīng)的系數(shù)按照在步驟S35設(shè)置的角度索引執(zhí)行逆ROT的處理的逆ROT處理等。將參照隨后所述的圖 11描述步驟S40的處理細節(jié)。
在執(zhí)行步驟S40的處理后,流程返回到步驟S35,并且步驟S35至S40的處理被重復(fù)執(zhí)行,直到索引編號O至3的所有角度索引設(shè)置為角度索引。而且,當(dāng)索引編號O至3的所有角度索引設(shè)置為角度索引時,流程返回到步驟S31。而且,重復(fù)執(zhí)行步驟S31至S40的處理,直至4X4、8X8、16X16、32X32、64X64和128X 128像素的所有尺寸被設(shè)置為幀間預(yù)測的塊尺寸。
而且,當(dāng)4X4、8X8、16X16、32X32、64X64和128X 128像素的所有尺寸被設(shè)置為幀間預(yù)測的塊尺寸,并且索引編號O至3的所有角度索引被設(shè)置為相對于每個塊尺寸的幀間預(yù)測塊的角度索引時,流程進行到步驟S41。
在步驟S41,運動預(yù)測器116相對于幀間預(yù)測模式和角度索引的每個組合根據(jù)MV 信息、已量化編碼信息、已解碼圖像計算RD成本。具體來說,運動預(yù)測器116相對于幀間預(yù)測模式和角度索引的每個組合,使用從幀存儲器112提供的運動矢量和參考圖像,產(chǎn)生預(yù)測圖像。而且,運動預(yù)測器116計算預(yù)測圖像與從幀重排緩存器102提供的圖像之間的差。 而且,運動預(yù)測器116使用該差、由步驟S38的處理獲得的已壓縮圖像的發(fā)生編碼量等計算如上所述的表達式(I ),并且計算所述RD成本。
而且,運動預(yù)測器116使用對應(yīng)于幀間預(yù)測的塊尺寸的幀間預(yù)測模式和角度索引的各個組合的RD成本之中的最小RD成本作為RD成本(P)。也就是說,運動預(yù)測器116將作為幀間預(yù)測模式和角度索引的組合的RD成本之中的最小RD成本的RD成本(P)以及相應(yīng)運動矢量和幀間預(yù)測模式信息提供給運動補償器113。
按照這種方式,運動補償器113基于從運動預(yù)測器116提供的運動矢量和幀間預(yù)測模式信息對從幀存儲器112提供的參考圖像執(zhí)行補償處理,并且產(chǎn)生預(yù)測圖像。而且,運動補償器113將從運動預(yù)測器116提供的RD成本(P)和所產(chǎn)生的預(yù)測圖像提供給選擇器 117。
圖10是描述圖9的步驟S36的處理細節(jié)的流程圖。
在圖10的步驟S51,正交變換器104確定幀間預(yù)測的塊尺寸是否是4X4像素。
當(dāng)在步驟S51確定幀間預(yù)測的塊尺寸是4X4像素時,在步驟S52,正交變換器104 按照角度索引執(zhí)行R0TXDCT的處理。具體來說,正交變換器104的4X4DCTXR0T501 (圖 5)按照圖9的步驟S35中設(shè)置的角度索引,對從計算設(shè)備103提供的殘差信息執(zhí)行DCT 和ROT的組合變換。4X4DCTXR0T501將作為變換結(jié)果所獲得的系數(shù)提供給量化器105的 4X4Quant419。
當(dāng)在步驟S51確定幀間預(yù)測的塊尺寸不是4X4像素時,在步驟S53,正交變換器 104執(zhí)行作為對從計算設(shè)備103提供的殘差信息執(zhí)行DCT的處理的DCT處理。具體來說,與正交變換器104的幀間預(yù)測的塊尺寸相對應(yīng)的8X8DCT412、16X16DCT413、32X32DCT414、 64X64DCT415或128 X 128DCT416對殘差信息執(zhí)行DCT。將作為DCT的結(jié)果所獲得的系數(shù)之中的8X8像素低頻分量提供給8X8R0T418,并且將剩余高頻分量提供給與幀間預(yù)測的塊尺寸相對應(yīng)的 16 X 16Quant421、32 X 32Quant422、64X 64Quant423 或 128 X 128Quant424。
在步驟S54,正交變換器104的8 X 8R0T418相對于低頻分量的8 X 8像素(8 X 8 尺寸)系數(shù)按照圖9的步驟S35中設(shè)置的角度索引執(zhí)行ROT處理。8X8R0T418將作為ROT 處理的結(jié)果所獲得的8X8像素系數(shù)提供給與幀內(nèi)預(yù)測的塊尺寸相對應(yīng)的8X8Quant420、 16X 16Quant421、32X32Quant422、64X64Quant423 或 128X 128Quant424。
圖11是詳細描述圖9的步驟S40的處理的流程圖。
在圖11的步驟S71中,逆正交變換器109確定幀間預(yù)測的塊尺寸是否是4X4像素。
當(dāng)在步驟S71確定幀間預(yù)測的塊尺寸是4X4像素時,在步驟S72,逆正交變換器 109按照角度索引執(zhí)行逆ROT X DCT處理。具體來說,逆正交變換器109的4 X 4Inv ROT X Inv DCT502 (圖5)按照圖35中設(shè)置的角度索引,對從反量化器108的4X4Inv Quant451提供的系數(shù)執(zhí)行逆ROT和逆DCT的組合變換。4X4Inv ROTXInv DCT502將作為該變換的結(jié)果所獲得的殘差信息提供給加法器110。
當(dāng)在步驟S71確定幀間預(yù)測的塊尺寸不是4X4像素時,流程進行到步驟S73。在步驟S73,逆正交變換器109的8X8Inv R0T458 (圖7)相對于從反量化器108提供的8X8 像素或更大像素的尺寸的系數(shù)中的低頻分量的8X8像素(8X8尺寸)系數(shù),按照圖9的步驟S35中設(shè)置的角度索引執(zhí)行作為執(zhí)行逆ROT的處理的逆ROT處理。8X8Inv R0T458將作為逆ROT處理的結(jié)果所獲得的系數(shù)提供給與幀間預(yù)測的塊尺寸相對應(yīng)的8 X 8Inv DCT460、 16X16Inv DCT46U32X32Inv DCT462、64X64Inv DCT463 或 128X 128Inv DCT464。
在步驟S74,逆正交變換器 109 的 8X8Inv DCT460、16X 16Inv DCT46U32X 32Inv DCT462、64X64Inv DCT463 或 128 X 128Inv DCT464 執(zhí)行作為對從 8 X 8Inv R0T458 提供的系數(shù)和從反量化器108提供的系數(shù)執(zhí)行逆DCT的處理的逆DCT處理。將作為逆DCT處理的結(jié)果所獲得的殘差信息提供給加法器110。
圖12是描述當(dāng)詳細使用圖8的步驟S12的幀內(nèi)預(yù)測時計算RD成本(I)的處理的流程圖。
在圖12的步驟S101,幀內(nèi)預(yù)測器114將幀內(nèi)預(yù)測的塊尺寸設(shè)置為在4X4、8X8、 16 X 16、32 X 32、64 X 64和128 X 128像素之中還沒有設(shè)置的一個。
在步驟S102,幀內(nèi)預(yù)測器114將幀內(nèi)預(yù)測模式(幀內(nèi)方向模式)設(shè)置為其幀內(nèi)方向模式編號是0、1、2、3、4、5、6、7或8的巾貞內(nèi)方向模式之中還沒有被設(shè)置的一個。巾貞內(nèi)方向模式編號是對幀內(nèi)預(yù)測模式唯一的編號,而且在本實施例中,準(zhǔn)備八個幀內(nèi)預(yù)測模式的編號 0 8。
在步驟S103,幀內(nèi)預(yù)測器114以步驟SlOl設(shè)置的塊尺寸和幀間預(yù)測模式執(zhí)行運動預(yù)測。具體來說,幀內(nèi)預(yù)測器114使用從幀重排緩存器102提供的圖像和從加法器110提供的參考圖像,在步驟SlOl中設(shè)置的塊尺寸的各個塊中,以所設(shè)置的幀內(nèi)預(yù)測模式執(zhí)行幀內(nèi)預(yù)測處理,并且產(chǎn)生預(yù)測圖像。幀內(nèi)預(yù)測器114將產(chǎn)生的預(yù)測圖像經(jīng)由選擇器117提供給計算設(shè)備103。
在步驟S104中,計算設(shè)備103計算與輸入圖像相對應(yīng)的圖像和幀內(nèi)預(yù)測圖像(由幀內(nèi)預(yù)測處理產(chǎn)生的預(yù)測圖像)之間的差。計算設(shè)備103將作為計算的結(jié)果所獲得的差提供給正交變換器104作為殘差信息。
步驟S105至SllO的處理與圖9的步驟S35至S40的處理相同,并且將不提供其描述。
在執(zhí)行步驟SllO的處理之后,流程返回到步驟S105,并且步驟S105至SllO的處理被重復(fù)執(zhí)行,直至索引編號O至3的所有角度索引被設(shè)置為所述角度索引。而且,當(dāng)索引編號O至3的所有角度索引被設(shè)置為所述角度索引時,流程返回到步驟S102。而且,步驟 S102至SllO的處理被重復(fù)執(zhí)行,直到幀內(nèi)方向模式編號O至8的所有幀內(nèi)預(yù)測模式被設(shè)置為所述幀內(nèi)預(yù)測模式。
而且,當(dāng)幀內(nèi)方向模式編號O至8全部被設(shè)置為所述幀內(nèi)預(yù)測模式時,流程返回到步驟S101。而且,步驟SlOl至SllO的處理被重復(fù)執(zhí)行,直到4X4、8X8、16X16、32X32、 64X64和128X 128像素的全部尺寸設(shè)置為幀內(nèi)預(yù)測的塊尺寸。
而且,當(dāng)4X4、8X8、16X16、32X32、64X64和128X 128像素的所有尺寸被設(shè)置為幀內(nèi)預(yù)測的塊尺寸時,索引編號O至3的所有角度索引被設(shè)置為相對于每個塊尺寸的所述塊的角度索引,并且當(dāng)幀內(nèi)預(yù)測模式O至8的所有幀內(nèi)預(yù)測模式被設(shè)置為幀內(nèi)預(yù)測模式時,流程進行到步驟S111。
在步驟S111,幀內(nèi)預(yù)測器114相對于幀內(nèi)預(yù)測塊尺寸、幀內(nèi)預(yù)測模式和角度索引的每個組合根據(jù)已量化代碼信息和已解碼圖像計算RD成本。具體來說,幀內(nèi)預(yù)測器114相對于幀內(nèi)預(yù)測塊尺寸、幀內(nèi)預(yù)測模式和角度索引,使用從幀存儲器112提供的參考圖像產(chǎn)生預(yù)測圖像。而且,幀內(nèi)預(yù)測器114計算該預(yù)測圖像與從幀重排緩存器102提供的圖像之間的差。而且,運動預(yù)測器116利用所述差、由步驟S108的處理獲得的壓縮圖像的發(fā)生編碼量等計算如上所述的表達式(I)并計算RD成本。
并且,幀內(nèi)預(yù)測器114使用幀內(nèi)預(yù)測塊尺寸、幀內(nèi)預(yù)測模式和角度索引的各個組合的RD成本之中的最小RD成本作為RD成本(I)。也就是說,幀內(nèi)預(yù)測器114將作為幀內(nèi)預(yù)測塊尺寸、幀內(nèi)預(yù)測模式以及角度索引和相應(yīng)預(yù)測圖像的各個組合之中的最小RD成本的RD成本(I)提供給選擇器117。
圖13、圖14和圖15是圖3的解碼器的處理的流程圖。
圖13是描述宏塊(MB)解碼處理的流程圖。
在圖13的步驟S121中,無損解碼器217從存儲緩存器216讀取和采集當(dāng)前宏塊的圖像壓縮信息,并且按照與圖2的無損編碼器106的無損編碼方案相對應(yīng)的方案來無損解碼所述圖像壓縮信息。通過此無損解碼,將幀內(nèi)預(yù)測模式信息或幀間預(yù)測模式信息提取為作為指示當(dāng)前宏塊的最佳預(yù)測模式的信息。
在步驟S122,無損解碼器217確定指示在步驟S121中提取的最佳預(yù)測模式的信息是否是幀內(nèi)預(yù)測模式信息。當(dāng)在步驟S122中確定該信息是幀內(nèi)預(yù)測模式信息時,在步驟 S123,解碼器根據(jù)幀內(nèi)預(yù)測解碼當(dāng)前宏塊(MB)。將參考后面描述的圖15描述步驟S123的處理細節(jié)。
另一方面,當(dāng)在步驟122中確定該信息不是幀內(nèi)預(yù)測模式信息,即,指示在步驟 si2i中提取的最佳預(yù)測模式的信息是幀間預(yù)測模式信息時,該流程前進到步驟Sm。
在步驟S124,解碼器根據(jù)幀間預(yù)測解碼當(dāng)前宏塊。將參考后面描述的圖14描述步驟S124的處理細節(jié)。
圖14是描述圖13的步驟S124的處理細節(jié)的流程圖。
在圖14的步驟141,無損解碼器217從從存儲緩沖器216采集的圖像壓縮信息(流信息)中提取與幀間預(yù)測塊尺寸相對應(yīng)的已量化系數(shù)、運動矢量(MV)、角度索引信息和殘差信息(差信息)。具體地說,無損解碼器217無損解碼圖像壓縮信息來獲得幀間預(yù)測模式信息、運動矢量、角度索引信息和已量化系數(shù)。而且,無損解碼器217識別與該幀間預(yù)測模式信息相對應(yīng)的幀間預(yù)測的塊尺寸。無損解碼器217以對應(yīng)于幀間預(yù)測模式信息的塊尺寸的各個塊,將已量化系數(shù)提供給反量化器218。而且,無損解碼器217將幀間預(yù)測模式信息和運動矢量提供給運動補償器224并將角度索引提供給逆正交變換器219。
在步驟S142,運動補償器224按照從無損解碼器217提供的幀間預(yù)測模式信息和運動矢量,對從幀存儲器223提供的參考圖像執(zhí)行運動補償處理(MC處理)。而且,運動補償器224經(jīng)由開關(guān)227將作為運動補償處理的結(jié)果獲得的預(yù)測圖像提供給加法器220。
在步驟S143,反量化器218對從無損解碼器217提供的已量化系數(shù)執(zhí)行反量化處理。具體來說,與反量化器218的幀間預(yù)測塊尺寸相對應(yīng)的4X4InvQuant601、 8X8Inv Quant602、16X16Inv Quant603、32X32Inv Quant604、64X64Inv Quant605 或 128X 128Inv Quant606反量化已量化系數(shù)。反量化器218將作為反量化處理的結(jié)果所獲得的系數(shù)提供給逆正交變換器219。
在步驟S144,逆正交變換器219相對于與從反量化器218提供的差信息(殘差信息)相對應(yīng)的系數(shù),按照從無損解碼器217提供的角度索引執(zhí)行逆ROT處理等。由于步驟 S144的處理細節(jié)與圖11中所描述的相同,將不提供其描述。
在步驟S145,加法器220將作為步驟S144的處理的結(jié)果所獲得的殘差信息(逆 ROT信息)添加到經(jīng)由開關(guān)227從運動補償器224提供的預(yù)測圖像(預(yù)測信號)以獲得已解碼圖像。將該已解碼圖像提供給幀內(nèi)預(yù)測器225、經(jīng)由去塊濾波器226提供給幀存儲器223 或經(jīng)由去塊濾波器226、幀重排緩存器221和D/Α轉(zhuǎn)換器222提供給外部。
圖15是描述圖13的步驟S123的處理的細節(jié)的流程圖。
在圖15的步驟S161中,無損解碼器217從從存儲緩存器216采集的圖像壓縮信息(流信息)中提取與幀內(nèi)預(yù)測塊尺寸相對應(yīng)的已量化系數(shù)、幀內(nèi)預(yù)測模式、角度索引信息和殘差信息(差信息)。具體來說,無損解碼器217無損解碼所述圖像壓縮信息,以獲得幀內(nèi)預(yù)測模式信息、角度索引信息和已量化系數(shù)。而且,無損解碼器217從幀內(nèi)預(yù)測模式信息識別幀內(nèi)預(yù)測模式和幀內(nèi)預(yù)測塊尺寸。無損解碼器217將已量化系數(shù)按幀內(nèi)預(yù)測塊尺寸的各個塊,提供給反量化器218。而且,無損解碼器217將幀內(nèi)預(yù)測模式信息提供給幀內(nèi)預(yù)測器 225,并且將角度索引提供給逆正交變換器219。
在步驟S162,幀內(nèi)預(yù)測器225按照從無損解碼器217提供的幀內(nèi)預(yù)測模式信息對從加法器220提供的參考圖像執(zhí)行幀內(nèi)預(yù)測處理。而且,幀內(nèi)預(yù)測器225將作為幀內(nèi)預(yù)測處理的結(jié)果所獲得的預(yù)測圖像經(jīng)由開關(guān)227提供給加法器220。
在步驟S163,反量化器218按照類似于圖14的步驟S143的處理的方式,對從無損解碼器217提供的已量化系數(shù)執(zhí)行反量化處理。反量化器218將作為該反量化處理的結(jié)果所獲得的系數(shù)提供給逆正交變換器219。
在步驟S164,逆正交變換器219按照從無損解碼器217提供的角度索引,以類似于步驟S144的處理的方式,對與從反量化器218提供的差信息相對應(yīng)的系數(shù)執(zhí)行逆ROT處理坐寸ο
在步驟S165,加法器220將作為步驟S164的結(jié)果所獲得的殘差信息(逆ROT信息) 經(jīng)由開關(guān)227添加到從幀內(nèi)預(yù)測器225提供的預(yù)測圖像(預(yù)測信號)以獲得已解碼圖像。將已解碼圖像提供給幀內(nèi)預(yù)測器225、經(jīng)由去塊濾波器226提供給幀存儲器223或者經(jīng)由去塊濾波器226、幀重排緩存器221和D/Α轉(zhuǎn)換器222輸出至外部。
應(yīng)用本技術(shù)的計算機的描述。
接著,如上所述的一系列處理不僅通過硬件而且還可以通過軟件執(zhí)行。當(dāng)由軟件執(zhí)行該一系列處理時,包括在軟件中的程序安裝在通用計算機等中。
現(xiàn)在參照圖16,將描述按照本技術(shù)的實施例的計算機的示范性配置,其中安裝了用于執(zhí)行如上所述的一系列處理的程序。
該程序可以預(yù)先記錄在作為配備在計算機中的記錄介質(zhì)的硬盤705或R0M703中。
作為替代,該程序可以存儲(記錄)在可移除記錄介質(zhì)711中。該可移除記錄介質(zhì) 711可以作為所謂封裝軟件提供。這里,例如,該可移除記錄介質(zhì)711可以是軟盤、CD-ROM (致密只讀存儲器)、M0 (磁光)盤、DVD (數(shù)字多功能盤)、磁盤、半導(dǎo)體存儲器等。
除了可以如上所述那樣從可移除記錄介質(zhì)711將程序安裝在計算機中外,還可以通過經(jīng)由通信網(wǎng)絡(luò)或廣播網(wǎng)絡(luò)將程序下載到計算機來將該程序安裝在內(nèi)部硬盤705中。也就是說,該程序可以經(jīng)由數(shù)字廣播衛(wèi)星從下載點以無線方式傳遞到計算機,或者可以經(jīng)由如LAN (局域網(wǎng))或因特網(wǎng)之類的網(wǎng)絡(luò)以有線方式傳遞到計算機。
所述計算機在其中已經(jīng)并入了 CPU (中央處理單元)702,并且輸入/輸出接口 710 經(jīng)由總線701連接到CPU702。
CPU702響應(yīng)于由用戶操作輸入單元707等經(jīng)由輸入/輸出單元710輸入的命令, 執(zhí)行存儲在ROM (只讀存儲器)703中的程序。作為替代,CPU702通過將程序加載在RAM (隨機存儲存儲器)704來執(zhí)行存儲在硬盤705中的程序。
按照這種方式,CPU702執(zhí)行對應(yīng)于如上所述的流程的處理或由所述框示的配置執(zhí)行的處理。然后,CPU702按需要經(jīng)由輸入/輸出接口 710,例如通過輸出單元706、通過通信單元708或在硬盤705中,輸出、發(fā)送或記錄處理結(jié)果。
輸入單元707包括鍵盤、鼠標(biāo)、麥克風(fēng)等。輸出單元706包括IXD (液晶顯示器)、揚聲器等。
這里,在本說明書中,計算機按照所述程序執(zhí)行的處理可以不以在流程圖中所述的次序下的時間順序方式執(zhí)行。也就是說,計算機按照程序執(zhí)行的處理包括并行或分開執(zhí)行的處理(例如,并行處理或基于對象的處理)。
而且,該程序可以通過單個計算機(處理器)執(zhí)行并且可以以分布方式由多個計算機執(zhí)行。而且,該程序可以通過被傳送到遠程地點的計算機來執(zhí)行。
本技術(shù)的實施例可以不限于如上所述的實施例,并且在不偏離本技術(shù)的精神的情形下,可以做出各種改變。
而且,本技術(shù)可以采取下面的配置。
(I) 一種圖像處理設(shè)備,包括
反量化單元,其反量化已量化圖像,以獲得通過在第一正交變換之后執(zhí)行第二正交變換獲得的、具有預(yù)定尺寸的圖像的低頻分量,并且獲得作為不同于圖像的低頻分量的分量并通過第一正交變換獲得的高頻分量;
逆正交變換單元,其當(dāng)所述圖像的尺寸是預(yù)定尺寸時,對作為低頻分量的圖像執(zhí)行第三逆正交變換,該第三逆正交變換是對應(yīng)于所述第一正交變換的第一逆正交變換和對應(yīng)于所述第二正交變換的第二逆正交變換的組合變換,并且其當(dāng)所述圖像的尺寸大于預(yù)定尺寸時,對該低頻分量執(zhí)行第二逆正交變換,并且對已經(jīng)經(jīng)歷第二逆正交變換的低頻分量和由該反量化單元獲得的高頻分量執(zhí)行第一逆正交變換。
(2)按照(I)的圖像處理設(shè)備,其中所述預(yù)定尺寸是4X4像素。
(3)按照(I)的圖像處理設(shè)備,其中所述預(yù)定尺寸當(dāng)該圖像的尺寸是4X4像素時是4X4像素,而當(dāng)該圖像的尺寸是8X8像素或更大時是8X8像素,
當(dāng)所述圖像的尺寸是4X4像素時,該逆正交變換單元對作為低頻分量的圖像執(zhí)行該第三逆正交變換,當(dāng)該圖像的尺寸是8X8像素或更大時,該逆正交變換單元對低頻分量執(zhí)行第二逆正交變換并對已經(jīng)經(jīng)歷第二逆正交變換的所述低頻分量和由反量化單元獲得的高頻分量執(zhí)行該第一逆正交變換。
(4)按照(I)至(3)中的任何一個的圖像處理設(shè)備,其中
所述第一正交變換是離散余弦變換(DCT),并且
所述第二正交變換是旋轉(zhuǎn)變換(R0T)。
(5)按照(I)至(4)中的任何一個的圖像處理設(shè)備,還包括
正交變換單元,其當(dāng)該圖像的尺寸是預(yù)定尺寸時,對該圖像執(zhí)行作為第一正交變換和第二正交變換的組合變換的第三正交變換,并且其當(dāng)所述圖像尺寸大于預(yù)定尺寸時對所述圖像執(zhí)行第一正交變換,而對具有已經(jīng)經(jīng)歷該第一正交變換的預(yù)定尺寸的圖像的低頻分量執(zhí)行第二正交變換;以及
量化單元,其量化已經(jīng)經(jīng)歷第三正交變換具有預(yù)定尺寸的圖像,或量化作為不同于該低頻分量的分量且由該第一正交變換獲得的高頻分量,以及由該第二正交變換獲得的低頻分量。
(6) 一種圖像處理設(shè)備的圖像處理方法,該圖像處理設(shè)備包括
反量化單元,其反量化已量化圖像,以獲得通過在第一正交變換之后執(zhí)行第二正交變換獲得的、具有預(yù)定尺寸的圖像的低頻分量,并且獲得作為不同于圖像的低頻分量的分量并通過第一正交變換獲得的高頻分量;以及
逆正交變換單元,其當(dāng)該圖像的尺寸是預(yù)定尺寸時,對作為低頻分量的該圖像執(zhí)行第三逆正交變換,該第三逆正交變換是對應(yīng)于所述第一正交變換的第一逆正交變換和對應(yīng)于所述第二正交變換的第二逆正交變換的組合變換,并且其當(dāng)所述圖像的尺寸大于預(yù)定尺寸時,對該低頻分量執(zhí)行第二逆正交變換,并且對已經(jīng)經(jīng)歷第二逆正交變換的低頻分量和由該反量化單元獲得的高頻分量執(zhí)行第一逆正交變換,
所述方法包括步驟
允許該反量化單元獲得該低頻分量和高頻分量;以及
允許該逆正交變換單元當(dāng)圖像的尺寸是預(yù)定尺寸時對作為低頻分量的圖像執(zhí)行第三逆正交變換,當(dāng)圖像的尺寸大于預(yù)定尺寸時對所述低頻分量執(zhí)行第二逆正交變換,以及對已經(jīng)經(jīng)歷第二逆正交變換的低頻分量和由反量化單元獲得的高頻分量執(zhí)行第一逆正交變換。
(7) 一種用于使得計算機用作如下單元的程序
反量化單元,其反量化已量化圖像,以獲得通過在第一正交變換之后執(zhí)行第二正交變換獲得的、具有預(yù)定尺寸的圖像的低頻分量,并且獲得作為不同于圖像的低頻分量的分量并通過第一正交變換獲得的高頻分量;以及
逆正交變換單元,其當(dāng)該圖像的尺寸是預(yù)定尺寸時,對作為低頻分量的該圖像執(zhí)行第三逆正交變換,該第三逆正交變換是對應(yīng)于所述第一正交變換的第一逆正交變換和對應(yīng)于所述第二正交變換的第二逆正交變換的組合變換,并且其當(dāng)所述圖像的尺寸大于預(yù)定尺寸時,對該低頻分量執(zhí)行第二逆正交變換,并且對已經(jīng)經(jīng)歷第二逆正交變換的低頻分量和由該反量化單元獲得的高頻分量執(zhí)行第一逆正交變換。
附圖標(biāo)記列表
104正交變換器
105量化器
108反量化器
109逆正交變換器
218反量化器
219逆正交變換器
701總線
702CPU
703ROM
704RAM
705硬盤
706輸出單元
707輸入單元
708通信單元
709驅(qū)動
710輸入/輸出接口
711可移除記錄介質(zhì)
權(quán)利要求
1.ー種圖像處理設(shè)備,包括 反量化単元,其反量化已量化圖像,以獲得通過在第一正交變換之后執(zhí)行第二正交變換獲得的、具有預(yù)定尺寸的圖像的低頻分量,并且獲得作為不同于圖像的低頻分量的分量并通過第一正交變換獲得的高頻分量; 逆正交變換單元,其當(dāng)所述圖像的尺寸是預(yù)定尺寸吋,對作為低頻分量的圖像執(zhí)行第三逆正交變換,該第三逆正交變換是對應(yīng)于所述第一正交變換的第一逆正交變換和對應(yīng)于所述第二正交變換的第二逆正交變換的組合變換,并且其當(dāng)所述圖像的尺寸大于預(yù)定尺寸時,對該低頻分量執(zhí)行第二逆正交變換并且對已經(jīng)經(jīng)歷第二逆正交變換的低頻分量和由該反量化單元獲得的該高頻分量執(zhí)行第一逆正交變換。
2.如權(quán)利要求I所述的圖像處理設(shè)備,其中 所述預(yù)定尺寸是4X4像素。
3.如權(quán)利要求I所述的圖像處理設(shè)備,其中 所述預(yù)定尺寸當(dāng)該圖像的尺寸是4X4像素時是4X4像素,而當(dāng)該圖像的尺寸是8X8像素或更大時是8X8像素, 當(dāng)所述圖像的尺寸是4X4像素時,該逆正交變換單元對作為低頻分量的圖像執(zhí)行該第三逆正交變換,并且 當(dāng)該圖像的尺寸是8X8像素或更大時,該逆正交變換單元對低頻分量執(zhí)行第二逆正交變換并對已經(jīng)經(jīng)歷第二逆正交變換的所述低頻分量和由反量化單元獲得的高頻分量執(zhí)行該第一逆正交變換。
4.如權(quán)利要求I所述的圖像處理設(shè)備,其中 所述第一正交變換是離散余弦變換(DCT),以及 所述第二正交變換是旋轉(zhuǎn)變換(ROT)。
5.如權(quán)利要求I所述的圖像處理設(shè)備,還包括 正交變換單元,其當(dāng)該圖像的尺寸是預(yù)定尺寸時,對該圖像執(zhí)行作為第一正交變換和第二正交變換的組合變換的第三正交變換,并且其當(dāng)所述圖像尺寸大于預(yù)定尺寸時,對所述圖像執(zhí)行第一正交變換并對具有已經(jīng)經(jīng)歷該第一正交變換的預(yù)定尺寸的圖像的低頻分量執(zhí)行第二正交變換;以及 量化単元,其量化已經(jīng)經(jīng)歷第三正交變換具有預(yù)定尺寸的圖像,或量化作為不同于該低頻分量的分量且由該第一正交變換獲得的高頻分量,以及由該第二正交變換獲得的低頻分量。
6.一種圖像處理設(shè)備的圖像處理方法,該圖像處理設(shè)備包括 反量化単元,其反量化已量化圖像,以獲得通過在第一正交變換之后執(zhí)行第二正交變換獲得的、具有預(yù)定尺寸的圖像的低頻分量,并且獲得作為不同于圖像的低頻分量的分量并通過第一正交變換獲得的高頻分量;以及 逆正交變換單元,其當(dāng)該圖像的尺寸是預(yù)定尺寸吋,對作為低頻分量的該圖像執(zhí)行第三逆正交變換,該第三逆正交變換是對應(yīng)于所述第一正交變換的第一逆正交變換和對應(yīng)于所述第二正交變換的第二逆正交變換的組合變換,并且其當(dāng)所述圖像的尺寸大于預(yù)定尺寸時,對該低頻分量執(zhí)行第二逆正交變換,并且對已經(jīng)經(jīng)歷第二逆正交變換的低頻分量和由該反量化單元獲得的高頻分量執(zhí)行第一逆正交變換,所述方法包括步驟 允許該反量化單元獲得該低頻分量和高頻分量;以及 允許該逆正交變換單元當(dāng)圖像的尺寸是預(yù)定尺寸時對作為低頻分量的圖像執(zhí)行第三逆正交變換,當(dāng)圖像的尺寸大于預(yù)定尺寸時對所述低頻分量執(zhí)行第二逆正交變換,以及對已經(jīng)經(jīng)歷第二逆正交變換的低頻分量和由反量化單元獲得的高頻分量執(zhí)行第一逆正交變換。
7.一種用于使得計算機用作如下単元的程序 反量化単元,其反量化已量化圖像,以獲得通過在第一正交變換之后執(zhí)行第二正交變換獲得的、具有預(yù)定尺寸的圖像的低頻分量,并且獲得作為不同于圖像的低頻分量的分量并通過第一正交變換獲得的高頻分量;以及 逆正交變換單元,其當(dāng)該圖像的尺寸是預(yù)定尺寸吋,對作為低頻分量的該圖像執(zhí)行第三逆正交變換,該第三逆正交變換是對應(yīng)于所述第一正交變換的第一逆正交變換和對應(yīng)于所述第二正交變換的第二逆正交變換的組合變換,并且其當(dāng)所述圖像的尺寸大于預(yù)定尺寸時,對該低頻分量執(zhí)行第二逆正交變換,并且對已經(jīng)經(jīng)歷第二逆正交變換的低頻分量和由該反量化單元獲得的高頻分量執(zhí)行第一逆正交變換。
全文摘要
本發(fā)明公開了一種圖像處理設(shè)備、圖像處理方法和程序,其可以減少為ROT和DCT或逆DCT和逆ROT所需要的處理量。通過逆量化通過解碼已編碼圖像而獲得的圖像信息,獲得經(jīng)由第一正交變換單元獲得的所述圖像信息的低頻分量和經(jīng)由第二正交變換單元獲得的所述圖像信息的高頻分量。所述高頻分量在頻率上高于所述低頻分量。然后,所述低頻分量和高頻分量經(jīng)由類似技術(shù)經(jīng)歷逆正交變換。該技術(shù)例如可以應(yīng)用于圖像編碼和解碼。
文檔編號H04N7/30GK102986223SQ201180034020
公開日2013年3月20日 申請日期2011年7月8日 優(yōu)先權(quán)日2010年7月16日
發(fā)明者近藤健治 申請人:索尼公司