專利名稱:利用一個公共的或三個不同的空間預(yù)測器的亮度-色度編碼的制作方法
技術(shù)領(lǐng)域:
本發(fā)明一般涉及視頻編碼器和解碼器,并且尤其涉及視頻編碼與解碼方法 和設(shè)備。
背景技術(shù):
目前,國際電信聯(lián)盟電信標(biāo)準(zhǔn)化部門(ITU-T)H.264標(biāo)準(zhǔn)(以下稱為"H.264 標(biāo)準(zhǔn)")的4:4:4格式只將三個通道之一編碼為亮度,而利用較低效工具將另外 兩個通道編碼為色度。當(dāng)編解碼器的輸入是每一個輸入分量都具有全分辨率的 4:4:4格式時,利用較低效色度編碼算法對三個輸入分量中的兩個分量進(jìn)行編 碼將導(dǎo)致在這兩個通道中使用更多的位。該特殊問題在幀內(nèi)幀中更為顯著。例 如,對于40dB (PSNR)及以上的整體壓縮質(zhì)量,以Intra-Only (僅僅幀內(nèi)) 模式運行的H.264標(biāo)準(zhǔn)比JPEG2k效率低。因此,所希望、且非常有利的是獲得克服上述現(xiàn)有技術(shù)缺點的視頻編碼與 解碼方法和設(shè)備。發(fā)明內(nèi)容本發(fā)明致力于解決現(xiàn)有技術(shù)的這些及其它缺點和不利條件,其涉及視頻編 碼和解碼方法及設(shè)備。根據(jù)本發(fā)明一方面,提供一種用于對圖像塊的視頻信號數(shù)據(jù)進(jìn)行編碼的視 頻編碼器。該視頻編碼器包括編碼器,用于利用視頻信號數(shù)據(jù)的每個顏色分量 的唯一預(yù)測器,來對該視頻信號數(shù)據(jù)進(jìn)行編碼。根據(jù)本發(fā)明另一方面,提供一種用于對圖像塊的視頻信號數(shù)據(jù)進(jìn)行編碼的 方法。該方法包括,利用視頻信號數(shù)據(jù)的每個顏色分量的唯一預(yù)測器,來對該 視頻信號數(shù)據(jù)進(jìn)行編碼。根據(jù)本發(fā)明又一方面,提供一種用于對圖像塊的視頻信號數(shù)據(jù)進(jìn)行解碼的 視頻解碼器。該視頻解碼器包括解碼器,用于利用視頻信號數(shù)據(jù)的每個顏色分 量的唯一預(yù)測器,來對該視頻信號數(shù)據(jù)進(jìn)行解碼。根據(jù)本發(fā)明又一方面,提供一種用于對圖像塊的視頻信號數(shù)據(jù)進(jìn)行解碼的 方法。該方法包括利用視頻信號數(shù)據(jù)的每個顏色分量的唯一預(yù)測器,來對該視 頻信號數(shù)據(jù)進(jìn)行編碼。以下將要結(jié)合附圖對示范性實施例進(jìn)行詳細(xì)描述,本發(fā)明的這些及其它方 面、特征和有益效果將變得很清楚。
根據(jù)以下示例圖可以更好地理解本發(fā)明,其中-
圖1是示出可以應(yīng)用本發(fā)明原理的示范性視頻編碼設(shè)備的框圖; 圖2是示出可以應(yīng)用本發(fā)明原理的示范性視頻解碼設(shè)備的框圖;圖3是示出根據(jù)本發(fā)明原理具有預(yù)編碼顏色變換塊的示范性視頻編碼過 程的流程圖;圖4是示出根據(jù)本發(fā)明原理具有后解碼逆顏色變換塊的示范性視頻解碼 過程的流程圖;圖5是示出殘差顏色轉(zhuǎn)換(RCT)簡化模型的框圖;圖6A和6B是根據(jù)本發(fā)明原理的、關(guān)于ATV intra-only的平均PSNR對位速率的曲線;圖7A和7B是根據(jù)本發(fā)明原理的、關(guān)于CT intra-only的平均PSNR對位速率的曲線;圖8A和8B是根據(jù)本發(fā)明原理的、關(guān)于DT intra-only的平均PSNR對位速率的曲線;圖9A和9B是根據(jù)本發(fā)明原理的、關(guān)于MIR—HD intra-only的平均PSNR對位速率的曲線;圖10A和10B是根據(jù)本發(fā)明原理的、關(guān)于RT intra-only的平均PSNR對位速率的曲線;圖IIA和11B是根據(jù)本發(fā)明原理的、關(guān)于STB—HD intra-only的平均PSNR對位速率的曲線;圖12是示出根據(jù)本發(fā)明原理的H.264序列參數(shù)句法的表; 圖13是示出根據(jù)本發(fā)明原理的H.264殘差數(shù)據(jù)句法的表; 圖14是示出根據(jù)本發(fā)明原理具有預(yù)編碼顏色變換塊的示范性視頻編碼過程的流程圖15是示出根據(jù)本發(fā)明原理具有后解碼逆顏色變換步驟塊的示范性視頻 解碼過程的流程圖;以及圖16是示出根據(jù)本發(fā)明原理的H.264宏塊預(yù)測句法的表。
具體實施方式
本發(fā)明針對用于對視頻信號數(shù)據(jù)進(jìn)行視頻編碼和解碼的方法和設(shè)備。應(yīng)該 理解,雖然主要對于利用ITU-T H.264標(biāo)準(zhǔn)的4:4:4格式采樣的視頻信號數(shù)據(jù) 來描述本發(fā)明,但是在保持本發(fā)明范圍的同時,本發(fā)明也可應(yīng)用于利用H.264 標(biāo)準(zhǔn)的其它格式(例如4:2:2和/或4:2:0格式)以及其它視頻壓縮標(biāo)準(zhǔn)采樣的視頻信號數(shù)據(jù)。應(yīng)該理解,根據(jù)本發(fā)明原理的方法和設(shè)備不需要為亮度或色度壓縮算法使 用任何新工具。而是可以使用現(xiàn)有亮度編碼工具。因此,由此的一個有利結(jié)果 是,可以在保持向后兼容性、并使現(xiàn)有H.264標(biāo)準(zhǔn)(或其它適用標(biāo)準(zhǔn))的任何 變化最小化的同時,使4:4:4格式的編碼性能最大化。根據(jù)如實施例中所配置的本發(fā)明原理,利用亮度編碼算法來對例如4:4:4 內(nèi)容的所有三個分量通道進(jìn)行編碼。該實施例的優(yōu)點包括,相對于現(xiàn)有技術(shù)提 高了 4:4:4內(nèi)容壓縮的整體編碼性能。目前,在現(xiàn)有H.264標(biāo)準(zhǔn)中,只將三個 通道之一編碼為亮度,而利用較低效工具將另外兩個通道編碼為色度。進(jìn)一歩,根據(jù)如實施例中所配置的本發(fā)明原理,執(zhí)行顏色變換作為預(yù)處理 步驟。因而,根據(jù)該實施例,在壓縮循環(huán)中不執(zhí)行殘差顏色轉(zhuǎn)換(RCT)。該 實施例的優(yōu)點包括,在所有顏色格式之間提供一致的編碼器/解碼器結(jié)構(gòu)。而且,根據(jù)如實施例中所配置的本發(fā)明原理,將相同的運動/空間預(yù)測模 式用于所有三個分量。該實施例的優(yōu)點包括減小的編解碼器復(fù)雜性以及向后兼容性。而且,根據(jù)另一實施例,不是為所有三個分量使用相同預(yù)測器,而是可以 為三個分量使用3個約束空間預(yù)測器的集合(或子集)。該實施例的優(yōu)點包括,相對于現(xiàn)有技術(shù)提高了 4:4:4內(nèi)容壓縮的整體編碼性能。應(yīng)該理解,可以將以上及隨后在此描述的各實施例實施為單獨實施例,或 者可以按照如該領(lǐng)域和相關(guān)領(lǐng)域的普通技術(shù)人員所容易理解的任何方式進(jìn)行 組合。因而,例如在第一組合實施例中,有利地利用亮度編碼算法對所有三個 分量通道進(jìn)行編碼,執(zhí)行顏色變換作為預(yù)處理步驟,并將單個預(yù)測器用于所有 三個分量通道。在第二組合實施例中,有利地利用亮度編碼算法對所有三個分 量通道進(jìn)行編碼,執(zhí)行顏色變換作為預(yù)處理步驟,并可以將3個約束空間預(yù)測 器的集合(或子集)用于三個分量通道。當(dāng)然,如上所述,給定在此提供的本 發(fā)明原理的教導(dǎo),在保持本發(fā)明范圍的同時,也可實施各實施例的其它組合。本說明書舉例說明本發(fā)明的原理。因而,應(yīng)該理解,本領(lǐng)域技術(shù)人員將能 夠設(shè)計出雖然在此未明確描述或示出、但是能具體實施本發(fā)明原理且被包括在 本發(fā)明精神和范圍內(nèi)的各種配置。在此列舉的所有例子和條件性語言都用于教導(dǎo)目的以幫助讀者理解本發(fā) 明人所提出的、有助于促進(jìn)本技術(shù)領(lǐng)域發(fā)展的本發(fā)明原理和概念,并且應(yīng)該認(rèn) 為本發(fā)明不限于這些具體列舉的例子和條件。而且,在此列舉本發(fā)明原理、方面和實施例及本發(fā)明特定例子的所有語句, 都預(yù)定包括其結(jié)構(gòu)和功能等效物。另外,這種等效物預(yù)定包括當(dāng)前已知的等效 物以及將來開發(fā)的等效物,即與結(jié)構(gòu)無關(guān)的執(zhí)行相同功能的任何被開發(fā)元件。因而,例如木領(lǐng)域技術(shù)人員應(yīng)該理解,在此給出的框圖代表具體實施本發(fā) 明原理的說明性電路的概念圖。類似應(yīng)該理解,任何流程表、流程圖、狀態(tài)轉(zhuǎn)
移圖、偽碼等,都代表實質(zhì)上可以在計算機可讀介質(zhì)中表示、從而可通過計算 機或處理器來執(zhí)行的各種過程,而不管這種計算機或處理器是否明確示出。利用專用硬件以及能夠與適當(dāng)軟件關(guān)聯(lián)地執(zhí)行軟件的硬件,可以提供圖中 所示的各種元件的功能。當(dāng)通過處理器來提供這些功能時,可以通過單個專用 處理器、或通過單個共享處理器、或通過其中一些可以被共享的多個單獨處理 器,來提供這些功能。而且,術(shù)語"處理器"或"控制器"的顯式使用不應(yīng)被 認(rèn)為只指能夠執(zhí)行軟件的硬件,而是可以隱含地包括但不限于數(shù)字信號處理器(DSP)硬件、用于存儲軟件的只讀存儲器(ROM)、隨機存儲器(RAM)和非易失性存儲器。也可以包括其它常規(guī)和/或定制的硬件。類似,圖中所示的任何開關(guān)都只 是概念性的。如從上下文更具體地理解的,可以通過程序邏輯操作、通過專用 邏輯、通過程序控制和專用邏輯的交互、乃至手動操作,來實現(xiàn)它們的功能, 可以由實施者來選擇特殊技術(shù)。在本發(fā)明權(quán)利要求中,被表示為用于執(zhí)行指定功能的裝置的任何元件都預(yù) 定包括執(zhí)行該功能的任何方式,例如包括a)執(zhí)行該功能的電路元件的組合; 或b)任何形式的軟件,因而包括和用于執(zhí)行該軟件的適當(dāng)電路相結(jié)合、以執(zhí)行 該功能的固件、微碼等。如這些權(quán)利要求所定義的本發(fā)明在于,以權(quán)利要求所 要求的方式來組合并集合由列舉的各種裝置所提供的功能性。因而,認(rèn)為能夠 提供這些功能性的任何裝置都等效于在此所示出的那些裝置。轉(zhuǎn)到圖l, 一般用附圖標(biāo)記199來表示示范性視頻編碼設(shè)備。視頻編碼設(shè) 備199包括視頻編碼器100和預(yù)編碼顏色變換模塊105。預(yù)編碼顏色變換模塊105用于,在視頻信號輸入到視頻編碼器100之前對 視頻信號執(zhí)行顏色預(yù)處理。以下進(jìn)一步描述預(yù)編碼顏色變換模塊105所執(zhí)行的 顏色預(yù)處理。應(yīng)該理解,在某些實施例中可省略預(yù)編碼顏色變換模塊105。預(yù)編碼顏色變換模塊105的輸入和視頻編碼器100的輸入可用作視頻編碼 設(shè)備199的輸入。預(yù)編碼顏色變換模塊105的輸出以信號通信方式與視頻編碼器100的輸入 相連。視頻編碼器100的輸入以信號通信方式與求和點110的非反相輸入相連。 求和點110的輸出以信號通信方式與變換器/量化器120相連。變換器/量化器 120的輸出以信號通信方式與熵編碼器140相連。熵編碼器140的輸出可用作 視頻編碼器100的輸出,并且也可用作視頻編碼設(shè)備199的輸出。變換器/量化器120的輸出進(jìn)一步以信號通信方式與逆變換器/逆量化器 150相連。逆變換器/逆量化器150的輸出以信號通信方式與解塊濾波器160的 輸入相連。解塊濾波器160的輸出以信號通信方式與參考圖像存儲器170相連。 參考圖像存儲器170的第一輸出以信號通信方式與運動和空間預(yù)測估計器180 的第一輸入相連。視頻編碼器100的輸入進(jìn)一步以信號通信方式與運動和空間 預(yù)測估計器180的第二輸入相連。運動和空間預(yù)測估計器180的輸出以信號通 信方式與運動和空間預(yù)測補償器190的第一輸入相連。參考圖像存儲器170的 第二輸出以信號通信方式與運動和空間預(yù)測補償器190的第二輸入相連。運動 和空間預(yù)測補償器190的輸出以信號通信方式與求和點110的反相輸入相連。轉(zhuǎn)到圖2, 一般用附圖標(biāo)記299來表示示范性視頻解碼設(shè)備。視頻解碼設(shè) 備299包括視頻解碼器200和后解碼器逆顏色變換模塊293。視頻解碼器200的輸入可用作視頻解碼設(shè)備299的輸入。視頻解碼器200 的輸入以信號通信方式與熵解碼器210的輸入相連。熵解碼器210的第一輸出 以信號通信方式與逆量化器/逆變換器220的輸入相連。逆量化器/逆變換器220 的輸出以信號通信方式與求和點240的第一輸入相連。求和點240的輸出以信號通信方式與解塊濾波器290相連。解塊濾波器 290的輸出以信號通信方式與參考圖像存儲器250相連。參考圖像存儲器250 以信號通信方式與運動和空間預(yù)測補償器260的第一輸入相連。運動和空間預(yù) 測補償器260的輸出以信號通信方式與求和點240的第二輸入相連。熵解碼器 210的第二輸出以信號通信方式與運動和空間預(yù)測補償器260的第二輸入相 連。解塊濾波器290的輸出可用作視頻解碼器200的輸出,并且也可用作視頻 解碼設(shè)備299的輸出。而且,后解碼逆顏色變換模塊293的輸出可用作視頻解碼設(shè)備299的輸出。 在這種情況下,視頻解碼器200的輸出可以以信號通信方式與后解碼逆顏色變 換模塊293的輸入相連,后解碼逆顏色變換模塊293是關(guān)于視頻解碼器200的 后處理模塊。后解碼逆顏色變換模塊293的輸出提供相對于視頻解碼器200輸 出的后處理逆顏色變換信號。應(yīng)該理解,后解碼逆顏色變換模塊293的使用是 可選的。現(xiàn)在描述根據(jù)本發(fā)明原理的增強4:4:4編碼。首先描述的實施例是一種組 合實施例,其中將亮度編碼算法用于所有顏色分量,將相同空間預(yù)測模式用于 所有顏色分量,且從壓縮循環(huán)中省略殘差顏色轉(zhuǎn)換(RCT)。也提供該組合實 施例的測試結(jié)果。隨后,描述第二組合實施例,其中將亮度編碼算法用于所有 顏色分量,將約束空間預(yù)測器的集合(或子集)(而不是單一空間預(yù)測模式) 用于所有顏色分量,并從壓縮循環(huán)中省略RCT。因而,第一和第二組合實施例 之間的不同在于,在第一組合實施例中將單一空間預(yù)測模式用于所有顏色分 量,而在第二組合實施例中將約束空間預(yù)測器的集合(或子集)用于所有顏色 分量。當(dāng)然,如上所述,可以將在此描述的各實施例實施為單獨實施例,或者
可以按照如該領(lǐng)域和相關(guān)領(lǐng)域的普通技術(shù)人員所容易理解的任何方式進(jìn)行組 合。例如,根據(jù)如實施例中所配置的本發(fā)明原理,只使用單一空間預(yù)測模式,而不和其它實施例組合,如從壓縮循環(huán)中省略RCT。應(yīng)該理解,給定在此提供的本發(fā)明原理的教導(dǎo),在保持本發(fā)明范圍的同時,該領(lǐng)域和相關(guān)領(lǐng)域的普通技 術(shù)人員將能夠容易弄清本發(fā)明的實施例的這些和其它變化、實施和組合。轉(zhuǎn)到圖3, 一般分別用附圖標(biāo)記300和301來表示具有預(yù)編碼顏色變換塊 的示范性視頻編碼過程。應(yīng)該理解,預(yù)編碼顏色變換塊301包括塊306、 308和310。而且,應(yīng)該 理解,預(yù)編碼顏色變換塊301是可選的,因而在本發(fā)明某些實施例中可以省略。預(yù)編碼顏色變換塊301包括循環(huán)限制塊306,循環(huán)限制塊306對圖像中的 每-個塊開始循環(huán),并將控制傳遞給功能塊308。功能塊308對當(dāng)前圖像塊的 視頻信號數(shù)據(jù)執(zhí)行顏色預(yù)處理,并將控制傳遞給循環(huán)限制塊310。循環(huán)限制塊 310結(jié)束循環(huán)。而且,循環(huán)限制塊310將控制傳遞給被包括在視頻編碼過程300 中的循環(huán)限制塊312。循環(huán)限制塊312對圖像中每一個塊開始循環(huán),并將控制傳遞給功能塊315。 功能塊315利用一個用于當(dāng)前圖像塊每個顏色分量的公共預(yù)測器,來形成當(dāng)前 圖像塊的運動補償或空間預(yù)測,并將控制傳遞給功能塊320。功能塊320從當(dāng) 前圖像塊減去運動補償或空間預(yù)測,以形成預(yù)測殘差,并將控制傳遞給功能塊 330。功能塊330對預(yù)測殘差進(jìn)行變換和量化,并將控制傳遞給功能塊335。功 能塊335對預(yù)測殘差進(jìn)行逆變換和逆量化,以形成編碼預(yù)測殘差,并將控制傳 遞給功能塊345。功能塊345將編碼殘差加到預(yù)測上,以形成編碼圖像塊,并 將控制傳遞給結(jié)束循環(huán)塊350。結(jié)束循環(huán)塊350結(jié)束循環(huán),并將控制傳遞給結(jié) 束塊355。
轉(zhuǎn)到圖4, 一般分別用附圖標(biāo)記400和460來表示具有后解碼逆顏色變換 塊的示范性視頻解碼過程。應(yīng)該理解,后解碼逆顏色變換塊460包括塊462、 464、 466和468。而且, 應(yīng)該理解,后解碼逆顏色變換塊460是可選的,因而在本發(fā)明某些實施例中可 以省略。解碼過程400包括循環(huán)限制塊410,循環(huán)限制塊410對圖像中的當(dāng)前塊開 始循環(huán),并將控制傳遞給功能塊415。功能塊415對編碼殘差進(jìn)行熵解碼,并 將控制傳遞給功能塊420。功能塊420對解碼的殘差進(jìn)行逆變換和逆量化,以 形成編碼殘差,并將控制傳遞給功能塊430。功能塊430將編碼殘差加到由應(yīng) 用于每個顏色分量的公共預(yù)測器所形成的預(yù)測上,以形成編碼圖像塊,并將控 制傳遞給循環(huán)限制塊435。循環(huán)限制塊435結(jié)束循環(huán),并將控制傳遞給結(jié)束塊 440。在某些實施例屮,循環(huán)限制塊435可選地將控制傳遞給后解碼逆顏色變換 塊460,尤其是后解碼逆顏色變換塊460中所包括的循環(huán)限制塊462。循環(huán)限 制塊462對圖像中每個塊開始循環(huán),并將控制傳遞給功能塊464。功能塊464 對當(dāng)前圖像塊的視頻信號數(shù)據(jù)執(zhí)行逆顏色后處理,并將控制傳遞給循環(huán)限制塊 466。循環(huán)限制塊466結(jié)束循環(huán),并將控制傳遞給結(jié)束塊468。在H.264 4:4:4格式中,每個分量通道都具有全分辨率。因而,根據(jù)上述 第一組合實施例,對每個顏色分量都使用亮度編碼算法,以獲得最大整體壓縮 效率。因此,在該實施例中,對于幀內(nèi)幀,例如可以利用2004年7月的文檔 N6540, ISO) /IEC 14496 10高級視頻編碼第三版(ITU-TRec. H.264)、 ISO/IEC JTC1/SC29/WG11和ITU-T SG16 Q.6中的表8-2、表8-3和表8-4中所列出的 那些預(yù)測模式,來Iii縮每種顏色分量。
另外,在實施例中,將相同空間預(yù)測模式用于所有三個像素分量,以進(jìn)一 步減小編解碼器的復(fù)雜性以及提高性能。例如,所有三個分量都可以使用通過宏塊預(yù)觀!J 頭中的亮度的 prev—intra4x4_pred—mode—flag 、 rem—intra4x4_pred—mode、 prev—intra8x8_pred—mode—flag 禾口 rem—intra8x8_pred_mode參數(shù)所設(shè)置的預(yù)測模式。因此,不需要額外的比特位 和句法元素。對于B和P (預(yù)測)幀,可以通過H.264標(biāo)準(zhǔn)的8.4.2.2.1節(jié)中描述的插值方法,對所有三個通道計算小數(shù)像素位置處的參考像素。以下進(jìn)一步 討論當(dāng)前H.264標(biāo)準(zhǔn)的詳細(xì)句法和語義變化。在高4:4:4檔次(Hign 4:4:4 profile)中,將RCT加到編碼器/解碼器上。 結(jié)果,4:4:4格式的壓縮結(jié)構(gòu)不同于H.264標(biāo)準(zhǔn)的所有其它檔次中當(dāng)前為4:2:0 和4:2:2格式使用的壓縮結(jié)構(gòu)。這導(dǎo)致了某些額外的實施復(fù)雜性。而且,類似 于其它任何顏色變換,YCOCG不一定提高整體壓縮性能。YCOCG的效率是 與內(nèi)容高度相關(guān)的。因而,為提高整體壓縮性能和魯棒性,在實施例中,將顏 色變換放在預(yù)測循環(huán)外,作為預(yù)處理塊一部分。通過這樣做,為特定壓縮任務(wù) 選擇最佳顏色變換是操作問題,并且可以在許多選項中找到特殊輸入序列的最 佳的顏色變換。根據(jù)其中所有三個分量都將相同空間預(yù)測器用于幀內(nèi)幀、并將 相同插值濾波器用于B和P (預(yù)測或幀間編碼)幀的實施例,當(dāng)忽略舍入/截斷 誤差時,對預(yù)測殘差執(zhí)行顏色變換等同于在編解碼器外對源圖像執(zhí)行顏色變 換。以下將進(jìn)一步對此進(jìn)行討論。因而,從編碼結(jié)構(gòu)去除RCT塊,以使編碼 結(jié)構(gòu)在所有顏色格式之間一致。轉(zhuǎn)到圖5, 一般用附圖標(biāo)記500來表示RCT簡化模型。RCT模型500包 括參考像素發(fā)生器510、求和點520和線性變換模塊530。參考像素發(fā)生器510 的輸入被配置成接收運動/邊緣信息和矢量[X1],[X2]......[Xn]. 參考像素發(fā)生器510的輸出以信號通信方式與求和點520的反相輸入相連,參考象素發(fā)生器510 向求和點520提供預(yù)測矢量[Xp]。求和點520的非反相輸入被配置成接收輸入 矢量[《 ]。求和點520的輸出以信號通信方式與線性變換模塊530的輸入相連, 求和點520向線性變換模塊530提供矢量[Xd]。線性變換模塊530的輸出被配 置成提供矢量[iy。在RCT 500的簡化模型中,由3x3矩陣[^]表示的顏色變換(線性變換)被定義如下(1)K丄[^], W], K]……[A]是代表RGB域中像素的3xl矢量。[YJ 是代表顏色變換結(jié)果的3xl矢量。因此陣[豐H剩-, (2) 因為在實施例中,根據(jù)如實施例中所配置的本發(fā)明原理,將相同的空間預(yù)測器和插值濾波器用于宏塊中的所有三個分量,所以可以將參考像素py表示如下<formula>formula see original document page 19</formula>(3)其中nxl矢量[C]代表H.264標(biāo)準(zhǔn)中定義的空間預(yù)測器和插值濾波器中涉及的 線性運算。在此,假定利用總共"個相鄰像素[A],….[^ ]來計算參考像素。將式(3)中的[Xp]代入式(2)得到以下結(jié)果i l i 2i 3......i "Gi G2。G 及52 ......C2 C3(4)忽略舍入/截斷誤差并假定在RGB或Y域選擇相同預(yù)測模式,得到以下結(jié),剛-a 7 27 3......aG, G2 Gs......G"fil 53......5"=[4:t2 h……WJ W2W3......WwVI V2 V3.......VnC3(5)因此,[r"]二[E"]-[yu3.....C3(6)因而,式(6)清楚地顯示出,把YUV用作根據(jù)如該實施例中所配置的本 發(fā)明原理的編碼器/解碼器的輸入,等同于執(zhí)行RCT。而且,根據(jù)如實施例中所配置的本發(fā)明原理,將新的4:4:4檔次(4:4:4 profile)添加到H.264標(biāo)準(zhǔn)中,在此被稱為"profile—idc=l66的高級4:4:4檔次"。 可以將該新的profilejdc加在序列參數(shù)頭中,并且可以將其用于宏塊層頭以及 殘差數(shù)據(jù)頭中。為支持利用亮度算法對所有三種顏色分量進(jìn)行編碼,可以對殘差數(shù)據(jù)句法 作出某些改變。另外,也可以對宏塊頭、殘差數(shù)據(jù)頭等之中的一些元素的語義
作出改變。 一般,H.264規(guī)范中的現(xiàn)有亮度句法將保持不變,并將用于對三個 分量之一進(jìn)行編碼。變化是向后兼容的。在此,以下描述詳細(xì)的句法和語義變 化?,F(xiàn)在,將描述根據(jù)如各實施例中配置的本發(fā)明原理所執(zhí)行的模擬結(jié)果。轉(zhuǎn)到圖6A和6B, 一般分別用附圖標(biāo)記600和650來表示關(guān)于ATV intra-only的平均PSNR (峰值信噪比)對位速率的曲線。轉(zhuǎn)到圖7A和7B, 一般分別用附圖標(biāo)記700和750來表示關(guān)于CT intra-only 的平均PSNR對位速率的曲線。轉(zhuǎn)到圖8A和8B, 一般分別用附圖標(biāo)記800和850來表示關(guān)于DT intra-only 的平均PSNR對位速率的曲線。轉(zhuǎn)到圖9A和9B, 一般分別用附圖標(biāo)記900和950來表示關(guān)于MIR—HD intra-only的平均PSNR對位速率的曲線。轉(zhuǎn)到圖10A和IOB, 一般分別用附圖標(biāo)記1000和1050來表示關(guān)于RT intra-only的平均PSNR對位速率的曲線。轉(zhuǎn)到圖11A和IIB, 一般用附圖標(biāo)記1100和1150來表示關(guān)于STB_HD intra-only的平均PSNR對位速率的曲線。尤其是,圖6A、 7A、 8A、 9A、 10A和11A示出了所建議的高級4:4:4檔次(用術(shù)語"新"來表示,并在它前面加上"新")對與之相應(yīng)的近似結(jié)果的 測試結(jié)果。而且,圖6B、 7B、 8B、 9B、 10B和11B示出了所建議的高級4:4:4 檔次(用術(shù)語"新"來表示,并在它前面加上"新")對JPEK2k的測試結(jié)果。 在圖6A、 6B至11A、 IIB的所有圖中,用分貝(dB)來表示PSNR,并 用每秒位數(shù)(bps)來表示位速率。ATV、 CT、 DT、 MIR、 RT、 STB是測試剪 輯的名稱。
在測試中,使用JVT-J042電影起源測試序列中所描述的所有JVT/FRExt 測試序列。它們都是4:4:4 10位電影素材,并且每個剪輯有58幀。在JVT參考軟件JM9.6中實施所建議的高級4:4:4檔次。Intra-only和IBBP編碼結(jié)構(gòu)都用于測試中。對于每一條R-D曲線,量化參數(shù)都被設(shè)為6、 12、 18、 24、 30和42。使用RD優(yōu)化模式選擇。也將所建議的高級4:4:4檔次和通過對每個單獨輸入分量運行 YUVFormat二0(4:0:0)的參考軟件所得到的結(jié)果進(jìn)行比較。把三個分開的單獨壓 縮位計數(shù)簡單相加,以得到用于計算壓縮位速率的總壓縮位數(shù)。關(guān)于JPEG2k,在測試中使用KaKadu V2.2.3軟件。利用具有9/7雙正交小 波濾波器的5級小波解壓縮,來產(chǎn)生測試結(jié)果。每幀只有一個瓦片(tile),并且 對于給定目標(biāo)位速率也使用RD優(yōu)化。所有PSNR測量都在RGB域中執(zhí)行。利用被定義為 (PSNR(紅)+PSNR(綠)+PSNR(藍(lán)》/3的平均PSNR,來比較整體壓縮質(zhì)量。這主 要是因為利用軟件所提供的未知速率控制算法來計算JPEG2k壓縮數(shù)據(jù)。對于 某些情況,RGBPSNR值相互之間相差很大,尤其是當(dāng)使用JPEG2k顏色變換 時。如下執(zhí)行壓縮比較 Newl:具有單一預(yù)測模式的建議高級4:4:4檔次。
New3:具有三種預(yù)測模式的建議高級4:4:4檔次。
RCT-OFF: RCT^關(guān)閉的RGB輸入。
RCT-ON: RCT二開啟的RGB輸入。
YCOCG:在編解碼器外面執(zhí)行RGB到Y(jié)COCG轉(zhuǎn)換。然后把轉(zhuǎn)換的 YCOCG用作JVT軟件的輸入。
R+G+B:通過分別壓縮R、 G和B信號而近似的建議方法。
Y+CO+CG:通過分別壓縮所轉(zhuǎn)換的Y、 CO和CG信號而近似的建議方法。
J2k—RGB:在RGB域執(zhí)行JPEG2k壓縮。關(guān)掉JPEG2k顏色變換。
J2k—YUV:在YUV域執(zhí)行JPEG2k壓縮。使用JPEG2k顏色變換。 根據(jù)測試結(jié)果,根據(jù)如實施例中所配置的本發(fā)明原理的實施在整體壓縮效率方面一般非常類似于JPEG2k。在某些情況下,甚至稍好一點。此外,對于40dB (PSNR)以上的質(zhì)量,根據(jù)如實施例中所配置的本發(fā)明 原理的實施提供了比當(dāng)前高4:4:4檔次(High 4:4:4 Profile)高得多的性能(壓 縮)。具體地說,Newl-YCOCG或New3-YCOCG好于YCOCG禾Q RCT-ON; Newl-RGB或New3-RGB好于RCT-OFF。在等于和大于45dB(PSNR)的PSNR 下,平均PSNR的平均提高大于1.5dB。在最后一個例子中,可以將該提高轉(zhuǎn) 變?yōu)?5dB PSNR下25%以上的位節(jié)省。根據(jù)測試結(jié)果,好像當(dāng)內(nèi)容具有更飽和顏色時,如TP、 RT,顏色變換將 有助于編碼性能。g卩,如果顏色是中性的、且不飽和,則在RGB域的編碼或 許是正確選擇。以上觀察與使用什么顏色變換無關(guān)。比較Newl-YCOCG或New3-YCOCG和JPEG-2k—YUV的結(jié)果,可以觀 察到,特定顏色變換的性能在提高編碼效率方面是與內(nèi)容非常相關(guān)的。沒有一 種顏色變換總是最好的。因此,我們的數(shù)據(jù)確認(rèn)了,在編碼(或解碼)循環(huán)內(nèi) 執(zhí)行顏色變換如RCT可能不是一個好主意。相反,如果必要,在編碼器/解碼 器外執(zhí)行顏色變換可能使整個壓縮系統(tǒng)提供更好、更魯棒的性能。比較YCOCG和RCT-ON,測試結(jié)果沒有顯示出由RCT引起的任何編碼 效率提高。另外,應(yīng)該主意,運行RCT開啟的參考軟件大大增加了編碼時間。
運行時間長了2.5倍多?,F(xiàn)在,將描述根據(jù)如實施例中所配置的本發(fā)明原理的句法和語義變化。轉(zhuǎn)到圖12, 一般用附圖標(biāo)記1200來表示H,264序列參數(shù)句法表。用斜體字來表示根據(jù)如實施例中所配置的本發(fā)明原理的句法變化。轉(zhuǎn)到圖13, 一般用附圖標(biāo)記1300來表示H.264殘差數(shù)據(jù)句法表。用斜體 字來表示根據(jù)如實施例中所配置的本發(fā)明原理的句法添加/變化。在表1300中, 殘差數(shù)據(jù)頭中的亮度部分和某些必須文本修改一起重復(fù)兩次,以分別支持 lumal禾口 luma2。如上所述,通過在JVT參考軟件JM9.6中實施本發(fā)明原理,來評價和測 試上述第一組合實施例。用Newl-RGB或Newl-YCOCG標(biāo)記的測試結(jié)果代表第一組合實施例。如上所述,根據(jù)如實施例中所配置的本發(fā)明原理,將3個約束空間預(yù)測器 的集合(或子集)而不是單一空間預(yù)測模式,用于分量通道(例如RGB、 YUV、 YCrCb格式等)。而且,如上所述,可以將該實施例和在此描述的其它實施例 組合起來,例如,只利用亮度編碼算法來對內(nèi)容的所有三個分量通道進(jìn)行編碼、 以及/或者使用顏色變換作為預(yù)處理步驟?,F(xiàn)在,將描述上述第二組合實施例,它涉及將3個約束空間預(yù)測器的集合 (或子集)用于顏色分量,只使用亮度編碼算法對所有三個顏色分量進(jìn)行編碼, 以及使用顏色變換作為預(yù)處理步驟(即,在壓縮循環(huán)內(nèi)沒有RCT)。與此同時 也將描述該實施例的某些變形方案。轉(zhuǎn)到圖14, 一般分別用附圖標(biāo)記1400和1401來表示具有預(yù)編碼顏色變換步驟的示范性視頻編碼過程。應(yīng)該理解,預(yù)編碼顏色變換塊1401包括塊1406、 1408和1410。而且,
應(yīng)該理解,預(yù)編碼顏色變換塊1401是可選的,因而在本發(fā)明某些實施例中可 以省略。
預(yù)編碼顏色變換塊1401包括循環(huán)限制塊1406,循環(huán)限制塊1406對圖像 中的每個塊開始循環(huán),并將控制傳遞給功能塊1408。功能塊1408對當(dāng)前圖像 塊的視頻信號數(shù)據(jù)執(zhí)行顏色預(yù)處理,并將控制傳遞給循環(huán)限制塊1410。循環(huán)限 制塊1410結(jié)束循環(huán)。而且,循環(huán)限制塊1410將控制傳遞給被包括在視頻編碼 過程1400中的循環(huán)限制塊1412。
循環(huán)限制塊1412對圖像中的每個塊開始循環(huán),并將控制傳遞給功能塊 1415。功能塊1415利用一個用于當(dāng)前圖像塊的每個顏色分量的公共預(yù)測器, 來形成當(dāng)前圖像塊的運動補償或空間預(yù)測,并將控制傳遞給功能塊1420。功能 塊1420從當(dāng)前圖像塊減去運動補償或空間預(yù)測,以形成預(yù)測殘差,并將控制 傳遞給功能塊1430。功能塊1430對預(yù)測殘差進(jìn)行變換和量化,并將控制傳遞 給功能塊1435。功能塊1435對預(yù)測殘差進(jìn)行逆變換和逆量化,以形成編碼預(yù) 測殘差,并將控制傳遞給功能塊1445。功能塊1445將編碼殘差加到預(yù)測上, 以形成編碼圖像塊,并將控制傳遞給結(jié)束循環(huán)塊1450。結(jié)束循環(huán)塊1450結(jié)束 循環(huán),并將控制傳遞給結(jié)束塊1455。
轉(zhuǎn)到圖15, 一般分別用附圖標(biāo)記1500和1560來表示具有后解碼逆顏色 變換步驟的示范性視頻解碼過程。
應(yīng)該理解后解碼逆顏色變換塊1560包括塊1562、 1564、 1566和1568。 而且,應(yīng)該理解,后解碼逆顏色變換塊1560是可選的,因而在本發(fā)明某些實 施例中可以省略。解碼過程1500包括循環(huán)限制塊1510,循環(huán)限制塊1510對圖像中的當(dāng)前 塊開始循環(huán),并將控制傳遞給功能塊1515。功能塊1515對編碼殘差進(jìn)行熵解
碼,并將控制傳遞給功能塊1520。功能塊1520對解碼殘差進(jìn)行逆變換和逆量 化,以形成編碼殘差,并將控制傳遞給功能塊1530。功能塊1530將編碼殘差 加到由用于每個顏色分量上的公共預(yù)測器形成的預(yù)測上,以形成編碼圖像塊, 并將控制傳遞給循環(huán)限制塊1535。循環(huán)限制塊1535結(jié)束循環(huán),并將控制傳遞 給結(jié)束塊1540。在某些實施例中,循環(huán)限制塊1535可選地將控制傳遞給后解碼逆顏色變 換塊1560,尤其是后解碼逆顏色變換塊1560中所包括的循環(huán)限制塊1562。循 環(huán)限制塊1562對圖像中的每個塊開始循環(huán),并將控制傳遞給功能塊1564。功 能塊1564對當(dāng)前圖像塊的視頻信號數(shù)據(jù)執(zhí)行逆顏色后處理,并將控制傳遞給 循環(huán)限制塊1566。循環(huán)限制塊1566結(jié)束循環(huán),并將控制傳遞給結(jié)束塊1568。如上所述,披露了高級4:4:4檔次的新檔次(profile一idc-166)。該新檔次 也可用于第二組合實施例,對應(yīng)的語義和句法變化如下所述。該新profile—idc 被加在序列參數(shù)集合中,并將主要用于隨后的頭中,以指示輸入格式為4:4:4、 以及所有三個輸入通道都類似地被編碼為亮度。為使H.264標(biāo)準(zhǔn)所需的改變減到最少,不為高級4:4:4檔次披露新的宏塊 類型。而是所有宏塊類型與H.264標(biāo)準(zhǔn)的表7-11、表7-13和表7-14中列出的 關(guān)聯(lián)編碼參數(shù)一起仍然有效。對于幀內(nèi)宏塊的情況,所有三個輸入通道,亮度、 Cr和Cb,都將基于H.264標(biāo)準(zhǔn)的表7-11中定義的MbPartPredMode來進(jìn)行編 碼。例如,高級4:4:4檔次中的Intra—4x4宏塊意味著,可以利用H.264標(biāo)準(zhǔn)的 表8-2中給出的所有9種可能預(yù)測模式來對每個輸入分量通道進(jìn)行編碼。僅供 參考,在當(dāng)前高4:4:4檔次(Hign 4:4:4 Profile)中,將把Intra—4x4宏塊的通道中 的兩個處理為色度,并且將只使用H.264標(biāo)準(zhǔn)的表8-5中的4種可能幀內(nèi)預(yù)測 模式之一。對于B和P宏塊,對高級4:4:4檔次所作的變化發(fā)生在小數(shù)像素位
置處的參考像素值的插值計算處理中。在此,R264標(biāo)準(zhǔn)的8.4.2.2.1節(jié)中描述 的過程,亮度樣本插值處理,將適用于亮度、Cr和Cb。再次僅供參考,當(dāng)前 高4:4:4檔次(Hign 4:4:4 Profile)將H.264標(biāo)準(zhǔn)的8.4.2.2.2節(jié)的色度樣本插值處 理用于輸入通道中的兩個。
在CABAC被選為熵編碼模式的情況下,將為Cr和Cb生成和當(dāng)前為亮度 定義的上下文模型相同的兩組分開上下文模型。在編碼期間,也將獨立地更新 它們。
最后,在實施例中,因為在編碼循環(huán)中沒有RCT塊,所以從高級4:4:4檔 次的序列參數(shù)集合中去除ResidueColorTransformFlag 。
到現(xiàn)在為止,如圖B所示,大多數(shù)句法變化都出現(xiàn)在殘差數(shù)據(jù)中,其中 原始亮度句法被重復(fù)兩次,以支持所建議的高級4:4:4檔次中的Cr和Cb。
關(guān)于H.264宏塊層表(未示出),對應(yīng)句法的語義變化包括以下。
coded一block-pattern (添加)。當(dāng) chroma一format—idc 等于 3 且 coded—block-pattem存在時,應(yīng)該將CodedBlockPatternChroma設(shè)為0。另外, 對于宏塊的12個8x8亮度、Cb和Cr塊的每一個,CodedBlockPattemLuma都 規(guī)定以下情況之一(1) 8x8亮度、8x8Cb和8x8Cr塊中的12個4x4亮度塊 的所有變換系數(shù)電平都等于0; (2)8x8亮度、8x8Cb和8x8Cr塊中的一個或 多個4x4亮度塊的一個或多個變換系數(shù)電平應(yīng)該為非零值。
現(xiàn)在,將描述根據(jù)第二組合實施例(或關(guān)于三個約束空間預(yù)測器集合(或 子集)的使用的單獨實施例)的幀內(nèi)塊空間預(yù)測模式選擇。
為了使每個分量獨立選擇其最佳MbPartPredMode和隨后的最佳空間預(yù)測 模式,和分別對每個輸入通道進(jìn)行編碼的情況一樣,可以將某些新幀內(nèi)塊類型 加到H.264標(biāo)準(zhǔn)的表7-11中。結(jié)果,將對H.264標(biāo)準(zhǔn)作出大量改變。在關(guān)于第
二組合實施例的實施例中,當(dāng)前mb—types保持不變,并且提供替換解決方案。 在該實施例中,限制用相同的MbPartPredMode或宏塊類型對三個輸入通道進(jìn) 行編碼。然后,將少量的新元素添加到宏塊預(yù)測句法中,以支持三種不同預(yù)測 模式。因此,每個分量理論上仍然能夠獨立選擇其最佳空間預(yù)測模式,以便使 每個分量通道的預(yù)測誤差最小化。例如,假定將Intra—4x4宏塊選為mb一type, 則亮度、Cr或Cb仍然可以在H.264標(biāo)準(zhǔn)的8.3丄1節(jié)的表8-2中找到它自己的 最佳空間預(yù)測模式,例如用于亮度的Intra_4x4_Vertical 、用于Cr的 Intra—4x4—Horizontal以及用于Cb的Intra—4x4—Diagonal—Down—Left。關(guān)于上述第一組合實施例的另一種方法是,約束所有三個輸入通道都共享 相同預(yù)測模式。這可以利用現(xiàn)有句法元素當(dāng)前所攜帶的預(yù)測信息來實現(xiàn),如宏 塊予頁測句法中的prev—intra4x4_pred—mode_flag、 rem—intra4x4__pred—mode、 pred—intra8x8_pred_mode—flag禾口 rem— >tra8x8_pred—mode。該選項將導(dǎo)致H.264 的少量變化以及編碼效率稍微有些損失?;跍y試結(jié)果,與第一組合實施例相比,使用三種預(yù)測模式可以將總編碼 性能提高大約0.2dB。轉(zhuǎn)到圖16, 一般用附圖標(biāo)記1600來表示H.264宏塊預(yù)測句法表。僅供參考,以下列出了用于支持使用三種預(yù)測模式的修改宏塊預(yù)測句法,其中 prev—intra4x4_pred—mode—flag0禾口 rem—intra4x4_pred—mode0用于亮度; prev—intra4x4_pred—mode—flag 1禾卩rem—intra4x4_pred—model用于Cr; prev—intra4x4_pred—mode—flag2禾Q rem_intra4x4_pred—mode2用于Cb。現(xiàn)在,將描述根據(jù)如關(guān)于第二組合實施例的實施例所配置的本發(fā)明原理而 執(zhí)行的模擬結(jié)果。使用JVT-J042,電影起源測試序列,JVT-J039 (Viper)中所描述的所有
JVT/FRExt測試序列。它們都是4:4:4 10位素材,并且每個剪輯有58幀。在JVT參考軟件JM9.6中實施所建議的算法,并在測試中使用修改的軟 件。對Intra-only和IBRrBP都進(jìn)行測試。在此,"Br"表示所記錄的B圖像。 Intra-only情況適合于量化參數(shù)等于6、 12、 18、 24、 30、 36和42的所有序列。 由于模擬中涉及大量的時間,IBRrBP圖像組(GOP)結(jié)構(gòu)只適合于量化參數(shù) 等于12、 18、 24、 30和36的電影剪輯。根據(jù)4:4:4 AHG中的論述,在測試中 使用以下關(guān)鍵參數(shù)SymbolMode = 1 RDOptimization = 1 ScalingMatrixPresentFlag = 0 OffsetMatrixPresentFlag = 1 QoffsetMatrixFile = "q_offset.cfg" AdaptiveRounding = 1 AdaptRndPeriod = 1 AdaptRndChroma = 1 AdaptRndWFactorX = 8 SearchRange = 64 UseFME = 1關(guān)于JPEG2k,在測試中使用KaKadu V2.2.3軟件。利用具有9/7雙正交小 波濾波器的5級小波解壓縮,來產(chǎn)生測試結(jié)果。每幀只有一個瓦片(tile),并 且對于給定目標(biāo)位速率也使用RD優(yōu)化。主要在源內(nèi)容的原始色域中計算PSNR度量,對于上述剪輯,源內(nèi)容的原 始色域是RGB。利用被定義為(PSNR(紅)+PSNR(綠)+PSNR(藍(lán)))/3的平均PSNR,來比較整體壓縮質(zhì)量。 如下執(zhí)行壓縮比較 Newl:具有單一預(yù)測模式的建議高級4:4:4檔次。
New3:具有三種預(yù)測模式的建議高級4:4:4檔次。
RCT-OFF: RCT^關(guān)閉的RGB輸入。
RCT-ON: RCT^開啟的RGB輸入。
YCOCG:在編解碼器外執(zhí)行RGB到Y(jié)COCG轉(zhuǎn)換。然后把轉(zhuǎn)換的 YCOCG用作JVT軟件的輸入。
R+G+B:通過分別壓縮R、 G和B信號而近似的建議方法。
Y+CO+CG:通過分別壓縮所轉(zhuǎn)換的Y、 CO和CG信號而近似的建議方法。
JPEG2k—RGB:在RGB域執(zhí)行JPEG2k壓縮。關(guān)掉JPEG2k顏色變換。
JPEG2k_YUV:在YUV域執(zhí)行JPEG2k壓縮。使用JPEG2k顏色變換。 對于Intra-only情況,根據(jù)本發(fā)明原理的建議高級4:4:4檔次在整體壓縮效率方面非常類似于JPEG2k。在某些情況下,甚至更好一些。根據(jù)本發(fā)明原理的方法明顯好于當(dāng)前高4:4:4檔次(Hign 4:4:4 Profile)。在等于和大于45dB (PSNR)的PSNR下,平均PSNR的平均提高超過1.5dB。在某些情況下,可以將該提高轉(zhuǎn)換為45dBPSNR下25%以上的位節(jié)省。即使對于相同塊類型,使用三種預(yù)測模式也稍好于單一預(yù)測模式。然而,可以使用更多句法和語義變化?,F(xiàn)在,將描述本發(fā)明實施例的原理所提供的許多附帶優(yōu)點/特征中的一些。 測試結(jié)果表明,與當(dāng)前高4:4:4檔次(Hign 4:4:4 Profile)相比,利用與本發(fā)明原理對應(yīng)的改進(jìn)的建議高級4:4:4檔次提供了改善的性能。并且性能提高的
很顯著。另外,將顏色變換移到編解碼器外面將使編解碼器的結(jié)構(gòu)在所有顏色 格式之間一致。結(jié)果,它將使實施更容易,且降低成本。在選擇最佳顏色變換 以獲得更好編碼效率的方面,它也將使編解碼器更魯棒。而且,建議的方法不 添加任何新的編碼工具,而只需對句法和語義稍作改變。因而,根據(jù)如實施例中配置的本發(fā)明原理,提供一種視頻編碼和解碼方法及設(shè)備。提供對現(xiàn)有汪264標(biāo)準(zhǔn)的修改,這些修改將性能提高到當(dāng)前可獲得的 性能之上。而且,對于高質(zhì)量應(yīng)用,甚至將性能提高到超過JPEG-2000。根據(jù) 如實施例中配置的本發(fā)明原理,可以通過利用亮度編碼算法對4:4:4內(nèi)容的所 有三個顏色分量進(jìn)行編碼,來實現(xiàn)H.264標(biāo)準(zhǔn)的4:4:4編碼性能重大提高。艮口,不需要新工具用于亮度(或沒有使用的色度)壓縮算法。而是使用現(xiàn)有亮度編 碼工具。進(jìn)一歩,可以根據(jù)本發(fā)明原理來實施當(dāng)前4:4:4檔次的句法和語義變化,以支持所有三個分量通道的亮度編碼。在根據(jù)本發(fā)明實施例進(jìn)行的測試中, 當(dāng)源內(nèi)容有許多空間紋理和邊緣時,亮度中使用的空間預(yù)測工具明顯顯示出它 們的性能優(yōu)于色度中所使用的空間預(yù)測工具。對于某些測試序列,當(dāng)每個顏色 分量都被編碼為亮度時,在大于或等于45dB (平均PSNR)的壓縮質(zhì)量下可觀 察到超過30%的位減少。應(yīng)該理解,雖然在此主要相對于利用H.264標(biāo)準(zhǔn)的4:4:4格式采樣的視頻 信號數(shù)據(jù)描述了本發(fā)明,但是也可容易相對于利用H.264標(biāo)準(zhǔn)的其它格式(如 4:2:0格式和/或4:2:2格式)以及其它視頻壓縮標(biāo)準(zhǔn)采樣的視頻信號數(shù)據(jù),來實 施本發(fā)明。給定在此提供的本發(fā)明教導(dǎo),在保持本發(fā)明范圍的同時,該領(lǐng)域及 相關(guān)領(lǐng)域普通技術(shù)人員也可容易實施本發(fā)明的這些及其它變化。相關(guān)領(lǐng)域的普通技術(shù)人員根據(jù)在此給出的教導(dǎo)可以容易地弄清本發(fā)明的 這些及其它特征和優(yōu)點。應(yīng)該理解,可以用各種形式的硬件、軟件、固件、專 用處理器或它們的組合,來實施本發(fā)明的教導(dǎo)。更為優(yōu)選地,把本發(fā)明的教導(dǎo)實施為硬件和軟件的組合。而且,軟件可為 在程序存儲單元上具體實施的應(yīng)用程序。該應(yīng)用程序可以被上載到包括任何合 適架構(gòu)的機器上,并通過該機器來執(zhí)行。優(yōu)選地,在具有硬件如一個或多個中央處理器(CPU)、 RAM和輸入/輸出(I/O)接口的計算機平臺上,實現(xiàn)該機 器。該計算機平臺也可包括操作系統(tǒng)和微指令碼。在此描述的各種過程和功能 可以是,可通過CPU執(zhí)行的微指令碼一部分、或應(yīng)用程序一部分、或它們的 任何組合。另外,其它各種外圍單元如附加數(shù)據(jù)存儲單元和打印單元,可以連 接到該計算機平臺。進(jìn)一步應(yīng)該理解,因為附圖中所描述的一些組成系統(tǒng)部件和方法優(yōu)選地是 用軟件來實現(xiàn)的,所以系統(tǒng)部件或過程功能塊之間的實際連接可以隨本發(fā)明的 編程方式而有所不同。給定在此的教導(dǎo),相關(guān)領(lǐng)域普通技術(shù)人員將能夠預(yù)期本 發(fā)明的這些及類似實施或配置。雖然在此參考附圖描述了說明性實施例,但是應(yīng)該理解,本發(fā)明不限于這 些具體實施例,并且相關(guān)領(lǐng)域普通技術(shù)人員可以在不脫離本發(fā)明范圍或精神的 情況下實現(xiàn)各種變動和修改。所有這種變動和修改都預(yù)定被包括在如所附的權(quán)利要求所闡述的本發(fā)明范圍內(nèi)。
權(quán)利要求
1.一種用于對圖像塊的視頻信號數(shù)據(jù)進(jìn)行編碼的視頻編碼器,所述視頻編碼器包括編碼器(100),用于利用所述視頻信號數(shù)據(jù)的每個顏色分量的唯一預(yù)測器,來對該視頻信號數(shù)據(jù)進(jìn)行編碼。
2. 根據(jù)權(quán)利要求1所述的視頻編碼器,其中所述唯一預(yù)測器用于編碼所述 視頻信號數(shù)據(jù),而不管所述視頻信號數(shù)據(jù)是利用公共塊隔斷還是利用多個塊隔 斷劃分的。
3. 根據(jù)權(quán)利要求1所述的視頻編碼器,其中所述唯一預(yù)測器都是亮度預(yù)觀!j器。
4. 根據(jù)權(quán)利要求1所述的視頻編碼器,其中所述唯一預(yù)測器包括用于所述 視頻信號數(shù)據(jù)的亮度分量和色度分量的唯一亮度預(yù)測器。
5. 根據(jù)權(quán)利要求1所述的視頻編碼器,其中所述視頻信號數(shù)據(jù)的采樣對應(yīng) 于國際電信聯(lián)盟電信標(biāo)準(zhǔn)化部門H.264標(biāo)準(zhǔn)的4:4:4、4:2:2和4:2:0格式中的任 何格式。
6. 根據(jù)權(quán)利要求1所述的視頻編碼器,其中所述唯一預(yù)測器用于所述視頻 信號數(shù)據(jù)的幀內(nèi)和幀間編碼。
7. 根據(jù)權(quán)利要求1所述的視頻編碼器,其中通過國際電信聯(lián)盟電信標(biāo)準(zhǔn)化部門H.264標(biāo)準(zhǔn)的prev—intra4x4_pred—mode—flag0禾tl rem_intra4x4_pred—mode0參數(shù)來設(shè)置第一個顏色分量的第一空間預(yù)測模式,通過國際電信聯(lián)盟電信標(biāo)準(zhǔn) 化 部 門 H.264 標(biāo) 準(zhǔn) 的 prev—intra4x4_pred—mode—flag 1 和 rem—intra4x4_pred—model參數(shù)來設(shè)置第二個顏色分量的第二預(yù)測模式,并通過 國際電信聯(lián)盟電信標(biāo)準(zhǔn)化部門H.264標(biāo)準(zhǔn)的prev—intra4x4j3red—mode—flag2和 rem—intra4x4_pred—mode2參數(shù)來設(shè)置第三個顏色分量的第三預(yù)測模式。
8. 根據(jù)權(quán)利要求1所述的視頻編碼器,其中所述編碼器(100)對所述視 頻信號數(shù)據(jù)的所有顏色分量進(jìn)行編碼,并且不對所述視頻信號數(shù)據(jù)的所有顏色分量應(yīng)用殘差顏色轉(zhuǎn)換。
9. 一種用于對圖像塊的視頻信號數(shù)據(jù)進(jìn)行編碼的方法,所述方法包括利 用所述視頻信號數(shù)據(jù)的每個顏色分量的唯一預(yù)測器,來對該視頻信號數(shù)據(jù)進(jìn)行 編碼(1415)。
10. 根據(jù)權(quán)利要求9所述的方法,其中所述唯一預(yù)測器用于編碼所述視頻 信號數(shù)據(jù),而不管所述視頻信號數(shù)據(jù)是利用公共塊隔斷還是利用多個塊隔斷劃 分的。
11. 根據(jù)權(quán)利要求9所述的方法,其中所述唯一預(yù)測器都是亮度預(yù)測器。
12. 根據(jù)權(quán)利要求9所述的方法,其中所述唯一預(yù)測器包括用于所述視頻 信號數(shù)據(jù)的亮度分量和色度分量的唯一亮度預(yù)測器。
13. 根據(jù)權(quán)利要求9所述的方法,其中所述視頻信號數(shù)據(jù)的采樣對應(yīng)于國 際電信聯(lián)盟電信標(biāo)準(zhǔn)化部門H.264標(biāo)準(zhǔn)的4:4:4、4:2:2和4:2:0格式中的任何格式。
14. 根據(jù)權(quán)利要求9所述的方法,其中所述唯一預(yù)測器用于所述視頻信號 數(shù)據(jù)的幀內(nèi)和幀間編碼。
15. 根據(jù)權(quán)利要求9所述的方法,其中通過國際電信聯(lián)盟電信標(biāo)準(zhǔn)化部門 H.264標(biāo)準(zhǔn)的prev—intra4x4_pred—mode—flag0禾卩rem—intra4x4_pred—mode0參數(shù) 來設(shè)置第一個顏色分量的第一空間預(yù)測模式,通過國際電信聯(lián)盟電信標(biāo)準(zhǔn)化部 門H.264牛示準(zhǔn)的prev—intra4x4_pred—mode—flag 1禾B rem—intra4x4_pred_model參 數(shù)來設(shè)置第二個顏色分量的第二預(yù)測模式,并通過國際電信聯(lián)盟電信標(biāo)準(zhǔn)化部 門H.264標(biāo)準(zhǔn)的prev—intra4x4_pred—mode—flag2禾口 rem—intra4x4_pred—mode2參數(shù)來設(shè)置第三個顏色分量的第三預(yù)測模式。
16. 根據(jù)權(quán)利要求9所述的方法,其中所述編碼步驟對所述視頻信號數(shù)據(jù) 的所有顏色分量進(jìn)行編碼,并且不對所述視頻信號數(shù)據(jù)的所有顏色分量應(yīng)用殘差顏色轉(zhuǎn)換。
17. —種用于對圖像塊的視頻信號數(shù)據(jù)進(jìn)行解碼的視頻解碼器,所述視頻 解碼器包括解碼器(200),用于利用所述視頻信號數(shù)據(jù)的每個顏色分量的唯一 預(yù)測器,來對該視頻信號數(shù)據(jù)進(jìn)行解碼。
18. 根據(jù)權(quán)利要求17所述的視頻解碼器,其中所述唯一預(yù)測器用于解碼所 述視頻信號數(shù)據(jù),而不管所述視頻信號數(shù)據(jù)是利用公共塊隔斷還是利用多個塊 隔斷劃分的。
19. 根據(jù)權(quán)利要求17所述的視頻解碼器,其中所述唯一預(yù)測器都是亮度 預(yù)測器。
20. 根據(jù)權(quán)利要求17所述的視頻解碼器,其中所述唯一預(yù)測器包括用于所 述視頻信號數(shù)據(jù)的亮度分量和色度分量的唯一亮度預(yù)測器。
21. 根據(jù)權(quán)利要求17所述的視頻解碼器,其中所述視頻信號數(shù)據(jù)的采樣對 應(yīng)于國際電信聯(lián)盟電信標(biāo)準(zhǔn)化部門H.264標(biāo)準(zhǔn)的4:4:4、 4:2:2和4:2:0格式中的任何格式。
22. 根據(jù)權(quán)利要求17所述的視頻解碼器,其中所述唯一預(yù)測器用于所述視 頻信號數(shù)據(jù)的幀內(nèi)和幀間編碼。
23. 根據(jù)權(quán)利要求17所述的視頻解碼器,其中通過國際電信聯(lián)盟電信標(biāo)準(zhǔn) 化 咅P 門 H.264 標(biāo) 準(zhǔn) 的 prev—intra4x4_pred—mode—flagO 和 rem—intra4x4_pred_mode0參數(shù)來設(shè)置第一個顏色分量的第一空間預(yù)測模式,通過國際電信聯(lián)盟電信標(biāo)準(zhǔn)化部門H.264標(biāo)準(zhǔn)的prev—intra4x4_pred—mode—flagl 和rem—intra4x4_pred—model參數(shù)來設(shè)置第二個顏色分量的第二預(yù)測模式,并 通過國際電信聯(lián)盟電信標(biāo)準(zhǔn)化部門 H.264 標(biāo)準(zhǔn)的 prev—intra4x4_pred_mode—flag2禾卩rem_intra4x4_pred_mode2參數(shù)來設(shè)置第三個顏色分量的第三預(yù)測模式。
24. 根據(jù)權(quán)利要求17所述的視頻解碼器,其中所述解碼器(200)對所述 視頻信號數(shù)據(jù)的所有顏色分量進(jìn)行解碼,并且不對所述視頻信號數(shù)據(jù)的所有顏色分量應(yīng)用殘差顏色轉(zhuǎn)換。
25. —種用于對圖像塊的視頻信號數(shù)據(jù)進(jìn)行解碼的方法,所述方法包括利 用所述視頻信號數(shù)據(jù)的每個顏色分量的唯一預(yù)測器,來對該視頻信號數(shù)據(jù)進(jìn)行 解碼(1415)。
26. 根據(jù)權(quán)利要求25所述的方法,其中所述唯一預(yù)測器用于解碼所述視 頻信號數(shù)據(jù),而不管所述視頻信號數(shù)據(jù)是利用公共塊隔斷還是利用多個塊隔斷 劃分的。
27. 根據(jù)權(quán)利要求25所述的方法,其中所述唯一預(yù)測器都是亮度預(yù)測器。
28. 根據(jù)權(quán)利要求25所述的方法,其中所述唯一預(yù)測器包括用于所述視頻信號數(shù)據(jù)的亮度分量和色度分量的唯一亮度預(yù)測器。
29. 根據(jù)權(quán)利要求25所述的方法,其中所述視頻信號數(shù)據(jù)的采樣對應(yīng)于 國際電信聯(lián)盟電信標(biāo)準(zhǔn)化部門H.264標(biāo)準(zhǔn)的4:4:4、4:2:2和4:2:0格式中的任何 格式。
30. 根據(jù)權(quán)利要求25所述的方法,其中所述唯一預(yù)測器用于所述視頻信號數(shù)據(jù)的幀內(nèi)和幀間編碼。
31. 根據(jù)權(quán)利要求25所述的方法,其中通過國際電信聯(lián)盟電信標(biāo)準(zhǔn)化部門H.264標(biāo)準(zhǔn)的prev—intra4x4_pred—mode—flag0禾B rem—intra4x4_pred—modeO數(shù)來設(shè)置第一個顏色分量的第一空間預(yù)測模式,通過國際電信聯(lián)盟電信標(biāo)準(zhǔn)化咅卩門H.264標(biāo)準(zhǔn)的prev—intra4x4_pred—mode—flag 1禾Q rem—intra4x4__pred—model參數(shù)來設(shè)置第二個顏色分量的第二預(yù)測模式,并通過國際電信聯(lián)盟電信標(biāo)準(zhǔn)化:卩門H.264標(biāo)準(zhǔn)的prev—intra4x4_pred—mode—flag2禾口 rem—intra4x4_pred—mode2參數(shù)來設(shè)置第三個顏色分量的第三預(yù)測模式。
32.根據(jù)權(quán)利要求25所述的方法,其中所述解碼步驟對所述視頻信號數(shù) 據(jù)的所有顏色分量進(jìn)行解碼,并且不對所述視頻信號數(shù)據(jù)的所有顏色分量應(yīng)用殘差顏色轉(zhuǎn)換。
全文摘要
提供了視頻編碼器、視頻解碼器和對應(yīng)方法。一種用于對圖像塊的視頻信號數(shù)據(jù)進(jìn)行編碼的視頻編碼器包括編碼器(100),該編碼器(100)用于利用公共預(yù)測器(315)對視頻信號數(shù)據(jù)的所有顏色分量進(jìn)行編碼。
文檔編號H04N7/26GK101160973SQ200680011945
公開日2008年4月9日 申請日期2006年3月16日 優(yōu)先權(quán)日2005年4月13日
發(fā)明者于浩平, 劉荔敏 申請人:湯姆遜許可公司