專利名稱:視頻數(shù)據(jù)流的上下文靈敏的編碼和解碼的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及視頻數(shù)據(jù)流的壓縮和解壓縮。本發(fā)明還涉及實(shí)施所述方法的裝置。
經(jīng)過包交換的數(shù)據(jù)網(wǎng)絡(luò)傳輸視頻數(shù)據(jù)特別需要這樣的壓縮方方法,因?yàn)榘粨Q的數(shù)據(jù)網(wǎng)絡(luò)的帶寬是很有限的。為此開發(fā)了用之使得能夠壓縮視頻數(shù)據(jù)的標(biāo)準(zhǔn)化方法,例如MPEG-1、MPEG-2和H.26X。這些標(biāo)準(zhǔn)化的方法用運(yùn)動(dòng)補(bǔ)償?shù)幕旌暇幋a工作,這是一種無損耗的冗余縮減和有損耗的不相關(guān)縮減的結(jié)合、所謂運(yùn)動(dòng)補(bǔ)償?shù)念A(yù)告對(duì)壓縮起的作用最大。運(yùn)動(dòng)補(bǔ)償?shù)念A(yù)言或者說預(yù)告利用相繼圖像的類似性,其中它從已經(jīng)傳輸?shù)膱D像預(yù)言當(dāng)前要編碼的圖像。因?yàn)槎鄶?shù)情況下只有相繼圖像的確定部分運(yùn)動(dòng)。編碼器把當(dāng)前要編碼的圖像折開成矩形的宏字塊,所述的宏字塊多數(shù)為8×8或者16×16像點(diǎn)大。對(duì)于每個(gè)這樣的宏字塊,編碼器從已經(jīng)傳輸?shù)膱D像找出適當(dāng)?shù)暮曜謮K,并且計(jì)算其它與當(dāng)前要編碼的圖像的宏字塊的推移。宏字塊的推移通過由編碼器借助于代碼表編碼的運(yùn)動(dòng)向量描述。
因?yàn)楫?dāng)前要編碼的圖像不是在每種情況下都能夠通過推移已經(jīng)傳輸?shù)膱D像宏字塊構(gòu)成,例如在新進(jìn)入圖像的物體時(shí),還必須向解碼器傳輸預(yù)言誤差或者說預(yù)告誤差。所述的預(yù)告識(shí)別由于在實(shí)際上當(dāng)前要編碼的圖像與通過推移宏字塊從以前的圖像構(gòu)成的預(yù)告圖像之間的差別產(chǎn)生。
因?yàn)橄噜徬顸c(diǎn)的預(yù)言誤差在不可或者不可很好地預(yù)見的范圍內(nèi)相干,為了進(jìn)一步的冗余縮減,要進(jìn)行預(yù)言誤差的變換。在此,視壓縮方法而異采用不同的變換方法。例如普遍地是離散的子波變換(Wavelet-TransformationDWT)或者離散的余弦變換。通過離散的余弦變換把每個(gè)8×8像點(diǎn)的宏字塊變換成8×8頻譜系數(shù)的矩陣。在此第一個(gè)系數(shù)代表該字塊的平均亮度,因此它也稱為“直流成分”或者“DC系數(shù)”。得出的系數(shù)反映亮度分布的高頻成分的上升的指數(shù),因此稱為“交流成分”或者“AC系數(shù)”。
為了進(jìn)一步降低要求的數(shù)據(jù)速率,在進(jìn)一步編碼前量化頻譜系數(shù)。如果像點(diǎn)至像點(diǎn)的預(yù)言誤差信號(hào)僅緩慢變化,在量化后多數(shù)的高頻頻譜系數(shù)等于零并且因此不需要傳輸。
因?yàn)樵谧儞Q以后多數(shù)頻譜系數(shù)是零,所以在方法的進(jìn)一步過程中通過行程編碼匯集頻譜系數(shù),并且接著借助于代碼表用可變長度的代碼字編碼。
從這種現(xiàn)有技術(shù)出發(fā),本發(fā)明的任務(wù)是指出與公知的方法比有較高壓縮比的壓縮和解壓縮視頻數(shù)據(jù)的方法。
該任務(wù)根據(jù)本發(fā)明通過壓縮視頻信號(hào)的方法完成,其中通過圖像符號(hào)表示圖像的視頻數(shù)據(jù),具有以下的方法步驟-從圖像存儲(chǔ)器讀取圖像符號(hào);-借助于上下文開關(guān)把圖像符號(hào)分類成圖像符號(hào)組,所述的圖像符號(hào)組分別被分配給不同的上下文,其中在預(yù)定的時(shí)間點(diǎn)把上下文開關(guān)置于預(yù)定的位置并且接著依據(jù)要傳輸?shù)膱D像符號(hào)的上下文操作所述上下文開關(guān);-熵編碼圖像符號(hào)組并且把由編碼器支路輸出的數(shù)據(jù)匯集成壓縮的視頻數(shù)據(jù)流。
該任務(wù)根據(jù)本發(fā)明還通過一種對(duì)被壓縮的視頻數(shù)據(jù)流的解壓縮方法解決,其中從視頻數(shù)據(jù)流提取代表圖像的圖像符號(hào)的視頻數(shù)據(jù),具有以下的步驟-把視頻數(shù)據(jù)流劃分成比特流段,所述比特流段分別被分配一個(gè)上下文;-把所述比特流段熵編碼成圖像符號(hào)組;-通過上下文開關(guān)把圖像符號(hào)按以不同方式劃分的圖像符號(hào)組傳輸進(jìn)圖像存儲(chǔ)器中,其中上下文開關(guān)在預(yù)定的時(shí)間點(diǎn)處在預(yù)定的位置,并且然后依據(jù)信號(hào)圖像符號(hào)的上下文來操作所述的上下文開關(guān)。
根據(jù)本發(fā)明的壓縮和解壓縮的方法的認(rèn)識(shí)基礎(chǔ)是圖像符號(hào)的出現(xiàn)概率可強(qiáng)烈地與相應(yīng)的上下文相關(guān)。根據(jù)本發(fā)明的方法充分利用這樣的情況,其中依據(jù)相應(yīng)的上下文把圖像符號(hào)分類進(jìn)編碼器支路。然后可以有效地用帶有可變字長的與相應(yīng)上下文匹配的代碼編碼劃分在編碼器支路上的圖像符號(hào)。這樣的代碼在下文中也稱為熵代碼。特別有利的是,在此可以采用與相應(yīng)上下文中的圖像符號(hào)的實(shí)際概率分布相匹配的代碼。
在根據(jù)本發(fā)明的一個(gè)優(yōu)選實(shí)施形式中把二進(jìn)制的符號(hào)劃分在編碼器支路上并且接著進(jìn)行行程長度編碼,其中對(duì)相繼地相同的符號(hào)的數(shù)量進(jìn)行計(jì)數(shù)和通過一個(gè)分配給該符號(hào)的數(shù)量進(jìn)行編碼。
根據(jù)本發(fā)明的方法的該實(shí)施形式利用在確定的上下文中出現(xiàn)通過行程長度編碼可以有效地壓縮大數(shù)量的相同符號(hào)的情況。其中,圖像符號(hào)依據(jù)相應(yīng)的上下文分類進(jìn)編碼器支路,從而在編碼器支路中存在各有大數(shù)量的相同圖像符號(hào)的圖像符號(hào)的組,創(chuàng)建了有效地行程長度編碼的前提。
在另一個(gè)優(yōu)選實(shí)施形式中,在相應(yīng)的編碼器支路或者解碼器支路中對(duì)于可變字長的代碼采用可解析地計(jì)算的熵代碼,所述的熵代碼在壓縮和解壓縮的過程中與相應(yīng)上下文的圖像的概率分布匹配。
通過采用達(dá)解析地產(chǎn)生的代碼可以不再采用對(duì)每個(gè)可能的上下文含有一個(gè)匹配的代碼的固定地存儲(chǔ)的代碼表。相反,所采用的熵代碼可以輕易地匹配實(shí)際出現(xiàn)的概率分布。對(duì)實(shí)際出現(xiàn)的概率分布的準(zhǔn)確匹配可以有效地編碼圖像符號(hào),這進(jìn)一步減少了傳輸所需要的帶寬。
在另一個(gè)優(yōu)選實(shí)施形式中為編碼圖像符號(hào)采用可解析計(jì)算的Golomb代碼。
所述Golomb代碼特別適于連續(xù)地匹配于相應(yīng)的圖像符號(hào)分布,因?yàn)檫@種代碼可以依據(jù)各個(gè)參數(shù)連續(xù)地計(jì)算,并且可以用簡單的方式確定參數(shù)。此外與算術(shù)編碼相反,這種代碼容忍誤差。
本發(fā)明的其它細(xì)節(jié)是從屬權(quán)利要求的主題。
下面參照附圖詳細(xì)地說明本發(fā)明。在附圖中
圖1是方框圖,示出編碼器的構(gòu)造和壓縮時(shí)采用的方法的流程;圖2是圖表,示出一個(gè)視頻圖像的宏字塊的圖像符號(hào),其中錄入要傳輸?shù)膱D像符號(hào)和所屬的上下文;圖3是上下文靈敏的編碼器單元的方框圖,該方框圖同時(shí)還示出上下文靈敏的編碼器的流程;圖4是解碼器的方框圖,該方框圖同時(shí)還示出該解碼器的流程;圖5是上下文靈敏的解碼器單元的方框圖,該方框圖同時(shí)還示出上下文靈敏的解碼器的流程;圖6示出一個(gè)變形的編碼器的方框圖。
圖1示出編碼器1,所述編碼器1按照運(yùn)動(dòng)補(bǔ)償?shù)幕旌暇幋a原理工作。所述編碼器1具有輸入端2,通過所述的輸入端2向編碼器1傳送視頻數(shù)據(jù)流。特別是通過輸入端2向編碼器傳送圖像序列的視頻數(shù)據(jù)。一個(gè)運(yùn)動(dòng)估算單元3把當(dāng)前要編碼的視頻數(shù)據(jù)流的圖像分段成多數(shù)有8×8或者16×16個(gè)像點(diǎn)大小的矩形的宏字塊。對(duì)于每個(gè)這樣的宏字塊運(yùn)動(dòng)估算單元3從已經(jīng)傳輸?shù)膱D像中尋找適當(dāng)?shù)暮曜钟?jì)算其運(yùn)動(dòng)向量。然后可以借助于常規(guī)的編碼表或者也可以借助于下面詳細(xì)地說明的上下文靈敏編碼單元4編碼該運(yùn)動(dòng)向量,并且通過復(fù)用器5嵌入在輸出端6輸出的比特流中。由運(yùn)動(dòng)估算單元3計(jì)算的宏字塊的運(yùn)動(dòng)向量還被分給運(yùn)動(dòng)補(bǔ)償器7,所述的運(yùn)動(dòng)補(bǔ)償器從存儲(chǔ)在圖像存儲(chǔ)器8中的、已經(jīng)傳輸?shù)膱D像出發(fā),通過移動(dòng)已經(jīng)傳輸了的圖像計(jì)算宏字塊得出的預(yù)告圖像。這種預(yù)告圖像在減法器9從原圖像中減去,以產(chǎn)生預(yù)言誤差,所述預(yù)言誤差傳送到帶有后置的量化器11的離散余弦轉(zhuǎn)換器10。所述的預(yù)言誤差也稱預(yù)告誤差或者說組織(Textur)。變換了和量化了的預(yù)告誤差數(shù)據(jù)轉(zhuǎn)交給另一個(gè)上下文靈敏的編碼器單元4,所述的編碼器單元4把變換了和量化了的預(yù)告誤差數(shù)據(jù)變換成比特流段,所述的比特流段由復(fù)用器4讀取并且嵌入在輸出端6輸出的比特流中。
通過在離散的余弦變換器10中進(jìn)行的處理,把例如帶有8×8像點(diǎn)的宏字塊表達(dá)成64個(gè)頻譜系數(shù)的矩陣。在此第一個(gè)系數(shù)含有平均亮度,并且因此也稱為直流成分或者DC系數(shù)。其余的頻譜系數(shù)反映亮度分布的高頻成分的上升的指數(shù),因此稱為交流成分或者AC系數(shù)。通過后續(xù)的量化器11進(jìn)一步降低數(shù)據(jù)速率。因?yàn)樵诿嬖蓄A(yù)告誤差只是緩慢地從像點(diǎn)到像點(diǎn)改變,從而在量化器11中處理以后高頻的頻譜系數(shù)等于零并且因此根本不需要傳輸。
此外量化器11還考慮心理的視覺效果。因?yàn)槿说拇竽X感覺低頻的圖像成分,也就是平面擴(kuò)張的圖像成分,比高頻的圖像成分,也就是比細(xì)節(jié),清楚得多。在此高頻的頻譜系數(shù)比低頻頻譜系數(shù)粗略地量化。
為了跟蹤存放在圖像存儲(chǔ)器8中的已經(jīng)傳輸了的圖像,所述頻譜系數(shù)輸送到反轉(zhuǎn)的量化器12中和反轉(zhuǎn)的離散余弦變換器13中,所述反轉(zhuǎn)的量化器12和反轉(zhuǎn)的離散余弦變換器13把這樣重建的預(yù)言誤差數(shù)據(jù)在加法器14中相加到由運(yùn)動(dòng)補(bǔ)償器7產(chǎn)生的預(yù)告圖像中。這樣產(chǎn)生的圖像相應(yīng)于在解碼器中出現(xiàn)的圖像。這些圖像存放在圖像存儲(chǔ)器8中,并且對(duì)運(yùn)動(dòng)估算單元3起計(jì)算后續(xù)圖像運(yùn)動(dòng)向量的基礎(chǔ)的作用。
下面借助于圖2和3說明上下文靈敏編碼器單元4的結(jié)構(gòu)和功能。
在圖2中變量x1-x64用作表達(dá)量化器11輸出的頻譜系數(shù)。頻譜系數(shù)x1代表直流成分或者說DC系數(shù)。頻譜系數(shù)x8和x57是分配給x和y方向的最高圖像頻率的頻譜系數(shù)。頻譜系數(shù)x64相應(yīng)于沿圖像對(duì)角線上的最高圖像頻率。如果采用編碼器單元4編碼運(yùn)動(dòng)向量,變量x1至x64還可以代表不同的推移向量。
由離散的余弦變換器產(chǎn)生的頻譜系數(shù)理想地是完全去相關(guān)的,即相鄰的頻譜系數(shù)相互之間統(tǒng)計(jì)上不相關(guān)。還有在頻譜系數(shù)理想地去相關(guān)時(shí),這不必對(duì)頻譜系數(shù)的比特層的各個(gè)比特都成立。相應(yīng)在此以很高的程度存在統(tǒng)計(jì)上的獨(dú)立性。這涉及頻譜系數(shù)一般地沒有值、從而在較低的、不重要的比特層中常常存在邏輯1的事實(shí)。
例如在圖2中圈出了頻譜系數(shù)x19,其二進(jìn)制值在確定的比特層統(tǒng)計(jì)地依賴于相應(yīng)比特層中的上下文組15中的頻譜系數(shù)的二進(jìn)制值。在圖2中上下文組15由確定比特層中的頻譜系數(shù)x1至x3、x9至x11以及x17和x18的二進(jìn)制值構(gòu)成。相應(yīng)的比特層中的頻譜系數(shù)x19的二進(jìn)制值的概率分布統(tǒng)計(jì)地取決于該比特層中相鄰的頻譜系數(shù)的二進(jìn)制值。
下面把變量xi的值稱為圖像符號(hào)。圖像符號(hào)的整體構(gòu)成字母。上下文組C中的確定的變量值組合在下面簡稱為上下文。
在圖3中單個(gè)圖示的上下文靈敏的編碼器單元4利用圖像符號(hào)之間的統(tǒng)計(jì)相關(guān)性和相應(yīng)分配的上下文進(jìn)行有效的編碼。
在上下文靈敏的編碼器單元4中通過比特層掃描器16把變量xi分解進(jìn)比特層。所述比特層以最高值的比特層開始相繼地傳輸進(jìn)中間存儲(chǔ)器17中。在此情況下從而只有兩個(gè)不同的圖像符號(hào),即邏輯0和邏輯1。
所述圖像符號(hào)按預(yù)定的序列串行地從中間存儲(chǔ)器17讀出。從中間存儲(chǔ)器17讀出的圖像符號(hào)借助于上下文開關(guān)18分類到編碼器支路19上。在此上下文開關(guān)18受上下文分辨器20控制,所述上下文分辨器對(duì)每個(gè)圖像符號(hào)確定所屬的上下文,并且負(fù)責(zé)相應(yīng)地向編碼器支路19分配圖像符號(hào)。除了上下文分辨器20之外還有分組單元(Clustereinheit)21,所述的分組單元分析相應(yīng)的上下文中圖像符號(hào)的概率分布,并且在不同上下文中的概率分布相符時(shí)引起上下文分辨器邏輯地匯集在圖像符號(hào)的概率分布方面相符的上下文,并且分配給一個(gè)共同的編碼器支路19。
分配給編碼器支路19的圖像符號(hào)首先存儲(chǔ)在圖像符號(hào)緩沖器22中。接著借助于行程長度編碼器23把圖像符號(hào)轉(zhuǎn)換成行程長度符號(hào),所述的行程長度編碼器23把圖像符號(hào)轉(zhuǎn)換成行程長度符號(hào)。如果圖像符號(hào)概率分布取決于相應(yīng)的上下文偏離相等分布,在編碼器支路19中特別經(jīng)常地出現(xiàn)一些圖像符號(hào)。然而相同的圖像符號(hào)可以借助于行程長度編碼器23以有效的方式匯集成行程長度符號(hào)。在行程長度編碼中對(duì)相續(xù)的相同圖像符號(hào)進(jìn)行計(jì)數(shù),并且由此編碼出現(xiàn)數(shù)量。例如二進(jìn)制序列“000100”編碼成“302”,其中“0”表示二進(jìn)制的“1”。
在進(jìn)一步的過程中通過符號(hào)編碼器24把行程長度符號(hào)轉(zhuǎn)換成不同代碼字長的代碼符號(hào)。這樣的Golomb編碼是領(lǐng)域內(nèi)普通技術(shù)人員公知的從而不是本申請(qǐng)的主題。Golomb編碼特別適用于編碼行程長度符號(hào),因?yàn)槎M(jìn)制圖像符號(hào)的行程長度編碼得出行程長度符號(hào)的近似的幾何分布。Golomb編碼特別適于這種分布。
由于圖像符號(hào)的概率分布由分組單元21連續(xù)地確定,分組單元21可以這樣地控制Golomb編碼器24,使得由Golomb編碼器24為編碼行程長度符號(hào)采用的Golomb代碼與確定的上下文中出現(xiàn)的圖像符號(hào)的概率分布匹配。
還有與此相關(guān)地Golomb編碼特別有利。Golomb代碼特別適于確定的上下文中的圖像符號(hào)的變化的概率分布匹配的跟蹤,這是因?yàn)镚olomb代碼是可以確定參數(shù)的,并且可以借助于各個(gè)與字母中的符號(hào)的變化的概率分布匹配。
由Golomb編碼器24產(chǎn)生的代碼符號(hào)作為比特流段存儲(chǔ)在比特流緩沖器25中。復(fù)用器26把各個(gè)編碼器支路19中的比特流段匯集成單一的比特流段,其中編碼器支路19的各個(gè)比特流段各自設(shè)有一個(gè)“標(biāo)題”,其中錄入相應(yīng)的比特流段的長度。
復(fù)用器26的功能還可以由復(fù)用器5接管,所述復(fù)用器5在輸出端6上提供壓縮的視頻數(shù)據(jù)流,在所述視頻數(shù)據(jù)流中嵌入關(guān)于推移向量和預(yù)言誤差數(shù)據(jù)的信息。
可以在下面總結(jié)出在上下文靈敏的編碼單元4中實(shí)施的方法步驟-從圖像存儲(chǔ)器15中串行地讀取圖像符號(hào);-借助于上下文開關(guān)18把圖像符號(hào)分類在不同的編碼器支路19上,所述的編碼器支路19各自分配給不同的上下文,其中在預(yù)定的時(shí)間把上下文開關(guān)18置于預(yù)定的位置并且接著依據(jù)要傳輸?shù)膱D像符號(hào)的相應(yīng)上下文操作;-劃分在編碼器支路19上的圖像符號(hào)行程長度編碼成行程長度符號(hào);-借助于與相應(yīng)的上下文的熵匹配的熵代碼把行程長度符號(hào)變換成匯集為一個(gè)比特流段的代碼符號(hào);-通過復(fù)用器26把比特流段匯集成壓縮的視頻數(shù)據(jù)流。
在另一個(gè)沒有示出的實(shí)施例中,上下文選擇不在比特層上,而是在完全頻譜系數(shù)下進(jìn)行。如果由于圖像統(tǒng)計(jì)通過離散的余弦變換器19的處理不表示理想的去相關(guān)的變換,從而不完全地對(duì)頻譜系數(shù)進(jìn)行去相關(guān)時(shí),在完全的頻譜系數(shù)層上進(jìn)行上下文選擇是合理的。
在實(shí)踐中離散的余弦變換不是理想去相關(guān)的變換,從而存在頻譜系數(shù)之間的相關(guān)性,可以通過按上下文分類和通過后續(xù)的Golomb編碼利用頻譜系數(shù)之間的相關(guān)性。然而,在此情況下所述的行程長度編碼不是有效的,因?yàn)橥耆念l譜系數(shù)可以取大量的值,從而得出特別大范圍的字母。因?yàn)樵谶@種情況下進(jìn)行與依據(jù)相應(yīng)的上下文考慮的圖像符號(hào)的出現(xiàn)概率近似的幾何分布,按照上下文的分類和與相應(yīng)的上下文匹配的Golomb編碼是完全合理的。
此外在去相關(guān)頻譜系數(shù)時(shí)還可以有一種宏字塊,這種宏字塊如此地分類頻譜系數(shù)以便為了選擇上下文組只考慮相同頻率的頻譜系數(shù),例如相鄰的宏字塊中的所有頻譜系數(shù)x1。然后可以產(chǎn)生頻譜系數(shù)之間的統(tǒng)計(jì)相關(guān)性。
在下面考慮所屬的解碼方法??梢岳斫饨獯a方法必須有相應(yīng)的解碼步驟。下面借助于圖4和5說明這樣的解碼方法。
在圖4中示出用于編碼器1產(chǎn)生的視頻信號(hào)流的解碼器27。解碼器27在輸入端28接收視頻數(shù)據(jù)流,輸入端28后接解復(fù)用器29。所述解復(fù)用器29通過下面詳細(xì)說明的上下文靈敏的解碼器30向運(yùn)動(dòng)補(bǔ)償器31傳送關(guān)于推移向量的信息。視頻數(shù)據(jù)流的含有預(yù)言誤差的信息的視頻數(shù)據(jù)流成分傳送到另一個(gè)上下文靈敏的解碼器單元30,所述的解碼器單元30從流入的比特流中重建預(yù)言誤差數(shù)據(jù)。預(yù)言誤差數(shù)據(jù)然后傳送到量化器32并且傳送到反轉(zhuǎn)的離散余弦變換器33中,并且在加法器34中相加到從運(yùn)動(dòng)補(bǔ)償器31發(fā)出的數(shù)據(jù)中,并且存放在圖像存儲(chǔ)器35中。圖像存儲(chǔ)器35最后連接顯示單元36,在顯示單元36中顯示視頻圖像。
在圖5中詳細(xì)地示出上下文靈敏的解碼器單元30。上下文靈敏的解碼器單元30具有標(biāo)題語法分析器37,所述的標(biāo)題語法分析器37讀取含在比特流中的標(biāo)題信息,并且這樣地控制解復(fù)用器38,使得分配給各個(gè)上下文的比特流段被劃分在解碼器支路39上。在此所述比特流段首先寫入在比特流緩沖器40中,接著通過Golomb解碼器41轉(zhuǎn)換成一個(gè)行程長度符號(hào)序列,所述的行程長度序列由行程長度解碼器42變換成所屬的圖像符號(hào),并且寫進(jìn)圖像符號(hào)緩沖器43中。圖像符號(hào)從圖像符號(hào)緩沖器43輸出通過上下文開關(guān)44讀進(jìn)中間寄存器45中,所述間寄存器后置一個(gè)圖像補(bǔ)償器46,在圖像補(bǔ)償器46中各又匯集比特層。
在從圖像符號(hào)緩沖器43向中間存儲(chǔ)器45傳輸開始時(shí),上下文開關(guān)處在一個(gè)預(yù)定的位置。在進(jìn)一步進(jìn)行讀取過程時(shí),通過上下文分辨器47控制上下文開關(guān)44。所述上下文分辨器47從輸出的圖像符號(hào)中確定讀出的圖像符號(hào)的上下文并且把上下文開關(guān)44切換到相應(yīng)解碼器支路39。如同在上下文靈敏和編碼器4中那樣在上下文靈敏的解碼器單元30中也有一個(gè)分組單元48,所述的分組單元48分析圖像符號(hào)的概率分布,并且通過控制上下文分辨器47確定對(duì)解碼器支路39分配上下文。此外所述的分組單元48控制Golomb解碼器41,其中分組單元48選擇與圖像符號(hào)的概率分布匹配的Golomb代碼。分組單元48遵循之工作的規(guī)則必須與上下文靈敏的編碼器單元4的分組單元21遵循之工作的規(guī)則相同,從而恰好與上下文靈敏的編碼器單元4的上下文開關(guān)18一樣地驅(qū)動(dòng)上下文靈敏的解碼器單元30的上下文開關(guān)44。
從而上下文靈敏的解碼單元30實(shí)施以下的方法步驟-通過解復(fù)用器38把各分配給一個(gè)圖像符號(hào)上下文的視頻信號(hào)流的比特流段分布到解碼器支路39上;-在形成長度符號(hào)中熵解碼比特流段;-把行程長度符號(hào)在表示圖像的圖像符號(hào)的視頻數(shù)據(jù)中進(jìn)行行程長度編碼;-通過上下文開關(guān)44從解碼器支路39把圖像符號(hào)傳輸進(jìn)圖像存儲(chǔ)器45中,其中上下文開關(guān)44在預(yù)定的時(shí)間點(diǎn)處在一個(gè)預(yù)定的位置,并且接著依據(jù)圖像符號(hào)的上下文被操作。
最后在圖6中示出一種變形的編碼器49,其中不直接在量化器11后面截取變換的預(yù)言誤差數(shù)據(jù),而在在上下文靈敏的編碼器單元4后進(jìn)行,并且通過一個(gè)反轉(zhuǎn)的上下文靈敏的編碼器單元50返回變換反轉(zhuǎn)的量化器12和反轉(zhuǎn)的離散的余弦變換器13。
最后應(yīng)當(dāng)說明,如果圖像符號(hào)與上下文之間有統(tǒng)計(jì)關(guān)聯(lián),說是可以采用在此說明的方法。在此,圖像符號(hào)可以是單個(gè)比特或者是一個(gè)比特層中的比特組,或者超過多個(gè)比特層。從而還能是一組圖像符號(hào)。
此外還要指出,本文說明的壓縮和解壓縮視頻數(shù)據(jù)流的方法和裝置既可以用硬件也可以用軟件實(shí)現(xiàn)。也可以設(shè)想混合的實(shí)施。
本文說明的方法在原則上與特定的數(shù)據(jù)源無關(guān),并且可以除了編碼組織以外還可以編碼運(yùn)動(dòng)向量,甚至用于編碼管理信息。
權(quán)利要求
1.壓縮視頻數(shù)據(jù)流的方法,其中通過圖像符號(hào)表示圖像的視頻數(shù)據(jù),具有以下的方法步驟-從圖像存儲(chǔ)器(17)讀取圖像符號(hào);-借助于上下文開關(guān)(18)在不同的編碼器支路(19)上把所述圖像符號(hào)分類成圖像符號(hào)組,所述的圖像符號(hào)組分別被分配給不同上下文,其中在預(yù)定的時(shí)間點(diǎn)把上下文開關(guān)(18)置于預(yù)定的位置并且接著依據(jù)要傳輸?shù)膱D像符號(hào)的相應(yīng)上下文來操作所述上下文開關(guān);-熵編碼圖像符號(hào)組并且把由編碼器支路(19)輸出的數(shù)據(jù)匯集成壓縮的視頻數(shù)據(jù)流。
2.如權(quán)利要求1所述的方法,其中,通過分配在相應(yīng)的編碼器支路(19)中的行程長度編碼器(23)把存在在于各個(gè)編碼器支路(19)中的圖像符號(hào)轉(zhuǎn)換成行程長度符號(hào)。
3.如權(quán)利要求2所述的方法,其中,借助于與相應(yīng)上下文中的圖像符號(hào)的概率分布匹配的熵代碼通過熵編碼器(24)轉(zhuǎn)換成熵代碼的代碼符號(hào)。
4.如權(quán)利要求3所述的方法,其中,通過熵編碼產(chǎn)生的比特流段通過復(fù)用器(6)匯集成壓縮的視頻數(shù)據(jù)流。
5.如權(quán)利要求4所述的方法,其中,由復(fù)用器(26)在壓縮的視頻數(shù)據(jù)流中嵌入關(guān)于比特流段長度的信息元。
6.如權(quán)利要求1至5之一所述的方法,其中,在壓縮過程中編碼器支路(19)借助于上下文邏輯(20、21)自適應(yīng)地分配給出圖像符號(hào)的上下文。
7.如權(quán)利要求1至6之一所述的方法,其中,為了把圖像符號(hào)轉(zhuǎn)換成代碼符號(hào)采用與相應(yīng)上下文中的圖像符號(hào)匹配的概率分布匹配的、可解析地計(jì)算的熵代碼。
8.如權(quán)利要求1至7之一所述的方法,其中,為所述熵代碼采用Golomb代碼。
9.如權(quán)利要求1至8之一所述的方法,其中,為了壓縮視頻數(shù)據(jù)借用組織數(shù)據(jù)。
10.裝置,用于實(shí)施如權(quán)利要求1至9之一所述的方法,其中,圖像存儲(chǔ)器(17)后接一個(gè)由上下文邏輯(20、22)控制的上下文開關(guān)(18),通過所述上下文開關(guān)(18)可以把從圖像存儲(chǔ)器(17)讀取的圖像符號(hào)分類成不同、分配給相應(yīng)的上下文的圖像符號(hào)組,并且傳送給熵編碼器(24)。
11.如權(quán)利要求10所述的裝置,其中上下文開關(guān)(18)依據(jù)上下文把圖像符號(hào)劃分到不同的編碼器支路(19),所述的編碼器支路(19)各自具有一個(gè)熵編碼器(24)用于進(jìn)行與相應(yīng)的上下文中的圖像符號(hào)匹配的概率分布匹配的熵編碼,以及一個(gè)行程長度編碼器(23),并且在輸出方連接在一個(gè)復(fù)用器(26)上。
12.一種解壓縮壓縮了的視頻數(shù)據(jù)流的方法,其中從視頻數(shù)據(jù)流提取圖像符號(hào),具有以下的步驟-把視頻數(shù)據(jù)流劃分成比特流段,所述比特流段各分配一個(gè)上下文;-把所述比特流段熵編碼成圖像符號(hào)組;-通過上下文開關(guān)(44)把劃分給不同的解碼器支路(39)中的圖像符號(hào)組中的圖像符號(hào)傳輸進(jìn)圖像存儲(chǔ)器(45)中,其中上下文開關(guān)(44)在預(yù)定的時(shí)間點(diǎn)處在預(yù)定的位置,并且接著依據(jù)信號(hào)圖像符號(hào)的上下文操作所述的上下文開關(guān)。
13.如權(quán)利要求12所述的方法,其中,通過熵解碼器(41)把含在比特流段中的代碼符號(hào)轉(zhuǎn)換成行程長度符號(hào),所述的行程長度符號(hào)接著通過行程長度解碼器(42)解碼成表達(dá)圖像的圖像符號(hào)的視頻數(shù)據(jù)。
14.如權(quán)利要求12或13所述的方法,其中,用可解析地計(jì)算的熵代碼編碼代碼符號(hào)。
15.如權(quán)利要求12或13所述的方法,其中用Golomb代碼編碼代碼符號(hào)。
16.如權(quán)利要求12至15之一所述的方法,其中,在解壓縮過程中解碼器支路(39)借助于上下文邏輯(47、48)自適應(yīng)地分配給圖像符號(hào)的上下文。
17.如權(quán)利要求12至16之一所述的方法,其中,通過解復(fù)用器(38)把視頻數(shù)據(jù)流的比特流段劃分到相應(yīng)分配給一個(gè)上下文的解碼器支路(39)上。
18.如權(quán)利要求12至17之一所述的方法,其中,由嵌入進(jìn)比特流中的、有關(guān)該比特流段的長度的信息元控制所述的解復(fù)用器(38)。
19.如權(quán)利要求12至18之一所述的方法,其中,為視頻信號(hào)采用組織數(shù)據(jù)。
20.裝置,用于解壓縮如權(quán)利要求12至19之一所述的視頻數(shù)據(jù),其中,可以通過解復(fù)用器(38)把比特流段分類在分配給圖像符號(hào)的不同上下文的解碼器支路(39)上,所述的解碼器支路(39)各有一個(gè)用于熵代碼的熵編碼器(41),并且其后接一個(gè)上下文開關(guān)(44)和一個(gè)圖像存儲(chǔ)器(45)。
21.如權(quán)利要求20所述的裝置,其中,解碼器支路(39)各有一個(gè)行程長度解碼器(42)。
全文摘要
提出一種壓縮和解壓縮視頻數(shù)據(jù)流的方法和裝置,其中采用圖像符號(hào)與其所屬的上下文之間的統(tǒng)計(jì)關(guān)系進(jìn)行壓縮。特別是說明了一種上下文靈敏的編碼器單元(14),其中通過上下文開關(guān)(18)把存放在圖像存儲(chǔ)器(17)中的圖像符號(hào)分配給不同的編碼器支路(19),在所述的編碼器支路(19)中借助于Golomb編碼器(24)和行程長度編碼器(23)編碼和壓縮圖像符號(hào)。
文檔編號(hào)H04N7/26GK1628466SQ03803337
公開日2005年6月15日 申請(qǐng)日期2003年2月4日 優(yōu)先權(quán)日2002年2月5日
發(fā)明者G·貝澤, K·伊爾納-費(fèi)恩斯, R·庫特卡, J·潘德爾 申請(qǐng)人:西門子公司