專利名稱:利用生成的能動表進(jìn)行量化/反量化的方法及裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及利用生成的能動表進(jìn)行量化/反量化的方法及裝置。具體地說,它是有關(guān)通過生成最適合于輸入影象的能動表來進(jìn)行量化/反量化的一種方法及裝置的。
背景技術(shù):
最近以來,從活字媒體開始發(fā)展的媒體(mebia)產(chǎn)業(yè),隨著因特網(wǎng)的飛速發(fā)展以及HDTV(高清晰度電視)、圖象電話的高速發(fā)展,由如超級文本的文字中心轉(zhuǎn)變?yōu)橐詣赢?、影象等為中心的可視性?nèi)容。這種圖象數(shù)據(jù),因其數(shù)據(jù)量非常龐大,通過通常的儲存、傳送方法,無論從功能上還是價(jià)格上,都非常不合理。
圖1示出了傳統(tǒng)編碼器框圖;而圖2示出了傳統(tǒng)MPEG(移動圖像專家組)的INTERA(交互式)量化表。
如圖1所示,傳統(tǒng)的動畫壓縮方法是,當(dāng)任意影象被輸入時,復(fù)雜度計(jì)算部(110)將計(jì)算輸入影象的復(fù)雜度,然后傳送到量化部(140)。與此同時,離散余弦變換處理部(120)也把輸入的影象信息變換成離散余弦后傳送到量化部(140)。
這時,在量化部(140),根據(jù)從復(fù)雜度計(jì)算部(110)及離散余弦變換處理部(120)獲得的變址信息,將在事先制作的量化表上檢測出影象壓縮率,如圖2所示。
圖3示出利用多種量化表的量化器框圖。
如圖3所示,在韓國專利公告1019980132895中記載有一種方法。該方法是在分析了多種多樣的影象的基礎(chǔ)上,試驗(yàn)性地生成了幾種具有代表性的表,并在編碼器和譯碼器上分別去約定表的數(shù)值之后,在編碼時去傳送被選擇的表值的變址。
上述方法因利用比傳統(tǒng)的標(biāo)準(zhǔn)表數(shù)要多的表,所以可適應(yīng)多樣的影象變化。但在上述的情況下,將不能細(xì)微地顯示個別的影象,而且當(dāng)表數(shù)增加時,將引起被傳送的變址的比特?cái)?shù)增加,因而產(chǎn)生編碼效率下降的缺點(diǎn)。
第二個方法是把在編碼器中使用的表,包含到比特?cái)?shù)列中進(jìn)行傳送;這時未約定的表也能進(jìn)行復(fù)原。
但傳送表的比特量將以幾何級數(shù)增加,會造成編碼效率大大降低的問題。
另外,上述的一些方法在表現(xiàn)方法上,沒有一個明確的標(biāo)準(zhǔn)。而且因比特量的過大增長,象質(zhì)的改善也不大。而且通常把重點(diǎn)放在把表值固定在建議值上,并將其用來改善量化步長,以適于量化器。
但這些方法,在頻率領(lǐng)域里將高頻與低頻是分開對待的,所以雖然析出了利用人類視覺特性的參數(shù),但由于表值是固定的,實(shí)際使用時對低頻與高頻有完全相同的反應(yīng),因而使其特性減半。
發(fā)明內(nèi)容本發(fā)明的目的是為了有效地去解決傳統(tǒng)技術(shù)中存在的問題,對當(dāng)前輸入的影象生成一種合適的量化表,并提供一種生成適用的能動表用量化/反量化方法及裝置。
為了完成上述的技術(shù)課題,本發(fā)明設(shè)有如下的幾個階段即,設(shè)有從任意的影像中析取復(fù)雜度的階段;設(shè)有通過被析取的復(fù)雜度及離散余弦變換來生成一定的量化表的階段;
設(shè)有根據(jù)生成的量化表進(jìn)行量化處理的階段。
為了完成上述的技術(shù)課題,本發(fā)明在另一方面還將設(shè)有如下的幾個階段即,設(shè)有根據(jù)量化步長去把從編碼發(fā)生量控制器產(chǎn)生的預(yù)測錯碼加以反量化的階段;設(shè)有將把被反量化的影像數(shù)據(jù)變換成反離散余弦,然后生成再生錯誤信號的階段;設(shè)有利用再生錯誤信號和復(fù)雜度,去再生影像的階段。
為了完成上述的技術(shù)課題,本發(fā)明又在另一方面還將設(shè)有如下的幾個手段即,設(shè)有為了預(yù)測和補(bǔ)償輸入的任意影像的動態(tài),進(jìn)行演算處理的復(fù)雜度計(jì)算手段;設(shè)有對輸入的任意影像數(shù)據(jù)進(jìn)行直交變換的離散余弦變換處理手段;設(shè)有為使緩沖器的數(shù)據(jù)存儲量維持在一個特定量,用來控制量化步長用的符號發(fā)生量控制手段;設(shè)有通過在復(fù)雜度計(jì)算手段中計(jì)算出來的復(fù)雜度生成一種適合任意影像特性的量化表,并利用任意的掃描方式和生成的量化表,將把從離散余弦變換處理手段提供的一定的影像數(shù)據(jù),進(jìn)行量化的量化手段;設(shè)有對量化的影像數(shù)據(jù)進(jìn)行編碼的信息熵編碼手段。
為了完成上述的技術(shù)課題,本發(fā)明又在另一方面還將設(shè)有如下的幾個手段即,設(shè)有按量化步長,從量化手段把預(yù)測錯碼進(jìn)行反量化的反量化手段;設(shè)有從反量化手段將把信號變換成反離散余弦,借以生成一個再生錯誤信號用的離散余弦變換處理手段;設(shè)有利用再生錯誤信號和預(yù)測信號,生成復(fù)原影像的反信息熵編碼手段。
如前所述,根據(jù)本發(fā)明生成的能動表量化/反量化方法及裝置,對輸入的任意影象,生成一種最合適的量化表,并用其去有效地去除高頻領(lǐng)域,使比特量減少;并能很方便地按各自的頻率領(lǐng)域去構(gòu)成表。
圖1示出傳統(tǒng)編碼器框圖。
圖2示出傳統(tǒng)MPEG(移動圖像專家組)的INTERA(交互式)量化表。
圖3示出利用多種量化表的量化器框圖。
圖4示出本發(fā)明一實(shí)例的編碼器部分框圖。
圖5示出本發(fā)明一實(shí)例的譯碼器部分框圖。
圖中符號的說明400復(fù)雜度計(jì)算手段410離散余弦變換處理手段420量化手段430符號發(fā)生量控制手段440信息熵編碼手段510反量化手段520反信息熵編碼手段530離散余弦變換處理手段具體實(shí)施方式下面參照附圖4和圖5,就利用通過生成一種能動表來進(jìn)行量化/反量化方法的一實(shí)例,進(jìn)行詳細(xì)說明。
圖4示出本發(fā)明一實(shí)例的編碼器的部分框圖。
如圖4所示,為了實(shí)現(xiàn)生成能動表的量化方法,設(shè)有復(fù)雜度計(jì)算手段(400),離散余弦變換處理手段(410),量化手段(420),符號發(fā)生量控制手段(430),信息熵編碼手段(440)。
復(fù)雜度計(jì)算手段(400),為析取輸入任意影像的特征參數(shù),將進(jìn)行復(fù)雜度的計(jì)算。
離散余弦變換處理手段(410),將把輸入的任意影像數(shù)據(jù)像元分成正方塊;并如在圖2所示,在像元塊單位的數(shù)據(jù)中,把低頻成份的影像數(shù)據(jù),偏置變換到左上端部分;而高頻成份的影像數(shù)據(jù),偏置變換到右下端部分。這時,若去除影像數(shù)據(jù)中,分布在右下端不必要的高頻成分,那么可在幾乎不損失影像數(shù)據(jù)量的情況下進(jìn)行壓縮。
量化手段(420),將利用在復(fù)雜度計(jì)算手段(400)中計(jì)算出來的復(fù)雜度,去生成適合輸入任意影像特性的量化表,并對任意影像數(shù)據(jù)進(jìn)行量化。
符號發(fā)生量控制手段(430),將去控制量化步長,使緩沖器(未圖示)的存儲量維持在特定量。
信息熵編碼手段(440),將根據(jù)從符號發(fā)生量控制手段(430)獲得的量化步長,去量化由離散余弦變換處理手段(410)提供的信號,生成預(yù)測錯碼。
圖5示出本發(fā)明一實(shí)例的譯碼器的部分框圖。
如在圖5所示,為了實(shí)現(xiàn)生成能動表的量化方法,設(shè)有由反信息熵編碼手段(510),反量化手段(520)及離散余弦變換處理手段(530)組成的譯碼器。
反量化手段(520),根據(jù)量化步長,對預(yù)測錯碼進(jìn)行譯碼,通過譯碼器進(jìn)行與影象復(fù)原過程相同的計(jì)算后,復(fù)原出譯碼器相同的次影象信號。
反信息熵編碼手段(510),將反量化器(520)復(fù)原的信號,變換成反離散余弦,并把再生錯碼信號提供給加法器。在這種情況下,利用再生錯碼信號和復(fù)雜度,加算出預(yù)測信號,構(gòu)成新的復(fù)原影象,以便去預(yù)測下一輸入影象。
下面將詳細(xì)說明用來生成能動表的一種利用量化手段的量化方法。
首先,從輸入的任意影像數(shù)據(jù)中,如果輸入任意一個像元,即一個代碼字,那么根據(jù)影像數(shù)據(jù)的空間頻率特性,由離散余弦變換處理手段(410),將低頻成份與高頻成份,分別偏置分布到左上端和右下端。
并且,為了析取任意影象的復(fù)雜度,決定利用如下數(shù)學(xué)試、[數(shù)學(xué)試1]σ′=110nΣf(x)2-(Σf(x))2n(n-1)]]>上述復(fù)雜度,是以標(biāo)準(zhǔn)偏差的10分之1的比例來取值的;它是根據(jù)一個像元塊內(nèi)的像元值(x)和像元數(shù)(n)來計(jì)算的。在這種情況下,所得的值愈大,表示變化強(qiáng)烈的高頻成份愈多;其值愈小則表示無變化的低頻成份。這時,上述復(fù)雜度可將被由分散或一般的標(biāo)準(zhǔn)偏差等來代替。
另外,輸入的影象,可以利用譯碼器中被復(fù)原的影像。在這種情況下,沒有必要去傳送由上述數(shù)學(xué)式1計(jì)算出的值,所以不會發(fā)生比特量超頂?shù)默F(xiàn)象。
然后,參照復(fù)雜度,去生成給定的量化表。這時生成量化的數(shù)學(xué)式如下。
q(u,v)=11+σ′e-r(u2+v2-center)]]>式中,center表示像元塊的中心。例如,在8×8的情況下,是為∑24.5。r表示低頻成份與高頻成份交界處的梯度。此時,r最適合的值為0.5~1.2。
根據(jù)數(shù)學(xué)式2生成的量化表,經(jīng)下面的數(shù)學(xué)式3換算后,如在標(biāo)準(zhǔn)方案中所看到的那樣將被量化。F^(u,v)=round(F(u,v)Q(u,v)xmquant)]]>在這里,F(xiàn)(u,v)是變換編碼后的系數(shù)值;而Q(u,v)是利用數(shù)學(xué)式2生成的量化表。為了生成上述的量化表而使用的值,將在譯碼器中為了反量化而經(jīng)過信息熵編碼后再被傳送。
上面使用的數(shù)學(xué)式2,可變換成如下數(shù)學(xué)式4的一元式來使用。q′(u)=11+σ′e-r(u-center)]]>式中,在數(shù)學(xué)式2中出現(xiàn)的σ’決定高頻與低頻的分界;σ’的增加,將起到使量化表內(nèi)容的分布向高頻方面進(jìn)行移動的作用;從整體上,只對以像塊內(nèi)的DC(直流)為基準(zhǔn)的狹窄領(lǐng)域進(jìn)行譯碼。并且,使高頻成分的大部分變?yōu)?,提高了編碼效率,減少了比特率。
另外,r表示在分界上的梯度。因此,r值愈小,愈能得到完滿的梯度;而且適當(dāng)?shù)偷臄?shù)值,可以去減少量化值在分界部分上可能發(fā)生的誤差。在數(shù)學(xué)式4中,r若為0,那么數(shù)學(xué)式2將變?yōu)?/(1+σ’),將會起到象線性量化器的作用。梯度愈完滿,所包含的高頻成分將愈多,反映人的視覺特性就變少。
然后,為了去除偏向各自不同領(lǐng)域的影象數(shù)據(jù)中的高頻成分,在量化手段(420)中生成量化表;在通過量化表進(jìn)行量化的過程中,將其變換成一個只存在低頻成份的量化影象數(shù)據(jù),然后再將其輸出。
只存在低頻成份的影象數(shù)據(jù),將由信息熵編碼手段來進(jìn)行編碼處理。
本發(fā)明作為參考,雖然只是對圖示的一實(shí)例進(jìn)行了說明,但只要具備本技術(shù)領(lǐng)域的通常知識的人都能知道,由此可以導(dǎo)出多種多樣的,以及均等的其它實(shí)例。為此,對本發(fā)明的技術(shù)保護(hù)范圍,應(yīng)將根據(jù)權(quán)利要求的技術(shù)思想來加以確定。
權(quán)利要求
1.一種利用生成的能動表進(jìn)行量化/反量化的方法及裝置,其特征是它設(shè)有從被輸入的任意影象中析取復(fù)雜度的階段;設(shè)有通過被析取的復(fù)雜度及離散余弦的變換,來生成給定的量化表階段;以及設(shè)有根據(jù)生成的量化表進(jìn)行量化處理的階段。
2.按照權(quán)利要求1所述的利用生成的能動表進(jìn)行量化/反量化的方法及裝置,其特征是量化表是通過下式能動地生成的。q(u,v)=11+σ′e-r(u2+v2-center)]]>
3.按照權(quán)利要求2所述的利用生成的能動表進(jìn)行量化/反量化的方法及裝置,其特征是所述的r值的取值范圍是0.5-1.2。
4.按照權(quán)利要求1所述的利用生成的能動表進(jìn)行量化/反量化的方法及裝置,其特征是為生成能動表,利用下式將把高頻和低頻的量化系數(shù)值的邊界,能設(shè)計(jì)的可變。q(u,v)=11+σ′e-r(u2+v2-center)]]>
5.按照權(quán)利要求1所述的利用生成的能動表進(jìn)行量化/反量化的方法及裝置,其特征是為生成能動表,利用下式將去調(diào)整高頻及低頻的整個量化系數(shù)水平及梯度。q(u,v)=11+σ′e-r(u2+v2-center)]]>
6.一種利用生成的能動表進(jìn)行量化/反量化的方法及裝置,其特征是它設(shè)有根據(jù)量化步長,把編碼發(fā)生量控制器中的預(yù)測錯碼進(jìn)行反量化的階段;設(shè)有把反量化影象數(shù)據(jù)變換成反離散余弦,然后去生成一種再生錯誤信號的階段;以及利用再生錯誤信號和復(fù)雜度來再生影象的階段。
7.一種利用生成的能動表進(jìn)行量化/反量化的方法及裝置,其特征是它設(shè)有復(fù)雜度計(jì)算手段,它為預(yù)測和補(bǔ)償輸入的任意影象動態(tài)而進(jìn)行演算處理;設(shè)有對輸入的任意影象數(shù)據(jù)進(jìn)行直交變換的離散余弦變換處理手段;設(shè)有符號發(fā)生量控制手段,它為使緩沖器的數(shù)據(jù)儲蓄量維持在一個特定的量,去控制量化步長;通過在復(fù)雜度計(jì)算手段中被計(jì)算出來的復(fù)雜度,生成一種適于輸入任意影像特性的量化表,并利用任意的掃描方式和生成的量化表,將把從離散余弦交換處理手段提供的一定的影象數(shù)據(jù),加以量化的量化手段;以及對量化的影象數(shù)據(jù)進(jìn)行編碼的信息熵編碼手段。
8.一種利用生成的能動表進(jìn)行量化/反量化的方法及裝置,其特征是它設(shè)有一個從量化手段中,按量化步長把預(yù)測錯碼進(jìn)行反量化的反量化手段;設(shè)有從反量化手段中,把信息變換成反離散余弦,借以生成一個再生錯誤信號用的離散余弦變換處理手段;以及設(shè)有利用再生錯誤信息和預(yù)測信息,生成復(fù)原影象的反信息熵編碼手段。
全文摘要
本發(fā)明涉及通過生成適合于輸入影象的能動表來進(jìn)行量化/反量化的一種方法及裝置的。所要解決的問題是隨著因特網(wǎng)及高清晰度電視、圖象電話的高速發(fā)展,由文字中心轉(zhuǎn)變?yōu)橐詣赢?、影象等為中心的可視性?nèi)容。這種圖象數(shù)據(jù),通過通常的儲存、傳送方法,無論從功能上還是價(jià)格上都不合理。本發(fā)明的技術(shù)要點(diǎn)是它設(shè)有從被輸入的任意影象中析取復(fù)雜度的階段;設(shè)有通過被析取的復(fù)雜度及離散余弦的變換,來生成給定的量化表階段;以及設(shè)有根據(jù)生成的量化表進(jìn)行量化處理的階段。本發(fā)明對輸入的任意影象,生成一種最合適的量化表,并用其可有效地去除高頻領(lǐng)域,使比特量減少;并能按各自的頻率領(lǐng)域去構(gòu)成表。本發(fā)明適合于輸入影象的能動表來進(jìn)行量化/反量化。
文檔編號H04N7/26GK1494323SQ0213329
公開日2004年5月5日 申請日期2002年10月29日 優(yōu)先權(quán)日2002年10月29日
發(fā)明者金正佑 申請人:樂金電子(沈陽)有限公司