專(zhuān)利名稱(chēng):圖像壓縮方法及其裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明是關(guān)于 一種圖像壓縮方法以及其裝置,且特別是關(guān)于依據(jù)先
前圖 <象的信息,動(dòng)態(tài)地調(diào)整量化值(quantization value )的壓縮方法及其裝置。
背景技術(shù):
圖像壓縮意指將數(shù)字圖像的數(shù)據(jù)量減小至可由存儲(chǔ)或者傳輸媒體 支持的程度。「數(shù)據(jù)」為傳輸「信息」的載體,且等量的信息可由不同 數(shù)據(jù)量表示。舉例而言,若一則故事由不同人來(lái)講述,則不同人描述相 同故事的語(yǔ)言量完全不同,其中故事為所感興趣的「信息」,而語(yǔ)言為 表示此信息的「數(shù)據(jù)」。提供無(wú)關(guān)信息或重復(fù)講述已知信息的數(shù)據(jù)被稱(chēng) 為數(shù)據(jù)冗余性。在數(shù)學(xué)中可定量地判定數(shù)據(jù)冗余性,例如,Rd=l-1/Cr, 其中Rd為數(shù)據(jù)冗余性,且Cr為壓縮比(compression ratio )。
壓縮比Cr等于N1/N2,其中Nl以及N2分別為在圖像壓縮之前以 及之后的數(shù)據(jù)量。壓縮比Cr 一般為代替比特率來(lái)表示壓縮系統(tǒng)的能力。 對(duì)于有損壓縮處理而言,壓縮比Cr變高表示數(shù)據(jù)冗余性被高度消除, 但另一方面,所壓縮的圖像的失真度也相對(duì)的變高。為了在消除數(shù)據(jù)冗 余性與降低所壓縮的圖像的失真度之間取得平衡,便需要適當(dāng)?shù)乜刂茐?縮比Cr。
圖1為傳統(tǒng)圖像壓縮模型的示意圖。請(qǐng)參照?qǐng)D1,基于預(yù)設(shè)的保真 度標(biāo)準(zhǔn)(fidelity criterion),量化器110依據(jù)量化參數(shù)QP來(lái)量化圖像。因 為人眼對(duì)整個(gè)視覺(jué)信息具有不同的敏感度,例如,人眼對(duì)圖像的平坦區(qū) 域比對(duì)圖像的邊緣較為敏感,所以當(dāng)與正常視覺(jué)處理相比時(shí),量化器110 可以減少不重要的心理視覺(jué)冗余信息。編碼器120為對(duì)圖像進(jìn)行可變長(zhǎng) 度編碼,亦即編碼器120使用較少位數(shù)目來(lái)編碼出現(xiàn)機(jī)率較小的灰階, 藉以減少編碼冗余性。
量化參數(shù)QP與壓縮比Cr極其有關(guān)。以往,圖像為依據(jù)一固定壓縮 比Cr來(lái)進(jìn)行壓縮。以具有240x320個(gè)像素的圖像為例,若每一像素包 含有光的三原色的成分,亦即紅色、綠色以及藍(lán)色,且使用八位來(lái)表示 每一原色,則圖像的總位數(shù)為240x320x3x8。對(duì)固定壓縮比Cr=2而言, 所壓縮的圖像的總位數(shù)為(240x320x3x8)/2,且平均比特率(average bit mte)等于十二。因此,通常需要透過(guò)速率控制處理(rate control process), 來(lái)依據(jù)所壓縮的圖像的平均比特率,調(diào)整量化參數(shù)QP的大小,及維持 固定壓縮比Cr。
然而,景物復(fù)雜性并非均勻地分布于圖像之中。當(dāng)圖像的景物復(fù)雜 性較低時(shí),包含量化及編碼的編碼處理可幾乎被視作為無(wú)損壓縮處理, 且壓縮比Cr不會(huì)因此減少。相反地,當(dāng)圖像的景物復(fù)雜性較高時(shí),為 了控制使壓縮比Cr固定,便需要提高所壓縮的圖像的失真度,以換取 較少的位數(shù)。因此,圖像質(zhì)量以及壓縮比Cr往往不能同時(shí)兼顧。
再者,對(duì)于整個(gè)圖像而言,圖像的壓縮順序一般為由上而下。當(dāng)目 前圖像的某一位置進(jìn)行編碼時(shí),可以知道已編碼的信息,但不可預(yù)測(cè)尚 未編碼的信息。因此,若圖像中的上半部景物復(fù)雜性較高,且圖像中的 下半部景物復(fù)雜性較低時(shí),上半部的失真度會(huì)被增加,以維持使上半部 的壓縮比Cr不減少。但是,圖像的下半部景物復(fù)雜性不可預(yù)測(cè),因此 圖像的下半部通常會(huì)根據(jù)與上半部相同的量化參數(shù)QP來(lái)進(jìn)行量化,因
而增加了下半部的壓縮比Cr。當(dāng)壓縮比Cr高于默認(rèn)值時(shí),多余的頻寬 便不能被有效地利用來(lái)降低上半部的失真度及增強(qiáng)上半部的峰值信雜 比(PSNR)。
發(fā)明內(nèi)容
有鑒于此,本發(fā)明提供一種圖像壓縮方法以及其裝置。由于連續(xù)圖 像相互具有相關(guān)性,本發(fā)明依據(jù)先前圖像的景物復(fù)雜性而動(dòng)態(tài)地調(diào)整量 化值。不僅可將圖像的壓縮比控制在適當(dāng)范圍內(nèi),且也可有效地利用傳 輸媒體的頻寬來(lái)增強(qiáng)圖像質(zhì)量。圖像壓縮裝置為依據(jù)此方法而據(jù)以實(shí)施。
本發(fā)明提供一種圖像壓縮方法。首先,接收具有多個(gè)區(qū)域的圖像, 且依據(jù)量化值來(lái)對(duì)圖像的 一特定區(qū)域進(jìn)行量化處理,其中特定區(qū)域?yàn)樯?br>
述區(qū)域其中之一。接著,在編碼處理之后,計(jì)算圖像的特定區(qū)域的第一 平均比特率,并且依據(jù)圖像的特定區(qū)域的第一平均比特率來(lái)調(diào)整下一個(gè) 所接收的圖像的相應(yīng)特定區(qū)域的量化值。
本發(fā)明提供一種圖像壓縮裝置,其包含接收模塊、量化模塊、編碼 模塊以及控制模塊。接收模塊接收一圖像,其中圖像具有多個(gè)區(qū)域。量 化模塊耦接接收模塊,其依據(jù)一量化值來(lái)對(duì)圖像的一特定區(qū)域進(jìn)行量化 處理,其中特定區(qū)域?yàn)樯鲜鰠^(qū)域其中之一。編碼模塊耦接量化模塊,用 于對(duì)圖像的特定區(qū)域進(jìn)行編碼處理??刂颇K耦接編碼模塊,其于編碼 處理后計(jì)算圖像的特定區(qū)域的第 一平均比特率,并且依據(jù)圖像的特定區(qū) 域的第一平均比特率來(lái)調(diào)整下一個(gè)所接收的圖像的相應(yīng)特定區(qū)域的量 化值。
本發(fā)明提供一種圖像壓縮方法以及其裝置,其依據(jù)先前壓縮的圖像 的一區(qū)域的第一平均比特率,來(lái)動(dòng)態(tài)地調(diào)整下一個(gè)所接收的圖像的相應(yīng) 區(qū)域的量化值,其中第 一平均比特率可以反應(yīng)出圖像中此區(qū)域的景物復(fù) 雜性。由于連續(xù)圖像通?;ゾ哂懈呦嚓P(guān)性,藉由上述調(diào)整量化值的方式, 本發(fā)明能依據(jù)圖像的區(qū)域的景物復(fù)雜性,對(duì)圖像的區(qū)域進(jìn)行壓縮,藉以 有效地利用頻寬及降低所壓縮的圖像的失真度。
為讓本發(fā)明的上述和其它目的、特征和優(yōu)點(diǎn)能更明顯易懂,下文特 舉本發(fā)明的優(yōu)選實(shí)施例,并配合所附圖式,作詳細(xì)說(shuō)明如下。
圖1為傳統(tǒng)圖像壓縮模型的示意圖。
圖2為本發(fā)明的 一個(gè)實(shí)施例的圖像壓縮裝置的方塊圖。
圖3A為本發(fā)明的一實(shí)施例所壓縮的圖像的示意圖。
圖3B為本發(fā)明的一實(shí)施例下一個(gè)所壓縮的圖像的示意圖。
圖4為本發(fā)明的一實(shí)施例的圖像壓縮方法的流程圖。
主要組件符號(hào)說(shuō)明 110:量化器 120:編碼器 200:圖像壓縮裝置
210:接收模塊
220:量化模塊
230:編碼模塊
240:控制模塊
310:所壓縮的圖像
311:區(qū)域
312:區(qū)域
313:區(qū)域
314:區(qū)域
320:所壓縮的圖像
Br:第一平均比特率 P:位數(shù)百分比 Q:量化值 QP:量化參數(shù)
具體實(shí)施例方式
在本發(fā)明的一個(gè)實(shí)施例中,透過(guò)記錄圖像的景物復(fù)雜性來(lái)改進(jìn)下一 個(gè)圖像的編碼方式,并且藉此降低所壓縮的圖像的失真度。
圖2為本發(fā)明的一實(shí)施例的圖像壓縮裝置的方塊圖。請(qǐng)參照?qǐng)D2, 圖像壓縮裝置200包括接收模塊210、量化模塊220、編碼模塊230 以及控制模塊240。接收模塊210接收一圖像,其中圖像具有多個(gè)區(qū)域。 量化模塊220耦接接收模塊210,其依據(jù)量化值Q來(lái)對(duì)圖像的一特定區(qū) 域進(jìn)行量化處理,其中特定區(qū)域?yàn)樯鲜鰠^(qū)域其中之一。編碼模塊230耦 接量化模塊220,用以對(duì)圖像的特定區(qū)域進(jìn)行編碼處理??刂颇K240 耦接編碼模塊230,用以在編碼處理后計(jì)算圖像的特定區(qū)域的第一平均 比特率,并且依據(jù)圖像的特定區(qū)域的第一平均比特率來(lái)調(diào)整下一個(gè)所接 收的圖像的相應(yīng)特定區(qū)域的量化值Q 。以下為各模塊的功能描述。
圖3A為本發(fā)明的一實(shí)施例所壓縮的圖像的示意圖。假設(shè)圖像具有 四個(gè)區(qū)域,且這些區(qū)域分別標(biāo)示為區(qū)域311至314以便于敘述。請(qǐng)參照 圖2及圖3A,當(dāng)接收?qǐng)D像時(shí),量化模塊220將所接收的圖像從區(qū)域311 至區(qū)域314進(jìn)行量化處理,此量化處理例如為差分脈碼調(diào)制(differential
pulse code modulation, DPCM )。由于差分脈碼調(diào)制為本領(lǐng)域具有通常知 識(shí)者所熟知的,故在此不加以贅述。當(dāng)進(jìn)行量化處理時(shí),量化模塊220 采用一量化值Q量化圖像的一特定區(qū)域(例如區(qū)域311)。在本實(shí)施例 中,量化值Q與量化的步階長(zhǎng)度(step size)有關(guān),也就是說(shuō)當(dāng)量化值 Q變高,所壓縮的圖像310的失真度亦變高。
在量化處理之后,編碼模塊23 0對(duì)圖像的特定區(qū)域進(jìn)行編碼處理, 此編碼處理例如為可變長(zhǎng)度編碼(variable length coding, VLC ),亦即使 用較少的位數(shù)將出現(xiàn)機(jī)率較多的灰階進(jìn)行編碼,以減少編碼冗余性。在 編碼處理之后,控制模塊240計(jì)算所壓縮的圖像310的特定區(qū)域的第一 平均比特率Br。第一平均比特率Br可反應(yīng)出圖像的特定區(qū)域的景物復(fù) 雜性。請(qǐng)參照?qǐng)D3A,區(qū)域3U至314壓縮后的位數(shù)占整個(gè)所壓縮的圖像 的總位數(shù)的位數(shù)百分比P分別為40%、 25%、 20%以及15%,且區(qū)域311 至314的第一平均比特率Br分別為12、 7.5、 6以及4.5位/秒,其中位 數(shù)百分比P為每一區(qū)域的位數(shù)與所壓縮的圖像310的總位數(shù)之比。第一 平均比特率Br較高表示較高頻率成分存在于特定區(qū)域中(例如區(qū)域 311),亦即表示此特定區(qū)域的景物復(fù)雜性較高。相反地,第一平均比特 率Br較低表示特定區(qū)域(例如區(qū)域314)的景物復(fù)雜性較低。
若所接收的圖像的每一像素具有三個(gè)色彩成份,且釆用八個(gè)位表示 每一色彩成份,則在壓縮比等于二時(shí),所壓縮的圖像的第二平均比特率 應(yīng)為十二。請(qǐng)參照?qǐng)D3A,所壓縮的圖像310的第二平均比特率為 (12+7.5+6+4.5)/4=7.5位/秒,從此處可以看出有冗余頻寬未能被有效的 利用。因此,控制模塊240依據(jù)所壓縮的圖像310的特定區(qū)域的第一平 均比特率Br來(lái)調(diào)整下一個(gè)所接收的圖像的相應(yīng)特定區(qū)域的量化值Q。
圖3B為本發(fā)明的一實(shí)施例下一個(gè)所壓縮的圖像的示意圖。請(qǐng)參照 圖2、圖3A以及圖3B,以區(qū)域311為上述特定區(qū)域?yàn)槔?,控制模塊240 已獲得所壓縮的圖像310的區(qū)域311的第一平均比特率Br-12位/秒。為 了有效地利用冗余頻寬,控制模塊240將下一個(gè)所接收的圖像的相應(yīng)區(qū) 域311的量化值Q調(diào)整為較低(在此為假設(shè)量化值Q與量化的步階長(zhǎng)度 成正比關(guān)系),藉以降低下一個(gè)所壓縮的圖像320的相應(yīng)區(qū)域311的失真 度。如圖3B中所示,下一個(gè)所壓縮的圖像320的相應(yīng)區(qū)域311的位數(shù) 百分比P增加至52.1%,且第一平均比特率Br亦增加至25位/秒。簡(jiǎn)而言之,在允許的頻寬下,控制模塊240使用較多的位數(shù)來(lái)?yè)Q取所壓縮的 圖像320的相應(yīng)區(qū)域311較低的失真度。
依此類(lèi)推,控制模塊240亦將下一個(gè)所接收的圖像的相應(yīng)區(qū)域312 的量化值Q調(diào)整為較低,使得下一個(gè)所壓縮的圖像320的相應(yīng)區(qū)域312 的位數(shù)百分比P及第一平均比特率Br分別增加至26.4%以及12.5位/秒。 歸因于所壓縮的圖像310的區(qū)域313以及314的景物復(fù)雜性較低,控制 模塊240可以將下一個(gè)所接收的圖像的相應(yīng)區(qū)域313以及314的量化值 Q調(diào)整為較高,或者不對(duì)其進(jìn)行調(diào)整。因此,下一個(gè)所壓縮的圖像320 的相應(yīng)區(qū)域313的位數(shù)百分比P以及第一平均比特率Br分別為12.5%以 及6位/秒,且下一個(gè)所壓縮的圖像320的相應(yīng)區(qū)域314的位數(shù)百分比P 以及第一平均比特率Br分別為10%以及4.5位/秒。
請(qǐng)參照?qǐng)D3B,如上述實(shí)施例的描述,控制模塊240將下一個(gè)所壓縮 的圖像320的第二平均比特率控制在 一 預(yù)定值內(nèi),亦即 (25+12.5+6+4.5)=12位/秒,此第二平均比特率為設(shè)定壓縮比等于二的所 要目標(biāo)。藉由動(dòng)態(tài)地調(diào)整量化值Q,不僅可維持圖像的壓縮比(或圖像 的第二平均比特率),且也可有效地利用冗余頻寬來(lái)降低圖像的失真度, 及增強(qiáng)所壓縮的圖像的質(zhì)量。
值得注意的是,在此圖像中區(qū)域的數(shù)目以及大小并不局限于此范 圍,本領(lǐng)域具有通常知識(shí)者可依據(jù)本發(fā)明實(shí)施例的教示,而將任何壓縮 標(biāo)準(zhǔn)應(yīng)用于上述實(shí)施例的圖像壓縮裝置中,例如,國(guó)際電信聯(lián)盟(ITU- T ) 提供的靜態(tài)圖像壓縮(Joint Photographic Experts G蘭p, JPEG)標(biāo)準(zhǔn), 或者H.26X視訊壓縮標(biāo)準(zhǔn)等。舉例而言,靜態(tài)圖像壓縮標(biāo)準(zhǔn)為以8x8個(gè) 像素的區(qū)塊為單位,因此任何大小的區(qū)塊可以形成上述實(shí)施例中圖像的 區(qū)域。此外,本發(fā)明的實(shí)施例中的量化值Q為與量化的步階長(zhǎng)度有關(guān), 在本發(fā)明的另一實(shí)施例中,量化值Q可與量化的步階數(shù)(stepnumber) 有關(guān),也就是說(shuō)量化值Q愈高,所壓縮的圖像的失真度會(huì)愈低。
由上述幾個(gè)實(shí)施例的敘述,在此可以歸納為下列的方法流程。圖4 為本發(fā)明的一實(shí)施例的圖像壓縮方法的流程圖。請(qǐng)參照?qǐng)D4,首先,接 收一圖像(步驟S401),而此圖像具有多個(gè)區(qū)域。接著,依據(jù)一量化值將 圖像的一特定區(qū)域進(jìn)行量化處理(步驟S402),其中特定區(qū)域?yàn)樯鲜鰠^(qū)域 其中之一。在編碼處理之后,計(jì)算圖像的特定區(qū)域的第一平均比特率(步
驟S403)。接下來(lái),依據(jù)圖像的特定區(qū)域的第一平均比特率,來(lái)調(diào)整下 一個(gè)所接收的圖像的相應(yīng)特定區(qū)域的量化值。因此,下一個(gè)所接收的圖 像為采用與先前所壓縮的圖像的景物復(fù)雜性相關(guān)的量化值來(lái)進(jìn)行壓縮, 而在允許的頻寬及固定壓縮比的條件下,能適當(dāng)?shù)乜刂葡乱粋€(gè)所壓縮的 圖像的失真度。
綜上所述,本發(fā)明的實(shí)施例提供一種圖像壓縮方法以及其裝置,其 為根據(jù)先前圖像的景物復(fù)雜性來(lái)動(dòng)態(tài)地調(diào)整量化值。當(dāng)將具有多個(gè)區(qū)域 的圖像進(jìn)行壓縮時(shí),所壓縮的圖像的 一 區(qū)域的第 一平均比特率可反應(yīng)出 此區(qū)域的景物復(fù)雜性,而所壓縮的圖像的第二平均比特率可被應(yīng)用來(lái)控 制壓縮比。本發(fā)明的實(shí)施例利用所壓縮的圖像的一區(qū)域的第一平均比特 率來(lái)調(diào)整下一個(gè)所接收的圖像的相應(yīng)區(qū)域的量化值,且透過(guò)將第二平均 比特率控制在一預(yù)定值內(nèi)來(lái)維持固定壓縮比。因此,本發(fā)明的實(shí)施例能 在固定的壓縮比下,動(dòng)態(tài)地調(diào)整量化值以增強(qiáng)所壓縮的圖像的質(zhì)量,及 有效地利用頻寬。
雖然本發(fā)明已以?xún)?yōu)選實(shí)施例揭露如上,然其并非用以限定本發(fā)明, 本領(lǐng)域技術(shù)人員,在不脫離本發(fā)明的精神和范圍內(nèi),當(dāng)可作些許的更動(dòng) 與潤(rùn)飾,因此本發(fā)明的保護(hù)范圍當(dāng)視后附的申請(qǐng)專(zhuān)利范圍所界定者為 準(zhǔn)。
權(quán)利要求
1. 一種圖像壓縮方法,包括接收一圖像,其中該圖像具有多個(gè)區(qū)域;依據(jù)一量化值將該圖像的一特定區(qū)域進(jìn)行一量化處理,其中該特定區(qū)域?yàn)樵撔﹨^(qū)域中之一者;在一編碼處理后,計(jì)算該圖像的該特定區(qū)域的第一平均比特率;以及依據(jù)該圖像的該特定區(qū)域的該第一平均比特率,調(diào)整下一個(gè)所接收的該圖像的相應(yīng)該特定區(qū)域的該量化值。
2. 如權(quán)利要求1所述的圖像壓縮方法,還包含 控制該圖像的第二平均比特率在 一 預(yù)定值內(nèi)。
3. 如權(quán)利要求l所述的圖像壓縮方法,其中依據(jù)該圖像的該特定區(qū) 域的該第一平均比特率,調(diào)整下一個(gè)所接收的該圖像的相應(yīng)該特定區(qū)域 的該量化值的步驟包括當(dāng)該圖像的該特定區(qū)域的該第一平均比特率較高時(shí),將下一個(gè)所接 收的該圖像的相應(yīng)該特定區(qū)域的該量化值調(diào)整為較?。灰约爱?dāng)該圖像的該特定區(qū)域的該第 一平均比特率較小時(shí),將下一個(gè)所接 收的該圖像的相應(yīng)該特定區(qū)域的該量化值調(diào)整為較高。
4. 如權(quán)利要求1所述的圖像壓縮方法,其中該編碼處理為可變長(zhǎng)度 編碼處理。
5. —種圖像壓縮裝置,其包含一接收模塊,用于接收一圖像,其中該圖像具有多個(gè)區(qū)域; 一量化模塊,耦接該接收模塊,依據(jù)一量化值將該圖像的一特定區(qū)域進(jìn)行一量化處理,其中該特定區(qū)域?yàn)樵撔﹨^(qū)域其中之一;一編碼模塊,耦接該量化模塊,將該圖像的該特定區(qū)域進(jìn)行一編碼處理;以及一控制模塊,耦接該編碼模塊,在該編碼處理之后計(jì)算該圖像的該 特定區(qū)域的第 一平均比特率,并且依據(jù)該圖像的該特定區(qū)域的該第 一平 均比特率,調(diào)整下一個(gè)所接收的該圖像的相應(yīng)該特定區(qū)域的該量化值。
6. 如權(quán)利要求5所述的圖像壓縮裝置,其中該控制模塊還將該圖像 的第二平均比特率控制在 一 預(yù)定值內(nèi)。
7. 如權(quán)利要求5所述的圖像壓縮裝置,其中該控制模塊在該圖像的 該特定區(qū)域的該第一平均比特率為較高時(shí),將下一個(gè)所接收的該圖像的 相應(yīng)該特定區(qū)域的該量化值調(diào)整為較小,且在該圖像的該特定區(qū)域的該 第一平均比特率較小時(shí),將下一個(gè)所接收的該圖像的相應(yīng)該特定區(qū)域的 該量化值調(diào)整為較高。
8. 如權(quán)利要求5所述的圖像壓縮裝置,其中該編碼處理為一可變長(zhǎng) 度編碼處理。
全文摘要
本發(fā)明提供一種圖像壓縮方法以及其裝置。首先,接收具有多個(gè)區(qū)域的圖像。接著,依據(jù)量化值對(duì)圖像的一特定區(qū)域進(jìn)行量化處理,其中特定區(qū)域?yàn)樯鲜鰠^(qū)域其中之一。接著,在編碼處理之后,計(jì)算圖像的特定區(qū)域的第一平均比特率。此外,依據(jù)圖像的特定區(qū)域的第一平均比特率,來(lái)調(diào)整下一個(gè)所接收的圖像的相應(yīng)特定區(qū)域的量化值。因此,藉由參考先前圖像的景物復(fù)雜性來(lái)調(diào)整量化值,不僅可以增強(qiáng)壓縮圖像的質(zhì)量,也可在不浪費(fèi)頻寬的情況下將壓縮比維持為一固定值。
文檔編號(hào)H04N7/30GK101394561SQ20081009283
公開(kāi)日2009年3月25日 申請(qǐng)日期2008年5月4日 優(yōu)先權(quán)日2007年9月19日
發(fā)明者鈕圣君 申請(qǐng)人:奇景光電股份有限公司