專利名稱:一種基于Curvelet變換和相位一致的無(wú)參考圖像質(zhì)量評(píng)價(jià)方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種圖像質(zhì)量評(píng)價(jià)方法,特別涉及一種基于Curvelet變換和相位一致的無(wú)參考圖像質(zhì)量評(píng)價(jià)方法,屬于圖像分析領(lǐng)域。
背景技術(shù):
人類獲取外界信息的70%來(lái)自于視覺系統(tǒng),圖像作為一種信息傳遞和交流的重要媒介在人類生活中扮演著越來(lái)越重要的角色。特別是隨著多媒體技術(shù)、計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)的快速發(fā)展,圖像處理技術(shù)也向著數(shù)字化,網(wǎng)絡(luò)化,智能化方面邁進(jìn)。例如視頻會(huì)議、安全監(jiān)控、醫(yī)學(xué)探測(cè)、衛(wèi)星遙感等。然而在數(shù)字圖像的處理過(guò)程中,由于物理設(shè)備和圖像處理算法的限制,不可避免的會(huì)對(duì)圖像的質(zhì)量產(chǎn)生影響,這將極大的降低人類的視覺感觀體驗(yàn)。圖像質(zhì)量評(píng)價(jià)作為傳統(tǒng)的圖像處理技術(shù)之一。它幾乎包含了圖像處理過(guò)程中的所有方面,例如:獲取、處理、壓縮、傳輸、重構(gòu)等。在獲取圖像方面,由于采集設(shè)備的軟硬件固有的缺陷以及人為操作所引進(jìn)的抖動(dòng)、曝光不足、焦距等問(wèn)題都會(huì)帶來(lái)圖像質(zhì)量的下降;在處理方面,圖像龐大的信息量和有限的存儲(chǔ)空間以及彩色空間的轉(zhuǎn)換、格式的轉(zhuǎn)換、圖像的壓縮等都會(huì)造成圖像質(zhì)量的損失;在傳輸方面,由于目前網(wǎng)絡(luò)通信帶寬的限制,大多數(shù)圖像都采用有損壓縮技術(shù),然后圖像的有損壓縮會(huì)引進(jìn)各種失真,例如JPEG壓縮由于采用DCT變換,它會(huì)在壓縮過(guò)程中引進(jìn)塊效應(yīng)和模糊效應(yīng);而JPEG2000壓縮技術(shù)由于采用離散小波(DWT)變換,它則會(huì)在壓縮過(guò)程中引進(jìn)振鈴效應(yīng)和模糊效應(yīng)等,另外網(wǎng)絡(luò)數(shù)據(jù)包丟失、網(wǎng)絡(luò)擁塞等問(wèn)題也常常會(huì)影響圖像的質(zhì)量;最后在重構(gòu)方面,由于顯示設(shè)備的物理特質(zhì),會(huì)出現(xiàn)圖像對(duì)比度、亮度、色域、色調(diào)等校準(zhǔn)問(wèn)題,這些都將帶來(lái)圖像質(zhì)量的變化。由于在實(shí)際系統(tǒng)中幾乎所有圖像都要經(jīng)歷以上過(guò)程。因此一個(gè)有效的圖像質(zhì)量評(píng)價(jià)方法可以在系統(tǒng)參數(shù)調(diào)整、算法比較和系統(tǒng)優(yōu)化等方面起到十分重要的作用:(I)可以嵌入到圖像系統(tǒng)中調(diào)節(jié)參數(shù)。例如圖像采集系統(tǒng)可以根據(jù)圖像質(zhì)量進(jìn)行參數(shù)調(diào)整從而得到最好的數(shù)據(jù)采集、圖像重構(gòu)系統(tǒng)可以根據(jù)圖像質(zhì)量進(jìn)行反饋并自動(dòng)調(diào)整系統(tǒng)從而得到最佳的用戶視覺體驗(yàn)。(2)可以用來(lái)衡量圖像處理算法性能的高低。眾所周知,主觀評(píng)價(jià)是最為可靠的圖像質(zhì)量評(píng)價(jià)方法,但其因觀察者的背景知識(shí)、觀測(cè)環(huán)境、心理狀態(tài)等諸多因素的影響,無(wú)法成為一種精確的可重復(fù)的測(cè)量手段。對(duì)于一些圖像處理算法的比較研究,客觀質(zhì)量評(píng)價(jià)方法就顯得更易操作,且省時(shí)省力。例如在圖像壓縮算法中,圖像質(zhì)量評(píng)價(jià)為不同的壓縮算法提供了比較依據(jù)。(3)可以優(yōu)化系統(tǒng)的性能。例如在傳輸系統(tǒng)中可以根據(jù)網(wǎng)絡(luò)的具體情況自動(dòng)優(yōu)化信道傳輸參數(shù)以及比特分配算法,在編解碼器系統(tǒng)中可以根據(jù)圖像質(zhì)量進(jìn)行編解碼器性能的優(yōu)化等。由此可見,研究高效、可靠且與人類主觀感知一致的客觀圖像質(zhì)量評(píng)價(jià)方法對(duì)于圖像處理技術(shù)以及人類視覺感知理論都有著十分重要的意義。本發(fā)明提出了一種基于Curvelet變換和相位一致的無(wú)參考圖像質(zhì)量評(píng)價(jià)方法,其參考的兩項(xiàng)重要的已有技術(shù)分別為 Shen 等人在文獻(xiàn)《HybridNo-ReferenceNatural ImageQualityAssessmentofNoisy, Blurry, JPEG2000, andJPEGImages》提出的無(wú)參考質(zhì)量評(píng)價(jià)方法HNR和Moorthy等人在文獻(xiàn)《BIindimagequalityassessment: Fromnaturalscenestati sti cstoperceptualquality〉〉提出的通用無(wú)參考質(zhì)量評(píng)價(jià)方法DIIVINE,其涉及的基礎(chǔ)背景技術(shù)主要為Curvelet變換和相位一致。(I) HNR 方法HNR方法是第一種將Curvelet變換引入圖像質(zhì)量評(píng)價(jià)領(lǐng)域中的方法,其根據(jù)測(cè)試圖像的不同失真類型將圖像變換到不同的變換域下,再提取相應(yīng)特征以對(duì)測(cè)試圖像做出質(zhì)量評(píng)價(jià)。其中對(duì)于模糊和噪聲圖像,將其變換到Curvelet域下,使用系數(shù)幅值Log直方圖的全局最大峰值坐標(biāo)作為特征;對(duì)于JPEG壓縮圖像,變換到DCT域中,使用系數(shù)幅值Log直方圖從左至右的第二峰值坐標(biāo)作為特征;對(duì)于JPEG2000壓縮圖像,變換到Wavelet域中,同樣使用系數(shù)幅值Log直方圖的全局最大峰值坐標(biāo)作為特征。該方法對(duì)于模糊,噪聲,JPEG壓縮,JPEG2000壓縮具有較好的主觀一致性,但由于對(duì)不同失真類型圖像需要采用不同的變換方式,導(dǎo)致算法的純度不高,且?guī)в邢闰?yàn)知識(shí)需求(需要事先知道圖像失真類型)。而且算法僅針對(duì)特定的失真類型進(jìn)行了設(shè)計(jì),導(dǎo)致算法的通用性不夠,可拓展性不強(qiáng)。(2) DIIVINE 方法DIIVINE方法是一種近來(lái)出現(xiàn)的通用無(wú)參考質(zhì)量評(píng)價(jià)方法,作者在該方法中提出了一種重要的基于機(jī)器學(xué)習(xí)的通用無(wú)參考質(zhì)量評(píng)價(jià)二步框架,即先對(duì)未知類型失真圖像進(jìn)行分類,再根據(jù)分類結(jié)果對(duì)不同的失真類型使用對(duì)應(yīng)的回歸模型對(duì)其進(jìn)行質(zhì)量評(píng)價(jià)。本發(fā)明中提出的方法也采用了這種二步框架。
DIIVINE方法對(duì)測(cè)試圖像使用了一種可控金字塔分解,該可控金字塔基于Wavelet變換,該方法的優(yōu)點(diǎn)在于增強(qiáng)了原始Wavelet變換的方向敏感性,其余性質(zhì)與Wavelet變換較為接近。在該可控金字塔分解的基礎(chǔ)上,DIIVINE方法對(duì)于一幅測(cè)試圖像提取了多達(dá)88維的特征,主要特征為對(duì)各子帶系數(shù)直方圖進(jìn)行廣義高斯分布擬合的擬合系數(shù)。該方法對(duì)于LIVE數(shù)據(jù)庫(kù)中全部5種失真類型的失真圖像具有較高主觀一致性,同時(shí)也具有較強(qiáng)的通用性和可拓展性。但該方法的缺點(diǎn)在與時(shí)間復(fù)雜度過(guò)大,首先特征提取過(guò)程復(fù)雜冗長(zhǎng)導(dǎo)致特征提取過(guò)程耗時(shí)過(guò)長(zhǎng),其次龐大的特征維數(shù)導(dǎo)致分類和回歸模型的訓(xùn)練耗時(shí)也過(guò)長(zhǎng)。(3) Curvelet 變換Curvelet變換為圖像構(gòu)建了冗余度約等于3.6的過(guò)完備字典,它能夠近似最優(yōu)表示圖像中C2奇異。不同于ID的小波變換,Curvelet變換是一種固有2D變換。每一個(gè)Curvelet具有長(zhǎng)條形的支撐區(qū)間,在主軸(長(zhǎng)軸)方向上較為平滑,而在短軸方向上表現(xiàn)出波動(dòng)行為。該支撐區(qū)間滿足拋物尺度關(guān)系width ^ length2,這使得Curvelet具有各向異性特性。Curvelet系數(shù)參數(shù)不僅包含位置和尺度,還包含有方向。從概念上來(lái)講,我們可以認(rèn)為Curvelet變換是一種在每個(gè)尺度下具有方向和位置信息的圖像金字塔,其空域形態(tài)在最精細(xì)尺度下呈現(xiàn)為針形。Curvelet變換具有緊框架,每一個(gè)Curvelet系數(shù)都是與其相關(guān)的Curvelet與圖像的卷積結(jié)果,如果一個(gè)Curvelet的尺度,位置和角度都近似與圖像中的曲線相合,它所對(duì)應(yīng)的Curvelet系數(shù)將會(huì)非常大,否則Curvelet系數(shù)將接近于O。由于Curvelet支撐基的各向異性尺度關(guān)系,我們可以用少量的Curvelet系數(shù)來(lái)描述圖像中的曲線奇異,對(duì)圖像中的邊緣信息等提供稀疏表示。而當(dāng)Curvelet在非常小的尺度上其中心位于圖像中的點(diǎn)奇異時(shí),其對(duì)應(yīng)的Curvelet系數(shù)也會(huì)很大,因此Curvelet也具有良好的點(diǎn)奇異表示能力。我們認(rèn)為圖像失真過(guò)程會(huì)在很大程度上影響圖像中存在的曲線奇異和點(diǎn)奇異,對(duì)應(yīng)的Curvelet系數(shù)也會(huì)受到強(qiáng)烈的影響。Curvelet變換還能夠提供豐富的方向信息,我們認(rèn)為圖像失真過(guò)程會(huì)改變其原有的方向能量分布,而這種變化可以被帶有方向參數(shù)的Curvelet系數(shù)捕捉到。對(duì)于2D離散函數(shù)f [懷t2]的離散Curvelet變換定義如下:
權(quán)利要求
1.一種基于Curvelet變換和相位一致的無(wú)參考圖像質(zhì)量評(píng)價(jià)方法,其特征在于:其具體實(shí)施步驟如下: 步驟一、從Curvelet變換系數(shù)域和相位一致域中提取一系列與人眼對(duì)自然圖像質(zhì)量的主觀認(rèn)知相關(guān)聯(lián)的自然場(chǎng)景統(tǒng)計(jì)特性(NSS)特征; 步驟二、針對(duì)全體數(shù)據(jù)庫(kù)抽取訓(xùn)練集,訓(xùn)練集由步驟一中得到的一系列自然場(chǎng)景統(tǒng)計(jì)特性特征和圖像失真類型組成,結(jié)合使用LIBSVM工具包中提供的C-SVC (RBF核)工具訓(xùn)練得到失真類型分類模型,并對(duì)待測(cè)圖像進(jìn)行包含概率估計(jì)的失真類型分類,得到η維分類概率估計(jì)向量Jj ; 步驟三、針對(duì)每種失真類型各自抽取對(duì)應(yīng)的訓(xùn)練集,訓(xùn)練集由步驟一中描述的一系列特征和主觀質(zhì)量評(píng)價(jià)DMOS值構(gòu)成,結(jié)合使用V -SVR(RBF核)訓(xùn)練得到η個(gè)回歸模型;對(duì)于在步驟二中已完成分類的失真圖像,將它分別通過(guò)η個(gè)回歸模型計(jì)算得到η維質(zhì)量預(yù)測(cè)向量g 再使用分類概率估計(jì)向量$加權(quán)求和得到最終客觀預(yù)測(cè)質(zhì)量β = ;7; 0
2.如權(quán)利要求1所示的 一種基于Curvelet變換和相位一致的無(wú)參考圖像質(zhì)量評(píng)價(jià)方法,其特征在于:步驟一中所述從Curvelet變換系數(shù)域和相位一致域中提取NSS特征的具體步驟為: (I) Curvelet系數(shù)域下的自然場(chǎng)景統(tǒng)計(jì)特性特征組 Curvelet變換要求輸入圖像的長(zhǎng)寬均為2η,η為正整數(shù),在對(duì)圖像進(jìn)行Curvelet變換前先對(duì)其進(jìn)行分塊,得到mXη相互之間有重疊部分的256 X 256分塊,然后對(duì)每個(gè)Curvelet分塊計(jì)算提取一系列特征,得到mXn個(gè)特征向量,對(duì)這mXn個(gè)特征向量取均值作為最終用于評(píng)價(jià)整幅圖像質(zhì)量的特征向量,之后所有和Curvelet變換相關(guān)的特征都將采用相同的策略,
3.如權(quán)利要求1所示的一種基于Curvelet變換和相位一致的無(wú)參考圖像質(zhì)量評(píng)價(jià)方法,其特征在于:步驟一中所述從Curvelet變換系數(shù)域和相位一致域中提取的總計(jì)21維NSS特征如下所示:
全文摘要
本發(fā)明涉及一種基于Curvelet變換和相位一致的無(wú)參考圖像質(zhì)量評(píng)價(jià)方法,包括以下步驟①將圖像分別變換到Curvelet域和相位一致域中;②從Curvelet域和相位一致域中提取一系列自然場(chǎng)景統(tǒng)計(jì)特征,包括Curvelet系數(shù)和相位一致系數(shù)的對(duì)數(shù)直方圖峰值坐標(biāo),方向能量分布特性和尺度能量分布特性;③使用一種二步框架,利用步驟②中提取的一系列特征和支持向量機(jī)首先對(duì)未知類型的失真圖像進(jìn)行分類,再根據(jù)分類結(jié)果對(duì)失真圖像進(jìn)行特定類型的非線性回歸,以圖像的客觀質(zhì)量評(píng)價(jià)結(jié)果(預(yù)測(cè)DMOS)。本發(fā)明提出的基于Curvelet變換和相位一致的無(wú)參考圖像質(zhì)量評(píng)價(jià)方法具有人眼主觀一致性高,時(shí)間復(fù)雜度小的特點(diǎn),具有較強(qiáng)的應(yīng)用價(jià)值。
文檔編號(hào)G06T7/00GK103200421SQ20131011676
公開日2013年7月10日 申請(qǐng)日期2013年4月7日 優(yōu)先權(quán)日2013年4月7日
發(fā)明者劉利雄, 董宏平, 黃華 申請(qǐng)人:北京理工大學(xué)