專利名稱:一種中粒度質(zhì)量可伸縮視頻編碼優(yōu)化方法、裝置及信息終端的制作方法
技術(shù)領(lǐng)域:
本發(fā)明屬于多媒體信息領(lǐng)域,尤其涉及一種中粒度質(zhì)量可伸縮視頻編碼優(yōu)化方法、裝置及信息終端。
背景技術(shù):
可伸縮視頻編碼(Salable Video Coding, SVC)著重于通過分層技術(shù)來改善流媒體傳輸?shù)姆?wù)質(zhì)量,提高系統(tǒng)的容錯(cuò)性能和對網(wǎng)絡(luò)的自適應(yīng)能力。視頻編碼的可伸縮性分為空間可伸縮、時(shí)間可伸縮和質(zhì)量可伸縮。其中,質(zhì)量可伸縮主要分為粗粒度質(zhì)量可伸縮 (Coarse Grain kalability,CGS)、中粒度質(zhì)量可伸縮(Medium Grain Scalability,MGS) 以及細(xì)粒度(Fine Grain Scalability,FGS)質(zhì)量可伸縮。相比CGS而言,MGS提供更高的靈活性。而且MGS編碼能夠在顯著降低計(jì)算復(fù)雜度的情況下提供與res相似的率失真結(jié)果, 因此成為目前主要使用的視頻編碼技術(shù)。編碼優(yōu)化作為視頻編碼的關(guān)鍵環(huán)節(jié),一直是視頻編碼技術(shù)研究的熱點(diǎn)。視頻編碼優(yōu)化問題常與碼率控制緊密相關(guān),目的在于在特定的帶寬碼率條件下尋找合適的量化參數(shù)和編碼方式使得編碼性能得到優(yōu)化,而碼率控制有效與否很大程度上取決于率失真模型 (R-D Model)的準(zhǔn)確性及碼率控制算法的適應(yīng)力。傳統(tǒng)針對特定碼率的編碼優(yōu)化無法解決實(shí)際區(qū)域網(wǎng)絡(luò)帶寬的浮動(dòng)變化和多用戶訪問所具有不同帶寬條件情況下的編碼優(yōu)化問題, 而MGS現(xiàn)有的模式是隨機(jī)分配片層方式,由于每個(gè)片層對視頻質(zhì)量的影響不同,片層所占用的帶寬不同,不能有效解決有限帶寬、視頻質(zhì)量和實(shí)時(shí)性直接訪問的平衡問題,尤其是當(dāng)流媒體資源數(shù)量達(dá)到海量級,而處理速度要求最大限度利用網(wǎng)絡(luò)的時(shí)候。
發(fā)明內(nèi)容
本發(fā)明實(shí)施例的目的在于提供一種中粒度質(zhì)量可伸縮視頻編碼優(yōu)化方法,旨在解決有限帶寬、視頻質(zhì)量和實(shí)時(shí)性直接訪問的平衡問題。本發(fā)明實(shí)施例是這樣實(shí)現(xiàn)的,一種中粒度質(zhì)量可伸縮視頻編碼優(yōu)化方法,所述方法包括下述步驟 A 定義片層重要性權(quán)重矢量K= [kl,k2,.
ki],i = 1,2,3.
16,根據(jù)下
列公式⑴、(2)和(3)計(jì)算各片層所占質(zhì)量增強(qiáng)層的質(zhì)量百分比kl,k2,......ki
權(quán)利要求
1. 一種中粒度質(zhì)量可伸縮視頻編碼優(yōu)化方法,其特征在于,所述方法包括下述步驟A 定義片層重要性權(quán)重矢量K= [kl,k2,......ki],i = 1,2,3......16,根據(jù)下列公式(1)、(2)和(3)計(jì)算各片層所占質(zhì)量增強(qiáng)層的質(zhì)量百分比kl,k2,......ki ;其中,respixeh表示片層i重構(gòu)像素,orgpixel表示原始像素,Imagesize表示圖像大小,PSNR表示片層數(shù)據(jù)未丟失的重構(gòu)圖像質(zhì)量表征,PSNRi表示丟棄了片層i數(shù)據(jù)后重構(gòu)圖像質(zhì)量表征;B:根據(jù)計(jì)算得到的片層所占質(zhì)量增強(qiáng)層的質(zhì)量百分比與所述片層編碼實(shí)際所需要的比特?cái)?shù),建立碼率與所述質(zhì)量百分比關(guān)系曲線,構(gòu)造中粒度質(zhì)量可伸縮片層率失真模型;C 根據(jù)構(gòu)造的中粒度質(zhì)量可伸縮片層率失真模型及預(yù)設(shè)的I、P、B幀率失真模型,估計(jì)視頻流碼率,所述I、P、B幀率失真模型包括I、P幀二次率失真模型和B幀線性的率失真模型;D 根據(jù)估計(jì)的視頻頻流碼率,通過貪婪算法獲取中粒度質(zhì)量可伸縮編碼目標(biāo)碼率區(qū)間內(nèi)碼率控制的優(yōu)化解。
2.如權(quán)利要求1所述的方法,其特征在于,所述步驟C具體為Cl 獲取基本層的碼率及各I、P幀基本層的平均絕對誤差,初始化I、P、B幀率失真模型參數(shù),所述平均絕對誤差為當(dāng)前質(zhì)量增強(qiáng)層的重構(gòu)圖像與前一幀重構(gòu)圖像的平均絕對差;C2 根據(jù)初始化的I、P、B幀率失真模型參數(shù),確定比例參數(shù)并構(gòu)建平均絕對誤差預(yù)測模型,通過線性回歸方法初始化平均絕對誤差預(yù)測模型參數(shù);C3:初始化所述構(gòu)造的中粒度質(zhì)量可伸縮片層率失真模型參數(shù),確定所述中粒度質(zhì)量可伸縮片層率失真模型;C4 根據(jù)步驟Cl、C2、C3,得到視頻流碼率估計(jì)表達(dá)式,估計(jì)視頻流碼率。
3.如權(quán)利要求1所述的方法,其特征在于,所述步驟D具體為Dl 將中粒度質(zhì)量可伸縮編碼碼率編碼至最高碼率,設(shè)置碼流提取的優(yōu)化目標(biāo);D2 根據(jù)預(yù)編碼過程估計(jì)得到粗粒度質(zhì)量可伸縮編碼方式的視頻流碼率,判斷所述視頻流碼率是否小于最小目標(biāo)帶寬碼率下限;D3 在所述視頻流碼率小于最小目標(biāo)帶寬碼率下限,采用粗粒度質(zhì)量可伸縮分片方式編碼;D4:在所述視頻流碼率大于或者最小目標(biāo)帶寬碼率下限,獲取重要中粒度質(zhì)量可伸縮片層數(shù)據(jù)編碼方式;D5 將剩余的中粒度質(zhì)量可伸縮片層合并,估計(jì)當(dāng)前中粒度質(zhì)量可伸縮片層數(shù)據(jù)編碼方式的碼率;D6 判斷所述估計(jì)的當(dāng)前中粒度質(zhì)量可伸縮片層數(shù)據(jù)編碼方式的碼率是否低于目標(biāo)帶寬碼率上限;D7 在所述估計(jì)的當(dāng)前中粒度質(zhì)量可伸縮片層數(shù)據(jù)編碼方式的碼率低于目標(biāo)帶寬碼率上限時(shí),按片層數(shù)據(jù)重要性對中粒度質(zhì)量可伸縮重要片層進(jìn)行分解,直到所述碼率達(dá)到目標(biāo)帶寬碼率上限。
4.如權(quán)利要求3所述的方法,其特征在于,所述目標(biāo)帶寬碼率下限為450K,目標(biāo)帶寬碼率上限為700K。
5.一種中粒度質(zhì)量可伸縮視頻編碼優(yōu)化裝置,其特征在于,所述裝置包括重要性計(jì)算單元,用于定義片層重要性權(quán)重矢量K= [kl, k2,......ki],i = 1,2,3......16,根據(jù)下列公式(1)、⑵和(3)計(jì)算各片層所占質(zhì)量增強(qiáng)層的質(zhì)量百分比kl,k2,......ki ;Γ 2552PSNR1 =IOlg MSEi =Mffi;」⑴^ ^espixeli - orgpixel)2PSNR = IOlgIm agesize 2552MSEMSE= Σ——” Im agesize(2), PSNR-PSNR “ _ S( , Skt=-- ~ ( 0<η<16 )(3)^(PSNR-PSNRJ)i=0其中,respixeli表示片層i重構(gòu)像素,orgpixel表示原始像素,Imagesize表示圖像大小,PSNR表示片層數(shù)據(jù)未丟失的重構(gòu)圖像質(zhì)量表征,PSNRi表示丟棄了片層i數(shù)據(jù)后重構(gòu)圖像質(zhì)量表征;模型構(gòu)造單元,用于通過計(jì)算得到的片層所占質(zhì)量增強(qiáng)層的質(zhì)量百分比與所述片層編碼實(shí)際所需要的比特?cái)?shù),建立碼率與所述質(zhì)量百分比關(guān)系曲線,構(gòu)造中粒度質(zhì)量可伸縮片層率失真模型;視頻流碼率估計(jì)單元,用于根據(jù)構(gòu)造的中粒度質(zhì)量可伸縮片層率失真模型,及預(yù)設(shè)的 I、P、B幀率失真模型,估計(jì)視頻流碼率,所述I、P、B幀率失真模型包括I、P幀二次率失真模型和B幀線性的率失真模型;碼率控制優(yōu)化單元,用于根據(jù)估計(jì)的視頻頻流碼率,通過貪婪算法獲取中粒度質(zhì)量可伸縮編碼目標(biāo)碼率區(qū)間內(nèi)碼率控制的優(yōu)化解。
6.如權(quán)利要求5所述的裝置,其特征在于,所述流碼率估計(jì)單元還包括 參數(shù)初始化模塊,用于獲取基本層的碼率及各I、P幀基本層的平均絕對誤差,初始化I、P、B幀率失真模型參數(shù),所述平均絕對誤差為當(dāng)前質(zhì)量增強(qiáng)層的重構(gòu)圖像與前一幀重構(gòu)圖像的平均絕對差;預(yù)測模型構(gòu)建模塊,用于根據(jù)初始化的I、P、B幀率失真模型參數(shù),確定比例參數(shù)并構(gòu)建平均絕對誤差預(yù)測模型,通過線性回歸方法初始化平均絕對誤差預(yù)測模型參數(shù);率失真模型確定模塊,用于初始化所述構(gòu)造的中粒度質(zhì)量可伸縮片層率失真模型參數(shù),確定所述中粒度質(zhì)量可伸縮片層率失真模型;視頻流碼率估計(jì)模塊,用于確定視頻流碼率估計(jì)表達(dá)式,根據(jù)所述視頻流碼率估計(jì)表達(dá)式估計(jì)視頻流碼率。
7.如權(quán)利要求5所述的裝置,其特征在于,所述碼率控制優(yōu)化單元還包括優(yōu)化目標(biāo)設(shè)置模塊,用于將中粒度質(zhì)量可伸縮編碼碼率編碼至最高碼率,設(shè)置碼流提取的優(yōu)化目標(biāo);第一判斷模塊,用于根據(jù)預(yù)編碼過程估計(jì)得到粗粒度質(zhì)量可伸縮編碼方式的視頻流碼率,判斷所述視頻流碼率是否小于最小目標(biāo)帶寬碼率下限;編碼模塊,用于在所述視頻流碼率小于最小目標(biāo)帶寬碼率下限,采用粗粒度質(zhì)量可伸縮分片方式編碼;編碼方式獲取模塊,用于在所述視頻流碼率大于或者最小目標(biāo)帶寬碼率下限,獲取重要中粒度質(zhì)量可伸縮片層數(shù)據(jù)編碼方式;碼率估計(jì)模塊,用于將剩余的中粒度質(zhì)量可伸縮片層合并,估計(jì)當(dāng)前中粒度質(zhì)量可伸縮片層數(shù)據(jù)編碼方式的碼率;第二判斷模塊,用于判斷所述估計(jì)的當(dāng)前中粒度質(zhì)量可伸縮片層數(shù)據(jù)編碼方式的碼率是否低于目標(biāo)帶寬碼率上限;分解模塊,用于在所述估計(jì)的當(dāng)前中粒度質(zhì)量可伸縮片層數(shù)據(jù)編碼方式的碼率低于目標(biāo)帶寬碼率上限時(shí),按片層數(shù)據(jù)重要性對中粒度質(zhì)量可伸縮重要片層進(jìn)行分解,直到所述碼率達(dá)到目標(biāo)帶寬碼率上限。
8.如權(quán)利要求7所述的裝置,其特征在于,所述目標(biāo)帶寬碼率下限為450K,目標(biāo)帶寬碼率上限為700K。
9.一種包含權(quán)利要求5所述的中粒度質(zhì)量可伸縮視頻編碼優(yōu)化裝置的信息終端。
全文摘要
本發(fā)明適用于多媒體信息領(lǐng)域,提供了一種中粒度質(zhì)量可伸縮視頻編碼優(yōu)化方法、裝置及信息終端,所述方法包括下述步驟定義片層重要性權(quán)重矢量,計(jì)算各片層所占質(zhì)量增強(qiáng)層的質(zhì)量百分比;根據(jù)所述片層所占質(zhì)量增強(qiáng)層的質(zhì)量百分比與其編碼實(shí)際所需要的比特?cái)?shù),建立碼率與所述質(zhì)量百分比關(guān)系曲線,構(gòu)造中粒度質(zhì)量可伸縮片層率失真模型;根據(jù)構(gòu)造的中粒度質(zhì)量可伸縮片層率失真模型及預(yù)設(shè)的I、P、B幀率失真模型,估計(jì)視頻流碼率;根據(jù)估計(jì)的視頻頻流碼率,通過貪婪算法獲取中粒度質(zhì)量可伸縮編碼目標(biāo)碼率區(qū)間內(nèi)碼率控制的優(yōu)化解。本發(fā)明通過貪婪算法優(yōu)化中粒度質(zhì)量可伸縮視頻編碼方案,可有效解決有限帶寬和視頻質(zhì)量的平衡問題,提高圖像解碼的質(zhì)量。
文檔編號H04N7/64GK102595115SQ20111000694
公開日2012年7月18日 申請日期2011年1月13日 優(yōu)先權(quán)日2011年1月13日
發(fā)明者柳偉 申請人:深圳信息職業(yè)技術(shù)學(xué)院