專利名稱:基于支持向量機的視頻轉碼快速幀內預測方法
技術領域:
本發(fā)明屬于數(shù)字視頻轉碼技術領域,具體涉及一種基于支持向量機的視頻轉碼 快速幀內預測的方法。
背景技術:
近年來,多媒體通信隨著網(wǎng)絡技術的飛速發(fā)展廣泛融入到社會和個人生活中。 由于網(wǎng)絡種類的多樣性(如Internet網(wǎng)、電信網(wǎng)和蜂窩無線網(wǎng)等),終端設備性能(如顯 示分辨率、處理能力和存儲能力等)的差異,使得提高視頻碼流在不同應用環(huán)境之間的 兼容性變得十分重要。轉換空間分辨率的視頻轉碼,為支持各類視頻顯示設備提供了有 效的解決方法,它將原始分辨率的視頻碼流轉換為適合接收端顯示的目標分辨率碼流。 H.264在壓縮高效性和傳輸可靠性方面優(yōu)于其它視頻編碼標準,并在各個領域中得到了廣 泛應用,基于H.264的視頻編碼及轉碼技術成為近年來國內外研究的熱點。理想的視頻轉碼器應具備低運算復雜度,高轉碼質量等性能。H.264幀內編碼充 分利用圖像空間相關性,結合率失真優(yōu)化技術選擇最優(yōu)幀內模式。高效的幀內預測編碼 極大降低了空間冗余,提高視頻編碼壓縮率,同時也大大增加了編碼器的計算復雜度, 影響到算法的實時性。因此,如何有效利用輸入碼流中的編碼信息來提高轉碼速度成為 視頻轉碼研究中的關鍵問題。對此,眾多科研人員做了大量工作來優(yōu)化幀內編碼算法。 包括降低率失真優(yōu)化運算復雜度,以及利用邊界方向分析宏塊特性等等。然而,這些幀 內優(yōu)化算法沒有充分利用輸入的編碼信息來提高轉碼效率,無法在視頻轉碼中達到理想 的效果。因此,如何提高視頻轉碼效率,同時保證圖像質量仍然是一個有待探索的課 題。
發(fā)明內容
本發(fā)明的目的是充分利用從輸入的高分辨率視頻碼流中提取的編碼信息,組成 多維特征向量訓練支持向量機(SupportVector Machine,SVM)分類器模型,構建分層式 SVM分類器,對降尺寸視頻中宏塊的幀內預測模式進行分類,降低轉碼運算復雜度。為了解決上述技術問題,本發(fā)明提供了一種基于支持向量機的視頻轉碼快速幀 內預測方法,其特征在于首先從輸入的高分辨率視頻碼流中提取模式特征組成多維特 征向量訓練支持向量機(Support Vector Machine,SVM)分類器模型,建立高分辨率視頻 編碼信息與降尺寸視頻宏塊幀內編碼模式之間的相關性。然后設計構建出分層式SVM分 類器,對降尺寸視頻中宏塊的幀內預測模式進行分類,以此減少預測模式數(shù)量,實現(xiàn)轉 碼再編碼過程中率失真優(yōu)化算法的提前終止。具體包括下述步驟1)將輸入的高分辨率視頻碼流解碼來提取編碼信息,包括幀內編碼模式、殘 差宏塊和離散余弦變換系數(shù),利用編碼信息計算得到表征宏塊特征的參量來組成多維特 征向量訓練支持向量機模型,通過該模型建立高分辨率視頻編碼信息與降尺寸視頻中宏 塊的幀內編碼模式之間的相關性;
5
2)由頂層分類器,中間層分類器和下層分類器構建成分層式SVM分類器架 構,分三步對降尺寸視頻中宏塊的幀內預測模式進行分類,首先劃分Intra 16X 16和Intra 4X4,其次對Intni4X4中的模式丨0,1,2丨和其它模式進行劃分,最后劃分Intra 4X4中 的垂直預測模式和水平預測模式,以此減少預測模式數(shù)量;3)利用縮減后的幀內模式對降尺寸視頻進行編碼,實現(xiàn)率失真優(yōu)化算法的提前 終止,避免轉碼中再編碼過程中的窮舉式全搜索,實現(xiàn)一個低復雜度的H.264視頻轉碼 器;4)輸出轉碼后的低分辨率視頻碼流。本方法既能夠保證轉碼后視頻質量,又有 效解決了降尺寸視頻轉碼實時性問題。在本發(fā)明所提供的基于支持向量機的視頻轉碼快速幀內預測方法中,所述的支 持向量機特征向量的選取,包括下述步驟1)頂層分類器實驗數(shù)據(jù)表明,在原始高分辨率視頻的四個相鄰宏塊中出現(xiàn)頻 率最高的編碼模式往往就是通過率失真優(yōu)化算法計算獲得的最優(yōu)編碼模式。本方法選擇 Intra 16X16和Intra 4X4在當前宏塊所對應的原始高分辨率視頻的四個相鄰宏塊中的出 現(xiàn)次數(shù)作為特征向量之一。此外,鑒于殘差塊不為零的離散余弦變換(DCT)系數(shù)的個數(shù) (nzcoef)與宏塊空間特征的緊密聯(lián)系,且提取方法簡單,無需進行DCT逆變換,因此將 不為零的離散余弦變換系數(shù)的個數(shù)選作頂層分類器的另一個特征向量;2)中間層分類器本方法利用如下公式中定義的方向差值參量來衡量宏塊的亮 度分布特征,進而劃分出采用模式丨0,1,2丨的宏塊。
權利要求
1.基于支持向量機的視頻轉碼快速幀內預測方法,其特征在于首先從輸入的視 頻碼流中提取編碼信息組成多維特征向量訓練支持向量機,即Support Vector Machine,SVM,分類器模型,建立高分辨率視頻編碼信息與降尺寸視頻中宏塊的編碼模式之間的 聯(lián)系;然后搭建階梯式SVM分類器對降尺寸視頻中宏塊幀內編碼模式進行分層式預測, 具體包括下述步驟1)將輸入的高分辨率視頻碼流解碼來提取編碼信息,包括幀內編碼模式、殘差宏 塊和離散余弦變換系數(shù);2)分別為三層SVM分類器選取特征向量,即利用編碼信息計算獲得表征宏塊特征的 參量來組成多維特征向量;3)通過定義的核函數(shù)性能參數(shù)來選擇核函數(shù),訓練支持向量機模型,通過該模型建 立高分辨率視頻編碼信息與降尺寸視頻中宏塊的幀內編碼模式之間的相關性;4)由頂層分類器,中間層分類器和下層分類器構建成分層式SVM分類器架構,分三 步對降尺寸視頻中宏塊的幀內預測模式進行分類,首先劃分Intra 16 X 16和Intra 4X 4,其 次對Intra 4X4中的模式丨0,1,2丨和其它模式進行劃分,最后劃分Intra 4X4中的垂直預 測模式和水平預測模式;5)利用縮減后的幀內模式對降尺寸視頻進行編碼,提前終止率失真優(yōu)化算法,避免 轉碼中再編碼過程中的窮舉式全搜索,實現(xiàn)一個低復雜度的H.264視頻轉碼器;6)輸出轉碼后的低分辨率視頻碼流。
2.根據(jù)權利要求1所述的基于支持向量機的視頻轉碼快速幀內預測方法,其特征在于 所述的支持向量機特征向量的選取,包括下述步驟1)頂層分類器選擇Intra16X16和Intra 4X4在當前宏塊所對應的原始高分辨率視 頻的四個相鄰宏塊中的出現(xiàn)次數(shù)作為特征向量之一;將不為零的離散余弦變換系數(shù)的個 數(shù)選作頂層分類器的另一個特征向量;2)中間層分類器利用如下公式中定義的方向差值參量來衡量宏塊的亮度分布特 征,進而劃分出采用模式丨0,1,2丨的宏塊;
3.根據(jù)權利要求1所述的基于支持向量機的視頻轉碼快速幀內預測方法,其特征在于 所述的支持向量機核函數(shù)的選擇,按如下步驟定義了核函數(shù)性能參數(shù)J 1)假設輸入空間中的兩類樣本(Xl,x2,…,X1)禾P(x1+1,x1+2,…,X21)分別屬于類 別C1和C2,其中1為樣本數(shù)量,各類中心點在特征空間中表示為如下形式,其中Φ為映 射函數(shù)
4.根據(jù)權利要求1所述的基于支持向量機的視頻轉碼快速幀內預測方法,其特征在于 所述的分層式SVM分類器的構建,包括下述步驟1)頂層分類器劃分Intra16X16模式和Intra 4X4模式,如果當前宏塊被劃分為Intra 16X16模式,則僅預測Intra 16X 16模式,換而言之,此分類器用于劃分出位于紋理分布 較均勻或運動平緩區(qū)域內的宏塊;2)中間層分類器劃分Intni4X4中的模式丨0,1,2丨和其它模式;3)下層分類器對Intra4X4中的9種預測模式進行細分,劃分為垂直預測模式和水平 預測模式;垂直預測模式僅對模式丨0,3,5,7丨進行預測,水平預測模式僅對模式U,.4,6,8}進行預測。
全文摘要
基于支持向量機的視頻轉碼快速幀內預測方法,屬于數(shù)字視頻轉碼技術領域。本發(fā)明具體包括以下步驟(1)將輸入的高分辨率視頻碼流解碼來提取編碼信息,組成多維特征向量訓練支持向量機模型,建立高分辨率視頻編碼信息與降尺寸視頻中宏塊的幀內編碼模式之間的相關性;(2)構建分層式SVM分類器,對降尺寸視頻中宏塊的幀內預測模式進行分類,以此減少預測模式數(shù)量;(3)利用縮減后的幀內模式對降尺寸視頻進行編碼,實現(xiàn)轉碼再編碼過程中率失真優(yōu)化算法的提前終止,達到降低轉碼運算復雜度的目的,實現(xiàn)一個低復雜度的H.264視頻轉碼器;(4)輸出轉碼后的低分辨率視頻碼流。本方法既能夠保證轉碼后視頻質量,又有效解決了降尺寸視頻轉碼實時性問題。
文檔編號H04N7/26GK102025999SQ20101061833
公開日2011年4月20日 申請日期2010年12月31日 優(yōu)先權日2010年12月31日
發(fā)明者呂卓逸, 孫中華, 賈克斌 申請人:北京工業(yè)大學