專利名稱:基于邊緣檢測的視頻模式識別方法
技術領域:
本發(fā)明涉及隔行視頻掃描格式轉換技術,具體涉及到識別輸入視頻是3: 2下拉的電影模 式還是普通隔行掃描視頻的方法。 技術背景
由于受到傳輸帶寬的限制,電視臺發(fā)送的視頻信號并不是一幅幅完整的圖像,而是將一 幀畫面分成奇場和偶場先后傳輸的,而在用戶終端,電視機也是一場一場地掃描,實現圖像 的顯示。這種技術稱為隔行掃描技術,雖然節(jié)省了傳輸帶寬,但是損害了畫面質量。隨著電 視技術的不斷發(fā)展和觀眾對收看電視節(jié)目畫面質量要求的不斷提高,逐行掃描電視開始普及 ,但是目前廣播電視臺發(fā)送的電視信號仍然以隔行掃描信號為主,為了在逐行掃描電視機上 播放隔行視頻信號,去隔行技術被提出并成為了目前視頻處理領域中的一個熱點和難點問題
目前被大多數國家采用的隔行掃描電視制式有60場/秒的NTSC (美國國家電視系統(tǒng)委員 會)和50場/秒的PAL (逐行倒相)彩色電視制式。在現行電視系統(tǒng)中,隔行掃描視頻信號中有 相當一部分是由逐行視頻源轉換而來的,這些逐行視頻源主要包括電影、廣告和電腦制作的 3D動畫等。如果能從大量視頻信號中區(qū)分出當前視頻信號是由逐行視頻轉換來的還是本來就 是隔行視頻信號,然后對由逐行信號轉換來的隔行信號采用weave (場間復制)方式去隔行 能無損失地恢復原逐行視頻。由電影膠片轉換為隔行視頻信號是這種情況的一個典型代表, 所以通常將通過逐行視頻源轉換得到的隔行視頻信號稱為電影模式視頻信號。正確區(qū)分視頻 信號是電影模式的還是非電影模式對提高去隔行效果顯得十分重要。
電影是以24幀/秒記錄在電影膠片上的模擬信號,廣播電視臺首先將這些電影膠片轉換 為逐行的視頻源,然后通過隔行化和場重復的方式轉換為60場/秒的NTSC制式或者50場/秒的 PAL制式。在將電影源轉換為NTSC制式電視時是采用一種叫3:2下拉的方式,如圖1所示。其 基本規(guī)律是以四個電影幀為周期,將第一個電影幀A分割拆分成第一個電視幀的奇場A1和偶 場A2、以及復制第一個電視幀的奇場A1作為第二個電視幀的奇場,第二個電影幀B拆分成第 二個電視幀的偶場B1以及第三個電視幀的奇場B2,第三個電影幀C拆分成第三個電視幀的偶 場C1以及第四個電視幀的奇場C2,并復制C1作為第四個電視幀的偶場,第四個電影幀D拆分 成第五個電視幀的奇場D1和偶場D2。如此每四個電影幀拆分成10個電視場,最后就將24幀/
4秒的逐行掃描電影源轉換為了 60場/秒的NTSC制式隔行掃描電視信號。
將電影信號轉換為50場/秒PAL制式視頻的方法叫2:2下拉,它是將每個電影幀拆分為一 個電視幀的奇場和偶場,這相當于將24幀/秒的電影倍頻為48場/秒的電視信號,當用PAL制 播放時,電視播放速率比在電影院快1/24,但這不影響觀看。
傳統(tǒng)檢測3:2下拉電影模式的方法是計算連續(xù)輸入兩場隔行信號的絕對差,然后統(tǒng)計得 到一個場差,場差可以是所有像素點絕對差之和也可以是像素點的絕對差平均值等。再將這 個場差與一個預先設定的門限比較,如果場差小于等于門限那么判定當前場為復制場并標記 當前場為"0",如果場差大于門限則判定當前場為非復制場并標記為"1"。連續(xù)檢測幾場 可產生一個標記符號序列,將這個序列與電影模式的基本序列組進行匹配,如果匹配得上則 說明當前場為3: 2下拉電影模式的場,否則為非3: 2下拉電影模式場。
傳統(tǒng)方法沒有深入分析3: 2下拉電影的特點及可能出現的情況,主要存在下面幾個問題
僅利用相鄰兩個極性不同的視頻場計算場差,這樣的場差并不能體現3:2下拉模式中存 在復制場這樣的特點,所以這樣的模式判斷準確度不高;
算法使用固定門限值,限定了算法的使用范圍,對場差波動大的視頻不能做到隨視頻改 變,容易造成誤判;
靜態(tài)場景或只存在少量運動的視頻中,傳統(tǒng)方法的處理不夠細膩;
如果視頻圖像受噪聲干擾,傳統(tǒng)方法不能正確檢出。
發(fā)明內容
本發(fā)明所要解決的技術問題,就是針對現有技術的上述缺點,提供一種根據3:2下拉電 影模式特點,采用邊緣檢測技術進行視頻模式識別的方法。
本發(fā)明解決所述技術問題,采用的技術方案是,基于邊緣檢測的視頻模式識別方法,其 特征在于,包括以下步驟
a、 根據輸入圖像當前場像素灰度的均方差o得到二值化門限T^ a * o和其中a為設 定值;
b、 用輸入圖像與其淡化處理后的圖像之差作為差值圖像;
c、 計算當前場的差值圖像與其最鄰近的同極性場的差值圖像相同坐標像素灰度的差值 ,統(tǒng)計差值為"1"的像素數目,記為^;
d、 對連續(xù)7場中的5個同極性場進行統(tǒng)計,得到WlN、如果^為最小且小于門限 TH則標記當前圖像的場標記為"0",否則為"1";e、將步驟d得到的5bit序列與電影模式的標準序列組比較,如果有相同項,則判斷當前場為電影模式的視頻場,否則判斷當前場為非電影模式的視頻場。具體的,所述o由下式得到:_
_丄.=0 ;.=0
其中^""J)代表當前場像素灰度數據,i, j為像素的坐標;M和N分別是當前場圖像的高和寬;
JW X iV 3=D 為當前場像素灰度的均值。
具體的,所述電影模式的標準序列組包括
{1,1,1,1,0};{1,1,1,0,1};{1,1,0,1,1};{1,0,1,1,1}; {0,1,1,1,1}。
進一步的,在步驟a之前還包括步驟a0、濾除輸入圖像的噪聲。
具體的,所述步驟a0中,采用中值濾波器濾除輸入圖像的噪聲。進一步的,步驟b所述淡化處理是對每個像素灰度取其鄰域內的最小值。具體的,所述鄰域為以待處理像素為中心的3 X 3鄰域。
本發(fā)明的有益效果是,基于運動產生邊緣位移這個思路進行電影模式檢測的,能夠準確區(qū)分視頻屬于3:2下拉電影模式還是普通隔行視頻;具有良好的抗噪聲干擾特性;能夠快速地實現電影模式與非電影模式之間的切換。
圖1是3:2下拉電影模式視頻信號產生過程原理圖2實施例的視頻信號模式檢測系統(tǒng)結構圖。
具體實施例方式
下面結合附圖及實施例,詳細描述本發(fā)明的技術方案。
因為3: 2下拉電影模式的視頻序列中每7個連續(xù)場中都包含有一對復制場,理論上這對復制場是完全相同的。但是現實中的視頻圖像都是含有噪聲的,所以復制場也不可能完全相同。通過分析復制場和非復制場的關系,我們知道復制場即使受噪聲影響其邊緣結構仍然保持相同。但是非復制場由于不是同一時刻的圖像,所以存在時間差,它們如果不是靜態(tài)圖像那么因為運動會讓它們的邊緣產生相對位移。本發(fā)明就是基于運動產生邊緣位移這個思路進行電影模式檢測的。
6本發(fā)明的檢測方法主要通過中值濾波模塊、門限生成模塊、邊緣處理模塊、場差計算模 塊、場標志序列生成模塊以及模式判斷模塊實現判斷輸入視頻場是否為3:2電影模式場,具 體包括以下步驟
1、 將每個輸入的視頻場進行降噪處理,本發(fā)明中選用中值濾波去掉圖像中的部分噪聲 ,可以提高邊緣提取的準確性;
2、 將當前場視頻數據輸入到門限生成模塊,該模塊統(tǒng)計輸入視頻場信號的均值y和均 方差o ,并利用均方差生成二值化門限111= a X o ; a為設定值;
3、 淡化輸入視頻圖像的亮邊緣對經中值濾波后的視頻圖像,每一個像素點的灰度值 取該像素點所在的3X3子塊中的九個像素灰度的最小值,這樣就得到了淡化了亮邊緣的圖像 。然后再用去噪圖像減去淡化后的圖像得到了差值圖像,這個差值圖像具有如下特性在圖 像的平滑區(qū)域,由于淡化操作基本不改變像素灰度,所以這樣的區(qū)域的差值為零或很?。欢?原始圖像中的亮邊緣由于淡化使其灰度值變小,所以這個區(qū)域的差值很大。最后用差值圖像 與二值化門限Th比較進行二值化,得到的圖像就是用于電影模式檢測的邊緣圖像(即差值圖 像)。
4、 輸入當前場和最鄰近的同極性場的邊緣圖像,計算其對應像素點的絕對差SAD ,=*化(。')-巧_2(~))
其中^X"jO代表當前場像素灰度數據,《_2(;,力代表與當前場最鄰近的同極性場 的灰度數據,i, j為像素的坐標。
因為是二值化圖像,所以絕對差只能是"1"或"0",設置一個記數器統(tǒng)計整場中對應 像素灰度絕對差為"1"的像素數量^,這個數據^就代表了當前場的場差。判斷當前場 的場差是否為連續(xù)五個同極性場的場差中的最小值,并且其場差小于二值化門限Th,如果滿 足條件,那么設置當前場的模式標志為"0",否則設置為"1",這樣就得到了一個5bit序 列;
5、 將這個序列與標準3:2電影標志序列匹配,如果兩個序列完全相同則說明當前場為 3:2下拉電影模式的場;如果匹配不上則說明當前場不是電影模式的場。
實施例
如圖2所示,本發(fā)明檢測電影模式的系統(tǒng)包含中值濾波模塊l、門限生成模塊2、邊緣處 理模塊3、場差計算模塊4、場標志序列生成模塊5、模式判斷模塊6,該系統(tǒng)判斷輸入視頻是 否為電影模式的具體步驟為1、 在中值濾波模塊l中,對輸入的視頻圖像進行中值濾波,目的是去除輸入視頻圖像中的噪聲,避免后續(xù)邊緣提取過程中產生非邊緣點;
2、 在門限生成模塊2中,計算輸入視頻圖像的均方差
_丄,.=0 ;.=0
根據均方差o得到二值化門限THi傘o ;其中A("^代表當前場像素灰度數據,i,j為像素的坐標;M和N分別是當前場圖像的高和寬;
JWXiV 3=D —Q 為當前場像素灰度的均值。a為非零的正值,屬于經驗值。
3、 在邊緣處理模塊3中,計算輸入的經中值濾波后的視頻圖像的差分(即邊緣處理)。本例采用一種自適應提取圖像亮邊緣的算法圖像像素點灰度值采用以其為中心的3X3鄰域中所有像素點的最小灰度值,這樣做相當于腐蝕了圖像中的亮邊緣,然后用原始圖像(中值濾波后的圖像)減去腐蝕后的圖像,就可以得到二值化處理后的差值圖像。
4、 在場差計算模塊4中,輸入的兩個最鄰近的同極性場的圖像都是二值圖像,所以像素灰度絕對差只能為"0"或"1",統(tǒng)計絕對差不為零的像素點個數,該像素點個數即為所求場差。
5、 場標志序列生成模塊5連續(xù)存儲五個同極性場的場差,標記其中最小值并小于Th的場的模式標志為"0",非最小值對應的場的模式標志為"1",這樣就形成一個5bits序列,該序列就是要求的模式標志序列。為了提高準確性,a的選擇應當使Th小于復制場的場差。
6、 模式判斷模塊6比較模式標志序列和標準電影模式標志序列。電影模式標準序列由5個基本序列組成{1,1,1,1,0}、 {1,1,1,0,1}、 {1,1,0,1,1}、 {1,0,1,1,1}、 {0,1,1,1,1}。只要輸入的模式標志序列與5個基本序列中任意一個相同,那么判定當前場為電影模式的場。
本發(fā)明首先提取輸入視頻圖像的亮邊緣然后計算場差,對由復制場計算出的場差基本上都是0,而非復制場由于存在時間差和邊緣位移所以場差大,對不含噪聲和含不同水平噪聲的測試視頻進行了檢測表明本發(fā)明方法能夠準確檢測出3:2下拉電影模式視頻。
權利要求
權利要求1基于邊緣檢測的視頻模式識別方法,其特征在于,包括以下步驟a、根據輸入圖像當前場像素灰度的均方差σ得到二值化門限TH=α*σ和其中α為設定值;b、用輸入圖像與其淡化處理后的圖像之差作為差值圖像;c、計算當前場的差值圖像與其最鄰近的同極性場的差值圖像相同坐標像素灰度的絕對差,統(tǒng)計絕對差為“1”的像素數目,記為Ni;d、對連續(xù)七場中的五個同極性場進行統(tǒng)計,得到N1……N5;如果Ni為最小且小于門限TH則標記當前圖像的場標記為“0”,否則為“1”;e、將步驟d得到的5bit序列與電影模式的標準序列組比較,如果有相同項,則判斷當前場為電影模式的視頻場,否則判斷當前場為非電影模式的視頻場。
2.根據權利要求l所述的基于邊緣檢測的視頻模式識別方法,其特征在于,所述o由下式得到:_<formula>formula see original document page 2</formula>其中^X"jO代表當前場像素灰度數據,i, j為像素的坐標;M和N分別是當前場圖像的高和寬;JW X iV 3=D 為當前場像素灰度的均值。
3.根據權利要求l所述的基于邊緣檢測的視頻模式識別方法,其特征在于,所述電影模式的標準序列組包括{1,1,1,1,0};{1,1,1,0,1};{1,1,0,1,1};{1,0,1,1,1}; {0,1,1,1,1}。
4.根據權利要求l、 2或3所述的基于邊緣檢測的視頻模式識別方法, 其特征在于,在步驟a之前還包括步驟 a0、濾除輸入圖像的噪聲。
5.根據權利要求4所述的基于邊緣檢測的視頻模式識別方法,其特征 在于,所述步驟a0中,采用中值濾波器濾除輸入圖像的噪聲。
6.根據上述任意一項權利要求所述的基于邊緣檢測的視頻模式識別 方法,其特征在于,步驟b所述淡化處理是對每個像素灰度取其鄰域內的最小值。
7.根據權利要求6所述的基于邊緣檢測的視頻模式識別方法,其特征 在于,所述鄰域為以待處理像素為中心的3X3鄰域。
全文摘要
本發(fā)明涉及識別輸入視頻是3:2下拉的電影模式還是普通隔行掃描視頻的方法。本發(fā)明針對現有技術準確率低的缺點,公開了一種基于邊緣檢測的視頻模式識別方法。根據3:2下拉電影模式特點,采用邊緣檢測技術進行視頻模式識別。本發(fā)明基于運動產生邊緣位移這個思路進行電影模式檢測的,能夠準確區(qū)分視頻屬于3:2下拉電影模式還是普通隔行視頻;具有良好的抗噪聲干擾特性;能夠快速地實現電影模式與非電影模式之間的切換。適用于去隔行技術的視頻模式識別領域。
文檔編號H04N7/01GK101483745SQ20081030644
公開日2009年7月15日 申請日期2008年12月22日 優(yōu)先權日2008年12月22日
發(fā)明者強 劉, 濤 陳 申請人:四川虹微技術有限公司