專利名稱:視頻信息中自動(dòng)的自然內(nèi)容檢測(cè)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及用于區(qū)分視頻信息中的自然和合成內(nèi)容的區(qū)域的一種方法、設(shè)備和裝置。
背景技術(shù):
CRT監(jiān)視器的特征一方面是它比電視屏幕有較高的分辨率,另一方面是較低的亮度。這是由于下述事實(shí),最初在計(jì)算機(jī)監(jiān)視器上顯示地內(nèi)容全部是合成的,特別是,它曾由文字代表。這一類型內(nèi)容明顯需要高的分別率來使用戶滿意,但是這使得亮度減小。
現(xiàn)今的情形有很大的變化。因特網(wǎng)和多媒體技術(shù),例如DVD和圖像存儲(chǔ)和傳輸,引起自然的TV型內(nèi)容的數(shù)量在監(jiān)視器應(yīng)用中增加。這一新的情形引起監(jiān)視器的一系列問題,因?yàn)楸O(jiān)視器最初不是為這種內(nèi)容設(shè)計(jì)的。
新概念CRT監(jiān)視器的基本思想是監(jiān)視器應(yīng)該能夠適應(yīng)在特定時(shí)刻所顯示的圖像的內(nèi)容。一個(gè)例子是對(duì)自然內(nèi)容應(yīng)用視頻增強(qiáng)算法以便獲得在監(jiān)視器上顯示的自然圖像的質(zhì)量顯著改善。然而,如果這些視頻增強(qiáng)算法應(yīng)用于純文字或圖形,總體結(jié)果是圖像質(zhì)量的顯著損失。從這一觀點(diǎn)出發(fā),區(qū)分自然和合成內(nèi)容的能力變得十分重要。
已經(jīng)公知增強(qiáng)解決方案,它可以明顯改善視覺性能,如果它應(yīng)用于在屏幕上自然內(nèi)容存在的特定區(qū)域中的話。由用戶執(zhí)行的基于窗口(它是基于應(yīng)用的)的手工選擇是為識(shí)別這些區(qū)域的一個(gè)簡單但是枯燥的方法,它可以適用于整個(gè)窗口內(nèi)容是自然內(nèi)容的情況。不幸的是,在同一窗口內(nèi)有復(fù)合內(nèi)容的場(chǎng)合,不能使用同一個(gè)方法,而復(fù)合內(nèi)容在萬維網(wǎng)頁中是典型的,因?yàn)?,如上所述,視頻增強(qiáng)算法對(duì)純文字或圖形的應(yīng)用可以引起在它們感覺到的視覺質(zhì)量方面顯著的損失。因此,需要一種用于在把內(nèi)容顯示在監(jiān)視器上之前區(qū)分自然的和合成的內(nèi)容的方法、設(shè)備和裝置。
發(fā)明概述
本發(fā)明的一個(gè)目的是通過提供一種方法、設(shè)備和裝置克服上述缺點(diǎn),所述方法、設(shè)備和裝置只使用圖像中的未經(jīng)加工的屏幕數(shù)據(jù)來區(qū)分自然內(nèi)容和合成內(nèi)容。本發(fā)明由所附獨(dú)立權(quán)利要求限定。從屬權(quán)利要求則限定有利的實(shí)施例。
根據(jù)本發(fā)明的一個(gè)實(shí)施例,自然圖像內(nèi)容借助統(tǒng)計(jì)分析而與合成圖像內(nèi)容區(qū)分,所述統(tǒng)計(jì)分析的目的是從圖像中抽取某些特征,然后對(duì)這些特征做智能解釋。這一方法的一個(gè)優(yōu)點(diǎn)是通過定位在對(duì)所抽取的特征的分析中的而不是圖像分析中的所有“智能”而使計(jì)算復(fù)雜性降到極小。
在視頻信息的場(chǎng)合,視頻信息作為一系列的圖像來處理,每一圖像獨(dú)立處理。在該方法的第一步驟中,分析視頻信息。作為下一步驟,把視頻信息中在分析期間找到包含相似特征的相鄰部分組合在一起。所述部分可以是圖像的行或列的線,但是也可以是線的一些部分。最后,把具有第一特征的組指定為自然內(nèi)容,而剩余的組指定為合成內(nèi)容。
如果為矩陣的每一線建立象素值的亮度直方圖將是有利的。然后決定對(duì)于每一線的每一非零直方圖值之間的距離。如果大多數(shù)距離小于或等于一個(gè)預(yù)定值的話,則該線被分類為包含自然內(nèi)容。然后把包含有自然內(nèi)容的相鄰線組合到一起以建立具有自然內(nèi)容的線的組。
參考下面說明的實(shí)施例,本發(fā)明的這些以及其它方面將十分顯然。
參考附圖并以舉例方式說明本發(fā)明,附圖中
圖1(a)表示一個(gè)一般算法思想的方框圖1(b)表示根據(jù)本發(fā)明的算法的方框圖2(a)-(c)表示根據(jù)本發(fā)明的實(shí)施例的一個(gè)合成場(chǎng)合的亮度直方圖分析;
圖3(a)-(c)表示根據(jù)本發(fā)明的實(shí)施例的一個(gè)中間合成場(chǎng)合的亮度直方圖4(a)-(c)表示根據(jù)本發(fā)明的實(shí)施例的一個(gè)自然場(chǎng)合的亮度直方圖分析;
圖5表示根據(jù)本發(fā)明的實(shí)施例的用于存儲(chǔ)與目標(biāo)區(qū)域的坐標(biāo)有關(guān)的信息的數(shù)據(jù)樹;
圖6描述根據(jù)本發(fā)明的實(shí)施例的從目標(biāo)區(qū)域提取的一些子區(qū)域;
圖7-10表示一些屏幕實(shí)錄,用于說明本發(fā)明的一個(gè)說明性例子。
具體實(shí)施例方式
本發(fā)明可以被視為是分段和識(shí)別的混合。信號(hào)識(shí)別的許多問題在許多文獻(xiàn)然后在應(yīng)用中被提出和解決,但是大多數(shù)問題涉及的是單維信號(hào)。雖然建議的這些解決方案非常不同,但是如果一個(gè)一般的分析能解決所有問題的話,則可以指出一些相似性。事實(shí)上,這些建議的解決方案的大多數(shù)都提出一個(gè)相似的一般結(jié)構(gòu),其示于圖1(a)。首先,提出一個(gè)特征抽取框100,它執(zhí)行所謂的“特征抽取”,后隨一個(gè)特征分析框102,它執(zhí)行“特征分析”。顯然,這一說明表示很一般的抽象,因?yàn)樾g(shù)語“特征”可以意味著許多不同的對(duì)象。然而,本發(fā)明的一個(gè)關(guān)鍵的思想是,該算法的“智能”必須在特征分析框102中被提出,該分析不針對(duì)原始數(shù)據(jù),而針對(duì)原始數(shù)據(jù)一個(gè)經(jīng)過過濾的(濃縮的)版本。原始數(shù)據(jù)可以受噪聲或無用的外部信息或?qū)ψR(shí)別有害的信息污染。反之,特征被視為只包含基本信息的數(shù)據(jù)(在一般意義上)的一個(gè)被過濾的版本。
從這些考慮出發(fā),可以提出幾個(gè)見解。首先,算法的大多數(shù)智能集中在特征分析框102。其次,與先前的見解相反,大多數(shù)資源消耗部分通常是特征抽取框100,因?yàn)橐话阏f,原始數(shù)據(jù)比抽取后的特征需要例如較大的存儲(chǔ)器用來存儲(chǔ)數(shù)據(jù)。最后,特征抽取是最關(guān)鍵的階段。事實(shí)上,發(fā)現(xiàn)真正包含為特征分析所需要的信息的被抽取的特征是至關(guān)重要的。
圖1(b)表示為實(shí)現(xiàn)本發(fā)明的一個(gè)實(shí)施例的系統(tǒng)。該系統(tǒng)包括亮度變換單元120、控制器122、直方圖評(píng)估器124、由分析器1108和規(guī)則應(yīng)用單元1110組成的分類單元126、和坐標(biāo)抽取器128。下面說明系統(tǒng)的操作。
在圖像中的象素矩陣的亮度值L(x,y)得不到但是紅、綠和藍(lán)顏色分量的值可得到的場(chǎng)合,亮度變換單元120提供需要的變換,解釋如下。
因?yàn)橐呀?jīng)公知,亮度包含關(guān)于形狀的最大部分的信息,因此,使用這一參數(shù)處理是很重要的。在文獻(xiàn)中,亮度由下面的公式提供
L(x,y)=(0.2989*R(x,y)+0.5870*G(x,y)+0.1140*B(x,y)
其中,L、R、G、B在范圍
內(nèi),R、G、B是矩陣中具有坐標(biāo)x,y的象素的紅、綠和藍(lán)顏色分量。
避免浮點(diǎn)運(yùn)算的一個(gè)簡化版本(當(dāng)L、R、G和B在范圍
內(nèi)時(shí),這在對(duì)本實(shí)施例的進(jìn)一步解釋中假定)是
亮度值L(x,y)的直方圖在直方圖評(píng)估器124中評(píng)估,說明如下。一個(gè)關(guān)鍵的思想是單獨(dú)評(píng)估圖像的每一行的亮度值L(x,y)的單維直方圖。對(duì)列則重復(fù)同一類型的運(yùn)算以獲得另外一組直方圖。
本發(fā)明的這一實(shí)施例的一個(gè)重要的假定是,要被識(shí)別的區(qū)域是矩形區(qū)域。必須注意,這一方法在所公開的方法中隱含地包含這一個(gè)幾何假定。事實(shí)上,單獨(dú)分析行和列導(dǎo)致僅在水平和豎直方向上分析圖像,但是本發(fā)明不限于此。
從計(jì)算的觀點(diǎn)看來,亮度值L(x,y)的處理是最消耗資源的。必須逐個(gè)象素掃描整個(gè)圖像。然而,如上所述,目的是分析整個(gè)圖像以獲得一組特征,該組特征不像整個(gè)圖像的亮度數(shù)據(jù)那樣龐大。
分類單元26后面的一個(gè)關(guān)鍵思想是將線(行和列)分類為自然圖像,如果該相應(yīng)直方圖具有自然圖像的特征的話。從經(jīng)驗(yàn)測(cè)試注意到,有關(guān)自然圖像的直方圖具有與有關(guān)合成圖像的直方圖相比不同的特征。這些特征包括在亮度直方圖L(x,y)的連續(xù)非零元素之間的距離d。
分析器1108使用這些距離的距離直方圖hist(d)分析這些距離。在這一分析中的關(guān)鍵思想是在線中存在相當(dāng)數(shù)量自然圖像的場(chǎng)合,小距離比大距離更為可能。然后在規(guī)則應(yīng)用單元1110中使用一個(gè)分類規(guī)則根據(jù)這些距離將線分類。
在表示自然內(nèi)容和表示合成內(nèi)容的距離直方圖hist(d)之間顯著的區(qū)分使用下述規(guī)則獲得
CLASSIFICATION RULE(分類規(guī)則)
IF(如果)arg(max(hist(d))}=1
THEN NATURAL(則是自然的)
ELSE SYNTHETIC.(否則是合成的)
如前所述,已經(jīng)假設(shè)有一個(gè)亮度值范圍
,因此,可能的距離從1到255變化。函數(shù)arg{max(hist(d))}抽取滿足括號(hào)內(nèi)的條件的一個(gè)(或多個(gè))距離。在這一場(chǎng)合,它抽取相應(yīng)于hist(d)的最大絕對(duì)值(或幾個(gè)最大值,如果有兩個(gè)或更多等大的最大值)的一個(gè)(或多個(gè))距離。
每當(dāng)發(fā)現(xiàn)兩個(gè)或更多個(gè)滿足條件的距離時(shí),則在這一分類中使用最小的距離。
如果距離1是在該線中最頻繁的距離(于是產(chǎn)生d=1時(shí)的hist(d)的最大值),則認(rèn)為該線包含相當(dāng)數(shù)量屬于自然圖像的象素,因此該線被分類為自然的,否則,它就被分類為合成的。在這種方式下,等于1的距離被認(rèn)為表示自然內(nèi)容的線,而所有其它的距離被認(rèn)為表示具有合成內(nèi)容的線。將會(huì)理解,本發(fā)明不限于僅有這一條規(guī)則,而且描繪自然和合成內(nèi)容的距離可以具有不是1的值。例如,可以使用模糊方法來考慮其它小距離和使用例如更多的類像“可能是合成的”、“可能是自然的”、“非常像自然的”。
一旦分類了所有的線(行和列),就把分類為“自然”的相鄰的線組成一組。線的這一分組在一個(gè)優(yōu)選實(shí)施例中使用下面的規(guī)則,即如果少于3條連續(xù)的“合成”線存在在“自然”線之間,則這些“合成”線被包括在被分類為“自然”的相鄰線的組中。另外可選擇的方案是,該規(guī)則可以使用比提到的3條線更多或更少的線。此外,該規(guī)則舍棄包括少于預(yù)定數(shù)目的自然線的組。這一預(yù)定數(shù)目可以是1,但是也可以是更大的數(shù)。
作為下一步驟,決定由行線的組和列線的組的交叉部分形成的區(qū)域。這些區(qū)域是圖像的有可能是“自然”的區(qū)域。坐標(biāo)抽取器128決定這些區(qū)域的角的坐標(biāo)。把這些坐標(biāo)反饋到控制器122。然后控制器122決定,是否應(yīng)該為一個(gè)特定區(qū)域重復(fù)決定“自然”區(qū)域的處理。如果是,則為該圖像的這些特定的“自然”區(qū)域重復(fù)在圖1b中由框124、126、128、122指示的步驟。這一重復(fù)優(yōu)選在稍微更大一些的區(qū)域進(jìn)行,以確保這一較大區(qū)域包容該圖像的實(shí)際“自然”區(qū)域。
在若干次循環(huán)后,產(chǎn)生出更準(zhǔn)確的“自然”區(qū)域的決定,控制器122交付“自然”區(qū)域的角的坐標(biāo)的最終值。
在圖2、3和4中,在3種不同的(而且簡化的)情形下評(píng)估剛才說明的算法。圖2(a)-(c)表示一種極端的合成情形,其中在圖2(a)中在恒定的背景(用值為255的象素模擬)上繪出了一條均勻線(用具有值100的兩個(gè)象素模擬)。如同圖2(b)中用亮度直方圖hist(L)表示的,在該線中存在的象素的亮度值之間的距離d是155。正如可以在這一情形中指出的,在距離直方圖hist(d)中不存在等于1的距離,且距離傾向于具有大的值,這正是對(duì)于其內(nèi)容是合成的線所期望的。
圖4(a)-(c)表示“自然”的情形。這里,圖4(a)中被分析的線包括柔和化的值,它們通常是自然圖像的值。在本例中,象素值分組在122-126之間,和距離等于2、1、1,分別在圖4(b)中的直方圖hist(L)中表示。其結(jié)果,小距離比其它的更多,因此分類規(guī)則導(dǎo)致將該線分類為自然的。圖3(a)-(c)表示一個(gè)中間情形,其中,既存在明確區(qū)分的值也存在軟化的值。在本例中,一些象素值分組為大約100,而其它象素值等于155和255,如圖3(a)所示。產(chǎn)生的距離分別等于1、54、100,如示于圖3(b)中的直方圖hist(L)。在這一場(chǎng)合,距離d等于1的和不等于1的都存在,但是,因?yàn)榫嚯xd不等于1的不如距離d等于1的那樣多,如圖3(c)的hist(d)所示,因此該線被分類為自然的。
如圖5所示,使用樹作為存儲(chǔ)與發(fā)現(xiàn)的坐標(biāo)有關(guān)的信息的數(shù)據(jù)結(jié)構(gòu),和使用分類器126用于在先前循環(huán)中抽取的圖像上。首先,在整個(gè)圖像上使用分類器126,抽取與一個(gè)圖像更可能存在于其內(nèi)的區(qū)域有關(guān)的4xm坐標(biāo)的一個(gè)列表(這里m是目標(biāo)區(qū)域的數(shù)目)。然后,在每一這些目標(biāo)區(qū)域重新開始該分類器,抽取圖像可能在其中存在的一些子區(qū)域,如圖6所示。這一遞歸處理重復(fù)若干次。從經(jīng)驗(yàn)中得出,重復(fù)這一處理3次,就會(huì)得出好的結(jié)果。循環(huán)的次數(shù)可以取決于停止重復(fù)的規(guī)則,例如,當(dāng)在循環(huán)末尾在該次循環(huán)期間被評(píng)估的區(qū)域內(nèi)沒有或者只有一個(gè)自然區(qū)域。
圖7到10表示屏幕實(shí)錄,它們用于說明本發(fā)明的說明性例子。圖7表示該說明性例子的直方圖評(píng)估器124和分類單元126。為屏幕700的行和列的直方圖分別為每一行(用行條710符號(hào)表示)和列(用列條720符號(hào)表示)評(píng)估。找到在直方圖值和最近異于零的值之間的最可能距離。如果找到的該最可能距離等于1,則認(rèn)為行(或列)701包含一些自然內(nèi)容。結(jié)果,它被標(biāo)記為可能具有自然內(nèi)容的行(或列)。在這一步驟的末尾,有兩個(gè)矢量包含先前分析的行和列的分類。
在下一步驟,如圖8所示,執(zhí)行在矢量中包含的行和列的分類的“調(diào)整”。使用術(shù)語“調(diào)整”表示將標(biāo)記為自然內(nèi)容的行和列聚集在一起。彼此之間具有小于預(yù)定門限的距離的行(或列)被認(rèn)為包含同一自然圖像的信息并聚集在一起,如方框802所示。換句話說,作為自然內(nèi)容的行和列根據(jù)它們的“密度”聚集在一起。
在這一階段,具有自然圖像內(nèi)容的區(qū)域902的位置被識(shí)別為聚集的行和列的交叉部分,如圖9所示。這些區(qū)域902的位置是來自兩個(gè)矢量從而是已知的。然而,這一位置不是精確地知道。因此,作為下一步驟,分別評(píng)估該圖像的每一區(qū)域。在這一步驟,考慮相對(duì)于在前一步驟檢測(cè)到的區(qū)域中一個(gè)較大的區(qū)域904,因?yàn)榭紤]到先前進(jìn)行的檢測(cè)相當(dāng)粗糙。在這些較大的區(qū)域904上,遞歸地應(yīng)用包括直方圖評(píng)估124、分類126和調(diào)整的整個(gè)處理。其優(yōu)點(diǎn)是在更具體的區(qū)域上評(píng)估直方圖,這樣它們的統(tǒng)計(jì)內(nèi)容更均勻。在遞歸步驟末尾,舍棄具有不滿足“自然內(nèi)容”的需要的行和列的區(qū)域904。產(chǎn)生的具有自然內(nèi)容的區(qū)域1002示于圖10。
下面給出說明分類單元126的另一種方式。使用圖11中的直方圖評(píng)估器124的輸出可以決定距離概率函數(shù)(DPF)。“距離概率函數(shù)”(DPF)在分析器1108中計(jì)算。給定當(dāng)前線的亮度直方圖hist(L),DPF P[d=k]是在兩個(gè)連續(xù)等于k的非零元素之間的找到距離d的頻率。對(duì)于每一線i如下計(jì)算。從線i的直方圖開始,所有異于零的元素的索引存儲(chǔ)在矢量ρi中,
ρi={j|hi(j)≠0,0≤j≤255},
式中,hi(j)是為線i的亮度直方圖的第j個(gè)值。該值表示線i中具有亮度等于j的象素的數(shù)目。每當(dāng)在一條線中只有一個(gè)亮度時(shí),則該線被分類為合成的,跳過為該線的其余的步驟。否則,計(jì)算在每一對(duì)連續(xù)非零值之間的差,它根據(jù)在該直方圖的非零元素之間的灰度級(jí)表示距離δi(jN是為該非零值的索引)
δi(jN)=ρi(jN+1)-ρi(jN),0≤jN≤(長度(ρi)-2)
根據(jù)距離δi,計(jì)算距離直方圖hδi,而為線i的DPF如下獲得
一個(gè)關(guān)鍵的思想是,在當(dāng)前線i包含一部分自然圖像的場(chǎng)合,矢量δi中的小距離比大距離更可能。結(jié)果,將該方法簡化,如果DPFi(k)對(duì)k=1最大,則在分類單元126中分類該線為“自然的”,否則分類為“合成的”。在合成中,分類規(guī)則是
分類規(guī)則
在實(shí)際應(yīng)用中,當(dāng)比較DPFi(k)和DPFi(j)時(shí),可以刪除兩個(gè)DPF函數(shù)的相等的分母
相似地,通過從hi直接導(dǎo)出hδi,可以刪除矢量δi的單獨(dú)計(jì)算。將會(huì)理解,使用在DPF函數(shù)中包含的全部信息而不是只看它的最大值,可以為這一目的使用其它更優(yōu)越的分類規(guī)則。
將會(huì)理解,本發(fā)明的不同的實(shí)施例不限于上述步驟的確切順序,其中一些步驟的序列可以互換而不影響本發(fā)明的總的操作。
應(yīng)該注意,上述實(shí)施例說明而不是限制本發(fā)明,熟悉本技術(shù)領(lǐng)域的人能夠設(shè)計(jì)許多可選的實(shí)施例而不離開所附權(quán)利要求的范圍。在權(quán)利要求中,放置在括號(hào)中的任何參考符號(hào)不應(yīng)該理解為限制該權(quán)利要求。詞“包括”不排除在權(quán)利要求中列出的元素或步驟之外的元素或步驟的存在。在元素前面的詞“一個(gè)”不排除多個(gè)這種元素的存在。本發(fā)明可以通過包括幾個(gè)不同元件的硬件實(shí)現(xiàn),和通過適當(dāng)編程的計(jì)算機(jī)實(shí)現(xiàn)。在列出幾個(gè)設(shè)備的設(shè)備權(quán)利要求中,幾個(gè)這些設(shè)備可以用同一個(gè)硬件實(shí)現(xiàn)。在不同的從屬權(quán)利要求中引用一定的這一簡單的事實(shí)不表示不能使用這些手段的組合以便改進(jìn)。
權(quán)利要求
1.一種區(qū)分視頻信息中自然和合成內(nèi)容的區(qū)域的方法,包括步驟
分析視頻信息;
把在分析期間發(fā)現(xiàn)的包含相似特征的視頻信息的相鄰部分組合到一起;
指定具有第一特征的相鄰部分的組為自然內(nèi)容,指定任何剩余組為合成內(nèi)容。
2.根據(jù)權(quán)利要求1的方法,其中,相鄰部分是視頻信息中包含相似特征的行和列的交叉部分。
3.根據(jù)權(quán)利要求1的方法,其中,分析步驟包括
分別決定行和列中的象素的亮度直方圖值;以及
決定在一個(gè)直方圖中的非零直方圖值之間的距離;
其中,該第一特征是大多數(shù)距離小于一個(gè)預(yù)定門限。
4.根據(jù)權(quán)利要求3的方法,其中,預(yù)定門限等于2。
5.根據(jù)權(quán)利要求1的方法,還包括步驟
以預(yù)定次數(shù)重新分析可能包含自然內(nèi)容的組,以便更明確地規(guī)定各組的邊界。
6.根據(jù)權(quán)利要求5的方法,其中,一個(gè)組的邊界由行和列坐標(biāo)規(guī)定。
7.根據(jù)權(quán)利要求5的方法,其中,預(yù)定次數(shù)等于3。
8.根據(jù)權(quán)利要求1的方法,其中,信息由在行和列的線的矩陣中的象素表示,并且所述分析方法包括
(a)為矩陣的每一線建立象素亮度值的亮度直方(b)為每一線決定連續(xù)的亮度直方圖值之間的距離;
(c)從決定的距離為每一線計(jì)算距離概率函數(shù);和
該第一特征是該距離概率具有低于一個(gè)預(yù)定距離值的最大值。
9.根據(jù)權(quán)利要求8的方法,其中,分類規(guī)則是
FOR LINE i
IF{k|DPFi(k)≥DPFi(j),j≠k k,j∈[1,255]}=1
THEN LINE i->NATURAL,
ELSE LINE i->SYNTHETIC。
10.一種區(qū)分視頻信息中自然和合成內(nèi)容區(qū)域的設(shè)備,包括
-用于分析視頻信息的裝置;
-用于把視頻信息中包含在分析期間找到的相似特征的相鄰部分進(jìn)行組合的裝置;
-用于指定具有第一特征的相鄰部分的組為自然內(nèi)容、和指定任何剩余組為合成內(nèi)容的裝置。
11.一種區(qū)分由排列在線的矩陣中的象素所表示的視頻信息中自然和合成內(nèi)容區(qū)域的設(shè)備,包括
用于為矩陣中的每一線建立象素值的直方圖的裝置;
用于為每一線決定在每一直方圖值之間的距離的裝置;
用于從所述已決定的距離為每一線計(jì)算距離概率函數(shù)的裝置;
用于在距離概率函數(shù)具有低于一個(gè)預(yù)定距離值的最大值時(shí)把一條線分類為包含自然內(nèi)容的裝置;
用于把包含自然內(nèi)容的相鄰線組合在一起以便建立自然內(nèi)容的簇的裝置。
全文摘要
公開了一種區(qū)分由排列在線上的一個(gè)矩陣中的象素所表示的視頻信息中的自然和合成內(nèi)容區(qū)域的方法。為該矩陣的每一線建立象素值的一個(gè)亮度直方圖(hist(L))。一條線被分類為包含自然內(nèi)容,如果大多數(shù)距離(d)小于或等于一個(gè)預(yù)定值。然后把包含自然內(nèi)容的相鄰線分組在一起以建立自然內(nèi)容組。然后以預(yù)定次數(shù)重復(fù)該處理,以便更精確定義具有自然內(nèi)容的區(qū)域。
文檔編號(hào)G06T5/00GK1692369SQ0281189
公開日2005年11月2日 申請(qǐng)日期2002年6月14日 優(yōu)先權(quán)日2001年6月15日
發(fā)明者M·馬科尼, P·卡賴, G·費(fèi)爾雷蒂 申請(qǐng)人:皇家菲利浦電子有限公司