專利名稱:檢測運動圖像中視頻鏡頭變化的方法及使用該方法的設備的制作方法
技術領域:
本發(fā)明涉及檢測運動圖像數(shù)據(jù)中的視頻鏡頭(shot)變化,并且更加具體地講,涉及一種通過以多層分級流為單元分類視頻幀來檢測運動圖像的視頻鏡頭變化和高速檢測視頻鏡頭變化以便快速地索引(index)運動圖像的內容的方法,以及采用該方法的設備。
背景技術:
視頻鏡頭是在拍攝視頻時通過單一攝像機的移動連續(xù)捕獲的一系列視頻幀,并且在通過主題索引視頻時,它被用作基本處理單元。用于檢測視頻鏡頭變化的技術在視頻索引中是很重要的。視頻鏡頭邊界的信息是在基于視頻內容組織內容表、實現(xiàn)視頻內容概括功能、或通過主題編輯視頻時使用的基本的片段數(shù)據(jù)。
所述用于檢測視頻鏡頭變化以提供視頻鏡頭邊界的信息的技術主要可以分為壓縮區(qū)域檢測技術和非壓縮區(qū)域(或像素區(qū)域)檢測技術。最初,處理多種像素區(qū)域圖像特性的非壓縮區(qū)域檢測技術被頻繁地使用。但是,近來部分地解碼壓縮視頻流然后利用諸如DCT(離散余弦變換)系數(shù)、運動矢量、宏塊模式和比特率分配等的某種流數(shù)據(jù)的壓縮區(qū)域方法得到廣泛地發(fā)展,從而加速了對以壓縮格式存儲的視頻內容的變化檢測任務。
根據(jù)通常的檢測視頻鏡頭變化的過程,對每一幀計算出相鄰幀之間的差別(differential)特征值,作為檢測測量值。主要地,使用在隨后的相鄰幀的色彩柱狀圖之間的差別。然后,比較差別特征值與預先確定的閾值來確定在當前幀中是否產生了視頻鏡頭變化。在壓縮區(qū)域方法的情況下,大多數(shù)檢測測量是直接根據(jù)DCT(離散余弦變化)系數(shù)、運動矢量、宏塊模式和比特流分配的部分解碼流數(shù)據(jù)計算出的。因此,可以不用完全解壓縮而快速執(zhí)行鏡頭變化檢測。
但是,通常用于壓縮或非壓縮區(qū)域的鏡頭變化檢測技術一般具有以下局限性。
第一,視頻中對應于視頻鏡頭變化的幀可能低于全部視頻幀的1%的比例。然而,多數(shù)視頻鏡頭變化檢測技術在每一幀時或在具有一定的幀跳躍長度的其它幀處重復。因此,該檢測方案的計算負荷的效率非常低,所以不允許處理速度的改善。為了改善檢測速度,一些壓縮區(qū)域檢測方法計算在壓縮流數(shù)據(jù)中隨后的內部編碼幀之間的檢測測量值,該內部編碼幀通常屬于每一個由大約15個幀組成的GOP(圖像組)流單元中的第一幀。GOP流單元中存在內部編碼幀使得能夠隨機訪問GOP單元中的壓縮視頻流。更特別地,通過比較在每一個GOP流單元計算的檢測測量值與給定的閾值,可以作出一個關于當前GOP流單元在其自身中是否存在視頻鏡頭變化的判定。然后,檢驗在被聲明為鏡頭變化候選GOP單元的當前GOP流單元中所有的視頻幀是鏡頭變化幀的可能性。此外,為了覆蓋這樣的視頻鏡頭變化檢測,該變化被特定地分為突變(cut)或GT(逐漸變化),在每一幀處需要計算出兩種不同的檢測測量值。詳細地,對于表示隨后兩個視頻攝像機鏡頭的無重疊連接的突變型鏡頭變化的有效的檢測,在具有相對短的幀距離(例如,1幀)的兩個后續(xù)幀中計算出的檢測測量值就足夠了,而在表示在隨后兩個視頻攝像機鏡頭的部分重疊連接的GT型鏡頭變化的情況下,就應該計算出在具有相對長的幀距離(例如,15~45幀)的兩個后續(xù)幀之間的另一個檢測測量值。上述檢測方法的這些因素成為改善檢測速度的干擾。
第二,將色彩柱狀圖差別用作主要檢測測量的傳統(tǒng)方法暴露出在時間上相鄰的、具有相似色彩分布的視頻鏡頭之間的鏡頭變化檢測上的局限性。此外,在可以頻繁地觀察到一種如閃光的有效照明度變化的新聞視頻或音樂視頻中,在具有閃光的視頻幀周圍檢測到許多虛假鏡頭變化。為了彌補這一問題,一些早期的工作提出一些獨立處理步驟,如獨立閃光檢測模塊或用于圖像照明度補償?shù)膹碗s的處理。
發(fā)明內容
本發(fā)明提供一種用于檢測運動圖像中的視頻鏡頭變化的方法,在該方法中運動圖像的壓縮視頻流數(shù)據(jù)可以以多級流為單元來劃分,并且只對一些被檢測為具有鏡頭變化可能性的流組應用分級鏡頭變化檢測處理。
同樣,本發(fā)明提供一種用于檢測運動圖像中的視頻鏡頭變化的設備,在該設備中運動圖像的壓縮視頻流數(shù)據(jù)可以以多級流單元來劃分,并且只對一些被檢測為具有鏡頭變化可能性的流組應用分級鏡頭變化檢測處理。
根據(jù)本發(fā)明的一個方面,提供一種用于檢測運動圖像中的視頻鏡頭變化的方法,該方法包括操作(a)對于通過組合運動圖像的視頻幀組成的第一至第K(此處,K是大于1的正整數(shù))上層幀組、通過組合第一至第K上層幀組中的第L(此處,L是大于1并小于K的正整數(shù))上層幀組中的視頻幀組成的第一至第M(此處,M是大于1的正整數(shù))中間層幀組、以及在第一至第M中間層幀組的第N中間層幀組中的第N(此處,N是大于1并且小于M的正整數(shù))下層幀組,檢測是否存在視頻鏡頭變化;和(b)通過使用操作(a)的結果產生一個視頻鏡頭變化列表。
根據(jù)本發(fā)明的另一方面,提供一種用于檢測運動圖像中的視頻鏡頭變化的設備,該設備包括鏡頭變化檢測單元,該單元對于通過組合運動圖像的視頻幀形成的第一至第K(此處,K是大于1的正整數(shù))上層幀組、通過組合第一至第K上層幀組中的第L(此處,L是大于1并小于K的正整數(shù))上層幀組中的視頻幀組成的第一至第M(此處,M是大于1的正整數(shù))中間層幀組、以及在第一至第M中間層幀組的第N中間層幀組中的第N(此處,N是大于1并且小于M的正整數(shù))下層幀組,檢測視頻鏡頭變化;和鏡頭變化列表產生單元,用于產生已檢測的視頻的鏡頭變化列表。
結合附圖,從下面對實施例的描述中,本發(fā)明的這些和/或其他方面、特征和優(yōu)點將變得清楚和更加容易理解,其中圖1是描述根據(jù)本發(fā)明的一個實施例檢測運動圖像中的視頻鏡頭變化的方法的流程圖;圖2是示出視頻流數(shù)據(jù)幀編組的例子的示意圖;圖3是描述根據(jù)本發(fā)明的一個實施例的、圖1中的操作10A的流程圖;圖4是描述根據(jù)本發(fā)明的一個實施例的、圖3中的操作32的流程圖;圖5是描述根據(jù)本發(fā)明的一個實施例的、圖3中的操作42的流程圖;圖6是描述根據(jù)本發(fā)明的一個實施例的、圖3中的操作56的流程圖;圖7是描述根據(jù)本發(fā)明的一個實施例的、圖6中的操作158的流程圖;圖8是描述根據(jù)本發(fā)明的一個實施例的、圖3中的操作60的流程圖;圖9是描述根據(jù)本發(fā)明的一個實施例的、圖8中的操作184的流程圖;
圖10描述根據(jù)本發(fā)明的一個實施例的、圖8中的操作186的流程圖;圖11描述根據(jù)本發(fā)明的一個實施例的、圖1中的操作10的流程圖;圖12是示出根據(jù)本發(fā)明的一個實施例的、用于檢測運動圖像中的視頻鏡頭變化的設備的框圖;圖13是示出根據(jù)本發(fā)明的一個實施例的鏡頭變化檢測單元的框圖;圖14是示出根據(jù)本發(fā)明的一個實施例的第三鏡頭變化可能性檢測單元502的框圖;圖15是示出根據(jù)本發(fā)明的一個實施例的、圖13中的第一鏡頭變化可能性檢測單元508的框圖;圖16是示出根據(jù)本發(fā)明的一個實施例的、圖13中的第二鏡頭變化可能性檢測單元518的框圖;圖17是示出根據(jù)本發(fā)明的一個實施例的、圖16中第四鏡頭變化可能性檢測單元648的框圖;圖18是示出根據(jù)本發(fā)明的一個實施例的、圖13中的突變型變化檢測單元520的框圖;圖19是示出根據(jù)本發(fā)明的一個實施例的、圖18中的第二突變型幀確定單元804的框圖;圖20是示出根據(jù)本發(fā)明的另一個實施例的、圖18中的第二突變型幀確定單元804的框圖;和圖21是示出根據(jù)本發(fā)明的另一個實施例的、圖12中的鏡頭變化檢測單元400的框圖。
具體實施例方式
現(xiàn)在將參照附圖對本發(fā)明進行更為全面地介紹,其中在附圖中給出了本發(fā)明的示范性實施例。不過,本發(fā)明可以以多種不同的形式具體實施并且不應被理解為局限于在本文提出的實施例;相反,給出這些實施例使得本公開內容更加全面和完整,并且將會把本發(fā)明的概念完整地傳達給本領域技術人員。在附圖中相同的參考數(shù)字表示相同的元件,因此省略對它們的介紹。
參見圖1,根據(jù)本發(fā)明的一個實施例檢測運動圖像中的視頻鏡頭變化的方法包括檢測是否存在視頻鏡頭變化和隨后產生鏡頭變化列表的操作10和12。
首先,對于通過組合運動圖像的視頻幀形成的第一至第K(此處,K是大于1的正整數(shù))上層幀組、通過組合第一至第K上層幀組當中的第L(此處,L是大于1并小于或等于K的正整數(shù))上層幀組中的視頻幀形成的第一至第M(此處,M是大于1的正整數(shù))中間層幀組、和通過組合第一至第M中間層幀組當中的第N個中間層幀組中的視頻幀形成的第N(此處,N是大于1并且小于或等于M的正整數(shù))個下層幀組進行視頻鏡頭變化的檢測(操作10)。第一至第K上層幀組是包括內部幀、前向預測幀、雙向預測幀的圖像組(GOP)。該GOP是由從一個內部幀延續(xù)到下一個內部幀的一組幀組成的,并且其作為可以任意訪問的最小獨立圖像單元。
而且,優(yōu)選的是對于比第一至第K上層幀組更高的最高層幀組檢測視頻鏡頭變化。
參見圖2,最高層幀組是通過將兩個上層幀組組合為一個幀組形成的。每一個上層幀組被分為多個中間層幀組。類似地,每一個中間層幀組被分為多個下層幀組。如圖2所示,第一最高層幀組包括位于兩端的內部幀(I1和I3),并且第一和第二上層幀組也分別包括位于兩端的內部編碼幀集合(I1和I2)及(I2和I3)。這里,顯示為第一最高層幀組內包含有兩個上層幀組。然而,第一最高層幀組內也可以包含三個上層幀組。第一上層幀組還包括第一至第五中間層幀組,這些中間層幀組分別由以下五個邊界幀集合(I1和P1)、(P1和P2)、(P2和P3)、(P3和P4)、(P4和I2)表示。顯示為每一個中間層幀組包括介于內部幀或前向預測幀之間的兩個雙向預測幀。但是,也可以包括預定數(shù)量的雙向預測幀。這里,顯示的是單獨的雙向預測幀作為下層幀組的單元幀。注意,由于為了便于解釋說明,所描繪的連續(xù)幀是以視頻播放順序排列的,而不是按照視頻編碼順序排列的,因此,上述分級幀分組與對真實壓縮視頻流數(shù)據(jù)實行的分組應當略有不同。
參見圖3,操作10包括操作30至68,用于通過對于多層幀組執(zhí)行分級鏡頭變化檢測處理來檢測在幀單元中是否存在突變型變化或是漸變型變化。
首先,在通過組合在第一至第K上層幀組中的預定數(shù)量的上層幀組而形成的第一至第G(其中,G是一個大于1的正整數(shù))最高層幀組中指定第H(其中,H是一個大于1并且小于或等于G的正整數(shù))最高層幀組(操作30)。例如,如果運動圖像是由第一至第G最高層幀組組成,則順序指定第一至第G最高層幀組。
在操作30之后,對于第H最高層幀組檢測鏡頭變化的可能性(操作32)。這里,鏡頭變化可能性表示經(jīng)歷鏡頭變化的一幀或多幀能夠被包括在幀組中的概率。如上所述,鏡頭變化被分類為突變型變化和漸變型變化。突變型變化指的是一種在相鄰視頻攝像鏡頭之間的突然變化,而漸變型變化指的是相鄰視頻攝像鏡頭之間的平滑或漸進變化。如果確定可能發(fā)生突變型變化和漸變型變化中的任何一個,就確定鏡頭變化是可能的。
參見圖4,操作32包括通過使用對于第三參考幀計算的第二差別特征值和第二相關系數(shù)來確定鏡頭變化可能性的操作100至110。通常,參考幀是指視頻壓縮序列中的一個內部編碼幀或前向預測幀。
首先,對于位于第H最高層幀組的兩端的第三參考幀計算基于色彩柱狀圖的第二差別特征值(操作100)。特別地,第三參考幀是內部幀。例如,如圖2所示,對于位于第一最高層幀組兩端的第一和第三內部幀I1和I3、根據(jù)兩個色彩柱狀圖計算第二差別特征值。下面的等式用于計算第二差別特征值。
|ΔFij|=1AΣk=1n|Fi(k)-Fj(k)|]]>其中,下標i和j代表位于最高層幀組兩端的幀;F表示指定幀的色彩柱狀圖;k表示色彩柱狀圖中的格(bin)編號;n表示在色彩柱狀圖中的格的總數(shù);和A表示指定幀的圖像大小。
等式1的結果被用作用于確定兩個參考圖像之間色彩分布相似性的差別特征值。當差別特征值越接近于0,就認為兩幅圖像在色彩分布上越相似,由所述兩幅圖像定義的流幀單元(或組)被認為具有越低的鏡頭變化可能性。相反,當差別特征值從0變得越大,則認為由所述兩幅圖像定義的流幀單元的鏡頭變化可能性越大。
在操作100之后,將計算的第二差別特征值與預定的第三閾值進行比較(操作102)。如果通過等式1計算的第二差別特征值不大于第三閾值,就執(zhí)行下面將要描述的操作110。
但是,如果計算的第二差別特征值大于第三閾值,則對于第三參考幀計算歸一化(normalized)的第二相關系數(shù)(操作104)。下面的等式被用于計算第二歸一化的相關系數(shù),該相關系數(shù)防止由照明度變化,尤其是閃光燈,引起的虛假檢測。
γij=1mΣp=1m[(Di(p)-Bi)(Dj(p)-Bj)Ei*Ej]]]>其中,下標i和j表示位于最高層幀組兩端的(參考)幀;p表示一個像素位置;m表示圖像幀像素的總數(shù);Di(p)和Dj(p)表示i和j幀中的p像素的亮度值;Bi和Bj表示i和j幀的平均亮度值;Ei和Ej表示i和j幀的亮度值的標準差。
通過等式2計算出的歸一化相關系數(shù)是分布在-1到1之間的。當估算的相關系數(shù)變得越接近1,在由所述兩幅圖像定義的流單元中發(fā)生鏡頭變化的可能性就越低。正相反,當相關系數(shù)越接近-1,鏡頭變化可能性就越高。所述的相關系數(shù)與基于色彩分布的差別特征值相比更有力地預防照明度變化。
在操作104之后,將由等式2得到的第二相關系數(shù)與預定的第四閾值進行比較(操作106)。如果比較的結果是第二相關系數(shù)不比第四閾值小,就如下執(zhí)行操作110。
但是,如果計算的第二相關系數(shù)比第四閾值小,就確定對于第H最高層幀組存在鏡頭變化可能性(操作108)。
同時,如果操作102的結果是第二差別特征值不大于第三閾值,或者如果操作106的結果是第二相關系數(shù)不小于第四閾值,就確定對于第H最高層幀組不存在鏡頭變化可能性(操作110)。無鏡頭變化可能性意味著在第H最高層幀組中不存在在其中發(fā)生了突變型變化或漸變型變化的幀或幀塊。
在操作32之后,基于操作32的結果確定對于第H最高層幀組是否存在鏡頭變化可能性(操作34)。如果對于第H最高層幀組存在鏡頭變化可能性,就執(zhí)行操作40。
但是,如果對于第H最高層幀組不存在鏡頭變化可能性,就確定第H最高層幀組是否是第一到第G最高層幀組的最后一個(操作36)。換句話說,沒有要檢測的最高層幀組。
如果第H最高層幀組不是第一到第G最高層幀組的最后一個,就指定第(H+1)最高層幀組(其中,H+1是大于1并且小于或等于G的正整數(shù)),并且執(zhí)行操作32(操作38)。如果指定了第(H+1)最高層幀組,則在步驟32中對于第(H+1)最高層幀組檢測鏡頭變化可能性。
但是,如果第H最高層幀組是第一至第G最高層幀組的最后一個,則如下所述執(zhí)行操作12。如果第H最高層幀組是最高層幀組的最后一個,由于沒有將要被檢測的最高層幀組,就執(zhí)行操作12。
在操作34中,如果對于第H最高層幀組存在鏡頭變化可能性,就指定第L上層幀組(操作40)。如上所述,第L上層幀組是GOP結構類型。在包含在第H最高層幀組中的第一至第K上層幀組中,按照幀位置的順序從第一上層幀組開始第L上層幀組的指定。
在操作40之后,對于第L上層幀組檢測鏡頭變化可能性(操作42)。
參見圖5,操作42包括通過使用對于第二參考幀計算的第一相關系數(shù)和計算的第一差別特征值來檢測鏡頭變化可能性的操作130到140。
首先,對于位于第L上層幀組兩端的第二參考幀,計算基于色彩柱狀圖的第一差別特征值(操作130)。類似于第三參考幀,第二參考幀是內部幀。例如,如圖2所示,第一上層幀組的第二參考幀是第一內部幀I1和第二內部幀I2。第一差別特征值可以由等式1得到。
在操作130之后,將得到的第一差別特征值與預定的閾值進行比較(操作132)。如果比較的結果是第一差別特征值不大于第一閾值,則如下所述執(zhí)行操作140。
但是,如果所得到的第一差別特征值大于第一閾值,則對于第二參考幀計算歸一化的第一相關系數(shù)(操作134)。第一相關系數(shù)可以由等式2得到。
在操作134之后,將得到的第一相關系數(shù)與預定的第二閾值進行比較(操作136)。如果比較的結果是第一相關系數(shù)不小于第二閾值,則如下所述執(zhí)行操作140。
但是,如果得到的第一相關系數(shù)比第二閾值小,就確定對于第L上層幀組存在鏡頭變化可能性(操作138)。
同時,如果操作132中的比較結果是第一差別特征值不大于第一閾值,或者如果操作136中的比較結果是第一相關系數(shù)不小于第二閾值,就確定對于第L上層幀組不存在鏡頭變化可能性(操作140)。
在操作42之后,通過使用操作42的結果確定對于第L上層幀組是否存在鏡頭變化可能性(操作44)。如果對于第L上層幀組存在鏡頭變化可能性,則如下所述執(zhí)行操作50。
但是,如果對于第L上層幀組不存在鏡頭變化可能性,則確定第L上層幀組是不是第一到第K上層幀組的最后一個(操作46)。換句話說,不存在將要被檢測的上層幀組。
如果第L上層幀組不是第一至第K上層幀組的最后一個,就指定第(L+1)上層幀組(其中,(L+1)是大于1并且小于或等于K的正整數(shù)),并且執(zhí)行操作42(操作48)。
但是,如果第L上層幀組是第一至第K上層幀組的最后一個,就執(zhí)行操作36。這是因為在第H最高層幀組中沒有將要被檢測的上層幀組。因此,為了檢測其它的最高層幀組,就執(zhí)行操作36。
在操作44中,如果存在針對第L上層幀組的鏡頭變化可能性,就確定在第L上層幀組中是否包括一個或多個第一參考幀,所述參考幀將第L上層幀組分為第一至第M中間層幀組(操作50)。特別地,第一參考幀是前向預測幀。如圖2所示,可以認識到對應于前向預測幀的第一參考幀P1、P2、P3、P4包括在第一上層幀組中。最后,基于該第一參考幀P1、P2、P3、P4而形成第一到第五中間層幀。
如果在第L上層幀組中包括一個或多個第一參考幀,就執(zhí)行操作54。
但是,如果在第L上層幀組中沒有第一參考幀,位于第L上層幀組兩端的第二參考幀中的第二個被確定為相應于視頻鏡頭的突然變化的突變型變化幀。然后執(zhí)行操作46(操作52)。如果在操作44中確定存在鏡頭變化可能性的第L上層幀組中沒有前向預測幀,其就確定存在一個突變型變化。
在操作50中,如果在第L上層幀組中存在第一參考幀,就指定第N中間層幀組以便檢測視頻鏡頭變化(操作54)。如果第一參考幀包括在第L上層幀組中,就確定存在分割第L上層幀組的中間層幀組。在這種情況下,從第L上層幀組的多個幀中的前面的中間層幀組進行順序指定。
在操作54之后,對于第N中間層幀組檢測鏡頭變化可能性(操作56)。
參見圖6,操作56包括使用對于預定幀計算的第三相關系數(shù)和第三差別特征值來檢測鏡頭變化可能性的操作150到164。
首先,對于位于第N中間層幀組兩端的幀,基于色彩柱狀圖計算第三差別特征值(操作150)。預定的幀可以是內部幀或是前向預測幀。如圖2所示,計算位于在第一上層幀組中的第二中間層幀組的兩端的預定幀P1和P2的第三差別特征值。第三差別特征值通過使用等式1計算出。
在操作150之后,將計算出的第三差別特征值與預定的第五閾值比較(操作152)。如果比較結果是第三差別特征值不大于第五閾值,就如下所述執(zhí)行操作164。
但是,如果得到的第三差別特征值大于第五閾值,則對于預定幀計算歸一化的第三相關系數(shù)(操作154)。第三相關系數(shù)通過使用等式2計算出。
在操作154之后,確定得到的第三相關系數(shù)是否在預定的第六閾值和預定的第七閾值之間(操作156)。
如果得到的第三相關系數(shù)在第六閾值和第七閾值之間,則對于第N中間層幀組,基于運動信息檢測鏡頭變化可能性(操作158)。對于相應幀的每一個塊執(zhí)行運動矢量預測,從而基于運動補償技術實現(xiàn)視頻壓縮。在這種情況下,根據(jù)在相應幀中是否存在鏡頭變化來確定是否應該執(zhí)行運動矢量預測。如果應該執(zhí)行預測模式,就確定應該采用前向預測模式、反向預測模式、和雙向預測模式中的哪種模式來實現(xiàn)運動矢量預測。換句話說,可能通過對于由運動補償壓縮的幀的流數(shù)據(jù)中的每一個塊檢測運動矢量預測和檢測每一個預測模式的比例,來間接確定是否有鏡頭變化。換句話說,在運動預測幀中的宏塊中,如果內部模式的數(shù)量大于運動預測模式(例如,前向預測模式,反向預測模式,和雙向預測模式)的數(shù)量,這意味著鏡頭變化可能性變高了。
參見圖7,操作158包括操作170到178,用于基于對于在第N中間層幀組中的第一參考幀計算的第一發(fā)生率比例檢測對于第N中間層幀組的鏡頭變化可能性。
首先,確定位于第N中間層幀組兩端的預定幀中的第二個是否是第一參考幀中的一個(操作170)。如上所述,預定幀可以是內部幀也可以是前向預測幀。然后,確定預定幀中位于第二個的幀是否是與第一參考幀相應的前向預測幀。如果預定幀中位于第二個的幀不是第一參考幀,就執(zhí)行操作178。
但是,如果預定幀中位于第二個的幀是第一參考幀,則計算出第一發(fā)生率比例(操作172)。第一發(fā)生率比例是內部模式的發(fā)生率和前向預測模式的發(fā)生率的比例。內部模式的發(fā)生率表示在第一參考幀,也就是前向預測幀,中存在多少具有內部模式的宏塊。前向預測模式的發(fā)生率表示在第一參考幀,也就是前向預測幀,中存在多少具有前向預測模式的宏塊。第一發(fā)生率比例可以由下面的等式得到。
R1=S1/T1,其中,R1是第一發(fā)生率比例S1內部模式的發(fā)生率;和T1是前向預測模式的發(fā)生率。
在操作172之后,將得到的第一發(fā)生率比例與預定的第八閾值進行比較(操作174)。如果第一發(fā)生率比例大于第八閾值,執(zhí)行操作178。
相反地,如果獲得的第一發(fā)生率比例不大于第八閾值,確定對于第N中間層幀組不存在鏡頭變化性(操作176)。
作為操作170的結果,如果預定幀中的第二個不是第一參考幀,或者如果操作174的結果是第一發(fā)生率比例大于第八閾值,就基于運動信息確定對于第N中間層幀組存在鏡頭變化可能性(操作178)。
如果圖6中的操作156的結果是確定第三相關系數(shù)不在第六和第七閾值之間,則確定得到的第三相關系數(shù)是否小于第六閾值(操作160)。
如果得到的第三相關系數(shù)小于第六閾值,就基于歸一化的相關性確定對于第N中間層幀組存在鏡頭變化可能性(操作162)。
相反地,如果在操作152中確定第三差別特征值不大于第五閾值,或者如果在操作160中確定第三相關系數(shù)大于第七閾值,就確定對于第N中間層幀組不存在鏡頭變化可能性(操作164)。
在操作56之后,基于操作56的結果確定對于第N中間層幀組是否存在鏡頭變化可能性(操作58)。
如果對于第N中間層幀組不存在鏡頭變化可能性,就確定第N中間層幀組是否是第一到第M中間層幀組的最后一個(操作62)。
作為操作62的結果,如果確定第N中間層幀組不是第一至第M中間層幀組的最后一個,則指定第(N+1)中間層幀組(其中,N+1是大于1并且小于或等于M的正整數(shù)),并且執(zhí)行操作56(操作64)。在操作56中,對于第(N+1)中間層幀組檢測鏡頭變化可能性。
作為操作62的結果,如果第N中間層幀組是第一至第M中間層幀組中的最后一個,這就意味著在第L上層幀組中檢測鏡頭變化的處理完成了。因此,確定對于第一到第M中間層幀組是否檢測到突變型鏡頭變化(操作66)。換句話說,確定在第L上層幀組中是否存在突然的鏡頭變化。
如果確定在第一至第M中間層幀組的任何一個中沒有突變型變化,就檢測對于第L上層幀組是否存在漸變型變化,然后執(zhí)行操作46(操作68)。
相反地,如果對于在第L上層幀組中的第一至第M中間層幀組存在突變型變化(該變化是視頻鏡頭的突然變化),就執(zhí)行操作46。
同時,作為操作58的結果,如果對于第N中間層幀組存在鏡頭變化可能性,就確定對于第N下層幀組是否存在突變型變化,該變化是突然的視頻鏡頭變化(操作60)。
參見圖8,操作60包括操作180至188,用于基于在第N下層幀組中是否存在雙向預測幀來對于第N下層幀組檢測是否存在突變型變化。
首先,確定在第N下層幀組中是否存在雙向預測幀(操作180)。如果在第N下層幀組中不具有雙向預測幀,執(zhí)行操作188。
相反地,如果在第N下層幀組中具有雙向預測幀,就基于運動信息確定第N中間層幀組是不是被確定為具有鏡頭變化可能性的中間層幀組(操作182)。
如果基于運動信息確定第N中間層幀組是被確定為具有鏡頭變化可能性的中間層幀組,則最后基于運動信息確定對于雙向預測幀是否存在突變型變化(操作184)。
參見圖9,操作184包括操作200至212,用于通過使用第二和第三發(fā)生率比例確定對于雙向預測幀是否存在突變型變化。
首先,在雙向預測幀中指定第一雙向預測幀(操作200)。第一雙向預測幀是第N下層幀組中雙向預測幀中位于第一位置(order)的幀。
在操作200之后,對于第一雙向預測幀計算第二和第三發(fā)生率比例(操作202)。第二發(fā)生率比例是雙向預測模式發(fā)生率與前向預測模式和反向預測模式發(fā)生率的比例。第三發(fā)生率比例是反向預測模式發(fā)生率與前向預測模式發(fā)生率的比例。反向預測模式發(fā)生率表示在雙向預測幀中有多少個具有反向模式的宏塊存在。前向預測模式和反向預測模式發(fā)生率表示在雙向預測模式中,具有前向預測模式的宏塊的數(shù)量與具有反向預測模式的宏塊的數(shù)量的總和。雙向預測模式發(fā)生率表示在雙向預測模式中存在多少具有雙向預測模式的宏塊。第二發(fā)生率比例可以從下面的等式得到。
R2=T1+T2)/U1,其中,R2表示第二發(fā)生率比例;T1表示前向預測模式的發(fā)生率;T2表示反向預測模式的發(fā)生率;和U1表示雙向預測模式的發(fā)生率。
另一方面,第三發(fā)生率比例可以由下面的等式得到。
R3=T1/T2其中,R3表示第三發(fā)生率比例;T1表示前向預測模式的發(fā)生率;和T2表示反向預測模式的發(fā)生率;在操作202之后,將得到的第二發(fā)生率比例與預定的第九閾值進行比較,并將得到的第三發(fā)生率比例與預定的第十閾值進行比較(操作204)。
如果得到的第二發(fā)生率比例大于第九閾值,并且如果得到的第三發(fā)生率比例小于第十閾值,則確定第一雙向預測幀為一個突變型變化幀(操作206)。
但是,如果得到的第二發(fā)生率比例不大于第九閾值,或者如果得到的第三發(fā)生率比例不小于第十閾值,就確定第一雙向預測幀是否是雙向預測幀中的最后一個(操作208)。換句話說,確定在操作200中指定的雙向預測幀是否是第N下層幀組中按照順序的最后一個雙向預測幀。
如果第一雙向預測幀是雙向預測幀的最后一個,則確定位于第N中間層幀組兩端的預定幀的第二個為突變型變化幀(操作210)。
但是,如果第一雙向預測幀不是雙向預測幀的最后一個,則指定不同于第一雙向預測幀的下一個雙向預測幀,然后執(zhí)行操作202(操作212)。在操作202中,對于不同于第一雙向預測幀的下一個雙向預測幀計算第二和第三發(fā)生率比例。
同時,如果第N中間層幀組與在操作182中基于運動信息確定為具有鏡頭變化可能性的中間層幀組不對應,則最后基于歸一化的相關性確定對于雙向預測幀是否存在鏡頭變化(操作186)。
參見圖10,操作186包括操作220至232,用于通過使用第四相關系數(shù)確定對于雙向預測幀是否存在突變型變化。
首先,在雙向預測幀中指定一個第一雙向預測幀(操作220)。
在操作220之后,對于位于第N中間層幀組兩端的預定幀中的第一個幀和指定的雙向預測幀計算歸一化的第四相關系數(shù)(操作222)。第四相關系數(shù)可以從等式2得到。
在操作222之后,將得到的第四相關系數(shù)與預定的第十一閾值比較(操作224)。
如果得到的第四相關系數(shù)小于第十一閾值,就確定第一雙向預測幀是突變型變化幀(操作226)。
相反地,如果得到的第四相關系數(shù)不小于第十一閾值,就確定第一雙向預測幀是不是雙向預測幀中的最后一個(操作228)。
如果第一雙向預測幀是雙向預測幀中的最后一個,就確定位于第N中間層幀組兩端的預定幀中的第二個為突變型變化幀(操作230)。
相反地,如果第一雙向預測幀不是雙向預測幀中的最后一個,則指定不同于第一雙向預測幀的下一個雙向預測幀,并且執(zhí)行操作22(操作232)。
同時,作為操作188的結果,如果在第N中間層幀組中沒有雙向預測幀,就確定位于第N中間層幀組兩端的預定幀中的第二個幀為突變型變化幀(操作188)。
參見圖11,操作10B包括操作300至338,用于基于檢測到的第一和第二列表,對于全部視頻幀序列檢測是否存在突變型變化以及隨后僅對于受限的視頻幀片段檢測是否存在漸變型變化。
圖11示出的操作30至64與圖3所示的操作300至334相對應,因此下面就不給出它們的詳細描述了。
作為操作306的結果,如果最高層幀組是第一至第G最高層幀組的最后一個,就檢測第一和第二列表(操作336)。第一列表包括在第一至K上層幀組中具有鏡頭變化可能性的上層幀組,而第二列表包括對應于視頻鏡頭的突然變化的突變型變化幀。例如,如果上層幀組是多個GOP,則將檢測到的具有鏡頭變化可能性的多個GOP列入第一列表。另外,在上述每一個操作中檢測到的突變型變化幀的列表用作第二列表。
在操作336之后,通過使用第一和第二列表檢測是否存在漸變型變化(操作338)。關于具有鏡頭變化可能性的上層幀組的信息可以從第一列表獲得??梢曰谟嘘P第一列表中具有鏡頭變化可能性的上層幀組(但不包括在第二列表中的突變型變化幀)的信息,來確定是否存在視頻鏡頭的漸變型變化。漸變型變化的檢測可以通過基于普通的坪特性(plateau)狀態(tài)檢測、使用鏡頭變化檢測技術來實現(xiàn)。漸變型變化的檢測在本領域中是熟知的,因此下面就不給出關于它的詳細描述。
在操作10之后,基于所檢測的視頻的鏡頭變化檢測結果、結合檢測為鏡頭變化的幀的位置信息來生成鏡頭變化列表(操作12)。換句話說,鏡頭變化列表是基于從圖3所示的操作30至68或圖11所示的操作300至338得到的鏡頭變化幀的位置信息產生的。
產生的鏡頭變化列表是基本視頻內容結構信息,其根本上是用于視頻索引,作為結果,它可以組織視頻內容的表格從而概括視頻內容,或者以視頻鏡頭為單元容易地編輯視頻。
現(xiàn)在,將參考附圖描述根據(jù)本發(fā)明的、用于檢測運動圖像中的視頻鏡頭變化的設備。
參見圖12,用于檢測在視頻圖像中的視頻鏡頭變化的設備包括鏡頭變化檢測單元400和鏡頭變化列表產生單元420。
鏡頭變化檢測單元400對于通過組合運動圖像的視頻幀得到的第一至第K(此處,K是大于1的正整數(shù))上層幀組、通過組合從第一至第K上層幀組的第L(此處,L是大于1并小于或等于K的正整數(shù))上層幀組中的視頻幀得到的第一至第M(此處,M是大于1的正整數(shù))中間層幀組、以及第一至第M中間層幀組的第N中間層幀組中的第N(此處,N是大于1并且小于或等于M的正整數(shù))下層幀組,檢測視頻鏡頭變化。鏡頭變化檢測單元400對于通過輸入終端IN1輸入的視頻序列檢測視頻鏡頭變化,并且將檢測結果輸出到鏡頭變化列表產生單元420。
參見圖13,鏡頭變化檢測單元400包括最高層幀組指定單元500、第三鏡頭變化可能性檢測單元502、末端最高層幀組感測單元504、上層幀組指定單元506、第一鏡頭變化可能性檢測單元508、末端上層幀組感測單元510、參考幀感測單元512、第一突變型變化幀確定單元514、中間層幀組指定單元516、第二鏡頭變化可能性檢測單元518、末端中間層幀組感測單元522、突變型變化檢測單元520、突變型變化感測單元524、和漸變型變化檢測單元526。
最高層幀組指定單元500在通過將第一到第K上層幀組組合成預定數(shù)目的束而形成的第一至第G(這里,G是大于1的正整數(shù))最高層幀組中指定第H(H是大于1并且小于或等于G的正整數(shù))最高層幀組。最高層幀組指定單元500對于通過輸入終端IN2輸入的視頻序列,將上層幀組捆綁為預定個數(shù)的束,并在最高層幀組中指定第H最高層幀組。然后,將指定的結果輸出到第三鏡頭變化可能性檢測單元502。
第三鏡頭變化可能性檢測單元502對于由最高層幀組指定單元500指定的第H最高層幀組檢測鏡頭變化可能性,并且將檢測結果輸出到末端最高層幀組感測單元504和上層幀組指定單元506。
參見圖14,第三鏡頭變化可能性檢測單元502包括第二差別特征值計算單元600、第三比較單元602、第二相關系數(shù)計算單元604、第四比較單元606、第二鏡頭變化可能性確定單元608。
當指定的第H最高層幀組從輸入終端IN3輸入時,第二差別特征值計算單元600通過使用等式1對于第三參考幀計算色彩柱狀圖的第二差別特征值,然后將計算結果輸出到第三比較單元602。
第三比較單元602比較計算的第二差別特征值和預定的第三閾值,然后將比較結果輸出到第二相關系數(shù)計算單元604和第二鏡頭變化可能性確定單元608。
第二相關系數(shù)計算單元604響應于第三比較單元602的比較結果對于第三參考幀計算歸一化的第二相關系數(shù),然后將計算結果輸出到第四比較單元606。
第四比較單元606比較由第二相關系數(shù)計算單元604計算的第二相關系數(shù)和預定的第四閾值,然后將比較結果輸出到第二鏡頭變化可能性確定單元608。
第二鏡頭變化可能性確定單元608響應于來第三比較單元602和第四比較單元606的比較結果,確定對于第H最高層幀組是否存在鏡頭變化可能性。第二鏡頭變化可能性確定單元608響應于來第三比較單元602的比較結果確定對于第H最高層幀組不存在鏡頭變化可能性,然后通過輸出終端OUT3輸出該確定結果。另外,第二鏡頭變化可能性確定單元608從第四比較單元606接收第二相關系數(shù)小于第四閾值的比較結果作為輸入、確定對于第H最高層幀組存在鏡頭變化可能性、然后將確定結果輸出到輸出終端OUT3。另外,第二鏡頭變化可能性確定單元608從第四比較單元606接收第二相關系數(shù)不小于第四閾值的比較結果作為輸入、確定對于第H最高層幀組不存在鏡頭變化可能性、然后通過輸出終端OUT3輸出該確定結果。
圖13所示的末端最高層幀組感測單元504感測第H最高層幀組是不是第一到第G最高層幀組的最后一個。末端最高層幀組感測單元504響應于來自第三鏡頭變化可能性檢測單元502的檢測結果或來自下面將要描述的末端上層幀組感測單元510的感測結果,感測第H最高層幀組是不是第一到第G最高層幀組的最后一個幀,并且通過輸出終端OUT2將感測結果輸出到最高層幀組指定單元500。
上層幀組指定單元506響應于來自第三鏡頭變化可能性檢測單元502的結果而指定第L上層幀組,隨后將指定結果輸出到第一鏡頭變化可能性檢測單元508。
第一鏡頭變化可能性檢測單元508對于由上層幀組指定單元506指定的第L上層幀組檢測視頻鏡頭變化的可能性,然后將檢測結果輸出到末端上層幀組感測單元510和參考幀感測單元512。
參見圖15,第一鏡頭變化可能性檢測單元508包括第一差別特征值計算單元620、第一比較單元622、第一相關系數(shù)計算單元624、第二比較單元626、和第一鏡頭變化可能性確定單元628。
第一差別特征值計算單元620對于位于第L上層幀組兩端的第二參考幀計算色彩柱狀圖的第一差別特征值。如果指定的上層幀組是從輸入單元IN4接收到的,第一差別特征值計算單元602通過利用等式1對于第二參考幀計算色彩柱狀圖的第一差別特征值,然后將計算結果輸出到第一比較單元622。
第一比較單元622比較計算的第一差別特征值與預先確定的第一閾值,然后將比較結果輸出到第一相關系數(shù)計算單元624和第一鏡頭變化可能性確定單元628。
第一相關系數(shù)計算單元624響應于來自第一比較單元622的比較結果,通過利用等式2對于第二參考幀計算歸一化的第一相關系數(shù),并且將比較結果輸出到第二比較單元626。
第二比較單元626比較在第一相關系數(shù)計算單元624中計算的第一相關系數(shù)與預定的第二閾值,然后將比較結果輸出到第一鏡頭變化可能性確定單元628。
第一鏡頭變化可能性確定單元628確定對于第L上層幀組是否存在鏡頭變化可能性。第一鏡頭變化可能性確定單元628響應于來自第一比較單元622的比較結果,確定對于第L上層幀組不存在鏡頭變化可能性,然后將比較結果通過輸出終端OUT4輸出。另外,第一鏡頭變化可能性確定單元628從第二比較單元626接收第一相關系數(shù)小于第二閾值的比較結果,確定對于第L上層幀組存在鏡頭變化可能性,然后將確定結果通過輸出終端OUT4輸出。另外,第一鏡頭變化可能性確定單元628從第二比較單元626接收第一相關系數(shù)不小于第二閾值的比較結果,確定對于第L上層幀組不存在鏡頭變化可能性,然后將確定結果通過輸出終端OUT4輸出。
圖13所示的末端上層幀組感測單元510感測第L上層幀組是不是第一至第K上層幀組的最后一個。末端上層幀組感測單元510響應于來自第一鏡頭變化可能性檢測單元508的檢測結果、來自下面將要描述的第一突變型幀檢測單元514的檢測結果、來自突變型變化感測單元524的感測結果、或來自漸變型變化感測單元526的感測結果,感測第L上層幀組是不是第一至第K上層幀組的最后一個,并且將感測結果輸出到末端最高層幀組感測單元504和上層幀組指定單元506。
參考幀感測單元512響應于來自第一鏡頭變化可能性檢測單元508的檢測結果,感測在第L上層幀組中是否包含一個或多個將第L上層幀組分割為第一至第M中間層幀組的第一參考幀,然后將感測結果輸出到第一突變型幀確定單元514和中間層幀組指定單元516。在這一情形中,第一參考幀是前向預測幀。
第一突變型幀確定單元514響應于來自參考幀感測單元512的感測結果,確定位于第L上層幀組的兩端的第二參考幀的第二個為突變型變化幀,并且將確定結果輸出到末端上層幀組感測單元510。在這一情形中,第二參考幀是內部幀。
中間層幀組指定單元516響應于來自參考幀感測單元512的感測結果或來自下面將要描述的中間層幀組感測單元522的感測結果,指定第N中間層幀組,并且將指定結果輸出到第二鏡頭變化可能性檢測單元518。
第二鏡頭變化可能性檢測單元518響應于來自中間層幀組指定單元516的結果,對于第N中間層幀組檢測鏡頭變化可能性,然后將檢測結果輸出到末端中間層幀組感測單元522和突變型變化檢測單元520。
參見圖16,第二鏡頭變化可能性檢測單元518包括第三差別特征值計算單元640、第五比較單元642、第三相關系數(shù)計算單元644、第六比較單元646、第四鏡頭變化可能性檢測單元648、和第三鏡頭變化可能性確定單元650。
第三差別特征值計算單元640響應于從輸入終端IN5輸入的第N中間層幀組,通過利用等式1對于位于第N中間層幀組兩端的預先確定的幀計算色彩柱狀圖的第三差別特征值,然后將計算結果輸出到第五比較單元642。
第五比較單元642比較從第三差別特征值計算單元640得到的第三差別特征值與預定的第五閾值,然后將比較結果輸出到第三相關系數(shù)計算單元644和第三鏡頭變化可能性確定單元650。
第三相關系數(shù)計算單元644響應于從第五比較單元642得到的比較結果,通過利用等式2對于預定的幀計算歸一化的第三相關系數(shù),然后將比較結果輸出到第六比較單元646。
第六比較單元646基于預定的第六和第七閾值進行比較,以確定從第三相關系數(shù)計算單元644獲得的第三相關系數(shù)屬于哪里,然后將比較結果輸出到第四鏡頭變化可能性檢測單元648和第三鏡頭變化可能性確定單元650。
第四鏡頭變化可能性檢測單元648響應于從第六比較單元646獲得的結果,基于運動信息對于第N中間層幀組檢測是否存在鏡頭變化可能性,并且通過輸出端口OUT5輸出該比較結果。
參見圖17,第四鏡頭變化可能性檢測單元包括第一感測單元700、第一發(fā)生率比例計算單元702、第七比較單元704、和第四鏡頭變化可能性確定單元706。
第一感測單元700響應于通過輸入單元IN6從第六比較單元646得到的比較結果,感測位于第N中間層幀組的兩端的預先確定的幀的第二個是否與第一參考幀中的一個相對應,然后將感測結果輸出到第一發(fā)生率比例計算單元702和第四鏡頭變化可能性確定單元706。
第一發(fā)生率比例計算單元702響應于從第一感測單元700得到的感測結果,對于第一參考幀中的一個幀計算和前向預測幀模式發(fā)生率與內部模式發(fā)生率的比例相對應的第一發(fā)生率比例,并且將計算結果輸出到第七比較單元704。
第七比較單元704比較由第一發(fā)生率比例計算單元702計算的第一發(fā)生率比例與預定的第八閾值,然后將比較結果輸出到第四鏡頭變化可能性確定單元706。
第四鏡頭變化可能性確定單元706確定對于第N中間層幀組是否存在鏡頭變化可能性。第四鏡頭變化可能性確定單元706響應于從第一感測單元700中得到的檢測結果,基于運動信息確定對于第N中間層幀組是否存在鏡頭變化可能性,然后將確定結果經(jīng)由輸出終端OUT7輸出。另外,第四鏡頭變化可能性確定單元706從第七比較單元704接收第一發(fā)生率比例大于第八閾值的比較結果、基于運動信息確定對于第N中間層幀組存在鏡頭變化可能性、然后通過輸出終端OUT7輸出確定的結果。同樣,第四鏡頭變化可能性確定單元706從第七比較單元704接收第一發(fā)生率比例不大于第八閾值的比較結果,確定對于第N中間層幀組不存在鏡頭變化可能性,然后通過輸出終端OUT7輸出確定結果。
圖16所示的第三鏡頭變化可能性確定單元650基于歸一化的相關性確定對于第N中間層幀組存在鏡頭變化可能性,或者不存在鏡頭變化可能性。第三鏡頭變化可能性確定單元650響應于來自第五比較單元642的比較結果確定對于第N中間層幀組不存在鏡頭變化可能性,然后通過輸出終端OUT6輸出確定結果。另外,第三鏡頭變化可能性確定單元650從第六比較單元646接收第三相關系數(shù)小于第六閾值的比較結果、基于歸一化的相關性確定對于第N中間層幀組存在鏡頭變化可能性、然后通過輸出終端OUT6輸出確定結果。同樣,第三鏡頭變化可能性確定單元650從第六比較單元646接收第三相關系數(shù)大于第七閾值的比較結果、確定對于第N中間層幀組不存在鏡頭變化可能性、然后通過輸出終端OUT6輸出確定結果。
圖13所示的突變型變化檢測單元520響應于從第二鏡頭變化可能性檢測單元518輸入的檢測結果檢測對于第N下層幀組是否存在突變型變化,然后將檢測結果輸出到末端中間層幀組感測單元522。
參見圖18,突變型變化檢測單元520包括第二感測單元800、第三感測單元802、第二突變型變化幀確定單元804。
第二感測單元800響應于從第二鏡頭變化可能性檢測單元518得到并從輸入終端IN7輸入的檢測結果感測在第N下層幀組中是否包括雙向預測幀,然后將感測結果輸出到第三感測單元802和第二突變型變化幀確定單元804。
第三感測單元802響應于從第二感測單元800得到的感測結果,基于運動信息感測第N中間層幀組是否與確定為具有鏡頭變化的中間層幀組相對應,然后將感測結果輸出到第二突變型變化幀確定單元804。
第二突變型變化幀確定單元804最后基于運動信息或歸一化的相關系數(shù)確定哪一個雙向預測幀與突變型變化幀相對應,或確定位于第N中間層幀組兩端的預先確定幀的第二個與突變型變化幀相對應。第二突變型變化幀確定單元804響應于來自第二感測單元800的檢測結果確定位于第N中間層幀組兩端的預先確定幀的第二個與突變型變化幀相對應,然后通過輸出終端OUT8輸出確定的結果。另外,第二突變型變化幀確定單元804響應于來自第三感測單元802的檢測結果,基于運動信息或歸一化的系數(shù)最終確定雙向預測幀中的哪一個與突變型變化幀相對應,然后通過輸出終端OUT8輸出確定結果。
參見圖19,第二突變型變化幀確定單元804包括第一雙向預測幀指定單元900、第二和第三發(fā)生率比例計算單元(902)、第八比較單元904、第一確定單元906、和第一末端幀感測單元908。
第一雙向預測幀指定單元900響應于通過輸入終端IN8從第三感測單元802輸入的感測結果,在第N下層幀組的雙向預測幀中指定第一雙向預測幀,然后將指定結果輸出到第二和第三發(fā)生率比例計算單元902。
第二和第三發(fā)生率比例計算單元902對于從第一雙向預測幀指定單元900輸入的第一雙向預測幀計算第二發(fā)生率比例,然后將計算結果輸出到第八比較單元904。第二發(fā)生率比例和雙向預測模式的發(fā)生率與前向預測模式及反向預測幀模式的發(fā)生率的比例相對應。相似地,第二和第三發(fā)生率比例計算單元902對于從第一雙向預測幀指定單元900輸入的第一雙向預測幀計算第三發(fā)生率比例,然后將計算結果輸出到第八比較單元904。第三發(fā)生率比例和反向預測模式發(fā)生率與前向預測模式發(fā)生率的比例相對應。
第八比較單元904比較從第二和第三發(fā)生率比例計算單元902得到的第二發(fā)生率比例與預先確定的第九閾值,并比較第三發(fā)生率比例和預先確定的第十閾值。然后,將比較結果輸出到第一確定單元906和第一末端幀感測單元908。
當從第八比較單元904接收到第二發(fā)生率比例大于第九閾值和第三發(fā)生率比例小于第十閾值的比較結果時,第一確定單元906確定第一雙向預測幀與突變型變化幀相對應,并且通過輸出終端OUT9輸出確定結果。另外,當從下面將要描述的第一末端幀感測單元908接收到感測結果時,第一確定單元906確定位于第N中間層幀組兩端的預先確定幀的第二個與突變型變化幀相對應,并且通過輸出終端OUT9輸出確定結果。
當?shù)玫降牡诙l(fā)生率比例不大于第九閾值,或當?shù)玫降牡谌l(fā)生率比例不小于第十閾值時,第一末端幀感測單元908感測第一雙向預測幀是不是雙向預測幀的最后一個,然后將感測結果輸出到第一確定單元906和第一雙向預測幀指定單元900。
參見圖20,第二突變型變化幀確定單元804包括第二雙向預測幀指定單元920、第四相關系數(shù)計算單元922、第九比較單元924、第二確定單元926、和第二末端幀感測單元928。
第二雙向預測幀指定單元920響應于通過輸入終端IN9從第三感測單元802輸入的感測結果,在雙向預測幀中指定第一雙向預測幀,然后將指定結果輸出到第四相關系數(shù)計算單元922。
第四相關系數(shù)計算單元922對于位于第N中間層幀組的兩端的預先確定幀的第一個以及由第二雙向預測幀指定單元920指定的第一雙向預測幀計算歸一化的第四相關系數(shù),然后將計算結果輸出到第九比較單元924。
第九比較單元924比較從第四相關系數(shù)計算單元922得到的第四相關系數(shù)與預先確定的第十一閾值,然后將比較結果輸出到第二確定單元926和第二末端幀感測單元928。
當從第九比較單元924接收到所獲得的第四相關系數(shù)小于第十一閾值的比較結果時,第二確定單元926確定第一雙向預測幀與突變型變化幀相對應,然后通過輸出終端OUT10輸出確定結果。另外,當從下面將要描述的第二末端幀感測單元928接收到檢測結果時,第二確定單元926確定位于第N中間層幀組兩端的預先確定幀的第二個與突變型變化幀相對應,然后通過輸出終端OUT10輸出確定結果。
當?shù)玫降牡谒南嚓P系數(shù)不小于第十一閾值時,第二末端幀感測單元928感測第一雙向預測幀是不是與最后一個雙向預測幀相對應,然后將感測結果輸出到第二確定單元926和第二雙向預測幀指定單元920。
同時,圖13所示的末端中間層幀組感測單元522響應于來自第二鏡頭變化可能性檢測單元518或突變型變化檢測單元510的檢測結果,感測第N中間層幀組是否是第一至第M中間層幀組的最后一個,然后將感測結果輸出到突變型變化感測單元524和中間層幀組指定單元516。
突變型變化感測單元524響應于來自末端中間層幀組感測單元522的感測結果,感測在第L上層幀組的第一至第M中間層幀組中是否存在突變型變化,然后輸出感測結果到漸變型變化檢測單元526和末端上層幀組感測單元510。
當響應于來自突變型變化感測單元524的感測結果確定在第L上層幀組的第一至第M中間層幀組中不存在突變型變化時,漸變型變化檢測單元526檢測在第L上層幀組中是否存在漸變型變化,然后將檢測結果輸出到末端上層幀組感測單元510。
參見圖21,鏡頭變化檢測單元400包括最高層幀組指定單元1000、第三鏡頭變化可能性檢測單元1002、末端最高層幀組感測單元1004、上層幀組指定單元1006、第一鏡頭變化可能性檢測單元1008、末端上層幀組感測單元1010、參考幀感測單元1012、第一突變型幀確定單元1014、中間層幀組指定單元1016、第二鏡頭變化可能性檢測單元1018、末端中間層幀組感測單元1020、突變型變化檢測單元1022、突變型變化感測單元1024、第一和第二列表檢測單元1026、以及漸變型變化檢測單元1028。
除了第一和第二列表檢測單元1026以外,圖21所示的組成部分的功能與圖12所示的那些類似,因此就不給出它們的詳細描述。代替的,下面的描述主要集中在第一和第二列表檢測單元1026。
第一和第二列表檢測單元1026響應于來自末端最高層幀組感測單元1004的感測結果而構成第一列表和第二列表,然后將結果輸出到漸變型變化檢測單元1028。第一列表包括在第一到第K上層幀組中的、具有鏡頭變化可能性的上層幀組,并且第二列表包括與視頻鏡頭的突然變化相對應的突變型變化幀。
圖12中的鏡頭變化列表產生單元420響應于在圖13中的末端最高層幀組感測單元504中的檢測結果或來自圖21中的漸變型變化檢測單元1028的檢測結果,產生一個視頻鏡頭變化列表,然后通過輸出終端OUT1輸出鏡頭變化列表的結果。
如上所述,根據(jù)本發(fā)明的用于檢測運動圖像中的視頻鏡頭變化的方法和利用該方法的設備,因為以多級流幀為單元分組運動圖像的壓縮流數(shù)據(jù),并且隨后只對一些被檢測為具有鏡頭變化可能性的流組應用分級鏡頭變化檢測處理,因此可以較快地檢測視頻鏡頭變化。
另外,由于基于色彩分布的差別特征值以及歸一化的相關系數(shù)被用作檢測特征值,因此可以防止由于亮度變化而在鏡頭變化檢測中引起的虛假檢測,并且對于相似性色彩分布能有效地檢測鏡頭變化。
雖然已經(jīng)參考本發(fā)明的優(yōu)選實施例詳細示出和描述了根據(jù)本發(fā)明的、用于檢測運動圖像中的視頻鏡頭變化的方法和利用該方法的設備,本領域的技術人員應當理解在不背離由所附的權利要求定義的本發(fā)明的精神和范圍的情況下,可以在形式和細節(jié)上的作出各種改變。應當從描述的意義上來考慮本發(fā)明的優(yōu)選實施例,而并非是為了限制的目的。因此,本發(fā)明的范圍并不是通過發(fā)明的詳細描述來定義而是通過所附的權利要求來定義,并且所有包含在本發(fā)明范圍之內的不同將被解釋為包含在本發(fā)明中。
權利要求
1.一種用于檢測運動圖像中的視頻鏡頭變化的方法,該方法包括(a)對于通過組合運動圖像的視頻幀組成的第一至第K(此處,K是大于1的正整數(shù))上層幀組、通過組合第一至第K上層幀組中的第L(此處,L是大于1并小于或等于K的正整數(shù))上層幀組中的視頻幀組成的第一至第M(此處,M是大于1的正整數(shù))中間層幀組、以及在第一至第M中間層幀組的第N中間層幀組中的第N(此處,N是大于1并且小于或等于M的正整數(shù))下層幀組,檢測是否存在視頻鏡頭變化;和(b)通過使用操作(a)的結果產生一個視頻鏡頭變化列表。
2.根據(jù)權利要求1的方法,其中的操作(a)包括操作(a1)指定第L上層幀組以便檢測視頻鏡頭變化;(a2)對于第L上層幀組檢測是否存在鏡頭變化可能性;(a3)對于第L上層幀組確定是否存在鏡頭變化可能性;(a4)如果確定在第L上層幀組中存在鏡頭變化可能性,則確定在第L上層幀組中是否存在將第L上層幀組分割為第一到第M中間層幀的一個或多個第一參考幀;(a5)如果第一參考幀在第L上層幀組中,則指定第N中間層幀組以用于檢測視頻鏡頭變化;(a6)對于第N中間層幀組檢測鏡頭變化可能性;(a7)對于第N中間層幀組確定是否存在鏡頭變化可能性;和(a8)如果對于第N中間層幀組存在鏡頭變化可能性,則檢測對于第N下層幀組是否存在突變型變化。
3.根據(jù)權利要求2的方法,其中的操作(a)的特征在于第一參考幀是前向預測幀。
4.根據(jù)權利要求3的方法,其中的操作(a)還包括操作(a9)在通過組合第一至第K上層幀組構成的第一到第G最高層幀組中,指定第H最高層幀組(H是大于1并且小于或等于G的正整數(shù),G是大于1的正整數(shù));(a10)對于第H最高層幀組檢測是否存在鏡頭變化可能性;(a11)對于第H最高層幀組確定是否存在鏡頭變化可能性;和如果對于第H最高層幀組存在鏡頭變化可能性,就返回操作(a1)。
5.根據(jù)權利要求4的方法,其中的操作(a)進一步包括操作(a12)如果操作(a11)的結果是確定對于第H最高層幀組不存在鏡頭變化可能性,則確定第H最高層幀組是不是運動圖像的第一到第G最高層幀組的最后一個;(a13)如果確定第H最高層幀組不是第一至第G最高層幀組的最后一個,則指定第(H+1)最高層幀組(其中,H+1是大于1并且小于或等于G的正整數(shù)),然后返回到操作(a10);和如果確定第H最高層幀組是第一到第G最高層幀組的最后一個,就返回操作(b)。
6.根據(jù)權利要求5的方法,其中的操作(a)進一步包括操作(a14)如果在操作(a3)中確定對于第L上層幀組不存在鏡頭變化可能性,則確定第L上層幀組是不是第一到第K上層幀組的最后一個;(a15)如果確定第L上層幀組不是第一到第K上層幀組的最后一個,則指定第(L+1)上層幀組(其中,L+1是大于1并且小于或等于K的正整數(shù)),并且返回操作(a2),和如果第L上層幀組與第一到第K上層幀組的最后一個相對應,則返回操作(a12)。
7.根據(jù)權利要求6的方法,其中操作(a)進一步包括操作(a16)如果操作(a4)的結果是確定在第L上層幀組中不存在將第L上層幀組分割為第一到第M中間層幀組的第一參考幀,則確定位于第L上層幀組兩端的第二參考幀的第二個對應于突變型變化幀,該突變型變化幀是視頻鏡頭的突然變化,然后執(zhí)行操作(a14)。
8.根據(jù)權利要求7的方法,其中的操作(a)進一步包括操作(a17)如果操作(a7)的結果是確定對于第N中間層幀組不存在鏡頭變化可能性,則確定第N中間層幀組是否是第一至第M中間層幀組的最后一個;和(a18)如果確定第N中間層幀組不是第一至第M中間層幀組的最后一個,則指定第(N+1)中間層幀組(其中,(N+1)是大于1并且小于或等于M的正整數(shù)),然后返回操作(a6)。
9.根據(jù)權利要求8的方法,其中操作(a)進一步包括(a19)如果操作(a17)的結果是確定第N中間層幀組是第一到第M中間層幀組的最后一個,則確定對于第L上層幀組的第一到第M中間層幀組是否存在突變型變化幀;(a20)如果確定在第一至第M中間層幀組中不存在突變型變化幀,則檢測對于第L上層幀組是否存在漸變型變化,并且返回操作(a14),和如果在第L上層幀組的第一至第M中間層幀組中存在突變型變化,則返回操作(a14)。
10.根據(jù)權利要求3的方法,其中的操作(a2)包括操作(a100)對于位于第L上層幀組兩端的第二參考幀計算色彩柱狀圖的第一差別特征值;(a102)比較第一差別特征值與預先確定的第一閾值;(a104)如果計算的第一差別特征值大于第一閾值,則對于第二參考幀計算歸一化的第一相關系數(shù);(a106)比較第一相關系數(shù)和預先確定的第二閾值;(a108)如果第一相關系數(shù)小于第二閾值,則確定對于第L上層幀組存在鏡頭變化可能性;和(a110)如果操作(a102)的結果是第一差別特征值不大于第一閾值或者如果操作(a106)的結果是第一相關系數(shù)不小于第二閾值,則確定對于第L上層幀組不存在鏡頭變化可能性。
11.根據(jù)權利要求10的方法,其中操作(a2)的特征在于第二參考幀是內部幀。
12.根據(jù)權利要求4的方法,其中的操作(a10)包括操作(a200)對于位于第H最高層幀組兩端的第三參考幀計算色彩柱狀圖的第二差別特征值;(a202)比較第二差別特征值與預先確定的第三閾值;(a204)如果計算的第二差別特征值大于第三閾值,則對于第三參考幀計算歸一化的第二相關系數(shù);(a206)比較第二相關系數(shù)與預先確定的第四閾值;和(a208)如果第二相關系數(shù)小于第四閾值,則確定對于第H最高層幀組不存在鏡頭變化可能性;和(a210)如果在操作(a202)中計算的第二差別特征值不大于第二閾值或者如果在操作(a206)中計算的第二相關系數(shù)不小于第四閾值,則確定對于第H最高層幀組不存在鏡頭變化可能性。
13.根據(jù)權利要求3的方法,其中的操作(a6)包括操作(a300)對于位于第N中間層幀組兩端的預先確定的幀計算色彩柱狀圖的第三差別特征值;(a302)比較第三差別特征值和預先確定的第五閾值;(a304)如果第三差別特征值大于第五閾值,則對于預先確定的幀計算歸一化的第三相關系數(shù);(a306)確定第三相關系數(shù)是否在預先確定的第六閾值和預先確定的第七閾值之間;(a308)如果第三相關系數(shù)在第六閾值和第七閾值之間,則基于運動信息確定對于第N中間層幀組是否存在鏡頭變化可能性;(a310)如果第三相關系數(shù)不在第六閾值和第七閾值之間,則確定第三相關系數(shù)是不是小于第六閾值;(a312)如果第三相關系數(shù)小于第六閾值,則基于歸一化的相關性確定對于第N中間層幀組存在鏡頭變化可能性;和(a314)如果在操作(a302)中計算的第三差別特征值不大于第五閾值或者在操作(a310)中計算的第三相關系數(shù)大于第七閾值,則確定對于第N中間層幀組不存在鏡頭變化可能性。
14.根據(jù)權利要求13的方法,其中的操作(a308)包括操作(a400)確定位于第N中間層幀組兩端的預先確定幀的第二個是否與第一參考幀中的一個相對應;(a402)如果預先確定幀中的第二個與第一參考幀中的一個相對應,則對于第一參考幀中的一個計算與前向預測幀模式的發(fā)生率和內部模式的發(fā)生率的比例相對應的第一發(fā)生率比例;(a404)比較第一發(fā)生率比例與預先確定的第八閾值;(a406)如果第一發(fā)生率比例不大于第八閾值,則確定對于第N中間層幀組不存在鏡頭變化可能性;和(a408)如果預先確定幀中的第二個與第一參考幀中的任何一個不相應或者如果第一發(fā)生率比例大于第八閾值,則基于運動信息確定對于第N中間層幀組存在鏡頭變化可能性。
15.根據(jù)權利要求14的方法,其中操作(a8)包括操作(a500)確定第N下層幀組是否包括一個雙向預測幀;(a502)基于運動信息確定第N中間層幀組與確定為具有鏡頭變化可能性的中間層幀組相應;(a504)如果基于運動信息確定第N中間層幀組與確定為具有鏡頭變化可能性的中間層幀組相對應,則基于運動信息確定對于雙向預測幀是否存在鏡頭變化可能性;(a506)如果基于運動信息確定第N中間層幀組與確定為具有鏡頭變化可能性的中間層幀組不相應,則基于運動信息確定對于雙向預測幀是否存在鏡頭變化可能性;和(a508)如果第N下層幀組不包括任何一個雙向預測幀,則確定位于第N中間層幀組兩端的預先確定幀的第二個幀與突變型鏡頭變化幀相對應。
16.根據(jù)權利要求15的方法,其中的操作(a504)包括操作(a600)在雙向預測幀中指定第一雙向預測幀;(a602)對于第一雙向預測幀計算和雙向預測模式發(fā)生率與前向預測模式和反向預測模式的發(fā)生率的比例相對應的第二發(fā)生率比例,以及和反向預測模式發(fā)生率與前向預測模式發(fā)生率的比例相對應的第三發(fā)生率比例;(a604)比較第二發(fā)生率比例與預先確定的第九閾值,以及比較第三發(fā)生率比例與預先確定的第九閾值;(a606)如果第二發(fā)生率比例大于第九閾值并且如果第三發(fā)生率比例小于第十閾值,確定第一雙向預測幀與突變型變化幀相對應;(a608)如果第二發(fā)生率比例不大于第九閾值并且如果第三發(fā)生率比例不小于第十閾值,確定第一雙向預測幀是不是雙向預測幀的最后一個;(a610)如果第一雙向預測幀是雙向預測幀的最后一個,確定位于第N中間層幀組兩端的預先確定幀的第二個是不是與突變型變化幀相對應;和(a612)如果第一雙向預測幀不是雙向預測幀的最后一個,指定除了第一雙向預測幀以外的下一個雙向預測幀,然后返回操作(a602)。
17.根據(jù)權利要求15的方法,其中的操作(a506)包括操作(a700)在雙向預測幀中指定第一雙向預測幀;(a702)對于第一雙向預測幀和位于第N中間層幀組兩端的預先確定幀中的第一個幀計算歸一化的第四相關系數(shù);(a704)比較第四相關系數(shù)與預先確定的第十一閾值;(a706)如果第四相關系數(shù)小于第十一閾值,確定第一雙向預測幀與突變型變化幀相對應;(a708)如果第四相關系數(shù)不小于第十一閾值,確定第一雙向預測幀是不是雙向預測幀的最后一個;(a710)如果第一雙向預測幀是雙向預測幀的最后一個,確定位于第N中間層幀組兩端的預先確定幀的第二個對應于突變型變化幀;和(a712)如果第一雙向預測幀不是雙向預測幀的最后一個,指定除了第一雙向預測幀以外的下一個雙向預測幀,并且隨后返回到操作(a702)。
18.根據(jù)權利要求8的方法,其中操作(a)進一步包括操作(a21)如果操作(a12)的結果是確定第H最高層幀組是第一到第G最高層幀組的最后一個,則檢測包含有在第一到第K上層幀組中具有鏡頭變化可能性的上層幀組的第一列表,和包含有與視頻鏡頭的突然變化相對應的突變型變化幀的第二列表;(a22)通過使用第一列表和第二列表檢測是否存在與視頻鏡頭的平滑變化相應的漸變型變化幀,和通過使用在操作(b)中檢測的第一和第二列表以及在操作(c)中的檢測結果來產生一個視頻鏡頭變化列表。
19.根據(jù)權利要求1的方法,其中的操作(a)的特征在于第一到第K上層幀組是包括有內部幀、單向預測幀、和雙向預測幀的圖片組。
20.一種用于檢測運動圖像的視頻鏡頭變化的設備,該設備包括鏡頭變化檢測單元,用于對于通過組合運動圖像的視頻幀組成的第一至第K(此處,K是大于1的正整數(shù))上層幀組、通過組合第一至第K上層幀組中的第L(此處,L是大于1并小于或等于K的正整數(shù))上層幀組中的視頻幀組成的第一至第M(此處,M是大于1的正整數(shù))中間層幀組、以及在第一至第M中間層幀組的第N中間層幀組中的第N(此處,N是大于1并且小于或等于M的正整數(shù))下層幀組,檢測視頻鏡頭變化;和鏡頭變化列表產生單元,其產生所檢測的視頻鏡頭變化列表。
21.根據(jù)權利要求20的設備,其中鏡頭變化檢測單元包括用于指定第L上層幀組的上層幀組指定單元;檢測對于第L上層幀組的鏡頭變化可能性的第一鏡頭變化可能性檢測單元;參考幀感測單元,用于感測在第L上層幀組中是否包括一個或多個將第L上層幀組分割為第一至第M中間層幀的第一參考幀;用于指定第N中間層幀組的中間層幀組指定單元;檢測對于第N中間層幀組的鏡頭變化可能性的第二鏡頭變化可能性檢測單元;檢測對于第N下層幀組是否存在突變型變化的突變型變化檢測單元。
22.根據(jù)權利要求21的設備,其中的鏡頭變化檢測單元的特征在于第一參考幀是前向預測幀。
23.根據(jù)權利要求22的設備,其中的鏡頭變化檢測單元還包括最高層幀組指定單元,用于在通過將第一至第K上層幀組組合成預定數(shù)目的組所構成的第一至第G最高層幀組中指定第H最高層幀組(H是大于1并且小于或等于G的正整數(shù),G是大于1的正整數(shù));對于第H最高層幀組檢測鏡頭變化可能性的第三鏡頭變化可能性檢測單元;末端最高層幀組感測單元,用于感測第H最高層幀組是不是運動圖像的第一到第G最高層幀組的最后一個。
24.根據(jù)權利要求23的設備,其中的鏡頭變化檢測單元還包括末端上層幀組感測單元,用于感測第L上層幀組是不是運動圖像的第一至第K上層幀組的最后一個。
25.根據(jù)權利要求24的設備,其中的鏡頭變化檢測單元還包括第一突變型變化幀確定單元,響應于來自參考幀感測單元的感測結果,將位于第L上層幀組兩端的第二參考幀的第二個確定為與視頻鏡頭的突然變化相對應的突變型變化幀。
26.根據(jù)權利要求25的設備,其中的鏡頭變化檢測單元還包括末端中間層幀組感測單元,用于感測第N中間層幀組是不是運動圖像的第一到第M中間層幀組的最后一個。
27.根據(jù)權利要求26的設備,其中的鏡頭變化檢測單元還包括突變型變化感測單元,用于對于第L上層幀組中的第一至第M中間層幀組感測是否存在突變型變化;和漸變型變化檢測單元,如果確定對于第一至第M中間層幀組不存在突變型變化,則該檢測單元用于檢測在第L上層幀組中是否存在漸變型變化。
28.根據(jù)權利要求22的設備,其中的第一鏡頭變化可能性檢測單元包括第一差別特征值計算單元,用于對于位于第L上層幀組兩端的第二參考幀計算色彩柱狀圖的第一差別特征值;第一比較單元,用于比較第一差別特征值與預先確定的第一閾值;第一相關系數(shù)單元,用于對于第二參考幀計算歸一化的第一相關系數(shù);第二比較單元,用于比較第一相關系數(shù)和預先確定的第二閾值;第一鏡頭變化可能性確定單元,用于對于第L上層幀組確定鏡頭變化可能性。
29.根據(jù)權利要求28的設備,其中的第一鏡頭變化可能性檢測單元的特征在于第二參考幀是內部幀。
30.根據(jù)權利要求23的設備,其中的第三鏡頭變化可能性檢測單元包括第二差別特征值計算單元,用于對于位于第H最高層幀組兩端的第三參考幀計算色彩柱狀圖的第二差別特征值;第三比較單元,用于比較第二差別特征值與預先確定的第三閾值;第二相關系數(shù)計算單元,用于對于第三參考幀計算歸一化的第二相關系數(shù);第四比較單元,用于比較第二相關系數(shù)與預先確定的第四閾值;和第二鏡頭變化可能性確定單元,用于確定對于第H最高層幀組是否存在鏡頭變化可能性。
31.根據(jù)權利要求22的設備,其中的第二鏡頭變化可能性檢測單元包括第三差別特征值計算單元,用于對于位于第N中間層幀組兩端的預先確定幀計算色彩柱狀圖的第三差別特征值;第五比較單元,用于比較第三差別特征值和預先確定的第五閾值;第三相關系數(shù)計算單元,用于對于預先確定幀計算歸一化的第三相關系數(shù);第六比較單元,基于預先確定的第六閾值和第七閾值執(zhí)行用于確定第三相關系數(shù)屬于哪里的比較;第四鏡頭變化可能性檢測單元,基于運動信息檢測對于第N中間層幀組是否存在鏡頭變化可能性;第三鏡頭變化可能性確定單元,基于歸一化的相關性確定對于第N中間層幀組存在鏡頭變化可能性或不存在鏡頭變化可能性。
32.根據(jù)權利要求31的設備,其中的第四鏡頭變化可能性檢測單元包括第一感測單元,用于感測位于第N中間層幀組兩端的預先確定幀的第二個是否與第一參考幀中的一個相對應;第一發(fā)生率比例計算單元,用于對于所述第一參考幀中的一個計算與前向預測幀模式的發(fā)生率和內部模式的發(fā)生率的比例相對應的第一發(fā)生率比例;第七比較單元,用于比較第一發(fā)生率比例與預先確定的第八閾值;第四鏡頭變化可能性確定單元,用于確定對于第N中間層幀組是否存在鏡頭變化可能性。
33.根據(jù)權利要求32的設備,其中的突變型變化檢測單元包括第二感測單元,用于感測在第N下層幀組中是否存在雙向預測幀;第三感測單元,用于感測第N中間層幀組是否與基于運動信息被確定為存在鏡頭變化可能性的中間層幀組相對應;和第二突變型變化幀確定單元,用于基于運動信息或歸一化的相關系數(shù)確定雙向預測幀與突變型變化幀相對應,或確定位于第N中間層幀組兩端的預先確定幀的第二個與突變型變化幀相對應。
34.根據(jù)權利要求33的設備,其中的第二突變型變化幀確定單元包括第一雙向預測幀指定單元,用于在雙向預測幀中指定第一雙向預測幀;第二和第三發(fā)生率比例計算單元,用于計算和雙向預測模式發(fā)生率與前向預測模式和反向預測模式發(fā)生率的比例相對應的第二發(fā)生率比例,以及和反向預測模式發(fā)生率與前向預測模式發(fā)生率的比例相對應的第三發(fā)生率比例;第八比較單元,用于比較第二發(fā)生率比例與預先確定的第九閾值以及比較第三發(fā)生率比例與預先確定的第十閾值;第一確定單元,如果第二發(fā)生率比例大于第九閾值并且如果第三發(fā)生率比例小于第十閾值,則確定第一雙向預測幀與突變型變化幀相應,或者如果第一雙向預測幀是雙向預測幀的最后一個,則確定位于第N中間層幀組兩端的預先確定幀的第二個幀與突變型變化幀相對應;和第一末端幀感測單元,如果第二發(fā)生率比例系數(shù)不大于第九閾值或如果第三發(fā)生率比例不小于第十閾值,則感測第一雙向預測幀是否與雙向預測幀的最后一個相對應。
35.根據(jù)權利要求33的設備,其中的第二突變型變化幀確定單元包括第二雙向預測幀指定單元,用于在雙向預測幀中指定第一雙向預測幀;第四相關系數(shù)計算單元,用于對于位于第N中間層幀組兩端的雙向預測幀的第一個幀和第一雙向預測幀計算歸一化的第四相關系數(shù);第九比較單元,用于比較第四相關系數(shù)與預先確定的第十一閾值;第二確定單元,如果第四相關系數(shù)小于第十一閾值,則確定第一雙向預測幀與突變型變化幀相對應,或者如果第一雙向預測幀是雙向預測幀的最后一個,則確定位于第N中間層幀組兩端的預先確定幀的第二個與突變型變化幀相對應;和第二末端幀感測單元,如果第四相關系數(shù)不小于第十一閾值,則感測第一雙向預測幀是不是雙向預測幀的最后一個。
36.根據(jù)權利要求26的設備,還包括第一和第二列表檢測單元,用于檢測包含有第一到第K上層幀組中具有鏡頭變化可能性的上層幀組的第一列表,和包含經(jīng)歷視頻鏡頭的突然變化的突變型變化幀的第二列表;和漸變型變化檢測單元,用于檢測是否存在與運動圖像中的視頻鏡頭的平滑變化相對應的漸變型變化,和通過使用由第一和第二列表檢測單元檢測的第一和第二列表以及在漸變型變化檢測單元中的檢測結果來產生視頻鏡頭變化列表。
全文摘要
一種用于檢測運動圖像中的視頻鏡頭變化的方法和設備。該方法包括a)對于組合運動圖像的視頻幀組成的第一至第K上層幀組、組合第一至第K上層幀組的第L上層幀組中的視頻幀組成的第一至第M中間層幀組、在第一至第M中間層幀組的第N中間層幀組中的第N下層幀組,檢測是否存在視頻鏡頭變化(K和M是大于1的正整數(shù),L是大于1且小于K的正整數(shù),N是大于1且小于M的正整數(shù));b)使用操作a)的結果產生視頻鏡頭變化列表。由于區(qū)別地分級處理運動圖像的壓縮流數(shù)據(jù),可以較快地檢測視頻鏡頭變化,由于將歸一化的相關系數(shù)和基于色彩分布的差別特征值用作檢測特征值,可能防止亮度變化引起的誤差,并對于相似性色彩分布有效地檢測鏡頭變化。
文檔編號G11B27/30GK1738433SQ200510109840
公開日2006年2月22日 申請日期2005年3月4日 優(yōu)先權日2004年3月5日
發(fā)明者文永秀, 金智淵 申請人:三星電子株式會社