專利名稱:使用分級(jí)圖像塊的對(duì)稱信息的視頻識(shí)別系統(tǒng)和方法
技術(shù)領(lǐng)域:
以下公開(kāi)涉及一種視頻識(shí)別系統(tǒng)和方法,并特別涉及一種使用分級(jí)圖像塊的對(duì)稱 信息的視頻識(shí)別系統(tǒng)和方法。
背景技術(shù):
終端的多樣化、大容量存儲(chǔ)介質(zhì)的實(shí)現(xiàn)以及高速通信環(huán)境使得數(shù)字化內(nèi)容易于被 播放,且被快速傳輸和共享。此外,由于數(shù)字化的特點(diǎn),已很容易傳輸和共享具有與原始內(nèi) 容相同品質(zhì)的違法內(nèi)容,因此版權(quán)的侵犯已經(jīng)增長(zhǎng)。因此,進(jìn)行版權(quán)保護(hù)以防止大容量和高品質(zhì)視頻內(nèi)容的非法共享的需要正在增 加。對(duì)于版權(quán)保護(hù),對(duì)視頻監(jiān)控和過(guò)濾系統(tǒng)的需求已經(jīng)增加。這種視頻監(jiān)控和過(guò)濾系統(tǒng)從 需要版權(quán)保護(hù)的原始視頻中提取獨(dú)特的視頻特征信息(也稱作“內(nèi)容DNA”),將該特征信息 存儲(chǔ)在數(shù)據(jù)庫(kù)(DB)中,當(dāng)傳輸或共享視頻內(nèi)容時(shí)從視頻內(nèi)容中提取視頻特征信息,將所提 取的信息與存儲(chǔ)于DB中的信息進(jìn)行比較,并基于比較結(jié)果執(zhí)行監(jiān)控和過(guò)濾。對(duì)于這種視頻監(jiān)控和過(guò)濾系統(tǒng),重要的是提取對(duì)在傳輸或共享視頻時(shí)可能發(fā)生的 壓縮、大小轉(zhuǎn)換、幀速率轉(zhuǎn)換等操作魯棒(robust)的視頻特征。特別地,近來(lái)存在處理如下 內(nèi)容的需要,即由于作為視頻播放器的選項(xiàng)而支持以90°旋轉(zhuǎn)或反向的方式進(jìn)行轉(zhuǎn)換的內(nèi) 容。在這種背景下,已進(jìn)行了許多對(duì)視頻識(shí)別的研究,并已經(jīng)提出了如下的現(xiàn)有技術(shù)。題目為“運(yùn)動(dòng)圖像搜索系統(tǒng)和方法”(“moving image search system and method")的韓國(guó)專利No. 10-0644016提出了一種使用其中在運(yùn)動(dòng)圖像中發(fā)生場(chǎng)景(或鏡 頭(shot))改變的圖像部分、以及圖像的注釋、顏色、形狀和紋理信息來(lái)搜索視頻的系統(tǒng)。 但是,為了將該系統(tǒng)應(yīng)用到過(guò)濾中,需要進(jìn)行分析和注解視頻的操作,并因此對(duì)于大容量視 頻而言要花費(fèi)很長(zhǎng)時(shí)間來(lái)配置DB。此外,很難保證注釋的客觀性。另外,由于場(chǎng)景改變部分 的圖像可能由于幀速率轉(zhuǎn)換等因素而易于發(fā)生變化,所以搜索的可靠性可能惡化。題目為“使用場(chǎng)景改變長(zhǎng)度的數(shù)字視頻識(shí)別系統(tǒng)和方法”(“digital video identification system and method using scene change length,,)的韓國(guó)專利 No. 10-0729660提出了一種用于檢測(cè)視頻信號(hào)的場(chǎng)景改變以及利用場(chǎng)景改變間的長(zhǎng)度來(lái)識(shí) 別視頻的方案。當(dāng)基于場(chǎng)景改變來(lái)識(shí)別視頻時(shí),場(chǎng)景改變數(shù)量根據(jù)待搜索視頻為非常大或 非常小,并因而當(dāng)配置或搜索DB時(shí)可能出現(xiàn)問(wèn)題。Job Oosteven、Ton Kalker和Japp Haitsma的題目為“用于視頻指紋識(shí)別的 特征提取禾口數(shù)據(jù)庫(kù)策略(Feature Extraction and a Database Strategy for VideoFingerprinting)(Proceeding of International Conference on Recent Advances in Visual Information Systems, 2002),,的論文提出了一種基于圖像塊的亮度值的視頻識(shí)別 方法。在這篇論文中,獲得圖像塊的平均亮度值,使用亮度值之間的時(shí)間和空間差異來(lái)提取 特征。在這種情況下,因?yàn)樘卣鞅欢M(jìn)制化,所以可提高搜索效率。但是,因?yàn)槭褂昧司哂?統(tǒng)一尺寸的連續(xù)塊的差異,所以不可能識(shí)別旋轉(zhuǎn)的、反轉(zhuǎn)的以及失真的圖像,在涉及大容量 DB應(yīng)用、搜索時(shí)間等的效率上出現(xiàn)問(wèn)題。在需要低運(yùn)算負(fù)荷的同時(shí),用于監(jiān)控和過(guò)濾系統(tǒng)的視頻識(shí)別技術(shù)對(duì)于當(dāng)傳輸或共 享視頻時(shí)發(fā)生的大小轉(zhuǎn)換、壓縮、幀速率變化、旋轉(zhuǎn)、反轉(zhuǎn)等操作必須是魯棒的。此外,特征 不能依賴于視頻的基于風(fēng)格的特點(diǎn)(genre-based characteristics)。例如,在動(dòng)作片和劇 情片間不能存在識(shí)別率上的差異,其中動(dòng)作片中有大量的運(yùn)動(dòng)和場(chǎng)景改變發(fā)生,而劇情片 中只有相對(duì)少量的場(chǎng)景改變或運(yùn)動(dòng)發(fā)生。
發(fā)明內(nèi)容
相應(yīng)地,考慮到現(xiàn)有技術(shù)中出現(xiàn)的上述問(wèn)題而做出本發(fā)明,且本發(fā)明目的是提供 一種視頻識(shí)別系統(tǒng)和方法,該系統(tǒng)和方法在以低運(yùn)算負(fù)荷來(lái)提取視頻特征的同時(shí),對(duì)于在 傳輸或共享視頻時(shí)可能出現(xiàn)的各種失真是魯棒的,即對(duì)于歸因于大小轉(zhuǎn)換、壓縮、幀速率轉(zhuǎn) 換、旋轉(zhuǎn)和反轉(zhuǎn)的失真是魯棒的。為了實(shí)現(xiàn)上述目的,本發(fā)明提供一種視頻識(shí)別系統(tǒng),包括特征和元信息數(shù)據(jù)庫(kù) (DB)單元,用于存儲(chǔ)從多個(gè)視頻剪輯和多條視頻信息中提取的、并且是視頻識(shí)別所需要的 特征和視頻元信息;特征提取單元,用于從輸入視頻剪輯中提取特征;數(shù)據(jù)庫(kù)搜索單元,用 于使用所提取特征來(lái)搜索特征和元信息數(shù)據(jù)庫(kù);以及特征匹配單元,用于將所提取特征與 所述特征和元信息數(shù)據(jù)庫(kù)的搜索結(jié)果相匹配;其中特征提取單元包括幀速率轉(zhuǎn)換單元, 用于將輸入視頻剪輯的視頻信號(hào)的幀速率轉(zhuǎn)換成一預(yù)設(shè)值;灰度級(jí)轉(zhuǎn)換單元,用于對(duì)幀速 率已被轉(zhuǎn)換的視頻信號(hào)執(zhí)行灰度級(jí)轉(zhuǎn)換;幀大小規(guī)格化單元,用于將已執(zhí)行灰度級(jí)轉(zhuǎn)換的 視頻信號(hào)的幀大小規(guī)格化為預(yù)設(shè)大??;以及分塊特征提取單元,用于將視頻分割為分級(jí)塊, 從各個(gè)塊提取對(duì)稱信息,并然后生成特征矢量。優(yōu)選地,分塊特征提取單元可基于具有時(shí)間或空間對(duì)稱結(jié)構(gòu)的塊圖案來(lái)將視頻分 割成分級(jí)塊。更具體地,分塊特征提取單元基于被定義為具有空間對(duì)稱結(jié)構(gòu)、同時(shí)在連續(xù)幀 中具有時(shí)間分級(jí)結(jié)構(gòu)、同時(shí)在時(shí)間上不同的幀中具有時(shí)間分級(jí)結(jié)構(gòu)的時(shí)間-空間分級(jí)塊圖 案,來(lái)將視頻分割為分級(jí)塊。分塊特征提取單元可基于塊圖案來(lái)生成包括N維對(duì)稱信息特 征值的特征矢量。優(yōu)選地,數(shù)據(jù)庫(kù)搜索單元可通過(guò)改變N維對(duì)稱信息特征值的位置值、或者通過(guò)反 轉(zhuǎn)特征值來(lái)搜索特征和元信息數(shù)據(jù)庫(kù),以確定因正交旋轉(zhuǎn)或水平/垂直反轉(zhuǎn)引起的失真 視頻,并且可以僅使用N維對(duì)稱信息特征值的較上層比特來(lái)初步地搜索特征和元信息數(shù)據(jù) 庫(kù),并其次使用N維對(duì)稱信息特征值的剩余比特來(lái)僅搜索初步搜索結(jié)果。為了實(shí)現(xiàn)上述目的,本發(fā)明提供一種從視頻中提取特征的方法,包括通過(guò)將輸入 視頻信號(hào)的幀速率轉(zhuǎn)換為預(yù)設(shè)值來(lái)執(zhí)行幀速率轉(zhuǎn)換;對(duì)幀速率已被轉(zhuǎn)換的視頻信號(hào)執(zhí)行灰 度級(jí)轉(zhuǎn)換;通過(guò)將已執(zhí)行灰度級(jí)轉(zhuǎn)換的視頻信號(hào)的幀大小規(guī)格化為指定大小來(lái)執(zhí)行幀大小 規(guī)格化;以及通過(guò)將視頻分割為分級(jí)塊、通過(guò)從各個(gè)塊中提取對(duì)稱信息、以及通過(guò)生成特征矢量來(lái)執(zhí)行分塊特征提取。此外,本發(fā)明提供一種視頻識(shí)別方法,包括通過(guò)將輸入視頻信號(hào)的幀速率轉(zhuǎn)換為 預(yù)設(shè)值來(lái)執(zhí)行幀速率轉(zhuǎn)換;對(duì)幀速率已被轉(zhuǎn)換的視頻信號(hào)執(zhí)行灰度級(jí)轉(zhuǎn)換;通過(guò)將已執(zhí)行 灰度級(jí)轉(zhuǎn)換的視頻信號(hào)的幀大小規(guī)格化為指定大小來(lái)執(zhí)行幀大小規(guī)格化;通過(guò)將視頻分割 為分級(jí)塊、從各個(gè)塊中提取對(duì)稱信息、以及生成特征矢量來(lái)執(zhí)行分塊特征提??;以及通過(guò)搜 索已預(yù)先使用特征矢量配置的特征數(shù)據(jù)庫(kù)(DB)、并且將特征矢量和特征數(shù)據(jù)庫(kù)的搜索結(jié)果 進(jìn)行匹配,來(lái)執(zhí)行特征匹配。根據(jù)下面的詳細(xì)說(shuō)明書、附圖、權(quán)利要求書,其他特征和方面將變明顯。
圖1是示出了根據(jù)本發(fā)明實(shí)施例的使用分級(jí)圖像塊的對(duì)稱信息的視頻識(shí)別系統(tǒng) 的構(gòu)造的框圖。圖2是示出了根據(jù)本發(fā)明實(shí)施例的視頻識(shí)別系統(tǒng)的特征提取單元的構(gòu)造的框圖。圖3是示出了由圖2的特征提取單元執(zhí)行的特征提取過(guò)程的示例的圖。圖4a和圖4b是分別示出了具有時(shí)間_空間分級(jí)結(jié)構(gòu)的圖像塊的示例的圖。圖5是示出了基于圖4a和圖4b中的塊圖案而提取的N維特征值的示例的圖。圖6是示出了用于計(jì)算相似度的比特操作的示例的圖。
具體實(shí)施例方式在下文中,將參照附圖詳細(xì)描述示例性實(shí)施例。貫穿附圖和詳細(xì)描述,除非另外描 述,相同的附圖標(biāo)記將被理解為指代相同的元件、特征和結(jié)構(gòu)。為清楚、說(shuō)明和方便起見(jiàn),這 些元件的相對(duì)尺寸和敘述可能被夸大。下述詳細(xì)描述用來(lái)幫助讀者獲得對(duì)此處描述的方 法、設(shè)備和/或系統(tǒng)的全面理解。因而,此處描述的方法、設(shè)備和/或系統(tǒng)的各種變化、修改 和等效物將是本領(lǐng)域普通技術(shù)人員所能想到的。而且,為了進(jìn)一步的清楚和簡(jiǎn)要,公知的功 能和結(jié)構(gòu)的描述可能被省略?!鞍?include) ”、“包含(comprise) ”、“包括(including) ”、 或“包含(comprising) ”的含義指定性質(zhì)、區(qū)域、固定編號(hào)、步驟、工藝、元件和/或成分,但 并不排除其他性質(zhì)、區(qū)域、固定編號(hào)、步驟、工藝、元件和/或成分。在下文中,將參照附圖詳細(xì)描述示例性實(shí)施例。根據(jù)本發(fā)明,通過(guò)使用分級(jí)圖像塊的對(duì)稱信息從視頻信號(hào)中提取內(nèi)容的識(shí)別信息 (即,內(nèi)容的特征),來(lái)識(shí)別內(nèi)容。對(duì)于此操作,從視頻信號(hào)的任意分級(jí)塊中獲取對(duì)稱信息, 任意分級(jí)塊被細(xì)分為值,這些值被配置成矩陣的形式,并且矩陣的元素被用作特征值,從而 視頻被識(shí)別。圖1是示出了根據(jù)本發(fā)明實(shí)施例的使用分級(jí)圖像塊的對(duì)稱信息的視頻識(shí)別系統(tǒng) 的構(gòu)造的框圖。如圖1所示,根據(jù)本發(fā)明實(shí)施例的使用分級(jí)圖像塊的對(duì)稱信息的視頻識(shí)別系統(tǒng) 100包括特征和元信息數(shù)據(jù)庫(kù)(DB) 110、特征提取單元120、DB搜索單元130、以及特征匹配 單元140。通過(guò)使用多個(gè)視頻剪輯和多片視頻信息來(lái)提取用于視頻識(shí)別的特征(內(nèi)容DNA) 和視頻元信息,來(lái)預(yù)先配置特征和元信息DB 110。
特征提取單元120是用于提取期望被識(shí)別的視頻剪輯的特征的組件,并且之后將 會(huì)描述其詳細(xì)構(gòu)造和功能。DB搜索單元130使用所提取特征來(lái)搜索特征和元信息DB 110, 而特征匹配單元140將所提取特征和DB的搜索結(jié)果相匹配。通過(guò)此方式,可獲得關(guān)于輸入 視頻剪輯的信息。在根據(jù)本發(fā)明實(shí)施例的使用分級(jí)圖像塊的對(duì)稱信息的視頻識(shí)別系統(tǒng)中,使用基于 分級(jí)圖像塊的對(duì)稱信息的特征作為視頻的特征值。用于提取這些特征的特征提取單元的構(gòu) 造示出在圖2中。圖3圖示了由特征提取單元執(zhí)行的特征提取過(guò)程的示例。如圖2所示,根據(jù)本發(fā)明的視頻識(shí)別系統(tǒng)100中的特征提取單元120包括幀速率 轉(zhuǎn)換單元121、灰度級(jí)轉(zhuǎn)換單元123、幀大小規(guī)格化單元125、以及分塊(block-wise)特征提 取單元127。如圖3所示,當(dāng)輸入包含多幀的視頻剪輯320時(shí),幀速率轉(zhuǎn)換單元121將輸入視頻 剪輯的視頻信號(hào)幀速率轉(zhuǎn)換成一預(yù)設(shè)值,并從而使視頻信號(hào)對(duì)于可能發(fā)生在時(shí)間軸上的轉(zhuǎn) 換是魯棒的。例如,不管輸入視頻信號(hào)的幀速率如何,幀速率轉(zhuǎn)換單元121都執(zhí)行將輸入視 頻信號(hào)的幀速率轉(zhuǎn)換為預(yù)設(shè)的同一幀速率的轉(zhuǎn)換操作。作為轉(zhuǎn)換的結(jié)果,生成了具有預(yù)設(shè) 的同一幀速率的視頻信號(hào)321。由灰度級(jí)轉(zhuǎn)換單元123對(duì)視頻信號(hào)執(zhí)行灰度級(jí)轉(zhuǎn)換。灰度級(jí)轉(zhuǎn)換單元123執(zhí)行用 于將視頻信號(hào)轉(zhuǎn)換為灰度級(jí)圖像的過(guò)程,從而只有視頻信號(hào)的亮度信息可被使用,而視頻 信號(hào)的顏色信息可被忽略。作為轉(zhuǎn)換的結(jié)果,生成了灰度級(jí)視頻信號(hào)323。接下來(lái),幀大小規(guī)格化單元125將視頻信號(hào)的幀大小規(guī)格化為預(yù)設(shè)大小,以使得 該視頻對(duì)于大小轉(zhuǎn)換是魯棒的。因此,生成了其幀大小已被規(guī)格化為預(yù)設(shè)大小的視頻信號(hào) 324。最后,分塊特征提取單元127分割幀以使得視頻被劃分為分級(jí)塊325,從各個(gè)塊中 提取對(duì)稱信息,并之后生成特征矢量。每個(gè)視頻的圖像塊可由沿時(shí)間軸或沿空間任意位置的對(duì)稱結(jié)構(gòu)所定義。具有這種 對(duì)稱結(jié)構(gòu)的圖像塊的示例被示出在圖4a和圖4b中。圖4a圖示了時(shí)間分級(jí)結(jié)構(gòu),而圖4b 圖示了空間分級(jí)結(jié)構(gòu)。后面將描述這些塊的結(jié)構(gòu)。從如圖所示構(gòu)造的四個(gè)塊中獲得對(duì)稱信息。在這個(gè)情況中,如圖4b所示,可以選 擇具有對(duì)稱結(jié)構(gòu)的四個(gè)塊以得到空間分級(jí)結(jié)構(gòu),或者通過(guò)將圖4a中的時(shí)間分級(jí)結(jié)構(gòu)應(yīng)用 到空間分級(jí)結(jié)構(gòu)上而得到時(shí)間_空間(temporal-spatial)分級(jí)結(jié)構(gòu)。當(dāng)具有時(shí)間_空間 分級(jí)結(jié)構(gòu)的塊被選擇時(shí),圖4a中的一個(gè)或多個(gè)時(shí)間分級(jí)結(jié)構(gòu)可被應(yīng)用到空間分級(jí)結(jié)構(gòu)中。下面描述用于提取四個(gè)塊的對(duì)稱信息的過(guò)程。首先,當(dāng)存在如等式(1)所示的 2X2矩陣A時(shí),可通過(guò)如下等式⑵來(lái)獲得矩陣A的對(duì)稱信息。
權(quán)利要求
1.一種視頻識(shí)別系統(tǒng),包括特征和元信息數(shù)據(jù)庫(kù)(DB)單元,用于存儲(chǔ)從多個(gè)視頻剪輯和多條視頻信息中提取的、 并且是視頻識(shí)別所需要的特征和視頻元信息兩者; 特征提取單元,用于從輸入視頻剪輯中提取特征; 數(shù)據(jù)庫(kù)搜索單元,用于使用所提取特征來(lái)搜索特征和元信息數(shù)據(jù)庫(kù)以及 特征匹配單元,用于將所提取特征與所述特征和元信息數(shù)據(jù)庫(kù)的搜索結(jié)果相匹配; 其中特征提取單元包括幀速率轉(zhuǎn)換單元,用于將輸入視頻剪輯的視頻信號(hào)的幀速率轉(zhuǎn)換成一預(yù)設(shè)值; 灰度級(jí)轉(zhuǎn)換單元,用于對(duì)幀速率已被轉(zhuǎn)換的視頻信號(hào)執(zhí)行灰度級(jí)轉(zhuǎn)換; 幀大小規(guī)格化單元,用于將已執(zhí)行灰度級(jí)轉(zhuǎn)換的視頻信號(hào)的幀大小規(guī)格化為預(yù)設(shè)大 ?。灰约胺謮K特征提取單元,用于將視頻分割為分級(jí)塊,從各個(gè)塊提取對(duì)稱信息,并然后生成特征矢量。
2.根據(jù)權(quán)利要求1所述的視頻識(shí)別系統(tǒng),其中所述分塊特征提取單元基于具有空間對(duì) 稱結(jié)構(gòu)的塊圖案來(lái)將視頻分割成分級(jí)塊。
3.根據(jù)權(quán)利要求2所述的視頻識(shí)別系統(tǒng),其中所述分塊特征提取單元基于塊圖案來(lái)生 成包括N維對(duì)稱信息特征值的特征矢量。
4.根據(jù)權(quán)利要求3所述的視頻識(shí)別系統(tǒng),其中所述數(shù)據(jù)庫(kù)搜索單元通過(guò)改變N維對(duì)稱 信息特征值的位置值、或者通過(guò)反轉(zhuǎn)特征值來(lái)搜索特征和元信息數(shù)據(jù)庫(kù),以確定因正交旋 轉(zhuǎn)或水平/垂直反轉(zhuǎn)引起的失真視頻。
5.根據(jù)權(quán)利要求3所述的視頻識(shí)別系統(tǒng),其中所述數(shù)據(jù)庫(kù)搜索單元僅使用N維對(duì)稱信 息特征值的較上層比特來(lái)初步地搜索特征和元信息數(shù)據(jù)庫(kù),并其次使用N維對(duì)稱信息特征 值的剩余比特來(lái)僅搜索初步搜索結(jié)果。
6.根據(jù)權(quán)利要求1所述的視頻識(shí)別系統(tǒng),其中所述分塊特征提取單元基于具有空間對(duì) 稱結(jié)構(gòu)同時(shí)在時(shí)間上不同的幀中具有時(shí)間分級(jí)結(jié)構(gòu)的塊圖案,來(lái)將視頻分割為分級(jí)塊。
7.根據(jù)權(quán)利要求6所述的視頻識(shí)別系統(tǒng),其中所述分塊特征提取單元基于塊圖案來(lái)生 成包括N維對(duì)稱信息特征值的特征矢量。
8.根據(jù)權(quán)利要求7所述的視頻識(shí)別系統(tǒng),其中所述數(shù)據(jù)庫(kù)搜索單元通過(guò)改變N維對(duì)稱 信息特征值的位置值或者通過(guò)反轉(zhuǎn)特征值來(lái)搜索特征和元信息數(shù)據(jù)庫(kù),用以確定因正交旋 轉(zhuǎn)或水平/垂直反轉(zhuǎn)引起的失真視頻。
9.根據(jù)權(quán)利要求7所述的視頻識(shí)別系統(tǒng),其中所述數(shù)據(jù)庫(kù)搜索單元僅使用N維對(duì)稱信 息特征值的較上層比特來(lái)初步地搜索特征和元信息數(shù)據(jù)庫(kù),并其次使用N維對(duì)稱信息特征 值的剩余比特而僅搜索初步搜索結(jié)果。
10.一種從視頻中提取特征的方法,包括通過(guò)將輸入視頻信號(hào)的幀速率轉(zhuǎn)換為預(yù)設(shè)值來(lái)執(zhí)行幀速率轉(zhuǎn)換; 對(duì)幀速率已被轉(zhuǎn)換的視頻信號(hào)執(zhí)行灰度級(jí)轉(zhuǎn)換;通過(guò)將已執(zhí)行灰度級(jí)轉(zhuǎn)換的視頻信號(hào)的幀大小規(guī)格化為指定大小來(lái)執(zhí)行幀大小規(guī)格 化;以及通過(guò)將視頻分割為分級(jí)塊、通過(guò)從各個(gè)塊中提取對(duì)稱信息、以及通過(guò)生成特征矢量來(lái)執(zhí)行分塊特征提取。
11.根據(jù)權(quán)利要求10所述的方法,其中所述執(zhí)行分塊特征提取的步驟被配置為基于具 有空間對(duì)稱結(jié)構(gòu)的塊圖案來(lái)將視頻分割成分級(jí)塊。
12.根據(jù)權(quán)利要求11所述的方法,其中所述執(zhí)行分塊特征提取的步驟被配置為基于所 述塊圖案生成包括N維對(duì)稱信息特征值的特征矢量。
13.根據(jù)權(quán)利要求10所述的方法,其中所述執(zhí)行分塊特征提取的步驟被配置為基于具 有空間對(duì)稱結(jié)構(gòu)同時(shí)在時(shí)間上不同的幀中具有時(shí)間分級(jí)結(jié)構(gòu)的塊圖案來(lái)將視頻分割成分 級(jí)塊。
14.根據(jù)權(quán)利要求13所述的方法,其中所述執(zhí)行分塊特征提取的步驟被配置為基于所 述塊圖案生成包括N維對(duì)稱信息特征值的特征矢量。
15.一種視頻識(shí)別方法,包括通過(guò)將輸入視頻信號(hào)的幀速率轉(zhuǎn)換為預(yù)設(shè)值來(lái)執(zhí)行幀速率轉(zhuǎn)換;對(duì)幀速率已被轉(zhuǎn)換的視頻信號(hào)執(zhí)行灰度級(jí)轉(zhuǎn)換;通過(guò)將已執(zhí)行灰度級(jí)轉(zhuǎn)換的視頻信號(hào)的幀大小規(guī)格化為指定大小來(lái)執(zhí)行幀大小規(guī)格化;通過(guò)將視頻分割為分級(jí)塊、從各個(gè)塊中提取對(duì)稱信息、以及生成特征矢量來(lái)執(zhí)行分塊 特征提??;以及通過(guò)搜索已預(yù)先使用特征矢量配置的特征數(shù)據(jù)庫(kù)(DB)、并且將特征矢量和特征數(shù)據(jù)庫(kù) 的搜索結(jié)果進(jìn)行匹配,來(lái)執(zhí)行特征匹配。
16.根據(jù)權(quán)利要求15所述的視頻識(shí)別方法,其中所述執(zhí)行分塊特征提取的步驟被配置 為基于具有空間對(duì)稱結(jié)構(gòu)的塊圖案將視頻分割為分級(jí)塊。
17.根據(jù)權(quán)利要求15所述的視頻識(shí)別方法,其中所述執(zhí)行分塊特征提取的步驟被配置 為基于具有空間對(duì)稱結(jié)構(gòu)同時(shí)在時(shí)間上不同的幀中具有時(shí)間分級(jí)結(jié)構(gòu)的塊圖案來(lái)將視頻 分割成分級(jí)塊。
18.根據(jù)權(quán)利要求17所述的視頻識(shí)別方法,其中所述執(zhí)行分塊特征提取的步驟被配置 為基于所述塊圖案生成包括N維對(duì)稱信息特征值的特征矢量。
19.根據(jù)權(quán)利要求18所述的視頻識(shí)別方法,其中所述執(zhí)行特征匹配的步驟被配置為 通過(guò)改變N維對(duì)稱信息特征值的位置值或者通過(guò)反轉(zhuǎn)特征值來(lái)搜索特征數(shù)據(jù)庫(kù),以確定由 正交旋轉(zhuǎn)或水平/垂直反轉(zhuǎn)引起的失真視頻。
20.根據(jù)權(quán)利要求18所述的視頻識(shí)別方法,其中所述執(zhí)行特征匹配的步驟被配置為 僅使用N維對(duì)稱信息特征值的較上層比特初步地搜索特征數(shù)據(jù)庫(kù),并其次使用N維對(duì)稱信 息特征值的剩余比特而僅搜索初步搜索結(jié)果。
全文摘要
這里公開(kāi)了一種使用分級(jí)圖像塊的對(duì)稱信息的視頻識(shí)別系統(tǒng)和方法。當(dāng)輸入視頻剪輯時(shí),視頻信號(hào)的幀速率被轉(zhuǎn)換為預(yù)設(shè)值,以使得視頻信號(hào)對(duì)于在時(shí)間軸上的轉(zhuǎn)換是魯棒的。此后,執(zhí)行灰度級(jí)轉(zhuǎn)換,以便僅使用視頻信號(hào)的亮度信息。隨后,視頻信號(hào)的幀大小被規(guī)格化為一指定大小,以使得視頻對(duì)于大小轉(zhuǎn)換也是魯棒的。幀大小已被規(guī)格化的視頻被分割為分級(jí)塊,并且從各個(gè)塊中提取對(duì)稱信息,從而生成特征矢量。分級(jí)塊可由沿時(shí)間軸或沿空間任意位置的對(duì)稱結(jié)構(gòu)來(lái)定義,以具有時(shí)間上或時(shí)間-空間上的分級(jí)結(jié)構(gòu)。
文檔編號(hào)G06K9/00GK102103686SQ201010246670
公開(kāi)日2011年6月22日 申請(qǐng)日期2010年6月30日 優(yōu)先權(quán)日2009年12月21日
發(fā)明者俞元英 申請(qǐng)人:韓國(guó)電子通信研究院