專利名稱:視頻流數(shù)據(jù)文件的處理方法及設(shè)備的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及圖像處理技術(shù)領(lǐng)域,尤其涉及視頻流數(shù)據(jù)文件的處理方法及設(shè)備。
背景技術(shù):
視頻流數(shù)據(jù)文件中所包含的視覺(jué)內(nèi)容包括顏色、紋理、形狀和運(yùn)動(dòng)信息,其中運(yùn)動(dòng)信息是視頻流數(shù)據(jù)文件區(qū)別于圖像數(shù)據(jù)所特有的內(nèi)容。基于運(yùn)動(dòng)信息的視頻檢索的優(yōu)勢(shì)就在于,它可以提供使用其他圖像特征所無(wú)法實(shí)現(xiàn)的檢索功能。 目前有學(xué)者研究了如何從視頻中提取運(yùn)動(dòng)信息,大量研究主要集中在以下兩種類型。例如, (1) IBM的QBIC (Query By Image Content,圖像檢索)系統(tǒng)將整個(gè)視頻序列中的鏡頭分為相機(jī)運(yùn)動(dòng)和目標(biāo)運(yùn)動(dòng)兩大類,在進(jìn)行檢索時(shí),用戶須指出要檢索相機(jī)運(yùn)動(dòng)類的鏡頭,還是目標(biāo)運(yùn)動(dòng)類的鏡頭,以實(shí)現(xiàn)基于內(nèi)容的檢索; (2)還有學(xué)者提出了在壓縮域上直接分析運(yùn)動(dòng)的方法,該方法不需要對(duì)視頻流數(shù)據(jù)文件進(jìn)行解壓,通過(guò)將2維直流(即DCT (Discrete CosineTransformation,離散余弦變換)中的DC(Direct Current Component,直流分量)系數(shù)圖像沿水平軸或垂直軸投影,變換成1維數(shù)據(jù),然后在這個(gè)1維數(shù)據(jù)上估算相機(jī)運(yùn)動(dòng)。 大量研究表明,以上方法(1)存在的不足在于直接在像素域上分析運(yùn)動(dòng)或通過(guò)光流方程分析運(yùn)動(dòng)都是非常耗時(shí)的過(guò)程,很難達(dá)到實(shí)時(shí)。 而方法(2)存在的不足在于僅適用于M-JPEG格式的視頻流數(shù)據(jù)文件,對(duì)于目前絕大多數(shù)視頻流數(shù)據(jù)文件來(lái)說(shuō),大多以MPEG-x、 H. 26x格式存儲(chǔ),因此該方案的應(yīng)用面顯然很窄。
發(fā)明內(nèi)容
本發(fā)明實(shí)施例提供一種視頻流數(shù)據(jù)文件中視頻場(chǎng)景運(yùn)動(dòng)強(qiáng)度的識(shí)別方法,用以提
供一種識(shí)別視頻流數(shù)據(jù)文件中視頻場(chǎng)景運(yùn)動(dòng)強(qiáng)度的方法,該方法包括 確定視頻流數(shù)據(jù)文件的前向預(yù)測(cè)幀P幀中的非運(yùn)動(dòng)補(bǔ)償宏塊的數(shù)量; 根據(jù)所述非運(yùn)動(dòng)補(bǔ)償宏塊的數(shù)量識(shí)別視頻場(chǎng)景的運(yùn)動(dòng)強(qiáng)度。 本發(fā)明實(shí)施例還提供一種視頻流數(shù)據(jù)文件中視頻流的運(yùn)動(dòng)信息提取方法,用以提供一種提取視頻流數(shù)據(jù)文件中包括運(yùn)動(dòng)強(qiáng)度的運(yùn)動(dòng)信息的方法,該方法包括
獲取視頻流數(shù)據(jù)文件中所述視頻場(chǎng)景運(yùn)動(dòng)強(qiáng)度的識(shí)別結(jié)果;
提取視頻流中包括所述識(shí)別結(jié)果的運(yùn)動(dòng)信息。 本發(fā)明實(shí)施例還提供一種視頻流數(shù)據(jù)文件的存儲(chǔ)方法,用以提供一種利用包括運(yùn)動(dòng)強(qiáng)度參數(shù)的運(yùn)動(dòng)信息來(lái)存儲(chǔ)視頻流數(shù)據(jù)文件的方法,該方法包括
獲取需保存的視頻流數(shù)據(jù)文件; 獲取該視頻流數(shù)據(jù)文件的運(yùn)動(dòng)信息,所述運(yùn)動(dòng)信息包括所述視頻場(chǎng)景運(yùn)動(dòng)強(qiáng)度的識(shí)別結(jié)果;
存儲(chǔ)視頻流數(shù)據(jù)文件,并以所述運(yùn)動(dòng)信息作為該視頻流數(shù)據(jù)文件的標(biāo)識(shí)。 本發(fā)明實(shí)施例還提供一種檢索按所述存儲(chǔ)方法存儲(chǔ)的視頻流數(shù)據(jù)文件的方法,用
以提供一種利用包括運(yùn)動(dòng)強(qiáng)度參數(shù)的運(yùn)動(dòng)信息來(lái)檢索視頻流數(shù)據(jù)文件的方法,該方法包
括 以運(yùn)動(dòng)強(qiáng)度為檢索詞進(jìn)行檢索; 反饋標(biāo)識(shí)與檢索詞匹配的視頻流數(shù)據(jù)文件,所述標(biāo)識(shí)是以視頻流數(shù)據(jù)文件的運(yùn)動(dòng)
信息作為標(biāo)識(shí)的,所述運(yùn)動(dòng)信息包括所述視頻場(chǎng)景運(yùn)動(dòng)強(qiáng)度的識(shí)別結(jié)果。 本發(fā)明實(shí)施例提供一種視頻流數(shù)據(jù)文件中視頻場(chǎng)景運(yùn)動(dòng)強(qiáng)度的識(shí)別裝置,用以提
供一種識(shí)別視頻流數(shù)據(jù)文件中視頻場(chǎng)景運(yùn)動(dòng)強(qiáng)度的方法,該裝置包括 確定模塊,用于確定視頻流數(shù)據(jù)文件的前向預(yù)測(cè)幀P幀中的非運(yùn)動(dòng)補(bǔ)償宏塊的數(shù) 識(shí)別模塊,用于根據(jù)所述非運(yùn)動(dòng)補(bǔ)償宏塊的數(shù)量識(shí)別視頻場(chǎng)景的運(yùn)動(dòng)強(qiáng)度。
本發(fā)明實(shí)施例還提供一種視頻流數(shù)據(jù)文件中視頻流的運(yùn)動(dòng)信息提取裝置,用以提 供一種提取視頻流數(shù)據(jù)文件中包括運(yùn)動(dòng)強(qiáng)度的運(yùn)動(dòng)信息的方法,該裝置包括
獲取模塊,用于獲取視頻流數(shù)據(jù)文件中所述識(shí)別模塊的識(shí)別結(jié)果;
提取模塊,用于提取視頻流中包括所述識(shí)別結(jié)果的運(yùn)動(dòng)信息。 本發(fā)明實(shí)施例還提供一種視頻流數(shù)據(jù)文件的存儲(chǔ)數(shù)據(jù)庫(kù)系統(tǒng),用以提供一種利用 包括運(yùn)動(dòng)強(qiáng)度參數(shù)的運(yùn)動(dòng)信息來(lái)存儲(chǔ)視頻流數(shù)據(jù)文件的方法,該系統(tǒng)包括
待保存文件獲取模塊,用于獲取需保存的視頻流數(shù)據(jù)文件; 運(yùn)動(dòng)信息獲取模塊,用于獲取該視頻流數(shù)據(jù)文件的運(yùn)動(dòng)信息,所述運(yùn)動(dòng)信息包括 所述識(shí)別模塊的識(shí)別結(jié)果; 存儲(chǔ)模塊,用于存儲(chǔ)視頻流數(shù)據(jù)文件,并以所述運(yùn)動(dòng)信息作為該視頻流數(shù)據(jù)文件 的標(biāo)識(shí)。 本發(fā)明實(shí)施例還提供一種檢索所述數(shù)據(jù)庫(kù)系統(tǒng)中視頻流數(shù)據(jù)文件的檢索系統(tǒng),用 以提供一種利用包括運(yùn)動(dòng)強(qiáng)度參數(shù)的運(yùn)動(dòng)信息來(lái)檢索視頻流數(shù)據(jù)文件的方法,該系統(tǒng)包 括 檢索模塊,用于以運(yùn)動(dòng)強(qiáng)度為檢索詞進(jìn)行檢索; 反饋模塊,用于反饋標(biāo)識(shí)與檢索詞匹配的視頻流數(shù)據(jù)文件,所述標(biāo)識(shí)是以視頻流
數(shù)據(jù)文件的運(yùn)動(dòng)信息作為標(biāo)識(shí)的,所述運(yùn)動(dòng)信息包括所述識(shí)別模塊的識(shí)別結(jié)果。 本發(fā)明實(shí)施例中提出了基于P幀非運(yùn)動(dòng)補(bǔ)償宏塊數(shù)量來(lái)判斷的視頻場(chǎng)景運(yùn)動(dòng)強(qiáng)
度的等級(jí)劃分,并給出了識(shí)別運(yùn)動(dòng)強(qiáng)度的技術(shù)方案。進(jìn)一步的,在提取運(yùn)動(dòng)信息中包括了對(duì)
運(yùn)動(dòng)強(qiáng)度等級(jí)的提取。更進(jìn)一步的,利用包括運(yùn)動(dòng)強(qiáng)度的運(yùn)動(dòng)信息來(lái)作為標(biāo)識(shí),構(gòu)建了視頻
流數(shù)據(jù)文件的存儲(chǔ)以及檢索的技術(shù)方案。 由于在本發(fā)明實(shí)施例中,是在壓縮域視頻直接進(jìn)行運(yùn)動(dòng)信息的檢索,因而耗時(shí)短, 特別適用于實(shí)時(shí)監(jiān)控及檢索;克服了現(xiàn)有技術(shù)中因直接在像素域上分析運(yùn)動(dòng)或通過(guò)光流方 程分析運(yùn)動(dòng)導(dǎo)致非常耗時(shí)、很難達(dá)到實(shí)時(shí)的不足。 同時(shí),由于在本發(fā)明實(shí)施例中,可對(duì)基于MPEG/H. 26X標(biāo)準(zhǔn)進(jìn)行壓縮的視頻進(jìn)行檢 索,只要是具備P幀特點(diǎn)的壓縮算法都可實(shí)施,因此可滿足目前大部分媒體管理系統(tǒng)的需 求。克服了現(xiàn)有技術(shù)僅適用于M-JPEG格式的視頻,應(yīng)用面顯然很窄的不足。
圖1為本發(fā)明實(shí)施例中視頻流數(shù)據(jù)文件中視頻場(chǎng)景運(yùn)動(dòng)強(qiáng)度的識(shí)別方法流程圖; 圖2為本發(fā)明實(shí)施例中一個(gè)圖像組的幀結(jié)構(gòu)示意圖; 圖3為本發(fā)明實(shí)施例中MPEG視頻中非運(yùn)動(dòng)補(bǔ)償宏塊分布示意圖; 圖4為本發(fā)明實(shí)施例中橄欖球比賽的視頻流數(shù)據(jù)文件中的開(kāi)始階段圖像與比賽
階段圖像比較示意圖; 圖5為本發(fā)明實(shí)施例中新聞播報(bào)的視頻流數(shù)據(jù)文件中的圖像與足球比賽的視頻
流數(shù)據(jù)文件中的圖像比較示意圖; 圖6為本發(fā)明實(shí)施例中u率折線示意圖; 圖7為本發(fā)明實(shí)施例中一個(gè)新聞播報(bào)的鏡頭; 圖8為本發(fā)明實(shí)施例中新聞播報(bào)鏡頭中每個(gè)P幀的Gu(a)值的分布情況示意圖; 圖9為本發(fā)明實(shí)施例中一個(gè)足球比賽中的鏡頭; 圖10為本發(fā)明實(shí)施例中足球比賽鏡頭中每個(gè)P幀的Gu(a)值的分布情況示意 圖; 圖11為本發(fā)明實(shí)施例中視頻流數(shù)據(jù)文件中視頻流的運(yùn)動(dòng)信息提取方法流程圖; 圖12為本發(fā)明實(shí)施例中視頻流數(shù)據(jù)文件的存儲(chǔ)方法流程圖; 圖13為本發(fā)明實(shí)施例中采集視頻流數(shù)據(jù)文件的流程圖; 圖14為本發(fā)明實(shí)施例中檢索視頻流數(shù)據(jù)文件的方法流程圖; 圖15為本發(fā)明實(shí)施例中查詢視頻流數(shù)據(jù)文件的流程圖; 圖16為本發(fā)明實(shí)施例中視頻流數(shù)據(jù)文件中視頻場(chǎng)景運(yùn)動(dòng)強(qiáng)度的識(shí)別裝置結(jié)構(gòu)示 意圖; 圖17為本發(fā)明實(shí)施例中視頻流數(shù)據(jù)文件中視頻流的運(yùn)動(dòng)信息提取裝置結(jié)構(gòu)示意 圖; 圖18為本發(fā)明實(shí)施例中視頻流數(shù)據(jù)文件的存儲(chǔ)數(shù)據(jù)庫(kù)系統(tǒng)結(jié)構(gòu)示意圖; 圖19為本發(fā)明實(shí)施例中數(shù)據(jù)庫(kù)系統(tǒng)中視頻流數(shù)據(jù)文件的檢索系統(tǒng)結(jié)構(gòu)示意圖。
具體實(shí)施例方式
本發(fā)明實(shí)施例中,首先提出一種視頻流數(shù)據(jù)文件中視頻場(chǎng)景運(yùn)動(dòng)強(qiáng)度的識(shí)別方 法,從而提出一種以運(yùn)動(dòng)強(qiáng)度為依據(jù)的視頻流的運(yùn)動(dòng)信息提取方法,并進(jìn)而以該包括了運(yùn) 動(dòng)強(qiáng)度的運(yùn)動(dòng)信息來(lái)構(gòu)建一種視頻流數(shù)據(jù)文件的存儲(chǔ)方法,以及一種檢索按該方法存儲(chǔ)的 視頻流數(shù)據(jù)文件的方法,通過(guò)以視頻場(chǎng)景的運(yùn)動(dòng)強(qiáng)度為參量解決了運(yùn)動(dòng)信息的提取、以及 相關(guān)的存儲(chǔ)和查詢,下面分別對(duì)運(yùn)動(dòng)強(qiáng)度的識(shí)別、運(yùn)動(dòng)信息的提取、視頻流數(shù)據(jù)文件的存 儲(chǔ)、檢索的具體實(shí)施方式
進(jìn)行說(shuō)明。 如圖1所示,本發(fā)明實(shí)施例中,視頻流數(shù)據(jù)文件中視頻場(chǎng)景運(yùn)動(dòng)強(qiáng)度的識(shí)別方法 流程可以包括 步驟101、確定視頻流數(shù)據(jù)文件的前向預(yù)測(cè)幀P幀中的非運(yùn)動(dòng)補(bǔ)償宏塊的數(shù)量;
步驟102、根據(jù)非運(yùn)動(dòng)補(bǔ)償宏塊的數(shù)量識(shí)別視頻場(chǎng)景的運(yùn)動(dòng)強(qiáng)度。
本實(shí)施例中,步驟101中P幀的選取,以MPEG壓縮算法為例進(jìn)行說(shuō)明。
MPEG數(shù)據(jù)結(jié)構(gòu)被定義為圖像序列(Sequence)、圖像組(GOP)、圖像(Picture)、宏 塊條(Slice)、宏塊(MB)和塊(Block)。 —個(gè)圖像組的幀結(jié)構(gòu)如圖2所示,MPEG采用了三種類型的圖像1幀(幀內(nèi)幀)、P 幀(預(yù)測(cè)幀)和B幀(雙向預(yù)測(cè)幀)。幀是成組壓縮的GOP,在每一組中,第一幀總是I幀, I幀是只使用本幀內(nèi)的信息進(jìn)行編碼的圖像,采用基于DCT的編碼技術(shù),壓縮率不高;P幀是 使用前面最靠近的I幀或P幀圖像作為參考幀進(jìn)行預(yù)測(cè)編碼的圖像,采用運(yùn)動(dòng)補(bǔ)償技術(shù),編 碼效率較高;B幀是使用一個(gè)過(guò)去的參考幀的和一個(gè)將來(lái)的參考幀進(jìn)行運(yùn)動(dòng)補(bǔ)償預(yù)測(cè)的編 碼圖像,其參考幀可以是一個(gè)I幀和P幀,或是前后兩個(gè)P幀,壓縮效率最高,但不作為預(yù)測(cè) 的參考圖像。 I幀是幀內(nèi)編碼,沒(méi)有包含視頻相關(guān)的運(yùn)動(dòng)信息。而P幀和B幀是幀間編碼,采用 基于16X 16像素的宏塊的運(yùn)動(dòng)補(bǔ)償技術(shù),P幀是前向預(yù)測(cè),B幀是雙向預(yù)測(cè),如果采用B幀, 處理起來(lái)運(yùn)算量會(huì)比較大而且會(huì)比較煩瑣。與此相反,處理P幀時(shí)就方便的多。而且在典 型的視頻流中P幀的出現(xiàn)頻率約每秒出現(xiàn)8次。這對(duì)于基于運(yùn)動(dòng)特征視頻檢索來(lái)說(shuō)是足夠 了。 基于上述理由,選取P幀為提取壓縮視頻運(yùn)動(dòng)信息的關(guān)鍵幀。本實(shí)施例是以MPEG
壓縮算法為例進(jìn)行說(shuō)明的,但是由選取P幀實(shí)施的理由可知,本發(fā)明實(shí)施時(shí),并不僅限于
MPEG系列壓縮算法處理的視頻流數(shù)據(jù)文件,而是只要圖像壓縮算法中的I幀(幀內(nèi)幀)、P
幀(預(yù)測(cè)幀)和B幀(雙向預(yù)測(cè)幀)具有MPEG壓縮算法特點(diǎn),即P幀既包含運(yùn)動(dòng)信息,且
處理相對(duì)方便,則滿足該要求的圖像壓縮算法都可以用來(lái)實(shí)施。 下面對(duì)步驟101中提取P幀中的非運(yùn)動(dòng)補(bǔ)償宏塊進(jìn)行詳細(xì)說(shuō)明。 壓縮視頻流采用了運(yùn)動(dòng)補(bǔ)償技術(shù), 一般是基于宏塊處理的。對(duì)于一個(gè)P幀來(lái)說(shuō),被
預(yù)測(cè)宏塊與參考宏塊不在幀內(nèi)的同一位置時(shí),編碼器將調(diào)用運(yùn)動(dòng)補(bǔ)償技術(shù)來(lái)進(jìn)行編碼。當(dāng)
宏塊沒(méi)有運(yùn)動(dòng)補(bǔ)償(No_MC)時(shí),稱其為非(無(wú))運(yùn)動(dòng)補(bǔ)償宏塊。 視頻流中有兩種非運(yùn)動(dòng)補(bǔ)償宏塊,一種是幀內(nèi)編碼(inter)的非運(yùn)動(dòng)補(bǔ)償宏塊, 另一種是幀間編碼(intra)的非運(yùn)動(dòng)補(bǔ)償宏塊。以典型的MPEG編碼器結(jié)構(gòu)為例,在壓縮 過(guò)的視頻基本碼流(ES)中,都會(huì)有宏塊層,里面包含了P幀及B幀的運(yùn)動(dòng)矢量(MV-Motion Vectors)。附加數(shù)據(jù)包含的信息有表明宏塊在宏塊條層中位置的宏塊地址、說(shuō)明宏塊編碼 方法及內(nèi)容的宏塊類型、宏塊量化參數(shù)、區(qū)別運(yùn)動(dòng)矢量類型及大小、表明以場(chǎng)離散余弦變換 (DCT-DiscreteCosine Transform)還是以幀DCT進(jìn)行編碼的DCT類型。通過(guò)讀取和解析宏 塊條層的包頭信息,可以建立一個(gè)判斷幀內(nèi)編碼或幀間編碼的分類器(classifier),用來(lái) 區(qū)分幀內(nèi)編碼和幀間編碼宏塊。 幀內(nèi)編碼或幀間編碼的分類器會(huì)與輸入圖片元素(象素)比較預(yù)測(cè)誤差。如果預(yù) 測(cè)的均方誤差超過(guò)了宏塊的均方值就判斷為幀內(nèi)編碼,否則就是幀間編碼。幀內(nèi)編碼和幀 間編碼的非運(yùn)動(dòng)補(bǔ)償宏塊可以分別得到。 P幀的宏塊中只包含幀間編碼的非運(yùn)動(dòng)補(bǔ)償宏塊。事實(shí)上,在特殊情況下,當(dāng)一個(gè) 宏塊和參考?jí)K匹配得很好時(shí),它將被跳過(guò),根本不進(jìn)行編碼。圖3示出了 MPEG視頻中非運(yùn) 動(dòng)補(bǔ)償宏塊的分布結(jié)構(gòu)。 下面對(duì)步驟102中對(duì)運(yùn)動(dòng)強(qiáng)度的確定進(jìn)行詳細(xì)說(shuō)明。 通過(guò)非運(yùn)動(dòng)補(bǔ)償宏塊定義可以得到,當(dāng)視頻內(nèi)容變化不明顯時(shí),大量的宏塊都與參考幀中的宏塊匹配的很好,那么P幀中的非運(yùn)動(dòng)補(bǔ)償宏塊的數(shù)量就會(huì)比較大。例如,體育 運(yùn)動(dòng)的暫停期間,一般只有一些小對(duì)象的運(yùn)動(dòng)而且作為視頻流數(shù)據(jù)文件獲取設(shè)備的攝象機(jī) 鏡頭通常會(huì)被固定,因此相應(yīng)的非運(yùn)動(dòng)補(bǔ)償宏塊的數(shù)量會(huì)很大。同理,當(dāng)視頻內(nèi)容變化很快 時(shí),很多宏塊都不能很好的和它們參考幀宏塊相匹配,因此,P幀中幀間編碼的非運(yùn)動(dòng)補(bǔ)償 宏塊數(shù)量就會(huì)很小。綜上可知,可以根據(jù)非運(yùn)動(dòng)補(bǔ)償宏塊的數(shù)量來(lái)識(shí)別視頻場(chǎng)景的運(yùn)動(dòng)強(qiáng) 度。下面對(duì)具體的識(shí)別實(shí)施方式進(jìn)行說(shuō)明。 首先定義一個(gè)關(guān)于P幀的比率a ,該值為P幀的幀間編碼的非運(yùn)動(dòng)補(bǔ)償宏塊數(shù)量 與P幀宏塊總數(shù)量的比率,可以用公式形式表示如下
—Numberof inter No一MC Macroblock
TotalNumberof FrameMacroblock 由a的定義及前述分析可以知道,比率a越高代表場(chǎng)景運(yùn)動(dòng)強(qiáng)度越小,反之,則 場(chǎng)景運(yùn)動(dòng)越大。圖4為橄欖球比賽的視頻流數(shù)據(jù)文件中的開(kāi)始階段圖像與比賽階段圖像比 較示意圖,如圖4的兩幀圖像可見(jiàn),第一幀為比賽的開(kāi)始階段,其a值比較高,為86%,而第 二幀為比賽過(guò)程中的一幀,其a值比較低,僅為5%。 圖5為新聞播報(bào)的視頻流數(shù)據(jù)文件中的圖像與足球比賽的視頻流數(shù)據(jù)文件中的 圖像比較示意圖,如圖5所示不同視頻中的兩幀圖像,第一幀為新聞播報(bào),視頻運(yùn)動(dòng)極為緩 慢,其a值比較高,為94%,而第二幀為足球比賽中的一幀,視頻運(yùn)動(dòng)很快,其a值比較低, 僅為30%左右。 通過(guò)上述分析,發(fā)明人注意到,比率a的變化規(guī)律符合場(chǎng)景運(yùn)動(dòng)強(qiáng)度的變化規(guī) 律,并且和人的感覺(jué)比較一致,因此可以此為運(yùn)動(dòng)信息的一個(gè)特征,更進(jìn)一步的,作為一個(gè) 區(qū)分值,可以用于視頻檢索,下面還有實(shí)施例會(huì)對(duì)該檢索、存儲(chǔ)的實(shí)施進(jìn)行介紹。
但是,確定場(chǎng)景運(yùn)動(dòng)強(qiáng)度的級(jí)別,較佳的方式是不直接使用比率a ,而是把比率 a進(jìn)一步量化成幾個(gè)等級(jí)。因此首先將比率a進(jìn)行u率變換為Gu(a),然后再根據(jù)比率的 u率變換結(jié)果識(shí)別視頻場(chǎng)景的運(yùn)動(dòng)強(qiáng)度。具體實(shí)施中,并不僅限于u率變換這一種方式,其 他能夠把比率a進(jìn)一步量化成幾個(gè)等級(jí)的方式都可以實(shí)施,即其目的在于使得大比率a 值有更大的量化步長(zhǎng)。貝U,比率的u率變換可以具體為
Gu(a ) = In(1+u a )/In(1+u) ,0《a《l,其中: a為P幀的幀間編碼的非運(yùn)動(dòng)補(bǔ)償宏塊數(shù)量與P幀宏塊總數(shù)量的比率,P是壓擴(kuò) 參數(shù),表示壓縮的程度。 圖6為u率折線示意圖,如圖6所示,可以直接使用Gu ( a )值來(lái)進(jìn)行級(jí)別劃分。圖 7為一個(gè)新聞播報(bào)的鏡頭,圖8為新聞播報(bào)鏡頭中每個(gè)P幀的Gu(a)值的分布情況示意圖。 可以看出新聞播報(bào)中的Gu(a )值幾乎所有的點(diǎn)都分布在大于0. 9的范圍內(nèi)。
同樣的,圖9為一個(gè)足球比賽中的鏡頭,圖10為足球比賽鏡頭中每個(gè)P幀的 Gu(a)值的分布情況示意圖,可以看出所有的點(diǎn)都分布在0.6以下,一般足球比賽的圖像 運(yùn)動(dòng)強(qiáng)度是大于新聞播報(bào)的,可見(jiàn)Gu(a)值與圖像場(chǎng)景的運(yùn)動(dòng)強(qiáng)度相關(guān),且其值越高則運(yùn) 動(dòng)強(qiáng)度越低,由Gu(a )值的產(chǎn)生也能證明這一規(guī)律。 由此可以看出,通過(guò)P幀的Gu(a)值直接劃分運(yùn)動(dòng)強(qiáng)度級(jí)別是可行的。結(jié)合 MPEG-7標(biāo)準(zhǔn),也可把場(chǎng)景的運(yùn)動(dòng)強(qiáng)度級(jí)分為五級(jí)。
8
第一級(jí),極慢,0. 9《Gu ( a )《1. 0 ;
第二級(jí),較慢,0. 8《Gu ( a )《0. 9 ;
第三級(jí),中,O. 7《Gu(a )《0. 8 ;
第四級(jí),較快,0.6《Gu(a)《0.7;
第五級(jí),很快,O. 0《Gu(a )《0. 6。 相應(yīng)的,在步驟102識(shí)別視頻場(chǎng)景的運(yùn)動(dòng)強(qiáng)度時(shí),便可以根據(jù)比率的u率變換結(jié)果識(shí)別視頻場(chǎng)景的運(yùn)動(dòng)強(qiáng)度,具體識(shí)別可以為 將0. 9《Gu ( a )《1. 0的視頻場(chǎng)景的運(yùn)動(dòng)強(qiáng)度識(shí)別為極慢;
將0. 8《Gu ( a )《0. 9的視頻場(chǎng)景的運(yùn)動(dòng)強(qiáng)度識(shí)別為較慢;
將0. 7《Gu ( a )《0. 8的視頻場(chǎng)景的運(yùn)動(dòng)強(qiáng)度識(shí)別為正常;
將0. 6《Gu ( a )《0. 7的視頻場(chǎng)景的運(yùn)動(dòng)強(qiáng)度識(shí)別為極快;
將0. 0《Gu ( a )《0. 6的視頻場(chǎng)景的運(yùn)動(dòng)強(qiáng)度識(shí)別為很快;
其中,Gu(a )為所述比率的u率變換結(jié)果。 利用上述運(yùn)動(dòng)強(qiáng)度的識(shí)別結(jié)果,實(shí)施中可以將其作為一個(gè)運(yùn)動(dòng)信息的特征值,并用以表征視頻流數(shù)據(jù)文件。基于此,本發(fā)明實(shí)施例還提供了一種視頻流數(shù)據(jù)文件中視頻流的運(yùn)動(dòng)信息提取方法,下面對(duì)該方法的具體實(shí)施方式
進(jìn)行說(shuō)明。 如圖11所示,本發(fā)明實(shí)施例中視頻流數(shù)據(jù)文件中視頻流的運(yùn)動(dòng)信息提取方法流程可以包括 步驟1101、確定視頻流數(shù)據(jù)文件的前向預(yù)測(cè)幀P幀中的非運(yùn)動(dòng)補(bǔ)償宏塊的數(shù)量;
步驟1102、根據(jù)非運(yùn)動(dòng)補(bǔ)償宏塊的數(shù)量識(shí)別視頻場(chǎng)景的運(yùn)動(dòng)強(qiáng)度;
步驟1103、獲取視頻場(chǎng)景運(yùn)動(dòng)強(qiáng)度的識(shí)別結(jié)果;
步驟1104、提取視頻流中包括識(shí)別結(jié)果的運(yùn)動(dòng)信息。 當(dāng)能提取包括識(shí)別結(jié)果的運(yùn)動(dòng)信息后,便可以利用該運(yùn)動(dòng)信息來(lái)對(duì)視頻流數(shù)據(jù)文件的分類依據(jù),即,按照前述的運(yùn)動(dòng)強(qiáng)度等級(jí)來(lái)對(duì)視頻流數(shù)據(jù)文件分類,并將其作為檢索的依據(jù)。據(jù)此,本發(fā)明實(shí)施例中還提供了一種視頻流數(shù)據(jù)文件的存儲(chǔ)方法、以及一種檢索視頻流數(shù)據(jù)文件的方法,下面對(duì)它們的實(shí)施方式進(jìn)行說(shuō)明。 如圖12所示,本發(fā)明實(shí)施例中視頻流數(shù)據(jù)文件的存儲(chǔ)方法流程可以包括
步驟1201、獲取需保存的視頻流數(shù)據(jù)文件; 步驟1202、獲取該視頻流數(shù)據(jù)文件的運(yùn)動(dòng)信息,運(yùn)動(dòng)信息包括視頻場(chǎng)景運(yùn)動(dòng)強(qiáng)度的識(shí)別結(jié)果; 步驟1203、存儲(chǔ)視頻流數(shù)據(jù)文件,并以所述運(yùn)動(dòng)信息作為該視頻流數(shù)據(jù)文件的標(biāo)識(shí)。 步驟1201中,為了使對(duì)視頻流數(shù)據(jù)文件的檢索結(jié)果能夠更具有普遍性,需要大量的且不同種類的壓縮視頻,因此可以采集大量的視頻流數(shù)據(jù)文件。實(shí)施中,可使用視頻采集卡,將電視中的節(jié)目錄制下來(lái)并轉(zhuǎn)換成相應(yīng)格式但 £61或11.261系列)的壓縮視頻。
實(shí)施中,將存儲(chǔ)了視頻流數(shù)據(jù)文件的實(shí)體稱為數(shù)據(jù)庫(kù),則數(shù)據(jù)庫(kù)可使用MicrosoftSQL Sever 2000或其他數(shù)據(jù)庫(kù)軟件實(shí)現(xiàn),在數(shù)據(jù)庫(kù)中采用關(guān)鍵幀圖像代表鏡頭進(jìn)行視頻存儲(chǔ),以關(guān)鍵幀的特征信息(如運(yùn)動(dòng)信息)代表關(guān)鍵幀圖像的管理方式,用來(lái)實(shí)現(xiàn)基于運(yùn)動(dòng)的壓縮視頻流數(shù)據(jù)文件的存儲(chǔ)與檢索。
9
數(shù)據(jù)庫(kù)系統(tǒng)中可以包含多種不同類型、不同方式的視頻流數(shù)據(jù)文件,例如可以采集以下類型的視頻流數(shù)據(jù)文件兒童節(jié)目,MTV,演唱會(huì),新聞播報(bào),人物專題采訪,電視劇,籃球比賽,足球比賽,乒乓球比賽,排球比賽等。 —個(gè)具體實(shí)例中采集視頻流數(shù)據(jù)文件的實(shí)施流程如圖13所示,可以包括
步驟1301、獲取視頻流數(shù)據(jù)文件; 步驟1302、對(duì)視頻流數(shù)據(jù)文件進(jìn)行鏡頭分割,分別轉(zhuǎn)入步驟1303、 1304 ;
步驟1303、提取運(yùn)動(dòng)特征,轉(zhuǎn)入步驟1307 ;
步驟1304、提取關(guān)鍵幀并聚類;
步驟1305、提取特征;
步驟1306、提取其它特征; 步驟1307、將視頻流數(shù)據(jù)文件存入數(shù)據(jù)庫(kù),并用運(yùn)動(dòng)特征及其他特征標(biāo)識(shí)。
其中,步驟1303中所提取的運(yùn)動(dòng)特征便包括了前述實(shí)施例中的運(yùn)動(dòng)強(qiáng)度特征,其提取的實(shí)施可以如圖1所示的執(zhí)行。步驟1305、1306中提取的特征可以是其它的一些特征,如時(shí)間、色度等等,可以用其與包括了運(yùn)動(dòng)強(qiáng)度的運(yùn)動(dòng)信息一起來(lái)標(biāo)識(shí)視頻流數(shù)據(jù)文件。
在利用上述方式標(biāo)識(shí)視頻流數(shù)據(jù)文件后,顯然,可以利用這些標(biāo)識(shí)來(lái)檢索數(shù)據(jù)庫(kù)中存儲(chǔ)的視頻流數(shù)據(jù)文件,因此,本發(fā)明實(shí)施例中還提供了一種檢索視頻流數(shù)據(jù)文件的方法,下面對(duì)檢索方法的具體實(shí)施方式
進(jìn)行說(shuō)明。 如圖14所示,本發(fā)明實(shí)施例中,檢索視頻流數(shù)據(jù)文件的方法流程可以包括 步驟1401、以運(yùn)動(dòng)強(qiáng)度為檢索詞進(jìn)行檢索; 步驟1402、反饋標(biāo)識(shí)與檢索詞匹配的視頻流數(shù)據(jù)文件。 本步驟中,標(biāo)識(shí)是以視頻流數(shù)據(jù)文件的運(yùn)動(dòng)信息作為標(biāo)識(shí)的,顯然,運(yùn)動(dòng)信息包括如前所述的視頻場(chǎng)景運(yùn)動(dòng)強(qiáng)度的識(shí)別結(jié)果。 上述實(shí)施例中是直接以運(yùn)動(dòng)強(qiáng)度為檢索關(guān)鍵詞進(jìn)行的檢索,實(shí)施中,設(shè)需在數(shù)據(jù)庫(kù)中檢索與視頻流數(shù)據(jù)文件A相同的若干同樣性質(zhì)的視頻流數(shù)據(jù)文件,例如查詢視頻素材等。則可以配合前述存儲(chǔ)視頻流數(shù)據(jù)文件數(shù)據(jù)庫(kù)進(jìn)行查詢。 —個(gè)具體實(shí)例中,查詢視頻流數(shù)據(jù)文件的實(shí)施流程如圖15所示,可以包括
步驟1501、獲取需檢索的視頻流數(shù)據(jù)文件; 步驟1502、對(duì)需檢索的視頻流數(shù)據(jù)文件進(jìn)行鏡頭分割,分別轉(zhuǎn)入步驟1503、 1504 ;
步驟1503、提取運(yùn)動(dòng)特征,轉(zhuǎn)入步驟1507 ;
步驟1504、提取關(guān)鍵幀并聚類;
步驟1505、提取特征;
步驟1506、提取其它特征; 步驟1507、將運(yùn)動(dòng)特征、其他特征作為檢索詞在數(shù)據(jù)庫(kù)中檢索匹配的標(biāo)識(shí);
步驟1508、將數(shù)據(jù)庫(kù)中匹配該標(biāo)識(shí)的視頻流數(shù)據(jù)文件輸出。 其中,步驟1503中所提取的運(yùn)動(dòng)特征便包括了前述實(shí)施例中的運(yùn)動(dòng)強(qiáng)度特征,其提取的實(shí)施可以如圖1所示的執(zhí)行。步驟1505、1506中提取的特征可以是其它的一些特征,如時(shí)間、色度等等,可以用其與包括了運(yùn)動(dòng)強(qiáng)度的運(yùn)動(dòng)信息一起來(lái)檢索視頻流數(shù)據(jù)文件。
具體實(shí)施中,可以提供一個(gè)面向視頻資料庫(kù)檢索者的客戶端。用戶便可以用圖片或視頻為檢索條件,通過(guò)客戶端界面,進(jìn)行基于運(yùn)動(dòng)及其他特征的提取,并與數(shù)據(jù)庫(kù)中的數(shù)
10據(jù)進(jìn)行匹配,從而便可以從視頻數(shù)據(jù)庫(kù)中檢索到所要查詢的視頻素材。 本領(lǐng)域普通技術(shù)人員可以理解上述實(shí)施例方法中的全部或部分步驟是可以通過(guò)程序來(lái)指令相關(guān)的硬件完成,該程序可以存儲(chǔ)于一計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)中,存儲(chǔ)介質(zhì)可以包括R0M、RAM、磁盤或光盤等。 基于同一發(fā)明構(gòu)思,本發(fā)明實(shí)施例還提供了一種視頻流數(shù)據(jù)文件中視頻場(chǎng)景運(yùn)動(dòng)強(qiáng)度的識(shí)別裝置,其結(jié)構(gòu)如圖16所示,可以包括 確定模塊1601,用于確定視頻流數(shù)據(jù)文件的前向預(yù)測(cè)幀P幀中的非運(yùn)動(dòng)補(bǔ)償宏塊的數(shù)量; 識(shí)別模塊1602,用于根據(jù)所述非運(yùn)動(dòng)補(bǔ)償宏塊的數(shù)量識(shí)別視頻場(chǎng)景的運(yùn)動(dòng)強(qiáng)度。
—個(gè)實(shí)施例中,識(shí)別模塊還可以用于根據(jù)P幀的幀間編碼的非運(yùn)動(dòng)補(bǔ)償宏塊數(shù)量與P幀宏塊總數(shù)量的比率,識(shí)別視頻場(chǎng)景的運(yùn)動(dòng)強(qiáng)度。 —個(gè)實(shí)施例中,識(shí)別模塊還可以用于根據(jù)所述比率的u率變換結(jié)果,識(shí)別視頻場(chǎng)景的運(yùn)動(dòng)強(qiáng)度。 —個(gè)實(shí)施例中,識(shí)別模塊還可以用于在比率進(jìn)行u率變換時(shí),比率進(jìn)行u率變換為Gu ( a ), Gu(a ) = ln(l+ua )/ln(l+u) ,0《a《l,其中: a為P幀的幀間編碼的非運(yùn)動(dòng)補(bǔ)償宏塊數(shù)量與P幀宏塊總數(shù)量的比率,P是壓擴(kuò)參數(shù)。 —個(gè)實(shí)施例中,識(shí)別模塊還可以用于在根據(jù)所述比率的u率變換結(jié)果,識(shí)別視頻場(chǎng)景的運(yùn)動(dòng)強(qiáng)度時(shí), 將0. 9《Gu ( a )《1. 0的視頻場(chǎng)景的運(yùn)動(dòng)強(qiáng)度識(shí)別為極慢;
將0. 8《Gu ( a )《0. 9的視頻場(chǎng)景的運(yùn)動(dòng)強(qiáng)度識(shí)別為較慢;
將0. 7《Gu ( a )《0. 8的視頻場(chǎng)景的運(yùn)動(dòng)強(qiáng)度識(shí)別為正常;
將0. 6《Gu ( a )《0. 7的視頻場(chǎng)景的運(yùn)動(dòng)強(qiáng)度識(shí)別為極快;
將0. 0《Gu ( a )《0. 6的視頻場(chǎng)景的運(yùn)動(dòng)強(qiáng)度識(shí)別為很快;
其中,Gu(a)為所述比率的u率變換結(jié)果。 基于同一發(fā)明構(gòu)思,本發(fā)明實(shí)施例還提供一種視頻流數(shù)據(jù)文件中視頻流的運(yùn)動(dòng)信息提取裝置,其結(jié)構(gòu)如圖17所示,可以包括 獲取模塊1701,用于獲取視頻流數(shù)據(jù)文件運(yùn)動(dòng)強(qiáng)度的識(shí)別結(jié)果;其中,識(shí)別結(jié)果可以采用識(shí)別模塊的執(zhí)行結(jié)果; 提取模塊1702,用于提取視頻流中包括所述識(shí)別結(jié)果的運(yùn)動(dòng)信息。 基于同一發(fā)明構(gòu)思,本發(fā)明實(shí)施例還提供一種視頻流數(shù)據(jù)文件的存儲(chǔ)數(shù)據(jù)庫(kù)系
統(tǒng),其結(jié)構(gòu)如圖18所示,可以包括 待保存文件獲取模塊1801,用于獲取需保存的視頻流數(shù)據(jù)文件; 運(yùn)動(dòng)信息獲取模塊1802,用于獲取該視頻流數(shù)據(jù)文件的運(yùn)動(dòng)信息,所述運(yùn)動(dòng)信息
包括對(duì)運(yùn)動(dòng)強(qiáng)度的識(shí)別結(jié)果;其中,識(shí)別結(jié)果可以采用識(shí)別模塊的執(zhí)行結(jié)果; 存儲(chǔ)模塊1803,用于存儲(chǔ)視頻流數(shù)據(jù)文件,并以所述運(yùn)動(dòng)信息作為該視頻流數(shù)據(jù)
文件的標(biāo)識(shí)。 基于同一發(fā)明構(gòu)思,本發(fā)明實(shí)施例還提供一種數(shù)據(jù)庫(kù)系統(tǒng)中視頻流數(shù)據(jù)文件的檢索系統(tǒng),其結(jié)構(gòu)如圖19所示,可以包括 檢索模塊1901,用于以運(yùn)動(dòng)強(qiáng)度為檢索詞進(jìn)行檢索; 反饋模塊1902,用于反饋標(biāo)識(shí)與檢索詞匹配的視頻流數(shù)據(jù)文件,所述標(biāo)識(shí)是以視頻流數(shù)據(jù)文件的運(yùn)動(dòng)信息作為標(biāo)識(shí)的,所述運(yùn)動(dòng)信息對(duì)運(yùn)動(dòng)強(qiáng)度的識(shí)別結(jié)果,其中,識(shí)別結(jié)果可以采用識(shí)別模塊的執(zhí)行結(jié)果。 由上述實(shí)施例可以看出,本發(fā)明實(shí)施例中提出了基于P幀非運(yùn)動(dòng)補(bǔ)償宏塊的數(shù)量來(lái)判斷的視頻場(chǎng)景運(yùn)動(dòng)強(qiáng)度的等級(jí)劃分,并給出了識(shí)別運(yùn)動(dòng)強(qiáng)度的技術(shù)方案。進(jìn)一步的,在提取運(yùn)動(dòng)信息中包括了對(duì)運(yùn)動(dòng)強(qiáng)度等級(jí)的提取。更進(jìn)一步的,利用包括運(yùn)動(dòng)強(qiáng)度的運(yùn)動(dòng)信息來(lái)作為標(biāo)識(shí),構(gòu)建了視頻流數(shù)據(jù)文件的存儲(chǔ)以及檢索的技術(shù)方案。 由于在本發(fā)明實(shí)施例中,是在壓縮域視頻直接進(jìn)行運(yùn)動(dòng)信息的檢索,因而耗時(shí)短,特別適用于實(shí)時(shí)監(jiān)控及檢索;克服了現(xiàn)有技術(shù)中因直接在像素域上分析運(yùn)動(dòng)或通過(guò)光流方程分析運(yùn)動(dòng)導(dǎo)致非常耗時(shí)、很難達(dá)到實(shí)時(shí)的不足。 同時(shí),由于在本發(fā)明實(shí)施例中,可對(duì)基于MPEG/H. 26X標(biāo)準(zhǔn)進(jìn)行壓縮的視頻進(jìn)行檢
索,只要是具備P幀特點(diǎn)的壓縮算法都可實(shí)施,因此可滿足目前大部分媒體管理系統(tǒng)的需
求??朔爽F(xiàn)有技術(shù)僅適用于M-JPEG格式的視頻,應(yīng)用面顯然很窄的不足。 顯然,本領(lǐng)域的技術(shù)人員可以對(duì)本發(fā)明進(jìn)行各種改動(dòng)和變型而不脫離本發(fā)明的精
神和范圍。這樣,倘若對(duì)本發(fā)明的這些修改和變型屬于本發(fā)明權(quán)利要求及其等同技術(shù)的范
圍之內(nèi),則本發(fā)明也意圖包含這些改動(dòng)和變型在內(nèi)。
權(quán)利要求
一種視頻流數(shù)據(jù)文件中視頻場(chǎng)景運(yùn)動(dòng)強(qiáng)度的識(shí)別方法,其特征在于,該方法包括確定視頻流數(shù)據(jù)文件的前向預(yù)測(cè)幀P幀中的非運(yùn)動(dòng)補(bǔ)償宏塊的數(shù)量;根據(jù)所述非運(yùn)動(dòng)補(bǔ)償宏塊的數(shù)量識(shí)別視頻場(chǎng)景的運(yùn)動(dòng)強(qiáng)度。
2. 如權(quán)利要求1所述的方法,其特征在于,根據(jù)所述非運(yùn)動(dòng)補(bǔ)償宏塊的數(shù)量識(shí)別視頻 場(chǎng)景的運(yùn)動(dòng)強(qiáng)度,包括根據(jù)P幀的幀間編碼的非運(yùn)動(dòng)補(bǔ)償宏塊數(shù)量與P幀宏塊總數(shù)量的比率,識(shí)別視頻場(chǎng)景 的運(yùn)動(dòng)強(qiáng)度。
3. 如權(quán)利要求2所述的方法,其特征在于,根據(jù)所述比率的U率變換結(jié)果,識(shí)別視頻場(chǎng) 景的運(yùn)動(dòng)強(qiáng)度。
4. 如權(quán)利要求3所述的方法,其特征在于,所述比率的U率變換包括 比率進(jìn)行u率變換為Gu(a),<formula>formula see original document page 2</formula>,其中:a為P幀的幀間編碼的非運(yùn)動(dòng)補(bǔ)償宏塊數(shù)量與P幀宏塊總數(shù)量的比率,P是壓擴(kuò)參數(shù)。
5. 如權(quán)利要求3或4所述的方法,其特征在于,根據(jù)所述比率的u率變換結(jié)果,識(shí)別視 頻場(chǎng)景的運(yùn)動(dòng)強(qiáng)度,包括將0. 9《Gu ( a )《1. 0的視頻場(chǎng)景的運(yùn)動(dòng)強(qiáng)度識(shí)別為極慢; 將0. 8《Gu ( a )《0. 9的視頻場(chǎng)景的運(yùn)動(dòng)強(qiáng)度識(shí)別為較慢; 將0. 7《Gu ( a )《0. 8的視頻場(chǎng)景的運(yùn)動(dòng)強(qiáng)度識(shí)別為正常; 將0. 6《Gu ( a )《0. 7的視頻場(chǎng)景的運(yùn)動(dòng)強(qiáng)度識(shí)別為極快; 將0. 0《Gu( a )《0. 6的視頻場(chǎng)景的運(yùn)動(dòng)強(qiáng)度識(shí)別為很快; 其中,Gu(a)為所述比率的u率變換結(jié)果。
6. —種視頻流數(shù)據(jù)文件中視頻流的運(yùn)動(dòng)信息提取方法,其特征在于,該方法包括 獲取視頻流數(shù)據(jù)文件中如權(quán)利要求1所述的視頻場(chǎng)景運(yùn)動(dòng)強(qiáng)度的識(shí)別結(jié)果; 提取視頻流中包括所述識(shí)別結(jié)果的運(yùn)動(dòng)信息。
7. —種視頻流數(shù)據(jù)文件的存儲(chǔ)方法,其特征在于,該方法包括 獲取需保存的視頻流數(shù)據(jù)文件;獲取該視頻流數(shù)據(jù)文件的運(yùn)動(dòng)信息,所述運(yùn)動(dòng)信息包括如權(quán)利要求1所述的視頻場(chǎng)景 運(yùn)動(dòng)強(qiáng)度的識(shí)別結(jié)果;存儲(chǔ)視頻流數(shù)據(jù)文件,并以所述運(yùn)動(dòng)信息作為該視頻流數(shù)據(jù)文件的標(biāo)識(shí)。
8. —種檢索按權(quán)利要求7所述方法存儲(chǔ)的視頻流數(shù)據(jù)文件的方法,其特征在于,該方 法包括以運(yùn)動(dòng)強(qiáng)度為檢索詞進(jìn)行檢索;反饋標(biāo)識(shí)與檢索詞匹配的視頻流數(shù)據(jù)文件,所述標(biāo)識(shí)是以視頻流數(shù)據(jù)文件的運(yùn)動(dòng)信息 作為標(biāo)識(shí)的,所述運(yùn)動(dòng)信息包括如權(quán)利要求1所述的視頻場(chǎng)景運(yùn)動(dòng)強(qiáng)度的識(shí)別結(jié)果。
9. 一種視頻流數(shù)據(jù)文件中視頻場(chǎng)景運(yùn)動(dòng)強(qiáng)度的識(shí)別裝置,其特征在于,包括 確定模塊,用于確定視頻流數(shù)據(jù)文件的前向預(yù)測(cè)幀P幀中的非運(yùn)動(dòng)補(bǔ)償宏塊的數(shù)量; 識(shí)別模塊,用于根據(jù)所述非運(yùn)動(dòng)補(bǔ)償宏塊的數(shù)量識(shí)別視頻場(chǎng)景的運(yùn)動(dòng)強(qiáng)度。
10. 如權(quán)利要求9所述的裝置,其特征在于,所述識(shí)別模塊進(jìn)一步用于根據(jù)P幀的幀間編碼的非運(yùn)動(dòng)補(bǔ)償宏塊數(shù)量與P幀宏塊總數(shù)量的比率,識(shí)別視頻場(chǎng)景的運(yùn)動(dòng)強(qiáng)度。
11. 如權(quán)利要求io所述的裝置,其特征在于,所述識(shí)別模塊進(jìn)一步用于根據(jù)所述比率的u率變換結(jié)果,識(shí)別視頻場(chǎng)景的運(yùn)動(dòng)強(qiáng)度。
12. 如權(quán)利要求ll所述的裝置,其特征在于,所述識(shí)別模塊進(jìn)一步用于在比率進(jìn)行u率 變換時(shí),比率進(jìn)行u率變換為Gu ( a ),Gu(a ) = ln(l+ua )/ln(l+u) ,0《a《l,其中:a為P幀的幀間編碼的非運(yùn)動(dòng)補(bǔ)償宏塊數(shù)量與P幀宏塊總數(shù)量的比率,P是壓擴(kuò)參數(shù)。
13. 如權(quán)利要求11或12所述的裝置,其特征在于,所述識(shí)別模塊進(jìn)一步用于在根據(jù)所 述比率的u率變換結(jié)果,識(shí)別視頻場(chǎng)景的運(yùn)動(dòng)強(qiáng)度時(shí),將0. 9《Gu ( a )《1. 0的視頻場(chǎng)景的運(yùn)動(dòng)強(qiáng)度識(shí)別為極慢; 將0. 8《Gu ( a )《0. 9的視頻場(chǎng)景的運(yùn)動(dòng)強(qiáng)度識(shí)別為較慢; 將0. 7《Gu ( a )《0. 8的視頻場(chǎng)景的運(yùn)動(dòng)強(qiáng)度識(shí)別為正常; 將0. 6《Gu ( a )《0. 7的視頻場(chǎng)景的運(yùn)動(dòng)強(qiáng)度識(shí)別為極快; 將0. 0《Gu( a )《0. 6的視頻場(chǎng)景的運(yùn)動(dòng)強(qiáng)度識(shí)別為很快; 其中,Gu(a)為所述比率的u率變換結(jié)果。
14. 一種視頻流數(shù)據(jù)文件中視頻流的運(yùn)動(dòng)信息提取裝置,其特征在于,包括 獲取模塊,用于獲取視頻流數(shù)據(jù)文件中如權(quán)利要求9所述識(shí)別模塊的識(shí)別結(jié)果; 提取模塊,用于提取視頻流中包括所述識(shí)別結(jié)果的運(yùn)動(dòng)信息。
15. —種視頻流數(shù)據(jù)文件的存儲(chǔ)數(shù)據(jù)庫(kù)系統(tǒng),其特征在于,包括 待保存文件獲取模塊,用于獲取需保存的視頻流數(shù)據(jù)文件;運(yùn)動(dòng)信息獲取模塊,用于獲取該視頻流數(shù)據(jù)文件的運(yùn)動(dòng)信息,所述運(yùn)動(dòng)信息包括如權(quán) 利要求9所述識(shí)別模塊的識(shí)別結(jié)果;存儲(chǔ)模塊,用于存儲(chǔ)視頻流數(shù)據(jù)文件,并以所述運(yùn)動(dòng)信息作為該視頻流數(shù)據(jù)文件的標(biāo)識(shí)。
16. —種檢索權(quán)利要求15所述數(shù)據(jù)庫(kù)系統(tǒng)中視頻流數(shù)據(jù)文件的檢索系統(tǒng),其特征在于,該系統(tǒng)包括檢索模塊,用于以運(yùn)動(dòng)強(qiáng)度為檢索詞進(jìn)行檢索;反饋模塊,用于反饋標(biāo)識(shí)與檢索詞匹配的視頻流數(shù)據(jù)文件,所述標(biāo)識(shí)是以視頻流數(shù)據(jù) 文件的運(yùn)動(dòng)信息作為標(biāo)識(shí)的,所述運(yùn)動(dòng)信息包括如權(quán)利要求9所述識(shí)別模塊的識(shí)別結(jié)果。
全文摘要
本發(fā)明公開(kāi)了一種視頻流數(shù)據(jù)文件中視頻場(chǎng)景運(yùn)動(dòng)強(qiáng)度的識(shí)別方法,該方法包括確定視頻流數(shù)據(jù)文件的前向預(yù)測(cè)幀P幀中的非運(yùn)動(dòng)補(bǔ)償宏塊的數(shù)量;根據(jù)所述非運(yùn)動(dòng)補(bǔ)償宏塊的數(shù)量識(shí)別視頻場(chǎng)景的運(yùn)動(dòng)強(qiáng)度。本發(fā)明同時(shí)公開(kāi)一種視頻流數(shù)據(jù)文件中視頻場(chǎng)景運(yùn)動(dòng)強(qiáng)度的識(shí)別裝置、視頻流數(shù)據(jù)文件中視頻流的運(yùn)動(dòng)信息提取方法及裝置、視頻流數(shù)據(jù)文件的存儲(chǔ)方法及系統(tǒng)、視頻流數(shù)據(jù)文件的檢索方法及系統(tǒng)。采用本發(fā)明能夠?qū)σ曨l流數(shù)據(jù)文件進(jìn)行實(shí)時(shí)的、應(yīng)用面廣的檢索。
文檔編號(hào)G06T7/20GK101770647SQ20081024706
公開(kāi)日2010年7月7日 申請(qǐng)日期2008年12月31日 優(yōu)先權(quán)日2008年12月31日
發(fā)明者嚴(yán)砥, 侯清富, 朱春梅, 梅海波 申請(qǐng)人:中國(guó)移動(dòng)通信集團(tuán)公司