專利名稱:一種監(jiān)控視頻壓縮的碼率降低方法
技術(shù)領(lǐng)域:
本發(fā)明專利的技術(shù)領(lǐng)域?yàn)楸O(jiān)控視頻編碼壓縮領(lǐng)域。
技術(shù)背景在該技術(shù)領(lǐng)域,監(jiān)控視頻的編碼壓縮一般采用壓縮比比較高的國際視頻壓縮標(biāo)準(zhǔn)如 MPEG2、 MPEG4或者H. 264。普通監(jiān)控視頻如果由最新的壓縮方式化264進(jìn)行壓縮,數(shù)據(jù)量在200Kb/s左右。這樣平 均每小時(shí)就會產(chǎn)生720Mb的數(shù)據(jù)量。由于監(jiān)控視頻的采集時(shí)間非常長、分辨率比較高,而且 像在銀行等許多公共場合都會設(shè)有多個(gè)監(jiān)控點(diǎn)。這樣一家小型銀行一個(gè)月的監(jiān)控視頻數(shù)據(jù)量 就達(dá)到5T,實(shí)在是非常驚人的數(shù)字。由于大容量存儲設(shè)備的價(jià)格非常昂貴,因此增大監(jiān)控 視頻壓縮比、降低監(jiān)控視頻碼率成為了一個(gè)非常迫切的任務(wù)。先進(jìn)的壓縮方式確實(shí)能對普通視頻產(chǎn)生很高的壓縮比,對監(jiān)控視頻也是如此。但是由于 監(jiān)控視頻的監(jiān)控時(shí)間長、分辨率高,即使是高壓縮比的壓縮方式進(jìn)行壓縮以后數(shù)據(jù)量還是非 常大。從MPEG2到MPEG4,在保證圖像質(zhì)量的基礎(chǔ)上壓縮比增大了一倍;從MPEG4到H.264 壓縮比增大了兩倍。壓縮標(biāo)準(zhǔn)的改朝換代給監(jiān)控視頻帶來的影響還是不夠。鑒于監(jiān)控視頻有這樣一些特點(diǎn)(1)監(jiān)控時(shí)間比較長,視頻分辨率比較高,造成監(jiān)控視 頻數(shù)據(jù)量非常龐大。(2)監(jiān)控目的性比較明確。(3)監(jiān)控視頻中很多時(shí)候會有畫面無變化現(xiàn) 象。本專利提出了一種碼率降低方法,可以使普通監(jiān)控視頻的壓縮比平均增大3-4倍,實(shí)現(xiàn) 了監(jiān)控視頻壓縮技術(shù)上的新突破。本方法降低碼率的情況下還可以使被監(jiān)控對象更加清晰。 發(fā)明內(nèi)容一種監(jiān)控視頻壓縮的碼率降低方法,其技術(shù)特征在于,包含如下步驟(1) 對視頻幀進(jìn)行輪廓檢測,或者運(yùn)動(dòng)檢測,或者輪廓和運(yùn)動(dòng)都檢測;(2) 將輪廓檢測結(jié)果c和運(yùn)動(dòng)檢測結(jié)果m,作為映射關(guān)系的輸入,求得碼率調(diào)節(jié)參數(shù)p;(3) 利用碼率調(diào)節(jié)參數(shù)p調(diào)節(jié)監(jiān)控視頻壓縮的壓縮比。該碼率降低方法,監(jiān)控視頻壓縮是指將監(jiān)控視頻從空間和時(shí)間上去掉冗余,進(jìn)行數(shù)據(jù)壓縮。該碼率降低方法步驟(1)中的視頻幀是指組成該視頻的單一圖像。 該碼率降低方法步驟(1)中的輪廓檢測包括人臉檢測、人體輪廓檢測、物體輪廓檢測。 該碼率降低方法步驟(1)中的運(yùn)動(dòng)檢測是指利用當(dāng)前視頻幀圖像與前后相鄰的幾個(gè)視 頻幀圖像進(jìn)行相減或其他運(yùn)算求得運(yùn)動(dòng)信息。該碼率降低方法步驟(2)中的輪廓檢測時(shí),將視頻幀是否含有被檢測輪廓對象作為結(jié)果A,檢測出的具體輪廓對象信息作為結(jié)果B,輪廓檢測結(jié)果c是結(jié)果A,或者結(jié)果B,或者 是結(jié)果A和B的組合。該碼率降低方法步驟(2)中的運(yùn)動(dòng)檢測時(shí),將視頻幀是否含有運(yùn)動(dòng)信息作為結(jié)果A,檢 測出的具體運(yùn)動(dòng)信息作為結(jié)果B,運(yùn)動(dòng)檢測結(jié)果m是結(jié)果A,或者結(jié)果B,或者是結(jié)果A和B 的組合。該碼率降低方法步驟(2)中的輪廓檢測結(jié)果c,運(yùn)動(dòng)檢測m以及碼率調(diào)節(jié)參數(shù)p維數(shù)均 是是一維或多維。
圖1是一種監(jiān)控視頻壓縮的碼率降低方法中實(shí)施方式總體流程圖。 具體實(shí)施方法1、 對視頻幀進(jìn)行輪廓檢測,或者運(yùn)動(dòng)檢測,或者輪廓和運(yùn)動(dòng)都檢測首先,必須選擇一類或兩類檢測方法。與輪廓檢測相比而言,運(yùn)動(dòng)檢測的運(yùn)算復(fù)雜度要 低的多。因此在硬件條件不夠的情況下只選擇運(yùn)動(dòng)檢測。但是由于運(yùn)動(dòng)檢測只能分辨有沒有 物體或者人在運(yùn)動(dòng),而不能分辨是什么物體在運(yùn)動(dòng),是正對鏡頭還是背對鏡頭。因此如果不 用輪廓檢測,碼率降低效果肯定不會達(dá)到最好。舉例而言,如果在銀行里一個(gè)人背對著監(jiān)控設(shè)備在運(yùn)動(dòng),此時(shí)運(yùn)動(dòng)檢測就會知道有東西 在動(dòng),而不知道監(jiān)控視頻拍的是人的背部。而在真正的監(jiān)控視頻中人的信息量集中在臉部, 一張臉能代表一個(gè)人,而通過背影去判斷一個(gè)人是不符合常理的。因此如果此時(shí)有人臉檢測 的話,就會判斷出這個(gè)視頻幀中沒有人臉,可以適當(dāng)?shù)脑龃驫P因子,也即增大壓縮比。所以這兩種檢測方法各有利弊,就看在實(shí)際應(yīng)用過程中如何去選擇。假如輪廓檢測被選 擇作為一種檢測方法,那么接下來就要確定被檢測對象,從而選擇一種具體的輪廓檢測方法。 例如在銀行大廳的監(jiān)控視頻中,其監(jiān)控對象肯定是人。那么在輪廓檢測的時(shí)候可以選擇人臉 檢測作為具體的檢測方法;又如在大型停車場的監(jiān)控視頻中,其監(jiān)控對象肯定是車,其次可 能是車中的人,那么就在輪廓檢測時(shí)可以把車輪廓檢測作為具體的檢測方法。迄今為止,人臉檢測、車輪廓檢測算法已經(jīng)非常的成熟。例如人臉檢測的AdaBoost等 算法的檢測率均達(dá)到了 95%以上的商用程度,因此完全可以運(yùn)用到一些實(shí)際的輪廓檢測中 去,在此也不去闡述相應(yīng)的技術(shù)細(xì)節(jié)。2、 確定輪廓檢測結(jié)果將視頻幀是否含有被檢測輪廓對象作為結(jié)果A,檢測出的具體輪廓對象信息作為結(jié)果B, 輪廓檢測結(jié)果可以是結(jié)果A,可以是結(jié)果B,也可以是結(jié)果A和B的組合。其中輪廓對象信息包含輪廓對象的數(shù)目、每個(gè)輪廓的位置、大小等信息。舉例而言,假如選取結(jié)果A作為最終結(jié)果,那么在輪廓檢測的最終結(jié)果就是一個(gè)開關(guān)型的變量b。假如選取結(jié)果A和結(jié)果B中的數(shù)目信息作為最終結(jié)果,那么輪廓檢測的最終輸出 就是一個(gè)二維向量(6,")"。其中b表示輪廓對象是否在當(dāng)前視頻幀中存在,是一個(gè)開關(guān)變量; n表示當(dāng)前視頻幀中輪廓對象的數(shù)目,是一個(gè)整數(shù)。3、 確定運(yùn)動(dòng)檢測結(jié)果現(xiàn)今有很多運(yùn)動(dòng)檢測的方法,比較簡單而通用的方法是將視頻幀與相鄰視頻幀的象素點(diǎn) 值進(jìn)行相減,可以求得當(dāng)前時(shí)間點(diǎn)上的視頻中有無運(yùn)動(dòng)信息。一般的做法是定義一個(gè)閾值^JA^AoW ,^一! ,一i-如果^e涵oW〉ZZ((^0)-GJ"-1)),則視為無運(yùn)動(dòng)信息。如果,Am^oW《f;l;(G^(")-、(n-1)),則視為有運(yùn)動(dòng)信息。其中A(;t)為當(dāng)前幀第i行第j列象素點(diǎn)的灰度象素值;&("-1)為前一幀第i行第j列象 素點(diǎn)的灰度象素值;m為圖像的寬度,n為圖像的高度。將視頻幀中是否含有運(yùn)動(dòng)信息作為 結(jié)果A;通常運(yùn)動(dòng)量大小及方向這兩個(gè)信息可以通過求視頻幀圖像中象素點(diǎn)的重心的位移來求 得。求圖像幀中象素點(diǎn)重心的方法是SG,x(w,.)其中表示當(dāng)前視頻幀的重心所在點(diǎn)逸°標(biāo)是、行,力列;(x,.,力)表示第i個(gè)象素點(diǎn)所在的坐標(biāo)是、行,乂列;Gf表示第i個(gè)象素點(diǎn)的灰度象素值。 因此重心點(diǎn)的位移就是(X/,力)="("),、("))-Og (" - 0,、("-") (&,力)是一個(gè)矢量,可以用來表示運(yùn)動(dòng)信息。其中包含了運(yùn)動(dòng)量的大小及方向這兩種信息。選擇其中的一種信息或兩種信息作為結(jié)果B。最后再選擇結(jié)果A和結(jié)果B中的兩個(gè),或者任 意一個(gè)作為運(yùn)動(dòng)檢測的最終結(jié)果。4、 求碼率調(diào)節(jié)參數(shù)在這個(gè)環(huán)節(jié)中需要將步驟2中的輪廓檢測最終結(jié)果c和運(yùn)動(dòng)檢測最終結(jié)果m,作為映射 關(guān)系/7 = /(^附)的輸入,求得碼率調(diào)節(jié)參數(shù)p。在此映射關(guān)系中輸入?yún)?shù)c和m可以其中有 一個(gè)不存在,這就取決于步驟l中選取一種還是兩種檢測方法。在很多壓縮方式中,可以將離散余弦變換的量化參數(shù)(QP)作為碼率調(diào)整參數(shù),QP因子 越大,壓縮比越大,圖像質(zhì)量就越差。在H.264壓縮編碼方式中,編碼器會將一個(gè)視頻幀分為若干個(gè)16X16的宏塊,每個(gè)宏塊可以設(shè)置不同的QP值。因此如果輪廓檢測中檢測出具體的輪廓位置和大小信息,就可以 將這些位置所包含宏塊的QP因子降低或者不變,將其余宏塊的QP因子增大。此時(shí)的碼率調(diào)節(jié)參數(shù)p就應(yīng)該是一組QP值,也就是說此時(shí)p是多維的。為了說明一種具體的碼率調(diào)節(jié)參數(shù)的求法,我們選擇人臉檢測作為輪廓檢測的具體方法,并選擇步驟2中的結(jié)果A作為輪廓檢測的最終結(jié)果。同時(shí)我們也選擇了運(yùn)動(dòng)檢測方法,并且只選擇步驟3中的結(jié)果A作為運(yùn)動(dòng)檢測的最終結(jié)果。最后選擇一個(gè)視頻幀的QP因子作 為碼率調(diào)節(jié)參數(shù)。因此定義映射關(guān)系式p = /(c,m)其中c表示視頻幀中是否含有輪廓對象,是一個(gè)開關(guān)型的變量; 「0 (視頻幀中不含有輪廓對象)1(視頻幀中含有輪廓對象)m表示視頻幀中是否含有運(yùn)動(dòng)信息,也是一個(gè)開關(guān)型的變量;f 0 (視頻幀中不含有運(yùn)動(dòng)信息)m:(視頻幀中含有運(yùn)動(dòng)信息)P為一個(gè)視頻幀內(nèi)QP因子的值,在扎264中0 的取值范圍是0-51的整數(shù)。即0S; 251其中映射關(guān)系f的具體定義是'30 a = 1y = /(fl,6): y —35 6 = l,a = 045 ft = 0,a = 0那么最后我們就可以得到一個(gè)最終的解決方案:(1)輪廓檢測1(視頻幀中不含有輪廓對象) (視頻幀中含有輪廓對象)(2)運(yùn)動(dòng)檢測m =(視頻幀中不含有運(yùn)動(dòng)信息) (視頻幀中含有運(yùn)動(dòng)信息)(3)求碼率控制參數(shù)<formula>formula see original document page 7</formula>這個(gè)解決方案的具體的實(shí)現(xiàn)流程可以參照附圖1。需要說明的是此解決方案只是為了說 明本方法具體的實(shí)現(xiàn)過程,并不會因此而縮小權(quán)利的覆蓋范圍。在具體實(shí)現(xiàn)過程中只要按照 權(quán)利要求的步驟所實(shí)現(xiàn)的方法,都屬于本專利權(quán)利覆蓋范圍之內(nèi)。 5、利用碼率調(diào)節(jié)參數(shù)p動(dòng)態(tài)調(diào)節(jié)監(jiān)控視頻壓縮的壓縮比利用前幾個(gè)步驟求得碼率調(diào)節(jié)參數(shù)p, P可能是一維的也可能是多維的。在上一步中已 經(jīng)對這兩種情況做了解釋,在此就不作闡述了。如果p是一維的,那么一般p的值會是當(dāng)前視頻幀的QP因子值,這樣直接調(diào)節(jié)當(dāng)前幀 編碼的QP因子值,其他的編碼參數(shù)可以不變。如果p是多維的,那么一般p的值會是一組 QP因子值。在編碼壓縮時(shí)直接用這些QP值去控制不同宏塊的編碼參數(shù),達(dá)到動(dòng)態(tài)控制視頻 幀和視頻幀內(nèi)宏塊編碼的效果。最終通過智能地、動(dòng)態(tài)地調(diào)節(jié)監(jiān)控視頻壓縮編碼時(shí)的碼率調(diào)節(jié)參數(shù),實(shí)現(xiàn)了監(jiān)控視頻壓 縮編碼的碼率大幅度降低,同時(shí)還可以使被監(jiān)控的對象更加清晰可見。
權(quán)利要求
1. 一種監(jiān)控視頻壓縮的碼率降低方法,其技術(shù)特征在于,包含如下步驟(1)對視頻幀進(jìn)行輪廓檢測,或者運(yùn)動(dòng)檢測,或者輪廓和運(yùn)動(dòng)都檢測;(2)將輪廓檢測結(jié)果c和運(yùn)動(dòng)檢測結(jié)果m,作為映射關(guān)系p=f(c,m)的輸入,求得碼率調(diào)節(jié)參數(shù)p;(3)利用碼率調(diào)節(jié)參數(shù)p調(diào)節(jié)監(jiān)控視頻壓縮的壓縮比。
2、 根據(jù)權(quán)利要求1所述的碼率降低方法,監(jiān)控視頻壓縮是指將監(jiān)控視頻從空間和時(shí)間上去 掉冗余,進(jìn)行數(shù)據(jù)壓縮。
3、 根據(jù)權(quán)利要求1所述的碼率降低方法,步驟(1)中的視頻幀是指組成該視頻的單一圖像。
4、 根據(jù)權(quán)利要求1所述的碼率降低方法,步驟(1)中的輪廓檢測包括人臉檢測、人體輪廓 檢測、物體輪廓檢測。
5、 根據(jù)權(quán)利要求1所述的碼率降低方法,步驟(1)中的運(yùn)動(dòng)檢測是指利用當(dāng)前視頻幀圖像 與前后相鄰的幾個(gè)視頻幀圖像進(jìn)行相減或其他運(yùn)算求得運(yùn)動(dòng)信息。
6、 根據(jù)權(quán)利要求1所述的碼率降低方法,步驟(2)中的輪廓檢測時(shí),將視頻幀是否含有被 檢測輪廓對象作為結(jié)果A,檢測出的具體輪廓對象信息作為結(jié)果B,輪廓檢測結(jié)果c是結(jié) 果A,或者結(jié)果B,或者是結(jié)果A和B的組合。
7、 根據(jù)權(quán)利要求1所述的碼率降低方法,步驟(2)中的運(yùn)動(dòng)檢測時(shí),將視頻幀是否含有運(yùn) 動(dòng)信息作為結(jié)果A,檢測出的具體運(yùn)動(dòng)信息作為結(jié)果B,運(yùn)動(dòng)檢測結(jié)果m是結(jié)果A,或者 結(jié)果B,或者是結(jié)果A和B的組合。
8、 根據(jù)權(quán)利要求1所述的碼率降低方法,步驟(2)中的輪廓檢測結(jié)果c,運(yùn)動(dòng)檢測m以及 碼率調(diào)節(jié)參數(shù)p維數(shù)均是是一維或多維。
全文摘要
本發(fā)明專利在視頻壓縮領(lǐng)域,針對監(jiān)控視頻這類非常特殊的視頻,提出了一種基于輪廓檢測和運(yùn)動(dòng)檢測來調(diào)節(jié)碼率控制參數(shù)的方法。監(jiān)控視頻有這樣一些特點(diǎn)(1)監(jiān)控時(shí)間比較長,造成監(jiān)控視頻數(shù)據(jù)量非常龐大。(2)監(jiān)控目的性比較明確。(3)監(jiān)控視頻中很多時(shí)候會有畫面無變化現(xiàn)象。從特點(diǎn)(1)來看監(jiān)控視頻數(shù)據(jù)量的龐大意味著需要昂貴的存儲設(shè)備,因此增大監(jiān)控視頻壓縮比勢在必行。但是增大壓縮比就會使視頻中的圖像質(zhì)量變差,因此也不能過大的增加壓縮比,否則會使監(jiān)控失去意義。由于特點(diǎn)(2)(3)的存在使大幅度增加壓縮比又成為可能,本方法通過輪廓檢測和運(yùn)動(dòng)檢測動(dòng)態(tài)地調(diào)節(jié)視頻壓縮碼率控制參數(shù)。智能地檢測出視頻中是否存在被監(jiān)控的對象,如果不存在可以適當(dāng)加大該段視頻的壓縮比,如果存在可以保持原來壓縮比或者適當(dāng)降低壓縮比,使視頻圖像變得更加清晰。本專利提出的方法在增大監(jiān)控視頻壓縮比的同時(shí)還使被監(jiān)控對象更加清晰,為監(jiān)控視頻壓縮開拓了一條新大道。具體的實(shí)現(xiàn)過程可以參照摘要附圖。
文檔編號H04N7/26GK101262608SQ20071007972
公開日2008年9月10日 申請日期2007年3月6日 優(yōu)先權(quán)日2007年3月6日
發(fā)明者陸云昆 申請人:陸云昆