專利名稱:一種網(wǎng)絡(luò)色情視頻實時檢測方法和系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及網(wǎng)絡(luò)色情視頻檢測技術(shù)領(lǐng)域,特別是涉及一種網(wǎng)絡(luò)色情視頻實時檢測 方法和系統(tǒng)。
背景技術(shù):
隨著網(wǎng)絡(luò)帶寬和視頻技術(shù)的飛速發(fā)展,網(wǎng)絡(luò)視頻的數(shù)量以及用戶規(guī)模都呈現(xiàn)巨大 增長。隨之而來,網(wǎng)絡(luò)上色情視頻泛濫的問題也日趨嚴(yán)重,并已嚴(yán)重干擾、污染現(xiàn)有網(wǎng)絡(luò)環(huán) 境。為了凈化網(wǎng)絡(luò)空間,遏制網(wǎng)絡(luò)上色情視頻的肆意泛濫,一個非常重要的技術(shù)手段就是應(yīng) 用針對網(wǎng)絡(luò)視頻的色情內(nèi)容檢測技術(shù),對網(wǎng)絡(luò)視頻進(jìn)行有效監(jiān)管。現(xiàn)有的色情視頻檢測方法都是針對傳統(tǒng)視頻節(jié)目的檢測方法,并沒有專門針對網(wǎng) 絡(luò)視頻的檢測方法。現(xiàn)有色情視頻檢測方法首先要對視頻進(jìn)行結(jié)構(gòu)化處理,即把視頻節(jié)目 分割成鏡頭,后續(xù)的檢測將以鏡頭作為單元進(jìn)行判定。在對一個鏡頭的判定中,目前主要 采用的是基于學(xué)習(xí)模型的判定方法,即通過機器學(xué)習(xí)得到一個色情內(nèi)容判定的模型,依據(jù) 該模型對鏡頭是否包含色情內(nèi)容做出判定。其中,模型判定的性能主要依賴于所提取的特 征。目前,所采用的特征主要來源于三方面,其一是幀級特征,即從鏡頭里抽取關(guān)鍵幀,在關(guān) 鍵幀上提取特征,這些特征通常是基于人臉檢測,膚色檢測,軀干檢測等的檢測結(jié)果構(gòu)造而 成;其二是時序特征,即從鏡頭里提取運動信息來構(gòu)造特征,這些特征反映的是鏡頭內(nèi)容的 變化;其三是音頻特征,即從鏡頭片段里提取音頻信息來構(gòu)造特征。但是,由于網(wǎng)絡(luò)視頻數(shù)據(jù)量巨大且傳播非常迅速,因而網(wǎng)絡(luò)色情視頻檢測技術(shù)必 須是高效率的檢測,否則將沒有應(yīng)用前景。而現(xiàn)有方法由于針對的是傳統(tǒng)視頻節(jié)目,其應(yīng)用 多是離線處理,因而對檢測效率并不看重。具體來說,把現(xiàn)有方法直接應(yīng)用在網(wǎng)絡(luò)色情視頻 檢測上,主要存在如下三個問題嚴(yán)重影響網(wǎng)絡(luò)色情視頻的檢測效率和檢測性能(1)鏡頭分割耗時且冗余。傳統(tǒng)視頻節(jié)目(電視節(jié)目,電影)通常時間長度較長, 并具有完整的視頻結(jié)構(gòu)(場景,鏡頭),因而在檢測之前,對視頻進(jìn)行鏡頭分割是必要的。但 是,網(wǎng)絡(luò)視頻通常時間長度較短,內(nèi)容較為單一,并且所含鏡頭也相對較少。此時,耗時的鏡 頭分割處理就顯得沒有必要。(2)基于模型的檢測方法在線計算量大?;谀P偷臋z測方法在判定時通常要進(jìn) 行復(fù)雜的計算,并且計算量是隨著訓(xùn)練樣本的增多而增加的。這大大影響了檢測程序在線 運行的效率。(3)特征攜帶大量噪聲。由于網(wǎng)絡(luò)視頻的視覺質(zhì)量參差不齊,傳統(tǒng)方法中所提取的 精細(xì)特征(例如軀干檢測,皮膚紋理分析,音頻特征)在網(wǎng)絡(luò)視頻上性能波動較大,這些特 征會給檢測過程帶來噪聲干擾。
發(fā)明內(nèi)容
本發(fā)明的目的在于提供一種網(wǎng)絡(luò)色情視頻實時檢測方法和系統(tǒng)。其結(jié)合網(wǎng)絡(luò)視頻 數(shù)據(jù)的特點,制定高效的抽幀和多幀結(jié)果融合策略,有效地提高了檢測效率。
為實現(xiàn)本發(fā)明的目的而提供的一種網(wǎng)絡(luò)色情視頻實時檢測方法,包括下列步驟步驟100.根據(jù)網(wǎng)絡(luò)視頻的長度,建立關(guān)鍵幀預(yù)抽取幀號隊列KFN = In1, n2,…, %},其中 Ii1 < n2 <...< nN ;步驟200.根據(jù)步驟100確定的關(guān)鍵幀預(yù)抽取幀號隊列,按順序抽取一幀關(guān)鍵幀并
解碼;步驟300.對步驟200得到解碼后的關(guān)鍵幀進(jìn)行色情內(nèi)容檢測,判斷該關(guān)鍵幀是否 包含色情內(nèi)容;步驟400.根據(jù)步驟300得到的對單個關(guān)鍵幀色情內(nèi)容的檢測結(jié)果,連同之前得 到的其他關(guān)鍵幀的檢測結(jié)果,進(jìn)行決策融合判定如果判定“是”,則認(rèn)為該視頻包含色情內(nèi) 容,結(jié)束檢測;如果判定“否”,則認(rèn)為該視頻不包含色情內(nèi)容,結(jié)束檢測;如果判定“不定”, 則返回步驟200,繼續(xù)進(jìn)行單個關(guān)鍵幀的檢測。所述步驟100,包括下列步驟步驟110.如果視頻長度小于或等于L秒,則將根據(jù)公式⑴等間隔抽取N1幀關(guān)
鍵幀作為預(yù)抽取策略
權(quán)利要求
1.一種網(wǎng)絡(luò)色情視頻實時檢測方法,其特征在于,所述方法,包括下列步驟步驟100.根據(jù)網(wǎng)絡(luò)視頻的長度,建立關(guān)鍵幀預(yù)抽取幀號隊列KFN= In1, n2,···,%}, 其中 Ii1 < n2 <丨< nN ;步驟200.根據(jù)步驟100確定的關(guān)鍵幀預(yù)抽取幀號隊列,按順序抽取一幀關(guān)鍵幀并解碼;步驟300.對步驟200得到解碼后的關(guān)鍵幀進(jìn)行色情內(nèi)容檢測,判斷該關(guān)鍵幀是否包含 色情內(nèi)容;步驟400.根據(jù)步驟300得到的對單個關(guān)鍵幀色情內(nèi)容的檢測結(jié)果,連同之前得到的其 他關(guān)鍵幀的檢測結(jié)果,進(jìn)行決策融合判定如果判定“是”,則認(rèn)為該視頻包含色情內(nèi)容,結(jié) 束檢測;如果判定“否”,則認(rèn)為該視頻不包含色情內(nèi)容,結(jié)束檢測;如果判定“不定”,則返 回步驟200,繼續(xù)進(jìn)行單個關(guān)鍵幀的檢測。
2.根據(jù)權(quán)利要求1所述的網(wǎng)絡(luò)色情視頻實時檢測方法,其特征在于,所述步驟100,包 括下列步驟步驟110.如果視頻長度小于或等于L秒,則將根據(jù)公式(1)等間隔抽取N1幀關(guān)鍵幀作為預(yù)抽取策略^^ ⑴! #!+1 1其中,Hi是第i個關(guān)鍵幀的幀號,W是視頻的總幀數(shù),L取值5到10之間,N1取值5到 20之間;步驟120.如果視頻長度大于L秒,則將根據(jù)公式(2)對視頻中間的視頻段等間隔 抽取隊幀關(guān)鍵幀作為預(yù)抽取策略Tii =Nr+l~^~, i = \,2”..,N2, Nr =JVx(l-r%)/2(2)N2 + 1其中,Iii是第i個關(guān)鍵幀的幀號,W是視頻的總幀數(shù),所述r取值50到90之間,隊取值 20到100之間。
3.根據(jù)權(quán)利要求1所述的網(wǎng)絡(luò)色情視頻實時檢測方法,其特征在于,所述步驟200,包 括下列步驟步驟210.根據(jù)所述關(guān)鍵幀預(yù)抽取幀號隊列,從視頻中抽取一幀關(guān)鍵幀,該幀的幀號為 當(dāng)前KFN中的最小幀號;步驟220.解碼抽取的所述關(guān)鍵幀抽;步驟230.從KFN中刪去所述幀號,返回步驟210。
4.根據(jù)權(quán)利要求1所述的網(wǎng)絡(luò)色情視頻實時檢測方法,其特征在于,所述步驟300,包 括下列步驟步驟310.對所述關(guān)鍵幀進(jìn)行多角度正面人臉檢測,并根據(jù)檢測結(jié)果計算“正面人 臉-圖像比”表示關(guān)鍵幀所有像素點中正面人臉像素點所占的比例;步驟320.對關(guān)鍵幀進(jìn)行多角度側(cè)面人臉檢測,并根據(jù)檢測結(jié)果計算“側(cè)面人臉-圖像 比”表示關(guān)鍵幀所有像素點中側(cè)面人臉像素點所占的比例;步驟330.對關(guān)鍵幀進(jìn)行多角度半身人體檢測,并根據(jù)檢測結(jié)果計算“半身人體-圖像 比”表示關(guān)鍵幀所有像素點中半身人體像素點所占的比例;步驟340.采用貝葉斯方法,根據(jù)公式C3)所示的比較結(jié)果,對關(guān)鍵幀進(jìn)行皮膚區(qū)域檢 測,并根據(jù)檢測結(jié)果計算“皮膚-圖像比”表示關(guān)鍵幀所有像素點中皮膚像素點所占的比例P(p/skin)/P(p/non-skin)彡 T8(3)其中,P表示關(guān)鍵幀中任一個像素點,P(p/skin)表示膚色高斯模型下產(chǎn)生ρ的概率, P(p/non-skin)表示非膚色高斯模型下產(chǎn)生ρ的概率,如果公式(;3)成立,則判斷ρ為皮膚 像素點,否則判斷P為非皮膚像素點,T8取值在1到10之間,該閾值控制單幀色情內(nèi)容檢測 的精度。步驟350.基于步驟310-340得到的檢測結(jié)果,計算“身體皮膚-正面人臉比”表示關(guān) 鍵幀中身體皮膚像素點與正面人臉像素點的個數(shù)之比;以及“身體皮膚-側(cè)面人臉比”表示 關(guān)鍵幀中身體皮膚像素點與側(cè)面人臉像素點的個數(shù)之比;步驟360.根據(jù)步驟310-350得到的計算結(jié)果,判斷所述關(guān)鍵幀是否包含色情內(nèi)容,判 定規(guī)則如下如果Ttl彡半身人體-圖像比彡T1且T2彡皮膚-圖像比彡T3且正面人臉-圖 像比< T4且側(cè)面人臉-圖像比< T5且身體皮膚-正面人臉比彡T6且身體皮膚-側(cè)面人臉 比》T7,則判定關(guān)鍵幀包含色情內(nèi)容,否則判斷不包含色情內(nèi)容,其中1\、T2, T3, T4, T5取值 都在0到1之間,T6和T7取值都在1到10之間。
5.根據(jù)權(quán)利要求1所述的網(wǎng)絡(luò)色情視頻實時檢測方法,其特征在于,所述步驟400,包 括下列步驟步驟410.統(tǒng)計已檢測的N。幀關(guān)鍵幀中,判定為包含色情內(nèi)容的關(guān)鍵幀數(shù)目Np;步驟420.令N為步驟100確定的所需抽取關(guān)鍵幀的數(shù)目,如果Np/N ^ Tp,判定為“是”; 如果(Ν。_ΝΡ) /N彡(I-Tp),判定為“否”;否則判定為“不定”;其中Tp取值在0到1之間,該 閾值控制色情視頻檢測的精度。
6.一種網(wǎng)絡(luò)色情視頻實時檢測系統(tǒng),其特征在于,所述系統(tǒng),包括關(guān)鍵幀預(yù)抽取隊列構(gòu)建單元,用于根據(jù)網(wǎng)絡(luò)視頻的長度,建立關(guān)鍵幀預(yù)抽取幀號隊列 KFN= Inpn2,…,ηΝ},其中 Ii1 < η2 <".< ηΝ ;關(guān)鍵幀抽取單元,用于根據(jù)所述關(guān)鍵幀預(yù)抽取幀號隊列,按順序抽取一幀關(guān)鍵幀并解碼;關(guān)鍵幀檢測單元,用于對解碼后的關(guān)鍵幀進(jìn)行色情內(nèi)容檢測,判斷該關(guān)鍵幀是否包含 色情內(nèi)容;視頻內(nèi)容檢測單元,用于根據(jù)得到的對單個關(guān)鍵幀色情內(nèi)容的檢測結(jié)果,連同之前得 到的其他關(guān)鍵幀的檢測結(jié)果,進(jìn)行決策融合判定如果判定“是”,則認(rèn)為該視頻包含色情內(nèi) 容,結(jié)束檢測;如果判定“否”,則認(rèn)為該視頻不包含色情內(nèi)容,結(jié)束檢測;如果判定“不定”, 則觸發(fā)關(guān)鍵幀抽取單元,繼續(xù)進(jìn)行單個關(guān)鍵幀的檢測。
7.根據(jù)權(quán)利要求6所述的網(wǎng)絡(luò)色情視頻實時檢測系統(tǒng),其特征在于,所述關(guān)鍵幀預(yù)抽 取隊列構(gòu)建單元,包括抽取策略模塊,根據(jù)視頻的長度提供相應(yīng)抽取策略如果視頻長度小于或等于L秒,則將根據(jù)公式(1)等間隔抽取N1幀關(guān)鍵幀作為預(yù)抽取 策略U1 = = \,2”..,Νλ(1)TV1 +1其中,Hi是第i個關(guān)鍵幀的幀號,W是視頻的總幀數(shù),L取值5到10之間,N1取值5到 20之間;如果視頻長度大于L秒,則將根據(jù)公式(2)對視頻中間的視頻段等間隔抽取N2幀 關(guān)鍵幀作為預(yù)抽取策略
8.根據(jù)權(quán)利要求6所述的網(wǎng)絡(luò)色情視頻實時檢測系統(tǒng),其特征在于,所述關(guān)鍵幀抽取 單元,包括解碼模塊,用于解碼抽取的關(guān)鍵幀抽。
9.根據(jù)權(quán)利要求6所述的網(wǎng)絡(luò)色情視頻實時檢測系統(tǒng),其特征在于,所述關(guān)鍵幀檢測 單元,包括正面人臉檢測模塊,用于對所述關(guān)鍵幀進(jìn)行多角度正面人臉檢測,并根據(jù)檢測結(jié)果計 算“正面人臉-圖像比”表示關(guān)鍵幀所有像素點中正面人臉像素點所占的比例;側(cè)面人臉檢測模塊,用于對關(guān)鍵幀進(jìn)行多角度側(cè)面人臉檢測,并根據(jù)檢測結(jié)果計算“側(cè) 面人臉-圖像比”表示關(guān)鍵幀所有像素點中側(cè)面人臉像素點所占的比例;半身人體檢測模塊,用于對關(guān)鍵幀進(jìn)行多角度半身人體檢測,并根據(jù)檢測結(jié)果計算“半 身人體-圖像比”表示關(guān)鍵幀所有像素點中半身人體像素點所占的比例;皮膚區(qū)域檢測模塊,用于采用貝葉斯方法,根據(jù)公式C3)所示的比較結(jié)果,對關(guān)鍵幀進(jìn) 行皮膚區(qū)域檢測,并根據(jù)檢測結(jié)果計算“皮膚-圖像比”表示關(guān)鍵幀所有像素點中皮膚像素 點所占的比例P(p/skin)/P(p/non-skin)彡 T8(3)其中,P表示關(guān)鍵幀中任一個像素點,P(p/skin)表示膚色高斯模型下產(chǎn)生ρ的概率, P(p/non-skin)表示非膚色高斯模型下產(chǎn)生ρ的概率,如果公式(;3)成立,則判斷ρ為皮膚 像素點,否則判斷P為非皮膚像素點,T8取值在1到10之間,該閾值控制單幀色情內(nèi)容檢測 的精度。比例計算模塊,用于根據(jù)檢測結(jié)果,計算“身體皮膚-正面人臉比”表示關(guān)鍵幀中身體 皮膚像素點與正面人臉像素點的個數(shù)之比;以及“身體皮膚-側(cè)面人臉比”表示關(guān)鍵幀中身 體皮膚像素點與側(cè)面人臉像素點的個數(shù)之比;判定模塊,用于根據(jù)計算結(jié)果,判斷所述關(guān)鍵幀是否包含色情內(nèi)容,判定規(guī)則如下如 果Ttl彡半身人體-圖像比彡T1且T2彡皮膚-圖像比彡T3且正面人臉-圖像比彡T4且側(cè) 面人臉-圖像比彡T5且身體皮膚-正面人臉比彡T6且身體皮膚-側(cè)面人臉比彡T7,則判 定關(guān)鍵幀包含色情內(nèi)容,否則判斷不包含色情內(nèi)容,其中Ι\、Τ2、Τ3、Τ4、Τ5取值都在0到1之 間,T6和T7取值都在1到10之間。
10.根據(jù)權(quán)利要求6所述的網(wǎng)絡(luò)色情視頻實時檢測系統(tǒng),其特征在于,視頻內(nèi)容檢測單 元,包括統(tǒng)計模塊,用于統(tǒng)計已檢測的N。幀關(guān)鍵幀中,判定為包含色情內(nèi)容的關(guān)鍵幀數(shù)目Np ;色情視頻判定模塊,令N為所述關(guān)鍵幀預(yù)抽取隊列中關(guān)鍵幀的數(shù)目,如果Np/N ^ Τρ,判定為“是”;如果(N。_NP) /N≥(I-Tp),判定為“否”;否則判定為“不定”;其中Tp取值在0到 1之間,該閾值控制色情視頻檢測的精度。
全文摘要
本發(fā)明公開了一種網(wǎng)絡(luò)色情視頻實時檢測方法和系統(tǒng)。所述方法包括下列步驟根據(jù)網(wǎng)絡(luò)視頻的長度,建立關(guān)鍵幀預(yù)抽取幀號隊列KFN={n1,n2,…,nN},其中n1<n2<…<nN;根據(jù)所述關(guān)鍵幀預(yù)抽取幀號隊列,按順序抽取一幀關(guān)鍵幀并解碼;對解碼后的關(guān)鍵幀進(jìn)行色情內(nèi)容檢測,判斷該關(guān)鍵幀是否包含色情內(nèi)容;根據(jù)對單個關(guān)鍵幀色情內(nèi)容的檢測結(jié)果,連同之前得到的其他關(guān)鍵幀的檢測結(jié)果,進(jìn)行決策融合判定如果判定“是”,則認(rèn)為該視頻包含色情內(nèi)容,結(jié)束檢測;如果判定“否”,則認(rèn)為該視頻不包含色情內(nèi)容,結(jié)束檢測;如果判定“不定”,則繼續(xù)進(jìn)行單個關(guān)鍵幀的檢測。
文檔編號G06F17/30GK102073676SQ20101056830
公開日2011年5月25日 申請日期2010年11月30日 優(yōu)先權(quán)日2010年11月30日
發(fā)明者萬吉, 劉武, 夏添, 張勇東, 李錦濤, 黃磊 申請人:中國科學(xué)院計算技術(shù)研究所