專利名稱:Wap手機(jī)傳媒色情圖像、視頻及不良內(nèi)容的識別監(jiān)管平臺的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種手機(jī)互聯(lián)網(wǎng)信息內(nèi)容的識別、監(jiān)管系統(tǒng)平臺,特別是涉及一種WAP 手機(jī)傳媒不良內(nèi)容的識別、監(jiān)管平臺。
背景技術(shù):
移動通信網(wǎng)和互聯(lián)網(wǎng)是當(dāng)前信息產(chǎn)業(yè)的兩大支柱,且隨著通訊技術(shù)的進(jìn)步不斷迅猛發(fā)展的。而手機(jī)互聯(lián)網(wǎng)具有將這兩大領(lǐng)域結(jié)合的優(yōu)勢與能力,引發(fā)了我國手機(jī)互聯(lián)網(wǎng)用戶的迅猛發(fā)展,隨著3G技術(shù)的進(jìn)步和3G業(yè)務(wù)的廣泛開展,帶寬明顯增加,手機(jī)互聯(lián)網(wǎng)開始滲透和融合到社會、生活、學(xué)習(xí)、娛樂和產(chǎn)業(yè)的各個環(huán)節(jié),權(quán)威人士估計(jì),到2011年底我國手機(jī)互聯(lián)網(wǎng)用戶數(shù)將會超過傳統(tǒng)互聯(lián)網(wǎng),屆時將達(dá)到4億以上。由于手機(jī)不受時間、地點(diǎn)、 環(huán)境的限制隨時隨地都可以上網(wǎng),十分方便,加上交互的便利性,因而趕時尚的青少年自然成為手機(jī)上網(wǎng)的主力軍。19歲以下的青少年,約占我國手機(jī)網(wǎng)民總數(shù)的40%。
然而近年來,淫穢色情內(nèi)容正猛烈地向手機(jī)互聯(lián)網(wǎng)滲透,由于暴利的驅(qū)使,監(jiān)管的困難,大量的手機(jī)WAP網(wǎng)站被淫穢內(nèi)容染指。赤裸裸的色情圖像和視頻,只要通過手機(jī)上網(wǎng)就唾手可得,甚至推送到你的手機(jī)上,引誘你下載瀏覽。
“目前大多數(shù)WAP網(wǎng)站公布的同時在線人數(shù)都達(dá)到了 5位數(shù),而一線門戶網(wǎng)站基本都在6位數(shù)以上”。再加上手機(jī)傳播的低成本、私密性和易用性,互動性,非常容易將色情圖像與他人分享,手機(jī)色情內(nèi)容傳播的廣泛性遠(yuǎn)遠(yuǎn)超過想象。這對青少年具有相當(dāng)大的吸引力,更容易誘使鑒別能力差、受好奇心驅(qū)使的未成年人誤入歧途,誘發(fā)犯罪。據(jù)調(diào)查,北京市 60%以上的中學(xué)生手機(jī)上都有赤裸裸的色情圖片,沒有的反被說成是OUT。為逃避監(jiān)管,色情WAP網(wǎng)站會設(shè)置IP地址訪問權(quán)限,只允許手機(jī)用戶訪問,或只允許手機(jī)用戶通過移動夢網(wǎng)服務(wù)訪問非法WAP網(wǎng)站,電腦模擬器訪問不到淫穢色情WAP網(wǎng)站的實(shí)際內(nèi)容。通過設(shè)置 IP地址訪問權(quán)限來逃避WAP網(wǎng)站的監(jiān)管。手機(jī)互聯(lián)網(wǎng)正在取代電腦網(wǎng)絡(luò)成為學(xué)生接觸色情信息的主要渠道。而家長監(jiān)管遠(yuǎn)較PC機(jī)為難。
手機(jī)互聯(lián)網(wǎng)淫穢色情圖像、視頻等不良信息具有以下特點(diǎn)1)手機(jī)互聯(lián)網(wǎng)上手機(jī)上傳或?yàn)g覽下載的數(shù)據(jù)信息是要經(jīng)過WAP網(wǎng)關(guān)轉(zhuǎn)換,帶寬窄,圖像傳輸速率低,但用戶多, 總量大;2)隱蔽性強(qiáng),采取偽裝措施,發(fā)現(xiàn)難;3)地址跳轉(zhuǎn)快;4)很多涉黃網(wǎng)站是通過搜索引擎和導(dǎo)航網(wǎng)站來傳播;5)許多藏身于境外;6)手機(jī)網(wǎng)站主要面向手機(jī)用戶訪問使用,有的網(wǎng)站限制、屏蔽來自互聯(lián)網(wǎng)的訪問,致使人工監(jiān)管難度加大。
因此,采用人工方式進(jìn)行觀看肯定不能滿足信息膨脹的需求,同時采用撥測方式對數(shù)據(jù)進(jìn)行主動采集,也會因?yàn)槭謾C(jī)互聯(lián)網(wǎng)特殊的環(huán)境遇到種種困難,使得監(jiān)管效果達(dá)不到指定要求。因此手機(jī)互聯(lián)網(wǎng)服務(wù)已成為國家網(wǎng)絡(luò)安全的巨大隱患。日本的3G運(yùn)營后, 9000萬手機(jī)網(wǎng)民每天下載的成人影視常常使3G網(wǎng)絡(luò)超載。過去的人工監(jiān)管方法已無能為力。而當(dāng)前對手機(jī)互聯(lián)網(wǎng)色情圖片與視頻內(nèi)容的自動識別技術(shù)又特別缺乏,無法進(jìn)行有效的監(jiān)控和管理。
2009年新疆烏魯木齊“75”事件中,境內(nèi)外“三股勢力”利用手機(jī)互聯(lián)網(wǎng)大肆制造、散播謠言,制造民族矛盾,利用網(wǎng)絡(luò)視頻挑起民族仇恨,煽動暴動。因此手機(jī)互聯(lián)網(wǎng)服務(wù)已成為國家網(wǎng)絡(luò)安全的巨大隱患。“75”事件凸顯了加強(qiáng)信息監(jiān)督管理、保障信息安全的重要性和緊迫性。政府應(yīng)當(dāng)建立和完善網(wǎng)絡(luò)信息安全監(jiān)控體系,對網(wǎng)上傳播的信息進(jìn)行嚴(yán)格識別,提高信息系統(tǒng)的安全防御能力和處理信息安全突發(fā)事件的能力,使其有效防控互聯(lián)網(wǎng)、 手機(jī)互聯(lián)網(wǎng)犯罪,做到及時識別發(fā)現(xiàn)、及時監(jiān)管、及時處理。防止事態(tài)擴(kuò)大。
因此對手機(jī)互聯(lián)網(wǎng)不良圖像、視頻內(nèi)容及危害國家安全內(nèi)容,只有用高技術(shù)手段智能識別過濾,構(gòu)建基礎(chǔ)防線才能根本解決這一難題,而此前這是空白。發(fā)明內(nèi)容
本發(fā)明基于上述技術(shù)背景,針對WAP手機(jī)圖像數(shù)據(jù)海量的存在及其特點(diǎn),提出一種旁路監(jiān)聽的WAP手機(jī)傳媒色情圖像識別與監(jiān)管平臺。
本發(fā)明所采用的技術(shù)方案一種WAP手機(jī)傳媒色情圖像、視頻及不良內(nèi)容的識別監(jiān)管平臺,所述識別、監(jiān)管平臺包括至少一個圖像采集檢測主服務(wù)器和至少一個圖像采集檢測從服務(wù)器,WAP業(yè)務(wù)數(shù)據(jù)鏡像口從CDMA或GSM網(wǎng)絡(luò)中鏡像WAP業(yè)務(wù)數(shù)據(jù),傳送到圖像采集檢測主服務(wù)器和圖像采集檢測從服務(wù)器,所述圖像采集檢測主服務(wù)器和從服務(wù)器通過內(nèi)部數(shù)據(jù)網(wǎng)連接后臺數(shù)據(jù)庫和監(jiān)控終端,系統(tǒng)軟件架構(gòu)包括采集控制層、數(shù)據(jù)審核層、數(shù)據(jù)管理層、數(shù)據(jù)呈現(xiàn)層,其中采集控制層將采集到的高帶寬數(shù)據(jù)經(jīng)協(xié)議解析還原為原始的圖像幀和文本信息, 進(jìn)行不良內(nèi)容訪問阻斷與提醒,并在前端將URL去重,將完全相同的不良圖像去重,以提高檢測速度,然后將還原的圖片、視頻、文字內(nèi)容通過接口送至數(shù)據(jù)審核層;數(shù)據(jù)審核層分別對文字、圖像、視頻進(jìn)行自動審核,并將獲取的不良信息內(nèi)容傳輸?shù)綌?shù)據(jù)管理層;數(shù)據(jù)管理層實(shí)現(xiàn)系統(tǒng)全局?jǐn)?shù)據(jù)的統(tǒng)一管理和多維數(shù)據(jù)統(tǒng)計(jì);呈現(xiàn)層對全局?jǐn)?shù)據(jù)進(jìn)行審計(jì),阻斷不良內(nèi)容、封鎖不良網(wǎng)址,給出需要的審計(jì)報(bào)表。
所述的WAP手機(jī)傳媒色情圖像、視頻及不良內(nèi)容的識別監(jiān)管平臺,設(shè)有完備的自身管理和其他接口,接口包括預(yù)留向其他系統(tǒng)同步黑名單接口和數(shù)據(jù)上傳到第三方系統(tǒng)的北向接口。
所述的WAP手機(jī)傳媒色情圖像、視頻及不良內(nèi)容的識別監(jiān)管平臺,數(shù)據(jù)審核層包括區(qū)域膚色分割加人臉識別的圖像識別算法模型和網(wǎng)絡(luò)視頻識別算法模型;所述網(wǎng)絡(luò)視頻識別算法模型,采用基于Directshow的通用視頻解碼技術(shù)識別網(wǎng)絡(luò)視頻流;然后通過滑動窗口技術(shù),按一定的策略獲取視頻流的關(guān)鍵幀,最后對關(guān)鍵幀采用前述的圖像識別算法進(jìn)行識別,當(dāng)視頻段的中所識別的關(guān)鍵幀為不良圖像達(dá)到一個確定數(shù)量時便判為該視頻為不良視頻,低于該數(shù)量為正常視頻或可疑視頻。所述的WAP手機(jī)傳媒色情圖像、視頻及不良內(nèi)容的識別監(jiān)管平臺,WAP業(yè)務(wù)數(shù)據(jù)鏡像口將來自無線協(xié)議棧的請求翻譯到WWW協(xié)議棧中并加以優(yōu)化;通過圖像采集檢測服務(wù)器對手機(jī)色情圖像及危害國家安全內(nèi)容進(jìn)行識別,得出“正常圖像”、“可疑圖像”、“色情圖像”三種結(jié)論,并以監(jiān)控終端上的實(shí)時檢測報(bào)告方式進(jìn)行報(bào)警;然后將色情圖像、危害國家安全的內(nèi)容及查到的對應(yīng)網(wǎng)址記錄在案在后臺數(shù)據(jù)庫中,后臺數(shù)據(jù)庫建有經(jīng)篩選的全局的海量標(biāo)準(zhǔn)的色情圖像樣本集,其中的色情圖像按色情指數(shù)進(jìn)行排列。
所述的WAP手機(jī)傳媒色情圖像、視頻及不良內(nèi)容的識別監(jiān)管平臺,圖像采集檢測服務(wù)器包括高速采集核心算法和圖像視頻快速識別核心算法以及與核心算法相匹配的 FPGA高速采集運(yùn)算卡,采集識別與硬卡合一,以加快采集識別速度;圖像采集檢測服務(wù)器采集 IOG 光口電口的 HTTP、FTP、WAP、GPRS、RADIUS、P2P 的 BT、電驢、QQLIVE、PLIVE 等多協(xié)議數(shù)據(jù),并解析還原為應(yīng)用層的圖像視頻文字內(nèi)容。本發(fā)明的有益積極效果
1、本發(fā)明WAP手機(jī)傳媒色情圖像識別與監(jiān)管平臺,率先在WAP網(wǎng)關(guān)處用旁路監(jiān)聽方法解決了手機(jī)互聯(lián)網(wǎng)海量淫穢圖像、視頻及不良信息的識別、監(jiān)管的難題。系統(tǒng)結(jié)構(gòu)包括硬件架構(gòu)和軟件架構(gòu),代替人工智能識別所有圖片、文字內(nèi)容是否含有淫穢色情及其它不良內(nèi)容。自動完成采集、識別、保存記錄、觸發(fā)操作等動作。從CDMA (或GSM)網(wǎng)絡(luò)中鏡像采集 WAP業(yè)務(wù)數(shù)據(jù),對數(shù)據(jù)解析還原成WAP圖像幀或視頻流后通過命令調(diào)度進(jìn)行圖像、視頻文字識別,得出正常圖像、視頻,色情圖像、視頻和可疑圖像、視頻,單臺圖片審計(jì)設(shè)備識別速度是每秒200幀,解決了人工根本無法全面審核的困境,提高了手機(jī)上網(wǎng)內(nèi)容審核效率。所有圖像、視頻、文字的采集、識別由“金惠圖像采集檢測服務(wù)器”來完成。2、本發(fā)明WAP手機(jī)傳媒色情圖像識別與監(jiān)管平臺,首次提出了整個識別監(jiān)管平臺四層次的軟件架構(gòu),實(shí)現(xiàn)監(jiān)管平臺對WAP手機(jī)互聯(lián)網(wǎng)不良內(nèi)容的監(jiān)管。系統(tǒng)軟件架構(gòu)分為采集控制層、數(shù)據(jù)審核層、數(shù)據(jù)管理層和呈現(xiàn)層及相應(yīng)的接口,給出了每層的軟件模塊,為識別監(jiān)管系統(tǒng)的軟件開發(fā)提供了規(guī)范。訪問記錄取證詳細(xì)、定位準(zhǔn)確。系統(tǒng)支持所有的淫穢內(nèi)容的取證,能夠詳細(xì)記錄內(nèi)容提供商的IP地址、SP代碼、內(nèi)容提供時間和訪問時間等 fn息ο3、本發(fā)明WAP手機(jī)傳媒色情圖像識別與監(jiān)管平臺,開發(fā)了基于FPGA的硬件平臺, 將圖像采集、識別算法與硬件并行處理匹配,即解決了數(shù)據(jù)的高速運(yùn)算,又保護(hù)了核心算法。系統(tǒng)全面覆蓋移動手機(jī)上網(wǎng)業(yè)務(wù),不存在任何技術(shù)盲區(qū)。系統(tǒng)同時支持2G手機(jī)和3G 手機(jī)上網(wǎng)檢測,支持IDC監(jiān)測、支持網(wǎng)關(guān)接口電路監(jiān)測,全面支持移動網(wǎng)絡(luò)內(nèi)容安全保障。4、本發(fā)明提出了基于因果的鏡頭邊界檢測方法,滿足了視頻識別實(shí)時性的要求, 首次建立了手機(jī)互聯(lián)網(wǎng)視頻識別算法模型;對分辨率低的小手機(jī)圖像提出了 “基于區(qū)域分割的膚色檢測加人臉識別的算法模型”,使對色情圖像的正確識別率>90%,對正常圖像的誤判率< 10%,識別速度200幅/秒(雙核CPU圖像檢測服務(wù)器),達(dá)到國內(nèi)外領(lǐng)先水平。5、本發(fā)明系統(tǒng)基于網(wǎng)絡(luò)旁路監(jiān)測、內(nèi)容還原和內(nèi)容識別技術(shù),能夠有效地抓取、還原和識別WAP網(wǎng)關(guān)、IDC機(jī)房服務(wù)器流入和流出流量中的色情圖像、視頻及不良信息,能準(zhǔn)確分析并截獲不良信息的數(shù)量、來源(域名和IP地址)和內(nèi)容性質(zhì),以及訪問者IP地址和訪問時間。系統(tǒng)的應(yīng)用領(lǐng)域包括(一)部署到IDC機(jī)房,監(jiān)測IDC機(jī)房的托管主機(jī)和虛擬空間。(二)部署到運(yùn)營商互聯(lián)網(wǎng)出口,監(jiān)測用戶訪問的互聯(lián)網(wǎng)上的淫穢內(nèi)容,采取屏蔽服務(wù)器地址的方式打擊淫穢內(nèi)容供應(yīng)商。(三)為相關(guān)部門配備便攜式網(wǎng)絡(luò)視頻、圖片偵測工具,滿足互聯(lián)網(wǎng)內(nèi)容安全監(jiān)管的需求。目前,國際、國內(nèi)沒有該項(xiàng)目相似技術(shù)與產(chǎn)品,是國內(nèi)移動運(yùn)營商、公安、文化、教育等系統(tǒng)急需的高技術(shù)產(chǎn)品。
圖1 本發(fā)明手機(jī)傳媒色情圖像、視頻及不良內(nèi)容的識別、監(jiān)管平臺CMDA網(wǎng)絡(luò)旁路監(jiān)聽監(jiān)控點(diǎn)的布暑示意圖2 本發(fā)明手機(jī)傳媒色情圖像、視頻及不良內(nèi)容的識別、監(jiān)管平臺GSM網(wǎng)絡(luò)旁路監(jiān)聽監(jiān)控點(diǎn)的布暑示意圖3 本發(fā)明識別、監(jiān)管平臺系統(tǒng)物理結(jié)構(gòu); 圖4 本發(fā)明手機(jī)傳媒色情圖像、視頻識別、監(jiān)管平臺的軟件架構(gòu); 圖5 基于膚色區(qū)域分割加人臉識別的圖像檢測算法模型; 圖6:視頻內(nèi)容提取關(guān)鍵幀。
具體實(shí)施例方式實(shí)施例一參見圖1 圖5,本發(fā)明WAP手機(jī)傳媒色情圖像、視頻及不良內(nèi)容的識另IJ、監(jiān)管平臺,包括至少一個圖像采集檢測主服務(wù)器和至少一個圖像采集檢測從服務(wù)器, WAP業(yè)務(wù)數(shù)據(jù)鏡像口從CDMA或GSM網(wǎng)絡(luò)中鏡像WAP業(yè)務(wù)數(shù)據(jù),傳送到圖像采集檢測主服務(wù)器和圖像采集檢測從服務(wù)器,所述圖像采集檢測主服務(wù)器和從服務(wù)器通過內(nèi)部數(shù)據(jù)網(wǎng)連接后臺數(shù)據(jù)庫和監(jiān)控終端,系統(tǒng)軟件架構(gòu)包括采集控制層、數(shù)據(jù)審核層、數(shù)據(jù)管理層、數(shù)據(jù)呈現(xiàn)層,其中
采集控制層將采集到的高帶寬數(shù)據(jù)經(jīng)協(xié)議解析還原為原始的圖像幀和文本信息, 進(jìn)行不良內(nèi)容訪問阻斷與提醒,并在前端將URL去重,將完全相同的不良圖像去重,以提高檢測速度,然后將還原的圖片、視頻、文字內(nèi)容通過接口送至數(shù)據(jù)審核層;實(shí)現(xiàn)了 IOG(光口或電口)高帶寬WAP上網(wǎng)數(shù)據(jù)采集,手機(jī)用戶訪問CMNET數(shù)據(jù)采集,支持IDC機(jī)房出口數(shù)據(jù)采集,支持移動出口電路和網(wǎng)關(guān)電路出口采集。能夠采集和還原用戶上網(wǎng)瀏覽的多種網(wǎng)絡(luò)協(xié)議下(HTTP、FTP、BBS、WAP、GRPS及P2P的BT、電驢、Plive、Qqlive等多種應(yīng)用協(xié)議)的文字、圖像、視頻等內(nèi)容。數(shù)據(jù)審核層在該層分別對文字、圖像、視頻進(jìn)行自動審核;并將獲取的不良信息內(nèi)容傳輸?shù)綌?shù)據(jù)管理層;數(shù)據(jù)審核層獲取的不良的信息內(nèi)容,特別是淫穢色情的圖像、視頻內(nèi)容、危害國家安全的內(nèi)容及相應(yīng)的IP地址、URL、SP代碼和查找到的不良信息源的物理地址,都要傳到數(shù)據(jù)管理層。數(shù)據(jù)管理層實(shí)現(xiàn)了系統(tǒng)全局?jǐn)?shù)據(jù)的統(tǒng)一管理和多維數(shù)據(jù)統(tǒng)計(jì)。全局(13個或更多省直轄市的“中國移動分公司”)不良的信息內(nèi)容通過網(wǎng)絡(luò)傳到北京總公司,去掉重復(fù)的圖像、視頻及相應(yīng)的IP地址后在J2EE平臺下按色情指數(shù)統(tǒng)一建庫,為快速檢索非結(jié)構(gòu)性的圖像數(shù)據(jù),我們采用科學(xué)的建庫方法。并建有多種要求的統(tǒng)計(jì)報(bào)表,作為管理的基礎(chǔ)數(shù)據(jù)和各分公司共享的統(tǒng)一參考數(shù)據(jù)。對于危害國家安全的內(nèi)容的敏感內(nèi)容,單獨(dú)列項(xiàng)管理。數(shù)據(jù)呈現(xiàn)層該層對全局?jǐn)?shù)據(jù)進(jìn)行全面審計(jì),阻斷不良內(nèi)容、封鎖不良網(wǎng)址,給出需要的審計(jì)報(bào)表。審計(jì)的主要內(nèi)容是上網(wǎng)行為分析,發(fā)現(xiàn)撲捉敏感信息,并跟蹤定位。對違法網(wǎng)站訪問內(nèi)容、時間、次數(shù)等進(jìn)行統(tǒng)計(jì)分析和歷史對比分析。對網(wǎng)站訪問、遠(yuǎn)程終端訪問、 數(shù)據(jù)庫訪問、即時通信、論壇文章、微博文章、P2P下載等進(jìn)行關(guān)聯(lián)分析。WAP協(xié)議網(wǎng)關(guān)將來自無線協(xié)議棧的請求(例如WSP、WTP、WTLS、WDP等)翻譯到WffW 協(xié)議棧(HTTP、SSL和TCP/IP)中并加以優(yōu)化;通過圖像采集檢測主服務(wù)器和從服務(wù)器對手機(jī)色情圖像及危害國家安全內(nèi)容進(jìn)行識別,得出“正常圖像”、“可疑圖像”、“色情圖像”等三種結(jié)論,以監(jiān)控終端上的實(shí)時檢測報(bào)告方式進(jìn)行報(bào)警。將色情圖像、危害國家安全的內(nèi)容及查到的對應(yīng)網(wǎng)址記錄在案在數(shù)據(jù)庫中,其中的色情圖像按色情指數(shù)進(jìn)行排列。系統(tǒng)設(shè)有完備的自身管理和其他接口,接口包括預(yù)留向其他系統(tǒng)同步黑名單的接口和數(shù)據(jù)上傳到第三方系統(tǒng)的北向接口,例如提供給公安部門管理系統(tǒng)的接口。接口為系統(tǒng)的軟件開發(fā)提供了規(guī)范化的模塊。實(shí)施例二 參見圖1 圖6,本實(shí)施例WAP手機(jī)傳媒色情圖像、視頻及不良內(nèi)容的識別、監(jiān)管平臺,根據(jù)網(wǎng)絡(luò)帶寬的大小與數(shù)據(jù)量的多少,來配置“金惠圖像采集檢測服務(wù)器” 的數(shù)量。數(shù)據(jù)審核層對文字、圖像、視頻進(jìn)行自動審核。智能識別不良信息,并提供了人工審核干預(yù)機(jī)制。1、數(shù)據(jù)審核層將審核后的不良信息的URL自動加入黑名單庫,并查找到對應(yīng)的IP 地址、SP代碼及確切的物理地址,以搜索到傳播嫌疑人。2、采用基于關(guān)鍵字庫的關(guān)鍵字比對識別文字,采用本公司研發(fā)的基于完整知識庫和推理引擎的語義分析來識別文本語義。3、由于識別的圖像是低分辨率、手機(jī)小圖像,我們在基于內(nèi)容的網(wǎng)絡(luò)色情圖像和不良圖像檢測系統(tǒng)(已授權(quán)專利(CN200510048577.0)基礎(chǔ)上提出了一種在高級語義指導(dǎo)下的區(qū)域膚色分割加人臉識別的算法模型,在高級語義指導(dǎo)標(biāo)注下,不斷修改區(qū)域膚色分割算法的特征參數(shù),得到語義模型,再去識別圖像,會得到最高的識別正確率。被膚色檢測器檢測為膚色占空比大的圖像,有可能是人臉,需要送入人臉檢測器進(jìn)行進(jìn)一步判別。4、在本層,采用網(wǎng)絡(luò)視頻識別算法對手機(jī)視頻內(nèi)容識別,一旦確定是視頻流后便分析、識別是否為不良視頻,先對視頻進(jìn)行解碼,采用基于Directshow的通用視頻解碼技術(shù),支持常見的網(wǎng)絡(luò)視頻編碼格式;然后通過改進(jìn)的滑動窗口技術(shù),按一定的策略,獲取視頻流的關(guān)鍵幀,見圖6。最后對關(guān)鍵幀采用前述的圖像識別算法進(jìn)行識別,當(dāng)視頻段的中所識別的關(guān)鍵幀為不良圖像達(dá)到一個確定數(shù)量時便判為該視頻為不良視頻,低于該數(shù)量為正常視頻或可疑視頻。對于網(wǎng)絡(luò)內(nèi)容特別是對可疑的圖像、視頻內(nèi)容也可人工審核識別。
權(quán)利要求
1.一種WAP手機(jī)傳媒色情圖像、視頻及不良內(nèi)容的識別監(jiān)管平臺,其特征是所述識別監(jiān)管平臺包括至少一個圖像采集檢測主服務(wù)器和至少一個圖像采集檢測從服務(wù)器,WAP業(yè)務(wù)數(shù)據(jù)鏡像口從CDMA或GSM網(wǎng)絡(luò)中鏡像WAP業(yè)務(wù)數(shù)據(jù),傳送到圖像采集檢測主服務(wù)器和圖像采集檢測從服務(wù)器,所述圖像采集檢測主服務(wù)器和從服務(wù)器通過內(nèi)部數(shù)據(jù)網(wǎng)連接后臺數(shù)據(jù)庫和監(jiān)控終端,系統(tǒng)軟件架構(gòu)包括采集控制層、數(shù)據(jù)審核層、數(shù)據(jù)管理層、數(shù)據(jù)呈現(xiàn)層,其中采集控制層將采集到的高帶寬數(shù)據(jù)經(jīng)協(xié)議解析還原為原始的圖像幀和文本信息, 進(jìn)行不良內(nèi)容訪問阻斷與提醒,并在前端將URL去重,將完全相同的不良圖像去重,以提高檢測速度,然后將還原的圖片、視頻、文字內(nèi)容通過接口送至數(shù)據(jù)審核層;數(shù)據(jù)審核層分別對文字、圖像、視頻進(jìn)行自動審核,并將獲取的不良信息內(nèi)容傳輸?shù)綌?shù)據(jù)管理層;數(shù)據(jù)管理層實(shí)現(xiàn)系統(tǒng)全局?jǐn)?shù)據(jù)的統(tǒng)一管理和多維數(shù)據(jù)統(tǒng)計(jì);呈現(xiàn)層對全局?jǐn)?shù)據(jù)進(jìn)行審計(jì),阻斷不良內(nèi)容、封鎖不良網(wǎng)址,給出需要的審計(jì)報(bào)表。
2.根據(jù)權(quán)利要求1所述的WAP手機(jī)傳媒色情圖像、視頻及不良內(nèi)容的識別監(jiān)管平臺,其特征是設(shè)有完備的自身管理和其他接口,接口包括預(yù)留向其他系統(tǒng)同步黑名單接口和數(shù)據(jù)上傳到第三方系統(tǒng)的北向接口。
3.根據(jù)權(quán)利要求1或2所述的WAP手機(jī)傳媒色情圖像、視頻及不良內(nèi)容的識別監(jiān)管平臺,其特征是數(shù)據(jù)審核層包括區(qū)域膚色分割加人臉識別的圖像識別算法模型和網(wǎng)絡(luò)視頻識別算法模型;所述網(wǎng)絡(luò)視頻識別算法模型,采用基于Directshow的通用視頻解碼技術(shù)識別網(wǎng)絡(luò)視頻流;然后通過滑動窗口技術(shù),按一定的策略獲取視頻流的關(guān)鍵幀,最后對關(guān)鍵幀采用前述的圖像識別算法進(jìn)行識別,當(dāng)視頻段的中所識別的關(guān)鍵幀為不良圖像達(dá)到一個確定數(shù)量時便判為該視頻為不良視頻,低于該數(shù)量為正常視頻或可疑視頻。
4.根據(jù)權(quán)利要求3所述的WAP手機(jī)傳媒色情圖像、視頻及不良內(nèi)容的識別監(jiān)管平臺,其特征是WAP業(yè)務(wù)數(shù)據(jù)鏡像口將來自無線協(xié)議棧的請求翻譯到WWW協(xié)議棧中并加以優(yōu)化;通過圖像采集檢測服務(wù)器對手機(jī)色情圖像及危害國家安全內(nèi)容進(jìn)行識別,得出“正常圖像”、 “可疑圖像”、“色情圖像”三種結(jié)論,并以監(jiān)控終端上的實(shí)時檢測報(bào)告方式進(jìn)行報(bào)警;然后將色情圖像、危害國家安全的內(nèi)容及查到的對應(yīng)網(wǎng)址記錄在案在后臺數(shù)據(jù)庫中,后臺數(shù)據(jù)庫建有經(jīng)篩選的全局的海量標(biāo)準(zhǔn)的色情圖像樣本集,其中的色情圖像按色情指數(shù)進(jìn)行排列。
5.根據(jù)權(quán)利要求4所述的WAP手機(jī)傳媒色情圖像、視頻及不良內(nèi)容的識別監(jiān)管平臺, 其特征是圖像采集檢測服務(wù)器包括高速采集核心算法和圖像視頻快速識別核心算法以及與核心算法相匹配的FPGA高速采集運(yùn)算卡,采集識別與硬卡合一,以加快采集識別速度; 圖像采集檢測服務(wù)器采集IOG光口電口的HTTP、FTP、WAP、GPRS、RADIUS、P2P的BT、電驢、 QQLIVE、PLIVE等多協(xié)議數(shù)據(jù),并解析還原為應(yīng)用層的圖像視頻文字內(nèi)容。
全文摘要
本發(fā)明涉及一種手機(jī)互聯(lián)網(wǎng)信息內(nèi)容的識別、監(jiān)管系統(tǒng)平臺。一種WAP手機(jī)傳媒色情圖像、視頻及不良內(nèi)容的識別監(jiān)管平臺,包括至少一個圖像采集檢測主服務(wù)器和至少一個圖像采集檢測從服務(wù)器,WAP業(yè)務(wù)數(shù)據(jù)鏡像口從CDMA或GSM網(wǎng)絡(luò)中鏡像WAP業(yè)務(wù)數(shù)據(jù),傳送到圖像采集檢測主服務(wù)器和圖像采集檢測從服務(wù)器,所述圖像采集檢測主服務(wù)器和從服務(wù)器通過內(nèi)部數(shù)據(jù)網(wǎng)連接后臺數(shù)據(jù)庫和監(jiān)控終端,系統(tǒng)軟件架構(gòu)包括采集控制層、數(shù)據(jù)審核層、數(shù)據(jù)管理層、數(shù)據(jù)呈現(xiàn)層。本發(fā)明WAP手機(jī)傳媒色情圖像識別與監(jiān)管平臺,率先在WAP網(wǎng)關(guān)處用旁路監(jiān)聽方法解決了手機(jī)互聯(lián)網(wǎng)海量淫穢圖像、視頻及不良信息的識別、監(jiān)管的難題。
文檔編號G06K9/00GK102547794SQ20121000853
公開日2012年7月4日 申請日期2012年1月12日 優(yōu)先權(quán)日2012年1月12日
發(fā)明者周翬, 孫曉峰, 張晨民, 湯懷禮, 趙慧琴, 陳永軍 申請人:鄭州金惠計(jì)算機(jī)系統(tǒng)工程有限公司