一種智能多媒體播放器的制造方法
【專利說明】
[0001]【技術領域】
本發(fā)明涉及一種智能多媒體播放器,屬于圖像和音頻處理技術領域。
[0002]【【背景技術】】
隨著互聯(lián)網(wǎng)以及圖像和音頻等多媒體技術的發(fā)展,各種多媒體內(nèi)容充斥在互聯(lián)網(wǎng)的各個角落,這些內(nèi)容包括影視圖像,也包含個人制作和拍攝的內(nèi)容。但是,目前視頻內(nèi)容也充斥著大量色情及暴力等影像或者音頻內(nèi)容,嚴重損害了廣大青少年的身心健康,危害著社會的穩(wěn)定和發(fā)展。
[0003]目前國內(nèi)外各種播放器也孕育而生,種類繁多,但是還是無法做到實時監(jiān)控和控制多媒體視頻內(nèi)容的播放。一種比較常用的方法是在這些網(wǎng)站中增加一些控制插件,或者是干脆將視頻DVD等隱藏起來,從而使得觀看者無法接觸到這樣的視頻內(nèi)容,這是一個完全由人為控制的過程。其缺陷主要表現(xiàn)在2個方面:(I)這種人為控制需要干預人觀看或者預先了解該段視頻,但是這往往是不可能做到的;(2)在一段視頻中,色情和暴力的部分可能只是其中的一小部分內(nèi)容,對該視頻的完全屏蔽也是不太切合情理的。
[0004]綜上所述,我們急需一個能在視頻播放過程中自動識別色情及暴力等有害內(nèi)容的智能多媒體播放器,使得觀看者在不影響觀看該視頻內(nèi)容的同時不受到有害內(nèi)容的影響。
[0005]【
【發(fā)明內(nèi)容】
】
本發(fā)明的目的在于:提供一種智能多媒體播放器,基于視頻、圖像和音頻所表達的內(nèi)容建立相應的自動識別及過濾系統(tǒng),并在遇到敏感及有害信息之后進行自動屏蔽,從而在保證視頻內(nèi)容連續(xù)播放的同時最大限度地保護觀看者的身心健康,促進社會的和諧發(fā)展。
[0006]為實現(xiàn)上述目的,本發(fā)明采用的技術方案是:
本發(fā)明所述的一種智能多媒體播放器,包括以下四部分:
(1)、圖像數(shù)據(jù)的無損壓縮系統(tǒng):由于多媒體圖像的分辨率過高,在最后演示的時候容易出現(xiàn)跳幀或者丟失幀的情況,為此須對每幀圖像的處理都會先對它通過雙線性插值算法進行高質(zhì)量的圖像壓縮,一般壓縮至640*480的大??;
(2)、圖像內(nèi)容的情感分析系統(tǒng):在得到上述640*480的壓縮圖像內(nèi)容之后,將640*480的壓縮圖像進行深度的情感內(nèi)容分析,包括圖像內(nèi)不同區(qū)域的分割、提取各個區(qū)域的特征并建立區(qū)域關系矩陣、不同區(qū)域的相關性定義和根據(jù)決策模型判斷是否屬于正常,分出圖像級別的等級權重;
(3)、音頻內(nèi)容分析系統(tǒng),其中音頻內(nèi)容分析系統(tǒng)通過以下步驟來操作:
步驟一、獲取當前幀不同頻率下音頻信號內(nèi)容;
步驟二、對獲取的音頻信號內(nèi)容運用一個高斯濾波器進行去噪;
步驟三、對去噪和濾波后的音頻信息進行頻譜分析,搞清楚在不同頻率段的直方圖,并得到多個基本的音頻信息,比如高頻的信息量,高頻與低頻的差異,高頻發(fā)生的位置等;步驟四、將上述分析后的基本音頻信息與現(xiàn)有的敏感及有害內(nèi)容進行相似度對比,得出音頻信息的敏感及有害內(nèi)容的等級權重,一般而言,相似度越高,越有可能是敏感及有害內(nèi)容; (4)、權重融合系統(tǒng):通過圖像級別的等級權重,權重融合并進行內(nèi)容判斷,在綜合上述的圖像分析結果和音頻的分析結果之后,進行綜合判斷是否屬于敏感及有害信息,其基本方式是這個綜合得分高于某個閾值就是敏感及有害信息,并對屬于敏感及有害信息的進行屏蔽處理,可以是打上馬賽克,也可以進行跳過不顯示。
[0007]采用上述結構后,本發(fā)明有益效果為:本發(fā)明基于視頻、圖像和音頻所表達的內(nèi)容建立相應的自動識別及過濾系統(tǒng),并在遇到敏感及有害信息之后進行自動屏蔽,從而在保證視頻內(nèi)容連續(xù)播放的同時最大限度地保護觀看者的身心健康,促進社會的和諧發(fā)展。
[0008]【【附圖說明】】
此處所說明的附圖是用來提供對本發(fā)明的進一步理解,構成本申請的一部分,但并不構成對本發(fā)明的不當限定,在附圖中:
圖1是本發(fā)明的流程示意圖;
圖2是本發(fā)明中對圖像內(nèi)容的情感分析示意圖;
圖3是本發(fā)明中對音頻內(nèi)容分析示意圖。
[0009]【【具體實施方式】】
下面將結合附圖以及具體實施例來詳細說明本發(fā)明,其中的示意性實施例以及說明僅用來解釋本發(fā)明,但并不作為對本發(fā)明的限定。
[0010]如圖1-3所示,一種智能多媒體播放器,包括以下四部分:
(1)、圖像數(shù)據(jù)的無損壓縮系統(tǒng):由于多媒體圖像的分辨率過高,在最后演示的時候容易出現(xiàn)跳幀或者丟失幀的情況,為此須對每幀圖像的處理都會先對它通過雙線性插值算法進行高質(zhì)量的圖像壓縮,一般壓縮至640*480的大??;
(2)、圖像內(nèi)容的情感分析系統(tǒng):在得到上述640*480的壓縮圖像內(nèi)容之后,將640*480的壓縮圖像進行深度的情感內(nèi)容分析,包括圖像內(nèi)不同區(qū)域的分割、提取各個區(qū)域的特征并建立區(qū)域關系矩陣、不同區(qū)域的相關性定義和根據(jù)決策模型判斷是否屬于正常,分出圖像級別的等級權重;
(3)、音頻內(nèi)容分析系統(tǒng),其中音頻內(nèi)容分析系統(tǒng)通過以下步驟來操作:
步驟一、獲取當前幀不同頻率下音頻信號內(nèi)容;
步驟二、對獲取的音頻信號內(nèi)容運用一個高斯濾波器進行去噪;
步驟三、對去噪和濾波后的音頻信息進行頻譜分析,搞清楚在不同頻率段的直方圖,并得到多個基本的音頻信息,比如高頻的信息量,高頻與低頻的差異,高頻發(fā)生的位置等;步驟四、將上述分析后的基本音頻信息與現(xiàn)有的敏感及有害內(nèi)容進行相似度對比,得出音頻信息的敏感及有害內(nèi)容的等級權重,一般而言,相似度越高,越有可能是敏感及有害內(nèi)容;
(4)、權重融合系統(tǒng):通過圖像級別的等級權重,權重融合并進行內(nèi)容判斷,在綜合上述的圖像分析結果和音頻的分析結果之后,進行綜合判斷是否屬于敏感及有害信息,其基本方式是這個綜合得分高于某個閾值就是敏感及有害信息,并對屬于敏感及有害信息的進行屏蔽處理,可以是打上馬賽克,也可以進行跳過不顯示。
[0011]本發(fā)明可以作為計算機和手機平臺上獨立運行的播放器也可以作為網(wǎng)絡播放器的插件而存在。
[0012]其中作為計算機和手機平臺的多媒體播放器通過如下操作: 1.用戶通過在電腦,手機,移動終端等安裝該軟件,同時對過濾內(nèi)容和過濾方式進行設置;
2.該播放器接收視頻內(nèi)容,利用深度分析模型進行情感內(nèi)容分析;
3.如果出現(xiàn)敏感及有害內(nèi)容,將自動屏蔽,但不影響視頻的連續(xù)播放;
其中可以作為網(wǎng)絡播放器的插件播放通過如下操作:
1.用戶通過對于視頻等網(wǎng)站安裝相應的插件,同時對過濾內(nèi)容和過濾方式進行設置;
2.用戶在線觀看各種視頻的時候,軟件插件將對多媒體內(nèi)容利用深度分析模型進行情感內(nèi)容分析;
3.如果出現(xiàn)敏感及有害內(nèi)容,將自動屏蔽,但不影響視頻的連續(xù)播放。
[0013]以上所述僅是本發(fā)明的較佳實施方式,故凡依本發(fā)明專利申請范圍所述的構造、特征及原理所做的等效變化或修飾,均包括于本發(fā)明專利申請范圍內(nèi)。
【主權項】
1.一種智能多媒體播放器,其特征在于:包括以下四部分: (1)、圖像數(shù)據(jù)的無損壓縮系統(tǒng):由于多媒體圖像的分辨率過高,在最后演示的時候容易出現(xiàn)跳幀或者丟失幀的情況,為此須對每幀圖像的處理都會先對它通過雙線性插值算法進行高質(zhì)量的圖像壓縮,一般壓縮至640*480的大?。? (2)、圖像內(nèi)容的情感分析系統(tǒng):在得到上述640*480的壓縮圖像內(nèi)容之后,將640*480的壓縮圖像進行深度的情感內(nèi)容分析,包括圖像內(nèi)不同區(qū)域的分割、提取各個區(qū)域的特征并建立區(qū)域關系矩陣、不同區(qū)域的相關性定義和根據(jù)決策模型判斷是否屬于正常,分出圖像級別的等級權重; (3 )、音頻內(nèi)容分析系統(tǒng),其中音頻內(nèi)容分析系統(tǒng)通過以下步驟來操作: 步驟一、獲取當前幀不同頻率下音頻信號內(nèi)容; 步驟二、對獲取的音頻信號內(nèi)容運用一個高斯濾波器進行去噪; 步驟三、對去噪和濾波后的音頻信息進行頻譜分析,搞清楚在不同頻率段的直方圖,并得到多個基本的音頻信息,比如高頻的信息量,高頻與低頻的差異,高頻發(fā)生的位置等;步驟四、將上述分析后的基本音頻信息與現(xiàn)有的敏感及有害內(nèi)容進行相似度對比,得出音頻信息的敏感及有害內(nèi)容的等級權重,一般而言,相似度越高,越有可能是敏感及有害內(nèi)容; (4)、權重融合系統(tǒng):通過圖像級別的等級權重,權重融合并進行內(nèi)容判斷,在綜合上述的圖像分析結果和音頻的分析結果之后,進行綜合判斷是否屬于敏感及有害信息,其基本方式是這個綜合得分高于某個閾值就是敏感及有害信息,并對屬于敏感及有害信息的進行屏蔽處理,可以是打上馬賽克,也可以進行跳過不顯示。
【專利摘要】本發(fā)明涉及一種智能多媒體播放器,包括圖像數(shù)據(jù)的無損壓縮系統(tǒng)、圖像內(nèi)容的情感分析系統(tǒng)、音頻內(nèi)容分析系統(tǒng)和權重融合系統(tǒng)四部分,基于視頻、圖像和音頻所表達的內(nèi)容建立相應的自動識別及過濾系統(tǒng)。本發(fā)明在遇到敏感及有害信息之后進行自動屏蔽,從而在保證視頻內(nèi)容連續(xù)播放的同時最大限度地保護觀看者的身心健康,促進社會的和諧發(fā)展。
【IPC分類】G06F17/30, G10L25/18
【公開號】CN105631015
【申請?zhí)枴緾N201511012948
【發(fā)明人】熊偉華, 馬燕軍
【申請人】寧波領視信息科技有限公司
【公開日】2016年6月1日
【申請日】2015年12月31日