異常聲音檢測方法及系統(tǒng)的制作方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明設(shè)及聲音檢測領(lǐng)域,尤其設(shè)及一種異常聲音檢測方法及系統(tǒng)。
【背景技術(shù)】
[0002] 近年來,安全問題已經(jīng)成為社會關(guān)注的焦點(diǎn),視頻監(jiān)控系統(tǒng)在安防等領(lǐng)域得到了 廣泛的發(fā)展。但是,目前的視頻監(jiān)控系統(tǒng)主要是基于視頻信號的,視頻分析存在一定的局限 性。比如,采集到的視頻圖像質(zhì)量容易受到天氣、光照變化和物體之間相互遮擋等因素的 影響,并且圖像處理算法復(fù)雜,計(jì)算復(fù)雜度較高。相對于視頻信號,音頻信號分布非常廣泛 并包含了大量的信息,具有易于分析和計(jì)算復(fù)雜度低的特點(diǎn),可W輔助視頻監(jiān)控系統(tǒng)的視 頻分析。在一些情況下,音頻信號甚至比視頻信號傳達(dá)了更重要的信息,比如公共場所的槍 聲,異常聲音能夠有效的揭示異常狀況W及突發(fā)事故,受到越來越多的關(guān)注。
[0003] 異常聲音屬于非語音信號,目前對異常聲音檢測的研究還比較緩慢,有學(xué)者將異 常聲音檢測技術(shù)用于檢查健康狀況,通過研究人呼吸聲音的特征向量來尋找異常聲音;有 科研人員通過計(jì)算每一個(gè)聲音帖的特征向量與模板進(jìn)行比較來判斷環(huán)境中是否有異常聲 音,該種方法計(jì)算量大,實(shí)時(shí)性不好;還有研究通過計(jì)算特征參數(shù)和訓(xùn)練來對異常聲音進(jìn)行 細(xì)致分類,分成爆炸聲、槍聲和玻璃破碎聲等,同樣計(jì)算量比較大。
【發(fā)明內(nèi)容】
[0004] 基于此,有必要針對計(jì)算量大的問題,提供一種計(jì)算復(fù)雜度低的異常聲音檢測方 法及系統(tǒng)。
[0005] 一種異常聲音檢測方法,包括步驟:
[0006] 實(shí)時(shí)采集音頻信號;
[0007] 計(jì)算采集的音頻信號的每一帖的短時(shí)能量和/或過零率;
[000引獲取第一短時(shí)能量闊值;
[0009] 依次比較音頻信號的每一帖的短時(shí)能量與第一短時(shí)能量闊值的大小;
[0010] 若當(dāng)前帖的短時(shí)能量大于第一短時(shí)能量闊值,則將當(dāng)前帖記為第一等級帖;
[0011] 若當(dāng)前帖的短時(shí)能量小于第一短時(shí)能量闊值,則獲取第二短時(shí)能量闊值和/或過 零率闊值,根據(jù)第二短時(shí)能量闊值或過零率闊值確認(rèn)是否將前帖記為第二等級帖,確認(rèn)是 否將前帖記為第二等級帖的步驟包括:
[0012] 若當(dāng)前帖的短時(shí)能量大于第二短時(shí)能量闊值或若當(dāng)前帖的過零率大于過零率闊 值,則將當(dāng)前帖記為第二等級帖;
[0013] 計(jì)錄連續(xù)為第一等級帖或第二等級帖的帖數(shù)量;
[0014] 判斷連續(xù)為第一等級帖或第二等級帖的帖數(shù)量是否大于N且當(dāng)前帖是否為第一 等級帖,其中,N為預(yù)定數(shù)量,N為正整數(shù);
[001引若是,則判斷聲音異常。
[0016] 在一種實(shí)施方式中,若比較當(dāng)前帖的短時(shí)能量小于第二短時(shí)能量闊值或若當(dāng)前帖 的過零率小于過零率闊值,則將所記錄的連續(xù)為第一等級帖或第二等級帖的帖數(shù)量初始化 為0。
[0017] 在一種實(shí)施方式中,在獲取第一短時(shí)能量闊值的步驟之前還包括:
[0018] 自學(xué)習(xí)音頻闊值,計(jì)算并保存第一短時(shí)能量闊值、第二短時(shí)能量闊值和過零率闊 值。
[0019] 在一種實(shí)施方式中,自學(xué)習(xí)音頻的步驟,具體包括:
[0020] 采集用于自學(xué)習(xí)的音頻信號;
[0021] 計(jì)算所采集的音頻信號的每一帖的短時(shí)能量和過零率;
[0022] 使用直方圖分別統(tǒng)計(jì)音頻信號的短時(shí)能量和過零率;
[0023] 判斷本次自學(xué)習(xí)時(shí)間是否大于預(yù)定的學(xué)習(xí)時(shí)間;
[0024] 若判斷本次自學(xué)習(xí)時(shí)間大于預(yù)定的學(xué)習(xí)時(shí)間,則根據(jù)直方圖計(jì)算本次學(xué)習(xí)正常聲 音的短時(shí)能量和過零率,正常聲音的短時(shí)能量為短時(shí)能量直方圖中數(shù)值最大的組對應(yīng)的取 值范圍的中值;正常聲音過零率為過零率直方圖中數(shù)值最大的組對應(yīng)的取值范圍的中值;
[0025] 判斷本次學(xué)習(xí)是否為初次學(xué)習(xí);
[0026] 若判斷本次學(xué)習(xí)為初次學(xué)習(xí),根據(jù)正常聲音的短時(shí)能量和正常聲音的過零率計(jì)算 第一短時(shí)能量闊值、第二短時(shí)能量闊值和過零率闊值。
[0027] 在一種實(shí)施方式中,根據(jù)正常聲音的短時(shí)能量和正常常聲音的過零率計(jì)算第一短 時(shí)能量闊值STCthl、第二短時(shí)能量闊值STCth2和過零率闊值Z邸th的公式分別為;
[002引 STCthl = a*STCback
[0029] STCth2 = 0. 5巧TCthl
[0030] ZCR化二 b*ZCRback
[0031] 其中,STEback和ZCRback是本次學(xué)習(xí)的正常聲音的短時(shí)能量和過零率,a和b是 一個(gè)常量參數(shù)。
[0032] 在一種實(shí)施方式中,若判斷本次學(xué)習(xí)為非初次學(xué)習(xí),則根據(jù)上次學(xué)習(xí)得到的正常 聲音的短時(shí)能量和過零率與本次學(xué)習(xí)得到的正常聲音的短時(shí)能量和過零率得到更新的正 常聲音的短時(shí)能量和過零率,并根據(jù)更新的正常聲音的短時(shí)能量和過零率更新第一短時(shí)能 量闊值、第二短時(shí)能量闊值和過零率闊值。
[0033] 在一種實(shí)施方式中,若判斷本次學(xué)習(xí)為非初次學(xué)習(xí),則根據(jù)上次學(xué)習(xí)得到的正常 聲音的短時(shí)能量和過零率與本次學(xué)習(xí)得到的正常聲音的短時(shí)能量和過零率得到更新的正 常聲音的短時(shí)能量STCback和過零率ZC化ack的公式為;
[0034] STEback = (1-a ) *STE;back_last+a 巧1663〇1^_州1';
[00巧]ZCI^back = (1-a ) *ZCI?back_last+a *2〔化3〇1^_州1';
[0036] 其中,STCback_last為上次學(xué)習(xí)的正常聲音短時(shí)能量;STCback_cur為本次學(xué)習(xí) 的正常聲音的短時(shí)能量;a為闊值更新速度;ZC化ack_last為上次學(xué)習(xí)的正常聲音過零 率;ZC化ack_cur為本次學(xué)習(xí)正常聲音的過零率。
[0037] 一種異常聲音檢測系統(tǒng),包括:
[003引采集模塊,用于實(shí)時(shí)采集音頻信號;
[0039] 計(jì)算模塊,用于計(jì)算采集的音頻信號的每一帖的短時(shí)能量和/或過零率;
[0040] 獲取模塊,獲取第一短時(shí)能量闊值;
[0041] 第一比較模塊,用于依次比較音頻信號的每一帖的短時(shí)能量與第一短時(shí)能量闊值 的大??;
[0042] 標(biāo)記模塊,用于當(dāng)?shù)谝槐容^模塊比較當(dāng)前帖的短時(shí)能量大于第一短時(shí)能量闊值 時(shí),將當(dāng)前帖記為第一等級帖;
[0043] 獲取模塊,還用于當(dāng)?shù)谝槐容^模塊比較當(dāng)前帖的短時(shí)能量小于第一短時(shí)能量闊值 時(shí),獲取第二短時(shí)能量闊值和/或獲取過零率闊值;
[0044] 第二比較模塊,用于根據(jù)第二短時(shí)能量闊值或過零率闊值確認(rèn)是否將前帖記為第 二等級帖,具體用于比較當(dāng)前帖的短時(shí)能量與第二短時(shí)能量闊值的大小或當(dāng)前帖的過零率 與過零率闊值的大?。?br>[0045] 標(biāo)記模塊,還用于當(dāng)?shù)诙容^模塊比較當(dāng)前帖的短時(shí)能量大于第二短時(shí)能量闊值 時(shí)或若當(dāng)前帖的過零率大于過零率闊值,將當(dāng)前帖記為第二等級帖;
[0046] 記錄模塊,用于計(jì)錄連續(xù)為第一等級帖或第二等級帖的帖數(shù)量;
[0047] 判斷模塊,用于判斷連續(xù)為第一等級帖或第二等級帖的帖數(shù)量是否大于N且當(dāng)前 帖是否為第一等級帖;其中,N為預(yù)定數(shù)量,N為正整數(shù);
[0048] 異常判斷模塊,用于判斷模塊判斷連續(xù)為第一等級帖或第二等級帖的帖數(shù)量大于 N且當(dāng)前帖為第一等級帖時(shí),判斷聲音異常。
[0049] 在一種實(shí)施方式中,記錄模塊還用于,在第二比較模塊比較當(dāng)前帖的短時(shí)能量小 于第二短時(shí)能量闊值或當(dāng)前帖的過零率小于過零率闊值時(shí),將記錄的連續(xù)為第一等級帖或 第二等級帖的帖數(shù)量初始化為0。
[0化0] 在一種實(shí)施方式中,該系統(tǒng)還包括;
[0051]自學(xué)習(xí)模塊,自學(xué)習(xí)模塊用于自學(xué)習(xí)音頻闊值,計(jì)算并保存第一短時(shí)能量闊值、第 二短時(shí)能量闊值和過零率闊值。
[0化2] 本發(fā)明的異常聲音檢測方法,通過比較采集的音頻信號的每一帖的短時(shí)能量與第 一短時(shí)能量闊值的大小,若大于第一短時(shí)能量闊值,則該帖記為第一等級帖,若小于第一短 時(shí)能量闊值,則比較其短時(shí)能量與第二闊值的大小或其過零率與過零率闊值的大小,將短 時(shí)能量小于第一短時(shí)能量闊值且大于第二短時(shí)能量闊值或過零率大于過零率闊值的帖記 為第二等級帖,若連續(xù)為第一等級帖或第二等級帖的帖數(shù)量大于N且當(dāng)前帖為第一等級帖 時(shí),則判斷聲音異常。該方法通過計(jì)算短時(shí)能量和過零率判斷異常聲音,由于短時(shí)能量和過 零率屬于時(shí)域特征,不設(shè)及頻域變換和特征參數(shù)的計(jì)算,能夠降低計(jì)算的復(fù)雜度。同時(shí),通 過對實(shí)時(shí)采集的音頻信息進(jìn)行處理,能夠?qū)崟r(shí)處理分析,及時(shí)判斷異常。
[0化3] 本發(fā)明的異常聲音檢測系統(tǒng),通過比較模塊比較采集模塊采集的音頻信號的每一 帖的短時(shí)能量與第一短時(shí)能量闊值的大小,標(biāo)記模塊將大于第一短時(shí)能量闊值的帖記為第 一等級帖,將小于第一短時(shí)能量闊值的帖,再比較其短時(shí)能量與第二闊值的大小或其過零 率與過零率闊值的大小,標(biāo)記模塊將短時(shí)能量的帖小于第一短時(shí)能量闊值且大于第二短時(shí) 能量闊值或過零率大于過零率闊值的帖記為第二等級帖,若判斷模塊連續(xù)為第一等級或第 二等級帖的帖數(shù)量大于N且當(dāng)前帖為第一等級帖時(shí),則判斷聲音異常。該系統(tǒng)通過計(jì)算模 塊計(jì)算的短時(shí)能量和過零率,判斷異常聲音,由于短時(shí)能量屬于時(shí)域特征,不設(shè)及頻域變換 和特征參數(shù)的計(jì)算,能夠降低計(jì)算的復(fù)雜度。同時(shí),通過對實(shí)時(shí)采集的音頻信息進(jìn)行處理, 能夠?qū)崟r(shí)處理分析,及時(shí)報(bào)