一種音頻特征檢測的方法
【專利摘要】本發(fā)明提供一種音頻特征檢測的方法,主要實(shí)現(xiàn)了以下功能:A、對音頻提取包絡(luò),實(shí)現(xiàn)音量過大、過小、截幅檢測功能;B、比對音頻斷音處前后能量值,實(shí)現(xiàn)斷音檢測功能;C、對音頻首尾處的音量值進(jìn)行一階直線擬合處理,獲取擬合后直線的斜率和垂直偏移,實(shí)現(xiàn)首尾淡入淡出效果的檢測功能;D、典型的電流聲語譜圖上存在明顯的亮直線特征,通過計(jì)算音頻能量以及對應(yīng)方差值,分析出這一特性,實(shí)現(xiàn)電流聲檢測的功能。本發(fā)明優(yōu)點(diǎn)在于采用了提取包絡(luò)的方法,進(jìn)一步提升音量檢測的準(zhǔn)確性;能夠很好的完成淡入淡出的檢測,準(zhǔn)確性較高;本方法對特定的電流聲具有很好的檢測效果。
【專利說明】一種音頻特征檢測的方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明屬于音頻處理領(lǐng)域,尤其涉及一種用于音頻特征檢測的方法,其為對音頻音量異常、斷音、淡入淡出、電流聲的檢測方法。
【背景技術(shù)】
[0002]隨著現(xiàn)代人生活素質(zhì)的不斷提高,人們對音樂品質(zhì)的追求也越來越迫切。高品質(zhì)MP3、無損格式音樂以及諸如此類的音樂欣賞網(wǎng)站和軟件也越來越多的介入到人們的日常生活之中。但是,在海量的音樂曲庫中,音頻的質(zhì)量好壞層次不齊,采用人工對音質(zhì)進(jìn)行檢測需要耗費(fèi)巨大的工作量,不具有可持續(xù)性。因此,這就需要一個(gè)很好的措施來解決這個(gè)問題。
【發(fā)明內(nèi)容】
[0003]本發(fā)明的目的在于提供一種音頻特征檢測的方法,這些特征會在一定程度上影響聽眾的聽覺效果,從而給人工檢測音質(zhì)好壞提供一定的參考。通過這個(gè)方法,可以自動化檢測音頻特征,降低人工檢測所耗費(fèi)的巨大工作量和人力風(fēng)險(xiǎn),有效提升檢測的效率。同時(shí)還可以減少人為因素導(dǎo)致的特征誤檢率,進(jìn)一步保證了檢測的準(zhǔn)確性。
[0004]本發(fā)明采用的技術(shù)方案為:一種音頻特征檢測方法,該方法包括了如下步驟:
[0005]I)音量異常檢測
[0006]音量異常主要是由聲音過大、過小以及靜音導(dǎo)致,規(guī)定好音量過小、過大、靜音的上下限,對音頻提取包絡(luò),計(jì)算每個(gè)包絡(luò)的平均音量大小,并統(tǒng)計(jì)分析結(jié)果,實(shí)現(xiàn)音量異常檢測功能;
[0007]2)截幅檢測
[0008]截幅主要是因?yàn)槁曇暨^大并超過了采樣值所能表示的最大值范圍導(dǎo)致,通過計(jì)算每一幀內(nèi)音頻的采樣值,判斷是否存在多個(gè)點(diǎn)以上的采樣值越界問題,實(shí)現(xiàn)截幅檢測功倉泛;
[0009]3)斷音檢測
[0010]斷音主要是由于外界原因,使原始音頻的連續(xù)性遭到破壞,聽感上存在明顯的不連貫,通過比對音頻斷音處前后能量值,實(shí)現(xiàn)斷音檢測功能;
[0011]4)淡入淡出檢測
[0012]淡入淡出是人為在音頻首尾所添加的一種效果,使聲音有個(gè)過渡的作用,對音頻首尾處的音量值進(jìn)行一階直線擬合處理,獲取擬合后直線的斜率和垂直偏移,實(shí)現(xiàn)首尾淡入淡出效果的檢測功能;
[0013]5)電流聲檢測
[0014]電流聲是元器件中的電子的不規(guī)則熱運(yùn)動造成的很微弱的電信號被放大后的“聲音”,一般主要由于環(huán)境、音頻傳輸所導(dǎo)致,典型的電流聲語譜圖上存在明顯的亮直線特征,通過計(jì)算音頻能量以及對應(yīng)方差值,分析出這一特性,實(shí)現(xiàn)電流聲檢測的功能。[0015]本發(fā)明的原理在于:
[0016]A、對音頻提取包絡(luò),實(shí)現(xiàn)音量過大、過小、截幅檢測功能;
[0017]B、比對音頻斷音處前后能量值,實(shí)現(xiàn)斷音檢測功能;
[0018]C、對音頻首尾處的音量值進(jìn)行一階直線擬合處理,獲取擬合后直線的斜率和垂直偏移,實(shí)現(xiàn)首尾淡入淡出效果的檢測功能;
[0019]D、典型的電流聲語譜圖上存在明顯的亮直線特征,通過計(jì)算音頻能量以及對應(yīng)方差值,分析出這一特性,實(shí)現(xiàn)電流聲檢測的功能。
[0020]本發(fā)明與現(xiàn)有技術(shù)相比的優(yōu)點(diǎn)在于:
[0021](I)、音量異常檢測:采用了提取包絡(luò)的方法,進(jìn)一步提升檢測的準(zhǔn)確性;
[0022](2)、淡入淡出檢測:目前業(yè)內(nèi)普遍存在淡入淡出制作軟件,但是還沒有相應(yīng)的檢測方法,本檢測算法能夠很好的完成淡入淡出的檢測,準(zhǔn)確性較高;
[0023](3)、電流聲檢測:目前業(yè)內(nèi)還沒有電流聲的具體檢測方法,本方法對特定的電流聲(語譜存在亮直線,如圖6)具有很好的檢測效果。
【專利附圖】
【附圖說明】
[0024]圖1是音頻音量過大的時(shí)域波形圖。
[0025]圖2是音頻音量過小的時(shí)域波形圖。
[0026]圖3是音頻存在爆音截幅的時(shí)域波形圖。
[0027]圖4是音頻存在斷音的時(shí)域波形圖。
[0028]圖5是音頻首尾存在淡入淡出效果的時(shí)域波形圖。
[0029]圖6是音頻存在電流聲干擾的語譜圖。
[0030]圖7是本申請音量異常檢測的活動圖。
[0031 ]圖8是本申請截幅檢測的活動圖。
[0032]圖9是本申請斷音檢測的活動圖。
[0033]圖10是本申請淡入淡出檢測的活動圖。
[0034]圖11是本申請電流聲檢測的活動圖。
【具體實(shí)施方式】
[0035]下面結(jié)合附圖以及【具體實(shí)施方式】進(jìn)一步說明本發(fā)明。
[0036]一種音頻特征檢測的方法,檢測內(nèi)容如下:
[0037]1.音量異常檢測
[0038]音量異常主要是由聲音過大、過小以及靜音導(dǎo)致,附圖7是音量異常檢測的活動圖,具體步驟如下:
[0039]步驟一:對音頻進(jìn)行轉(zhuǎn)碼;
[0040]步驟二:對轉(zhuǎn)碼后的wav文件進(jìn)行去直流分量處理,防止直流干擾;
[0041]步驟三:將wav文件按時(shí)間片段劃分成幀;
[0042]步驟四:通常音量的計(jì)算是對音頻中所有的點(diǎn)進(jìn)行計(jì)算,分析可知,人耳感知音量大小的程度主要是由音頻波形中包絡(luò)的幅值所決定。包絡(luò)指的是音頻采樣點(diǎn)中由極大值(采樣值絕對值)點(diǎn)構(gòu)成的點(diǎn)的集合,這些點(diǎn)能夠更準(zhǔn)確的反映音量的變化特征。故而對每一幀音頻進(jìn)行包絡(luò)提取;
[0043]步驟五:規(guī)定好音量過小、過大、靜音的上下限,計(jì)算每個(gè)包絡(luò)的平均音量大小,并統(tǒng)計(jì)結(jié)果,根據(jù)統(tǒng)計(jì)值判斷音量是否正常。
[0044]附圖1、2分別展示了音量過大、過小的音頻波形圖。
[0045]2.截幅檢測
[0046]由附圖3可以知道,截幅主要是因?yàn)槁曇暨^大并超過了采樣值所能表示的最大值范圍。
[0047]附圖8是截幅檢測的活動圖,具體步驟如下:
[0048]步驟一、二、三同音量檢測步驟;
[0049]步驟四:計(jì)算每一幀內(nèi)音頻的采樣值,判斷是否存在多個(gè)點(diǎn)以上的采樣值越界問題,若存在則檢測為截幅;
[0050]3.斷音檢測
[0051]斷音主要是由于外界原因,使原始音頻的連續(xù)性遭到破壞,聽感上存在明顯的不連貫,附圖9是斷音檢測的活動圖,具體步驟如下:
[0052]步驟一、二同音量檢測步驟;
[0053]步驟三:由附圖4可知,斷音位置后的一小段片段音量較小,故而對音頻進(jìn)行掃描,找到所有的音量較小的片段;
[0054]步驟四:顯然,斷音位置前后的能量相差較大。根據(jù)上述特征,我們對片段起始位置前后的能量進(jìn)行計(jì)算,若前后相差較大則判斷為斷音。
[0055]4.淡入淡出檢測
[0056]淡入淡出是人為在音頻首尾所添加的一種效果,開始時(shí)聲音緩慢變大,結(jié)束時(shí)則緩慢變小。淡入淡出使聲音有個(gè)過渡的作用,讓人有準(zhǔn)備適應(yīng)下一首歌曲,不會因?yàn)榍L(fēng)的突然變化而感到不適,附圖10是淡入淡出檢測的活動圖,具體步驟如下:
[0057]步驟一、二同音量檢測步驟;
[0058]步驟三:由附圖5的波形圖可以看出,淡入淡出音頻在首尾的趨勢分別為斜向上和斜向下。故對音頻首尾每幀音頻的音量值進(jìn)行一階直線擬合處理,獲取擬合后直線的斜率和垂直偏移,具體擬合公式如下:
[0059]假設(shè)直線方程表達(dá)式為y = a+bx,對滿足線性關(guān)系的一組等精度測量數(shù)據(jù)(XilYi),根據(jù)最小二乘法線性擬合公式可知:
【權(quán)利要求】
1.一種音頻特征檢測的方法,其特征在于,該方法具體如下步驟: 1)音量異常檢測 音量異常主要是由聲音過大、過小以及靜音導(dǎo)致,規(guī)定好音量過小、過大、靜音的上下限,對音頻提取包絡(luò),計(jì)算每個(gè)包絡(luò)的平均音量大小,并統(tǒng)計(jì)分析結(jié)果,實(shí)現(xiàn)音量異常檢測功能; 2)截幅檢測 截幅主要是因?yàn)槁曇暨^大并超過了采樣值所能表示的最大值范圍導(dǎo)致,通過計(jì)算每一幀內(nèi)音頻的采樣值,判斷是否存在多個(gè)點(diǎn)以上的采樣值越界問題,實(shí)現(xiàn)截幅檢測功能; 3)斷音檢測 斷音主要是由于外界原因,使原始音頻的連續(xù)性遭到破壞,聽感上存在明顯的不連貫,通過比對音頻斷音處前后能量值,實(shí)現(xiàn)斷音檢測功能; 4)淡入淡出檢測 淡入淡出是人為在音頻首尾所添加的一種效果,使聲音有個(gè)過渡的作用,對音頻首尾處的音量值進(jìn)行一階直線擬合處理,獲取擬合后直線的斜率和垂直偏移,實(shí)現(xiàn)首尾淡入淡出效果的檢測功能; 5)電流聲檢測 電流聲是元器件中的電子的不規(guī)則熱運(yùn)動造成的很微弱的電信號被放大后的“聲音”,一般主要由于環(huán)境、音頻傳輸所導(dǎo)致,典型的電流聲語譜圖上存在明顯的亮直線特征,通過計(jì)算音頻能量以及對應(yīng)方差值,分析出這一特性,實(shí)現(xiàn)電流聲檢測的功能。
【文檔編號】G10L25/78GK103632682SQ201310589888
【公開日】2014年3月12日 申請日期:2013年11月20日 優(yōu)先權(quán)日:2013年11月20日
【發(fā)明者】楊溥, 吳維昊, 史峰 申請人:安徽科大訊飛信息科技股份有限公司