專利名稱:一種彩鈴音質(zhì)優(yōu)化的方法及裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及電信增值業(yè)務(wù)的實現(xiàn),特別涉及一種彩鈴音質(zhì)優(yōu)化的方法及裝置。
背景技術(shù):
如今的通信市場競爭非常激烈,通信運營商的每用戶平均收入(ARPU)值在呈現(xiàn) 下降的趨勢,找尋新的利潤增長點成為各大運營商的當(dāng)務(wù)之急。彩鈴業(yè)務(wù)自推出以來業(yè)務(wù) 量增長迅猛,成為繼短信之后第二個“殺手級,,應(yīng)用的增值業(yè)務(wù),對提高通信運營商的ARPU 值具有非常重要的意義。彩鈴業(yè)務(wù)的賣點就在于用動聽的音樂鈴聲代替乏味的傳統(tǒng)“嘟一嘟一”的回鈴 音,而彩鈴系統(tǒng)建成以來,通信運營商陸續(xù)收到用戶投訴,反映其購買的彩鈴鈴音質(zhì)量很 差,經(jīng)??梢月牭健八?.....啦......”的雜音,撥測結(jié)果也證實了雜音的存在。因此,如何定位雜音產(chǎn)生的原因,以提高彩鈴質(zhì)量,就成為亟待解決的技術(shù)問題。
發(fā)明內(nèi)容
本發(fā)明所要解決的技術(shù)問題是提供一種彩鈴音質(zhì)優(yōu)化的方法及裝置,以提高彩鈴 的鈴音質(zhì)量。為解決上述技術(shù)問題,本發(fā)明提供技術(shù)方案如下—種彩鈴音質(zhì)優(yōu)化的方法,包括計算鈴音文件的平均能量以及其中每個語音幀的平均能量;分別計算每個語音幀的平均能量與鈴音文件的平均能量的比值;統(tǒng)計比值小于第一門限或者大于第二門限的語音幀總數(shù);當(dāng)所述語音幀總數(shù)大于第三門限時,則確定該鈴音文件會產(chǎn)生雜音;對確定的會產(chǎn)生雜音的鈴音文件進行調(diào)制優(yōu)化。上述的方法,其中通過對多個會產(chǎn)生雜音的鈴音文件進行分析,來得到所述第一 門限和第二門限。上述的方法,其中,所述通過對多個會產(chǎn)生雜音的鈴音文件進行分析,來得到所述 第一門限和第二門限,包括如下步驟A、選擇一個會產(chǎn)生雜音的鈴音文件,并定位出其中產(chǎn)生雜音的語音段;B、計算所選擇的鈴音文件的平均能量以及其中產(chǎn)生雜音的語音段的平均能量;C、分別計算各個產(chǎn)生雜音的語音段的平均能量與鈴音文件的平均能量的比值,得 到多個比值,并獲取其中的最小比值和最大比值;D、反復(fù)執(zhí)行上述步驟A C,得到多個最小比值和多個最大比值;E、從所述多個最小比值中選取出現(xiàn)次數(shù)最多的最小比值,從所述多個最大比值中 選取出現(xiàn)次數(shù)最多的最大比值,并將所述出現(xiàn)次數(shù)最多的最小比值作為所述第一門限,將 所述出現(xiàn)次數(shù)最多的最大比值作為所述第二門限。上述的方法,其中,按照如下公式計算鈴音文件中的采樣點的瞬時能量
P(i) = (l-a)*P(i-l)+a*|x(i) |,其中,P⑴為第i個采樣點的瞬時能量,P(I)= X(I) I,x(i)為第i個采樣點上的語音信號,i = 1,2,...,n,n為采樣點數(shù)目,a是取值在
0到1之間的常數(shù)。上述的方法,其中,按照如下公式計算鈴音文件中的采樣點的瞬時能量P⑴=(l-a)*P(i-l)+a*x⑴*x(i),其中,P⑴為第i個采樣點的瞬時能量,P(I) =I χ (1) I,χ (i)為第i個采樣點上的語音信號,i = 1,2,. . .,η,η為采樣點數(shù)目,a是取值 在0到1之間的常數(shù)上述的方法,其中,按照如下公式計算鈴音文件中的采樣點的瞬時能量P⑴=|x⑴I,其中,P⑴為第i個采樣點的瞬時能量,x(i)為第i個采樣點上 的語音信號,i = l,2,...,n,n為采樣點數(shù)目上述的方法,其中,所述對確定的會產(chǎn)生雜音的鈴音文件進行調(diào)制優(yōu)化為對鈴音文件進行增益控制,以提高整個鈴音文件的平均能量,或者,提高鈴音文件 中產(chǎn)生雜音的語音段的平均能量。一種彩鈴音質(zhì)優(yōu)化的裝置,包括能量計算單元,用于計算鈴音文件的平均能量以及其中每個語音幀的平均能量;比值計算單元,用于分別計算每個語音幀的平均能量與鈴音文件的平均能量的比值;統(tǒng)計單元,用于統(tǒng)計比值小于第一門限或者大于第二門限的語音幀總數(shù);雜音判斷單元,用于當(dāng)所述語音幀總數(shù)大于第三門限時,確定該鈴音文件會產(chǎn)生 雜音;調(diào)制優(yōu)化單元,用于對確定的會產(chǎn)生雜音的鈴音文件進行調(diào)制優(yōu)化。上述的裝置,其中,還包括門限獲取單元,用于通過對多個會產(chǎn)生雜音的鈴音文件進行分析,來得到所述第 一門限和第二門限。上述的裝置,其中,所述調(diào)制優(yōu)化單元進一步用于對鈴音文件進行增益控制,以提高整個鈴音文件的平均能量,或者,提高鈴音文件 中產(chǎn)生雜音的語音段的平均能量。本發(fā)明實施例通過對大量的產(chǎn)生雜音的鈴音文件樣本進行分析,得到雜音能量特 征值;然后,根據(jù)所述雜音能量特征值對彩鈴數(shù)據(jù)庫中的彩鈴文件進行分析,確定哪些彩鈴 文件會產(chǎn)生雜音;對于確定的會產(chǎn)生雜音的彩鈴文件進行調(diào)制優(yōu)化,使得經(jīng)過調(diào)制優(yōu)化后 的彩鈴文件經(jīng)過彩鈴平臺后,不再產(chǎn)生雜音,或者,產(chǎn)生雜音的概率降低,從而提高了彩鈴 的鈴音質(zhì)量,進而提升了客戶滿意度。
圖1為本發(fā)明實施例中雜音能量特征值檢測的方法流程圖;圖2為本發(fā)明實施例的彩鈴音質(zhì)優(yōu)化的方法流程圖;圖3為本發(fā)明實施例的彩鈴音質(zhì)優(yōu)化的裝置結(jié)構(gòu)圖。
具體實施例方式通過對大量產(chǎn)生雜音的鈴音文件樣本進行分析,發(fā)現(xiàn)放音時產(chǎn)生雜音的彩鈴具備以下特征(1)每次產(chǎn)生雜音的地方在語音低谷(語音信號幅度較小的位置)或者在語音高 谷(語音信號幅度較大的位置),但卻不是每個語音低谷或者語音高谷都產(chǎn)生雜音;(2)同一個鈴音文件產(chǎn)生雜音的位置相同;(3)同一個鈴音文件,有時候產(chǎn)生雜音,有時候卻無雜音,經(jīng)過統(tǒng)計,產(chǎn)生雜音的概 率為95% ;(4)分別用手機和固定電話播聽彩鈴,前者產(chǎn)生雜音機率大,后者產(chǎn)生雜音幾率通過以上的分析可知,鈴音文件本身的某些特征值是觸發(fā)彩鈴平臺播放彩鈴時產(chǎn) 生雜音的主要原因,而這些特征值與語音信號的能量密切相關(guān);同時,系統(tǒng)本身外的其他環(huán) 節(jié)也會影響雜音的產(chǎn)生?;诖?,本發(fā)明實施例提出了一種從彩鈴源入手的雜音解決方案通過對大量的 產(chǎn)生雜音的鈴音文件樣本進行分析,得到雜音能量特征值;然后,根據(jù)所述雜音能量特征值 對彩鈴數(shù)據(jù)庫中的彩鈴文件進行分析,確定哪些彩鈴文件會產(chǎn)生雜音;對于確定的會產(chǎn)生 雜音的彩鈴文件進行調(diào)制優(yōu)化,使得經(jīng)過調(diào)制優(yōu)化后的彩鈴文件經(jīng)過彩鈴平臺后,不再產(chǎn) 生雜音,或者,產(chǎn)生雜音的概率降低。參照圖1,本發(fā)明實施例的雜音能量特征值檢測的方法,包括如下步驟步驟101 選擇一個會產(chǎn)生雜音的鈴音文件,并定位出其中產(chǎn)生雜音的語音段;從彩鈴數(shù)據(jù)庫中選擇鈴音文件,并通過彩鈴平臺進行播放,然后,選中產(chǎn)生雜音的 鈴音文件,并記錄該鈴音文件中產(chǎn)生雜音的語音段。步驟102 計算所選擇的鈴音文件的平均能量以及其中產(chǎn)生雜音的語音段的平均
能量;先計算出鈴音文件中每個采樣點的瞬時能量,根據(jù)所述每個采樣點的瞬時能量便 可計算所述平均能量。具體地,各采樣點瞬時能量之和除以采樣點數(shù)即為平均能量。瞬時能量的計算方法有多種,示例性地,本發(fā)明實施例提供如下三種優(yōu)選的能量 估計模型(1)絕對值回歸模型瞬時能量計算方法=P⑴=(1-a) *P (i_l) +a* | χ (i)其中,P⑴為第i個采樣點的瞬時能量,P(I) = x(l) I,x(i)為第i個采樣點上 的語音信號,i = 1,2,...,η,η為采樣點數(shù)目,a是取值在0到1之間的常數(shù),其反映了相 鄰采樣點的瞬時能量之間的相關(guān)性。(2)平法回歸模型瞬時能量計算方法=P⑴=(1-a) *P (i_l) +a*x (i) *x (i)其中,P(i)為第i個采樣點的瞬時能量,P(I) = x(l) I,x(i)為第i個采樣點上 的語音信號,i = 1,2,...,η,η為采樣點數(shù)目,a是取值在0到1之間的常數(shù),其反映了相 鄰采樣點的瞬時能量之間的相關(guān)性。(3)絕對值模型瞬時能量計算方法=P⑴=I χ⑴其中,P⑴為第i個采樣點的瞬時能量,x(i)為第i個采樣點上的語音信號,i =1,2,...,n,n為采樣點數(shù)目。步驟103 分別計算各個產(chǎn)生雜音的語音段的平均能量與鈴音文件的平均能量的 比值,得到多個比值,并獲取其中的最小比值min_rate和最大比值maxjate ;步驟104 反復(fù)執(zhí)行上述步驟101 103,得到多個最小比值min_rate和多個最大 比值 max_rate ;步驟105 從所述多個最小比值min_rate和多個最大比值maxjate中,選取出 現(xiàn)次數(shù)最多的最小比值minjate和最大比值maxjate,將所述出現(xiàn)次數(shù)最多的最小比值 mirurate作為雜音能量特征值中的第一門限,將所述出現(xiàn)次數(shù)最多的最大比值maxjate 作為雜音能量特征值中的第二門限。一般來說,比值小于第一門限或者大于第二門限的語 音段,產(chǎn)生雜音的概率比較高。確定了彩鈴文件產(chǎn)生雜音的能量特征值后,就可以利用該能量特征值來判斷彩鈴 數(shù)據(jù)庫中的彩鈴文件是否會產(chǎn)生雜音,并對會產(chǎn)生雜音的彩鈴文進行調(diào)制優(yōu)化處理。進一 步,還可以根據(jù)調(diào)制優(yōu)化處理結(jié)果來反饋修正所述第一門限和第二門限。通過對彩鈴數(shù)據(jù)庫中產(chǎn)生雜音的彩鈴進行分析發(fā)現(xiàn),所述第一門限取0. 1、所述第 二門限取0. 85比較適合。參照圖2,本發(fā)明實施例的彩鈴音質(zhì)優(yōu)化的方法,包括如下步驟步驟201 計算鈴音文件的平均能量以及其中每個語音幀的平均能量;先計算出鈴音文件中每個采樣點的瞬時能量,根據(jù)所述每個采樣點的瞬時能量便 可計算所述平均能量。具體地,各采樣點瞬時能量之和除以采樣點數(shù)即為平均能量。瞬時 能量的計算方法有多種,優(yōu)選地,可采用上述的絕對值回歸模型、平法回歸模型或者絕對值 模型來計算所述瞬時能量。步驟202 分別計算每個語音幀的平均能量與鈴音文件的平均能量的比值;步驟203 統(tǒng)計比值小于第一門限或者大于第二門限的語音幀總數(shù);統(tǒng)計比值小于第一門限的語音幀數(shù)目,得到第一數(shù)目;統(tǒng)計比值大于第二門限的 語音幀數(shù)目,得到第二數(shù)目;將第一數(shù)目和第二數(shù)目相加,得到所述語音幀總數(shù)。步驟204 當(dāng)所述語音幀總數(shù)大于第三門限時,則確定該鈴音文件會產(chǎn)生雜音;例如,取第三門限為5,N代表比值在特征值范圍W. 1,0. 85]之外的語音幀數(shù)目, 如果N > 5,則認為該鈴音文件會產(chǎn)生雜音。步驟205 對確定的會產(chǎn)生雜音的鈴音文件進行調(diào)制優(yōu)化。本發(fā)明實施例提出了一種基于能量的調(diào)制優(yōu)化方法,針對產(chǎn)生雜音的鈴音文件進 行自動增益控制(AGC)來減少雜音產(chǎn)生的概率。具體地,本發(fā)明實施例提供如下三種調(diào)制 方法(1)基于全局的調(diào)制基于全局的調(diào)制是指,提高整個鈴音文件的平均能量。具體地,鈴音文件的全局調(diào) 制方法分為以下幾步第一步根據(jù)鈴音文件的平均能量,獲取對應(yīng)的平均能量級別,根據(jù)獲取的平均能 量級別,選擇一個能量提高比率,經(jīng)過實驗,發(fā)現(xiàn)能量提高比率取值在0. 1 0. 3較適合;在本發(fā)明中,可以預(yù)先對平均能量進行分級,每個平均能量級別對應(yīng)一個平均能 量范圍,并且,每個平均能量級別還對應(yīng)一個能量提高比率。
第二步利用最小均方算法(IiK)對鈴音文件進行增益控制,即,按照選擇的能量 提高比率提高鈴音文件的平均能量;第三步對提高能量后的鈴音文件進行平滑處理,使得各采樣點上的語音信號連 續(xù)。其中,能量提高比率可設(shè)置3個候選值,例如0. 1,0. 2,0. 3,默認值設(shè)置為0. 2。(2)基于局部的調(diào)制只針對產(chǎn)生雜音的語音段進行調(diào)制,提高該語音段的平均能量,不對鈴音文件整 體進行增益控制,鈴音文件的局部調(diào)制方法分為以下兩步第一步確定雜音的起始位置a和終止位置b ;第二步對雜音段[a,b]的語音信號進行一定比率的增益控制。(3)多次調(diào)制在一次全局調(diào)制的基礎(chǔ)上,通過修改能量提高比率進行多次全局調(diào)制,然后再對 仍然可能有雜音的部分語音段進行局部調(diào)制。這種方法是全局調(diào)制和局部調(diào)制的組合,經(jīng) 過實驗驗證,這種調(diào)制方法能夠有效的避免雜音的產(chǎn)生。參照圖3,本發(fā)明實施例的彩鈴音質(zhì)優(yōu)化的裝置包括,能量計算單元、比值計算單 元、統(tǒng)計單元、雜音判斷單元和調(diào)制優(yōu)化單元。其中所述能量計算單元,用于計算鈴音文件的平均能量以及其中每個語音幀的平均能 量。先計算出鈴音文件中每個采樣點的瞬時能量,根據(jù)所述每個采樣點的瞬時能量便可計 算所述平均能量。具體地,各采樣點瞬時能量之和除以采樣點數(shù)即為平均能量。瞬時能量 的計算方法有多種,優(yōu)選地,可采用上述的絕對值回歸模型、平法回歸模型或者絕對值模型 來計算所述瞬時能量。所述比值計算單元,用于分別計算每個語音幀的平均能量與鈴音文件的平均能量 的比值。所述統(tǒng)計單元,用于統(tǒng)計比值小于第一門限或者大于第二門限的語音幀總數(shù)。統(tǒng) 計比值小于第一門限的語音幀數(shù)目,得到第一數(shù)目;統(tǒng)計比值大于第二門限的語音幀數(shù)目, 得到第二數(shù)目;將第一數(shù)目和第二數(shù)目相加,得到所述語音幀總數(shù)。所述雜音判斷單元,用于當(dāng)所述語音幀總數(shù)大于第三門限時,確定該鈴音文件會 產(chǎn)生雜音。例如,取第三門限為5,N代表比值在特征值范圍W. 1,0.85]之外的語音幀數(shù) 目,如果N > 5,則認為該鈴音文件會產(chǎn)生雜音。所述調(diào)制優(yōu)化單元,用于對確定的會產(chǎn)生雜音的鈴音文件進行調(diào)制優(yōu)化。具體地, 所述調(diào)制優(yōu)化單元通過對鈴音文件進行增益控制,以提高整個鈴音文件的平均能量,或者, 提高鈴音文件中產(chǎn)生雜音的語音段的平均能量。示例性地,可以采用上述的基于全局的調(diào) 制、基于局部的調(diào)制或者多次調(diào)制方法對會產(chǎn)生雜音的鈴音文件進行調(diào)制優(yōu)化。進一步,所述裝置中還可包括門限獲取單元(圖未示),用于通過對多個會產(chǎn)生雜 音的鈴音文件進行分析,來得到所述第一門限和第二門限。具體地,所述門限獲取單元可以 按照上述的雜音能量特征值檢測的方法來確定所述第一門限和第二門限。綜上所述,本發(fā)明實施例通過對大量的產(chǎn)生雜音的鈴音文件樣本進行分析,得到 雜音能量特征值;然后,根據(jù)所述雜音能量特征值對彩鈴數(shù)據(jù)庫中的彩鈴文件進行分析,確 定哪些彩鈴文件會產(chǎn)生雜音;對于確定的會產(chǎn)生雜音的彩鈴文件進行調(diào)制優(yōu)化,使得經(jīng)過調(diào)制優(yōu)化后的彩鈴文件經(jīng)過彩鈴平臺后,不再產(chǎn)生雜音,或者,產(chǎn)生雜音的概率降低,從而 提高了彩鈴的鈴音質(zhì)量,進而提升了客戶滿意度。 最后應(yīng)當(dāng)說明的是,以上實施例僅用以說明本發(fā)明的技術(shù)方案而非限制,本領(lǐng)域 的普通技術(shù)人員應(yīng)當(dāng)理解,可以對本發(fā)明的技術(shù)方案進行修改或者等同替換,而不脫離本 發(fā)明技術(shù)方案的精神范圍,其均應(yīng)涵蓋在本發(fā)明的權(quán)利要求范圍當(dāng)中。
權(quán)利要求
1.一種彩鈴音質(zhì)優(yōu)化的方法,其特征在于,包括計算鈴音文件的平均能量以及其中每個語音幀的平均能量;分別計算每個語音幀的平均能量與鈴音文件的平均能量的比值;統(tǒng)計比值小于第一門限或者大于第二門限的語音幀總數(shù);當(dāng)所述語音幀總數(shù)大于第三門限時,則確定該鈴音文件會產(chǎn)生雜音;對確定的會產(chǎn)生雜音的鈴音文件進行調(diào)制優(yōu)化。
2.如權(quán)利要求1所述的方法,其特征在于通過對多個會產(chǎn)生雜音的鈴音文件進行分析,來得到所述第一門限和第二門限。
3.如權(quán)利要求2所述的方法,其特征在于,所述通過對多個會產(chǎn)生雜音的鈴音文件進 行分析,來得到所述第一門限和第二門限,包括如下步驟A、選擇一個會產(chǎn)生雜音的鈴音文件,并定位出其中產(chǎn)生雜音的語音段;B、計算所選擇的鈴音文件的平均能量以及其中產(chǎn)生雜音的語音段的平均能量;C、分別計算各個產(chǎn)生雜音的語音段的平均能量與鈴音文件的平均能量的比值,得到多 個比值,并獲取其中的最小比值和最大比值;D、反復(fù)執(zhí)行上述步驟A C,得到多個最小比值和多個最大比值;E、從所述多個最小比值中選取出現(xiàn)次數(shù)最多的最小比值,從所述多個最大比值中選取 出現(xiàn)次數(shù)最多的最大比值,并將所述出現(xiàn)次數(shù)最多的最小比值作為所述第一門限,將所述 出現(xiàn)次數(shù)最多的最大比值作為所述第二門限。
4.如權(quán)利要求1或3所述的方法,其特征在于,按照如下公式計算鈴音文件中的采樣點 的瞬時能量P⑴=(l-a)*P(i-l)+a*|X⑴|,其中,P(i)為第i個采樣點的瞬時能量,P(1)= X (1) I,X (i)為第i個采樣點上的語音信號,i = 1,2,. . .,η,η為采樣點數(shù)目,a是取值在 0到1之間的常數(shù)。
5.如權(quán)利要求1或3所述的方法,其特征在于,按照如下公式計算鈴音文件中的采樣點 的瞬時能量P⑴=(1-&)*卩(1-1)+&襯(1)襯(1),其中,卩(土)為第i個采樣點的瞬時能量,P(I)= IX (1) I,X (i)為第i個采樣點上的語音信號,i = 1,2,. . .,η,η為采樣點數(shù)目,a是取值在 0到1之間的常數(shù)。
6.如權(quán)利要求1或3所述的方法,其特征在于,按照如下公式計算鈴音文件中的采樣點 的瞬時能量P⑴=Ix⑴I,其中,P⑴為第i個采樣點的瞬時能量,x(i)為第i個采樣點上的語 音信號,i = l,2,...,n,n為采樣點數(shù)目。
7.如權(quán)利要求1所述的方法,其特征在于,所述對確定的會產(chǎn)生雜音的鈴音文件進行 調(diào)制優(yōu)化為對鈴音文件進行增益控制,以提高整個鈴音文件的平均能量,或者,提高鈴音文件中產(chǎn) 生雜音的語音段的平均能量。
8.一種彩鈴音質(zhì)優(yōu)化的裝置,其特征在于,包括能量計算單元,用于計算鈴音文件的平均能量以及其中每個語音幀的平均能量;比值計算單元,用于分別計算每個語音幀的平均能量與鈴音文件的平均能量的比值;統(tǒng)計單元,用于統(tǒng)計比值小于第一門限或者大于第二門限的語音幀總數(shù);雜音判斷單元,用于當(dāng)所述語音幀總數(shù)大于第三門限時,確定該鈴音文件會產(chǎn)生雜曰;調(diào)制優(yōu)化單元,用于對確定的會產(chǎn)生雜音的鈴音文件進行調(diào)制優(yōu)化。
9.如權(quán)利要求8所述的裝置,其特征在于,還包括門限獲取單元,用于通過對多個會產(chǎn)生雜音的鈴音文件進行分析,來得到所述第一門 限和第二門限。
10.如權(quán)利要求8所述的裝置,其特征在于,所述調(diào)制優(yōu)化單元進一步用于對鈴音文件進行增益控制,以提高整個鈴音文件的平均能量,或者,提高鈴音文件中產(chǎn) 生雜音的語音段的平均能量。
全文摘要
本發(fā)明提供一種彩鈴音質(zhì)優(yōu)化的方法及裝置。方法包括計算鈴音文件的平均能量以及其中每個語音幀的平均能量;分別計算每個語音幀的平均能量與鈴音文件的平均能量的比值;統(tǒng)計比值小于第一門限或者大于第二門限的語音幀總數(shù);當(dāng)所述語音幀總數(shù)大于第三門限時,則確定該鈴音文件會產(chǎn)生雜音;對確定的會產(chǎn)生雜音的鈴音文件進行調(diào)制優(yōu)化。依照本發(fā)明,能夠有效提高彩鈴的鈴音質(zhì)量。
文檔編號G10L21/00GK102074244SQ20091023871
公開日2011年5月25日 申請日期2009年11月20日 優(yōu)先權(quán)日2009年11月20日
發(fā)明者馮偉, 吳偉剛, 肖鑫, 辛?xí)杂? 陳毓鋒 申請人:中國移動通信集團廣東有限公司