音頻信號響度級的自動校正的制作方法

文檔序號：7521146閱讀：261來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>電子電路裝置的制造及其應(yīng)用技術(shù)

專利名稱：音頻信號響度級的自動校正的制作方法
技術(shù)領(lǐng)域：
本發(fā)明涉及對包含至少兩個不同音軌(track)的音頻輸出信號的增益進行調(diào)整 (adapt)的方法和系統(tǒng)，這至少兩個不同音軌具有不同信號水平范圍。
背景技術(shù)：
在本領(lǐng)域中，已知有許多不同的包含音樂和/或語音的音頻信號源。音樂信號可被存儲在CD、DVD或任意其它的存儲介質(zhì)中。尤其是隨著例如MPEG的新壓縮方案的發(fā)展，具有不同的風(fēng)格和表演者的音頻信號被保存在存儲介質(zhì)上，并可被組合成要播放給用戶的播放列表。尤其是在車輛環(huán)境中，乘客感受到的音頻信號包括音頻信號本身和道路輪胎噪聲、空氣動力噪聲和發(fā)動機噪聲。不同音頻源的不同音頻信號通常具有不同的信號和動態(tài)壓縮水平。經(jīng)常地，音頻輸出信號的不同音軌具有不同信號水平范圍，被用戶感知到時具有不同的響度級。尤其是在車輛環(huán)境中，所接收的音頻信號對于用戶應(yīng)該是能感知到的，這意味著所接收的音頻信號必須超過車輛中存在的噪聲。同時總音頻信號水平不應(yīng)超過一定的水平，如果超過該水平則會對用戶產(chǎn)生聽覺損害或使用戶感覺疼痛。

發(fā)明內(nèi)容
因此，存在允許對音頻信號中的響度級進行動態(tài)自動校正的需求，尤其是在嘈雜環(huán)境中。并且在收聽電影時聲音或音樂不應(yīng)超過一定響度的環(huán)境中，例如在晚間使用家庭影院時，需要響度級的動態(tài)自動校正。這種需要可由獨立權(quán)利要求的特征滿足。在從屬權(quán)利要求中，描述了本發(fā)明的實施例的優(yōu)選實施例。依據(jù)本發(fā)明的第一方面，提供了用于對包含至少兩個不同音軌的音頻輸出信號的增益進行調(diào)整方法，這至少兩個不同音軌具有不同信號水平范圍。該方法包括基于人類聽覺的心理聲學(xué)模型動態(tài)地確定音頻輸入信號的感知響度。額外地，動態(tài)地確定增益確定單元輸出的音頻輸出信號的增益，該增益確定單元接收所確定的響度并輸出音頻輸出信號，其中增益被確定成使得音頻輸出信號的所述至少兩個音軌被輸出時在預(yù)定的信號水平范圍內(nèi)。通過以使不同的音軌被輸出時在預(yù)定范圍內(nèi)的方式對輸出信號水平進行自動地調(diào)整，對于不同音軌可獲得一個相等的響度。此外，用戶不再需要音量調(diào)節(jié)。尤其是避免了對音軌音量或具有高信號聲壓級SPL的音頻信號的減少，還避免了在具有相當(dāng)?shù)偷男盘柭晧杭壍囊纛l信號的情況下對音量的增加。因此，可以在保留音頻信號的動態(tài)結(jié)構(gòu)的同時，使所有不同音頻信號源具有相等的響度。不同的音軌可以是為相同的音頻信號的回放提供的，或者這些不同的音軌可來自不同的信號源或存儲媒介。響度可通過單獨使用所述心理聲學(xué)模型，或者結(jié)合使用所述心理聲學(xué)模型與音頻輸入信號的信號統(tǒng)計來確定。依據(jù)優(yōu)選的實施例，本方法包括確定所述至少兩個不同音軌之間的暫?；蛞粋€音軌內(nèi)的暫停的步驟，在該暫停中噪聲是占主導(dǎo)的音頻輸入信號。當(dāng)檢測出這樣的具有噪聲的暫停時，減少在確定的暫停中的增益，以便避免噪聲的放大。在本發(fā)明的一個實施例中，通過使用對如正在收聽音頻輸入信號的收聽者所感知的音頻輸入信號的空間感知的模擬來基于雙耳定位模型確定所述輸入信號是否能夠被定位，以在音頻輸入信號中檢測出噪聲。如果能夠使用所述人類聽覺的心理聲學(xué)模型定位音頻輸入信號，則該音頻輸入信號不能被當(dāng)作噪聲。但是，如果音頻輸入信號不能被定位，則該音頻輸入信號被當(dāng)作是主要包含噪聲。結(jié)果，可避免增加僅包含噪聲的音頻信號的響度。優(yōu)選地，如果檢測到超過預(yù)定時間段(例如IO-IOOms之間，優(yōu)選地在50ms左右)內(nèi)的暫停，為該暫停減少增益。因此，只有在長于例如50ms的時間內(nèi)檢測到暫停，增益才被降低，以便避免在非常短的不包含音樂信號時期的音軌中降低增益。但是如果音頻輸入信號包含更多的信息并且該輸入信號水平很低，則因此應(yīng)該通過以使得音頻輸出信號覆蓋預(yù)定的信號水平范圍的方式增加增益，來調(diào)整該增益。因此，通過對增益進行控制來降低具有太高的音頻輸入水平的音頻輸入信號，使得預(yù)定的信號水平范圍被覆蓋，并且如果輸入音頻水平太低，則該增益被提高，以便覆蓋相同的信號水平范圍。對于基于輸入信號的定位能力的暫停檢測可使用定位模型。該定位模型可額外地被用于估計響度。正常地，以多個塊的方式處理音頻信號，與對每個采樣進行處理相比節(jié)省了處理時間。依據(jù)本發(fā)明的一個實施例，每個塊的增益通過使用時間常數(shù)來確定，該時間常數(shù)描述了從一個信號塊到下一個塊的響度改變。在該實施例中，提升時間常數(shù)被用于描述在兩個連續(xù)的塊之間的上升的信號響度，而下降時間常數(shù)被用于描述在兩個連續(xù)的塊之間的下降的響度。一個塊包含一個或若干個數(shù)字音頻輸入信號的信號采樣。優(yōu)選地，時間常數(shù)被配置成，使得與下降時間常數(shù)允許響度下降相比，提升時間常數(shù)允許更快的響度增加。信號暫停之后的新音軌開始處需要快速的響度增加，此處需要從一個塊到另一個塊突然地增加響度。兩個塊之間響度下降的較低的可能性允許保持在該音頻信號中最初包含的增加的響度的動態(tài)。優(yōu)選地，時間常數(shù)是自適應(yīng)時間常數(shù)，其中該自適應(yīng)時間常數(shù)被調(diào)整成，使得允許時間常數(shù)在音軌開始處，比稍后的音軌期間改變得更快。這使得在音軌開始處響度能夠被快速調(diào)整，并仍然有助于保持例如在音樂的音軌中的音頻信號中包含的動態(tài)。尤其地，在包含古典音樂的音樂音軌中，應(yīng)該保持和信號中最初包含的一樣的信號水平的動態(tài)。優(yōu)選地，當(dāng)兩個音軌之間檢測到暫停時，重置自適應(yīng)時間常數(shù)。音頻信號源的一些用戶可能喜歡保持原始音頻信號的動態(tài)范圍而不對增益進行調(diào)整以達(dá)到適合的響度。為實現(xiàn)這種結(jié)果，可以進一步控制由增益確定單元確定的增益，使得由增益確定單元確定的增益的量可由用戶調(diào)整。作為示例，可以指示出，自動地并動態(tài)地調(diào)整的增益可被100%地使用。但是，也可以將增益調(diào)整控制成，使得對于音頻輸出信號水平，根本不考慮由增益確定單元確定的被確定增益。此外，音頻輸入信號在被輸出之前可被延遲，該延遲與對調(diào)整增益進行確定所需的時間相對應(yīng)。這種延遲可以是恒定的，或可以隨調(diào)整增益的計算而改變。本發(fā)明還涉及如上描述的那樣調(diào)整增益的系統(tǒng)，該系統(tǒng)包括響度確定單元，該響度確定單元基于人類聽覺的心理聲學(xué)雙耳模型，并最終基于音樂輸入信號的信號統(tǒng)計，或者基于兩者的結(jié)合，動態(tài)地確定音頻輸入信號的響度。在接收所確定的響度的系統(tǒng)中提供了增益確定單元，該增益確定單元輸出具有調(diào)整增益的音樂輸出信號，其中該增益確定單元動態(tài)地確定音樂輸出信號的增益，使得音頻輸出信號的至少兩個音軌以覆蓋預(yù)定的信號水平范圍的方式被輸出。音頻分析單元，如以上提及的那樣，通過分析對輸入信號進行定位的可能性，或通過使用信號統(tǒng)計確定了暫停。該音樂分析單元試圖使用輸入信號空間調(diào)整的模擬來定位音頻輸入信號。在EP 152^68A1中描述了如何使用如收聽者感知的那樣的音樂輸入信號空間感知進行定位的一個實施例。定位的進一步的細(xì)節(jié)可參考此文檔。進一步的細(xì)節(jié)也可以在Wolfgang Hess 等人于 2003 年 10 月，在 Audio Engineering Society Convention Paper 5864，115thConvention 中發(fā)表的 “Acoustical Evaluation of Virtual Rooms by Means of Binaural Activity Patterns”中找到。對于信號源的定位可參考由W. Lindemann在 Journal of Acoustic Society of America，1986 年 12 月，p. 1608-1622，Vol. 80 (6)的 "Extension of a Binaural Cross-Correlation Model by Contralateral Inhibition. I. Simulation of Lateralization for Stationary Signals”。音頻分析單元如上所述那樣確定自適應(yīng)時間常數(shù)，并在檢測到暫停時對這些自適應(yīng)時間常數(shù)進行重置?？赏ㄟ^使用上面提到的暫停檢測來識別不同音軌的內(nèi)容，來將音頻信號的不同音軌分隔開。該系統(tǒng)可包括增益控制單元，該增益控制單元被配置成將增益控制成使得確定多少數(shù)量的確定增益被用于輸出信號的輸出信號水平。這種增益控制單元可被用戶界面控制，該用戶界面允許用戶選擇什么程度的確定增益應(yīng)被用于控制音頻輸出信號的信號水平。而且，可能存在延遲單元，在音頻輸入信號伴隨著被控制的增益被輸出之前，將延遲時間引入音頻輸入信號。該延遲元件引入了與確定調(diào)整增益所需的延遲時間相對應(yīng)的延遲。

將參考附圖更詳細(xì)地描述本發(fā)明，其中圖1示意性地示出了車輛內(nèi)的聲音分量，包含噪音和音頻分量；圖2示出了音頻輸入信號與無增益調(diào)整的估計響度的示例，包括不同的時間常量以平滑響度，即，對增加響度的快速反應(yīng)和在減少響度級處的延遲反應(yīng)；圖3示出了音頻輸入信號的動態(tài)水平調(diào)節(jié)，如應(yīng)該為自動響度調(diào)節(jié)進行調(diào)節(jié)一樣，當(dāng)已知整個信號內(nèi)容時進行理想地校正，12個平均響度線被示出；圖4示意性地示出了用于調(diào)整音頻輸出信號增益的系統(tǒng)；圖5示出了被用于確定音頻輸入信號響度的音頻分析單元的更詳細(xì)的視圖；圖6示意性地示出了向音頻信號引入時間常數(shù)，表現(xiàn)為從一個塊到另一個塊的增益改變；圖7示出了不具有以及具有自動響度調(diào)整的音頻輸入信號水平；圖8示出了在自動響度調(diào)整之前和之后，音頻輸入信號的另一個示例。
具體實施例方式從圖1可以看出，取決于使用的車輛，乘車者感知到不同的環(huán)境噪聲。車輛聲音信號包括噪聲分量10和音頻信號分量20。噪聲信號分量10可歸因于道路輪胎噪聲、空氣動力噪聲或發(fā)動機噪聲。在圖1的右側(cè)部分中，指示了不同車輛的噪聲，該噪聲取決于車輛速度。曲線11描述了在跑車或運動型車中產(chǎn)生的噪聲，而曲線12示出了 SUV的與速度相關(guān)的噪聲。正如所看到的，噪聲可具有在60到85dB SPL(信號聲壓級)之間的值。由于聽力痛苦閾值在120dB SPL周圍，音頻信號分量的范圍在20-40dB SPL之間。在圖2的上圖部分中，以滿刻度示出了音頻輸入信號的信號水平，表示OdB滿刻度 (OdBFS)被分配到數(shù)字域最大可能的信號水平，dB滿刻度表示相對于滿刻度的分貝。正如從圖2的上圖部分可以看出的，信號水平變化地相當(dāng)大，并因此使得被使用者感知的對應(yīng)于該信號的響度級也變化地相當(dāng)大。在圖2的下圖部分，相應(yīng)的響度被從信號輸入水平中估計出，在 ITU-RBS. 1770-1 ("Algorithms to Measure Audio Program Loudness and to a Peak Audio Level")的建議中描述了一種響度估計的可能方法。在本申請中，響度可通過雙耳定位模型(binaural localization model)估計。如果如圖2示出的聲音信號在車輛中向使用者播放，該音頻信號的一些部分可能會被感知到具有令人不快的響度，而音頻信號的其它部分可能被認(rèn)為太低而不能被使用者正確地感知。在圖3中示出了圖2中的信號被理想地調(diào)節(jié)后的水平。作為示例，為了讓使用者良好地感知到，在范圍21中的信號采樣應(yīng)被調(diào)整成較低的信號水平，而在范圍22中的信號應(yīng)被調(diào)整成較高的信號水平。相似地，范圍23中的信號將以強烈減弱的信號水平被輸出。作為示例，在圖2中示出的不同采樣可源自于由例如存儲介質(zhì)(例如硬盤)的單信號源提供的音頻信號的不同音軌。在另一個實施例中，不同的音軌/樂曲可源自于不同音頻信號源，例如CD/DVD上提供了第一音軌，而在硬盤上提供了所播放的另一個音軌，此處音樂信號可被存儲為例如MP3的壓縮格式。這兩個音軌也可均以壓縮或未壓縮的格式存儲在硬盤上。在圖3的下圖部分中，示出了上圖部分的對應(yīng)的經(jīng)理想調(diào)節(jié)的水平的估計響度。當(dāng)比較圖2的下圖部分與圖3的下圖部分時，可推導(dǎo)出圖3示出的響度估計值優(yōu)于圖2中示出的響度估計值。圖3的響度估計值可比圖2的響度估計值感知的感覺更好。在此得到了并形像化了平滑的、相對恒定的響度。圖4中示出了一種系統(tǒng)，使用該系統(tǒng)可如同圖3的實施例中示意性示出的那樣對響度進行調(diào)整。所示的系統(tǒng)包括音頻信號分析單元30，其中使用人類聽力的心理聲學(xué)定位模型并使用信號統(tǒng)計確定音頻輸入信號，例如娛樂音頻信號的響度。該音頻輸入信號19被輸入到包括增益控制單元41和延遲元件42的信號控制器40。通過使用用戶界面50控制由增益控制確定的增益，在用戶界面50能夠確定在被經(jīng)由揚聲器60輸出或被饋給后處理級之前，由增益確定單元確定的增益是否被用于音頻輸出信號19，或以哪種程度被用于音頻輸出信號19。娛樂或音頻輸入信號可以是2. 0、1. 5或7. 1倍的作為音頻信號18輸入音頻信號分析單元和信號控制器40中的音頻信號或另一種格式。在信號分析單元30中，象征性地示出響度是基于人類聽覺心理聲學(xué)模型并基于信號的統(tǒng)計確定的。心理聲學(xué)模型被用于估計響度、聲音定位，并被用于確定噪音是否在音頻輸入信號中作為主導(dǎo)因素存在，例如暫停期間或兩個音軌之間。信號統(tǒng)計是確定或估計響度以及確定在該音頻信號中是否存在具有噪聲的暫停的第二基礎(chǔ)。作為示例，可確定該娛樂音頻信號的信號強度。單獨地基于心理聲學(xué)模型或基于心理聲學(xué)模型與統(tǒng)計信號模型的結(jié)合，響度的適配通過將在下面詳細(xì)描述的動態(tài)確定自適應(yīng)時間常量來確定。在圖5中，示出了音頻信號分析單元30的更詳細(xì)的視圖。該音頻信號分析單元包括對接收音頻輸入信號的響度進行估計的響度確定單元31。該響度確定單元31可使用本領(lǐng)域公知的方法和如在ITU-R BS 1770-1中描述的其他方法來確定響度。該響度確定單元可進一步使用人類聽力的雙耳模型，該人類聽力的雙耳模型用于在聽到音頻輸入信號 18時確定響度并用于確定該音頻輸入信號18是否可被用戶定位以及被定位在何處。該雙耳模型模擬音頻輸入信號的空間感知，并允許確定該音頻輸入信號是否主要包含噪聲或例如音樂或語音的任何其它輸入信號。在本申請前面提到的文件中，主要在EP 1522868A1， W. Lindemann 的文件中或在上面提到的 Audio Engineering Society Convention Paper 5864中，更詳細(xì)地描述了對音頻輸入信號的定位。這種定位技術(shù)允許區(qū)分噪音和其它聲音信號，并有助于在音頻輸入信號中僅檢測出噪聲時避免該噪聲經(jīng)過增加的增益被輸出。還允許在檢測出暫停時重置自適應(yīng)時間常數(shù)。該響度確定單元使用人類聽覺的心理聲學(xué)模型對音頻輸入信號的響度進行估計。而且，響度確定單元31可額外地使用統(tǒng)計信號處理，以便估計該音頻輸入信號的響度或檢測信號的暫停。在音頻輸入信號統(tǒng)計分析中，確定了音頻輸入信號的不同采樣的實際信號水平。作為示例，如果該輸入信號的若干連續(xù)采樣的信號水平符合高斯分布，可推論出所處理的采樣只包含噪聲而不含其它音頻信號。然后音頻信號分析單元使用響度估計的結(jié)果，以便計算被引入到音頻輸入信號中的時間常數(shù)。在圖5中，時間常數(shù)的計算由時間常數(shù)生成器32代表。音頻信號分析單元30進一步包括調(diào)整該音頻輸出信號17的增益的增益確定單元 35。響度確定單元31通過發(fā)出dB響度等值(dBLEQ)提供了一定部分的音樂輸入信號，例如包含若干采樣的塊的響度。該增益確定單元具有預(yù)定的信號水平或任意其它信號水平閾值，該預(yù)定的信號水平為當(dāng)輸出例如圖7和圖8的下圖部分示出的-12dB的音頻信號時應(yīng)該滿足的信號水平。在增益確定單元中，從要獲得的平均信號水平中減去確定出的響度，以便計算增益。作為示例，如果確定出的響度對應(yīng)于_5dB，并且如果目標(biāo)為-12dB滿刻度，則必須據(jù)此通過降低增益來調(diào)整增益，以便具有約-12dB的平均信號水平。在圖6中示出了由時間常數(shù)沈分隔開的音頻輸入信號的不同的采樣25。該時間常數(shù)26說明了從一個采樣到下一個采樣應(yīng)該如何調(diào)整響度。該時間常數(shù)可以是提升時間常數(shù)或下降時間常數(shù)。提升時間常數(shù)說明從一個采樣到下一個采樣信號增益如何被增加，反之下降時間常數(shù)說明從一個采樣到下一個采樣增益減少。時間常數(shù)26是以使得提升時間常數(shù)可比下降時間常數(shù)更迅速地被調(diào)整的方式確定的。作為示例，如果在兩個音軌之間或在一個音軌內(nèi)確定出信號暫停，則不應(yīng)增加音頻信號水平以便避免噪聲的放大。當(dāng)新的音軌開始時，在非常低的信號水平之后可能立即出現(xiàn)高信號水平。因此必須對響度估計的提升時間常數(shù)進行調(diào)整，以便避免新音軌開始處的信號水平被大大增加。在音頻信號水平減少情況下的下降時間常數(shù)只允許與信號水平的增加相比信號水平較慢地減少。而且，時間常數(shù)為自適應(yīng)時間常數(shù)，表示音軌越長，時間常數(shù)反應(yīng)越慢。對于提升和下降時間常數(shù)，這可能是有效的。經(jīng)平滑的響度估計還保證了和人類感知響度的方式一樣的響度估計。尖峰和凹谷(dips)被人類聽覺系統(tǒng)平滑掉。時間常數(shù)隨著音頻音軌的時間增加而更慢地變化，有助于保持該音頻信號的動態(tài)。但是，也在到達(dá)音樂信號的長運行時間時，對增加的響度的較短的反應(yīng)時間保證了對較快信號增長的適當(dāng)反應(yīng)。在圖6的下圖部分中，示出對于音樂信號隨時間過去的增益增長和增益下降。對于音樂采樣的第一塊61，第一增益被確定為所示出的那樣。對于隨后的信號塊62，確定其具有增加的增益，隨后的信號塊63具有輕微下降的增益。基于使用時間常數(shù)的響度調(diào)整，確定了每個塊的增益，即每個塊的目標(biāo)增益。于是塊η的目標(biāo)增益實現(xiàn)為從前一個塊n-1 的目標(biāo)增益開始的線性斜坡。如果確定了在一個音軌中或兩個音軌之間有暫停，可重置時間常數(shù)。在信號分析單元30中執(zhí)行的暫停檢測或音軌檢測由暫停檢測單元33和音軌檢測單元34代表。在圖5 的實施例中，響度確定單元31、時間常數(shù)生成器32、暫停和音軌檢測單元33和34以及增益確定單元35被示為分開的單元。但是，對于本領(lǐng)域技術(shù)人員來說應(yīng)該清楚的是，不同的單元可被合并為更少的單元，并且這些單元可被組合成若干個單元或甚至成為一個單元。而且，信號分析單元可通過硬件元件或軟件或硬件和軟件的組合來設(shè)計。信號分析單元的信號輸出17被輸入到增益控制單元41中，該增益控制單元41 正如將在下面進一步描述的那樣對音頻輸入信號的增益進行控制。此外，信號控制單元40 包括延遲元件，該延遲元件將在信號分析單元中確定增益所需要的延遲引入音頻輸入信號 18。延遲元件有助于確保由信號分析單元30處理的信號實際被對應(yīng)于音頻信號的正確的時間常數(shù)控制，正確的時間常數(shù)對于該音頻信號被確定。增益控制單元41有助于確定由增益確定單元35確定的增益實際影響信號輸出水平的多少數(shù)量。為實現(xiàn)這種目的，提供了用戶界面50，在該用戶界面50中，用戶能夠指示要對輸出使用由音頻信號分析單元30進行的增益校正。如果在信號17中存在的100%的增益應(yīng)該輸出，則由增益確定單元確定的值被取出。但是，也可能用戶不需要增益調(diào)整，例如在用戶想要保持一首樂曲中的響度進展的情況下。在該示例中，用戶可將增益控制單元中的增益調(diào)整設(shè)定為0%，意味著沒有單元30中確定的校正被用于輸出。在增益控制單元中，可確定增益校正量，例如通過設(shè)定在0%到100%之間的因子。如果因子被設(shè)定為0%，則該增益的確定不受時間常數(shù)的影響。圖7中示出了自動響度調(diào)整的第一個示例。在圖7的上圖部分中，示出了響度估計之前的音頻輸出信號18。正如可由該音頻輸入信號的兩個聲道看出的，該輸入信號覆蓋了不同的輸入水平范圍。最大輸入水平可為OdB滿刻度。在圖7的下圖部分中，示出了在響度估計和增益調(diào)整后的音頻輸出信號19。正如可從圖7的下圖部分看出的，平均信號水平被設(shè)定為_12dB滿刻度。同時保留了該音頻信號的動態(tài)結(jié)構(gòu)。圖8中示出了另一個示例，其中輸入水平具有_20dB滿刻度的最大輸入水平。在圖8的下圖部分，示出了在響度估計和增益估計之后的音頻輸出信號19。再次保留了動態(tài)結(jié)構(gòu)，并且平均信號水平再次為_12dB滿刻度。如果圖7和圖8的上圖部分中示出的輸入信號被輸出給使用者，該使用者必須頻繁地調(diào)節(jié)音量，以便避免信號水平太高而令人不快，并對收聽的信號水平太低的音頻信號部分的信號進行增加。通過本申請的使用，由于系統(tǒng)對響度進行了估計，并且在輸出之前自動地且動態(tài)地調(diào)整了增益，用戶將不再需要這種頻繁的音量調(diào)節(jié)。
權(quán)利要求
1.一種用于對包含至少兩個不同音軌的音頻輸出信號的增益進行調(diào)整的方法，這兩個不同音軌具有不同信號水平范圍，該方法的步驟包括-基于人類聽覺的心理聲學(xué)模型，動態(tài)地確定音頻輸入信號的感知響度；-動態(tài)地確定由增益確定單元(3 輸出的音頻輸出信號的增益，該增益確定單元(35) 接收所述感知響度并輸出具有被確定的增益的音頻輸出信號，其中以使得所述音頻輸出信號的至少兩個音軌是覆蓋預(yù)定信號水平范圍或響度范圍的輸出的這樣一種方式確定該增■、Λfrff. ο
2.如權(quán)利要求1中所述的方法，進一步包括確定所述至少兩個不同音軌之間或一個音軌以內(nèi)的暫停的步驟，在該暫停中噪聲是音頻輸入信號的主導(dǎo)部分，其中在所確定的暫停中增益被減少，其中通過使用對如收聽所述音頻輸入信號的收聽者所感知的音頻輸入信號的空間感知的模擬來基于雙耳定位模型確定是否能夠定位所述輸入信號，來在所述音頻輸入信號中檢測所述噪聲。
3.如權(quán)利要求1或2所述的方法，其中所述感知響度是基于所述音頻輸入信號的信號統(tǒng)計被進一步確定的。
4.如前述權(quán)利要求中的任一項所述的方法，其中音頻輸入和輸出信號的每個音軌包含音樂信號的連續(xù)的塊，其中每個塊的響度通過使用時間常數(shù)來確定，該時間常數(shù)描述了從一個塊到下一個塊的響度改變。
5.如權(quán)利要求4所述的方法，其中提升時間常數(shù)被用于描述兩個連續(xù)塊之間升高的響度，而下降時間常數(shù)描述兩個連續(xù)塊之間下降的響度，其中時間常數(shù)被配置成使得，與下降時間常數(shù)允許的響度下降相比，提升時間常數(shù)允許更快的響度增加。
6.如權(quán)利要求4或5所述的方法，其中所述時間常數(shù)為自適應(yīng)時間常數(shù)，其中所述自適應(yīng)時間常數(shù)被調(diào)整成，使得在音軌開始處，所述時間常數(shù)被允許比稍后音軌期間變化得更快。
7.如權(quán)利要求6所述的方法，其中當(dāng)檢測出兩個音軌之間的暫停時，所述自適應(yīng)時間常數(shù)被重置，通過確定是否能夠通過單獨使用雙耳定位模型或通過結(jié)合使用雙耳定位模型與信號統(tǒng)計模型定位所述音頻輸入信號，來檢測所述暫停。
8.如上述權(quán)利要求中的任一項所述的方法，進一步包括以下步驟，即，控制增益確定單元(3 確定的增益，使得確定出的增益的多少數(shù)量將決定所述音頻輸出信號的音頻輸出信號水平被確定。
9.如前述權(quán)利要求中的任一項所述的方法，進一步包括在所述音頻輸入信號被輸出之前，將延遲時間包括在所述音頻輸入信號中的步驟，其中所述延遲時間對應(yīng)于對所述音頻輸出信號的增益進行確定所需的時間。
10.一種對包含至少兩個不同音軌的音頻輸出信號的增益進行調(diào)整的系統(tǒng)，該至少兩個不同的音軌具有不同的信號水平范圍，該系統(tǒng)接收音頻輸入信號并輸出具有被調(diào)整的增益的音頻輸出信號，該系統(tǒng)包括響度確定單元(31)，其基于人類聽覺的心理聲學(xué)模型動態(tài)地確定所述音頻輸入信號的響度，以及增益確定單元(35)，其接收所確定的響度并輸出具有被調(diào)整的增益的音頻輸出信號，其中該增益確定單元(3 動態(tài)地確定所述音頻輸出信號的增益，使得所述音頻輸出信號的至少兩個音軌是覆蓋了預(yù)定的信號水平范圍的輸出。
11.如權(quán)利要求10所述的系統(tǒng)，進一步包括暫停檢測單元(33)，該暫停檢測單元(33) 通過使用對如正在收聽所述音頻輸入信號的收聽者所感知的音頻輸入信號的空間感知來確定是否能夠定位所述音頻輸入信號，以確定所述至少兩個不同音軌之間或一個音軌以內(nèi)的暫停，在該暫停中噪聲是所述音頻輸入信號的主導(dǎo)部分，其中，所述增益確定單元(35) 在被確定的暫停中減少增益。
12.如權(quán)利要求10或11所述的系統(tǒng)，其中所述音頻輸入和輸出信號的每個音軌包括音頻信號的連續(xù)的塊(25)，其中時間常數(shù)生成單元(3 確定所述音頻輸入信號的所述連續(xù)的塊的時間常數(shù)(26)，該時間常數(shù)06)描述了從一個塊到下一個塊的響度的改變，其中所述增益確定單元(3 基于所述時間常數(shù)確定所述音頻輸出信號的增益。
13.如權(quán)利要求12所述的系統(tǒng)，其中所述時間常數(shù)生成單元(32)使用提升時間常數(shù)來描述兩個連續(xù)塊之間升高的響度，并使用下降時間常數(shù)描述兩個連續(xù)塊之間下降的響度，其中所述時間常數(shù)生成單元將所述時間常數(shù)確定成，使得與下降時間常數(shù)允許的增益減少相比，提升時間常數(shù)允許增益增加得更快。
14.如權(quán)利要求12或13所述的系統(tǒng)，其中所述時間常數(shù)生成單元(32)將所述時間常數(shù)確定成，使得所述時間常數(shù)為自適應(yīng)時間常數(shù)，在音軌開始處，該自適應(yīng)時間常數(shù)在塊與塊之間能夠變化得比在稍后的音軌期間變化得更快。
15.如權(quán)利要求12至14中的任一項所述的系統(tǒng)，其中當(dāng)在兩個音軌之間檢測出暫停時，所述時間常數(shù)生成單元(3 重置所述時間常數(shù)。
16.如權(quán)利要求11至15中的任一項所述的系統(tǒng)，進一步包括增益控制單元(41)，該增益控制單元Gl)被配置成將所述增益確定單元確定的增益控制成，使得所述增益控制單元確定被確定出的增益的多少量將影響所述音頻輸出信號的音頻輸出信號水平。
17.如權(quán)利要求11至16中的任一項所述的系統(tǒng)，進一步包括延遲元件(42)，所述延遲元件0 在所述音頻輸入信號被作為輸出信號輸出之前將延遲時間引入所述音頻輸入信號，其中所述延遲元件引入與對所述音頻輸出信號的增益進行確定所需的時間對應(yīng)的延遲時間。
全文摘要
本發(fā)明涉及一種用于對包含至少兩個不同音軌的音頻輸出信號的增益進行調(diào)整的方法，這至少兩個不同音軌具有不同信號水平范圍，該方法的步驟包括-基于人類的心理聲學(xué)模型，動態(tài)地確定音頻輸入信號的感知響度，-動態(tài)地確定由增益確定單元(35)輸出的音頻輸出信號的增益，該增益確定單元(35)接收感知響度并輸出具有確定增益的音頻輸出信號，其中該增益被確定成使得音頻輸出信號的所述至少兩個音軌在輸出時覆蓋預(yù)定的信號水平范圍。
文檔編號H03G3/32GK102195585SQ20111006023
公開日2011年9月21日申請日期2011年3月14日優(yōu)先權(quán)日2010年3月12日
發(fā)明者沃爾夫?qū)?赫斯申請人:哈曼貝克自動系統(tǒng)股份有限公司

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：沃爾夫?qū)?赫斯
技術(shù)所有人：哈曼貝克自動系統(tǒng)股份有限公司
我是此專利的發(fā)明人

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請點此查看客服電話進行咨詢。
1、田老師：1: 建筑節(jié)能綠色建筑能耗的模擬與檢測(EnergyPlus)；建筑碳排放和生命周期評價；城市微氣候、建筑能耗與太陽能技術(shù)的相互影響；地理信息系統(tǒng)(GIS)和空間回歸方法用于城市建筑能耗分析；不確定性、敏感性分析和機器學(xué)習(xí)方法應(yīng)用于建筑能耗分析(R)；貝葉斯方法用于城市和單體建筑能源分析 2: 過
2、孫老師：1.振動信號時頻分析理論與測試系統(tǒng)設(shè)計 2.汽車檢測系統(tǒng)設(shè)計 3.汽車電子控制系統(tǒng)設(shè)計
3、畢老師：機構(gòu)動力學(xué)與控制
4、王老師：1.計算機網(wǎng)絡(luò)安全 2.計算機仿真技術(shù)
5、周老師：1.智能機器人技術(shù) 2.智能檢測與控制技術(shù) 3.機構(gòu)運動學(xué)與動力學(xué) 4.機電一體化技術(shù)
如您是高校老師，可以點此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

音頻響度相關(guān)技術(shù)

正交信號校正相關(guān)技術(shù)

正交信號校正的特點相關(guān)技術(shù)

音頻信號相關(guān)技術(shù)

高考信號指令音頻mp3相關(guān)技術(shù)

音頻信號發(fā)生器軟件相關(guān)技術(shù)

1khz音頻信號下載相關(guān)技術(shù)

国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

音頻信號響度級的自動校正的制作方法