国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      自適應(yīng)語(yǔ)音可理解性處理器的制造方法

      文檔序號(hào):2825811閱讀:254來(lái)源:國(guó)知局
      自適應(yīng)語(yǔ)音可理解性處理器的制造方法
      【專利摘要】本申請(qǐng)描述了用于自適應(yīng)地處理語(yǔ)音以改進(jìn)語(yǔ)音可理解性的系統(tǒng)和方法。這些系統(tǒng)和方法可以自適應(yīng)地識(shí)別和跟蹤共振峰位置,從而使共振峰能夠在改變時(shí)得到強(qiáng)調(diào)。因此,即使在有噪環(huán)境中,這些系統(tǒng)和方法也可以改進(jìn)近端可理解性。所述系統(tǒng)和方法可以在IP語(yǔ)音(VoIP)應(yīng)用、電話和/或視頻會(huì)議應(yīng)用(包括在蜂窩電話、智能電話等上)、膝上型和平板通信等中實(shí)現(xiàn)。所述系統(tǒng)和方法還可以增強(qiáng)非濁音話音,所述非濁音話音可以包括無(wú)需聲道而產(chǎn)生的話音,如,瞬態(tài)話音。
      【專利說(shuō)明】自適應(yīng)語(yǔ)音可理解性處理器
      [0001]相關(guān)申請(qǐng)的交叉引用
      [0002]本申請(qǐng)依據(jù)35U.S.C.§ 119(e)要求2011年7月29日遞交的題為“AdaptiveVoice Intelligibility Processor” 的美國(guó)臨時(shí)申請(qǐng) N0.61 / 513,298,其公開(kāi)內(nèi)容以引用方式完全并入于此。
      【背景技術(shù)】
      [0003]經(jīng)常在包括高背景噪聲的區(qū)域中使用移動(dòng)電話。該噪聲通常具有使得來(lái)自移動(dòng)電話揚(yáng)聲器的話音通信的可理解性極大劣化的級(jí)別。在許多情況下,由于較高的環(huán)境噪聲級(jí)別掩蓋了呼叫方的語(yǔ)音或使呼叫方的語(yǔ)音失真,如收聽(tīng)方聽(tīng)到的那樣,一些通信丟失或至少部分丟失。
      [0004]在高背景噪聲存在的情況下最小化可理解性損失的嘗試已經(jīng)涉及使用均衡器、限幅電路或者簡(jiǎn)單地提高移動(dòng)電話的音量。均衡器和限幅電路自身可以增加背景噪聲,因此未解決該問(wèn)題。提高移動(dòng)電話的聲音或揚(yáng)聲器音量的總體級(jí)別通常不顯著地改進(jìn)可理解性,并且會(huì)引起其他問(wèn)題,如,反饋和收聽(tīng)方不適。

      【發(fā)明內(nèi)容】

      [0005]為了概述本公開(kāi),此處描述了發(fā)明的特定方面、優(yōu)勢(shì)和新穎特征。應(yīng)理解,可以在根據(jù)此處公開(kāi)的發(fā)明的任意特定實(shí)施例中實(shí)現(xiàn)未必全部這些優(yōu)勢(shì)。因此,以實(shí)現(xiàn)或優(yōu)化此處教導(dǎo)的一個(gè)或一組優(yōu)勢(shì)而不一定實(shí)現(xiàn)此處可能教導(dǎo)或啟示的其他優(yōu)勢(shì)的方式,來(lái)實(shí)現(xiàn)或?qū)嵤┐颂幑_(kāi)的發(fā)明。
      [0006]在特定實(shí)施例中,一種調(diào)整語(yǔ)音可理解性增強(qiáng)的方法包括:接收輸入的語(yǔ)音信號(hào);以及利用線性預(yù)測(cè)編碼(LPC)過(guò)程來(lái)獲得輸入的語(yǔ)音信號(hào)的譜表示。所述譜表示可以包括一個(gè)或更多個(gè)共振峰頻率。所述`方法還可以包括:利用一個(gè)或更多個(gè)處理器來(lái)調(diào)整輸入的語(yǔ)音信號(hào)的譜表示,以產(chǎn)生增強(qiáng)濾波器,所述增強(qiáng)濾波器被配置為強(qiáng)調(diào)所述一個(gè)或更多個(gè)共振峰頻率。此外,所述方法可以包括:對(duì)輸入的語(yǔ)音信號(hào)的表示應(yīng)用所述增強(qiáng)濾波器,以產(chǎn)生具有增強(qiáng)的共振峰頻率的修改后的語(yǔ)音信號(hào);基于輸入的語(yǔ)音信號(hào)來(lái)檢測(cè)包絡(luò);以及分析修改后的語(yǔ)音信號(hào)的包絡(luò),以確定一個(gè)或更多個(gè)時(shí)間增強(qiáng)參數(shù)。此外,所述方法可以包括:對(duì)修改后的語(yǔ)音信號(hào)應(yīng)用所述一個(gè)或更多個(gè)時(shí)間增強(qiáng)參數(shù),以產(chǎn)生輸出的語(yǔ)音信號(hào)。至少應(yīng)用所述一個(gè)或更多個(gè)時(shí)間增強(qiáng)參數(shù)可由一個(gè)或更多個(gè)處理器執(zhí)行。
      [0007]在特定實(shí)施例中,前一段的方法可以包括以下特定的任意組合:其中,對(duì)修改后的語(yǔ)音信號(hào)應(yīng)用所述一個(gè)或更多個(gè)時(shí)間增強(qiáng)參數(shù)包括:銳化修改后的語(yǔ)音信號(hào)的一個(gè)或更多個(gè)包絡(luò)中的峰,以強(qiáng)調(diào)修改后的語(yǔ)音信號(hào)中所選擇的輔音;其中,檢測(cè)包絡(luò)包括檢測(cè)以下各項(xiàng)中一個(gè)或更多個(gè)的包絡(luò):輸入的語(yǔ)音信號(hào);以及修改后的語(yǔ)音信號(hào);以及還包括:對(duì)輸入的語(yǔ)音信號(hào)應(yīng)用逆濾波器,以產(chǎn)生激勵(lì)信號(hào),使得所述對(duì)輸入的語(yǔ)音信號(hào)的表示應(yīng)用所述增強(qiáng)濾波器包括對(duì)所述激勵(lì)信號(hào)應(yīng)用所述增強(qiáng)濾波器。
      [0008]在一些實(shí)施例中,一種用于調(diào)整語(yǔ)音可理解性增強(qiáng)的系統(tǒng)包括:分析模塊,能夠獲得輸入的音頻信號(hào)的至少一部分的譜表示。所述譜表示包括一個(gè)或更多個(gè)共振峰頻率。所述系統(tǒng)還可以包括:共振峰增強(qiáng)模塊,可以產(chǎn)生增強(qiáng)濾波器,所述增強(qiáng)濾波器可以強(qiáng)調(diào)所述一個(gè)或更多個(gè)共振峰頻率。所述增強(qiáng)濾波器能夠以一個(gè)或更多個(gè)處理器被應(yīng)用于輸入的音頻信號(hào)的表示,以產(chǎn)生修改后的語(yǔ)音信號(hào)。此處,所述系統(tǒng)還可以包括:時(shí)間包絡(luò)成形器,被配置為至少部分基于修改后的語(yǔ)音信號(hào)的一個(gè)或更多個(gè)包絡(luò)來(lái)對(duì)修改后的語(yǔ)音信號(hào)應(yīng)用時(shí)間增強(qiáng)。
      [0009]在特定實(shí)施例中,前一段的系統(tǒng)可以包括以下特定的任意組合:其中,所述分析模塊還被配置為:使用線性預(yù)測(cè)編碼技術(shù)來(lái)獲得輸入的音頻信號(hào)的譜表示,所述線性預(yù)測(cè)編碼技術(shù)被配置為產(chǎn)生與所述譜表示相對(duì)應(yīng)的系數(shù);還包括:映射模塊,被配置為將所述系數(shù)映射至線譜對(duì);還包括:修改所述線譜對(duì),以增強(qiáng)與共振峰頻率相對(duì)應(yīng)的譜表示中的增益;其中,所述增強(qiáng)濾波器還被配置為應(yīng)用于以下各項(xiàng)中的一個(gè)或更多個(gè):輸入的音頻信號(hào);以及從輸入的音頻信號(hào)導(dǎo)出的激勵(lì)信號(hào);其中,所述時(shí)間包絡(luò)成形器還被配置為:將修改后的語(yǔ)音信號(hào)細(xì)分為多個(gè)頻帶,并且所述一個(gè)或更多個(gè)包絡(luò)與所述多個(gè)頻帶中至少一些頻帶的包絡(luò)相對(duì)應(yīng);還包括:語(yǔ)音增強(qiáng)控制器,可以被配置為至少部分基于輸入的麥克風(fēng)信號(hào)中檢測(cè)到的環(huán)境噪聲量,來(lái)調(diào)整增強(qiáng)濾波器的增益;還包括:語(yǔ)音活動(dòng)性檢測(cè)器,被配置為檢測(cè)輸入的麥克風(fēng)信號(hào)中的語(yǔ)音,并響應(yīng)于檢測(cè)到的語(yǔ)音來(lái)控制語(yǔ)音增強(qiáng)控制器;其中,所述語(yǔ)音活動(dòng)性檢測(cè)器還被配置為:響應(yīng)于檢測(cè)到輸入的麥克風(fēng)信號(hào)中的語(yǔ)音,使所述語(yǔ)音增強(qiáng)控制器基于先前的噪聲輸入來(lái)調(diào)整增強(qiáng)濾波器的增益;以及還包括:麥克風(fēng)校準(zhǔn)模塊,被配置為設(shè)置麥克風(fēng)的增益,所述麥克風(fēng)被配置為接收輸入的麥克風(fēng)信號(hào),其中,所
      述麥克風(fēng)校準(zhǔn)模塊還被配置為:至少部分基于參考信號(hào)和記錄的噪聲信號(hào),來(lái)設(shè)置所述增益。
      [0010]在一些實(shí)施例中,一種用于調(diào)整語(yǔ)音可理解性增強(qiáng)的系統(tǒng)包括:線性預(yù)測(cè)編碼分析模塊,可以應(yīng)用線性預(yù)測(cè)編碼(LPC)技術(shù)來(lái)獲得與輸入的語(yǔ)音信號(hào)的譜相對(duì)應(yīng)的LPC系數(shù),其中,所述譜包括一個(gè)或更多個(gè)共振峰頻率。所述系統(tǒng)還可以包括:映射模塊,可以將所述LPC系數(shù)映射至線譜對(duì)。所述系統(tǒng)還可以包括一個(gè)或更多個(gè)處理器的共振峰增強(qiáng)模塊,其中,所述共振峰增強(qiáng)模塊可以修改所述線譜對(duì)從而調(diào)整輸入的語(yǔ)音信號(hào)的譜,并產(chǎn)生增強(qiáng)濾波器,所述增強(qiáng)濾波器可以強(qiáng)調(diào)所述一個(gè)或更多個(gè)共振峰頻率。所述增強(qiáng)濾波器可以應(yīng)用于輸入的音頻信號(hào)的表示,以產(chǎn)生修改后的語(yǔ)音信號(hào)。
      [0011]在各種實(shí)施例,前一段的系統(tǒng)可以包括以下特征的任意組合:還包括:語(yǔ)音活動(dòng)性檢測(cè)器,可以檢測(cè)輸入的麥克風(fēng)信號(hào)中的語(yǔ)音,并響應(yīng)于檢測(cè)到的語(yǔ)音使增強(qiáng)濾波器的增益得到調(diào)整;還包括:麥克風(fēng)校準(zhǔn)模塊,可以設(shè)置麥克風(fēng)的增益,所述麥克風(fēng)可以接收輸入的麥克風(fēng)信號(hào),其中,所述麥克風(fēng)校準(zhǔn)模塊還被配置為:至少部分基于參考信號(hào)和記錄的噪聲信號(hào),來(lái)設(shè)置所述增益;其中,所述增強(qiáng)濾波器還被配置為應(yīng)用于以下各項(xiàng)中的一個(gè)或更多個(gè):輸入的音頻信號(hào);以及從輸入的音頻信號(hào)導(dǎo)出的激勵(lì)信號(hào);還包括:時(shí)間包絡(luò)成形器,可以至少部分基于修改后的語(yǔ)音信號(hào)的一個(gè)或更多個(gè)包絡(luò),來(lái)對(duì)修改后的語(yǔ)音信號(hào)應(yīng)用時(shí)間增強(qiáng);以及其中,所述時(shí)間包絡(luò)成形器還被配置為:銳化修改后的語(yǔ)音信號(hào)的一個(gè)或更多個(gè)包絡(luò)中的峰,以強(qiáng)調(diào)修改后的語(yǔ)音信號(hào)的所選擇的部分。
      【專利附圖】

      【附圖說(shuō)明】[0012]在附圖中,可以重復(fù)使用附圖標(biāo)記以指示所標(biāo)記的元素之間的對(duì)應(yīng)性。提供附圖以示意此處描述的發(fā)明的實(shí)施例而非限制其范圍。
      [0013]圖1示出了能夠?qū)崿F(xiàn)語(yǔ)音增強(qiáng)系統(tǒng)的移動(dòng)電話環(huán)境的實(shí)施例。
      [0014]圖2示出了語(yǔ)音增強(qiáng)系統(tǒng)的更詳細(xì)的實(shí)施例。
      [0015]圖3示出了自適應(yīng)語(yǔ)音增強(qiáng)模塊的實(shí)施例。
      [0016]圖4示出了話音譜的示例曲線。
      [0017]圖5示出了自適應(yīng)語(yǔ)音增強(qiáng)模塊的另一實(shí)施例。
      [0018]圖6示出了時(shí)間包絡(luò)成形器的實(shí)施例。
      [0019]圖7示出了時(shí)域話音包絡(luò)的示例曲線。
      [0020]圖8示出了起音和衰減包絡(luò)的示例曲線。
      [0021]圖9示出了語(yǔ)音檢測(cè)過(guò)程的實(shí)施例。
      [0022]圖10示出了麥克風(fēng)校準(zhǔn)過(guò)程的實(shí)施例。
      【具體實(shí)施方式】
      [0023]1.簡(jiǎn)介
      [0024]現(xiàn)有的語(yǔ)音可理解性系統(tǒng)試圖強(qiáng)調(diào)話音中的共振峰,所述共振峰可以包括講話方的聲帶產(chǎn)生的與特定元音和響輔音相對(duì)應(yīng)的諧振頻率。這些現(xiàn)有系統(tǒng)通常采用具有帶通濾波器的濾波器組,所述帶通濾波器用于強(qiáng)調(diào)預(yù)期出現(xiàn)共振峰的不同固定頻帶處的共振峰。該方案的問(wèn)題在于:對(duì)于不同個(gè)體,共振峰位置可能不同。此外,給定個(gè)體的共振峰位置也可能隨時(shí)間改變。因此,固定的帶通濾波器可能強(qiáng)調(diào)與給定個(gè)體的共振峰頻率不同的頻率,導(dǎo)致受損的語(yǔ)音可理解性。
      [0025]本公開(kāi)描述了用于自適應(yīng)地處理話音以改進(jìn)語(yǔ)音可理解性的系統(tǒng)和方法以及其他特征。在特定實(shí)施例中,這些系統(tǒng)和方法能夠自適應(yīng)地識(shí)別和跟蹤共振峰位置,從而使共振峰能夠在改變時(shí)得到強(qiáng)調(diào)。因此,即使在有噪環(huán)境中,這些系統(tǒng)和方法也可以改進(jìn)近端可理解性。所述系統(tǒng)和方法還可以增強(qiáng)非濁音話音,所述非濁音話音可以包括無(wú)需聲道而產(chǎn)生的話音,如,瞬態(tài)話音??梢员辉鰪?qiáng)的非濁音話音的一些示例包括阻塞輔音,如爆破音、摩擦音和塞擦音。
      [0026]可以使用許多技術(shù)來(lái)自適應(yīng)地跟蹤共振峰位置。自適應(yīng)濾波是一種這樣的技術(shù)。在一些實(shí)施例中,可以使用在線性預(yù)測(cè)編碼(LPC)的上下文中采用的自適應(yīng)濾波來(lái)跟蹤共振峰。為了簡(jiǎn)單起見(jiàn),本說(shuō)明書(shū)的其余部分將描述LPC上下文中的自適應(yīng)共振峰跟蹤。然而,應(yīng)理解的是,在特定實(shí)施例中,可以使用許多其他自適應(yīng)處理技術(shù)代替LPC來(lái)跟蹤共振峰位置。此處可以取代LPC使用的或除了 LPC還可以使用的技術(shù)的一些示例包括多帶能量解調(diào)、極點(diǎn)交互、無(wú)參數(shù)預(yù)測(cè)、以及上下文相關(guān)的音位信息。
      [0027]I1.系統(tǒng)概況
      [0028]圖1示出了可以實(shí)現(xiàn)語(yǔ)音增強(qiáng)系統(tǒng)110的移動(dòng)電話環(huán)境100的實(shí)施例。語(yǔ)音增強(qiáng)系統(tǒng)110可以包括用于增強(qiáng)語(yǔ)音輸入信號(hào)102的可理解性的硬件和/或軟件。語(yǔ)音增強(qiáng)系統(tǒng)110可以例如利用語(yǔ)音增強(qiáng)處理語(yǔ)音輸入信號(hào)102,所述語(yǔ)音增強(qiáng)強(qiáng)調(diào)元音聲音(如共振峰)以及非元音聲音(如輔音,包括例如爆破音和摩擦音)的區(qū)別特征。
      [0029]在示例移動(dòng)電話環(huán)境100中,示出了呼叫方電話104和接收方電話108。在該示例中語(yǔ)音增強(qiáng)系統(tǒng)110安裝在接收方電話108中,雖然在其他實(shí)施例中,兩個(gè)電話都可以具有語(yǔ)音增強(qiáng)系統(tǒng)。呼叫方電話104和接收方電話108可以是移動(dòng)電話、互聯(lián)網(wǎng)協(xié)議語(yǔ)音(VoIP)電話、智能電話、有線電話、電話和/或視頻會(huì)議電話、其他計(jì)算設(shè)備(如膝上型或平板計(jì)算機(jī))等。呼叫方電話104可以被看作位于移動(dòng)電話環(huán)境100的遠(yuǎn)端,接收方電話可以被看作位于移動(dòng)電話環(huán)境100的近端。當(dāng)接收方電話108的用戶講話時(shí),近端和遠(yuǎn)端可以反轉(zhuǎn)。
      [0030]在所描述的實(shí)施例中,呼叫方向呼叫方電話104提供語(yǔ)音輸入102。呼叫方電話104中的發(fā)射器106向接收方電話108發(fā)送語(yǔ)音輸入信號(hào)102。發(fā)射器106可以無(wú)線方式或通過(guò)通訊電纜或兩者的結(jié)合發(fā)送語(yǔ)音輸入信號(hào)102。接收方電話108中的語(yǔ)音增強(qiáng)系統(tǒng)110可以增強(qiáng)語(yǔ)音輸入信號(hào)102以提高語(yǔ)音可理解性。
      [0031]語(yǔ)音增強(qiáng)系統(tǒng)110可以動(dòng)態(tài)地識(shí)別語(yǔ)音輸入信號(hào)102中表示的語(yǔ)音的共振峰或其他特征部分。因此,即使共振峰隨時(shí)間改變或?qū)τ诓煌v話方不同,語(yǔ)音增強(qiáng)系統(tǒng)110也能夠動(dòng)態(tài)增強(qiáng)語(yǔ)音的共振峰或其他特征部分。語(yǔ)音增強(qiáng)系統(tǒng)110還可以至少部分基于使用接收方電話108的麥克風(fēng)檢測(cè)的麥克風(fēng)輸入信號(hào)112中的環(huán)境噪聲,適配對(duì)語(yǔ)音輸入信號(hào)102應(yīng)用語(yǔ)音增強(qiáng)的程度。環(huán)境噪聲或內(nèi)容可以包括背景或環(huán)境噪聲。如果環(huán)境噪聲增加,語(yǔ)音增強(qiáng)系統(tǒng)110可以增加所應(yīng)用的語(yǔ)音增強(qiáng)的量,反之亦然。因此,語(yǔ)音增強(qiáng)可以至少部分跟蹤檢測(cè)到的環(huán)境噪聲的量。類似地,語(yǔ)音增強(qiáng)系統(tǒng)110還可以至少部分基于環(huán)境噪聲的量,來(lái)增加應(yīng)用于語(yǔ)音輸入信號(hào)102的總增益。
      [0032]然而,當(dāng)存在較少的環(huán)境噪聲時(shí),語(yǔ)音增強(qiáng)系統(tǒng)110可以減少語(yǔ)音增強(qiáng)的量和/或所應(yīng)用的增益增加。該減少可以有益于收聽(tīng)方,這是由于當(dāng)存在較低級(jí)別的環(huán)境噪聲時(shí),語(yǔ)音增強(qiáng)和/或音量增加可能聽(tīng)起來(lái)刺耳或令人不快。例如,一旦環(huán)境噪聲超過(guò)閾值量,語(yǔ)音增強(qiáng)系統(tǒng)110就可以開(kāi)始對(duì)語(yǔ)音輸入信號(hào)102應(yīng)用語(yǔ)音增強(qiáng),以避免使語(yǔ)音在不存在環(huán)境噪聲的情況下聽(tīng)起來(lái)刺耳。
      [0033]因此,在特定實(shí)施例中,在存在變化級(jí)別的環(huán)境噪聲的情況下,語(yǔ)音增強(qiáng)系統(tǒng)110將語(yǔ)音輸入信號(hào)變換為收聽(tīng)方能夠更易于理解的增強(qiáng)的輸出信號(hào)114。在一些實(shí)施例中,語(yǔ)音增強(qiáng)系統(tǒng)110還可以包括在呼叫方電話104中。語(yǔ)音增強(qiáng)系統(tǒng)110可以至少部分基于呼叫方電話104檢測(cè)到的環(huán)境噪聲的量,對(duì)語(yǔ)音輸入信號(hào)102應(yīng)用增強(qiáng)。因此,可以在呼叫方電話104、接收方電話108或兩者中使用語(yǔ)音增強(qiáng)系統(tǒng)110。
      [0034]雖然語(yǔ)音增強(qiáng)系統(tǒng)110被示為電話108的一部分,語(yǔ)音增強(qiáng)系統(tǒng)110可以取而代之地實(shí)現(xiàn)在任意通信設(shè)備中。例如,語(yǔ)音增強(qiáng)系統(tǒng)110可以實(shí)現(xiàn)在計(jì)算機(jī)、路由器、模擬電話適配器、錄音電話機(jī)等中。語(yǔ)音增強(qiáng)系統(tǒng)Iio還可以用于公共地址(“PA”)設(shè)備(包括互聯(lián)網(wǎng)協(xié)議PA)、無(wú)線收發(fā)器、輔助聽(tīng)覺(jué)設(shè)備(例如助聽(tīng)器)、揚(yáng)聲器電話、以及其他音頻系統(tǒng)。此外,可以在向一個(gè)或更多個(gè)講話方提供音頻輸出的基于處理器的系統(tǒng)中實(shí)現(xiàn)語(yǔ)音增強(qiáng)系統(tǒng)110。
      [0035]圖2示出了語(yǔ)音增強(qiáng)系統(tǒng)210的更詳細(xì)的實(shí)施例。語(yǔ)音增強(qiáng)系統(tǒng)210可以實(shí)現(xiàn)語(yǔ)音增強(qiáng)系統(tǒng)110的一些或全部特征,并且可以用硬件和/或軟件實(shí)現(xiàn)。語(yǔ)音增強(qiáng)系統(tǒng)210可以實(shí)現(xiàn)在移動(dòng)電話、蜂窩電話、智能電話或其他計(jì)算設(shè)備(包括以上提到的任一設(shè)備)中。語(yǔ)音增強(qiáng)系統(tǒng)210可以自適應(yīng)地跟蹤語(yǔ)音信號(hào)的共振峰和/或其他部分,并且可以至少部分基于環(huán)境噪聲的檢測(cè)量和/或輸入信號(hào)來(lái)調(diào)整增強(qiáng)處理。[0036]語(yǔ)音增強(qiáng)系統(tǒng)210包括自適應(yīng)語(yǔ)音增強(qiáng)模塊220。自適應(yīng)語(yǔ)音增強(qiáng)模塊220可以包括用于對(duì)(例如,從呼叫方電話、在助聽(tīng)器或其他設(shè)備中接收的)語(yǔ)音輸入信號(hào)202自適應(yīng)地應(yīng)用語(yǔ)音增強(qiáng)的硬件和/或軟件。語(yǔ)音增強(qiáng)可以強(qiáng)調(diào)包括濁音和/或非濁音聲音在內(nèi)的語(yǔ)音輸入信號(hào)202中的兀音聲音的區(qū)別特征。
      [0037]有利地,在特定實(shí)施例中,自適應(yīng)語(yǔ)音增強(qiáng)模塊220自適應(yīng)地跟蹤共振峰,以針對(duì)不同的講話方(例如個(gè)體)或針對(duì)具有隨時(shí)間改變的共振峰的相同的講話方,增強(qiáng)適當(dāng)?shù)墓舱穹孱l率。自適應(yīng)語(yǔ)音增強(qiáng)模塊220還可以增強(qiáng)話音的非濁音部分,包括聲道的聲帶以外的部分產(chǎn)生的特定輔音或其他聲音。在一個(gè)實(shí)施例中,自適應(yīng)語(yǔ)音增強(qiáng)模塊220通過(guò)在時(shí)間上使語(yǔ)音輸入信號(hào)成形來(lái)增強(qiáng)非濁音話音。以下,將參照?qǐng)D3更詳細(xì)地描述這些特征。
      [0038]提供語(yǔ)音增強(qiáng)控制器222,其能夠控制語(yǔ)音增強(qiáng)模塊220所提供的語(yǔ)音增強(qiáng)的級(jí)另O。語(yǔ)音增強(qiáng)控制器222能夠向自適應(yīng)語(yǔ)音增強(qiáng)模塊220提供增強(qiáng)級(jí)別控制信號(hào)或值,其增加或降低所應(yīng)用的語(yǔ)音增強(qiáng)的級(jí)別。當(dāng)包括環(huán)境噪聲的麥克風(fēng)輸入信號(hào)204增加和降低時(shí),控制信號(hào)可以逐塊或逐采樣適配。
      [0039]在特定實(shí)施例中,語(yǔ)音增強(qiáng)控制器222在檢測(cè)到麥克風(fēng)輸入信號(hào)204中環(huán)境噪聲的能量的閾值量后,適配語(yǔ)音增強(qiáng)的級(jí)別。在閾值以上,語(yǔ)音增強(qiáng)控制器222可以使語(yǔ)音增強(qiáng)的級(jí)別跟蹤或?qū)嵸|(zhì)上跟蹤麥克風(fēng)輸入信號(hào)204中環(huán)境噪聲的量。在一個(gè)實(shí)施例中,例如,在噪聲閾值上提供的語(yǔ)音增強(qiáng)的級(jí)別正比于噪聲的能量(或功率)與閾值之比。在備選實(shí)施例中,在不使用閾值的情況下適配語(yǔ)音增強(qiáng)的級(jí)別。語(yǔ)音增強(qiáng)控制器222所應(yīng)用的語(yǔ)音增強(qiáng)適配的級(jí)別可能隨增加的環(huán)境噪聲以指數(shù)或線性方式增加(反之亦然)。
      [0040]為了確?;蛟噲D確保語(yǔ)音增強(qiáng)控制器222針對(duì)并入語(yǔ)音增強(qiáng)系統(tǒng)210的每個(gè)設(shè)備以大約相同的級(jí)別適配語(yǔ)音增強(qiáng)的級(jí)別,提供麥克風(fēng)校準(zhǔn)模塊234。麥克風(fēng)校準(zhǔn)模塊234可以計(jì)算并存儲(chǔ)一個(gè)或更多個(gè)校準(zhǔn)參數(shù),所述校準(zhǔn)參數(shù)調(diào)整應(yīng)用于麥克風(fēng)輸入信號(hào)204的增益,以使麥克風(fēng)的總增益對(duì)于一些或全部設(shè)備相同或大致相同。以下參照?qǐng)D10更詳細(xì)地描述麥克風(fēng)校準(zhǔn)模塊234的功能。
      [0041]當(dāng)接收電話108的麥克風(fēng)從電話108的揚(yáng)聲器輸出114拾取語(yǔ)音信號(hào)時(shí),可能出現(xiàn)令人不快的現(xiàn)象。該揚(yáng)聲器反饋可能被語(yǔ)音增強(qiáng)控制器222理解為環(huán)境噪聲,從而可能引起語(yǔ)音增強(qiáng)的自激活并因此引起揚(yáng)聲器反饋對(duì)語(yǔ)音增強(qiáng)的調(diào)制。得到的調(diào)制后的輸出信號(hào)可能令收聽(tīng)方不快。當(dāng)收聽(tīng)方在接收方電話108輸出從呼叫方電話104接收的語(yǔ)音信號(hào)的同時(shí)講話、咳嗽或以其他方式向接收方電話108中發(fā)出聲音時(shí),可能出現(xiàn)類似的問(wèn)題。在講話方和收聽(tīng)方同時(shí)講話(或發(fā)出聲音)的該雙重講話情形下,自適應(yīng)語(yǔ)音增強(qiáng)模塊220可以基于雙重講話來(lái)調(diào)制遠(yuǎn)程語(yǔ)音輸入202。該調(diào)制后的輸出信號(hào)可能令收聽(tīng)方不快。
      [0042]為了應(yīng)對(duì)這些現(xiàn)象,在所示實(shí)施例中提供語(yǔ)音活動(dòng)性檢測(cè)器212。語(yǔ)音活動(dòng)性檢測(cè)器212可以檢測(cè)麥克風(fēng)輸入信號(hào)204中從講話者發(fā)出的語(yǔ)音或其他聲音,并且能夠區(qū)分環(huán)境噪聲和語(yǔ)音。當(dāng)麥克風(fēng)輸入信號(hào)204包括環(huán)境噪聲時(shí),語(yǔ)音活動(dòng)性檢測(cè)器212可以允許語(yǔ)音增強(qiáng)222基于當(dāng)前的測(cè)量的環(huán)境噪聲,來(lái)調(diào)整自適應(yīng)語(yǔ)音增強(qiáng)模塊220所提供的語(yǔ)音增強(qiáng)的量。然而,當(dāng)語(yǔ)音活動(dòng)性檢測(cè)器212在麥克風(fēng)輸入信號(hào)204中檢測(cè)到語(yǔ)音時(shí),語(yǔ)音活動(dòng)性檢測(cè)器212可以使用環(huán)境噪聲的先前測(cè)量來(lái)調(diào)整語(yǔ)音增強(qiáng)。
      [0043]語(yǔ)音增強(qiáng)系統(tǒng)210的所示實(shí)施例包括:額外增強(qiáng)控制226,用于進(jìn)一步調(diào)整語(yǔ)音增強(qiáng)控制器222所提供的控制的量。該額外增強(qiáng)控制226向語(yǔ)音增強(qiáng)控制器222提供額外增強(qiáng)控制信號(hào),其可以被用作增強(qiáng)級(jí)別不能低于的值。額外增強(qiáng)控制226可經(jīng)由用戶接口向用戶開(kāi)放。該控制226還可以允許用戶將增強(qiáng)級(jí)別增加至超過(guò)語(yǔ)音增強(qiáng)控制器222所確定的級(jí)別。在一個(gè)實(shí)施例中,語(yǔ)音增強(qiáng)控制器222可以將來(lái)自額外增強(qiáng)控制226的額外增強(qiáng)添加至語(yǔ)音增強(qiáng)控制器222所確定的增強(qiáng)級(jí)別。額外增強(qiáng)控制226對(duì)于希望更多語(yǔ)音增強(qiáng)處理或者希望頻繁應(yīng)用語(yǔ)音增強(qiáng)處理的聽(tīng)障人士可能特別有用。
      [0044]自適應(yīng)語(yǔ)音增強(qiáng)模塊220可以向輸出增益控制器230提供輸出的語(yǔ)音信號(hào)。輸出增益控制器230可以控制應(yīng)用于語(yǔ)音增強(qiáng)模塊220的輸出信號(hào)的總增益的量。輸出增益控制器230可以用硬件和/或軟件實(shí)現(xiàn)。輸出增益控制器230可以至少部分基于噪聲輸入204的級(jí)別和語(yǔ)音輸入202的級(jí)別來(lái)調(diào)整應(yīng)用于輸出信號(hào)的增益。除了任意用戶設(shè)置的增益(如電話的音量控制),還可以應(yīng)用該增益。有利地,基于麥克風(fēng)輸入信號(hào)的環(huán)境噪聲204和/或語(yǔ)音輸入202級(jí)別來(lái)適配音頻信號(hào)的增益可以有助于收聽(tīng)方進(jìn)一步理解語(yǔ)音輸入信號(hào)202。
      [0045]在所示實(shí)施例中還示出了自適應(yīng)級(jí)別控制232,其可以進(jìn)一步調(diào)整輸出增益控制器230所提供的增益的量。用戶接口還可以向用戶開(kāi)放自適應(yīng)級(jí)別控制232。增加該控制32可以使控制器230的增益在傳入的語(yǔ)音輸入202級(jí)別降低時(shí)或噪聲輸入204曾加時(shí)增加得較多。減小該控制232可以使控制器230的增益在傳入的語(yǔ)音輸入信號(hào)202電平降低時(shí)或在噪聲輸入204降低時(shí)增加得較少。
      [0046]在一些情況下,語(yǔ)音增強(qiáng)模塊220、語(yǔ)音增強(qiáng)控制器222和/或輸出增益控制器230所應(yīng)用的增益可以使語(yǔ)音信號(hào)限幅或飽和。飽和可以導(dǎo)致使收聽(tīng)方不快的諧波失真。因此,在特定實(shí)施例中,還提供失真控制模塊140。失真控制模塊140可以接收輸出增益控制器230的增益調(diào)整后的語(yǔ)音信號(hào)。失真控制模塊140可以包括控制失真同時(shí)還至少部分保持或者甚至增加語(yǔ)音增強(qiáng)模塊220、語(yǔ)音增強(qiáng)控制器222和/或輸出增益控制器230所提供的信號(hào)能量的硬件和/或軟件。即使在向失真控制模塊140提供的信號(hào)中不存在限幅,在一些實(shí)施例中,失真控制模塊`140也引起至少部分飽和或限幅,以進(jìn)一步增加信號(hào)的響度和可理解性。
      [0047]在特定實(shí)施例中,失真控制模塊140通過(guò)將語(yǔ)音信號(hào)的一個(gè)或更多個(gè)采樣映射至諧波比完全飽和的信號(hào)少的輸出信號(hào),來(lái)控制語(yǔ)音信號(hào)中的失真。對(duì)于未飽和的采樣,該映射可以線性地或近似線性地跟蹤語(yǔ)音信號(hào)。對(duì)于飽和的采樣,映射可以是應(yīng)用受控失真的非線性變換。因此,在特定實(shí)施例中,失真控制模塊140可以允許語(yǔ)音信號(hào)以比完全飽和的?目號(hào)少的失真聽(tīng)起來(lái)更響。因此,在特定實(shí)施例中,失真控制模塊140將表不物理語(yǔ)首/[目號(hào)的數(shù)據(jù)變換為表示具有受控失真的另一物理語(yǔ)音信號(hào)的數(shù)據(jù)。
      [0048]語(yǔ)音增強(qiáng)系統(tǒng)110和210的各種特征可以包括2009年9月14日遞交的是為“Systems for Adaptive Voice Intelligibility Processing” 的美國(guó)專利 8,204,742 中描述的相同或相似組件的相應(yīng)功能,其公開(kāi)內(nèi)容以引用方式完全并入于此。此外,語(yǔ)音增強(qiáng)系統(tǒng)110或210可以包括1993年7月23日遞交的題為“Public Address Intell igibilitySystem”的美國(guó)專利5,459,813( “‘813專利”)中描述的任一特征,其公開(kāi)內(nèi)容以引用方式完全并入于此。例如,語(yǔ)音增強(qiáng)系統(tǒng)110或210的一些實(shí)施例可以實(shí)現(xiàn)‘813專利中描述的固定共振峰跟蹤特征,同時(shí)實(shí)現(xiàn)此處描述的其他特征(如非濁音話音的時(shí)間增強(qiáng)、語(yǔ)音活動(dòng)性檢測(cè)、麥克風(fēng)校準(zhǔn)及其組合等)中的一些或全部特征。類似地,語(yǔ)音增強(qiáng)系統(tǒng)110或210的其他實(shí)施例可以實(shí)現(xiàn)此處描述的自適應(yīng)共振峰跟蹤特征,而不實(shí)現(xiàn)此處描述的其他特征中的一些或全部特征。
      [0049]II1.自話應(yīng)共振峰跟蹤實(shí)施例
      [0050]參照?qǐng)D3,示出了自適應(yīng)語(yǔ)音增強(qiáng)模塊320的實(shí)施例。自適應(yīng)語(yǔ)音增強(qiáng)模塊320是圖2的自適應(yīng)語(yǔ)音增強(qiáng)模塊220的更詳細(xì)的實(shí)施例。因此,自適應(yīng)語(yǔ)音增強(qiáng)模塊320可由語(yǔ)音增強(qiáng)系統(tǒng)110或210實(shí)現(xiàn)。相應(yīng)地,自適應(yīng)語(yǔ)音增強(qiáng)模塊320可以用軟件和/或硬件實(shí)現(xiàn)。有利地,自適應(yīng)語(yǔ)音增強(qiáng)模塊320可以自適應(yīng)地跟蹤濁音話音(如共振峰),并且還可以在時(shí)間上增強(qiáng)非濁音話音。
      [0051]在自適應(yīng)語(yǔ)音增強(qiáng)模塊320中,向前置濾波器310提供輸入話音。該輸入話音與上述語(yǔ)音輸入信號(hào)202相對(duì)應(yīng)。前置濾波器310可以是使特定的低音頻率衰減的高通濾波器等。例如,在一個(gè)實(shí)施例中,前置濾波器310衰減大約750Hz以下的頻率,盡管可以選擇其他截止頻率。通過(guò)衰減低頻(如大約750Hz以下的頻率)處的譜能量,前置濾波器310可以為后續(xù)處理創(chuàng)建更多的凈空,使更好的LPC分析和增強(qiáng)成為可能。類似地,在其他實(shí)施例中,取代高通濾波器或除了高通濾波器,前置濾波器310還可以包括低通濾波器,并且從而提供附加凈空用于增益處理。在一些實(shí)現(xiàn)中,還可以省略前置濾波器310。
      [0052]在所示實(shí)施例中,向LPC分析模塊312提供前置濾波器310的輸出。LPC分析模塊312可以應(yīng)用線性預(yù)測(cè)技術(shù)來(lái)對(duì)頻譜中的共振峰位置進(jìn)行譜分析和識(shí)別。雖然此處描述為識(shí)別共振峰位置,更一般地,LPC分析模塊312可以產(chǎn)生能夠表示輸入話音的頻率或功率譜表示的系數(shù)。該譜表示可以包括與輸入話音中的共振峰相對(duì)應(yīng)的峰。所識(shí)別的共振峰可以與頻帶而不僅僅是峰自身相對(duì)應(yīng)。例如,所謂位于800Hz的共振峰實(shí)際上可以包括800Hz左右的譜帶。通過(guò)產(chǎn)生具有該譜識(shí)別的這些系數(shù),LPC分析模塊312可以在共振峰位置隨時(shí)間變化時(shí)自適應(yīng)地識(shí)別輸入話音中的共振峰位置。因此,自適應(yīng)語(yǔ)音增強(qiáng)模塊320的后續(xù)組件能夠自適應(yīng)地增強(qiáng)這些共振峰。
      [0053]在一個(gè)實(shí)施例中,LPC分析模塊312使用預(yù)測(cè)算法來(lái)產(chǎn)生全極點(diǎn)濾波器,這是由于全極點(diǎn)濾波器模型可以精確地對(duì)話音中的共振峰位置進(jìn)行建模。在一個(gè)實(shí)施例中,使用自相關(guān)方法來(lái)獲得全極點(diǎn)濾波器的系統(tǒng)。除了其他算法之外,可用于執(zhí)行該分析的一個(gè)特定的算法是Levinson-Durbin算法。Levinson-Durbin算法產(chǎn)生柵格濾波器的系統(tǒng),盡管還可以產(chǎn)生直接型系統(tǒng)。可以針對(duì)采樣塊而非針對(duì)每個(gè)采樣來(lái)產(chǎn)生系數(shù),以提高處理效率。
      [0054]LPC分析所產(chǎn)生的系數(shù)往往對(duì)量化噪聲敏感。系數(shù)中極小的誤差可以使整個(gè)譜失真或使濾波器不穩(wěn)定。為了降低量化噪聲對(duì)全極點(diǎn)濾波器的影響,可以由映射模塊314執(zhí)行從LPC系數(shù)到線譜對(duì)(LSP,又稱線譜頻率(LSF))的映射或變換。映射模塊314可以針對(duì)每個(gè)LPC系統(tǒng)產(chǎn)生系數(shù)對(duì)。有利地,在特定實(shí)施例中,該映射可以產(chǎn)生位于單位圓(在Z變換域中)上的LSP,提高全極點(diǎn)濾波器的穩(wěn)定性。備選地,或除了作為處理對(duì)噪聲的系數(shù)敏感性的方式的LSP以外,還可以使用對(duì)數(shù)面積比(LAR)或其他技術(shù)來(lái)表示系數(shù)。
      [0055]在特定實(shí)施例中,共振峰增強(qiáng)模塊316接收LSP并執(zhí)行附加處理,以產(chǎn)生增強(qiáng)型全極點(diǎn)濾波器326。增強(qiáng)型全極點(diǎn)濾波器326是可應(yīng)用于輸入的音頻信號(hào)的表示以產(chǎn)生更易理解的音頻信號(hào)的增強(qiáng)濾波器的一個(gè)示例。在一個(gè)實(shí)施例中,共振峰增強(qiáng)模塊316以強(qiáng)調(diào)共振峰頻率處的譜峰的方式來(lái)調(diào)整LSP。參照?qǐng)D4,示例曲線400被示為包括頻率幅度譜412 (實(shí)線),具有由峰414和416識(shí)別的共振峰位置。共振峰增強(qiáng)模塊316可以調(diào)整這些峰414、416,以產(chǎn)生新的譜422(由虛線近似),具有位于相同或?qū)嵸|(zhì)相同的共振峰位置但增益較高的峰424、426。在一個(gè)實(shí)施例中,共振峰增強(qiáng)模塊316通過(guò)減小線譜對(duì)之間的距離來(lái)增加峰的增益,如豎條418所示。
      [0056]在特定實(shí)施例中,與共振峰頻率相對(duì)應(yīng)的線譜對(duì)被調(diào)整為表示更靠近在一起的頻率,從而增加每個(gè)峰的增益。雖然線性預(yù)測(cè)多項(xiàng)式具有單位圓內(nèi)任意位置的復(fù)根,在一些實(shí)施例中,線譜多項(xiàng)式具有僅位于單位圓上的根。因此,對(duì)于LPC的直接量化,線譜對(duì)可以具有許多優(yōu)越的屬性。由于在一些實(shí)現(xiàn)中對(duì)根進(jìn)行交織,如果根單調(diào)增加可以實(shí)現(xiàn)濾波器的穩(wěn)定性。與LPC系數(shù)不同,LSP可不對(duì)量化噪聲過(guò)于敏感,并且因此可以實(shí)現(xiàn)穩(wěn)定性。兩個(gè)根越近,在相應(yīng)頻率處濾波器可能越諧振。因此,減小與LPC譜峰相對(duì)應(yīng)的兩個(gè)根(一個(gè)線譜對(duì))之間的距離可以有利地增加該共振峰位置處的濾波器增益。
      [0057]在一個(gè)實(shí)施例中,共振峰增強(qiáng)模塊316可以通過(guò)使用相位改變操作(如乘以&_Ω s)對(duì)每個(gè)根應(yīng)用調(diào)制因子I來(lái)減小峰之間的距離。改變量S的值可以使根沿單位圓靠近在一起或向遠(yuǎn)處分開(kāi)。因此,對(duì)于一對(duì)LSP根,通過(guò)應(yīng)用正值調(diào)制因子δ,第一根可以靠近第二根,通過(guò)應(yīng)用負(fù)值調(diào)制因子S,第二根可以靠近第一根。在一些實(shí)施例中,根之間的距離可以減小特定量,以實(shí)現(xiàn)期望的增強(qiáng),如,距離減小大約10%、或大約25%、或大約30%、或大約50%、或某一其他值。
      [0058]語(yǔ)音增強(qiáng)控制器222還可以控制對(duì)根的調(diào)整。如以上參照?qǐng)D2描述的,語(yǔ)音增強(qiáng)模塊222可以基于麥克風(fēng)輸入信號(hào)204噪聲電平來(lái)調(diào)整所應(yīng)用的語(yǔ)音可理解性增強(qiáng)的量。在一個(gè)實(shí)施例中,語(yǔ)音增強(qiáng)控制器222向自適應(yīng)語(yǔ)音增強(qiáng)控制器220輸出控制信號(hào),共振峰增強(qiáng)模塊316可以使用該控制信號(hào)來(lái)調(diào)整應(yīng)用于LSP根的共振峰增量的量。在一個(gè)實(shí)施例中,共振峰增強(qiáng)模塊316基于控制信號(hào)來(lái)調(diào)整調(diào)制因子δ。因此,指示應(yīng)應(yīng)用更多增強(qiáng)的控制信號(hào)(例如由于更多噪聲)可以使共振峰增強(qiáng)模塊316改變調(diào)制因子δ,以使根更靠近在一起,反之亦然。
      [0059]再次參照?qǐng)D3,共振峰增強(qiáng)模塊316可以將調(diào)整后的LSP映射回LPC系數(shù)(柵格或直接型),以產(chǎn)生增強(qiáng)型全極點(diǎn)濾波器326。然而,在一些實(shí)現(xiàn)中,無(wú)需執(zhí)行該映射,相反,可以實(shí)現(xiàn)增強(qiáng)型全極點(diǎn)濾波器,以LSP作為系數(shù)。
      [0060]為了增強(qiáng)輸入話音,在特定實(shí)施例中,增強(qiáng)型全極點(diǎn)濾波器326對(duì)從輸入的話音信號(hào)合成的激勵(lì)信號(hào)324操作。在特定實(shí)施例中,通過(guò)對(duì)輸入話音應(yīng)用全極點(diǎn)濾波器322以產(chǎn)生激勵(lì)信號(hào)324來(lái)執(zhí)行該合成。全零點(diǎn)濾波器322由LPC分析模塊312創(chuàng)建,并且可以是作為L(zhǎng)PC分析模塊312所創(chuàng)建的全極點(diǎn)濾波器的逆的你濾波器。在一個(gè)實(shí)施例中,還用LPC分析模塊312所計(jì)算的LSP來(lái)實(shí)現(xiàn)全零點(diǎn)濾波器322。通過(guò)對(duì)輸入話音應(yīng)用全極點(diǎn)濾波器的逆并且接著對(duì)倒轉(zhuǎn)的話音信號(hào)(激勵(lì)信號(hào)324)應(yīng)用增強(qiáng)型全極點(diǎn)濾波器326,可以恢復(fù)(至少近似地)并增強(qiáng)原始的輸入的話音信號(hào)。由于全零點(diǎn)濾波器322和增強(qiáng)型全極點(diǎn)濾波器326的系數(shù)可以逐塊(或者甚至逐采樣)改變,可以自適應(yīng)地跟蹤和強(qiáng)調(diào)輸入話音中的共振峰,從而即使在有噪環(huán)境中也改進(jìn)話音可理解性。因此,在特定實(shí)施例中,使用分析合成技術(shù)產(chǎn)生增強(qiáng)的話音。
      [0061]圖5示出了包括圖3的自適應(yīng)語(yǔ)音增強(qiáng)模塊320的全部特征以及附加特征在內(nèi)的自適應(yīng)語(yǔ)音增強(qiáng)模塊520的另一實(shí)施例。具體地,在所示實(shí)施例中,應(yīng)用兩次圖3的增強(qiáng)型全極點(diǎn)濾波器326:—次應(yīng)用于激勵(lì)信號(hào)324 (526a);以及一次應(yīng)用于輸入話音(526b)。對(duì)輸入話音應(yīng)用增強(qiáng)型全極點(diǎn)濾波器526b可以產(chǎn)生譜近似為輸入話音的譜的平方的信號(hào)。合并器528將該近似的譜平方信號(hào)與增強(qiáng)的激勵(lì)信號(hào)輸出相加,以輸出增強(qiáng)的話音輸出??梢蕴峁┛蛇x的增益框510,以調(diào)整所應(yīng)用的譜平方信號(hào)的量。(雖然被示為應(yīng)用于譜平方信號(hào),增益可以取而代之地應(yīng)用于增強(qiáng)型全極點(diǎn)濾波器526a的輸出或應(yīng)用于兩個(gè)濾波器526a、526b的輸出)。可以提供用戶接口控制,以允許用戶(如并入了自適應(yīng)語(yǔ)音增強(qiáng)模塊320的設(shè)備的制造商或設(shè)備的端用戶)調(diào)整增益510。應(yīng)用于譜平方信號(hào)的更高增益可以增加信號(hào)的粗糙度,在特別有噪的環(huán)境中這可以增加可理解性但在不那么有噪的環(huán)境中可能聽(tīng)起來(lái)過(guò)于刺耳。因此,提供用戶控制可以使得能夠調(diào)整增強(qiáng)的話音信號(hào)的感知到的粗糙度。在一些實(shí)施例中,還可以由語(yǔ)音增強(qiáng)控制器222基于輸入的環(huán)境噪聲自動(dòng)控制該增益 510。
      [0062]在特定實(shí)施例中,可以實(shí)現(xiàn)比自適應(yīng)語(yǔ)音增強(qiáng)模塊320或520中所示的全部框更少的框。在一些實(shí)施例中,還可以向自適應(yīng)語(yǔ)音增強(qiáng)模塊320或520添加附加的框或?yàn)V波器。
      [0063]IV.時(shí)間包絡(luò)成形實(shí)施例
      [0064]在一些實(shí)施例中,可以向時(shí)間包絡(luò)成形器332提供圖3中增強(qiáng)型全極點(diǎn)濾波器326所修改的或作為圖6中合并器548輸出的語(yǔ)音信號(hào)。時(shí)間包絡(luò)成形器332可以經(jīng)由時(shí)域中的時(shí)間包絡(luò)成形來(lái)增強(qiáng)非濁音話音(包括瞬態(tài)話音)。在一個(gè)實(shí)施例中,時(shí)間包絡(luò)成形器332增強(qiáng)中間范圍頻率,包括大約3kz以下(以及可選地低音頻率以上)的頻率。時(shí)間包絡(luò)成形器332也可以增強(qiáng)中間范圍頻率以外的頻率。
      [0065]在特定實(shí)施例中,時(shí)間包絡(luò)成形器332可以通過(guò)首先從增強(qiáng)型全極點(diǎn)濾波器326的輸出信號(hào)檢測(cè)包絡(luò)來(lái)增強(qiáng)時(shí)域中的時(shí)間頻率。時(shí)間包絡(luò)成形器332可以使用多種方法中的任一種來(lái)檢測(cè)包絡(luò)。一個(gè)示例方法是最大值跟蹤,其中,時(shí)間包絡(luò)成形器332可以將信號(hào)劃分至加窗部分并且接著從每個(gè)加窗部分選擇最大或最小值。時(shí)間包絡(luò)成形器332可以將最大值連接在一起(直線或曲線連接在每個(gè)值之間),以形成包絡(luò)。在一些實(shí)施例中,為了增加話音可理解性,時(shí)間包絡(luò)成形器332可以將信號(hào)劃分至適當(dāng)數(shù)目的頻帶,并針對(duì)每個(gè)頻帶執(zhí)行不同的成形。
      [0066]示例窗尺寸可以包括64、128、256或512個(gè)采樣,雖然還可以選擇其他窗尺寸(包括不是2的冪的窗尺寸)。一般地,較大的窗尺寸可以將要增強(qiáng)的時(shí)間頻率擴(kuò)展至較低頻率。此外,可以使用其他技術(shù)來(lái)檢測(cè)信號(hào)包絡(luò),如,Hilbert變換相關(guān)的技術(shù)和自解調(diào)技術(shù)(例如,對(duì)信號(hào)進(jìn)行平方和低通濾波)。
      [0067]一旦檢測(cè)到包絡(luò),時(shí)間包絡(luò)成形器332就可以調(diào)整包絡(luò)的形狀,以選擇性地銳化或平滑包絡(luò)的外觀。在第一階段,時(shí)間包絡(luò)成形器332可以基于包絡(luò)的特征來(lái)計(jì)算增益。在第二極短,時(shí)間包絡(luò)成形器332可以對(duì)實(shí)際信號(hào)中的采用應(yīng)用增益,以達(dá)到期望的效果。在一個(gè)實(shí)施例中,期望的效果是銳化話音的瞬態(tài)部分,以強(qiáng)調(diào)非元音話音(如特定的輔音,如“s”和“t”),從而增加話音可理解性。在其他應(yīng)用中,使話音平滑從而使話音軟化可能是有用的。
      [0068]圖6示出了可以實(shí)現(xiàn)圖3的時(shí)間包絡(luò)成形器332的特征的時(shí)間包絡(luò)成形器632的更詳細(xì)的實(shí)施例。時(shí)間包絡(luò)成形器632還可以與上述自適應(yīng)語(yǔ)音增強(qiáng)模塊無(wú)關(guān)地用于不同應(yīng)用。[0069]時(shí)間包絡(luò)成形器632接收輸入信號(hào)602 (例如,從濾波器326或合并器528)。接著,時(shí)間包絡(luò)成形器632使用帶通濾波器610等將輸入信號(hào)602細(xì)分為多個(gè)帶??梢赃x擇任意數(shù)目的帶。作為一個(gè)示例,時(shí)間包絡(luò)成形器632可以將輸入信號(hào)602劃分為4個(gè)帶,包括:從大約50Hz到大約200z的第一帶、從大約200Hz到大約4kz的第二帶、從大約4kz到大約IOkHz的第三帶、以及從大約IOkHz到大約20kHz的第四帶。在其他實(shí)施例中,時(shí)間包絡(luò)成形器332不將信號(hào)劃分為帶,而取而代之地對(duì)整個(gè)信號(hào)操作。
      [0070]最低帶可以是使用子帶通濾波器610a獲得的低音或子帶。該子帶可以與通常在低音炮中再現(xiàn)的頻率相對(duì)應(yīng)。在以上示例中,最低帶是大約50Hz至大約200Hz。該子帶通濾波器610a的輸出被提供至對(duì)子帶中的信號(hào)應(yīng)用增益的子補(bǔ)償增益框612。如將于以下詳細(xì)描述的,可以對(duì)其他帶應(yīng)用增益,以銳化或強(qiáng)調(diào)輸入信號(hào)602的外觀。然而,應(yīng)用這樣的增益可以增加子帶610a以外的帶610b中的能量,導(dǎo)致潛在的低音輸出降低。為了補(bǔ)償該降低的低音效果,子補(bǔ)償增益框612可以基于應(yīng)用于其他帶610b的增益的量,對(duì)子帶610a應(yīng)用增益。子補(bǔ)償增益可以具有與原始輸入信號(hào)(或其包絡(luò))和銳化的輸入信號(hào)的能量差相等或近似相等的值。子補(bǔ)償增益可由增益框612通過(guò)對(duì)應(yīng)用于其他帶610b的增加的能量或增益進(jìn)行求和、平均或其他方式的合并來(lái)計(jì)算。子補(bǔ)償增益還可由選擇應(yīng)用于帶610b之一的峰增益并將該值等用于子補(bǔ)償增益的增益框612計(jì)算。然而,在另一實(shí)施例中,子補(bǔ)償增益是固定的增益值。向合并器630提供子補(bǔ)償增益框612的輸出。
      [0071]每個(gè)其他帶通濾波器610b的輸出可以提供給包絡(luò)檢測(cè)器622,包絡(luò)檢測(cè)器622執(zhí)行上述包絡(luò)檢測(cè)算法中的任一算法。例如,包絡(luò)檢測(cè)器622可以執(zhí)行最大值跟蹤等。包絡(luò)檢測(cè)器622的輸出可以提供給包絡(luò)成形器624,包絡(luò)成形器624可以調(diào)整包絡(luò)的形狀,以選擇性地銳化或平滑包絡(luò)的外觀。每個(gè)包絡(luò)成形器624向合并器630提供輸出信號(hào),合并器630合并每個(gè)包絡(luò)成形器624和子補(bǔ)償增益框612的輸出,以提供輸出信號(hào)634。
      [0072]可以通過(guò)操縱每個(gè)帶中包絡(luò)(或者在不細(xì)分的情況下整個(gè)信號(hào))的斜率來(lái)實(shí)現(xiàn)包絡(luò)成形器624所提供的銳化效果,如圖7和8所示。參照?qǐng)D7,示例曲線700被示為時(shí)域包絡(luò)701的一部分。在曲線700中,時(shí)域包絡(luò)701包括兩個(gè)部分:第一部分702和第二部分704。第一部分702具有正斜率,而第二部分704具有負(fù)斜率。因此,兩個(gè)部分702、704形成峰708。包絡(luò)上的點(diǎn)706、708和710表示由上述最大值包括檢測(cè)器從窗或幀檢測(cè)的峰值。部分702、704表示用于連接峰點(diǎn)706、708、710從而形成包括710的直線。雖然峰708被示為在該包絡(luò)701中,包絡(luò)701的其他部分(未示出)可以取而代之地具有轉(zhuǎn)折點(diǎn)或零斜率。還可以針對(duì)包絡(luò)701的這樣的其他部分執(zhí)行參照包絡(luò)701的示例部分描述的分析。
      [0073]包絡(luò)701的第一部分702與橫軸形成角度Θ。該角度的陡度可以反映包絡(luò)701部分702、704是否表示話音信號(hào)的瞬態(tài)部分,較陡的角度更多地指示瞬態(tài)。類似地,包絡(luò)701的第二部分702與橫軸形成角度Φ。該角度也反映瞬態(tài)存在的可能性,更大的角度更多地指示瞬態(tài)。因此,增加角度θ、φ中的一個(gè)或兩個(gè)可以有效地銳化或強(qiáng)調(diào)瞬態(tài),并且特別地,增加Φ可以導(dǎo)致更單調(diào)的聲音(例如具有較少回響的聲音),這是由于可以降低聲音的反射。
      [0074]可以通過(guò)調(diào)整部分702、704所形成的直線中每一個(gè)的斜率來(lái)增加角度,以產(chǎn)生具有更陡峭或銳化的部分712、714的新包絡(luò)。第一部分702的斜率可以被表示為dy / dxl (如圖所示),而第二部分704的斜率可以被表示為dy / dx2(如圖所示)??梢詰?yīng)用增益,以增加每個(gè)斜率的絕對(duì)值(例如,對(duì)于dy / dxl為正增量,對(duì)于dy / dx2為負(fù)增量)。該增益可以依賴于每個(gè)角度θ、φ的值。為了使瞬態(tài)銳化,在特定實(shí)施例中,增益值隨正斜率一起增加,在負(fù)斜率中減小。提供至包絡(luò)的第一部分702的增益調(diào)整的量可以但無(wú)需與應(yīng)用于第二部分704的量相同。在一個(gè)實(shí)施例中,第二部分704的增益在絕對(duì)值上大于應(yīng)用于第一部分702的增益,從而使聲音進(jìn)一步銳化。針對(duì)峰處的采樣,可以使增益平滑,以降低由于從正增益到負(fù)增益的突然轉(zhuǎn)換導(dǎo)致的偽象。在特定實(shí)施例中,每當(dāng)上述角度低于閾值時(shí),對(duì)包絡(luò)應(yīng)用增益。在其他實(shí)施例中,每當(dāng)角度大于閾值時(shí),應(yīng)用增益。所計(jì)算的增益(或針對(duì)多個(gè)采樣和/或多個(gè)帶的增益)可以構(gòu)成使信號(hào)中的峰銳化的時(shí)間增強(qiáng)參數(shù),從而增強(qiáng)音頻信號(hào)所選擇的輔音或其他部分。
      [0075]可以執(zhí)行這些特征的具有平滑的示例增益等式如下:gain=exp (gFactor*delta* (1-mBand- > prev_maxXL / dx) * (mBand- > mGainoffs et+Offsetdelta* (1-mBand- > prev_maxXL))。在該示例等式中,增益是角度改變的指數(shù)函數(shù),這是由于包絡(luò)和角度是在對(duì)數(shù)尺度下計(jì)算的。量gFactoi控制起音或衰減的速率。量(1-mBand-> prev_maxXL / dx)表示包絡(luò)的斜率,而增益等式的以下部分表示從先前增益開(kāi)始以當(dāng)前增益結(jié)束的平滑函數(shù):(mBand- > mGainoffset+Offsetdelta* (1-mBand- > prev_maxXL))。由于人類聽(tīng)覺(jué)系統(tǒng)基于對(duì)數(shù)尺度,指數(shù)函數(shù)可以有助于收聽(tīng)者更好的區(qū)分瞬態(tài)聲音。
      [0076]圖8中還示出了量gFactor的起音/衰減函數(shù),其中,在第一曲線中示出了不同級(jí)別的增加的起音斜率812,在第二曲線820中示出了不同級(jí)別的降低的衰減斜率822??梢匀缟纤鲈谛甭噬显黾悠鹨粜甭?12,以強(qiáng)調(diào)與圖7的更陡峭的第一部分712相對(duì)應(yīng)的瞬態(tài)聲音。類似地,可以如上所述在斜率上減小衰減斜率822,以進(jìn)一步強(qiáng)調(diào)與圖7的更陡峭的第二部分714相對(duì)應(yīng)的瞬態(tài)聲音。
      [0077]V.示例語(yǔ)音檢測(cè)過(guò)程
      [0078]圖9示出了語(yǔ)音檢測(cè)過(guò)程900的實(shí)施例。噪聲檢測(cè)過(guò)程900可由上述語(yǔ)音增強(qiáng)系統(tǒng)110、210中的任一個(gè)實(shí)現(xiàn)。在一個(gè)實(shí)施例中,噪聲檢測(cè)過(guò)程900由語(yǔ)音活動(dòng)性檢測(cè)器212實(shí)現(xiàn)。
      [0079]語(yǔ)音檢測(cè)過(guò)程900檢測(cè)輸入信號(hào)(如麥克風(fēng)輸入信號(hào)204)中的語(yǔ)音。如果輸入信號(hào)包括噪聲而非語(yǔ)音,語(yǔ)音檢測(cè)過(guò)程900允許基于當(dāng)前的測(cè)量的環(huán)境噪聲來(lái)調(diào)整語(yǔ)音增強(qiáng)的量。然而,當(dāng)輸入信號(hào)包括語(yǔ)音時(shí),語(yǔ)音檢測(cè)過(guò)程900可以使環(huán)境噪聲的先前測(cè)量用于調(diào)整語(yǔ)音增強(qiáng)。使用噪聲的先前測(cè)量可以有利地基于語(yǔ)音輸入來(lái)調(diào)整語(yǔ)音增強(qiáng),同時(shí)仍使語(yǔ)音增強(qiáng)能夠適于環(huán)境噪聲條件。
      [0080]在過(guò)程900的框902中,語(yǔ)音活動(dòng)性檢測(cè)器212接收輸入的麥克風(fēng)信號(hào)。在框904,語(yǔ)音活動(dòng)性檢測(cè)器212執(zhí)行麥克風(fēng)信號(hào)的語(yǔ)音活動(dòng)性分析。語(yǔ)音活動(dòng)性檢測(cè)器212可以使用多種技術(shù)中的任一種檢測(cè)語(yǔ)音活動(dòng)性。在一個(gè)實(shí)施例中,語(yǔ)音活動(dòng)性檢測(cè)器212檢測(cè)噪聲而非語(yǔ)音活動(dòng)性,并且推斷出非噪聲活動(dòng)性的時(shí)段對(duì)應(yīng)于語(yǔ)音。語(yǔ)音活動(dòng)性檢測(cè)器212可以使用以上技術(shù)等的任意組合來(lái)檢測(cè)語(yǔ)音和/或噪聲:信號(hào)的統(tǒng)計(jì)分析(使用例如標(biāo)準(zhǔn)差、方差等)、較低頻帶能量與較高頻帶能量之比、過(guò)零率、譜通量或其他頻域方法、或自相關(guān)。此外,在一些實(shí)施例中,語(yǔ)音活動(dòng)性檢測(cè)器212使用2006年4月21日遞交的題為“Systems and Methods for Reducing Audio Noise”的美國(guó)專利中描述的噪聲檢測(cè)技術(shù)中的一些或全部來(lái)檢測(cè)噪聲,其公開(kāi)內(nèi)容以引用方式完全并入于此。[0081]如果如在判決框906處確定的信號(hào)包括語(yǔ)音,語(yǔ)音活動(dòng)性檢測(cè)器212使語(yǔ)音增強(qiáng)控制器222使用先前的噪聲緩沖器來(lái)控制自適應(yīng)語(yǔ)音增強(qiáng)模塊220的語(yǔ)音增強(qiáng)。噪聲緩沖器可以包括語(yǔ)音活動(dòng)性檢測(cè)器212或語(yǔ)音增強(qiáng)控制器222所保存的麥克風(fēng)輸入信號(hào)204的一個(gè)或更多個(gè)塊的噪聲米樣。在環(huán)境噪聲自先前噪聲米樣存儲(chǔ)在噪聲緩沖器中起未顯著改變的假設(shè)下,可以使用從輸入信號(hào)402的先前部分保存的先前的噪聲緩沖器。由于交談中的停頓頻繁發(fā)生,該假設(shè)在許多實(shí)例中是正確的。
      [0082]另一方面,如果信號(hào)不包括語(yǔ)音,語(yǔ)音活動(dòng)性檢測(cè)器212使語(yǔ)音增強(qiáng)控制器222使用當(dāng)前的噪聲緩沖器來(lái)控制自適應(yīng)語(yǔ)音增強(qiáng)模塊220的語(yǔ)音增強(qiáng)。當(dāng)前的噪聲緩沖器可以表示一個(gè)或更多個(gè)最近接收的塊的噪聲采樣。語(yǔ)音活動(dòng)性檢測(cè)器212在框914確定是否接收到附加信號(hào)。如果接收到,過(guò)程900循環(huán)回到框904。否則,過(guò)程900結(jié)束。
      [0083]因此,在特定實(shí)施例中,語(yǔ)音檢測(cè)過(guò)程900可以減輕語(yǔ)音輸入調(diào)制或以其他方式自激活應(yīng)用于遠(yuǎn)程語(yǔ)音信號(hào)的語(yǔ)音可理解性增強(qiáng)的等級(jí)的非期望效果。
      [0084]V1.示例麥克風(fēng)校準(zhǔn)過(guò)程
      [0085]圖10示出了麥克風(fēng)校準(zhǔn)過(guò)程1000的實(shí)施例。麥克風(fēng)校準(zhǔn)過(guò)程1000可以至少部分由上述語(yǔ)音增強(qiáng)系統(tǒng)110、210中的任一個(gè)實(shí)現(xiàn)。在一個(gè)實(shí)施例中,麥克風(fēng)校準(zhǔn)過(guò)程1000至少部分由麥克風(fēng)校準(zhǔn)模塊234實(shí)現(xiàn)。如圖所示,過(guò)程的一部分可以在實(shí)驗(yàn)室或設(shè)計(jì)設(shè)施中實(shí)現(xiàn),而過(guò)程1000的其余部分可以在現(xiàn)場(chǎng)(如在并入了語(yǔ)音增強(qiáng)系統(tǒng)110或210的設(shè)備的制造商的設(shè)施處)實(shí)現(xiàn)。
      [0086]如上所述,麥克風(fēng)校準(zhǔn)模塊234可以計(jì)算并存儲(chǔ)一個(gè)或更多個(gè)校準(zhǔn)參數(shù),所述一個(gè)或更多個(gè)校準(zhǔn)參數(shù)調(diào)整應(yīng)用于麥克風(fēng)輸入信號(hào)204的增益,使麥克風(fēng)的總體增益對(duì)于一些或全部設(shè)備相同或大約相同。相反,使麥克風(fēng)增益在設(shè)備間相等的現(xiàn)有方法往往是不一致的,導(dǎo)致在不同設(shè)備中不同噪聲級(jí)別激活語(yǔ)音增強(qiáng)。在當(dāng)前的麥克風(fēng)校準(zhǔn)方法中,現(xiàn)場(chǎng)工程師(例如在設(shè)備制造商設(shè)施處或在別處)通過(guò)激活測(cè)試設(shè)備中的回放揚(yáng)聲器來(lái)產(chǎn)生將被電話或其他設(shè)備拾取的噪聲來(lái)應(yīng)用試錯(cuò)法。接著,現(xiàn)場(chǎng)工程師嘗試校準(zhǔn)麥克風(fēng),使得麥克風(fēng)信號(hào)具有語(yǔ)音增強(qiáng)控制器222理解為到達(dá)噪聲閾值的級(jí)別,從而使語(yǔ)音增強(qiáng)控制器222觸發(fā)或啟用語(yǔ)音增強(qiáng)。由于每個(gè)現(xiàn)場(chǎng)工程師對(duì)為達(dá)到觸發(fā)語(yǔ)音的閾值增強(qiáng)麥克風(fēng)應(yīng)拾取的噪聲的級(jí)別具有不同的感覺(jué),出現(xiàn)不一致。此外,許多麥克風(fēng)具有較寬的增益范圍(例如-40dB到+40dB),并且因此可能難以在調(diào)諧麥克風(fēng)時(shí)找到精確的增益數(shù)。
      [0087]麥克風(fēng)校準(zhǔn)過(guò)程1000可以計(jì)算可以與當(dāng)前現(xiàn)場(chǎng)工程師試錯(cuò)法更一致的每個(gè)麥克風(fēng)的增益值。起始于實(shí)驗(yàn)室,在框1002,用測(cè)試設(shè)備輸出噪聲信號(hào),所述測(cè)試設(shè)備可以是具有或與適當(dāng)?shù)膿P(yáng)聲器耦合的任意計(jì)算設(shè)備。在框1004該噪聲信號(hào)被記錄為參考信號(hào),并且在框1006從標(biāo)準(zhǔn)參考信號(hào)計(jì)算平滑后的能量。該平滑后的能量(記為RefPwr)可以是被用于現(xiàn)場(chǎng)自動(dòng)麥克風(fēng)校準(zhǔn)的黃金參考值。
      [0088]在現(xiàn)場(chǎng),可以使用黃金參考值RefPwr進(jìn)行自動(dòng)校準(zhǔn)。在框1008,例如由現(xiàn)場(chǎng)工程師使用測(cè)試設(shè)備以標(biāo)準(zhǔn)音量播放參考信號(hào)。以與在實(shí)驗(yàn)室中在框1002中播放噪聲信號(hào)相同的音量來(lái)播放參考信號(hào)。在框1010,麥克風(fēng)校準(zhǔn)模塊234可以計(jì)算從測(cè)試下的麥克風(fēng)接收的聲音。接著,麥克風(fēng)校準(zhǔn)模塊234在框1012計(jì)算記錄信號(hào)的平滑后的能量,記為CaliPwr0在框1014,麥克風(fēng)校準(zhǔn)模塊234可以基于參考信號(hào)和記錄信號(hào)的能量來(lái)計(jì)算麥克風(fēng)偏移,例如:MicOffset=RefPwr/CaliPwr。[0089]在框1016,麥克風(fēng)校準(zhǔn)模塊234將麥克風(fēng)偏移設(shè)置為麥克風(fēng)的增益。當(dāng)接收麥克風(fēng)輸入信號(hào)204時(shí),該麥克風(fēng)偏移可以作為校準(zhǔn)增益應(yīng)用于麥克風(fēng)輸入信號(hào)204。因此,使語(yǔ)音增強(qiáng)控制器222針對(duì)相同閾值級(jí)別觸發(fā)語(yǔ)音增強(qiáng)的噪聲級(jí)別在設(shè)備間相同或近似相同。
      [0090]VI1.術(shù)語(yǔ)
      [0091]由本公開(kāi),此處描述的變型以外的許多其他變型將是顯而易見(jiàn)的。例如,根據(jù)實(shí)施例,可以不同順序執(zhí)行此處描述的任一算法的特定動(dòng)作、事件或功能,并且可以增加、合并或完全省略此處描述的任一算法的特定動(dòng)作、事件或功能(例如,對(duì)于算法的實(shí)現(xiàn),并非所有描述的動(dòng)作或時(shí)間都是必須的)。此外,在特定實(shí)施例中,可以同時(shí)(例如通過(guò)多線程處理、中斷處理或者多處理器或處理器或者在其他并行架構(gòu)上)而非順序執(zhí)行動(dòng)作或事件。此外,可以通過(guò)能夠一起工作的不同機(jī)器和/或計(jì)算系統(tǒng)來(lái)執(zhí)行不同的任務(wù)或過(guò)程。
      [0092]此處結(jié)合此處公開(kāi)的實(shí)施例描述的各種說(shuō)明性邏輯框、模塊和算法步驟可以被實(shí)現(xiàn)為電子硬件、計(jì)算機(jī)軟件或兩者的組合。為了清楚地說(shuō)明硬件的軟件的該可交換性,以上一般地按照其功能描述了各種說(shuō)明性組件、框、模塊和步驟。這樣的功能是被實(shí)現(xiàn)為硬件還是軟件取決于施加于整個(gè)系統(tǒng)的特定的應(yīng)用和設(shè)計(jì)約束。例如,交通工具管理系統(tǒng)110或210可由一個(gè)或更多個(gè)計(jì)算機(jī)系統(tǒng)或由包括一個(gè)或更多個(gè)處理器在內(nèi)的計(jì)算機(jī)系統(tǒng)實(shí)現(xiàn)。對(duì)于各個(gè)特定應(yīng)用,可以改變的方式實(shí)現(xiàn)所描述的功能,但是這樣的實(shí)現(xiàn)決策不應(yīng)理解為導(dǎo)致背離本公開(kāi)的范圍。
      [0093]結(jié)合此處公開(kāi)的實(shí)施例描述的各種說(shuō)明性邏輯框、模塊和算法步驟可以由機(jī)器實(shí)現(xiàn)或執(zhí)行,如,被設(shè)計(jì)為執(zhí)行此處描述的功能的通用處理器、數(shù)字信號(hào)處理器(DSP)、專用集成電路(ASIC)、現(xiàn)場(chǎng)可編程門(mén)陣列(FPGA)或其他可編程邏輯器件、分立的門(mén)或晶體管邏輯、分立的硬件組件或其任意組合。通用處理器可以是微處理器,但備選地處理器可以是控制器、微控制器或狀態(tài)機(jī)或其組合等。處理器還可以被實(shí)現(xiàn)為計(jì)算設(shè)備的組合,例如,DSP和微處理器的組合、多個(gè)微處理器、與DSP核結(jié)合的一個(gè)或更多個(gè)微處理器或任意其他這樣的配置。計(jì)算環(huán)境可以包括任意類型的計(jì)算機(jī)系統(tǒng),包括但不限于基于微處理器的計(jì)算機(jī)系統(tǒng)、主機(jī)計(jì)算機(jī)、數(shù)字信號(hào)處理器、便攜式計(jì)算設(shè)備、個(gè)人組織器、設(shè)備控制器、以及器械中的計(jì)算引擎等。
      [0094]結(jié)合此處公開(kāi)的實(shí)施例描述的方法、過(guò)程或算法的步驟可以執(zhí)行用硬件、由處理器執(zhí)行的軟件模塊或用兩者的結(jié)合來(lái)實(shí)現(xiàn)。軟件模塊可以駐留在RAM存儲(chǔ)器、閃存、ROM存儲(chǔ)器、EPROM存儲(chǔ)器、EEPROM存儲(chǔ)器、寄存器、硬盤(pán)、可移除盤(pán)、CD-ROM或任意其他形式的非瞬態(tài)計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)、或者現(xiàn)有技術(shù)中已知的物理計(jì)算機(jī)存儲(chǔ)器中。示例存儲(chǔ)介質(zhì)可以耦合至處理器,使得處理器能夠從存儲(chǔ)介質(zhì)讀取并向存儲(chǔ)介質(zhì)寫(xiě)入信息。備選地,存儲(chǔ)介質(zhì)可以是處理器的一部分。處理器和存儲(chǔ)介質(zhì)可以駐留在ASIC中。ASIC可以駐留在用戶終端中。備選地,處理器和存儲(chǔ)介質(zhì)可以駐留為用戶終端中的分立組件。
      [0095]除非另行具體說(shuō)明或在此處使用的上下文中以其他方式理解,此處使用的條件式語(yǔ)言(如“能夠”、“可能”、“可以”、“例如”等)一般意在表達(dá):特定實(shí)施例包括而其他實(shí)施例不包括特定特征、元素和/或狀態(tài)。因此,這樣的條件式語(yǔ)言一般并非意在暗示一個(gè)或更多個(gè)實(shí)施例必須包括用于(在有無(wú)著者輸入或提示的情況下)判斷這些特征、元素和/或狀態(tài)是否被包括在任意特定實(shí)施例中或要在任意特定實(shí)施例中執(zhí)行的邏輯。術(shù)語(yǔ)“包括”、“包含”、“具有”等是同義的并且以開(kāi)放式包含方式使用,而不排除附加元素、特征、動(dòng)作、操作等。此外,術(shù)語(yǔ)“或”以其包含意義(而非排除意義)使用,從而當(dāng)例如用于連接一系列元素時(shí),術(shù)語(yǔ)“或”指列表中元素的一個(gè)、一些或全部。此外,除了具有其通常含義,此處使用的術(shù)語(yǔ)“每個(gè)”還指術(shù)語(yǔ)“每個(gè)”所應(yīng)用于的元素集合的任意子集。
      [0096]雖然以上詳細(xì)描述已經(jīng)示出、描述并指出了適用于各種實(shí)施例的新穎特征,將理解的是:可以在不背離本公開(kāi)精神的前提下,做出所示意的設(shè)備或算法的形式和細(xì)節(jié)上的各種省略、替換和改變。如將意識(shí)到的,由于一些特征可以與其他特征分開(kāi)使用或?qū)崿F(xiàn),可以不提供此處記載的全部特征和益處的形式,實(shí)現(xiàn)此處描述的發(fā)明的特定實(shí)施例。
      【權(quán)利要求】
      1.一種調(diào)整語(yǔ)音可理解性增強(qiáng)的方法,所述方法包括: 接收輸入的語(yǔ)音信號(hào); 利用線性預(yù)測(cè)編碼LPC過(guò)程來(lái)獲得輸入的語(yǔ)音信號(hào)的譜表示,所述譜表示包括一個(gè)或更多個(gè)共振峰頻率; 利用一個(gè)或更多個(gè)處理器來(lái)調(diào)整輸入的語(yǔ)音信號(hào)的譜表示,以產(chǎn)生增強(qiáng)濾波器,所述增強(qiáng)濾波器被配置為強(qiáng)調(diào)所述一個(gè)或更多個(gè)共振峰頻率; 對(duì)輸入的語(yǔ)音信號(hào)的表示應(yīng)用所述增強(qiáng)濾波器,以產(chǎn)生具有增強(qiáng)的共振峰頻率的修改后的語(yǔ)音信號(hào); 基于輸入的語(yǔ)音信號(hào)來(lái)檢測(cè)包絡(luò); 分析修改后的語(yǔ)音信號(hào)的包絡(luò),以確定一個(gè)或更多個(gè)時(shí)間增強(qiáng)參數(shù);以及 對(duì)修改后的語(yǔ)音信號(hào)應(yīng)用所述一個(gè)或更多個(gè)時(shí)間增強(qiáng)參數(shù),以產(chǎn)生輸出的語(yǔ)音信號(hào); 其中,至少所述應(yīng)用所述一個(gè)或更多個(gè)時(shí)間增強(qiáng)參數(shù)由一個(gè)或更多個(gè)處理器來(lái)執(zhí)行。
      2.根據(jù)權(quán)利要求1所述的方法,其中,所述對(duì)修改后的語(yǔ)音信號(hào)應(yīng)用所述一個(gè)或更多個(gè)時(shí)間增強(qiáng)參數(shù)包括:銳化修改后的語(yǔ)音信號(hào)的一個(gè)或更多個(gè)包絡(luò)中的峰,以強(qiáng)調(diào)修改后的語(yǔ)音信號(hào)中所選擇的輔音。
      3.根據(jù)權(quán)利要求1所述的方法,其中,所述檢測(cè)包絡(luò)包括檢測(cè)以下各項(xiàng)中一個(gè)或更多個(gè)的包絡(luò):輸入的語(yǔ)音信號(hào);以及修改后的語(yǔ)音信號(hào)。
      4.根據(jù)權(quán)利要求1所述的方法,還包括:對(duì)輸入的語(yǔ)音信號(hào)應(yīng)用逆濾波器,以產(chǎn)生激勵(lì)信號(hào),使得所述對(duì)輸入的語(yǔ)音信號(hào)的表示應(yīng)用所述增強(qiáng)濾波器包括對(duì)所述激勵(lì)信號(hào)應(yīng)用所述增強(qiáng)濾波器。
      5.一種用于調(diào)整語(yǔ)音可理解性`增強(qiáng)的系統(tǒng),所述系統(tǒng)包括: 分析模塊,被配置為獲得輸入的音頻信號(hào)的至少一部分的譜表示,所述譜表示包括一個(gè)或更多個(gè)共振峰頻率; 共振峰增強(qiáng)模塊,被配置為產(chǎn)生增強(qiáng)濾波器,所述增強(qiáng)濾波器被配置為強(qiáng)調(diào)所述一個(gè)或更多個(gè)共振峰頻率; 所述增強(qiáng)濾波器被配置為利用一個(gè)或更多個(gè)處理器應(yīng)用于輸入的音頻信號(hào)的表示,以產(chǎn)生修改后的語(yǔ)音信號(hào);以及 時(shí)間包絡(luò)成形器,被配置為至少部分基于修改后的語(yǔ)音信號(hào)的一個(gè)或更多個(gè)包絡(luò)來(lái)對(duì)修改后的語(yǔ)音信號(hào)應(yīng)用時(shí)間增強(qiáng)。
      6.根據(jù)權(quán)利要求5所述的系統(tǒng),其中,所述分析模塊還被配置為:使用線性預(yù)測(cè)編碼技術(shù)來(lái)獲得輸入的音頻信號(hào)的譜表示,所述線性預(yù)測(cè)編碼技術(shù)被配置為產(chǎn)生與所述譜表示相對(duì)應(yīng)的系數(shù)。
      7.根據(jù)權(quán)利要求6所述的系統(tǒng),還包括:映射模塊,被配置為將所述系數(shù)映射至線譜對(duì)。
      8.根據(jù)權(quán)利要求7所述的系統(tǒng),還包括:修改所述線譜對(duì),以增強(qiáng)與共振峰頻率相對(duì)應(yīng)的譜表示中的增益。
      9.根據(jù)權(quán)利要求5所述的系統(tǒng),其中,所述增強(qiáng)濾波器還被配置為應(yīng)用于以下各項(xiàng)中的一個(gè)或更多個(gè):輸入的音頻信號(hào);以及從輸入的音頻信號(hào)導(dǎo)出的激勵(lì)信號(hào)。
      10.根據(jù)權(quán)利要求5所述的系統(tǒng),其中,所述時(shí)間包絡(luò)成形器還被配置為:將修改后的語(yǔ)音信號(hào)細(xì)分為多個(gè)頻帶,并且所述一個(gè)或更多個(gè)包絡(luò)與所述多個(gè)頻帶中至少一些頻帶的包絡(luò)相對(duì)應(yīng)。
      11.根據(jù)權(quán)利要求5所述的系統(tǒng),還包括:語(yǔ)音增強(qiáng)控制器,被配置為至少部分基于輸入的麥克風(fēng)信號(hào)中檢測(cè)到的環(huán)境噪聲量,來(lái)調(diào)整增強(qiáng)濾波器的增益。
      12.根據(jù)權(quán)利要求11所述的系統(tǒng),還包括:語(yǔ)音活動(dòng)性檢測(cè)器,被配置為檢測(cè)輸入的麥克風(fēng)信號(hào)中的語(yǔ)音,并響應(yīng)于檢測(cè)到的語(yǔ)音來(lái)控制語(yǔ)音增強(qiáng)控制器。
      13.根據(jù)權(quán)利要求12所述的系統(tǒng),其中,所述語(yǔ)音活動(dòng)性檢測(cè)器還被配置為:響應(yīng)于檢測(cè)到輸入的麥克風(fēng)信號(hào)中的語(yǔ)音,使所述語(yǔ)音增強(qiáng)控制器基于先前的噪聲輸入來(lái)調(diào)整增強(qiáng)濾波器的增益。
      14.根據(jù)權(quán)利要求11所述的系統(tǒng),還包括:麥克風(fēng)校準(zhǔn)模塊,被配置為設(shè)置麥克風(fēng)的增益,所述麥克風(fēng)被配置為接收輸入的麥克風(fēng)信號(hào),其中,所述麥克風(fēng)校準(zhǔn)模塊還被配置為:至少部分基于參考信號(hào)和記錄的噪聲信號(hào),來(lái)設(shè)置所述增益。
      15.一種用于調(diào)整語(yǔ)音可理解性增強(qiáng)的系統(tǒng),所述系統(tǒng)包括: 線性預(yù)測(cè)編碼分析模塊,被配置為應(yīng)用線性預(yù)測(cè)編碼LPC技術(shù)來(lái)獲得與輸入的語(yǔ)音信號(hào)的譜相對(duì)應(yīng)的LPC系數(shù),所述譜包括一個(gè)或更多個(gè)共振峰頻率; 映射模塊,被配置為將所述LPC系數(shù)映射至線譜對(duì);以及 包括一個(gè)或更多個(gè)處理器的共振峰增強(qiáng)模塊,所述共振峰增強(qiáng)模塊被配置為修改所述線譜對(duì)從而調(diào)整輸入的語(yǔ)音信號(hào)的譜,并產(chǎn)生增強(qiáng)濾波器,所述增強(qiáng)濾波器被配置為強(qiáng)調(diào)所述一個(gè)或更多個(gè)共振峰頻率; 所述增強(qiáng)濾波器被配置為應(yīng)用于輸入的音頻信號(hào)的表示,以產(chǎn)生修改后的語(yǔ)音信號(hào)。
      16.根據(jù)權(quán)利要求15所述的系統(tǒng),還包括:語(yǔ)音活動(dòng)性檢測(cè)器,被配置為檢測(cè)輸入的麥克風(fēng)信號(hào)中的語(yǔ)音,并響應(yīng)于檢測(cè)到輸入的麥克風(fēng)信號(hào)中的語(yǔ)音使增強(qiáng)濾波器的增益得到調(diào)整。
      17.根據(jù)權(quán)利要求16所述的系統(tǒng),還包括:麥克風(fēng)校準(zhǔn)模塊,被配置為設(shè)置麥克風(fēng)的增益,所述麥克風(fēng)被配置為接收輸入的麥克風(fēng)信號(hào),其中,所述麥克風(fēng)校準(zhǔn)模塊還被配置為:至少部分基于參考信號(hào)和記錄的噪聲信號(hào),來(lái)設(shè)置所述增益。
      18.根據(jù)權(quán)利要求15所述的系統(tǒng),其中,所述增強(qiáng)濾波器還被配置為應(yīng)用于以下各項(xiàng)中的一個(gè)或更多個(gè):輸入的音頻信號(hào);以及從輸入的音頻信號(hào)導(dǎo)出的激勵(lì)信號(hào)。
      19.根據(jù)權(quán)利要求15所述的系統(tǒng),還包括:時(shí)間包絡(luò)成形器,被配置為至少部分基于修改后的語(yǔ)音信號(hào)的一個(gè)或更多個(gè)包絡(luò),來(lái)對(duì)修改后的語(yǔ)音信號(hào)應(yīng)用時(shí)間增強(qiáng)。
      20.根據(jù)權(quán)利要求19所述的系統(tǒng),其中,所述時(shí)間包絡(luò)成形器還被配置為:銳化修改后的語(yǔ)音信號(hào)的一個(gè)或更多個(gè)包絡(luò)中的峰,以強(qiáng)調(diào)修改后的語(yǔ)音信號(hào)的所選擇的部分。
      【文檔編號(hào)】G10L25/15GK103827965SQ201280047329
      【公開(kāi)日】2014年5月28日 申請(qǐng)日期:2012年7月26日 優(yōu)先權(quán)日:2011年7月29日
      【發(fā)明者】魯?shù)峡岁?yáng), 何星, 詹姆斯·特雷西 申請(qǐng)人:Dts有限責(zé)任公司
      網(wǎng)友詢問(wèn)留言 已有0條留言
      • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
      1