專(zhuān)利名稱(chēng):音頻信號(hào)合成的制作方法
音頻信號(hào)合成本發(fā)明涉及音頻信號(hào)合成。本發(fā)明尤其涉及其中確定所合成信號(hào) 的相位的音頻信號(hào)合成裝置和方法。本發(fā)明進(jìn)一步涉及修改音頻信號(hào) 頻率的裝置和方法,該裝置包括上面提到的音頻信號(hào)合成裝置或方法。利用諸如頻率和相位的信號(hào)參數(shù)來(lái)合成音頻信號(hào)是眾所周知的。 該合成可被實(shí)施用于在電子樂(lè)器或其它諸如移動(dòng)(蜂窩)電話的消費(fèi) 類(lèi)裝置中生成聲音信號(hào)。可替換地,該合成可以由解碼器實(shí)施,對(duì)前 面編碼過(guò)的音頻信號(hào)進(jìn)行解碼。編碼方法的例子是參數(shù)編碼,其中音 頻信號(hào)在每個(gè)時(shí)間段被分解為正弦分量、噪聲分量和可選的其它分量, 這些分量每一個(gè)都可用適當(dāng)?shù)膮?shù)來(lái)表示。在適當(dāng)?shù)慕獯a器中,這些 參數(shù)用于充分地重構(gòu)原始的音頻信號(hào)。由A. C. den Br inker 、 E. G. P. Schui jers和A. W丄Oomen在Audio Engineering Society Convention Paper 5554, Mun i ch (Germany) , May 2002上發(fā)表的論文"Parametric Coding for High-Quality Audio" 揭示了正弦軌道(track)在參數(shù)編碼中的應(yīng)用。利用瞬態(tài)對(duì)象、正弦對(duì) 象和噪聲對(duì)象對(duì)音頻信號(hào)建模。每個(gè)時(shí)間幀估計(jì)一次正弦對(duì)象的參數(shù)。 每一幀估計(jì)的頻率在幀上鏈接起來(lái),由此形成正弦軌道。這些軌道指 示時(shí)間幀的哪些正弦對(duì)象繼續(xù)進(jìn)入下 一 時(shí)間幀。國(guó)際專(zhuān)利申請(qǐng)WO 02/056298 (飛利浦)揭示了參數(shù)編碼中信號(hào)分 量的鏈接。鏈接單元生成指示連續(xù)延伸的信號(hào)段分量的鏈接信息,其 中所述連續(xù)延伸的信號(hào)段可以被鏈接在一起,形成正弦軌道。盡管這些已知的方法提供了令人滿(mǎn)意的結(jié)果,但是它們還存在著 跨越時(shí)間幀邊界的正弦曲線鏈接會(huì)帶來(lái)相位誤差的缺點(diǎn)。如果某個(gè)時(shí) 間幀的正弦曲線被鏈接到下 一 時(shí)間幀的錯(cuò)誤的正弦曲線上,則 一般會(huì) 造成相位失配。這種相位失配將會(huì)產(chǎn)生所合成音頻信號(hào)的可聽(tīng)失真。因此本發(fā)明的目標(biāo)是克服現(xiàn)有技術(shù)的這些以及其它問(wèn)題,并且提 供一種合成音頻信號(hào)的裝置和方法,其中避免或至少大大地減輕相位 的不連續(xù)性。因此,本發(fā)明提供一種用于合成音頻信號(hào)的信號(hào)合成裝置,該裝置包括-正弦合成單元,用于利用至少一個(gè)表示音頻信號(hào)頻率的頻率參 數(shù)和至少一個(gè)表示音頻信號(hào)相位的相位參數(shù)來(lái)合成音頻信號(hào),以及-參數(shù)產(chǎn)生單元,用于利用(至少一個(gè))頻率參數(shù)和已合成的音 頻信號(hào)來(lái)產(chǎn)生(至少一個(gè))相位參數(shù)。通過(guò)利用已經(jīng)合成的音頻信號(hào)來(lái)產(chǎn)生相位,使用能夠提供基本上 連續(xù)相位的相位環(huán)。更特別地,正弦合成單元中4吏用的相位從已合成 的音頻信號(hào)中導(dǎo)出,因此能夠正確地匹配音頻信號(hào)。結(jié)果,相位預(yù)測(cè) 得以極大改善,且相位預(yù)測(cè)誤差的數(shù)量因此大大減少。包括在環(huán)中的 任何時(shí)間延遲均優(yōu)選地被考慮進(jìn)來(lái)。在本發(fā)明的裝置中,可以刪除用于將連續(xù)分段的信號(hào)分量鏈接起 來(lái)的常規(guī)的鏈接單元,由此避免了由于這種鏈接單元所造成的任何相 位失配。在優(yōu)選實(shí)施例中,已合成的音頻信號(hào)包括時(shí)間段,且參數(shù)產(chǎn)生單 元被安排為利用音頻信號(hào)的前一時(shí)間段來(lái)產(chǎn)生當(dāng)前的相位參數(shù)。在這 些實(shí)施例中,正被合成的段的相位由前面已合成的段的相位導(dǎo)出,優(yōu) 選是緊接著的前一段。以這種方式,可以保持已合成音頻信號(hào)的相位 與正在合成的音頻信號(hào)的相位之間的緊密關(guān)系。進(jìn)一步優(yōu)選地,參數(shù)產(chǎn)生單元包括,皮安排為確定一組相位/頻率對(duì) 的相位確定單元,其中每個(gè)相位/頻率對(duì)表示音頻信號(hào)一個(gè)頻率的相 位。在該實(shí)施例中,從已合成的音頻信號(hào)中導(dǎo)出一組相位和它們相關(guān) 聯(lián)的頻率。有利地,參數(shù)產(chǎn)生單元可以進(jìn)一步包括相位預(yù)測(cè)單元,該相位預(yù) 測(cè)單元被安排為一將頻率參數(shù)與該組相位/頻率對(duì)進(jìn)行比舉交,并選擇最接近該頻率參數(shù)的相位/頻率對(duì),并且-利用頻率參數(shù)和所選擇的相位產(chǎn)生相位參數(shù)。因此,參數(shù)產(chǎn)生單元可以選擇與由頻率參數(shù)所表示的頻率最匹配的頻率,然后在合成中使用與所選擇的頻率相關(guān)聯(lián)的相位。這種選擇可以實(shí)施幾次,如果多個(gè)頻率被用于合成音頻信號(hào)的話,則優(yōu)選是每個(gè)頻率實(shí)施一次選擇。所合成的音頻信號(hào)可以具有由頻率參數(shù)所表示的頻率(或多個(gè)頻 率)。然而,還希望能修改該頻率(或這些頻率)。因此,在一個(gè)有 利實(shí)施例中,參數(shù)產(chǎn)生單元包括頻率修改單元,用于響應(yīng)控制參數(shù)來(lái) 修改頻率參數(shù)。該(頻率)控制參數(shù)例如可以是乘法因數(shù),等于1的 值對(duì)應(yīng)于沒(méi)有頻率變化,小于1的值對(duì)應(yīng)于減小的頻率,而大于1的 值對(duì)應(yīng)于增大的頻率。在其它實(shí)施例中,控制參數(shù)可以指示頻率偏移。盡管本發(fā)明可以?xún)H僅利用頻率參數(shù)(或多個(gè)頻率參數(shù))和相位參 數(shù)(或多個(gè)相位參數(shù))來(lái)實(shí)現(xiàn),但是優(yōu)選地可以利用附加參數(shù)來(lái)進(jìn)一 步定義要被合成的音頻信號(hào)。因此,正弦合成單元可以附加地使用幅 度參數(shù)。另外,或者可替換地,本發(fā)明的裝置可以進(jìn)一步包括乘法單 元,用增益參數(shù)乘以所合成的音頻信號(hào)。如果所合成的音頻信號(hào)由時(shí)間段(時(shí)間幀)組成,則當(dāng)該裝置進(jìn)一步包括重疊相加(overlap-and-add)單元是有益的,其中該重疊相加 單元將所合成的音頻信號(hào)的時(shí)間段連接起來(lái)。其本身公知的這種重疊 相加單元用于通過(guò)將信號(hào)的重疊時(shí)間段部分地相加,產(chǎn)生基本連續(xù)的音頻數(shù)據(jù)流。如杲提供了分段單元和重疊相加單元,有益地,該分段單元可以 由第一重疊參數(shù)來(lái)控制,而重疊相加單元由第二重疊參數(shù)來(lái)控制,該 裝置被安排為通過(guò)改變重疊參數(shù)來(lái)進(jìn)行時(shí)間縮放(scaling)。本發(fā)明的裝置可以接收頻率參數(shù)、相位參數(shù)和來(lái)自于存儲(chǔ)介質(zhì)、 解復(fù)用器或任意其它適當(dāng)來(lái)源的任意其它參數(shù)。當(dāng)本發(fā)明的裝置用作 對(duì)在前面已經(jīng)利用參數(shù)編碼器而被編碼的音頻信號(hào)進(jìn)行解碼(也就是 合成)的解碼器時(shí),將尤其是這種情況。然而,在更加有利的實(shí)施例 中,本發(fā)明的裝置可以自己產(chǎn)生參數(shù)。因此在這些實(shí)施例中,該裝置 進(jìn)一步包括正弦分析單元,用于接收輸入音頻信號(hào)及產(chǎn)生頻率參數(shù)和 相位參數(shù)。其中音頻信號(hào)被首先編碼(即被分析并用信號(hào)參數(shù)表示)然后被 解碼(即使用所述信號(hào)參數(shù)合成)的裝置實(shí)施例可用于通過(guò)修改參數(shù) 來(lái)修改信號(hào)特性,例如頻率。因此,本發(fā)明還提供一種包括如上定義的信號(hào)合成裝置的頻率修 改裝置,該頻率修改裝置包括頻率修改單元,用于響應(yīng)控制參數(shù)來(lái)修 改頻率參數(shù),還包括正弦分析單元,用于接收輸入音頻信號(hào)并產(chǎn)生頻率參數(shù)和相位參數(shù)。
當(dāng)提供有用于接收輸入音頻信號(hào)并產(chǎn)生頻率參數(shù)和相位參數(shù)的正
弦分析單元時(shí),本發(fā)明的信號(hào)合成裝置可以有利地進(jìn)一步包括 -用于產(chǎn)生合成音頻信號(hào)的另一個(gè)正弦合成單元,和 -用于將所合成的音頻信號(hào)與輸入音頻信號(hào)進(jìn)行比較,從而產(chǎn)生
增益參數(shù)的比較單元。
在該實(shí)施例中,產(chǎn)生增益參數(shù),該參數(shù)允許已合成音頻信號(hào)的增
益被針對(duì)由于編碼(參數(shù)化)過(guò)程而導(dǎo)致的任意增益修改調(diào)整。
該裝置可進(jìn)一步包括分段單元,用于將音頻信號(hào)劃分為時(shí)間段。
然而,某些實(shí)施例可安排為用于接收已經(jīng)被劃分為時(shí)間段的音頻信號(hào),
且因此將不需要分段單元。
本發(fā)明還提供一種語(yǔ)音變換裝置,包括
-線性預(yù)測(cè)分析單元,用于響應(yīng)輸入語(yǔ)音信號(hào)而產(chǎn)生預(yù)測(cè)參數(shù)和 殘余信號(hào),
-音調(diào)適配(adaptation)單元,用于適配殘余4言號(hào)的音調(diào),/人 而產(chǎn)生音調(diào)適配的殘余信號(hào),和
-線性預(yù)測(cè)合成單元,用于響應(yīng)該音調(diào)適配的殘余信號(hào)而合成輸 出語(yǔ)音信號(hào)。
其中該音調(diào)適配單元包括如上定義的用于修改音頻信號(hào)頻率 的裝置。線性預(yù)測(cè)合成單元可安排為響應(yīng)音調(diào)適配的殘余信號(hào)和預(yù)測(cè) 參數(shù)而合成輸出語(yǔ)音信號(hào)。
本發(fā)明附加地提供一種包括如上定義的裝置的音頻系統(tǒng)。本發(fā)明 的音頻系統(tǒng)可以進(jìn)一步包括語(yǔ)音合成器和/或音樂(lè)合成器。本發(fā)明的裝 置可用在例如消費(fèi)類(lèi)裝置中,諸如移動(dòng)(蜂窩)電話、MP3或AAC播放 器、電子樂(lè)器、包括音頻(例如立體聲或5. 1 )和視頻(例如電視機(jī)) 以及諸如計(jì)算機(jī)設(shè)備的其它裝置的娛樂(lè)系統(tǒng)。特別地,本發(fā)明可用于 通過(guò)不對(duì)音頻信號(hào)相位進(jìn)行編碼而實(shí)現(xiàn)節(jié)省比特和/或比特率的應(yīng)用 中。
本發(fā)明還提供一種合成音頻信號(hào)的方法,該方法包括如下步驟 -利用至少一個(gè)表示音頻信號(hào)頻率的頻率參數(shù)和至少一個(gè)表示 音頻信號(hào)相位的相位參數(shù)來(lái)合成音頻信號(hào),并且 -利用頻率參數(shù)和音頻信號(hào)來(lái)產(chǎn)生相位參數(shù)。優(yōu)選地,所合成的音頻信號(hào)包括時(shí)間段,且相位產(chǎn)生步驟包括利 用音頻信號(hào)的前一時(shí)間段來(lái)產(chǎn)生當(dāng)前相位參數(shù)的子步驟。
特別優(yōu)選地,相位預(yù)測(cè)步驟包括確定一組相位/頻率對(duì)的子步驟, 每個(gè)相位/頻率對(duì)表示音頻信號(hào)一個(gè)頻率的相位。
相位預(yù)測(cè)步驟可以進(jìn)一步包括如下子步驟
-比較頻率參數(shù)和該組相位/頻率對(duì),并選擇最接近該頻率參數(shù)
的相位/頻率對(duì),并且
-利用頻率參數(shù)和所選擇的相位產(chǎn)生相位參數(shù)。 相位預(yù)測(cè)步驟可有利地進(jìn)一步包括響應(yīng)控制參數(shù)而修改頻率參數(shù)
的子步驟。
本發(fā)明還提供一種包括如上定義的正弦合成方法的頻率修改方 法,它包括響應(yīng)控制參數(shù)而修改頻率參數(shù),并接收輸入音頻信號(hào)及產(chǎn) 生頻率參數(shù)和相位參數(shù)的子步驟。
本發(fā)明進(jìn)一步提供一種語(yǔ)音變換方法,包括如下步驟 -響應(yīng)輸入語(yǔ)音信號(hào)而產(chǎn)生預(yù)測(cè)參數(shù)和殘余信號(hào), -適配殘余信號(hào)的音調(diào),從而產(chǎn)生音調(diào)適配的殘余信號(hào),并且 -響應(yīng)音調(diào)適配的殘余信號(hào)而合成輸出語(yǔ)音信號(hào), 其中該音調(diào)適配步驟包括如上定義的頻率<多改方法。 合成輸出語(yǔ)音信號(hào)的步驟可涉及音調(diào)適配的殘余信號(hào)和預(yù)測(cè)參 數(shù)。其它有利的方法步驟和/或子步驟將根據(jù)本發(fā)明在下面所提供的說(shuō) 明而變得顯而易見(jiàn)。
本發(fā)明附加地提供一種計(jì)算機(jī)程序產(chǎn)品,用于執(zhí)行如上定義的方 法。計(jì)算機(jī)程序產(chǎn)品可包括一組存儲(chǔ)在諸如CD或DVD的數(shù)據(jù)載體上的 計(jì)算機(jī)可執(zhí)行指令。允許可編程計(jì)算機(jī)執(zhí)行如上定義的方法的該組計(jì) 算機(jī)可執(zhí)行指令還可用于從遠(yuǎn)程服務(wù)器,例如經(jīng)由互聯(lián)網(wǎng)進(jìn)行下載。
結(jié)合附圖所示的典型實(shí)施例,本發(fā)明在下面將得到進(jìn)一步解釋?zhuān)?其中
圖1示意性示出了根據(jù)本發(fā)明的參數(shù)音頻信號(hào)修改系統(tǒng)。
圖2示意性示出了根據(jù)本發(fā)明的音頻信號(hào)頻率修改裝置的實(shí)施例。
圖3示意性地示出了根據(jù)本發(fā)明的頻率修改音頻信號(hào)編碼器/解碼器對(duì)。圖4示意性地示出了由圖3的音頻信號(hào)編碼器/解碼器對(duì)執(zhí)行的時(shí) 間縮放的第一個(gè)例子。
圖5示意性地示出了由圖3的音頻信號(hào)編碼器/解碼器對(duì)執(zhí)行的時(shí) 間縮放的第二個(gè)例子。
僅通過(guò)圖1中的非限制性例子所示出的參數(shù)音頻信號(hào)修改系統(tǒng)1 包括線性預(yù)測(cè)分析(LPA)單元10、音調(diào)適配(PA)單元20、線性預(yù) 測(cè)合成(LPS)單元30和修改(Mod)單元40。參數(shù)音頻信號(hào)修改系統(tǒng) 1的結(jié)構(gòu)本身是已知的,然而,在圖1所示的系統(tǒng)1中,音調(diào)適配單元 20具有新穎的設(shè)計(jì),這將在后面結(jié)合圖2-4進(jìn)行更詳細(xì)描述。
圖1的系統(tǒng)1接收音頻信號(hào)X,該音頻信號(hào)例如可以是話音(語(yǔ)音) 信號(hào)或音樂(lè)信號(hào),并輸出經(jīng)修改的音頻信號(hào)Y。信號(hào)X輸入到線性預(yù)測(cè) 分析單元10中,該線性預(yù)測(cè)分析單元10將該信號(hào)變換為(時(shí)變的) 預(yù)測(cè)參數(shù)p和殘余信號(hào)r的序列。為此,線性預(yù)測(cè)單元10包括適當(dāng)?shù)?線性預(yù)測(cè)分析濾波器。單元10產(chǎn)生的預(yù)測(cè)參數(shù)p是濾波參數(shù),在所示 包含在線性預(yù)測(cè)合成單元30中的線性預(yù)測(cè)合成濾波器的例子中,該濾 波參數(shù)允許適當(dāng)?shù)臑V波器響應(yīng)適當(dāng)?shù)募?lì)信號(hào)而充份地再現(xiàn)信號(hào)X。殘 余信號(hào)r (或者在任意的音調(diào)適配之后,經(jīng)修改的殘余信號(hào)r,)在這里 用作激勵(lì)信號(hào)。如上所示,線性預(yù)測(cè)分析濾波器和線性預(yù)測(cè)合成濾波 器對(duì)本領(lǐng)域技術(shù)人員來(lái)說(shuō)是公知的,不需要進(jìn)一步解釋。
音調(diào)適配(PA)單元20允許音頻信號(hào)X的音調(diào)(主頻)通過(guò)4奮改 殘余信號(hào)r并產(chǎn)生經(jīng)修改的殘佘信號(hào)r,而得到修改。信號(hào)X的其它參 數(shù)可以利用其它f多改單元40來(lái)修改,該其它修改單元40 ;故安排為用 于修改預(yù)測(cè)參數(shù)p并產(chǎn)生經(jīng)修改的預(yù)測(cè)參數(shù)P,。在本發(fā)明中,其它修 改單元40不是必需的,其可被省略。當(dāng)然,預(yù)測(cè)參數(shù)p應(yīng)饋送到線性 預(yù)測(cè)合成單元30,以便允許夠合成信號(hào)Y。
用于修改音頻信號(hào)頻率的裝置被示意性地示于圖2。裝置20可有 益地用作圖1系統(tǒng)中的音調(diào)適配單元,也可用在其它系統(tǒng)中。因此, 應(yīng)該明白,裝置2 0不僅可以應(yīng)用在利用線性預(yù)測(cè)分析和合成的系統(tǒng)中, 而且可以用作其中不使用線性預(yù)測(cè)分析和合成的音頻信號(hào)修改裝置和 /或系統(tǒng)中的獨(dú)立單元。
圖2所示的裝置20包括正弦分析(SiA)單元21、參數(shù)產(chǎn)生(PaP)單元22和正弦合成(SiS )單元23。注意到,正弦分析單元21和正弦 合成單元23與圖1所示的系統(tǒng)1的線性預(yù)測(cè)分析單元10和線性預(yù)測(cè) 合成單元30不同。
正弦分析單元21接收輸入音頻信號(hào)r。該信號(hào)可與圖1的殘余信 號(hào)r相同,但是不限于此。例如,圖2的輸入音頻信號(hào)r可以與圖1 的輸入音頻信號(hào)X相同,并且可以是話音(語(yǔ)音)或音樂(lè)信號(hào)。
正弦分析單元21分析輸入信號(hào)r,并產(chǎn)生一組信號(hào)參數(shù)頻率參 數(shù)f和幅度參數(shù)A。頻率參數(shù)f表示輸入信號(hào)r的正弦分量的頻率。在 一些實(shí)施例中,可以產(chǎn)生多個(gè)頻率參數(shù)f,,f2,f3,…,每個(gè)頻率參數(shù)表 示一個(gè)頻率。幅度參數(shù)A不是必需的,且可以省略(例如當(dāng)正弦合成 單元23中使用固定頻率時(shí))。然而,在典型實(shí)施例中,將使用幅度參 數(shù)A (或多個(gè)幅度參數(shù)At, A2, A3,…)。在優(yōu)選實(shí)施例中,正弦分析單元 21被安排為執(zhí)行快速傅立葉變換(FFT)來(lái)產(chǎn)生頻率和幅度參數(shù)。
參數(shù)產(chǎn)生單元22從正弦分析單元21接收頻率參數(shù)f,并利用(頻 率)控制參數(shù)C調(diào)整該頻率參數(shù)f。參數(shù)產(chǎn)生單元22例如可以包括乘 法單元,該乘法單元將頻率參數(shù)f與控制參數(shù)C相乘來(lái)產(chǎn)生經(jīng)修改的 頻率參數(shù)f,,其中f^C. f。如果,在該例子中,C等于l,則頻率參數(shù) 不被修改,如果C小于1,則頻率參數(shù)值減小,如果C大于l,則頻率 參數(shù)值增大。
根據(jù)本發(fā)明,參數(shù)產(chǎn)生單元22還接收合成信號(hào)r,并導(dǎo)出該信號(hào)的 相位,以便產(chǎn)生相位參數(shù)(J),。參數(shù)產(chǎn)生單元22將經(jīng)修改的頻率參數(shù)f, 和相位參數(shù)(J),饋送至正弦合成單元23,該單元也接收(可選的)幅度 參數(shù)A。利用這些參數(shù),正弦合成單元23合成輸出音頻信號(hào)r,。
在優(yōu)選實(shí)施例中,正弦合成單元23#皮安排用來(lái)實(shí)施逆快速傅立葉 變換(IFFT)或相似操作。后面將結(jié)合圖3來(lái)詳細(xì)解釋參數(shù)產(chǎn)生單元 22。
圖3示意性地示出了根據(jù)本發(fā)明的頻率修改音頻信號(hào)編碼器/解碼 器對(duì)。編碼器4和解碼器5被顯示為分離的裝置,盡管這些裝置可以 合并為一個(gè)裝置(圖2中的20)。
僅在圖3中通過(guò)非限制性例子進(jìn)行說(shuō)明的音頻信號(hào)編碼器4包括 分段(SEG)單元25、正弦分析(SiA)單元21、(第二)正弦合成(SiS,) 單元23,和最小均方誤差(MMSE)單元26。注意到,(附加的)正弦合成(SiS,)單元23,和最小均方誤差(MMSE)單元26不是必需的,可 以省略。進(jìn)一步注意到,正弦合成(SiS,)單元23,纟皮表示為第二正弦 合成單元,以便將該單元與解碼器5中的(第一)正弦合成(SiS)單 元23區(qū)分開(kāi)來(lái)。
僅在圖3中通過(guò)非限制性例子進(jìn)行說(shuō)明的音頻信號(hào)解碼器5包括 正弦分析(SiS)單元23、參數(shù)產(chǎn)生單元22、增益控制單元24和重疊 相加(0LA)和時(shí)間縮放(TS)單元25,。基本上對(duì)應(yīng)于圖2的參數(shù)產(chǎn) 生(PaP)單元22的參數(shù)產(chǎn)生單元22包括存儲(chǔ)器(M)單元29、(第 二)正弦分析(SiA,)單元21,、相位預(yù)測(cè)單元28和(可選的)頻率 縮放(FS)單元27。注意到在某些實(shí)施例中,頻率縮放(FS)單元27 可被刪除。進(jìn)一步注意到,正弦分析(SiA,)單元21,一皮表示為第二正 弦分析(SiA,)單元21,,以便將該單元與編碼器4中的(第一)正弦 分析(SiA)單元21區(qū)分開(kāi)來(lái)。
編碼器4接收(數(shù)字)音頻信號(hào)s,該信號(hào)可以是話音(語(yǔ)音)信 號(hào)、音樂(lè)信號(hào)或它們的組合。該音頻信號(hào)s被分段單元25劃分為部分 重疊的時(shí)間段(幀),以便產(chǎn)生分段的音頻信號(hào)r。分段單元25接收 (輸入)更新間隔參數(shù)updin,該參數(shù)指示連續(xù)時(shí)間段的時(shí)間間距。分 段的音頻信號(hào)r可以等于圖1、 2和3中的信號(hào)r,但不限于此。
優(yōu)選地被安排用于執(zhí)行快速傅立葉變換(FFT )的正弦分析單元21 產(chǎn)生至少一個(gè)頻率參數(shù)f,并且在所示實(shí)施例中,還產(chǎn)生至少一個(gè)幅度 參數(shù)A和至少一個(gè)相位參數(shù)(l)。頻率參數(shù)f和幅度參數(shù)A由編碼器4 輸出,而相位參數(shù)(J)在內(nèi)部使用。在所示的實(shí)施例中,相位參數(shù)cb被 饋送至(附加的)正弦分析單元23,,在那里它與參數(shù)f和A—起被用 于合成信號(hào)r"。理想地,除了任意的增益差異之外,該合成的信號(hào)r" 基本上與輸入音頻信號(hào)r相同。為了補(bǔ)償該增益差異,原始(分段的) 輸入音頻信號(hào)r和合成的音頻r"被饋送至比較單元,該比較單元在所 示實(shí)施例中由最小均方誤差(MMSE)單元26構(gòu)成。該單元確定輸入音 頻信號(hào)r與合成的音頻信號(hào)r"之間的最小均方誤差,并產(chǎn)生相應(yīng)的增 益信號(hào)G來(lái)補(bǔ)償任意的幅度差異。在某些實(shí)施例中,該幅度校正信息 可被包含在幅度參數(shù)A中或者可被忽略,這種情況下,單元23,和26 可以從編碼器4中省略,而增益控制單元24可以/人解碼器5中省略。
因此可以看出,編碼器4接收輸入音頻信號(hào)并將該信號(hào)轉(zhuǎn)換為表示該信號(hào)的一組參數(shù)f和A,以及附加參數(shù)G。該組參數(shù)利用任意合適 的手段或方法而被發(fā)送到解碼器5,例如經(jīng)由音頻系統(tǒng)導(dǎo)線、互聯(lián)網(wǎng)連 接、無(wú)線(例如藍(lán)牙⑧)連接或諸如CD、 DVD或記憶棒的數(shù)據(jù)載體。在 其它實(shí)施例中,編碼器4和解碼器5構(gòu)成單一的裝置(圖1、 2和3中 的20),且編碼器4和解碼器5之間的連接是所述單一裝置的內(nèi)部連 接。因此,解碼器5接收信號(hào)參數(shù)f和A,以及附加參數(shù)G和C。幅度 A被直接饋送到正弦合成單元23,該單元優(yōu)選地凈皮安排用于實(shí)現(xiàn)逆快 速傅立葉變換(IFFT),從而產(chǎn)生合成的信號(hào)r,-r,(n)??梢岳萌?下公式進(jìn)行合成r'(w) 二 sin(2;r. //'" + O , 其中k是信號(hào)中頻率分量的個(gè)數(shù)。參數(shù)f和C被饋送至參數(shù)產(chǎn)生單元22的頻率縮放單元27,而增益 補(bǔ)償參數(shù)G被饋送至增益控制(在本實(shí)施例中乘法)單元24。頻率縮放(FS)單元27利用控制參數(shù)C來(lái)調(diào)節(jié)(即縮放)頻率參 數(shù)f,例如通過(guò)乘以控制參數(shù)C和頻率參數(shù)f。這樣得到經(jīng)調(diào)節(jié)的(即 經(jīng)縮放的)頻率參數(shù)f,,該頻率參數(shù)被饋送至正弦合成單元23和相位 預(yù)測(cè)單元28。正弦合成單元23利用幅度參數(shù)A、頻率參數(shù)f和相位參數(shù)(J),(如 上所述,幅度參數(shù)A不是必需的,在某些實(shí)施例中可以省略)合成輸 出音頻信號(hào)r,。該合成的信號(hào)r,被饋送至增益控制單元24,該單元利 用增益參數(shù)G調(diào)節(jié)信號(hào)r,的幅度,并將已增益調(diào)節(jié)的信號(hào)饋送至重疊 相加(0LA )和時(shí)間縮放(TS )單元25,。該0LA/TS單元25,還接收(輸 出)更新間隔參數(shù)updout,該參數(shù)指示輸出信號(hào)時(shí)間段的重疊。利用 參數(shù)updout,部分重疊時(shí)間段的信號(hào)值一皮加入,從而產(chǎn)生輸出信號(hào)s,。根據(jù)本發(fā)明,由正弦合成單元23產(chǎn)生的合成的信號(hào)r,被饋送至存 儲(chǔ)器(M)或延遲單元29,在其中暫時(shí)存儲(chǔ)合成信號(hào)r,的最新近時(shí)間段。 該段然后^f皮饋送到(第二)正弦分析(SiA,)單元21,,該單元確定該 段的頻率加上它們相關(guān)聯(lián)的相位值。也就是說(shuō),正弦分析單元21,確定 該時(shí)間段的頻語(yǔ),例如利用FFT,然后為所有非零頻率值確定相位,并 最終輸出一組相位/頻率對(duì),每個(gè)對(duì)包括頻率及其相關(guān)聯(lián)的相位。單元21,因此產(chǎn)生一 (優(yōu)選的只是非零)頻率值的"網(wǎng)格,,,每個(gè)(非零) 頻率值具有一個(gè)相關(guān)聯(lián)的相位值。在某些實(shí)施例中,由于它們相關(guān)聯(lián) 的相位值由于舍入誤差而經(jīng)常相對(duì)地不精確,大于零的閾值可被用于 消除小的頻率值。由單元21,產(chǎn)生的該組相位/頻率對(duì)祐:饋送至相位預(yù)測(cè)單元28,它 將頻率參數(shù)f,與該組中的頻率進(jìn)行比較,并選擇與由參數(shù)f,表示的頻 率最匹配的相位/頻率對(duì)。然后利用如下公式補(bǔ)償所選擇對(duì)中的相位當(dāng) 前l(fā)殳與先前段之間的時(shí)間延遲,二 ^ + 2;r . ./A/ ,其中d),是已補(bǔ)償?shù)南辔粎?shù),小是所選擇的相位/頻率對(duì)的相位,f,是(可選地經(jīng)修改的)頻率參數(shù),且At是時(shí)間延遲。得到的已補(bǔ)償 的相位參數(shù)cj),然后被饋送到正弦合成單元23,以便合成信號(hào)r,的下一 時(shí)間段。因此可以看出,本發(fā)明的解碼器不使用前面討論的現(xiàn)有技術(shù)中的 鏈接器。正在合成的音頻信號(hào)的相位由前面合成的音頻信號(hào)的相位導(dǎo) 出,特別是由最后(即最新近)時(shí)間段的音頻信號(hào)導(dǎo)出。將會(huì)了解,如果不使用時(shí)間段,可以在相位預(yù)測(cè)單元28中使用其它時(shí)間延遲標(biāo)準(zhǔn),例如基于處理時(shí)間的標(biāo)準(zhǔn)。如杲裝置5被用作沒(méi)有頻率調(diào)節(jié)的解碼器,則可以省略頻移單元 27。如果編碼器4和解碼器5結(jié)合在包括頻移單元27的單一裝置中,則會(huì)帶來(lái)有益的頻率修改裝置。圖3中所示的編碼器裝置4和解碼器裝置5可以是個(gè)別地也可以 是組合地用于時(shí)間縮放。為此,上面提到的更新間隔參數(shù)updin和 updout可以被適當(dāng)?shù)匦薷?。在圖4中,輸入信號(hào)(例如圖3中的信號(hào)s)表示在時(shí)間軸I上, 而相對(duì)應(yīng)的輸出信號(hào)(例如圖3中的信號(hào)s,)被表示在時(shí)間軸II上。 該信號(hào)在圖4中示意性地用窗A和B來(lái)表示,為了方便表示為三角形, 但是可具有任意適當(dāng)?shù)男螤?,例如高斯或余弦形。每個(gè)窗捕獲到其長(zhǎng) 度等于參數(shù)seglen的信號(hào)時(shí)間段。在分段過(guò)程中,在分段單元(圖3 的25)中,窗A的間距由參數(shù)updin確定。相似地,在OLA單元(圖 3中的25,)中的重疊相加過(guò)程中,窗B的間距由參數(shù)updout確定。通 過(guò)選擇updout大于updin,信號(hào)s被擴(kuò)展,如圖4所示。在圖5中,情況相反,參數(shù)updout被選擇為小于updin,造成信 號(hào)的壓縮(即時(shí)間壓縮)。因此可以看出,通過(guò)適當(dāng)?shù)男薷膮?shù)updin 和updout,可以實(shí)現(xiàn)時(shí)間縮方文。本發(fā)明是基于這樣的見(jiàn)識(shí),即當(dāng)合成音頻信號(hào)時(shí),要被合成的信 號(hào)的相位可以有益地從已經(jīng)被合成的音頻信號(hào),即新近的(或優(yōu)選最 近的)被合成的信號(hào)中導(dǎo)出。這樣得到基本上沒(méi)有不連續(xù)性的相位。 本發(fā)明得益于進(jìn)一步的見(jiàn)識(shí),即由所合成的音頻信號(hào)中導(dǎo)出的相位可 以利用要被合成的信號(hào)的頻率來(lái)調(diào)節(jié),并且,調(diào)節(jié)該頻率可以實(shí)現(xiàn)一 種提供受頻率調(diào)節(jié)的信號(hào)的方便的方法。范圍。特別地,詞語(yǔ)"包括"、和口"包含"、;意味著排除沒(méi)有特別提到 的任何元素。單一 (電路)元件可以用多個(gè)(電路)元件或它們的等 價(jià)物來(lái)代替。本領(lǐng)域技術(shù)人員將會(huì)明白,本發(fā)明不限制在上述實(shí)施例中,在不 脫離后附權(quán)利要求中所定義的本發(fā)明保護(hù)范圍的情況下,可以作出很 多》務(wù)改和添加。
權(quán)利要求
1、一種用于合成音頻信號(hào)(r’)的信號(hào)合成裝置(20),該裝置包括-正弦合成單元(23),用于利用至少一個(gè)表示音頻信號(hào)頻率的頻率參數(shù)(f’)和至少一個(gè)表示音頻信號(hào)相位的相位參數(shù)(φ’)來(lái)合成音頻信號(hào)(r’),以及-參數(shù)產(chǎn)生單元(22),用于利用頻率參數(shù)(f)和音頻信號(hào)(r’)來(lái)產(chǎn)生相位參數(shù)(φ’)。
2、 根據(jù)權(quán)利要求1所述的裝置,其中所合成的音頻信號(hào)(r,)包 括時(shí)間段,并且其中參數(shù)產(chǎn)生單元(22 )被安排用于利用音頻信號(hào)(r,) 的先前時(shí)間段來(lái)產(chǎn)生當(dāng)前的相位參數(shù)(c|),)。
3、 根據(jù)權(quán)利要求1所述的裝置,其中參數(shù)產(chǎn)生單元(22)包括相 位確定單元(21,),該相位確定單元被安排用于確定一組相位/頻率對(duì), 每個(gè)相位/頻率對(duì)表示音頻信號(hào)(r,) 一個(gè)頻率的相位。
4、 根據(jù)權(quán)利要求3所述的裝置,其中參數(shù)產(chǎn)生單元(22)進(jìn)一步 包括相位預(yù)測(cè)單元(28),該相位預(yù)測(cè)單元一皮安排用于一 將頻率參數(shù)(f,f,)與該組相位/頻率對(duì)進(jìn)行比較,并選擇最接近 該頻率參數(shù)(f,)的相位/頻率對(duì),并且- 利用頻率參數(shù)(f,)和所選擇的相位產(chǎn)生相位參數(shù)((J),)。
5、 根據(jù)權(quán)利要求1所述的裝置,其中參數(shù)產(chǎn)生單元(22)包括頻 率修改單元(27),該頻率修改單元用于響應(yīng)控制參數(shù)(C)而修改頻 率參數(shù)(f )。
6、 根據(jù)權(quán)利要求l所述的裝置,其中正弦合成單元(23)附加地 利用幅度參數(shù)(A)。
7、 根據(jù)權(quán)利要求1所述的裝置,進(jìn)一步包括增益控制單元(24), 用于將所合成的音頻信號(hào)(r,)乘以增益參數(shù)(G)。
8、 根據(jù)權(quán)利要求1所述的裝置,進(jìn)一步包括正弦分析單元(21 ), 該正弦分析單元用于接收輸入音頻信號(hào)(r),并產(chǎn)生頻率參數(shù)(f,) 和相位參數(shù)(cj),)。
9、 根據(jù)權(quán)利要求8所述的裝置,進(jìn)一步包括- 用于產(chǎn)生所合成的音頻信號(hào)的另一個(gè)正弦合成單元(23,),和- 用于將所合成的音頻信號(hào)與輸入音頻信號(hào)進(jìn)行比較,從而產(chǎn)生增益參數(shù)(G)的比較單元(26)。
10、根據(jù)權(quán)利要求2所述的裝置,進(jìn)一步包括分段單元(25), 該分段單元用于將音頻信號(hào)(r)劃分為時(shí)間段。
11、根據(jù)權(quán)利要求2所述的裝置,進(jìn)一步包括重疊相加單元(25,), 該重疊相加單元將所合成的音頻信號(hào)(r,)的時(shí)間段連接起來(lái)。
12、 根據(jù)權(quán)利要求10或11所述的裝置,其中分段單元(25)由 第一重疊參數(shù)(叩din)控制,而其中重疊相加單元(25,)由第二重 疊參數(shù)(updout)控制,并且其中該裝置被安排為通過(guò)改變重疊參數(shù)(updin, updout )進(jìn)行時(shí)間縮放。
13、 一種語(yǔ)音變換裝置(]),包括- 線性預(yù)測(cè)分析單元(10),用于響應(yīng)輸入語(yǔ)音信號(hào)(x)而產(chǎn)生預(yù) 測(cè)參數(shù)(P)和殘余信號(hào)(r),- 音調(diào)適配單元(20),用于適配殘余信號(hào)(r)的音調(diào),從而產(chǎn)生 音調(diào)適配的殘余信號(hào)(r,),和- 線性預(yù)測(cè)合成單元(30),用于響應(yīng)該音調(diào)適配的殘余信號(hào)(r,) 而合成輸出語(yǔ)音信號(hào)(y ),其中該音調(diào)適配單元(20)包括根據(jù)權(quán)利要求5所述的裝置。
14、 根據(jù)權(quán)利要求13所述的語(yǔ)音變換裝置,進(jìn)一步包括用于修改 預(yù)測(cè)參數(shù)的修改單元(40)。
15、 一種音頻系統(tǒng),包括根據(jù)權(quán)利要求1所述的裝置。
16、 一種音頻信號(hào)解碼器(5),包括- 正弦合成單元(23),用于利用至少一個(gè)表示音頻信號(hào)頻率的頻 率參數(shù)(f,)和至少一個(gè)表示音頻信號(hào)相位的相位參數(shù)(Cj),)來(lái)合成 音頻信號(hào)(r,),以及- 參數(shù)產(chǎn)生單元(22),用于利用頻率參數(shù)(f)和音頻信號(hào)(r,) 來(lái)產(chǎn)生相位參數(shù)(小,)。
17、 一種合成音頻信號(hào)(r,)的方法,該方法包括如下步驟- 利用至少一個(gè)表示音頻信號(hào)頻率的頻率參數(shù)(f, f,)和至少一個(gè)表 示音頻信號(hào)相位的相位參數(shù)(d),)來(lái)合成音頻信號(hào)(r,),以及- 利用頻率參數(shù)(f,f,)和音頻信號(hào)(r,)來(lái)產(chǎn)生相位參數(shù)(小,)。
18、 根據(jù)權(quán)利要求17所述的方法,其中所合成的音頻信號(hào)(r,) 包括時(shí)間段,并且其中參數(shù)產(chǎn)生單元(22)被安排用于利用音頻信號(hào)(r,)的先前時(shí)間段來(lái)產(chǎn)生當(dāng)前的相位參數(shù)(cb,)。
19、 根據(jù)權(quán)利要求17所述的方法,其中相位預(yù)測(cè)步驟包括確定一 組相位/頻率對(duì)的子步驟,每個(gè)相位/頻率對(duì)表示音頻信號(hào)(r,) 一個(gè)頻 率的相位。
20、 根據(jù)權(quán)利要求17所述的方法,其中相位預(yù)測(cè)步驟進(jìn)一步包括 如下子步驟一 將頻率參數(shù)(f,)與該組相位/頻率對(duì)進(jìn)4于比4交,并選擇最接近該 頻率參數(shù)(f,)的相位/頻率對(duì),并且- 利用頻率參數(shù)(f,)和所選擇的相位產(chǎn)生相位參數(shù)(d),)。
21、 根據(jù)權(quán)利要求17所述的方法,其中相位預(yù)測(cè)步驟包括響應(yīng)控 制參數(shù)(C)而修改頻率參數(shù)(f,)的子步驟。
22、 一種語(yǔ)音變換方法,包括如下步驟- 響應(yīng)輸入語(yǔ)音信號(hào)(x)而產(chǎn)生預(yù)測(cè)參數(shù)(p)和殘余信號(hào)(r),- 適配殘余信號(hào)(r)的音調(diào),從而產(chǎn)生音調(diào)適配的殘余信號(hào)(r,), 和- 響應(yīng)該音調(diào)適配的殘余信號(hào)(r,)而合成輸出語(yǔ)音信號(hào)(y), 其中音調(diào)適配步驟包括根據(jù)權(quán)利要求21改變音頻信號(hào)頻率的子步驟。
23、 根據(jù)權(quán)利要求17或22的方法,進(jìn)一步包括時(shí)間縮放的步驟。
24、 一種計(jì)算機(jī)程序產(chǎn)品,用于執(zhí)行根據(jù)權(quán)利要求l7或22所述 的方法。
全文摘要
一種改變諸如語(yǔ)音信號(hào)的音頻信號(hào)(r)音調(diào)的裝置(2),包括正弦分析單元(21),用于確定音頻信號(hào)(r)的正弦參數(shù);參數(shù)產(chǎn)生單元(22),用于預(yù)測(cè)正弦分量的相位;以及正弦合成單元(23),用于合成參數(shù)來(lái)產(chǎn)生重建的信號(hào)(r’)。參數(shù)產(chǎn)生單元(22)為音頻信號(hào)的每個(gè)時(shí)間段接收先前時(shí)間段的相位,以便預(yù)測(cè)當(dāng)前時(shí)間段的相位。
文檔編號(hào)G10L21/00GK101223581SQ200680025590
公開(kāi)日2008年7月16日 申請(qǐng)日期2006年7月6日 優(yōu)先權(quán)日2005年7月14日
發(fā)明者A·C·登布林克, R·J·斯盧伊特 申請(qǐng)人:皇家飛利浦電子股份有限公司