專利名稱:語(yǔ)音信號(hào)修復(fù)方法和裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及通信技術(shù)領(lǐng)域,更具體地說(shuō),涉及一種語(yǔ)音信號(hào)修復(fù)方法和裝置。
背景技術(shù):
隨著無(wú)線網(wǎng)絡(luò)技術(shù)的飛速發(fā)展,以及網(wǎng)絡(luò)傳輸質(zhì)量的不斷提高,相比傳統(tǒng)的有線 網(wǎng)絡(luò),無(wú)線網(wǎng)絡(luò)在便捷性和移動(dòng)性方面已經(jīng)表現(xiàn)出了相當(dāng)巨大的優(yōu)勢(shì)。同時(shí),基于無(wú)線網(wǎng)絡(luò) 的各種應(yīng)用也迅速發(fā)展起來(lái),而基于無(wú)線網(wǎng)絡(luò)的VoIP(Voice over IP)技術(shù)便是其中之一。 VoIP指的是利用IP網(wǎng)絡(luò)進(jìn)行話音傳輸,由于在分組網(wǎng)絡(luò)中語(yǔ)音傳輸可以很容易地與其它 業(yè)務(wù)結(jié)合,實(shí)現(xiàn)多媒體通信,并且以分組形式傳輸?shù)恼Z(yǔ)音信息利用了互聯(lián)網(wǎng)低成本的特定, 使其費(fèi)用通常比傳統(tǒng)的電話網(wǎng)傳輸要低,因此,受到了廣大用戶的歡迎。但由于無(wú)線網(wǎng)絡(luò)本身的不穩(wěn)定性,導(dǎo)致基于無(wú)線網(wǎng)絡(luò)的VoIP語(yǔ)音包的傳輸面臨 著大量的丟包情況,而當(dāng)VoIP業(yè)務(wù)的丟包率超過(guò)了 5%,就會(huì)對(duì)語(yǔ)音通信質(zhì)量產(chǎn)生比較明 顯的影響,而在前向糾錯(cuò)已無(wú)法產(chǎn)生作用的時(shí)候,就需要依靠接收端通過(guò)一系列的丟包恢 復(fù)技術(shù)來(lái)抵消無(wú)線網(wǎng)絡(luò)大量丟包對(duì)語(yǔ)音通信質(zhì)量造成的不良影響。其中,丟包恢復(fù)技術(shù)屬于丟包處理技術(shù)的一種,它指的是在已經(jīng)發(fā)生了丟包的情 況下,采用隱藏丟包技術(shù),使人主觀上產(chǎn)生一種并沒(méi)有丟包的感覺(jué)的技術(shù)。對(duì)于語(yǔ)音信號(hào)來(lái) 說(shuō),丟包恢復(fù)技術(shù)主要是利用了人類在聽(tīng)到不完整波形的時(shí)候的一種下意識(shí)的修復(fù)能力, 在對(duì)收到的波形進(jìn)行一定的改動(dòng)之后,可以在相當(dāng)大的程度上減輕丟包對(duì)人產(chǎn)生的主要影 響,讓接收端的人耳感官上認(rèn)為并沒(méi)有丟包或者丟包并不是特別嚴(yán)重。在現(xiàn)有技術(shù)中,通常采用波形相似疊加(WSOLA)方法來(lái)進(jìn)行語(yǔ)音信號(hào)的丟包恢 復(fù)。WSOLA方法是一種在語(yǔ)音處理領(lǐng)域常用的時(shí)域拉伸方法,它是在基于語(yǔ)音波形相似性的 前提下工作,可以保證主觀質(zhì)量的前提下改變語(yǔ)音信號(hào)的長(zhǎng)度。其實(shí)現(xiàn)過(guò)程為當(dāng)接收端探 測(cè)到有一個(gè)語(yǔ)音幀由于傳輸環(huán)境影響被丟棄以后,就可以利用WSOLA方法將丟失的幀之前 接收到的幾個(gè)完好的語(yǔ)音幀進(jìn)行時(shí)域拉伸,使拉伸后的語(yǔ)音數(shù)據(jù)長(zhǎng)度覆蓋過(guò)丟失了的語(yǔ)音 幀的位置,使得接收端的人耳聽(tīng)起來(lái)就好像沒(méi)有丟包一樣。在實(shí)現(xiàn)本發(fā)明創(chuàng)造的過(guò)程中,發(fā)明人發(fā)現(xiàn),上述方法至少存在以下問(wèn)題傳統(tǒng)的 WSOLA方法可能導(dǎo)致拉伸生成的語(yǔ)音信號(hào)幅度趨勢(shì)同原音信號(hào)差距較大,而且容易在新生 成的信號(hào)中造成幅度突變,從而降低了語(yǔ)音的質(zhì)量。
發(fā)明內(nèi)容
本發(fā)明實(shí)施例提供一種語(yǔ)音信號(hào)修復(fù)方法和裝置,使在對(duì)語(yǔ)音信號(hào)進(jìn)行恢復(fù)時(shí), 新生成的語(yǔ)音信號(hào)幅度趨勢(shì)更加接近于原語(yǔ)音信號(hào),相應(yīng)提高了語(yǔ)音質(zhì)量。本發(fā)明實(shí)施例提供一種語(yǔ)音信號(hào)修復(fù)方法,包括將與丟失語(yǔ)音幀相鄰近的語(yǔ)音幀在時(shí)域范圍內(nèi)進(jìn)行拆分,生成多個(gè)語(yǔ)音段;分別為所述語(yǔ)音段引入系數(shù);將引入系數(shù)的語(yǔ)音段分別與一個(gè)與自身長(zhǎng)度相同的漢寧窗進(jìn)行相乘,得出最終語(yǔ)
4音段;將所述最終語(yǔ)音段進(jìn)行疊加,以覆蓋所述丟失語(yǔ)音幀所處的區(qū)域。本發(fā)明實(shí)施例提供了一種語(yǔ)音信號(hào)修復(fù)裝置,包括語(yǔ)音段生成單元,用于將與丟失語(yǔ)音幀相鄰近的語(yǔ)音幀在時(shí)域范圍內(nèi)進(jìn)行拆分, 生成多個(gè)語(yǔ)音段;系數(shù)引入單元,用于分別為所述語(yǔ)音段生成單元中生成的所述語(yǔ)音段引入系數(shù);漢寧窗引入單元,用于將引入系數(shù)的語(yǔ)音段分別與一個(gè)與自身長(zhǎng)度相同的漢寧窗 進(jìn)行相乘,得出最終語(yǔ)音段;語(yǔ)音段疊加單元,用于將所述最終語(yǔ)音段進(jìn)行疊加,以覆蓋所述丟失語(yǔ)音幀所處 的區(qū)域。本發(fā)明實(shí)施例通過(guò)對(duì)原語(yǔ)音幀進(jìn)行拆分,生成語(yǔ)音段,并為新生成的語(yǔ)音段引入 一個(gè)系數(shù),將引入系數(shù)的語(yǔ)音段與漢寧窗相乘得出最終語(yǔ)音段,將所述最終語(yǔ)音段進(jìn)行疊 加以覆蓋丟失語(yǔ)音幀所處的區(qū)域的技術(shù)手段,使疊加后的波形能夠更大程度上地恢復(fù)原語(yǔ) 音信號(hào)的幅值,從而提高語(yǔ)音質(zhì)量。
為了更清楚地說(shuō)明本發(fā)明實(shí)施例中的技術(shù)方案,下面將對(duì)實(shí)施例中所需要使用的 附圖作簡(jiǎn)單地介紹,顯而易見(jiàn)地,下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例,對(duì)于本領(lǐng) 域普通技術(shù)人員來(lái)講,在不付出創(chuàng)造性勞動(dòng)性的前提下,還可以根據(jù)這些附圖獲得其他的 附圖。圖1為本發(fā)明實(shí)施例所涉及的一種語(yǔ)音信號(hào)修復(fù)方法的流程圖;圖2為本發(fā)明實(shí)施例所涉及的另一種語(yǔ)音信號(hào)修復(fù)方法的流程圖;圖3為本發(fā)明實(shí)施例所涉及的第三種語(yǔ)音信號(hào)修復(fù)方法的流程圖;圖4為本發(fā)明實(shí)施例所涉及的一種語(yǔ)音信號(hào)修復(fù)裝置的結(jié)構(gòu)示意圖;圖5為本發(fā)明實(shí)施例所涉及的另一種語(yǔ)音信號(hào)修復(fù)裝置的結(jié)構(gòu)示意圖;圖6為本發(fā)明實(shí)施例所涉及的一種異常期判斷單元的結(jié)構(gòu)示意圖;圖7為本發(fā)明實(shí)施例所涉及的另一種異常期判斷單元的結(jié)構(gòu)示意圖;圖8為本發(fā)明實(shí)施例所涉及的一種系數(shù)引入單元的結(jié)構(gòu)示意圖;圖9為本發(fā)明實(shí)施例所涉及的另一種系數(shù)引入單元的結(jié)構(gòu)示意圖;圖10為本發(fā)明實(shí)施例所涉及的一種語(yǔ)音信號(hào)修復(fù)的方法的流程圖。
具體實(shí)施例方式下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完 整地描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例?;?本發(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒(méi)有做出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他 實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。在現(xiàn)有技術(shù)中,在對(duì)已損壞或丟失的語(yǔ)音幀進(jìn)行修復(fù)時(shí),是在保證主觀質(zhì)量的前 提下改變語(yǔ)音信號(hào)的長(zhǎng)度,但由于在這個(gè)過(guò)程中,由于只考慮到了保持語(yǔ)音基音頻率的穩(wěn) 定以及重疊語(yǔ)音的相位一致,未考慮生成語(yǔ)音波形與原波形在幅度上的一致,因此會(huì)導(dǎo)致修復(fù)后的語(yǔ)音質(zhì)量較低。本發(fā)明實(shí)施例提供了一種語(yǔ)音信號(hào)修復(fù)方法,具體流程如圖1所示步驟101 將與丟失語(yǔ)音幀相鄰近的語(yǔ)音幀在時(shí)域范圍內(nèi)進(jìn)行拆分,生成多個(gè)語(yǔ) 音段;步驟102 分別為所述語(yǔ)音段引入系數(shù);步驟103 將引入系數(shù)的語(yǔ)音段分別與一個(gè)與自身長(zhǎng)度相同的漢寧窗進(jìn)行相乘, 得出最終語(yǔ)音段;步驟104 將所述最終語(yǔ)音段進(jìn)行疊加,以覆蓋所述丟失的語(yǔ)音幀所處的區(qū)域。本實(shí)施例所提供的一種語(yǔ)音信號(hào)修復(fù)方法,通過(guò)對(duì)原語(yǔ)音幀進(jìn)行拆分,生成語(yǔ)音 段,并為新生成的語(yǔ)音段引入一個(gè)系數(shù),使疊加后的波形能夠更大程度上地恢復(fù)原語(yǔ)音信 號(hào)的幅值,從而提高語(yǔ)音質(zhì)量。同時(shí),本發(fā)明實(shí)施例還提供了另外一種語(yǔ)音信號(hào)修復(fù)方法,具體流程如圖2所示步驟201 將與丟失語(yǔ)音幀相鄰近的語(yǔ)音幀在時(shí)域范圍內(nèi)進(jìn)行拆分,生成多個(gè)語(yǔ) 音段;在步驟201中,將該丟失的語(yǔ)音幀鄰近的幾個(gè)完整語(yǔ)音幀進(jìn)行拆分,生成語(yǔ)音段, 在這個(gè)過(guò)程中,首先要確定所要使用的語(yǔ)音幀和丟失語(yǔ)音幀的總長(zhǎng)度,此處將該長(zhǎng)度稱為 語(yǔ)音幀總長(zhǎng)度,該長(zhǎng)度決定了語(yǔ)音段進(jìn)行疊加放置后所形成波形的總長(zhǎng)度。在進(jìn)行拆分所 生成語(yǔ)音段的長(zhǎng)度和該語(yǔ)音段將要放置的位置的確定過(guò)程中,可以有多種方式,而這些方 式需要滿足的條件是相鄰語(yǔ)音段之間必須進(jìn)行疊加,其目的是為了保證在將語(yǔ)音段進(jìn)行放 置后,各波段之間能有一個(gè)平滑過(guò)度。為便于實(shí)際應(yīng)用技術(shù)方案的實(shí)現(xiàn),可以預(yù)先設(shè)定語(yǔ)音 段的個(gè)數(shù),并將語(yǔ)音段的長(zhǎng)度取為相同,同時(shí)使相鄰兩個(gè)語(yǔ)音段之間相互重疊一半,從而可 以根據(jù)上述幾個(gè)條件求得生成語(yǔ)音段的長(zhǎng)度。在語(yǔ)音段的個(gè)數(shù)、長(zhǎng)度以及相互之間的疊加關(guān)系均確定以后,需要將語(yǔ)音段從原 語(yǔ)音幀上進(jìn)行拆分,該過(guò)程可以通過(guò)如下方式進(jìn)行從原語(yǔ)音幀的起始處取與語(yǔ)音段長(zhǎng)度相同的一段作為第1個(gè)語(yǔ)音段,并將該語(yǔ)音 段放置于語(yǔ)音幀總長(zhǎng)度的起始處。在選取第2個(gè)語(yǔ)音段時(shí),首先為該語(yǔ)音段的起始位置選取一個(gè)范圍,使該語(yǔ)音段 在該范圍內(nèi)進(jìn)行選取時(shí)與第1個(gè)語(yǔ)音段進(jìn)行疊加時(shí)能滿足相關(guān)性最大,即與第1個(gè)語(yǔ)音段 進(jìn)行疊加時(shí)能夠盡可能地相位保持一致。同理,可以進(jìn)行后面所有語(yǔ)音段的選取。步驟202 分別為所述語(yǔ)音段引入增益因子;步驟202的目的是為了使語(yǔ)音段進(jìn)行疊加后所形成的新的波形與原語(yǔ)音波形在 幅度上盡量相同。其中,該處引入的增益因子可以為該語(yǔ)音段將要疊加位置的原語(yǔ)音波形 的平均幅值和該語(yǔ)音段本身的平均幅值的比值。這樣,在語(yǔ)音段與該增益因子相乘后,可以 在疊加時(shí)盡量在幅度上和原語(yǔ)音波形保持一致。步驟203 將引入增益因子的語(yǔ)音段分別與一個(gè)與自身長(zhǎng)度相同的漢寧窗進(jìn)行相 乘,得出最終語(yǔ)音段;由于在進(jìn)行語(yǔ)音段的疊加過(guò)程中,語(yǔ)音段的重疊必然導(dǎo)致疊加后的語(yǔ)音幅度的增 加,因此,需要對(duì)參與疊加的每個(gè)語(yǔ)音段施加一個(gè)漢寧窗,即參與疊加的每個(gè)語(yǔ)音段分別與一個(gè)與自身長(zhǎng)度相同的漢寧窗相乘,這樣,在語(yǔ)音段的疊加部分會(huì)有一個(gè)變化的衰減,并且 該衰減可以確保疊加部分的最終幅度不至于過(guò)大。步驟204 將所述最終語(yǔ)音段進(jìn)行疊加,以覆蓋所述丟失的語(yǔ)音幀所處的區(qū)域。在得到最終的語(yǔ)音段之后,根據(jù)之前所確定的各個(gè)語(yǔ)音段的放置位置,將最終得 到的語(yǔ)音段放置于對(duì)應(yīng)位置,以覆蓋所述丟失的語(yǔ)音幀所處的區(qū)域。本實(shí)施例所提供的一種語(yǔ)音信號(hào)修復(fù)方法,通過(guò)對(duì)原語(yǔ)音幀進(jìn)行拆分,生成多個(gè) 語(yǔ)音段,并分別為新生成的語(yǔ)音段引入相應(yīng)的增益因子,使疊加后的波形能夠更大程度上 地恢復(fù)原語(yǔ)音信號(hào)的幅值,從而提高語(yǔ)音質(zhì)量。相應(yīng)地,本發(fā)明實(shí)施例還提供了第三種語(yǔ)音信號(hào)修復(fù)方法,具體流程如圖3所示步驟301 將與丟失語(yǔ)音幀相鄰近的語(yǔ)音幀在時(shí)域范圍內(nèi)進(jìn)行拆分,生成多個(gè)語(yǔ) 音段;在步驟301中,將該丟失的語(yǔ)音幀鄰近的幾個(gè)完整語(yǔ)音幀進(jìn)行拆分,生成語(yǔ)音段, 在這個(gè)過(guò)程中,首先要確定所要使用的語(yǔ)音幀和丟失語(yǔ)音幀的總長(zhǎng)度,此處將該長(zhǎng)度稱為 語(yǔ)音幀總長(zhǎng)度,該長(zhǎng)度決定了語(yǔ)音段進(jìn)行疊加放置后所形成波形的總長(zhǎng)度。在進(jìn)行拆分所 生成語(yǔ)音段的長(zhǎng)度和該語(yǔ)音段將要放置的位置的確定過(guò)程中,可以有多種方式,而這些方 式需要滿足的條件是相鄰語(yǔ)音段之間必須進(jìn)行疊加,其目的是為了保證在將語(yǔ)音段進(jìn)行放 置后,各波段之間能有一個(gè)平滑過(guò)度。為便于實(shí)際應(yīng)用技術(shù)方案的實(shí)現(xiàn),可以預(yù)先設(shè)定語(yǔ)音 段的個(gè)數(shù),并將語(yǔ)音段的長(zhǎng)度取為相同,同時(shí)使相鄰兩個(gè)語(yǔ)音段之間相互重疊一半,從而可 以根據(jù)上述幾個(gè)條件求得生成語(yǔ)音段的長(zhǎng)度。在語(yǔ)音段的個(gè)數(shù)、長(zhǎng)度以及相互之間的疊加關(guān)系均確定以后,需要將語(yǔ)音段從原 語(yǔ)音幀上進(jìn)行拆分,該過(guò)程可以通過(guò)如下方式進(jìn)行從原語(yǔ)音幀的起始處取與語(yǔ)音段長(zhǎng)度相同的一段作為第1個(gè)語(yǔ)音段,并將該語(yǔ)音 段放置于語(yǔ)音幀總長(zhǎng)度的起始處。在選取第2個(gè)語(yǔ)音段時(shí),首先為該語(yǔ)音段的起始位置選取一個(gè)范圍,使該語(yǔ)音段 在該范圍內(nèi)進(jìn)行選取時(shí)與第1個(gè)語(yǔ)音段進(jìn)行疊加時(shí)能滿足相關(guān)性最大,即與第1個(gè)語(yǔ)音段 進(jìn)行疊加時(shí)能夠盡可能地相位保持一致。同理,可以進(jìn)行后面所有語(yǔ)音段的選取。步驟302 判斷語(yǔ)音段是否處于語(yǔ)音異常期;在步驟302中,由于生成的多個(gè)語(yǔ)音段有可能會(huì)處于語(yǔ)音異常期,如語(yǔ)音轉(zhuǎn)換期 或白噪聲期等,其中,語(yǔ)音轉(zhuǎn)換期可以理解為當(dāng)任意長(zhǎng)度的一段語(yǔ)音幅度變化較頻繁,并 且有很多的語(yǔ)音幅度為零值。從而需要對(duì)所生成的語(yǔ)音段分別判斷其是否處于語(yǔ)音異常 期。在本實(shí)施例中,可以采用如下兩種方法實(shí)現(xiàn)對(duì)語(yǔ)音段是否處于語(yǔ)音異常期的判斷方法一計(jì)算語(yǔ)音段將要疊加位置的原語(yǔ)音波形的能量和語(yǔ)音段本身能量的,如 果兩者相差過(guò)大,則可以認(rèn)為該語(yǔ)音段處于語(yǔ)音異常期,換一種說(shuō)法為如果語(yǔ)音段將要疊 加位置的原語(yǔ)音波形的能量和語(yǔ)音段本身能量的該比值近似等于1,認(rèn)為該語(yǔ)音段未處于 語(yǔ)音異常期;否則,認(rèn)為處于語(yǔ)音異常期。方法二 在語(yǔ)音段與其他語(yǔ)音段進(jìn)行疊加放置時(shí),計(jì)算該語(yǔ)音段的疊加部分的相 關(guān)性,當(dāng)該相關(guān)性大于預(yù)先設(shè)定的閾值時(shí),表示該語(yǔ)音段未處于語(yǔ)音異常期;否則,表示新 語(yǔ)音段處于語(yǔ)音異常期。在本方法中,如果計(jì)算得出的相關(guān)性小于設(shè)定的閾值,表明該語(yǔ)音段很難與其他語(yǔ)音段進(jìn)行疊加時(shí)實(shí)現(xiàn)相位上的一致,則可以認(rèn)為該語(yǔ)音段處于語(yǔ)音異常 期。步驟303 根據(jù)判斷結(jié)果分別為語(yǔ)音段引入相應(yīng)的系數(shù);步驟303的目的是為了防止在新語(yǔ)音段進(jìn)行疊加放置后所形成的新的波形與原 語(yǔ)音波形在幅度上存在過(guò)大差距。在步驟302中,分別對(duì)生成的語(yǔ)音段進(jìn)行語(yǔ)音異常期的判斷后,根據(jù)判斷結(jié)果為 語(yǔ)音段引入相應(yīng)系數(shù)對(duì)于未處于語(yǔ)音異常期的語(yǔ)音段,為其引入增益因子;而對(duì)于處于 語(yǔ)音異常期的語(yǔ)音段,相應(yīng)為其引入一個(gè)預(yù)先設(shè)定的因數(shù)。其中,增益因子的計(jì)算方法前面已做過(guò)介紹,在此不做贅述;而預(yù)先設(shè)定的因數(shù)則 可以根據(jù)統(tǒng)計(jì)結(jié)果和當(dāng)前網(wǎng)絡(luò)的傳輸狀況來(lái)得到,例如,將該傳輸網(wǎng)絡(luò)之前長(zhǎng)時(shí)間的傳輸 狀況進(jìn)行統(tǒng)計(jì)分析,依據(jù)以往數(shù)據(jù)設(shè)定一個(gè)值,也可以只考慮當(dāng)前網(wǎng)絡(luò)的傳輸狀況設(shè)定一 個(gè)值,通常情況下,網(wǎng)絡(luò)傳輸狀況較差時(shí),易發(fā)生語(yǔ)音處于異常期的情況,則相應(yīng)地,語(yǔ)音段 需要一個(gè)較大的衰減,則所設(shè)定的因數(shù)要較小?;旧?,該處所設(shè)定的因數(shù)都為一個(gè)小于或 等于1的正數(shù)。需要說(shuō)明的是,也可以先對(duì)所有語(yǔ)音段進(jìn)行增益因子的計(jì)算,再進(jìn)行語(yǔ)音異常期 的判斷,并根據(jù)語(yǔ)音異常期的判斷結(jié)果,決定所計(jì)算出的增益因子是否被采用。在這里,這 兩步的具體順序不做特殊要求。步驟304:將引入系數(shù)的語(yǔ)音段分別與一個(gè)與自身長(zhǎng)度相同的漢寧窗進(jìn)行相乘, 得出最終語(yǔ)音段;由于在進(jìn)行語(yǔ)音段的疊加過(guò)程中,語(yǔ)音段的重疊必然導(dǎo)致疊加后的語(yǔ)音幅度的增 加,因此,需要對(duì)參與疊加的每個(gè)語(yǔ)音段施加一個(gè)漢寧窗,即參與疊加的每個(gè)語(yǔ)音段分別與 一個(gè)與自身長(zhǎng)度相同的漢寧窗相乘,這樣,在語(yǔ)音段的疊加部分會(huì)有一個(gè)變化的衰減,并且 該衰減可以確保疊加部分的最終幅度不至于過(guò)大。步驟305 將所述最終語(yǔ)音段進(jìn)行疊加,以覆蓋所述丟失的語(yǔ)音幀所處的區(qū)域。在得到最終的語(yǔ)音段之后,根據(jù)之前所確定的各個(gè)語(yǔ)音段的放置位置,將最終得 到的語(yǔ)音段放置于對(duì)應(yīng)位置,以覆蓋所述丟失的語(yǔ)音幀所處的區(qū)域。本實(shí)施例所提供的一種語(yǔ)音信號(hào)修復(fù)方法,通過(guò)對(duì)原語(yǔ)音幀進(jìn)行拆分,生成多個(gè) 語(yǔ)音段,對(duì)所生成的語(yǔ)音段分別進(jìn)行語(yǔ)音異常期的判斷,并根據(jù)判斷結(jié)果分別為新生成的 語(yǔ)音段引入相應(yīng)的系數(shù),使疊加后的波形能夠更大程度上地恢復(fù)原語(yǔ)音信號(hào)的幅值,從而 提高語(yǔ)音質(zhì)量。本發(fā)明實(shí)施例還相應(yīng)提供了一種語(yǔ)音信號(hào)修復(fù)裝置,如圖4所示,該裝置包括語(yǔ)音段生成單元401,用于將與丟失語(yǔ)音幀向鄰近的語(yǔ)音幀在時(shí)域范圍內(nèi)進(jìn)行拆 分,生成多個(gè)語(yǔ)音段;系數(shù)引入單元402,用于分別為所述語(yǔ)音段生成單元中生成的所述語(yǔ)音段引入系 數(shù);漢寧窗引入單元403,用于將引入系數(shù)的語(yǔ)音段分別與一個(gè)與自身長(zhǎng)度相同的漢 寧窗進(jìn)行相乘,得出最終語(yǔ)音段;語(yǔ)音段疊加單元404,用于將所述最終語(yǔ)音段進(jìn)行疊加,以覆蓋所述丟失的語(yǔ)音幀 所處的區(qū)域。
結(jié)合以上裝置,對(duì)語(yǔ)音信號(hào)進(jìn)行恢復(fù)包括語(yǔ)音段生成單元401將與丟失語(yǔ)音幀相鄰近的語(yǔ)音幀在時(shí)域范圍內(nèi)進(jìn)行拆分,生 成多個(gè)語(yǔ)音段;為了使語(yǔ)音段在疊加后能夠盡量與原語(yǔ)音的波形保持一致,需要通過(guò)系數(shù) 引入單元402根據(jù)每個(gè)語(yǔ)音段的不同情況分別引入不同的系數(shù);由于語(yǔ)音段在進(jìn)行疊加時(shí) 會(huì)導(dǎo)致疊加后的語(yǔ)音幅度的增加,因此,需要漢寧窗引入單元403將引入系數(shù)的語(yǔ)音段分 別與一個(gè)與自身長(zhǎng)度相同的漢寧窗進(jìn)行相乘,并得出最終語(yǔ)音段;之后,語(yǔ)音段疊加單元 404將生成的最終語(yǔ)音段進(jìn)行疊加,以覆蓋所述丟失的語(yǔ)音幀所處的區(qū)域。本實(shí)施例所提供的一種語(yǔ)音修復(fù)裝置,通過(guò)對(duì)原語(yǔ)音幀進(jìn)行拆分,生成多個(gè)語(yǔ)音 段,并分別為新生成的語(yǔ)音段引入相應(yīng)的增益因子,使疊加后的波形能夠更大程度上地恢 復(fù)原語(yǔ)音信號(hào)的幅值,從而提高語(yǔ)音質(zhì)量。本發(fā)明實(shí)施例還相應(yīng)提供了另外一種語(yǔ)音信號(hào)修復(fù)裝置,如圖5所示,該裝置包 括語(yǔ)音段生成單元501,用于將與丟失語(yǔ)音幀向鄰近的語(yǔ)音幀在時(shí)域范圍內(nèi)進(jìn)行拆 分,生成多個(gè)語(yǔ)音段;語(yǔ)音異常期判斷單元502,用于判斷所述語(yǔ)音段是否處于語(yǔ)音異常期;系數(shù)引入單元503,用于分別為所述語(yǔ)音段生成單元中生成的所述語(yǔ)音段引入系 數(shù);漢寧窗引入單元504,用于將引入系數(shù)的語(yǔ)音段分別與一個(gè)與自身長(zhǎng)度相同的漢 寧窗進(jìn)行相乘,得出最終語(yǔ)音段;語(yǔ)音段疊加單元505,用于將所述最終語(yǔ)音段進(jìn)行疊加,以覆蓋所述丟失的語(yǔ)音幀 所處的區(qū)域。其中,語(yǔ)音異常期判斷單元可以進(jìn)一步包括如圖6所示子單元能量比值計(jì)算子單元601,用于計(jì)算所述語(yǔ)音段將要疊加位置的原語(yǔ)音波形的能 量和所述語(yǔ)音段本身能量的比值;第一比較子單元602,用于判斷能量比值計(jì)算子單元計(jì)算出的能量比值是否近似 等于1,如果是,確定所述語(yǔ)音段未處于語(yǔ)音異常期;否則,確定所述語(yǔ)音段處于語(yǔ)音異常 期;另外,語(yǔ)音異常期判斷單元還可以進(jìn)一步包括如圖7所示子單元相關(guān)性計(jì)算子單元701,用于計(jì)算所述語(yǔ)音段進(jìn)行疊加時(shí)疊加部分的相關(guān)性;第二比較子單元702,用于將相關(guān)性計(jì)算子單元計(jì)算所得的相關(guān)性與設(shè)定閾值進(jìn) 行比較,如果所述相關(guān)性大于預(yù)先設(shè)定的閾值,確定所述語(yǔ)音段未處于語(yǔ)音異常期;否則, 確定所述語(yǔ)音段處于語(yǔ)音異常期。另外,根據(jù)判斷結(jié)果的不同,語(yǔ)音段所引入的系數(shù)也存在不同,當(dāng)判斷語(yǔ)音段未處 于語(yǔ)音異常期時(shí),為該語(yǔ)音段引入一個(gè)增益因子;否則,為該語(yǔ)音段引入一個(gè)預(yù)先設(shè)定的因數(shù)。因此,系數(shù)引入單元也相應(yīng)包括以下兩種結(jié)構(gòu)一種如圖8所示,包括增益因子計(jì)算子單元801,用于計(jì)算用于所述語(yǔ)音段的增益因子,所述增益因子為 語(yǔ)音段將要疊加位置的原語(yǔ)音波形的平均幅值和所述語(yǔ)音段本身平均幅值的比值;
第一相乘子單元802 用于將計(jì)算得出的所述增益因子與所述語(yǔ)音段進(jìn)行相乘。另外一種如圖9所示,包括因數(shù)生成子單元901,用于根據(jù)統(tǒng)計(jì)分析或網(wǎng)絡(luò)傳輸情況生成用于所述語(yǔ)音段的 因數(shù);第二相乘子單元902,用于將所述生成的因數(shù)與所述語(yǔ)音段進(jìn)行相乘。結(jié)合以上裝置,對(duì)語(yǔ)音信號(hào)進(jìn)行恢復(fù)具體為語(yǔ)音段生成單元501將與丟失語(yǔ)音幀相鄰近的語(yǔ)音幀在時(shí)域范圍內(nèi)進(jìn)行拆分,生 成多個(gè)語(yǔ)音段;由于生成的語(yǔ)音段有可能處于語(yǔ)音異常期,而影響修復(fù)的效果,需要由語(yǔ)音 異常期判斷單元502判斷語(yǔ)音段是否處于語(yǔ)音異常期;根據(jù)判斷結(jié)果,如果該語(yǔ)音段未處 于語(yǔ)音異常期,則由增益因子計(jì)算子單元801為該語(yǔ)音段計(jì)算增益因子,并通過(guò)第一相乘 子單元802將計(jì)算得出的增益因子與該語(yǔ)音段進(jìn)行相乘;而如果該語(yǔ)音段處于語(yǔ)音異常 期,則由因數(shù)生成子單元901生成的語(yǔ)音段的因數(shù),并通過(guò)第二相乘子單元902將計(jì)算得出 的增益因子與該語(yǔ)音段進(jìn)行相乘;由于語(yǔ)音段在進(jìn)行疊加時(shí)會(huì)導(dǎo)致疊加后的語(yǔ)音幅度的增 加,因此,需要漢寧窗引入單元504將引入系數(shù)的語(yǔ)音段分別與一個(gè)與自身長(zhǎng)度相同的漢 寧窗進(jìn)行相乘,并得出最終語(yǔ)音段;之后,語(yǔ)音段疊加單元505將生成的最終語(yǔ)音段進(jìn)行疊 加,以覆蓋所述丟失的語(yǔ)音幀所處的區(qū)域。本實(shí)施例所提供的一種語(yǔ)音信號(hào)修復(fù)裝置,通過(guò)對(duì)原語(yǔ)音幀進(jìn)行拆分,生成多個(gè) 語(yǔ)音段,對(duì)所生成的語(yǔ)音段分別進(jìn)行語(yǔ)音異常期的判斷,并根據(jù)判斷結(jié)果分別為新生成的 語(yǔ)音段引入相應(yīng)的系數(shù),使疊加后的波形能夠更大程度上地恢復(fù)原語(yǔ)音信號(hào)的幅值,從而 提高語(yǔ)音質(zhì)量。結(jié)合上述方法和具體應(yīng)用情況,本實(shí)施例對(duì)本發(fā)明的技術(shù)方案做進(jìn)一步介紹。假設(shè)發(fā)送端發(fā)送3幀語(yǔ)音信號(hào),但由于網(wǎng)絡(luò)原因,第3幀信號(hào)在傳輸過(guò)程中丟失, 接收端需要對(duì)前面兩個(gè)完好的語(yǔ)音幀進(jìn)行拉伸,使其覆蓋過(guò)第3個(gè)語(yǔ)音幀的位置。具體步 驟如圖10所示步驟1001 將接收到的2個(gè)完整的語(yǔ)音幀拆分為3段長(zhǎng)度相同的語(yǔ)音段。在步驟1001中,假設(shè)接收到的2個(gè)完好的語(yǔ)音幀的長(zhǎng)度分別為20ms,在8000Hz的 采樣頻率之下,該2個(gè)語(yǔ)音幀分別包括160個(gè)采樣點(diǎn)。由于要滿足相鄰兩個(gè)語(yǔ)音段之間相 互重疊一半,而重疊之后的語(yǔ)音段剛好覆蓋3個(gè)語(yǔ)音幀,即480個(gè)樣點(diǎn)長(zhǎng)度的數(shù)據(jù),由此可 以得出,拆分后的語(yǔ)音段長(zhǎng)度應(yīng)為240個(gè)樣點(diǎn)。下面,對(duì)如何進(jìn)行語(yǔ)音幀的拆分做詳細(xì)介紹由于要將現(xiàn)有的兩個(gè)160個(gè)樣點(diǎn)長(zhǎng) 度的語(yǔ)音幀拆分為3個(gè)240個(gè)樣點(diǎn)長(zhǎng)度的語(yǔ)音段,因此,要進(jìn)行如下操作通常情況下,將輸入的兩幀語(yǔ)音的開(kāi)始處作為第1個(gè)語(yǔ)音段的起始位置,則第1個(gè) 語(yǔ)音段應(yīng)該是從第1個(gè)樣點(diǎn)到第240個(gè)樣點(diǎn),在對(duì)第2個(gè)語(yǔ)音段進(jìn)行選取的過(guò)程中,為便于 實(shí)現(xiàn),該語(yǔ)音段的起始位置可以從第1至第41個(gè)樣點(diǎn)中進(jìn)行選取,并根據(jù)選取的起始位置, 向后數(shù)240個(gè)樣點(diǎn),形成第2個(gè)語(yǔ)音段;同理,第3個(gè)語(yǔ)音段的起始位置則在第41至第81 個(gè)樣點(diǎn)中進(jìn)行選取,并根據(jù)選取好的起始位置向后數(shù)240個(gè)樣點(diǎn),形成第3個(gè)語(yǔ)音段。需要 注意的是,在選取語(yǔ)音段的起始位置的時(shí)候,要考慮到在3個(gè)語(yǔ)音段進(jìn)行疊加時(shí),盡量使相 互疊加的語(yǔ)音段的相位保持一致,即讓兩段語(yǔ)音信號(hào)的波峰和波峰相疊加,波谷和波谷相 疊加,因此,在選取語(yǔ)音段的起始位置的時(shí)候,通常要首先計(jì)算每個(gè)語(yǔ)音段疊加部分的相關(guān)
10性,最大相關(guān)性所對(duì)應(yīng)的樣點(diǎn),即為該語(yǔ)音段的起始位置。步驟1002 判斷語(yǔ)音段是否處于語(yǔ)音異常期,例如語(yǔ)音轉(zhuǎn)換期或白噪聲期等,如 果是,則進(jìn)入步驟1003 ;否則,進(jìn)入步驟1004。在步驟1002中,在進(jìn)行語(yǔ)音轉(zhuǎn)換期或白噪聲期的判別時(shí),可以采用如下方式以第2語(yǔ)音段為例,采用如下公式進(jìn)行判斷
其中,X為第2個(gè)語(yǔ)音段在原語(yǔ)音幀中所處位置的采樣點(diǎn)值,Y為第2個(gè)語(yǔ)音段在 將要疊加的位置的采樣點(diǎn)值。將計(jì)算得出的gl和g2進(jìn)行比較,如果gl約等于g2,也就是 說(shuō)該語(yǔ)音段將要疊加位置的原語(yǔ)音波形的能量和該語(yǔ)音段本身能量的比值近似等于1則 說(shuō)明該語(yǔ)音段不處于語(yǔ)音轉(zhuǎn)換期或白噪聲期,否則,說(shuō)明該語(yǔ)音段處于語(yǔ)音轉(zhuǎn)換期或白噪聲期。同理,可進(jìn)行對(duì)第3語(yǔ)音段的判斷。除了利用上述方法進(jìn)行語(yǔ)音轉(zhuǎn)換期或白噪聲期的判斷外,還可采用以下方法進(jìn)行 判斷仍然以第2個(gè)語(yǔ)音段為例,前面已做過(guò)介紹,在進(jìn)行第2個(gè)語(yǔ)音段的起始位置的選 擇時(shí),選擇范圍為原語(yǔ)音幀的第1至第41個(gè)樣點(diǎn),而由于進(jìn)行疊加后,第2個(gè)語(yǔ)音段的前 120個(gè)樣點(diǎn)將與第1個(gè)語(yǔ)音段的后120個(gè)樣點(diǎn)產(chǎn)生重疊,將該范圍內(nèi)的每一個(gè)樣點(diǎn)都假設(shè)為 第2個(gè)語(yǔ)音段的起點(diǎn),并依次與第一個(gè)語(yǔ)音段的后120個(gè)樣點(diǎn)進(jìn)行相關(guān)性計(jì)算,計(jì)算所得最 大值所對(duì)應(yīng)的樣點(diǎn)即為第2個(gè)語(yǔ)音段的起始位置,而如果計(jì)算所得相關(guān)性的最大值大于預(yù) 先設(shè)定的閾值,說(shuō)明該語(yǔ)音段未處于語(yǔ)音轉(zhuǎn)換期或白噪聲期;否則,說(shuō)明該語(yǔ)音段處于語(yǔ)音 轉(zhuǎn)換期或白噪聲期。同理,可進(jìn)行對(duì)第3語(yǔ)音段的判斷。在該步驟中,通常情況下,將閾值設(shè)在0. 5 2之間,該方法的優(yōu)點(diǎn)是不需要額外 復(fù)雜的計(jì)算,在進(jìn)行語(yǔ)音段拆分的過(guò)程中已將每個(gè)數(shù)據(jù)段的相關(guān)性做了計(jì)算。步驟1003 對(duì)語(yǔ)音段使用一個(gè)預(yù)定義的衰減。在步驟1003中,對(duì)第2和第3語(yǔ)音段使用一個(gè)預(yù)定義的衰減,可以是將第2和第 3語(yǔ)音段分別與一個(gè)預(yù)定的小于1的系數(shù)相乘,從而實(shí)現(xiàn)第2和第3語(yǔ)音段的衰減,而對(duì)于 第1語(yǔ)音段,可以不對(duì)其幅值進(jìn)行改變。步驟1004 計(jì)算分別用于3個(gè)語(yǔ)音段的增益因子。步驟1004是該實(shí)施例的一個(gè)關(guān)鍵步驟,目的是使疊加后生成的波形包絡(luò)幅度能 很好地和原波形相匹配。其中,用于第2個(gè)語(yǔ)音段的增益因子可以通過(guò)如下公式進(jìn)行計(jì)算
其中,C2表示第2語(yǔ)音段將要疊加的位置的原語(yǔ)音波形的平均幅值和第2語(yǔ)音段本身平均幅值的比值;S指代第2個(gè)語(yǔ)音段的起始位置。
而用于第3個(gè)語(yǔ)音段的增益因子通過(guò)如下公式進(jìn)行計(jì)算 其中,C3表示第3語(yǔ)音段將要疊加的位置的原語(yǔ)音波形的平均幅值和第3語(yǔ)音段 本身平均幅值的比值;S’指代第3個(gè)語(yǔ)音段的起始位置。而由于第1語(yǔ)音段在原語(yǔ)音幀中的位置與疊加放置后的位置相同,因此,其增益 因子為1,可以認(rèn)為不用對(duì)第1語(yǔ)音段引入增益因子。步驟1005 將步驟1004中計(jì)算得出的增益因子分別與第2個(gè)語(yǔ)音段和第3個(gè)語(yǔ) 音段進(jìn)行相乘。步驟1006 利用同每個(gè)語(yǔ)音段長(zhǎng)度相同的漢寧窗分別與每個(gè)語(yǔ)音段相乘。由于要進(jìn)行3個(gè)語(yǔ)音段的疊加,而在對(duì)語(yǔ)音段進(jìn)行重疊后,重疊的部分必然導(dǎo)致 語(yǔ)音幅度的增加,因此,對(duì)參與疊加的語(yǔ)音段施加一個(gè)漢寧窗,可以在疊加部分受到一個(gè)變 化的衰減,使疊加部分的幅度增加不至于過(guò)大。步驟1007 將拆分所得的3個(gè)語(yǔ)音段在一個(gè)480個(gè)樣點(diǎn)的語(yǔ)音區(qū)間內(nèi)進(jìn)行疊加。在步驟1007中,由于每個(gè)語(yǔ)音段均具有240個(gè)樣點(diǎn),在進(jìn)行語(yǔ)音段的重疊過(guò)程中, 需要滿足相鄰兩個(gè)語(yǔ)音段之間相互重疊一半,因此,將第2個(gè)語(yǔ)音段的前120個(gè)樣點(diǎn)與第1 個(gè)語(yǔ)音段的后120個(gè)樣點(diǎn)進(jìn)行重疊,將第3個(gè)語(yǔ)音段的前120個(gè)樣點(diǎn)與第2個(gè)語(yǔ)音段的后 120個(gè)樣點(diǎn)進(jìn)行重疊,從而實(shí)現(xiàn)3個(gè)240樣點(diǎn)的語(yǔ)音段在480個(gè)樣點(diǎn)的區(qū)域內(nèi)完成重疊。本領(lǐng)域普通技術(shù)人員可以理解實(shí)現(xiàn)上述方法實(shí)施方式中的全部或部分步驟是可 以通過(guò)程序來(lái)指令相關(guān)的硬件來(lái)完成,所述的程序可以存儲(chǔ)于計(jì)算機(jī)可讀取存儲(chǔ)介質(zhì)中, 這里所稱的存儲(chǔ)介質(zhì),如ROM/RAM、磁碟、光盤等。對(duì)所公開(kāi)的實(shí)施例的上述說(shuō)明,使本領(lǐng)域?qū)I(yè)技術(shù)人員能夠?qū)崿F(xiàn)或使用本發(fā)明。 對(duì)這些實(shí)施例的多種修改對(duì)本領(lǐng)域的專業(yè)技術(shù)人員來(lái)說(shuō)將是顯而易見(jiàn)的,本文中所定義的 一般原理可以在不脫離本發(fā)明的精神或范圍的情況下,在其它實(shí)施例中實(shí)現(xiàn)。因此,本發(fā)明 將不會(huì)被限制于本文所示的這些實(shí)施例,而是要符合與本文所公開(kāi)的原理和新穎特點(diǎn)相一 致的最寬的范圍。
權(quán)利要求
一種語(yǔ)音信號(hào)修復(fù)方法,其特征在于,包括將與丟失語(yǔ)音幀相鄰近的語(yǔ)音幀在時(shí)域范圍內(nèi)進(jìn)行拆分,生成多個(gè)語(yǔ)音段;分別為所述語(yǔ)音段引入系數(shù);將引入系數(shù)的語(yǔ)音段分別與一個(gè)與自身長(zhǎng)度相同的漢寧窗進(jìn)行相乘,得出最終語(yǔ)音段;將所述最終語(yǔ)音段進(jìn)行疊加,以覆蓋所述丟失語(yǔ)音幀所處的區(qū)域。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述將與丟失語(yǔ)音幀相鄰近的語(yǔ)音幀在 時(shí)域范圍內(nèi)進(jìn)行拆分,生成多個(gè)語(yǔ)音段包括確定所述語(yǔ)音段的長(zhǎng)度和放置位置;根據(jù)所述語(yǔ)音段的長(zhǎng)度、放置位置和疊加部分相關(guān)性最大化原則在所述相鄰近的語(yǔ)音 幀的波形上選取所述語(yǔ)音段。
3.如權(quán)利要求1所述的方法,其特征在于,所述分別為所述語(yǔ)音段引入系數(shù)包括分別 為所述語(yǔ)音段引入增益因子。
4.如權(quán)利要求3所述的方法,其特征在于,所述增益因子包括所述語(yǔ)音段將要疊加的 位置的原語(yǔ)音波形的平均幅值和所述語(yǔ)音段本身平均幅值的比值。
5.如權(quán)利要求1至4任意一項(xiàng)所述的方法,其特征在于,還包括 判斷所述語(yǔ)音段是否處于語(yǔ)音異常期;當(dāng)判斷為否時(shí),所述分別為所述語(yǔ)音段引入系數(shù)包括,分別為所述語(yǔ)音段引入增益因子;當(dāng)判斷為是時(shí),所述分別為所述語(yǔ)音段引入系數(shù)包括,分別為所述語(yǔ)音段引入預(yù)先設(shè) 定的因數(shù),所述因數(shù)根據(jù)統(tǒng)計(jì)分析或網(wǎng)絡(luò)傳輸情況產(chǎn)生,并為一個(gè)小于或等于1的正數(shù)。
6.如權(quán)利要求5所述的方法,其特征在于,所述判斷所述語(yǔ)音段是否處于語(yǔ)音異常期 包括確定所述語(yǔ)音段將要疊加位置的原語(yǔ)音波形的能量和所述語(yǔ)音段本身能量的比值, 若所述比值近似等于1,則所述語(yǔ)音段未處于語(yǔ)音異常期;否則,所述語(yǔ)音段處于語(yǔ)音異常 期;或者,確定所述語(yǔ)音段進(jìn)行疊加時(shí)疊加部分的相關(guān)性,若所述相關(guān)性大于或等于預(yù)先設(shè)定的 閾值,則所述語(yǔ)音段未處于語(yǔ)音異常期;否則,所述語(yǔ)音段處于語(yǔ)音異常期。
7.一種語(yǔ)音信號(hào)修復(fù)裝置,其特征在于,包括語(yǔ)音段生成單元,用于將與丟失語(yǔ)音幀相鄰近的語(yǔ)音幀在時(shí)域范圍內(nèi)進(jìn)行拆分,生成 多個(gè)語(yǔ)音段;系數(shù)引入單元,用于分別為所述語(yǔ)音段生成單元中生成的所述語(yǔ)音段引入系數(shù); 漢寧窗引入單元,用于將引入系數(shù)的語(yǔ)音段分別與一個(gè)與自身長(zhǎng)度相同的漢寧窗進(jìn)行 相乘,得出最終語(yǔ)音段;語(yǔ)音段疊加單元,用于將所述最終語(yǔ)音段進(jìn)行疊加,以覆蓋所述丟失語(yǔ)音幀所處的區(qū)域。
8 如權(quán)利要求7所述的裝置,其特征在于,還包括語(yǔ)音異常期判斷單元,用于判斷所 述語(yǔ)音段是否處于語(yǔ)音異常期。
9.如權(quán)利要求8所述的裝置,其特征在于,所述語(yǔ)音異常期判斷單元包括能量比值計(jì)算子單元,用于計(jì)算所述語(yǔ)音段將要疊加位置的原語(yǔ)音波形的能量和所述 語(yǔ)音段本身能量的比值;第一比較子單元,用于判斷能量比值計(jì)算子單元計(jì)算出的能量比值是否近似等于1 ; 或者,相關(guān)性計(jì)算子單元,用于計(jì)算所述語(yǔ)音段進(jìn)行疊加時(shí)疊加部分的相關(guān)性; 第二比較子單元,用于將相關(guān)性計(jì)算子單元計(jì)算所得的相關(guān)性與設(shè)定閾值進(jìn)行比較。
10.如權(quán)利要求8或9所述的裝置,其特征在于,所述系數(shù)引入單元包括 增益因子計(jì)算子單元,用于計(jì)算用于所述語(yǔ)音段的增益因子,所述增益因子為語(yǔ)音段 將要疊加位置的原語(yǔ)音波形的平均幅值和所述語(yǔ)音段本身平均幅值的比值;第一相乘子單元用于將計(jì)算得出的所述增益因子與所述語(yǔ)音段進(jìn)行相乘;或者, 因數(shù)生成子單元,用于根據(jù)統(tǒng)計(jì)分析或網(wǎng)絡(luò)傳輸情況生成用于所述語(yǔ)音段的因數(shù); 第二相乘子單元,用于將所述生成的因數(shù)與所述語(yǔ)音段進(jìn)行相乘。
全文摘要
本發(fā)明實(shí)施例公開(kāi)了一種語(yǔ)音信號(hào)修復(fù)方法,包括步驟將與丟失語(yǔ)音幀相鄰近的語(yǔ)音幀在時(shí)域范圍內(nèi)進(jìn)行拆分,生成多個(gè)語(yǔ)音段;分別為所述語(yǔ)音段引入系數(shù);將引入系數(shù)的語(yǔ)音段分別與一個(gè)與自身長(zhǎng)度相同的漢寧窗進(jìn)行相乘,得出最終語(yǔ)音段;將所述最終語(yǔ)音段進(jìn)行疊加,以覆蓋所述丟失語(yǔ)音幀所處的區(qū)域。同時(shí),本發(fā)明實(shí)施例還公開(kāi)了一種語(yǔ)音信號(hào)修復(fù)裝置。通過(guò)本發(fā)明,使在采用語(yǔ)音拉伸法進(jìn)行語(yǔ)音修復(fù)時(shí),能使疊加后的波形更大程度地恢復(fù)原語(yǔ)音信號(hào)的幅值,避免新生成的語(yǔ)音信號(hào)幅度趨勢(shì)同原語(yǔ)音信號(hào)差距過(guò)大,由此改善語(yǔ)音質(zhì)量。
文檔編號(hào)G10L21/04GK101894565SQ200910140488
公開(kāi)日2010年11月24日 申請(qǐng)日期2009年5月19日 優(yōu)先權(quán)日2009年5月19日
發(fā)明者吳大鵬, 李默嘉, 武穆清, 甄巖, 苗磊, 許劍峰, 魏璐璐 申請(qǐng)人:華為技術(shù)有限公司;北京郵電大學(xué)