根據(jù)本發(fā)明的一個實施例的由缺失信號發(fā)生器311a執(zhí)行的操作。圖4描繪信號400、402、404和408的圖形。圖形的垂直軸代表信號的量值而水平軸代表時間。第一信號400是編碼器222嘗試處理的原始聲音信號。第二信號402是從缺乏任何修改地處理第一信號400而產(chǎn)生的信號(即,未修改的信號)。第一時間410是編碼器222從第一模式(例如,使用頻域編碼器,諸如基于諧波的正弦型編碼器的音樂模式)切換成第二模式(例如,使用時域或者波形編碼器,諸如CELP編碼器的語音模式)的時間點。因此,直到第一時間410,編碼器222以第一模式來處理音頻信號。在第一時間410處或者之后不久,編碼器222嘗試以第二模式來處理音頻信號,但是直至編碼器222能夠在模式切換(該模式切換在第二時間412出現(xiàn))之后刷出濾波存儲器和緩沖器并且填充先行緩沖器221才能夠有效地這樣做。正如可見,在第一時間410與第二時間412之間存在時間間隔,在該時間間隔中,在處理的音頻信號中存在間隙416(例如,該間隔416可以大約為5毫秒)。在該間隙416期間,在BWE區(qū)域中幾乎沒有聲音可用于編碼。為了補償該間隙,缺失信號發(fā)生器311a復(fù)制信號402的部分406。復(fù)制的信號部分406是缺失信號部分(S卩,應(yīng)當(dāng)已經(jīng)在間隙中的信號部分)的估計。復(fù)制的信號部分406占用從第二時間412到第三時間414跨越的時間間隔418。將要注意,可以存在第二時間412后的信號的可以被復(fù)制的多個部分,但是該示例涉及單個復(fù)制的部分。
[0030]編碼器222將復(fù)制的信號部分406疊加到重新生成的信號估計408上,使得復(fù)制的信號部分406的一部分被插入到間隙416中。在一些實施例中,如圖4中所示,缺失信號發(fā)生器311a在將復(fù)制的信號部分406疊加到重新生成的信號估計402上之前對復(fù)制的信號部分406進(jìn)行時間反轉(zhuǎn)。
[0031]在一個實施例中,復(fù)制的部分406跨越比間隙416的時間段更長的時間段。因此,除了復(fù)制的部分406填充間隙416之外,復(fù)制的部分的一部分與超出間隙416之外的信號組合。在其它實施例中,復(fù)制的部分跨越與間隙416相同的時間段。
[0032]圖5示出另一實施例。在該實施例中,存在已知目標(biāo)信號500,該已知目標(biāo)信號500是從由編碼器222執(zhí)行的初始處理產(chǎn)生的信號。在第一時間512之前,編碼器222以第一模式(其中,例如,它使用頻率編碼器,諸如基于諧波的正弦型編碼器)來操作。在第一時間512處,編碼器222從第一模式切換成第二模式(其中,例如,它使用CELP編碼器)。例如,該切換基于從音樂或者類音樂的聲音改變成語音或者類語音的聲音的向通信設(shè)備輸入的音頻。編碼器222直至第二時間514才能夠從第一模式向第二模式的切換中恢復(fù)。在第二時間514之后,編碼器222能夠以第二模式對語音輸入進(jìn)行編碼。間隙503存在于第一時間與第二時間之間。為了補償間隙503,缺失信號發(fā)生器311a(圖3)復(fù)制已知目標(biāo)信號500的與間隙503相同時間長度518的部分504。缺失信號發(fā)生器組合復(fù)制的部分504的余弦窗口部分502與復(fù)制的部分504的時間反轉(zhuǎn)的正弦窗口部分506。余弦窗口部分502和時間反轉(zhuǎn)的正弦窗口部分506 二者均可以取自復(fù)制的部分504的相同分段516。時間反轉(zhuǎn)的正弦和余弦部分可以相互異相,并且可以不一定在分段516的相同時間點處開始和結(jié)束。余弦窗口和時間反轉(zhuǎn)的正弦窗口的組合將被稱為重疊-相加信號510。重疊-相加信號510替換目標(biāo)信號500的復(fù)制的部分504的一部分。復(fù)制的信號504的尚未被替換的部分將被稱為未替換的信號520。編碼器將重疊-相加信號510附加到未替換的信號516,并且使用組合的信號510和516來填充間隙503。
[0033]盡管已經(jīng)以如下方式描述了本公開內(nèi)容及其最佳模式,該方式建立了由發(fā)明人的占有并且使得本領(lǐng)域普通技術(shù)人員能夠?qū)崿F(xiàn)和使用本公開內(nèi)容,但是將會理解,存在在此公開的示例實施例的等價形式并且可以對其進(jìn)行修改和變化而不偏離本公開內(nèi)容的精神和范圍,本公開內(nèi)容的精神和范圍將不由示例實施例限制而由所附權(quán)利要求限制。
【主權(quán)項】
1.一種對音頻信號進(jìn)行編碼的方法,所述方法包括: 以第一編碼器模式(300A)處理所述音頻信號; 在第一時間(410)從所述第一編碼器模式(300A)切換到第二編碼器模式(300B); 以所述第二編碼器模式(300B)處理所述音頻信號,其中所述第二編碼器模式(300B)的處理延遲造成了所述音頻信號中的間隙(416),所述間隙(416)具有在所述第一時間(410)處或者之后開始并且在第二時間(412)處結(jié)束的時間跨度; 復(fù)制經(jīng)處理的所述音頻信號的部分(406),其中復(fù)制的所述部分(406)在所述第二時間(412)處或者之后出現(xiàn);以及 將信號插入到所述間隙(416)中,其中插入的所述信號基于復(fù)制的所述部分(406)。
2.根據(jù)權(quán)利要求1所述的方法,其中插入的所述信號是復(fù)制的所述部分的時間反轉(zhuǎn)的版本。
3.根據(jù)權(quán)利要求1所述的方法, 其中復(fù)制的所述部分的所述時間跨度比所述間隙的所述時間跨度長; 所述方法進(jìn)一步包括組合復(fù)制的所述部分的重疊部分與經(jīng)處理的所述音頻信號的出現(xiàn)在所述第二時間之后的至少一部分。
4.根據(jù)權(quán)利要求1所述的方法, 其中復(fù)制的所述部分包括正弦窗口部分和余弦窗口部分;并且其中插入復(fù)制的所述部分包括組合所述正弦窗口部分與所述余弦窗口部分并且將組合的所述正弦窗口部分和所述余弦窗口部分的至少一部分插入到所述間隙部分中。
5.根據(jù)權(quán)利要求1所述的方法,其中將所述編碼器從第一模式切換到第二模式包括將所述編碼器從音樂模式切換到語音模式。
6.根據(jù)權(quán)利要求1所述的方法,進(jìn)一步包括: 如果所述音頻信號被確定為音樂信號,則以所述第一模式對所述音頻信號進(jìn)行編碼;確定所述音頻信號已經(jīng)從所述音樂信號切換到語音信號;以及如果確定了所述音頻信號已經(jīng)切換成語音信號,則以所述第二模式對所述音頻信號進(jìn)行編碼。
7.根據(jù)權(quán)利要求6所述的方法,其中所述第一模式是音樂編碼模式并且所述第二模式是語音編碼模式。
8.根據(jù)權(quán)利要求1所述的方法,進(jìn)一步包括在所述第一模式中使用頻域編碼器并且在所述第二模式中使用CELP編碼器。
9.一種用于對音頻信號進(jìn)行編碼的裝置(200),所述裝置(200)包括: 第一編碼器(300A); 第二編碼器(300B); 語音-音樂檢測器(300); 其中當(dāng)所述語音-音樂檢測器(300)確定音頻信號已經(jīng)從音樂改變成語音時,所述音頻信號停止由所述第一編碼器(300A)處理而由所述第二編碼器(300B)處理; 其中所述第二編碼器(300B)的處理延遲造成了所述音頻信號中的間隙(416),所述間隙(416)具有在第一時間(410)處或者之后開始并且在第二時間(412)處結(jié)束的時間跨度;以及 缺失信號發(fā)生器(311A),所述缺失信號發(fā)生器(311A)復(fù)制經(jīng)處理的所述音頻信號的部分(406),其中復(fù)制的所述部分(406)在所述第二時間(412)處或者之后出現(xiàn),并且所述缺失信號發(fā)生器(311A)將信號插入到所述間隙(416)中,其中插入的所述信號基于復(fù)制的所述部分(406)。
【專利摘要】混合語音編碼器(200)檢測從類音樂的聲音到類語音的聲音的改變。當(dāng)編碼器(200)檢測到類音樂的聲音(例如,音樂)時,它以第一模式操作,在該第一模式中它運用頻域編碼器(300A)。當(dāng)編碼器(200)檢測到類語音的聲音(例如,人類語音)時,它以第二模式操作,并且運用時域或者波形編碼器(300B)。在切換出現(xiàn)時,編碼器(200)使用信號的在間隙(416)之后出現(xiàn)的部分來回填信號中的間隙(416)。
【IPC分類】G10L19-18
【公開號】CN104781879
【申請?zhí)枴緾N201380059616
【發(fā)明人】J·A·吉布斯, H·L·弗朗索瓦
【申請人】摩托羅拉移動有限責(zé)任公司
【公開日】2015年7月15日
【申請日】2013年9月6日
【公告號】EP2901450A1, US9129600, US20140088973, WO2014051965A1