專利名稱:用于提供amr-wb dtx同步的系統(tǒng)和方法
技術(shù)領(lǐng)域:
本發(fā)明總體上涉及語音編碼。更具體地,本發(fā)明涉及語音編碼、容錯(cuò)以及在電路交換網(wǎng)絡(luò)(諸如無匯接操作(TF0)網(wǎng)絡(luò)、無聲碼器操作(TrF0)網(wǎng)絡(luò))和分組交換網(wǎng)絡(luò)(諸如IP語音(VoIP)網(wǎng)絡(luò))上的語音傳輸。
背景技術(shù):
本部分旨在對權(quán)利要求書中細(xì)述的本發(fā)明提供背景或上下文。此處的描述可以包括能夠被探究的概念,卻不必須是之前已經(jīng)想到或者探究的那些概念。因此,除了在此明確指出之外,本部分提及的內(nèi)容對于本申請的說明書和權(quán)利要求書而言不是現(xiàn)有技術(shù),并且并不因?yàn)榘ㄔ诒静糠种芯统姓J(rèn)其為現(xiàn)有技術(shù)。 第三代合作伙伴計(jì)劃(3GPP)核心網(wǎng)中的TF0和TrF0以及服務(wù)(諸如VoIP服務(wù))中的接收機(jī)邏輯可以利用傳輸碼RX_N0_DATA將傳遞至語音編碼器的空幀或空分組注入自適應(yīng)多速率寬帶(AMR-WB)比特流中。換言之,活躍的語音比特流偶爾可以包含空幀或空分組。這些空幀或空分組通常用于其他目的。例如,這種幀或分組通常被諸如TFO/TrFO信令或其他系統(tǒng)級信令之類的緊急信令數(shù)據(jù)所替換。為了避免解碼器將這種"非語音"數(shù)據(jù)幀/分組作為語音幀/分組處理,將其標(biāo)記為RX_N0_DATA。在接收RX_N0_DATA幀的另一示例中,沿傳輸路徑丟失或損壞的幀可以例如由某個(gè)中間實(shí)體替換為RX_N0_DATA幀。
在啟用非連續(xù)傳輸(DTX)操作的情況下,當(dāng)AMR-WB解碼器接收活躍語音的片段中的RX—NO—DATA幀時(shí),根據(jù)TS 26.173 v7. 0. 0 (定點(diǎn)實(shí)現(xiàn))和TS 26.204 v7. 0. O(浮點(diǎn)實(shí)現(xiàn))的AMR-WB解碼器實(shí)現(xiàn)可以靜默(mute)或衰減語音合成的輸出,有時(shí)可以長達(dá)100ms的時(shí)段。此輸出的靜默或衰減引起與顯著的語音質(zhì)量下降有關(guān)的問題。 根據(jù)TS 26.193 v7. 0. 0 (艮卩"Source controlled rate operation")的既定AMR-WB解碼器功能注意到在解碼器處于SPEECH(語音)模式中時(shí),從DTX處理器的角度來看,接收的N0_DATA幀應(yīng)當(dāng)作為SPEECH_L0ST (語音丟失)幀來處理。具體而言,TS 26. 193v7. 0. 0記載有"如果RX DTX處理器處于模式SPEECH,則應(yīng)當(dāng)按照3GPP TS26. 191中定義的那樣來替代或靜默被分類為SPEECH_DEGRADED(語音下降)、SPEECH_BAD(不良語音)、SPEECHJDST(語音丟失)或N(U)ATA(無數(shù)據(jù))的幀。分類為N0_DATA的幀應(yīng)當(dāng)與不具有有效語音信息的SPEECH_L0ST幀相類似地進(jìn)行處理。" 可能期待AMR-WB解碼器變得更具魯棒性,以便其能夠處理可以由網(wǎng)絡(luò)創(chuàng)建的或可以由終端/網(wǎng)關(guān)中的實(shí)現(xiàn)創(chuàng)建的任何幀類型輸入組合。然而,在DTX同步的情況中出現(xiàn)了某些問題。AMR-WB編碼器具有檢測不活躍語音的語音活動(dòng)性檢測(VAD)功能,并且為了指示包含不活躍語音的幀,AMR-WB編碼器相應(yīng)地將VAD標(biāo)志設(shè)置為0。在8個(gè)幀的DTX拖尾(hangover)時(shí)段之后,調(diào)用非連續(xù)傳輸(DTX)功能,在該DTX拖尾時(shí)段期間,確定舒適噪音參數(shù)。針對此DTX拖尾,解碼器需要與編碼器同步。如果解碼器沒有與編碼器完全同步,則在解碼器中的舒適噪音計(jì)算將不能與編碼器對準(zhǔn)。 傳統(tǒng)上,所接收的N0_DATA幀被簡單地分類為屬于DTX時(shí)段的幀,即,指示不存在
4傳輸。然而,在這種情況下會產(chǎn)生問題,因?yàn)?,盡管發(fā)射機(jī)或網(wǎng)絡(luò)正在發(fā)射信令幀,而DTX同步邏輯卻沒有對準(zhǔn)。在接收到包含舒適噪音參數(shù)的第一靜音描述符(SID)之后,該同步被恢復(fù)。另一方面,當(dāng)N0_DATA幀被分類為活躍語音比特流的一部分并且由SPEECH_L0ST幀類型(并由此由解碼器中的錯(cuò)誤隱藏操作)替換時(shí),針對DTX處理會產(chǎn)生問題。例如,如果接收機(jī)已經(jīng)丟失了 SID_FIRST幀(DTX時(shí)段的第一幀),則該N0_DATA幀被錯(cuò)誤地分類為丟失語音幀。在接收到下一個(gè)SID_UPDATE之后,該同步被再次恢復(fù)。 在定點(diǎn)AMR-WB參考實(shí)現(xiàn)(3GPP TS 26. 173)中,此DTX同步的處理以C代碼實(shí)現(xiàn),如以下的示例1所示(源文件"dtx. c"中的函數(shù)"rx—dtxjiandler")。 —種用于處理上述狀況的現(xiàn)有技術(shù)提議在以下的示例2中進(jìn)行了描述。示例2
0)0)
if ((sub(frame_type, RX_SID_FIRST)(sub(frame_type, RX_SID_UPDATE)(sub(frame_type, RX_SID_BAD)==((sub (frame_type, RX_N0_DATA) = = 0) &&(sub(st- > dtxGlobalState,SPEECH) !=
0)
1
2
3
4 _ — _ _
4b (sub (st-> dtxGlobalState, SPEECH) ! =0)))
5 {
6 encState = DTX ; movel6 0 ;
7 }else
8 {
9 encState = SPEECH; movel6 0 ;
10 }
盡管在上述4b行中的文本確保了可能插入在活躍語音的片段中間的N0_DATA并不導(dǎo)致錯(cuò)誤地切換至DTX狀態(tài),但是這仍然沒有完全解決會對插入的N0_DATA幀進(jìn)行錯(cuò)誤處理這一問題。
發(fā)明內(nèi)容
本發(fā)明的各種實(shí)施方式提供了一種用于提供改進(jìn)的AMR-WBDTX同步的系統(tǒng)和方法。根據(jù)各種實(shí)施方式,討論中的AMR-WB比特流包含用于每個(gè)所發(fā)射幀的VAD標(biāo)志信息。換言之,在DTX時(shí)段將開始(即,接收到SID_FIRST幀)之前的8個(gè)幀處,向解碼器信號傳送關(guān)于不活躍語音時(shí)段的開始的指示。因此,在VAD標(biāo)志指示在少于之前的8個(gè)幀時(shí)活躍語音或該標(biāo)志被設(shè)置為0的情況下,接收的N0_DATA幀可以以高的可靠度被分類為活躍語音,即,被視為發(fā)射機(jī)、網(wǎng)絡(luò)或終端發(fā)起的信令,并且可以由SPEECHJDST來替換。在8個(gè)幀之前或更早之前時(shí)VAD標(biāo)志被設(shè)置為0的情況下,將N(U)ATA幀分類為DTX。利用本發(fā)明的各種實(shí)施方式,AMR-WB接收機(jī)針對N0_DATA幀處理更具魯棒性。本發(fā)明的各種實(shí)施方式適用于在AMR-WB解碼器中使用,并且尤其適用于在DTX舒適噪音生成和同步中使用。
通過下述結(jié)合附圖的具體描述,本發(fā)明的這些和其他優(yōu)點(diǎn)與特征,連同其組織和操作方式都將變得明顯,其中貫穿下述若干附圖,相同附圖標(biāo)記表示相同元素。
圖1是本發(fā)明的各種實(shí)施方式可以在其中實(shí)現(xiàn)的系統(tǒng)的概括圖; 圖2是示出了可以實(shí)現(xiàn)本發(fā)明的各種實(shí)施方式的過程的流程圖; 圖3是可以與本發(fā)明的各種實(shí)施方式的實(shí)現(xiàn)結(jié)合使用的電子設(shè)備的透視圖;以及 圖4是可以包括在圖3的電子設(shè)備中的電路的示意性表示。
具體實(shí)施例方式
本發(fā)明的各種實(shí)施方式提供了一種用于提供改進(jìn)的AMR-WBDTX同步的系統(tǒng)和方法。根據(jù)各種實(shí)施方式,討論中的AMR-WB比特流包含用于每個(gè)所發(fā)射幀的VAD標(biāo)志信息。換言之,在DTX時(shí)段將開始(即,接收到SID_FIRST幀)之前的8個(gè)幀處,向解碼器信號傳送關(guān)于不活躍語音時(shí)段的開始的指示。因此,在VAD標(biāo)志指示在少于之前的8個(gè)幀時(shí)活躍語音或該標(biāo)志被設(shè)置為0的情況下,接收的N0_DATA幀可以以高的可靠度被分類為活躍語音,即,被視為發(fā)射機(jī)、網(wǎng)絡(luò)或終端發(fā)起的信令,并且可以由SPEECHJDST來替換。在8個(gè)幀之前或更早之前時(shí)VAD標(biāo)志被設(shè)置為0的情況下,將N0_DATA幀分類為DTX。
圖1是本發(fā)明的各種實(shí)施方式可以在其中實(shí)現(xiàn)的通用多媒體通信系統(tǒng)的圖形化表示。如圖1所示,數(shù)據(jù)源100以模擬、未壓縮數(shù)字式、或壓縮數(shù)字格式或這些格式的任意組合提供源信號。編碼器110將源信號編碼成已編碼媒體比特流。應(yīng)當(dāng)注意,待解碼的比特流可以直接或間接從虛擬地位于任何類型的網(wǎng)絡(luò)中的遠(yuǎn)程設(shè)備接收。另外,該比特流可以從本地硬件或軟件接收。編碼器110能夠?qū)Χ嘤谝粋€(gè)的媒體類型進(jìn)行編碼,或者可能需要多于一個(gè)的編碼器110以對源信號的不同媒體類型進(jìn)行編碼。編碼器110還可以得到合成產(chǎn)生的輸入,諸如圖形和文本,或者其能夠產(chǎn)生合成媒體的已編碼比特流。在下文中,僅考慮對一個(gè)媒體類型的一個(gè)已編碼媒體比特流進(jìn)行處理,以便簡化描述。然而,應(yīng)當(dāng)注意的是,通常實(shí)時(shí)廣播服務(wù)包括若干流(通常,至少一個(gè)音頻、視頻和文本字幕流)。還應(yīng)當(dāng)注意的是,系統(tǒng)可以包括很多編碼器,但是在圖1中,不失一般性地,僅表示一個(gè)編碼器110,以簡化描述。還應(yīng)當(dāng)進(jìn)一步理解,盡管在此包含的文本和示例可能具體描述了編碼過程,但是本領(lǐng)域技術(shù)人員能夠理解,相同的概念和原理也可以應(yīng)用于相應(yīng)的解碼過程,反之亦然。
已編碼媒體比特流式傳輸至存儲設(shè)備120。存儲設(shè)備120可以包括任何類型的海量存儲器,以存儲已編碼的媒體比特流。存儲設(shè)備120中已編碼媒體比特流的格式可以是基本自給的(elementaryself-contained)比特流格式,或者一個(gè)或多個(gè)已編碼比特流可以封裝至容器文件中。某些系統(tǒng)"現(xiàn)場"操作,即,省略存儲設(shè)備,而直接將已編碼媒體比特流從編碼器110傳輸至發(fā)送器130。已編碼媒體比特流隨后傳輸至發(fā)送器130,根據(jù)需要,也稱為服務(wù)器。在傳輸中使用的格式可以是基本自給的比特流格式、分組流格式,或者一個(gè)或多個(gè)已編碼媒體比特流可以封裝至容器文件中。編碼器110、存儲設(shè)備120和發(fā)送器130可以駐留于同一物理設(shè)備中,或者它們可以包括在分離的設(shè)備中。編碼器110和發(fā)送器130可以利用直播實(shí)時(shí)內(nèi)容進(jìn)行操作,在該情況下,已編碼媒體比特流通常不會永久存儲,而是在內(nèi)容編碼器IIO和/或發(fā)送器130中緩沖一小段時(shí)間,以平滑處理延遲、傳輸延遲和已編碼媒體比特速率的變化。 發(fā)送器130使用通信協(xié)議棧來發(fā)送已編碼媒體比特流。??梢园ǖ幌抻趯?shí)時(shí)傳輸協(xié)議(RTP)、用戶數(shù)據(jù)報(bào)協(xié)議(UDP)和互聯(lián)網(wǎng)協(xié)議(IP),不過還應(yīng)當(dāng)注意,3GPP電路交換電話也可以在本發(fā)明各種實(shí)施方式的上下文中使用。當(dāng)通信協(xié)議是面向分組的時(shí)候,發(fā)送器130將已編碼媒體流封裝至分組中。例如,當(dāng)使用RTP時(shí),發(fā)送器130根據(jù)RTP凈荷格式將已編碼媒體比特流封裝至RTP分組中。通常,每個(gè)媒體類型具有專用RTP凈荷格式。再次需要注意,系統(tǒng)可以包含多于一個(gè)的發(fā)送器130,但是為了簡化,以下描述僅考慮一個(gè)發(fā)送器130。 發(fā)送器130可以或可以不通過通信網(wǎng)絡(luò)連接至網(wǎng)關(guān)140。網(wǎng)關(guān)140可以執(zhí)行不同類型的功能,諸如將根據(jù)一個(gè)通信協(xié)議棧的分組流轉(zhuǎn)譯成另一通信協(xié)議棧,合并以及分流數(shù)據(jù)流,以及根據(jù)下行鏈路和/或接收機(jī)的能力操縱數(shù)據(jù)流,諸如控制根據(jù)流行的下行鏈路網(wǎng)絡(luò)條件控制轉(zhuǎn)發(fā)的比特流的比特速率。網(wǎng)關(guān)140的示例包括MCU、電路交換和分組交換視頻電話之間的網(wǎng)關(guān)、一鍵通話(PoC)服務(wù)器、手持?jǐn)?shù)字視頻廣播(DVB-H)系統(tǒng)的IP封裝器,或者將本地廣播傳輸轉(zhuǎn)發(fā)到家庭無線網(wǎng)絡(luò)的機(jī)頂盒。當(dāng)使用RTP時(shí),網(wǎng)關(guān)140被稱為RTP混合器或RTP轉(zhuǎn)譯器,并且典型地充當(dāng)RTP連接的端點(diǎn)。 系統(tǒng)包括一個(gè)或者多個(gè)接收機(jī)150,其通常能夠接收、解調(diào)已傳輸?shù)男盘?,以及將其解封裝為已編碼的媒體比特流。已編碼媒體比特流被傳輸至記錄存儲155。記錄存儲155可以包括用于存儲已編碼媒體比特流的任何類型海量存儲器。備選地或者附加地,記錄存儲155可以包括計(jì)算存儲器,諸如隨機(jī)訪問存儲器。記錄存儲155中的已編碼媒體比特流的格式可以是基本自給的比特流格式,或者一個(gè)或多個(gè)已編碼媒體比特流可以封裝至容器文件。如果存在彼此相關(guān)聯(lián)的多個(gè)已編碼媒體比特流,則通常使用容器文件,并且接收機(jī)150包括或者附接至根據(jù)輸入流產(chǎn)生容器文件的容器文件生成器。某些系統(tǒng)"現(xiàn)場"操作,即,省略記錄存儲155,而直接從接收機(jī)150將已編碼媒體比特流傳輸至解碼器160。在某些系統(tǒng)中,僅在記錄存儲155中維護(hù)已記錄流的最新部分(例如,已記錄流的最近10分鐘摘錄),而從記錄存儲155中丟棄任何先前記錄的數(shù)據(jù)。 已編碼媒體比特流從記錄存儲155向解碼器160傳輸。如果存在彼此相關(guān)聯(lián)并且封裝至容器文件的多個(gè)已編碼媒體比特流,則文件解析器(附圖中未示出)用于從該容器文件解封裝每個(gè)已編碼媒體比特流。記錄存儲155或解碼器160可以包括文件解析器,或者文件解析器附接至記錄存儲155或解碼器160。 已編碼媒體比特流通常進(jìn)一步由解碼器160處理,其輸出是一個(gè)或者多個(gè)未壓縮的媒體流。最后,呈現(xiàn)器170可以例如通過揚(yáng)聲器重現(xiàn)未壓縮的媒體流。接收機(jī)150、記錄存儲155、解碼器160和呈現(xiàn)器170可以駐留于同一物理設(shè)備中,或者它們可以被包含在分離的設(shè)備中。 根據(jù)各種實(shí)施方式,當(dāng)AMR-WB解碼器接收NO_DATA幀/分組時(shí),該解碼器檢查VAD
標(biāo)志的狀態(tài)和相應(yīng)的DTX拖尾狀態(tài)。AMR-WB具有8幀的DTX拖尾。因此,在VAD標(biāo)志被設(shè)
置為0時(shí),該解碼器期望接收作為第8個(gè)幀的SID_FIRST。由于解碼器已經(jīng)記錄了 VAD標(biāo)
志歷史,即,具有不活躍語音的連續(xù)幀數(shù)量,則解碼器可以估計(jì)那個(gè)應(yīng)當(dāng)包含SID_FIRST和
NO—DATA幀的幀。此過程的表示如下 如果vadjiist〈8NO_DATA幀被視為SPEECH_LOST 信令包括在比特流中不需要DTX拖尾信息更新 否則NO_DATA幀被視為DTX
需要更新DTX拖尾信息 為了將上述功能包括在定點(diǎn)3GPP AMR-WB參考實(shí)現(xiàn)(3GPP TS26. 173)中,可以使用對之前討論的示例2的源代碼的片段的進(jìn)一步修改,該修改在以下示例3中描述。
示例3 1 if ((sub (frame—type, RX—SID—FIRST) = = 0) |
2 (sub(frame_type, RX_SID_UPDATE) = = 0) |
3 (sub (frame—type, RX—SID—BAD) = = 0) |
4 ((sub(frame_type, RX_NO_DATA) == 0)&&
4b ((sub (st-> dtxGlobalState, SPEECH) ! = 0) |
4c (sub(vad_hist, DTX_HANG_CONST) >= O))))
5 { 行4b和4c的源代碼用于確保只有在AMR-WB比特流中接收的VAD標(biāo)志指示拖尾時(shí)段結(jié)束,即,如果當(dāng)前幀是接收的VAD指示從活躍語音改變到不活躍語音之后的第8個(gè)幀的時(shí)候,NO_DATA幀才會觸發(fā)從語音狀態(tài)到DTX狀態(tài)的切換。此外,可變的vadjiist指示接收的(連續(xù))語音幀的數(shù)量,這些語音幀的VAD標(biāo)志被設(shè)置為O。此值的取值可以例如在函數(shù)"decoder"(在文件"decjiiain. c"中)中計(jì)算,并作為附加參數(shù)傳遞給函數(shù)"rx—dtx—handler",或者在函數(shù)"rx—dtxjiandler"(假設(shè)用于計(jì)算此值所需的信息可用)內(nèi)部計(jì)算,
以便支持對示例3的行4c的"if"聲明的估計(jì)。 圖2是示出了可以實(shí)現(xiàn)本發(fā)明的各種實(shí)施方式的過程的流程圖。在圖2的200處, 音頻內(nèi)容的各個(gè)幀被編碼為比特流。這多個(gè)幀的每一個(gè)例如通過使用VAD標(biāo)志來包括關(guān)于 每個(gè)相應(yīng)幀是代表活躍語音還是代表其他音頻的指示。在210處,解碼器接收多個(gè)幀。在 220處,接收具有無數(shù)據(jù)包含于其中的指示的指示的幀,S卩,該幀是N(U)ATA幀。在230處, 確定在前的預(yù)定數(shù)量(在圖2中由X表示)的幀的至少一個(gè)是否包括各自幀代表活躍音頻 或語音的指示。如以上所討論的,此預(yù)定數(shù)量的幀在一個(gè)實(shí)施方式中共包括8個(gè)幀。如果 在前的預(yù)定數(shù)量的幀的至少一個(gè)包括各自幀代表活躍音頻的指示,則在240處,將附加幀 分類為代表活躍音頻。在這種情況下,在250處,NO_DATA幀可以用SPEECH_LOST幀替換。 另一方面,如果在前的預(yù)定數(shù)量的幀都不包括各自幀代表活躍音頻的指示,則在260處,將 N0_DATA幀分類為DTX,指示非連續(xù)傳輸。 圖3和圖4示出了本發(fā)明可以在其中實(shí)現(xiàn)的一個(gè)代表性移動(dòng)設(shè)備12。然而,應(yīng)當(dāng) 理解的是,本發(fā)明不旨在限于一種特定類型的電子設(shè)備。圖3和圖4的移動(dòng)設(shè)備12包括外 殼30、液晶顯示器形式的顯示器32、小鍵盤34、麥克風(fēng)36、耳機(jī)38、電池40、紅外端口 42、天 線44、根據(jù)本發(fā)明一個(gè)實(shí)施例的UICC形式的智能卡46、讀卡器48、無線接口電路52、編解 碼器電路54、控制器56以及存儲器58。單獨(dú)的電路和元件可以是本領(lǐng)域公知的所有類型, 例如Nokia范圍內(nèi)的移動(dòng)電話系列。 在方法步驟或過程的通常背景下對本發(fā)明的各種實(shí)施方式進(jìn)行了描述,在一個(gè)實(shí)
施例中,這些方法步驟或過程可以通過包含在計(jì)算機(jī)可讀介質(zhì)中的計(jì)算機(jī)程序產(chǎn)品來實(shí)
現(xiàn),該計(jì)算機(jī)程序產(chǎn)品包括在網(wǎng)絡(luò)環(huán)境中由計(jì)算機(jī)執(zhí)行的計(jì)算機(jī)可執(zhí)行指令,諸如程序代
碼。通常,程序模塊可以包括例程、程序、對象、組件、數(shù)據(jù)結(jié)構(gòu)等,用于執(zhí)行特定任務(wù)或者實(shí)
現(xiàn)特定的抽象數(shù)據(jù)類型。計(jì)算機(jī)可執(zhí)行指令、相關(guān)聯(lián)的數(shù)據(jù)結(jié)構(gòu)和程序模塊代表了用于執(zhí)
行此處公開的方法的步驟的程序代碼的示例。這種可執(zhí)行指令或者相關(guān)聯(lián)的數(shù)據(jù)結(jié)構(gòu)的特
定序列代表了用于實(shí)現(xiàn)在這種步驟或過程中描述的功能的對應(yīng)動(dòng)作的示例。 本發(fā)明各種實(shí)施方式的軟件和web實(shí)現(xiàn)能夠利用標(biāo)準(zhǔn)編程技術(shù)來完成,利用基于
規(guī)則的邏輯或者其他邏輯來實(shí)現(xiàn)各種數(shù)據(jù)庫搜索步驟或過程、相關(guān)步驟或過程、比較步驟
或過程和決策步驟或過程。還應(yīng)當(dāng)注意的是,此處以及下述權(quán)利要求書中使用的詞語"組
件"和"模塊"意在包括使用一行或者更多行軟件代碼的實(shí)現(xiàn)和/或硬件實(shí)現(xiàn)和/或用于接
收手動(dòng)輸入的設(shè)備。 出于示例和描述的目的,已經(jīng)給出了本發(fā)明實(shí)施方式的前述說明。前述說明并非 是窮舉性的也并非要將本發(fā)明的實(shí)施方式限制到所公開的確切形式,根據(jù)上述教導(dǎo)還可能 存在修改和變形,或者是可能從本發(fā)明各種實(shí)施方式的實(shí)踐中得到修改和變形。在這里選 擇和描述實(shí)施方式是為了說明本發(fā)明各種實(shí)施方式的原理和本質(zhì)及其實(shí)際應(yīng)用,以使得本 領(lǐng)域的技術(shù)人員能夠以適合于構(gòu)思的特定用途來以各種實(shí)施方式和各種修改而利用本發(fā) 明。
9
權(quán)利要求
一種對音頻內(nèi)容進(jìn)行解碼的方法,包括從比特流接收音頻內(nèi)容的多個(gè)幀,所述多個(gè)幀的每一個(gè)包括各自幀是否代表活躍音頻的指示;接收音頻內(nèi)容的附加幀,所述附加幀包括沒有數(shù)據(jù)包含于其中的指示;以及如果在所述附加幀之前的預(yù)定數(shù)量的幀內(nèi)的多個(gè)幀都不包括所述各自幀代表活躍音頻的指示,則將所述附加幀分類作為非連續(xù)傳輸。
2. 根據(jù)權(quán)利要求1所述的方法,進(jìn)一步包括如果在所述附加幀之前的預(yù)定數(shù)量的幀 內(nèi)的所述多個(gè)幀的至少一個(gè)包括所述各自幀代表活躍音頻的指示,則將所述附加幀分類為 代表活躍音頻。
3. 根據(jù)權(quán)利要求2所述的方法,進(jìn)一步包括如果在所述附加幀之前的預(yù)定數(shù)量的幀 內(nèi)的所述多個(gè)幀的至少一個(gè)包括所述各自幀代表活躍音頻的指示,則用指定音頻已經(jīng)丟失 的幀來替換所述附加幀。
4. 根據(jù)權(quán)利要求1所述的方法,其中所述音頻內(nèi)容包括語音內(nèi)容。
5. 根據(jù)權(quán)利要求1所述的方法,其中所述預(yù)定數(shù)量的幀包括8個(gè)幀。
6. 根據(jù)權(quán)利要求1所述的方法,其中所述比特流包括自適應(yīng)多速率寬帶比特流。
7. —種計(jì)算機(jī)程序產(chǎn)品,包含在計(jì)算機(jī)可讀介質(zhì)中,包括配置為執(zhí)行權(quán)利要求1的過 程的計(jì)算機(jī)代碼。
8. —種裝置,包括 處理器;以及存儲器單元,其可通信地連接至所述處理器,并且包括用于對來自比特流的音頻內(nèi)容的已接收的多個(gè)幀進(jìn)行處理的計(jì)算機(jī)代碼,所述多個(gè)幀 的每一個(gè)包括各自幀是否代表活躍音頻的指示;用于對音頻內(nèi)容的已接收的附加幀進(jìn)行處理的計(jì)算機(jī)代碼,所述附加幀包括沒有數(shù)據(jù) 包含于其中的指示;以及用于如果在所述附加幀之前的預(yù)定數(shù)量的幀內(nèi)的多個(gè)幀都不包括所述各自幀代表活 躍音頻的指示,則將所述附加幀分類作為非連續(xù)傳輸?shù)挠?jì)算機(jī)代碼。
9. 根據(jù)權(quán)利要求8所述的裝置,其中所述存儲器單元進(jìn)一步包括用于如果在所述附 加幀之前的預(yù)定數(shù)量的幀內(nèi)的所述多個(gè)幀的至少一個(gè)包括所述各自幀代表活躍音頻的指 示,則將所述附加幀分類為代表活躍音頻的計(jì)算機(jī)代碼。
10. 根據(jù)權(quán)利要求8所述的裝置,進(jìn)一步包括如果在所述附加幀之前的預(yù)定數(shù)量的幀 內(nèi)的所述多個(gè)幀的至少一個(gè)包括所述各自幀代表活躍音頻的指示,則用指定音頻已經(jīng)丟失 的幀來替換所述附加幀。
11. 根據(jù)權(quán)利要求8所述的裝置,其中所述音頻內(nèi)容包括語音內(nèi)容。
12. 根據(jù)權(quán)利要求8所述的裝置,其中所述預(yù)定數(shù)量的幀包括8個(gè)幀。
13. 根據(jù)權(quán)利要求8所述的裝置,其中所述比特流包括自適應(yīng)多速率寬帶比特流。
14. 一種設(shè)備,包括用于從比特流接收音頻內(nèi)容的多個(gè)幀的裝置,所述多個(gè)幀的每一個(gè)包括各自幀是否代 表活躍音頻的指示;用于接收音頻內(nèi)容的附加幀的裝置,所述附加幀包括沒有數(shù)據(jù)包含于其中的指示;以及用于如果在所述附加幀之前的預(yù)定數(shù)量的幀內(nèi)的多個(gè)幀都不包括所述各自幀代表活 躍音頻的指示,則將所述附加幀分類作為非連續(xù)傳輸?shù)难b置。
15. 根據(jù)權(quán)利要求14所述的設(shè)備,進(jìn)一步包括用于如果在所述附加幀之前的預(yù)定數(shù) 量的幀內(nèi)的所述多個(gè)幀的至少一個(gè)包括所述各自幀代表活躍音頻的指示,則將所述附加幀 分類為代表活躍音頻的裝置。
16. 根據(jù)權(quán)利要求15所述的設(shè)備,進(jìn)一步包括用于如果在所述附加幀之前的預(yù)定數(shù) 量的幀內(nèi)的所述多個(gè)幀的至少一個(gè)包括所述各自幀代表活躍音頻的指示,則用指定音頻已 經(jīng)丟失的幀來替換所述附加幀的裝置。
全文摘要
一種用于提供改進(jìn)的自適應(yīng)多速率寬帶(AMR-WB)非連續(xù)傳輸(DTX)同步的系統(tǒng)和方法。根據(jù)各種實(shí)施方式,在DTX時(shí)段將開始(即,接收到SID_FIRST幀)之前的預(yù)定數(shù)量的幀處,關(guān)于不活躍語音時(shí)段的開始的指示經(jīng)由語音活動(dòng)檢測(VAD)標(biāo)志被信號傳送到解碼器。在VAD標(biāo)志指示活躍語音時(shí),或者在少于之前預(yù)定數(shù)量的幀時(shí)該VAD標(biāo)志被設(shè)置為0的情況下,接收的NO_DATA幀可以以較高的可靠度被分類為活躍語音,即,被視為發(fā)射機(jī)、網(wǎng)絡(luò)或終端發(fā)起的信令,并且可以由SPEECH_LOST來替換。在8個(gè)幀之前或更早之前時(shí)VAD標(biāo)志被設(shè)置為0的情況下,將NO_DATA幀分類為DTX。
文檔編號H04J3/06GK101790754SQ200880104750
公開日2010年7月28日 申請日期2008年8月28日 優(yōu)先權(quán)日2007年8月31日
發(fā)明者A·拉卡涅米, P·奧雅拉 申請人:諾基亞公司