傳送冗余幀信息的系統(tǒng)和方法
【專利說明】
[0001 ] 相關(guān)申請案的交叉參考
[0002] 本申請案主張2013年10月11日申請的標(biāo)題為"傳送冗余幀信息的系統(tǒng)和方法 (SYSTEMS AND METHODS OF COMMUNICATING REDUNDANT FRAME INFORMATION)" 的第61/ 890,092號美國臨時(shí)專利申請案和2014年10月8日申請的標(biāo)題為"傳送冗余幀信息的系統(tǒng)和 方法"的第14/509,817號美國非臨時(shí)專利申請案的優(yōu)先權(quán),以上申請案的內(nèi)容以全文引用 的方式并入本文。
技術(shù)領(lǐng)域
[0003] 本發(fā)明大體上涉及傳送冗余幀信息。
【背景技術(shù)】
[0004] 技術(shù)的進(jìn)步已經(jīng)產(chǎn)生了更小且更強(qiáng)大的計(jì)算裝置。舉例來說,目前存在各種便攜 式個(gè)人計(jì)算裝置,包含無線計(jì)算裝置,例如較小、輕重量且易于由用戶攜帶的便攜式無線電 話、個(gè)人數(shù)字助理(PDA)和尋呼裝置。更具體來說,便攜式無線電話(例如,蜂窩式電話和因 特網(wǎng)協(xié)議(IP)電話)可經(jīng)由無線網(wǎng)絡(luò)傳送話音和數(shù)據(jù)包。另外,許多此類無線電話包含并入 其中的其它類型的裝置。舉例來說,無線電話還可包含數(shù)字靜態(tài)相機(jī)、數(shù)碼攝像機(jī)、數(shù)字記 錄器和音頻文件播放器。
[0005] 例如無線電話等電子裝置可經(jīng)由網(wǎng)絡(luò)發(fā)送和接收數(shù)據(jù)。舉例來說,可經(jīng)由電路交 換網(wǎng)絡(luò)(例如,公共交換電話網(wǎng)絡(luò)(PSTN)、全球移動(dòng)通信系統(tǒng)(GSM)網(wǎng)絡(luò)等)或包交換網(wǎng)絡(luò) (例如,因特網(wǎng)協(xié)議話音(Vo IP)網(wǎng)絡(luò)、長期演進(jìn)話音(VoLTE)網(wǎng)絡(luò)等)發(fā)送和接收音頻數(shù)據(jù)。 在包交換網(wǎng)絡(luò)中,音頻包可個(gè)別地從源裝置路由到目的地裝置。由于網(wǎng)絡(luò)條件,音頻包可能 無序地到達(dá)。目的地裝置可將所接收包存儲在去抖動(dòng)緩沖器中且可在需要時(shí)重新布置所接 收的包。
[0006] 當(dāng)傳送音頻數(shù)據(jù)時(shí)可使用各種編碼方案。舉例來說,取決于音頻幀類型,碼激勵(lì)線 性預(yù)測(CELP)方法或基于頻域的經(jīng)修改離散余弦變換(MDCT)可用以緊湊地表示語音和音 頻。為了在編碼較大帶寬(例如,高達(dá)8千赫茲(kHz)寬帶(WB )、16kHz超寬帶(SWB)或20kHz全 頻帶)時(shí)改善低位速率(例如,13.2千位每秒(kbps )、24.4kbps等)下的譯碼效率,通常使用 例如CELP或MDCT等波形匹配譯碼技術(shù)編碼較低頻帶核心(例如,高達(dá)6.4kHz或高達(dá)8kHz)。 執(zhí)行帶寬擴(kuò)展(BWE),其模型化高頻帶(例如,>6.4kHz或>8kHz)且編碼"輔助信息"(例如,與 高頻帶參數(shù)相關(guān)聯(lián))。高頻帶輔助信息可包含模型化精細(xì)和粗略時(shí)間演進(jìn)兩者的線性預(yù)測 (LP)濾波器系數(shù)和增益參數(shù)。編碼器或源裝置可將輔助信息連同低頻部分一起發(fā)送到目的 地裝置,使得目的地裝置可在目的地裝置處合成音頻幀的高頻部分以用于高質(zhì)量重構(gòu)。
【發(fā)明內(nèi)容】
[0007] 因?yàn)榘粨Q網(wǎng)絡(luò)中的包可無序地到達(dá),所以有可能即使特定包(例如,對應(yīng)于音頻 幀N)損壞或丟失,后續(xù)包(例如,對應(yīng)于音頻幀N+2)也可無錯(cuò)誤且在去抖動(dòng)緩沖器中可用。 因此,在后續(xù)幀(例如,幀N+2)中包含可用以重構(gòu)前一幀(例如,幀N)的冗余譯碼信息(例如, 錯(cuò)誤校正信息)可為有用的。
[0008] 本發(fā)明描述傳送冗余幀信息的系統(tǒng)和方法。根據(jù)所描述的技術(shù),當(dāng)帶寬擴(kuò)展(BWE) 方案在使用中時(shí),音頻幀可包含四種類型的數(shù)據(jù):經(jīng)編碼低頻帶核心,高頻帶輔助信息,與 前一幀的低頻帶部分相關(guān)聯(lián)的冗余譯碼信息,以及與前一幀的高頻帶參數(shù)相關(guān)聯(lián)的冗余譯 碼信息。當(dāng)前幀的低頻帶核心和高頻帶輔助信息可共同稱為"主要"譯碼。前一幀的低頻帶 和高頻帶的冗余譯碼信息可共同稱為"部分副本"。因此,幀可包含用于其自身的低頻帶和 高頻帶的主要譯碼位,且?guī)€可包含用于前一幀的低頻帶和高頻帶的部分副本位。
[0009] 當(dāng)幀擦除條件發(fā)生(例如,前一幀未被接收或由于網(wǎng)絡(luò)錯(cuò)誤而損壞)時(shí),冗余譯碼 信息可由接收器使用以重構(gòu)前一幀。此外,分配給四種類型的數(shù)據(jù)(即,低頻帶核心、高頻帶 輔助信息、前一幀的低頻帶核心的部分副本,和前一幀的高頻帶的部分副本)中的每一者的 位數(shù)目可基于正發(fā)射的音頻信號的性質(zhì)而動(dòng)態(tài)調(diào)整。甚至當(dāng)成功地接收前一幀(例如,在清 潔信道條件中)時(shí),解碼器也可在解碼主要譯碼位之前分離主要譯碼位與部分副本位。
[0010] 在特定方面,一種對幀進(jìn)行解碼的方法包含在計(jì)算裝置的解碼器處接收第二音頻 幀,其中所述第二音頻幀在音頻信號中跟隨第一音頻幀。所述第二音頻幀包含分配給與所 述第二音頻幀相關(guān)聯(lián)的主要譯碼信息(例如,經(jīng)編碼低頻帶核心和高頻帶參數(shù))的第一數(shù)目 的位。所述第二音頻幀還包含分配給與所述第一音頻幀相關(guān)聯(lián)的冗余(例如,部分副本)譯 碼信息的第二數(shù)目的位。所述第二音頻幀進(jìn)一步包含所述第一音頻幀的幀類型(例如,部分 副本幀類型)的指示符。所述方法包含響應(yīng)于與所述第一音頻幀相關(guān)聯(lián)的幀擦除條件,基于 所述指示符確定所述第二音頻幀的分配給與所述第一音頻幀相關(guān)聯(lián)的所述冗余譯碼信息 的所述第二數(shù)目的位。所述方法進(jìn)一步包含基于所述冗余譯碼信息對所述第一音頻幀進(jìn)行 解碼。
[0011] 在另一特定方面中,一種對幀進(jìn)行解碼的方法包含在計(jì)算裝置的解碼器處接收第 一音頻幀和第二音頻幀。所述第二音頻幀在音頻信號中跟隨所述第一音頻幀。所述第二音 頻幀包含分配給與第二音頻幀相關(guān)聯(lián)的主要譯碼信息的第一數(shù)目的位、分配給與第一音頻 幀相關(guān)聯(lián)的冗余譯碼信息的第二數(shù)目的位,以及第一音頻幀的幀類型的指示符。所述方法 還包含對所述第一音頻幀進(jìn)行解碼。所述方法進(jìn)一步包含基于所述指示符確定所述第二音 頻幀的分配給與所述第二音頻幀相關(guān)聯(lián)的主要譯碼信息的所述第一數(shù)目的位。所述方法包 含基于所述主要譯碼信息對所述第二音頻幀進(jìn)行解碼。在特定實(shí)施例中,所述方法包含通 過從總位數(shù)(例如,用以表示第二音頻幀)減去分配給第一音頻幀的部分副本的第二數(shù)目的 位而確定分配給與所述第二音頻幀相關(guān)聯(lián)的主要譯碼信息的第一數(shù)目的位。
[0012] 在另一特定方面中,一種對幀進(jìn)行編碼的方法包含在第一計(jì)算裝置的編碼器處對 音頻信號的第一音頻幀進(jìn)行編碼,以及將所述第一音頻幀從所述第一計(jì)算裝置發(fā)射到第二 計(jì)算裝置。所述方法還包含基于所述第一音頻幀的幀類型確定所述第二音頻幀的第一數(shù)目 的位以分配給與所述第二音頻幀相關(guān)聯(lián)的主要譯碼信息且確定所述第二音頻幀的第二數(shù) 目的位以分配給與所述第一音頻幀相關(guān)聯(lián)的冗余譯碼信息。所述第二音頻幀在音頻信號中 跟隨所述第一音頻幀。所述方法還包含對所述第二音頻幀進(jìn)行編碼且將所述第二音頻幀從 所述第一計(jì)算裝置發(fā)射到所述第二計(jì)算裝置。所述第二音頻幀包含主要譯碼信息的第一數(shù) 目的位、冗余譯碼信息的第二數(shù)目的位,以及第一音頻幀的幀類型的指示符。
[0013] 在另一特定方面中,一種設(shè)備包含經(jīng)配置以接收第二音頻幀的接收器。所述第二 音頻幀在音頻信號中跟隨第一音頻幀。所述第二音頻幀包含分配給與所述第二音頻幀相關(guān) 聯(lián)的主要譯碼信息的第一數(shù)目的位。所述第二音頻幀還包含分配給與所述第一音頻幀相關(guān) 聯(lián)的冗余譯碼信息的第二數(shù)目的位。所述第二音頻幀進(jìn)一步包含所述第一音頻幀的幀類型 的指示符。所述設(shè)備還包含解碼器,其經(jīng)配置以響應(yīng)于與所述第一音頻幀相關(guān)聯(lián)的幀擦除 條件,基于所述指示符確定所述第二音頻幀的分配給與所述第一音頻幀相關(guān)聯(lián)的冗余譯碼 信息的所述第二數(shù)目的位。所述解碼器經(jīng)配置以基于所述冗余譯碼信息對第一音頻幀進(jìn)行 解碼。
[0014] 在另一特定方面中,一種設(shè)備包含經(jīng)配置以接收第一音頻幀和在音頻信號中跟隨 所述第一音頻幀的第二音頻幀的接收器。所述第二音頻幀包含分配給與所述第二音頻幀相 關(guān)聯(lián)的主要譯碼信息的第一數(shù)目的位。所述第二音頻幀還包含分配給與所述第一音頻幀相 關(guān)聯(lián)的冗余譯碼信息的第二數(shù)目的位。所述第二音頻幀進(jìn)一步包含所述第一音頻幀的幀類 型的指示符。所述設(shè)備還包含解碼器,其經(jīng)配置以對所述第一音頻幀進(jìn)行解碼,且基于所述 指示符確定所述第二音頻幀的分配給與所述第二音頻幀相關(guān)聯(lián)的主要譯碼信息的所述第 一數(shù)目的位。所述解碼器經(jīng)配置以基于所述主要譯碼信息對第二音頻幀進(jìn)行解碼。
[0015] 在另一特定方面中,一種設(shè)備包含經(jīng)配置以對音頻信號的第一音頻幀進(jìn)行編碼的 編碼器。所述編碼器還經(jīng)配置以基于所述第一音頻幀的幀類型確定所述第二音頻幀的第一 數(shù)目的位以分配給與所述第二音頻幀相關(guān)聯(lián)的主要譯碼信息且確定所述第二音頻幀的第 二數(shù)目的位以分配給與所述第一音頻幀相關(guān)聯(lián)的冗余譯碼信息。所述編碼器進(jìn)一步經(jīng)配置 以對所述第二音頻幀進(jìn)行編碼。所述第二音頻幀在音頻信號中跟隨所述第一音頻幀。所述 第二音頻幀包含主要譯碼信息的第一數(shù)目的位、冗余譯碼信息的第二數(shù)目的位,以及第一 音頻幀的幀類型的指示符。所述設(shè)備還包含經(jīng)配置以將所述第一音頻幀和所述第二音頻幀 發(fā)射到目的地裝置的發(fā)射器。
[0016] 由所揭示實(shí)施例中的至少一者提供的特定優(yōu)點(diǎn)包含在音頻流的較晚幀中提供所 述音頻流的較早幀的冗余譯碼信息的能力。包含在所述較晚幀中的冗余譯碼信息可例如當(dāng) 較早幀由于網(wǎng)絡(luò)錯(cuò)誤而損壞或丟失時(shí)實(shí)現(xiàn)較早幀的重構(gòu)。本發(fā)明的其它方面、優(yōu)點(diǎn)和特征 將在審閱全部申請案之后變得顯而易見,所述全部申請案包含以下部分:【附圖說明】、具體實(shí) 施方式和權(quán)利要求書。
【附圖說明】
[0017] 圖1是說明可操作以傳送冗余幀信息的系統(tǒng)的特定實(shí)施例的圖;
[0018] 圖2是說明包含另一音頻幀的冗余譯碼信息的音頻幀的特定實(shí)施例的圖;
[0019]圖3是說明包含另一音頻幀的冗余譯碼信息的音頻幀的另一特定實(shí)施例的圖; [0020]圖4是說明高頻帶增益幀碼簿的特定實(shí)施例的圖;
[0021] 圖5是說明經(jīng)配置以對冗余幀信息進(jìn)行編碼的并行路徑編碼器的特定實(shí)施例的 圖;
[0022] 圖6是說明經(jīng)配置以解碼冗余幀信息的單個(gè)路徑解碼器的特定實(shí)施例的圖;
[0023] 圖7和圖8共同地描繪說明基于包含在后續(xù)幀中的冗余譯碼信息對幀進(jìn)行解碼的 方法的特定實(shí)施例的流程圖;
[0024] 圖9是說明將幀的冗余譯碼信息編碼到后續(xù)幀中的特定實(shí)施例的流程圖;以及
[0025] 圖10是可操作以根據(jù)圖1-9的系統(tǒng)和方法執(zhí)行操作的無線裝置的框圖。
【具體實(shí)施方式】
[0026] 下文參考圖式描述本發(fā)明的特定實(shí)施例。在描述和附圖中,為了描繪和描述的實(shí) 施例的清楚,由共同參考標(biāo)號指定共同特征。
[0027] 參考圖1,展示可操作以傳送冗余幀信息的系統(tǒng)的特定實(shí)施例且大體上指定為 100。系統(tǒng)100包含第一計(jì)算裝置110和第二計(jì)算裝置120。第一計(jì)算裝置110和第二計(jì)算裝置 120可經(jīng)配置以經(jīng)由包交換網(wǎng)絡(luò)傳送數(shù)據(jù),例如音頻幀。舉例來說,包交換網(wǎng)絡(luò)可包含VoIP 網(wǎng)絡(luò)、VoLTE網(wǎng)絡(luò)或另一包交換網(wǎng)絡(luò)。在說明性實(shí)施例中,第一計(jì)算裝置110和第二計(jì)算裝置 120各自包含移動(dòng)電話、計(jì)算裝置(例如,膝上型計(jì)算機(jī)、桌上型計(jì)算機(jī)、平板計(jì)算機(jī)、服務(wù)器 計(jì)算機(jī)等)、媒體播放器、游戲裝置、機(jī)頂盒裝置、導(dǎo)航裝置、包交換網(wǎng)絡(luò)的組件、經(jīng)配置以傳 送音頻數(shù)據(jù)的另一裝置,或其任何組合。
[0028] 第一計(jì)算裝置110可包含處理器112(例如,中央處理單元(CPU)、數(shù)字信號處理器 (DSP)等)和存儲器114。在特定實(shí)施例中,存儲器114存儲可由處理器112執(zhí)行以執(zhí)行本文所 描述的各種操作的指令。第一計(jì)算裝置110還可包含編碼器116和發(fā)射器118。編碼器116可 對由發(fā)射器118發(fā)射(例如,經(jīng)由包交換網(wǎng)絡(luò))的音頻幀進(jìn)行編碼。在替代實(shí)施例中,第一計(jì) 算裝置110除發(fā)射器118之外還可包含接收器,或可包含經(jīng)配置以發(fā)射和接收數(shù)據(jù)的收發(fā) 器。編碼器116可對音頻幀序列進(jìn)行編碼,包含說明性音頻幀131、132、133和134。在圖1中, 音頻幀131、132、133和134是音頻信號的四個(gè)連續(xù)幀且分別表示為第(N-1)幀、第N幀、第(N+ 1 )幀以及第(N+2)幀。為便于閱讀,這些幀在本文中分別被稱作幀N-I、幀N、幀N+1和幀N+2。應(yīng)注 意,雖然圖1中以左到右次序說明音頻幀131-134,但這不應(yīng)解譯為暗示音頻幀131-134以此 次序由第二計(jì)算裝置120接收。如本文進(jìn)一步描述,音頻幀可無序地到達(dá)目的地裝置或可能 由于網(wǎng)絡(luò)錯(cuò)誤而丟失。
[0029] 音頻幀131-134中的每一者可包含經(jīng)編碼低頻帶信號("LB核心")和高頻帶參數(shù) ("HB參數(shù)")。幀的LB核心和HB參數(shù)可共同地被稱作幀的主要譯碼。在特定實(shí)施例中,音頻幀 131-134中的每一者具有固定大小,且分配到經(jīng)編碼低頻帶核心和高頻帶參數(shù)的帶寬量(例 如,幀的位數(shù)目)可在幀之間動(dòng)態(tài)調(diào)整,如本文進(jìn)一步描述。為了改善在網(wǎng)絡(luò)錯(cuò)誤存在下的 音頻解碼性能,音頻幀131-134中的一或多者可包含前一幀的冗余譯碼信息。冗余譯碼信息 可包含低頻帶冗余譯碼信息和/或高頻帶參數(shù)冗余譯碼信息。前一幀的低頻帶和高頻帶的 冗余譯碼信息