音頻多編碼傳輸方法及相應(yīng)裝置制造方法
【專利摘要】本發(fā)明公開了一種音頻多編碼的傳輸方法及相關(guān)裝置,其中所述方法包括:編碼端根據(jù)輸入的多編碼參數(shù)信息、信息數(shù)據(jù)以及音頻數(shù)據(jù)生成編碼標(biāo)識(shí);根據(jù)輸入的信息數(shù)據(jù)和/或音頻數(shù)據(jù)生成增強(qiáng)數(shù)據(jù);或者直接將信息數(shù)據(jù)作為增強(qiáng)數(shù)據(jù);將輸入到編碼端的音頻數(shù)據(jù)進(jìn)行編碼后生成音頻編碼數(shù)據(jù);根據(jù)編碼標(biāo)識(shí)、增強(qiáng)數(shù)據(jù)以及音頻編碼數(shù)據(jù)生成帶有增強(qiáng)數(shù)據(jù)的多編碼語音幀,并打包發(fā)送至音頻多編碼的解碼端;解碼端接收編碼端發(fā)來的多編碼語音幀并進(jìn)行解析,解析后得到編碼標(biāo)識(shí)、編碼后的增強(qiáng)數(shù)據(jù)發(fā)送給以及音頻數(shù)據(jù);根據(jù)編碼標(biāo)識(shí)對(duì)編碼后的增強(qiáng)數(shù)據(jù)進(jìn)行解碼;對(duì)編碼后的音頻數(shù)據(jù)進(jìn)行解碼;本發(fā)明擴(kuò)展了音頻編解碼方法,提高了通過IP網(wǎng)絡(luò)傳輸媒體的服務(wù)質(zhì)量。
【專利說明】音頻多編碼傳輸方法及相應(yīng)裝置
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及通信【技術(shù)領(lǐng)域】,尤其涉及一種音頻多編碼傳輸方法及相應(yīng)裝置。
【背景技術(shù)】
[0002]隨著Internet的普及,越來越多的媒體(如視頻、音頻)通過IP網(wǎng)絡(luò)傳送,VoIP(Voice over Internet Protocol)就是基于IP分組網(wǎng)絡(luò)多媒體的一個(gè)典型業(yè)務(wù),它利用IP網(wǎng)或互聯(lián)網(wǎng)進(jìn)行話音傳輸,該技術(shù)的主要特點(diǎn)為將模擬聲音信號(hào)經(jīng)過壓縮編碼和打包分組之后,以數(shù)據(jù)包的形式在IP網(wǎng)絡(luò)上傳輸。
[0003]實(shí)時(shí)語音傳輸一般用UDP協(xié)議來傳輸語音數(shù)據(jù)分組以提高傳輸?shù)膶?shí)時(shí)性,UDP協(xié)議的機(jī)制是best effort方式傳輸IP數(shù)據(jù)包,不保證將數(shù)據(jù)分組正確傳送到目的地,數(shù)據(jù)分組在網(wǎng)絡(luò)中傳輸時(shí)會(huì)由于網(wǎng)絡(luò)抖動(dòng)、網(wǎng)絡(luò)擁塞等原因造成分組丟失、時(shí)延,數(shù)據(jù)分組丟失直接降低了話音質(zhì)量,并且丟失的分組還會(huì)影響后續(xù)正確接收的語音數(shù)據(jù)的解碼,語音通話會(huì)出現(xiàn)延時(shí)大甚至中斷等現(xiàn)象,嚴(yán)重影響用戶體驗(yàn)。對(duì)于IP分組丟失,現(xiàn)有的技術(shù)是采用前向糾錯(cuò)(FEC, ForwardError Correction)對(duì)丟失的語音包進(jìn)行恢復(fù),然而FEC技術(shù)增加了對(duì)帶寬的需求,丟失的語音包需要其他語音包做運(yùn)算來恢復(fù),也增大了延時(shí)。
[0004]IP網(wǎng)絡(luò)由于自身的局限性,相對(duì)于傳輸文本信息,在傳輸語音等實(shí)時(shí)通信媒體時(shí)無法提供很高的質(zhì)量保證。因此,如何對(duì)現(xiàn)有語音編解碼能力進(jìn)行擴(kuò)展,提高高實(shí)時(shí)媒體的業(yè)務(wù)質(zhì)量,保證語音通話用戶體驗(yàn)是一個(gè)有待解決的問題。
【發(fā)明內(nèi)容】
[0005]鑒于上述的分析,本發(fā)明旨在提供一種音頻多編碼傳輸方法及相應(yīng)裝置,用以解決現(xiàn)有技術(shù)中由于IP網(wǎng)絡(luò)由于自身的局限性所帶來的傳輸語音等實(shí)時(shí)通信媒體時(shí)無法提供質(zhì)量保證的問題。
[0006]本發(fā)明的目的主要是通過以下技術(shù)方案實(shí)現(xiàn)的:
[0007]本發(fā)明提供了一種音頻多編碼的編碼端,包括:
[0008]編碼控制模塊,用于根據(jù)輸入的多編碼參數(shù)信息、信息數(shù)據(jù)以及音頻數(shù)據(jù)生成編碼標(biāo)識(shí)并發(fā)送給多編碼器,并將信息數(shù)據(jù)以及音頻數(shù)據(jù)發(fā)送給信息編碼模塊或者直接將信息數(shù)據(jù)作為增強(qiáng)數(shù)據(jù)發(fā)送給多編碼器;
[0009]信息編碼模塊,包含多個(gè)信息編碼器,所述信息編碼器用于根據(jù)輸入的信息數(shù)據(jù)和/或音頻數(shù)據(jù)生成增強(qiáng)數(shù)據(jù)并發(fā)送給多編碼器;
[0010]音頻編碼器,用于將輸入的音頻數(shù)據(jù)進(jìn)行編碼后生成音頻編碼數(shù)據(jù)并發(fā)送給多編碼器;
[0011]多編碼器,用于根據(jù)接收到的編碼標(biāo)識(shí)、增強(qiáng)數(shù)據(jù)以及音頻編碼數(shù)據(jù)生成帶有增強(qiáng)數(shù)據(jù)的多編碼語音幀,并打包發(fā)送至音頻多編碼的解碼端。
[0012]進(jìn)一步地,所述編碼控制模塊具體用于,根據(jù)輸入的多編碼參數(shù)信息以及信息數(shù)據(jù)的類型制定編碼策略,并在接收到音頻數(shù)據(jù)時(shí),根據(jù)制定的編碼策略生成編碼標(biāo)識(shí);其中,所述編碼策略包括:
[0013]信息編碼器相關(guān)參數(shù)的配置以及多編碼器相關(guān)參數(shù)的配置。
[0014]進(jìn)一步地,所述編碼標(biāo)識(shí)用于幫助信息編碼器以及多編碼器解碼,具體包括:數(shù)據(jù)信息編碼有關(guān)信息、音頻數(shù)據(jù)編碼信息、增強(qiáng)數(shù)據(jù)編碼信息。
[0015]進(jìn)一步地,所述信息數(shù)據(jù)包括解碼端反饋信息、輔助信息、增強(qiáng)信息或者增值信息中一個(gè)或多個(gè)。
[0016]進(jìn)一步地,所述多編碼語音幀包括:多編碼幀頭和多編碼數(shù)據(jù),其中,多編碼幀頭用以確定幀頭長、音頻數(shù)據(jù)長度以及信息數(shù)據(jù)長度;多編碼數(shù)據(jù)包括:音頻數(shù)據(jù)和增強(qiáng)數(shù)據(jù)。
[0017]本發(fā)明還提供了一種音頻多編碼的解碼端,包括:
[0018]多編碼解析器,用于接收編碼端發(fā)來的多編碼語音幀并進(jìn)行解析,將解析后得到的編碼標(biāo)識(shí)、編碼后的增強(qiáng)數(shù)據(jù)發(fā)送給信息解碼模塊,將解析得到的編碼后的音頻數(shù)據(jù)發(fā)送給音頻解碼器;
[0019]信息解碼模塊,包括多個(gè)信息解碼器,所述信息解碼器用于根據(jù)編碼標(biāo)識(shí)對(duì)編碼后的增強(qiáng)數(shù)據(jù)進(jìn)行解碼,并將解碼后得到的信息數(shù)據(jù)發(fā)送出去;
[0020]音頻解碼器,用于對(duì)編碼后的音頻數(shù)據(jù)進(jìn)行解碼,將解碼后得到的音頻數(shù)據(jù)發(fā)送出去。
[0021]本發(fā)明還提供了一種音頻多編碼的編碼方法,包括:
[0022]編碼端根據(jù)輸入的多編碼參數(shù)信息、信息數(shù)據(jù)以及音頻數(shù)據(jù)生成編碼標(biāo)識(shí);
[0023]根據(jù)輸入的信息數(shù)據(jù)和/或音頻數(shù)據(jù)生成增強(qiáng)數(shù)據(jù);或者直接將信息數(shù)據(jù)作為增強(qiáng)數(shù)據(jù);
[0024]將輸入到編碼端的音頻數(shù)據(jù)進(jìn)行編碼后生成音頻編碼數(shù)據(jù);
[0025]根據(jù)編碼標(biāo)識(shí)、增強(qiáng)數(shù)據(jù)以及音頻編碼數(shù)據(jù)生成帶有增強(qiáng)數(shù)據(jù)的多編碼語音幀,并打包發(fā)送至音頻多編碼的解碼端。
[0026]進(jìn)一步地,生成編碼標(biāo)識(shí)的步驟具體包括:
[0027]根據(jù)輸入的多編碼參數(shù)信息以及信息數(shù)據(jù)的類型制定編碼策略,并在接收到音頻數(shù)據(jù)時(shí),根據(jù)制定的編碼策略生成編碼標(biāo)識(shí);其中,所述編碼策略包括:信息編碼器相關(guān)參數(shù)的配置以及多編碼器相關(guān)參數(shù)的配置。
[0028]進(jìn)一步地,所述編碼標(biāo)識(shí)具體包括:數(shù)據(jù)信息編碼有關(guān)信息、音頻數(shù)據(jù)編碼信息、增強(qiáng)數(shù)據(jù)編碼信息。
[0029]進(jìn)一步地,所述信息數(shù)據(jù)包括解碼端反饋信息、輔助信息、增強(qiáng)信息或者增值信息中一個(gè)或多個(gè)。
[0030]本發(fā)明還提供了一種音頻多編碼的解碼方法,包括:
[0031]解碼端接收編碼端發(fā)來的多編碼語音幀并進(jìn)行解析,解析后得到編碼標(biāo)識(shí)、編碼后的增強(qiáng)數(shù)據(jù)發(fā)送給以及音頻數(shù)據(jù);
[0032]根據(jù)編碼標(biāo)識(shí)對(duì)編碼后的增強(qiáng)數(shù)據(jù)進(jìn)行解碼,將解碼后得到信息數(shù)據(jù)發(fā)送出去;
[0033]對(duì)編碼后的音頻數(shù)據(jù)進(jìn)行解碼,將解碼后得到的音頻數(shù)據(jù)發(fā)送出去。
[0034]本發(fā)明有益效果如下:
[0035]本發(fā)明擴(kuò)展了音頻編解碼方法,提高了通過IP網(wǎng)絡(luò)傳輸媒體的服務(wù)質(zhì)量和用戶體驗(yàn)。
[0036]本發(fā)明的其他特征和優(yōu)點(diǎn)將在隨后的說明書中闡述,并且,部分的從說明書中變得顯而易見,或者通過實(shí)施本發(fā)明而了解。本發(fā)明的目的和其他優(yōu)點(diǎn)可通過在所寫的說明書、權(quán)利要求書、以及附圖中所特別指出的結(jié)構(gòu)來實(shí)現(xiàn)和獲得。
【專利附圖】
【附圖說明】
[0037]圖1為本發(fā)明實(shí)施例所述編碼端的結(jié)構(gòu)示意圖;
[0038]圖2本發(fā)明實(shí)施例中,多編碼語音幀的組成結(jié)構(gòu)示意圖;
[0039]圖3為本發(fā)明實(shí)施例所述解碼端的結(jié)構(gòu)示意圖;
[0040]圖4為本發(fā)明實(shí)施例所述編碼方法的流程不意圖;
[0041]圖5為本發(fā)明實(shí)施例所述解碼方法的流程示意圖。
【具體實(shí)施方式】
[0042]下面結(jié)合附圖來具體描述本發(fā)明的優(yōu)選實(shí)施例,其中,附圖構(gòu)成本申請(qǐng)一部分,并與本發(fā)明的實(shí)施例一起用于闡釋本發(fā)明的原理。
[0043]首先結(jié)合附圖1對(duì)本發(fā)明實(shí)施例所述編碼端進(jìn)行詳細(xì)說明。
[0044]如圖1所示,圖1為本發(fā)明實(shí)施例所述編碼端的結(jié)構(gòu)示意圖,具體包括:
[0045]編碼控制模塊,用于根據(jù)輸入的多編碼參數(shù)信息、信息數(shù)據(jù)以及音頻數(shù)據(jù)生成編碼標(biāo)識(shí)并發(fā)送給多編碼器,并將信息數(shù)據(jù)以及音頻數(shù)據(jù)發(fā)送給信息編碼模塊或者直接將信息數(shù)據(jù)作為增強(qiáng)數(shù)據(jù)發(fā)送給多編碼器;具體的說就是,編碼控制模塊根據(jù)輸入的多編碼參數(shù)信息以及信息數(shù)據(jù)的類型制定編碼策略,并在接收到音頻數(shù)據(jù)時(shí),根據(jù)制定的編碼策略生成編碼標(biāo)識(shí);其中,所述編碼策略包括:信息編碼器相關(guān)參數(shù)的配置以及多編碼器相關(guān)參數(shù)的配置。
[0046]信息編碼模塊,包含多個(gè)信息編碼器,所述信息編碼器用于根據(jù)輸入的信息數(shù)據(jù)和/或音頻數(shù)據(jù)生成增強(qiáng)數(shù)據(jù)并發(fā)送給多編碼器;
[0047]音頻編碼器,用于將輸入的音頻數(shù)據(jù)進(jìn)行編碼后生成音頻編碼數(shù)據(jù)并發(fā)送給多編碼器;
[0048]多編碼器,用于根據(jù)接收到的編碼標(biāo)識(shí)、增強(qiáng)數(shù)據(jù)以及音頻編碼數(shù)據(jù)生成帶有增強(qiáng)數(shù)據(jù)的多編碼語音幀,并打包發(fā)送至音頻多編碼的解碼端。
[0049]上述編碼標(biāo)識(shí)用于幫助信息編碼器以及多編碼器解碼,編碼標(biāo)識(shí)可以幫助信息編碼器、多編碼器編碼和解碼。例如,編碼標(biāo)識(shí)可以包含信息編碼有關(guān)信息(信息編碼器類型,參數(shù)),語音段編碼信息(語音編碼類型、采樣率、語音編碼數(shù)據(jù)長度)、增強(qiáng)數(shù)據(jù)編碼信息(編碼方法、增強(qiáng)數(shù)據(jù)長度)。編碼標(biāo)識(shí)長度可以固定或不等長,若不等長,則應(yīng)有標(biāo)識(shí)長度的字段。
[0050]上述增強(qiáng)數(shù)據(jù)可以直接就是外部輸入的關(guān)聯(lián)信息,也可以是對(duì)輸入的語音數(shù)據(jù)和關(guān)聯(lián)信息分別或一起做一定處理而生成的。例如,外部輸入文本提示信息直接作為增強(qiáng)數(shù)據(jù),解析后能引起接收端用戶注意,給用戶提示?;蛘?,對(duì)輸入的語音數(shù)據(jù)進(jìn)行語音識(shí)別處理,形成語音字幕,或同聲翻譯字幕等,生成增強(qiáng)數(shù)據(jù),幫助接收用戶理解通話內(nèi)容。增加數(shù)據(jù)也可以是對(duì)語音數(shù)據(jù)和關(guān)聯(lián)信息一起做處理而生成,例如對(duì)語音數(shù)據(jù)進(jìn)行FEC處理,生成語音數(shù)據(jù)的冗余數(shù)據(jù)作為增強(qiáng)數(shù)據(jù),在語音數(shù)據(jù)出現(xiàn)錯(cuò)誤時(shí),用增強(qiáng)數(shù)據(jù)進(jìn)行恢復(fù),從而保證通話質(zhì)量。增強(qiáng)數(shù)據(jù)也可以是通話伴生信息,例如,通話過程中提及某事物的背景資料。同時(shí)增強(qiáng)數(shù)據(jù)還可以是增值信息,例如字幕廣告等信息。
[0051]對(duì)增強(qiáng)信息的生成,要綜合考慮。在信道資源緊張的情況下,可以選擇不發(fā)送增強(qiáng)信息。優(yōu)先考慮解碼端的需求,根據(jù)解碼的反饋,確認(rèn)增強(qiáng)信息類型。增強(qiáng)信息的類型在通話過程中可動(dòng)態(tài)變化,例如,在網(wǎng)絡(luò)狀態(tài)好時(shí),增強(qiáng)信息可以從FEC數(shù)據(jù)換成字幕信息等。
[0052]上述信息數(shù)據(jù)包括解碼端反饋信息、輔助信息、增強(qiáng)信息或者增值信息中一個(gè)或多個(gè)。具體來說就是,上述信息數(shù)據(jù)包括解碼端反饋信息,反饋信息包括丟包率,抖動(dòng),碼率等信息,當(dāng)信息數(shù)據(jù)包括解碼端反饋信息時(shí),則編碼端應(yīng)更新語音編碼器和信息編碼器和相應(yīng)的編碼參數(shù),以滿足所述反饋信息,同時(shí)生成編碼標(biāo)識(shí);當(dāng)信息數(shù)據(jù)還包括記載與語音通話有關(guān)聯(lián)關(guān)系的輔助信息(輔助信息包括對(duì)語音幀數(shù)據(jù)的統(tǒng)計(jì)信息,對(duì)語音幀數(shù)據(jù)的文本描述,或?qū)獯a端的一些提示信息,還可以是幫助解碼端理解通話的一些文本表達(dá))時(shí),則信息編碼方式應(yīng)是輔助信息編碼器進(jìn)行編碼生成增強(qiáng)數(shù)據(jù),同時(shí)生成輔助信息編碼標(biāo)識(shí);當(dāng)信息數(shù)據(jù)還包括與語音通話有關(guān)聯(lián)關(guān)系的增值信息(增值信息包括節(jié)目伴生信息,或通話過程中提及的信息的詳細(xì)描述),則信息編碼方式應(yīng)是增值信息編碼器進(jìn)行編碼生成增強(qiáng)數(shù)據(jù),同時(shí)生成增值信息編碼標(biāo)識(shí);當(dāng)輸入信息數(shù)據(jù)為增強(qiáng)信息,則信息編碼方式應(yīng)是增強(qiáng)信息編碼器進(jìn)行編碼生成增強(qiáng)數(shù)據(jù),同時(shí)生成增強(qiáng)信息編碼標(biāo)識(shí);并且若輸入的信息數(shù)據(jù)為增值信息,則輸入的信息數(shù)據(jù)也可以不經(jīng)過信息編碼器編碼,直接作為增強(qiáng)數(shù)據(jù)。
[0053]上述多編碼語音幀的組成結(jié)構(gòu)如圖2所示,具體可以包括:多編碼幀頭和多編碼數(shù)據(jù),其中,多編碼幀頭用以確定幀頭長、音頻數(shù)據(jù)長度以及信息數(shù)據(jù)長度;多編碼數(shù)據(jù)包括:音頻數(shù)據(jù)和增強(qiáng)數(shù)據(jù)。
[0054]如圖3所示,圖3為本發(fā)明實(shí)施例所述解碼端的結(jié)構(gòu)示意圖,具體包括:
[0055]多編碼解析器,用于接收編碼端發(fā)來的多編碼語音幀并進(jìn)行解析,將解析后得到的編碼標(biāo)識(shí)、編碼后的增強(qiáng)數(shù)據(jù)發(fā)送給信息解碼模塊,將解析得到的編碼后的音頻數(shù)據(jù)發(fā)送給音頻解碼器;
[0056]信息解碼模塊,包括多個(gè)信息解碼器,所述信息解碼器用于根據(jù)編碼標(biāo)識(shí)對(duì)編碼后的增強(qiáng)數(shù)據(jù)進(jìn)行解碼,并將解碼后得到的信息數(shù)據(jù)發(fā)送出去;
[0057]音頻解碼器,用于對(duì)編碼后的音頻數(shù)據(jù)進(jìn)行解碼,將解碼后得到的音頻數(shù)據(jù)發(fā)送出去。
[0058]接下來結(jié)合附圖4對(duì)本發(fā)明實(shí)施例所述方法進(jìn)行詳細(xì)說明。
[0059]如圖4所示,圖4為本發(fā)明實(shí)施例所述編碼方法的流程示意圖,具體可以包括:
[0060]步驟401:將輸入的語音數(shù)據(jù),按用戶指定的語音編碼器編碼,生成語音編碼數(shù)據(jù);
[0061]步驟402:按照用戶輸入多編碼器參數(shù)信息,確定信息編碼器類型及配置相關(guān)參數(shù),生成編碼標(biāo)識(shí)。
[0062]步驟403:對(duì)輸入的語音數(shù)據(jù)和關(guān)聯(lián)信息做一定處理,信息編碼器生成增強(qiáng)數(shù)據(jù)。
[0063]步驟404:將編碼標(biāo)識(shí)、增強(qiáng)數(shù)據(jù)、語音編碼數(shù)據(jù)輸入多編碼器,多編碼器根據(jù)編碼標(biāo)識(shí),生成帶有增強(qiáng)信息的多編碼語音幀;
[0064]步驟405:將多編碼幀打包,并通過相應(yīng)信道傳輸至解碼端。[0065]如圖5所示,圖5為本發(fā)明實(shí)施例所述解碼方法的流程示意圖,具體可以包括:
[0066]步驟501:解碼端接收編碼端發(fā)來的多編碼語音幀并進(jìn)行解析,解析后得到編碼標(biāo)識(shí)、編碼后的增強(qiáng)數(shù)據(jù)發(fā)送給以及音頻數(shù)據(jù);
[0067]步驟502:根據(jù)編碼標(biāo)識(shí)對(duì)編碼后的增強(qiáng)數(shù)據(jù)進(jìn)行解碼,將解碼后得到信息數(shù)據(jù)發(fā)送出去;同時(shí)對(duì)編碼后的音頻數(shù)據(jù)進(jìn)行解碼,將解碼后得到的音頻數(shù)據(jù)發(fā)送出去。
[0068]綜上所述,本發(fā)明實(shí)施例提供了一種音頻多編碼傳輸方法及相應(yīng)裝置,用戶可以輸入一些與語音通話有關(guān)系的關(guān)聯(lián)信息,根據(jù)用戶設(shè)置的編碼策略,經(jīng)過信息編碼器生成增強(qiáng)數(shù)據(jù)或直接將關(guān)聯(lián)信息作為增強(qiáng)數(shù)據(jù),與經(jīng)過語音編碼器編碼后的語音編碼數(shù)據(jù),再次做多編碼操作,形成帶有增強(qiáng)信息的語音幀。語音幀經(jīng)過打包,在相應(yīng)信道傳輸至解碼端。為使幫助解碼端更好地理解編碼端發(fā)送的語音數(shù)據(jù),還可以通過多編碼器將用戶輸入的輔助信息與語音數(shù)據(jù)編碼成語音幀發(fā)送。在網(wǎng)絡(luò)出現(xiàn)異常情況下,解碼端仍然可以通過解碼出的輔助信息來幫助理解編碼端發(fā)送的語音的意思。本發(fā)明擴(kuò)展了音頻編解碼方法,提高了通過IP網(wǎng)絡(luò)傳輸媒體的服務(wù)質(zhì)量和用戶體驗(yàn)。
[0069]以上所述,僅為本發(fā)明較佳的【具體實(shí)施方式】,但本發(fā)明的保護(hù)范圍并不局限于此,任何熟悉本【技術(shù)領(lǐng)域】的技術(shù)人員在本發(fā)明揭露的技術(shù)范圍內(nèi),可輕易想到的變化或替換,都應(yīng)涵蓋在本發(fā)明的保護(hù)范圍之內(nèi)。因此,本發(fā)明的保護(hù)范圍應(yīng)該以權(quán)利要求書的保護(hù)范圍為準(zhǔn)。
【權(quán)利要求】
1.一種音頻多編碼的編碼端,其特征在于,包括: 編碼控制模塊,用于根據(jù)輸入的多編碼參數(shù)信息、信息數(shù)據(jù)以及音頻數(shù)據(jù)生成編碼標(biāo)識(shí)并發(fā)送給多編碼器,并將信息數(shù)據(jù)以及音頻數(shù)據(jù)發(fā)送給信息編碼模塊或者直接將信息數(shù)據(jù)作為增強(qiáng)數(shù)據(jù)發(fā)送給多編碼器; 信息編碼模塊,包含多個(gè)信息編碼器,所述信息編碼器用于根據(jù)輸入的信息數(shù)據(jù)和/或音頻數(shù)據(jù)生成增強(qiáng)數(shù)據(jù)并發(fā)送給多編碼器; 音頻編碼器,用于將輸入的音頻數(shù)據(jù)進(jìn)行編碼后生成音頻編碼數(shù)據(jù)并發(fā)送給多編碼器; 多編碼器,用于根據(jù)接收到的編碼標(biāo)識(shí)、增強(qiáng)數(shù)據(jù)以及音頻編碼數(shù)據(jù)生成帶有增強(qiáng)數(shù)據(jù)的多編碼語音幀,并打包發(fā)送至音頻多編碼的解碼端。
2.根據(jù)權(quán)利要求1所述的編碼端,其特征在于,所述編碼控制模塊具體用于,根據(jù)輸入的多編碼參數(shù)信息以及信息數(shù)據(jù)的類型制定編碼策略,并在接收到音頻數(shù)據(jù)時(shí),根據(jù)制定的編碼策略生成編碼標(biāo)識(shí);其中,所述編碼策略包括:信息編碼器相關(guān)參數(shù)的配置以及多編碼器相關(guān)參數(shù)的配置。
3.根據(jù)權(quán)利要求1所述的編碼端,其特征在于,所述編碼標(biāo)識(shí)用于幫助信息編碼器以及多編碼器解碼,具體包括:數(shù)據(jù)信息編碼有關(guān)信息、音頻數(shù)據(jù)編碼信息、增強(qiáng)數(shù)據(jù)編碼信息。
4.根據(jù)權(quán)利要求1所述的編碼端,其特征在于,所述信息數(shù)據(jù)包括解碼端反饋信息、輔助信息、增強(qiáng)信息或者增值信息中一個(gè)或多個(gè)。
5.根據(jù)權(quán)利要求1到中任意一項(xiàng)所述的編碼端,其特征在于,所述多編碼語音幀包括:多編碼幀頭和多編碼數(shù)據(jù),其中,多編碼幀頭用以確定幀頭長、音頻數(shù)據(jù)長度以及信息數(shù)據(jù)長度;多編碼數(shù)據(jù)包括:音頻數(shù)據(jù)和增強(qiáng)數(shù)據(jù)。
6.一種音頻多編碼的解碼端,其特征在于,包括: 多編碼解析器,用于接收編碼端發(fā)來的多編碼語音幀并進(jìn)行解析,將解析后得到的編碼標(biāo)識(shí)、編碼后的增強(qiáng)數(shù)據(jù)發(fā)送給信息解碼模塊,將解析得到的編碼后的音頻數(shù)據(jù)發(fā)送給音頻解碼器; 信息解碼模塊,包括多個(gè)信息解碼器,所述信息解碼器用于根據(jù)編碼標(biāo)識(shí)對(duì)編碼后的增強(qiáng)數(shù)據(jù)進(jìn)行解碼,并將解碼后得到的信息數(shù)據(jù)發(fā)送出去; 音頻解碼器,用于對(duì)編碼后的音頻數(shù)據(jù)進(jìn)行解碼,將解碼后得到的音頻數(shù)據(jù)發(fā)送出去。
7.一種音頻多編碼的編碼方法,其特征在于,包括: 編碼端根據(jù)輸入的多編碼參數(shù)信息、信息數(shù)據(jù)以及音頻數(shù)據(jù)生成編碼標(biāo)識(shí); 根據(jù)輸入的信息數(shù)據(jù)和/或音頻數(shù)據(jù)生成增強(qiáng)數(shù)據(jù);或者直接將信息數(shù)據(jù)作為增強(qiáng)數(shù)據(jù); 將輸入到編碼端的音頻數(shù)據(jù)進(jìn)行編碼后生成音頻編碼數(shù)據(jù); 根據(jù)編碼標(biāo)識(shí)、增強(qiáng)數(shù)據(jù)以及音頻編碼數(shù)據(jù)生成帶有增強(qiáng)數(shù)據(jù)的多編碼語音幀,并打包發(fā)送至音頻多編碼的解碼端。
8.根據(jù)權(quán)利要求7所述的編碼方法,其特征在于,生成編碼標(biāo)識(shí)的步驟具體包括: 根據(jù)輸入的多編碼參數(shù)信息以及信息數(shù)據(jù)的類型制定編碼策略,并在接收到音頻數(shù)據(jù)時(shí),根據(jù)制定的編碼策略生成編碼標(biāo)識(shí);其中,所述編碼策略包括:信息編碼器相關(guān)參數(shù)的配置以及多編碼器相關(guān)參數(shù)的配置。
9.根據(jù)權(quán)利要求7或8所述的編碼方法,其特征在于,所述編碼標(biāo)識(shí)具體包括:數(shù)據(jù)信息編碼有關(guān)信息、音頻數(shù)據(jù)編碼信息、增強(qiáng)數(shù)據(jù)編碼信息。
10.根據(jù)權(quán)利要求7或8所述的編碼端,其特征在于,所述信息數(shù)據(jù)包括解碼端反饋信息、輔助信息、增強(qiáng)信息或者增值信息中一個(gè)或多個(gè)。
11.一種音頻多編碼的解碼方法,其特征在于,包括: 解碼端接收編碼端發(fā)來的多編碼語音幀并進(jìn)行解析,解析后得到編碼標(biāo)識(shí)、編碼后的增強(qiáng)數(shù)據(jù)發(fā)送給以及音頻數(shù)據(jù); 根據(jù)編碼標(biāo)識(shí)對(duì)編碼后的增強(qiáng)數(shù)據(jù)進(jìn)行解碼,將解碼后得到信息數(shù)據(jù)發(fā)送出去; 對(duì)編碼后的音頻數(shù)據(jù)進(jìn)行 解碼,將解碼后得到的音頻數(shù)據(jù)發(fā)送出去。
【文檔編號(hào)】G10L19/005GK103812824SQ201210440924
【公開日】2014年5月21日 申請(qǐng)日期:2012年11月7日 優(yōu)先權(quán)日:2012年11月7日
【發(fā)明者】包樂輝 申請(qǐng)人:中興通訊股份有限公司