用于確定編碼模式的方法和設(shè)備、用于對(duì)音頻信號(hào)進(jìn)行編碼的方法和設(shè)備以及用于對(duì)音 ...的制作方法
【技術(shù)領(lǐng)域】
[0001] 與示例性實(shí)施例一致的設(shè)備和方法涉及音頻編碼和音頻解碼,更具體地講,涉及 一種通過(guò)確定適合于音頻信號(hào)的特性的編碼模式并防止頻繁的編碼模式切換來(lái)確定用于 提高重構(gòu)的音頻信號(hào)的質(zhì)量的編碼模式的方法和設(shè)備,一種用于對(duì)音頻信號(hào)進(jìn)行編碼的方 法和設(shè)備以及一種用于對(duì)音頻信號(hào)進(jìn)行解碼的方法和設(shè)備。
【背景技術(shù)】
[0002] 廣為人知的是,在頻域?qū)σ魳?lè)信號(hào)進(jìn)行編碼是有效率的并且在時(shí)域?qū)φZ(yǔ)音信號(hào)進(jìn) 行編碼是有效率的。因此,已提出了用于確定混合有音樂(lè)信號(hào)和語(yǔ)音信號(hào)的音頻信號(hào)的類 別并確定與所確定的類別相應(yīng)的編碼模式的各種技術(shù)。
[0003] 然而,由于頻率編碼模式切換,不僅發(fā)生延遲,還使解碼的聲音質(zhì)量降低。此外,由 于不存在用于校正最初確定的編碼模式(即,類別)的技術(shù),因此,如果在確定編碼模式期 間發(fā)生錯(cuò)誤,則重構(gòu)的音頻信號(hào)的質(zhì)量降低。
【發(fā)明內(nèi)容】
[0004] 技術(shù)問(wèn)題
[0005] 一個(gè)或更多個(gè)示例性實(shí)施例的多個(gè)方面提供了一種用于通過(guò)確定適合于音頻信 號(hào)的特性的編碼模式來(lái)確定用于提高重構(gòu)的音頻信號(hào)的質(zhì)量的編碼模式的方法和設(shè)備,一 種用于對(duì)音頻信號(hào)進(jìn)行編碼的方法和設(shè)備以及一種用于對(duì)音頻信號(hào)進(jìn)行解碼的方法和設(shè) 備。
[0006] -個(gè)或更多個(gè)示例性實(shí)施例的多個(gè)方面提供了一種用于確定適合于音頻信號(hào)的 特性的編碼模式并減少由于頻繁的編碼模式切換而引起的時(shí)延的方法和設(shè)備,一種用于對(duì) 音頻信號(hào)進(jìn)行編碼的方法和設(shè)備以及一種用于對(duì)音頻信號(hào)進(jìn)行解碼的方法和設(shè)備。
[0007] 解決方案
[0008] 根據(jù)一個(gè)或更多個(gè)示例性實(shí)施例的一方面,一種確定編碼模式的方法,所述方法 包括:根據(jù)音頻信號(hào)的特性,將包括第一編碼模式和第二編碼模式的多個(gè)編碼模式之中的 一個(gè)編碼模式確定為初始編碼模式;如果在對(duì)初始編碼模式的確定中存在錯(cuò)誤,則通過(guò)將 初始編碼模式校正為第三編碼模式來(lái)產(chǎn)生經(jīng)過(guò)校正的編碼模式。
[0009] 根據(jù)一個(gè)或更多個(gè)示例性實(shí)施例的一方面,一種對(duì)音頻信號(hào)進(jìn)行編碼的方法,所 述方法包括:根據(jù)音頻信號(hào)的特性,將包括第一編碼模式和第二編碼模式的多個(gè)編碼模式 之中的一個(gè)編碼模式確定為初始編碼模式;如果在對(duì)初始編碼模式的確定中存在錯(cuò)誤,則 通過(guò)將初始編碼模式校正為第三編碼模式來(lái)產(chǎn)生經(jīng)過(guò)校正的編碼模式;基于初始編碼模式 或經(jīng)過(guò)校正的編碼模式對(duì)音頻信號(hào)執(zhí)行不同的編碼處理。
[0010] 根據(jù)一個(gè)或更多個(gè)示例性實(shí)施例的一方面,一種對(duì)音頻信號(hào)進(jìn)行解碼的方法,所 述方法包括:對(duì)包括初始編碼模式和第三編碼模式之一的比特流進(jìn)行解析,并基于初始編 碼模式或第三編碼模式對(duì)所述比特流執(zhí)行不同的解碼處理,其中,所述初始編碼模式是通 過(guò)根據(jù)音頻信號(hào)的特性在包括第一編碼模式和第二編碼模式的多個(gè)編碼模式之中確定一 個(gè)編碼模式而獲得的,所述第三編碼模式是在對(duì)初始編碼模式的確定中存在錯(cuò)誤的情況下 從初始編碼模式進(jìn)行校正而得到的。
[0011] 有益效果
[0012] 根據(jù)示例性實(shí)施例,通過(guò)基于對(duì)初始編碼模式的校正以及與拖尾長(zhǎng)度相應(yīng)的幀的 編碼模式來(lái)確定當(dāng)前幀的最終編碼模式,可在防止多個(gè)幀之間的頻繁的編碼模式切換的同 時(shí)選擇出適應(yīng)于音頻信號(hào)的特性的編碼模式。
【附圖說(shuō)明】
[0013] 圖1是示出根據(jù)示例性實(shí)施例的音頻編碼設(shè)備的配置的框圖;
[0014] 圖2是示出根據(jù)另一示例性實(shí)施例的音頻編碼設(shè)備的配置的框圖;
[0015] 圖3是示出根據(jù)示例性實(shí)施例的編碼模式確定單元的配置的框圖;
[0016] 圖4是示出根據(jù)示例性實(shí)施例的初始編碼模式確定單元的配置的框圖;
[0017] 圖5是示出根據(jù)示例性實(shí)施例的特征參數(shù)提取單元的配置的框圖;
[0018] 圖6是示出根據(jù)示例性實(shí)施例的線性預(yù)測(cè)域編碼和譜域之間的自適應(yīng)切換方法 的示圖;
[0019] 圖7是示出根據(jù)示例性實(shí)施例的編碼模式校正單元的操作的示圖;
[0020] 圖8是示出根據(jù)示例性實(shí)施例的音頻解碼設(shè)備的配置的框圖;
[0021] 圖9是示出根據(jù)另一示例性實(shí)施例的音頻解碼設(shè)備的配置的框圖。
【具體實(shí)施方式】
[0022] 現(xiàn)在將詳細(xì)描述實(shí)施例,其示例在附圖中被示出,其中,相同的標(biāo)號(hào)始終是指相同 的元件。在這一點(diǎn)上,本實(shí)施例可具有不同的形式并且不應(yīng)該被解釋為受限于在此闡述的 描述。因此,通過(guò)參照附圖,在下面實(shí)施例僅被描述用于解釋本說(shuō)明書的多個(gè)方面。
[0023] 諸如"連接的"和"鏈接的"的術(shù)語(yǔ)可被用于指示直接連接或鏈接的狀態(tài),但應(yīng)理 解,另一組件可被置于其間。
[0024] 諸如"第一"和"第二"的術(shù)語(yǔ)可被用于描述各種組件,但所述組件不應(yīng)受限于所 述術(shù)語(yǔ)。所述術(shù)語(yǔ)可僅被用于使一個(gè)組件與另一組件區(qū)分開。
[0025] 在示例性實(shí)施例中描述的單元被獨(dú)立示出以指示不同的特性功能,并且它不意味 著每個(gè)單元由一個(gè)單獨(dú)的硬件組件或軟件組件形成。為了便于解釋而示出每個(gè)單元,并且 多個(gè)單元可形成一個(gè)單元,一個(gè)單元可被劃分為多個(gè)單元。
[0026] 圖1是示出根據(jù)示例性實(shí)施例的音頻編碼設(shè)備100的配置的框圖。
[0027] 圖1中示出的音頻編碼設(shè)備100可包括編碼模式確定單元110、切換單元120、譜 域編碼單元130、線性預(yù)測(cè)域編碼單元140和比特流產(chǎn)生單元150。線性預(yù)測(cè)域編碼單元 140可包括時(shí)域激勵(lì)編碼單元141和頻域激勵(lì)編碼單元143,其中,線性預(yù)測(cè)域編碼單元140 可被實(shí)現(xiàn)為時(shí)域激勵(lì)編碼單元141和頻域激勵(lì)編碼單元143中的至少一個(gè)。除非必須被實(shí) 現(xiàn)為單獨(dú)的硬件,否則上述組件可被集成為至少一個(gè)模塊并且可被實(shí)現(xiàn)為至少一個(gè)處理器 (未示出)。這里,術(shù)語(yǔ)音頻信號(hào)可指音樂(lè)信號(hào)、語(yǔ)音信號(hào)或它們的混合信號(hào)。
[0028] 參照?qǐng)D1,編碼模式確定單元110可分析音頻信號(hào)的特性以確定音頻信號(hào)的類別, 并根據(jù)分類的結(jié)果來(lái)確定編碼模式。對(duì)編碼模式的確定可以以超幀、幀或頻段為單位來(lái)執(zhí) 行??蛇x擇地,對(duì)編碼模式的確定可以以多個(gè)超幀組、多個(gè)幀組或多個(gè)頻段組為單位來(lái)執(zhí) 行。這里,編碼模式的示例可包括譜域和時(shí)域或線性預(yù)測(cè)域,但不限于此。如果處理器的性 能和處理速度足夠并且由于編碼模式切換引起的時(shí)延可被解決,則編碼模式可被細(xì)分,并 且編碼方案也可根據(jù)編碼模式被細(xì)分。根據(jù)示例性實(shí)施例,編碼模式確定單元110可將音 頻信號(hào)的初始編碼模式確定為譜域編碼模式和時(shí)域編碼模式之一。根據(jù)另一示例性實(shí)施 例,編碼模式確定單元110可將音頻信號(hào)的初始編碼模式確定為譜域編碼模式、時(shí)域激勵(lì) 編碼模式和頻域激勵(lì)編碼模式之一。如果譜域編碼模式被確定為初始編碼模式,則編碼模 式確定單元110可將初始編碼模式校正為譜域編碼模式和頻域激勵(lì)編碼模式之一。如果 時(shí)域編碼模式(即,時(shí)域激勵(lì)編碼模式)被確定為初始編碼模式,則編碼模式確定單元Iio 可將初始編碼模式校正為時(shí)域激勵(lì)編碼模式和頻域激勵(lì)編碼模式之一。如果時(shí)域激勵(lì)編碼 模式被確定為初始編碼模式,則對(duì)最終編碼模式的確定可被選擇性地執(zhí)行。換句話說(shuō),初始 編碼模式(即,時(shí)域激勵(lì)編碼模式)可被保持。編碼模式確定單元Iio可確定與拖尾長(zhǎng)度 (hangover length)相應(yīng)的多個(gè)幀的編碼模式,并可為當(dāng)前幀確定最終編碼模式。根據(jù)示例 性實(shí)施例,如果當(dāng)前幀的初始編碼模式或經(jīng)過(guò)校正的編碼模式與多個(gè)先前幀(例如,7個(gè)先 前幀)的編碼模式相同,則相應(yīng)的初始編碼模式或經(jīng)過(guò)校正的編碼模式可被確定為當(dāng)前幀 的最終編碼模式。同時(shí),如果當(dāng)前幀的初始編碼模式或經(jīng)過(guò)校正的編碼模式與多個(gè)先前幀 (例如,7個(gè)先前幀)的編碼模式不相同,則編碼模式確定單元110可將恰在當(dāng)前幀之前的 幀的編碼模式確定為當(dāng)前幀的最終編碼模式。
[0029] 如上所述,通過(guò)基于對(duì)初始編碼模式的校正以及與拖尾長(zhǎng)度相應(yīng)的幀的編碼模式 來(lái)確定當(dāng)前幀的最終編碼模式,可在防止幀之間的頻繁的編碼模式切換的同時(shí)選擇出適應(yīng) 于音頻信號(hào)的特性的編碼模式。
[0030] 一般來(lái)說(shuō),時(shí)域編碼(即,時(shí)域激勵(lì)編碼)對(duì)于語(yǔ)音信號(hào)會(huì)是有效率的,譜域編碼 對(duì)于音樂(lè)信號(hào)會(huì)是有效率的,并且頻域激勵(lì)編碼對(duì)于言語(yǔ)(vocal)信號(hào)和/或諧波信號(hào)會(huì) 是有效率的。
[0031] 根據(jù)由編碼模式確定單元110確定的編碼模式,切換單元120可向譜域編碼單元 130或線性預(yù)測(cè)域編碼單元140提供音頻信號(hào)。如果線性預(yù)測(cè)域編碼單元140被實(shí)現(xiàn)為時(shí) 域激勵(lì)編碼單元141,則切換單元120可包括總共兩個(gè)分支。如果線性預(yù)測(cè)域編碼單元140 被實(shí)現(xiàn)為時(shí)域激勵(lì)編碼單元141和頻域激勵(lì)編碼單元143,則切換單元120可具有總共3個(gè) 分支。
[0032] 譜域編碼單元130可在譜域?qū)σ纛l信號(hào)進(jìn)行編碼。譜域可指頻域或變換域。適合 于譜域編碼單元130的編碼方法的示例可包括高級(jí)音頻編碼(AAC)或包括改進(jìn)離散余弦變 換(MDCT)和階乘脈沖編碼(FPC)的組合,但不限于此。詳細(xì)地講,其它量化技術(shù)和熵編碼 技術(shù)可用來(lái)代替FPC。在譜域編碼單元130中對(duì)音樂(lè)信號(hào)進(jìn)行編碼會(huì)是有效率的。
[0033] 線性預(yù)測(cè)域編碼單元140可在線性預(yù)測(cè)域?qū)σ纛l信號(hào)進(jìn)行編碼。線性預(yù)測(cè)域可指 激勵(lì)域或時(shí)域。線性預(yù)測(cè)域編碼單元140可被實(shí)現(xiàn)為時(shí)域激勵(lì)編碼單元141,或者可被實(shí)現(xiàn) 為包括時(shí)域激勵(lì)編碼單元141和頻域激勵(lì)編碼單元143。適合于時(shí)域激勵(lì)編碼單元141的 編碼方法的示例可包括碼激勵(lì)線性預(yù)測(cè)(C