編碼方案確定的方法和設(shè)備的制造方法
【專利說(shuō)明】編碼方案確定的方法和設(shè)備
[0001]本申請(qǐng)是向中國(guó)知識(shí)產(chǎn)權(quán)局提交的申請(qǐng)日為2009年7月9日、申請(qǐng)?zhí)枮?00980135140.7、發(fā)明名稱為“編碼方案確定的方法和設(shè)備”的申請(qǐng)的分案申請(qǐng)。
技術(shù)領(lǐng)域
[0002]—個(gè)或多個(gè)實(shí)施例涉及一種用于對(duì)具有音樂(lè)和語(yǔ)音特性的音頻信號(hào)進(jìn)行編碼或解碼的方法和設(shè)備,更具體地講,涉及一種通過(guò)小量比特流來(lái)有效地對(duì)這種音頻信號(hào)進(jìn)行編碼和解碼的方法和設(shè)備。
【背景技術(shù)】
[0003]當(dāng)對(duì)音頻進(jìn)行編碼時(shí),可通過(guò)分析輸入信號(hào)的特性來(lái)選擇多個(gè)各種編碼方案(即編碼模式)之一來(lái)對(duì)輸入信號(hào)進(jìn)行編碼。例如,可選擇頻域編碼模式(諸如先進(jìn)音頻編解碼(AAC)方法)或者時(shí)域編碼模式(諸如碼激勵(lì)線性預(yù)測(cè)編碼(CELP)方法)以對(duì)輸入信號(hào)進(jìn)行編碼。傳統(tǒng)地,如果確定輸入信號(hào)的特性更接近代表音樂(lè)特性,則選擇頻域編碼模式來(lái)對(duì)輸入信號(hào)進(jìn)行編碼。如果確定輸入信號(hào)的特性更接近代表語(yǔ)音特性,則選擇時(shí)域編碼模式來(lái)對(duì)輸入信號(hào)編碼。
[0004]這里,在這種操作中,當(dāng)選擇輸入信號(hào)的編碼模式時(shí),可存儲(chǔ)先前幀中的信號(hào)的特性,并且可基于存儲(chǔ)的先前幀的特性以及當(dāng)前幀的特性來(lái)確定當(dāng)前幀的編碼模式。然而,在這種方法中,信號(hào)編碼模式改變的次數(shù)以及由這種改變引起的任何相應(yīng)延遲應(yīng)被減少。
【附圖說(shuō)明】
[0005]圖1示出根據(jù)一個(gè)或多個(gè)實(shí)施例的編碼方案確定方法;
[0006]圖2示出根據(jù)一個(gè)或多個(gè)實(shí)施例的編碼方案確定方法;
[0007]圖3示出根據(jù)一個(gè)或多個(gè)實(shí)施例的計(jì)算語(yǔ)音存在概率(SPP)的歷史值的方法;
[0008]圖4示出根據(jù)一個(gè)或多個(gè)實(shí)施例的編碼方案確定方法(例如,圖2的編碼方案確定方法)的編碼方案改變操作;
[0009]圖5示出根據(jù)一個(gè)或多個(gè)實(shí)施例的編碼方案確定方法;
[0010]圖6示出根據(jù)一個(gè)或多個(gè)實(shí)施例的無(wú)聲時(shí)間段和非無(wú)聲時(shí)間段;
[0011]圖7示出根據(jù)一個(gè)或多個(gè)實(shí)施例的編碼方案確定設(shè)備;
[0012]圖8示出根據(jù)一個(gè)或多個(gè)實(shí)施例的編碼方案確定設(shè)備;
[0013]圖9示出根據(jù)一個(gè)或多個(gè)實(shí)施例的編碼方案確定設(shè)備。
【發(fā)明內(nèi)容】
[0014]技術(shù)問(wèn)題
[0015]—個(gè)或多個(gè)實(shí)施例包括用于從多個(gè)編碼模式確定有效信號(hào)編碼模式的方法和設(shè)備。
[0016]技術(shù)方案
[0017]根據(jù)一個(gè)或多個(gè)實(shí)施例,提供了一種編碼方案確定方法,該方法基于存儲(chǔ)的與一個(gè)或多個(gè)先前幀中的信號(hào)有關(guān)的信息或參數(shù)確定當(dāng)前幀中的信號(hào)的編碼方案,所述方法包括:確定當(dāng)前幀中的信號(hào)是否與無(wú)聲時(shí)間段相應(yīng);當(dāng)當(dāng)前幀中的信號(hào)與無(wú)聲時(shí)間段相應(yīng)時(shí),重置存儲(chǔ)的信息或參數(shù)。
[0018]根據(jù)一個(gè)或多個(gè)實(shí)施例,提供了一種編碼方案確定方法,包括:確定當(dāng)前幀中的信號(hào)的編碼方案;計(jì)算當(dāng)前幀中的信號(hào)的語(yǔ)音存在概率或音樂(lè)存在概率;基于一個(gè)或多個(gè)先前幀中的信號(hào)的語(yǔ)音存在概率或音樂(lè)存在概率的歷史以及計(jì)算的語(yǔ)音存在概率或音樂(lè)存在概率,來(lái)確定是否改變已確定的編碼方案;當(dāng)是否改變已確定的編碼方案的確定指示應(yīng)改變編碼方案時(shí),改變已確定的編碼方案。
[0019]根據(jù)一個(gè)或多個(gè)實(shí)施例,提供了一種編碼方案確定設(shè)備,包括:存儲(chǔ)單元,存儲(chǔ)與一個(gè)或多個(gè)先前幀中的信號(hào)有關(guān)的信息或參數(shù);編碼方案確定單元,通過(guò)使用存儲(chǔ)的信息或參數(shù)來(lái)確定當(dāng)前幀中的信號(hào)的編碼方案;無(wú)聲時(shí)間段確定單元,確定當(dāng)前幀中的信號(hào)是否與無(wú)聲時(shí)間段相應(yīng);重置單元,如果當(dāng)前幀中的信號(hào)與無(wú)聲時(shí)間段相應(yīng),則重置存儲(chǔ)的信息或參數(shù)。
[0020]根據(jù)一個(gè)或多個(gè)實(shí)施例,提供了一種編碼方案確定設(shè)備,包括:編碼方案確定單元,確定當(dāng)前幀中的信號(hào)的編碼方案;信號(hào)分析單元,計(jì)算當(dāng)前幀中的信號(hào)的語(yǔ)音存在概率或音樂(lè)存在概率;改變確定單元,基于一個(gè)或多個(gè)先前幀中的信號(hào)的語(yǔ)音存在概率或音樂(lè)存在概率的歷史以及計(jì)算的語(yǔ)音存在概率或音樂(lè)存在概率,來(lái)確定是否改變已確定的編碼方案;模式改變單元,當(dāng)改變確定單元確定改變已確定的編碼方案時(shí),改變已確定的編碼方案。
[0021]根據(jù)一個(gè)或多個(gè)實(shí)施例,提供了一種記錄有控制至少一個(gè)處理裝置執(zhí)行編碼方案確定方法的計(jì)算機(jī)可讀代碼的計(jì)算機(jī)可讀記錄介質(zhì),該方法基于存儲(chǔ)的與一個(gè)或多個(gè)先前幀中的信號(hào)有關(guān)的信息或參數(shù)確定當(dāng)前幀中的信號(hào)的編碼方案,所述方法包括:確定當(dāng)前幀中的信號(hào)是否與無(wú)聲時(shí)間段相應(yīng);當(dāng)當(dāng)前幀中的信號(hào)與無(wú)聲時(shí)間段相應(yīng)時(shí),重置存儲(chǔ)的信息或參數(shù)。
[0022]根據(jù)一個(gè)或多個(gè)實(shí)施例,提供了一種記錄有控制至少一個(gè)處理裝置執(zhí)行編碼方案確定方法的計(jì)算機(jī)可讀代碼的計(jì)算機(jī)可讀記錄介質(zhì),該方法包括:確定當(dāng)前幀中的信號(hào)的編碼方案;計(jì)算當(dāng)前幀中的信號(hào)的語(yǔ)音存在概率或音樂(lè)存在概率;基于一個(gè)或多個(gè)先前幀中的信號(hào)的語(yǔ)音存在概率或音樂(lè)存在概率的歷史以及計(jì)算的語(yǔ)音存在概率或音樂(lè)存在概率,來(lái)確定是否改變已確定的編碼方案;當(dāng)是否改變已確定的編碼方案的確定指示應(yīng)改變編碼方案時(shí),改變已確定的編碼方案。
【具體實(shí)施方式】
[0023]現(xiàn)在將詳細(xì)參照實(shí)施例,其示例在附圖中示出,其中,相同的標(biāo)號(hào)始終表示相同的部件。在這點(diǎn)上,本實(shí)施例可具有不同形式,并且不應(yīng)解釋為受限于這里闡述的說(shuō)明書(shū)。因此,下面僅通過(guò)參照附圖描述實(shí)施例以解釋本說(shuō)明書(shū)的各方面。
[0024]圖1示出根據(jù)一個(gè)或多個(gè)實(shí)施例的編碼方案(即,編碼模式)確定方法。
[0025]參照?qǐng)D1,開(kāi)始,確定當(dāng)前幀中的信號(hào)是否與無(wú)聲時(shí)間段(S卩,安靜時(shí)間段)相應(yīng)(操作100)??苫诋?dāng)前幀中的信號(hào)的能量或特性來(lái)執(zhí)行操作100中的確定。僅作為示例,如果能量小于閾值,則可確定當(dāng)前幀中的信號(hào)與無(wú)聲時(shí)間段相應(yīng),注意另外的和/或可選的無(wú)聲檢測(cè)技術(shù)同樣可用。
[0026]如果操作100的確定100指示當(dāng)前幀中的信號(hào)與無(wú)聲時(shí)間段相應(yīng),則可存在對(duì)與一個(gè)或多個(gè)先前幀中的信號(hào)有關(guān)的信息或參數(shù)的重置??纱鎯?chǔ)所述信息或參數(shù)以后續(xù)使用于從多個(gè)信號(hào)編碼方案中確定例如當(dāng)前幀中的信號(hào)的合適的編碼方案(操作110)。
[0027]例如,與先前幀中的信號(hào)有關(guān)的信息或參數(shù)可以是關(guān)于長(zhǎng)時(shí)信號(hào)特征的信息或參數(shù)。例如,在操作110,在多個(gè)長(zhǎng)時(shí)特征中,可重置與在預(yù)設(shè)數(shù)量的先前幀中的信號(hào)的短時(shí)特征有關(guān)的平均值或者預(yù)定幀中的信號(hào)的語(yǔ)音存在概率或音樂(lè)存在概率的歷史值。
[0028]這里,長(zhǎng)時(shí)特征是指通過(guò)分析一個(gè)或多個(gè)先前幀中的信號(hào)的短時(shí)特征的轉(zhuǎn)變而獲得的信息。例如,長(zhǎng)時(shí)特征可包括與預(yù)設(shè)數(shù)量的先前幀中的信號(hào)的短時(shí)特征有關(guān)的平均值、預(yù)定幀中的信號(hào)的語(yǔ)音存在概率或音樂(lè)存在概率以及語(yǔ)音存在概率或音樂(lè)存在概率的歷史值。例如,短時(shí)特征是指每幀的特有特性,并且可包括從包括下述信息或參數(shù)的組中選擇的至少一個(gè):例如線性預(yù)測(cè)長(zhǎng)期預(yù)測(cè)(LP-LTP)增益、頻譜傾斜、過(guò)零率和頻譜自相關(guān)。
[0029]在執(zhí)行操作110之后,確定是否使用與緊接的先前幀中的信號(hào)相同的編碼方案對(duì)當(dāng)前幀中的信號(hào)進(jìn)行編碼(操作120)。
[0030]如果操作100的確定指示當(dāng)前幀中的信號(hào)不與無(wú)聲時(shí)間段相應(yīng),則執(zhí)行對(duì)當(dāng)前幀的分析以分析當(dāng)前幀中的信號(hào)的特性,從而例如提取與當(dāng)前幀中的信號(hào)有關(guān)的信息或參數(shù)。隨后基于與先前幀中的信號(hào)有關(guān)的信息或參數(shù)以及與當(dāng)前幀中的信號(hào)有關(guān)的信息或參數(shù),來(lái)確定多種信號(hào)編碼方案中的哪種編碼方案應(yīng)被用于當(dāng)前幀中的信號(hào)(操作130)。在操作130中提取的與當(dāng)前幀中的信號(hào)有關(guān)的信息或參數(shù)的示例包括上述短時(shí)特征和長(zhǎng)時(shí)特征。
[0031]這里,這種信號(hào)編碼方案的示例包括時(shí)域編碼模式(諸如碼激勵(lì)線性預(yù)測(cè)編碼(CELP)方法)和頻域編碼模式(諸如變換碼激勵(lì)(TCX)方法或高級(jí)音頻編解碼器(AAC)方法)。信號(hào)編碼方案的示例也可包括語(yǔ)音編碼模式和音樂(lè)編碼模式。這里,另外的和/或可選的模式可被使用,并且實(shí)施例不受限于這里指示的編碼模式。
[0032]在執(zhí)行操作120或操作130之后,確定當(dāng)前幀是否是最后幀(操作140)。
[0033]如果操作140的確定指示當(dāng)前幀不是最后幀,則可接收后續(xù)幀(操作150),并且可對(duì)后續(xù)幀重復(fù)執(zhí)行操作1〇〇至150。
[0034]圖2示出根據(jù)一個(gè)或多個(gè)實(shí)施例的編碼方案確定方法。
[0035]參照?qǐng)D2,開(kāi)始,分析當(dāng)前幀中的信號(hào)的特性以便提取與當(dāng)前幀中的信號(hào)有關(guān)的信息或參數(shù)(操作200)。例如,在操作200中提取的信息或參數(shù)的示例包括短時(shí)特征和長(zhǎng)時(shí)特征。短時(shí)特征是指每幀的特有特性并且短時(shí)特征可包括例如下述信息或參數(shù)的至少一個(gè):諸如LP-LTP增益、頻譜傾斜、過(guò)零率和頻譜自相關(guān)。該處理可還包括這些信息或參數(shù)中的一個(gè)或多個(gè)的選擇。長(zhǎng)時(shí)特征是指通過(guò)分析一個(gè)或多個(gè)先前幀中的信號(hào)的短時(shí)特征的轉(zhuǎn)變而獲得的信息。例如,長(zhǎng)時(shí)特征可包括與在預(yù)設(shè)數(shù)量的先前幀中的信號(hào)的短時(shí)特征有關(guān)的平均值、預(yù)定幀中的信號(hào)的語(yǔ)音存在概率或音樂(lè)存在概率以及語(yǔ)音存在概率或音樂(lè)存在概率的歷史值。
[0036]例如,在長(zhǎng)時(shí)特征中,可通過(guò)使用下面的等式1來(lái)計(jì)算語(yǔ)音存在概率(SPP)。下文中,將代表性地描述SPP。然而,本發(fā)明實(shí)施例不限于SPP。
[0037]等式 1 :
[0038]SPP = SNR_ff · SNR_SP+TILT_ff · TILT_SP+ZC_ff · ZC_SP
[0039]這里,SNR_W表示關(guān)于SNR_SP的權(quán)重,TILT_W表示關(guān)于TILT_SP的權(quán)重,ZC_W表示關(guān)于ZC_SP的權(quán)重,SNR_SP表示關(guān)于LP-LTP增益的長(zhǎng)時(shí)特征并且可通過(guò)使用等式2來(lái)計(jì)算,TILT_SP表示關(guān)于頻譜傾斜的長(zhǎng)時(shí)特征并且可通過(guò)使用下面的等式3來(lái)計(jì)算,例如ZC_SP表示關(guān)于過(guò)零率的長(zhǎng)時(shí)特征并且可通過(guò)下面的等式4來(lái)計(jì)算,這僅作為示例。
[0040]等式 2 :
[0041]if(SNR_VAR>SNR_THR)
[0042]SNR_SP = a*SNR_SP+(l-a)*SNR_VAR
[0043]else
[0044]S