一種基于頻譜映射的端到端的語音加解密方法
【專利摘要】本發(fā)明公開了一種基于頻譜映射的端到端語音加密方法,包括以下步驟:對數字語音信號進行線性預測(LPC)分析得到LPC系數;將LPC系數轉換為線性譜頻率(LSF)系數,對LSF系數按照給定的密鑰進行映射變換,再將映射后的LSF系數轉換為LPC系數,并構造出合成濾波器;原始數字語音信號通過線性預測,得到預測殘差信號,最后將預測殘差信號通過由映射變換后的LPC系數所構造的合成濾波器得到加密后的語音信號。保證了加密語音信號的語音特征,實現有效的語音加密。
【專利說明】
一種基于頻譜映射的端到端的語音加解密方法
技術領域
[0001] 本發(fā)明涉及一種語音加解密方法,具體地涉及一種基于線性預測編碼和頻譜映射 的語音加解密方法。
【背景技術】
[0002] 語音是人類獲取信息的重要手段,語音通信是現代通信中最有效最方便的手段之 一。隨著通信技術的發(fā)展,各種各樣的語音通信出現在人們的生活中。但是現實生活中的語 音通信難免地會受到安全威脅,如竊聽、電話跟蹤、電話劫持和拒絕服務等。因此,語音加密 對于保證語音的安全十分重要。語音加密的重要性表現在兩個方面:一方面,隨著人們保護 自己隱私權意識逐步上升,對語音加密的重視程度越來越高;另一方面,在軍事通信、商業(yè) 洽談、政治談判等特殊應用中,信息一旦被泄露,將會造成巨大損失,在這里語音加密十分 必要。
[0003] 然而,傳統(tǒng)的移動通信缺乏端到端的加密機制,移動網絡節(jié)點設備間傳輸的為經 過模數轉換的明文信息,被竊聽的風險極高?,F有的移動通信過程一般經歷手機端語音信 號的模數轉化、編碼傳輸、基站解碼再編碼技術,手機端解碼數模轉換為語音信號等幾個過 程。而現有的加密手段多在編碼過程之后進行加密,再通過基站的解密解碼再編碼加密,這 種加密方式是建立在核心網絡部分安全可信的前提下,因為只考慮了無線信道部分的安 全,其明文信息對基站可見,導致系統(tǒng)不能為用戶提供端到端的安全通信。編碼后加密的方 式不可否認的具有加密數據少,占用信道小等優(yōu)點,但其對基站透明的特點使得這種加密 方式仍存在被竊聽的風險。
[0004] 中國專利文獻CN201210055857公開了一種語音加密系統(tǒng),提出了一種語音加密算 法,首先對語音信號按照設定長度分段進行時域到頻域的轉換,然后在頻域對語音信號頻 率分組置亂,最后將頻域轉換為時域形成加密后的語音信號。雖然可以在一定程度上降低 被竊聽的風險,但是,經過理論分析與實驗證明,該方法合成的加密語音信號對加解密兩端 的同步要求高,實用性較差,無法廣泛的應用。
【發(fā)明內容】
[0005] 為了解決現有技術存在的問題,本發(fā)明目的是:提供一種基于頻譜映射的端到端 語音加解密方法,基于線性預測編碼和頻譜映射,在加密端對數字語音信號進行線性預測 (LPC)分析得到LPC系數,然后將LPC系數轉換為線性譜頻率(LSF)系數,對LSF系數按照給定 的密鑰進行映射變換,再將映射后的LSF系數轉換為LPC系數,并構造出合成濾波器;另一方 面,原始語音通過線性預測,得到預測殘差信號,最后將預測殘差信號通過由映射變換后的 LPC系數所構造的合成濾波器得到加密后的語音信號,保證了加密語音信號的語音特征,實 現有效的語音加密。
[0006] 本發(fā)明的技術方案是:
[0007] -種基于頻譜映射的端到端語音加密方法,其特征在于,包括以下步驟:
[0008] SOI:對數字語音信號進行線性預測LPC分析得到LPC系數;
[0009] S02:將LPC系數轉換為線性譜頻率LSF系數,對LSF系數按照給定的密鑰進行映射 變換,再將映射后的LSF系數轉換為LPC系數,并構造出合成濾波器;
[0010] S03:原始數字語音信號通過線性預測,得到預測殘差信號,最后將預測殘差信號 通過由映射變換后的LPC系數所構造的合成濾波器得到加密后的語音信號。
[0011] 優(yōu)選的,所述步驟S01中的LPC系數通過以下步驟得到:
[0012] 線性預測L P C為用過去p個樣點值s ( η )來預測現在或未來樣點值
,預測誤差ε(η)為:
[0014] 其中,ai為線性預測系數,η為自然數;[0015] 線性預測LPC的Yule-Walker方程:
[0017] Levinson-Durbin 算法遞推公式為:
[0021] 由此可以求解出兩階線性預測的預測系數ai,i = l,2,…,p。
[0022] 優(yōu)選的,所述將LPC系數轉換為線性譜頻率LSF系數包括以下步驟:
[0023] p階線性預測濾波器函數為:
[0027]當階數p為偶數時有:
[0030]當階數P為奇數時有:[0031 ] P7 (z) =P(z)
[0033] P' (z)和Q' (z)為對稱的偶次多項式,根為復值共輒對,只需確定位于上半圓的根 即可,設在上半圓K (z)和Qlz)的根為#%? = 1,2,···,ρ,其線譜頻率為根的角頻率0〈ωι〈 π;
[0034] 當階數ρ為偶數時令
[0035] Μι = ρ/2,Μ2 = ρ/2
[0036] 當階數ρ為奇數時令
[0037] Μι=(ρ+1)/2,Μ2=(ρ-1)/2
[0038] 利用泰勒級數展開原理,將共輒零點對數分別為施和此對應的Κ (ζ)和V (ζ)展開, 有Μ1+Μ2 = ρ,用z = e#代入,并利用余弦定理轉換有:
[0039] Ρ/7( ω )=2cosMi〇+2P/ (l)cos(Mi-l) 〇+---+2?7 (Mi-1 )cos ω+P7 (Μι)
[0040] 〇^( ω )=2(3081^0+207 (l)cos(Mi-l) 0+...+2?7 (Mi-Dcosco+Q' (Μι)
[0041 ] 再令x = cos ω,將上式用Chebyshev多項式Tm(x) = cos(mx)展開有:
[0044] 第郵介義的Chebyshev多項式Tm(x)滿足遞推Tm(x) = 2xTk-i(x)_Tk-2(x),初值To(x)= 1,Ti(x) =x,求x在[1,-l]區(qū)間內,搜索P〃(x) =0和Q〃(x) =0的根植{xi},而對應的LSF的參 數值ω 1由ω i = arccosxi來確定。
[0045] 優(yōu)選的,所述步驟S02的映射變換包括線性映射和非線性映射,其中線性映射分為 平移映射、旋轉映射、相似映射、反演映射,非線性映射即利用各類非線性算子實現映射。 [0046]優(yōu)選的,所述步驟S02中LSF系數轉換為LPC系數,包括以下步驟:
[0047] 由LSF參數ω i逆向推導Chebyshev多項式來求解,LSF參數值叫,令xk = cos c〇k,k = 1,2,…,p得中間式
[0050] 按原推導過程對應關系,由P〃(x)逆推得Ρ?ω)和K(z),同樣由Q〃(x)逆推得Q (ω )和Q(z)進而逆推導可得p(z)和Q(z):
[0051] P(z) =P7 (z)*( 1+z-1)
[0052] Q(z) =Q7 (z)*(l-z_1)
[0053] 則有:
[0054] A(z) = (P(z)+Q(z))/2
[0055] 由 A(z)可得 LPC 參數 ai。
[0056] 優(yōu)選的,在步驟SOI之前對輸入的數字語音信號加窗分幀處理,即用窗函數w(n)乘 以s(n),使得加窗語音信號sw=s(n)*w(n)。
[0057] 本發(fā)明還公開了一種語音解密方法,其特征在于,包括以下步驟:
[0058] S11:將加密后的數字語音信號進行線性預測LPC分析得到LPC系數;
[0059] S12:將LPC系數轉換為線性譜頻率LSF系數,對LSF系數按照密鑰進行逆映射變換, 再將逆映射后的LSF系數轉換為LPC系數,并構造解密語音合成濾波器;
[0060] S13:加密數字語音信號通過線性預測,得到預測殘差信號,最后將預測殘差信號 通過由逆映射變換后的LPC系數所構造的解密語音合成濾波器得到原始語音信號。
[0061] 與現有技術相比,本發(fā)明的優(yōu)點是:
[0062] 1、本發(fā)明是基于線性預測編碼和頻譜映射的語音加解密方法,在加密端對數字語 音信號進行線性預測(LPC)分析得到LPC系數,然后將LPC系數轉換為線性譜頻率(LSF)系 數,對LSF系數按照給定的密鑰進行映射變換,再將映射后的LSF系數轉換為LPC系數,并構 造出合成濾波器;另一方面,原始語音通過線性預測,得到預測殘差信號,最后將預測殘差 信號通過由映射變換后的LPC系數所構造的合成濾波器得到加密后的語音信號,保證了加 密語音信號的語音特征,實現有效的語音加密。
[0063] 2、解密過程是加密過程的逆過程。解密端對加密后的數字語音信號線性預測 (LPC)得到加密信號的LPC系數,然后將LPC系數轉化為線性譜頻率(LSF)系數,對LSF系數按 照密鑰逆映射,再將逆映射后的LSF系數轉換為LPC系數,并構造出語音合成濾波器;與此同 時,加密語音通過線性預測,得到預測的殘差信號,最后將預測殘差信號通過由逆映射變化 后的LPC系數構造的合成濾波器得到原始語音信號,簡單而高效地恢復出原始信號。對加解 密兩端的同步要求低,實用性較好,具有廣泛的應用前景。
【附圖說明】
[0064] 下面結合附圖及實施例對本發(fā)明作進一步描述:
[0065] 圖1為本發(fā)明語音加密裝置的結構框圖;
[0066] 圖2為本發(fā)明語音解密裝置的結構框圖;
[0067] 圖3為原始語音信號波形圖;
[0068] 圖4為加密語音信號波形圖;
[0069]圖5為解密語音信號波形圖。
【具體實施方式】
[0070]為使本發(fā)明的目的、技術方案和優(yōu)點更加清楚明了,下面結合【具體實施方式】并參 照附圖,對本發(fā)明進一步詳細說明。應該理解,這些描述只是示例性的,而并非要限制本發(fā) 明的范圍。此外,在以下說明中,省略了對公知結構和技術的描述,以避免不必要地混淆本 發(fā)明的概念。
[0071] 實施例:
[0072]如圖1所示,待加密的信號為數字語音信號如圖3所示,根據語音信號的短時平穩(wěn) 性能,為了便于對語音信號特征參數的分析,需要對語音信號進行分幀,此處采用的分幀方 法為加窗分幀技術。與此同時,幀與幀之間平滑過渡,保證語音信號的連續(xù)性,分幀后的信 號為s(n)。
[0073]首先對語音信號幀s(n)作線性預測(LPC)分析,其p階線性預測系數&1*Ι^ν?η 8〇η Durbin算法利用自相關函數求出??紤]到線性譜頻率LSF系數具有良好的量化特性和插值 特性,并且線性譜頻率LSF可以很好地與頻譜保留的共振峰的位置和帶寬相對應,因此在語 音處理中常常直接對LSF進行控制和處理,因此本文是直接對LSF系數映射轉換。本文利用 Chebyshev法將求出的LPC系數轉為線譜對LSF參數。按照給定的密鑰選擇合適的映射方式 對LSF系數映射,此處是語音加密的主要實現部分。最后將映射后的LSF轉換為LPC系數,構 成語音加密合成濾波器,用于合成加密后的語音信號。
[0074] 另一方面,原始語音通過線性預測,得到預測殘差信號e(n),最后將預測殘差信號 e(n)通過由映射變換后的LPC系數所構造的語音加密合成濾波器得到加密后的語音信號。 至此,實現了原始語音信號的加密,加密后的語音波形圖如圖4所示。
[0075] 如圖2所示,解密過程是加密過程的逆過程。解密端對加密后的數字語音信號線性 預測(LPC)分析,得到加密信號的LPC系數,然后將LPC系數轉化為線性譜頻率(LSF)系數,按 照提供的密鑰對LSF系數逆映射,恢復出原始語音信號的LSF系數。為合成原始語音信號,需 要再將LSF系數轉換為LPC系數,并構造出語音合成濾波器;與此同時,加密語音通過線性預 測,得到預測的殘差信號,最后將預測殘差信號通過由逆映射變化后的LPC系數構造的合成 濾波器得到原始語音信號,簡單而高效地恢復出原始信號,波形圖如圖5所示。
[0076]具體實現方法:
[0077] 由于語音信號的短時平穩(wěn)性,為了避免截斷效應的產生,通常需要對輸入的語音 信號加窗分幀處理,同時也需要保證語音信號幀與幀之間的連續(xù)性。
[0078] 分幀是用可以動的有限長度窗口進行加權的方法來實現的,即用窗函數w(n)乘以 s(n),使得加窗語音信號sw=s(n)*w(n) ·
[0079] 語音信號數字處理中常用的窗函數時矩形窗和漢明窗,表達式如下:
[0084]其中,N為幀長,η為自然數。
[0085] (1)線性預測分析
[0086]線性預測的基本思想是用過去ρ個樣點值s(n)來預測現在或未來樣點值S(n):
[0090] 其中,ai,i = 1,2,…,p為線性預測系數,可由Levinson-Durbin算法求出, Levinson-Durbin算法利用自相關矩陣的對稱性和Toepltz性質提出了高效的遞推算法。 [0091 ] 線性預測的Yule-Walker方程
[0093]從方程中可以看出,它共有ρ+l個方程,當1? = 0,1,2,···,ρ的已知時,可以解 得apk[k= 1,2,…,p]以及樣p+1個未知量。Levinson-Durbin算法遞推公式為:
[0097]由此可以求解出兩階線性預測的預測系數ai,i = 1,2,…,p,式中1為中間變量。 [0098] (2)LPC系數轉換為LSF系數
[0099] 本文思想是將LPC系數轉換為LSF系數,對LSF系數進行加密,再將加密后的LSF系 數轉化為LPC系數,合成加密后的語音信號,保證合成后的加密語音信號包含有語音特性, 所以需要將LPC系數轉換為LSF系數。
[0100] 第i階線性預測誤差濾波器傳遞函數的遞推關系為:
[0101] Ai(z)=Ai_1(z)-kiZ_1A i_1(z_1) (9)
[0102] 則有p階線性預測濾波器函數為:
[0104]定義:
[0105] P(z) =A(z)+z-(p+1)A(z-工)(ll)Q(z)=A(z)_z-(p+1)A(z-工)
[0106] 所以:
[0108] 可以證明,當A(z)的零點在Z平面單位圓內時,P(z)和Q(z)的零點都在單位圓上, 并且P(z)和Q(z)有共輒復根和零點沿著單位圓隨ω的增加交替出現。P(z)必定有一個根z =-1( ω =jt),Q(z)必定有一個根z = _l。
[0109] 設P (z)的零點為#>\〇 (z)的零點為由于P (z)和Q (z)的零點都在單位圓上, 所以這些零點可以直接用頻率來表示:
[0110] O<〇i<0i<---<Wp/2<0p/ 2<jT (13)
[0111] (^,,成對出現,反映了譜的特性,所以稱之為線譜對(LSP),由于LSF參數是頻域 參數,所以它和語音信號譜包絡的峰有更緊密的聯系。
[0112] 當階數p為偶數時有
[0115] (14)
[0116] 當階數p為奇數時有
[0117] P7 (z) =P(z)
[0119] (15)
[0120] P' (z)和Q' (z)為對稱的偶次多項式,根為復值共輒對,只需確定位于上半圓的根 即可。設在上半圓1^(2)和吖(2)的根為6/^4 = 1,2,一,?,其線譜頻率為根的角頻率0〈《1 <π0
[0121] 當階數ρ為偶數時令
[0122] Mi = p/2,M2 = p/2 (16)
[0123] 當階數ρ為奇數時令
[0124] Mi=(p+l)/2,M2=(p-l)/2 (17)
[0125] 利用泰勒級數展開原理,將共輒零點對數分別為施和此對應的Κ (ζ)和V (ζ)展開, 有Μ1+Μ2 = ρ。用z = e#代入,并利用余弦定理轉換有
[0126] Ρ/7( ω )=2cosMi〇+2P/ (l)cos(Mi-l) 〇+---+2?7 (Mi-1 )cos ω+P7 (Μι)
[0127] 〇^( ω )=2(3081^0+207 (l)cos(Mi-l) 0+...+2?7 (Mi-Dcosco+Q' (Μι)
[0128] (18)
[0129] 再令x = cos ω,將上式用Chebyshev多項式Tm(x) = cos(mx)展開有
[0132] 第郵介義的Chebyshev多項式Tm(x)滿足遞推Tm(x) = 2xTk-i(x)_Tk-2(x),初值To(x)= 1,
[0133] Ti(x) = x,利用搜索法求出LSF參數值。以上Chebyshev多項式解法實質是求x在 [1,-1 ]區(qū)間內,搜索P〃(X) = 〇和Q〃(X) = 〇的根植{xi},而對應的LSF的值即可由ω i = arccosxi來石角定。
[0134] LSF分析是用P個離散頻率來表示語音信號頻譜特性的一種方法,LSF系數偏差只 對該頻率附近的語音頻譜產生影響,而對其他頻率上的LSF語音頻譜影響不大。
[0135] (3)LSF映射變換
[0136] 根據提供的密鑰對LSF系數映射變換即為加密的主要過程。數據映射包括線性映 射和非線性映射,其中線性映射可以分為平移映射、旋轉映射、相似映射、反演映射等。
[0137] 本文主要根據對LSF系數ω 1的映射實現線譜頻率的映射變換過程,其中密鑰為映 射因子。由于LSF系數〇^在〇~π范圍內,所以本文采用的是旋轉映射,根據提供的密鑰實現 對LSF系數的映射變換。
[0138] (4)LSF系數轉化為LPC系數
[0139] 對于LSF轉換成LPC,由LSF參數ω!和0!逆向推倒Chebyshev多項式來求解,LSF參數 值《k,令xk = cos C0k,k=l,2,…,p得中間式:
[0142] 按原推導過程對應關系,可以由P〃(x)逆推得Ρ'(ω)和Κ(ζ),同樣由Q〃(x)逆推得 Q( ω )和Q(z)進而按方程(11)逆推導可得P(z)和Q(z),而有:
[0143] P(z) =P7 (z)*( 1+z-1)
[0144] q(z)=q'(z)*(i-z-!) (22)
[0145] 則有:
[0146] A(z) = (P(z)+Q(z))/2 (23)
[0147] 則由A(z)可得LPC參數ai和ki。
[0148] 應當理解的是,本發(fā)明的上述【具體實施方式】僅僅用于示例性說明或解釋本發(fā)明的 原理,而不構成對本發(fā)明的限制。因此,在不偏離本發(fā)明的精神和范圍的情況下所做的任何 修改、等同替換、改進等,均應包含在本發(fā)明的保護范圍之內。此外,本發(fā)明所附權利要求旨 在涵蓋落入所附權利要求范圍和邊界、或者這種范圍和邊界的等同形式內的全部變化和修 改例。
【主權項】
1. 一種基于頻譜映射的端到端語音加密方法,其特征在于,包括以下步驟: SO 1:對數字語音信號進行線性預測LPC分析得到LPC系數; S02:將LPC系數轉換為線性譜頻率LSF系數,對LSF系數按照給定的密鑰進行映射變換, 再將映射后的LSF系數轉換為LPC系數,并構造出加密語音合成濾波器; S03:原始數字語音信號通過線性預測,得到預測殘差信號,最后將預測殘差信號通過 由映射變換后的LPC系數所構造的加密語音合成濾波器得到加密后的語音信號。2. 根據權利要求1所述的語音加密方法,其特征在于,所述步驟SOl中的LPC系數通過以 下步驟得到: 線性預測LPC為用過去p個樣點值s(n)來預測現在或未來樣點值 頇涮誤#由此可以求解出兩階線性預測的預測系數Ct1, i = l,2,…,ρ。3. 根據權利要求1所述的語音加密方法,其特征在于,所述將LPC系數轉換為線性譜頻 率LSF系數包括以下步驟: P階線性預測濾波器函數為:定義,P(z) = A(z)+z-(p+1)A(z-工),Q(z)當階數P為奇數時有: P' (Z)=P(Z)K (z)和V (z)為對稱的偶次多項式,根為復值共輒對,只需確定位于上半圓的根即可, 設在上半圓P7 (ζ)和V (ζ)的根為= 1,2,…,ρ,其線譜頻率為根的角頻率0〈 ω Xjt; 當階數P為偶數時令 Μι = ρ/2,Μ2 = ρ/2 當階數P為奇數時令 Mi= (ρ+1)/2,Μ2= (ρ-1)/2 利用泰勒級數展開原理,將共輒零點對數分別為施和跑對應的K (ζ)和V (ζ)展開,有M1 +Μ2 = ρ,用z = eW代入,并利用余弦定理轉換有:第111階叉的Chebyshev多項式Tm(X)滿足遞推Tm(x) = 2xTk-i(x)_Tk-2(X),初值To(X) = I,Τι (X) = X,求X在[I,-1 ]區(qū)間內,搜索P〃(X) = O和Q〃(X) = O的根植{Xi},而對應的LSF的參數值 ω i由ω i = arccosxi來石角定。4. 根據權利要求1所述的語音加密方法,其特征在于,所述步驟S02的映射變換包括線 性映射和非線性映射,其中線性映射分為平移映射、旋轉映射、相似映射、反演映射,非線 性映射即利用各類非線性算子實現映射。5. 根據權利要求3所述的語音加密方法,其特征在于,所述步驟S02中LSF系數轉換為 LPC系數,包括以下步驟: 由LSF參數ω i逆向推導Chebyshev多項式來求解,LSF參數值ω k,令Xk= cos ω k,k= 1, 2,…,P得中間式按原推導過程對應關系,由P〃(X)逆推得K ( ω )和P' (z),同樣由Q〃(X)逆推得Q( ω )和Q (ζ)進而逆推導可得P(Z)和Q(z): P(Z)=P7 (zXl+z-1) Q(z)=Q7 (z)*(l-z_1) 則有: A(z) = (P(z)+Q(z))/2 由A (ζ)可得LPC參數ai。6. 根據權利要求2所述的語音加密方法,其特征在于,在步驟SOl之前對輸入的數字語 音信號加窗分幀處理,即用窗函數w(n)乘以s(n),使得加窗語音信號s w=s(n)*w(n)。7. -種語音解密方法,其特征在于,包括以下步驟: SI 1:將加密后的數字語音信號進行線性預測LPC分析得到LPC系數; Sl 2:將LPC系數轉換為線性譜頻率LSF系數,對LSF系數按照密鑰進行逆映射變換,再將 逆映射后的LSF系數轉換為LPC系數,并構造解密語音合成濾波器; S13:加密數字語音信號通過線性預測,得到預測殘差信號,最后將預測殘差信號通過 由逆映射變換后的LPC系數所構造的解密語音合成濾波器得到原始語音信號。
【文檔編號】H04L9/06GK106024000SQ201610343431
【公開日】2016年10月12日
【申請日】2016年5月23日
【發(fā)明人】胡劍凌, 李楊, 張霞, 陳建榮, 張強慶, 方健
【申請人】蘇州大學