專利名稱:遠距離水聲語音通信系統(tǒng)及通信方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種遠距離水聲語音通信系統(tǒng)及通信方法。
背景技術(shù):
與空中無線通信系統(tǒng)不同,水聲信道是一個復(fù)雜的時-空-頻多徑信道,信道條件十分惡劣,水聲信道的多普勒效應(yīng)和多徑延時效應(yīng)都要遠大于一般的陸地?zé)o線通信信道, 所以水下實時水聲通信是當(dāng)前研究的熱點和難點課題之一。在水聲信道中高速率的傳輸實時語音流是極其困難的,特別是在長距離傳輸中,水下通信相比有線通信來說速率非常低, 因為水下通信采用的是聲波而非無線電波。近年來,聲碼器技術(shù)被逐漸引進水聲通信系統(tǒng)中,通過先進的聲碼器算法將實時語音流壓縮成碼率極低的比特流,進而將高速傳輸轉(zhuǎn)換為低速或者極低速率傳輸,從而可以有效的解決信道干擾問題,進而提出了一系列水聲語音通信系統(tǒng)的設(shè)計方法。但是水聲通信系統(tǒng)中,傳輸距離與傳輸速率是一對相互制約的指標(biāo),目前具有較好自然度和魯棒性的語音壓縮算法最低可以將編碼速率壓縮至300bps左右,這就使得實時的語音流傳輸在傳輸距離上受到了一定的制約。目前水聲數(shù)字語音通信系統(tǒng)都是在編碼速率不大于信道速率的基礎(chǔ)上進行設(shè)計的,這使得水聲數(shù)字語音通信系統(tǒng)的設(shè)計局限于現(xiàn)有的算法,很難突破水下惡劣信道實時語音傳輸?shù)钠款i。依前所述,目前水聲數(shù)字語音通信系統(tǒng)都是在編碼速率不大于信道速率的基礎(chǔ)上進行設(shè)計的。有較好自然度和魯棒性的非機器合成語音最低可以將編碼速率壓縮至300bps 左右,而遠距離水聲通信系統(tǒng)的傳輸速率常常低于300bps,這就使得實現(xiàn)可靠的遠距離水下語音通信變得異常艱難。有學(xué)者采用基于語音識別與語音合成的技術(shù)實現(xiàn)低于300bps 的語音編碼算法,此類算法合成語音機器味重,對不同的說話人適應(yīng)能力有限,而且對環(huán)境噪聲和信道誤碼的魯棒性很差,很難在實際通信中得到應(yīng)用。
發(fā)明內(nèi)容
本發(fā)明為了克服現(xiàn)有水聲通信系統(tǒng)應(yīng)用在遠距離通信時常常無法建立有效連接的問題,提供了一種可靠的遠距離水聲語音通信系統(tǒng),同時還提供了一種通信方法。本發(fā)明采用以下技術(shù)方案
該發(fā)明遠距離水聲語音通信系統(tǒng),包括通過水聲信道進行兩方全雙工通信的通信模塊,一方通信模塊包括輸入單元、對輸入單元所采集的音頻信號分段為語音段和靜音段的分段單元、對所述語音段進行編碼的編碼單元和對該編碼單元所編碼信息發(fā)送的發(fā)送單元;
另一方通信模塊則包括通過所建立的水聲信道與所述發(fā)送單元通信的接收單元、對該接收單元所接收信息進行解碼的解碼單元、按照預(yù)定算法對解碼出的語音段進行段間插入靜音段的播放控制單元和對播放控制單元處理過的信號進行播放的播放單元。上述遠距離水聲語音通信系統(tǒng),所述分段單元設(shè)有能量門限單元,以通過語音段的能量進行靜音段與語音段的區(qū)分。上述遠距離水聲語音通信系統(tǒng),所述編碼單元包括標(biāo)志單元,以對語音段的每一幀進行標(biāo)志,以區(qū)別于相鄰語音段。上述遠距離水聲語音通信系統(tǒng),所述發(fā)送單元及所述接收單元均設(shè)有存儲緩沖單兀。上述遠距離水聲語音通信系統(tǒng),所述發(fā)送單元和所述接收單元為基于跳頻4FSK 的單元。一種遠距離水聲語音通信方法,包括對輸入處理步驟、通過水聲信道進行傳輸?shù)膫鬏敳襟E和輸出處理步驟,其特征在于所述輸入處理步驟包括輸入音頻信號的步驟、對輸入的音頻信號分段為語音段和靜音段的步驟、對語音段進行編碼的編碼步驟和對編碼步驟所得到編碼信息向所建立的水聲信道播發(fā)的發(fā)送步驟;
所述輸出處理步驟包括從水聲信道接受信息的接收步驟、對接收步驟所接收的信息進行解碼的解碼步驟、按照預(yù)定算法對解碼步驟解碼出的語音段進行段間插入靜音段的播放控制步驟和對播放控制步驟處理過的信號進行播放的播放步驟。上述遠距離水聲語音通信方法,所述對輸入的音頻信號分段為語音段和靜音段的步驟設(shè)有靜音門限值,如果當(dāng)前幀的能量值小于靜音門限值,且連續(xù)相鄰多幀的值均小于靜音門限值,則該多幀信號組成靜音段。上述遠距離水聲語音通信方法,所述編碼步驟包括對每一語音段的每一幀進行標(biāo)志的步驟,以使當(dāng)前語音段區(qū)別于相鄰語音段。上述遠距離水聲語音通信方法,在所述發(fā)送步驟和接收步驟均設(shè)有對數(shù)據(jù)進行緩沖的步驟,以保證數(shù)據(jù)傳輸?shù)倪B續(xù)性。上述遠距離水聲語音通信方法,所述發(fā)送步驟和接收步驟采用4FSK調(diào)制解調(diào)方法。依據(jù)本發(fā)明,通過把音頻信號區(qū)分為靜音段和語音段的方式,進而只對語音段進行編碼傳輸?shù)姆桨福瑴p少了碼流總量,信道占用率低,使得在水聲信道這種窄帶傳輸信道情形下的傳輸可靠性增強,從而可以建立有效的連接。另外,由于帶寬比較窄,有效偵聽范圍窄,可以提高通信過程中的有效防偵聽問題。
圖1為音頻存儲轉(zhuǎn)發(fā)語音通信系統(tǒng)架構(gòu)框圖。圖2為音頻存儲轉(zhuǎn)發(fā)工作流程圖。圖3為擁有4個獨立語音段的語音段頻譜圖。圖4為存儲轉(zhuǎn)發(fā)語音通信系統(tǒng)延時變化頻譜示意圖。圖5為一種遠距離水聲語音通信的終端架構(gòu)圖。圖6 (a)為MELPE編碼器原理框圖。圖6 (b)為MELPE解碼器原理框圖。
具體實施例方式本發(fā)明的重點在于語音信號的分段,也就是區(qū)分成靜音段和語音段,只對語音段進行編碼傳輸。本發(fā)明所依賴的硬件架構(gòu)是現(xiàn)在公知的遠距離水聲數(shù)字語音通信終端,參見說明書附圖5,其基本結(jié)構(gòu)是其終端含有一高速數(shù)字信號處理器,如附圖5所示的TI公司的 TMS320Vc5509A,圖中虛線框內(nèi)為處理器,該處理器連接水聲換能器,以建立與其他遠距離水聲數(shù)字語音通信終端的水聲信道,同時該處理器還連接有音頻采集裝置及A/D采樣電路,以獲取數(shù)字音頻信號,并連接有音頻輸出裝置及D/A轉(zhuǎn)換電路,以把經(jīng)水聲換能器接收到的音頻信號播放出來。依據(jù)上述結(jié)構(gòu),本發(fā)明的基本結(jié)構(gòu)實際上是在上述結(jié)構(gòu)上實現(xiàn)的,那么本發(fā)明的基本方案是一種遠距離水聲語音通信系統(tǒng),包括通過水聲信道進行兩方全雙工通信的通信模塊,一方通信模塊包括輸入單元、對輸入單元所采集的音頻信號分段為語音段和靜音段的分段單元、對所述語音段進行編碼的編碼單元和對該編碼單元所編碼信息發(fā)送的發(fā)送單元;
另一方通信模塊則包括通過所建立的水聲信道與所述發(fā)送單元通信的接收單元、對該接收單元所接收信息進行解碼的解碼單元、按照預(yù)定算法對解碼出的語音段進行段間插入靜音段的播放控制單元和對播放控制單元處理過的信號進行播放的播放單元。兩方通信模塊的基本架構(gòu)是一樣的,都應(yīng)當(dāng)包括輸入單元同時包括諸如輸出單元,只是為了敘述上的方便,依據(jù)數(shù)據(jù)的處理過程描述了整個語音通信系統(tǒng)的結(jié)構(gòu),另一方通信模塊作為輸入端,那么所說的一方通信模塊就成了輸出端。首先關(guān)于語音分段方案
依據(jù)本發(fā)明,提出一種基于存儲轉(zhuǎn)發(fā)的方案,參見說明書附圖1,圖1中,編碼器與解碼器對應(yīng)同一種語音編碼解碼算法,信道傳輸速率通常低于該算法的編碼速率。語音分段的基本功能包括1)通過將輸入語音分成語音段和靜音段,對靜音段不編碼傳輸,從而減少系統(tǒng)發(fā)送的碼流總量;2)向同一語音段的所有語音幀插入標(biāo)志比特。播放控制單元的基本功能則是利用接受碼流中的分段標(biāo)志比特,來控制語音的分段播放。參見說明書附圖2,是基于存儲轉(zhuǎn)發(fā)的工作流程,獨立的語音段是指被靜音段隔離開的語音段。再如說明書附圖3所示,實際上,此類通信技術(shù)要考慮三個關(guān)鍵的因素,一是如何對語音進行分段處理,二是收發(fā)終端的緩存空間尺寸問題,三是通話延時問題,下面就這三個關(guān)鍵問題進行詳細分析。第一,為了減少系統(tǒng)發(fā)送的碼流總量,將輸入語音分成語音段和靜音段,對靜音段不傳輸,而只對語音段進行傳輸,這就需要一個分段單元。由于解碼端接收到的只有語音幀而沒有靜音幀,因此需要一些額外的信息來確保解碼端能夠正確區(qū)分各幀所屬的語音段信息,這就需要由標(biāo)志單元來處理,以對語音段的每一幀進行標(biāo)志,以區(qū)別于相鄰語音段。 可以采用插入標(biāo)志位的方法,基本方案是對每個語音幀編碼碼流增加一個比特的分段標(biāo)志位,屬于同一語音段的各語音幀分段標(biāo)志位相同,以靜音段為間隔,相鄰的不同語音段中各幀的標(biāo)志位不同,分別為‘0’和‘1’。這樣在解碼端進行播放控制,在兩個語音段之間插入適當(dāng)?shù)撵o音時間,可以完整的恢復(fù)編碼端的語音信息,對應(yīng)于所述編碼單元和解碼單元以及播放控制單元。插入靜音時間沒有嚴格的要求,只要能夠區(qū)分開個語音段即可,正常的語速及停頓結(jié)合即可,據(jù)此容易設(shè)置。第二,基于存儲轉(zhuǎn)發(fā)的語音通信系統(tǒng)的終端緩存空間尺寸基于存儲轉(zhuǎn)發(fā)的語音通信系統(tǒng)中,由于語音編碼速率要高于信道傳輸速率,編碼端需要緩存空間存放尚未發(fā)送出去的比特流,而解碼端需要一個獨立語音段的所有編碼比特流接收完畢后才可以進行解碼播放,因此也需要緩存空間存放待解碼的比特流。因此,設(shè)置相適應(yīng)的存儲緩沖單元也就變得必要。 從說話者開始講話,整個話音用語音段和靜音段表示為
權(quán)利要求
1.一種遠距離水聲語音通信系統(tǒng),包括通過水聲信道進行兩方全雙工通信的通信模塊,其特征在于,一方通信模塊包括輸入單元、對輸入單元所采集的音頻信號分段為語音段和靜音段的分段單元、對所述語音段進行編碼的編碼單元和對該編碼單元所編碼信息發(fā)送的發(fā)送單元;另一方通信模塊則包括通過所建立的水聲信道與所述發(fā)送單元通信的接收單元、對該接收單元所接收信息進行解碼的解碼單元、按照預(yù)定算法對解碼出的語音段進行段間插入靜音段的播放控制單元和對播放控制單元處理過的信號進行播放的播放單元。
2.根據(jù)權(quán)利要求1所述的遠距離水聲語音通信系統(tǒng),其特征在于,所述分段單元設(shè)有能量門限單元,以通過語音段的能量進行靜音段與語音段的區(qū)分。
3.根據(jù)權(quán)利要求1或2所述的遠距離水聲語音通信系統(tǒng),其特征在于,所述編碼單元包括標(biāo)志單元,以對語音段的每一幀進行標(biāo)志,以區(qū)別于相鄰語音段。
4.根據(jù)權(quán)利要求1所述的遠距離水聲語音通信系統(tǒng),其特征在于,所述發(fā)送單元及所述接收單元均設(shè)有存儲緩沖單元。
5.根據(jù)權(quán)利要求1所述的遠距離水聲語音通信系統(tǒng),其特征在于,所述發(fā)送單元和所述接收單元為基于跳頻4FSK的單元。
6.一種遠距離水聲語音通信方法,包括對輸入處理步驟、通過水聲信道進行傳輸?shù)膫鬏敳襟E和輸出處理步驟,其特征在于所述輸入處理步驟包括輸入音頻信號的步驟、對輸入的音頻信號分段為語音段和靜音段的步驟、對語音段進行編碼的編碼步驟和對編碼步驟所得到編碼信息向所建立的水聲信道播發(fā)的發(fā)送步驟;所述輸出處理步驟包括從水聲信道接受信息的接收步驟、對接收步驟所接收的信息進行解碼的解碼步驟、按照預(yù)定算法對解碼步驟解碼出的語音段進行段間插入靜音段的播放控制步驟和對播放控制步驟處理過的信號進行播放的播放步驟。
7.根據(jù)權(quán)利要求6所述的遠距離水聲語音通信方法,其特征在于,所述對輸入的音頻信號分段為語音段和靜音段的步驟設(shè)有靜音門限值,如果當(dāng)前幀的能量值小于靜音門限值,且連續(xù)相鄰多幀的值均小于靜音門限值,則該多幀信號組成靜音段。
8.根據(jù)權(quán)利要求6或7所述的遠距離水聲語音通信方法,其特征在于,所述編碼步驟包括對每一語音段的每一幀進行標(biāo)志的步驟,以使當(dāng)前語音段區(qū)別于相鄰語音段。
9.根據(jù)權(quán)利要求6所述的遠距離水聲語音通信方法,其特征在于,在所述發(fā)送步驟和接收步驟均設(shè)有對數(shù)據(jù)進行緩沖的步驟,以保證數(shù)據(jù)傳輸?shù)倪B續(xù)性。
10.根據(jù)權(quán)利要求6所述的遠距離水聲語音通信方法,其特征在于,所述發(fā)送步驟和接收步驟采用4FSK調(diào)制解調(diào)方法。
全文摘要
本發(fā)明公開了一種遠距離水聲語音通信系統(tǒng)及通信方法,通過把音頻信號區(qū)分為靜音段和語音段的方式,進而只對語音段進行編碼傳輸?shù)姆桨?,減少了碼流總量,信道占用率低,使得在水聲信道這種窄帶傳輸信道情形下的傳輸可靠性增強,從而可以建立有效的連接。另外,由于帶寬比較窄,有效偵聽范圍窄,可以提高通信過程中的有效防偵聽問題。
文檔編號H04B13/02GK102255672SQ201110198028
公開日2011年11月23日 申請日期2011年7月15日 優(yōu)先權(quán)日2011年7月15日
發(fā)明者姜競賽, 李曄, 樊燕紅, 郝秋贇, 馬曉鳳 申請人:山東省計算中心