專利名稱:一種低速率等效語音水聲通信技術的制作方法
技術領域:
本發(fā)明涉及屬于水聲通信技術領域,特別是一種低速率等效語音水聲技術。
背景技術:
水下聲信道是一種復雜的時變、空變、頻變的隨機多途傳輸信道,其帶寬嚴重受限、傳播損失大、環(huán)境噪聲高、多途效應嚴重、信道帶寬窄、可適用的載波頻率低、傳輸時延擴展大、信號起伏衰落嚴重等等,使得有線通信或在空中無線電通信領域很容易實現(xiàn)的語音通信技術,在水聲通信領域實現(xiàn)起來非常的困難。
目前,國內外研究者對水聲語音通信的研究主要還是集中在將語音信號經A/D采樣后,通過源編碼壓縮算法去除冗余信息,再通過信道編碼傳輸。為保證接收端還原的語音具有一定的清晰度,其傳輸速率始終難于降到很低。就目前具有通信質量的中、低碼率語音編碼器而言,16kbps和8kbps的技術己經標準化和產品化,4~8kbps是標準化制定和實用產品競爭的熱點,近年來,國際上的許多研究機構己把“1.2kbps速率以下的語音壓縮編碼”作為未來幾年的重點研究課題。
對于水聲信道這種低頻窄帶、衰落及多途效應嚴重的信道,要保證遠程清晰的語音指揮通信,尤其是對水下高速運動中的潛航器進行遠程語音通信是很困難的。目前國內外水聲通信領域的研究者始終未能有效地解決語音通信質量和通信距離之間的矛盾,按傳統(tǒng)的語音通信技術,剝除對音色的要求,要達到基本可聽懂語意的語音通信質量,其數(shù)據(jù)傳輸速率都要求達到幾百bps以上,因此其通信距離難于提高。
申請?zhí)枮?00410039406.7的發(fā)明專利公開了一種在電話上實現(xiàn)語音編碼通信及常用語分類編碼的通信方法,其優(yōu)點是便于簡單撥號就可發(fā)送預先編制好的一句或一小段語音,缺點是不能滿足任意編制通信信息的語音通信要求;申請?zhí)枮?4100577.1的發(fā)明專利公開了一種用漢語拼音代碼映射詞庫的文字輸入編碼和查找索引方法,實現(xiàn)了代碼輸入字詞內碼輸出,申請?zhí)枮?00610057552.1的發(fā)明專利公開了一種用撥號輸入代碼向被叫方進行路況等信息查詢的方法,申請?zhí)枮?00510001914.0的發(fā)明專利公開了一種多語種語音交換裝置,通過語音識別系統(tǒng)可將中文語音輸入轉換成其它語種的語音輸出,申請?zhí)枮?2114751.5的發(fā)明專利公開了一種通過輸入統(tǒng)一編制的代碼查詢全球旅游景點多媒體信息的方法,輸入端輸入根據(jù)全球旅游信息樹狀編碼方案編制的信息代碼,信息服務器返回相應景點的多媒體信息,申請?zhí)枮?2127005.8的發(fā)明專利公開了一種用于中文文本處理的中文分詞方法,申請?zhí)枮?1123418.0的發(fā)明專利公開了一種基于大規(guī)模自然語音音庫的動態(tài)漢語語音合成技術。
上述這些技術都有其各自的優(yōu)點,但其不足是;1、均未能有效地解決大壓縮比的信息編碼問題。2、均未能解決低速率語音通信,特別是適用于水聲信道的等效語音通信的問題。3、均未能解決文字及其語音用簡短的代碼串實現(xiàn)等效同時傳輸?shù)膯栴}。4、均未能解決進行水聲通信的雙方用語音或文字輸入,對方卻能收聽到文字及其語音信息的問題。
發(fā)明內容
本發(fā)明的主要目的是提供一種可用很低的數(shù)據(jù)傳輸速率等效地實現(xiàn)語音通信的水聲通信體制和實現(xiàn)該通信體制的水聲通信系統(tǒng)的基本結構。通過建立轉換詞條庫和多媒體信息數(shù)據(jù)庫,并采用語音識別設備將通信語音信息經語音識別轉換成對應文字組成的報文,通過轉換詞條庫和信息代碼轉換匹配算法將該報文切分成最少數(shù)量的構成單元,每個構成單元對應轉換詞條庫中的一個詞條代碼,各詞條依其先后次序構成詞條代碼串;發(fā)送端用低速穩(wěn)健的遠程水聲通信設備將該詞條代碼串發(fā)送到水聲信道,接收端具有和發(fā)射端相同的轉換詞條庫和多媒體信息數(shù)據(jù)庫,收到該詞條代碼串后,根據(jù)代碼格式分割出一個一個的詞條代碼,并一一對應地從轉換詞條庫和多媒體信息數(shù)據(jù)庫中取出詞條內碼及其對應的語音或圖形符號,連接還原成通信報文,或由多媒體播放器播放出其語音等信息。
本發(fā)明的又一目的是提供一種基于轉換詞條庫的信息代碼轉換技術。從報文開頭的第一個字開始,掃描讀入第一個字的機內碼,從轉換詞條庫的首字表內找到該字,并建立鏈表指針指向以該字開頭的次級鏈表。依次讀入下一個字的內碼,并在能與首字構成雙字搭配的次級鏈表內查找是否存在該字,如果不存在,則取出首字表中對應該字的詞條代碼,并將其下一個字作為首字重新進行查找匹配;如果存在該字,則將鏈表指針指向以這兩個字開頭的再下級鏈表,再讀入報文的下一個字,直至讀入的第N+1個字不在由前N個字構成的下級鏈表內,取出與第N個字對應鏈表中的詞條代碼就作為該N字詞條的詞條代碼,第N+1個字又作為首字繼續(xù)進行匹配,直至報文結束。這樣就可將整個報文按轉換成簡短的代碼串。
本發(fā)明的再一目的是提供一種通過多媒體信息數(shù)據(jù)庫實現(xiàn)等效語音水聲通信轉換技術。收發(fā)雙方設置有相同的轉換詞條庫和多媒體信息數(shù)據(jù)庫,通過建立多媒體信息數(shù)據(jù)庫中的記錄與詞條代碼的一一對應關系,接收端收到詞條代碼串后,根據(jù)代碼傳輸?shù)膸袷椒指畛鲆粋€一個的詞條代碼,并從多媒體信息數(shù)據(jù)庫中取出與詞條代碼一一對應的語音或圖形符號,并由多媒體信息播放器播放出其語音等信息。
為達到上述目的,本發(fā)明的技術方案是該低速率等效語音水聲通信技術,包括轉換詞條庫、多媒體信息數(shù)據(jù)庫、信息采集及語音識別設備、信息代碼轉換匹配算法、顯控及信息編輯設備、水聲通信設備、多媒體信息播放器,其通信過程如下 1)建立轉換詞條庫和多媒體信息數(shù)據(jù)庫,轉換詞條庫包含字、詞、術語、短語、語句片段、常用語句、圖像及符號等,它們統(tǒng)稱為詞條,每個詞條對應一個詞條代碼,多媒體信息數(shù)據(jù)庫中的記錄與轉換詞條庫中的詞條的語音或圖形符號一一對應,它們都對應一個相同的詞條代碼; 2)通過語音識別設備將通信語音信息識別轉換成對應文字組成的報文,或顯控及信息編輯設備直接編輯通信報文,通過轉換詞條庫和信息代碼轉換匹配算法將該報文切分成最少數(shù)量的構成單元,每個構成單元對應轉換詞條庫中的一個詞條,每個詞條對應一個詞條代碼,各詞條依其先后次序構成詞條代碼串; 3)發(fā)送端用水聲通信設備將該詞條代碼串發(fā)送到水聲信道,接收端具有相同的轉換詞條庫和多媒體信息數(shù)據(jù)庫,收到該詞條代碼串后,根據(jù)代碼格式分割出一個一個的詞條代碼,并一一對應地從轉換詞條庫和多媒體信息數(shù)據(jù)庫中取出詞條內碼及其對應的語音或圖形符號,根據(jù)需要由顯控及信息編輯設備連接還原成通信報文,或由多媒體信息播放器播放出其語音等信息。
所述轉換詞條庫是其詞條可以是漢語、英語、日語、德語、法語、俄語等語種中的詞句;不僅包含通用的字、詞、詞組和短語,還包含指揮通信常用或專用的術語、語句片斷和常用語句等;其詞條可采用多級鏈表結構,將多個字或詞鏈接成一個詞條,每個詞條對應一個詞條代碼和詞條內碼;對于漢語詞條中各字的機內碼可用GB2312、GB18030內碼表示,也可用BIG-5、Unicode內碼表示,還可以用其它形式的內碼表示,包括多級漢字及某些圖形符號;對于由多個字母組成詞語種,如英語、法語、俄語,是以多字母組成的詞或可獨立表意的字母和符號組為基本編碼單元;各語種可以獨立編碼轉換詞條庫,也可以統(tǒng)一編碼形成通用的轉換詞條庫。
所述轉換詞條庫中的詞條,詞的結構可描述為由若干個葉結點、子結點和根結點構成的多叉樹結構;每棵多叉樹對應詞庫中的一個多級鏈表;多叉樹的每個結點都對應一個字,結點的內碼可用該字的機內碼表示;每個結點還對應一個詞條代碼和詞條內碼,該詞條代碼是從根結點到本結點的路徑上的若干個字構成的詞句,根據(jù)其在通信過程中出現(xiàn)的頻率高低進行統(tǒng)計編碼求得的變長碼,該詞條內碼可用從根結點到本結點的路徑上的若干個字的機內碼的順序組合表示。
所述多級鏈表是首先構建一個包含所需字及符號的字表,每個能以其為首構成詞、術語、短語、語句片段、甚至常用語句的字均有一個對應的下級鏈表,表內包含全部能與其一起構成詞句的下一個字的機內碼和對應節(jié)點的詞條代碼以及其再下一級鏈表的信息;以此類推,每個能與前N個字構成詞句的第N+1個字也有一個對應的再下級鏈表,表內包含全部能與這前N+1個字一起構成詞句的第N+2個字的機內碼和從首字到本級結點字構成的多字詞的詞條代碼,如果還有再下一級的鏈表則還包括其再下一級鏈表的信息,如果沒有再下一級的鏈表了,則在其對應下級鏈表的鏈表地址或鏈表索引處給出詞條結束標志。
所述多媒體信息數(shù)據(jù)庫是多媒體信息數(shù)據(jù)庫中的記錄與轉換詞條庫中的詞條一一對應;每個記錄至少包含詞條代碼字段、詞條內碼字段、詞條語音或圖形符號的流媒體字段;或者每個記錄至少包含詞條代碼字段、詞條內碼的鏈接字段、詞條語音或圖形符號的流媒體的鏈接字段;詞條內碼的鏈接字段存放詞條內碼的存儲地址信息或詞條內碼的索引信息,詞條語音或圖形符號的流媒體的鏈接字段記錄詞條的語音或圖形符號的流媒體的存儲地址信息或該詞條的語音或圖形符號文件的索引信息。
所述信息代碼轉換匹配算法是從報文開頭的第一個字開始,掃描讀入第一個字的機內碼,從轉換詞條庫的首字表內找到該字,并建立鏈表指針指向以該字開頭的次級鏈表。依次讀入下一個字的內碼,并在能與首字構成雙字搭配的次級鏈表內查找是否存在該字,如果不存在,則取出首字表中對應該字的詞條代碼,并將其下一個字作為首字重新進行查找匹配;如果存在該字,則將鏈表指針指向以這兩個字開頭的再下級鏈表,再讀入報文的下一個字,直至讀入的第N+1個字不在由前N個字構成的下級鏈表內,取出與第N個字對應鏈表中的詞條代碼就作為該N字詞條的詞條代碼,第N+1個字又作為首字繼續(xù)進行匹配,直至報文結束。信息代碼轉換匹配算法主要包括下列步驟 (1)設通信報文字符串Q=U0,U1,…,Un,U0,…,Un表示通信報文的第0到第n個字,其對應內碼M=M0,M1,…,Mn,字串Qi=Ui,…,Uj,0≤i≤n,i≤j≤n,Qi∈Q且Qi∈ZHCTK,它是通信報文字符串Q的子字符串,也是能在轉換詞條庫ZHCTK中匹配到的最長字串,其對應的詞條代碼為QMi,相關度函數(shù)Ri=int GetR el(Qi,ZHCTK),即Ri=Qi中構成語句片段的字數(shù); (2)定義報文指針pi指向報文中的第i字Ui,即Pi→Ui,讀取其內碼為Mi,(0≤i≤n),SZNMB為首字內碼表,Mi∈SZNMB表示第i個字Ui的內碼Mi存在于首字內碼表SZNMB內;鏈表指針Li指向與字Ui對應的下級鏈表L(Ui),即Li→L(Ui); (3)首字索引,將報文指針pi指向報文的第一個字U0,并讀取其內碼M0和與其對應的詞條代碼QM0,并將鏈表指針Li指向與字U0對應的下級鏈表L(U0),即Li→L(U0),i=i+1,使指針指向下一個字; (4)次字索引,將報文指針pi指向報文的下一個字U1,讀取其內碼M1,并判斷若M1∈L(U0),則將鏈表指針Li指向與字U1對應的下級鏈表L(U1),即Li→L(U1);若,則讀取與U0對應的詞條代碼QM0作為該單字詞的編碼輸出,并將U1作為下一個編碼單元的首字; (5)若i≥n,則轉步驟(7);否則i=i+1,將報文指針pi指向報文的下一個字Ui,讀取其內碼Mi,并判斷若Mi∈L(Ui-1),則將鏈表指針Li指向與字Ui對應的下級鏈表L(Ui),即Li→L(Ui);若則讀取與Ui-1,對應的詞條代碼QMi-1作為該字串的編碼輸出,并將Ui作為下一個編碼單元的首字; (6)若i<j,則轉步驟(5);否則i=i+1,讀取與Uj對應的詞條代碼QMj作為該單元詞條的編碼輸出,并將Ui作為下一個編碼單元的首字,若i<n,則轉步驟(5); (7)讀取與Ui對應的詞條代碼QMi作為該單元詞條的編碼輸出; 通過上述信息匹配和代碼轉換,將通信報文字符串Q=U0,U1,…,Un轉換成簡短的詞條代碼串QM=QM0,QM1,…,QMk,0≤k≤n,且每個詞條代碼QMi均對應一個多媒體信息數(shù)據(jù)庫中的一個記錄,該記錄包含字串Qi=Ui,…,Uj中各個字的內碼及其語音流媒體的鏈接信息等。
所述語句片段是由若干個字、詞或詞組甚至是短句構成,是一種比詞或詞組的長度大且能在句子中常出現(xiàn),可表達一定信息的語句構成單元,是語言表達中若干個字和詞的常用搭配,并可被編制成轉換詞條庫中的詞條,對應一個簡短的詞條代碼。
所述詞條代碼是它是與轉換詞條庫中的詞條一一對應的可變碼長的多位二進制編碼,其編碼長度是根據(jù)該詞條在整個轉換詞條庫中按其在通信過程中出現(xiàn)概率的大小排序,出現(xiàn)概率越大的詞條對應越短的編碼位數(shù)的詞條代碼,不常出現(xiàn)的詞條對應長的編碼位數(shù)的詞條代碼。
所述等效語音是用存儲在多媒體信息數(shù)據(jù)庫中的詞條的經人工錄音得到的語音取代說話者的語音,也可直接用語音合成技術得到報文的合成語音去取代說話者的語音,等效地實現(xiàn)用語音表達所需表達的通信語言信息。若采用語音合成技術播報通信報文的合成語音信息,則在多媒體信息數(shù)據(jù)庫中不必存儲各詞條的語音多媒體流信息,而是通過通用的語音合成軟件直接將報文中的文字播放出其合成語音。接收端可一邊接收詞條代碼一邊還原成報文,并直接播放對應詞條的語音,也可將通信報文接收完整后再整篇播放報文的語音。
本發(fā)明的有益效果是可顯著降低水聲報文及語音通信的傳輸速率要求,接收端又可實時清晰地播放出包括報文和語音甚至圖像的信息,既可顯著降低水聲通信系統(tǒng)的設計技術難度,又可提高系統(tǒng)的可靠性和通信保密性。可用低傳輸速率的通信設備等效地實現(xiàn)語音通信功能,特別適用于水聲信道這種低頻窄帶、衰落及多途效應嚴重的信道,進行遠程和清晰的語音通信,而且系統(tǒng)結構簡單,通信方便且穩(wěn)定可靠。既可適用于水下蛙人之間,蛙人與水面船之間,水下潛航器之間,水面船與水下潛航器之間進行遠程語音通信。
圖1是本發(fā)明等效語音水聲通信系統(tǒng)基本結構示意圖 圖2是轉換詞條庫的多級鏈表結構示意圖 圖3是詞條構詞法中的多叉樹結構示意圖 圖4是信息幀格式示意圖 圖5是以“一”字開頭的詞群的多叉樹結構示意圖 圖6是以“英”字開頭的詞群的多叉樹結構示意圖 圖7是以“中”字開頭的詞群的多叉樹結構示意圖
具體實施例方式 如圖1所示,本等效語音水聲通信系統(tǒng)主要由轉換詞條庫、多媒體信息數(shù)據(jù)庫、信息采集及語音識別設備、信息代碼轉換匹配算法、顯控及信息編輯設備、水聲通信設備、多媒體信息播放器等構成,其通信方法是 首先,通過收錄相關詞典中的詞匯,并收錄相關短語和術語甚至常用語句,結合詞頻統(tǒng)計分詞等方法加入新詞匯,建立包含字、詞、術語、短語、語句片段、常用語句、圖像及符號等的轉換詞條庫。采用人工錄音或語音合成的辦法,建立與轉換詞條庫中的每個詞條相對應的語音等信息的多媒體信息數(shù)據(jù)庫。收發(fā)雙方均配置有相同的轉換詞條庫和多媒體信息數(shù)據(jù)庫。
然后,通過語音識別設備將通信語音信息識別轉換成對應文字組成的報文,或用顯控及信息編輯設備直接編輯通信報文。通過轉換詞條庫和信息代碼轉換匹配算法將該報文切分成最少數(shù)量的構成單元,每個構成單元對應轉換詞條庫中的一個詞條,每個詞條對應一個詞條代碼,各詞條依其先后次序構成詞條代碼串。
最后,發(fā)送端用水聲通信設備將該詞條代碼串發(fā)送到水聲信道,發(fā)射端和接收端具有相同的轉換詞條庫和多媒體信息數(shù)據(jù)庫,接收端收到該詞條代碼串后,根據(jù)代碼格式分割出一個一個的詞條代碼,并一一對應地從轉換詞條庫和多媒體信息數(shù)據(jù)庫中取出詞條內碼及其對應的語音或圖形符號,根據(jù)需要由顯控及信息編輯設備連接還原成通信報文,或由多媒體信息播放器播放出其語音等信息。
所述轉換詞條庫的詞條可以是漢語、英語、日語、德語、法語、俄語等語種中的詞句。轉換詞條庫不僅包含通用的字、詞、詞組和短語,還包含指揮通信常用或專用的術語、語句片斷和常用語句等。其詞條可采用多級鏈表結構,如圖2所示,將多個字或詞鏈接成一個詞條,每個詞條對應一個詞條代碼和詞條內碼;對于漢語詞條中各字的機內碼可用GB2312、GBK、GB18030、BIG-5、BIG-5E內碼表示,還可以用Unicode、ISO 10646的內碼表示,包括多級漢字及某些圖形符號;對于由多個字母組成詞語種,如英語、法語、俄語,是以多字母組成的詞或可獨立表意的字母和符號組為基本編碼單元;各語種可以獨立編碼轉換詞條庫,也可以統(tǒng)一編碼形成通用的轉換詞條庫。
轉換詞條庫中的詞條可描述為由若干個葉結點、子結點和根結點構成的多叉樹結構,如圖2所示。每個結點都對應一個字,結點的內碼可用該字的機內碼表示;每個結點還對應一個詞條代碼和詞條內碼,該詞條代碼是從根結點到本結點的路徑上的若干個字構成的詞句,根據(jù)其在通信過程中出現(xiàn)的頻率高低進行統(tǒng)計編碼求得的變長碼,該詞條內碼可用從根結點到本結點的路徑上的若干個字的機內碼的順序組合表示。每個詞條是以其首字開頭的詞群中的詞之一,其首字登錄在轉換詞條庫的首字表中。
詞條在詞條庫中的存儲方式可表示為多級鏈表結構,就是首先構建一個字表,每個能以其為首構成詞、術語、短語、語句片段、甚至常用語句的字均有一個對應的下級鏈表,表內包含全部能與其一起構成詞句的下一個字的機內碼和對應節(jié)點的詞條代碼以及其再下一級鏈表的信息;以此類推,每個能與前N個字構成詞句的第N+1個字也有一個對應的再下級鏈表,表內包含全部能與這前N+1個字一起構成詞句的第N+2個字的機內碼,也包括從本詞條的首字到本級結點字構成的多字詞的詞條代碼,如果還有再下一級的鏈表則還包括其再下一級鏈表的信息,如果沒有再下一級的鏈表了,則在其對應下級鏈表的鏈表地址或鏈表索引處給出詞條結束標志。
多媒體信息數(shù)據(jù)庫是用于構建和存儲轉換詞條庫中的各詞條的詞條內碼和語音或圖形符號的,多媒體信息數(shù)據(jù)庫中的記錄與轉換詞條庫中的詞條一一對應;每個記錄至少包含詞條代碼字段、詞條內碼字段、詞條語音或圖形符號的流媒體字段;或者每個記錄至少包含詞條代碼字段、詞條內碼的鏈接字段、詞條語音或圖形符號的流媒體的鏈接字段;詞條內碼的鏈接字段存放詞條內碼的存儲地址信息或詞條內碼的索引信息,詞條語音或圖形符號的流媒體的鏈接字段記錄詞條的語音或圖形符號的流媒體的存儲地址信息或該詞條的語音或圖形符號文件的索引信息。
信息代碼轉換匹配算法采用逐字掃描查表匹配技術,就是從報文開頭的第一個字開始,掃描讀入第一個字的機內碼,從轉換詞條庫的首字表內找到該字,并建立鏈表指針指向以該字開頭的次級鏈表。依次讀入下一個字的內碼,并在能與首字構成雙字搭配的次級鏈表內查找是否存在該字,如果不存在,則取出首字表中對應該字的詞條代碼,并將其下一個字作為首字重新進行查找匹配;如果存在該字,則將鏈表指針指向以這兩個字開頭的再下級鏈表,再讀入報文的下一個字,直至讀入的第N+1個字不在由前N個字構成的下級鏈表內,取出與第N個字對應鏈表中的詞條代碼就作為該N字詞條的詞條代碼,第N+1個字又作為首字繼續(xù)進行匹配,直至報文結束。匹配算法主要包括下列步驟 (1)設通信報文字符串Q=U0,U1,…,Un,U0,…,Un表示通信報文的第0到第n個字,其對應內碼M=M0,M1,…,Mn,字串Qi=Ui,…,Uj,0≤i≤n,i≤j≤n,Qi∈Q且Qi∈ZHCTK,它是通信報文字符串Q的子字符串,也是能在轉換詞條庫ZHCTK中匹配到的最長字串,其對應的詞條代碼為QMi,相關度函數(shù)Ri=int GetR el(Qi,ZHCTK),即Ri=Qi中構成語句片段的字數(shù); (2)定義報文指針pi指向報文中的第i字Ui,即Pi→Ui,讀取其內碼為Mi,(0≤i≤n),SZNMB為首字內碼表,Mi∈SZNMB表示第i個字Ui的內碼Mi存在于首字內碼表SZNMB內;鏈表指針Li指向與字Ui對應的下級鏈表L(Ui),即Li→L(Ui); (3)首字索引,將報文指針pi指向報文的第一個字U0,并讀取其內碼M0和與其對應的詞條代碼QM0,并將鏈表指針Li指向與字U0對應的下級鏈表L(U0),即Li→L(U0),i=i+1,使指針指向下一個字; (4)次字索引,將報文指針pi指向報文的下一個字U1,讀取其內碼M1,并判斷若M1∈L(U0),則將鏈表指針Li指向與字U1對應的下級鏈表L(U1),即Li→L(U1);若則讀取與U0對應的詞條代碼QM0作為該單字詞的編碼輸出,并將U1作為下一個編碼單元的首字; (5)若i≥n,則轉步驟(7);否則i=i+1,將報文指針pi指向報文的下一個字Ui,讀取其內碼Mi,并判斷若Mi∈L(Ui-1),則將鏈表指針Li指向與字Ui對應的下級鏈表L(Ui),即Li→L(Ui)若則讀取與Ui-1對應的詞條代碼QMi-1作為該字串的編碼輸出,并將Ui作為下一個編碼單元的首字; (6)若i<j,則轉步驟(5);否則i=i+1,讀取與Uj對應的詞條代碼QMj作為該單元詞條的編碼輸出,并將Ui作為下一個編碼單元的首字,若i<n,則轉步驟(5); (7)讀取與Ui對應的詞條代碼QMi作為該單元詞條的編碼輸出; 通過上述信息匹配和代碼轉換,將通信報文字符串Q=U0,U1,…,Un轉換成簡短的詞條代碼串QM=QM0,QM1,…,QMk,0≤k≤n,且每個詞條代碼QMi均對應一個多媒體信息數(shù)據(jù)庫中的一個記錄,該記錄包含字串Qi=Ui,…,Uj中各個字的內碼及其語音流媒體的鏈接信息等。
所述語句片段就是由若干個字、詞或詞組甚至是短句構成,是一種比詞或詞組的長度大且能在句子中常出現(xiàn),可表達一定信息的語句構成單元,是語言表達中若干個字和詞的常用搭配,并可被編制成轉換詞條庫中的詞條,對應一個簡短的詞條代碼。比如將指揮口令“各站位注意!請報告三十分鐘準備情況”、“各站位注意!請報告十分鐘準備情況”、“各站位注意!請報告工作情況”等,這里的“各站位注意!請報告”由于在實際的水聲指揮通信中會經常用到,就可把它作為一個常用的語句片段,給予其編制一個用16位二進制數(shù)表示的代碼,比如C8D6H,其內碼就用該語句片段中各個字的GB2312內碼的組合表示。
所述詞條代碼是用多位二進制數(shù)表示的編碼,它與轉換詞條庫中的詞條一一對應,其編碼的長度是根據(jù)該詞條在通信過程中出現(xiàn)的概率的大小確定的。
通信過程中,為便于區(qū)分所傳輸?shù)氖窃~條代碼還是數(shù)據(jù),可采用至少包含若干標志位和若干信息位的信息幀結構,如圖4所示。標志位用于標識后續(xù)的若干信息位攜帶的是詞條代碼還是數(shù)據(jù),以及詞條代碼和數(shù)據(jù)位的長度。數(shù)據(jù)位的長度分為短數(shù)據(jù)、中長數(shù)據(jù)、長數(shù)據(jù)和特長數(shù)據(jù)。詞條代碼的長度分為短代碼、中短代碼、中長代碼、長代碼和特長代碼。為便于數(shù)據(jù)的壓縮傳輸,通??蓪?shù)據(jù)轉換成多位二進制數(shù)表示的數(shù)值,并根據(jù)數(shù)據(jù)的數(shù)值大小對應地給其分配數(shù)據(jù)位的長度。
應用舉例發(fā)送語音報文“中國人民解放軍是一支英勇善戰(zhàn)的隊伍,改革開放后中國人民生活水平得到很大提高?!逼渫ㄐ胚^程為 假設在轉換詞條庫中收錄了下列詞條及其對應的詞條代碼,多媒體信息數(shù)據(jù)庫中也一一對應地存儲有各詞條的語音信息 中國人民解放軍——E8D6H, 是——FA6H, 一支——E6A6H 英勇善戰(zhàn)的——E4A6H 隊伍——E386H 改革開放后——D37B6H 中國人民生活水平——D1F08H 得到——E576H 很大提高——EA7BH ,——F16H 。——F3CH 其中各詞條代碼的第一個字符是數(shù)據(jù)幀的標識位,E表示后面攜帶的是詞條代碼,長度為12位二進制數(shù),F(xiàn)表示后面攜帶的是詞條代碼,長度8位二進制數(shù),D表示后面攜帶的是詞條代碼,長度16位二進制數(shù);H表示用十六進制數(shù)表示。
首先,通過語音識別系統(tǒng)將上述語音報文轉換成文字報文,或用顯控或信息編輯設備直接編輯上述報文,通過信息代碼轉換匹配算法,將上述報文轉換成如下詞條代碼串E8D6 FA6 E6A6 E4A6 E386 F16 D37B6 D1F08 E576 EA7B F3C,一共43×4=172bits。
然后,發(fā)射端只需將上述172bits的詞條代碼發(fā)送到水聲信道,接收端收到上述172bits的詞條代碼串后,按其信息傳輸幀格式即可切分出一個一個的詞條代碼。
最后,由于收發(fā)雙方均有相同的轉換詞條庫和多媒體信息數(shù)據(jù)庫,接收方根據(jù)收到的詞條代碼,一一對應地從多媒體信息數(shù)據(jù)庫中取出各詞條的內碼和語音信息,即可還原成上述報文并清晰地播放出上述報文的語音信息。或者收到各詞條代碼后,先將其還原成文字,再采用通用的語音合成軟件直接將報文中的文字播放出其合成語音。接收端可一邊接收詞條代碼一邊還原成報文,并直接播放對應詞條的語音,也可將通信報文接收完整后再整篇播放報文的語音。
權利要求
1、一種低速率等效語音水聲通信技術,包括轉換詞條庫、多媒體信息數(shù)據(jù)庫、信息采集及語音識別設備、信息代碼轉換匹配算法、顯控及信息編輯設備、水聲通信設備、多媒體信息播放器,其特征是通信過程如下
1)建立轉換詞條庫和多媒體信息數(shù)據(jù)庫,轉換詞條庫包含字、詞、術語、短語、語句片段、常用語句、圖像及符號等,它們統(tǒng)稱為詞條,每個詞條對應一個詞條代碼,多媒體信息數(shù)據(jù)庫中的記錄與轉換詞條庫中的詞條的語音或圖形符號一一對應,它們都對應一個相同的詞條代碼;
2)通過語音識別設備將通信語音信息識別轉換成對應文字組成的報文,或顯控及信息編輯設備直接編輯通信報文,通過轉換詞條庫和信息代碼轉換匹配算法將該報文切分成最少數(shù)量的構成單元,每個構成單元對應轉換詞條庫中的一個詞條,每個詞條對應一個詞條代碼,依其先后次序構成詞條代碼串;
3)發(fā)送端用水聲通信設備將該詞條代碼串發(fā)送到水聲信道,收發(fā)雙方具有相同的轉換詞條庫和多媒體信息數(shù)據(jù)庫,接收端收到該詞條代碼串后,根據(jù)代碼格式分割出一個一個的詞條代碼,并一一對應地從轉換詞條庫或多媒體信息數(shù)據(jù)庫中取出詞條內碼及其對應的語音或圖形符號,根據(jù)需要由顯控及信息編輯設備連接還原成通信報文,或由多媒體信息播放器播放出其語音等信息。
2、根據(jù)權利要求1所述低速率等效語音水聲通信技術,其特征在于所述轉換詞條庫是其詞條可以是漢語、英語、日語、德語、法語、俄語等語種中的詞句;不僅包含通用的字、詞、詞組和短語,還包含指揮通信常用或專用的術語、語句片斷和常用語句等;其詞條可采用多級鏈表結構,將多個字或詞鏈接成一個詞條,每個詞條對應一個詞條代碼和詞條內碼;對于漢語詞條中各字的機內碼可用GB2312、GB18030內碼表示,也可用BIG-5、Unicode內碼表示,還可以用其它形式的內碼表示,包括多級漢字及某些圖形符號;對于由多個字母組成詞的語種,如英語、法語、俄語,是以多字母組成的詞或可獨立表意的字母和符號組為基本編碼單元;各語種可以獨立編碼轉換詞條庫,也可以統(tǒng)一編碼形成通用的轉換詞條庫。
3、根據(jù)權利要求2所述低速率等效語音水聲通信技術,其特征在于所述轉換詞條庫中的詞條,詞的結構可描述為由若干個葉結點、子結點和根結點構成的多叉樹結構,它對應以根結點上的字開頭的一群詞句;每棵多叉樹對應詞庫中的一個多級鏈表;多叉樹的每個結點都對應一個字,結點的內碼可用該字的機內碼表示;每個結點還對應一個詞條代碼和詞條內碼,該詞條代碼是從根結點到本結點的路徑上的若干個字構成的詞句,根據(jù)其在通信過程中出現(xiàn)頻率的高低進行統(tǒng)計編碼求得的變長碼,該詞條內碼可用從根結點到本結點的路徑上的若干個字的機內碼的順序組合表示。
4、根據(jù)權利要求2或3所述低速率等效語音水聲通信技術,其特征在于所述多級鏈表是首先構建一個包含所需字及符號的字表,每個能以其為首構成詞、術語、短語、語句片段、甚至常用語句的字均有一個對應的下級鏈表,表內包含全部能與其一起構成詞句的下一個字的機內碼和對應節(jié)點的詞條代碼以及其再下一級鏈表的信息;以此類推,每個能與前N個字構成詞句的第N+1個字也有一個對應的再下級鏈表,表內包含全部能與這前N+1個字一起構成詞句的第N+2個字的機內碼和從首字到本級結點字構成的多字詞的詞條代碼,如果還有再下一級的鏈表則還包括其再下一級鏈表的信息,如果沒有再下一級的鏈表了,則在其對應下級鏈表的鏈表地址或鏈表索引處給出詞條結束標志。
5、根據(jù)權利要求1所述低速率等效語音水聲通信技術,其特征在于所述多媒體信息數(shù)據(jù)庫是多媒體信息數(shù)據(jù)庫中的記錄與轉換詞條庫中的詞條一一對應;每個記錄至少包含詞條代碼字段、詞條內碼字段、詞條語音或圖形符號的流媒體字段;或者每個記錄至少包含詞條代碼字段、詞條內碼的鏈接字段、詞條語音或圖形符號的流媒體的鏈接字段;詞條內碼的鏈接字段存放詞條內碼的存儲地址信息或詞條內碼的索引信息,詞條語音或圖形符號的流媒體的鏈接字段記錄詞條的語音或圖形符號的流媒體的存儲地址信息或該詞條的語音或圖形符號的流媒體的索引信息。
6、根據(jù)權利要求1所述低速率等效語音水聲通信技術,其特征在于所述信息代碼轉換匹配算法是從報文開頭的第一個字開始,掃描讀入第一個字的機內碼,從轉換詞條庫的首字表內找到該字,并建立鏈表指針指向以該字開頭的一群詞的次級鏈表。依次讀入報文下一個字的內碼,并在能與首字構成雙字搭配的次級鏈表內查找是否存在該字,如果不存在,則取出首字表中對應該字的詞條代碼,并將其下一個字作為首字重新進行查找匹配;如果存在該字,則將鏈表指針指向以這兩個字開頭的再下級鏈表,再讀入報文的下一個字,直至讀入的第N+1個字不在由前N個字構成的下級鏈表內,取出與第N個字對應鏈表中的詞條代碼就作為該N字詞條的詞條代碼,報文的第N+1個字又作為首字繼續(xù)進行匹配,直至報文結束;信息代碼轉換匹配過程主要包括下列步驟
(1)設通信報文字符串Q=U0,U1,…,Un,U0,…,Un表示通信報文的第0到第n個字,其對應內碼M=M0,M1,…,Mn,字串Qi=Ui,…,Uj,0≤i≤n,i≤j≤n,Qi∈Q且Qi∈ZHCTK,它是通信報文字符串Q的子字符串,也是能在轉換詞條庫ZHCTK中匹配到的最長字串,其對應的詞條代碼為QMi,相關度函數(shù)Ri=int GetRel(Qi,ZHCTK),即Ri=Qi中構成語句片段的字數(shù);
(2)定義報文指針pi指向報文中的第i字Ui,即Pi→Ui,讀取其內碼為Mi,(0≤i≤n),SZNMB為首字內碼表,Mi∈SZNMB表示第i個字Ui的內碼Mi存在于首字內碼表SZNMB內;鏈表指針Li指向與字Ui對應的下級鏈表L(Ui),即Li→L(Ui);
(3)首字索引,將報文指針pi指向報文的第一個字U0,并讀取其內碼M0和與其對應的詞條代碼QM0,并將鏈表指針Li指向與字U0對應的下級鏈表L(U0),即Li→L(U0),i=i+1,使指針指向下一個字;
(4)次字索引,將報文指針pi指向報文的下一個字U1,讀取其內碼Mi,并判斷若M1∈L(U0),則將鏈表指針Li指向與字U1對應的下級鏈表L(U1),即Li→L(U1);若則讀取與U0對應的詞條代碼QM0作為該單字詞的編碼輸出,并將U1作為下一個編碼單元的首字;
(5)若i≥n,則轉步驟(7);否則i=i+1,將報文指針pi指向報文的下一個字Ui,讀取其內碼Mi,并判斷若Mi∈L(Uj-1),則將鏈表指針Li指向與字Ui對應的下級鏈表L(Ui),即Li→L(Ui);若則讀取與Ui-1對應的詞條代碼QMi-1作為該字串的編碼輸出,并將Ui作為下一個編碼單元的首字;
(6)若i<j,則轉步驟(5);否則i=i+1,讀取與Uj對應的詞條代碼QMj作為該單元詞條的編碼輸出,并將Ui作為下一個編碼單元的首字,若i<n,則轉步驟(5);
(7)讀取與Ui對應的詞條代碼QMi作為該單元詞條的編碼輸出;
通過上述信息匹配和代碼轉換,將通信報文字符串Q=U0,U1,…,Un轉換成簡短的詞條代碼串QM=QM0,QM1,…,QMk,0≤k≤n,且每個詞條代碼QMi均對應一個多媒體信息數(shù)據(jù)庫中的一個記錄,該記錄包含字串Qi=Ui,…,Uj中各個字的內碼及其語音流媒體的鏈接信息等。
7、根據(jù)權利要求1或2所述低速率等效語音水聲通信技術,其特征在于所述語句片段是由若干個字、詞或詞組甚至是短句構成,是一種比詞或詞組的長度大且能在句子中常出現(xiàn),可表達一定信息的語句構成單元,是語言表達中若干個字和詞的常用搭配,并可被編制成轉換詞條庫中的詞條,每個語句片段對應一個簡短的詞條代碼。
8、根據(jù)權利要求1、2、3、5或6所述低速率等效語音水聲通信技術,其特征在于所述詞條代碼是它是與轉換詞條庫中的詞條一一對應的可變碼長的多位二進制編碼,其編碼長度是根據(jù)該詞條在整個轉換詞條庫中按其在通信過程中出現(xiàn)概率的大小排序,出現(xiàn)概率越大的詞條對應越短的編碼位數(shù)的詞條代碼,不常出現(xiàn)的詞條對應長的編碼位數(shù)的詞條代碼;每個詞條代碼均包含表示代碼屬性及其代碼長度的標志位。
9、根據(jù)權利要求4所述低速率等效語音水聲通信技術,其特征在于所述詞條代碼是它是與轉換詞條庫中的詞條一一對應的可變碼長的多位二進制編碼,其編碼長度是根據(jù)該詞條在整個轉換詞條庫中按其在通信過程中出現(xiàn)概率的大小排序,出現(xiàn)概率越大的詞條對應越短的編碼位數(shù)的詞條代碼,不常出現(xiàn)的詞條對應長的編碼位數(shù)的詞條代碼;每個詞條代碼均包含表示代碼屬性及其代碼長度的標志位。
10、根據(jù)權利要求7所述低速率等效語音水聲通信技術,其特征在于所述詞條代碼是它是與轉換詞條庫中的詞條一一對應的可變碼長的多位二進制編碼,其編碼長度是根據(jù)該詞條在整個轉換詞條庫中按其在通信過程中出現(xiàn)概率的大小排序,出現(xiàn)概率越大的詞條對應越短的編碼位數(shù)的詞條代碼,不常出現(xiàn)的詞條對應長的編碼位數(shù)的詞條代碼;每個詞條代碼均包含表示代碼屬性及其代碼長度的標志位。
11、根據(jù)權利要求7所述低速率等效語音水聲通信技術,其特征在于所述等效語音是用存儲在多媒體信息數(shù)據(jù)庫中的詞條的經人工錄音得到的語音取代說話者的語音,也可直接用語音合成技術得到報文的合成語音去取代說話者的語音,等效地實現(xiàn)用語音表達所需表達的通信語言信息;若采用語音合成技術播報通信報文的合成語音信息,則在多媒體信息數(shù)據(jù)庫中不必存儲各詞條的語音多媒體流信息,而是通過通用的語音合成軟件直接將報文中的文字播放出其合成語音;接收端可一邊接收詞條代碼一邊還原成報文,并直接播放對應詞條的語音,也可將通信報文接收完整后再整篇播放報文的語音。
全文摘要
一種低速率等效語音水聲通信技術,先將語音通過語音識別轉換成報文,通過轉換詞條庫和信息代碼轉換匹配算法將報文轉換成簡短的詞條代碼串,每個詞條代碼和多媒體信息數(shù)據(jù)庫中與該詞條的多媒體語音記錄一一對應,通過水聲通信設備將該詞條代碼串發(fā)送到水聲信道,收發(fā)雙方具有相同的轉換詞條庫和多媒體信息數(shù)據(jù)庫,接收端將收到的詞條代碼串解碼成相應的文字并播放出其語音等信息。本發(fā)明可顯著降低水聲報文及語音通信的傳輸速率要求,接收端又可實時清晰地播放出包括報文和語音甚至圖像的信息,既可顯著降低水聲通信系統(tǒng)的設計技術難度,又可提高系統(tǒng)的可靠性和通信保密性。
文檔編號H04B13/00GK101388731SQ20071003028
公開日2009年3月18日 申請日期2007年9月14日 優(yōu)先權日2007年9月14日
發(fā)明者劉林泉, 李宏偉, 波 吳, 超 尚, 平 于, 劉百峰, 周志強, 劉松海 申請人:劉林泉