飛機(jī)駕駛艙語(yǔ)音指令控制系統(tǒng)及其操作方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及一種語(yǔ)言指令控制系統(tǒng),尤其涉及飛機(jī)駕駛艙語(yǔ)音指令控制系統(tǒng)及其操作方法,屬于航空領(lǐng)域中的語(yǔ)音處理技術(shù)。
【背景技術(shù)】
[0002]語(yǔ)言是人類(lèi)表達(dá)最自然、最有效的方法,語(yǔ)音的輸入無(wú)需占用界面上的特殊空間,語(yǔ)音還具有無(wú)方向性、允許存在距離間隔,還可以解放出雙眼和手,因此適應(yīng)于在許多特定環(huán)境中的使用。例如,使用“語(yǔ)音撥號(hào)”,人們只需一次性地“讀入”人名或電話號(hào)碼,就能方便的進(jìn)行撥號(hào)操作;語(yǔ)音查詢則可用于旅游業(yè)及服務(wù)業(yè)的各種查詢系統(tǒng),如語(yǔ)音自動(dòng)導(dǎo)游系統(tǒng),游客可以通過(guò)與系統(tǒng)的交互式對(duì)話,獲取自己感興趣的景點(diǎn)相關(guān)信息;對(duì)于傷殘者,能夠全部使用聲音控制的各種現(xiàn)代電器和辦公設(shè)備可以給他們帶來(lái)極大的生活工作便利;在通信方面,通過(guò)“語(yǔ)音識(shí)別一機(jī)器翻譯一語(yǔ)音合成”將一種語(yǔ)音直接轉(zhuǎn)換成另一種語(yǔ)言,實(shí)現(xiàn)兩種語(yǔ)言之間的直接通信;在工業(yè)控制方面,對(duì)于在一些工作環(huán)境惡劣或手工難以操作的地方,均可通過(guò)語(yǔ)音發(fā)出相應(yīng)的控制命令,讓設(shè)備完成各種工作。
[0003]信息科學(xué)的發(fā)展、技術(shù)的進(jìn)步對(duì)指揮控制的技術(shù)提出了更高的要求,語(yǔ)音識(shí)別將是車(chē)載、機(jī)載、艦載綜合電子設(shè)備中一項(xiàng)不可缺少的內(nèi)容,機(jī)載語(yǔ)音識(shí)別技術(shù)的研宄對(duì)于飛機(jī)駕駛員在高速行駛中發(fā)出各種必要的控制命令,提高整個(gè)作戰(zhàn)系統(tǒng)的反應(yīng)速度,有著重要的意義。在有效減少離桿操作、降低飛行員的操作負(fù)擔(dān)、實(shí)現(xiàn)飛行員的思維決策與任務(wù)操作的直接對(duì)接、保持思維過(guò)程的連續(xù)性、提高飛行安全等方面,語(yǔ)音指令控制方式都具備其獨(dú)特的優(yōu)勢(shì)。
【發(fā)明內(nèi)容】
[0004]本發(fā)明的目的在于解決上述的技術(shù)問(wèn)題,提出飛機(jī)駕駛艙語(yǔ)音指令控制系統(tǒng)及其操作方法。
[0005]本發(fā)明的第一個(gè)目的,飛機(jī)駕駛艙語(yǔ)音指令控制系統(tǒng),其特征在于:包括語(yǔ)音識(shí)別單元、控制單元和輸出單元;
所述語(yǔ)音識(shí)別單元包括依次串聯(lián)的語(yǔ)音輸入模塊、語(yǔ)音預(yù)處理模塊和語(yǔ)音識(shí)別模塊;所述控制單元包括控制模塊及與控制模塊相連的語(yǔ)音指令設(shè)置模塊和語(yǔ)音識(shí)別啟動(dòng)豐吳塊;
所述輸出單元包括命令輸出模塊和語(yǔ)音輸出模塊,其中命令輸出模塊由命令反饋模塊和命令執(zhí)行模塊組成;
所述控制模塊與語(yǔ)音識(shí)別模塊之間由RS232總線相連,所述控制模塊的輸出端分別連接命令輸出模塊和語(yǔ)音輸出模塊;所述語(yǔ)音指令設(shè)置模塊的輸出端與語(yǔ)音識(shí)別模塊相連,所述命令反饋模塊的輸出端與控制模塊相連。
[0006]優(yōu)選的,所述語(yǔ)音輸入模塊包括依次串聯(lián)的麥克風(fēng)陣列、語(yǔ)音信號(hào)處理模塊和語(yǔ)音信號(hào)輸出模塊。
[0007]優(yōu)選的,所述語(yǔ)音預(yù)處理模塊包括依次串聯(lián)的預(yù)濾波模塊、采樣模塊、A/D轉(zhuǎn)換模塊、分頻模塊和頻率提升模塊。
[0008]優(yōu)選的,所述語(yǔ)音識(shí)別模塊包括依次串聯(lián)的端點(diǎn)檢測(cè)模塊、特征提取模塊、信息比對(duì)模塊和命令I(lǐng)D輸出模塊。
[0009]優(yōu)選的,所述控制模塊包括依次串聯(lián)的語(yǔ)音命令發(fā)送模塊、串口發(fā)送/接收模塊、命令I(lǐng)D識(shí)別模塊和命令判斷模塊。
[0010]優(yōu)選的,所述語(yǔ)音識(shí)別模塊為DSP、ARM或FPGA語(yǔ)音識(shí)別模塊。
[0011]優(yōu)選的,所述控制模塊為FPGA控制模塊或單片機(jī)。
[0012]本發(fā)明的第二個(gè)目的,飛機(jī)駕駛艙語(yǔ)音指令控制系統(tǒng)的操作方法,其特征在于包括如下步驟:
a.語(yǔ)音指令設(shè)置步驟,在語(yǔ)音指令設(shè)置模塊中,將需要識(shí)別的語(yǔ)音指令設(shè)置好成為語(yǔ)音命令庫(kù);
b.啟動(dòng)語(yǔ)音識(shí)別命令步驟,通過(guò)語(yǔ)音識(shí)別啟動(dòng)模塊啟動(dòng)語(yǔ)音識(shí)別命令;
c.語(yǔ)音處理及識(shí)別步驟,語(yǔ)音輸入模塊接收到外界的語(yǔ)音,傳輸至語(yǔ)音預(yù)處理模塊,語(yǔ)音預(yù)處理模塊將語(yǔ)音做端點(diǎn)檢測(cè)處理,提取出語(yǔ)音的特征,并與語(yǔ)音指令設(shè)置模塊中的語(yǔ)音命令庫(kù)作對(duì)比,找出語(yǔ)音與語(yǔ)音命令庫(kù)內(nèi)最匹配的一條語(yǔ)音指令;
d.匹配語(yǔ)音數(shù)據(jù)傳輸步驟,語(yǔ)音識(shí)別模塊將匹配到的語(yǔ)音指令數(shù)據(jù)通過(guò)RS232總線發(fā)送至控制模塊;
e.命令輸出步驟,控制模塊將語(yǔ)音指令數(shù)據(jù)發(fā)送至命令輸出模塊內(nèi);
f.指令執(zhí)行及反饋步驟,命令輸出模塊接收到語(yǔ)音指令數(shù)據(jù),驅(qū)動(dòng)命令執(zhí)行模塊執(zhí)行指令,并同時(shí)驅(qū)動(dòng)命令反饋模塊將反饋信息傳送至控制模塊;
g.語(yǔ)音反饋步驟,控制模塊接收到反饋信息后驅(qū)動(dòng)語(yǔ)音輸出模塊輸出機(jī)器語(yǔ)音,反饋給語(yǔ)音的發(fā)出者。
[0013]優(yōu)選的,當(dāng)步驟c中,外界的語(yǔ)音與語(yǔ)音命令庫(kù)匹配失敗時(shí),語(yǔ)音識(shí)別模塊則生成匹配失敗數(shù)據(jù),語(yǔ)音識(shí)別模塊將匹配失敗數(shù)據(jù)通過(guò)RS232總線發(fā)送至控制模塊,控制模塊進(jìn)行記錄,并生成匹配失敗信息驅(qū)動(dòng)語(yǔ)音輸出模塊輸出機(jī)器語(yǔ)音,反饋給語(yǔ)音的發(fā)出者。
[0014]本發(fā)明的有益效果主要體現(xiàn)在:本發(fā)明飛機(jī)駕駛艙語(yǔ)音指令控制系統(tǒng)可以實(shí)現(xiàn)飛機(jī)駕駛艙內(nèi)操作者語(yǔ)音指令控制,來(lái)代替?zhèn)鹘y(tǒng)的按鍵、開(kāi)關(guān)等其他輸入等功能,解放操作者的雙眼和手,提高飛行期間的操作效率,具有指令識(shí)別快,反饋信息快的特點(diǎn),且當(dāng)指令識(shí)別失敗時(shí),亦反饋信息,能及時(shí)提醒操作者再次發(fā)出指令或修改指令,防止操作者誤認(rèn)為指令已經(jīng)發(fā)出而延誤指令的發(fā)出。
【附圖說(shuō)明】
[0015]圖1是本發(fā)明飛機(jī)駕駛艙語(yǔ)音指令控制系統(tǒng)的操作方法的框圖示意圖;
圖2是本發(fā)明中語(yǔ)音輸入模塊的框圖示意圖;
圖3是本發(fā)明中語(yǔ)音預(yù)處理模塊的框圖示意圖;
圖4是本發(fā)明中語(yǔ)音識(shí)別模塊的框圖示意圖;
圖5是本發(fā)明中控制模塊的框圖示意圖;
圖6是本發(fā)明的操作方法的流程示意圖。
【具體實(shí)施方式】
[0016]本發(fā)明提供了飛機(jī)駕駛艙語(yǔ)音指令控制系統(tǒng),特別地,包括語(yǔ)音識(shí)別單元、控制單元和輸出單元;語(yǔ)音識(shí)別單元包括依次串聯(lián)的語(yǔ)音輸入模塊、語(yǔ)音預(yù)處理模塊和語(yǔ)音識(shí)別模塊;控制單元包括控制模塊及與控制模塊相連的語(yǔ)音指令設(shè)置模塊和語(yǔ)音識(shí)別啟動(dòng)模塊;輸出單元包括命令輸出模塊和語(yǔ)音輸出模塊,其中命令輸出模塊由命令反饋模塊和命令執(zhí)行模塊組成;控制模塊與語(yǔ)音識(shí)別模塊之間由RS232總線相連,控制模塊的輸出端分別連接命令輸出模塊和語(yǔ)音輸出模塊;語(yǔ)音指令設(shè)置模塊的輸出端與語(yǔ)音識(shí)別模塊相連,命令反饋模塊的輸出端與控制模塊相連。如圖1所示,其中,語(yǔ)音輸入模塊、語(yǔ)音預(yù)處理模塊、語(yǔ)音識(shí)別模塊和控制模塊順次串聯(lián),構(gòu)成了本發(fā)明的核心部分。此外,語(yǔ)音指令設(shè)置模塊與語(yǔ)音識(shí)別模塊連接,同時(shí)該模塊受控制模塊的控制;語(yǔ)音識(shí)別啟動(dòng)模塊與控制模塊連接;控制模塊的輸出分別與命令輸出模塊和語(yǔ)音輸出模塊連接,后兩者是并列關(guān)系,可以同時(shí)執(zhí)行;命令輸出模塊與命令反饋模塊和命令執(zhí)行模塊連接,后兩者并列關(guān)系,此外命令反饋模塊又與控制模塊連接。
[0017]其中,如圖2所示,語(yǔ)音輸入模塊包括依次串聯(lián)的麥克風(fēng)陣列、語(yǔ)音信號(hào)處理模塊和語(yǔ)音信號(hào)輸出模塊,多個(gè)麥克風(fēng)組成陣列式麥克風(fēng)用來(lái)采集操作者的語(yǔ)音信息,使用傳統(tǒng)麥克風(fēng)說(shuō)話時(shí),人需要盡量靠近麥克風(fēng),對(duì)于本系統(tǒng)來(lái)說(shuō),靠近麥克風(fēng)說(shuō)話的就是“主音”,系統(tǒng)獲得較大的輸入。而對(duì)于旁邊的雜音,或者對(duì)話者從揚(yáng)聲器輸出的聲音相對(duì)“主音”來(lái)說(shuō),幅度都是比較小的,都屬于“干擾音”。本發(fā)明設(shè)置兩組以上麥克風(fēng),并以這些麥克風(fēng)對(duì)音訊進(jìn)行偵測(cè),所得到的語(yǔ)音信息交由語(yǔ)音信號(hào)處理模塊進(jìn)行比對(duì),用以還原聲音的原貌,并消除背景雜音。這樣系統(tǒng)可以更準(zhǔn)確過(guò)濾掉“干擾音”,保留“主音”。這樣,經(jīng)過(guò)麥克風(fēng)陣列和語(yǔ)音信號(hào)處理模塊處理后的語(yǔ)音信息最大程度上接近了操作者聲帶發(fā)出的聲音信息,這個(gè)語(yǔ)音信號(hào)由語(yǔ)音輸出模塊送至下一個(gè)模塊進(jìn)行處理。
[0018]如圖3所示語(yǔ)音預(yù)處理模塊包括依次串聯(lián)的預(yù)濾波模塊、采樣模塊、A/D轉(zhuǎn)換模塊、分頻模塊和頻率提升模塊。語(yǔ)音預(yù)處理模塊主要功能為對(duì)輸入的語(yǔ)音信號(hào)做A/D轉(zhuǎn)換處理。預(yù)濾波模塊對(duì)語(yǔ)音信號(hào)做濾波處理,這樣可以達(dá)到兩個(gè)目的:(I)抑制輸入信號(hào)各頻域分量中頻率超出fs/2的所有分量(fs:信號(hào)采樣頻率),以防止頻率混疊干擾;(2)抑制50Hz的電源工頻干擾。因此,預(yù)濾波模塊中的預(yù)濾波器必須是一個(gè)帶通濾波器,根據(jù)語(yǔ)音特性,它的通頻帶可以選100?3400Hz,基本覆蓋了語(yǔ)音信號(hào)的帶寬。采樣模塊中,根據(jù)采樣定律,要不失真地對(duì)3400Hz的信號(hào)進(jìn)行采樣,需要的最低采樣率是6800Hz。為了提高精度,A/D轉(zhuǎn)換模塊中的A/D采樣率在8kHz到12kHz。語(yǔ)音信號(hào)是時(shí)變的隨機(jī)信號(hào),對(duì)語(yǔ)音信號(hào)的分析處理必須采用短時(shí)分析法,也就是分幀,然后分幀進(jìn)行數(shù)據(jù)的處理,這一步在分頻模塊中實(shí)現(xiàn)。由于人的發(fā)聲器官的固有特性,語(yǔ)音從嘴唇輻射將有6分貝/倍頻的衰減,相當(dāng)于頻率每增加一倍,語(yǔ)音信號(hào)的功率將減少1/4。這種現(xiàn)象將會(huì)導(dǎo)致語(yǔ)音信號(hào)頻譜的畸化,主要表現(xiàn)在高頻信息的損失,對(duì)語(yǔ)音信號(hào)的特征提取會(huì)造成不利的影響。因此,必須對(duì)信號(hào)進(jìn)行高頻提升,即對(duì)信號(hào)進(jìn)行高頻的補(bǔ)償工作,使得信號(hào)頻譜平坦化,在頻率提升模塊中完成上述功能。
[0019]如圖4所示,語(yǔ)音識(shí)別模塊包括依次串聯(lián)的端點(diǎn)檢測(cè)模塊、特征提取模塊、信息比對(duì)模塊和命令I(lǐng)D輸出模塊。該模塊為本發(fā)明的核心部分之一。端點(diǎn)檢測(cè)模塊用于檢測(cè)語(yǔ)音信號(hào)的有無(wú),從輸入信號(hào)中提取一個(gè)或一系列的對(duì)比特征參數(shù)(量),然后將其和一個(gè)或一系列的門(mén)限閥值進(jìn)行比較。如果超過(guò)門(mén)限則表示當(dāng)前為有音段,否則表示當(dāng)前為無(wú)音段,門(mén)限閥值通常是根據(jù)無(wú)音段時(shí)的特征確定的。特征提取模塊用于提取語(yǔ)音信息里的特征參數(shù),模擬的語(yǔ)音信號(hào)在完成A/D轉(zhuǎn)換后成為數(shù)字信號(hào),此時(shí)的語(yǔ)音信號(hào)為時(shí)域的信號(hào),時(shí)域的信號(hào)難以進(jìn)行分析和處理,而且數(shù)據(jù)量龐大,需要對(duì)時(shí)域信號(hào)進(jìn)行變換,提取其中某種特定的參數(shù),通過(guò)一些更加能反映語(yǔ)音本質(zhì)特征的參數(shù)來(lái)進(jìn)行語(yǔ)音識(shí)別。在特征參數(shù)提取之后,直接進(jìn)行識(shí)別比對(duì),在信息比對(duì)模塊中,根據(jù)所選擇的識(shí)別比對(duì)算法比對(duì)出該語(yǔ)音對(duì)應(yīng)于語(yǔ)音模板庫(kù)中模板語(yǔ)音的序號(hào),最后得出識(shí)別的結(jié)果。如果比對(duì)結(jié)果為沒(méi)有找到匹配的指令,那么也會(huì)發(fā)送相關(guān)的數(shù)據(jù)給下一個(gè)模塊表明結(jié)果。在命令I(lǐng)D輸出模塊中,該結(jié)果按照協(xié)議與其他輔助數(shù)據(jù)一起打包發(fā)送出去,供后續(xù)模塊使用。
[002