專利名稱:口語仿真學習機的制作方法
技術(shù)領(lǐng)域:
本實用新型涉及一種視聽語音設(shè)備,尤其指一種模仿真人對話的口語仿真學習機。
背景技術(shù):
磁帶語音復讀機是一種傳統(tǒng)的學習機,它在英語學習過程中可以反復聽某一個句子或某一個單詞的錄音,學習者跟隨朗讀,反復多次達到記憶的目的。這種復讀機解決了反復聽某一句錄音而不需要“倒帶”這樣繁瑣操作的問題,基本上可以讓學習者方便地聽錄音。
近期市面上陸續(xù)出現(xiàn)一種“數(shù)碼英語學習機”,這種學習機在保留磁帶復讀機跟讀、比讀等功能的基礎(chǔ)上,重點強調(diào)超強復讀,即可任意定義A、B兩點進行復讀。如市面上銷售的“愛國者英語學習機”就屬于這種學習機。還有一些產(chǎn)品在這種學習機的基礎(chǔ)上設(shè)置麥克風插口,使用者可外接麥克風,將自己跟讀的語音記錄下來,然后放錄音,學習者自己比對,調(diào)整發(fā)音。
以上兩種學習機的重點是在“聽”的概念上做文章,說的功能簡單,聽的內(nèi)容只是機械的重復,使用者聽幾遍就沒有興趣再聽下去,學習起來比較枯燥,缺乏現(xiàn)實語境中的聽說訓練。
實用新型內(nèi)容本實用新型的目的是要解決傳統(tǒng)學習機功能單一、沒有人機對話功能的技術(shù)問題,提出一種既能結(jié)合聽說功能,又能模擬真人對話的口語仿真學習機。
一般英語學習的重點在于如何掌握豐富的詞匯和在實際語言環(huán)境中的快速發(fā)揮訓練,包括單詞、語法、句型、語態(tài)、語調(diào)等的綜合運用。本實用新型提出的口語仿真學習機是一個帶有真人語音數(shù)據(jù)庫的隨身攜帶的學習工具,能夠隨機向?qū)W習者發(fā)問,一問一答實現(xiàn)人機語音對話,創(chuàng)造出與真人對話、交流的氛圍,而這種氛圍對詞匯鞏固和綜合運用能力鍛煉有著較好的效果。
本實用新型提出的口語仿真學習機包括微處理器,存儲器、液晶顯示器、輸入鍵盤、解碼器、數(shù)模轉(zhuǎn)換器、放大器、輸出耳機,還包括與微處理器連接的語音識別模塊和麥克風。所述的語音識別模塊可以由解碼器、模數(shù)轉(zhuǎn)換器、微控制器組成,也可以采用語音識別引擎加模數(shù)轉(zhuǎn)換器組成。
本實用新型能夠模仿真人對話的場景和氛圍,充分調(diào)動使用者的學習情緒,達到良好的學習效果。與傳統(tǒng)的學習機相比,本實用新型具有如下優(yōu)點1.人機單詞對話,讓學習者輕松進行詞匯錘煉;2.人機語句對話,讓學習者身臨其境在各種語言環(huán)境模塊中游歷;3.對錯誤對話記錄進行隨機測驗,更符合學習者的需要;4.提高學習興趣,從而帶來良好的學習效果;5.體積小,易于隨身攜帶;6.成本與現(xiàn)有的數(shù)碼學習機相差不大,在價格上具有競爭優(yōu)勢。
以下結(jié)合附圖和具體實施例對本實用新型進行詳細說明,其中
圖1是本實用新型的方框圖;圖2是本實用新型第一實施例的方框圖;圖3是本實用新型第一實施例的語音識別模塊電路圖;圖4是本實用新型第二實施例的方框圖。
具體實施方式
如
圖1所示,本實用新型包括微處理器1,存儲器2、液晶顯示器3、輸入鍵盤4、解碼器5、數(shù)模轉(zhuǎn)換器6、放大器7,輸出耳機8,還包括與微處理器1連接的音識別模塊9和輸入麥克風10。存儲器2可以采用大容量閃存、光盤或移動硬盤。顯示器3采用LCD液晶顯示器。語音識別模塊9是本實用新型的重點,其作用是接受麥克風10的輸入信號,并對其進行識別,微處理器1根據(jù)識別結(jié)果控制系統(tǒng)運行。
圖2是本實用新型的一個實施例。在該實施例中,語音識別模塊9由解碼器11、模數(shù)轉(zhuǎn)換器12、微控制器13組成。解碼器11通過接口電路連接微處理器1,接受由其傳來的數(shù)字語音信號,通過接口電路輸出給微控制器13。而麥克風語音經(jīng)模數(shù)轉(zhuǎn)換器12轉(zhuǎn)換后,通過接口電路輸出給微控制器13??紤]成本因素,圖中微控制器13可采用89C51芯片,由其對麥克風輸入的語音和內(nèi)存語音進行語音識別,最后將結(jié)果反饋給微處理器1,微處理器根據(jù)識別結(jié)果,控制系統(tǒng)運行。麥克風10的另一路語音直接送至耳機放大電路,作為輸入監(jiān)聽。
本實用新型第一實施例的核心是對一句完整語音進行整體識別,譬如一個單詞或者一句話的語音,因此需要將相關(guān)語音文件預先存入存儲器2。
根據(jù)本實用新型功能需要,可以在某一時間段里通過液晶顯示器3交替顯示兩個不同內(nèi)容的文本,也可以加裝另一塊液晶顯示器14,專門顯示“提示文本”,如圖2所示。
語音識別控制程序描述在任一人機對話程序中,當某一單詞或語句語音輸出完畢,麥克風10的輸入有效,當麥克風的語音輸入出現(xiàn)時,微控制器13開始以一定的取樣頻率(調(diào)試選定)對來自麥克風10的語音信號和來自微處理器1從存儲器2讀取的內(nèi)存語音信號進行比較,同時把總的取樣次數(shù)進行計數(shù),結(jié)果假設(shè)存于寄存器A,把取樣中二者差值大于預定值(調(diào)試選定)的取樣也進行計數(shù),結(jié)果假設(shè)存于寄存器B,當麥克風的輸入語音結(jié)束時,微控制器13停止取樣,同時比較寄存器A和B中的數(shù)值,當比值位于預定值(調(diào)試選定)之內(nèi)時,向微處理器1輸出一個執(zhí)行下一命令的信號,否則輸出一個讀取存儲器中一個特定語音數(shù)據(jù)的信號,從耳機中輸出,譬如“請再重復一遍!”的語音文件,同時計數(shù)器復位,寄存器清零。當麥克風的語音再次出現(xiàn)時,微控制器重復取樣,直到能被識別的語音輸入或者按鍵中斷。
當用本實用新型第一實施例方案學習英文單詞時,首先,微處理器1從外存2中隨機或按照要求讀出一個單詞的中文(或英文)語音文件和文本文件,并分別送至解碼器5和液晶器3,語音文件經(jīng)處理后從耳機輸出真人語音(即“問句”);語音信號輸出完畢時,麥克風輸入有效,系統(tǒng)等待麥克風的語音輸入;當麥克風信號出現(xiàn)(信噪比調(diào)試選定)時,微控制器13同時接受微處理器1從外存中讀出的該單詞譯文語音數(shù)據(jù)和來自麥克風語音數(shù)據(jù),當語音輸入結(jié)束時,向微處理器1反饋比較結(jié)果,根據(jù)結(jié)果,微處理器要么執(zhí)行下一“提問”命令,要么讀取一特定語音文件,并經(jīng)耳機語音輸出,譬如“請再說一遍!”,以維持良好的對話氛圍,這時微控制器13會等待再一次語音輸入并執(zhí)行,當然學習者可以隨時按鍵中斷;其中,在“問句”語音信號播放完畢后約三秒鐘(給學習者一個思考的空間),微處理器1讀出該單詞譯文文本文件,并送至液晶顯示器14,如圖2所示。液晶顯示器14也可以通過微處理器1軟件設(shè)計集成到液晶顯示器3中。
當用本實用新型第一實施例方案學習語句對話時,首先,微處理器1從存儲器2隨機或按照要求讀出(文件庫)某語境塊中某對話句組的“起始問句”的文本文件、語音文件,分別送至解碼器5和液晶顯示器3,語音文件經(jīng)處理后從耳機中輸出真人語音;語音信號輸出完畢時,麥克風輸入有效,系統(tǒng)等待麥克風的語音輸入;當麥克風信號出現(xiàn)(信噪比調(diào)試選定)時,微控制器13同時接受微處理器1從外存中讀出該語句的“回答語句”語音數(shù)據(jù)和來自麥克風語音數(shù)據(jù),當語音輸入結(jié)束時,向微處理器1反饋比較結(jié)果,根據(jù)結(jié)果,微處理器要么執(zhí)行下一“提問”命令,要么讀取一特定語音文件,并經(jīng)耳機語音輸出,譬如“請再說一遍!”,以維持良好的對話氛圍,這時微控制器13會等待再一次語音輸入并執(zhí)行,當然學習者可以隨時按鍵中斷;其中,在“問句”語音信號播放完畢后約三秒鐘(給學習者一個思考的空間),微處理器1讀出“回答語句”文本文件,并送至液晶顯示器14。
圖3是本實用新型第一實施例的語音識別模塊電路圖。該電路中微處理器1采用雙口RAMCY7C133芯片、解碼器11采用TMS320C32芯片、存儲器2采用兩片單口存儲器61C256、微控制器13采用89C51芯片、模數(shù)轉(zhuǎn)換器12用ADS7832。CY7C133是16位數(shù)據(jù)總線、11位地址總線的高速2K×16CMOS雙端口靜態(tài)RAM,解碼器11通過它與微處理器1進行高速數(shù)據(jù)通信,微控制器13是模塊的核心,是一片性價比較高的8位單片機。當檢測到麥克風語音輸入時,它通過控制總線的程序讀(PSEN)信號線,控制模數(shù)轉(zhuǎn)換器12的轉(zhuǎn)換啟動,以及控制微處理器1的“對話答句”語音文件的讀取操作,位于兩片兩個結(jié)果61C256中的取樣結(jié)果,在微控制器13的讀取命令下,同時送至其PO口和P1口,并進行比較、識別,識別比較的過程如前所述的“控制程序描述”。
圖4是本實用新型的第二個實施例,本方案的核心是對一句語音(一個單詞或者一句話)進行關(guān)鍵詞識別,因此,必須在存儲器2中植入一個語音識別引擎,如IBM提供的語音識別引擎,即ASR(Automatic SpeechRecognization),又稱語音識別系統(tǒng)。在該實施例中,語音識別模塊9包括A/D模數(shù)轉(zhuǎn)換器及相關(guān)的接口電路,麥克風的10的語音一路經(jīng)模數(shù)轉(zhuǎn)換器15送給微處理器1控制的語音識別引擎識別,另一路直接送至音頻放大器7,作為輸入監(jiān)聽。
語音識別程序描述在人機對話程序中,當某一單詞或語句語音輸出完畢時,麥克風輸入有效,系統(tǒng)等待麥克風語音輸入;當麥克風語音輸入出現(xiàn)時,微處理器1同時對從外存中讀出該語句的“回答語句”語音數(shù)據(jù)和來自麥克風語音數(shù)據(jù)進行關(guān)鍵詞識別,分別對識別的關(guān)鍵詞數(shù)和不被識別的關(guān)鍵詞數(shù)進行計數(shù),當語音輸入結(jié)束時,微控制器停止識別,同時比較兩個計數(shù)結(jié)果,當比值位于預定值(調(diào)試選定)之內(nèi)時,微處理器1則執(zhí)行下一命令,否則輸出一個讀取存儲器中一個特定語音數(shù)據(jù)的信號,從耳機中輸出,譬如“請再重復一遍!”的語音文件,并從耳機語音輸出,譬如“請再重復一遍!”的語句,同時計數(shù)器復位,寄存器清零。當麥克風的語音再次出現(xiàn)時,微處理器重復執(zhí)行識別操作,直到識別通過或者按鍵中斷。
本實用新型存儲器2中的語音文件及文本文件庫設(shè)計如下1、包括單詞庫和對話語句庫,前者包含每個單詞及釋義的中英文文本數(shù)據(jù)和每個單詞的中英文語音數(shù)據(jù),后者包含每個語句中英文文本數(shù)據(jù)和語音數(shù)據(jù)。
2、文本數(shù)據(jù)采用PC機常用的文件系統(tǒng)管理,語音數(shù)據(jù)采用壓縮格式的音頻格式。
3、單詞庫和對話語句庫可以針對不同水平的使用者進行等級分類,如初中水平、高中水平、大學四級水平、大學六級水平等。
4、對話語句庫由若干個語言環(huán)境塊組成,每個語言環(huán)境塊由若干個對話語句組構(gòu)成,一個定義的語言環(huán)境塊可以包括若干個內(nèi)容相關(guān)的對話句組,例如定義為高中英語水平的“機場接機”的語言環(huán)境塊,可以包括這些對話句組與出租車司機的對話(去機場),與咨詢臺小姐的對話(在機場),與客人間的對話(在出口),與客人的對話(在返程路上),與前臺小姐的對話(在入住酒店)。當然,與客人間的對話,是與一個陌生人的對話,所以又可以邏輯組合到其他的語境塊中;當然與出租車司機的對話句組又可以有不同的版本。
5、微處理器1會把每次按鍵中斷的句子或單詞分別記錄下來,在一個小程序里,學習者可以接受機器再次反復的隨機測驗,每次測驗時模塊都給正確回答計數(shù),當該單詞或語句成功接受3次(可任意定義)回答后,系統(tǒng)自動將該單詞或語句從錯誤記錄里刪除。
本實用新型存儲器2中的本實用新型還可以集成其他功能,如復讀、跟讀、MP3播放器等功能,在遵循相關(guān)存儲協(xié)議規(guī)范時,整個設(shè)備還可以作為個人電腦的一個大容量移動存儲設(shè)備使用。
權(quán)利要求1.一種口語仿真學習機,包括微處理器(1)、存儲器(2)、液晶顯示器(3)、按鍵面板(4)、解碼器(5)、數(shù)模轉(zhuǎn)換器(6)、放大器(7)、耳機(8),其特征在于,還包括語音識別模塊(9)和麥克風(10)。
2.如權(quán)利要求1所述的口語仿真學習機,其特征在于所述的語音識別模塊(9)包括解碼器(11),模數(shù)轉(zhuǎn)換器(12)和微控制器(13)。
3.如權(quán)利要求1所述的口語仿真學習機,其特征在于存儲器(2)內(nèi)嵌套有語音識別引擎,所述的語音識別模塊(9)由與微處理(1)相連的模數(shù)轉(zhuǎn)換器(15)組成。
4.如權(quán)利要求1所述的口語仿真學習機,其特征在于麥克風(10)的信號除輸出給語音識別模塊(9)外,還輸出給耳機監(jiān)聽電路。
5.如權(quán)利要求1所述的口語仿真學習機,其特征在于還設(shè)有一個與微處理器(1)相連的,用于顯示“回答提示文本”的液晶顯示器(14)。
6.如權(quán)利要求1所述的口語仿真學習機,其特征在于微處理器(1)設(shè)有一個通過通信線與個人電腦進行通信的接口。
專利摘要一種口語仿真學習機,包括微處理器(1),與微處理器(1)連接的存儲器(2)、液晶顯示器(3)、輸入鍵盤(4)、解碼器(5)、模數(shù)轉(zhuǎn)換器(6)、放大器(7)和耳機(8),其特征在于還包括與微處理器(1)連接的語音識別模塊(9)和麥克風(10)。本實用新型提出的口語仿真學習機是一個模仿帶有真人語音數(shù)據(jù)庫的隨身攜帶的學習工具,能夠隨機向?qū)W習者發(fā)問,一問一答實現(xiàn)人機語音對話,創(chuàng)造出與真人對話交流的氛圍。
文檔編號G09B7/00GK2755698SQ200420102510
公開日2006年2月1日 申請日期2004年12月6日 優(yōu)先權(quán)日2004年12月6日
發(fā)明者聶鑒強 申請人:聶鑒強