專利名稱:發(fā)音矯正設(shè)備及方法
技術(shù)領(lǐng)域:
本發(fā)明是關(guān)于一種語音識(shí)別技術(shù),特別是關(guān)于一種可對(duì)使用者發(fā)音模式中的音節(jié)成分主動(dòng)進(jìn)行分析,并針對(duì)使用者的發(fā)音弱點(diǎn)提供改進(jìn)建議的發(fā)音矯正設(shè)備及方法。
背景技術(shù):
由于科技發(fā)達(dá)及交通便利,分布于世界各地的人們可借由先進(jìn)的網(wǎng)絡(luò)及通信技術(shù)相互交換信息,通過便利快速的交通工具前往世界各地訪問。因此,人與人之間的關(guān)系不再因距離的遙遠(yuǎn)而產(chǎn)生空間上的隔閡,反之,增加了人們相互間溝通及交流的頻率,即使分處于地球兩端,也會(huì)由于網(wǎng)絡(luò)通信的發(fā)達(dá)及交通工具的迅速便捷而可擺脫空間距離上的限制,將整個(gè)世界融合成一個(gè)沒有空間距離限制的地球村。
在此趨勢(shì)中,若要使分布于世界各地區(qū),且種族、生活習(xí)慣及語言都不相同的人們彼此間能溝通順暢,必須制定一種共同語言。這是因?yàn)檎Z言是人類溝通思想、傳遞信息與表達(dá)意愿最基本與最主要的工具,近年來,由于信息快速膨脹及國(guó)際間的互動(dòng)日趨頻繁,人與人之間溝通的障礙也已由地理上的空間隔閡轉(zhuǎn)為語言間的隔閡。據(jù)統(tǒng)計(jì),全球大約有九千種語言,以歐洲共同體為例,就涵蓋了約九種的官方語言,而在國(guó)際網(wǎng)絡(luò)市場(chǎng)行銷公司2000年的研究中指出,目前全球四億七千六百萬的國(guó)際互聯(lián)網(wǎng)人口,使用的語言超過10種以上,而且,除了母語之外,要通曉某種外語是相當(dāng)困難的事,更何況還要應(yīng)付各種不同的語言。因此開發(fā)出一個(gè)能將語言障礙打破的語言學(xué)習(xí)輔助機(jī)器,對(duì)不同語系間人們的交流及信息的互通,都將產(chǎn)生劃時(shí)代的影響。臺(tái)灣專利公告第448,379號(hào)案即提出一種計(jì)算機(jī)外國(guó)語教學(xué)的方法,其是利用互動(dòng)方式并搭配不同場(chǎng)景進(jìn)行教學(xué),是一種多媒體教學(xué)法,幫助使用者配合生活化的場(chǎng)景,學(xué)習(xí)在日常生活中如何使用外語進(jìn)行交談的技巧;此外,臺(tái)灣專利公告第468,120號(hào)案也提出一種外語口語學(xué)習(xí)系統(tǒng)及方法,該案是利用語音識(shí)別技術(shù)識(shí)別使用者的發(fā)音,再將所識(shí)別的字匯重新發(fā)音,供使用者自行矯正發(fā)音。
綜上可知,學(xué)習(xí)他國(guó)語言已成為現(xiàn)代人邁向國(guó)際化的必經(jīng)過程,因此,才有上述種種輔助方法產(chǎn)生。此外,市場(chǎng)上也有多種關(guān)于提高外語能力的書籍,這些方法都是希望以比較有效率的學(xué)習(xí)方式,縮短人們學(xué)習(xí)他國(guó)語言所需花費(fèi)的時(shí)間及金錢。不論是上述兩個(gè)案例還是市面上流通的外語學(xué)習(xí)輔助書籍及其提供的教材,在輔助使用者學(xué)習(xí)外國(guó)語言發(fā)音方面所采用的方式有兩種一種是請(qǐng)使用者作自我的聽力學(xué)習(xí),另一種是請(qǐng)使用者發(fā)出某些單字或句子的讀音后,給予相似度的評(píng)分,但它們都缺乏具有分析能力的訓(xùn)練方式,也無法針對(duì)使用者的發(fā)音方式提供改進(jìn)的方法及建議,因此,使用者只了解自己的發(fā)音不很正確,卻不知如何修正,使有心學(xué)習(xí)口語發(fā)音及改進(jìn)本身錯(cuò)誤發(fā)音方式的使用者必須通過專人進(jìn)行口語發(fā)音訓(xùn)練,并針對(duì)其錯(cuò)誤的發(fā)音方法進(jìn)行指導(dǎo)并提供改善建議,如此,雖可及時(shí)針對(duì)使用者本身錯(cuò)誤的口語發(fā)音進(jìn)行修正,但也造成使用者在時(shí)間及金錢上的耗費(fèi),因此,如何提供一種具有分析使用者發(fā)音正確與否,并可及時(shí)提供改進(jìn)建議供使用者參考的語言學(xué)習(xí)輔助設(shè)備,節(jié)省使用者所耗費(fèi)的時(shí)間及金錢并提高使用者的學(xué)習(xí)效率,是目前個(gè)人順應(yīng)國(guó)際化趨勢(shì)所必須克服的問題。
發(fā)明內(nèi)容
為克服上述現(xiàn)有技術(shù)的缺點(diǎn),本發(fā)明的主要目的在于提供一種發(fā)音矯正設(shè)備及方法,其可針對(duì)使用者的發(fā)音進(jìn)行分析并提供改進(jìn)意見供使用者參考。
本發(fā)明的另一目的在于提供一種發(fā)音矯正設(shè)備及方法,其可將針對(duì)使用者發(fā)音進(jìn)行分析所得的數(shù)據(jù)及使用者錯(cuò)誤的發(fā)音信息儲(chǔ)存在數(shù)據(jù)庫(kù)中,建立使用者本身的學(xué)習(xí)記錄,令使用者可隨時(shí)針對(duì)自己的發(fā)音弱點(diǎn)進(jìn)行改進(jìn)。
基于上述發(fā)明目的,本發(fā)明提供一種發(fā)音矯正設(shè)備及方法。
本發(fā)明的發(fā)音矯正設(shè)備包括(1)功能選擇模塊,其作為使用者使用發(fā)音矯正設(shè)備的操作接口,可供使用者直接操作,也可在該發(fā)音矯正設(shè)備與電子信息產(chǎn)品搭接時(shí),與電子信息產(chǎn)品所含的操作接口連接進(jìn)行操作;(2)數(shù)據(jù)供應(yīng)模塊,其提供使用者學(xué)習(xí)口語發(fā)音的訓(xùn)練教材;(3)口語特征相似庫(kù),其按口語發(fā)音的音節(jié)相似度區(qū)分各式音節(jié),并儲(chǔ)存;(4)口語識(shí)別單元,其利用語音識(shí)別算法、訓(xùn)練教材及已區(qū)分的各式音節(jié)等數(shù)據(jù)建立語音模型,并將使用者的發(fā)音與該語音模型進(jìn)行分項(xiàng)對(duì)比,將對(duì)比結(jié)果輸出;(5)專家系統(tǒng),其具有語音識(shí)別功能,可針對(duì)該對(duì)比結(jié)果進(jìn)行分析,并根據(jù)分析的結(jié)果為使用者提供改進(jìn)建議;以及(6)數(shù)據(jù)庫(kù),其儲(chǔ)存該專家系統(tǒng)分析的數(shù)據(jù)及使用者錯(cuò)誤的發(fā)音信息,以記錄使用者的學(xué)習(xí)記錄。
本發(fā)明的發(fā)音矯正方法包括(1)令該口語識(shí)別單元先行按口語音節(jié)相似度區(qū)分各式音節(jié),并予以儲(chǔ)存;(2)令該數(shù)據(jù)供應(yīng)模塊從專家系統(tǒng)中選定訓(xùn)練教材,以供使用者進(jìn)行發(fā)音練習(xí);(3)令該口語識(shí)別單元利用語音識(shí)別算法、已區(qū)分的各式音節(jié)及訓(xùn)練教材等數(shù)據(jù)建立語音模型,并將使用者的發(fā)音與該語音模型進(jìn)行分項(xiàng)對(duì)比,并輸出對(duì)比結(jié)果;(4)令該專家系統(tǒng)針對(duì)所得的分項(xiàng)對(duì)比結(jié)果進(jìn)行分析,并將分析數(shù)據(jù)連同使用者錯(cuò)誤的發(fā)音信息儲(chǔ)存在數(shù)據(jù)庫(kù)中;(5)令該專家系統(tǒng)針對(duì)使用者的發(fā)音問題提供改善建議。
綜上所述,本發(fā)明的發(fā)音矯正設(shè)備及方法可針對(duì)使用者的發(fā)音進(jìn)行分析,并提供改進(jìn)意見供使用者參考;還可將對(duì)使用者發(fā)音分析的數(shù)據(jù)及使用者錯(cuò)誤的發(fā)音信息儲(chǔ)存在數(shù)據(jù)庫(kù)中,建立使用者本身的學(xué)習(xí)記錄,令使用者可隨時(shí)針對(duì)自己的發(fā)音弱點(diǎn)進(jìn)行改進(jìn)。
圖1是本發(fā)明的發(fā)音矯正設(shè)備內(nèi)部結(jié)構(gòu)的方塊圖;以及圖2是本發(fā)明的發(fā)音矯正方法在進(jìn)行發(fā)音矯正程序時(shí)所進(jìn)行的各項(xiàng)步驟的流程圖。
具體實(shí)施例方式
實(shí)施例以下通過特定的具體實(shí)例詳細(xì)說明本發(fā)明的觀點(diǎn),但并非以任何觀點(diǎn)限制本發(fā)明的范疇。
圖1是本發(fā)明的發(fā)音矯正設(shè)備1的內(nèi)部結(jié)構(gòu)方塊圖。本發(fā)明的發(fā)音矯正設(shè)備1除可獨(dú)立使用外,也可與筆記本電腦、桌上電腦、個(gè)人數(shù)字助理等電子信息產(chǎn)品(圖未標(biāo))相互整合,以增加該電子信息產(chǎn)品的使用功能。如圖所示,該發(fā)音矯正設(shè)備1包括功能選擇模塊11、數(shù)據(jù)供應(yīng)模塊12、專家系統(tǒng)13、口語識(shí)別單元14、口語特征相似庫(kù)15及數(shù)據(jù)庫(kù)16。
口語特征相似庫(kù)15儲(chǔ)存有按口語音節(jié)相似度區(qū)分的各式音節(jié)數(shù)據(jù),并可根據(jù)數(shù)據(jù)庫(kù)16存放的數(shù)據(jù)進(jìn)行修正。
功能選擇模塊11可與電子信息產(chǎn)品搭接或直接組設(shè)在發(fā)音矯正設(shè)備1上,以對(duì)發(fā)音矯正設(shè)備1的發(fā)音訓(xùn)練功能進(jìn)行操作。
此時(shí),數(shù)據(jù)供應(yīng)模塊12從專家系統(tǒng)13中,選取范例單字、詞組或句子等作為訓(xùn)練教材,由發(fā)音矯正設(shè)備1按使用者設(shè)定的輸出方式(如通過電子產(chǎn)品的顯示屏(圖未標(biāo))或由聲音播放裝置輸出(圖未標(biāo))),令使用者根據(jù)數(shù)據(jù)供應(yīng)模塊12選定的訓(xùn)練教材進(jìn)行發(fā)音矯正訓(xùn)練。當(dāng)數(shù)據(jù)供應(yīng)模塊12將選定的訓(xùn)練教材輸出,供使用者進(jìn)行發(fā)音練習(xí)時(shí),也同時(shí)將該訓(xùn)練教材的文字內(nèi)容輸入口語識(shí)別單元14。
口語識(shí)別單元14可先行至口語特征相似庫(kù)15中取出與該訓(xùn)練教材發(fā)音模式相關(guān)的音調(diào)、音節(jié)等數(shù)據(jù),等使用者按訓(xùn)練教材發(fā)音方式讀出該訓(xùn)練教材的讀音時(shí),口語識(shí)別單元14即接收使用者所發(fā)出的讀音,并與現(xiàn)有的從數(shù)據(jù)供應(yīng)模塊12輸入的訓(xùn)練教材文字內(nèi)容,及由口語特征相似庫(kù)15取出與該訓(xùn)練教材文字內(nèi)容相關(guān)的發(fā)音模式相互進(jìn)行對(duì)比。該口語識(shí)別單元14先將使用者的讀音進(jìn)行初步切割,以將音節(jié)區(qū)分,并取得發(fā)音樣本,隨后,再通過語音識(shí)別算法,如隱馬爾可夫模型(Hidden Markov Model,HMM,以下略稱為HMM模型),并輔以一階算法、已區(qū)分的音節(jié)及訓(xùn)練教材等數(shù)據(jù)建立一語音模型,并將所取得的發(fā)音樣本與該語音模型通過概率統(tǒng)計(jì)方式進(jìn)行分析,以描述使用者的發(fā)音特性。因HMM模型是利用統(tǒng)計(jì)觀念建立,故可克服觀測(cè)發(fā)音特性所蘊(yùn)藏的時(shí)變特性,并對(duì)初步分割的音節(jié)進(jìn)行辨認(rèn),HMM模型可將使用者的讀音同語音模型進(jìn)行分項(xiàng)對(duì)比,以描述出不同層次的語音單元,如句子、單字、音節(jié)及音素,并將所描述的語音單元匯整成音調(diào)、音節(jié)及音節(jié)分段時(shí)間等分項(xiàng)對(duì)比結(jié)果輸出至專家系統(tǒng)13執(zhí)行進(jìn)一步的分析作業(yè)。
專家系統(tǒng)13按現(xiàn)有的提供給數(shù)據(jù)供應(yīng)模塊12的訓(xùn)練教材,針對(duì)口語識(shí)別單元14所匯整的音調(diào)、音節(jié)及音節(jié)分段時(shí)間等分項(xiàng)對(duì)比結(jié)果進(jìn)行分析,還以語音或屏幕顯示等方式輸出,以提供改善建議供使用者參考,令使用者可根據(jù)專家系統(tǒng)13所提供的建議,矯正錯(cuò)誤的發(fā)音問題,另一方面,專家系統(tǒng)13也將所分析的數(shù)據(jù)及使用者錯(cuò)誤的發(fā)音信息儲(chǔ)存在數(shù)據(jù)庫(kù)16中,以供以后進(jìn)行語音數(shù)據(jù)分析,還可供數(shù)據(jù)供應(yīng)模塊12日后作為選定訓(xùn)練教材的參考及供使用者追蹤學(xué)習(xí)記錄。
圖2是本發(fā)明的發(fā)音矯正方法通過發(fā)音矯正設(shè)備1進(jìn)行發(fā)音矯正程序時(shí)的流程圖,如圖所示,在步驟S1中,令口語特征相似庫(kù)15先行按照口語音節(jié)相似度區(qū)分各式音節(jié)并予以儲(chǔ)存,接著進(jìn)至步驟S2。
在步驟S2中,當(dāng)使用者通過功能選擇模塊11操作發(fā)音矯正功能時(shí),令數(shù)據(jù)供應(yīng)模塊12從專家系統(tǒng)13中選定訓(xùn)練教材(如范例單字、字符串及語句等),供使用者進(jìn)行發(fā)音練習(xí),接著進(jìn)至步驟S3。
在步驟S3中,令口語識(shí)別單元14利用隱馬爾可夫模型(HiddenMarkov Model,HMM)、口語特征相似庫(kù)15內(nèi)已區(qū)分的音節(jié)數(shù)據(jù)及數(shù)據(jù)供應(yīng)模塊12選定的訓(xùn)練教材建立一個(gè)語音模型,將使用者的發(fā)音與該語音模型按音調(diào)、音節(jié)及音節(jié)分段時(shí)間等分項(xiàng)進(jìn)行對(duì)比,并在對(duì)比完成后產(chǎn)生音調(diào)輸出、音節(jié)輸出及音節(jié)分段時(shí)間輸出等對(duì)比結(jié)果,隨后進(jìn)至步驟S4。
在步驟S4中,令專家系統(tǒng)13針對(duì)對(duì)比結(jié)果分析其音調(diào)高低、快慢及發(fā)音錯(cuò)誤的問題,并將所分析的數(shù)據(jù)及使用者錯(cuò)誤的發(fā)音信息儲(chǔ)存在數(shù)據(jù)庫(kù)16中,以作為使用者的學(xué)習(xí)記錄,并可供數(shù)據(jù)供應(yīng)模塊日后作為選取訓(xùn)練教材的參考,隨后進(jìn)至步驟S5。
在步驟S5中,令專家系統(tǒng)13針對(duì)使用者錯(cuò)誤的發(fā)音模式,提供改善建議,令使用者可清楚了解錯(cuò)誤之處,以及時(shí)進(jìn)行改進(jìn)。
權(quán)利要求
1.一種發(fā)音矯正設(shè)備,其特征在于,該設(shè)備包括功能選擇模塊,作為使用者對(duì)該發(fā)音矯正設(shè)備進(jìn)行功能選取的操作接口;數(shù)據(jù)供應(yīng)模塊,在該功能選擇模塊被使用者操作時(shí),為使用者提供訓(xùn)練教材作為口語發(fā)音練習(xí)之用;口語特征相似庫(kù),區(qū)分各式音節(jié);口語識(shí)別單元,利用語音識(shí)別算法、數(shù)據(jù)供應(yīng)模塊提供的訓(xùn)練教材及口語特征相似庫(kù)內(nèi)已區(qū)分的各式音節(jié)建立語音模型,將使用者的發(fā)音與該語音模型進(jìn)行分項(xiàng)對(duì)比,并輸出對(duì)比結(jié)果;專家系統(tǒng),分析由口語識(shí)別單元輸出的對(duì)比結(jié)果,并根據(jù)所得的分析數(shù)據(jù)提供矯正建議供使用者參考;以及數(shù)據(jù)庫(kù),記錄該專家系統(tǒng)所分析的數(shù)據(jù)及使用者錯(cuò)誤的發(fā)音信息。
2.如權(quán)利要求1所述的發(fā)音矯正設(shè)備,其特征在于,該數(shù)據(jù)供應(yīng)模塊提供給使用者的訓(xùn)練教材是從專家系統(tǒng)中取得。
3.如權(quán)利要求1所述的發(fā)音矯正設(shè)備,其特征在于,該訓(xùn)練教材包括單字、字符串及語句。
4.如權(quán)利要求1所述的發(fā)音矯正設(shè)備,其特征在于,該語音模型是具有語音識(shí)別功能的隱馬爾可夫模型。
5.如權(quán)利要求1所述的發(fā)音矯正設(shè)備,其特征在于,該分項(xiàng)對(duì)比的項(xiàng)目是音調(diào)對(duì)比、音節(jié)對(duì)比及音節(jié)分段時(shí)間對(duì)比中的一種。
6.如權(quán)利要求1所述的發(fā)音矯正設(shè)備,其特征在于,該對(duì)比結(jié)果的輸出項(xiàng)目是音調(diào)輸出、音節(jié)輸出及音節(jié)分段時(shí)間輸出中的一種。
7.如權(quán)利要求1所述的發(fā)音矯正設(shè)備,其特征在于,該矯正建議是指提示使用者須矯正發(fā)音的音調(diào)或音節(jié)。
8.如權(quán)利要求1所述的發(fā)音矯正設(shè)備,其特征在于,該發(fā)音矯正設(shè)備可整合搭接在電子信息產(chǎn)品中。
9.如權(quán)利要求1所述的發(fā)音矯正設(shè)備,其特征在于,該口語特征相似庫(kù)是根據(jù)口語音階相似度區(qū)分各式音節(jié)并予以儲(chǔ)存。
10.一種發(fā)音矯正方法,其特征在于,借由發(fā)音矯正設(shè)備分析使用者的發(fā)音并提供改進(jìn)建議,該方法包括先行區(qū)分各式音節(jié),并予以儲(chǔ)存;提供訓(xùn)練教材供使用者進(jìn)行發(fā)音練習(xí);利用語音識(shí)別算法、已區(qū)分的各式音節(jié)及訓(xùn)練教材,建立一語音模型與使用者的發(fā)音進(jìn)行分項(xiàng)對(duì)比;以及針對(duì)對(duì)比的結(jié)果進(jìn)行分析,為使用者提供改善建議。
11.如權(quán)利要求10所述的發(fā)音矯正方法,其特征在于,該發(fā)音矯正設(shè)備是權(quán)利要求1所述的發(fā)音矯正設(shè)備。
12.如權(quán)利要求10所述的發(fā)音矯正方法,其特征在于,該口語特征相似庫(kù)是按口語音節(jié)相似度區(qū)分各式音節(jié)并予以儲(chǔ)存。
13.如權(quán)利要求10所述的發(fā)音矯正方法,其特征在于,該訓(xùn)練教材是由數(shù)據(jù)供應(yīng)模塊從專家系統(tǒng)中選定,并供使用者進(jìn)行發(fā)音練習(xí)。
14.如權(quán)利要求10所述的發(fā)音矯正方法,其特征在于,該語音識(shí)別算法是具有語音識(shí)別功能的隱馬爾可夫模型。
15.如權(quán)利要求10所述的發(fā)音矯正方法,其特征在于,該分項(xiàng)對(duì)比程序是由口語識(shí)別單元進(jìn)行,它是按音調(diào)、音節(jié)和音節(jié)分段時(shí)間中的一種進(jìn)行對(duì)比。
16.如權(quán)利要求10所述的發(fā)音矯正方法,其特征在于,該方法是由專家系統(tǒng)針對(duì)對(duì)比的結(jié)果進(jìn)行分析,并將所分析的數(shù)據(jù)及使用者錯(cuò)誤的發(fā)音信息儲(chǔ)存在數(shù)據(jù)庫(kù)中。
17.如權(quán)利要求16所述的發(fā)音矯正方法,其特征在于,該數(shù)據(jù)庫(kù)中所存放的數(shù)據(jù)可作為使用者的學(xué)習(xí)記錄。
18.如權(quán)利要求16所述的發(fā)音矯正方法,其特征在于,該數(shù)據(jù)庫(kù)中所存放的數(shù)據(jù)還可作為數(shù)據(jù)供應(yīng)模塊日后選擇訓(xùn)練教材的參考。
19.如權(quán)利要求13所述的發(fā)音矯正方法,其特征在于,該專家系統(tǒng)具有語音識(shí)別功能,并可同時(shí)針對(duì)音調(diào)高低、快慢及發(fā)音錯(cuò)誤問題中的一種進(jìn)行分析。
全文摘要
一種發(fā)音矯正設(shè)備及方法,包括功能選擇模塊、數(shù)據(jù)供應(yīng)模塊、專家系統(tǒng)、口語識(shí)別單元、口語特征相似庫(kù)及數(shù)據(jù)庫(kù);首先由數(shù)據(jù)供應(yīng)模塊選定訓(xùn)練教材供使用者練習(xí)發(fā)音,等使用者發(fā)出訓(xùn)練教材的讀音后,即令口語識(shí)別單元將使用者的發(fā)音與語音模型進(jìn)行分項(xiàng)對(duì)比,并輸出對(duì)比結(jié)果,還由專家系統(tǒng)針對(duì)該對(duì)比結(jié)果進(jìn)行分析,并將其所分析的數(shù)據(jù)連同使用者錯(cuò)誤的發(fā)音信息儲(chǔ)存在數(shù)據(jù)庫(kù)中,以自動(dòng)提供使用者改進(jìn)發(fā)音的建議,還可令使用者追蹤自我學(xué)習(xí)記錄,隨時(shí)針對(duì)本身的發(fā)音弱點(diǎn)進(jìn)行改進(jìn)。
文檔編號(hào)G10L15/00GK1614684SQ20031010345
公開日2005年5月11日 申請(qǐng)日期2003年11月3日 優(yōu)先權(quán)日2003年11月3日
發(fā)明者顏睿余 申請(qǐng)人:微星科技股份有限公司