国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      一種用于口語(yǔ)練習(xí)的學(xué)生朗讀作業(yè)的評(píng)判方法

      文檔序號(hào):2833585閱讀:250來(lái)源:國(guó)知局
      專(zhuān)利名稱(chēng):一種用于口語(yǔ)練習(xí)的學(xué)生朗讀作業(yè)的評(píng)判方法
      技術(shù)領(lǐng)域
      本發(fā)明涉及語(yǔ)音作業(yè)評(píng)判領(lǐng)域,具體涉及一種用于口語(yǔ)練習(xí)的學(xué)生朗讀作業(yè)的評(píng)判方法。
      背景技術(shù)
      小學(xué)階段是孩子打下良好語(yǔ)言基礎(chǔ)最關(guān)鍵的時(shí)期,由于學(xué)生缺乏自覺(jué)性,朗讀、背誦、聽(tīng)寫(xiě)等隱性作業(yè)需要依賴(lài)家長(zhǎng)監(jiān)督完成,而并不是所有的家長(zhǎng)都能按教師布置作業(yè)的數(shù)量、質(zhì)量要求全程完成督學(xué)任務(wù),因此導(dǎo)致部分學(xué)生語(yǔ)言類(lèi)學(xué)習(xí)的作業(yè)完成效果不理想。通過(guò)計(jì)算機(jī)手段,能自動(dòng)完成對(duì)學(xué)生朗讀及聽(tīng)寫(xiě)等作業(yè)完成情況的監(jiān)督,降低了學(xué)生完成作業(yè)需要家長(zhǎng)或老師監(jiān)督的依賴(lài)性,提高了學(xué)習(xí)、教學(xué)的質(zhì)量。然而,現(xiàn)有的基于說(shuō)話(huà)人特定文本的評(píng)判方法,類(lèi)似語(yǔ)音輸入法、語(yǔ)音撥號(hào)等應(yīng)用,一方面因?yàn)檎Z(yǔ)料庫(kù)過(guò)大,導(dǎo)致模型龐大(通常全語(yǔ)料的模型有2G左右,甚至更大),因此需要較長(zhǎng)的識(shí)別時(shí)間,這樣就降低了識(shí)別速度,影響了客戶(hù)的感知。另一方面,在語(yǔ)文與英語(yǔ)教學(xué)中,很多時(shí)候關(guān)注的是關(guān)鍵字詞的朗讀情況,而現(xiàn)有的識(shí)別技術(shù)往往只對(duì)字詞采用固定方式進(jìn)行判別,對(duì)兒童與成年人的建模過(guò)程,并沒(méi)有很好的歸一化,當(dāng)使用者發(fā)聲特征明顯不同的時(shí)候,聲道參數(shù)往往需要重新訓(xùn)練,這在實(shí)際應(yīng)用中就表現(xiàn)為,同一個(gè)識(shí)別器,需要用不同類(lèi)型的人單獨(dú)訓(xùn)練,而單一的對(duì)兒童聲道進(jìn)行統(tǒng)一設(shè)定,也并不妥當(dāng),因?yàn)橛猩贁?shù)高年級(jí)的兒童,聲道的發(fā)育會(huì)較早于同齡兒童。因此,現(xiàn)有的技術(shù)方法無(wú)法進(jìn)行準(zhǔn)確及高效的識(shí)別,從而造成使用不便。

      發(fā)明內(nèi)容
      針對(duì)上述問(wèn)題,本發(fā)明的目的在于提供一種用于口語(yǔ)練習(xí)的學(xué)生朗讀作業(yè)的評(píng)判方法,能夠?qū)Σ杉恼Z(yǔ)音文件進(jìn)行準(zhǔn)確而高效的識(shí)別及評(píng)判。為實(shí)現(xiàn)上述目的,本發(fā)明采用如下技術(shù)方案一種用于口語(yǔ)練習(xí)的學(xué)生朗讀作業(yè)的評(píng)判方法,包括步驟利用語(yǔ)言模型建立指定文本對(duì)應(yīng)的第一課文模型LI,并根據(jù)指定文本對(duì)應(yīng)的混淆詞表和混淆發(fā)音表將第一課文模型LI制作成帶有競(jìng)爭(zhēng)能力的第二課文模型L2,其中,混淆詞表和混淆發(fā)音表中的混淆信息分別為指定文本中容易產(chǎn)生混淆的詞及對(duì)應(yīng)混淆詞的信息及容易產(chǎn)生混淆的發(fā)音與對(duì)應(yīng)混淆發(fā)音的信息;通過(guò)語(yǔ)音采集器采集用戶(hù)朗讀的語(yǔ)音文件,對(duì)聲道進(jìn)行重估后得到重估語(yǔ)音文件;通過(guò)第二課文模型L2引導(dǎo)語(yǔ)音識(shí)別器對(duì)重估語(yǔ)音文件進(jìn)行識(shí)別,獲得識(shí)別文本;將識(shí)別文本與指定文本進(jìn)行帶有置信度加權(quán)的加權(quán)對(duì)比和評(píng)判,得到對(duì)比及評(píng)判結(jié)果。本發(fā)明的有益效果在于通過(guò)區(qū)別于現(xiàn)有的對(duì)指定文本所建的模型,本發(fā)明的方法所建模型具有體積小的
      5特點(diǎn),且通過(guò)所建模型進(jìn)行識(shí)別具有識(shí)別率高的優(yōu)點(diǎn)。一方面,本發(fā)明通過(guò)引入RNN改善傳統(tǒng)N-gram的性能,克服小語(yǔ)料條件下N-gram估計(jì)概率不準(zhǔn)的缺陷;另一方面,本發(fā)明通過(guò)引入裁剪的通用模型,克服了專(zhuān)用模型無(wú)法識(shí)別課文以外文本的缺陷;另外,區(qū)別于現(xiàn)有的語(yǔ)音識(shí)別方法,本發(fā)明通過(guò)引入直方圖概率分布映射進(jìn)行聲道歸一化,使得識(shí)別準(zhǔn)確率大大提聞;進(jìn)一步地,區(qū)別于傳統(tǒng)的DTW方法,本發(fā)明通過(guò)引入每個(gè)詞的權(quán)重系數(shù),通過(guò)對(duì)重點(diǎn)詞加大權(quán)重,對(duì)普通詞減小權(quán)重,并利用識(shí)別置信度將評(píng)判結(jié)果進(jìn)行等級(jí)量化,使得評(píng)分效果更貼近人的主觀感受,評(píng)判準(zhǔn)確性大大提高。


      圖I為本發(fā)明的用于口語(yǔ)練習(xí)的學(xué)生朗讀作業(yè)的評(píng)判方法的流程圖。
      具體實(shí)施例方式下面,結(jié)合附圖以及具體實(shí)施方式
      ,對(duì)本發(fā)明做進(jìn)一步描述如圖I所示,為本發(fā)明的用于口語(yǔ)練習(xí)的學(xué)生朗讀作業(yè)的評(píng)判方法的流程圖。所述用于口語(yǔ)練習(xí)的學(xué)生朗讀作業(yè)的評(píng)判方法用于在用戶(hù)進(jìn)行語(yǔ)音輸入后對(duì)語(yǔ)音進(jìn)行處理及評(píng)判,具有廣闊的應(yīng)用范圍。如應(yīng)用在對(duì)學(xué)生的朗讀作業(yè)完成情況進(jìn)行評(píng)判的領(lǐng)域,即,學(xué)生根據(jù)顯示的作業(yè)文本(如需要朗讀完成的詩(shī)詞、閱讀文章)進(jìn)行語(yǔ)音輸入,根據(jù)輸入的語(yǔ)音來(lái)評(píng)判學(xué)生的閱讀完成情況。所述用于口語(yǔ)練習(xí)的學(xué)生朗讀作業(yè)的評(píng)判方法包括步驟步驟SlOl :利用語(yǔ)言模型建立指定文本(需要被朗讀的文本,如《靜夜思》)對(duì)應(yīng)的第一課文模型LI,并根據(jù)指定文本對(duì)應(yīng)的混淆詞表和混淆發(fā)音表將第一課文模型LI制作成帶有競(jìng)爭(zhēng)能力的第二課文模型L2,其中,混淆詞表和混淆發(fā)音表中的混淆信息分別為指定文本中容易產(chǎn)生混淆的詞及對(duì)應(yīng)混淆詞的信息及容易產(chǎn)生混淆的發(fā)音與對(duì)應(yīng)混淆發(fā)音的信息,以《靜夜思》為例,其中“床前明月光”中的“床(chuang)”容易被發(fā)音為“chuan”或“cuan”,這個(gè)就可作為容易產(chǎn)生混淆的發(fā)音與對(duì)應(yīng)混淆發(fā)音的信息,“疑似地上霜”中的“霜(shuang)”容易被混淆成“相(xiang)”,這個(gè)就可作為容易產(chǎn)生混淆的詞及對(duì)應(yīng)混淆詞的信息。當(dāng)然,對(duì)某些詞或讀音是否容易產(chǎn)生混淆以及可能與哪些詞或發(fā)音進(jìn)行混淆需要根據(jù)兒童的知識(shí)水平、文本對(duì)兒童的考察重點(diǎn)等綜合因素來(lái)考慮,可根據(jù)需要進(jìn)行設(shè)定;步驟S102 :通過(guò)語(yǔ)音采集器采集用戶(hù)朗讀的語(yǔ)音文件,對(duì)聲道進(jìn)行重估后得到重估語(yǔ)音文件;其中,所述語(yǔ)音采集器可以是個(gè)人電腦、手機(jī)、電話(huà)、復(fù)讀機(jī)、錄音機(jī)或點(diǎn)讀機(jī)等裝置上能夠采集聲音的部件,如麥克風(fēng);步驟S103 :通過(guò)第二課文模型L2引導(dǎo)語(yǔ)音識(shí)別器對(duì)重估語(yǔ)音文件進(jìn)行識(shí)別,獲得識(shí)別文本;步驟S104 :將識(shí)別文本與指定文本進(jìn)行帶有置信度加權(quán)的加權(quán)對(duì)比和評(píng)判,得到對(duì)比及評(píng)判結(jié)果。在本實(shí)施方式中,具體的,英語(yǔ)和漢語(yǔ)分別對(duì)應(yīng)兩個(gè)不同的聲學(xué)模型,采用HMM模型作為基本的模型框架,每個(gè)HMM模型含3個(gè)隱藏狀態(tài)、I個(gè)輸入狀態(tài)和I個(gè)輸出狀態(tài),每個(gè)狀態(tài)采用GMM模型,GMM混合數(shù)為32混合,對(duì)于每個(gè)指定文本,不采用傳統(tǒng)語(yǔ)音識(shí)別技術(shù)中的三音子建模方法進(jìn)行建模,而是采用二音子建模方法建立指定文本對(duì)應(yīng)的第一課文模型LI,即每個(gè)建模單元僅根據(jù)上文建模單元不同而分成不同HMM模型,而不管下文是否相同。與傳統(tǒng)的三音子建模方式相比,本發(fā)明的HMM模型的輸出狀態(tài)存放了二音子轉(zhuǎn)移到各個(gè)下文音子的轉(zhuǎn)移概率,從而具有模型規(guī)模小的優(yōu)點(diǎn)。其中,第一課文模型LI由通用模型和專(zhuān)用模型采用PPL最大化方式插值而成,專(zhuān)用模型采用指定文本中的句子生成,用于識(shí)別指定文本內(nèi)部的單詞,該專(zhuān)用模型對(duì)正常閱讀(針對(duì)指定文本進(jìn)行閱讀)的用戶(hù)具有極高的識(shí)別準(zhǔn)確率。通用模型采用指定文本以外的語(yǔ)料(在本實(shí)施方式中為新聞、小說(shuō)、微博及專(zhuān)用名詞這四種語(yǔ)料中的至少一種)訓(xùn)練而成,并裁剪成適當(dāng)大小(如10M-100M左右),用于識(shí)別指定文本以外的單詞,該通用模型能夠識(shí)別用戶(hù)說(shuō)話(huà)中超出指定文本的說(shuō)話(huà)內(nèi)容,從而整個(gè)識(shí)別過(guò)程更加準(zhǔn)確實(shí)用。具體的,針對(duì)專(zhuān)用模型,將指定文本訓(xùn)練成5-gram模型Ml,將指定文本訓(xùn)練成RNN模型M2,利用M2模型對(duì)Ml模型中的每個(gè)N-gram進(jìn)行打分,將打分與原有的概率值平均,獲得模型Ml的優(yōu)化模型M3,即專(zhuān)用模型,其中,優(yōu)化模型M3和Ml享有相同的回退概率。針對(duì)通用模型,分別采用新聞?wù)Z料訓(xùn)練tri-gram模型Tl,采用小說(shuō)語(yǔ)料訓(xùn)練tri-gram模型T2,采用微博語(yǔ)料訓(xùn)練tri-gram模型T3及采用專(zhuān)用名詞訓(xùn)練tri-gram模型T4,根據(jù)模型Tl、T2、T3及T4采用PPL最大化方式插值形成通用模型。在步驟101中,將第一課文模型LI制作成帶有競(jìng)爭(zhēng)能力的第二課文模型L2的過(guò)程具體包括將第一課文模型LI轉(zhuǎn)換成WFST網(wǎng)絡(luò)Wl,將WFST網(wǎng)絡(luò)Wl中的易錯(cuò)詞擴(kuò)展成相應(yīng)的競(jìng)爭(zhēng)詞,權(quán)重與原有易錯(cuò)詞相同,形成新的網(wǎng)絡(luò)W2 ;將網(wǎng)絡(luò)W2和音子循環(huán)網(wǎng)絡(luò)P進(jìn)行Compose操作,形成輸入為音子、輸出為單詞的WFST 網(wǎng)絡(luò) W3 ;將WFST網(wǎng)絡(luò)W3中的易出錯(cuò)音子P擴(kuò)展成它的競(jìng)爭(zhēng)音子,權(quán)重與原有易出錯(cuò)音子相同,形成第二課文模型L2,其中,易錯(cuò)詞根據(jù)混淆詞表和混淆發(fā)音表中的混淆信息進(jìn)行確定。在步驟103中,對(duì)聲道進(jìn)行重估的方法包括步驟采用聲道系數(shù)猜測(cè)法,猜測(cè)聲道系數(shù)為O. 7,0. 8,0. 9、I. O、I. I或I. 2中的一個(gè),分
      別對(duì)采集到的用戶(hù)朗讀的語(yǔ)音文件進(jìn)行連續(xù)語(yǔ)音識(shí)別,計(jì)算與指定文本的匹配率;采用與最高匹配率相應(yīng)的聲道系數(shù),通過(guò)強(qiáng)制切分技術(shù)獲得采集到的語(yǔ)音文件中每個(gè)時(shí)刻對(duì)應(yīng)的HMM模型狀態(tài),統(tǒng)計(jì)語(yǔ)音文件的平均能量,取出高于平均能量的語(yǔ)音片段,將這些片段的頻譜能量作直方圖統(tǒng)計(jì),獲得直方圖G1,同時(shí)利用每個(gè)語(yǔ)音片段對(duì)應(yīng)的HMM狀態(tài)求出每個(gè)語(yǔ)音片段對(duì)應(yīng)標(biāo)準(zhǔn)模型的頻譜能量直方圖G2 ;采用F2 (x ( f2) =Fl (x ( f\)的映射關(guān)系將用戶(hù)每個(gè)頻率點(diǎn)Π映射到標(biāo)準(zhǔn)說(shuō)話(huà)人的頻率點(diǎn)f2,其中,F(xiàn)l是采集到的語(yǔ)音片段的概率分布,F(xiàn)2是標(biāo)準(zhǔn)說(shuō)話(huà)人語(yǔ)音的概率分布,X是頻率,f2為梅爾濾波器中心頻率,Π是用戶(hù)的頻譜頻率,利用所述映射關(guān)系對(duì)采集到的語(yǔ)音片段的頻譜進(jìn)行頻率扭曲,即相當(dāng)于將當(dāng)前用戶(hù)的聲道映射到標(biāo)準(zhǔn)發(fā)音人的聲道,完成聲道重估,得到與采集到的語(yǔ)音文件對(duì)應(yīng)的重估語(yǔ)音文件。采用語(yǔ)音識(shí)別器進(jìn)行識(shí)別的具體方法為語(yǔ)音識(shí)別器采用幀同步搜索算法進(jìn)行識(shí)別,每間隔預(yù)定時(shí)間(例如10秒)處理一次采集到的語(yǔ)音數(shù)據(jù),對(duì)新加入的語(yǔ)音數(shù)據(jù)自動(dòng)檢測(cè)端點(diǎn),將有語(yǔ)音的數(shù)據(jù)段落分段送入解碼,語(yǔ)言識(shí)別器每到一段語(yǔ)音數(shù)據(jù)的端點(diǎn)回溯一次,并在回溯路徑中有與上一次相同的路徑時(shí)將相同的路徑輸出作為識(shí)別結(jié)果,其中,語(yǔ)音識(shí)別器采用下式估算識(shí)別置信度對(duì)每一幀激活的所有狀態(tài)估算當(dāng)前幀屬于每個(gè)音子Pi的后驗(yàn)概率
      權(quán)利要求
      1.一種用于口語(yǔ)練習(xí)的學(xué)生朗讀作業(yè)的評(píng)判方法,其特征在于,包括步驟 利用語(yǔ)言模型建立指定文本對(duì)應(yīng)的第一課文模型LI,并根據(jù)指定文本對(duì)應(yīng)的混淆詞表和混淆發(fā)音表將第一課文模型LI制作成帶有競(jìng)爭(zhēng)能力的第二課文模型L2,其中,混淆詞表和混淆發(fā)音表中的混淆信息分別為指定文本中容易產(chǎn)生混淆的詞及對(duì)應(yīng)混淆詞的信息及容易產(chǎn)生混淆的發(fā)音與對(duì)應(yīng)混淆發(fā)音的信息; 通過(guò)語(yǔ)音采集器采集用戶(hù)朗讀的語(yǔ)音文件,對(duì)聲道進(jìn)行重估后得到重估語(yǔ)音文件; 通過(guò)第二課文模型L2引導(dǎo)語(yǔ)音識(shí)別器對(duì)重估語(yǔ)音文件進(jìn)行識(shí)別,獲得識(shí)別文本; 將識(shí)別文本與指定文本進(jìn)行帶有置信度加權(quán)的加權(quán)對(duì)比和評(píng)判,得到對(duì)比及評(píng)判結(jié)果O
      2.如權(quán)利要求I所述的用于口語(yǔ)練習(xí)的學(xué)生朗讀作業(yè)的評(píng)判方法,其特征在于,英語(yǔ)和漢語(yǔ)分別對(duì)應(yīng)兩個(gè)不同的聲學(xué)模型,采用HMM模型作為基本的模型框架,每個(gè)HMM模型含3個(gè)隱藏狀態(tài)、I個(gè)輸入狀態(tài)和I個(gè)輸出狀態(tài),每個(gè)狀態(tài)采用GMM模型,GMM混合數(shù)為32混合,對(duì)于每個(gè)指定文本,采用二音子建模方法建立指定文本對(duì)應(yīng)的第一課文模型LI。
      3.如權(quán)利要求I所述的用于口語(yǔ)練習(xí)的學(xué)生朗讀作業(yè)的評(píng)判方法,其特征在于,第一課文模型LI由通用模型和專(zhuān)用模型采用PPL最大化方式插值而成,專(zhuān)用模型采用指定文本中的句子生成,用于識(shí)別指定文本內(nèi)部的單詞,通用模型采用新聞、小說(shuō)、微博及專(zhuān)用名詞四種語(yǔ)料中的至少一種訓(xùn)練而成,并裁剪成10M-100M大小,用于識(shí)別指定文本以外的單ο
      4.如權(quán)利要求3所述的用于口語(yǔ)練習(xí)的學(xué)生朗讀作業(yè)的評(píng)判方法,其特征在于,將指定文本訓(xùn)練成5-gram模型Ml,將指定文本訓(xùn)練成RNN模型M2,利用M2模型對(duì)Ml模型中的每個(gè)N-gram進(jìn)行打分,將打分與原有的概率值平均,獲得模型Ml的優(yōu)化模型M3,即專(zhuān)用模型,其中,優(yōu)化模型M3和Ml享有相同的回退概率。
      5.如權(quán)利要求3或4所述的用于口語(yǔ)練習(xí)的學(xué)生朗讀作業(yè)的評(píng)判方法,其特征在于,分別采用新聞?wù)Z料訓(xùn)練tri-gram模型Tl,采用小說(shuō)語(yǔ)料訓(xùn)練tri-gram模型T2,采用微博語(yǔ)料訓(xùn)練tri-gram模型T3及采用專(zhuān)用名詞訓(xùn)練tri-gram模型T4,根據(jù)模型T1、T2、T3及Τ4采用PPL最大化方式插值形成通用模型。
      6.如權(quán)利要求I所述的用于口語(yǔ)練習(xí)的學(xué)生朗讀作業(yè)的評(píng)判方法,其特征在于,將第一課文模型LI制作成帶有競(jìng)爭(zhēng)能力的第二課文模型L2的步驟具體包括 將第一課文模型LI轉(zhuǎn)換成WFST網(wǎng)絡(luò)Wl,將WFST網(wǎng)絡(luò)Wl中的易錯(cuò)詞擴(kuò)展成相應(yīng)的競(jìng)爭(zhēng)詞,權(quán)重與原有易錯(cuò)詞相同,形成新的網(wǎng)絡(luò)W2 ; 將網(wǎng)絡(luò)W2和音子循環(huán)網(wǎng)絡(luò)P進(jìn)行Compose操作,形成輸入為音子、輸出為單詞的WFST網(wǎng)絡(luò)W3 ; 將WFST網(wǎng)絡(luò)W3中的易出錯(cuò)音子P擴(kuò)展成它的競(jìng)爭(zhēng)音子,權(quán)重與原有易出錯(cuò)音子相同,形成第二課文模型L2,其中,易錯(cuò)詞根據(jù)混淆詞表和混淆發(fā)音表中的混淆信息進(jìn)行確定。
      7.如權(quán)利要求I或6所述的用于口語(yǔ)練習(xí)的學(xué)生朗讀作業(yè)的評(píng)判方法,其特征在于,對(duì)聲道進(jìn)行重估的方法包括步驟 采用聲道系數(shù)猜測(cè)法,猜測(cè)聲道系數(shù)為O. 7,0. 8,0. 9、I. O、I. I或I. 2中的一個(gè),分別對(duì)采集到的用戶(hù)朗讀的語(yǔ)音文件進(jìn)行連續(xù)語(yǔ)音識(shí)別,計(jì)算與指定文本的匹配率; 采用與最高匹配率相應(yīng)的聲道系數(shù),通過(guò)強(qiáng)制切分技術(shù)獲得采集到的語(yǔ)音文件中每個(gè)時(shí)刻對(duì)應(yīng)的HMM模型狀態(tài),統(tǒng)計(jì)語(yǔ)音文件的平均能量,取出高于平均能量的語(yǔ)音片段,將這些片段的頻譜能量作直方圖統(tǒng)計(jì),獲得直方圖G1,同時(shí)利用每個(gè)語(yǔ)音片段對(duì)應(yīng)的HMM狀態(tài)求出每個(gè)語(yǔ)音片段對(duì)應(yīng)標(biāo)準(zhǔn)模型的頻譜能量直方圖G2 ; 采用F2 (x ( f2) =Fl (x ( f\)的映射關(guān)系將用戶(hù)每個(gè)頻率點(diǎn)映射到標(biāo)準(zhǔn)說(shuō)話(huà)人的頻率點(diǎn)f2,其中,F(xiàn)l是采集到的語(yǔ)音片段的概率分布,F(xiàn)2是標(biāo)準(zhǔn)說(shuō)話(huà)人語(yǔ)音的概率分布,X是頻率,f2為梅爾濾波器中心頻率,是用戶(hù)的頻譜頻率,利用所述映射關(guān)系對(duì)采集到的語(yǔ)音片段的頻譜進(jìn)行頻率扭曲,即相當(dāng)于將當(dāng)前用戶(hù)的聲道映射到標(biāo)準(zhǔn)發(fā)音人的聲道,完成聲道重估,得到與采集到的語(yǔ)音文件對(duì)應(yīng)的重估語(yǔ)音文件。
      8.如權(quán)利要求7所述的用于口語(yǔ)練習(xí)的學(xué)生朗讀作業(yè)的評(píng)判方法,其特征在于,語(yǔ)音識(shí)別器采用幀同步搜索算法進(jìn)行識(shí)別,每間隔預(yù)定時(shí)間處理一次采集到的語(yǔ)音數(shù)據(jù),對(duì)新加入的語(yǔ)音數(shù)據(jù)自動(dòng)檢測(cè)端點(diǎn),將有語(yǔ)音的數(shù)據(jù)段落分段送入解碼,語(yǔ)言識(shí)別器每到一段語(yǔ)音數(shù)據(jù)的端點(diǎn)回溯一次,并在回溯路徑中有與上一次相同的路徑時(shí)將相同的路徑輸出作為識(shí)別結(jié)果,其中,語(yǔ)音識(shí)別器采用下式估算識(shí)別置信度 對(duì)每一幀激活的所有狀態(tài)估算當(dāng)前幀屬于每個(gè)音子Pi的后驗(yàn)概率
      9.如權(quán)利要求8所述的用于口語(yǔ)練習(xí)的學(xué)生朗讀作業(yè)的評(píng)判方法,其特征在于,對(duì)比過(guò)程采用加權(quán)的DTW算法,加權(quán)DTW的優(yōu)化目標(biāo)包括兩個(gè)文本對(duì)齊后分割段數(shù)最小化目標(biāo)及文本對(duì)齊后匹配詞的權(quán)重之和最大化,其中,每個(gè)單詞的權(quán)重根據(jù)是否重點(diǎn)的程度由高到低進(jìn)行設(shè)定。
      10.如權(quán)利要求9所述的用于口語(yǔ)練習(xí)的學(xué)生朗讀作業(yè)的評(píng)判方法,其特征在于,在對(duì)比過(guò)程結(jié)束后對(duì)每個(gè)詞匯給出正確或插入或丟失或替換的其中一種類(lèi)型,并對(duì)每個(gè)類(lèi)型分別依據(jù)語(yǔ)音識(shí)別器輸出的置信度進(jìn)行評(píng)分,當(dāng)單詞錯(cuò)誤且置信度低于指定門(mén)限時(shí),單詞為嚴(yán)重錯(cuò)誤,針對(duì)該單詞給出第一分值,當(dāng)單詞錯(cuò)誤且置信度高于指定門(mén)限時(shí),單詞為輕度錯(cuò)誤,針對(duì)該單詞給出第二分值,當(dāng)單詞正確且置信度低于指定門(mén)限時(shí),單詞為發(fā)音缺陷,針對(duì)該單詞給出第三分值,當(dāng)單詞正確且置信度高于指定門(mén)限時(shí),單詞為完全正確,針對(duì)該單詞給出第 四分值,并計(jì)算整個(gè)語(yǔ)音文件中的所有單詞所得總分。
      全文摘要
      本發(fā)明公開(kāi)了一種用于口語(yǔ)練習(xí)的學(xué)生朗讀作業(yè)的評(píng)判方法,包括利用語(yǔ)言模型建立指定文本對(duì)應(yīng)的第一課文模型L1,并根據(jù)指定文本對(duì)應(yīng)的混淆詞表和混淆發(fā)音表將第一課文模型L1制作成帶有競(jìng)爭(zhēng)能力的第二課文模型L2,通過(guò)語(yǔ)音采集器采集用戶(hù)朗讀的語(yǔ)音文件,對(duì)聲道進(jìn)行重估得到重估語(yǔ)音文件,通過(guò)模型L2引導(dǎo)語(yǔ)音識(shí)別器對(duì)重估文件進(jìn)行識(shí)別,得到識(shí)別文本,并與指定文本進(jìn)行帶有置信度加權(quán)的對(duì)比及評(píng)判。通過(guò)本發(fā)明的用于口語(yǔ)練習(xí)的學(xué)生朗讀作業(yè)的評(píng)判方法,可以對(duì)采集的語(yǔ)音文件進(jìn)行準(zhǔn)確而高效的識(shí)別及評(píng)判。
      文檔編號(hào)G10L15/14GK102930866SQ20121043844
      公開(kāi)日2013年2月13日 申請(qǐng)日期2012年11月5日 優(yōu)先權(quán)日2012年11月5日
      發(fā)明者肖劍 申請(qǐng)人:廣州市神驥營(yíng)銷(xiāo)策劃有限公司
      網(wǎng)友詢(xún)問(wèn)留言 已有0條留言
      • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
      1