基于語(yǔ)音相似度的語(yǔ)音評(píng)測(cè)方法及系統(tǒng)與流程

文檔序號(hào)：12128422閱讀：1036來源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專利>樂器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

基于語(yǔ)音相似度的語(yǔ)音評(píng)測(cè)方法及系統(tǒng)與流程

本發(fā)明涉及語(yǔ)音評(píng)測(cè)領(lǐng)域，特指一種基于語(yǔ)音相似度的語(yǔ)音評(píng)測(cè)方法及系統(tǒng)。

背景技術(shù)：

語(yǔ)音信號(hào)處理技術(shù)是語(yǔ)音處理和語(yǔ)音識(shí)別領(lǐng)域中的一個(gè)重要分支，也是現(xiàn)今語(yǔ)音識(shí)別和語(yǔ)音評(píng)價(jià)系統(tǒng)的主要核心技術(shù)。隨著科技的發(fā)展，語(yǔ)音信號(hào)處理技術(shù)已深入到各個(gè)領(lǐng)域，包括語(yǔ)言學(xué)習(xí)以及語(yǔ)音自動(dòng)評(píng)分，而在語(yǔ)言學(xué)習(xí)和自動(dòng)評(píng)分中，運(yùn)用語(yǔ)音信號(hào)處理的目的是將最新的語(yǔ)音技術(shù)于當(dāng)前的教學(xué)和學(xué)習(xí)方法結(jié)合，建立輔助語(yǔ)言學(xué)習(xí)的系統(tǒng)或者語(yǔ)音智能評(píng)分系統(tǒng)。

對(duì)于語(yǔ)音評(píng)測(cè)的研究，目前大多數(shù)的評(píng)測(cè)方法或系統(tǒng)均專注于如何提高語(yǔ)音評(píng)測(cè)的準(zhǔn)確性，即提高評(píng)測(cè)結(jié)果的準(zhǔn)確度，以實(shí)現(xiàn)對(duì)發(fā)音質(zhì)量的公正、客觀、高效的評(píng)測(cè)。但是評(píng)測(cè)結(jié)果是否準(zhǔn)確對(duì)學(xué)習(xí)者的語(yǔ)言學(xué)習(xí)并沒有提供直接的幫助，其僅能更為客觀的反應(yīng)學(xué)習(xí)者目前的口語(yǔ)水平，不能提高口語(yǔ)水平和語(yǔ)言學(xué)習(xí)效果。

技術(shù)實(shí)現(xiàn)要素：

本發(fā)明的目的在于克服現(xiàn)有技術(shù)的缺陷，提供一種基于語(yǔ)音相似度的評(píng)測(cè)方法及系統(tǒng)，解決現(xiàn)有的評(píng)測(cè)系統(tǒng)不能為學(xué)習(xí)者的語(yǔ)言學(xué)習(xí)提供直接幫助和不能提高口語(yǔ)水平及語(yǔ)言學(xué)習(xí)效果的問題。

實(shí)現(xiàn)上述目的的技術(shù)方案是：

本發(fā)明提供了一種基于語(yǔ)音相似度的語(yǔ)音評(píng)測(cè)方法，包括如下步驟：

提供訓(xùn)練數(shù)據(jù)集，所述訓(xùn)練數(shù)據(jù)集包括訓(xùn)練參照語(yǔ)音數(shù)據(jù)、與所述訓(xùn)練參照語(yǔ)音數(shù)據(jù)對(duì)應(yīng)的訓(xùn)練模仿語(yǔ)音數(shù)據(jù)以及所述訓(xùn)練參照語(yǔ)音數(shù)據(jù)和所述訓(xùn)練模仿語(yǔ)音數(shù)據(jù)的相似度評(píng)分值；

利用所述訓(xùn)練數(shù)據(jù)集對(duì)動(dòng)態(tài)時(shí)間規(guī)整算法和支持向量順序回歸算法進(jìn)行算法訓(xùn)練，以獲得相似度評(píng)分模型；

提供參照語(yǔ)音信息；

錄制模仿朗讀所述參照語(yǔ)音信息的模仿語(yǔ)音信息；

提取所述參照語(yǔ)音信息中的參照語(yǔ)音特征序列集和所述模仿語(yǔ)音信息中的模仿語(yǔ)音特征序列集；以及

向所述相似度評(píng)分模型輸入所述參照語(yǔ)音特征序列集和所述模仿語(yǔ)音特征序列集，獲得所述模仿語(yǔ)音信息和所述參照語(yǔ)音信息的相似度評(píng)分值并輸出。

本發(fā)明提出了一種語(yǔ)音相似度的評(píng)測(cè)方法，能夠直觀的為學(xué)習(xí)者給出相似度的評(píng)分，為語(yǔ)言學(xué)習(xí)的模仿學(xué)習(xí)方法提供了有效的反饋，能夠促進(jìn)學(xué)習(xí)者在語(yǔ)言學(xué)習(xí)中反復(fù)模仿練習(xí)，以提高學(xué)習(xí)者的語(yǔ)言學(xué)習(xí)水平和學(xué)習(xí)效果，進(jìn)而為學(xué)習(xí)者的語(yǔ)音學(xué)習(xí)提供直接的幫助。本發(fā)明的語(yǔ)音相似度的評(píng)測(cè)方法在對(duì)發(fā)音正確性進(jìn)行考核的基礎(chǔ)上，增加了對(duì)發(fā)音模仿程度的評(píng)估，可幫助用戶有針對(duì)性的進(jìn)行模仿練習(xí)，提高發(fā)音水平。

本發(fā)明基于語(yǔ)音相似度的語(yǔ)音評(píng)測(cè)方法的進(jìn)一步改進(jìn)在于，所述訓(xùn)練參照語(yǔ)音數(shù)據(jù)和所述訓(xùn)練模仿語(yǔ)音數(shù)據(jù)包括語(yǔ)音內(nèi)容特征序列、語(yǔ)音音調(diào)特征序列、語(yǔ)音時(shí)長(zhǎng)特征序列、語(yǔ)音停頓特征序列以及語(yǔ)音重讀特征序列；

進(jìn)行算法訓(xùn)練包括：

利用所述訓(xùn)練參照語(yǔ)音數(shù)據(jù)和所述訓(xùn)練模仿語(yǔ)音數(shù)據(jù)中的語(yǔ)音音調(diào)特征序列、語(yǔ)音時(shí)長(zhǎng)特征序列、語(yǔ)音停頓特征序列以及語(yǔ)音重讀特征序列對(duì)所述動(dòng)態(tài)時(shí)間規(guī)整算法進(jìn)行算法訓(xùn)練，以使得通過所述動(dòng)態(tài)時(shí)間規(guī)整算法獲得所述訓(xùn)練參照語(yǔ)音數(shù)據(jù)和所述訓(xùn)練模仿語(yǔ)音數(shù)據(jù)之間的語(yǔ)音音調(diào)距離、語(yǔ)音時(shí)長(zhǎng)距離、語(yǔ)音停頓距離以及語(yǔ)音重讀距離；

利用所述訓(xùn)練參照語(yǔ)音數(shù)據(jù)和所述訓(xùn)練模仿語(yǔ)音數(shù)據(jù)中的語(yǔ)音內(nèi)容特征序列、所述訓(xùn)練參照語(yǔ)音數(shù)據(jù)和所述訓(xùn)練模仿語(yǔ)音數(shù)據(jù)的相似度評(píng)分值、所獲得的語(yǔ)音音調(diào)距離、語(yǔ)音時(shí)長(zhǎng)距離、語(yǔ)音停頓距離以及語(yǔ)音重讀距離對(duì)所述支持向量順序回歸算法進(jìn)行算法訓(xùn)練。

本發(fā)明基于語(yǔ)音相似度的語(yǔ)音評(píng)測(cè)方法的進(jìn)一步改進(jìn)在于，在進(jìn)行算法訓(xùn)練時(shí)，為所述動(dòng)態(tài)時(shí)間規(guī)整算法設(shè)定以時(shí)間幀順序依序進(jìn)行計(jì)算的約束條件。

本發(fā)明基于語(yǔ)音相似度的語(yǔ)音評(píng)測(cè)方法的進(jìn)一步改進(jìn)在于，提取所述參照語(yǔ)音信息中的參照語(yǔ)音特征序列集和所述模仿語(yǔ)音信息中的模仿語(yǔ)音特征序列集，包括：

對(duì)所述參照語(yǔ)音信息進(jìn)行語(yǔ)音識(shí)別以獲得對(duì)應(yīng)的語(yǔ)音內(nèi)容特征序列、語(yǔ)音停頓特征序列以及語(yǔ)音時(shí)長(zhǎng)特征序列并加入到參照語(yǔ)音特征序列集中；

對(duì)所述模仿語(yǔ)音信息進(jìn)行語(yǔ)音識(shí)別以獲得對(duì)應(yīng)的語(yǔ)音內(nèi)容特征序列、語(yǔ)音停頓特征序列以及語(yǔ)音時(shí)長(zhǎng)特征序列并加入到模仿語(yǔ)音特征序列集中。

本發(fā)明基于語(yǔ)音相似度的語(yǔ)音評(píng)測(cè)方法的進(jìn)一步改進(jìn)在于，提取所述參照語(yǔ)音信息中的參照語(yǔ)音特征序列集和所述模仿語(yǔ)音信息中的模仿語(yǔ)音特征序列集，還包括：

對(duì)所述參照語(yǔ)音信息進(jìn)行基頻提取以獲得對(duì)應(yīng)的語(yǔ)音音調(diào)特征序列并加入到參照語(yǔ)音特征序列集中；

對(duì)所述參照語(yǔ)音信息進(jìn)行能量提取以獲取對(duì)應(yīng)的語(yǔ)音重讀特征序列并加入到參照語(yǔ)音特征序列集中；

對(duì)所述模仿語(yǔ)音信息進(jìn)行基頻提取以獲得對(duì)應(yīng)的語(yǔ)音音調(diào)特征序列并加入到模仿語(yǔ)音特征序列集中；

對(duì)所述模仿語(yǔ)音信息進(jìn)行能量提取以獲取對(duì)應(yīng)的語(yǔ)音重讀特征序列并加入到模仿語(yǔ)音特征序列集中。

本發(fā)明還提供了一種基于語(yǔ)音相似度的語(yǔ)音評(píng)測(cè)系統(tǒng)，包括：

數(shù)據(jù)存儲(chǔ)模塊，用于存儲(chǔ)參照語(yǔ)音信息；

語(yǔ)音播報(bào)模塊，與所述數(shù)據(jù)存儲(chǔ)模塊連接，用于播報(bào)所述數(shù)據(jù)存儲(chǔ)模塊中存儲(chǔ)的參照語(yǔ)音信息；

語(yǔ)音獲取模塊，用于錄制模仿朗讀所述語(yǔ)音播報(bào)模塊播報(bào)的參照語(yǔ)音信息的模仿語(yǔ)音信息；

特征提取模塊，與所述語(yǔ)音播報(bào)模塊和所述語(yǔ)音獲取模塊連接，用于對(duì)所述語(yǔ)音播報(bào)模塊所播報(bào)的參照語(yǔ)音信息和所述語(yǔ)音獲取模塊所獲取的模仿語(yǔ)音信息進(jìn)行特征提取，以獲得對(duì)應(yīng)的參照語(yǔ)音特征序列集和模仿語(yǔ)音特征序列集；以及

評(píng)分模塊，與所述特征提取模塊連接，所述評(píng)分模塊接收所述特征提取模塊獲得的參照語(yǔ)音特征序列集和模仿語(yǔ)音特征序列集，并計(jì)算得出所述模仿語(yǔ)音信息和所述參照語(yǔ)音信息的相似度評(píng)分值。

本發(fā)明基于語(yǔ)音相似度的語(yǔ)音評(píng)測(cè)系統(tǒng)的進(jìn)一步改進(jìn)在于，所述評(píng)分模塊內(nèi)建立有相似度評(píng)分模型，所述相似度評(píng)分模型通過訓(xùn)練數(shù)據(jù)集對(duì)動(dòng)態(tài)時(shí)間規(guī)整算法和支持向量順序回歸算法進(jìn)行算法訓(xùn)練而建立，所述訓(xùn)練數(shù)據(jù)集包括訓(xùn)練參照語(yǔ)音數(shù)據(jù)、與所述訓(xùn)練參照語(yǔ)音數(shù)據(jù)對(duì)應(yīng)的訓(xùn)練模仿語(yǔ)音數(shù)據(jù)以及所述訓(xùn)練參照語(yǔ)音數(shù)據(jù)和所述訓(xùn)練模仿語(yǔ)音數(shù)據(jù)的相似度評(píng)分值；

所述評(píng)分模塊將所述的參照語(yǔ)音特征序列集和模仿語(yǔ)音特征序列集后輸入到所述相似度評(píng)分模塊以獲得所述模仿語(yǔ)音信息和所述參照語(yǔ)音信息的相似度評(píng)分值。

本發(fā)明基于語(yǔ)音相似度的語(yǔ)音評(píng)測(cè)系統(tǒng)的進(jìn)一步改進(jìn)在于，所述訓(xùn)練參照語(yǔ)音數(shù)據(jù)和所述訓(xùn)練模仿語(yǔ)音數(shù)據(jù)包括語(yǔ)音內(nèi)容特征序列、語(yǔ)音音調(diào)特征序列、語(yǔ)音時(shí)長(zhǎng)特征序列、語(yǔ)音停頓特征序列以及語(yǔ)音重讀特征序列；

通過所述訓(xùn)練參照語(yǔ)音數(shù)據(jù)和所述訓(xùn)練模仿語(yǔ)音數(shù)據(jù)中的語(yǔ)音音調(diào)特征序列、語(yǔ)音時(shí)長(zhǎng)特征序列、語(yǔ)音停頓特征序列以及語(yǔ)音重讀特征序列對(duì)所述動(dòng)態(tài)時(shí)間規(guī)整算法進(jìn)行算法訓(xùn)練，以使得通過所述動(dòng)態(tài)時(shí)間規(guī)整算法獲得所述訓(xùn)練參照語(yǔ)音數(shù)據(jù)和所述訓(xùn)練模仿語(yǔ)音數(shù)據(jù)之間的語(yǔ)音音調(diào)距離、語(yǔ)音時(shí)長(zhǎng)距離、語(yǔ)音停頓距離以及語(yǔ)音重讀距離；

通過所述訓(xùn)練參照語(yǔ)音數(shù)據(jù)和所述訓(xùn)練模仿語(yǔ)音數(shù)據(jù)中的語(yǔ)音內(nèi)容特征序列、所述訓(xùn)練參照語(yǔ)音數(shù)據(jù)和所述訓(xùn)練模仿語(yǔ)音數(shù)據(jù)的相似度評(píng)分值、所獲得的語(yǔ)音音調(diào)距離、語(yǔ)音時(shí)長(zhǎng)距離、語(yǔ)音停頓距離以及語(yǔ)音重讀距離對(duì)所述支持向量順序回歸算法進(jìn)行算法訓(xùn)練，從而于所述評(píng)分模塊內(nèi)建立了相似度評(píng)分模型。

本發(fā)明基于語(yǔ)音相似度的語(yǔ)音評(píng)測(cè)系統(tǒng)的進(jìn)一步改進(jìn)在于，所述動(dòng)態(tài)時(shí)間規(guī)整算法在進(jìn)行算法訓(xùn)練時(shí)，設(shè)定有以時(shí)間幀順序依序進(jìn)行算法訓(xùn)練的約束條件。

本發(fā)明基于語(yǔ)音相似度的語(yǔ)音評(píng)測(cè)系統(tǒng)的進(jìn)一步改進(jìn)在于，所述特征提取模塊包括語(yǔ)音識(shí)別子模塊、基頻提取子模塊、能量提取子模塊以及序列緩存子模塊；

所述序列緩存子模塊內(nèi)存儲(chǔ)有參照語(yǔ)音特征序列集和模仿語(yǔ)音特征序列集；

所述語(yǔ)音識(shí)別子模塊用于對(duì)所述參照語(yǔ)音信息進(jìn)行語(yǔ)音識(shí)別以獲得對(duì)應(yīng)的語(yǔ)音內(nèi)容特征序列、語(yǔ)音停頓特征序列以及語(yǔ)音時(shí)長(zhǎng)特征序列并寫入到所述參照語(yǔ)音特征序列集中；還用于對(duì)所述模仿語(yǔ)音信息進(jìn)行語(yǔ)音識(shí)別以獲得對(duì)應(yīng)的語(yǔ)音內(nèi)容特征序列、語(yǔ)音停頓特征序列以及語(yǔ)音時(shí)長(zhǎng)特征序列并寫入到所述模仿語(yǔ)音特征序列集中；

所述基頻提取子模塊用于對(duì)所述參照語(yǔ)音信息進(jìn)行基頻提取以獲得對(duì)應(yīng)的語(yǔ)音音調(diào)特征序列并寫入到所述參照語(yǔ)音特征序列集中；還用于對(duì)所述模仿語(yǔ)音信息進(jìn)行基頻提取以獲得對(duì)應(yīng)的語(yǔ)音音調(diào)特征序列并寫入到模仿語(yǔ)音特征序列集中；

所述能量提取子模塊用于對(duì)所述參照語(yǔ)音信息進(jìn)行能量提取以獲取對(duì)應(yīng)的語(yǔ)音重讀特征序列并寫入到所述參照語(yǔ)音特征序列集中；還用于對(duì)所述模仿語(yǔ)音信息進(jìn)行能量提取以獲取對(duì)應(yīng)的語(yǔ)音重讀特征序列并寫入到模仿語(yǔ)音特征序列集中。

附圖說明

圖1為本發(fā)明基于語(yǔ)音相似度的語(yǔ)音評(píng)測(cè)系統(tǒng)的系統(tǒng)圖。

圖2為本發(fā)明基于語(yǔ)音相似度的語(yǔ)音評(píng)測(cè)方法及系統(tǒng)的相似度評(píng)測(cè)流程圖。

圖3為本發(fā)明基于語(yǔ)音相似度的語(yǔ)音評(píng)測(cè)方法及系統(tǒng)中特征提取的流程圖。

具體實(shí)施方式

下面結(jié)合附圖和具體實(shí)施例對(duì)本發(fā)明作進(jìn)一步說明。

本發(fā)明提供了一種基于語(yǔ)音相似度的語(yǔ)音評(píng)測(cè)方法及系統(tǒng)，實(shí)現(xiàn)了自動(dòng)化的相似度評(píng)分。為模仿學(xué)習(xí)提供幫助，對(duì)于語(yǔ)言學(xué)習(xí)來講，模仿學(xué)習(xí)對(duì)語(yǔ)言發(fā)音練習(xí)具有顯著的幫助效果，但是目前現(xiàn)有的評(píng)測(cè)系統(tǒng)都僅是針對(duì)發(fā)音質(zhì)量進(jìn)行公正客觀的評(píng)測(cè)，而不能直觀的為發(fā)音模仿程度給出評(píng)估結(jié)果，對(duì)于模仿學(xué)習(xí)方法沒有直接幫助。而本發(fā)明的基于語(yǔ)音相似度的語(yǔ)音評(píng)測(cè)方法及系統(tǒng)，針對(duì)語(yǔ)音韻律特征，感知兩條語(yǔ)音相似程度，給出相似度評(píng)分，能夠給學(xué)習(xí)者的模仿學(xué)習(xí)提供有效直觀的反饋，為語(yǔ)言學(xué)習(xí)提供了一種新的學(xué)習(xí)方法，即模仿練習(xí)學(xué)習(xí)。有效的提高學(xué)習(xí)者的發(fā)音水平和學(xué)習(xí)效果。下面結(jié)合附圖對(duì)本發(fā)明基于語(yǔ)音相似度的語(yǔ)音評(píng)測(cè)方法及系統(tǒng)進(jìn)行說明。

如圖1所示，本發(fā)明的基于語(yǔ)音相似度的語(yǔ)音評(píng)測(cè)系統(tǒng)包括有數(shù)據(jù)存儲(chǔ)模塊11、語(yǔ)音播報(bào)模塊12、語(yǔ)音獲取模塊13、特征提取模塊14、評(píng)分模塊15，數(shù)據(jù)存儲(chǔ)模塊11與語(yǔ)音播報(bào)模塊12連接，語(yǔ)音播報(bào)模塊12和語(yǔ)音獲取模塊13與特征提取模塊14連接，特征提取模塊14與評(píng)分模塊15連接。

數(shù)據(jù)存儲(chǔ)模塊11用于存儲(chǔ)參照語(yǔ)音信息，在數(shù)據(jù)存儲(chǔ)模塊11中建立有用于發(fā)音練習(xí)的發(fā)音練習(xí)數(shù)據(jù)庫(kù)，該發(fā)音練習(xí)數(shù)據(jù)庫(kù)中存儲(chǔ)復(fù)數(shù)個(gè)參照語(yǔ)音信息，該參照語(yǔ)音信息為音頻格式，可通過音頻播放器進(jìn)行播放，以供學(xué)習(xí)者進(jìn)行模仿。

語(yǔ)音播報(bào)模塊12與數(shù)據(jù)存儲(chǔ)模塊11連接，該語(yǔ)音播報(bào)模塊12用于播報(bào)數(shù)據(jù)存儲(chǔ)模塊11中存儲(chǔ)的參照語(yǔ)音信息給學(xué)習(xí)者，學(xué)習(xí)者通過聆聽播報(bào)的參照語(yǔ)音信息而進(jìn)行模仿發(fā)音練習(xí)。

語(yǔ)音獲取模塊13用于錄制模仿朗讀語(yǔ)音播報(bào)模塊12播報(bào)的參照語(yǔ)音信息的模仿語(yǔ)音信息，該語(yǔ)音播報(bào)模塊12在播報(bào)完成后形成錄制獲取指令發(fā)送給語(yǔ)音獲取模塊13，以啟動(dòng)語(yǔ)音獲取模塊13，語(yǔ)音獲取模塊13錄制學(xué)習(xí)者的朗讀聲音形成模仿語(yǔ)音信息。該語(yǔ)音獲取模塊13可以為麥克風(fēng)，能夠錄制來自學(xué)習(xí)者的語(yǔ)音。

特征提取模塊14用于對(duì)語(yǔ)音播報(bào)模塊12所播報(bào)的參照語(yǔ)音信息進(jìn)行特征提取，還對(duì)語(yǔ)音獲取模塊13所獲取的模仿語(yǔ)音信息進(jìn)行特征提取，以獲得對(duì)應(yīng)參照語(yǔ)音信息的參照語(yǔ)音特征序列集和對(duì)應(yīng)模仿語(yǔ)音信息的模仿語(yǔ)音特征序列集，該參照語(yǔ)音特征序列集和模仿語(yǔ)音特征序列集中包括有語(yǔ)音韻律特征，通過對(duì)兩個(gè)語(yǔ)音韻律特征進(jìn)行分析比對(duì)就能夠得到兩條語(yǔ)音信息的相似度評(píng)分值。

評(píng)分模塊15接收特征提取模塊獲得的參照語(yǔ)音特征序列集合模仿語(yǔ)音特征序列集，并計(jì)算得出模仿語(yǔ)音信息和參照語(yǔ)音信息的相似度評(píng)分值。該得到的相似度評(píng)分值直接反饋給模仿學(xué)習(xí)者，對(duì)模仿學(xué)習(xí)者的模仿練習(xí)起到評(píng)估的作用，可幫助學(xué)習(xí)者有針對(duì)性的進(jìn)行模仿練習(xí)，且通過模仿練習(xí)使得學(xué)習(xí)者的發(fā)音越來越像參照語(yǔ)音(標(biāo)準(zhǔn)發(fā)音或者老師的發(fā)音)，有效提高了發(fā)音水平，為發(fā)音練習(xí)提供了新的模仿學(xué)習(xí)方法。

評(píng)分模塊內(nèi)建立有相似度評(píng)分模型，該相似度評(píng)分模型用于在輸入模仿語(yǔ)音特征序列集和參照語(yǔ)音特征序列集后，輸出模仿語(yǔ)音信息和參照語(yǔ)音信息的相似度評(píng)分值。評(píng)分模塊在接收到參照語(yǔ)音特征序列集合模仿語(yǔ)音特征序列集后，將參照語(yǔ)音特征序列集合模仿語(yǔ)音特征序列集輸入到相似度評(píng)分模型中，就能夠獲得模仿語(yǔ)音信息和參照語(yǔ)音信息的相似度評(píng)分值。

該相似度評(píng)分模型通過訓(xùn)練數(shù)據(jù)集對(duì)動(dòng)態(tài)時(shí)間規(guī)整算法(DTW，Dynamic Time Warping)和支持向量順序回歸算法(SVOR，Support Vector Ordinal Regression)進(jìn)行算法訓(xùn)練而建立，訓(xùn)練數(shù)據(jù)集包括有訓(xùn)練參照語(yǔ)音數(shù)據(jù)、與訓(xùn)練參照語(yǔ)音數(shù)據(jù)對(duì)應(yīng)的訓(xùn)練模仿語(yǔ)音數(shù)據(jù)以及訓(xùn)練參照語(yǔ)音數(shù)據(jù)和模仿語(yǔ)音數(shù)據(jù)的相似度評(píng)分值，該訓(xùn)練參照語(yǔ)音數(shù)據(jù)和模仿語(yǔ)音數(shù)據(jù)的相似度評(píng)分值為人工標(biāo)注，利用訓(xùn)練數(shù)據(jù)集進(jìn)行算法訓(xùn)練以獲得相似度評(píng)分模型。在進(jìn)行算法訓(xùn)練時(shí)，訓(xùn)練參照語(yǔ)音數(shù)據(jù)和訓(xùn)練模仿語(yǔ)音數(shù)據(jù)包括有語(yǔ)音內(nèi)容特征序列、語(yǔ)音音調(diào)特征序列、語(yǔ)音時(shí)長(zhǎng)特征序列、語(yǔ)音停頓特征序列以及語(yǔ)音重讀特征序列，其中的語(yǔ)音內(nèi)容特征序列是指語(yǔ)音數(shù)據(jù)中的文本內(nèi)容，即以單詞為單位的識(shí)別結(jié)果文本序列；語(yǔ)音音調(diào)特征序列指人發(fā)音語(yǔ)調(diào)的變化情況，音調(diào)特征序列包括標(biāo)準(zhǔn)化的基頻序列、風(fēng)格化的基頻序列、標(biāo)準(zhǔn)化基頻序列的一階差分、以及風(fēng)格化基頻序列的一階差分，語(yǔ)音音調(diào)特征序列通過基頻提取來實(shí)現(xiàn)，該基頻提取是指對(duì)每一幀語(yǔ)音提取其基頻信息；語(yǔ)音時(shí)長(zhǎng)特征序列指單詞或音節(jié)的發(fā)音時(shí)間長(zhǎng)短情況，語(yǔ)音時(shí)長(zhǎng)特征序列包括單詞絕對(duì)發(fā)音時(shí)長(zhǎng)序列和單詞相對(duì)發(fā)音時(shí)長(zhǎng)序列，單詞絕對(duì)發(fā)音時(shí)長(zhǎng)序列指識(shí)別結(jié)果中每個(gè)單詞發(fā)音時(shí)長(zhǎng)所構(gòu)成的序列，單詞相對(duì)發(fā)音時(shí)長(zhǎng)序列指每個(gè)單詞發(fā)音時(shí)長(zhǎng)占總發(fā)音時(shí)長(zhǎng)的比例的序列；語(yǔ)音停頓特征序列是指發(fā)音和靜音交錯(cuò)情況，即靜音和發(fā)音間隔時(shí)長(zhǎng)序列，因?yàn)橐粭l語(yǔ)音是由靜音段和發(fā)音段交錯(cuò)組成的，將每個(gè)靜音段也當(dāng)作一個(gè)單詞(SIL，silence，靜音)，計(jì)算其持續(xù)時(shí)間當(dāng)作時(shí)長(zhǎng)，與每個(gè)單詞的發(fā)音時(shí)長(zhǎng)共同構(gòu)成一個(gè)序列；語(yǔ)音重讀特征序列是指哪些單詞為了突出強(qiáng)調(diào)而重讀，重讀的聲音具有較大的力度和音量，語(yǔ)音重讀特征序列包括能量序列和能量序列的一階差分。利用訓(xùn)練參照語(yǔ)音數(shù)據(jù)和訓(xùn)練模仿語(yǔ)音數(shù)據(jù)中的語(yǔ)音音調(diào)特征序列、語(yǔ)音時(shí)長(zhǎng)特征序列、語(yǔ)音停頓特征序列以及語(yǔ)音重讀特征序列對(duì)所述動(dòng)態(tài)時(shí)間規(guī)整算法進(jìn)行算法訓(xùn)練，以使得通過所述動(dòng)態(tài)時(shí)間規(guī)整算法獲得所述訓(xùn)練參照語(yǔ)音數(shù)據(jù)和所述訓(xùn)練模仿語(yǔ)音數(shù)據(jù)之間的語(yǔ)音音調(diào)距離、語(yǔ)音時(shí)長(zhǎng)距離、語(yǔ)音停頓距離以及語(yǔ)音重讀距離，由于語(yǔ)音音調(diào)特征序列、語(yǔ)音時(shí)長(zhǎng)特征序列、語(yǔ)音停頓特征序列以及語(yǔ)音重讀特征序列都是時(shí)間序列，可用“距離”來衡量?jī)蓚€(gè)序列的相似度，采用動(dòng)態(tài)時(shí)間規(guī)整算法從兩個(gè)不同長(zhǎng)度序列中找到相似的匹配點(diǎn)，從而計(jì)算匹配點(diǎn)的距離即獲得了兩個(gè)序列的距離。為了提高動(dòng)態(tài)時(shí)間規(guī)整算法的魯棒性，為動(dòng)態(tài)時(shí)間規(guī)整算法設(shè)定約束條件，令動(dòng)態(tài)時(shí)間規(guī)整算法以時(shí)間幀順序依序進(jìn)行算法訓(xùn)練，避免動(dòng)態(tài)時(shí)間規(guī)整算法在查找匹配點(diǎn)時(shí)返回已遍歷過的時(shí)間幀進(jìn)行查找。約束了動(dòng)態(tài)時(shí)間規(guī)整算法的連續(xù)性和單調(diào)性，提高了算法的魯棒性。對(duì)于訓(xùn)練參照語(yǔ)音數(shù)據(jù)和訓(xùn)練模仿語(yǔ)音數(shù)據(jù)中的語(yǔ)音內(nèi)容特征序列的內(nèi)容距離，可通過兩者的直接比對(duì)而獲得。利用訓(xùn)練參照語(yǔ)音數(shù)據(jù)和訓(xùn)練模仿語(yǔ)音數(shù)據(jù)中的語(yǔ)音內(nèi)容特征序列、訓(xùn)練參照語(yǔ)音數(shù)據(jù)和訓(xùn)練模仿語(yǔ)音數(shù)據(jù)的相似度評(píng)分值、所獲得的語(yǔ)音音調(diào)距離、語(yǔ)音時(shí)長(zhǎng)距離、語(yǔ)音停頓距離以及語(yǔ)音重讀距離對(duì)支持向量順序回歸算法進(jìn)行算法訓(xùn)練，該支撐向量順序回歸算法作為分?jǐn)?shù)映射模型，針對(duì)兩個(gè)序列的距離給出合適的相似度評(píng)分值。通過對(duì)動(dòng)態(tài)時(shí)間規(guī)整算法和支持向量順序回歸算法的算法訓(xùn)練，在評(píng)分模塊內(nèi)建立相似度評(píng)分模型。

該相似度評(píng)分模型通過相似度特征提取和相似度得分計(jì)算得到相似度評(píng)分值，其中的相似度特征提取是基于從音頻和語(yǔ)音識(shí)別結(jié)果中提取出各個(gè)語(yǔ)音特征序列，進(jìn)一步提取相似度相關(guān)特征，具體包括從模仿語(yǔ)音信息和參照語(yǔ)音信息中分別提取出所有語(yǔ)音特征序列，該所有語(yǔ)音特征序列包括語(yǔ)音內(nèi)容特征序列、語(yǔ)音音調(diào)特征序列、語(yǔ)音時(shí)長(zhǎng)特征序列、語(yǔ)音停頓特征序列以及語(yǔ)音重讀特征序列；計(jì)算模仿語(yǔ)音信息和參照語(yǔ)音信息的語(yǔ)音內(nèi)容特征序列之間的Levenshtein距離，作為一維特征；對(duì)于其他序列特征，均采用DTW計(jì)算模仿語(yǔ)音信息和參照語(yǔ)音信息的最小匹配距離，設(shè)參照語(yǔ)音信息的特征序列為R，模仿語(yǔ)音信息的特征序列為U，則DTW動(dòng)態(tài)規(guī)劃目標(biāo)函數(shù)為：G_i,j＝d_i,j+min{G_i,j-1,G_i-1,j,G_i-1,j-1+d_i,j}

其中i為參照語(yǔ)音特征序列的下標(biāo)，j為模仿語(yǔ)音信息語(yǔ)音特征序列的下標(biāo)，G_i,j為累積距離，d_i,j＝|R_i-U_j|

每一對(duì)特征序列均可得到一個(gè)最小匹配距離，作為一維相似度特征，這樣一共得到10維相似度特征。

相似度得分計(jì)算，在相似度特征和專家打分之間建立一種對(duì)應(yīng)關(guān)系，通過訓(xùn)練以得到相似度得分計(jì)算的模型，該模型可以是任何一種回歸、分類模型。常用的線性回歸模型對(duì)于相似度特別高或者特別差的樣本不能準(zhǔn)確表達(dá)，因此我們采用SVOR模型，可以克服線性回歸的缺點(diǎn)。

特征提取模塊14包括語(yǔ)音識(shí)別子模塊、基頻提取子模塊、能量提取子模塊以及序列緩存子模塊；序列緩存子模塊內(nèi)存儲(chǔ)有參照語(yǔ)音特征序列集和模仿語(yǔ)音特征序列集；語(yǔ)音識(shí)別子模塊用于對(duì)參照語(yǔ)音信息進(jìn)行語(yǔ)音識(shí)別，識(shí)別出語(yǔ)音內(nèi)的文本內(nèi)容、語(yǔ)音中單詞音素邊界，從而獲得對(duì)應(yīng)該參照語(yǔ)音信息的語(yǔ)音內(nèi)容特征序列、語(yǔ)音停頓特征序列和語(yǔ)音時(shí)長(zhǎng)特征序列，語(yǔ)音內(nèi)容特征序列為以單詞為單位的識(shí)別結(jié)果文本序列；語(yǔ)音停頓特征序列包括靜音、發(fā)音間隔時(shí)長(zhǎng)序列；語(yǔ)音時(shí)長(zhǎng)特征序列包括單詞絕對(duì)發(fā)音時(shí)長(zhǎng)序列和單詞相對(duì)發(fā)音時(shí)長(zhǎng)序列，可通過如下公式計(jì)算：

其中D為單詞絕對(duì)發(fā)音時(shí)長(zhǎng)序列，D′為單詞相對(duì)發(fā)音時(shí)長(zhǎng)序列，N為識(shí)別結(jié)果中單詞總個(gè)數(shù)。語(yǔ)音停頓特征序列通過語(yǔ)音識(shí)別檢測(cè)出哪些語(yǔ)音段是發(fā)音段，哪些語(yǔ)音段是靜音段，這種發(fā)音段和靜音段交錯(cuò)代表了人說話的節(jié)奏，即語(yǔ)音停頓特征序列，語(yǔ)音時(shí)長(zhǎng)特征序列利用語(yǔ)音識(shí)別技術(shù)和強(qiáng)制切分算法，可以獲得單詞和音素的起止時(shí)間點(diǎn)，進(jìn)一步計(jì)算出單詞和音素的發(fā)音時(shí)間長(zhǎng)度。語(yǔ)音識(shí)別子模塊將獲得的對(duì)應(yīng)該參照語(yǔ)音信息的語(yǔ)音內(nèi)容特征序列、語(yǔ)音停頓特征序列和語(yǔ)音時(shí)長(zhǎng)特征序列寫入到序列緩存子模塊中的參照語(yǔ)音特征序列集中。語(yǔ)音識(shí)別子模塊還用于對(duì)模仿語(yǔ)音信息進(jìn)行語(yǔ)音識(shí)別以獲得對(duì)應(yīng)的語(yǔ)音內(nèi)容特征序列、語(yǔ)音停頓特征序列以及語(yǔ)音時(shí)長(zhǎng)特征序列并寫入到模仿語(yǔ)音特征序列集中?；l提取子模塊用于對(duì)參照語(yǔ)音信息進(jìn)行基頻提取以獲得對(duì)應(yīng)的語(yǔ)音音調(diào)特征序列并寫入到參照語(yǔ)音特征序列集中，利用基頻提取技術(shù)從語(yǔ)音中獲得基頻曲線，以代表語(yǔ)音音調(diào)特征序列。基頻提取子模塊還用于對(duì)模仿語(yǔ)音信息進(jìn)行基頻提取以獲得對(duì)應(yīng)的語(yǔ)音音調(diào)特征序列并寫入到模仿語(yǔ)音特征序列集中?；l提取是指對(duì)每一幀語(yǔ)音提取其基頻信息，算法采用基于自相關(guān)的基頻提取算法，該算法計(jì)算速度快，得到基頻準(zhǔn)確穩(wěn)定。根據(jù)語(yǔ)音的特點(diǎn)，頻率區(qū)間設(shè)為60Hz至600Hz。提取出的基頻需要進(jìn)行如下后處理：提取出來的基頻存在一些錯(cuò)誤點(diǎn)，基于自相關(guān)的基頻提取算法會(huì)出現(xiàn)倍頻和半頻錯(cuò)誤，基頻序列中大部分是準(zhǔn)確的，以此為基準(zhǔn)可以修正提取結(jié)構(gòu)的倍頻和半頻錯(cuò)誤。提取出的基頻曲線不是連續(xù)光滑的，還需要對(duì)其進(jìn)行插值和平滑。插值算法采用線性插值，平滑算法采用3階巴特沃斯低通濾波器。人耳對(duì)聲音頻率的感知是對(duì)數(shù)均勻的，因此需要先將基頻F₀轉(zhuǎn)至對(duì)數(shù)域，即Semitone(半音程)，

其中F_ref為參考頻率，一般參考頻率取20Hz。標(biāo)準(zhǔn)化基頻序列是為了消除不同人群固有的基頻差異，使其具有可比性。這里采用Z-score標(biāo)準(zhǔn)化：

其中F₀為基頻序列中一點(diǎn)，μ為基頻序列的均值，σ為基頻序列的方差。發(fā)音的最小單位是音節(jié)。風(fēng)格化基頻序列是在標(biāo)準(zhǔn)化的基礎(chǔ)上，按語(yǔ)音識(shí)別結(jié)果中的音節(jié)邊界信息切分基頻序列，每個(gè)切分片段取其中位數(shù)，再將其連接成一個(gè)新的序列。風(fēng)格化不考慮每個(gè)音節(jié)內(nèi)部的基頻變化細(xì)節(jié)，只關(guān)心語(yǔ)音基頻變化的整體趨勢(shì)。基頻序列本身的相對(duì)變化也是描述音調(diào)編號(hào)的重要特征，因此分別取標(biāo)準(zhǔn)化基頻序列的一階差分、風(fēng)格化基頻序列的一階差分作為兩個(gè)特征序列。能量提取子模塊用于對(duì)參照語(yǔ)音信息進(jìn)行能量提取以獲得對(duì)應(yīng)的語(yǔ)音重讀特征序列并寫入到參照語(yǔ)音特征序列集中，重讀特征可從語(yǔ)音中提取能量變化曲線，能量代表人說話的力度和音量，分析能量曲線可獲得哪些單詞是強(qiáng)度重讀的，哪些是非重讀的。能量提取子模塊還用于對(duì)模仿語(yǔ)音信息進(jìn)行能力提取以獲取對(duì)應(yīng)的語(yǔ)音重讀特征序列并寫入到模仿語(yǔ)音特征序列集中。能量提取是指對(duì)每一幀語(yǔ)音提取其能量：

其中E為一幀語(yǔ)音的能量，A為音頻振幅序列，N為幀長(zhǎng)。能量序列本身的相對(duì)變化也是描述重讀編號(hào)的重要特征，因此取能量序列的一階差分作為一個(gè)特征序列。

下面對(duì)本發(fā)明提供的一種基于語(yǔ)音相似度的語(yǔ)音評(píng)測(cè)方法進(jìn)行說明。

本發(fā)明基于語(yǔ)音相似度的語(yǔ)音評(píng)測(cè)方法，包括如下步驟：

提供訓(xùn)練數(shù)據(jù)集，該訓(xùn)練數(shù)據(jù)集包括訓(xùn)練參照語(yǔ)音數(shù)據(jù)、與訓(xùn)練參照語(yǔ)音數(shù)據(jù)對(duì)應(yīng)的訓(xùn)練模仿語(yǔ)音數(shù)據(jù)以及訓(xùn)練參照語(yǔ)音數(shù)據(jù)和訓(xùn)練模仿語(yǔ)音數(shù)據(jù)的相似度評(píng)分值；該訓(xùn)練參照語(yǔ)音數(shù)據(jù)和訓(xùn)練模仿語(yǔ)音數(shù)據(jù)的相似度評(píng)分值根據(jù)人工標(biāo)注獲得；

利用訓(xùn)練數(shù)據(jù)集對(duì)動(dòng)態(tài)時(shí)間規(guī)整算法和支持向量順序回歸算法進(jìn)行算法訓(xùn)練，以獲得相似度評(píng)分模型；

如圖1所示，執(zhí)行步驟S101，參照語(yǔ)音信息。提供參照語(yǔ)音信息；并將參照語(yǔ)音信息播放給學(xué)習(xí)者聆聽以供其模仿練習(xí)；

執(zhí)行步驟S102，模仿語(yǔ)音信息。錄制模仿朗讀參照語(yǔ)音信息的模仿語(yǔ)音信息；在學(xué)習(xí)者模仿朗讀參照語(yǔ)音信息時(shí)對(duì)該模仿語(yǔ)音信息進(jìn)行錄制獲?。?/p>

執(zhí)行步驟S103和步驟S104，特征提取。提取參照語(yǔ)音信息中的參照語(yǔ)音特征序列集和模仿語(yǔ)音信息中的模仿語(yǔ)音特征序列集；

執(zhí)行步驟S105至步驟S109，向相似度評(píng)分模型輸入?yún)⒄照Z(yǔ)音特征序列集和模仿語(yǔ)音特征序列集，獲得模仿語(yǔ)音信息和參照語(yǔ)音信息的相似度評(píng)分值并輸出。

作為本發(fā)明的一較佳實(shí)施方式，訓(xùn)練參照語(yǔ)音數(shù)據(jù)和訓(xùn)練模仿語(yǔ)音數(shù)據(jù)包括語(yǔ)音內(nèi)容特征序列、語(yǔ)音音調(diào)特征序列、語(yǔ)音時(shí)長(zhǎng)特征序列、語(yǔ)音停頓特征序列以及語(yǔ)音重讀特征序列；其中的語(yǔ)音內(nèi)容特征序列是指語(yǔ)音數(shù)據(jù)中的文本內(nèi)容，語(yǔ)音音調(diào)特征序列指人發(fā)音語(yǔ)調(diào)的變化情況，語(yǔ)音時(shí)長(zhǎng)特征序列指單詞或音節(jié)的發(fā)音時(shí)間長(zhǎng)短情況，語(yǔ)音停頓特征序列是指發(fā)音和靜音交錯(cuò)情況，語(yǔ)音重讀特征序列是指哪些單詞為了突出強(qiáng)調(diào)而重讀，重讀的聲音具有較大的力度和音量。

利用訓(xùn)練數(shù)據(jù)集進(jìn)行算法訓(xùn)練包括：

利用訓(xùn)練參照語(yǔ)音數(shù)據(jù)和訓(xùn)練模仿語(yǔ)音數(shù)據(jù)中的語(yǔ)音音調(diào)特征序列、語(yǔ)音時(shí)長(zhǎng)特征序列、語(yǔ)音停頓特征序列以及語(yǔ)音重讀特征序列對(duì)動(dòng)態(tài)時(shí)間規(guī)整算法進(jìn)行算法訓(xùn)練，以使得通過動(dòng)態(tài)時(shí)間規(guī)整算法獲得訓(xùn)練參照語(yǔ)音數(shù)據(jù)和訓(xùn)練模仿語(yǔ)音數(shù)據(jù)之間的語(yǔ)音音調(diào)距離、語(yǔ)音時(shí)長(zhǎng)距離、語(yǔ)音停頓距離以及語(yǔ)音重讀距離，結(jié)合圖1中步驟S105和步驟S107所示；由于語(yǔ)音音調(diào)特征序列、語(yǔ)音時(shí)長(zhǎng)特征序列、語(yǔ)音停頓特征序列以及語(yǔ)音重讀特征序列都是時(shí)間序列，可用“距離”來衡量?jī)蓚€(gè)序列的相似度，采用動(dòng)態(tài)時(shí)間規(guī)整算法從兩個(gè)不同長(zhǎng)度序列中找到相似的匹配點(diǎn)，從而計(jì)算匹配點(diǎn)的距離即獲得了兩個(gè)序列的距離。為了提高動(dòng)態(tài)時(shí)間規(guī)整算法的魯棒性，為動(dòng)態(tài)時(shí)間規(guī)整算法設(shè)定以時(shí)間幀順序依序進(jìn)行計(jì)算的約束條件，令動(dòng)態(tài)時(shí)間規(guī)整算法以時(shí)間幀順序依序進(jìn)行算法訓(xùn)練，避免動(dòng)態(tài)時(shí)間規(guī)整算法在查找匹配點(diǎn)時(shí)返回已遍歷過的時(shí)間幀進(jìn)行查找。約束了動(dòng)態(tài)時(shí)間規(guī)整算法的連續(xù)性和單調(diào)性，提高了算法的魯棒性。

利用訓(xùn)練參照語(yǔ)音數(shù)據(jù)和訓(xùn)練模仿語(yǔ)音數(shù)據(jù)中的語(yǔ)音內(nèi)容特征序列、訓(xùn)練參照語(yǔ)音數(shù)據(jù)和訓(xùn)練模仿語(yǔ)音數(shù)據(jù)的相似度評(píng)分值、所獲得的語(yǔ)音音調(diào)距離、語(yǔ)音時(shí)長(zhǎng)距離、語(yǔ)音停頓距離以及語(yǔ)音重讀距離對(duì)支持向量順序回歸算法進(jìn)行算法訓(xùn)練。該支撐向量順序回歸算法作為分?jǐn)?shù)映射模型，針對(duì)兩個(gè)序列的距離給出合適的相似度評(píng)分值。

作為本發(fā)明的一較佳實(shí)施方式，提取參照語(yǔ)音信息中的參照語(yǔ)音特征序列集，包括：

如圖3所示，執(zhí)行步驟S201，參照語(yǔ)音信息。提供參照語(yǔ)音信息進(jìn)行特征提取。執(zhí)行步驟S202，語(yǔ)音識(shí)別，對(duì)參照語(yǔ)音信息進(jìn)行語(yǔ)音識(shí)別。執(zhí)行步驟S205，通過語(yǔ)音識(shí)別輸出參照語(yǔ)音信息的語(yǔ)音內(nèi)容特征序列，語(yǔ)音停頓特征序列以及語(yǔ)音時(shí)長(zhǎng)特征序列并加入到參照語(yǔ)音特征序列集總。語(yǔ)音識(shí)別子模塊用于對(duì)參照語(yǔ)音信息進(jìn)行語(yǔ)音識(shí)別，識(shí)別出語(yǔ)音內(nèi)的文本內(nèi)容、語(yǔ)音中單詞音素邊界，從而獲得對(duì)應(yīng)該參照語(yǔ)音信息的語(yǔ)音內(nèi)容特征序列、語(yǔ)音停頓特征序列和語(yǔ)音時(shí)長(zhǎng)特征序列，語(yǔ)音停頓特征序列通過語(yǔ)音識(shí)別檢測(cè)出哪些語(yǔ)音段是發(fā)音段，哪些語(yǔ)音段是靜音段，這種發(fā)音段和靜音段交錯(cuò)代表了人說話的節(jié)奏，即語(yǔ)音停頓特征序列，語(yǔ)音時(shí)長(zhǎng)特征序列利用語(yǔ)音識(shí)別技術(shù)和強(qiáng)制切分算法，可以獲得單詞和音素的起止時(shí)間點(diǎn)，進(jìn)一步計(jì)算出單詞和音素的發(fā)音時(shí)間長(zhǎng)度。執(zhí)行步驟S203，基頻提取，對(duì)參照語(yǔ)音信息進(jìn)行基頻提取，執(zhí)行步驟S206，通過基頻提取輸出參照語(yǔ)音信息的語(yǔ)音音調(diào)特征序列并加入到參照語(yǔ)音特征序列集中。利用基頻提取技術(shù)從語(yǔ)音中獲得基頻曲線，以代表語(yǔ)音音調(diào)特征序列。執(zhí)行步驟S204，能量提取，對(duì)參照語(yǔ)音信息進(jìn)行能量提取，執(zhí)行步驟S207，通過能量提取輸出參照語(yǔ)音信息的語(yǔ)音重讀特征序列并加入到參照語(yǔ)音特征序列集中。重讀特征可從語(yǔ)音中提取能量變化曲線，能量代表人說話的力度和音量，分析能量曲線可獲得哪些單詞是強(qiáng)度重讀的，哪些是非重讀的。

作為本發(fā)明的一較佳實(shí)施方式，提取模仿語(yǔ)音信息中的模仿語(yǔ)音特征序列集，包括：對(duì)模仿語(yǔ)音信息進(jìn)行語(yǔ)音識(shí)別以獲得對(duì)應(yīng)的語(yǔ)音內(nèi)容特征序列、語(yǔ)音停頓特征序列以及語(yǔ)音時(shí)長(zhǎng)特征序列并加入到模仿語(yǔ)音特征序列集中；對(duì)模仿語(yǔ)音信息進(jìn)行基頻提取以獲得對(duì)應(yīng)的語(yǔ)音音調(diào)特征序列并加入到模仿語(yǔ)音特征序列集中；對(duì)模仿語(yǔ)音信息進(jìn)行能量提取以獲取對(duì)應(yīng)的語(yǔ)音重讀特征序列并加入到模仿語(yǔ)音特征序列集中。

本發(fā)明基于語(yǔ)音相似度的語(yǔ)音評(píng)測(cè)方法及系統(tǒng)的有益效果為：

本發(fā)明的語(yǔ)音相似度的評(píng)測(cè)方法及系統(tǒng)，能夠直觀的為學(xué)習(xí)者給出相似度的評(píng)分，為語(yǔ)言學(xué)習(xí)的模仿學(xué)習(xí)方法提供了有效的反饋，能夠促進(jìn)學(xué)習(xí)者在語(yǔ)言學(xué)習(xí)中反復(fù)模仿練習(xí)，以提高學(xué)習(xí)者的語(yǔ)言學(xué)習(xí)水平(口語(yǔ)水平)和學(xué)習(xí)效果，進(jìn)而為學(xué)習(xí)者的語(yǔ)音學(xué)習(xí)提供直接的幫助。本發(fā)明的語(yǔ)音相似度的評(píng)測(cè)方法在對(duì)發(fā)音正確性進(jìn)行考核的基礎(chǔ)上，增加了對(duì)發(fā)音模仿程度的評(píng)估，可幫助用戶有針對(duì)性的進(jìn)行模仿練習(xí)，提高發(fā)音水平。

以上結(jié)合附圖實(shí)施例對(duì)本發(fā)明進(jìn)行了詳細(xì)說明，本領(lǐng)域中普通技術(shù)人員可根據(jù)上述說明對(duì)本發(fā)明做出種種變化例。因而，實(shí)施例中的某些細(xì)節(jié)不應(yīng)構(gòu)成對(duì)本發(fā)明的限定，本發(fā)明將以所附權(quán)利要求書界定的范圍作為本發(fā)明的保護(hù)范圍。

完整全部詳細(xì)技術(shù)資料下載

當(dāng)前第1頁(yè)1 2 3