国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      一種智能口語(yǔ)測(cè)評(píng)方法與流程

      文檔序號(hào):12128429閱讀:446來(lái)源:國(guó)知局

      本發(fā)明涉及語(yǔ)言溝通領(lǐng)域,尤其涉及一種智能口語(yǔ)測(cè)評(píng)方法。



      背景技術(shù):

      隨著全球經(jīng)濟(jì)一體化的發(fā)展,英語(yǔ)作為國(guó)際通用語(yǔ)言,越來(lái)越顯示出其重要的作用。商務(wù)往來(lái)、文化交流、跨國(guó)旅游等活動(dòng)日益頻繁,越來(lái)越多的人需要學(xué)習(xí)一門外語(yǔ),這樣口語(yǔ)交際能力的提高已經(jīng)成為了外語(yǔ)學(xué)習(xí)的迫切需求。如何提高外語(yǔ)的學(xué)習(xí)效果,更好地滿足用戶對(duì)外語(yǔ)學(xué)習(xí)的需求,已經(jīng)成為目前亟待解決的問(wèn)題。



      技術(shù)實(shí)現(xiàn)要素:

      為了克服上述現(xiàn)有技術(shù)中的不足,本發(fā)明的目的在于,提供一種智能口語(yǔ)測(cè)評(píng)方法,方法包括:

      S1:使用計(jì)算機(jī)的錄音設(shè)備獲取用戶的口語(yǔ)語(yǔ)音數(shù)據(jù)信息,提取用戶語(yǔ)音數(shù)據(jù)中的用戶語(yǔ)音特征;

      S2:將用戶語(yǔ)音特征與標(biāo)準(zhǔn)語(yǔ)音特征進(jìn)行對(duì)齊,并將用戶語(yǔ)音特征中的母音,輔音分別對(duì)應(yīng)與標(biāo)準(zhǔn)語(yǔ)音特征的母音,輔音進(jìn)行對(duì)比,形成對(duì)比數(shù)據(jù)信息;

      S3:將對(duì)比數(shù)據(jù)信息進(jìn)行評(píng)分;

      S4:將對(duì)比數(shù)據(jù)信息及評(píng)分結(jié)果儲(chǔ)存至數(shù)據(jù)庫(kù)中。

      優(yōu)選地,步驟S1之前還包括:設(shè)置標(biāo)準(zhǔn)朗讀文本,獲取標(biāo)準(zhǔn)朗讀文本的標(biāo)準(zhǔn)語(yǔ)音特征;

      將標(biāo)準(zhǔn)語(yǔ)音特征按時(shí)間進(jìn)行分段,分為n段,以20ms為一時(shí)間分段;

      將每一時(shí)間段標(biāo)準(zhǔn)語(yǔ)音特征分為靜態(tài)特征及動(dòng)態(tài)特征;

      將每一時(shí)間段標(biāo)準(zhǔn)語(yǔ)音特征的頻譜能量進(jìn)行分解,分解出每一時(shí)間段標(biāo)準(zhǔn)語(yǔ)音特征的母音節(jié)的頻譜能量分布以及輔音節(jié)的頻譜能量分布;

      設(shè)置每一時(shí)間段內(nèi)標(biāo)準(zhǔn)語(yǔ)音特征的母音節(jié)MFCC特征向量,輔音節(jié)MFCC特征向量;

      將每一時(shí)間段內(nèi)標(biāo)準(zhǔn)語(yǔ)音特征的母音節(jié)MFCC特征向量,輔音節(jié)MFCC特征向量?jī)?chǔ)存至數(shù)據(jù)庫(kù)中。

      優(yōu)選地,步驟S1還包括:

      S11將用戶語(yǔ)音數(shù)據(jù)按時(shí)間進(jìn)行分段,分為n段,以20ms為一時(shí)間分段,對(duì)每一時(shí)間段用戶語(yǔ)音數(shù)據(jù)加矩形窗,或漢明窗處理得到分段語(yǔ)音信號(hào)Xn,n為分段數(shù);

      S12對(duì)分段語(yǔ)音信號(hào)Xn進(jìn)行短時(shí)傅里葉變換,變換為頻域信號(hào),將短時(shí)時(shí)域信號(hào)轉(zhuǎn)化為頻域信號(hào)Yn,并通過(guò)Qn=│Yn2計(jì)算其短時(shí)能量譜Qn;

      S13采用先進(jìn)先出的方式將短時(shí)能量譜Qn從矢量空間S移動(dòng)至帶通濾波器進(jìn)行濾波;由于每一個(gè)頻帶中分量的作用在人耳中是疊加的,因此將每個(gè)濾波器頻帶內(nèi)的能量進(jìn)行疊加,這時(shí)第k個(gè)濾波器輸出功率譜x'(k);

      S14將每個(gè)濾波器的輸出取對(duì)數(shù),得到相應(yīng)頻帶的對(duì)數(shù)功率譜;并進(jìn)行反離散余弦變換,得到M個(gè)MFCC系數(shù),一般M取13~15個(gè);MFCC系數(shù)為:

      S15將得到的每一時(shí)間段的用戶語(yǔ)音MFCC特征作為靜態(tài)特征,再將所述靜態(tài)特征做一階和二階差分,得到相應(yīng)的動(dòng)態(tài)特征。

      優(yōu)選地,步驟S1還包括:

      獲取每一語(yǔ)音段頻率范圍的頻譜能量(fk),該語(yǔ)音段內(nèi)的頻率上限值k1,下限值k2,獲取語(yǔ)音段內(nèi)的頻譜能量比值PNn

      優(yōu)選地,步驟S1還包括:

      若語(yǔ)音段內(nèi)頻譜能量(fk)≥第一閾值,該語(yǔ)音段內(nèi)頻譜能量比值PNn≥第二閾值,則判斷此語(yǔ)音段為母音節(jié);第一閾值0.1-0.5,第二閾值取60%-85%;

      以具有母音節(jié)的頻譜能量為基準(zhǔn),判斷具有母音節(jié)的頻譜能量之前的頻譜能量的過(guò)零率是否大于第三閾值,若大于第三閾值,則斷定該頻譜能量為母音前的輔音節(jié),第三閾值取100;

      以具有母音節(jié)的頻譜能量為基準(zhǔn),判斷具有母音節(jié)的頻譜能量之后的頻譜能量的過(guò)零率是否大于第三閾值,若大于第三閾值,則判斷該頻譜能量為母音后的輔音;

      若具有母音節(jié)的頻譜能量之后的頻譜能量的過(guò)零率大于第三閾值,且該頻譜能量為語(yǔ)音段的最后一幀,則判斷為鼻尾輔音。

      優(yōu)選地,步驟S2還包括:

      設(shè)置每一時(shí)間段內(nèi)用戶語(yǔ)音特征的母音節(jié)MFCC特征向量,輔音節(jié)MFCC特征向量;

      使用DTW算法,得到一條誤差最小的對(duì)齊路徑以,得到一條誤差最小的對(duì)齊路徑和對(duì)應(yīng)的DTW距離;

      基于該對(duì)齊路徑和對(duì)應(yīng)的DTW距離,將相同時(shí)間段內(nèi)用戶語(yǔ)音特征的母音節(jié)MFCC特征向量與標(biāo)準(zhǔn)語(yǔ)音特征的母音節(jié)MFCC特征向量進(jìn)行語(yǔ)音比較以及將相同時(shí)間段內(nèi)用戶語(yǔ)音特征的輔音節(jié)MFCC特征向量與標(biāo)準(zhǔn)語(yǔ)音特征的輔音節(jié)MFCC特征向量進(jìn)行語(yǔ)音比較,得出用戶語(yǔ)音特征與標(biāo)準(zhǔn)語(yǔ)音特征之間的發(fā)音差別。

      優(yōu)選地,步驟S2還包括:

      設(shè)置每一時(shí)間段內(nèi)標(biāo)準(zhǔn)語(yǔ)音特征的母音節(jié)標(biāo)準(zhǔn)語(yǔ)音特征向量為P1=[p1(1),p1(2),…,p1(R)],一階差分向量為PΔ1=[pΔ1(1),pΔ1(2),…,pΔ1(R)](R為標(biāo)準(zhǔn)語(yǔ)音特征的母音節(jié)語(yǔ)音長(zhǎng)度),PΔ1(n)=|p1(n)-p1(n-1)|,n=1,2,…,R,p1(0)=0;

      設(shè)置每一時(shí)間段內(nèi)標(biāo)準(zhǔn)語(yǔ)音特征的輔音節(jié)標(biāo)準(zhǔn)語(yǔ)音特征向量為P’1=[p’1(1),p’1(2),…,p’1(R)],一階差分向量為P’Δ1=[p’Δ1(1),p’Δ1(2),…,p’Δ1(R)](R為標(biāo)準(zhǔn)語(yǔ)音特征的語(yǔ)音長(zhǎng)度),P’Δ1(n)=|p’1(n)-p’1(n-1)|,n=1,2,…,R,p’1(0)=0;

      優(yōu)選地,步驟S2還包括:

      設(shè)置每一時(shí)間段內(nèi)用戶語(yǔ)音特征的母音節(jié)特征向量為P2=[p2(1),p2(2),…,p2(T)],其一階差分向量為PΔ2=[pΔ2(1),pΔ2(2),…,pΔ2(T)](T為待評(píng)價(jià)語(yǔ)音的長(zhǎng)度),PΔ2(n)=|p2(n)-p2(n-1)|,n=1,2,…,T,p2(0)=0;

      設(shè)置每一時(shí)間段內(nèi)用戶語(yǔ)音特征的輔音節(jié)特征向量為P’2=[p’2(1),p’2(2),…,p’2(T)],其一階差分向量為P’Δ2=[p’Δ2(1),p’Δ2(2),…,p’Δ2(T)](T為待評(píng)價(jià)語(yǔ)音的長(zhǎng)度),

      P’Δ2(n)=|p’2(n)-p’2(n-1)|,n=1,2,…,T,p’2(0)=0;

      使用DTW算法,得到一條誤差最小的對(duì)齊路徑以,得到一條誤差最小的對(duì)齊路徑,進(jìn)行每一時(shí)間段內(nèi)的母音節(jié)和輔音節(jié)比較;

      比較得出母音節(jié)的差距dp,以及變化量的差距Δdp,比較得出輔音節(jié)的差距d’p,以及變化量的差距Δd’p,來(lái)獲得用戶語(yǔ)音特征與標(biāo)準(zhǔn)語(yǔ)音特征的相似度,即:

      dp=|p1(n)-p2(m)|

      d’p=|p’1(n)-p’2(m)|

      Δdp=|Δp1(n)-Δp2(m)|

      Δd’p=|Δp’1(n)-Δp’2(m)|

      其中,Δpi(n)=|pi(n)-pi(n-1)|

      Δp’i(n)=|p’i(n)-p’i(n-1)|。

      優(yōu)選地,步驟S3還包括:評(píng)分s為:

      s=ω1(ω11s11+ω12s12+……+ω1js1j)+ω2(ω21s21+ω22s22+……+ω2js2j)+……+ωn(ωn1sn1+ωn2sn2+……+ωnjsnj)

      其中,ω1,ω2,ωn分別代表每一語(yǔ)音段的權(quán)重;

      j代表每一語(yǔ)音段內(nèi)母音節(jié)加輔音節(jié)的總數(shù)量;

      ω11,ω12……ω1j分別代表第一個(gè)語(yǔ)音段內(nèi)音節(jié)的權(quán)重;

      s11,s12……+s1j,代表第一個(gè)語(yǔ)音段內(nèi)的各個(gè)音節(jié);

      ω21,ω22……ω2j分別代表第二個(gè)語(yǔ)音段內(nèi)音節(jié)的權(quán)重;

      s21,s22……+s2j,代表第二個(gè)語(yǔ)音段內(nèi)的各個(gè)音節(jié);

      ωn1,ωn2……ωnj分別代表第n個(gè)語(yǔ)音段內(nèi)音節(jié)的權(quán)重;

      sn1,sn2……+snj,代表第n個(gè)語(yǔ)音段內(nèi)的各個(gè)音節(jié)。

      從以上技術(shù)方案可以看出,本發(fā)明具有以下優(yōu)點(diǎn):

      智能口語(yǔ)測(cè)評(píng)方法使得用戶與計(jì)算機(jī)獲取同樣的一片文本,進(jìn)行朗讀對(duì)比,使用戶能夠獲悉到自己的口語(yǔ)與標(biāo)準(zhǔn)的口語(yǔ)有哪些詞語(yǔ)發(fā)音不準(zhǔn)確,還需要在哪些詞語(yǔ)進(jìn)行改進(jìn)及進(jìn)一步學(xué)習(xí)。這樣給學(xué)習(xí)者帶來(lái)了學(xué)習(xí)語(yǔ)言的便捷性,提高外語(yǔ)學(xué)習(xí)的效率,增加用戶學(xué)習(xí)興趣。

      附圖說(shuō)明

      圖1為智能口語(yǔ)測(cè)評(píng)方法的流程圖。

      具體實(shí)施方式

      為使得本發(fā)明的發(fā)明目的、特征、優(yōu)點(diǎn)能夠更加的明顯和易懂,下面將運(yùn)用具體的實(shí)施例及附圖,對(duì)本發(fā)明保護(hù)的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,下面所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而非全部的實(shí)施例?;诒緦@械膶?shí)施例,本領(lǐng)域普通技術(shù)人員在沒(méi)有做出創(chuàng)造性勞動(dòng)前提下所獲得的所有其它實(shí)施例,都屬于本專利保護(hù)的范圍。

      本發(fā)明提供一種智能口語(yǔ)測(cè)評(píng)方法,如圖1所示,本方法采用一標(biāo)準(zhǔn)朗讀文本,計(jì)算機(jī)先獲取該標(biāo)準(zhǔn)朗讀文本的內(nèi)容,并獲取標(biāo)準(zhǔn)朗讀文本的標(biāo)準(zhǔn)讀音。本發(fā)明所涉及的方法是基于計(jì)算機(jī)硬件配合相應(yīng)的程序?qū)崿F(xiàn)。這樣用戶與計(jì)算機(jī)獲取同樣的一片文本,進(jìn)行朗讀對(duì)比,使得用戶能夠獲悉到自己的口語(yǔ)與標(biāo)準(zhǔn)的口語(yǔ)有哪些詞語(yǔ)發(fā)音不準(zhǔn)確,還需要在哪些詞語(yǔ)進(jìn)行改進(jìn)及進(jìn)一步學(xué)習(xí)。這樣給學(xué)習(xí)者帶來(lái)了學(xué)習(xí)語(yǔ)言的便捷性,提高外語(yǔ)學(xué)習(xí)的效率,增加用戶學(xué)習(xí)興趣。

      方法包括:

      S1:使用計(jì)算機(jī)的錄音設(shè)備獲取用戶的口語(yǔ)語(yǔ)音數(shù)據(jù)信息,提取用戶語(yǔ)音數(shù)據(jù)中的用戶語(yǔ)音特征;

      S2:將用戶語(yǔ)音特征與標(biāo)準(zhǔn)語(yǔ)音特征進(jìn)行對(duì)齊,并將用戶語(yǔ)音特征中的母音,輔音分別對(duì)應(yīng)與標(biāo)準(zhǔn)語(yǔ)音特征的母音,輔音進(jìn)行對(duì)比,形成對(duì)比數(shù)據(jù)信息;

      S3:將對(duì)比數(shù)據(jù)信息進(jìn)行評(píng)分;

      S4:將對(duì)比數(shù)據(jù)信息及評(píng)分結(jié)果儲(chǔ)存至數(shù)據(jù)庫(kù)中。

      步驟S1之前還包括:設(shè)置標(biāo)準(zhǔn)朗讀文本,獲取標(biāo)準(zhǔn)朗讀文本的標(biāo)準(zhǔn)語(yǔ)音特征;

      將標(biāo)準(zhǔn)語(yǔ)音特征按時(shí)間進(jìn)行分段,分為n段,以20ms為一時(shí)間分段;

      將每一時(shí)間段標(biāo)準(zhǔn)語(yǔ)音特征分為靜態(tài)特征及動(dòng)態(tài)特征;

      將每一時(shí)間段標(biāo)準(zhǔn)語(yǔ)音特征的頻譜能量進(jìn)行分解,分解出每一時(shí)間段標(biāo)準(zhǔn)語(yǔ)音特征的母音節(jié)的頻譜能量分布以及輔音節(jié)的頻譜能量分布;

      設(shè)置每一時(shí)間段內(nèi)標(biāo)準(zhǔn)語(yǔ)音特征的母音節(jié)MFCC特征向量,輔音節(jié)MFCC特征向量;

      將每一時(shí)間段內(nèi)標(biāo)準(zhǔn)語(yǔ)音特征的母音節(jié)MFCC特征向量,輔音節(jié)MFCC特征向量?jī)?chǔ)存至數(shù)據(jù)庫(kù)中。

      步驟S1還包括:

      S11將用戶語(yǔ)音數(shù)據(jù)按時(shí)間進(jìn)行分段,分為n段,以20ms為一時(shí)間分段,對(duì)每一時(shí)間段用戶語(yǔ)音數(shù)據(jù)加矩形窗,或漢明窗處理得到分段語(yǔ)音信號(hào)Xn,n為分段數(shù);

      S12對(duì)分段語(yǔ)音信號(hào)Xn進(jìn)行短時(shí)傅里葉變換,變換為頻域信號(hào),將短時(shí)時(shí)域信號(hào)轉(zhuǎn)化為頻域信號(hào)Yn,并通過(guò)Qn=│Yn2計(jì)算其短時(shí)能量譜Qn;

      S13采用先進(jìn)先出的方式將短時(shí)能量譜Qn從矢量空間S移動(dòng)至帶通濾波器進(jìn)行濾波;由于每一個(gè)頻帶中分量的作用在人耳中是疊加的,因此將每個(gè)濾波器頻帶內(nèi)的能量進(jìn)行疊加,這時(shí)第k個(gè)濾波器輸出功率譜x'(k);

      S14將每個(gè)濾波器的輸出取對(duì)數(shù),得到相應(yīng)頻帶的對(duì)數(shù)功率譜;并進(jìn)行反離散余弦變換,得到M個(gè)MFCC系數(shù),一般M取13~15個(gè);MFCC系數(shù)為:

      S15將得到的每一時(shí)間段的用戶語(yǔ)音MFCC特征作為靜態(tài)特征,再將所述靜態(tài)特征做一階和二階差分,得到相應(yīng)的動(dòng)態(tài)特征。

      本實(shí)施例中,步驟S1還包括:

      獲取每一語(yǔ)音段頻率范圍的頻譜能量(fk),該語(yǔ)音段內(nèi)的頻率上限值k1,下限值k2,獲取語(yǔ)音段內(nèi)的頻譜能量比值PNn;

      步驟S1還包括:

      若語(yǔ)音段內(nèi)頻譜能量(fk)≥第一閾值,該語(yǔ)音段內(nèi)頻譜能量比值PNn≥第二閾值,則判斷此語(yǔ)音段為母音節(jié);第一閾值0.1-0.5,第二閾值取60%-85%;

      以具有母音節(jié)的頻譜能量為基準(zhǔn),判斷具有母音節(jié)的頻譜能量之前的頻譜能量的過(guò)零率是否大于第三閾值,若大于第三閾值,則斷定該頻譜能量為母音前的輔音,第三閾值取100;

      以具有母音節(jié)的頻譜能量為基準(zhǔn),判斷具有母音節(jié)的頻譜能量之后的頻譜能量的過(guò)零率是否大于第三閾值,若大于第三閾值,則判斷該頻譜能量為母音后的輔音;

      若具有母音節(jié)的頻譜能量之后的頻譜能量的過(guò)零率大于第三閾值,且該頻譜能量為語(yǔ)音段的最后一幀,則判斷為鼻尾輔音。

      將用戶的每一語(yǔ)音段進(jìn)行分解得出母音節(jié),輔音節(jié)以及在語(yǔ)音段的最后一幀是否有鼻尾輔音,鼻尾輔音即為鼻音。

      在計(jì)算機(jī)預(yù)先設(shè)置了標(biāo)準(zhǔn)朗讀文本中每一語(yǔ)音段的母音節(jié),輔音節(jié)以及在語(yǔ)音段的最后一幀是否有鼻尾輔音,鼻尾輔音即為鼻音。將用戶朗讀的每一語(yǔ)音段的母音節(jié),輔音節(jié)以及在語(yǔ)音段的最后一幀的鼻尾輔音,分別與標(biāo)準(zhǔn)語(yǔ)音特征進(jìn)行比較。

      本實(shí)施例中,步驟S2還包括:

      設(shè)置每一時(shí)間段內(nèi)用戶語(yǔ)音特征的母音節(jié)MFCC特征向量,輔音節(jié)MFCC特征向量;

      使用DTW算法,得到一條誤差最小的對(duì)齊路徑以,得到一條誤差最小的對(duì)齊路徑和對(duì)應(yīng)的DTW距離;

      基于該對(duì)齊路徑和對(duì)應(yīng)的DTW距離,將相同時(shí)間段內(nèi)用戶語(yǔ)音特征的母音節(jié)MFCC特征向量與標(biāo)準(zhǔn)語(yǔ)音特征的母音節(jié)MFCC特征向量進(jìn)行語(yǔ)音比較以及將相同時(shí)間段內(nèi)用戶語(yǔ)音特征的輔音節(jié)MFCC特征向量與標(biāo)準(zhǔn)語(yǔ)音特征的輔音節(jié)MFCC特征向量進(jìn)行語(yǔ)音比較,得出用戶語(yǔ)音特征與標(biāo)準(zhǔn)語(yǔ)音特征之間的發(fā)音差別。

      本實(shí)施例中,步驟S2還包括:

      設(shè)置每一時(shí)間段內(nèi)標(biāo)準(zhǔn)語(yǔ)音特征的母音節(jié)標(biāo)準(zhǔn)語(yǔ)音特征向量為P1=[p1(1),p1(2),…,p1(R)],一階差分向量為PΔ1=[pΔ1(1),pΔ1(2),…,pΔ1(R)](R為標(biāo)準(zhǔn)語(yǔ)音特征的母音節(jié)語(yǔ)音長(zhǎng)度),PΔ1(n)=|p1(n)-p1(n-1)|,n=1,2,…,R,p1(0)=0;

      設(shè)置每一時(shí)間段內(nèi)標(biāo)準(zhǔn)語(yǔ)音特征的輔音節(jié)標(biāo)準(zhǔn)語(yǔ)音特征向量為P’1=[p’1(1),p’1(2),…,p’1(R)],一階差分向量為P’Δ1=[p’Δ1(1),p’Δ1(2),…,p’Δ1(R)](R為標(biāo)準(zhǔn)語(yǔ)音特征的語(yǔ)音長(zhǎng)度),P’Δ1(n)=|p’1(n)-p’1(n-1)|,n=1,2,…,R,p’1(0)=0;

      步驟S2還包括:

      設(shè)置每一時(shí)間段內(nèi)用戶語(yǔ)音特征的母音節(jié)特征向量為P2=[p2(1),p2(2),…,p2(T)],其一階差分向量為PΔ2=[pΔ2(1),pΔ2(2),…,pΔ2(T)](T為待評(píng)價(jià)語(yǔ)音的長(zhǎng)度),PΔ2(n)=|p2(n)-p2(n-1)|,n=1,2,…,T,p2(0)=0;

      設(shè)置每一時(shí)間段內(nèi)用戶語(yǔ)音特征的輔音節(jié)特征向量為P’2=[p’2(1),p’2(2),…,p’2(T)],其一階差分向量為P’Δ2=[p’Δ2(1),p’Δ2(2),…,p’Δ2(T)](T為待評(píng)價(jià)語(yǔ)音的長(zhǎng)度),

      P’Δ2(n)=|p’2(n)-p’2(n-1)|,n=1,2,…,T,p’2(0)=0;

      使用DTW算法,得到一條誤差最小的對(duì)齊路徑以,得到一條誤差最小的對(duì)齊路徑,進(jìn)行每一時(shí)間段內(nèi)的母音節(jié)和輔音節(jié)比較;

      比較得出母音節(jié)的差距dp,以及變化量的差距Δdp,比較得出輔音節(jié)的差距d’p,以及變化量的差距Δd’p,來(lái)獲得用戶語(yǔ)音特征與標(biāo)準(zhǔn)語(yǔ)音特征的相似度,即:

      dp=|p1(n)-p2(m)|

      d’p=|p’1(n)-p’2(m)|

      Δdp=|Δp1(n)-Δp2(m)|

      Δd’p=|Δp’1(n)-Δp’2(m)|

      其中,Δpi(n)=|pi(n)-pi(n-1)|

      Δp’i(n)=|p’i(n)-p’i(n-1)|。

      步驟S3還包括:評(píng)分s為:

      s=ω1(ω11s11+ω12s12+……+ω1js1j)+ω2(ω21s21+ω22s22+……+ω2js2j)+……+ωn(ωn1sn1+ωn2sn2+……+ωnjsnj)

      其中,ω1,ω2,ωn分別代表每一語(yǔ)音段的權(quán)重;

      j代表每一語(yǔ)音段內(nèi)母音節(jié)加輔音節(jié)的總數(shù)量;

      ω11,ω12……ω1j分別代表第一個(gè)語(yǔ)音段內(nèi)音節(jié)的權(quán)重;

      s11,s12……+s1j,代表第一個(gè)語(yǔ)音段內(nèi)的各個(gè)音節(jié);

      在第一個(gè)語(yǔ)音段內(nèi)如果第一個(gè)音節(jié)是輔音節(jié)則s11為輔音節(jié),如果第一個(gè)音節(jié)是母音節(jié)則s11為母音節(jié);如果第一個(gè)音節(jié)是輔音節(jié)則s12為輔音節(jié),如果第一個(gè)音節(jié)是母音節(jié)則s12為母音節(jié);每一個(gè)語(yǔ)音段以此類推。

      ω21,ω22……ω2j分別代表第二個(gè)語(yǔ)音段內(nèi)音節(jié)的權(quán)重;

      s21,s22……+s2j,代表第二個(gè)語(yǔ)音段內(nèi)的各個(gè)音節(jié);

      ωn1,ωn2……ωnj分別代表第n個(gè)語(yǔ)音段內(nèi)音節(jié)的權(quán)重;

      sn1,sn2……+snj,代表第n個(gè)語(yǔ)音段內(nèi)的各個(gè)音節(jié)。

      各個(gè)權(quán)重參數(shù),是經(jīng)由大量的實(shí)驗(yàn)得出,也可以由每一語(yǔ)音段的權(quán)重比例分配得知。也可以根據(jù)每一語(yǔ)音段對(duì)于文本的重要性設(shè)定。也可以由研發(fā)人員基于大量實(shí)驗(yàn)后得出最佳效果進(jìn)行設(shè)定。

      當(dāng)前第1頁(yè)1 2 3 
      網(wǎng)友詢問(wèn)留言 已有0條留言
      • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
      1