一種文字轉(zhuǎn)語音的處理方法及系統(tǒng)的制作方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及文字處理技術(shù)領(lǐng)域,尤其涉及一種文字轉(zhuǎn)語音的處理方法及系統(tǒng)。
【背景技術(shù)】
[0002]在日常生活中常常出現(xiàn)發(fā)送者不方便說話只能通過文字發(fā)送信息,但是接收方又只能接收語音信息的情況,這時候用戶通過文字轉(zhuǎn)語音的技術(shù)就可以將自己編輯好的文字信息轉(zhuǎn)換成語音信息發(fā)出去,但目前的文字轉(zhuǎn)語音處理方法轉(zhuǎn)換得到的語音信息僅僅是簡單的語音合成和語音拼湊,不能將說話者語音中的感情表達(dá)出來,翻譯過來的語音顯的很生硬,不能將用戶想表達(dá)的感情特征表現(xiàn)出來。本發(fā)明利用感情特征對應(yīng)的特征值將輸入的文字信息轉(zhuǎn)換為帶有相應(yīng)感情特征的聲音信息,豐富了輸出語音的特征,還原用戶想要表達(dá)的感情特征,提尚用戶體驗(yàn)。
【發(fā)明內(nèi)容】
[0003]本發(fā)明提出一種文字轉(zhuǎn)語音的處理方法及系統(tǒng),該方法利用感情特征對應(yīng)的特征值將輸入的文字信息轉(zhuǎn)換為帶有相應(yīng)感情特征的聲音信息,還原用戶想要表達(dá)的感情特征。
[0004]為達(dá)此目的,本發(fā)明采用以下技術(shù)方案:
[0005]第一方面,本發(fā)明提出一種文字轉(zhuǎn)語音的處理方法,包括:
[0006]獲取用戶輸入的文字信息;
[0007]將所述文字信息轉(zhuǎn)換為聲音;
[0008]獲取所述文字信息的感情特征,讀取預(yù)存的所述感情特征對應(yīng)的特征值;
[0009]利用所述特征值對所述聲音進(jìn)行調(diào)節(jié),得到輸出語音。
[0010]其中,獲取所述文字信息的感情特征,包括;
[0011]識別所述文字信息中的關(guān)鍵字、得到所述關(guān)鍵字對應(yīng)的感情特征,或
[0012]獲取用戶輸入的對應(yīng)所述文字信息的感情特征。
[0013]其中,將所述文字信息轉(zhuǎn)換為聲音之后,利用所述特征值對所述聲音進(jìn)行調(diào)節(jié)之前,還包括,對所述聲音進(jìn)行音色處理。
[0014]其中,對所述聲音進(jìn)行音色處理,包括:獲取所述用戶的信息,讀取預(yù)存的所述用戶的語音數(shù)據(jù),從語音數(shù)據(jù)得到音色特點(diǎn),使用所述音色特點(diǎn)對所述聲音進(jìn)行音色處理。
[0015]其中,使用所述音色特點(diǎn)對所述聲音進(jìn)行音色處理之前,還包括:存儲所述用戶的語音數(shù)據(jù)。
[0016]所述讀取所述感情特征對應(yīng)的特征值之前,還包括:存儲感情特征對應(yīng)的特征值。
[0017]其中,感情特征包括:悲傷、憤怒、充滿愛、高興;特征值包括:聲音頻率、音調(diào)、語速、輕重音。
[0018]第二方面,本發(fā)明提出一種文字轉(zhuǎn)語音的處理系統(tǒng),包括:
[0019]第一獲取單元:用于獲取用戶輸入的文字信息;
[0020]轉(zhuǎn)換單元:用于將所述文字信息轉(zhuǎn)換為聲音;
[0021]第二獲取單元:用于獲取所述文字信息的感情特征,讀取預(yù)存的所述感情特征對應(yīng)的特征值;
[0022]感情處理單元:用于利用所述特征值對所述聲音進(jìn)行調(diào)節(jié),得到輸出語音。
[0023]其中,第二獲取單元包括:
[0024]識別獲取單元:用于識別所述文字信息中的關(guān)鍵字、得到所述關(guān)鍵字對應(yīng)的感情特征;
[0025]直接獲取單元:用于獲取用戶輸入的對應(yīng)所述文字信息的感情特征。
[0026]其中,還包括,音色處理單元:用于所述轉(zhuǎn)換單元將所述文字信息轉(zhuǎn)換為聲音之后,對所述聲音進(jìn)行音色處理。
[0027]其中,音色處理單元包括:
[0028]第三獲取單元:用于獲取所述用戶的信息,讀取預(yù)存的所述用戶的語音數(shù)據(jù),從語音數(shù)據(jù)得到音色特點(diǎn);
[0029]處理單元:用于使用所述音色特點(diǎn)對所述聲音進(jìn)行音色處理。
[0030]其中,還包括,存儲單元:用于存儲所述用戶的語音數(shù)據(jù)和所述感情特征對應(yīng)的特征值。
[0031]本發(fā)明有益效果:本發(fā)明通過獲取文字信息的感情特征,利用感情特征對應(yīng)的特征值將輸入的文字信息轉(zhuǎn)換為帶有相應(yīng)感情特征的聲音信息,豐富了輸出語音的特征;此外本發(fā)明還對轉(zhuǎn)換后的語音信息進(jìn)行音色處理,根據(jù)用戶的語音數(shù)據(jù)提取用戶的音色特點(diǎn),使用該音色特點(diǎn)對語音信息進(jìn)行音色處理,能夠針對用戶進(jìn)行個性化的語音轉(zhuǎn)換,更大程度的還原用戶想要表達(dá)的感情特征,用戶體驗(yàn)更好。
【附圖說明】
[0032]圖1是本發(fā)明提供的文字轉(zhuǎn)語音的處理方法實(shí)施例一的方法流程圖。
[0033]圖2是本發(fā)明提供的文字轉(zhuǎn)語音的處理方法實(shí)施例二的方法流程圖。
[0034]圖3是本發(fā)明提供的文字轉(zhuǎn)語音的處理系統(tǒng)的功能模塊圖。
[0035]圖4是本發(fā)明提供的另一種文字轉(zhuǎn)語音的處理系統(tǒng)的功能模塊圖。
【具體實(shí)施方式】
[0036]以下結(jié)合附圖,通過具體實(shí)施例來進(jìn)一步說明本發(fā)明的技術(shù)方案。
[0037]實(shí)施例一
[0038]參考圖1,一種文字轉(zhuǎn)語音的處理方法,包括:
[0039]S101、獲取用戶輸入的文字信息;自動獲取用戶編輯的想要發(fā)送的文字信息。
[0040]S102、將所述文字信息轉(zhuǎn)換為聲音。
[0041]主要利用現(xiàn)有的文本轉(zhuǎn)語音(tts,text to speech)技術(shù),將文字信息轉(zhuǎn)換為聲音,但是這一步驟僅是簡單的將文字轉(zhuǎn)化為聲音,只是簡單的語音拼湊。
[0042]S103、獲取所述文字信息的感情特征,讀取預(yù)存的所述感情特征對應(yīng)的特征值。
[0043]對文字信息進(jìn)行關(guān)鍵字識別,根據(jù)關(guān)鍵字識別出文字信息中的感情特征,感情特征包括悲傷、憤怒、充滿愛、高興等;再根據(jù)感情特征從數(shù)據(jù)庫中讀取預(yù)存的感情特征對應(yīng)的特征值,該特征值為相應(yīng)感情特征下聲音的頻率、語速、音調(diào)、輕重音等。
[0044]例如,對文字信息進(jìn)行關(guān)鍵字識別,獲得與高興相關(guān)的關(guān)鍵字,則判斷出用戶想要表達(dá)的感情特征為高興,從數(shù)據(jù)庫中讀取預(yù)存的感情特征為高興的對應(yīng)的聲音頻率、語速、音調(diào)、輕重音等對應(yīng)的特征值。
[0045]為了提高感情特征的準(zhǔn)確性,除根據(jù)關(guān)鍵字識別出文字信息中的感情特征之外,用戶還可以手動輸入想要表達(dá)的感情特征。
[0046]S104、利用所述特征值對所述聲音進(jìn)行調(diào)節(jié),得到輸出語音。
[0047]從數(shù)據(jù)庫中可以獲取不同感情特征下聲音頻率、語速、音調(diào)、輕重音等特征值,利用這些特征值對簡單轉(zhuǎn)換后得到的聲音進(jìn)行情感處理,最終的輸出語音便帶有相應(yīng)的感情色彩,實(shí)現(xiàn)將用戶的感情特征傳達(dá)給接收者的目的。
[0048]例如通過上一步驟得知用戶要表達(dá)的感情特征是高興,則從數(shù)據(jù)庫中提取的特征值就是高興時聲音的頻率、語速、音調(diào)、輕重音等,利用這些特征值對簡單轉(zhuǎn)換后得到的聲音進(jìn)行優(yōu)化,轉(zhuǎn)換的聲音就能表現(xiàn)出高興的感情狀態(tài)。
[0049]本方法通過獲取文字信息的感情特征,利用感情特征對應(yīng)的特征值將輸入的文字信息轉(zhuǎn)換為帶有相應(yīng)感情特征的聲音信息,豐富了輸出語音的特征,還原用戶想要表達(dá)的感情特征,提尚用戶體驗(yàn)。
[0050]實(shí)施例二
[0051]參考圖2,本實(shí)施例提供了另一種文字轉(zhuǎn)語音的處理方法,包括:
[0052]S201、獲取用戶輸入的文字信息,自動獲取用戶編輯的想要發(fā)送的文字信息。
[0053]S202、將所述文字信息轉(zhuǎn)換為聲音。
[0054]主要利用現(xiàn)有的文本轉(zhuǎn)語音(tts,text to speech)技術(shù),將文字信息轉(zhuǎn)換為聲音,但是這一步驟僅是簡單的將文字轉(zhuǎn)化為聲音,只是簡單的語音拼湊。
[0055]S203、獲取所述文字信息的感情特征,讀取預(yù)存的所述感情特征對應(yīng)的特征值。該步驟與S103相同,此處不再贅述。
[0056]S204、獲取所述用戶的信息,讀取預(yù)存的所述用戶的語音數(shù)據(jù),從語音數(shù)據(jù)得到音色特點(diǎn),使用所述音色特點(diǎn)對所述聲音進(jìn)行音色處理。
[0057]語音數(shù)據(jù)包括了用戶的音色特點(diǎn)。音色特點(diǎn)指用戶的聲音特點(diǎn),比如有的人聲音低沉,有的人聲音清亮,有的人說話時語氣輕柔,有的人說話時語氣急躁等都是用戶的音色特點(diǎn),不同的人氣音色特點(diǎn)均不相同,且同一個用戶和不同的人進(jìn)行交流時表現(xiàn)出的音色特點(diǎn)也有所不同,因此需要對用戶的音色特點(diǎn)進(jìn)行采集和存儲,不僅僅需要保存用戶本身的音色特點(diǎn)還要保存用戶和不同的人進(jìn)行對話時的音色特點(diǎn),利用這些音色特點(diǎn)對簡單轉(zhuǎn)換后的聲音進(jìn)行音色處理才能使變聲處理更具有針對性和個性化,根據(jù)不同使用者的風(fēng)格對簡單轉(zhuǎn)換后的聲音進(jìn)行音色處理。
[0058]例如媽媽發(fā)送信息給孩子時,可以得知文字信息是媽媽發(fā)送給孩子的,則此時就以數(shù)據(jù)庫中保存的媽媽之前與孩子交流時的音色特點(diǎn)為參照,提取出相應(yīng)的音色特點(diǎn),利用相應(yīng)的音色特點(diǎn)對簡單轉(zhuǎn)換后的聲音進(jìn)行音色處理,得到具有媽媽的音色特點(diǎn)的聲音。
[0059]S205、利用所述特征值對所述聲音進(jìn)行調(diào)節(jié),得到輸出語音。
[0060]通過上一步驟對轉(zhuǎn)換后的聲音進(jìn)行了音色處理,使得轉(zhuǎn)換的聲音具有使用者的音色特點(diǎn),得到具有音色特點(diǎn)的聲音;再根據(jù)S203中得到的感情特征對應(yīng)的特征值,該特征值為相應(yīng)感情特征下聲音的頻率、語速、音調(diào)、輕重音等。
[0061]利用這些特征值對進(jìn)行了音色處理的聲音再次進(jìn)行情感處理,得到最終的輸出語音,最終的輸出語音即帶有用戶的音色特點(diǎn)又帶有用戶想要表達(dá)的感情特征,將用戶的發(fā)送的文字信息原汁原味的還原成用戶的聲音信息,并帶有相應(yīng)的感情特征傳達(dá)給接收者。
[0062]例如媽媽發(fā)送信息給孩子時,根據(jù)文字信息通關(guān)關(guān)鍵字識別或媽媽手動輸入要表達(dá)的感情特征,判斷得到媽媽想要表達(dá)的感情特征為高興,則在數(shù)據(jù)庫中提取感情特征為高興時的特征值;其次,可以得知文字信息是媽媽發(fā)送給孩子的,則此時就從數(shù)據(jù)庫中保存的媽媽之前與孩子交流時的音色特點(diǎn)為參照,提取出相應(yīng)的音色特點(diǎn),利用相應(yīng)的音色特點(diǎn)對簡單轉(zhuǎn)換后的聲音進(jìn)行變聲處理,得到具有媽媽的音色特點(diǎn)的聲音;最后利用感情特征為高興時的特征值對具有媽媽的音色特點(diǎn)的聲音再次進(jìn)行優(yōu)化,最終將輸入的文字信息原汁原味的還原成媽媽高興時的聲音作為輸出語音發(fā)送給孩子。
[0063]本發(fā)明通過獲取文字信息的感情特征,利用感情特征對應(yīng)的特征值將輸入的文字信息轉(zhuǎn)換為帶有相應(yīng)感情特征的聲音信息,豐富了輸出語音的特征;此外本發(fā)明還對轉(zhuǎn)換后的語音信息進(jìn)行音色處理,根據(jù)用戶的語音數(shù)據(jù)提取用戶的音色特點(diǎn),使用該音色特點(diǎn)對語音信息進(jìn)行音色處理,能夠針對用戶進(jìn)行個性化的語音轉(zhuǎn)換,更大程度的還原用戶想要表達(dá)的感情特征,用戶體驗(yàn)更好。
[0064]實(shí)施例三
[0065]參考圖3,本實(shí)施例提供了一種文字轉(zhuǎn)語音的處理系統(tǒng),包括:
[0066]101第一獲取單元:用于獲取用戶輸入的文字信息;通過第一獲取單元自動獲取用戶編輯的想要發(fā)送