本發(fā)明屬于語(yǔ)音合成技術(shù)領(lǐng)域,特別是涉及一種語(yǔ)音合成方法。
背景技術(shù):
語(yǔ)音識(shí)別和語(yǔ)音合成技術(shù)是信息處理領(lǐng)域的重要分支,是實(shí)現(xiàn)人機(jī)語(yǔ)音交互的兩項(xiàng)關(guān)鍵技術(shù),這兩項(xiàng)技術(shù)使計(jì)算機(jī)具有類似于人一樣的說(shuō)話和聽(tīng)懂人說(shuō)話的能力,是當(dāng)今信息產(chǎn)業(yè)的重要競(jìng)爭(zhēng)市場(chǎng)。語(yǔ)音合成(speechsynthesis)是指由人工通過(guò)一定的機(jī)器設(shè)備產(chǎn)生出語(yǔ)音。語(yǔ)音合成是一門跨學(xué)科的技術(shù),它涉及聲學(xué)、語(yǔ)言學(xué)、心理學(xué)、數(shù)字信號(hào)處理、人工智能、計(jì)算機(jī)科學(xué)等多個(gè)學(xué)科技術(shù),是信息處理領(lǐng)域的一項(xiàng)前沿技術(shù),它的研究將推動(dòng)相關(guān)學(xué)科的進(jìn)步和發(fā)展。目前語(yǔ)音合成技術(shù)已是世界強(qiáng)國(guó)競(jìng)相研究的熱點(diǎn)之一,國(guó)內(nèi)外很多科研機(jī)構(gòu)致力于此項(xiàng)技術(shù)。近20年來(lái),語(yǔ)音合成技術(shù)取得顯著進(jìn)步,開(kāi)始從實(shí)驗(yàn)室走向市場(chǎng)。語(yǔ)音合成技術(shù)將進(jìn)入工業(yè)、家電、通信、汽車電子、醫(yī)療、家庭服務(wù)、消費(fèi)電子產(chǎn)品等各個(gè)領(lǐng)域。特別是隨著計(jì)算機(jī)技術(shù)、多媒體技術(shù)以及人工智能的不斷發(fā)展,語(yǔ)音合成技術(shù)作為一種新的信息傳遞技術(shù)逐漸被計(jì)算機(jī)產(chǎn)品或其他的電子產(chǎn)品所使用,以新的技術(shù)應(yīng)用在人機(jī)交互介質(zhì)中。具體方法是利用計(jì)算機(jī)將任意組合的文本轉(zhuǎn)化為聲音文件,并通過(guò)聲卡、電話語(yǔ)音卡等多媒體設(shè)備將聲音輸出的技術(shù),簡(jiǎn)單的說(shuō)就是讓機(jī)器把文字資料“讀”出來(lái)。這種新的信息傳遞方式比傳統(tǒng)的信息輸入輸出方式更加靈活、快捷和方便,因此語(yǔ)音編碼取代字符編碼成為信息的主要傳遞元素將成為信息技術(shù)發(fā)展的必然趨勢(shì),這也使得語(yǔ)音合成一直受到各國(guó)科學(xué)界的廣泛關(guān)注。在中國(guó),語(yǔ)音合成技術(shù)具有非常驚人的市場(chǎng)潛力,是一個(gè)活躍的研究課題。
語(yǔ)音合成用于將文本文件轉(zhuǎn)換成自然語(yǔ)音輸出,從而可以有效地幫助有視覺(jué)障礙的人閱讀文本信息,或者只是簡(jiǎn)單的用來(lái)增加文本文檔等的可讀性。
早期的語(yǔ)音合成系統(tǒng)一般采用專用的芯片實(shí)現(xiàn),如德州儀器公司的tms50c10/tms50c57芯片以及皇家飛利浦公司的ph84h36芯片等,但是上述的芯片一般主要應(yīng)用于家用電器或兒童玩具中。而計(jì)算機(jī)或移動(dòng)終端等電子設(shè)備中的語(yǔ)音合成系統(tǒng)一般都是通過(guò)軟件的形式實(shí)現(xiàn)。
所以現(xiàn)有的語(yǔ)音合成系統(tǒng)的實(shí)現(xiàn)形式多樣,各個(gè)廠家都具有自己定制的語(yǔ)音合成系統(tǒng),而且各個(gè)廠家的語(yǔ)音合成系統(tǒng)之間相互不兼容。從而限制了語(yǔ)音合成系統(tǒng)的應(yīng)用與發(fā)展。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明的目的在于提供語(yǔ)音合成方法,以語(yǔ)音合成裝置均可以生成進(jìn)行語(yǔ)音合成工作的執(zhí)行文件,還可而已通過(guò)打印接口將接收到的文本信息打印出來(lái),便于用戶的查閱,將所述語(yǔ)音合成系統(tǒng)加入移動(dòng)終端中,從而來(lái)語(yǔ)音輸出移動(dòng)終端所接收的文本信息,因而提高了移動(dòng)終端的用戶使用體驗(yàn)。。
為了達(dá)到上述目的,本發(fā)明提供了一種語(yǔ)音合成方法,應(yīng)用于語(yǔ)音合成設(shè)備,所述方法包括步驟:
讀取待合成的文本信息,并發(fā)送與所述待合成的文本信息對(duì)應(yīng)的語(yǔ)音轉(zhuǎn)化指令;
讀取所述文本信息中的所有字符,并根據(jù)所述字符確定對(duì)應(yīng)的詞匯;
根據(jù)所述詞匯,將所述文本信息轉(zhuǎn)換成對(duì)應(yīng)的語(yǔ)音信息;
合成所述語(yǔ)音信息,并通過(guò)所述應(yīng)用于語(yǔ)音合成設(shè)備發(fā)送語(yǔ)音信息。
優(yōu)選的,在所述讀取待合成的文本信息,并發(fā)送與所述待合成的文本信息對(duì)應(yīng)的語(yǔ)音轉(zhuǎn)化指令之前,所述方法還包括:
接收語(yǔ)音信息對(duì)應(yīng)的語(yǔ)音合成執(zhí)行指令,并生成所述語(yǔ)音信息對(duì)應(yīng)的執(zhí)行文件;
所述讀取待合成的文本信息,并發(fā)送與所述待合成的文本信息對(duì)應(yīng)的語(yǔ)音轉(zhuǎn)化指令,包括;
根據(jù)所述執(zhí)行文件以及所讀取待合成的文本信息,并發(fā)送與所述待合成的文本信息對(duì)應(yīng)的語(yǔ)音轉(zhuǎn)化指令。
優(yōu)選的,在所述讀取待合成的文本信息,并發(fā)送與所述待合成的文本信息對(duì)應(yīng)的語(yǔ)音轉(zhuǎn)化指令之前,所述方法還包括:
接收語(yǔ)音信息對(duì)應(yīng)的語(yǔ)音合成執(zhí)行指令,并生成所述語(yǔ)音信息對(duì)應(yīng)的執(zhí)行文件;
獲取所述文本信息中的短語(yǔ)信息,調(diào)用預(yù)存的分析資料庫(kù),對(duì)比分析短語(yǔ)信息,根據(jù)所述短語(yǔ)信息,將所述文本信息轉(zhuǎn)換成對(duì)應(yīng)的語(yǔ)音信息;
合成所述語(yǔ)音信息,并通過(guò)所述應(yīng)用于語(yǔ)音合成設(shè)備發(fā)送語(yǔ)音信息。
優(yōu)選的,在所述讀取待合成的文本信息,并發(fā)送與所述待合成的文本信息對(duì)應(yīng)的語(yǔ)音轉(zhuǎn)化指令之前,所述方法還包括:
接收語(yǔ)音信息對(duì)應(yīng)的語(yǔ)音合成執(zhí)行指令,并生成所述語(yǔ)音信息對(duì)應(yīng)的執(zhí)行文件;
獲取所述文本信息中的語(yǔ)句信息,調(diào)用預(yù)存的分析資料庫(kù),對(duì)比分析語(yǔ)句信息,根據(jù)所述語(yǔ)句信息,將所述文本信息轉(zhuǎn)換成對(duì)應(yīng)的語(yǔ)音信息;
合成所述語(yǔ)音信息,并通過(guò)所述應(yīng)用于語(yǔ)音合成設(shè)備發(fā)送語(yǔ)音信息。
優(yōu)選的,所述語(yǔ)音合成設(shè)備還包括打印接口。
優(yōu)選的,所述合成所述語(yǔ)音信息,并通過(guò)所述應(yīng)用于語(yǔ)音合成設(shè)備發(fā)送語(yǔ)音信息,包括:
所述語(yǔ)音合成設(shè)備將所述文本信息轉(zhuǎn)化為打印文本信息并輸出至所述打印接口,合成所述語(yǔ)音信息,并通過(guò)所述應(yīng)用于語(yǔ)音合成設(shè)備發(fā)送語(yǔ)音信息。
優(yōu)選的,所述合成所述語(yǔ)音信息,并通過(guò)所述應(yīng)用于語(yǔ)音合成設(shè)備發(fā)送語(yǔ)音信息,包括:
根據(jù)gmm-hmm語(yǔ)音轉(zhuǎn)化模型,合成所述語(yǔ)音信息,并通過(guò)所述應(yīng)用于語(yǔ)音合成設(shè)備發(fā)送語(yǔ)音信息。
優(yōu)選的,所述gmm-hmm語(yǔ)音轉(zhuǎn)化模型為hmm語(yǔ)音合成模型。
與現(xiàn)有技術(shù)相比,本發(fā)明的有益效果在于:
本發(fā)明提高了一種語(yǔ)音合成方法,應(yīng)用于語(yǔ)音合成設(shè)備,所述方法包括步驟:讀取待合成的文本信息,并發(fā)送與所述待合成的文本信息對(duì)應(yīng)的語(yǔ)音轉(zhuǎn)化指令;讀取所述文本信息中的所有字符,并根據(jù)所述字符確定對(duì)應(yīng)的詞匯;根據(jù)所述詞匯,將所述文本信息轉(zhuǎn)換成對(duì)應(yīng)的語(yǔ)音信息;合成所述語(yǔ)音信息,并通過(guò)所述應(yīng)用于語(yǔ)音合成設(shè)備發(fā)送語(yǔ)音信息。本發(fā)明的語(yǔ)音合成裝置均可以生成進(jìn)行語(yǔ)音合成工作的執(zhí)行文件,還可而已通過(guò)打印接口將接收到的文本信息打印出來(lái),便于用戶的查閱,將所述語(yǔ)音合成系統(tǒng)加入移動(dòng)終端中,從而來(lái)語(yǔ)音輸出移動(dòng)終端所接收的文本信息,因而提高了移動(dòng)終端的用戶使用體驗(yàn)。
附圖說(shuō)明
為了更清楚地說(shuō)明本發(fā)明或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對(duì)本發(fā)明或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡(jiǎn)單地介紹,顯而易見(jiàn)地,下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來(lái)講,在不付出創(chuàng)造性勞動(dòng)的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
圖1本發(fā)明提供的語(yǔ)音合成方法的第一種流程示意圖。
圖2本發(fā)明提供的語(yǔ)音合成方法的第二種流程示意圖。
圖3本發(fā)明提供的語(yǔ)音合成方法的第三種流程示意圖。
具體實(shí)施方式
下面將結(jié)合本發(fā)明中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例。基于本發(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒(méi)有做出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
下面通過(guò)具體實(shí)施例,對(duì)本發(fā)明進(jìn)行詳細(xì)的說(shuō)明。
參見(jiàn)圖1,圖1為語(yǔ)音合成方法的流程示意圖,所述方法包括步驟:
s101,讀取待合成的文本信息,并發(fā)送與所述待合成的文本信息對(duì)應(yīng)的語(yǔ)音轉(zhuǎn)化指令;
s102,讀取所述文本信息中的所有字符,并根據(jù)所述字符確定對(duì)應(yīng)的詞匯;
s103,根據(jù)所述詞匯,將所述文本信息轉(zhuǎn)換成對(duì)應(yīng)的語(yǔ)音信息;
s104,合成所述語(yǔ)音信息,并通過(guò)所述應(yīng)用于語(yǔ)音合成設(shè)備發(fā)送語(yǔ)音信息。
進(jìn)一步的,參見(jiàn)圖2,在所述讀取待合成的文本信息,并發(fā)送與所述待合成的文本信息對(duì)應(yīng)的語(yǔ)音轉(zhuǎn)化指令之前,所述方法還包括:
s105,接收語(yǔ)音信息對(duì)應(yīng)的語(yǔ)音合成執(zhí)行指令,并生成所述語(yǔ)音信息對(duì)應(yīng)的執(zhí)行文件;
所述s101,可以為s101a;根據(jù)所述執(zhí)行文件以及所讀取待合成的文本信息,并發(fā)送與所述待合成的文本信息對(duì)應(yīng)的語(yǔ)音轉(zhuǎn)化指令。
可選的,參見(jiàn)圖3,所述語(yǔ)音合成設(shè)備還包括打印接口,所述s104具體還可以為s104a:
s104a,所述語(yǔ)音合成設(shè)備將所述文本信息轉(zhuǎn)化為打印文本信息并輸出至所述打印接口,合成所述語(yǔ)音信息,并通過(guò)所述應(yīng)用于語(yǔ)音合成設(shè)備發(fā)送語(yǔ)音信息。
所述文件生成模塊生成用于執(zhí)行語(yǔ)音合成的執(zhí)行文件,并將所述執(zhí)行文件燒錄至所述通信模塊。所述通信模塊依據(jù)所述執(zhí)行文件生成文本解析子模塊和語(yǔ)音合成子模塊。
具體的,所述合成所述語(yǔ)音信息,并通過(guò)所述應(yīng)用于語(yǔ)音合成設(shè)備發(fā)送語(yǔ)音信息,包括:根據(jù)gmm-hmm語(yǔ)音轉(zhuǎn)化模型,合成所述語(yǔ)音信息,并通過(guò)所述應(yīng)用于語(yǔ)音合成設(shè)備發(fā)送語(yǔ)音信息,所述gmm-hmm語(yǔ)音轉(zhuǎn)化模型為hmm語(yǔ)音合成模型。
文本接口從外部設(shè)備讀入文本信息,并發(fā)送至所述文本解析子模塊,所述文本解析子模塊將文本信息中的所有詞匯分別轉(zhuǎn)化為語(yǔ)音信息。所述語(yǔ)音合成子模塊將所述語(yǔ)音信息合成為音頻信息。所述音頻接口將所述音頻信息發(fā)送至外部設(shè)備。
本實(shí)施例的語(yǔ)音合成系統(tǒng)通過(guò)與移動(dòng)終端的結(jié)合,從而來(lái)語(yǔ)音輸出移動(dòng)終端所接收的文本信息,因而提高了移動(dòng)終端的用戶使用體驗(yàn)。
本實(shí)施例的語(yǔ)音合成系統(tǒng)中還包括一打印接口,其中本實(shí)施例的通信模塊將所述文本接口接收的文本信息轉(zhuǎn)化為打印文本信息,并通過(guò)所述打印接口輸出至外部打印設(shè)備或系統(tǒng)中。
本實(shí)施例的語(yǔ)音合成系統(tǒng)的工作流程包括以下步驟:所述文件生成模塊生成用于執(zhí)行語(yǔ)音合成的執(zhí)行文件,并將所述執(zhí)行文件燒錄至所述通信模塊。所述通信模塊依據(jù)所述執(zhí)行文件生成文本解析子模塊和語(yǔ)音合成子模塊。文本接口從外部設(shè)備讀入文本信息,并發(fā)送至所述文本解析子模塊。所述通信模塊將所述文本信息轉(zhuǎn)化為打印文本信息并通過(guò)所述打印接口輸出至外部打印設(shè)備或打印系統(tǒng)中。所述文本解析子模塊將文本信息中的所有詞匯分別轉(zhuǎn)化為語(yǔ)音信息。所述語(yǔ)音合成子模塊將所述語(yǔ)音信息合成為音頻信息。所述音頻接口將所述音頻信息發(fā)送至外部設(shè)備。本實(shí)施例的語(yǔ)音合成系統(tǒng)通過(guò)通信模塊和打印接口將接收到的文本信息打印出來(lái),便于用戶的查閱。
需要說(shuō)明的是,在本文中,諸如第一和第二等之類的關(guān)系術(shù)語(yǔ)僅僅用來(lái)將一個(gè)實(shí)體或者操作與另一個(gè)實(shí)體或操作區(qū)分開(kāi)來(lái),而不一定要求或者暗示這些實(shí)體或操作之間存在任何這種實(shí)際的關(guān)系或者順序。而且,術(shù)語(yǔ)“包括”、“包含”或者其任何其他變體意在涵蓋非排他性的包含,從而使得包括一系列要素的過(guò)程、方法、物品或者設(shè)備不僅包括那些要素,而且還包括沒(méi)有明確列出的其他要素,或者是還包括為這種過(guò)程、方法、物品或者設(shè)備所固有的要素。在沒(méi)有更多限制的情況下,由語(yǔ)句“包括一個(gè)……”限定的要素,并不排除在包括所述要素的過(guò)程、方法、物品或者設(shè)備中還存在另外的相同要素。
本說(shuō)明書(shū)中的各個(gè)實(shí)施例均采用相關(guān)的方式描述,各個(gè)實(shí)施例之間相同相似的部分互相參見(jiàn)即可,每個(gè)實(shí)施例重點(diǎn)說(shuō)明的都是與其他實(shí)施例的不同之處。
以上所述僅為本發(fā)明的較佳實(shí)施例而已,并非用于限定本發(fā)明的保護(hù)范圍。凡在本發(fā)明的精神和原則之內(nèi)所作的任何修改、等同替換、改進(jìn)等,均包含在本發(fā)明的保護(hù)范圍內(nèi)。