專利名稱:一種語音合成插件的實現(xiàn)方法
技術領域:
本發(fā)明屬于語音合成技術領域,特別是一種語音合成插件的實現(xiàn)方法。
背景技術:
目前,語音合成技術已經(jīng)獲得了廣泛應用,特 別是在網(wǎng)絡設備上的應用尤其廣泛。 現(xiàn)在網(wǎng)絡電視發(fā)展迅速,然而基于電視瀏覽器的語音合成技術卻發(fā)展緩慢?;陔娨暈g覽器的語音合成技術發(fā)展緩慢的主要原因是網(wǎng)絡電視采用通常的 NPAPI (網(wǎng)景插入式應用程序編程接口)標準插件的形式進行語音合成插件的開發(fā),要實現(xiàn)的接口很多,開發(fā)過程較繁瑣。因此,有必要提供一種語音合成插件的實現(xiàn)方法,能夠簡化網(wǎng)絡電視的語音合成插件的開發(fā)過程。
發(fā)明內(nèi)容
本發(fā)明的目的在于提供一種語音合成插件的實現(xiàn)方法,旨在解決現(xiàn)有技術中進行語音合成插件的開發(fā),要實現(xiàn)的接口很多,開發(fā)過程較繁瑣的問題。本發(fā)明是這樣實現(xiàn)的,一種語音合成插件的實現(xiàn)方法,該方法包括步驟S100,發(fā)送語音合成請求;步驟S200,利用電視端的Http Server檢測并解析語音合成請求;步驟 S300,利用合成引擎將文字信息進行語音合成并緩存,并利用語音播放器播放合成的語音。該語音合成插件的實現(xiàn)方法中,步驟SlOO具體包括如下步驟步驟S101,用戶點擊語音合成頁面的播放控制按鈕;步驟S102,JS處理語音合成頁面的按鍵操作,將請求的播放狀態(tài)和所要播放的文字發(fā)送給http server.,其中,步驟SlOl中,語音合成頁面的每個播放控制按鈕表示一個播放狀態(tài),且用戶在點擊播放控制按鈕時,已經(jīng)有需要進行語音播放的文字;步驟S102中,Java scrip處理用戶在語音合成頁面上的按鍵操作,并通過GET 或POST方式將請求的播放狀態(tài)和所要播放的文字發(fā)送給電視端的http server.,該語音合成插件的實現(xiàn)方法的步驟S200中,電視端的http server檢測是否有請求到來,如果位于電視端的http server檢測到語音合成頁面發(fā)出的語音合成請求,則解析此請求,并獲取請求的內(nèi)容。此外,步驟S200中,http server以GET方式或POST方式解析http包頭,解析出的內(nèi)容包括播放狀態(tài)以及要播放的文字內(nèi)容。該語音合成插件的實現(xiàn)方法,步驟S300具體包括步驟S301,Http Server傳入播放狀態(tài)和待語音合成的文字;步驟S302,合成引擎獲取到待合成的文字以及播放狀態(tài); 步驟S303,合成引擎判斷播放狀態(tài)是否為播放;如果否,則轉(zhuǎn)步驟S304,等待播放狀態(tài)的到來;如果是,則轉(zhuǎn)步驟S305,合成引擎進行合成,并輸出合成后的語音流寫入一個buf緩沖區(qū)內(nèi),并記錄下寫入緩沖區(qū)中的位置writ印os ;在上述步驟S302至步驟305,合成引擎獲取到待合成的文字以及播放狀態(tài)并進行語音流合成的同時,語音播放器執(zhí)行以下步驟步驟S306,播放器獲取播放狀態(tài);如果播放器獲取的播放狀態(tài)為是,則執(zhí)行步驟S307 ;否則等待播放狀態(tài)來臨;步驟S307,判斷buf緩沖區(qū)是否為空;如果為空,則執(zhí)行步驟S308,如果不為空,則執(zhí)行步驟S309 ;步驟S308,播放器等待合成引擎輸出語音流;步驟S309,播放器從buf緩沖區(qū)中讀入數(shù)據(jù),記錄讀buf緩沖區(qū)的位置readpos,并開始播放;在播放時,需要進行步驟S310,判斷writepos是否大于readpos ;如果是,則進行步驟S311,否則進行步驟 S312 ;步驟S311,合成引擎繼續(xù)合成語音流,播放器繼續(xù)播放合成的語音流;步驟S312,播放器停止播放,等待合成引擎輸出語音流。其中,步驟S305中的buf緩沖區(qū)是環(huán)形的緩沖區(qū)。
本發(fā)明通過電視端的Http Server接收并解析語音合成界面的播放狀態(tài)以及待播放的文字內(nèi)容,利用合成引擎合成語音流,利用播放器播放語音,無需編寫標準NPAPI插件中的大量接口,簡化網(wǎng)絡電視的語音合成插件的開發(fā)過程。
圖1是本發(fā)明語音合成插件實現(xiàn)方法的流程圖;圖2是實現(xiàn)圖1中步驟SlOO的流程圖;圖3是實現(xiàn)圖1中步驟S300的流程圖。
具體實施例方式為了使本發(fā)明的目的、技術方案及優(yōu)點更加清楚明白,以下結(jié)合附圖及實施例,對本發(fā)明進行進一步詳細說明。應當理解,此處所描述的具體實施例僅僅用以解釋本發(fā)明,并不用于限定本發(fā)明。請參閱圖1,是本發(fā)明語音合成插件實現(xiàn)方法的流程圖。該語音合成插件的合成方法包括如下步驟步驟S100,發(fā)送語音合成請求;該步驟SlOO的流程圖如圖2所示,該步驟具體包括步驟S101,用戶點擊語音合成頁面的播放控制按鈕;網(wǎng)絡電視的瀏覽器啟動之后,用戶進入語音合成頁面,并點擊頁面上的播放控制按鈕,每個播放控制按鈕表示一個播放狀態(tài),如播放,暫停,停止,繼續(xù),另外,用戶在點擊播放控制按鈕時,已經(jīng)默認有需要進行語音播放的文字;步驟S102,JS處理按鍵操作,將請求的播放狀態(tài)和所要播放的文字發(fā)送給http server ;Java scrip處理用戶在語音合成頁面上的按鍵操作,并通過GET或POST方式將請求的播放狀態(tài)和所要播放的文字發(fā)送給http server ;通常,Http Server設置在電視端;接下來進行步驟S200,利用電視端的Http Server檢測并解析語音合成請求;位于電視端的http server 一直檢測是否有請求到來,如果位于電視端的http server檢測到語音合成頁面發(fā)出的語音合成請求,則解析此請求,并獲取請求的內(nèi)容,具體來說,http server檢測到網(wǎng)頁頁面操作請求之后,解析http包頭,如果前端網(wǎng)頁的請求方式是GET方式,http server就會以GET方式對包頭進行解析;如果前端網(wǎng)頁的請求方式是 POST方式,http server就以POST方式解析,并發(fā)送解析出來的內(nèi)容,解析出的內(nèi)容包括 播放狀態(tài)以及要播放的文字內(nèi)容。Http server解析出播放狀態(tài)以及待播放的文字內(nèi)容后,將播放狀態(tài)和待播放的文字內(nèi)容寫入一個共享內(nèi)存中,直至處理完語音合成請求后,將共享內(nèi)存中的待播放文字傳送至合成引擎,將播放狀態(tài)傳送至合成弓I擎和語音播放器。然后,執(zhí)行步驟S300,利用合成引擎將文字信息進行語音合成并緩存,并利用語音播放器播放合成的語音;步驟S300的流程圖如圖3所示,執(zhí)行步驟S300的具體流程如下步驟S301,Http Server傳入播放狀態(tài)和待語音合成的文字;步驟S302,合成引擎獲取到待合成的文字以及播放狀態(tài);步驟S303,合成引擎判斷播放狀態(tài)是否為播放;如果否,則轉(zhuǎn)步驟S304,等待播放狀態(tài)的到來;如果是,則轉(zhuǎn)步驟S305,合成引擎進行合成,并輸出合成后的語音流寫入一個buf 緩沖區(qū)內(nèi),并記錄下寫入緩沖區(qū)中的位置writ印os ;該緩沖區(qū)是環(huán)形的緩沖區(qū);在上述步驟S302至步驟305,合成引擎獲取到待合成的文字以及播放狀態(tài)并進行語音流合成的同時,播放器執(zhí)行以下步驟步驟S306,播放器獲取播放狀態(tài);如果播放器獲取的播放狀態(tài)為是,則執(zhí)行步驟 S307 ;否則等待播放狀態(tài)來臨(圖未示);步驟S307,判斷buf緩沖區(qū)是否為空;如果為空,則執(zhí)行步驟S308,如果不為空,則執(zhí)行步驟S309 ;步驟S308,播放器等待合成引擎輸出語音流;步驟S309,播放器從buf緩沖區(qū)中讀入數(shù)據(jù),記錄讀buf緩沖區(qū)的位置readpos, 并開始播放;在播放時,需要進行步驟S310,判斷writepos是否大于readpos ;如果是,則進行步驟S311,否則進行步驟S312 ;步驟S311,合成引擎繼續(xù)合成語音流,播放器繼續(xù)播放合成的語音流;步驟S312,播放器停止播放,等待合成引擎輸出語音流。本發(fā)明通過電視端的Http Server接收并解析語音合成界面的播放狀態(tài)以及待播放的文字內(nèi)容,利用合成引擎合成語音流,利用播放器播放語音流,無需編寫標準NPAPI插件中的大量接口,簡化網(wǎng)絡電視的語音合 成插件的開發(fā)過程。此外,本發(fā)明中播放器播放過程中,buf緩沖區(qū)中readpos不能超過writ印os,這樣確保讀的速度不超過寫的速度,從而保證播放語音流的正確性。以上所述僅為本發(fā)明的較佳實施例而已,并不用以限制本發(fā)明,凡在本發(fā)明的精神和原則之內(nèi)所作的任何修改、等同替換和改進等,均應包含在本發(fā)明的保護范圍之內(nèi)。
權利要求
1.一種語音合成插件的實現(xiàn)方法,該方法包括 步驟S100,發(fā)送語音合成請求;步驟S200,利用電視端的Http Server檢測并解析語音合成請求; 步驟S300,利用合成引擎將文字信息進行語音合成并緩存,并利用語音播放器播放合成的語音。
2.根據(jù)權利要求1所述的語音合成插件的實現(xiàn)方法,其特征在于,該步驟SlOO具體包括如下步驟步驟S101,用戶點擊語音合成頁面的播放控制按鈕;步驟S102,Java Scrip(JS)處理語音合成頁面的按鍵操作,將請求的播放狀態(tài)和所要播放的文字發(fā)送給http server.
3.根據(jù)權利要求2所述的語音合成插件的實現(xiàn)方法,其特征在于,步驟SlOl中,語音合成頁面的每個播放控制按鈕表示一個播放狀態(tài),且用戶在點擊播放控制按鈕時,已經(jīng)有需要進行語音播放的文字。
4.根據(jù)權利要求2所述的語音合成插件的實現(xiàn)方法,其特征在于,步驟S102中,Java Scrip處理用戶在語音合成頁面上的按鍵操作,并通過GET或POST方式將請求的播放狀態(tài)和所要播放的文字發(fā)送給電視端的http server.
5.根據(jù)權利要求1所述的語音合成插件的實現(xiàn)方法,其特征在于,步驟S200中,電視端的http server檢測是否有請求到來,如果位于電視端的http server檢測到語音合成頁面發(fā)出的語音合成請求,則解析此請求,并獲取請求的內(nèi)容。
6.根據(jù)權利要求5所述的語音合成插件的實現(xiàn)方法,其特征在于,步驟S200中,http server以GET方式或POST方式解析http包頭,解析出的內(nèi)容包括播放狀態(tài)以及要播放的文字內(nèi)容。
7.根據(jù)權利要求1所述的語音合成插件的實現(xiàn)方法,其特征在于,步驟S300具體包括步驟S301,Http Server傳入播放狀態(tài)和待語音合成的文字; 步驟S302,合成引擎獲取到待合成的文字以及播放狀態(tài);步驟S303,合成引擎判斷播放狀態(tài)是否為播放,如果否,則轉(zhuǎn)步驟S304,如果是,則轉(zhuǎn)步驟S305 ;步驟S304,等待播放狀態(tài)的到來;步驟S305,合成引擎進行合成,并輸出合成后的語音流寫入一個緩沖區(qū)內(nèi),并記錄下寫入緩沖區(qū)中的位置writ印os ;在上述步驟S302至步驟305,合成引擎獲取到待合成的文字以及播放狀態(tài)并進行語音流合成的同時,語音播放器執(zhí)行以下步驟步驟S306,播放器獲取播放狀態(tài);如果播放器獲取的播放狀態(tài)為是,則執(zhí)行步驟S307 ; 否則等待播放狀態(tài)來臨;步驟S307,判斷緩沖區(qū)是否為空;如果為空,則執(zhí)行步驟S308,如果不為空,則執(zhí)行步驟 S309 ;步驟S308,播放器等待合成引擎輸出語音流;步驟S309,播放器從緩沖區(qū)中讀入數(shù)據(jù),記錄讀緩沖區(qū)的位置readpos,并開始播放;在播放時,需要進行步驟S310,判斷writepos是否大于readpos ;如果是,則進行步驟 S311,否則進行步驟S312 ;步驟S311,合成引擎繼續(xù)合成語音流,播放器繼續(xù)播放合成的語音流; 步驟S312,播放器停止播放,等待合成引擎輸出語音流。
8.根據(jù)權利要求7所述的語音合成插件的實現(xiàn)方法,其特征在于,步驟S305中的緩沖區(qū)是環(huán)形的緩沖區(qū)。
全文摘要
本發(fā)明屬于語音合成技術領域,提供一種語音合成插件的實現(xiàn)方法。該方法包括步驟S100,發(fā)送語音合成請求;步驟S200,利用電視端的Http Server檢測并解析語音合成請求;步驟S300,利用合成引擎將文字信息進行語音合成并緩存,并利用語音播放器播放合成的語音。本發(fā)明通過利用電視端的Http Server檢測并解析語音合成請求,利用合成引擎合成語音流,利用播放器播放語音,無需編寫標準NPAPI插件中的大量接口,簡化網(wǎng)絡電視的語音合成插件的開發(fā)過程。
文檔編號H04L29/08GK102169689SQ20111007406
公開日2011年8月31日 申請日期2011年3月25日 優(yōu)先權日2011年3月25日
發(fā)明者胡佳文, 費流波, 陳澄 申請人:深圳Tcl新技術有限公司