国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      語音合成方法和裝置的制造方法

      文檔序號:9275419閱讀:674來源:國知局
      語音合成方法和裝置的制造方法
      【技術領域】
      [0001]本發(fā)明涉及語音處理技術領域,尤其涉及一種語音合成方法和裝置。
      【背景技術】
      [0002]語音合成技術根據服務的提供方式可劃分為基于云端引擎的語音合成(以下簡稱:“在線語音合成”)和基于本地引擎的語音合成(以下簡稱:“離線語音合成”)兩種,這兩種語音合成技術具有各自的優(yōu)點和缺點。在線語音合成具有高自然度、高實時性和不占用客戶端設備資源等優(yōu)點,但是其缺點也非常明顯,由于使用語音合成的應用(Applicat1n ;以下簡稱:App)可以一次性發(fā)送大段文本到服務器端,但是服務器端合成的語音數據是分段發(fā)回給安裝上述App的客戶端的,而語音的數據量即使經過壓縮也相對較大(例如:4kb/s),如果網絡環(huán)境的不穩(wěn)定性,在線語音合成將變得非常緩慢而無法實現連貫的合成;離線語音合成則可以脫離對網絡的依賴,能夠保證合成服務的穩(wěn)定性,但是合成的效果相比在線合成較差。
      [0003]綜上所述,現有技術中使用到語音合成技術的產品都是基于單獨的在線語音合成或者單獨的離線語音合成,在線語音合成對數據流量消耗較大,遇到網絡錯誤只能提示用戶發(fā)生錯誤,而離線語音合成的效果不是特別自然,用戶體驗較差。

      【發(fā)明內容】

      [0004]本發(fā)明的目的旨在至少在一定程度上解決相關技術中的技術問題之一。
      [0005]為此,本發(fā)明的第一個目的在于提出一種語音合成方法。該方法結合在線語音合成與離線語音合成的優(yōu)點,可以提供更穩(wěn)定、效果更自然的語音合成服務,保證了用戶的語音合成請求總是可以順利地完成,提高了用戶對語音合成服務的認可度和用戶體驗度。
      [0006]本發(fā)明的第二個目的在于提出一種語音合成裝置。
      [0007]為了實現上述目的,本發(fā)明第一方面實施例的語音合成方法,包括:對文本進行處理,獲得待合成文本;當存在網絡連接時,將所述待合成文本發(fā)送給在線語音合成系統進行語音合成;如果在所述在線語音合成系統進行語音合成的過程中,所述在線語音合成系統出現故障或者實際使用過程中網絡連接中斷,則將所述在線語音合成系統未完成語音合成的文本發(fā)送給離線語音合成系統進行語音合成。
      [0008]本發(fā)明實施例的語音合成方法中,當存在網絡連接時,將上述待合成文本發(fā)送給在線語音合成系統進行語音合成,如果在上述在線語音合成系統進行語音合成的過程中,在線語音合成系統出現故障或者實際使用過程中網絡連接中斷,則將在線語音合成系統未完成語音合成的文本發(fā)送給離線語音合成系統進行語音合成,從而可以結合在線語音合成與離線語音合成的優(yōu)點,提供更穩(wěn)定、效果更自然的語音合成服務,保證了用戶的語音合成請求總是可以順利地完成,提高了用戶對語音合成服務的認可度和用戶體驗度。
      [0009]為了實現上述目的,本發(fā)明第二方面實施例的語音合成裝置,包括:文本處理模塊,用于對文本進行處理,獲得待合成文本;發(fā)送模塊,用于在存在網絡連接時,將所述文本處理模塊獲得的待合成文本發(fā)送給在線語音合成系統進行語音合成;如果在所述在線語音合成系統進行語音合成的過程中,所述在線語音合成系統出現故障或者實際使用過程中網絡連接中斷,則將所述在線語音合成系統未完成語音合成的文本發(fā)送給離線語音合成系統進行語音合成。
      [0010]本發(fā)明實施例的語音合成裝置中,當存在網絡連接時,發(fā)送模塊將上述待合成文本發(fā)送給在線語音合成系統進行語音合成,如果在上述在線語音合成系統進行語音合成的過程中,在線語音合成系統出現故障或者實際使用過程中網絡連接中斷,則將在線語音合成系統未完成語音合成的文本發(fā)送給離線語音合成系統進行語音合成,從而可以結合在線語音合成與離線語音合成的優(yōu)點,提供更穩(wěn)定、效果更自然的語音合成服務,保證了用戶的語音合成請求總是可以順利地完成,提高了用戶對語音合成服務的認可度和用戶體驗度。
      [0011]本發(fā)明附加的方面和優(yōu)點將在下面的描述中部分給出,部分將從下面的描述中變得明顯,或通過本發(fā)明的實踐了解到。
      【附圖說明】
      [0012]本發(fā)明上述的和/或附加的方面和優(yōu)點從下面結合附圖對實施例的描述中將變得明顯和容易理解,其中:
      [0013]圖1為本發(fā)明語音合成方法一個實施例的流程圖;
      [0014]圖2為本發(fā)明語音合成方法另一個實施例的流程圖;
      [0015]圖3為本發(fā)明語音合成方法再一個實施例的流程圖;
      [0016]圖4為本發(fā)明語音合成方法再一個實施例的流程圖;
      [0017]圖5為本發(fā)明語音合成裝置一個實施例的結構示意圖;
      [0018]圖6為本發(fā)明語音合成裝置另一個實施例的結構示意圖。
      【具體實施方式】
      [0019]下面詳細描述本發(fā)明的實施例,所述實施例的示例在附圖中示出,其中自始至終相同或類似的標號表示相同或類似的元件或具有相同或類似功能的元件。下面通過參考附圖描述的實施例是示例性的,僅用于解釋本發(fā)明,而不能理解為對本發(fā)明的限制。相反,本發(fā)明的實施例包括落入所附加權利要求書的精神和內涵范圍內的所有變化、修改和等同物。
      [0020]圖1為本發(fā)明語音合成方法一個實施例的流程圖,如圖1所示,該語音合成方法可以包括:
      [0021]步驟101,對文本進行處理,獲得待合成文本。
      [0022]具體地,對文本進行處理可以為:對文本進行斷句分詞、詞性標注、數字符號處理、標注拼音和韻律停頓預測處理。
      [0023]以“前方400米有闖紅燈拍照”為例,首先經過斷句分詞、詞性標注和數字符號處理得到序列“前方/f四百/m米/q有/V闖紅燈/V拍照/V”,其中斜杠后的部分為詞性的縮寫,標注拼音時會根據詞性進行多音字分析;然后再標注拼音得到序列“qian2 fangl si4bai2 mi3 you3 chuang3 hong2 dengl pail zhao4” ;最后一步對韻律停頓進行預測,處理后的序列為“前方四百米$有闖紅燈拍照$”,其中空格代表短停頓,$符號代表長停頓。
      [0024]步驟102,當存在網絡連接時,將上述待合成文本發(fā)送給在線語音合成系統進行語音合成。
      [0025]本實施例中,當存在網絡連接時,客戶端會將上述待合成文本發(fā)送給在線語音合成系統進行語音合成,在線語音合成系統采用波形拼接的合成方法,將錄制好的聲音片段按照一定的規(guī)則拼接成句子,這種合成方法具有聲音質量好、聽感自然和更接近真人發(fā)音的優(yōu)點,為了滿足聲音質量好、聽感自然和更接近真人發(fā)音的優(yōu)點的效果,通常云端的音庫模型都非常龐大(通常會達到數個G),無法直接應用在本地。
      [0026]步驟103,如果在上述在線語音合成系統進行語音合成的過程中,在線語音合成系統出現故障或者實際使用過程中網絡連接中斷,則將在線語音合成系統未完成語音合成的文本發(fā)送給離線語音合成系統進行語音合成。
      [0027]本實施例中,如果在上述在線語音合成系統進行語音合成的過程中,在線語音合成系統出現故障或者實際使用過程中網絡連接中斷,則客戶端將在線語音合成系統未完成語音合成的文本發(fā)送給離線語音合成系統進行語音合成,離線語音合成系統通常采用參數合成方法,需要預先從音庫中提取出聲學參數,然后利用聲學參數和聲碼器重建聲音,使用這種辦法可以將需要存儲的音庫數據大小減小到M字節(jié)的量級,使得離線語音合成能夠在手機等移動設備上使用,但是由于聲學參數并不是真實聲音,離線語音合成系統合成出來的聲音自然度和音質不如在線語音合成系統。
      [0028]進一步地,在語音合成完
      當前第1頁1 2 3 4 
      網友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會獲得點贊!
      1