国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      語音合成方法和裝置的制造方法_4

      文檔序號:9598796閱讀:來源:國知局
      83將上述聲學(xué)模型列表發(fā)送給終端設(shè)備,以供上述終端設(shè)備下載并保存使用上述終端設(shè)備的用戶從上述聲學(xué)模型列表中選擇的音色對應(yīng)的聲學(xué)模型,并通過保存的聲學(xué)模型進(jìn)行語音合成,從而可以使得語音合成在不同計(jì)算能力的終端設(shè)備上,都有很好地表現(xiàn),在計(jì)算能力較差的設(shè)備上,可以流暢地進(jìn)行語音合成,不影響用戶接收語音中所包含的信息;在計(jì)算能力較好的設(shè)備上,可以合成出更加自然的語音,改善用戶的人機(jī)交互體驗(yàn)。
      [0081]需要說明的是,在本發(fā)明的描述中,術(shù)語“第一”、“第二”等僅用于描述目的,而不能理解為指示或暗示相對重要性。此外,在本發(fā)明的描述中,除非另有說明,“多個(gè)”的含義是兩個(gè)或兩個(gè)以上。
      [0082]流程圖中或在此以其他方式描述的任何過程或方法描述可以被理解為,表示包括一個(gè)或更多個(gè)用于實(shí)現(xiàn)特定邏輯功能或過程的步驟的可執(zhí)行指令的代碼的模塊、片段或部分,并且本發(fā)明的優(yōu)選實(shí)施方式的范圍包括另外的實(shí)現(xiàn),其中可以不按所示出或討論的順序,包括根據(jù)所涉及的功能按基本同時(shí)的方式或按相反的順序,來執(zhí)行功能,這應(yīng)被本發(fā)明的實(shí)施例所屬技術(shù)領(lǐng)域的技術(shù)人員所理解。
      [0083]應(yīng)當(dāng)理解,本發(fā)明的各部分可以用硬件、軟件、固件或它們的組合來實(shí)現(xiàn)。在上述實(shí)施方式中,多個(gè)步驟或方法可以用存儲在存儲器中且由合適的指令執(zhí)行系統(tǒng)執(zhí)行的軟件或固件來實(shí)現(xiàn)。例如,如果用硬件來實(shí)現(xiàn),和在另一實(shí)施方式中一樣,可用本領(lǐng)域公知的下列技術(shù)中的任一項(xiàng)或他們的組合來實(shí)現(xiàn):具有用于對數(shù)據(jù)信號實(shí)現(xiàn)邏輯功能的邏輯門電路的離散邏輯電路,具有合適的組合邏輯門電路的專用集成電路,可編程門陣列(Programmable Gate Array ;以下簡稱:PGA),現(xiàn)場可編程門陣列(Field ProgrammableGate Array ;以下簡稱:FPGA)等。
      [0084]本技術(shù)領(lǐng)域的普通技術(shù)人員可以理解實(shí)現(xiàn)上述實(shí)施例方法攜帶的全部或部分步驟是可以通過程序來指令相關(guān)的硬件完成,所述的程序可以存儲于一種計(jì)算機(jī)可讀存儲介質(zhì)中,該程序在執(zhí)行時(shí),包括方法實(shí)施例的步驟之一或其組合。
      [0085]此外,本發(fā)明各個(gè)實(shí)施例中的各功能模塊可以集成在一個(gè)處理模塊中,也可以是各個(gè)模塊單獨(dú)物理存在,也可以兩個(gè)或兩個(gè)以上模塊集成在一個(gè)模塊中。上述集成的模塊既可以采用硬件的形式實(shí)現(xiàn),也可以采用軟件功能模塊的形式實(shí)現(xiàn)。所述集成的模塊如果以軟件功能模塊的形式實(shí)現(xiàn)并作為獨(dú)立的產(chǎn)品銷售或使用時(shí),也可以存儲在一個(gè)計(jì)算機(jī)可讀取存儲介質(zhì)中。
      [0086]上述提到的存儲介質(zhì)可以是只讀存儲器,磁盤或光盤等。
      [0087]在本說明書的描述中,參考術(shù)語“一個(gè)實(shí)施例”、“一些實(shí)施例”、“示例”、“具體示例”、或“一些示例”等的描述意指結(jié)合該實(shí)施例或示例描述的具體特征、結(jié)構(gòu)、材料或者特點(diǎn)包含于本發(fā)明的至少一個(gè)實(shí)施例或示例中。在本說明書中,對上述術(shù)語的示意性表述不一定指的是相同的實(shí)施例或示例。而且,描述的具體特征、結(jié)構(gòu)、材料或者特點(diǎn)可以在任何的一個(gè)或多個(gè)實(shí)施例或示例中以合適的方式結(jié)合。
      [0088]盡管上面已經(jīng)示出和描述了本發(fā)明的實(shí)施例,可以理解的是,上述實(shí)施例是示例性的,不能理解為對本發(fā)明的限制,本領(lǐng)域的普通技術(shù)人員在本發(fā)明的范圍內(nèi)可以對上述實(shí)施例進(jìn)行變化、修改、替換和變型。
      【主權(quán)項(xiàng)】
      1.一種語音合成方法,其特征在于,包括: 向服務(wù)器發(fā)送數(shù)據(jù)文件查詢請求,所述數(shù)據(jù)文件查詢請求攜帶終端設(shè)備的計(jì)算能力數(shù)據(jù); 接收所述服務(wù)器發(fā)送的適合所述終端設(shè)備的計(jì)算能力的聲學(xué)模型列表,所述聲學(xué)模型列表中包括至少一個(gè)音色對應(yīng)的聲學(xué)模型; 將所述聲學(xué)模型列表顯示給使用所述終端設(shè)備的用戶,以供所述用戶從所述聲學(xué)模型列表中選擇音色對應(yīng)的聲學(xué)模型; 下載并保存所述用戶選擇的音色對應(yīng)的聲學(xué)模型; 通過保存的聲學(xué)模型進(jìn)行語音合成。2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述向服務(wù)器發(fā)送數(shù)據(jù)文件查詢請求之前,還包括: 當(dāng)所述用戶首次使用所述終端設(shè)備上安裝的應(yīng)用的語音合成功能時(shí),向所述用戶提示是否下載聲學(xué)模型; 接收到所述用戶確定下載聲學(xué)模型的指示之后,執(zhí)行所述向服務(wù)器發(fā)送數(shù)據(jù)文件查詢請求的步驟。3.一種語音合成方法,其特征在于,包括: 接收終端設(shè)備發(fā)送的數(shù)據(jù)文件查詢請求,所述數(shù)據(jù)文件查詢請求攜帶所述終端設(shè)備的計(jì)算能力數(shù)據(jù); 根據(jù)所述終端設(shè)備的計(jì)算能力數(shù)據(jù)確定適合所述終端設(shè)備的計(jì)算能力的聲學(xué)模型列表,所述聲學(xué)模型列表中包括至少兩個(gè)音色對應(yīng)的聲學(xué)模型; 將所述聲學(xué)模型列表發(fā)送給所述終端設(shè)備,以供所述終端設(shè)備下載并保存使用所述終端設(shè)備的用戶從所述聲學(xué)模型列表中選擇的音色對應(yīng)的聲學(xué)模型,并通過保存的聲學(xué)模型進(jìn)行語音合成。4.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述接收終端設(shè)備發(fā)送的數(shù)據(jù)文件查詢請求之前,還包括: 利用語音數(shù)據(jù)和所述語音數(shù)據(jù)對應(yīng)的文本標(biāo)注數(shù)據(jù)進(jìn)行訓(xùn)練,獲得至少兩種具有不同復(fù)雜度的聲學(xué)模型。5.一種語音合成裝置,其特征在于,包括: 發(fā)送模塊,用于向服務(wù)器發(fā)送數(shù)據(jù)文件查詢請求,所述數(shù)據(jù)文件查詢請求攜帶終端設(shè)備的計(jì)算能力數(shù)據(jù); 接收模塊,用于接收所述服務(wù)器發(fā)送的適合所述終端設(shè)備的計(jì)算能力的聲學(xué)模型列表,所述聲學(xué)模型列表中包括至少一個(gè)音色對應(yīng)的聲學(xué)模型; 顯示模塊,用于將所述接收模塊接收的聲學(xué)模型列表顯示給使用所述終端設(shè)備的用戶,以供所述用戶從所述聲學(xué)模型列表中選擇音色對應(yīng)的聲學(xué)模型; 下載模塊,用于下載所述用戶選擇的音色對應(yīng)的聲學(xué)模型; 保存模塊,用于保存所述下載模塊下載的聲學(xué)模型; 語音合成模塊,用于通過所述保存模塊保存的聲學(xué)模型進(jìn)行語音合成。6.根據(jù)權(quán)利要求5所述的裝置,其特征在于,還包括:提示模塊; 所述提示模塊,用于在所述發(fā)送模塊向服務(wù)器發(fā)送數(shù)據(jù)文件查詢請求之前,當(dāng)所述用戶首次使用所述終端設(shè)備上安裝的應(yīng)用的語音合成功能時(shí),向所述用戶提示是否下載聲學(xué)豐旲型; 所述發(fā)送模塊,具體用于在所述接收模塊接收到所述用戶確定下載聲學(xué)模型的指示之后,執(zhí)行所述向服務(wù)器發(fā)送數(shù)據(jù)文件查詢請求的步驟。7.一種語音合成裝置,其特征在于,包括: 接收模塊,用于接收終端設(shè)備發(fā)送的數(shù)據(jù)文件查詢請求,所述數(shù)據(jù)文件查詢請求攜帶所述終端設(shè)備的計(jì)算能力數(shù)據(jù); 確定模塊,用于根據(jù)所述終端設(shè)備的計(jì)算能力數(shù)據(jù)確定適合所述終端設(shè)備的計(jì)算能力的聲學(xué)模型列表,所述聲學(xué)模型列表中包括至少兩個(gè)音色對應(yīng)的聲學(xué)模型; 發(fā)送模塊,用于將所述確定模塊確定的聲學(xué)模型列表發(fā)送給所述終端設(shè)備,以供所述終端設(shè)備下載并保存使用所述終端設(shè)備的用戶從所述聲學(xué)模型列表中選擇的音色對應(yīng)的聲學(xué)模型,并通過保存的聲學(xué)模型進(jìn)行語音合成。8.根據(jù)權(quán)利要求7所述的裝置,其特征在于,還包括:獲得模塊; 所述獲得模塊,用于在所述接收模塊接收終端設(shè)備發(fā)送的數(shù)據(jù)文件查詢請求之前,利用語音數(shù)據(jù)和所述語音數(shù)據(jù)對應(yīng)的文本標(biāo)注數(shù)據(jù)進(jìn)行訓(xùn)練,獲得至少兩種具有不同復(fù)雜度的聲學(xué)模型。
      【專利摘要】本發(fā)明提出一種語音合成方法和裝置,該語音合成方法包括:向服務(wù)器發(fā)送數(shù)據(jù)文件查詢請求;接收所述服務(wù)器發(fā)送的適合所述終端設(shè)備的計(jì)算能力的聲學(xué)模型列表,所述聲學(xué)模型列表中包括至少一個(gè)音色對應(yīng)的聲學(xué)模型;將所述聲學(xué)模型列表顯示給使用所述終端設(shè)備的用戶,以供所述用戶從所述聲學(xué)模型列表中選擇音色對應(yīng)的聲學(xué)模型;下載并保存所述用戶選擇的音色對應(yīng)的聲學(xué)模型;通過保存的聲學(xué)模型進(jìn)行語音合成。本發(fā)明可以使得語音合成在不同計(jì)算能力的終端設(shè)備上,都有很好地表現(xiàn),在計(jì)算能力較差的設(shè)備上,可以流暢地進(jìn)行語音合成,不影響用戶接收語音中所包含的信息;在計(jì)算能力較好的設(shè)備上,可以合成出更加自然的語音,改善用戶的人機(jī)交互體驗(yàn)。
      【IPC分類】G10L13/047
      【公開號】CN105355194
      【申請?zhí)枴緾N201510690575
      【發(fā)明人】李秀林, 唐海員, 李維高, 白潔
      【申請人】百度在線網(wǎng)絡(luò)技術(shù)(北京)有限公司
      【公開日】2016年2月24日
      【申請日】2015年10月22日
      當(dāng)前第4頁1 2 3 4 
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
      1