構(gòu)建語音特征庫的方法、語音合成方法、裝置及設(shè)備的制造方法_2

文檔序號：9371978閱讀：來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>樂器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)>構(gòu)建語音特征庫的方法、語音合成方法、裝置及設(shè)備的制造方法

等我失去的時候才追悔莫及人世間最痛苦的事莫過于此”。從這段文本信息中，可以截取出“曾經(jīng)有一份真摯的愛情放在我面前”，“曾經(jīng)有一份真摯的愛情”，“放在我面前”，“我沒有珍惜”，“等我失去的時候才追悔莫及”，“追悔莫及”，“人世間最痛苦的事莫過于此”，“人世間最痛苦的事”，“莫過于此”等等。
[0046]步驟110、分析得到每條個性化的文本信息對應(yīng)的至少一個語境和相同語義的至少一條文本信息。
[0047]其中，分析的具體方式有多種，例如可以通過大數(shù)據(jù)技術(shù)分析語境和語義。
[0048]其中，一條個性化的文本信息可能對應(yīng)一個語境，也可能對應(yīng)多個語境。
[0049]其中，一條個性化的文本信息對應(yīng)一個語義，但該語義有多種表達(dá)方式，也就對應(yīng)多個文本信息。例如，個性化的文本信息是“我沒有珍惜”，與其相同語義的其他文本信息可以是“我不珍惜”，“我沒能珍惜”，“偶沒有珍惜”等等。
[0050]步驟120、在上述對象的語音特征庫中關(guān)聯(lián)保存每條個性化的文本信息及對應(yīng)的文語特征，每條文語特征指示對應(yīng)的一個語境和一條文本信息。
[0051]例如，對“我沒有珍惜”這條個性化的文本信息分析得到有兩個語境:陳述，后悔?！拔覜]有珍惜”這條個性化的文本信息分析得到有相同語義的三條文本信息我不珍惜”，“我沒能珍惜”，“偶沒有珍惜”。那么，“我沒有珍惜”這條個性化的文本信息對應(yīng)有8條文語特征，其中包括指示“我沒有珍惜”這一個性化的文本信息的文語特征。
[0052]本發(fā)明中，文語特征的內(nèi)容可以是其指示的語境和文本信息，也可以是其指示的語境和文本信息的標(biāo)識信息，還可以是其指示的語境和文本信息存儲位置的指針，等等。
[0053]步驟130、對上述錄音進(jìn)行音頻采樣，得到音頻采樣值。
[0054]其中，具體是對上述錄音進(jìn)行元音、輔音、音調(diào)等反映語音習(xí)慣特點(diǎn)的音頻信息進(jìn)行米樣。
[0055]其中，可以針對上述錄音的每條個性化的文本信息，分別得到一組對應(yīng)的音頻采樣值。
[0056]步驟140、在上述對象的語音特征庫中保存音頻特征，音頻特征指示了音頻采樣值。
[0057]本發(fā)明中，音頻特征的內(nèi)容可以是其指示的音頻采樣值，也可以是其指示的音頻采樣值的標(biāo)識信息，還可以是其指示的音頻采樣值存儲位置的指針，等等。
[0058]由于本發(fā)明推薦候選推薦項(xiàng)目時要考慮用戶的場景信息和用戶信息構(gòu)建語音特征庫時，針對每條個性化的文本信息，確定至少一個語境和與該條個性化的文本信息相同語義的至少一條文本信息。在后續(xù)進(jìn)行語音合成時，即使提供的文本信息并非所需的個性化語音對應(yīng)的個性化文本信息，也可以在語音特征庫中首先查找到與需要進(jìn)行語音合成的文本信息語義相同的個性化的文本信息，進(jìn)而實(shí)現(xiàn)個性化的語音合成，從而使得個性化語音的使用不依賴于人的生老病死。
[0059]上述本發(fā)明實(shí)施例中，為了便于語音特征庫的管理與查找，還可以保存有語音特征，每條個性化的文本信息對應(yīng)的語音特征指示一條文語特征和一條音頻特征。相應(yīng)的，還在上述語音特征庫中保存每條個性化的文本信息對應(yīng)的語音特征，每條語音特征指示一條文語特征和一條音頻特征。
[0060]例如，“我沒有珍惜”這條個性化的文本信息對應(yīng)有如上所述的8條文語特征，并且對應(yīng)有一個音頻特征，那么，在對象的語音特征庫中保存有這條個性化的文本信息對應(yīng)的8條語音特征，每個語音特征指示這條個性化的文本信息對應(yīng)的一條文語特征及其對應(yīng)的音頻特征。
[0061]基于上述任意方法實(shí)施例，其中每條文語特征還指示對應(yīng)的語境和文本信息在本條文語特征中的權(quán)重。
[0062]例如，“我沒有珍惜”這條個性化的文本信息對應(yīng)的一條文語特征指示的語境是“陳述”，指示的文本信息是“我沒有珍惜”，這條文本特征還指示了“陳述”這一語境和“我沒有珍惜”這一文本信息分別在這條文語特征中的權(quán)重。
[0063]本發(fā)明中，初始權(quán)重的取值可以是預(yù)設(shè)的，例如，在生成一條文語特征時，為其指示的語境和文本特征設(shè)置權(quán)重分別為0.5。
[0064]在此基礎(chǔ)上，上述步驟120的具體實(shí)現(xiàn)方式可以是:
[0065]生成每條個性化的文本信息對應(yīng)的文語特征，并確定每條文語特征指示的語境和文本信息在本條文語特征中的權(quán)重；
[0066]如果在上述對象的語音特征庫中已經(jīng)保存的文語特征指示的語境和文本信息與分析得到的語境和文本信息相同，但在文語特征中的權(quán)重不同，將權(quán)重按照預(yù)定規(guī)則合并。
[0067]例如，生成的一條文語特征指示的語境是“陳述”，其權(quán)重是0.5，文本信息是“我沒有珍惜”，其權(quán)重是0.5。上述對象的語音特征庫中保存有一條文語特征指示的語境是“陳述”，其權(quán)重是0.4，文本信息是“我沒有珍惜”，其權(quán)重是0.6，那么，按照預(yù)定規(guī)則(例如求平均值)合并權(quán)重后保存，即將保存的該條文語特征指示的語境的權(quán)重修改為0.45，文本信息的權(quán)重修改為0.55。
[0068]如果語音特征庫中保存的文語特征中沒有與生成的文語特征指示的語境和文本信息均相同的，則將生成的文語特征直接保存到語音特征庫中。
[0069]基于上述任意方法實(shí)施例，其中，上述步驟140的具體實(shí)現(xiàn)方式可以是:如果在上述對象的語音特征庫中已經(jīng)保存的音頻特征指示的音頻采樣值與音頻采樣得到的音頻采樣值的差值在預(yù)定范圍內(nèi)，將音頻采樣值合并。
[0070]例如，“我沒有珍惜”這一個性化的文本信息對應(yīng)的音頻采樣值與語音特征庫中保存的一組音頻特征值的差值在預(yù)定范圍內(nèi)，則將這兩組音頻特征值按照預(yù)定規(guī)則合并(例如取均值)后替換掉原來保存的這組音頻特征值。
[0071]如果在上述對象的語音特征庫中沒有保存的音頻特征指示的音頻采樣值與音頻采樣得到的音頻采樣值的差值在預(yù)定范圍內(nèi)，直接將采樣得到的音頻采樣值保存的語音特征庫中。
[0072]基于與上述方法相同的發(fā)明構(gòu)思，本發(fā)明的實(shí)施例還提供一種構(gòu)建語音特征庫的
目.ο
[0073]圖2是根據(jù)本發(fā)明的另一個實(shí)施例的構(gòu)建語音特征庫的裝置的示意圖，下簡稱構(gòu)建裝置。
[0074]如圖2所示，構(gòu)建裝置包括:用于將對象的錄音轉(zhuǎn)換為個性化的文本信息的裝置(下文簡稱為“文本信息轉(zhuǎn)換裝置”)201 ;用于分析得到每條個性化的文本信息對應(yīng)的至少一個語境和相同語義的至少一條文本信息的裝置(下文簡稱為“文本信息分析裝置”)202 ;用于在所述對象的語音特征庫中關(guān)聯(lián)保存每條個性化的文本信息及對應(yīng)的文語特征的裝置(下文簡稱為“文語特征保存裝置”)203 ;用于對所述錄音進(jìn)行音頻采樣，得到音頻采樣值的裝置(下文簡稱“音頻采樣裝置”)204 ;被配置為在所述對象的語音特征庫中保存音頻特征的裝置(下文簡稱“音頻特征保存裝置”)205，音頻特征指示了音頻采樣值。
[0075]由于本發(fā)明推薦候選推薦項(xiàng)目時要考慮用戶的場景信息和用戶信息構(gòu)建語音特征庫時，針對每條個性化的文本信息，確定至少一個語境和與該條個性化的文本信息相同語義的至少一條文本信息。在后續(xù)進(jìn)行語音合成時，即使提供的文本信息并非所需的個性化語音對應(yīng)的個性化文本信息，也可以在語音特征庫中首先查找到與需要進(jìn)行語音合成的文本信息語義相同的個性化的文

完整全部詳細(xì)技術(shù)資料下載

當(dāng)前第2頁1 2 3 4

相關(guān)技術(shù)