一種基于中文語音信息訓練英文語音模型的方法與設(shè)備的制作方法

文檔序號：2825441閱讀：237來源：國知局

一種基于中文語音信息訓練英文語音模型的方法與設(shè)備的制作方法
【專利摘要】本發(fā)明的目的是提供一種用于基于中文語音信息訓練英文語音模型的方法與設(shè)備；獲取用戶通過語音采集裝置輸入的語音數(shù)據(jù)；判斷該語音數(shù)據(jù)是否為英文語音數(shù)據(jù)；當該語音數(shù)據(jù)為英文語音數(shù)據(jù)，根據(jù)中文語音信息，對該英文語音數(shù)據(jù)進行語音識別處理，以獲得與該英文語音數(shù)據(jù)相對應(yīng)的發(fā)音信息；根據(jù)該發(fā)音信息，確定該英文語音數(shù)據(jù)所對應(yīng)的英文數(shù)據(jù)，以建立或更新英文語音模型。與現(xiàn)有技術(shù)相比，本發(fā)明在原有中文聲學模型基礎(chǔ)上，利用相似的中文語音信息，對英文語音數(shù)據(jù)進行語音識別處理，以獲得與該英文語音數(shù)據(jù)相對應(yīng)的發(fā)音信息，實現(xiàn)對英文語音模型的建立或更新，有效地控制了英文語音模型的規(guī)模。
【專利說明】一種基于中文語音信息訓練英文語音模型的方法與設(shè)備
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及自然語言處理【技術(shù)領(lǐng)域】，尤其涉及一種用于基于中文語音信息訓練英文語音模型的技術(shù)。
【背景技術(shù)】
[0002]現(xiàn)有的訓練英文語音模型的方式一般利用現(xiàn)有的英語語音數(shù)據(jù)庫，包括語音數(shù)據(jù)及其標注，在發(fā)音單元集合中加入英文發(fā)音單元，利用英語數(shù)據(jù)進行訓練?，F(xiàn)有技術(shù)的問題在于，采用該種方式訓練英文語音模型需要一定規(guī)模的英語語音數(shù)據(jù)，且難以對加入模型中的英語詞的規(guī)模進行控制。
[0003]因此，如何克服上述困難，在控制規(guī)模的同時，實現(xiàn)對英文語音模型的訓練，成為本領(lǐng)域技術(shù)人員亟需解決的問題之一。

【發(fā)明內(nèi)容】

[0004]本發(fā)明的目的是提供一種用于基于中文語音信息訓練英文語音模型的方法與設(shè)備。
[0005]根據(jù)本發(fā)明的一個方面，提供了一種用于基于中文語音信息訓練英文語音模型的方法，其中，該方法包括以下步驟:
[0006]a獲取用戶通過語音采集裝置輸入的語音數(shù)據(jù)；
[0007]b判斷所述語音數(shù)據(jù)是否為英文語音數(shù)據(jù)；
[0008]c當所述語音數(shù)據(jù)為英文語音數(shù)據(jù)，根據(jù)中文語音信息，對所述英文語音數(shù)據(jù)進行語音識別處理，以獲得與所述英文語音數(shù)據(jù)相對應(yīng)的發(fā)音信息；
[0009]d根據(jù)所述發(fā)音信息，確定所述英文語音數(shù)據(jù)所對應(yīng)的英文數(shù)據(jù)，以建立或更新英文語音模型，其中，所述發(fā)音信息與所述英文數(shù)據(jù)通過所述中文語音信息相映射。
[0010]根據(jù)本發(fā)明的另一方面，還提供了一種用于基于中文語音信息訓練英文語音模型的模型訓練設(shè)備，其中，該設(shè)備包括:
[0011]語音獲取裝置，用于獲取用戶通過語音采集裝置輸入的語音數(shù)據(jù)；
[0012]英文判斷裝置，用于判斷所述語音數(shù)據(jù)是否為英文語音數(shù)據(jù)；
[0013]語音識別裝置，用于當所述語音數(shù)據(jù)為英文語音數(shù)據(jù)，根據(jù)中文語音信息，對所述英文語音數(shù)據(jù)進行語音識別處理，以獲得與所述英文語音數(shù)據(jù)相對應(yīng)的發(fā)音信息；
[0014]模型訓練裝置，用于根據(jù)所述發(fā)音信息，確定所述英文語音數(shù)據(jù)所對應(yīng)的英文數(shù)據(jù)，以建立或更新英文語音模型，其中，所述發(fā)音信息與所述英文數(shù)據(jù)通過所述中文語音信息相映射。
[0015]與現(xiàn)有技術(shù)相比，本發(fā)明在原有中文聲學模型基礎(chǔ)上，利用相似的中文語音信息，對英文語音數(shù)據(jù)進行語音識別處理，以獲得與該英文語音數(shù)據(jù)相對應(yīng)的發(fā)音信息，實現(xiàn)對英文語音模型的建立或更新，有效地控制了英文語音模型的規(guī)模；進一步地，本發(fā)明還可與語音識別相結(jié)合，支持用戶以按字母及按單詞兩種方式輸入英文語音序列，提升了用戶的使用體驗。
【專利附圖】

【附圖說明】
[0016]通過閱讀參照以下附圖所作的對非限制性實施例所作的詳細描述，本發(fā)明的其它特征、目的和優(yōu)點將會變得更明顯:
[0017]圖1示出根據(jù)本發(fā)明一個方面的用于基于中文語音信息訓練英文語音模型的設(shè)備不意圖；
[0018]圖2示出根據(jù)本發(fā)明一個優(yōu)選實施例的用于基于中文語音信息訓練英文語音模型的設(shè)備示意圖；
[0019]圖3示出根據(jù)本發(fā)明另一個方面的用于基于中文語音信息訓練英文語音模型的方法流程圖；
[0020]圖4示出根據(jù)本發(fā)明一個優(yōu)選實施例的用于基于中文語音信息訓練英文語音模型的方法流程圖。
[0021 ] 附圖中相同或相似的附圖標記代表相同或相似的部件。
【具體實施方式】
[0022]下面結(jié)合附圖對本發(fā)明作進一步詳細描述。
[0023]圖1示出根據(jù)本發(fā)明一個方面的用于基于中文語音信息訓練英文語音模型的設(shè)備示意圖。模型訓練設(shè)備1包括語音獲取裝置101、英文判斷裝置102、語音識別裝置103和模型訓練裝置104。
[0024]其中，語音獲取裝置101獲取用戶通過語音采集裝置輸入的語音數(shù)據(jù)。具體地，用戶或大量用戶通過與語音采集裝置的交互，輸入了語音數(shù)據(jù)，語音獲取裝置101通過調(diào)用該語音采集裝置所提供的應(yīng)用程序接口(API)，獲取該用戶或大量用戶輸入的語音數(shù)據(jù)；或者，用戶或大量用戶通過與語音采集裝置的交互，輸入了語音數(shù)據(jù)，并將該語音數(shù)據(jù)存入語音數(shù)據(jù)庫中，語音獲取裝置101通過調(diào)用該語音數(shù)據(jù)庫所提供的應(yīng)用程序接口(API)，從該語音數(shù)據(jù)庫中獲取用戶或大量用戶輸入的語音數(shù)據(jù)。
[0025]本領(lǐng)域技術(shù)人員應(yīng)能理解上述獲取語音數(shù)據(jù)的方式僅為舉例，其他現(xiàn)有的或今后可能出現(xiàn)的獲取語音數(shù)據(jù)的方式如可適用于本發(fā)明，也應(yīng)包含在本發(fā)明保護范圍以內(nèi)，并在此以引用方式包含于此。
[0026]英文判斷裝置102判斷所述語音數(shù)據(jù)是否為英文語音數(shù)據(jù)。具體地，英文判斷裝置102根據(jù)語音獲取裝置101所獲取的用戶通過語音采集裝置輸入的語音數(shù)據(jù)，例如通過聲學模型匹配等方式，判斷該語音數(shù)據(jù)是否為英文語音數(shù)據(jù)。
[0027]本領(lǐng)域技術(shù)人員應(yīng)能理解上述判斷英文語音數(shù)據(jù)的方式僅為舉例，其他現(xiàn)有的或今后可能出現(xiàn)的判斷英文語音數(shù)據(jù)的方式如可適用于本發(fā)明，也應(yīng)包含在本發(fā)明保護范圍以內(nèi)，并在此以引用方式包含于此。
[0028]語音識別裝置103當所述語音數(shù)據(jù)為英文語音數(shù)據(jù)，根據(jù)中文語音信息，對所述英文語音數(shù)據(jù)進行語音識別處理，以獲得與所述英文語音數(shù)據(jù)相對應(yīng)的發(fā)音信息。具體地，當英文判斷裝置102判斷該語音數(shù)據(jù)為英文語音數(shù)據(jù)，語音識別裝置103根據(jù)中文語音信息，如中文聲韻母信息，對該英文語音數(shù)據(jù)進行語音識別處理，例如，當英文判斷裝置判斷該語音數(shù)據(jù)為英文語音數(shù)據(jù)時，語音識別裝置103采用所有可能的中文聲韻母信息去識別該英文語音數(shù)據(jù)，以確定該英文語音數(shù)據(jù)的發(fā)音信息。
[0029]例如，用戶通過與語音采集裝置的交互，輸入了語音數(shù)據(jù)單詞“iphone”，語音獲取裝置101通過調(diào)用該語音采集裝置所提供的應(yīng)用程序接口(API)，獲取了該語音數(shù)據(jù)“iphone”；隨后，英文判斷裝置102采用聲學模型匹配的方式，判斷該語音數(shù)據(jù)為英文語音數(shù)據(jù)；隨后，語音識別裝置103采用所有可能的中文聲韻母信息，對該英文語音數(shù)據(jù)“iphone”進行強制對齊，確定該英文語音數(shù)據(jù)“iphone”的發(fā)音信息為“aa ai4 f engl”。在此，aa、ai4、f、engl等即為中文聲韻母信息，其中的數(shù)字表示該韻母信息所對應(yīng)的聲調(diào)。本領(lǐng)域技術(shù)人員應(yīng)能理解，在此，中文聲韻母信息及聲調(diào)的表示僅為示例，而不應(yīng)對本發(fā)明產(chǎn)生任何限制。
[0030]優(yōu)選地，語音識別裝置103還可以根據(jù)單詞模型所對應(yīng)的中文語音信息、或字母模型所對應(yīng)的中文語音信息，對該英文語音數(shù)據(jù)進行語音識別處理，以獲得與該英文語音數(shù)據(jù)相對應(yīng)的單詞發(fā)音信息、或字母發(fā)音信息。例如，對于“iphone”，若用戶輸入語音采集裝置的為按單詞讀的“iphone”，則語音識別裝置103確定其對應(yīng)的采用中文語音信息表示的發(fā)音信息為“aa ai4 f engl” ;若用戶輸入語音采集裝置的為按字母讀的“iphone”，即，“1、p、h、ο、n、e”，則語音識別裝置103確定其對應(yīng)的采用中文語音信息表示的發(fā)音信息為“aa ai4 p i4ei2 ch oo oul ee enl ii i4，，。
[0031]本領(lǐng)域技術(shù)人員應(yīng)能理解上述識別發(fā)音信息的方式僅為舉例，其他現(xiàn)有的或今后可能出現(xiàn)的識別發(fā)音信息的方式如可適用于本發(fā)明，也應(yīng)包含在本發(fā)明保護范圍以內(nèi)，并在此以引用方式包含于此。
[0032]模型訓練裝置104根據(jù)所述發(fā)音信息，確定所述英文語音數(shù)據(jù)所對應(yīng)的英文數(shù)據(jù)，以建立或更新英文語音模型，其中，所述發(fā)音信息與所述英文數(shù)據(jù)通過所述中文語音信息相映射。具體地，模型訓練裝置104根據(jù)該語音識別裝置103所識別獲得的發(fā)音信息，確定該英文語音數(shù)據(jù)所對應(yīng)的英文數(shù)據(jù)，如根據(jù)發(fā)音信息“aa ai4 f engl”，確定該發(fā)音信息對應(yīng)的英文數(shù)據(jù)為“iphone”，再將該發(fā)音信息與該英文數(shù)據(jù)的映射關(guān)系存入英文語音模型，以實現(xiàn)對該英文語音模型的建立或更新，其中，該發(fā)音信息與該英文數(shù)據(jù)通過該中文語音信息相映射。
[0033]在此，英文數(shù)據(jù)為一具體的英文單詞，如“iphone”等，而英文語音數(shù)據(jù)為該具體的英文單詞所對應(yīng)的語音數(shù)據(jù)，如“iphone”所對應(yīng)的語音數(shù)據(jù)，通過語音獲取裝置101所獲取。
[0034]本領(lǐng)域技術(shù)人員應(yīng)能理解上述建立或更新英文語音模型的方式僅為舉例，其他現(xiàn)有的或今后可能出現(xiàn)的建立或更新英文語音模型的方式如可適用于本發(fā)明，也應(yīng)包含在本發(fā)明保護范圍以內(nèi)，并在此以引用方式包含于此。
[0035]在此，本發(fā)明在原有中文聲學模型基礎(chǔ)上，利用相似的中文語音信息，對英文語音數(shù)據(jù)進行語音識別處理，以獲得與該英文語音數(shù)據(jù)相對應(yīng)的發(fā)音信息，實現(xiàn)對英文語音模型的建立或更新，有效地控制了英文語音模型的規(guī)模。
[0036]優(yōu)選地，模型訓練設(shè)備1的各個裝置之間是持續(xù)不斷工作的。具體地，語音獲取裝置101獲取用戶通過語音采集裝置輸入的語音數(shù)據(jù)；英文判斷裝置102判斷所述語音數(shù)據(jù)是否為英文語音數(shù)據(jù)；語音識別裝置103當所述語音數(shù)據(jù)為英文語音數(shù)據(jù)，根據(jù)中文語音信息，對所述英文語音數(shù)據(jù)進行語音識別處理，以獲得與所述英文語音數(shù)據(jù)相對應(yīng)的發(fā)音信息；模型訓練裝置104根據(jù)所述發(fā)音信息，確定所述英文語音數(shù)據(jù)所對應(yīng)的英文數(shù)據(jù)，以建立或更新英文語音模型，其中，所述發(fā)音信息與所述英文數(shù)據(jù)通過所述中文語音信息相映射。在此，本領(lǐng)域技術(shù)人員應(yīng)理解“持續(xù)”是指模型訓練設(shè)備1的各裝置分別不斷地進行語音數(shù)據(jù)的獲取、英文語音數(shù)據(jù)的判斷、英文語音數(shù)據(jù)的識別處理及英文語音模型的建立或更新，直至該模型訓練設(shè)備1在較長時間內(nèi)停止獲取語音數(shù)據(jù)。
[0037]優(yōu)選地，語音識別裝置103當所述語音數(shù)據(jù)為英文語音數(shù)據(jù)，根據(jù)單詞模型所對應(yīng)的中文語音信息，對所述英文語音數(shù)據(jù)進行語音識別處理，以獲得與所述英文語音數(shù)據(jù)相對應(yīng)的單詞發(fā)音信息。具體地，當該英文判斷裝置102判斷語音獲取裝置101所獲取的語音數(shù)據(jù)為英文語音數(shù)據(jù)，語音識別裝置103采用單詞模型所對應(yīng)的中文語音信息，如“aaai4 f engl”等，對所述英文語音數(shù)據(jù)進行語音識別處理，如強制對齊處理，采用所有可能的中文聲韻母信息，對該英文語音數(shù)據(jù)進行強制對齊，以獲得與所述英文語音數(shù)據(jù)相對應(yīng)的單詞發(fā)音信息。
[0038]在此，該單詞模型中存儲有大量單詞所對應(yīng)的中文語音信息，該單詞模型可以位于模型訓練設(shè)備1中，或者位于與該模型訓練設(shè)備1通過網(wǎng)絡(luò)相連接的第三方設(shè)備中。
[0039]優(yōu)選地，語音識別裝置103當所述語音數(shù)據(jù)為英文語音數(shù)據(jù)，根據(jù)字母模型所對應(yīng)的中文語音信息，對所述英文語音數(shù)據(jù)進行語音識別處理，以獲得與所述英文語音數(shù)據(jù)相對應(yīng)的字母發(fā)音信息。具體地，當該英文判斷裝置102判斷語音獲取裝置101所獲取的語音數(shù)據(jù)為英文語音數(shù)據(jù)，語音識別裝置103根據(jù)字母模型所對應(yīng)的中文語音信息，如二十六個英文字母所對應(yīng)的中文語音信息，如字母“a”對應(yīng)的中文語音信息“aa eil”、字母“b”對應(yīng)的中文語音信息“b i4”、字母“c”對應(yīng)的中文語音信息“s ei4”等，對該英文語音數(shù)據(jù)進行語音識別處理，以獲得與該英文語音數(shù)據(jù)相對應(yīng)的字母發(fā)音信息。
[0040]優(yōu)選地，語音識別裝置103對于英文判斷裝置102判斷為英文語音數(shù)據(jù)為語音數(shù)據(jù)，優(yōu)先采用單詞模型所對應(yīng)的中文語音信息，對該英文語音數(shù)據(jù)進行語音識別處理，當該語音識別裝置103采用單詞模型無法識別出該英文語音數(shù)據(jù)的發(fā)音信息時，再采用字母模型所對應(yīng)的中文語音信息，對該英文語音數(shù)據(jù)進行語音識別處理，以獲得與該英文語音數(shù)據(jù)相對應(yīng)的字母發(fā)音信息。相似地，該語音識別裝置103也可以優(yōu)先采用字母模型所對應(yīng)的中文語音信息，對該英文語音數(shù)據(jù)進行語音識別處理，當該語音識別裝置103采用字母模型無法識別出該英文語音數(shù)據(jù)的發(fā)音信息時，再采用單詞模型所對應(yīng)的中文語音信息，對該英文語音數(shù)據(jù)進行語音識別處理，以獲得與該英文語音數(shù)據(jù)相對應(yīng)的單詞發(fā)音信息。在此，優(yōu)先采用單詞模型還是優(yōu)先采用字母模型所對應(yīng)的中文語音信息，對該英文語音數(shù)據(jù)進行語音識別處理，可以是該模型訓練設(shè)備1預(yù)先設(shè)定的，也可以應(yīng)事件而進行調(diào)整。
[0041]例如，對于語音獲取裝置101所獲取的語音數(shù)據(jù)“iphone”，英文判斷裝置102判斷該語音數(shù)據(jù)“iphone”為英文語音數(shù)據(jù)，語音識別裝置103優(yōu)先采用單詞模型所對應(yīng)的中文語音信息，對該英文語音數(shù)據(jù)進行語音識別處理，但無法識別出該英文語音數(shù)據(jù)的發(fā)音信息；隨后，該語音獲取裝置101再采用字母模型所對應(yīng)的中文語音信息，對該英文語音數(shù)據(jù)進行語音識別處理，獲得與該英文語音數(shù)據(jù)相對應(yīng)的字母發(fā)音信息“aa ai4 p i4 ei2ch oo oul ee enl ii i4”，則可知該語音獲取裝置101所獲取的語音數(shù)據(jù)為按字母讀的“iphone”，即，“1、p、h、ο、η、e”。[0042]更優(yōu)選地，語音識別裝置103分別采用單詞模型所對應(yīng)的中文語音信息、字母模型所對應(yīng)的中文語音信息，對該英文語音數(shù)據(jù)進行語音識別處理，并分別對語音識別處理所獲得的結(jié)果進行打分，確定打分較高的發(fā)音信息為該英文語音數(shù)據(jù)的發(fā)音信息。
[0043]在此，由于用戶在輸入英文單詞時有時按單詞讀有時按字母讀，本發(fā)明對每個需要識別的英文單詞，利用相似的單詞模型對應(yīng)的中文語音信息、字母模型對應(yīng)的中文語音信息，確定其對應(yīng)的發(fā)音信息，提升了語音識別的準確性。
[0044]在一優(yōu)選實施例中，該模型訓練設(shè)備1還包括模型更新裝置(未示出)。該模型更新裝置統(tǒng)計所述英文數(shù)據(jù)所對應(yīng)的英文語音數(shù)據(jù)在所述語音數(shù)據(jù)中的出現(xiàn)次數(shù)；根據(jù)所述出現(xiàn)次數(shù)，并結(jié)合所述語音數(shù)據(jù)的數(shù)量信息，確定所述英文數(shù)據(jù)的概率值；根據(jù)所述概率值，更新所述英文語音模型。具體地，當大量用戶通過語音采集裝置輸入語音數(shù)據(jù)，其中，多個用戶所輸入的英文語音數(shù)據(jù)為相同的英文語音數(shù)據(jù)，語音獲取裝置101獲取該大量用戶輸入的大量語音數(shù)據(jù)；英文判斷裝置102判斷該大量語音數(shù)據(jù)為英文語音數(shù)據(jù)；隨后，語音識別裝置103根據(jù)中文語音信息，對該大量英文語音數(shù)據(jù)進行語音識別處理，以獲得與該大量英文語音數(shù)據(jù)相對應(yīng)的發(fā)音信息，在此，由于該多個用戶輸入的為相同的英文語音數(shù)據(jù)，因此，該語音識別裝置103所獲得的關(guān)于該多個用戶輸入的英文語音數(shù)據(jù)所對應(yīng)的發(fā)音信息相同或相似；接著，模型訓練裝置104根據(jù)該多個相同或相似的發(fā)音信息，確定該多個英文語音數(shù)據(jù)所對應(yīng)的相同的英文數(shù)據(jù)；模型更新裝置統(tǒng)計該相同的英文數(shù)據(jù)所對應(yīng)的英文語音數(shù)據(jù)在該語音數(shù)據(jù)中的出現(xiàn)次數(shù)；接著，該模型更新裝置再根據(jù)該英文語音數(shù)據(jù)的出現(xiàn)次數(shù)，并結(jié)合該語音數(shù)據(jù)的數(shù)量信息，確定該英文數(shù)據(jù)的概率值，如將該出現(xiàn)次數(shù)除以該大量語音數(shù)據(jù)的數(shù)量信息，獲得該英文數(shù)據(jù)的概率值；該模型更新裝置再將該英文數(shù)據(jù)及其對應(yīng)的概率值存入該英文語音模型中，以實現(xiàn)對該英文語音模型的更新。
[0045]優(yōu)選地，該模型訓練設(shè)備1還包括數(shù)據(jù)提取裝置(未示出)和單元訓練裝置(未示出)。該數(shù)據(jù)提取裝置當所述出現(xiàn)次數(shù)大于預(yù)定數(shù)量閾值，自所述英文語音模型中提取所述英文數(shù)據(jù)與所述英文語音數(shù)據(jù)；該單元訓練裝置根據(jù)所述英文數(shù)據(jù)與所述英文語音數(shù)據(jù)的映射關(guān)系，建立或更新與所述英文語音數(shù)據(jù)相對應(yīng)的英文語音單元。具體地，該模型訓練設(shè)備1可以設(shè)置一個預(yù)定數(shù)量閾值，該預(yù)定數(shù)量閾值用來判斷英文數(shù)據(jù)所對應(yīng)的英文語音數(shù)據(jù)在該語音數(shù)據(jù)中的出現(xiàn)次數(shù)是否超過該值，當該出現(xiàn)次數(shù)大于該預(yù)定數(shù)量閾值時，數(shù)據(jù)提取裝置自該英文語音模型中提取該英文數(shù)據(jù)與該英文語音數(shù)據(jù)；該單元訓練裝置根據(jù)該英文數(shù)據(jù)與該英文語音數(shù)據(jù)的映射關(guān)系，為該英文語音數(shù)據(jù)新建一個英文語音單元，以實現(xiàn)對該英文語音單元的建立或更新。
[0046]更優(yōu)選地，該單元訓練裝置根據(jù)所述英文數(shù)據(jù)與所述英文語音數(shù)據(jù)的映射關(guān)系，采用插值計算方法，建立或更新所述英文語音單元。具體地，該單元訓練裝置根據(jù)該英文數(shù)據(jù)與該英文語音數(shù)據(jù)的映射關(guān)系，為該英文數(shù)據(jù)新建一英文語音單元，再例如通過將該中文發(fā)音信息所對應(yīng)的中文語音單元的模型參數(shù)復(fù)制給該英文語音單元，然后在英文數(shù)據(jù)上對齊，得到統(tǒng)計量，再與該復(fù)制所獲得的參數(shù)進行插值計算，以實現(xiàn)對該英文語音單元的建立或更新。在此，所述中文語音單元包括為每個中文發(fā)音信息，如中文聲母或韻母信息所建立的發(fā)音單元，如“s”、“ei4”等中文聲韻母信息所對應(yīng)的中文語音單元。
[0047]更優(yōu)選地，該模型訓練設(shè)備1還包括單元更新裝置(未示出)。該單元更新裝置根據(jù)所述英文語音數(shù)據(jù)及與該英文語音數(shù)據(jù)相對應(yīng)的發(fā)音信息，更新所述英文語音單元。具體地，在單元訓練裝置為英文數(shù)據(jù)新建一英文語音單元之后，單元更新裝置不斷地根據(jù)用戶輸入的英文語音數(shù)據(jù)，及由語音識別裝置103識別所獲得的與該英文語音數(shù)據(jù)相對應(yīng)的發(fā)音信息，訓練該英文語音單元。
[0048]在此，本發(fā)明對出現(xiàn)此處大于預(yù)定閾值的英文語音數(shù)據(jù)，為該英文語音數(shù)據(jù)及英文數(shù)據(jù)新建英文語音單元，并對該英文語音單元不斷地進行訓練，以進一步提升該英文語音數(shù)據(jù)的發(fā)音信息的準確性。
[0049]圖2示出根據(jù)本發(fā)明一個優(yōu)選實施例的用于基于中文語音信息訓練英文語音模型的設(shè)備示意圖。該模型訓練設(shè)備1還包括序列獲取裝置205、序列確定裝置206和信息提供裝置207。以下參照圖2對該優(yōu)選實施例進行詳細描述:具體地，語音獲取裝置201獲取用戶通過語音采集裝置輸入的語音數(shù)據(jù)；英文判斷裝置202判斷所述語音數(shù)據(jù)是否為英文語音數(shù)據(jù)；語音識別裝置203當所述語音數(shù)據(jù)為英文語音數(shù)據(jù)，根據(jù)中文語音信息，對所述英文語音數(shù)據(jù)進行語音識別處理，以獲得與所述英文語音數(shù)據(jù)相對應(yīng)的發(fā)音信息；模型訓練裝置204根據(jù)所述發(fā)音信息，確定所述英文語音數(shù)據(jù)所對應(yīng)的英文數(shù)據(jù)，以建立或更新英文語音模型，其中，所述發(fā)音信息與所述英文數(shù)據(jù)通過所述中文語音信息相映射；序列獲取裝置205獲取所述用戶為目標應(yīng)用輸入的單詞語音序列；序列確定裝置206根據(jù)所述英文語音模型，確定與所述單詞語音序列相對應(yīng)的英文字符序列；信息提供裝置207將與所述英文字符序列相對應(yīng)的信息提供給所述用戶。其中，語音獲取裝置201、英文判斷裝置202、語音識別裝置203和模型訓練裝置204與圖1所示對應(yīng)裝置相同或相似，故此處不再贅述，并通過引用的方式包含于此。
[0050]其中，序列獲取裝置205獲取所述用戶為目標應(yīng)用輸入的單詞語音序列。具體地，用戶例如通過與用戶設(shè)備的語音采集裝置的交互，在目標應(yīng)用中輸入單詞語音序列，序列獲取裝置205例如通過調(diào)用該用戶設(shè)備所提供的應(yīng)用程序接口(API)等方式，獲取該用戶為目標應(yīng)用所輸入的單詞語音序列。
[0051]序列確定裝置206根據(jù)所述英文語音模型，確定與所述單詞語音序列相對應(yīng)的英文字符序列。具體地，序列確定裝置206根據(jù)該序列獲取裝置205所獲取的單詞語音序列，通過語音識別處理，確定該單詞語音序列的發(fā)音信息，進而，根據(jù)該發(fā)音信息，在該英文語音模型中進行匹配查詢，確定與該單詞語音序列相對應(yīng)的英文字符序列。例如，用戶通過與用戶設(shè)備的語音采集裝置的交互，輸入了單詞語音序列“iphone”，序列獲取裝置205例如通過調(diào)用該用戶設(shè)備所提供的應(yīng)用程序接口(API)等方式，獲取了該用戶輸入的單詞語音序列“iphone”；隨后，序列確定裝置206根據(jù)該單詞語音序列“iphone”，通過語音識別處理，確定該單詞語音序列的發(fā)音信息“aa ai4 f engl”，進而，根據(jù)該發(fā)音信息，在該英文語音模型中進行匹配查詢，確定與該單詞語音序列相對應(yīng)的英文字符序列“iphone”。
[0052]信息提供裝置207將與所述英文字符序列相對應(yīng)的信息提供給所述用戶。例如，當該目標應(yīng)用為語音輸入應(yīng)用，該信息提供裝置207通過調(diào)用諸如JSP、ASP或PHP等動態(tài)網(wǎng)頁技術(shù)，將該英文字符序列作為語音輸入候選詞條提供給該用戶；當該目標應(yīng)用為語音搜索應(yīng)用；該信息提供裝置207通過調(diào)用諸如JSP、ASP或PHP等動態(tài)網(wǎng)頁技術(shù)，將根據(jù)該英文字符序列搜索獲得的一個或多個搜索結(jié)果提供給該用戶。
[0053]優(yōu)選地，該目標應(yīng)用為語音輸入應(yīng)用；其中，該信息提供裝置207將所述英文字符序列作為語音輸入候選詞條提供給所述用戶。例如，當該目標應(yīng)用為語音輸入應(yīng)用，用戶通過與用戶設(shè)備的語音采集裝置的交互，在語音輸入應(yīng)用中輸入了單詞語音序列“iphone”，序列獲取裝置205例如通過調(diào)用該用戶設(shè)備所提供的應(yīng)用程序接口(API)等方式，獲取了該用戶輸入的單詞語音序列“iphone”；隨后，序列確定裝置206根據(jù)該單詞語音序列“iphone”，通過語音識別處理，確定該單詞語音序列的發(fā)音信息“aa ai4 f engl”，進而，根據(jù)該發(fā)音信息，在該英文語音模型中進行匹配查詢，確定與該單詞語音序列相對應(yīng)的英文字符序列“iphone” ;進而，信息提供裝置207通過調(diào)用諸如JSP、ASP或PHP等動態(tài)網(wǎng)頁技術(shù)，將該英文字符序列“iphone”作為語音輸入候選詞條提供給該用戶，以供該用戶選擇輸入。
[0054]優(yōu)選地，該目標應(yīng)用為語音搜索應(yīng)用；其中，該模型訓練設(shè)備1還包括搜索獲取裝置(未示出)。該搜索獲取裝置將所述英文字符序列作為所述用戶的查詢序列，獲取與所述查詢序列相對應(yīng)的一個或多個搜索結(jié)果；其中，該信息提供裝置207將所述一個或多個搜索結(jié)果提供給所述用戶。具體地，當該目標應(yīng)用為語音搜索應(yīng)用，序列確定裝置206根據(jù)該英文語音模型，確定與該單詞語音序列相對應(yīng)的英文字符序列；搜索獲取裝置根據(jù)該序列確定裝置206所確定的英文字符序列，將該英文字符序列作為該用戶的查詢序列，進行匹配查詢，獲取與該查詢序列相對應(yīng)的一個或多個搜索結(jié)果；隨后，信息提供裝置207通過調(diào)用諸如JSP、ASP或PHP等動態(tài)網(wǎng)頁技術(shù)，將該一個或多個搜索結(jié)果提供給該用戶。
[0055]例如，當該目標應(yīng)用為語音搜索應(yīng)用，用戶通過與用戶設(shè)備的語音采集裝置的交互，在語音輸入應(yīng)用中輸入了單詞語音序列“iphone”，序列獲取裝置205例如通過調(diào)用該用戶設(shè)備所提供的應(yīng)用程序接口(API)等方式，獲取了該用戶輸入的單詞語音序列“iphone”；隨后，序列確定裝置206根據(jù)該單詞語音序列“iphone”，通過語音識別處理，確定該單詞語音序列的發(fā)音信息“aa ai4 f engl”，進而，根據(jù)該發(fā)音信息，在該英文語音模型中進行匹配查詢，確定與該單詞語音序列相對應(yīng)的英文字符序列“ iphone”;進而，搜索獲取裝置根據(jù)該序列確定裝置206所確定的英文字符序列，將該英文字符序列“iphone”作為該用戶的查詢序列，進行匹配查詢，獲取與該查詢序列相對應(yīng)的一個或多個搜索結(jié)果；隨后，信息提供裝置207通過調(diào)用諸如JSP、ASP或PHP等動態(tài)網(wǎng)頁技術(shù)，將與該英文字符序列“iphone”相對應(yīng)的一個或多個搜索結(jié)果提供給該用戶，供該用戶瀏覽。
[0056]更優(yōu)選地，序列獲取裝置205獲取所述用戶為目標應(yīng)用輸入的字母語音序列；其中，所述序列確定裝置206根據(jù)所述英文語音模型，確定與所述字母語音序列相對應(yīng)的英文字符序列。具體地，用戶例如通過與用戶設(shè)備的語音采集裝置的交互，在目標應(yīng)用中輸入字母語音序列，序列獲取裝置205例如通過調(diào)用該用戶設(shè)備所提供的應(yīng)用程序接口(API)等方式，獲取該用戶為目標應(yīng)用所輸入的字母語音序列；隨后，序列確定裝置206根據(jù)該序列獲取裝置205所獲取的字母語音序列，通過語音識別處理，確定該字母語音序列的發(fā)音信息，進而，根據(jù)該發(fā)音信息，在該英文語音模型中進行匹配查詢，確定與該字母語音序列相對應(yīng)的英文字符序列。例如，用戶通過與用戶設(shè)備的語音采集裝置的交互，輸入了字母語音序列“1、p、h、o、n、e”，序列獲取裝置205例如通過調(diào)用該用戶設(shè)備所提供的應(yīng)用程序接口(API)等方式，獲取了該用戶輸入的字母語音序列“1、p、h、o、n、e”;隨后，序列確定裝置206根據(jù)該字母語音序列“1、p、h、o、n、e”，通過語音識別處理，確定該字母語音序列的發(fā)音信息“aa ai4 p i4 ei2 ch oo oul ee enl ii i4”,進而，根據(jù)該發(fā)音信息,在該英文語音模型中進行匹配查詢，確定與該字母語音序列相對應(yīng)的英文字符序列“iphone”。[0057]相似地，信息提供裝置207將與該英文字符序列相對應(yīng)的信息提供給所述用戶。接上例，當該目標應(yīng)用為語音輸入應(yīng)用，該信息提供裝置207通過調(diào)用諸如JSP、ASP或PHP等動態(tài)網(wǎng)頁技術(shù)，將該英文字符序列“iphone”作為語音輸入候選詞條提供給該用戶，以供該用戶選擇輸入；當該目標應(yīng)用為語音搜索應(yīng)用；搜索獲取裝置根據(jù)該序列確定裝置206所確定的英文字符序列，將該英文字符序列“iphone”作為該用戶的查詢序列，進行匹配查詢，獲取與該查詢序列相對應(yīng)的一個或多個搜索結(jié)果；隨后，信息提供裝置207通過調(diào)用諸如JSP、ASP或PHP等動態(tài)網(wǎng)頁技術(shù)，將與該英文字符序列“iphone”相對應(yīng)的一個或多個搜索結(jié)果提供給該用戶，供該用戶瀏覽。
[0058]在此，本發(fā)明還可與語音識別相結(jié)合，支持用戶以按字母及按單詞兩種方式輸入英文語音序列，提升了用戶的使用體驗。
[0059]圖3示出根據(jù)本發(fā)明另一個方面的用于基于中文語音信息訓練英文語音模型的方法流程圖。
[0060]在步驟S301中，模型訓練設(shè)備1獲取用戶通過語音采集裝置輸入的語音數(shù)據(jù)。具體地，用戶或大量用戶通過與語音采集裝置的交互，輸入了語音數(shù)據(jù)，在步驟S301中，模型訓練設(shè)備1通過調(diào)用該語音采集裝置所提供的應(yīng)用程序接口(API)，獲取該用戶或大量用戶輸入的語音數(shù)據(jù)；或者，用戶或大量用戶通過與語音采集裝置的交互，輸入了語音數(shù)據(jù)，并將該語音數(shù)據(jù)存入語音數(shù)據(jù)庫中，在步驟S301中，模型訓練設(shè)備1通過調(diào)用該語音數(shù)據(jù)庫所提供的應(yīng)用程序接口(API)，從該語音數(shù)據(jù)庫中獲取用戶或大量用戶輸入的語音數(shù)據(jù)。
[0061]本領(lǐng)域技術(shù)人員應(yīng)能理解上述獲取語音數(shù)據(jù)的方式僅為舉例，其他現(xiàn)有的或今后可能出現(xiàn)的獲取語音數(shù)據(jù)的方式如可適用于本發(fā)明，也應(yīng)包含在本發(fā)明保護范圍以內(nèi)，并在此以引用方式包含于此。
[0062]在步驟S302中，模型訓練設(shè)備1判斷所述語音數(shù)據(jù)是否為英文語音數(shù)據(jù)。具體地，在步驟S302中，模型訓練設(shè)備1根據(jù)在步驟S301中所獲取的用戶通過語音采集裝置輸入的語音數(shù)據(jù)，例如通過聲學模型匹配等方式，判斷該語音數(shù)據(jù)是否為英文語音數(shù)據(jù)。
[0063]本領(lǐng)域技術(shù)人員應(yīng)能理解上述判斷英文語音數(shù)據(jù)的方式僅為舉例，其他現(xiàn)有的或今后可能出現(xiàn)的判斷英文語音數(shù)據(jù)的方式如可適用于本發(fā)明，也應(yīng)包含在本發(fā)明保護范圍以內(nèi)，并在此以引用方式包含于此。
[0064]在步驟S303中，模型訓練設(shè)備1當所述語音數(shù)據(jù)為英文語音數(shù)據(jù)，根據(jù)中文語音信息，對所述英文語音數(shù)據(jù)進行語音識別處理，以獲得與所述英文語音數(shù)據(jù)相對應(yīng)的發(fā)音信息。具體地，當在步驟S302中，模型訓練設(shè)備1判斷該語音數(shù)據(jù)為英文語音數(shù)據(jù)，在步驟S303中，模型訓練設(shè)備1根據(jù)中文語音信息，如中文聲韻母信息，對該英文語音數(shù)據(jù)進行語音識別處理，例如，當在步驟S302中，模型訓練設(shè)備1判斷該語音數(shù)據(jù)為英文語音數(shù)據(jù)時，在步驟S303中，模型訓練設(shè)備1采用所有可能的中文聲韻母信息去識別該英文語音數(shù)據(jù)，以確定該英文語音數(shù)據(jù)的發(fā)音信息。
[0065]例如，用戶通過與語音采集裝置的交互，輸入了語音數(shù)據(jù)單詞“iphone”，在步驟S301中，模型訓練設(shè)備1通過調(diào)用該語音采集裝置所提供的應(yīng)用程序接口(API)，獲取了該語音數(shù)據(jù)“iphone”;隨后，在步驟S302中，模型訓練設(shè)備1采用聲學模型匹配的方式，判斷該語音數(shù)據(jù)為英文語音數(shù)據(jù)；隨后，在步驟S303中，模型訓練設(shè)備1采用所有可能的中文聲韻母信息，對該英文語音數(shù)據(jù)“iphone”進行強制對齊，確定該英文語音數(shù)據(jù)“iphone”的發(fā)音信息為“aa ai4f engl”。在此，aa、ai4、f、engl等即為中文聲韻母信息,其中的數(shù)字表示該韻母信息所對應(yīng)的聲調(diào)。本領(lǐng)域技術(shù)人員應(yīng)能理解，在此，中文聲韻母信息及聲調(diào)的表示僅為示例，而不應(yīng)對本發(fā)明產(chǎn)生任何限制。
[0066]優(yōu)選地，在步驟S303中，模型訓練設(shè)備1還可以根據(jù)單詞模型所對應(yīng)的中文語音信息、或字母模型所對應(yīng)的中文語音信息，對該英文語音數(shù)據(jù)進行語音識別處理，以獲得與該英文語音數(shù)據(jù)相對應(yīng)的單詞發(fā)音信息、或字母發(fā)音信息。例如，對于“iphone”，若用戶輸入語音采集裝置的為按單詞讀的“iphone”，則在步驟S303中，模型訓練設(shè)備1確定其對應(yīng)的采用中文語音信息表示的發(fā)音信息為“aa ai4 fengl”;若用戶輸入語音采集裝置的為按字母讀的“iphone”，即，“1、p、h、ο、n、e”，則在步驟S303中，模型訓練設(shè)備1確定其對應(yīng)的采用中文語音信息表示的發(fā)音信息為“aa ai4 pi4 ei2 ch oo oul ee enl iii4”。
[0067]本領(lǐng)域技術(shù)人員應(yīng)能理解上述識別發(fā)音信息的方式僅為舉例，其他現(xiàn)有的或今后可能出現(xiàn)的識別發(fā)音信息的方式如可適用于本發(fā)明，也應(yīng)包含在本發(fā)明保護范圍以內(nèi)，并在此以引用方式包含于此。
[0068]在步驟S304中，模型訓練設(shè)備1根據(jù)所述發(fā)音信息，確定所述英文語音數(shù)據(jù)所對應(yīng)的英文數(shù)據(jù)，以建立或更新英文語音模型，其中，所述發(fā)音信息與所述英文數(shù)據(jù)通過所述中文語音信息相映射。具體地，在步驟S304中，模型訓練設(shè)備1根據(jù)在步驟S303中所識別獲得的發(fā)音信息，確定該英文語音數(shù)據(jù)所對應(yīng)的英文數(shù)據(jù)，如根據(jù)發(fā)音信息“aa ai4 fengl”，確定該發(fā)音信息對應(yīng)的英文數(shù)據(jù)為“iphone”，再將該發(fā)音信息與該英文數(shù)據(jù)的映射關(guān)系存入英文語音模型，以實現(xiàn)對該英文語音模型的建立或更新，其中，該發(fā)音信息與該英文數(shù)據(jù)通過該中文語音信息相映射。
[0069]在此，英文數(shù)據(jù)為一具體的英文單詞，如“iphone”等，而英文語音數(shù)據(jù)為該具體的英文單詞所對應(yīng)的語音數(shù)據(jù)，如“iphone”所對應(yīng)的語音數(shù)據(jù)，通過語音獲取裝置101所獲取。
[0070]本領(lǐng)域技術(shù)人員應(yīng)能理解上述建立或更新英文語音模型的方式僅為舉例，其他現(xiàn)有的或今后可能出現(xiàn)的建立或更新英文語音模型的方式如可適用于本發(fā)明，也應(yīng)包含在本發(fā)明保護范圍以內(nèi)，并在此以引用方式包含于此。
[0071]在此，本發(fā)明在原有中文聲學模型基礎(chǔ)上，利用相似的中文語音信息，對英文語音數(shù)據(jù)進行語音識別處理，以獲得與該英文語音數(shù)據(jù)相對應(yīng)的發(fā)音信息，實現(xiàn)對英文語音模型的建立或更新，有效地控制了英文語音模型的規(guī)模。
[0072]優(yōu)選地，模型訓練設(shè)備1的各個步驟之間是持續(xù)不斷工作的。具體地，在步驟S301中，模型訓練設(shè)備1獲取用戶通過語音采集裝置輸入的語音數(shù)據(jù)；在步驟S302中，模型訓練設(shè)備1判斷所述語音數(shù)據(jù)是否為英文語音數(shù)據(jù)；在步驟S303中，模型訓練設(shè)備1當所述語音數(shù)據(jù)為英文語音數(shù)據(jù)，根據(jù)中文語音信息，對所述英文語音數(shù)據(jù)進行語音識別處理，以獲得與所述英文語音數(shù)據(jù)相對應(yīng)的發(fā)音信息；在步驟S304中，模型訓練設(shè)備1根據(jù)所述發(fā)音信息，確定所述英文語音數(shù)據(jù)所對應(yīng)的英文數(shù)據(jù)，以建立或更新英文語音模型，其中，所述發(fā)音信息與所述英文數(shù)據(jù)通過所述中文語音信息相映射。在此，本領(lǐng)域技術(shù)人員應(yīng)理解“持續(xù)”是指模型訓練設(shè)備1的各步驟分別不斷地進行語音數(shù)據(jù)的獲取、英文語音數(shù)據(jù)的判斷、英文語音數(shù)據(jù)的識別處理及英文語音模型的建立或更新，直至該模型訓練設(shè)備1在較長時間內(nèi)停止獲取語音數(shù)據(jù)。[0073]優(yōu)選地，在步驟S303中，模型訓練設(shè)備1當所述語音數(shù)據(jù)為英文語音數(shù)據(jù)，根據(jù)單詞模型所對應(yīng)的中文語音信息，對所述英文語音數(shù)據(jù)進行語音識別處理，以獲得與所述英文語音數(shù)據(jù)相對應(yīng)的單詞發(fā)音信息。具體地，當在步驟S302中，模型訓練設(shè)備1判斷在步驟S301中所獲取的語音數(shù)據(jù)為英文語音數(shù)據(jù)，在步驟S303中，模型訓練設(shè)備1采用單詞模型所對應(yīng)的中文語音信息，如“aa ai4 f engl”等，對所述英文語音數(shù)據(jù)進行語音識別處理，如強制對齊處理，采用所有可能的中文聲韻母信息，對該英文語音數(shù)據(jù)進行強制對齊，以獲得與所述英文語音數(shù)據(jù)相對應(yīng)的單詞發(fā)音信息。
[0074]在此，該單詞模型中存儲有大量單詞所對應(yīng)的中文語音信息，該單詞模型可以位于模型訓練設(shè)備1中，或者位于與該模型訓練設(shè)備1通過網(wǎng)絡(luò)相連接的第三方設(shè)備中。
[0075]優(yōu)選地，在步驟S303中，模型訓練設(shè)備1當所述語音數(shù)據(jù)為英文語音數(shù)據(jù)，根據(jù)字母模型所對應(yīng)的中文語音信息，對所述英文語音數(shù)據(jù)進行語音識別處理，以獲得與所述英文語音數(shù)據(jù)相對應(yīng)的字母發(fā)音信息。具體地，當在步驟S302中，模型訓練設(shè)備1判斷在步驟S301中所獲取的語音數(shù)據(jù)為英文語音數(shù)據(jù)，在步驟S303中，模型訓練設(shè)備1根據(jù)字母模型所對應(yīng)的中文語音信息，如二十六個英文字母所對應(yīng)的中文語音信息，如字母“a”對應(yīng)的中文語音信息“aa eil”、字母“b”對應(yīng)的中文語音信息“b i4”、字母“c”對應(yīng)的中文語音信息“s ei4”等，對該英文語音數(shù)據(jù)進行語音識別處理，以獲得與該英文語音數(shù)據(jù)相對應(yīng)的字母發(fā)音信息。
[0076]優(yōu)選地，在步驟S303中，模型訓練設(shè)備1對于在步驟S302中判斷為英文語音數(shù)據(jù)為語音數(shù)據(jù)，優(yōu)先采用單詞模型所對應(yīng)的中文語音信息，對該英文語音數(shù)據(jù)進行語音識別處理，當在步驟S303中，模型訓練設(shè)備1采用單詞模型無法識別出該英文語音數(shù)據(jù)的發(fā)音信息時，再采用字母模型所對應(yīng)的中文語音信息，對該英文語音數(shù)據(jù)進行語音識別處理，以獲得與該英文語音數(shù)據(jù)相對應(yīng)的字母發(fā)音信息。相似地，在步驟S303中，模型訓練設(shè)備1也可以優(yōu)先采用字母模型所對應(yīng)的中文語音信息，對該英文語音數(shù)據(jù)進行語音識別處理，當在步驟S303中，模型訓練設(shè)備1采用字母模型無法識別出該英文語音數(shù)據(jù)的發(fā)音信息時，再采用單詞模型所對應(yīng)的中文語音信息，對該英文語音數(shù)據(jù)進行語音識別處理，以獲得與該英文語音數(shù)據(jù)相對應(yīng)的單詞發(fā)音信息。在此，優(yōu)先采用單詞模型還是優(yōu)先采用字母模型所對應(yīng)的中文語音信息，對該英文語音數(shù)據(jù)進行語音識別處理，可以是該模型訓練設(shè)備1預(yù)先設(shè)定的，也可以應(yīng)事件而進行調(diào)整。
[0077]例如，對于在步驟S301中，模型訓練設(shè)備1所獲取的語音數(shù)據(jù)“iphone”，在步驟S302中，模型訓練設(shè)備1判斷該語音數(shù)據(jù)“iphone”為英文語音數(shù)據(jù)，在步驟S303中，模型訓練設(shè)備1優(yōu)先采用單詞模型所對應(yīng)的中文語音信息，對該英文語音數(shù)據(jù)進行語音識別處理，但無法識別出該英文語音數(shù)據(jù)的發(fā)音信息；隨后，在步驟S301中，模型訓練設(shè)備1再采用字母模型所對應(yīng)的中文語音信息，對該英文語音數(shù)據(jù)進行語音識別處理，獲得與該英文語音數(shù)據(jù)相對應(yīng)的字母發(fā)音信息“aa ai4 p i4 ei2 ch oo oul ee enl ii i4”,則可知在步驟S301中所獲取的語音數(shù)據(jù)為按字母讀的“iphone”，即，“1、p、h、ο、n、e”。
[0078]更優(yōu)選地，在步驟S303中，模型訓練設(shè)備1分別采用單詞模型所對應(yīng)的中文語音信息、字母模型所對應(yīng)的中文語音信息，對該英文語音數(shù)據(jù)進行語音識別處理，并分別對語音識別處理所獲得的結(jié)果進行打分，確定打分較高的發(fā)音信息為該英文語音數(shù)據(jù)的發(fā)音信肩、Ο[0079]在此，由于用戶在輸入英文單詞時有時按單詞讀有時按字母讀，本發(fā)明對每個需要識別的英文單詞，利用相似的單詞模型對應(yīng)的中文語音信息、字母模型對應(yīng)的中文語音信息，確定其對應(yīng)的發(fā)音信息，提升了語音識別的準確性。
[0080]在一優(yōu)選實施例中，該方法還包括步驟S308(未示出)。在步驟S308中，模型訓練設(shè)備1統(tǒng)計所述英文數(shù)據(jù)所對應(yīng)的英文語音數(shù)據(jù)在所述語音數(shù)據(jù)中的出現(xiàn)次數(shù)；根據(jù)所述出現(xiàn)次數(shù)，并結(jié)合所述語音數(shù)據(jù)的數(shù)量信息，確定所述英文數(shù)據(jù)的概率值；根據(jù)所述概率值，更新所述英文語音模型。具體地，當大量用戶通過語音采集裝置輸入語音數(shù)據(jù)，其中，多個用戶所輸入的英文語音數(shù)據(jù)為相同的英文語音數(shù)據(jù)，在步驟S301中，模型訓練設(shè)備1獲取該大量用戶輸入的大量語音數(shù)據(jù)；在步驟S302中，模型訓練設(shè)備1判斷該大量語音數(shù)據(jù)為英文語音數(shù)據(jù)；隨后，在步驟S303中，模型訓練設(shè)備1根據(jù)中文語音信息，對該大量英文語音數(shù)據(jù)進行語音識別處理，以獲得與該大量英文語音數(shù)據(jù)相對應(yīng)的發(fā)音信息，在此，由于該多個用戶輸入的為相同的英文語音數(shù)據(jù)，因此，在步驟S303中，模型訓練設(shè)備1所獲得的關(guān)于該多個用戶輸入的英文語音數(shù)據(jù)所對應(yīng)的發(fā)音信息相同或相似；接著，在步驟S304中，模型訓練設(shè)備1根據(jù)該多個相同或相似的發(fā)音信息，確定該多個英文語音數(shù)據(jù)所對應(yīng)的相同的英文數(shù)據(jù)；在步驟S308中，模型訓練設(shè)備1統(tǒng)計該相同的英文數(shù)據(jù)所對應(yīng)的英文語音數(shù)據(jù)在該語音數(shù)據(jù)中的出現(xiàn)次數(shù)；接著，在步驟S308中，模型訓練設(shè)備1再根據(jù)該英文語音數(shù)據(jù)的出現(xiàn)次數(shù)，并結(jié)合該語音數(shù)據(jù)的數(shù)量信息，確定該英文數(shù)據(jù)的概率值，如將該出現(xiàn)次數(shù)除以該大量語音數(shù)據(jù)的數(shù)量信息，獲得該英文數(shù)據(jù)的概率值；該在步驟S308中，模型訓練設(shè)備1再將該英文數(shù)據(jù)及其對應(yīng)的概率值存入該英文語音模型中，以實現(xiàn)對該英文語音模型的更新。
[0081]優(yōu)選地，該方法還包括步驟S309(未示出)和步驟S310(未示出)。在步驟S309中，當所述出現(xiàn)次數(shù)大于預(yù)定數(shù)量閾值，模型訓練設(shè)備1自所述英文語音模型中提取所述英文數(shù)據(jù)與所述英文語音數(shù)據(jù)；在步驟S310中，模型訓練設(shè)備1根據(jù)所述英文數(shù)據(jù)與所述英文語音數(shù)據(jù)的映射關(guān)系，建立或更新與所述英文語音數(shù)據(jù)相對應(yīng)的英文語音單元。具體地，該模型訓練設(shè)備1可以設(shè)置一個預(yù)定數(shù)量閾值，該預(yù)定數(shù)量閾值用來判斷英文數(shù)據(jù)所對應(yīng)的英文語音數(shù)據(jù)在該語音數(shù)據(jù)中的出現(xiàn)次數(shù)是否超過該值，當該出現(xiàn)次數(shù)大于該預(yù)定數(shù)量閾值時，在步驟S309中，模型訓練設(shè)備1自該英文語音模型中提取該英文數(shù)據(jù)與該英文語音數(shù)據(jù)；在步驟S310中，模型訓練設(shè)備1根據(jù)該英文數(shù)據(jù)與該英文語音數(shù)據(jù)的映射關(guān)系，為該英文語音數(shù)據(jù)新建一個英文語音單元，以實現(xiàn)對該英文語音單元的建立或更新。
[0082]更優(yōu)選地，在步驟S310中，模型訓練設(shè)備1根據(jù)所述英文數(shù)據(jù)與所述英文語音數(shù)據(jù)的映射關(guān)系，采用插值計算方法，建立或更新所述英文語音單元。具體地，在步驟S310中，模型訓練設(shè)備1根據(jù)該英文數(shù)據(jù)與該英文語音數(shù)據(jù)的映射關(guān)系，為該英文數(shù)據(jù)新建一英文語音單元，再例如通過將該中文發(fā)音信息所對應(yīng)的中文語音單元的模型參數(shù)復(fù)制給該英文語音單元，然后在英文數(shù)據(jù)上對齊，得到統(tǒng)計量，再與該復(fù)制所獲得的參數(shù)進行插值計算，以實現(xiàn)對該英文語音單元的建立或更新。在此，所述中文語音單元包括為每個中文發(fā)音信息，如中文聲母或韻母信息所建立的發(fā)音單元，如“s”、“ei4”等中文聲韻母信息所對應(yīng)的中文語音單元。
[0083]更優(yōu)選地，該方法還包括步驟S311 (未示出)。在步驟S311中，模型訓練設(shè)備1根據(jù)所述英文語音數(shù)據(jù)及與該英文語音數(shù)據(jù)相對應(yīng)的發(fā)音信息，更新所述英文語音單元。具體地，在步驟S310中，模型訓練設(shè)備1為英文數(shù)據(jù)新建一英文語音單元之后，在步驟S311中，模型訓練設(shè)備1不斷地根據(jù)用戶輸入的英文語音數(shù)據(jù)，及由在步驟S303中識別所獲得的與該英文語音數(shù)據(jù)相對應(yīng)的發(fā)音信息，訓練該英文語音單元。
[0084]在此，本發(fā)明對出現(xiàn)此處大于預(yù)定閾值的英文語音數(shù)據(jù)，為該英文語音數(shù)據(jù)及英文數(shù)據(jù)新建英文語音單元，并對該英文語音單元不斷地進行訓練，以進一步提升該英文語音數(shù)據(jù)的發(fā)音信息的準確性。
[0085]圖4示出根據(jù)本發(fā)明一個優(yōu)選實施例的用于基于中文語音信息訓練英文語音模型的方法流程圖。以下參照圖4對該優(yōu)選實施例進行詳細描述:具體地，在步驟S401中，模型訓練設(shè)備1獲取用戶通過語音采集裝置輸入的語音數(shù)據(jù)；在步驟S402中，模型訓練設(shè)備1判斷所述語音數(shù)據(jù)是否為英文語音數(shù)據(jù)；在步驟S403中，模型訓練設(shè)備1當所述語音數(shù)據(jù)為英文語音數(shù)據(jù)，根據(jù)中文語音信息，對所述英文語音數(shù)據(jù)進行語音識別處理，以獲得與所述英文語音數(shù)據(jù)相對應(yīng)的發(fā)音信息；在步驟S404中，模型訓練設(shè)備1根據(jù)所述發(fā)音信息，確定所述英文語音數(shù)據(jù)所對應(yīng)的英文數(shù)據(jù)，以建立或更新英文語音模型，其中，所述發(fā)音信息與所述英文數(shù)據(jù)通過所述中文語音信息相映射；在步驟S405中，模型訓練設(shè)備1獲取所述用戶為目標應(yīng)用輸入的單詞語音序列；在步驟S406中，模型訓練設(shè)備1根據(jù)所述英文語音模型，確定與所述單詞語音序列相對應(yīng)的英文字符序列；在步驟S407中，模型訓練設(shè)備1將與所述英文字符序列相對應(yīng)的信息提供給所述用戶。其中，步驟S401-S404與圖3所示對應(yīng)步驟相同或相似，故此處不再贅述，并通過引用的方式包含于此。
[0086]在步驟S405中，模型訓練設(shè)備1獲取所述用戶為目標應(yīng)用輸入的單詞語音序列。具體地，用戶例如通過與用戶設(shè)備的語音采集裝置的交互，在目標應(yīng)用中輸入單詞語音序列，在步驟S405中，模型訓練設(shè)備1例如通過調(diào)用該用戶設(shè)備所提供的應(yīng)用程序接口(API)等方式，獲取該用戶為目標應(yīng)用所輸入的單詞語音序列。
[0087]在步驟S406中，模型訓練設(shè)備1根據(jù)所述英文語音模型，確定與所述單詞語音序列相對應(yīng)的英文字符序列。具體地，在步驟S406中，模型訓練設(shè)備1根據(jù)在步驟S405中所獲取的單詞語音序列，通過語音識別處理，確定該單詞語音序列的發(fā)音信息，進而，根據(jù)該發(fā)音信息，在該英文語音模型中進行匹配查詢，確定與該單詞語音序列相對應(yīng)的英文字符序列。例如，用戶通過與用戶設(shè)備的語音采集裝置的交互，輸入了單詞語音序列“iphone”，在步驟S405中，模型訓練設(shè)備1例如通過調(diào)用該用戶設(shè)備所提供的應(yīng)用程序接口(API)等方式，獲取了該用戶輸入的單詞語音序列“iphone”；隨后，在步驟S406中，模型訓練設(shè)備1根據(jù)該單詞語音序列“iphone”，通過語音識別處理，確定該單詞語音序列的發(fā)音信息“aaai4 f engl”，進而，根據(jù)該發(fā)音信息，在該英文語音模型中進行匹配查詢，確定與該單詞語音序列相對應(yīng)的英文字符序列“iphone”。
[0088]在步驟S407中，模型訓練設(shè)備1將與所述英文字符序列相對應(yīng)的信息提供給所述用戶。例如，當該目標應(yīng)用為語音輸入應(yīng)用，在步驟S407中，模型訓練設(shè)備1通過調(diào)用諸如JSP、ASP或PHP等動態(tài)網(wǎng)頁技術(shù)，將該英文字符序列作為語音輸入候選詞條提供給該用戶；當該目標應(yīng)用為語音搜索應(yīng)用；在步驟S407中，模型訓練設(shè)備1通過調(diào)用諸如JSP、ASP或PHP等動態(tài)網(wǎng)頁技術(shù)，將根據(jù)該英文字符序列搜索獲得的一個或多個搜索結(jié)果提供給該用戶。
[0089]優(yōu)選地，該目標應(yīng)用為語音輸入應(yīng)用；其中，在步驟S407中，模型訓練設(shè)備1將所述英文字符序列作為語音輸入候選詞條提供給所述用戶。例如，當該目標應(yīng)用為語音輸入應(yīng)用，用戶通過與用戶設(shè)備的語音采集裝置的交互，在語音輸入應(yīng)用中輸入了單詞語音序列“iphone”，在步驟S405中，模型訓練設(shè)備1例如通過調(diào)用該用戶設(shè)備所提供的應(yīng)用程序接口(API)等方式，獲取了該用戶輸入的單詞語音序列“iphone”;隨后，在步驟S406中，模型訓練設(shè)備1根據(jù)該單詞語音序列“iphone”，通過語音識別處理，確定該單詞語音序列的發(fā)音信息“aa ai4 f engl”，進而，根據(jù)該發(fā)音信息，在該英文語音模型中進行匹配查詢，確定與該單詞語音序列相對應(yīng)的英文字符序列“ iphone” ;進而，在步驟S407中，模型訓練設(shè)備1通過調(diào)用諸如JSP、ASP或PHP等動態(tài)網(wǎng)頁技術(shù)，將該英文字符序列“iphone”作為語音輸入候選詞條提供給該用戶，以供該用戶選擇輸入。
[0090]優(yōu)選地，該目標應(yīng)用為語音搜索應(yīng)用；其中，該方法還包括步驟S412 (未示出)。在步驟S412中，模型訓練設(shè)備1將所述英文字符序列作為所述用戶的查詢序列，獲取與所述查詢序列相對應(yīng)的一個或多個搜索結(jié)果；其中，在步驟S407中，模型訓練設(shè)備1將所述一個或多個搜索結(jié)果提供給所述用戶。具體地，當該目標應(yīng)用為語音搜索應(yīng)用，在步驟S406中，模型訓練設(shè)備1根據(jù)該英文語音模型，確定與該單詞語音序列相對應(yīng)的英文字符序列；在步驟S412中，模型訓練設(shè)備1根據(jù)在步驟S406中所確定的英文字符序列，將該英文字符序列作為該用戶的查詢序列，進行匹配查詢，獲取與該查詢序列相對應(yīng)的一個或多個搜索結(jié)果；隨后，在步驟S407中，模型訓練設(shè)備1通過調(diào)用諸如JSP、ASP或PHP等動態(tài)網(wǎng)頁技術(shù)，將該一個或多個搜索結(jié)果提供給該用戶。
[0091]例如，當該目標應(yīng)用為語音搜索應(yīng)用，用戶通過與用戶設(shè)備的語音采集裝置的交互，在語音輸入應(yīng)用中輸入了單詞語音序列“iphone”，在步驟S405中，模型訓練設(shè)備1例如通過調(diào)用該用戶設(shè)備所提供的應(yīng)用程序接口(API)等方式，獲取了該用戶輸入的單詞語音序列“iphone”；隨后，在步驟S406中，模型訓練設(shè)備1根據(jù)該單詞語音序列“ iphone”，通過語音識別處理，確定該單詞語音序列的發(fā)音信息“aa ai4 f engl”，進而，根據(jù)該發(fā)音信息，在該英文語音模型中進行匹配查詢，確定與該單詞語音序列相對應(yīng)的英文字符序列“iphone” ;進而，在步驟S412中，模型訓練設(shè)備1根據(jù)在步驟S406中所確定的英文字符序列，將該英文字符序列“iphone”作為該用戶的查詢序列，進行匹配查詢，獲取與該查詢序列相對應(yīng)的一個或多個搜索結(jié)果；隨后，在步驟S407中，模型訓練設(shè)備1通過調(diào)用諸如JSP、ASP或PHP等動態(tài)網(wǎng)頁技術(shù)，將與該英文字符序列“iphone”相對應(yīng)的一個或多個搜索結(jié)果提供給該用戶，供該用戶瀏覽。
[0092]更優(yōu)選地，在步驟S405中，模型訓練設(shè)備1獲取所述用戶為目標應(yīng)用輸入的字母語音序列；其中，在步驟S406中，模型訓練設(shè)備1根據(jù)所述英文語音模型，確定與所述字母語音序列相對應(yīng)的英文字符序列。具體地，用戶例如通過與用戶設(shè)備的語音采集裝置的交互，在目標應(yīng)用中輸入字母語音序列，在步驟S405中，模型訓練設(shè)備1例如通過調(diào)用該用戶設(shè)備所提供的應(yīng)用程序接口(API)等方式，獲取該用戶為目標應(yīng)用所輸入的字母語音序列；隨后，在步驟S406中，模型訓練設(shè)備1根據(jù)在步驟S405中所獲取的字母語音序列，通過語音識別處理，確定該字母語音序列的發(fā)音信息，進而，根據(jù)該發(fā)音信息，在該英文語音模型中進行匹配查詢，確定與該字母語音序列相對應(yīng)的英文字符序列。例如，用戶通過與用戶設(shè)備的語音采集裝置的交互，輸入了字母語音序列“1、P、h、ο、n、e”，在步驟S405中，模型訓練設(shè)備1例如通過調(diào)用該用戶設(shè)備所提供的應(yīng)用程序接口(API)等方式，獲取了該用戶輸入的字母語音序列“1、P、h、0、n、e” ；隨后，在步驟S406中，模型訓練設(shè)備1根據(jù)該字母語音序列“1、P、h、o、n、e”，通過語音識別處理，確定該字母語音序列的發(fā)音信息“aa ai4 pi4 ei2 ch oo oul ee enl ii i4”,進而，根據(jù)該發(fā)音信息，在該英文語音模型中進行匹配查詢，確定與該字母語音序列相對應(yīng)的英文字符序列“iphone”。
[0093]相似地，在步驟S407中，模型訓練設(shè)備1將與該英文字符序列相對應(yīng)的信息提供給所述用戶。接上例，當該目標應(yīng)用為語音輸入應(yīng)用，在步驟S407中，模型訓練設(shè)備1通過調(diào)用諸如JSP、ASP或PHP等動態(tài)網(wǎng)頁技術(shù)，將該英文字符序列“iphone”作為語音輸入候選詞條提供給該用戶，以供該用戶選擇輸入；當該目標應(yīng)用為語音搜索應(yīng)用；在步驟S412中，模型訓練設(shè)備1根據(jù)在步驟S406中所確定的英文字符序列，將該英文字符序列“iphone”作為該用戶的查詢序列，進行匹配查詢，獲取與該查詢序列相對應(yīng)的一個或多個搜索結(jié)果；隨后，在步驟S407中，模型訓練設(shè)備1通過調(diào)用諸如JSP、ASP或PHP等動態(tài)網(wǎng)頁技術(shù)，將與該英文字符序列“iphone”相對應(yīng)的一個或多個搜索結(jié)果提供給該用戶，供該用戶瀏覽。
[0094]在此，本發(fā)明還可與語音識別相結(jié)合，支持用戶以按字母及按單詞兩種方式輸入英文語音序列，提升了用戶的使用體驗
[0095]本發(fā)明的軟件程序可以通過處理器執(zhí)行以實現(xiàn)上文所述步驟或功能。同樣地，本發(fā)明的軟件程序(包括相關(guān)的數(shù)據(jù)結(jié)構(gòu))可以被存儲到計算機可讀記錄介質(zhì)中，例如，RAM存儲器，磁或光驅(qū)動器或軟磁盤及類似設(shè)備。另外，本發(fā)明的一些步驟或功能可采用硬件來實現(xiàn)，例如，作為與處理器配合從而執(zhí)行各個功能或步驟的電路。
[0096]另外，本發(fā)明的一部分可被應(yīng)用為計算機程序產(chǎn)品，例如計算機程序指令，當其被計算機執(zhí)行時，通過該計算機的操作，可以調(diào)用或提供根據(jù)本發(fā)明的方法和/或技術(shù)方案。而調(diào)用本發(fā)明的方法的程序指令，可能被存儲在固定的或可移動的記錄介質(zhì)中，和/或通過廣播或其他信號承載媒體中的數(shù)據(jù)流而被傳輸，和/或被存儲在根據(jù)所述程序指令運行的計算機設(shè)備的工作存儲器中。在此，根據(jù)本發(fā)明的一個實施例包括一個裝置，該裝置包括用于存儲計算機程序指令的存儲器和用于執(zhí)行程序指令的處理器，其中，當該計算機程序指令被該處理器執(zhí)行時，觸發(fā)該裝置運行基于前述根據(jù)本發(fā)明的多個實施例的方法和/或技術(shù)方案。
[0097]對于本領(lǐng)域技術(shù)人員而言，顯然本發(fā)明不限于上述示范性實施例的細節(jié)，而且在不背離本發(fā)明的精神或基本特征的情況下，能夠以其他的具體形式實現(xiàn)本發(fā)明。因此，無論從哪一點來看，均應(yīng)將實施例看作是示范性的，而且是非限制性的，本發(fā)明的范圍由所附權(quán)利要求而不是上述說明限定，因此旨在將落在權(quán)利要求的等同要件的含義和范圍內(nèi)的所有變化涵括在本發(fā)明內(nèi)。不應(yīng)將權(quán)利要求中的任何附圖標記視為限制所涉及的權(quán)利要求。此夕卜，顯然“包括” 一詞不排除其他單元或步驟，單數(shù)不排除復(fù)數(shù)。裝置權(quán)利要求中陳述的多個單元或裝置也可以由一個單元或裝置通過軟件或者硬件來實現(xiàn)。第一，第二等詞語用來表示名稱，而并不表示任何特定的順序。
【權(quán)利要求】
1.一種用于基于中文語音信息訓練英文語音模型的方法，其中，該方法包括以下步驟:a獲取用戶通過語音采集裝置輸入的語音數(shù)據(jù)；b判斷所述語音數(shù)據(jù)是否為英文語音數(shù)據(jù)；c當所述語音數(shù)據(jù)為英文語音數(shù)據(jù)，根據(jù)中文語音信息，對所述英文語音數(shù)據(jù)進行語音識別處理，以獲得與所述英文語音數(shù)據(jù)相對應(yīng)的發(fā)音信息；d根據(jù)所述發(fā)音信息，確定所述英文語音數(shù)據(jù)所對應(yīng)的英文數(shù)據(jù)，以建立或更新英文語音模型，其中，所述發(fā)音信息與所述英文數(shù)據(jù)通過所述中文語音信息相映射。
2.根據(jù)權(quán)利要求1所述的方法，其中，所述步驟c包括:-當所述語音數(shù)據(jù)為英文語音數(shù)據(jù)，根據(jù)單詞模型所對應(yīng)的中文語音信息，對所述英文語音數(shù)據(jù)進行語音識別處理，以獲得與所述英文語音數(shù)據(jù)相對應(yīng)的單詞發(fā)音信息。
3.根據(jù)權(quán)利要求1所述的方法，其中，所述步驟c包括:-當所述語音數(shù)據(jù)為英文語音數(shù)據(jù)，根據(jù)字母模型所對應(yīng)的中文語音信息，對所述英文語音數(shù)據(jù)進行語音識別處理，以獲得與所述英文語音數(shù)據(jù)相對應(yīng)的字母發(fā)音信息。
4.根據(jù)權(quán)利要求1至3中任一項所述的方法，其中，該方法還包括:-統(tǒng)計所述英文數(shù)據(jù)所對應(yīng)的英文語音數(shù)據(jù)在所述語音數(shù)據(jù)中的出現(xiàn)次數(shù)；-根據(jù)所述出現(xiàn)次數(shù)，并結(jié)合所述語音數(shù)據(jù)的數(shù)量信息，確定所述英文數(shù)據(jù)的概率值；-根據(jù)所述概率值，更新所述英文語音模型。
5.根據(jù)權(quán)利要求4所述的方法，其中，該方法還包括:-當所述出現(xiàn)次數(shù)大于預(yù)定數(shù)量閾值，自所述英文語音模型中提取所述英文數(shù)據(jù)與所述英文語音數(shù)據(jù)；r根據(jù)所述英文數(shù)據(jù)與所述英文語音數(shù)據(jù)的映射關(guān)系，建立或更新與所述英文語音數(shù)據(jù)相對應(yīng)的英文語音單元。
6.根據(jù)權(quán)利要求5所述的方法，其中，所述步驟r包括:-根據(jù)所述英文數(shù)據(jù)與所述英文語音數(shù)據(jù)的映射關(guān)系，采用插值計算方法，建立或更新所述英文語音單元。
7.根據(jù)權(quán)利要求5或6所述的方法，其中，該方法還包括:-根據(jù)所述英文語音數(shù)據(jù)及與該英文語音數(shù)據(jù)相對應(yīng)的發(fā)音信息，更新所述英文語音單元。
8.根據(jù)權(quán)利要求1至7中任一項所述的方法，其中，該方法還包括:X獲取所述用戶為目標應(yīng)用輸入的單詞語音序列；y根據(jù)所述英文語音模型，確定與所述單詞語音序列相對應(yīng)的英文字符序列；Z將與所述英文字符序列相對應(yīng)的信息提供給所述用戶。
9.根據(jù)權(quán)利要求8所述的方法，其中，所述目標應(yīng)用為語音輸入應(yīng)用；其中，所述步驟z包括:-將所述英文字符序列作為語音輸入候選詞條提供給所述用戶。
10.根據(jù)權(quán)利要求8所述的方法，其中，所述目標應(yīng)用為語音搜索應(yīng)用；其中，該方法還包括:-將所述英文字符序列作為所述用戶的查詢序列，獲取與所述查詢序列相對應(yīng)的一個或多個搜索結(jié)果；其中，所述步驟Z包括:-將所述一個或多個搜索結(jié)果提供給所述用戶。
11.根據(jù)權(quán)利要求8至10中任一項所述的方法，其中，所述步驟X包括:-獲取所述用戶為目標應(yīng)用輸入的字母語音序列；其中，所述步驟y包括:-根據(jù)所述英文語音模型，確定與所述字母語音序列相對應(yīng)的英文字符序列。
12.一種用于基于中文語音信息訓練英文語音模型的模型訓練設(shè)備，其中，該設(shè)備包括:語音獲取裝置，用于獲取用戶通過語音采集裝置輸入的語音數(shù)據(jù)；英文判斷裝置，用于判斷所述語音數(shù)據(jù)是否為英文語音數(shù)據(jù)；語音識別裝置，用于當所述語音數(shù)據(jù)為英文語音數(shù)據(jù)，根據(jù)中文語音信息，對所述英文語音數(shù)據(jù)進行語音識別處理，以獲得與所述英文語音數(shù)據(jù)相對應(yīng)的發(fā)音信息；模型訓練裝置，用于根據(jù)所述發(fā)音信息，確定所述英文語音數(shù)據(jù)所對應(yīng)的英文數(shù)據(jù)，以建立或更新英文語音模型，其中，所述發(fā)音信息與所述英文數(shù)據(jù)通過所述中文語音信息相映射。
13.根據(jù)權(quán)利要求12所述的模型訓練設(shè)備，其中，所述語音識別裝置用于:-當所述語音數(shù)據(jù)為英文語音數(shù)據(jù)，根據(jù)單詞模型所對應(yīng)的中文語音信息，對所述英文語音數(shù)據(jù)進行語音識別處理，以獲得與所述英文語音數(shù)據(jù)相對應(yīng)的單詞發(fā)音信息。
14.根據(jù)權(quán)利要求12所述的模型訓練設(shè)備，其中，所述語音識別裝置用于:-當所述語音數(shù)據(jù)為英文語音數(shù)據(jù)，根據(jù)字母模型所對應(yīng)的中文語音信息，對所述英文語音數(shù)據(jù)進行語音識別處理，以獲得與所述英文語音數(shù)據(jù)相對應(yīng)的字母發(fā)音信息。
15.根據(jù)權(quán)利要求12至14中任一項所述的模型訓練設(shè)備，其中，該設(shè)備還包括模型更新裝置，用于:-統(tǒng)計所述英文數(shù)據(jù)所對應(yīng)的英文語音數(shù)據(jù)在所述語音數(shù)據(jù)中的出現(xiàn)次數(shù)；-根據(jù)所述出現(xiàn)次數(shù)，并結(jié)合所述語音數(shù)據(jù)的數(shù)量信息，確定所述英文數(shù)據(jù)的概率值；-根據(jù)所述概率值，更新所述英文語音模型。
16.根據(jù)權(quán)利要求15所述的模型訓練設(shè)備，其中，該設(shè)備還包括:數(shù)據(jù)提取裝置，用于當所述出現(xiàn)次數(shù)大于預(yù)定數(shù)量閾值，自所述英文語音模型中提取所述英文數(shù)據(jù)與所述英文語音數(shù)據(jù)；單元訓練裝置，用于根據(jù)所述英文數(shù)據(jù)與所述英文語音數(shù)據(jù)的映射關(guān)系，建立或更新與所述英文語音數(shù)據(jù)相對應(yīng)的英文語音單元。
17.根據(jù)權(quán)利要求16所述的模型訓練設(shè)備，其中，所述單元訓練裝置用于:-根據(jù)所述英文數(shù)據(jù)與所述英文語音數(shù)據(jù)的映射關(guān)系，采用插值計算方法，建立或更新所述英文語音單元。
18.根據(jù)權(quán)利要求16或17所述的模型訓練設(shè)備，其中，該設(shè)備還包括單元更新裝置，用于:-根據(jù)所述英文語音數(shù)據(jù)及與該英文語音數(shù)據(jù)相對應(yīng)的發(fā)音信息，更新所述英文語音單元。
19.根據(jù)權(quán)利要求12至18中任一項所述的模型訓練設(shè)備，其中，該設(shè)備還包括:序列獲取裝置，用于獲取所述用戶為目標應(yīng)用輸入的單詞語音序列；序列確定裝置，用于根據(jù)所述英文語音模型，確定與所述單詞語音序列相對應(yīng)的英文字符序列；信息提供裝置，用于將與所述英文字符序列相對應(yīng)的信息提供給所述用戶。
20.根據(jù)權(quán)利要求19所述的模型訓練設(shè)備，其中，所述目標應(yīng)用為語音輸入應(yīng)用；其中，所述信息提供裝置用于:-將所述英文字符序列作為語音輸入候選詞條提供給所述用戶。
21.根據(jù)權(quán)利要求19所述的模型訓練設(shè)備，其中，所述目標應(yīng)用為語音搜索應(yīng)用；其中，該設(shè)備還包括:搜索獲取裝置，用于將所述英文字符序列作為所述用戶的查詢序列，獲取與所述查詢序列相對應(yīng)的一個或多個搜索結(jié)果；其中，所述信息提供裝置用于:-將所述一個或多個搜索結(jié)果提供給所述用戶。
22.根據(jù)權(quán)利要求19至21中任一項所述的模型訓練設(shè)備，其中，所述序列獲取裝置用于:-獲取所述用戶為目標應(yīng)用輸入的字母語音序列；其中，所述序列確定裝置用于:-根據(jù)所述英文語音模型，確定與所述字母語音序列相對應(yīng)的英文字符序列。
【文檔編號】G10L15/06GK103632668SQ201210299700
【公開日】2014年3月12日申請日期:2012年8月21日優(yōu)先權(quán)日:2012年8月21日
【發(fā)明者】蘇丹, 萬廣魯申請人:北京百度網(wǎng)訊科技有限公司

完整全部詳細技術(shù)資料下載

該技術(shù)已申請專利。僅供學習研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：蘇丹;萬廣魯
技術(shù)所有人：北京百度網(wǎng)訊科技有限公司
我是此專利的發(fā)明人

上一篇：五拼面板雙音梁古箏的制作方法
上一篇：一種語音識別的方法及電子設(shè)備的制作方法

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

一種基于中文語音信息訓練英文語音模型的方法與設(shè)備的制作方法