分詞詞典的生成方法和裝置及語音合成方法和裝置的制造方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及語音處理技術(shù)領(lǐng)域,尤其涉及一種分詞詞典的生成方法和裝置及語音 合成方法和裝置。
【背景技術(shù)】
[0002] 語音合成,又稱文語轉(zhuǎn)換(Text to Speech),能將文字信息實時轉(zhuǎn)化為語音朗讀 出來,相當于給機器裝上了人工嘴巴。對于語音合成系統(tǒng),首先需要對輸入的文本進行處 理,其中包括分詞處理。
[0003]目前,分詞算法主要有兩類,一種是基于詞典匹配的算法,另一種是基于機器學(xué)習(xí) 的方法?;谠~典匹配的算法中,采用的分詞詞典通常是根據(jù)專家知識(如電子詞典,新華 字典等)建立詞典的詞條。但是這種根據(jù)專家知識建立的分詞詞典的語料不夠均衡,特別 是缺乏對不常見的詞語的統(tǒng)計,不常見的詞語如人名,地名,專屬名等?;跈C器學(xué)習(xí)的方 法需要對大量的文本進行分詞標注,從中抽取特征和所屬類別訓(xùn)練模型,使用時對輸入文 本進行特征抽取后,利用模型判斷邊界類型,從而實現(xiàn)分詞的目的。但是,機器學(xué)習(xí)方式需 要大量的標注數(shù)據(jù),不論是工作量成本還是時間成本都較大。
【發(fā)明內(nèi)容】
[0004] 本發(fā)明旨在至少在一定程度上解決相關(guān)技術(shù)中的技術(shù)問題之一。
[0005] 為此,本發(fā)明的一個目的在于提出一種分詞詞典的生成方法,該方法可以獲取與 相應(yīng)領(lǐng)域適合的分詞詞典,進而可以提高分詞效果,提高語音合成效果。
[0006] 本發(fā)明的另一個目的在于提出一種語音合成方法,該方法可以在語音合成時選擇 合適的分詞詞典,從而提高語音合成效果。
[0007] 本發(fā)明的另一個目的在于提出一種分詞詞典的生成裝置。
[0008] 本發(fā)明的另一個目的在于提出一種語音合成裝置。
[0009] 為達到上述目的,本發(fā)明第一方面實施例提出的分詞詞典的生成方法,包括:對收 集的預(yù)設(shè)范圍內(nèi)的文本進行劃分,得到組成所述文本的句子;對所述句子進行劃分,得到不 同長度的字符串;根據(jù)所述不同長度的字符串,確定不同長度的字符串內(nèi)的可信詞條;根 據(jù)所述可信詞條建立分詞詞典。
[0010] 本發(fā)明第一方面實施例提出的分詞詞典的生成方法,通過基于預(yù)設(shè)范圍內(nèi)收集的 文本生成分詞詞典,可以考慮預(yù)設(shè)范圍內(nèi)的整體情況,根據(jù)范圍不同生成不同的分詞詞典, 避免僅根據(jù)專家知識造成的一些詞難以統(tǒng)計的問題,獲取與相應(yīng)領(lǐng)域適合的分詞詞典,進 而可以提高分詞效果,提高語音合成效果。
[0011] 為達到上述目的,本發(fā)明第二方面實施例提出的語音合成方法,包括:對輸入文本 進行文本處理,所述文本處理包括:分詞處理,所述分詞處理包括選擇與所述輸入文本對應(yīng) 的分詞詞典,所述分詞詞典是預(yù)先對與所述輸入文本對應(yīng)領(lǐng)域的文本進行訓(xùn)練后得到的; 對文本處理后的輸入文本進行后續(xù)處理,得到合成語音。
[0012] 本發(fā)明第二方面實施例提出的語音合成方法,通過采用與輸入文本對應(yīng)的分詞詞 典進行分詞,可以改善分詞效果,從而提升語音合成質(zhì)量,改善用戶體驗。
[0013] 為達到上述目的,本發(fā)明第三方面實施例提出的分詞詞典的生成裝置,包括:第一 劃分模塊,用于對收集的預(yù)設(shè)范圍內(nèi)的文本進行劃分,得到組成所述文本的句子;第二劃分 模塊,用于對所述句子進行劃分,得到不同長度的字符串;確定模塊,用于根據(jù)所述不同長 度的字符串,確定不同長度的字符串內(nèi)的可信詞條;建立模塊,用于根據(jù)所述可信詞條建立 分詞詞典。
[0014] 本發(fā)明第三方面實施例提出的分詞詞典的生成裝置,通過基于預(yù)設(shè)范圍內(nèi)收集的 文本生成分詞詞典,可以考慮預(yù)設(shè)范圍內(nèi)的整體情況,根據(jù)范圍不同生成不同的分詞詞典, 避免僅根據(jù)專家知識造成的一些詞難以統(tǒng)計的問題,獲取與相應(yīng)領(lǐng)域適合的分詞詞典,進 而可以提高分詞效果,提高語音合成效果。
[0015] 為達到上述目的,本發(fā)明第四方面實施例提出的語音合成裝置,包括:第一處理模 塊,用于對輸入文本進行文本處理,所述文本處理包括:分詞處理,所述分詞處理包括選擇 與所述輸入文本對應(yīng)的分詞詞典,所述分詞詞典是預(yù)先對與所述輸入文本對應(yīng)領(lǐng)域的文本 進行訓(xùn)練后得到的;第二處理模塊,用于對文本處理后的輸入文本進行后續(xù)處理,得到合成 語音。
[0016] 本發(fā)明第四方面實施例提出的語音合成裝置,通過采用與輸入文本對應(yīng)的分詞詞 典進行分詞,可以改善分詞效果,從而提升語音合成質(zhì)量,改善用戶體驗。
[0017] 本發(fā)明附加的方面和優(yōu)點將在下面的描述中部分給出,部分將從下面的描述中變 得明顯,或通過本發(fā)明的實踐了解到。
【附圖說明】
[0018] 本發(fā)明上述的和/或附加的方面和優(yōu)點從下面結(jié)合附圖對實施例的描述中將變 得明顯和容易理解,其中:
[0019] 圖1是本發(fā)明一實施例提出的分詞詞典的生成方法的流程示意圖;
[0020] 圖2是本發(fā)明另一實施例提出的分詞詞典的生成方法的流程示意圖;
[0021] 圖3是本發(fā)明另一實施例提出的語音合成方法的流程示意圖;
[0022] 圖4是本發(fā)明另一實施例提出的語音合成方法的流程示意圖;
[0023] 圖5是本發(fā)明實施例中分詞處理的流程示意圖;
[0024] 圖6是本發(fā)明實施例中獲取領(lǐng)域詞典的示意圖;
[0025] 圖7是本發(fā)明另一實施例提出的分詞詞典的生成裝置的結(jié)構(gòu)示意圖;
[0026] 圖8是本發(fā)明另一實施例提出的語音合成裝置的結(jié)構(gòu)示意圖;
[0027] 圖9是本發(fā)明另一實施例提出的語音合成裝置的結(jié)構(gòu)示意圖。
【具體實施方式】
[0028] 下面詳細描述本發(fā)明的實施例,所述實施例的示例在附圖中示出,其中自始至終 相同或類似的標號表示相同或類似的模塊或具有相同或類似功能的模塊。下面通過參考 附圖描述的實施例是示例性的,僅用于解釋本發(fā)明,而不能理解為對本發(fā)明的限制。相反, 本發(fā)明的實施例包括落入所附加權(quán)利要求書的精神和內(nèi)涵范圍內(nèi)的所有變化、修改和等同 物。
[0029] 圖1是本發(fā)明一實施例提出的分詞詞典的生成方法的流程示意圖,該方法包括:
[0030] Sll :對收集的預(yù)設(shè)范圍內(nèi)的文本進行劃分,得到組成所述文本的句子。
[0031] 現(xiàn)有技術(shù)中,分詞詞典是根據(jù)已有的專家知識得到的。
[0032] 而本實施例中,分詞詞典是對收集的樣本進行訓(xùn)練后得到的,從而避免已有的專 家知識缺乏不常見詞條的問題。
[0033] 本實施例中,收集的樣本是預(yù)設(shè)范圍內(nèi)的文本,預(yù)設(shè)范圍可以包括:通用范圍,或 者,領(lǐng)域范圍。通用范圍不限定領(lǐng)域,例如,收集小說,新聞,體育等領(lǐng)域的文本,領(lǐng)域范圍是 限定一個特定領(lǐng)域,例如,當領(lǐng)域范圍是小說領(lǐng)域時,僅收集小說領(lǐng)域的文本。相應(yīng)的,對應(yīng) 通用范圍生成的詞典可以稱為通用詞典,對應(yīng)領(lǐng)域范圍生成的詞典可以稱為領(lǐng)域詞典。
[0034] 在收集到文本后,可以對每個文本進行劃分,得到每個文本內(nèi)的句子。
[0035] 可選的,所述對收集的預(yù)設(shè)范圍內(nèi)的文本進行劃分,得到組成所述文本的句子,包 括:
[0036] 根據(jù)所述文本內(nèi)的特殊字符對所述文本進行劃分,得到組成所述文本的句子,所 述特殊字符包括:標點符號。
[0037] 例如,將文本內(nèi)每個標點符號隔開的部分作為一個句子。
[0038] 例如,一個文本中有如下內(nèi)容:"語音合成,相當于給機器裝上了人工嘴巴",則該 內(nèi)容可以包括兩個句子:"語音合成",以及"相當于給機器裝上了人工嘴巴"。
[0039] S12 :對所述句子進行劃分,得到不同長度的字符串。
[0040] 在得到每個句子后,可以將每個句子劃分為不同長度的字符串。
[0041] 可選的,所述對所述句子進行劃分,得到不同長度的字符串,包括:
[0042] 將所述句子劃分為長度分別是n0, nO+L,nO+2L,…,N的字符串,其中,n0、L和N 是預(yù)設(shè)值,分別是字符串的最小長度、移動窗的長度和字符串的最大長度。
[0043] 例如,設(shè)置n0 = 1,L = 1時,對應(yīng)"相當于給機器裝上了人工嘴巴"這個句子,可 以得到如下的字符串:
[0044] 長度為1的字符串:相當于給機器裝上了人工嘴巴
[0045] 長度為2的字符串:相當當于于給給機機器器裝裝上上了了人人工工嘴嘴巴
[0046] 長度為3的字符串:相當于當于給于給機給機器機器裝器裝上裝上了上了人了人 工人工嘴工嘴巴
[0047] 依此類推,還可以得到長度為4,5,…,直至最大長度的字符串,最大長度例如為 5~7中的一個值。
[0048] 上述的各字符串之間用空格區(qū)分。
[0049] 另外,由于字符串是對每個句子進行劃分后得到的,每個文本內(nèi)可以包括多個句 子,并且收集的文本也通常是多個,因此,可以統(tǒng)計多個句子(同一個