構(gòu)建多語言音標數(shù)據(jù)庫的方法、多語言注音的方法及裝置制造方法
【專利摘要】本發(fā)明公開了一種構(gòu)建多語言音標數(shù)據(jù)庫的方法,多語言注音方法及多語言語音合成裝置,多語言注音的方法(國際拼音-GP)包括:根據(jù)漢語拼音聲韻調(diào)理論構(gòu)建基礎(chǔ)音標數(shù)據(jù)庫;獲取漢語以外的至少一種外語的標準發(fā)音的音節(jié);針對所述外語的每一個音節(jié),識別出該音節(jié)的元音/輔音/聲調(diào);對于識別出的每一個元音/輔音,若其與基礎(chǔ)音標數(shù)據(jù)庫中的漢語拼音的發(fā)音相同,則確定其音標為共用音標;若其與基礎(chǔ)音標數(shù)據(jù)庫中的任一漢語拼音的發(fā)音均不同,則確定其音標為非共用音標;將共用音標采用與其發(fā)音相同的漢語拼音進行替代,并將非共用音標以預(yù)設(shè)方式加入基礎(chǔ)音標數(shù)據(jù)庫中,以形成擴展音標數(shù)據(jù)庫,利用擴展音標數(shù)據(jù)庫對所述外語進行注音。
【專利說明】構(gòu)建多語言音標數(shù)據(jù)庫的方法、多語言注音的方法及裝置
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及語音處理領(lǐng)域,具體而言,涉及一種基于漢語拼音構(gòu)建多語言音標數(shù) 據(jù)庫的方法、一種多語言注音方法和一種多語言語音合成裝置。
【背景技術(shù)】
[0002] 語言學(xué)習(xí)一直是一個重要的領(lǐng)域,通常,學(xué)習(xí)者受到語言環(huán)境的影響,學(xué)習(xí)語言環(huán) 境相關(guān)的語言比較快,如母語。但,當語言環(huán)境無法有效的幫助學(xué)習(xí)者學(xué)習(xí)語言的時候,則 會導(dǎo)致學(xué)習(xí)者無法有效的認知和讀出某一種語言中的詞語、或者字。
[0003] 應(yīng)對于對詞語或者字的朗讀問題,大部分語言配置了相應(yīng)的音標,來幫助學(xué)習(xí)者 來認讀字和詞。音標如英文音標,中文拼音等。隨著需要學(xué)習(xí)的語言增加,學(xué)習(xí)者需要針對 每一種語言單獨的學(xué)習(xí)一種與該語言相對應(yīng)的音標,并且,雖然每種語言是不同,但每種語 言發(fā)音的基礎(chǔ)單元(音標,或拼音)卻有著部分相似的特征,也就是不同語言的音標符號相 同,但發(fā)音不同;或者是不同語言的音標發(fā)音相同,但符號不同。這樣,會導(dǎo)致學(xué)習(xí)者在進行 音標的認讀時造成混淆,大大降低學(xué)習(xí)效率和學(xué)習(xí)的準確性。如漢字中,拼音的聲母和韻母 有一些是與英文音標中的元音音標,或輔音音標的發(fā)音是相同的,但其表達方式卻是不相 同的。而且,當待學(xué)習(xí)的語言增加時,符號相同,發(fā)音不同和發(fā)音相同,符號不同的音標會越 來越多,這樣會加大學(xué)習(xí)者的學(xué)習(xí)難度。
[0004] 綜上所述,現(xiàn)有的每種語言的音標沒有相通性,無法在學(xué)習(xí)一種語言音標的基礎(chǔ) 上,在學(xué)習(xí)另一種語言的音標。
【發(fā)明內(nèi)容】
[0005] 本發(fā)明的目的在于提供一種基于漢語拼音構(gòu)建多語言音標數(shù)據(jù)庫的方法、一種多 語言注音方法和一種多語言語音合成裝置,以解決上述的問題。
[0006] 在本發(fā)明的實施例中提供了一種基于漢語拼音構(gòu)建多語言音標數(shù)據(jù)庫的方法,包 括:
[0007] 根據(jù)漢語拼音構(gòu)建基礎(chǔ)音標數(shù)據(jù)庫;
[0008] 獲取漢語以外的至少一種外語的標準發(fā)音的音節(jié);
[0009] 針對外語的每一個音節(jié),識別出該音節(jié)的每一個元音和輔音;
[0010] 對于識別出的每一個元音或輔音,若其與基礎(chǔ)音標數(shù)據(jù)庫中的漢語拼音的發(fā)音相 同,則確定其音標為共用音標;若其與基礎(chǔ)音標數(shù)據(jù)庫中的任一漢語拼音的發(fā)音均不同,貝 1J 確定其音標為非共用音標;
[0011] 將共用音標采用與其發(fā)音相同的漢語拼音進行替代,并將非共用音標進行預(yù)設(shè)處 理后加入基礎(chǔ)音標數(shù)據(jù)庫中,以形成擴展音標數(shù)據(jù)庫。
[0012] 優(yōu)選的,包括:將非共用音標進行預(yù)設(shè)處理后加入基礎(chǔ)音標數(shù)據(jù)庫中,包括:
[0013] 對于每個非共用音標,判斷其發(fā)音與基礎(chǔ)音標數(shù)據(jù)庫中的漢語拼音的發(fā)音的相似 度是否滿足預(yù)設(shè)條件,若是,則將其替代為發(fā)音相似度滿足預(yù)設(shè)條件的漢語拼音;否則,直 接將其加入基礎(chǔ)音標數(shù)據(jù)庫中。
[0014] 本發(fā)明實施例還提供了一種多語言注音方法,包括基于漢語拼音構(gòu)建多語言音標 數(shù)據(jù)庫的方法,還包括:
[0015] 利用擴展音標數(shù)據(jù)庫對外語進行注音。
[0016] 優(yōu)選的,利用擴展音標數(shù)據(jù)庫對外語進行注音,包括:
[0017] 獲取外語的待注音單元;其中,待注音單元為待注音的單詞或句子;
[0018] 針對待注音單元的每個音節(jié),從擴展音標數(shù)據(jù)庫中查找其音標,并確定其聲調(diào);
[0019] 根據(jù)待注音單元的每個音節(jié)的音標及聲調(diào),對待注音單元進行注音。
[0020] 優(yōu)選的,聲調(diào)包括基本聲調(diào)和合成聲調(diào),基本聲調(diào)包括:高調(diào)、低調(diào)、升調(diào)和降調(diào), 合成聲調(diào)包括基本聲調(diào)合成的聲調(diào);其中,高調(diào)對應(yīng)漢語拼音中的一聲,低調(diào)對應(yīng)漢語拼音 中的輕聲,升調(diào)對應(yīng)漢語拼音中的二聲,降調(diào)對應(yīng)漢語拼音中的四聲。
[0021] 優(yōu)選的,利用擴展音標數(shù)據(jù)庫對外語進行注音,包括:
[0022] 按照漢語拼音的聲韻調(diào)順序?qū)ν庹Z進行注音。
[0023] 優(yōu)選的,至少一種外語包括英語;
[0024] 利用擴展音標數(shù)據(jù)庫對英語和德語進行注音,包括:
[0025] 將待注音的英語,德語單元中的重音轉(zhuǎn)化為高調(diào)或降調(diào),輕音轉(zhuǎn)化為低調(diào)。
[0026] 優(yōu)選的,利用擴展音標數(shù)據(jù)庫對外語進行注音,包括:
[0027] 根據(jù)擴展音標數(shù)據(jù)庫中的輔音音標,生成待注音單元的輔音音標或輔音串音標。
[0028] 本發(fā)明實施例另提供了一種多語言語音合成裝置,包括:采用基于漢語拼音構(gòu)建 多語言音標數(shù)據(jù)庫的方法所構(gòu)建的擴展音標數(shù)據(jù)庫,還包括:
[0029] 構(gòu)建模塊,用于針對漢語及至少一種外語的每個音節(jié),根據(jù)擴展音標數(shù)據(jù)庫確定 其音標,根據(jù)音節(jié)的音標和聲調(diào),形成帶調(diào)音節(jié),針對每一個帶調(diào)音節(jié),采集相應(yīng)的標準發(fā) 音以形成語音數(shù)據(jù)庫,語音數(shù)據(jù)庫是針對每個帶調(diào)音節(jié)的,可能的組合包括帶調(diào)的單個元 音;帶調(diào)的單個輔音;帶調(diào)的輔音元音組合;
[0030] 查詢模塊,用于獲取待合成的多語言單元的每個音節(jié),并查詢語音數(shù)據(jù)庫以獲取 該音節(jié)的語音;其中多語言單元包括以下中的一種或多種:漢語、至少一種外語;
[0031] 播放模塊,用于將獲取的多語言單元的語音進行播放。
[0032] 優(yōu)選的,標準發(fā)音為音節(jié)的音標和聲調(diào)組合的發(fā)音。
[0033] 本發(fā)明提供的技術(shù)方案,基于漢語拼音構(gòu)建多語言音標數(shù)據(jù)庫,以實現(xiàn)多語音的 注音及合成。本發(fā)明的技術(shù)方法,基于同一數(shù)據(jù)庫對多語言進行注音,能夠提高多語言注音 的效率,也就能夠相應(yīng)提高多語言語音合成的效率;另外,采用漢語拼音的聲韻調(diào)順序?qū)Χ?語言進行注音,還能夠提高多語言注音的靈活性和準確性,不僅利于國人學(xué)習(xí)外語,還能進 一步使?jié)h語拼音方式得到推廣。
【專利附圖】
【附圖說明】
[0034]圖1示出了本發(fā)明實施例的一種基于漢語拼音構(gòu)建多語言音標數(shù)據(jù)庫的流程圖;
[0035] 圖2示出了本發(fā)明實施例的一種多語言注音方法的流程圖;
[0036] 圖3示出了采用本發(fā)明的多語言注音方法進行注音的示意圖;
[0037] 圖4示出了本發(fā)明實施例的一種多語言語音合成裝置流程圖。
【具體實施方式】
[0038]下面通過具體的實施例子并結(jié)合附圖對本發(fā)明做進一步的詳細描述。
[0039] 國人常用的語言是漢語,但隨著中國與其他國家溝通的增加,使用其他國家的語 言進行交流的機會也明顯增加了,進而需要加快學(xué)習(xí)其他種類語言(如英語、日語等)的效 率。學(xué)習(xí)外語時,首先需要學(xué)習(xí)對應(yīng)的音標。但各種語言的音標基本沒有相同的(指音標 的符號形式),雖然音標有差別,不同種類的語言音標的發(fā)音與漢語拼音的發(fā)音還是比較相 似的,至少每種語言的全部音標中,有一部分音標與漢語拼音的發(fā)音是相類似的。那么在學(xué) 習(xí)新語言的音標時,或者是對新語言的字詞通過音標進行注音的時候,可以使用發(fā)音相同 或相似的漢語拼音來進行注音,這樣對新語言的注音就是由漢語拼音所構(gòu)成。需要說明的 是,任何一門新語言都存在與漢語拼音的發(fā)音不同的音標,即非共用的音標,這需要學(xué)習(xí)者 單獨進行學(xué)習(xí),而通常非公用的音標的數(shù)量比較少,因此,本發(fā)明考慮基于漢語拼音建立基 礎(chǔ)音標數(shù)據(jù)庫,在此基礎(chǔ)上加入新語言的音標以實現(xiàn)數(shù)據(jù)庫的擴展,依靠擴展后的數(shù)據(jù)庫 對漢語及其他語言進行注音。
[0040] 本發(fā)明實施例1提供了一種基于漢語拼音構(gòu)建多語言音標數(shù)據(jù)庫的方法,如圖1 所示,包括如下步驟S101-S105 :
[0041] S101 :根據(jù)漢語拼音構(gòu)建基礎(chǔ)音標數(shù)據(jù)庫。
[0042] 步驟S101中,構(gòu)建基礎(chǔ)音標的數(shù)據(jù)庫可以包括漢語拼音的全部聲母和韻母和四 種聲調(diào),在此基礎(chǔ)上還可以包括聲母和韻母組合所形成的音標。
[0043] S102 :獲取漢語以外的至少一種外語的標準發(fā)音的音節(jié)。
[0044] S103 :針對外語的每一個音節(jié),識別出該音節(jié)的每一個元音和輔音;
[0045]音節(jié)是很多國外語言發(fā)音的基本單位,外語的音節(jié)包括元音和輔音,部分元音和 輔音與漢語的聲母和韻母的發(fā)音相同,但也有不同的。
[0046]S104:對于識別出的每一個元音或輔音,若其與基礎(chǔ)音標數(shù)據(jù)庫中的漢語拼音的 發(fā)音相同,則確定其音標為共用音標;若其與基礎(chǔ)音標數(shù)據(jù)庫中的任一漢語拼音的發(fā)音均 不同,則確定其音標為非共用音標;
[0047]S105:將共用音標采用與其發(fā)音相同的漢語拼音進行替代,并將非共用音標進行 預(yù)設(shè)處理后加入基礎(chǔ)音標數(shù)據(jù)庫中,以形成擴展音標數(shù)據(jù)庫。
[0048] 步驟S102中,獲取漢語以外的至少一種外語的標準發(fā)音的音節(jié)是指,獲取需要進 行注音的一種或多種外語的音節(jié),如需要進行漢語、英語和法語注音,則步驟S102中需要 獲取英語和法語的每個音節(jié)。對于音節(jié)來說,漢語中一個漢字一般一個音節(jié),每個音節(jié)由聲 母、韻母和聲調(diào)三個部分組成;英語中一個元音可構(gòu)成一個音節(jié),一個元音和一個或幾個輔 音結(jié)合也可以構(gòu)成一個音節(jié)。步驟102中需要獲取的這些外語的全部音節(jié)。
[0049] 步驟S104中,如果步驟S103所確定的元音或輔音與基礎(chǔ)音標數(shù)據(jù)庫中的漢語拼 音的發(fā)音相同,則可以使用相應(yīng)的漢語拼音的音標來替代該元音或輔音的音標。如英語中 的/9U/與漢語拼音中的[0u]發(fā)音相同,貝 1J可以使用[0u]替代/su/。
[0050] 進一步的,同一種發(fā)音,在不同種類的語言中的表現(xiàn)形式是通過不同的元音、輔 音、聲母或韻母的符號來體現(xiàn)的。也就是在每種語言中可能存在不同的音標對應(yīng)的是同一 種發(fā)音,由此,可以通過發(fā)音是否相同來確定是否可以使用漢語拼音來替代外語的元音或 輔音的符號。
[0051] 當然,其他語言中除了有與漢語拼音發(fā)音相同的元音或輔音,還有與漢語拼音中 發(fā)音不同的元音或輔音,這些不同的元音或輔音則是非共用音標。漢語拼音中的聲母和韻 母的發(fā)音并不一定與兀音或輔音的發(fā)音能夠 對應(yīng)上,還可以是多個聲母和韻母的組合 能夠與一個元音或輔音對應(yīng)上,那么在對發(fā)音進行辨識的時候,還應(yīng)考慮到是否需要將聲 母韻母的組合拼音與一個元音或輔音進行對應(yīng),以減少非共用音標的數(shù)量。
[0052] 步驟S105中,需要將公用音標采用相應(yīng)的漢語拼音進行替代,非公用音標以預(yù)設(shè) 的方式加入基礎(chǔ)音標數(shù)據(jù)庫中,以使擴展后的音標數(shù)據(jù)庫中能夠查詢到新語言的全部音 標,進而形成擴展音標數(shù)據(jù)庫。具體的,預(yù)設(shè)方式是基于彈性注標或非彈性注標所采用的方 式,彈性注標即將非共用音標采用與其發(fā)音相近的音標替代,如英語中的/ 0 /與漢語中的 [s],發(fā)音雖然不同,但非常的相似,則可以采用漢語中的[s ;]替代英語中的/ 0/,彈性注 標判斷發(fā)音的相似程度可以采用人工判斷,也可以采用語音識別機器進行判斷。
[0053] 彈性注標的方式中,非公用音標以預(yù)設(shè)的方式加入基礎(chǔ)音標數(shù)據(jù)庫中即:判斷非 共用音標的發(fā)音與基礎(chǔ)音標數(shù)據(jù)庫中的漢語拼音的發(fā)音的相似度是否達到一定程度,若 是,則將其替代為發(fā)音相似度滿足所述預(yù)設(shè)條件的漢語拼音;否則,直接將其加入所述基礎(chǔ) 音標數(shù)據(jù)庫中。漢語拼音的發(fā)音和外語音標的發(fā)音可能存在不完全相同的情況,但只要二 者的差別在合理的范圍內(nèi)(如不仔細聽無法分別,在拼讀的時候,容易忽略掉差別),那么 便可以使用發(fā)音相似的漢語拼音來替代該音標。這樣,便可以進一步在合理的范圍內(nèi)減少 非公用音標的數(shù)量,也就使學(xué)習(xí)新語言的人可以更少的學(xué)習(xí)新語言的音標,從而簡化學(xué)習(xí) 過程,也可以進一步簡化多語言語音合成器的設(shè)計。在非彈性注標的方式中,則是將所有的 非共用音標都直接加入基礎(chǔ)音標數(shù)據(jù)庫中。
[0054] 將非共用音標加入基礎(chǔ)音標數(shù)據(jù)庫中后就形成了擴展音標數(shù)據(jù)庫,利用該擴展音 標數(shù)據(jù)庫,就能對上述的多種語言進行準音。
[0055] 根據(jù)該擴展音標數(shù)據(jù)庫對外語進行注音后,大部分的音標是熟知漢語的人員所認 識的,只有少部分非共用音標需要進行學(xué)習(xí),從而在學(xué)習(xí)一種新語言的時候,可以降低需要 學(xué)習(xí)的音標的數(shù)量,提高學(xué)習(xí)效率。另一方面,還可以降低對外語注音的復(fù)雜程度,如只需 要通過少量的音標便能夠完成對多種語言進行注音,在采用上述步驟S101-步驟S105將所 有的國際語言的音標都加入擴展音標數(shù)據(jù)庫后,就可以對全部國際語言采用漢語拼音的方 式進行注音,因此,基于上述擴展音標數(shù)據(jù)庫進行注音的方式可以作為國際拼音使用,使用 國際拼音一方面能夠提高外語學(xué)習(xí)效率,另一方面還能減少多語言的注音難度,且能夠使 得漢語拼音的注音方式得到國際性的推廣。
[0056] 本發(fā)明實施例所提供的基于漢語拼音構(gòu)建多語言音標數(shù)據(jù)庫的方法,通過對新語 言的每個音節(jié)的元音和輔音的發(fā)音進行辨別,區(qū)分出與基礎(chǔ)音標數(shù)據(jù)庫中的漢語拼音中發(fā) 音相同和發(fā)音不同的音標,以確定公用音標和非共用音標,并且將非公用音標以預(yù)設(shè)方式 加入到基礎(chǔ)音標數(shù)據(jù)庫中,從而擴展了注音的語言種類,且能夠降低學(xué)習(xí)新語言的難度和 提高新語言學(xué)習(xí)的效率,并且使相應(yīng)的注音設(shè)備的設(shè)計簡化,解決了現(xiàn)有技術(shù)中的不足。
[0057] 基于上述方法構(gòu)建了多種語言的擴展音標數(shù)據(jù)庫,就能夠利用該擴展音標數(shù)據(jù)庫 對多種語言進行注音。參見圖2所示為本發(fā)明實施例提供的一種多語言注音方法的流程 圖,圖3所示為采用該方法進行多語言注音的示意圖。如圖2所示,該方法包括:
[0058] S201,獲取外語的待注音單元;其中,待注音單元為待注音的單詞或句子;
[0059] S202,針對待注音單元的每個音節(jié),從擴展音標數(shù)據(jù)庫中查找其音標,并確定其聲 調(diào);
[0060] S203,根據(jù)待注音單元的每個音節(jié)的音標及聲調(diào),對待注音單元進行注音。
[0061] 步驟S202中,需要在擴展音標數(shù)據(jù)庫中查找對應(yīng)的音標,漢語的注音在此不多做 解釋,對于漢語以外的,且其音標已加入音標數(shù)據(jù)庫的新語言,在對該新語言的單詞或句子 進行注音時,先識別每個其中的每個音節(jié),并在擴展音標數(shù)據(jù)庫中查找每個音節(jié)的音標,由 于擴展數(shù)據(jù)庫已經(jīng)錄入該新語言的全部音標,所以從該擴展音標數(shù)據(jù)庫能夠查到該新語言 的單詞或句子的音節(jié)的音標。
[0062] 此外,還需要確定待注音的單詞或句子的聲調(diào),并按照漢語拼音的聲韻調(diào)順序?qū)?所述外語進行注音。國際拼音中有四種聲調(diào),高低升降,而英語或其他部分語種是只區(qū)分 重音,不區(qū)分聲調(diào)的,這會對認知某種語言的音標造成一定的困難,由此,還需要確定音節(jié) 的聲調(diào)。具體的聲調(diào)可以分為四種,如高調(diào)(漢語中的1聲),低調(diào)(漢語中的輕聲),升調(diào) (漢語中的2聲),降調(diào)(漢語中的4聲)。
[0063] 具體的,聲調(diào)包括基本聲調(diào)和合成聲調(diào),基本聲調(diào)包括:高調(diào)、低調(diào)、升調(diào)和降調(diào), 合成聲調(diào)包括基本聲調(diào)合成的聲調(diào);其中,高調(diào)對應(yīng)漢語拼音中的一聲,低調(diào)對應(yīng)漢語拼音 中的輕聲,升調(diào)對應(yīng)對應(yīng)漢語拼音中的二聲,降調(diào)對應(yīng)漢語拼音中的四聲;低調(diào)和升調(diào)的合 成的聲調(diào),相當于漢語拼音中的三聲。
[0064] 其中,在進行注音時,低調(diào)可進行省略,其他聲調(diào)不進行省略。
[0065] 步驟S203中,需要根據(jù)步驟S202所獲取到的音標和聲調(diào)對每個待注音單元進行 注音。對于輔音串,在注音時可以使用相應(yīng)的輔音串音標進行注音。
[0066] 進一步,利用擴展音標數(shù)據(jù)庫對外語進行注音,包括:
[0067] 按照漢語拼音的聲韻調(diào)順序?qū)ν庹Z進行注音。
[0068] 英語是現(xiàn)在社會中學(xué)習(xí)范圍最廣泛的一種語言,由此,至少一種外語包括英語;
[0069] 利用擴展音標數(shù)據(jù)庫對英語進行注音,包括:
[0070] 將待注音的英語單元中的重音轉(zhuǎn)化為高調(diào)或降調(diào),輕音轉(zhuǎn)化為低調(diào)。
[0071] 英語中,音標的重音與漢語中的高調(diào)或降調(diào)是相同的,英語中的輕音與漢語中的 低調(diào)是相同的。
[0072] 進一步,利用擴展音標數(shù)據(jù)庫對外語進行注音,包括:
[0073] 根據(jù)擴展音標數(shù)據(jù)庫中的輔音音標,生成待注音單元的輔音音標或輔音串音標。
[0074] 實施例2所提供的多語言注音方法還可以細化為如下步驟(當已掌握語言為漢語 時):
[0075] 1,確定待學(xué)習(xí)語言的類別;
[0076] 2,按照該語言的音節(jié)的聽覺效果和發(fā)音標準,識別音節(jié)的種類和音節(jié)數(shù)量;
[0077] 3,對每一個音節(jié)進行分析,識別發(fā)音里的元音(韻母)和輔音(聲母)和聲調(diào);
[0078] 4,確定這些元音,輔音,哪些是與擴展音標數(shù)據(jù)庫里面的元音和輔音是相同的或 者不同的;
[0079] 5,對于與擴展音標數(shù)據(jù)庫相同的元音,輔音,用擴展音標數(shù)據(jù)庫里的符號表達;對 于那些不同的元音,輔音,采用新的的音標表示,并將其加入擴展音標數(shù)據(jù)庫;
[0080] 6,按照漢語拼音的聲韻調(diào)方式進行書寫,允許輔音,輔音串單獨書寫。為了便于輸 機和顯示,只使用26個英文字母和少數(shù)符號"," " " "逗號,分號,點號和撇號。例 如desk[dai, 4sk], sk,屬于輔音串;bike[bai4k], k是輔音,可單獨存在;
[0081] 7,重復(fù)以上步驟,可是實現(xiàn)對相應(yīng)語言詞匯注音,并形成建相應(yīng)語言的單詞音標 數(shù)據(jù)庫;
[0082] 8,調(diào)用數(shù)據(jù)庫,顯示在學(xué)習(xí)機,電腦,智能終端上,便于學(xué)習(xí)。
[0083] 相關(guān)技術(shù)中,有關(guān)語言注音、學(xué)習(xí)和合成方面主要有兩方面的缺點:
[0084] 1,相關(guān)技術(shù)中的系統(tǒng)和方法未能與中國現(xiàn)行的漢語拼音系統(tǒng)相結(jié)合,各個系統(tǒng)和 方法之間互相獨立,重復(fù)浪費資源(學(xué)習(xí)每種語言的時候,需要對每種語言針對性的進行 學(xué)習(xí),各種學(xué)習(xí)之間不具有相關(guān)聯(lián)性),致使中國人學(xué)習(xí)難度大,效率低,浪費資源;目前英 文音標,只標重音,沒有聲調(diào),不利于中國人學(xué)習(xí);用到太多的特殊音標,例如$,〇,3 等,不易于輸入計算機,影響人們使用和學(xué)習(xí)。
[0085] 2,對于語音合成方面,英文系統(tǒng)只針對英文,漢語系統(tǒng)只針對漢語,不能資源共 享,系統(tǒng)資源浪費嚴重;現(xiàn)有的語音合成系統(tǒng),由于沒有嚴格的精確的音節(jié)聲調(diào)設(shè)計,語音 生硬難懂。
[0086] 本發(fā)明所提供的擴展音標數(shù)據(jù)庫具有如下特點:
[0087] 1,方便中國人學(xué)習(xí)外語。因為該系統(tǒng)(擴展音標數(shù)據(jù)庫)和注音方法可以是以漢 語拼音為基礎(chǔ),漢語拼音在中國是家喻戶曉的,有廣大的用戶和市場。
[0088] 2,如果該方法得到推廣和發(fā)揚,將奠定漢語拼音的國際地位,對于外語學(xué)習(xí)而言, 提供了一個非常有利的學(xué)習(xí)系統(tǒng)和方法。國際音標產(chǎn)生于1886年,漢語拼音方案產(chǎn)生于 1958,漢語拼音產(chǎn)生較晚,本身就克服了國際音標的很多缺點,國際拼音注音方法和系統(tǒng)是 建立在這個了兩個方案的基礎(chǔ)上,綜合了他們的優(yōu)點,摒棄他們的缺點,建立的一個新的方 法和系統(tǒng)。
[0089] 3,發(fā)展了中國的聲調(diào)理論,將聲調(diào)理論引入外語學(xué)習(xí),使音標所能夠表達的信息 更加完整。
[0090] 本發(fā)明實施例3提供了一種多語言語音合成裝置,包括:采用實施例1所提供的基 于漢語拼音構(gòu)建多語言音標數(shù)據(jù)庫的方法所構(gòu)建的擴展音標數(shù)據(jù)庫,如圖4所示,還包括: [0091] 構(gòu)建模塊,用于針對漢語及至少一種外語的每個音節(jié),根據(jù)擴展音標數(shù)據(jù)庫確定 其音標,根據(jù)音節(jié)的音標和聲調(diào),形成帶調(diào)音節(jié),針對每一個帶調(diào)音節(jié),采集相應(yīng)的標準發(fā) 音以形成語音數(shù)據(jù)庫。其中,可以將每個音節(jié)的語音形式按國際拼音進行語音編碼,以便以 后調(diào)用。語音數(shù)據(jù)庫是針對每個帶調(diào)音節(jié)的,可能的組合包括帶調(diào)的單個元音,例如a的四 種發(fā)音,al (高調(diào)),a(低調(diào)),a2(升調(diào)),a4(降調(diào));帶調(diào)的單個輔音,例如s的四種發(fā) 音,si (高調(diào)),s (低調(diào)),s2 (升調(diào)),s4 (降調(diào));帶調(diào)的輔音元音組合,例如sa的四種發(fā) 音,sal (高調(diào)),sa (低調(diào)),sa2 (升調(diào)),sa4 (降調(diào))
[0092] 查詢模塊,用于獲取待合成的多語言單元的每個音節(jié),并查詢語音數(shù)據(jù)庫以獲取 該音節(jié)的語音;其中多語言單元包括以下中的一種或多種:漢語、至少一種外語;
[0093] 播放模塊,用于將獲取的多語言單元的語音進行播放。
[0094] 上述的多語言語音合成裝置,實現(xiàn)了多種語言的語音合成,且語言合成是建立使 用者所熟悉的語言(漢語)的基礎(chǔ)上進行的,由此,不僅提高了語音合成的效率,也能夠使 得合成的語言能更接近使用者的要求。
[0095] 本發(fā)明所提供的語音合成器具有如下特點:
[0096] 語音合成器(多語言語音合成裝置),由于引進了四種基本聲調(diào),效果好,成本低 廉,性價比高。目前對于一個擁有10萬詞的漢語或者是英文系統(tǒng)而言,至少需要錄音10萬 次,工作量很大;國際拼音語音合成器,只需要錄音1800次,性價比很高,提高了效率。
[0097] 本發(fā)明實施例1提供了以漢語拼音所做成的數(shù)據(jù)庫(國際拼音注音系統(tǒng)的數(shù)據(jù) 庫)作為基礎(chǔ)音標數(shù)據(jù)庫,以英語作為待學(xué)習(xí)的語言,所形成使用漢語拼音替代英語音標 的替代關(guān)系。
[0098] 經(jīng)過本發(fā)明所提供的多語言注音方法的相應(yīng)步驟,使?jié)h語拼音和國際音標(英語 音標)按照如下幾個表格進行替代,其中對于不同學(xué)習(xí)階段的人群,還可以分為兩種不同 的方案,一是英文音標與漢語拼音不嚴格對應(yīng)的注音方式,也就是相似的音標米用同一個 聲母,或者韻母來替代,即寬式音標;二是音標與拼音嚴格對應(yīng)的注音方式,也就是每種音 標只與一種聲母,或者韻母相對應(yīng),對發(fā)音上有嚴格的區(qū)分,即嚴式音標。同時也提供了德 語的音標數(shù)據(jù)庫。具體音標數(shù)據(jù)格式如下:
[00"] 聲調(diào)(表1)
[0100] 英語輔音,元音替換表和單詞舉例(表2,3, 4,5)
[0101] 德語輔音,元音替換表和單詞舉例(表6和表7)
[0102] 表1-聲調(diào)符號
[0103]
【權(quán)利要求】
1. 一種基于漢語拼音構(gòu)建多語言音標數(shù)據(jù)庫的方法,其特征在于,包括: 根據(jù)漢語拼音構(gòu)建基礎(chǔ)音標數(shù)據(jù)庫; 獲取漢語以外的至少一種外語的標準發(fā)音的音節(jié); 針對所述外語的每一個音節(jié),識別出該音節(jié)的每一個元音和輔音; 對于識別出的每一個所述元音或輔音,若其與所述基礎(chǔ)音標數(shù)據(jù)庫中的漢語拼音的發(fā) 音相同,則確定其音標為共用音標;若其與所述基礎(chǔ)音標數(shù)據(jù)庫中的任一漢語拼音的發(fā)音 均不同,則確定其音標為非共用音標; 將所述共用音標采用與其發(fā)音相同的漢語拼音進行替代,并將所述非共用音標以預(yù)設(shè) 方式加入所述基礎(chǔ)音標數(shù)據(jù)庫中,以形成擴展音標數(shù)據(jù)庫。
2. 根據(jù)權(quán)利要求1所述的方法,其特征在于,包括:將所述非共用音標以預(yù)設(shè)方式加入 所述基礎(chǔ)音標數(shù)據(jù)庫中,包括: 對于每個所述非共用音標,判斷其發(fā)音與所述基礎(chǔ)音標數(shù)據(jù)庫中的漢語拼音的發(fā)音的 相似度是否滿足預(yù)設(shè)條件,若是,則將其替代為發(fā)音相似度滿足所述預(yù)設(shè)條件的漢語拼音; 否則,直接將其加入所述基礎(chǔ)音標數(shù)據(jù)庫中。
3. -種多語言注音方法,包括如權(quán)利要求1-2任一所述的基于漢語拼音構(gòu)建多語言音 標數(shù)據(jù)庫的方法,其特征在于,還包括: 利用所述擴展音標數(shù)據(jù)庫對所述外語進行注音。
4. 根據(jù)權(quán)利要求3所述的方法,其特征在于,利用所述擴展音標數(shù)據(jù)庫對所述外語進 行注音,包括: 獲取所述外語的待注音單元;其中,所述待注音單元為待注音的單詞或句子; 針對所述待注音單元的每個音節(jié),從所述擴展音標數(shù)據(jù)庫中查找其音標,并確定其聲 調(diào); 根據(jù)所述待注音單元的每個音節(jié)的音標及聲調(diào),對所述待注音單元進行注音。
5. 根據(jù)權(quán)利要求4所述的方法,其特征在于,所述聲調(diào)包括基本聲調(diào)和合成聲調(diào),所述 基本聲調(diào)包括4種:高調(diào)、低調(diào)、升調(diào)和降調(diào);所述合成聲調(diào)包括所述基本聲調(diào)合成的聲調(diào); 其中,所述高調(diào)對應(yīng)漢語拼音中的一聲,所述低調(diào)對應(yīng)漢語拼音中的輕聲,所述升調(diào)對應(yīng)漢 語拼音中的二聲,所述降調(diào)對應(yīng)漢語拼音中的四聲。
6. 根據(jù)權(quán)利要求5所述的方法,其特征在于,利用所述擴展音標數(shù)據(jù)庫對所述外語進 行注音,包括: 按照漢語拼音的聲韻調(diào)順序?qū)λ鐾庹Z進行注音。
7. 根據(jù)權(quán)利要求6所述的方法,其特征在于,所述至少一種外語包括英語; 利用所述擴展音標數(shù)據(jù)庫對英語進行注音,包括: 將待注音的英語單元中的重音轉(zhuǎn)化為高調(diào)或降調(diào),輕音轉(zhuǎn)化為低調(diào)。
8. 根據(jù)權(quán)利要求3所述的方法,其特征在于,利用所述擴展音標數(shù)據(jù)庫對所述外語進 行注音,包括: 根據(jù)所述擴展音標數(shù)據(jù)庫中的輔音音標,生成待注音單元的輔音音標或輔音串音標。
9. 一種多語言語音合成裝置,包括:采用如權(quán)利要求1-2所述的方法所構(gòu)建的擴展音 標數(shù)據(jù)庫,其特征在于,還包括: 構(gòu)建模塊,用于針對漢語及所述至少一種外語的每個音節(jié),根據(jù)所述擴展音標數(shù)據(jù)庫 確定其音標,根據(jù)所述音節(jié)的音標和聲調(diào),形成帶調(diào)音節(jié),針對每一個帶調(diào)音節(jié),采集相應(yīng) 的標準發(fā)音以形成語音數(shù)據(jù)庫; 查詢模塊,用于獲取待合成的多語言單元的每個音節(jié),并查詢所述語音數(shù)據(jù)庫以獲取 該音節(jié)的語音;其中所述多語言單元包括以下中的一種或多種:漢語、所述至少一種外語; 播放模塊,用于將獲取的所述多語言單元的語音進行播放。
10.根據(jù)權(quán)利要求9所述的裝置,其特征在于,所述標準發(fā)音為所述音節(jié)的音標和聲調(diào) 組合的發(fā)音。
【文檔編號】G06F17/30GK104239579SQ201410535621
【公開日】2014年12月24日 申請日期:2014年10月11日 優(yōu)先權(quán)日:2014年10月11日
【發(fā)明者】魯冠軍, 馬方旭, 宮宸 申請人:北京千鈺千尋科技有限公司