專利名稱:以選定的語(yǔ)言提供電視語(yǔ)音的裝置和方法
技術(shù)領(lǐng)域:
本發(fā)明涉及電視系統(tǒng),尤其涉及讓電視節(jié)目提供隨節(jié)目錄制的語(yǔ)言以外的另一種語(yǔ)言的裝置和方法。
背景技術(shù):
電視節(jié)目包括音頻部分和視頻部分,音頻部分以節(jié)目播放地的語(yǔ)言錄制,然而,同一個(gè)地方并非所有的居民都說(shuō)同一種語(yǔ)言,因此,應(yīng)當(dāng)提供對(duì)語(yǔ)言的選擇,這樣觀眾就可以更好的欣賞電視節(jié)目。
以前,解決語(yǔ)言問(wèn)題的技術(shù)方法主要立足于提供一個(gè)以上的附加音頻信號(hào),每路附加音頻信號(hào)攜帶電視節(jié)目不同的語(yǔ)言的音頻部分。例如,在數(shù)字電視傳輸?shù)脑S多建議中,有的主張?zhí)峁┑诙纛l節(jié)目(SAP),可以用來(lái)以第二語(yǔ)言提供電視音頻。這一解決方案存在一個(gè)問(wèn)題,每路單獨(dú)的音頻信號(hào)需要占用額外的傳輸帶寬。這種額外帶寬的使用是不希望的,因?yàn)檫@些帶寬本來(lái)可以用來(lái)提供如額外節(jié)目的服務(wù)。
以前,人們提供隱含字幕數(shù)據(jù)(closed caption data),讓聽(tīng)力障礙者可以以文字的形式欣賞到電視節(jié)目的音頻部分。根據(jù)實(shí)用電視標(biāo)準(zhǔn),這種數(shù)據(jù)以模擬和數(shù)字電視信號(hào)傳輸,例如,美國(guó)的國(guó)際電視系統(tǒng)委員會(huì)的模擬電視標(biāo)準(zhǔn),動(dòng)畫(huà)專家組的數(shù)字電視標(biāo)準(zhǔn)。過(guò)去,隱含字幕數(shù)據(jù)僅僅用于文字顯示。
希望有一個(gè)系統(tǒng),它能夠讓觀眾可以在多種語(yǔ)言中選擇電視節(jié)目音頻部分使用的語(yǔ)言,而且這個(gè)系統(tǒng)提供多種語(yǔ)言但每種語(yǔ)言又不占用額外的帶寬。
本發(fā)明提供的一種電視音頻系統(tǒng),除具有以上的優(yōu)點(diǎn)外,還具有其它優(yōu)點(diǎn)。
發(fā)明內(nèi)容
本發(fā)明讓電視觀眾可以選擇電視語(yǔ)音的語(yǔ)言,為了達(dá)到這種功能,把隱含字幕數(shù)據(jù)從電視信號(hào)中提取出來(lái)。隱含字幕數(shù)據(jù)主要是文字,提取的隱含字幕數(shù)據(jù)經(jīng)語(yǔ)音合成器處理生成所需語(yǔ)言的語(yǔ)音。
一個(gè)用戶接口可以讓用戶從語(yǔ)音合成器提供的多種語(yǔ)言中選擇一種,用戶接口可以包括電視屏幕顯示等。在一個(gè)實(shí)施例中,用戶通過(guò)電視遙控所述屏幕顯示進(jìn)行交互。
由于電視信號(hào)已經(jīng)包含第一種語(yǔ)言的音頻,當(dāng)選擇另外一種語(yǔ)言時(shí),該音頻會(huì)被置于無(wú)聲狀態(tài),這樣,電視節(jié)目攜帶的音頻就不會(huì)干擾語(yǔ)音合成器的音頻輸出。
在一個(gè)實(shí)施例中,隱含字幕數(shù)據(jù)首先被轉(zhuǎn)換成文本,然后文本再轉(zhuǎn)換成語(yǔ)音。隱含字幕數(shù)據(jù)可以是所需語(yǔ)言的文字,也可能不是所需語(yǔ)言的文字,這種情況下,在合成語(yǔ)音之前,要將其翻譯成所需語(yǔ)言的文字。
實(shí)現(xiàn)本發(fā)明的實(shí)施例的設(shè)備包括一個(gè)隱含字幕處理器,用以從已經(jīng)有第一語(yǔ)言音頻的電視節(jié)目中把隱含字幕數(shù)據(jù)提取出來(lái),隱含字幕數(shù)據(jù)代表文字。一個(gè)語(yǔ)音合成器,用來(lái)把隱含字幕數(shù)據(jù)代表的文字轉(zhuǎn)化成第二種語(yǔ)言的語(yǔ)音。
用戶接口,用以讓用戶選擇第二種語(yǔ)言。它可以包括一個(gè)可以讓用戶操控電視屏幕顯示的遙控器,一個(gè)啞音電路,當(dāng)語(yǔ)音合成器輸出替換的語(yǔ)音時(shí),將電視信號(hào)的音頻置于無(wú)聲狀態(tài)。
本發(fā)明至少有一部分可以由軟件程序?qū)崿F(xiàn),用來(lái)以所需語(yǔ)言提供電視語(yǔ)音。該軟件包括,一個(gè)隱含字幕處理模塊,用以從已經(jīng)有第一語(yǔ)言音頻的電視節(jié)目中把隱含字幕數(shù)據(jù)提取出來(lái),所述隱含字幕數(shù)據(jù)代表文字,該軟件可進(jìn)一步包括一個(gè)語(yǔ)音合成模塊,用來(lái)將所述隱含字幕數(shù)據(jù)代表的文字轉(zhuǎn)換成第二語(yǔ)言的語(yǔ)音。
該軟件還可進(jìn)一步包括一個(gè)用戶接口模塊,讓用戶從多個(gè)不同的語(yǔ)言中選擇一種作為第二語(yǔ)言。例如,用戶接口模塊可以包括一段軟件代碼,用以產(chǎn)生一個(gè)屏幕顯示讓用戶通過(guò)遙控器選擇想要的第二語(yǔ)言。還可以有一個(gè)啞音模塊,當(dāng)語(yǔ)音合成模塊輸出替換的語(yǔ)音時(shí),啟動(dòng)啞音電路將電視信號(hào)的音頻置于無(wú)聲狀態(tài)。
軟件程序中的隱含字幕模塊可以設(shè)計(jì)成能夠把隱含字幕數(shù)據(jù)轉(zhuǎn)化成文本,由語(yǔ)音合成模塊處理成語(yǔ)音,文本可能是所需語(yǔ)言,也可能不是所需語(yǔ)言的文字,這種情況下,語(yǔ)音合成模塊可以先將其翻譯成第二語(yǔ)言再處理成語(yǔ)音,軟件程序可以以機(jī)讀媒體提供。
還有一種方法,在電視信號(hào)中提供多種語(yǔ)言其中一種的音頻。電視信號(hào)中包含其中一種語(yǔ)言的音頻,用戶從中選擇一種語(yǔ)言,如果所需語(yǔ)言并不是電視信號(hào)中包含的語(yǔ)言,電視信號(hào)中包含的語(yǔ)言就會(huì)被轉(zhuǎn)換成所需語(yǔ)言的音頻表示,一種情況,語(yǔ)言由隱含字幕信號(hào)提供的文本轉(zhuǎn)換,另一種情況,語(yǔ)言由電視信號(hào)的音頻轉(zhuǎn)換。
圖1表示本發(fā)明系統(tǒng)的主要部件的框圖;圖2表示應(yīng)用于本發(fā)明的軟件舉例的框圖。
具體實(shí)施例方式
本發(fā)明利用隱含字幕數(shù)據(jù)的文字,以及一個(gè)語(yǔ)音合成器,使電視音頻以所需語(yǔ)言輸出。這樣,看電視時(shí),觀眾就可以選擇與節(jié)目相關(guān)聯(lián)的主語(yǔ)言以外的另一種語(yǔ)言,作為聽(tīng)節(jié)目的語(yǔ)言。以前,觀眾要想聽(tīng)到節(jié)目隨帶的語(yǔ)言以外的語(yǔ)言,節(jié)目提供者就得在節(jié)目上提供另一種語(yǔ)言。這種需求限制了語(yǔ)言的數(shù)目,而且讓節(jié)目提供者承擔(dān)提供額外語(yǔ)言的重負(fù)。本發(fā)明解決了這一問(wèn)題,它利用隱含字幕數(shù)據(jù)和文本至語(yǔ)音轉(zhuǎn)換器(也就是一個(gè)語(yǔ)音合成器),把隱含字幕文本轉(zhuǎn)換成用戶選擇的語(yǔ)言,提供給用戶的是所選擇的語(yǔ)言而不是節(jié)目隨帶的語(yǔ)言。
圖1表示本發(fā)明的相關(guān)硬件部件,一個(gè)隱含字幕處理器10從收到的電視節(jié)目中將隱含字幕數(shù)據(jù)(例如以文本的形式)提取出來(lái),隱含字幕數(shù)據(jù)被傳給文本至語(yǔ)音處理器12,它包含文本識(shí)別轉(zhuǎn)換軟件,用來(lái)將隱含字幕數(shù)據(jù)轉(zhuǎn)換成所需語(yǔ)言。盡管圖1表示處理器12可以把隱含字幕文本從英語(yǔ)轉(zhuǎn)換成西班牙語(yǔ)、德語(yǔ)、法語(yǔ)和俄語(yǔ),應(yīng)當(dāng)指出的是,只要有適當(dāng)?shù)能浖?,任何語(yǔ)言都可以作為起始語(yǔ)言,也可以提供任何目標(biāo)語(yǔ)言。
文本至語(yǔ)音處理器技術(shù)已廣為人知,任何適當(dāng)?shù)脑O(shè)備都可用以實(shí)施本發(fā)明,例如,日本東京的Oki Electric Industry Co.,Ltd.(Oki電子工業(yè)有限公司)銷售的MSM7630型多路語(yǔ)音控制處理器能夠?qū)Π朗接⒄Z(yǔ)、歐洲英語(yǔ)、法語(yǔ)、德語(yǔ)、西班牙語(yǔ)和日語(yǔ)的六種語(yǔ)言進(jìn)行文本至語(yǔ)音合成,該產(chǎn)品利用具有12位數(shù)模轉(zhuǎn)換器的一個(gè)大型集成電路芯片,通過(guò)時(shí)域音調(diào)同步疊加技術(shù)(time domain-pitch synchronousoverlap-add technology)來(lái)提供人聲音中的聲波,從而提供自然發(fā)音,根據(jù)不同的應(yīng)用,可以使用串口和并口,對(duì)用戶詞典進(jìn)行編程以擴(kuò)大詞匯量,也可使用閃存(只讀存儲(chǔ)器)以便輕松升級(jí)。
本發(fā)明的文本至語(yǔ)音處理器12被編程以能夠輸出任何所需語(yǔ)言,語(yǔ)言還可以更換和擴(kuò)充。例如,通過(guò)下載到設(shè)備上的軟件模塊,或者在設(shè)備的插口插入一個(gè)永久存儲(chǔ)卡(例如閃存)。為了進(jìn)行語(yǔ)言選擇,還可以為用戶提供一個(gè)電動(dòng)開(kāi)關(guān),或者圖形化用戶接口GUI。在一個(gè)實(shí)施例中,一個(gè)圖形化用戶接口(例如利用標(biāo)準(zhǔn)屏幕顯示軟硬件)出現(xiàn)在用戶的電視屏幕上,上面列出該設(shè)備能“說(shuō)”的語(yǔ)言,用戶可以利用電視遙控器14選擇一種語(yǔ)言,例如,按下對(duì)應(yīng)于所需語(yǔ)言的按鈕(比如數(shù)字按鈕),用戶接口檢測(cè)到遙控感應(yīng)(比如通過(guò)紅外線接收),啟動(dòng)文本至語(yǔ)音處理器把收到的隱含字幕文本轉(zhuǎn)換成所需的語(yǔ)言。
如果選擇了節(jié)目隨帶的主語(yǔ)言以外的一種語(yǔ)言,文本至語(yǔ)音處理器12就向開(kāi)關(guān)20發(fā)出一個(gè)切換信號(hào),使文本至語(yǔ)音處理器的輸出與電視音頻放大器22和揚(yáng)聲器24連接。當(dāng)開(kāi)關(guān)20與文本至語(yǔ)音處理器連接時(shí),原節(jié)目音頻因?yàn)榕c音頻電路22、24斷開(kāi),所以處于無(wú)聲狀態(tài)。要想聽(tīng)節(jié)目原來(lái)的語(yǔ)言,就切換開(kāi)關(guān)20,使原來(lái)的電視音頻輸出與放大器22和揚(yáng)聲器24連接。
圖2給出了一個(gè)處理流程圖和用于實(shí)現(xiàn)本發(fā)明的軟件組件。特別指出,用戶輸入30傳遞給一個(gè)處理器32,處理器32可以是一個(gè)已經(jīng)安裝在電視機(jī)頂盒里的微處理器。微處理器控制的機(jī)頂盒例如美國(guó)賓夕法尼亞州摩托羅拉公司寬帶通信部生產(chǎn)的DCT5000。處理器還接收包含主語(yǔ)言音頻部分和隱含字幕數(shù)據(jù)的數(shù)字電視信號(hào)。需要指出,盡管圖2說(shuō)明了數(shù)字電視信號(hào)的處理過(guò)程,但是,隱含字幕數(shù)據(jù)也可以由模擬電視信號(hào)攜帶,再被提取出來(lái)以數(shù)字形式輸入到處理器32。
處理器32以傳統(tǒng)方式為用戶電視提供視頻34和音頻36,根據(jù)本發(fā)明,所包括的軟件38用以提供可以選擇替換語(yǔ)言的電視音頻36。軟件38可以安裝在機(jī)頂盒的永久存儲(chǔ)部分(例如ROM),可以在工廠或商店里安裝,或者通過(guò)有線電視網(wǎng)、電話線以及無(wú)線通信途徑下載到機(jī)頂盒。軟件還可以存儲(chǔ)在與機(jī)頂盒連接的個(gè)人多功能存儲(chǔ)器、個(gè)人電腦等的硬盤和其他存儲(chǔ)部分。
如圖2所示,軟件38包括一個(gè)使隱含字幕處理能把隱含字幕數(shù)據(jù)從電視信號(hào)中提取出來(lái)的隱含字幕處理模塊,該隱含字幕處理模塊把隱含字幕數(shù)據(jù)以文本形式提供給一個(gè)語(yǔ)音合成模塊,把文本轉(zhuǎn)換成所要的語(yǔ)言,并把由文本轉(zhuǎn)化成的語(yǔ)音提供給用戶電視或其他視頻設(shè)備(比如磁帶錄像機(jī)、PVR等)的音頻電路。
軟件38還包括一個(gè)用戶接口模塊,它提供一個(gè)屏幕顯示讓用戶可以選擇他們想聽(tīng)的語(yǔ)言,該用戶接口模塊還負(fù)責(zé)電視(或者機(jī)頂盒,VCR,PVR等)遙控輸入的信號(hào)的解碼。還有一個(gè)啞音模塊,用來(lái)將主要節(jié)目音頻輸出置于無(wú)聲狀態(tài),從而可以通過(guò)電視音頻系統(tǒng)聽(tīng)到所選擇的替換語(yǔ)言。需要指出的是,圖2所示的實(shí)例只是用來(lái)說(shuō)明本發(fā)明的目的,根據(jù)本發(fā)明還可以提供其他的實(shí)例。
這里應(yīng)該指出,本發(fā)明給出了隱含字幕數(shù)據(jù)的一種新用途。這些數(shù)據(jù)用來(lái)讓能聽(tīng)到語(yǔ)音的觀眾可以聽(tīng)到不同語(yǔ)言的語(yǔ)音,而不是為聽(tīng)力障礙者提供字幕文本。隱含字幕數(shù)據(jù)也可以以不同的語(yǔ)言由電視信號(hào)攜帶,可以直接輸入到語(yǔ)音處理器,轉(zhuǎn)換成語(yǔ)音而無(wú)需翻譯。
盡管通過(guò)一個(gè)具體實(shí)例說(shuō)明了本發(fā)明,但是應(yīng)當(dāng)理解,可以進(jìn)行各種改動(dòng)和變型而不脫離本發(fā)明的權(quán)利要求所述的范圍。
權(quán)利要求
1.一種以選定的語(yǔ)言提供電視語(yǔ)音的方法,該方法包括把隱含字幕數(shù)據(jù)從電視信號(hào)中提取出來(lái),所述隱含字幕數(shù)據(jù)代表文字;以及用一個(gè)語(yǔ)音合成器對(duì)提取出來(lái)的隱含字幕數(shù)據(jù)進(jìn)行處理,提供所需語(yǔ)言的所述文字的語(yǔ)音。
2.如權(quán)利要求1所述的方法,包括提供一個(gè)用戶接口,讓用戶從語(yǔ)音合成器能夠提供的多種語(yǔ)言中選擇一種語(yǔ)言。
3.如權(quán)利要求2所述的方法,其中所述用戶接口包括一個(gè)電視屏幕顯示。
4.如權(quán)利要求3所述的方法,其中所述用戶通過(guò)一個(gè)電視遙控器所述屏幕顯示進(jìn)行交互。
5.如權(quán)利要求1所述的方法,其中所述電視信號(hào)包括一音頻部分和一視頻部分,所述方法包括進(jìn)一步將所述音頻部分置于無(wú)聲狀態(tài)。
6.如權(quán)利要求1所述的方法,其中所述處理步驟把所述隱含字幕數(shù)據(jù)轉(zhuǎn)換成文本,然后將所述文本轉(zhuǎn)換成語(yǔ)音。
7.如權(quán)利要求1所述的方法,其中所述隱含字幕數(shù)據(jù)代表所述所需語(yǔ)言的文字。
8.如權(quán)利要求1所述的方法,其中所述隱含字幕數(shù)據(jù)代表不同于所述所需語(yǔ)言的另一種語(yǔ)言的文字,所述處理步驟把所述文字翻譯成所需語(yǔ)言。
9.一種以選定的語(yǔ)言提供電視語(yǔ)音的裝置,該裝置包括一隱含字幕處理器,用以把隱含字幕數(shù)據(jù)從帶有第一語(yǔ)言音頻部分的電視信號(hào)中提取出來(lái),所述隱含字幕數(shù)據(jù)代表文字;以及一個(gè)語(yǔ)音合成器,用來(lái)把所述隱含字幕數(shù)據(jù)代表的文字轉(zhuǎn)換成第二種語(yǔ)言的語(yǔ)音。
10.如權(quán)利要求9所述的裝置,進(jìn)一步包括一個(gè)與所述語(yǔ)音合成器可操作地相聯(lián)系的用戶接口,讓用戶可以從多種不同的語(yǔ)言中選擇出一種作為所述第二種語(yǔ)言。
11.如權(quán)利要求10所述的裝置,其中所述用戶接口包括一個(gè)電視屏幕顯示。
12.如權(quán)利要求11所述的裝置,其中所述用戶接口進(jìn)一步包括所述用戶用來(lái)與所述屏幕顯示進(jìn)行交互的遙控器。
13.如權(quán)利要求9所述的裝置,進(jìn)一步包括一個(gè)啞音電路,用于在所述語(yǔ)音合成器提供替換的語(yǔ)音時(shí),將所述電視信號(hào)的音頻部分置于無(wú)聲狀態(tài)。
14.如權(quán)利要求9所述的裝置,其中所述隱含字幕處理器將所述隱含字幕數(shù)據(jù)轉(zhuǎn)換成文本以由所述語(yǔ)音合成器處理成語(yǔ)音。
15.如權(quán)利要求14所述的裝置,其中所述文本是所述的第二語(yǔ)言文本。
16.如權(quán)利要求14所述的裝置,其中所述文本是所述第二語(yǔ)言以外的一種語(yǔ)言的文本,所述語(yǔ)音合成器能夠?qū)⑺鑫谋痉g成所述第二語(yǔ)言以處理成語(yǔ)音。
17.一種以選定的語(yǔ)言提供電視語(yǔ)音的軟件程序,該程序包括一個(gè)隱含字幕處理模塊,用于把隱含字幕數(shù)據(jù)從具有第一語(yǔ)言音頻部分的電視信號(hào)中提取出來(lái),所述隱含字幕數(shù)據(jù)代表文字;以及一個(gè)語(yǔ)音合成模塊,用于將所述隱含字幕數(shù)據(jù)代表的文字轉(zhuǎn)換成第二種語(yǔ)言的語(yǔ)音。
18.如權(quán)利要求17所述的軟件程序,進(jìn)一步包括一個(gè)用戶接口模塊,讓用戶可以從多種不同的語(yǔ)言中選擇出一種作為所述的第二語(yǔ)言。
19.如權(quán)利要求18所述的軟件程序,其中所述用戶接口模塊包括能產(chǎn)生一個(gè)屏幕顯示讓所述用戶可以使用遙控器選擇第二語(yǔ)言的軟件代碼。
20.如權(quán)利要求17所述的軟件程序,進(jìn)一步包括一個(gè)啞音模塊,用以在所述語(yǔ)音合成模塊輸出替換的語(yǔ)音時(shí),啟動(dòng)一啞音電路將所述電視信號(hào)的音頻部分置于無(wú)聲狀態(tài)。
21.如權(quán)利要求17所述的軟件程序,其中所述隱含字幕模塊將所述隱含字幕數(shù)據(jù)轉(zhuǎn)換成文本以由所述語(yǔ)音合成模塊處理成語(yǔ)音。
22.如權(quán)利要求21所述的軟件程序,其中所述文本是所述第二語(yǔ)言文本。
23.如權(quán)利要求21所述的軟件程序,其中所述文本是所述第二語(yǔ)言以外的另一語(yǔ)言文本,所述語(yǔ)音合成模塊用以將所述文本翻譯成所述第二語(yǔ)言以用來(lái)處理成語(yǔ)音。
24.一個(gè)含有權(quán)利要求17所述軟件程序的機(jī)讀媒體。
25.一種根據(jù)電視信號(hào)以多種語(yǔ)言中的一種語(yǔ)言提供音頻的方法,所述電視信號(hào)包含所述語(yǔ)言之一的所述音頻,該方法包括允許用戶從所述語(yǔ)言中選擇一種;以及如果所選擇的語(yǔ)言并不包含在所述電視信號(hào)中,就將包含在所述電視信號(hào)中的語(yǔ)言轉(zhuǎn)換成所選擇的語(yǔ)言,以音頻提供給所述用戶。
26.如權(quán)利要求25所述的方法,其中所述語(yǔ)言是由隱含字幕信號(hào)提供的文本轉(zhuǎn)換來(lái)的。
27.如權(quán)利要求25所述的方法,其中所述語(yǔ)言是由所述電視信號(hào)的音頻部分轉(zhuǎn)換來(lái)的。
全文摘要
根據(jù)收到的電視信號(hào)中的隱含字幕數(shù)據(jù),以所需語(yǔ)言提供電視語(yǔ)音。代表文字的隱含字幕數(shù)據(jù)從電視信號(hào)中被提取,然后,隱含字幕數(shù)據(jù)經(jīng)過(guò)一個(gè)語(yǔ)音合成器的處理,生成所述文字的所需語(yǔ)言的語(yǔ)音。隱含字幕數(shù)據(jù)在轉(zhuǎn)換成語(yǔ)音的同時(shí)或者以前由第一語(yǔ)言被翻譯成第二語(yǔ)言?;蛘?,電視信號(hào)攜帶的隱含字幕數(shù)據(jù)可以有多種語(yǔ)言,所需語(yǔ)言的數(shù)據(jù)可以從電視信號(hào)中被選擇和提取出來(lái)并轉(zhuǎn)換成語(yǔ)音。
文檔編號(hào)H04N5/60GK1407795SQ02141460
公開(kāi)日2003年4月2日 申請(qǐng)日期2002年8月30日 優(yōu)先權(quán)日2001年8月30日
發(fā)明者C·J·斯通 申請(qǐng)人:通用儀器公司