專利名稱:視頻信號中編碼文本的翻譯的制作方法
視頻信號中編碼文本的翻譯
本發(fā)明專利申請是國際申請?zhí)枮镻CT/US2004/033167,國際申請日為2004年10 月7日,進(jìn)入中國國家階段的申請?zhí)枮?00480037755. 3,名稱為“視頻信號中編碼文本的翻 譯”的發(fā)明專利申請的分案申請。
背景
本發(fā)明涉及使用廣播和多播媒體表示文本的領(lǐng)域,具體地說,涉及當(dāng)在廣播或多 播頻道上接收到編碼文本時,翻譯所述編碼文本。
現(xiàn)在許多廣播和多播視頻信號包括可以在電視或其他顯示設(shè)備上顯示的文本。 一種此類文本是隱藏式字幕(CC)文本。典型地,CC文本是視頻中所說的文字的抄本 (transcription),此抄本有時還有對聲道(soundtrack)中具有少量文字的部分的描述性 敘述。開始CC文本是為了方便有聽力障礙的殘障人士,后來CC文本也用在周圍噪音級別 (或者很高或者很低)使得信號中音頻部分很難聽見的環(huán)境中,例如酒吧、餐館、機(jī)場、醫(yī)務(wù)主寸。
存在被包括在視頻信號中的其他文本服務(wù),所述服務(wù)包括可以包含文本的 TeleText, Ceefax和Oracle,所述文本涉及節(jié)目、電子節(jié)目指南、新聞、體育和緊急通告以 及許多其他類型的信息?,F(xiàn)在,大多數(shù)文本服務(wù)被編碼到視頻信號的VBI (垂直消隱間隔) 內(nèi)。但是,數(shù)字視頻信號,包括MPEG-2(活動圖像專家組)編碼信號,也被構(gòu)建(structure) 來將一些文本數(shù)據(jù)與信號的音頻與視頻部分一同攜帶(carry)。
在任何視頻信號中可以攜帶的文本數(shù)量受編碼系統(tǒng)的限制。使用VBI系統(tǒng)僅具有 有限量的用于攜帶文本的容量。由于CC文本必須全部被攜帶在VBI的21線上,所以存在 有限的可以被編碼到每幀內(nèi)的字符數(shù)。此外,可以被傳輸?shù)淖址透袷?formatting)的類 型受到限制,例如,既不支持Cyrillic、Arabic和Asian字符也不能修改這些字符的大小和 字體。TeleText具有更好的性能,但是仍然顯著地受到限制。
嵌入式文本信號也受到信號創(chuàng)建者或提供者決定傳送的內(nèi)容的限制。例如在美 國,可以獲得英語CC文本,并且通??梢垣@得西班牙語的文本。信號中的容量和市場需求 幾乎無法考慮任何其他選擇。由于缺乏容量和市場需求,不支持將文本翻譯成葡萄牙語、亞 美尼亞語、匈牙利語和許多其他語言。不能提供到中文、保加利亞語、泰語和希伯來語的翻 譯,是因為編碼結(jié)構(gòu)不支持在這些和許多其他語言中使用的字符。TeleText和其他編碼文 本傳輸系統(tǒng)遭遇類似的約束。
附圖簡要說明
從下面給出的詳細(xì)說明和本發(fā)明的各種實施方案的附圖將能夠更完整地理解本 發(fā)明。然而,這些附圖并不把本發(fā)明限制于特定實施方案,而僅僅是用于解釋和理解。
圖1是根據(jù)本發(fā)明的一個實施方案,翻譯隱藏式字幕文本的流程圖2是根據(jù)本發(fā)明的一個實施方案,隱藏式字幕文本翻譯系統(tǒng)的框圖3是適合于實現(xiàn)本發(fā)明的實施方案的媒體中心的框圖;以及
圖4是適合于與本發(fā)明一起使用的娛樂系統(tǒng)的框圖。
詳細(xì)描述
參見圖1,隱藏式字幕或其他類型的編碼文本數(shù)據(jù)可以被翻譯成用戶選擇的任何 語言。首先,在框13中接收具有編碼文本數(shù)據(jù)的視頻信號??梢詮娜我獾母鞣N不同來源, 例如錄像帶、盤或存儲器播放器、網(wǎng)絡(luò)連接或廣播調(diào)諧器接收視頻信號。這些視頻信號的一 個普遍來源是通過無線和有線(cable)媒體的電視廣播。這些信號可以是任意的支持編碼 文本的類型。美國已經(jīng)采用NTSC(全國電視標(biāo)準(zhǔn)委員會)和ATSC(先進(jìn)電視系統(tǒng)委員會) 標(biāo)準(zhǔn),而歐洲已經(jīng)采用PAL(逐行倒相)和SECAM (順序傳送彩色與記憶)標(biāo)準(zhǔn)等等,而且日 本還使用不同的標(biāo)準(zhǔn)。
編碼文本可以對應(yīng)許多不同的格式,所述格式使用在用于傳輸編碼文本的這些和 其他標(biāo)準(zhǔn)中。在模擬視頻信號中,編碼文本通常在對應(yīng)于信號的VBI (垂直消隱間隔)的光 柵掃描線中傳輸。CC(隱藏式字幕)、Videotex、TeleText、Ceefax、Oracle和其他標(biāo)準(zhǔn)也使 用VBI中的線。
數(shù)字信號還分配每個分組(packet)的某個部分用于文本數(shù)據(jù)的傳輸。ATSC分派 (allocate)9600比特每秒的數(shù)據(jù)速率供隱藏式字幕使用。這是NTSC系統(tǒng)中的容量的10倍, 并且擴(kuò)展了提供修飾(embellished)文本特性、多種顏色、更多語言頻道以及許多其他特 征的能力。HD-SDI(高清晰串行數(shù)字接口)隱藏式字幕和相關(guān)數(shù)據(jù)攜帶在HD-SDI比特流、 圖像用戶數(shù)據(jù)、節(jié)目映射表(PMT)和事件信息表(EIT)的三個分別的部分中。字幕文本和 窗體命令被攜帶在HD-SDI運(yùn)送頻道中(所述頻道依次地被攜帶在圖像用戶位中)。HD-SDI 字幕頻道服務(wù)目錄被攜帶在PMT中,并且用電纜可選地攜帶在EIT中。
存在許多其他使用中和開發(fā)中的文本編碼系統(tǒng)。上面提及的文本編碼系統(tǒng)被提供 來作為實施例。本發(fā)明可以被應(yīng)用于任何編碼或同時傳輸?shù)奈谋荆还苁侨绾谓邮?、編碼 或調(diào)制所述文本的。所述文本可以包括嵌入式和邊帶(sideband)文本數(shù)據(jù)以及在不同頻 道、頻率或流上提供的補(bǔ)充(supplemental)文本數(shù)據(jù)。
接收完視頻信號后,在框15中編碼文本數(shù)據(jù)被解碼。解碼可以由常規(guī)的CC或 TeleText解碼器執(zhí)行,所述解碼器在商業(yè)上可以從很多種類的不同來源獲得??商鎿Q 地,解碼器可以是一般化的數(shù)字解碼器或其他視頻處理設(shè)備的部分。對于本發(fā)明的NTSC CC文本實施方案而言,解碼器讀取VBI的21線上的信號,并將這些信號解碼成字母數(shù)字 (alphanumeric)字符。不同的模擬和視頻標(biāo)準(zhǔn)應(yīng)用不同的規(guī)范(convention)。
解碼處理的結(jié)果通常是與視頻同步的有序文本串。文本可以使用與視頻節(jié)目相 同的語言(例如CC或Oracle文本),或者使用與視頻節(jié)目不同的語言(例如對白字幕 (subtitle))。但是,使用一些文本系統(tǒng)時,文本不需要或不要求任何與視頻的同步。例如, 如果文本涉及職業(yè)體育比賽的比分,那么比分可以與當(dāng)前視頻的時間安排(timing)沒有 任何顯著的關(guān)系。例如,Oracle被用來傳送視頻聲道的抄本,而TeleText提供一般新聞信 息,所述一般新聞信息與攜帶它的視頻沒有特定的關(guān)系。
在框17中翻譯已解碼文本數(shù)據(jù)。翻譯可以以不同的方式發(fā)生。在一個實施方案 中,向電子字典查詢所述文本,所述電子字典將初始語言的文字替換為另一種語言的文字。 通過為語言提供合適的字典,可以支持任何語言。使用軟件翻譯系統(tǒng),可以調(diào)整翻譯的語 法、用法、術(shù)語和其他細(xì)微差別,以提供經(jīng)改進(jìn)的翻譯。可以使用任何各種不同的翻譯系統(tǒng)。 翻譯導(dǎo)致另一種語言的新的文本流。
然后,已翻譯文本可以在框19中與視頻信號組合在一起。與視頻的此組合可以通過用新文本替換初始的編碼文本來完成,或者可以創(chuàng)建組合了文本和視頻的全新視頻信 號。如何顯示已翻譯文本的選擇將取決于包括接收器和顯示系統(tǒng)的功能的具體應(yīng)用。
在另一個實施方案中,不翻譯文本。文本被如上所述地解碼,并且向字典查詢所述 文本。然而,通過提供與已解碼文本相同語言的字典,所述字典可以用來糾正編碼文本中的 拼寫、語法和句法錯誤。對于直播事件和一些低預(yù)算的作品(production),文本是被實時或 匆忙錄入的并且之后沒有被編輯。于是,字典可以用來糾正簡單的錯誤。然后,已糾正文本 可以如上面關(guān)于參考圖1的框19所描述的那樣與視頻信號組合在一起。
參見圖2,示出了能夠翻譯編碼文本的調(diào)諧器系統(tǒng)11。此系統(tǒng)可以被構(gòu)建在單個 適配器卡或印刷電路板上、在單個模塊上,或者可以從更大系統(tǒng)中的不同位置上連接在一 起,所述系統(tǒng)的一個實施例是在圖3中示出的媒體中心。此系統(tǒng)可以是電視或視頻顯示器、 視頻或音頻記錄器、用于連接到娛樂系統(tǒng)的分離的調(diào)諧器或任何各種其他設(shè)備。
圖2的調(diào)諧器系統(tǒng)11具有一個或更多個模擬、數(shù)字或組合視頻調(diào)諧器13。所述調(diào) 諧器可以具有相同類型,以允許畫中畫觀看或同步觀看和記錄(recording),或者它們可以 具有不同類型,以允許接收不同種類的來源。調(diào)諧器可以用于各種不同的模擬和數(shù)字電視 或視頻信號(不論是廣播、多播還是點(diǎn)到點(diǎn))中的任意一種。實施例包括NTSC、ATSC信號, PAL(逐行倒相)、各種可能的標(biāo)準(zhǔn)下的有線電視信號,或任何其他類型的音頻或視頻信號。
在本實施例中,調(diào)諧器被耦合到電視同軸電纜、陸地廣播天線或DBS(直播衛(wèi)星) 天線,并創(chuàng)建應(yīng)用于其他組件的MPEG-2(活動圖像專家組)編碼信號。優(yōu)選的(preferred) 輸出信號的準(zhǔn)確性質(zhì)(nature)將取決于特定的設(shè)備。作為替換,調(diào)諧器可以包括解碼器, 從而產(chǎn)生未壓縮的數(shù)字或模擬視頻輸出信號。
在本實施例中,調(diào)諧器輸出信號被應(yīng)用于隱藏式字幕(CC)解碼器27,以從已調(diào) 諧信號中提取數(shù)字字符串。被提取的字符串被傳送到CC邏輯(logic) 29,所述CC邏輯四 決定CC文本是否應(yīng)該被示出和是否應(yīng)該被翻譯。此邏輯可以駐留在調(diào)諧器系統(tǒng)中或者駐 留在系統(tǒng)中的某個其他處理器中?;谶@些決定,文本可以被傳送到翻譯引擎31,所述翻 譯引擎向字典15查詢所述文本。所述字典提供使用其自身語言的單詞、短語、表達(dá)或直 譯(transliteration)來替換CC文本。對CC文本的實施例來講,文本通常包括常用短語 (stockphrase),所述常用短語傳遞(relay)關(guān)于場景中接下來是什么的信息。這些短語可 能翻譯得不好。因此,為CC文本的常用短語特別設(shè)計的自定義字典可以用來增強(qiáng)翻譯的可 理解性。
已翻譯CC文本被傳送回CC邏輯以供使用。CC邏輯、翻譯引擎和字典可以全部在 相同硬件中實現(xiàn)或在系統(tǒng)的不同部分中實現(xiàn)。字典可以存入可重寫存儲器,從而可以為不 同的用戶支持不同的語言??梢栽趩蝹€組件內(nèi)或者在通信總線(例如I2C(Inter-IC,飛利 浦半導(dǎo)體設(shè)計的一種總線))或任何其他類型數(shù)據(jù)總線上執(zhí)行這些通信。
同樣類型的翻譯處理也可以被應(yīng)用于音頻信號。已經(jīng)提出各種標(biāo)準(zhǔn)用于補(bǔ)充具有 文本的廣播音頻,并且一些衛(wèi)星無線電系統(tǒng)已經(jīng)這樣做了。AM(調(diào)幅)和FM(調(diào)頻)廣播無 線電可以攜帶包括PTY(節(jié)目類型)數(shù)據(jù)的RDS (無線電數(shù)據(jù)系統(tǒng))文本。翻譯可以被應(yīng)用 于此文本或任何其他嵌入或旁帶數(shù)據(jù),從而在被顯示前所述數(shù)據(jù)被提取和翻譯。
替換上面描述的RF(射頻)調(diào)諧器或除上面描述的RF(射頻)調(diào)諧器之外,可以使 用復(fù)合視頻調(diào)諧器。此設(shè)備可以允許系統(tǒng)接收來自錄像機(jī)、攝像機(jī)、外部調(diào)諧器或任何其他6設(shè)備的視頻和音頻信號。然后,此信號可以通過解碼器27和翻譯引擎四以與任何其他視 頻或音頻信號相同的方式來處理。大量各種不同連接器可以被用于此調(diào)諧器,從同軸電纜 到RCA分量視頻、S-Video, DIN連接線、DVI (數(shù)字視頻接口)、HDMI (高清晰多媒體接口)、 VGA(視頻圖形適配器)等等。
如圖2進(jìn)一步示出,CC解碼器將視頻(包括任意音頻)頻道(channel)傳送到圖 形控制器或其他視頻信號處理設(shè)備的視頻平面(plane) 17。適當(dāng)?shù)脑O(shè)備可以是圖3的圖形 控制器41,但是也可以使用更強(qiáng)或更弱性能的組件。已翻譯CC文本在圖形平面19上被傳 送到相同控制器。這些信號在阿爾法混合器(blender)中被組合,以產(chǎn)生可以被視頻設(shè)備 顯示和存儲的信號。阿爾法混合器使用阿爾法值將視頻和圖形平面混合在一起,以提供菜 單、EPG(電子節(jié)目指南)數(shù)據(jù)和節(jié)目信息。視頻平面、圖形平面和阿爾法混合器的功能可 以由許多其他設(shè)備來執(zhí)行。圖2的體系結(jié)構(gòu)對于本發(fā)明不是必需的。
已混合的輸出可以或者是具有不同編碼文本的相同視頻信號,或者是包括作為視 頻圖像的部分的已翻譯文本的視頻信號。在一個實施方案中,觀眾被允許選擇編碼文本或 者作為圖形嵌入在視頻中的文本。通過編碼已翻譯文本和替換初始文本,圖形控制器允許 所有的常規(guī)的文本編碼、解碼和顯示技術(shù)來控制文本。例如,使用具有CC文本的NTSC信號 時,電視屏幕(monitor)可以使用電視的內(nèi)建解碼器顯示已翻譯文本。文本顯示功能可以 由電視控制,而無須將任何命令傳送到調(diào)諧器系統(tǒng)或CC邏輯。另一方面,將文本包括在視 頻圖像中,避免了在顯示器中對解碼器的需要并降低了對編碼文本與特定視頻幀同步的精 確性要求。
可替換地,通過生成已翻譯字符的圖形顯示并且將這些字符與視頻信號的圖像組 合在一起,文本數(shù)據(jù)系統(tǒng)的性能可以得到加強(qiáng)。例如,可以擴(kuò)展字符的數(shù)目。從英語到法語 的翻譯可能通常需要比原始的英語多百分之五十的字符。如果編碼文本已經(jīng)接近它的最大 容量,那么法語翻譯不能以與英語文本同樣的方式被編碼到視頻信號中。可以生成可視文 本、文字電視廣播、隱藏式字幕或其他文本系統(tǒng)不支持的其他字符。例如,具有編碼英語CC 文本的ATSC信號可以被翻譯成中文并使用傳統(tǒng)或現(xiàn)代漢字來顯示。在CC編碼中完全不支 持中文。
除了將文本疊加在視頻上,已翻譯文本可以以不同大小、字體、具有不同背景效果 的顏色等來被示出??梢栽陲@示器上提供任何可以被編程到視頻處理器21中的性能,而不 需要在所述顯示器中具有文本解碼器??梢詾橛^眾提供菜單來選擇文本的背景類型(例 如標(biāo)準(zhǔn)黑、其他顏色或透明)、文本的顏色、文本的位置以及字體和大小。例如,當(dāng)觀看的視 頻使用的格式比顯示器屏幕更寬時,觀眾可以選擇將文本放在比水平黑條更高或更低的位 置。如果文本被編碼回視頻信號中,則這是不可能的。
圖3示出適于使用上面描述的調(diào)諧器系統(tǒng)的媒體中心43的框圖。圖2的系統(tǒng)可 以是整個更大的系統(tǒng)。被示出并關(guān)于圖2描述的硬件足夠用來提供具有增強(qiáng)文本性能的集 成或機(jī)頂調(diào)諧器盒。它在調(diào)諧器13處接收輸入并提供來自阿爾法混合器21的輸出。通過 顯示器以及用戶輸入的用戶接口可以由邏輯引擎四來管理和處理??梢允褂么艓?、盤或存 儲器記錄器、使用附加的輸入和輸出或附加的調(diào)諧器來增加圖2的硬件。字典15可以被提 供為廠家默認(rèn)或者為可互換存儲器芯片或模塊。通過提供輸入/輸出接口,字典可以在相 同或不同的存儲器中被更新、修改或替換,以提供任何期望的一種或多種語言。輸入/輸出接口可以直接地或通過邏輯引擎四指向字典。
在圖3中,圖2的更簡單系統(tǒng)的性能被廣泛地增強(qiáng)了。使用例如上面描述的I2C 接口,圖2中的調(diào)諧器系統(tǒng)11被耦合到圖形控制器41。在一個實施方案中,視頻平面17、 圖形平面19和阿爾法混合器21都駐留在圖形控制器內(nèi)。但是,其他體系結(jié)構(gòu)也是可能的。 關(guān)于圖2描述的多個視頻、音頻和文本輸出被耦合到復(fù)用器51。如果需要的話,其他源也可 以被耦合到復(fù)用器,例如IEEE 1394裝置53被示為也被耦合到復(fù)用器。一些這樣的設(shè)備可 以包括磁帶播放器、盤播放器和MP3播放器等等。在圖形控制器控制下的復(fù)用器選擇調(diào)諧 器或其他輸入中的哪一個將被連接到媒體中心的其他部分。
被選出的調(diào)諧器輸入被耦合到復(fù)用器輸出。在本實施例中,這些復(fù)用器輸出分別 被路由到各自的MPEG-2編碼器53-1、53-2,并且隨后被路由到圖形控制器41。在數(shù)字電 視、無線電、數(shù)字電纜或衛(wèi)星信號的情況下,復(fù)用器可以將信號路由在MPEG-2編碼器周圍, 或者當(dāng)這些信號已經(jīng)被編碼時,禁止(disable)編碼過程。
來自圖形控制器的視頻和音頻信號可以是用于顯示、儲存或記錄的輸出。在一個 實施方案中,圖形控制器包括MPEG-2和MPEG-3解碼器以及視頻信號處理器,以格式化被期 望的裝置使用的視頻和音頻信號,并將命令、控制、菜單、消息和其他圖像與來自調(diào)諧器的 視頻和音頻組合起來。如下面所描述,圖形控制器可以驅(qū)動整個設(shè)備,或者僅操作用于在另 一個高級別處理器控制下的圖形功能。
為了簡單起見,圖3僅示出一個視頻輸出和一個音頻輸出,但是輸出的數(shù)目和種 類可以大大地依賴于具體應(yīng)用而變化。如果媒體中心作為調(diào)諧器來運(yùn)用,那么單個DVI或 分量視頻輸出連同單個數(shù)字音頻輸出(例如光學(xué)S/PDIF(索尼/飛利浦?jǐn)?shù)字接口))就可 能夠用。在示出的配置中,媒體中心可以被用作具有在屏幕上的畫中畫顯示的調(diào)諧器,或者 它可以被用來在示出另一個頻道的同時記錄一個頻道。如果媒體中心要提供更多功能,那 么可以期望一種或更多種不同類型的附加音頻和視頻連接。
用于視頻和音頻連接的實際連接器和格式可以具有許多不同類型和不同數(shù)目。一 些連接器格式包括同軸電纜、RCA復(fù)合視頻、S-Video、分量視頻、DIN(德國工業(yè)標(biāo)準(zhǔn))連接 器、DVI (數(shù)字視頻接口)、HDMI (高清晰多媒體接口)、VGA (視頻圖形適配器)以及甚至USB 和IEEE 1394。還存在對于具體應(yīng)用來說可能是優(yōu)選的幾種不同的專有連接器。可以修改 連接器的類型以適合于具體應(yīng)用,或者可以作為不同的連接器被采用。
媒體中心也可以包括大容量儲存設(shè)備,例如硬盤驅(qū)動器、易失性存儲器、磁帶驅(qū)動 器(例如用于VTR)或光驅(qū)動器。此設(shè)備可以用來存儲用于圖形控制器的指令、維持EPG(電 子節(jié)目指南)或記錄從調(diào)諧器系統(tǒng)接收到的音頻或視頻。
雖然對于許多消費(fèi)類電子、家庭娛樂和家庭影院設(shè)備,例如調(diào)諧器(陸地、有線和 衛(wèi)星機(jī)頂盒)、VTR、PVR和電視等等來說,上面描述的組件足夠用。可以使用下面描述的附 加組件的一些來提供另外的功能。此外,前置放大器和功率放大器、控制面板或顯示器(未 示出)可以按需要被耦合到圖形控制器。
媒體中心還可以包括耦合到主控制器63或芯片組的CPU(中央處理單元)61。 可以使用任意數(shù)目的不同CPU和芯片組。在一個實施方案中,使用具有Intel 830芯片 組的移動Intel Celeron 處理器,但是本發(fā)明不受此限制。此處理器提供了足夠用的處 理能力、連通性和節(jié)能模式。主處理器具有耦合到I/O控制器中心(ICH)65 (例如Intel FW82801DB(ICH4))的北橋,以及耦合到板載存儲器67 (例如RAM (隨機(jī)訪問存儲器))的南 橋。芯片組還具有與圖形控制器41耦合的接口。注意,本發(fā)明不限于在此建議的處理器的 特定選擇。在一個實施方案中,如下所述,翻譯引擎31由CPU和芯片組提供,而字典15被 存儲在硬盤驅(qū)動器87上。
ICH 65提供針對寬范圍的不同設(shè)備的連通性。已經(jīng)良好確立的規(guī)定和協(xié)議可以用 于這些連接。連接可以包括LAN(局域網(wǎng))端口 69、USB集線器(USB hub) 71和本地BIOS(基 本輸入/輸出系統(tǒng))閃存73。SIO(超級輸入/輸出)端口 75可以為具有按鈕和顯示器的 前端面板77、鍵盤79、鼠標(biāo)81和紅外設(shè)備85 (例如紅外增強(qiáng)器(IR blaster)或遙控傳感 器)提供連通性。I/O端口還可以支持軟盤、并行端口以及串行端口連接。可替換地,這些 設(shè)備的任意一個或更多個可以從USB、PCI或任何其他類型的總線得到支持。
ICH還可以提供用于連接到盤驅(qū)動器87、89或其他大存儲器設(shè)備的IDE(集成電子 設(shè)備)總線。大容量儲存裝置可以包括硬盤驅(qū)動器和光驅(qū)動器。所以,例如軟件程序、用戶 數(shù)據(jù)、EPG數(shù)據(jù)和已記錄娛樂節(jié)目可以存儲在硬盤驅(qū)動器或其他驅(qū)動器上。除了 CD (致密 盤)外,DVD(數(shù)字多用途盤)和其他儲存媒體可以在耦合到IDE總線的驅(qū)動器上播放。
PCI (外設(shè)部件互連)總線91被耦合到ICH并且允許寬范圍的設(shè)備和端口被耦合 到ICH。圖3中的實施例包括WAN(廣域網(wǎng))端口 93、無線端口 95、數(shù)據(jù)卡連接器97和視頻 適配器卡99。存在更多可用于連接PCI端口的設(shè)備和大量更多可能的功能。PCI設(shè)備可以 允許到本地設(shè)備,例如攝像機(jī)、存儲器卡、電話、PDA(個人數(shù)字助理)或附近的計算機(jī)的連 接。它們還可以允許到各種外圍設(shè)備,例如打印機(jī)、掃描儀、錄制器(recorder)、顯示器等等 的連接。它們還可以允許到更多遠(yuǎn)程器件或者任意大量不同的接口的有線或無線連接。遠(yuǎn) 程器件可以允許節(jié)目或EPG數(shù)據(jù)的通信、維護(hù)(maintenance)或遙控,或者游戲、因特網(wǎng)沖 浪或其他性能。
最后,ICH被示為具有AC-Link (音頻編解碼鏈路)101 Jy^iAC-Link 101是支持 具有針對音頻和調(diào)制解調(diào)器的獨(dú)立功能的編解碼器的數(shù)字鏈路。在音頻區(qū)中,支持麥克風(fēng) 輸入和左右音頻信道。在圖3的實施例中,AC-Link支持用于連接到PSTN的調(diào)制解調(diào)器 103,以及到圖形控制器41的音頻鏈路。AC-Link將CPU、主控制器或ICH生成的任何音頻 傳送到圖形控制器,以與音頻輸出57集成(integration)。可替換地,ISA (工業(yè)標(biāo)準(zhǔn)結(jié)構(gòu)) 總線、PCI總線或任何其他類型的連接可以用來達(dá)到此目的。如從圖3中可以看到的,存在 許多不同方式來支持調(diào)諧器產(chǎn)生的信號和控制調(diào)諧器的操作。圖3的體系結(jié)構(gòu)允許寬范圍 的不同功能和性能。特定的設(shè)計將取決于特定的應(yīng)用。
圖4示出適于與圖3的媒體中心一起使用的娛樂系統(tǒng)111的框圖。圖4示出具有 寬范圍的已安裝器件的娛樂系統(tǒng)。此設(shè)備作為許多可能性的實施例被示出。本發(fā)明可以用 在簡單得多或復(fù)雜得多的系統(tǒng)中。圖3中所描述的媒體中心能夠支持通過WAN和LAN連 接、藍(lán)牙、IEEE 802. 11USB、1394、IDE、PCI和紅外的通信。此外,調(diào)諧器系統(tǒng)接收來自天線、 組件、和復(fù)合視頻與音頻以及IEEE 1394設(shè)備的輸入。這在設(shè)備類型方面提供了極高靈活 性和多樣性,所述設(shè)備可以被連接到媒體中心并且和媒體中心一起操作。隨著新接口被開 發(fā)出來并且根據(jù)媒體中心的具體應(yīng)用,其他接口可以被增加或被用來替換那些被描述的接 口。許多連接可以被移除以降低成本。圖4中示出的具體設(shè)備代表了可以適合于消費(fèi)者家 庭娛樂系統(tǒng)的配置的一個實施例。
媒體中心43具有上述的幾種不同的可能輸入。在圖4的實施例中,這些輸入包括 電視電纜117、廣播天線119、衛(wèi)星接收器121、視頻播放器123(例如磁帶或盤播放器)、音 頻播放器125(例如磁帶、盤或存儲器播放器)以及數(shù)字設(shè)備127(例如由IEEE 1394連接 來連接)。
處理、選擇和控制后,這些輸入可以用來為用戶生成輸出。這些輸出可以在屏幕 129、或投影儀131或任何其他類型的可察覺的視頻顯示器上被呈現(xiàn)(render)。音頻部分可 以通過放大器133 (例如A/V接收器或聲音處理引擎)被路由到達(dá)耳機(jī)135、揚(yáng)聲器137或 任何其他類型的聲音生成設(shè)備。輸出也可以被傳送到外部記錄器139,例如VTR、PVR、⑶或 DVD記錄器、存儲器卡等等。
媒體中心還提供通過例如電話端口 141和網(wǎng)絡(luò)端口 143連接到外部設(shè)備的連通 性。通過例如鍵盤145或遙控器147提供用戶接口,并且媒體中心可以通過其自身的紅外 端口 149與其他設(shè)備通信??梢瞥齼Υ嬖O(shè)備153可以允許在便攜式設(shè)備上存儲MP3壓縮音 頻并在以后播放所述音頻,或者允許在屏幕1 上顯示攝像機(jī)圖像。
存在許多不同的用于使用圖3的媒體中心的娛樂中心的設(shè)備配置以及要連接設(shè) 備的許多不同的可能選擇。使用典型的當(dāng)前可獲得設(shè)備的典型家庭娛樂系統(tǒng)可以如下所 述。作為輸入,所述典型家庭娛樂系統(tǒng)可以具有電視天線119以及到媒體中心的調(diào)諧器系 統(tǒng)的有線電視117輸入或DBS 121輸入中的一個。VTR或DVD記錄器可以被連接為輸入設(shè) 備123和輸出設(shè)備139??梢栽黾佑糜谝魳返蘑遣シ牌?25和MP3播放器127。此系統(tǒng) 還可以包括寬屏高清晰電視129,以及耦合到六個或八個揚(yáng)聲器137的環(huán)繞聲接收器133。 此同樣的用戶系統(tǒng)會擁有供用戶使用的小型遙控器147并且提供從媒體中心到電視、接收 器、VTR和⑶播放器的遙控操作149。網(wǎng)絡(luò)連接141和鍵盤145將允許網(wǎng)上沖浪、升級和信 息下載,而計算機(jī)網(wǎng)絡(luò)將允許文件交換以及在住宅內(nèi)的來自個人計算機(jī)或到個人計算機(jī)的 遠(yuǎn)程控制。
應(yīng)該意識到,比上面描述的實施例更少或更多裝備的娛樂系統(tǒng)和媒體中心對于某 些實現(xiàn)來說可能是優(yōu)選的。因此,娛樂系統(tǒng)和媒體中心的配置根據(jù)不同的實是變化的,這取 決于多個因素,例如價格約束、性能需求、技術(shù)改進(jìn)或其他情形。本發(fā)明的實施方案也可以 被應(yīng)用于其他類型的軟件驅(qū)動的系統(tǒng),所述系統(tǒng)使用與圖2、3和4示出的硬件體系結(jié)構(gòu)不 同的硬件體系結(jié)構(gòu)。
在以上描述中,出于解釋的目的,闡述了很多具體的細(xì)節(jié),以提供對本發(fā)明的完整 理解。然而,本領(lǐng)域的技術(shù)人員將會清楚,無需使用這些具體的細(xì)節(jié)中的一些就可以實現(xiàn)本 發(fā)明。此外,公知結(jié)構(gòu)和裝置以框圖形式被示出。
本發(fā)明可以包括各種步驟。本發(fā)明的步驟可以由硬件組件(例如圖2、3和4中示 出的那些)執(zhí)行,或者可以以機(jī)器可執(zhí)行指令具體實施,所述指令可以用來導(dǎo)致使用所述 指令編程的通用或?qū)S玫奶幚砥骰蛘哌壿嬰娐穲?zhí)行所述步驟??商鎿Q地,所述步驟可以由 硬件和軟件的組合來執(zhí)行。
本發(fā)明可以被提供為可以包括其上存有指令的機(jī)器可讀介質(zhì)的計算機(jī)編程產(chǎn)品, 所述指令可以用來給媒體中心(或其他電子設(shè)備)編程,以根據(jù)本發(fā)明來執(zhí)行處理。機(jī)器 可讀介質(zhì)可以包括,但不限于,軟盤、光盤、CD-ROM和磁光盤、ROM、RAM、EPROM、EEPR0M、磁卡 或光卡、閃存存儲器或是適于存儲電子指令的其他類型的媒體/機(jī)器可讀介質(zhì)。此外,本發(fā)明還可以作為計算機(jī)編程產(chǎn)品被下載,其中,所述程序可以以載波或其他傳播介質(zhì)具體實 施的數(shù)據(jù)信號的方式,經(jīng)由通信鏈路(例如調(diào)制解調(diào)器或網(wǎng)絡(luò)連接)從遠(yuǎn)程計算機(jī)被傳輸 到請求的計算機(jī)。
許多方法和裝置是以它們最基本的形式描述的,但是不背離本發(fā)明的基本范圍, 可以向方法中增加步驟或從方法中刪除步驟,并且可以向描述的裝置中增加組件或從描述 的裝置中去除組件。本領(lǐng)域技術(shù)人員將會清楚可以進(jìn)行許多進(jìn)一步修改和改動。具體實施 方案不是提供來限制本發(fā)明而是示出本發(fā)明的。本發(fā)明的范圍不由上面提供的特定實施例 確定而僅由所附的權(quán)利要求書確定的。
權(quán)利要求
1.一種裝置,包括視頻接收器,所述視頻接收器接收具有編碼文本數(shù)據(jù)的視頻信號;解碼器,所述解碼器解碼所述編碼文本數(shù)據(jù);文本翻譯器,所述文本翻譯器將所述已解碼文本數(shù)據(jù)從所述文本被接收時的語言翻譯 成第二種語言;以及視頻處理器,所述視頻處理器生成已翻譯文本數(shù)據(jù)的字符圖像并將所述字符圖像疊加 在所述視頻信號的視頻部分的圖像之上以用于顯示。
2.如權(quán)利要求1所述的裝置,其中,所述編碼文本數(shù)據(jù)包括隱藏式字幕文本。
3.如權(quán)利要求1所述的裝置,其中,所述文本翻譯器還包括字典和處理器,所述處理器 向所述字典查詢所述已解碼文本數(shù)據(jù),以翻譯所述文本數(shù)據(jù)。
4.一種方法,包括接收具有編碼文本數(shù)據(jù)的視頻信號;解碼所述編碼文本數(shù)據(jù);處理所述已解碼文本數(shù)據(jù),以生成表示所述已解碼文本數(shù)據(jù)的字符圖像;以及將所述字符圖像疊加在所述視頻信號的視頻部分的圖像之上以用于顯示。
5.如權(quán)利要求4所述的方法,其中,解碼文本數(shù)據(jù)的操作包括解碼來自所述視頻信號 的垂直消隱間隔的文本信號。
6.如權(quán)利要求4所述的方法,其中,解碼文本數(shù)據(jù)的操作包括從所述視頻信號的視頻 傳輸流中提取文本數(shù)據(jù)分組。
7.如權(quán)利要求4所述的方法,其中,處理文本數(shù)據(jù)的操作包括向短語字典查詢所述已 解碼文本中的短語。
8.如權(quán)利要求4所述的方法,其中,組合操作包括將所述已處理文本編碼成文本數(shù)據(jù), 并用所述編碼的已翻譯文本數(shù)據(jù)替換所述接收到的視頻信號的所述編碼文本數(shù)據(jù)。
9.一種無線視頻接收器,包括視頻接收器,所述視頻接收器接收具有編碼文本數(shù)據(jù)的無線視頻信號;解碼器,所述解碼器解碼所述編碼文本數(shù)據(jù);文本處理器,所述文本處理器處理所述已解碼文本數(shù)據(jù)以生成表示所述已解碼文本數(shù) 據(jù)的字符圖像;以及視頻處理器,所述視頻處理器疊加所述視頻信號的視頻部分的字符圖像以用于顯示。
10.如權(quán)利要求9所述的調(diào)諧器,其中,所述解碼器讀取來自所述視頻信號的垂直消隱 間隔的數(shù)據(jù)。
11.如權(quán)利要求9所述的調(diào)諧器,其中,所述解碼器包括數(shù)字視頻傳輸流解碼器。
12.如權(quán)利要求9所述的調(diào)諧器,其中,所述文本處理器還包括字典和處理器,所述處 理器向所述字典查詢所述已解碼文本數(shù)據(jù),以獲得所述已處理文本數(shù)據(jù)。
13.如權(quán)利要求9所述的調(diào)諧器,其中,所述視頻處理器將所述已處理文本編碼成文本 數(shù)據(jù),并用所述編碼的已處理文本數(shù)據(jù)替換所述接收到的視頻信號的所述編碼文本數(shù)據(jù)。
14.一種系統(tǒng),包括用于接收具有編碼文本數(shù)據(jù)的視頻信號的裝置;用于解碼所述編碼文本數(shù)據(jù)的裝置;用于處理所述已解碼文本數(shù)據(jù)以生成表示所述已解碼文本數(shù)據(jù)的字符圖像的裝置;以及用于將所述字符圖像疊加在所述視頻信號的視頻部分的圖像之上以用于顯示的裝置。
15.如權(quán)利要求14所述的系統(tǒng),其中,所述用于解碼文本數(shù)據(jù)的裝置包括用于從所述 視頻信號的視頻傳輸流中提取文本數(shù)據(jù)分組的裝置。
全文摘要
可以基于隱藏式字幕或其他類型的編碼文本數(shù)據(jù)顯示各種不同的語言和格式。在一個實施方案中,本發(fā)明包括接收具有編碼文本數(shù)據(jù)的視頻信號、解碼該編碼文本數(shù)據(jù)、翻譯已解碼文本數(shù)據(jù)以及將已翻譯文本數(shù)據(jù)與視頻信號的視頻部分組合以用于顯示。
文檔編號G06F17/28GK102036045SQ201110008639
公開日2011年4月27日 申請日期2004年10月7日 優(yōu)先權(quán)日2003年10月17日
發(fā)明者克里斯托弗·科奈克, 托尼·莫伊 申請人:英特爾公司