專利名稱:數(shù)字視頻再現(xiàn)設(shè)備的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及用于再現(xiàn)數(shù)字視頻內(nèi)容的數(shù)字視頻再現(xiàn)設(shè)備。
背景技術(shù):
通常,在諸如DVD(數(shù)字化視頻光盤)播放機之類的數(shù)字視頻再現(xiàn)設(shè)備中,當(dāng)開始對內(nèi)容進行再現(xiàn)時,顯示一個章節(jié)列表作為索引圖像,以便能夠通過操作在該設(shè)備本體上或者遙控器上所提供的鍵而分別選擇各個章節(jié)。因此,用戶能夠從所希望的章節(jié)開始再現(xiàn)所述內(nèi)容。
最近,BS數(shù)字高清晰度電視中可以包括語音識別功能,因此,可以通過使用語音輸入廣播臺名稱、頻道名稱等等來切換頻道。
另外,提出了一種設(shè)備(例如,見專利文獻1),用于對輸入語音執(zhí)行語音識別處理,并且基于該處理的結(jié)果,在顯示器上顯示與所述輸入語音相對應(yīng)的字符串。
專利文獻1日本專利特許公報No.11-41538。
發(fā)明內(nèi)容
本發(fā)明要解決的問題在諸如DVD播放機之類的視頻再現(xiàn)設(shè)備中,通過說出章節(jié)的名稱而選擇章節(jié)將會是很方便的。然而,為了通過語音選擇章節(jié),需要預(yù)先提供參考表格,用于確定用戶所說出的詞語指示哪一個章節(jié)。
然而,通常上述參考表格并不包含在數(shù)字視頻內(nèi)容中。因此,即使是在視頻再現(xiàn)設(shè)備中結(jié)合了能夠?qū)τ脩羲f出的詞語進行識別的語音識別功能,也不能基于用戶所說出的詞語指定章節(jié)。
因此,本發(fā)明的一個目的在于提供一種數(shù)字視頻再現(xiàn)設(shè)備,用于通過語音指定數(shù)字視頻內(nèi)容的再現(xiàn)位置。
問題的解決方案本發(fā)明具有以下特征來實現(xiàn)上述目的。注意,圓括號中的參考數(shù)字和圖號指示與附圖的對應(yīng)性,以便幫助理解本發(fā)明,并不用于限制本發(fā)明。
本發(fā)明的第一方面是針對一種用于再現(xiàn)數(shù)字視頻內(nèi)容的數(shù)字視頻再現(xiàn)設(shè)備(1),其包括字典創(chuàng)建裝置(102),用于根據(jù)所述數(shù)字視頻內(nèi)容的信號創(chuàng)建可用于語音識別處理的字典;語音識別裝置(104),用于通過使用已經(jīng)由所述字典創(chuàng)建裝置創(chuàng)建的字典執(zhí)行所述語音識別處理;以及再現(xiàn)控制裝置(105),用于根據(jù)由所述語音識別裝置所執(zhí)行的語音識別的結(jié)果執(zhí)行對所述數(shù)字視頻內(nèi)容的再現(xiàn)控制。
在本發(fā)明的第二方面中,基于所述第一方面,還包括字符信息識別裝置(101),用于從再現(xiàn)位置選擇圖像(圖2、圖4、圖5)中識別字符信息,所述再現(xiàn)位置選擇圖像包含在所述數(shù)字視頻內(nèi)容的視頻信號中,用于允許用戶選擇所述數(shù)字視頻內(nèi)容的再現(xiàn)位置;并且所述字典創(chuàng)建裝置通過使用已經(jīng)由所述字符信息識別裝置識別的字符信息,創(chuàng)建索引字典,所述索引字典用于允許所述用戶通過語音選擇所述再現(xiàn)位置。
在本發(fā)明的第三方面中,基于所述第二方面,還包括索引顯示裝置(106),用于當(dāng)所述再現(xiàn)位置選擇圖像顯示在顯示設(shè)備上時,根據(jù)由所述字符信息識別裝置所執(zhí)行的識別的結(jié)果,著重顯示與基于所述再現(xiàn)位置選擇圖像而注冊在所述索引字典中的字符信息相對應(yīng)的字符串部分。
在本發(fā)明的第四方面中,基于所述第二方面,還包括非易失性存儲裝置(107),用于以非易失性的形式存儲已經(jīng)由所述字符信息識別裝置識別的字符信息,作為在過去已經(jīng)使用過的數(shù)字視頻內(nèi)容的字符信息。
在本發(fā)明的第五方面中,基于所述第四方面,所述非易失性存儲裝置將已經(jīng)由所述字符信息識別裝置識別的字符信息與歷史信息一起進行存儲,所述歷史信息指示在所述數(shù)字視頻內(nèi)容中的與所述字符信息相對應(yīng)的部分在過去是否已經(jīng)再現(xiàn)過。
在本發(fā)明的第六方面中,基于所述第五方面,所述非易失性存儲裝置將已經(jīng)由所述字符信息識別裝置識別的字符信息與所述歷史信息一起進行存儲,并且還一起存儲對所述數(shù)字視頻內(nèi)容中與所述字符信息相對應(yīng)的部分再現(xiàn)時的日期和時間。
在本發(fā)明的第七方面中,基于所述第二方面,所述字典創(chuàng)建裝置在已經(jīng)由所述字符信息識別裝置識別的字符信息中的字符數(shù)量超過預(yù)定閾值時,通過采用所述字符信息中的數(shù)量減少的字符來創(chuàng)建所述索引字典。
在本發(fā)明的第八方面中,基于所述第二方面,還包括語言確定裝置(101),用于確定由所述字符信息識別裝置所識別的字符信息是否是采用日語;代碼添加裝置(103),用于當(dāng)所述字符信息沒有被所述字符信息識別裝置所識別出時或者當(dāng)由所述字符信息識別裝置所識別的字符信息不是采用英語時,根據(jù)預(yù)定規(guī)則將代碼添加到所述再現(xiàn)位置選擇圖像;以及索引顯示裝置(106),用于在顯示設(shè)備(5)上顯示已經(jīng)由所述代碼添加裝置添加了代碼的所述再現(xiàn)位置選擇圖像。所述字典創(chuàng)建裝置通過使用已經(jīng)由所述字符信息識別裝置識別的采用英語的字符信息以及由所述代碼添加裝置添加到所述再現(xiàn)位置選擇圖像中的所述代碼,創(chuàng)建用于允許所述用戶通過語音選擇所述再現(xiàn)位置的所述索引字典。
在本發(fā)明的第九方面中,基于所述第一方面,還包括代碼添加裝置(103),用于根據(jù)預(yù)定規(guī)則將代碼添加到再現(xiàn)位置選擇圖像(圖2、圖4、圖5),所述再現(xiàn)位置選擇圖像包含在所述數(shù)字視頻內(nèi)容的視頻信號中并且進行顯示以允許用戶選擇所述數(shù)字視頻內(nèi)容的再現(xiàn)位置;以及索引顯示裝置(106),用于在顯示設(shè)備(5)上顯示已經(jīng)由所述代碼添加裝置添加了代碼的所述再現(xiàn)位置選擇圖像。所述字典創(chuàng)建裝置通過使用已經(jīng)由所述代碼添加裝置添加到所述再現(xiàn)位置選擇圖像中的所述代碼,創(chuàng)建用于允許所述用戶通過語音選擇所述再現(xiàn)位置的索引字典。
在本發(fā)明的第十方面中,基于所述第一方面,所述字典創(chuàng)建裝置,通過使用在所述數(shù)字視頻內(nèi)容的信號中包含的、用于允許用戶選擇所述數(shù)字視頻內(nèi)容的再現(xiàn)位置的文本信息,創(chuàng)建用于允許所述用戶通過語音選擇所述再現(xiàn)位置的索引字典。
本發(fā)明的效果根據(jù)所述第一方面,可以通過語音選擇數(shù)字TV的內(nèi)容的標(biāo)題、DVD視頻的內(nèi)容的章節(jié)名稱等等。
根據(jù)所述第二方面,例如,可以通過語音從DVD視頻等等的章節(jié)選擇圖像等等中選擇章節(jié)。
根據(jù)所述第三方面,例如,可以采用能夠明確理解的方式,將要說出來以便選擇所希望章節(jié)的詞語提供給用戶。
根據(jù)所述第四方面,例如,用戶能夠觀看在過去已經(jīng)使用過的、諸如DVD之類的介質(zhì)中的章節(jié)信息,而不用裝入所述介質(zhì)。
根據(jù)所述第五方面,例如,用戶能夠確認在過去哪個章節(jié)已經(jīng)再現(xiàn)過以及哪個章節(jié)沒有再現(xiàn)過。
根據(jù)所述第六方面,例如,能夠根據(jù)在過去提供的再現(xiàn)日期和時間,選擇在過去已經(jīng)觀看過的章節(jié)。
根據(jù)所述第七方面,例如,當(dāng)章節(jié)名稱很長時,可以不說出整個章節(jié)名稱,而是比之更加容易地選擇章節(jié)。
根據(jù)所述第八方面,例如,即使是章節(jié)沒有特別具有章節(jié)名稱或者章節(jié)所具有的章節(jié)名稱是采用英語以外的語言,也能夠通過說出一個代碼而容易地選擇該章節(jié)。
根據(jù)所述第九方面,例如,即使是當(dāng)在DVD視頻等等的章節(jié)選擇圖像中提供的章節(jié)選擇按鈕中沒有包含字符串,也可以通過說出一個代碼而選擇章節(jié)。
根據(jù)所述第十方面,例如,當(dāng)與視頻中提供的選擇按鈕相對應(yīng)的文本信息如同數(shù)字TV的內(nèi)容中一樣預(yù)先包含在內(nèi)容中時,可以通過使用該文本信息容易地創(chuàng)建要用于語音識別的字典。
圖1是示出根據(jù)本發(fā)明的實施例的數(shù)字視頻再現(xiàn)設(shè)備的結(jié)構(gòu)的圖;圖2是索引圖像的第一示例;圖3是示出系統(tǒng)控制器4的功能的圖;圖4是索引圖像的第二示例;圖5是索引圖像的第三示例;圖6是索引字典的第一示例;圖7是索引字典的第二示例;圖8是已經(jīng)被索引顯示裝置106處理過的索引圖像的第一示例;圖9是已經(jīng)被索引顯示裝置106處理過的索引圖像的第二示例;圖10是已經(jīng)被索引顯示裝置106處理過的索引圖像的第三示例;圖11是索引字典的第三示例;以及圖12是與索引字典一起存儲在存儲裝置107中的信息的示例。
參考符號描述1 數(shù)字視頻再現(xiàn)設(shè)備2 DVD驅(qū)動器3 緩沖器4 系統(tǒng)控制器5 顯示裝置6 按鈕7 ADC8 麥克風(fēng)10 索引圖像20 背景顯示21-25 選擇按鈕51-55 下劃線61-65 語音標(biāo)志71,72 代碼81-85 代碼
101 字符信息識別裝置102 索引字典創(chuàng)建裝置103 代碼添加裝置104 語音識別裝置105 再現(xiàn)控制裝置106 索引顯示裝置107 存儲裝置具體實施方式
以下將參考附圖,描述根據(jù)本發(fā)明的實施例的數(shù)字視頻再現(xiàn)設(shè)備。
在圖1中,數(shù)字視頻再現(xiàn)設(shè)備1包括能夠再現(xiàn)DVD視頻的DVD驅(qū)動器2、用于暫時存儲由DVD區(qū)動器2所再現(xiàn)的視頻的緩沖器3,用于整體控制數(shù)字視頻再現(xiàn)設(shè)備1的系統(tǒng)控制器4、用于顯示該視頻的顯示設(shè)備5、在要開始語音輸入時由用戶按壓的按鈕6、用于輸入語音的麥克風(fēng)8、以及用于將從麥克風(fēng)8提供的模擬語音信號轉(zhuǎn)換為數(shù)字語音信號的ADC(模擬到數(shù)字轉(zhuǎn)換器)7。注意,DVD驅(qū)動器2和麥克風(fēng)8不是必須要結(jié)合到數(shù)字視頻再現(xiàn)設(shè)備1中。
當(dāng)用戶將其中記錄有數(shù)字視頻內(nèi)容(以下稱為DVD視頻)的DVD放入DVD驅(qū)動器2中時,將圖2中所示的索引圖像作為原始圖像從DVD視頻中讀出,并顯示在顯示設(shè)備5上。DVD視頻被劃分為多個章節(jié),在索引圖像中顯示選擇按鈕21到25,用于分別選擇這些章節(jié)。注意,選擇按鈕并不是必須要局限于圖2中所示的按鈕,并且可以不顯示選擇按鈕的下滑線(即,采用與背景相同的顏色),或者可以將在這些章節(jié)開始位置處的視頻的縮小圖像用作選擇按鈕。注意,圖2中所示的20不是選擇按鈕,而是一部分背景顯示。圖2中示出了一種DVD包括5個章節(jié)的情況的示例。用戶可以使用輸入設(shè)備(在此未示出)從章節(jié)列表中選擇所希望的章節(jié),以便從所希望的章節(jié)開始再現(xiàn)DVD視頻。
在選擇按鈕21到25中的每一個上所顯示的章節(jié)名稱(“入學(xué)典禮”、“遠足”等等)并非作為文本信息而包含在DVD視頻中,包含選擇按鈕21到25的索引圖像僅僅是作為圖像信息而存儲在DVD視頻中。用于確定索引圖像的哪個區(qū)域與哪個選擇按鈕相對應(yīng)的信息存儲在DVD視頻中。
接下來,將參考圖5,描述系統(tǒng)控制器4的功能。系統(tǒng)控制器4是用諸如微計算機、DSP和存儲器之類的硬件與存儲在ROM等中的軟件的組合實現(xiàn)的,并執(zhí)行對于在圖像信息中包含的字符的識別處理、語音識別處理、章節(jié)再現(xiàn)處理等等。具體的,系統(tǒng)控制器4充當(dāng)字符信息識別裝置101、索引字典創(chuàng)建裝置102、代碼添加裝置103、語音識別裝置104、再現(xiàn)控制裝置105、索引顯示裝置106和存儲裝置107。以下將詳細描述每個裝置。
字符信息識別裝置101通過字符識別處理,從在DVD驅(qū)動器2所讀出的索引圖像中包含的圖2所示的選擇按鈕21到25(即,用于選擇每個章節(jié)的圖像區(qū)域)中的每一個中提取出字符信息。注意,字符信息識別裝置101具有確定通過字符識別處理所提取的字符信息是否是采用英語的功能,以下所提供的處理步驟根據(jù)在該過程中是否已經(jīng)提取了采用英語的字符信息而不同。注意,在此提供的描述是基于以下前提的即,數(shù)字視頻再現(xiàn)設(shè)備1是在講英語的國家中使用的。然而,例如,在數(shù)字視頻再現(xiàn)設(shè)備1是在講日語的國家中使用時,以下所提供的處理步驟根據(jù)在該處理中是否已經(jīng)提取了采用日語的字符信息而不同。即,更為普遍地,字符信息識別裝置101具有確定通過字符識別處理所提取的字符信息是否是采用特定語言的功能。
在字符信息識別裝置101已經(jīng)提取了采用英語的字符信息的情況中,字符信息識別裝置101將所提取的字符信息作為文本數(shù)據(jù)輸出到索引字典創(chuàng)建裝置102。相反地,在沒有提取出采用英語的字符信息的情況中(即,在根本沒有提取出字符信息的情況中,或者在所提取的字符信息采用了英語以外的語言的情況中),字符信息識別裝置101請求代碼添加裝置103執(zhí)行代碼添加處理。例如,在如圖4所示的在每個選擇按鈕中用日語顯示章節(jié)名稱的情況中,或者在如圖5所示的選擇按鈕為在各個章節(jié)開始位置處提供的視頻的縮小圖像(縮略圖)的情況中,字符信息識別裝置101請求代碼添加裝置103執(zhí)行代碼添加處理。
注意,可以采用已知的任意技術(shù)作為字符識別技術(shù),用于字符信息識別裝置101。
代碼添加裝置103根據(jù)預(yù)定規(guī)則,對不包含采用英語的字符信息的每個選擇按鈕分配一個代碼(例如數(shù)字),并將與已經(jīng)分配給每個選擇按鈕的代碼相對應(yīng)的文本數(shù)據(jù)輸出到索引字典創(chuàng)建裝置102。
根據(jù)從字符信息識別裝置101輸出的文本數(shù)據(jù)(“入學(xué)儀式”、“遠足”等等)或者從代碼添加裝置103輸出的文本數(shù)據(jù)(“1”、“2”等等),索引字典創(chuàng)建裝置102創(chuàng)建可用于語音識別裝置104所執(zhí)行的語言識別處理的索引字典。以下將具體描述索引字典創(chuàng)建裝置102的處理。
索引字典創(chuàng)建裝置102首先檢查從字符信息識別裝置101輸出的文本數(shù)據(jù)或者從代碼添加裝置103輸出的文本數(shù)據(jù)中是否包含相同的文本數(shù)據(jù),當(dāng)包含相同的文本數(shù)據(jù)時,在所述相同的文本數(shù)據(jù)后面添加一個數(shù)字等等(更精確而言,是添加與該數(shù)字相對應(yīng)的文本數(shù)據(jù)),從而能夠區(qū)分所述相同的文本數(shù)據(jù)中的每一個。例如,在輸入到索引字典創(chuàng)建裝置102中的文本數(shù)據(jù)中包含兩個“遠足”的情況下,將兩個“遠足”中的一個轉(zhuǎn)換為“遠足1”,將另一個轉(zhuǎn)換為“遠足2”。
當(dāng)創(chuàng)建了與索引圖像中包含的全部選擇按鈕相關(guān)的文本信息時,索引字典創(chuàng)建裝置102通過使用已經(jīng)創(chuàng)建的文本數(shù)據(jù)創(chuàng)建用于執(zhí)行語音識別處理的索引字典,并將索引字典存儲在存儲裝置107中。存儲裝置107可以是非易失性存儲裝置,其即使是在電源關(guān)閉時也會持續(xù)保留所存儲的內(nèi)容,或者存儲裝置107可以是易失性存儲裝置,其在電源關(guān)閉時丟失所存儲的內(nèi)容。在索引圖像中提供的、與文本數(shù)據(jù)相對應(yīng)的每個選擇按鈕的顯示位置也記錄到與該文本數(shù)據(jù)關(guān)聯(lián)的索引字典中。圖6示出了根據(jù)圖2的索引圖像創(chuàng)建的索引字典的內(nèi)容。圖7示出了根據(jù)圖4的索引圖像創(chuàng)建的索引字典的內(nèi)容,或者根據(jù)圖5的索引圖像創(chuàng)建的索引字典的內(nèi)容。
注意,索引字典創(chuàng)建裝置102將由于如上所述的存在多個相同文本數(shù)據(jù)的情況而添加了數(shù)字等等的文本數(shù)據(jù)記錄為文本數(shù)據(jù),還將指示正在記錄的文本數(shù)據(jù)是添加了數(shù)字等等的原始文本數(shù)據(jù)的信息(標(biāo)記)記錄到與正在記錄的文本數(shù)據(jù)關(guān)聯(lián)的索引字典中。
索引顯示裝置106執(zhí)行顯示控制,為用戶提供要由用戶說出的詞語,以便選擇在索引圖像中包含的每個選擇按鈕。更具體的,索引顯示裝置106按照需要,從字符信息識別裝置101中獲得由字符信息識別裝置101所識別的采用英語的字符串在索引圖像中的顯示位置,并且通過如圖8所示的分別在字符串下面畫下劃線51到55、用邊框包圍字符串、在字符串附近添加用于分別指示字符串是要說出來的字符串的語音標(biāo)志61到65等等方法來強調(diào)這些字符串。此外,如圖9所示,在具有已經(jīng)由索引字典創(chuàng)建裝置102添加了數(shù)字等等的文本數(shù)據(jù)的字符串后面,分別額外顯示數(shù)字(71、72)。此外,如圖10所示,代碼添加裝置103將代碼(81到85)分別分配給由字符信息識別裝置101所識別的采用英語之外的其他語言的字符串,然后對其進行額外顯示。作為如上所述的由索引顯示裝置106執(zhí)行的處理結(jié)果,當(dāng)要在索引圖像中選擇所希望的章節(jié)時,用戶一眼就能夠識別出要說出的字符串。
當(dāng)用戶按壓按鈕6以便開始語音輸入時,從按鈕6輸出語音識別開始信號S1。當(dāng)接收到該語音識別開始信號S1時,語音識別裝置104通過使用經(jīng)由ADC7得到的語音數(shù)據(jù)D1和在存儲裝置107中存儲的索引字典來執(zhí)行語音識別處理。當(dāng)作為所述語音識別處理的結(jié)果而在索引字典中檢測到與語音數(shù)據(jù)D1相對應(yīng)的文本數(shù)據(jù)時,語音識別裝置104從索引字典中獲得與該文本數(shù)據(jù)相對應(yīng)的每個選擇按鈕的顯示位置信息,然后將該顯示位置信息輸出到再現(xiàn)控制裝置105。
根據(jù)從語音識別裝置104中接收的顯示位置信息,再現(xiàn)控制裝置105指定一個章節(jié)并開始再現(xiàn)該章節(jié)。
注意,對于在講日語的國家中,字符信息識別裝置101具有確定通過字符識別處理所提取的字符信息是否是采用日語的功能,并且在索引圖像中包含的采用日語的章節(jié)名稱的各個字符是用日本漢字表示的情況中,索引字典創(chuàng)建裝置102為了創(chuàng)建與所講出的字符串的字典相同的字典,首先將從字符信息識別裝置101中輸出的文本數(shù)據(jù)或者從代碼添加裝置103中輸出的文本數(shù)據(jù)轉(zhuǎn)換到片假名數(shù)據(jù)(『ニユウガクシキ』(“nyuugakushiki”),『エンソク』(“ensoku”),『イチ』(“ichi”),『ニ』(“ni”)等等)。每個選擇按鈕的相應(yīng)的從字符信息識別裝置101中輸出的文本數(shù)據(jù)、從代碼添加裝置103中輸出的文本數(shù)據(jù)、以及在索引圖像中的顯示位置也記錄在與所述片假名數(shù)據(jù)相關(guān)聯(lián)的索引字典中。圖11示出了根據(jù)圖4的索引圖像創(chuàng)建的索引字典的內(nèi)容。
系統(tǒng)控制器4的上述功能允許用戶通過語音從索引圖像中包含的多個選擇按鈕中選擇一個任意的選擇按鈕,并開始觀看與該任意的選擇按鈕相對應(yīng)的章節(jié)。因此,根據(jù)本實施例,可以通過語音選擇章節(jié),因此其對于車內(nèi)DVD再現(xiàn)設(shè)備尤其有用。此外,可以將導(dǎo)航功能添加到本實施例中,從而可以提供包括再現(xiàn)數(shù)字視頻內(nèi)容的功能的導(dǎo)航設(shè)備。
注意,可以使用非易失性存儲裝置作為存儲裝置107,以便即使是在數(shù)字視頻再現(xiàn)設(shè)備1關(guān)閉后也可以保留由索引字典創(chuàng)建裝置102創(chuàng)建的索引字典,因此當(dāng)數(shù)字視頻再現(xiàn)設(shè)備1關(guān)閉過一次之后再次開啟時,可以使用存儲裝置107過去所存儲數(shù)據(jù)。因此,能夠提高數(shù)字視頻再現(xiàn)設(shè)備1的可用性。以下將描述一個所采用的示例,其中使用非易失性存儲裝置作為存儲裝置107。
在所采用的示例中,如圖12所示,將由索引字典創(chuàng)建裝置102創(chuàng)建的索引字典記錄在存儲裝置107中,并且與DVD視頻的標(biāo)題、對于DVD而言唯一性的信息、或者其他附加信息相關(guān)聯(lián)。所述對于DVD而言唯一性的信息可以包括,例如記錄在DVD中的數(shù)據(jù)大小、視頻長度、章節(jié)數(shù)量等等。此外,當(dāng)章節(jié)已經(jīng)再現(xiàn)過時,再現(xiàn)控制裝置105就將該章節(jié)再現(xiàn)時的日期和時間作為再現(xiàn)歷史信息,存儲在存儲裝置107中,并且與和該章節(jié)相對應(yīng)的每個選擇按鈕的顯示位置信息相關(guān)聯(lián)。此外,當(dāng)用戶在章節(jié)中間部分停止了再現(xiàn)該章節(jié)時,再現(xiàn)控制裝置105就將在章節(jié)停止位置處提供的該視頻的時間計數(shù)器的值作為再現(xiàn)歷史信息,存儲存儲裝置107中,并且與該章節(jié)再現(xiàn)時的日期和時間相關(guān)聯(lián)。
當(dāng)向數(shù)字視頻再現(xiàn)設(shè)備1供電時,系統(tǒng)控制器4首先確認DVD驅(qū)動器2中是否插入了DVD。在DVD驅(qū)動器2中插入了DVD的情況中,系統(tǒng)控制器4參考如圖12所示的存儲在存儲裝置107中的信息,確認在DVD驅(qū)動器2中當(dāng)前插入的DVD是否是在過去已經(jīng)插入過的DVD。在DVD驅(qū)動器2中當(dāng)前插入的DVD是在過去已經(jīng)插入過的DVD的情況中,通過使用在過去已經(jīng)創(chuàng)建的索引字典執(zhí)行語音識別處理。在該DVD是第一次插入在其中的DVD情況中,根據(jù)索引圖像創(chuàng)建索引字典,并將其存儲在存儲裝置107中,并通過使用已經(jīng)創(chuàng)建和存儲的索引字典執(zhí)行語音識別處理。因此,能夠省去創(chuàng)建新的、用于在過去已經(jīng)使用過的DVD的索引字典的麻煩,因此能夠減少從將DVD插入DVD驅(qū)動器2開始到能夠通過語音選擇章節(jié)這一過程所需要的時間。
此外,當(dāng)使用在存儲裝置107中存儲的日期和時間信息時,索引顯示裝置106可以將指示每個章節(jié)在過去是否被再現(xiàn)過的信息添加到索引圖像中,然后可以將其顯示在顯示設(shè)備5上。
此外,當(dāng)使用在存儲裝置107中存儲的計數(shù)器數(shù)值信息時,用戶可以在重新選擇了在過去在其中間停止再現(xiàn)的章節(jié)時,從該章節(jié)的停止點開始再現(xiàn)該章節(jié)。
注意,作為本發(fā)明的一個示例,描述了對DVD中記錄的數(shù)字視頻內(nèi)容進行再現(xiàn)的情況。然而,本發(fā)明并不局限于此,本發(fā)明還可以類似地應(yīng)用于對在另一種記錄介質(zhì)中記錄的數(shù)字視頻內(nèi)容進行再現(xiàn)的情況、對通過通信線路提供的數(shù)字視頻內(nèi)容進行再現(xiàn)的情況、通過廣播電波提供的數(shù)字視頻內(nèi)容進行再現(xiàn)的情況,等等。注意,在與視頻中顯示的選擇按鈕相對應(yīng)的文本信息,與數(shù)字TV等等的內(nèi)容一樣預(yù)先包含在內(nèi)容中的情況中,索引字典創(chuàng)建裝置102可以通過使用該文本信息創(chuàng)建索引字典,即使是字符信息識別裝置101不執(zhí)行字符識別過程也是如此。
工業(yè)應(yīng)用性目前存在大量的具有語音識別功能的車內(nèi)導(dǎo)航系統(tǒng),并且能夠再現(xiàn)DVD的系統(tǒng)也是廣泛應(yīng)用的。將根據(jù)本發(fā)明的、用于從數(shù)字信號中創(chuàng)建可用于語音識別的字典的裝置添加到上述系統(tǒng)中,從而使得駕駛者即使是在駕駛時也可以通過語音安全地選擇一個章節(jié),該裝置在安裝在車內(nèi)時尤其有用。
權(quán)利要求
1.一種用于再現(xiàn)數(shù)字視頻內(nèi)容的數(shù)字視頻再現(xiàn)設(shè)備,其包括字典創(chuàng)建裝置,用于根據(jù)所述數(shù)字視頻內(nèi)容的信號,創(chuàng)建可用于語音識別處理的字典;語音識別裝置,用于通過使用已經(jīng)由所述字典創(chuàng)建裝置創(chuàng)建的字典,執(zhí)行所述語音識別處理;以及再現(xiàn)控制裝置,用于根據(jù)由所述語音識別裝置所執(zhí)行的語音識別的結(jié)果,執(zhí)行對所述數(shù)字視頻內(nèi)容的再現(xiàn)控制。
2.如權(quán)利要求1所述的數(shù)字視頻再現(xiàn)設(shè)備,還包括字符信息識別裝置,用于從再現(xiàn)位置選擇圖像中識別字符信息,所述再現(xiàn)位置選擇圖像包含在所述數(shù)字視頻內(nèi)容的視頻信號中并且用于允許用戶選擇所述數(shù)字視頻內(nèi)容的再現(xiàn)位置,其中所述字典創(chuàng)建裝置通過使用已經(jīng)由所述字符信息識別裝置識別的字符信息,創(chuàng)建索引字典,所述索引字典用于允許所述用戶通過語音選擇所述再現(xiàn)位置。
3.如權(quán)利要求2所述的數(shù)字視頻再現(xiàn)設(shè)備,還包括索引顯示裝置,用于當(dāng)所述再現(xiàn)位置選擇圖像顯示在顯示設(shè)備上時,根據(jù)由所述字符信息識別裝置所執(zhí)行的識別的結(jié)果,著重顯示與根據(jù)所述再現(xiàn)位置選擇圖像而注冊到所述索引字典中的字符信息相對應(yīng)的字符串部分。
4.如權(quán)利要求2所述的數(shù)字視頻再現(xiàn)設(shè)備,還包括非易失性存儲裝置,用于以非易失性的形式存儲已經(jīng)由所述字符信息識別裝置識別的字符信息,作為在過去已經(jīng)使用過的數(shù)字視頻內(nèi)容的字符信息。
5.如權(quán)利要求4所述的數(shù)字視頻再現(xiàn)設(shè)備,其中所述非易失性存儲裝置將已經(jīng)由所述字符信息識別裝置識別的字符信息與歷史信息一起進行存儲,所述歷史信息指示在所述數(shù)字視頻內(nèi)容中的與所述字符信息相對應(yīng)的部分在過去是否已經(jīng)再現(xiàn)過。
6.如權(quán)利要求5所述的數(shù)字視頻再現(xiàn)設(shè)備,其中所述非易失性存儲裝置將已經(jīng)由所述字符信息識別裝置識別的字符信息與所述歷史信息一起進行存儲,并且還一起存儲對所述數(shù)字視頻內(nèi)容中與所述字符信息相對應(yīng)的部分進行再現(xiàn)時的日期和時間。
7.如權(quán)利要求2所述的數(shù)字視頻再現(xiàn)設(shè)備,其中所述字典創(chuàng)建裝置在已經(jīng)由所述字符信息識別裝置識別的字符信息中的字符數(shù)量超過預(yù)定閾值時,通過采用所述字符信息中的數(shù)量減少的字符來創(chuàng)建所述索引字典。
8.如權(quán)利要求2所述的數(shù)字視頻再現(xiàn)設(shè)備,還包括語言確定裝置,用于確定已經(jīng)由所述字符信息識別裝置識別的字符信息是否是采用日語;代碼添加裝置,用于當(dāng)所述字符信息沒有被所述字符信息識別裝置所識別出時,或者當(dāng)由所述字符信息識別裝置所識別的字符信息不是采用英語時,根據(jù)預(yù)定規(guī)則將代碼添加到所述再現(xiàn)位置選擇圖像;以及索引顯示裝置,用于在顯示設(shè)備上顯示已經(jīng)由所述代碼添加裝置添加了所述代碼的所述再現(xiàn)位置選擇圖像,其中,所述字典創(chuàng)建裝置通過使用已經(jīng)由所述字符信息識別裝置所識別的所述采用英語的字符信息以及由所述代碼添加裝置添加到所述再現(xiàn)位置選擇圖像中的所述代碼,創(chuàng)建用于允許所述用戶通過語音來選擇所述再現(xiàn)位置的所述索引字典。
9.如權(quán)利要求1所述的數(shù)字視頻再現(xiàn)設(shè)備,還包括代碼添加裝置,用于根據(jù)預(yù)定規(guī)則將代碼添加到再現(xiàn)位置選擇圖像,所述再現(xiàn)位置選擇圖像包含在所述數(shù)字視頻內(nèi)容的視頻信號中并且進行顯示以允許用戶選擇所述數(shù)字視頻內(nèi)容的再現(xiàn)位置;以及索引顯示裝置,用于在顯示設(shè)備上顯示已經(jīng)由所述代碼添加裝置添加了代碼的所述再現(xiàn)位置選擇圖像,其中,所述字典創(chuàng)建裝置通過使用已經(jīng)由所述代碼添加裝置添加到所述再現(xiàn)位置選擇圖像中的所述代碼,創(chuàng)建用于允許所述用戶通過語音來選擇所述再現(xiàn)位置的索引字典。
10.如權(quán)利要求1所述的數(shù)字視頻再現(xiàn)設(shè)備,所述字典創(chuàng)建裝置,通過使用在所述數(shù)字視頻內(nèi)容的信號中包含的、用于允許用戶選擇所述數(shù)字視頻內(nèi)容的再現(xiàn)位置的文本信息,創(chuàng)建用于允許所述用戶通過語音來選擇所述再現(xiàn)位置的索引字典。
全文摘要
字符信息識別裝置(101)通過字符識別處理從包含在索引圖像中的選擇按鈕中提取出字符信息。根據(jù)從字符信息識別裝置(101)中輸出的文本數(shù)據(jù),索引字典創(chuàng)建裝置(102)創(chuàng)建可用于由語音識別裝置(104)所執(zhí)行的語音識別處理的索引字典。語音識別裝置(104)通過使用通過ADC(7)得到的語音數(shù)據(jù)(D1)和存儲在存儲裝置(7)中的索引字典執(zhí)行語音識別處理。根據(jù)由語音識別裝置(104)所執(zhí)行的語音識別處理的結(jié)果,再現(xiàn)控制裝置(105)執(zhí)行章節(jié)的再現(xiàn)控制。因此,可以通過語音在DVD視頻的章節(jié)選擇圖像上所顯示的多個章節(jié)選擇按鈕中選擇所希望的按鈕。
文檔編號G11B27/10GK101057497SQ20058003814
公開日2007年10月17日 申請日期2005年11月4日 優(yōu)先權(quán)日2004年11月8日
發(fā)明者飯阪篤, 山下敦士, 平井卓哉 申請人:松下電器產(chǎn)業(yè)株式會社