專利名稱:信息處理設(shè)備和信息處理方法
技術(shù)領(lǐng)域:
本發(fā)明涉及信息處理設(shè)備和信息處理方法。
背景技術(shù):
可以獲得用于特征識別的技木。作為與這種技術(shù)相關(guān)的技術(shù),例如,日本未審查專利申請公開第2001-285716號公開了能夠以高精度檢測和識別圖像中的字幕(telop)的字幕信息處理設(shè)備。在字幕信息處理設(shè)備中,從圖像中檢測出顯示字幕信息的區(qū)域,提取組成字幕字符的像素,以及通過使用字幕候選圖像創(chuàng)建單元、字幕字符串區(qū)域候選提取単元、字幕字符像素提取單元和字幕字符識別単元,在字符識別處理中執(zhí)行識別。字幕信息創(chuàng)建單元基于這一系列處理的可靠性評估結(jié)果來選擇為ー個字幕提供的多個識別結(jié)果之一。此吋,字幕信息創(chuàng)建單元通過使用由字幕字符像素提取單元執(zhí)行的字幕字符提取處理的可靠性評估值和/或由字幕字符識別單元執(zhí)行的字符識別處理的識別可靠性來獲取最終的字幕信息。日本未審查專利申請公開第04-115384號公開了具有單詞檢查功能的日單詞符識別設(shè)備,其中,如果在字典中登記有已經(jīng)讀取的字符串,則該字符串被確定為字,并且通過使用描述語句中的詞性之間的連接關(guān)系的連接表確保字之間的有效性來根據(jù)上下文識別字符,從而提高字符讀取性能。日單詞符識別設(shè)備包括讀取單元,其讀取日單詞符并提取用于模糊字符的多個可能性高的候選;字符串創(chuàng)建単元,如果在通過讀取單元讀取的字符串中存在模糊字符,其通過組合多個可能性高的候選來創(chuàng)建候選字符串;單詞劃分単元,其對通過字符串創(chuàng)建単元所創(chuàng)建的字符串執(zhí)行單詞劃分;字典中查找單元,其確定在字典中是否已登記有通過單詞劃分單元執(zhí)行的單詞劃分所獲取的字;以及連接關(guān)系確定單元,其參照描述詞性間連接關(guān)系的連接表,確定已被字典中查找單元確定登記在字典中的單詞的連接關(guān)系。
發(fā)明內(nèi)容
本發(fā)明的目的在于提供信息處理設(shè)備和信息處理方法,其中,與不使用根據(jù)本發(fā)明示例性實施例的結(jié)構(gòu)的情況相比,可以使用針對運動圖像中的圖像的具有較高識別精度的字符識別結(jié)果。根據(jù)本發(fā)明的第一方面,提供了ー種信息處理設(shè)備,包括鑒別單元、字符識別單元、獲取單元、校正単元和輸出單元。鑒別單元鑒別包括在運動圖像中的靜止圖像。字符識別單元對通過鑒別單元鑒別的靜止圖像執(zhí)行字符識別。獲取單元獲取關(guān)于運動圖像的信息。校正単元基于通過獲取單元所獲取的信息校正通過字符識別單元生成的字符識別結(jié)果。輸出單元輸出與運動圖像相關(guān)聯(lián)的通過校正単元校正的字符識別結(jié)果。根據(jù)本發(fā)明的第二方面,獲取單元識別運動圖像中的人物并獲取關(guān)于人物的信息。校正単元基于通過獲取單元獲取的關(guān)于人物的信息校正字符識別結(jié)果。根據(jù)本發(fā)明的第三方面,基于作為用于識別運動圖像的信息的運動圖像識別信息或者基于運動圖像識別信息和通過鑒別単元鑒別的靜止圖像的時間位置,獲取單元獲取可能包括在靜止圖像中的字符信息。校正単元基于通過獲取單元獲取的字符信息校正字符識別結(jié)果。根據(jù)本發(fā)明的第四方面,獲取單元提取通過字符識別單元對處于預(yù)定時間位置的靜止圖像生成的字符識別結(jié)果中所包括的人物的名字,并獲取關(guān)于人物的名字的信息。基于通過獲取單元獲取的關(guān)于人物的名字的信息,校正単元校正通過字符識別單元所生成的字符識別結(jié)果。根據(jù)本發(fā)明的第五方面,獲取單元提取關(guān)于運動圖像的拍攝地點以及拍攝日期和時間的信息,并獲取關(guān)于在拍攝日期和時間在拍攝地點舉行的事件的信息?;谕ㄟ^獲取單元獲取的關(guān)于事件的信息,校正単元校正通過字符識別單元生成的字符識別結(jié)果。根據(jù)本發(fā)明的第六方面,獲取單元對通過字符識別単元生成的字符識別結(jié)果執(zhí)行形態(tài)分析,并獲取關(guān)于作為形態(tài)分析結(jié)果的字符串的信息或者關(guān)于與該字符串類似的字符串的信息?;谕ㄟ^獲取單元獲取的關(guān)于字符串的信息,校正単元校正通過字符識別單元生成的字符識別結(jié)果。根據(jù)本發(fā)明的第七方面,獲取單元提取包括在由字符識別単元生成的字符識別結(jié)果中的人物的名字或者事件標題,并且,如果字符識別結(jié)果包括多個人物的名字或多個事件標題,則獲取単元基于靜止圖像的時間位置執(zhí)行加權(quán)并獲取使用加權(quán)結(jié)果而選擇的關(guān)于人物的名字或事件標題的信息?;谕ㄟ^獲取單元獲取的關(guān)于人物的名字或事件標題的信息,校正単元校正通過字符識別單元生成的字符識別結(jié)果。根據(jù)本發(fā)明的第八方面,提供了ー種圖像處理方法,包括鑒別運動圖像中包括的靜止圖像;對鑒別的靜止圖像執(zhí)行字符識別;獲取關(guān)于運動圖像的信息;基于獲取的信息,校正在字符識別中生成的字符識別結(jié)果;以及輸出與運動圖像相關(guān)聯(lián)的校正字符識別結(jié)果。在根據(jù)本發(fā)明第一方面的信息處理設(shè)備中,與不使用根據(jù)本發(fā)明示例性實施例的結(jié)構(gòu)的情況相比,可以使用針對運動圖像中的圖像具有較高識別精度的字符識別結(jié)果。在根據(jù)第二方面的信息處理設(shè)備中,可以基于關(guān)于運動圖像中的人物的信息來校正字符識別結(jié)果。在根據(jù)第三方面的信息處理設(shè)備中,可以基于運動圖像鑒別信息和關(guān)于靜止圖像的時間位置的信息來校正字符識別結(jié)果。在根據(jù)第四方面的信息處理設(shè)備中,可以基于關(guān)于人物的名字的信息來校正字符識別結(jié)果。在根據(jù)第五方面的信息處理設(shè)備中,可以基于關(guān)于在運動圖像的拍攝日期和時間在拍攝地點舉行的事件的信息來校正字符識別結(jié)果。在根據(jù)第六方面的信息處理設(shè)備中,可以基于關(guān)于用作對字符識別結(jié)果執(zhí)行的形態(tài)分析結(jié)果的字符串的信息或者與該字符串類似的字符串的信息來校正字符識別結(jié)果。在根據(jù)第七方面的信息處理設(shè)備中,可以基于根據(jù)靜止圖像的時間位置已執(zhí)行了加權(quán)的關(guān)于人物的名字或事件標題的信息來校正字符識別結(jié)果。在根據(jù)第八方面的信息處理方法中,與不使用根據(jù)本發(fā)明示例性實施例的結(jié)構(gòu)的情況相比,可以使用針對運動圖像中的圖像具有較高識別精度的字符識別結(jié)果。
將基于以下附圖描述本發(fā)明的示例性實施例,其中圖1是示出根據(jù)示例性實施例的示例結(jié)構(gòu)的概念模塊結(jié)構(gòu)示圖;圖2是示出根據(jù)示例性實施例的示例結(jié)構(gòu)的概念模塊結(jié)構(gòu)示圖;圖3是示出根據(jù)示例性實施例的示例結(jié)構(gòu)的概念模塊結(jié)構(gòu)示圖;圖4是示出根據(jù)示例性實施例的通過人物識別模塊等執(zhí)行的處理的示例的流程圖;圖5是示出運動圖像、幻燈圖像(slide image)和面部區(qū)域的示例的示圖;圖6是示出人物關(guān)鍵字組表的數(shù)據(jù)結(jié)構(gòu)的示例的示圖;圖7是示出根據(jù)示例性實施例的通過運動圖像ID/頁碼識別模塊執(zhí)行的處理的示例的流程圖;圖8是示出運動圖像ID/頁碼關(guān)鍵字組表的數(shù)據(jù)結(jié)構(gòu)的示例的示圖;圖9是示出根據(jù)示例性實施例的通過演講者名字識別模塊等執(zhí)行的處理的示例的流程圖;圖10是示出演講者名字關(guān)鍵字組表的數(shù)據(jù)結(jié)構(gòu)的示例的示圖;圖11是示出根據(jù)示例性實施例的通過演講標題指定模塊等執(zhí)行的處理的示例的流程圖;圖12是示出時間表的數(shù)據(jù)結(jié)構(gòu)的示例的示圖;圖13是示出演講標題關(guān)鍵字組表的數(shù)據(jù)結(jié)構(gòu)的示例的示圖;圖14是示出運動圖像和幻燈圖像的示例的示圖;圖15是示出根據(jù)示例性實施例的通過文本組配置模塊等執(zhí)行的處理的示例的流程圖;圖16是示出運動圖像和幻燈圖像的示例的示圖;圖17是示出文本組關(guān)鍵字組表的數(shù)據(jù)結(jié)構(gòu)的示圖;圖18是示出根據(jù)示例性實施例的通過人物名字提取模塊、演講標題提取模塊等執(zhí)行的處理的示例的流程圖;圖19是示出運動圖像和幻燈圖像的示例的示圖;圖20是示出人物名字/演講標題關(guān)鍵字組表的數(shù)據(jù)結(jié)構(gòu)的示例的示圖;圖21是示出運動圖像和幻燈圖像的示例的示圖;圖22是示出在實現(xiàn)示例性實施例的情況下的示例系統(tǒng)結(jié)構(gòu)的示圖;以及圖23是示出實現(xiàn)示例性實施例的計算機的示例硬件結(jié)構(gòu)的框圖。
具體實施例方式以下,參照附圖描述本發(fā)明的示例性實施例。圖1是示出根據(jù)示例性實施例的示例結(jié)構(gòu)的概念模塊結(jié)構(gòu)示圖。通常,“模塊”是可以相互邏輯分離的軟件(計算機程序)或硬件的部件。因此,根據(jù)示例性實施例的模塊不僅對應(yīng)于計算機程序的模塊,而且對應(yīng)于硬件結(jié)構(gòu)的模塊。因此,示例性實施例的描述包括用于使計算機用作這些模塊的計算機程序(用于使計算機執(zhí)行各個程序步驟的程序、用于使計算機用作各個單元的程序或者用于使計算機實現(xiàn)各個功能的程序)、系統(tǒng)和方法的描述。為了方便描述,將使用表達“存儲”、“使…存儲”及其等效表達。在計算機程序的情況下,這些表達具體是指“使存儲裝置存儲”或“執(zhí)行控制以使存儲裝置存儲”。模塊可以以一一對應(yīng)關(guān)系而對應(yīng)于功能。根據(jù)封裝,可以通過單個程序構(gòu)成單個模塊,可以通過單個程序構(gòu)成多個模塊或者可以通過多個程序構(gòu)成單個模塊。此外,可以通過單個計算機執(zhí)行多個模塊,或者可以在分布式或并行環(huán)境中通過多個計算機執(zhí)行單個模塊??蛇x地,單個模塊可以包括另ー個模塊。下文中,“連接”用于表示邏輯連接(數(shù)據(jù)的傳送和接收、指令、數(shù)據(jù)之間的引用關(guān)系等)以及物理連接。“預(yù)定”是指在特定操作之前被確定,并且包括在根據(jù)示例性實施例的處理開始之后的特定操作之前以及在根據(jù)示例性實施例的處理開始之前根據(jù)當前情況/狀態(tài)被確定或者根據(jù)先前情況/狀態(tài)被確定的含義。除了不需要確定是否A的情況,具有“在A情況下執(zhí)行B”含義的描述被用作含義“確定是否A,如果確定A則執(zhí)ィ丁 B”。
系統(tǒng)或設(shè)備可以通過經(jīng)由諸如網(wǎng)絡(luò)(包括具有一一對應(yīng)關(guān)系的通信連接)的通信介質(zhì)相互連接的多個計算機、硬件単元、裝置等來實現(xiàn)或者可以通過單個計算機、硬件單元、裝置等來實現(xiàn)。同義地使用“設(shè)備”和“系統(tǒng)”。當然,“系統(tǒng)”不包括人為社會“組織”(社會系統(tǒng))。此外,在通過對應(yīng)模塊執(zhí)行的各個處理操作中或者在通過單個模塊執(zhí)行的各個處理操作中,從存儲裝置中讀取目標信息。在每個處理操作都結(jié)束之后,其處理結(jié)果被寫入存儲裝置。因此,可以省略在處理操作之前從存儲裝置中讀取以及在處理操作之后寫入存儲裝置的描述。這里,存儲裝置的示例包括硬盤、隨機存取存儲器(RAM)、外部存儲介質(zhì)、通過通信線連接的存儲裝置、中央處理單元(CPU)中的寄存器等。根據(jù)示例性實施例的信息處理設(shè)備將信息與運動圖像相關(guān)聯(lián)。如圖1所示,信息處理設(shè)備包括運動圖像存儲模塊100、運動圖像讀取模塊105、幻燈圖像鑒別模塊110、字符識別模塊115、單詞估計模塊120、背景獲取模塊125、關(guān)鍵字組選擇模塊130、關(guān)鍵字組存儲模塊140、單詞輸出模塊145和單詞存儲模塊150。信息與運動圖像相關(guān)聯(lián),使得容易使用信息捜索運動圖像。例如,可以在用于分析演講場景的運動圖像、提取和索引字符串以及能夠基于文本捜索運動圖像的系統(tǒng)中利用該示例性實施例。更具體地,在所拍攝的運動圖像包括幻燈投影的場景的情況下,該示例性實施例能夠提取和索弓I包括在幻燈圖像中的字符串并搜索運動圖像。運動圖像存儲模塊100連接至運動圖像讀取模塊105。運動圖像存儲模塊100被運動圖像讀取模塊105訪問,并存儲運動圖像(運動圖像數(shù)據(jù))。運動圖像可以為彩色圖像或單色圖像。此外,運動圖像可以包括聲音。例如,運動圖像包括包含字符的靜止圖像、使用幻燈圖像的演講或演出的圖像。這里,靜止圖像是拍攝的運動圖像中對應(yīng)于預(yù)定時間段以上的靜止片段的圖像,例如,在先前演講中使用的幻燈圖像的圖像等。以下,靜止圖像也被稱為幻燈圖像,但術(shù)語“靜止圖像”不限于幻燈圖像。運動圖像讀取模塊105連接至運動圖像存儲模塊100和幻燈圖像鑒別模塊110。運動圖像讀取模塊105在存儲在運動圖像存儲模塊100中的運動圖像中讀取目標運動圖像,并將讀取的運動圖像提供給幻燈圖像鑒別模塊110。幻燈圖像鑒別模塊110連接至運動圖像讀取模塊105和字符識別模塊115?;脽魣D像鑒別模塊110鑒別包括在目標運動圖像中的靜止圖像。例如,幻燈圖像鑒別模塊110從運動圖像中提取幻燈圖像的圖像。具體地,幻燈圖像鑒別模塊110計算包括在運動圖像的幀序列中的連續(xù)幀之間的像素值的差。幻燈圖像鑒別模塊110基于所計算出的差與預(yù)定閾值之間的比較結(jié)果鑒別幀序列中的被確定為靜止圖像的多個幀的集合。更具體地,當所計算的差小于/等于或小于預(yù)定閾值時,對應(yīng)片段的圖像(幀中的整個圖像或者幀中滿足上述條件的圖像部分)被鑒別為靜止圖像。這里,“幀之間”是指在其間具有預(yù)定時間段以上的幀之間。此外,“幀之間”是指彼此相鄰的幀之間。如果檢測到在對應(yīng)于預(yù)定時間段以上的順序幀之間發(fā)生像素值的差小于/等于或小于預(yù)定閾值的事件,則幻燈圖像鑒別模塊110可以將對應(yīng)于該片段的圖像鑒別為靜止圖像。此外,可以增加以下條件作為鑒別靜止圖像的條件具有矩形形狀的圖像以及具有百分比大干/等于或大于預(yù)定顔色(例如,白色)的面積的預(yù)定百分比的圖像。字符識別模塊115連接至幻燈圖像鑒別模塊110和單詞估計模塊120。字符識別模塊115對通過幻燈圖像鑒別模塊110鑒別的靜止圖像執(zhí)行字符識別。例如,字符識別模塊115識別演講中所使用的幻燈圖像中的字符??梢允褂矛F(xiàn)有的字符識別技術(shù)來執(zhí)行字符識別。背景獲取模塊125連接至關(guān)鍵字組選擇模塊130。背景獲取模塊125獲取關(guān)于通過運動圖像讀取模塊105讀取的運動圖像的信息。通過背景獲取模塊125執(zhí)行的處理對應(yīng)于包括在圖2或圖3所示背景獲取模塊125中的模塊,這將在以下進行描述。關(guān)鍵字組選擇模塊130連接至單詞估計模塊120、背景獲取模塊125和關(guān)鍵字組存儲模塊140。關(guān)鍵字組選擇模塊130從關(guān)鍵字組存儲模塊140中選擇與通過背景獲取模塊125獲取的信息相關(guān)聯(lián)的關(guān)鍵字組。關(guān)鍵字組存儲模塊140連接至關(guān)鍵字組選擇模塊130和單詞輸出模塊145。關(guān)鍵字組存儲模塊140被關(guān)鍵字組選擇模塊130和單詞輸出模塊145訪問,并存儲關(guān)鍵字組。以下將參照圖2、圖3、圖6、圖8、圖10、圖13、圖17和圖20描述存儲在關(guān)鍵字組存儲模塊140中的關(guān)鍵字組。單詞估計模塊120連接至字符識別模塊115、關(guān)鍵字組選擇模塊130和單詞輸出模塊145。單詞估計模塊120基于通過背景獲取模塊125或關(guān)鍵字組選擇模塊130獲取的信息來校正通過字符識別模塊115生成的字符識別結(jié)果。例如,單詞估計模塊120對作為通過字符識別模塊115生成的字符識別結(jié)果的字符串執(zhí)行形態(tài)分析,并將識別為單詞(用作將要提供給運動圖像的候選單詞)的字符提供給單詞輸出模塊145。如果用作字符識別結(jié)果的字符串包括與通過關(guān)鍵字組選擇模塊130選擇的任何一個關(guān)鍵字類似的關(guān)鍵字,則單詞估計模塊120將用作將要提供給運動圖像的候選單詞的關(guān)鍵字提供給單詞輸出模塊145。單詞輸出模塊145連接至單詞估計模塊120、關(guān)鍵字組存儲模塊140和單詞存儲模塊150。單詞輸出模塊145與目標運動圖像相關(guān)聯(lián)地輸出通過單詞估計模塊120校正的字符識別結(jié)果。例如,單詞輸出模塊145在單詞存儲模塊150中存儲從單詞估計模塊120接收的單詞以便執(zhí)行執(zhí)行對目標運動圖像的索引,在關(guān)鍵字組存儲模塊140中相互關(guān)聯(lián)地存儲通過背景獲取模塊125獲取的背景信息和從單詞估計模塊120接收的單詞,并且更新存儲在關(guān)鍵字組存儲模塊140中的信息。單詞存儲模塊150連接至單詞輸出模塊145。單詞存儲模塊150與目標運動圖像相關(guān)聯(lián)地存儲從單詞估計模塊120提供的字符識別結(jié)果。例如,單詞存儲模塊150是能夠使用文本作為關(guān)鍵字來捜索運動圖像的數(shù)據(jù)庫。圖2是示出根據(jù)示例性實施例的示例結(jié)構(gòu)的概念模塊結(jié)構(gòu)示圖。具體地,圖2示出了圖1所示背景獲取模塊125的細節(jié)。在圖2中,與圖1相同的部件用相同的參考標號表示,并且省略對應(yīng)描述。運動圖像讀取模塊105連接至幻燈圖像鑒別模塊110和背景獲取模塊125中的人物識別模塊210?;脽魣D像鑒別模塊110連接至運動圖像讀取模塊105、字符識別模塊115和背景獲取模塊125中的運動圖像ID/頁碼識別模塊220。字符識別模塊115連接至幻燈圖像鑒別模塊110、單詞估計模塊120和背景獲取模塊125中的演講者名字識別模塊230。背景獲取模塊125包括人物識別模塊210、運動圖像ID/頁碼識別模塊220和演講者名字識別模塊230中的至少ー個。人物識別模塊210連接至運動圖像讀取模塊105和關(guān)鍵字組選擇模塊130。人物識別模塊210識別目標運動圖像中的人物,并獲取關(guān)于該人物的信息。例如,人物識別模塊210對出現(xiàn)在運動圖像中的演講者執(zhí)行面部識別,并獲取作為面部識別結(jié)果的面部信息(指定人物的信息,例如,人物的名字或鑒別信息)以作為背景信息。以下將參照圖4至圖6描述該處理的細節(jié)。在使用通過人物識別模塊210生成的處理結(jié)果的情況下,單詞估計模塊120基于通過人物識別模塊210獲取的關(guān)于人物的信息來校正字符識別結(jié)果。運動圖像ID/頁碼識別模塊220連接至幻燈圖像鑒別模塊110和關(guān)鍵字組選擇模塊130?;谧鳛橛糜阼b別目標運動圖像的信息的運動圖像鑒別信息(以下稱為運動圖像ID)和通過幻燈圖像鑒別模塊110鑒別的靜止圖像的時間位置(temporal position),運動圖像ID/頁碼識別模塊220獲取可能包括在靜止圖像中的字符信息。例如,運動圖像ID/頁碼識別模塊220獲取目標運動圖像的運動圖像ID,并確定通過幻燈圖像鑒別模塊110提取的靜止圖像在運動圖像中的時間位置。例如,“可能包括在靜止圖像中的字符信息”對應(yīng)于在幻燈圖像中的字符。以下將參照圖7和圖8描述該處理的細節(jié)。在使用通過運動圖像ID/頁碼識別模塊220生成的處理結(jié)果的情況下,單詞估計模塊120基于通過運動圖像ID/頁碼識別模塊220獲取的字符信息來校正字符識別結(jié)果。演講者名字識別模塊230連接至字符識別模塊115和關(guān)鍵字組選擇模塊130。演講者名字識別模塊230提取包括在通過字符識別模塊115對處于預(yù)定時間位置的靜止圖像執(zhí)行的字符識別的結(jié)果中的人物名字,并獲取關(guān)于人物名字的信息。例如,演講者名字識別模塊230識別包括在通過字符識別模塊115提取的字符串中的人物名字作為演講者名字。通常,在第一幻燈圖像中描述演講者名字。因此,從第一幻燈圖像中提取的人物名字被認為是演講者名字。以下將參照圖9和圖10描述該處理的細節(jié)。在使用通過演講者名字識別模塊230生成的處理結(jié)果的情況下,單詞估計模塊120基于通過演講者名字識別模塊230獲取的關(guān)于人物名字的信息來校正通過字符識別模塊115生成的字符識別結(jié)果。關(guān)鍵字組選擇模塊130連接至單詞估計模塊120、人物識別模塊210、運動圖像ID/頁碼識別模塊220、演講者名字識別模塊230和關(guān)鍵字組存儲模塊140。關(guān)鍵字組選擇模塊130根據(jù)所接收的背景信息的類型和值來搜索關(guān)鍵字組存儲模塊140。在已經(jīng)從人物識別模塊210接收到作為背景信息的人物(類型)及其值的情況下,關(guān)鍵字組選擇模塊130搜索對應(yīng)于該人物(類型)的關(guān)鍵字組。在已經(jīng)從運動圖像ID/頁碼識別模塊220接收到運動圖像ID和頁碼的情況下,關(guān)鍵字組選擇模塊130捜索與該運動圖像ID和頁碼(類型)對應(yīng)的運動圖像ID的關(guān)鍵字組或者對應(yīng)頁碼前后的關(guān)鍵字組。在已經(jīng)從演講者名字識別模塊230接收到作為背景信息的人物名字(類型)及其值的情況下,關(guān)鍵字組選擇模塊130搜索對應(yīng)于該人物名字(類型)的人物名字的關(guān)鍵字組。關(guān)鍵字組存儲模塊140包括關(guān)鍵字組表240。關(guān)鍵字組表240包括ID列242、背景類型列244、背景值列246和關(guān)鍵字組列248。ID列242存儲用于唯一鑒別存儲在關(guān)鍵字組表240中的信息的數(shù)字。背景類型列244存儲用于確定將被搜索的關(guān)鍵字組的背景的類型。關(guān)鍵字組對應(yīng)于從人物識別模塊210、運動圖像ID/頁碼識別模塊220和演講者名字識別模塊230的任意一個接收的信息。背景值列246存儲背景的值(例如,人物名字、運動圖像ID和頁碼)。關(guān)鍵字組列248存儲對應(yīng)于背景的關(guān)鍵字組。單詞估計模塊120確定作為從字符識別模塊115提供的識別結(jié)果的字符串和通過關(guān)鍵字組選擇模塊130選擇的關(guān)鍵字組之間的相似性,井向單詞輸出模塊145輸出具有預(yù)定閾值以上的一個或多個關(guān)鍵字作為候選單詞。代替確定相似性,單詞估計模塊120可以向單詞輸出模塊145輸出在形態(tài)分析等的處理中被識別為單詞的ー個或多個單詞。通過單詞輸出模塊145,這些候選單詞作為新的背景的值被反饋給關(guān)鍵字組存儲模塊140。圖3是示出根據(jù)示例性實施例的示例結(jié)構(gòu)的概念模塊結(jié)構(gòu)示圖。具體地,圖3示出了圖1所示背景獲取模塊125的細節(jié)。在圖3中,與圖1相同的部件用相同的參考標號表示,并且將省略對應(yīng)的描述。運動圖像讀取模塊105連接至幻燈圖像鑒別模塊110和演講標題指定模塊320?;脽魣D像鑒別模塊110連接至運動圖像讀取模塊105和字符識別模塊115。字符識別模塊115連接至幻燈圖像鑒別模塊110、單詞估計模塊120、文本組配置模塊330、人物名字提取模塊340和演講標題提取模塊350。時間表存儲模塊310連接至演講標題指定模塊320。時間表存儲模塊310存儲周幾、地點(演講室)、演講標題等。背景獲取模塊125包括演講標題指定模塊320、文本組配置模塊330、人物名字提取模塊340和演講標題提取模塊350中的至少ー個。演講標題指定模塊320連接至運動圖像讀取模塊105、關(guān)鍵字組選擇模塊130和時間表存儲模塊310。演講標題指定模塊320提取關(guān)于目標運動圖像的拍攝地點以及拍攝日期和時間的信息,并獲取關(guān)于在該拍攝日期和時間在該拍攝地點處舉行的事件的信息。這里,事件的示例為演講。演講標題指定模塊320從演講安排(時間表,包括地點、日期和時間以及演講標題)獲取關(guān)于演講的信息。例如,演講標題指定模塊320從關(guān)于通過運動圖像讀取模塊105讀取的運動圖像的運動圖像信息中提取日期/時間信息(其為關(guān)于拍攝運動圖像時的日期和時間的信息)和地點信息(其為關(guān)于拍攝運動圖像的地點的信息)。在將運動圖像與日期/時間信息和地點信息一起存儲在運動圖像存儲模塊100中的情況下,演講標題指定模塊320提取日期/時間信息和地點信息??梢曰谶\動圖像文件的記錄日期和時間來獲取日期/時間信息??梢酝ㄟ^從包括在運動圖像中的元數(shù)據(jù)中提取相機的序列號以及通過使用序列號與地點信息相關(guān)聯(lián)的預(yù)備表來提取地點信息。然后,演講標題指定模塊320根據(jù)基于日期/時間信息中的日期和時間而指定的演講標題或授課標題來獲取關(guān)于演講的信息。下面參照圖11至圖14描述處理的細節(jié)。在使用通過演講標題指定模塊320生成的處理結(jié)果的情況下,單詞估計模塊120基于通過演講標題指定模塊320獲取的關(guān)于事件的信息來校正通過單詞表示模塊115生成的字符識別結(jié)果。文本組配置模塊330連接至字符識別模塊115和關(guān)鍵字組選擇模塊130。文本組配置模塊330對通過字符識別模塊115生成的字符識別結(jié)果執(zhí)行形態(tài)分析,并獲取關(guān)于字符串(其為形態(tài)分析的結(jié)果)的信息或者關(guān)于與該字符串類似的字符串的信息。例如,文本組配置模塊330配置從字符識別模塊115接收的字符串。配置的示例包括使用形態(tài)分析提取單詞以及切斷具有預(yù)定長度的字符串。以下將參照圖15至圖17描述處理的細節(jié)。在使用通過文本組配置模塊330生成的處理結(jié)果的情況下,單詞估計模塊120基于通過文本組配置模塊330獲取的關(guān)于字符串的信息校正通過單詞識別模塊115生成的字符識別結(jié)果。人物名字提取模塊340連接至字符識別模塊115和關(guān)鍵字組選擇模塊130。人物名字提取模塊340提取包括在通過字符識別模塊115生成的字符識別結(jié)果中的人物名字。當存在多個人物名字吋,人物名字提取模塊340基于各靜止圖像的時間位置執(zhí)行加權(quán),并獲取關(guān)于使用加權(quán)結(jié)果選擇的人物名字的信息。例如,人物名字提取模塊340從作為從字符識別模塊115接收的字符識別結(jié)果的字符串中提取人物名字。當提取了多個人物名字吋,人物名字提取模塊340接收將被處理的幻燈圖像的編號以及字符串,并特別對從第一幻燈圖像中提取的人物名字執(zhí)行加權(quán)。在使用通過人物名字提取模塊340生成的處理結(jié)果的情況下,單詞估計模塊120基于通過人物名字提取模塊340獲取的關(guān)于人物名字的信息校正通過字符識別模塊115生成的字符識別結(jié)果。演講標題提取模塊350連接至字符識別模塊115和關(guān)鍵字組選擇模塊130。演講標題提取模塊350提取包括在通過字符識別模塊115生成的字符識別結(jié)果中的事件標題。當存在多個事件標題吋,演講標題提取模塊350基于各靜止圖像的時間位置執(zhí)行加權(quán),并獲取關(guān)于使用加權(quán)結(jié)果選擇的事件標題的信息。例如,演講標題提取模塊350從作為從字符識別模塊115接收的字符識別結(jié)果的字符串中提取演講標題。當提取了多個演講標題吋,演講標題提取模塊350接收將被處理的幻燈圖像的編號以及字符串,并特別對從第一幻燈圖像中提取的演講標題執(zhí)行加權(quán)。此外,當演講標題位于標題可能定位的位置(諸如幻燈圖像的頂部)時,演講標題提取模塊350執(zhí)行加權(quán)。以下將參照圖18至圖21描述通過人物名字提取模塊340和演講標題提取模塊350執(zhí)行的處理的細節(jié)。在使用通過演講標題提取模塊350生成的處理結(jié)果的情況下,單詞估計模塊120基于關(guān)于通過演講標題提取模塊350獲取的事件標題的信息校正通過字符識別模塊115生成的字符識別結(jié)果。關(guān)鍵字組選擇模塊130連接至單詞估計模塊120、演講標題指定模塊320、文本組配置模塊330、人物名字提取模塊340、演講標題提取模塊350和關(guān)鍵字組存儲模塊140。關(guān)鍵字組選擇模塊130還經(jīng)由通信線390連接至數(shù)據(jù)庫380和數(shù)據(jù)庫382。關(guān)鍵字組選擇模塊130根據(jù)所接收的背景信息的類型和值來搜索關(guān)鍵字組存儲模塊140。在已經(jīng)從演講標題指定模塊320接收了演講標題(類型)及其值作為背景信息的情況下,關(guān)鍵字組選擇模塊130捜索對應(yīng)于該演講標題(類型)的關(guān)鍵字組。在已經(jīng)從文本組配置模塊330接收了文本組(類型)及其值作為背景信息的情況下,關(guān)鍵字組選擇模塊130執(zhí)行所配置字符串與對應(yīng)于該文本組(類型)的關(guān)鍵字組之間的匹配,并確定與預(yù)定閾值或以上值匹配的關(guān)鍵字組作為候選。在已經(jīng)從人物名字提取模塊340和演講標題提取模塊350接收了演講標題(類型)、人物名字(類型)及其值作為背景信息的情況下,關(guān)鍵字組選擇模塊130捜索對應(yīng)于演講標題(類型)和人物名字(類型)的關(guān)鍵字組??蛇x地,除關(guān)鍵字組存儲模塊140中的關(guān)鍵字組表360之外,關(guān)鍵字組選擇模塊130可以搜索數(shù)據(jù)庫380或數(shù)據(jù)庫382。關(guān)鍵字組存儲模塊140包括關(guān)鍵字組表360。關(guān)鍵字組表360包括ID列362、背景類型列364、背景值列366和關(guān)鍵字組列368。關(guān)鍵字組表360等效于圖2所示關(guān)鍵字組表240。然而,關(guān)鍵字組表360存儲與從演講標題指定模塊320、文本組配置模塊330、人物名字提取模塊340和演講標題提取模塊350提供的背景信息的類型相對應(yīng)的信息。單詞估計模塊120確定作為從字符識別模塊115提供的識別結(jié)果的字符串與通過關(guān)鍵字組選擇模塊130選擇的關(guān)鍵字組之間的相似性,井向單詞輸出模塊145輸出具有預(yù)定閾值以上的一個或多個關(guān)鍵字作為候選單詞??蛇x地,代替確定相似性,單詞估計模塊120可以向單詞輸出模塊145輸出在形態(tài)分析的處理等中識別為單詞的一個或多個單詞作為候選單詞。通過單詞輸出模塊145,這些候選單詞被反饋給(存儲迸)關(guān)鍵字組存儲模塊140作為新的背景的值。圖4是示出根據(jù)示例性實施例的通過人物識別模塊210等執(zhí)行的處理的示例的流程圖。將描述使用關(guān)于人物的信息作為背景信息的情況。這里,幻燈圖像鑒別模塊110已經(jīng)分析運動圖像并提取幻燈投影的圖像作為靜止圖像(或者幻燈投影圖像中的幻燈圖像的靜止圖像)。在步驟S402中,人物識別模塊210分析運動圖像并指定人物。面部識別技術(shù)可用作指定人物的技術(shù)。如果這里獲取的結(jié)果與先前識別的面部圖像匹配,則人物識別模塊210獲取關(guān)于面部圖像的面部信息。如果沒有識別出面部圖像,則處理前進至步驟S406。在步驟S404中,關(guān)鍵字組選擇模塊130通過使用面部信息搜索關(guān)鍵字組存儲模塊140以查找與所獲取的面部信息相關(guān)聯(lián)的關(guān)鍵字。在步驟S406中,字符識別模塊115對靜止圖像執(zhí)行字符識別。在步驟S408中,單詞估計模塊120從作為字符識別結(jié)果的字符串切出多個字符串。單詞估計模塊120對通過字符識別獲取的字符串執(zhí)行形態(tài)分析,并切出多個字符串以使得每個字符串都具有通過步驟S404中的搜索獲取的關(guān)鍵字的字符串的長度。在步驟S410中,單詞估計模塊120提取作為形態(tài)分析的結(jié)果已經(jīng)提取為名詞的單詞。此外,單詞估計模塊120計算在步驟S408中切出的各字符串與包括在關(guān)鍵字組中的關(guān)鍵字之間的相似性。在這種情況下,可以通過比較具有相同長度的單詞減少計算量。可以通過使用編輯距離(Levenshtein distance)和單詞的長度來計算相似性。在步驟S412中,單詞輸出模塊145存儲通過形態(tài)分析獲取的單詞和通過關(guān)鍵字組存儲模塊140中的相似性計算獲取的單詞。在步驟S414中,單詞輸出模塊145輸出分析結(jié)果。利用表示運動圖像的ID —起索引分析結(jié)果。在圖4中的流程圖所示的處理中,校正對單個運動圖像中所包括的靜止圖像執(zhí)行的字符識別的結(jié)果。可選地,可以對運動圖像中包括的每個幻燈圖像執(zhí)行該處理。將參照圖5給出更加詳細的描述。圖5是示出運動圖像500、幻燈圖像510和面部區(qū)域520的示圖。運動圖像500是目標運動圖像中的一幀的圖像。運動圖像500包括幻燈圖像510和人物?;脽魣D像鑒別模塊110將運動圖像500鑒別為靜止圖像。在步驟S402中,人物識別模塊210對面部區(qū)域520執(zhí)行面部識別。例如,假設(shè)面部區(qū)域520被識別為人物A。在步驟S404中,關(guān)鍵字組選擇模塊130從圖6所示人物關(guān)鍵字組表600中提取與作為背景類型(在背景類型列604中)的人物以及作為其值(面部識別結(jié)果)的人物A(在背景值列606中)相對應(yīng)的關(guān)鍵字組(在關(guān)鍵字組列608中)。人物關(guān)鍵字組表600等效于圖2所示的關(guān)鍵字組表240。這里,提取關(guān)鍵字組列608中的關(guān)鍵字組“security、authentication、coae、access,,。在步驟S406中,字符識別模塊115對幻燈圖像510執(zhí)行字符識別。結(jié)果,假設(shè)獲取了字符識別結(jié)果 “Rasically sac U Yify is dihherent frcm safety”。這種識別結(jié)果是由于如下原因而得到的。從運動圖像中提取的靜止圖像具有與通過掃描紙件文檔獲取的圖像相比較低的分辨率和較低的對比度,因此難以對其執(zhí)行精確的字符識別。在步驟S408中,單詞估計模塊120對字符識別結(jié)果執(zhí)行形態(tài)分析,并提取名詞“safety”。然后,計算在步驟S404中提取的關(guān)鍵字組中的各個字符串的長度。在這種情況下,長度分別為8個字符、14個字符、4個字符和6個字符。因此,字符識別結(jié)果被劃分為4個字符、6個字符、8個字符和14個字符。結(jié)果,獲取了“^8しれ&1、1178、8&(^、11 Y if、lyis、…、rentircmsaiety,,。在步驟S410中,單詞估計模塊120將作為字符識別結(jié)果并具有8個字符的字符串"sac u Y ify”與作為包括在關(guān)鍵字組中的關(guān)鍵字“security”進行比較。這兩個字符串在四個字符“a”、“ U ”、“ Y ”和“f”上相互不同。因此,編輯距離為4,并且它們之間的相似性為0.5,這通過將4除以字符串的長度(S卩,8)來得到。當相似性等于或小于預(yù)定閾值吋,向單詞輸出模塊145輸出所比較的關(guān)鍵字作為候選字符串。例如,當閾值為0. 5時,輸出“ security,7。在步驟S412中,單詞輸出模塊145在關(guān)鍵字組存儲模塊140中存儲通過形態(tài)分析獲取的單詞“safety”和通過相似性計算獲取的關(guān)鍵字“security”。即,“safety”被增加到與人物關(guān)鍵字組表600中的“人物A”相對應(yīng)的關(guān)鍵字組列608中?!皊ecurity”是關(guān)鍵字組列608中已經(jīng)存在的關(guān)鍵字。在步驟S414中,單詞輸出模塊145向目標運動圖像添加“safety”和“security”作為索引信息。圖7是示出根據(jù)示例性實施例的通過運動圖像ID/頁碼識別模塊220等執(zhí)行的處理的示例的流程圖。將描述將運動圖像ID和頁碼作為背景信息的情況。這里,幻燈圖像鑒別模塊110已經(jīng)分析了運動圖像并提取了幻燈投影的圖像作為靜止圖像(或者幻燈投影圖像中的幻燈圖像的靜止圖像)。在步驟S702中,運動圖像ID/頁碼識別模塊220確定是否已經(jīng)指定了運動圖像ID和頁碼。如果已經(jīng)指定了運動圖像ID和頁碼,則處理前進到步驟S704。如果沒有指定,則處理前進至步驟S706。分配給將被分析的運動圖像的運動圖像ID被用于指定運動圖像ID和頁碼。作為運動圖像ID,可以使用預(yù)先分配給運動圖像的ID。可選地,通過使用存儲了與運動圖像ID相關(guān)聯(lián)的運動圖像的標題以及拍攝日期和時間的表,可以基于運動圖像的標題以及運動圖像的拍攝日期和時間來獲取運動圖像ID。在分析具有運動圖像ID的運動圖像的情況下,頁碼指示了被提取為文本提取目標的靜止圖像的時間位置。換句話說,頁碼是被提取為靜止圖像的圖像的位置。具體地,當幻燈圖像改變時(當翻頁時),新幻燈圖像被提取為靜止圖像。因此,被鑒別為靜止圖像的每個圖像的時間位置對應(yīng)于頁碼。在步驟S704中,關(guān)鍵字組選擇模塊130通過使用運動圖像ID或頁碼搜索關(guān)鍵字組存儲模塊140以查找與運動圖像ID和頁碼相關(guān)聯(lián)的關(guān)鍵字組。例如,將給出如下情況的描述,其中運動圖像ID/頁碼關(guān)鍵字組表800存儲在關(guān)鍵字組存儲模塊140中,從中提取出靜止圖像的運動圖像具有運動圖像ID A123,并且所提取的靜止圖像在第三頁上。圖8是示出運動圖像ID/頁碼關(guān)鍵字組表800的數(shù)據(jù)結(jié)構(gòu)的示例的示圖。運動圖像ID/頁碼關(guān)鍵字組表800包括ID列802、背景類型列804、背景值列806和關(guān)鍵字組列808。運動圖像ID/頁碼關(guān)鍵字組表800等效于關(guān)鍵字組表240,但是背景類型列804存儲運動圖像ID和頁碼。在通過關(guān)鍵字組選擇模塊130執(zhí)行的關(guān)鍵字組搜索中,捜索與所獲取的運動圖像IDA123和頁碼003相關(guān)的關(guān)鍵字組??墒褂枚喾N類型的捜索方法。例如,可以搜索具有A123的運動圖像ID的所有頁面(僅使用運動圖像ID的捜索),并且可以提取與其對應(yīng)的關(guān)鍵字組列808??蛇x地,可以搜索具有A123的運動圖像ID和頁碼003的頁面(使用運動圖像ID和頁碼的捜索),并且可以提取與其對應(yīng)的關(guān)鍵字組列808??蛇x地,可以搜索與具有A123的運動圖像ID和頁碼003的頁面相關(guān)的頁面(例如,之前預(yù)定量的頁,具體地,I頁、2頁或3頁),并且可以提取與其對應(yīng)的關(guān)鍵字組列808。此外,在已經(jīng)分析了靜止圖像的后續(xù)頁面之后,不僅前面的頁可以被認為是捜索目標,而且后續(xù)頁也可以被認為是搜索目標(例如,之后預(yù)定量的頁,具體地,3頁、4頁或5頁,或者之前和之后預(yù)定量的頁,具體地,I頁、2頁、3頁或4頁),并且可以提取與其對應(yīng)的關(guān)鍵字組列808。步驟S706的處理等效于圖4所示流程圖中的步驟S406的處理。在步驟S706中,字符識別模塊115對靜止圖像執(zhí)行字符識別。在步驟S708中,單詞估計模塊120從作為字符識別結(jié)果的字符串中切出多個字符串。在步驟S710中,單詞估計模塊120提取作為形態(tài)分析的結(jié)果已經(jīng)提取為名詞的單詞。此外,單詞估計模塊120計算步驟S708中切出的各字符串與包括在關(guān)鍵字組中的各關(guān)鍵字之間的相似性。在步驟S712中,單詞輸出模塊145將通過形態(tài)分析獲取的單詞以及通過計算相似性得到的單詞存儲到關(guān)鍵字組存儲模塊140中。
在步驟S714中,單詞輸出模塊145輸出分析結(jié)果。在圖7流程圖所示的處理中,校正對單個運動圖像所包括的靜止圖像執(zhí)行字符識別的結(jié)果??蛇x地,可以對包括在運動圖像中的每個幻燈圖像執(zhí)行該處理。圖9是示出根據(jù)示例性實施例的通過演講者名字識別模塊230等執(zhí)行的處理的示例的流程圖。將描述將演講者名字作為背景信息的情況。這里,幻燈圖像鑒別模塊110已經(jīng)分析了運動圖像并提取了幻燈投影的圖像作為靜止圖像(或者幻燈投影圖像中的幻燈圖像的靜止圖像)。在步驟S902中,演講者名字識別模塊230確定是否已經(jīng)指定了演講者名字。如果已經(jīng)指定了演講者名字,則處理前進至步驟S904。如果沒有指定,則處理前進至步驟S906。使字符識別模塊115對具有預(yù)定頁碼(例如,I或2)的靜止圖像執(zhí)行字符識別。然后,確定字符識別結(jié)果是否包括與在預(yù)先存儲演講者名字的表(例如,下面描述的演講者名字關(guān)鍵字組表1000或者演講者名字關(guān)鍵字組表1000中的背景值列1006)中登記的演講者名字相匹配的演講者名字。如果字符識別結(jié)果包括與表中登記的演講者名字相匹配的演講者名字,則認為已經(jīng)指定了演講者名字。如果沒有,則認為沒有指定演講者名字。在步驟S904中,關(guān)鍵字組選擇模塊130通過使用演講者名字搜索關(guān)鍵字組存儲模塊140以查找與演講者名字相關(guān)聯(lián)的關(guān)鍵字組。例如,演講者名字關(guān)鍵字組表1000被存儲在關(guān)鍵字組存儲模塊140中。圖10是示出演講者名字關(guān)鍵字組表1000的數(shù)據(jù)結(jié)構(gòu)的示例的示圖。演講者名字關(guān)鍵字組表1000包括ID列1002、背景類型列1004、背景值列1006和關(guān)鍵字組列1008。演講者名字關(guān)鍵字組表1000等效于關(guān)鍵字組表240,但是背景類型列1004存儲演講者名字。在通過關(guān)鍵字組選擇模塊130執(zhí)行的關(guān)鍵字組的搜索中,在背景值列1006中搜索所獲取的演講者名字,并且從關(guān)鍵字組列1008中提取與演講者名字相關(guān)的關(guān)鍵字組。步驟S906的處理等效于圖4所示流程圖中步驟S406的處理。在步驟S906中,字符識別模塊115對靜止圖像執(zhí)行字符識別。在步驟S908中,單詞估計模塊120從作為字符識別結(jié)果的字符串切出多個字符串。在步驟S910中,單詞估計模塊120提取作為形態(tài)分析的結(jié)果已經(jīng)提取為名詞的單詞。此外,單詞估計模塊120計算步驟S908中切出的各字符串與關(guān)鍵字組所包括的各關(guān)鍵字之間的相似性。在步驟S912中,單詞輸出模塊145將通過形態(tài)分析獲取的單詞和通過相似性計算獲取的單詞存儲到關(guān)鍵字組存儲模塊140中。在步驟S914中,單詞輸出模塊145輸出分析結(jié)果。在圖9中的流程圖所示處理中,校正對單個運動圖像所包括的靜止圖像執(zhí)行的字符識別的結(jié)果。可選地,可以對運動圖像所包括的每個幻燈圖像執(zhí)行該處理。圖11是示出根據(jù)示例性實施例的通過演講標題指定模塊320等執(zhí)行的處理的示例的流程圖。將描述使用演講標題作為背景信息的情況。在步驟S1102中,通過采用上面對演講標題指定模塊320執(zhí)行的處理的描述中所述的方法,演講標題指定模塊320獲取運動圖像的拍攝日期和時間以及拍攝地點。在步驟S1104中,演講標題指定模塊320基于拍攝日期和時間獲取星期幾和時間,并通過使用地點、星期幾和時間作為關(guān)鍵字來搜索時間表存儲模塊310,從而獲取演講標題。時間表1200等被存儲在時間表存儲模塊310中。圖12是示出時間表1200等的數(shù)據(jù)結(jié)構(gòu)的示例的示圖。時間表1200包括時隙列1202、星期一列1204、星期二列1206、星期三列1208等。提供用于各個年級的多個時間表(時間表1200、1220和1240)。時隙列1202存儲關(guān)于演講的開始時間和結(jié)束時間的信息。星期一列1204存儲關(guān)于在星期ー舉行的演講和演講室的信息。星期二列1206存儲關(guān)于在星期ニ舉行的演講和演講室的信息。星期三列1208存儲關(guān)于在星期三舉行的演講和演講房間的信息。演講標題指定模塊320基于拍攝日期和時間提取在對應(yīng)日期對應(yīng)時間舉行的演講的演講標題和演講室,并獲取拍攝地點與演講室匹配的演講標題。這里,可以確定是否獲取了演講標題。如果已獲取,則處理可以前進到步驟S1106,否則前進到步驟S1108。在步驟SI 106中,關(guān)鍵字組選擇模塊130通過使用演講標題搜索關(guān)鍵字組存儲模塊140以查找與演講標題相關(guān)的關(guān)鍵字組。例如,將給出在關(guān)鍵字組存儲模塊140中存儲了演講標題關(guān)鍵字組表1300并且 “economy I”被指定為演講標題的情況的描述。圖13是示出演講標題關(guān)鍵字組表1300的數(shù)據(jù)結(jié)構(gòu)的示例的示圖。演講標題關(guān)鍵字組表1300包括ID列1302、背景類型列1304、背景值列1306和關(guān)鍵字組列1308。演講標題關(guān)鍵字組表1300等效于關(guān)鍵字組表240,但是背景類型列1304存儲演講標題。在通過關(guān)鍵字組選擇模塊130執(zhí)行的關(guān)鍵字組的搜索中,在背景值列1306中搜索所獲取的演講標題,并且從關(guān)鍵字組列1308中提取與演講標題相關(guān)的關(guān)鍵字組。這里,提取包括“ economy'“market ”、“ec onomic” 和“GDP” 的關(guān)鍵字組。在步驟S1108中,幻燈圖像鑒別模塊110分析運動圖像,并提取幻燈投影的圖像作為靜止圖像(或者幻燈投影圖像中的幻燈圖像的靜止圖像)。例如,將給出已提取幻燈圖像1410作為靜止圖像的示例的描述。圖14是示出運動圖像1400和幻燈圖像1410的示圖。運動圖像1400包括幻燈圖像1410。對各個提取的靜止圖像重復(fù)執(zhí)行自步驟SlllO的處理。在步驟SlllO中,確定是否已處理了所有提取的靜止圖像。如果所有提取的靜止圖像都已被處理,則處理結(jié)束。否則,處理前進到步驟S1112。在步驟S1112中,字符識別模塊115對靜止圖像執(zhí)行字符識別。例如,假設(shè)針對運動圖像 1400 中的幻燈圖像 1410,獲取 “Ecohomidcapital is…in terms of economy” 作為字符識別結(jié)果。在步驟S1114中,單詞估計模塊120從作為字符識別結(jié)果的字符串切出多個字符串。單詞估計模塊120對通過字符識別獲取的字符串執(zhí)行形態(tài)分析,并切出多個字符串以使得每個字符串都具有通過步驟S1106中的關(guān)鍵字搜索獲取的關(guān)鍵字的字符串的長度。在前面字符識別結(jié)果的示例中,作為形態(tài)分析的結(jié)果,將“capital”和“economy”提取作為名詞。通過步驟S1106中對關(guān)鍵字組的搜索獲取的關(guān)鍵字“eC0n0my”、“market”、“economic”和“⑶P”的字符串的長度分別為7個字符、6個字符、8個字符和3個字符。因此,切出字符串“Eco,oho, omi,idc,cap,…,andfeconomy,,。在步驟S1116中,單詞估計模塊120提取作為形態(tài)分析結(jié)果被提取為名詞的單詞。此外,單詞估計模塊120計算步驟S1114中切出的各字符串與關(guān)鍵字組所包括的各關(guān)鍵字之間的相似性。在這種情況下,可以通過比較具有相同長度的單詞來減少計算量??梢酝ㄟ^使用編輯距離和單詞的長度來計算相似性。現(xiàn)在,將給出對切出的各字符串與關(guān)鍵字組包括的各關(guān)鍵字之間的相似性進行的計算的描述。即,將給出如下具體示例的描述,其中通過比較具有相同長度的單詞減少計算量并且通過使用編輯距離和單詞長度計算相似性?!癊C0h0mid”(作為單詞識別結(jié)果并具有8個字符的字符串)與“ economic”(關(guān)鍵字組所包括的關(guān)鍵字)進行比較。這兩個字符串在2個字符“h”和“ d”上相互不同。因此,編輯距離為2,并且相似性為0. 25,這通過將2除以字符串的長度(即,8)來得到。當相似性等于或小于預(yù)定閾值時,向單詞輸出模塊145輸出所比較的關(guān)鍵字來作為候選。例如,當閾值為0. 5時,輸出“economic”。在步驟SI 118中,單詞輸出模塊145在關(guān)鍵字組存儲模塊140中存儲通過形態(tài)分析獲取的單詞“capital”和“economy”以及通過相似性計算獲取的關(guān)鍵字“economic”。即,“capital”被添加至與演講標題關(guān)鍵字組表1300中的“economy I”相對應(yīng)的關(guān)鍵字組列1308。“economy”和“economic”是關(guān)鍵字組列1308中已經(jīng)存在的關(guān)鍵字。
在步驟S1120中,單詞輸出模塊145向目標運動圖像添加“economic”、“capital”和“economy”作為索引信息。具體地,當出現(xiàn)幻燈圖像時,與運動圖像ID和時間一起索引這些關(guān)鍵字。在圖11中的流程圖所示的處理中,處理運動圖像所包括的各個幻燈圖像。可選地,可以針對單個運動圖像所包括的靜止圖像校正字符識別結(jié)果。圖15是示出根據(jù)示例性實施例的通過文本組配置模塊130等執(zhí)行的處理的示例的流程圖。將描述將文本組用作背景信息的情況。在步驟S1502中,幻燈圖像鑒別模塊110分析運動圖像,并提取幻燈投影的圖像作為靜止圖像(或者幻燈投影圖像中的幻燈圖像的靜止圖像)。例如,將給出已經(jīng)提取幻燈圖像1610作為靜止圖像的示例的描述。圖16是示出運動圖像1600和幻燈圖像1610的示圖。運動圖像1600包括幻燈圖像1610。針對各個提取的靜止圖像重復(fù)執(zhí)行自步驟S1504的處理。在步驟S1504中,確定是否已經(jīng)處理了所有提取的靜止圖像。如果已經(jīng)處理了所有提取的靜止圖像,則處理結(jié)束。否則,處理前進至步驟S1506。在步驟S1506中,字符識別模塊115對靜止圖像執(zhí)行字符識別。例如,假設(shè)針對運動圖像 1600 中的幻燈圖像 1610獲取“Rasically sac U Yify is dihherent frcm safety”作為字符識別結(jié)果。在步驟S1508中,文本組配置模塊330對字符識別結(jié)果執(zhí)行配置。首先,文本組配置模塊330對作為字符識別結(jié)果的字符串執(zhí)行形態(tài)分析,從而提取單詞。此外,文本組配置模塊330從字符識別結(jié)果中提取具有預(yù)定長度的字符串。在上述示例中,提取名詞“safety”作為單詞。然后,切出具有4至14個字符的字符串。結(jié)果,得到“Ras1、ical、
丄lys、sacy、y yif> fyis> -Hirentfrcmsafetyno在步驟S1510中,關(guān)鍵字組選擇模塊130通過使用步驟S1508中提取的單詞和/或具有預(yù)定長度的字符串搜索關(guān)鍵字組存儲模塊140以查找關(guān)鍵字組。例如,文本組關(guān)鍵字組表1700存儲在關(guān)鍵字組存儲模塊140中。圖17是示出文本組關(guān)鍵字組表1700的數(shù)據(jù)結(jié)構(gòu)的示圖。文本組關(guān)鍵字組表1700包括ID列1702、背景類型列1704和關(guān)鍵字組列1708。文本組關(guān)鍵字組表1700等效于不具有背景值列246的關(guān)鍵字組表240??蛇x地,文本組關(guān)鍵字組表1700可以包括等效于空的背景值列246。背景類型列1704存儲文本組。在這種情況下執(zhí)行的捜索中,不需要所有的單詞和字符串與關(guān)鍵字組列1708所存儲的任何一個關(guān)鍵字相匹配,只要匹配的數(shù)量為預(yù)定值或以上、或者通過將匹配的數(shù)量除以搜索所使用的關(guān)鍵字的數(shù)量而得到的匹配頻率為預(yù)定值或以上即可。在上述示例中,“safety”匹配(文本組關(guān)鍵字組表1700中的第一行),由此傳送包括在該列中的關(guān)鍵字組(security, safety)以作為搜索結(jié)果。在步驟S1512中,單詞估計模塊120提取作為形態(tài)分析結(jié)果已被提取為名詞的單詞。此外,單詞估計模塊120計算在步驟S1510中提取的字符串與在關(guān)鍵字組中包括的關(guān)鍵字之間的相似性。在這種情況下,可以通過比較具有相同長度的單詞來減少計算量??梢酝ㄟ^使用編輯距離和單詞長度來計算相似性。
現(xiàn)在,將給出切出的各字符串與關(guān)鍵字組包括的各關(guān)鍵字之間的相似性的計算的描述。即,將給出如下具體示例的描述,其中通過比較具有相同長度的單詞來減少計算量并且通過使用編輯距離和單詞長度來計算相似性。作為字符識別結(jié)果且具有8字符的字符串"Sacu Y ify”與作為關(guān)鍵字組包括的關(guān)鍵字“security”進行比較。這兩個字符串在四個字符“a”、“ u ”、“ y ”和“f”上相互不同。因此,編輯距離為4,并且相似性為0. 5,該相似性通過將4除以字符串的長度(S卩,8)來得到。當相似性等于或小于預(yù)定閾值時,向單詞輸出模塊145輸出所比較的關(guān)鍵字作為候選字符串。例如,當閾值為0. 5時,輸出“security”。在步驟S1514中,單詞輸出模塊145在關(guān)鍵字組存儲模塊140中存儲通過形態(tài)分析獲取的單詞“safety”和通過相似性計算獲取的關(guān)鍵字“security”。即,在文本組關(guān)鍵字組表1700的關(guān)鍵字組列1708的第一行中存儲“safety”和“security”。然而,此處已經(jīng)存在這些關(guān)鍵字,因此不需要増加。在步驟S1516中,單詞輸出模塊145向目標運動圖像增加“safety”和“security”作為索引信息。具體地,當出現(xiàn)幻燈圖像時,利用運動圖像ID和時間一起索引這些關(guān)鍵字。在圖15中的流程圖所示的處理中,處理包括在運動圖像中的各個幻燈圖像。可選地,可以針對包括在單個運動圖像中的靜止圖像校正字符識別的結(jié)果。圖18是示出根據(jù)示例性實施例的通過人物名字提取模塊340、演講標題提取模塊350等執(zhí)行的處理的示例的流程圖。將描述使用人物名字或演講標題作為背景信息的情況。在步驟S1802中,幻燈圖像鑒別模塊110分析運動圖像并提取幻燈投影的圖像作為靜止圖像(或者幻燈投影圖像中的幻燈圖像的靜止圖像)。例如,將給出已經(jīng)提取幻燈圖像1910和2110作為靜止圖像的示例的描述。圖19是示出運動圖像1900和幻燈圖像1910的示圖。運動圖像1900包括幻燈圖像1910。圖21是示出運動圖像2100和幻燈圖像2110的示圖。運動圖像2100包括幻燈圖像2110。在步驟S1804中,確定是否已經(jīng)處理了所有(或ー些)提取的靜止圖像。如果已經(jīng)處理了所有(或ー些)提取的靜止圖像,則處理前進至步驟S1812。否則,處理前進到步驟 S1806。在步驟S1806中,字符識別模塊115對靜止圖像執(zhí)行字符識別。例如,假設(shè)獲取“ECONOMY II”和“BKO YAMADA ”作為針對運動圖像1900中的幻燈圖像1910的字符識別結(jié)果。還假設(shè)獲取“Demand and subbjy”作為針對運動圖像2100中的幻燈圖像2110的字符識別結(jié)果。然后,演講標題提取模塊350確定字符識別結(jié)果是否包括與預(yù)先存儲人物名字和演講標題的表(例如,下面描述的人物名字/演講標題關(guān)鍵字組表2000或者人物名字/演講標題關(guān)鍵字組表2000中的背景值列2006)中所存儲的人物名字或演講標題匹配的人物名字或演講標題。幻燈圖像1910包括人物名字和演講標題,但是幻燈圖像2110不包括它們。在步驟S1808中,確定是否存在人物名字或演講標題。如果存在人物名字或演講標題,則處理返回到步驟S1810。否則,處理返回到步驟S1804。對幻燈圖像1910執(zhí)行步驟S1810。
如果存在多個人物名字或多個演講標題(如果單個靜止圖像包括多個人物名字或多個演講標題,或者如果作為對多個靜止圖像執(zhí)行字符識別的結(jié)果而提取了多個人物名字或多個演講標題),則可以執(zhí)行基于靜止圖像的時間位置(上述頁碼)的加權(quán),并且可以使用加權(quán)結(jié)果來選擇人物名字或演講標題。在加權(quán)中,例如,可以對人物名字或演講標題處在第一頁或最后ー頁的靜止圖像中的情況分配值“1”,可以對人物名字或演講標題處在其他頁的靜止圖像中的情況分配值“0”,并且可以選擇第一頁或最后一頁上的人物名字或演講標題。可選地,在首先出現(xiàn)的人物名字可能為演講者名字的假設(shè)下,可以對人物名字或演講標題處在第一頁的靜止圖像中的情況分配值“ 10”,并且每當頁碼前進時該值都可以減I??蛇x地,可以對人物名字或演講標題處在最后ー頁的靜止圖像中的情況分配值“ 10”,并且每當頁碼后退時該值都可以減I。在步驟S1810中,關(guān)鍵字組選擇模塊130通過使用人物名字和/或演講標題搜索關(guān)鍵字組存儲模塊140以查找與人物名字或演講標題相關(guān)聯(lián)的關(guān)鍵字組。例如,人物名字/演講標題關(guān)鍵字組表2000存儲在關(guān)鍵字組存儲模塊140中。圖20是示出人物名字/演講標題關(guān)鍵字組表2000的數(shù)據(jù)結(jié)構(gòu)的示例的示圖。人物名字/演講標題關(guān)鍵字組表2000包括ID列2002、背景類型列2004、背景值列2006和關(guān)鍵字組列2008。人物名字/演講標題關(guān)鍵字組表2000等效于關(guān)鍵字組表240,但是背景類型列2004存儲人物名字或演講標題。在通過使用人物名字搜索關(guān)鍵字組的情況下,捜索與背景類型列2004中的人物名字和背景值列2006中的相同名字相關(guān)聯(lián)的關(guān)鍵字組。例如,當通過使用“BKO YAMADA"作為人物名字來搜索關(guān)鍵字組時,存儲在關(guān)鍵字組列2008中的“demand”、“Supply”、“market”和“index”被獲取作為搜索結(jié)果??梢詫λ袌D像或ー些圖像執(zhí)行前面的處理。如果獲取多個結(jié)果,則合并所獲取的關(guān)鍵字組。在步驟S1812中,單詞估計模塊120估計單詞。首先,單詞估計模塊120對作為每個靜止圖像的字符識別結(jié)果的字符串執(zhí)行形態(tài)分析并提取單詞。此外,單詞估計模塊120從字符識別結(jié)果中提取具有預(yù)定長度的字符串。在上述示例中,從幻燈圖像2110的字符識別結(jié)果中提取名詞“demand”作為單詞。通過步驟S1810中捜索關(guān)鍵字組獲取的關(guān)鍵字“demand”、“supply”、“market”和“index”的字符串的長度分別為6個字符、6個字符、6個字符和 5 個字符。因此,切出字符串 “demand, dandsu, ubbjy, deman, ndand, dsubb,…”。將給出所切出的字符串與關(guān)鍵字組包括的關(guān)鍵字之間的相似性計算的描述。在這種情況下,可以通過比較具有相同長度的單詞來減少計算量。通過使用編輯距離和單詞長度來執(zhí)行相似性的計算。具體地,將“subbjy”(用作字符識別結(jié)果并具有6個字符的字符串)與“supply” (包括在關(guān)鍵字組中的關(guān)鍵字)進行比較。這兩個字符串在3個字符“b,b和j”上不同。因此,編輯距離為3,并且相似性為0. 5,該相似性通過將3除以字符串長度(即,6)來獲取。當相似性等于或小于預(yù)定閾值時,向單詞輸出模塊145輸出所比較的關(guān)鍵字作為候選。當閾值為0. 5時,輸出單詞“supply”。在步驟S1814中,單詞輸出模塊145在關(guān)鍵字組存儲模塊140中存儲通過形態(tài)分析獲取的單詞“demand”和通過相似性計算獲取的單詞“supply”。即,單詞輸出模塊145在與人物名字/演講標題關(guān)鍵字組表2000中的“BKO YAMADA"相對應(yīng)的關(guān)鍵字組列2008中存儲單詞“demand”和“ supply”。然而,這些單詞已經(jīng)被存儲,因此在這種情況下不添加單
詞·
在步驟S1816中,單詞輸出模塊145向目標運動圖像添加單詞“demand”和“suppIy”作為索引信息。具體地,當出現(xiàn)幻燈圖像時,一起使用運動圖像ID和時間來索弓丨這些關(guān)鍵字。圖22是示出實現(xiàn)示例性實施例的情況下的示例系統(tǒng)結(jié)構(gòu)的示圖。運動圖像存儲服務(wù)器2210A、運動圖像存儲服務(wù)器2210B、信息處理服務(wù)器2220、客戶終端2230A和客戶終端2230B經(jīng)由通信線2290相互連接。運動圖像存儲服務(wù)器2210A和2210B設(shè)置有圖1所示的運動圖像存儲模塊100。信息處理服務(wù)器2220設(shè)置有圖1所示的運動圖像讀取模塊105、幻燈圖像鑒別模塊110、字符識別模塊115、單詞估計模塊120、背景獲取模塊125、關(guān)鍵字組選擇模塊130、關(guān)鍵字組存儲模塊140、單詞輸出模塊145和單詞存儲模塊150??蛻艚K端2230A和2230B搜索信息處理服務(wù)器2220中的單詞存儲模塊150,從運動圖像存儲服務(wù)器2210A或2210B中獲取期望的運動圖像,并重放該運動圖像。如圖23所示,執(zhí)行根據(jù)示例性實施例的程序的計算機的硬件結(jié)構(gòu)為典型的計算機,具體地,個人計算機或者用作服務(wù)器的計算機。即,中央處理單元(CPU)2301被用作處理單元(操作単元),以及隨機存取存儲器(RAM) 2302、只讀存儲器(ROM) 2303和硬盤(HD) 2304被用作存儲裝置。硬盤可以被用作HD 2304。圖23所示計算機包括CPU 2301,其執(zhí)行與運動圖像讀取模塊105、幻燈圖像鑒別模塊110、字符識別模塊115、單詞估計模塊120、背景獲取模塊125、關(guān)鍵字組選擇模塊130、單詞輸出模塊145、人物識別模塊210、運動圖像ID/頁碼識別模塊220、演講者名字識別模塊230、演講標題指定模塊320、文本組配置模塊330、人物名字提取模塊340、演講標題提取模塊350等對應(yīng)的程序;RAM 2302,其存儲程序和數(shù)據(jù);R0M2303,其存儲用于啟動計算機的程序;HD 2304,其用作輔助存儲裝置;接收裝置2306,其基于用戶對鍵盤、鼠標、觸摸板等執(zhí)行的操作來接收數(shù)據(jù);輸出裝置2305,諸如陰極射線管(CRT)或液晶顯示器;通信線接ロ 2307,其用于連接至諸如網(wǎng)絡(luò)接ロ卡的通信網(wǎng)絡(luò);以及總線2308,其用于連接這些裝置使得可以在裝置之間傳輸和接收數(shù)據(jù)。多個計算機(每ー個都具有上述結(jié)構(gòu))可以經(jīng)由網(wǎng)絡(luò)相互連接。在上述示例性實施例中,通過使該硬件結(jié)構(gòu)的系統(tǒng)讀取用作軟件的計算機程序以及通過使軟件和硬件源相互協(xié)作來實現(xiàn)基于計算機系統(tǒng)的模塊。圖23所示的硬件結(jié)構(gòu)是一個示例結(jié)構(gòu)。示例性實施例不限于圖23所示的結(jié)構(gòu),并且可以使用另ー種結(jié)構(gòu),只要可以執(zhí)行在如上面示例性實施例中描述的模塊即可。例如,一些模塊可以通過專用硬件(例如,專用集成電路(ASIC))來配置,而ー些模塊可以包括在外部系統(tǒng)中并經(jīng)由通信線連接。此外,多個系統(tǒng)(每ー個都具有圖23所示結(jié)構(gòu))可以經(jīng)由通信線相互連接并且可以相互進行協(xié)作。具體地,代替?zhèn)€人計算機,圖23所示的系統(tǒng)可以合并到信息裝置、復(fù)印機、傳真機、掃描器、打印機、多功能外設(shè)(具有掃描器、打印機、復(fù)印機和傳真功能中的任意兩種功能的圖像處理設(shè)備)等中??蛇x地,可以使用上述處理的組合(例如,圖2和圖3所示背景獲取模塊125中的模塊的組合以及圖4、圖7、圖9、圖11、圖15和圖18所示流程圖的組合)。在這種情況下,通過使用邏輯運算(AND運算、OR運算等),單詞輸出模塊145可以選擇每個處理的結(jié)果。此外,根據(jù)現(xiàn)有技術(shù)的技術(shù)可以用于每個模塊所執(zhí)行的處理。上述程序可以通過存儲在記錄介質(zhì)中來提供或者可以經(jīng)由通信單元來提供。在這種情況下,例如,上述程序可以被認為是“其上記錄程序的計算機可讀記錄介質(zhì)”?!捌渖嫌涗洺绦虻挠嬎銠C可讀記錄介質(zhì)”是其上記錄有該程序的用于安裝、執(zhí)行或傳播該程序的計算機可讀記錄介質(zhì)。以下是記錄介質(zhì)的示例DVD-R、DVD-RW、DVD-RAM等,它們是數(shù)字通用盤(DVD)和通過DVD論壇建立的標準;DVD+R、DVD+RW等,它們是通過DVD+RW建立的標準;壓縮盤(⑶),諸如只讀存儲器(⑶-ROM)、可記錄⑶(⑶-R)和可重寫⑶(⑶-RW);藍光盤(注冊商標);磁光(MO)盤;軟盤(FD);磁帶;硬盤;只讀存儲器(ROM)、電可擦除可編程只讀存儲器(EEPR0M,注冊商標);閃存;隨機存取存儲器(RAM);和安全數(shù)字(SD)存儲卡。上述程序或者部分程序可以記錄在記錄介質(zhì)上并且可以被存儲或傳播。此外,程序或部分程序可以使用傳輸介質(zhì)(諸如有線網(wǎng)絡(luò),包括局域網(wǎng)(LAN)、城域網(wǎng)(MAN)、廣域網(wǎng)(WAN)、互聯(lián)網(wǎng)、內(nèi)聯(lián)網(wǎng)、外聯(lián)網(wǎng);或者有線通信網(wǎng)絡(luò);或者有線和無線網(wǎng)絡(luò)的組合)進行傳輸,或者可以使用載波進行載送。此外,上述程序可以為另一程序的一部分,或者可以與另一程序記錄在記錄介質(zhì)上??蛇x地,程序可以以劃分形式記錄在多個記錄介質(zhì)上??梢砸匀魏涡问接涗洺绦?,只要程序可以恢復(fù)即可,例如,程序可以被壓縮或加密。為了說明和描述的目的提供了本發(fā)明示例性實施例的描述。這不用于將本發(fā)明限制為所公開的具體形式。明顯地,許多修改和變化對于本領(lǐng)域的技術(shù)人員來說是顯而易見的。選擇和描述實施例以更好地解釋本發(fā)明的原理及其實踐應(yīng)用,從而能夠使本領(lǐng)域的技術(shù)人員理解,用于各種實施例和具有各種修改的本發(fā)明適合于預(yù)期的具體用法。通過所附權(quán)利要求及其等效物來限定本發(fā)明的范圍。
權(quán)利要求
1.一種信息處理設(shè)備,包括 鑒別單元,其鑒別包括在運動圖像中的靜止圖像; 字符識別單元,其對通過所述鑒別單元鑒別的所述靜止圖像執(zhí)行字符識別; 獲取單元,其獲取關(guān)于所述運動圖像的信息; 校正單元,其基于通過所述獲取單元所獲取的信息,校正通過所述字符識別單元生成的字符識別結(jié)果;以及 輸出單元,其輸出與所述運動圖像相關(guān)聯(lián)的通過所述校正單元校正的字符識別結(jié)果。
2.根據(jù)權(quán)利要求1所述的信息處理設(shè)備, 其中,所述獲取單元識別所述運動圖像中的人物并獲取關(guān)于所述人物的信息,并且其中,所述校正單元基于通過所述獲取單元所獲取的關(guān)于所述人物的信息來校正所述字符識別結(jié)果。
3.根據(jù)權(quán)利要求1所述的信息處理設(shè)備, 其中,基于作為用于鑒別所述運動圖像的信息的運動圖像鑒別信息或者基于所述運動圖像鑒別信息和通過所述鑒別單元所鑒別的靜止圖像的時間位置,所述獲取單元獲取可能包括在所述靜止圖像中的字符信息,并且 其中,所述校正單元基于通過所述獲取單元所獲取的字符信息來校正所述字符識別結(jié)果O
4.根據(jù)權(quán)利要求2所述的信息處理設(shè)備, 其中,基于作為用于鑒別所述運動圖像的信息的運動圖像鑒別信息或者基于所述運動圖像鑒別信息和通過所述鑒別單元所鑒別的靜止圖像的時間位置,所述獲取單元獲取可能包括在所述靜止圖像中的字符信息,并且 其中,所述校正單元基于通過所述獲取單元所獲取的字符信息來校正所述字符識別結(jié)果O
5.根據(jù)權(quán)利要求1至4中任一項所述的信息處理設(shè)備, 其中,所述獲取單元提取通過所述字符識別單元針對處于預(yù)定時間位置的靜止圖像生成的字符識別結(jié)果中所包括的人物名字,并獲取關(guān)于所述人物名字的信息,并且 其中,基于通過所述獲取單元所獲取的關(guān)于所述人物名字的信息,所述校正單元校正通過所述字符識別單元所生成的字符識別結(jié)果。
6.根據(jù)權(quán)利要求1至4中任一項所述的信息處理設(shè)備, 其中,所述獲取單元提取關(guān)于所述運動圖像的拍攝地點以及拍攝時間和日期的信息,并獲取關(guān)于在所述拍攝日期和時間在所述拍攝地點舉行的事件的信息,并且 其中,基于通過所述獲取單元所獲取的關(guān)于所述事件的信息,所述校正單元校正通過所述字符識別單元所生成的字符識別結(jié)果。
7.根據(jù)權(quán)利要求5所述的信息處理設(shè)備, 其中,所述獲取單元提取關(guān)于所述運動圖像的拍攝地點以及拍攝時間和日期的信息,并獲取關(guān)于在所述拍攝日期和時間在所述拍攝地點舉行的事件的信息,并且 其中,基于通過所述獲取單元所獲取的關(guān)于所述事件的信息,所述校正單元校正通過所述字符識別單元所生成的字符識別結(jié)果。
8.根據(jù)權(quán)利要求1至4中任一項所述的信息處理設(shè)備,其中,所述獲取單元對通過所述字符識別單元生成的所述字符識別結(jié)果執(zhí)行形態(tài)分析,并獲取關(guān)于作為形態(tài)分析結(jié)果的字符串的信息或者關(guān)于與該字符串類似的字符串的信息,并且 其中,基于通過所述獲取單元所獲取的關(guān)于字符串的信息,所述校正單元校正通過所述字符識別單元所生成的字符識別結(jié)果。
9.根據(jù)權(quán)利要求5所述的信息處理設(shè)備, 其中,所述獲取單元對通過所述字符識別單元生成的所述字符識別結(jié)果執(zhí)行形態(tài)分析,并獲取關(guān)于作為形態(tài)分析結(jié)果的字符串的信息或者關(guān)于與該字符串類似的字符串的信息,并且 其中,基于通過所述獲取單元所獲取的關(guān)于字符串的信息,所述校正單元校正通過所述字符識別單元所生成的字符識別結(jié)果。
10.根據(jù)權(quán)利要求6所述的信息處理設(shè)備, 其中,所述獲取單元對通過所述字符識別單元生成的所述字符識別結(jié)果執(zhí)行形態(tài)分析,并獲取關(guān)于作為形態(tài)分析結(jié)果的字符串的信息或者關(guān)于與該字符串類似的字符串的信息,并且 其中,基于通過所述獲取單元所獲取的關(guān)于字符串的信息,所述校正單元校正通過所述字符識別單元所生成的字符識別結(jié)果。
11.根據(jù)權(quán)利要求7所述的信息處理設(shè)備, 其中,所述獲取單元對通過所述字符識別單元生成的所述字符識別結(jié)果執(zhí)行形態(tài)分析,并獲取關(guān)于作為形態(tài)分析結(jié)果的字符串的信息或者關(guān)于與該字符串類似的字符串的信息,并且 其中,基于通過所述獲取單元所獲取的關(guān)于字符串的信息,所述校正單元校正通過所述字符識別單元所生成的字符識別結(jié)果。
12.根據(jù)權(quán)利要求1至4中任一項所述的信息處理設(shè)備, 其中,所述獲取單元提取通過所述字符識別單元所生成的字符識別結(jié)果所包括的人物名字或事件標題,并且,如果所述字符識別結(jié)果包括多個人物名字或多個事件標題,則所述獲取單元基于所述靜止圖像的時間位置來執(zhí)行加權(quán),并獲取使用加權(quán)的結(jié)果選擇的關(guān)于人物名字或事件標題的信息,并且 其中,基于通過所述獲取單元所獲取的關(guān)于人物名字或事件標題的信息,所述校正單元校正通過所述字符識別單元所生成的字符識別結(jié)果。
13.根據(jù)權(quán)利要求5所述的信息處理設(shè)備, 其中,所述獲取單元提取通過所述字符識別單元所生成的字符識別結(jié)果所包括的人物名字或事件標題,并且,如果所述字符識別結(jié)果包括多個人物名字或多個事件標題,則所述獲取單元基于所述靜止圖像的時間位置來執(zhí)行加權(quán),并獲取使用加權(quán)的結(jié)果選擇的關(guān)于人物名字或事件標題的信息,并且 其中,基于通過所述獲取單元所獲取的關(guān)于人物名字或事件標題的信息,所述校正單元校正通過所述字符識別單元所生成的字符識別結(jié)果。
14.根據(jù)權(quán)利要求6所述的信息處理設(shè)備, 其中,所述獲取單元提取通過所述字符識別單元所生成的字符識別結(jié)果所包括的人物名字或事件標題,并且,如果所述字符識別結(jié)果包括多個人物名字或多個事件標題,則所述獲取單元基于所述靜止圖像的時間位置來執(zhí)行加權(quán),并獲取使用加權(quán)的結(jié)果選擇的關(guān)于人物名字或事件標題的信息,并且 其中,基于通過所述獲取單元所獲取的關(guān)于人物名字或事件標題的信息,所述校正單元校正通過所述字符識別單元所生成的字符識別結(jié)果。
15.根據(jù)權(quán)利要求7所述的信息處理設(shè)備, 其中,所述獲取單元提取通過所述字符識別單元所生成的字符識別結(jié)果所包括的人物名字或事件標題,并且,如果所述字符識別結(jié)果包括多個人物名字或多個事件標題,則所述獲取單元基于所述靜止圖像的時間位置來執(zhí)行加權(quán),并獲取使用加權(quán)的結(jié)果選擇的關(guān)于人物名字或事件標題的信息,并且 其中,基于通過所述獲取單元所獲取的關(guān)于人物名字或事件標題的信息,所述校正單元校正通過所述字符識別單元所生成的字符識別結(jié)果。
16.根據(jù)權(quán)利要求8所述的信息處理設(shè)備, 其中,所述獲取單元提取通過所述字符識別單元所生成的字符識別結(jié)果所包括的人物名字或事件標題,并且,如果所述字符識別結(jié)果包括多個人物名字或多個事件標題,則所述獲取單元基于所述靜止圖像的時間位置來執(zhí)行加權(quán),并獲取使用加權(quán)的結(jié)果選擇的關(guān)于人物名字或事件標題的信息,并且 其中,基于通過所述獲取單元所獲取的關(guān)于人物名字或事件標題的信息,所述校正單元校正通過所述字符識別單元所生成的字符識別結(jié)果。
17.根據(jù)權(quán)利要求9所述的信息處理設(shè)備, 其中,所述獲取單元提取通過所述字符識別單元所生成的字符識別結(jié)果所包括的人物名字或事件標題,并且,如果所述字符識別結(jié)果包括多個人物名字或多個事件標題,則所述獲取單元基于所述靜止圖像的時間位置來執(zhí)行加權(quán),并獲取使用加權(quán)的結(jié)果選擇的關(guān)于人物名字或事件標題的信息,并且 其中,基于通過所述獲取單元所獲取的關(guān)于人物名字或事件標題的信息,所述校正單元校正通過所述字符識別單元所生成的字符識別結(jié)果。
18.根據(jù)權(quán)利要求10所述的信息處理設(shè)備, 其中,所述獲取單元提取通過所述字符識別單元所生成的字符識別結(jié)果所包括的人物名字或事件標題,并且,如果所述字符識別結(jié)果包括多個人物名字或多個事件標題,則所述獲取單元基于所述靜止圖像的時間位置來執(zhí)行加權(quán),并獲取使用加權(quán)的結(jié)果選擇的關(guān)于人物名字或事件標題的信息,并且 其中,基于通過所述獲取單元所獲取的關(guān)于人物名字或事件標題的信息,所述校正單元校正通過所述字符識別單元所生成的字符識別結(jié)果。
19.根據(jù)權(quán)利要求11所述的信息處理設(shè)備, 其中,所述獲取單元提取通過所述字符識別單元所生成的字符識別結(jié)果所包括的人物名字或事件標題,并且,如果所述字符識別結(jié)果包括多個人物名字或多個事件標題,則所述獲取單元基于所述靜止圖像的時間位置來執(zhí)行加權(quán),并獲取使用加權(quán)的結(jié)果選擇的關(guān)于人物名字或事件標題的信息,并且 其中,基于通過所述獲取單元所獲取的關(guān)于人物名字或事件標題的信息,所述校正單元校正通過所述字符識別單元所生成的字符識別結(jié)果。
20.—種圖像處理方法,包括 鑒別包括在運動圖像中的靜止圖像; 對所鑒別的靜止圖像執(zhí)行字符識別; 獲取關(guān)于所述運動圖像的信息; 基于所獲取的信息,校正在所述字符識別中生成的字符識別結(jié)果;以及 輸出與所述運動圖像相關(guān)聯(lián)的被校正的字符識別結(jié)果。
全文摘要
本發(fā)明提供了一種信息處理設(shè)備和信息處理方法,該信息處理設(shè)備包括鑒別單元、字符識別單元、獲取單元、校正單元和輸出單元。鑒別單元鑒別包括在運動圖像中的靜止圖像。字符識別單元對通過鑒別單元鑒別的靜止圖像執(zhí)行字符識別。獲取單元獲取關(guān)于運動圖像的信息。基于通過獲取單元獲取的信息,校正單元校正通過字符識別單元生成的字符識別結(jié)果。輸出單元輸出與運動圖像相關(guān)聯(lián)的通過校正單元校正的字符識別結(jié)果。
文檔編號G06K9/00GK103020581SQ20121010234
公開日2013年4月3日 申請日期2012年4月9日 優(yōu)先權(quán)日2011年9月21日
發(fā)明者永峰猛志, 安部勉 申請人:富士施樂株式會社