專利名稱:語音聊天系統(tǒng)、信息處理裝置、話語識別和關(guān)鍵字檢測的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及語音(voice)聊天系統(tǒng)、信息處理裝置、話語(speech) 識別方法、關(guān)鍵字檢測方法和程序。
背景技術(shù):
話語識別已經(jīng)得到很長時間的研究,并且已經(jīng)變得能夠提供關(guān)于被讀 出的話語的非常高的精確識別率。但是,仍然難以提供在識別人類之間的 自然談話方面的高性能。
近年來,已經(jīng)對用于從話語中提取談話主題的技術(shù)執(zhí)行認(rèn)真的研究, 該技術(shù)還稱為話題檢測技術(shù)。當(dāng)采用話題檢測技術(shù)時,從話語中提取文本 信息的話語識別單元起到了重要作用。
作為從話語中提取關(guān)鍵字的方法,已知存在一種僅關(guān)注關(guān)鍵字的從話 語中提取關(guān)鍵字的方法和一種使用大詞匯量話語識別來識別全部話語然后 從識別結(jié)果中提取關(guān)鍵字的方法。具體而言,前一種方法使用例如從音素 網(wǎng)格(phoneme lattice)中提取其音素網(wǎng)格可識別的字序列的方法。同時, 后一種方法使用了 LVCSR (大詞匯量連續(xù)話語識別)。如果關(guān)鍵字的數(shù) 目巨大,則后一種方法由于其計(jì)算效率而較有利。在這些方法的任何一種 中,都需要對將被識別的詞匯具有語言上的理解,這可以通過使用關(guān)于將 被檢測的詞匯的出現(xiàn)頻率的信息來解決。
話語識別可以分成對孤立字進(jìn)行識別的孤立字識別和對包括多個字的 字序列進(jìn)行識別的連續(xù)字識別。連續(xù)字識別使用了語言模型——"存儲了 字之間的聯(lián)接相似性的數(shù)據(jù)庫",從而防止"具有相似的聲音但是意義完 全不同的字序列"作為識別結(jié)果被輸出。
但是,語言模型僅僅描述了原先可識別的那些字的信息(以下稱為已 知字),因此,很難正確地識別后來登記的字(以下稱為登記字)。另一方面,在孤立字識別的情況下, 一旦字被登記在識別字字典(word dictionary)中,在登記之后這些字立即被識別。但是,在連續(xù)字識別的情 況下,僅僅對字進(jìn)行登記是不夠的,而需要反映到語言模型上,但不幸的 是反映到語言模型上通常很難。
基于此,相關(guān)技術(shù)的一個示例,JP-A NO. 2004-252121公開了一種方 法,該方法將登記字分成諸如"人名"和"地名"之類的類別,提供與這 些類別相對應(yīng)的語言模型,并且使用語言模型來關(guān)聯(lián)登記字與類別,由此 新的詞匯可通過連續(xù)話語識別來識別。
同時,登記字的選擇存在很大的問題。特別地,專有名詞通常是重要 關(guān)鍵字,原因在于專有名詞的識別允許向用戶提供有用信息。
基于此,作為相關(guān)技術(shù)的一個示例,JP-A NO. 2002-216026公開了--種方法,該方法從因特網(wǎng)上的信息中獲取關(guān)鍵字,并從所獲得的關(guān)鍵字中 提取關(guān)鍵字。
但是,存在大量專有名詞,因此,實(shí)踐中可能很難預(yù)先登記用戶將說 到的用于話語識別的所有字。
發(fā)明內(nèi)容
出于這些原因,即使是JP-A NO. 2002-216026所公開的方法也可能很 難以高精確度來從語音聊天期間的談話對話中識別與最近的話題相關(guān)的關(guān) 鍵字。
本發(fā)明是鑒于上述情形而設(shè)計(jì)出來的。存在對提供下述新的且改進(jìn)了 的語言聊天系統(tǒng)、信息處理裝置和程序的需要,這些系統(tǒng)、裝置和程序能 夠以高精確度來識別存在于語音聊天期間的談話對話中的關(guān)鍵字。
還存在對提供下述新的且改進(jìn)了的信息處理裝置、關(guān)鍵字檢測方法和 程序的需要,這些系統(tǒng)、裝置和程序能夠以高精確度來檢測存在于廣播信 息(節(jié)目信息)中的關(guān)鍵字。
根據(jù)本發(fā)明的一個觀點(diǎn),提供了一種語音聊天系統(tǒng),該語音聊天系統(tǒng) 包括執(zhí)行語音聊天同時執(zhí)行話語識別的多個信息處理裝置;和經(jīng)由通信 網(wǎng)絡(luò)而與所述多個信息處理裝置相連接的搜索服務(wù)器,其中,搜索服務(wù)器向至少一個信息處理裝置公開搜索關(guān)鍵字列表,該搜索關(guān)鍵字列表包含由 搜索服務(wù)器搜索的搜索關(guān)鍵字,所述至少一個信息處理裝置包括識別字 字典生成單元,該識別字字典生成單元從搜索服務(wù)器獲取所述搜索關(guān)鍵字 列表,以生成包含在話語識別時使用的字的識別字字典;話語識別單元, 該話語識別單元通過參考包含識別字字典的識別數(shù)據(jù)庫來對從語音聊天期 間的談話對話中獲得的語音數(shù)據(jù)執(zhí)行語音識別;語音談話控制單元,該語 音談話控制單元執(zhí)行與至少一個信息處理裝置之間的語音數(shù)據(jù)的通信控 制;以及關(guān)鍵字檢測單元,該關(guān)鍵字檢測單元從所述話語識別的結(jié)果中檢
測與語音聊天期間的談話內(nèi)容相關(guān)的關(guān)鍵字。
根據(jù)本發(fā)明的另一個觀點(diǎn),提供了一種信息處理裝置,該裝置從搜索 服務(wù)器獲取包含由搜索服務(wù)器搜索的搜索關(guān)鍵字的搜索關(guān)鍵字列表并執(zhí)行
與其它信息處理裝置的語音聊天,所述裝置包括識別字字典生成單元, 該識別字字典生成單元從搜索服務(wù)器獲取搜索關(guān)鍵字列表,以生成包含在
話語識別時使用的字的識別字字典;話語識別單元,該話語識別單元通過
參考包含識別字字典的識別數(shù)據(jù)庫來對從語音聊天期間的談話對話中獲得
的語音數(shù)據(jù)執(zhí)行話語識別;語音談話控制單元,該語音談話控制單元執(zhí)行 與所述其它信息處理裝置之間的語音數(shù)據(jù)的通信控制;以及關(guān)鍵字檢測單 元,該關(guān)鍵字檢測單元從話語識別的結(jié)果中檢測與語音聊天期間的談話內(nèi) 容相關(guān)的關(guān)鍵字。
所述識別字字典可以包括預(yù)先登記了預(yù)定的字的固定字字典;和按 需來更新所登記的字的可變字字典,并且識別字字典生成單元可以從包含 搜索服務(wù)器的較高等級的搜索關(guān)鍵字的所述搜索關(guān)鍵字列表中選擇將被登 記在可變字字典中的字,以生成可變字字典。
識別字字典生成單元可以基于由關(guān)鍵字檢測單元檢測得到的關(guān)鍵字的 歷史信息來確定所述信息處理裝置的用戶的偏好,并基于該偏好來從搜索 關(guān)鍵字列表中選擇字。
識別字字典生成單元可以使用搜索服務(wù)器來搜索所述從搜索關(guān)鍵字列 表中選擇出來的字,并從通過所述搜索而獲得的搜索結(jié)果中獲取與所述字 相關(guān)的次關(guān)鍵字,從而以與所述字相關(guān)聯(lián)的方式來將次關(guān)鍵字登記在可變識別字字典生成單元可以基于搜索等級信息來對從搜索關(guān)鍵字列表中 選擇的各個字進(jìn)行加權(quán),其中,搜索等級信息是利用所述字被搜索服務(wù)器 搜索的頻率來確定的。
識別字字典生成單元可以基于由關(guān)鍵字檢測單元檢測到的關(guān)鍵字的歷 史信息來計(jì)算這些關(guān)鍵字的頻率,并改變登記在可變字字典中且與這些關(guān) 鍵字相對應(yīng)的字的權(quán)重。
根據(jù)本發(fā)明的又一個觀點(diǎn),提供了一種信息處理裝置,該裝置從搜索 服務(wù)器獲取包含由搜索服務(wù)器搜索的搜索關(guān)鍵字的搜索關(guān)鍵字列表,從該 搜索關(guān)鍵字列表中選擇字,從對所選擇的字施加在話語識別時使用的權(quán)重 信息的識別字字典生成設(shè)備獲取被施加了權(quán)重信息的字,并與其它信息處 理裝置執(zhí)行語音聊天,所述信息處理裝置包括話語識別單元,該話語識 別單元通過參考包含從識別字字典生成設(shè)備獲得的字的識別數(shù)據(jù)庫來對從 語音聊天期間的談話對話中獲得的語音數(shù)據(jù)執(zhí)行話語識別;語音談話控制 單元,該語音談話控制單元執(zhí)行與其它信息處理裝置之間的語音數(shù)據(jù)的通 信控制;以及關(guān)鍵字檢測單元,該關(guān)鍵字檢測單元從話語識別的結(jié)果中檢 測與語音聊天期間的談話內(nèi)容相關(guān)的關(guān)鍵字。
根據(jù)本發(fā)明的又一個觀點(diǎn),提供了一種在信息處理裝置中使用的話語 識別方法,所述裝置從搜索服務(wù)器獲取包含由搜索服務(wù)器搜索的搜索關(guān)鍵 字的搜索關(guān)鍵字列表并與其它信息處理裝置執(zhí)行語音聊天,所述方法包括 以下步驟從搜索服務(wù)器獲取搜索關(guān)鍵字列表,以生成包含在話語識別時 使用的字的識別字字典;從語音聊天期間的談話內(nèi)容中獲得語音數(shù)據(jù);基 于所述語音數(shù)據(jù)的聲學(xué)特征來分析該語音數(shù)據(jù),并生成與所述談話內(nèi)容相
對應(yīng)的字序列候選;以及通過參考在話語識別時使用的包含識別字字典的
識別數(shù)據(jù)庫、基于在構(gòu)成所述字序列的字之間的語言學(xué)串聯(lián)特征來分析所 生成的字序列候選,從而選擇最合適的字序列。
根據(jù)本發(fā)明的又一個觀點(diǎn),提供了一種在信息處理裝置中使用的話語 識別方法,所述裝置從搜索服務(wù)器獲取包含由搜索服務(wù)器搜索的搜索關(guān)鍵 字的搜索關(guān)鍵字列表、從所述搜索關(guān)鍵字列表中選擇字、從對所選擇的字施加在話語識別時使用的權(quán)重信息的識別字字典生成設(shè)備獲取被施加了權(quán) 重信息的字、并與其它信息處理裝置執(zhí)行語音聊天,所述方法包括以下步 驟從識別字字典生成設(shè)備獲取被施加了權(quán)重信息的字,并將所述字存儲 在識別數(shù)據(jù)庫中以在話語識別時使用;從語音聊天期間的談話內(nèi)容中獲得 語音數(shù)據(jù);基于所述語音數(shù)據(jù)的聲學(xué)特征來分析該語音數(shù)據(jù),并生成與所 述談話內(nèi)容相對應(yīng)的字序列候選;以及通過參考識別數(shù)據(jù)庫、基于在構(gòu)成
所述字序列的字之間的語言學(xué)串聯(lián)特征來分析所生成的字序列候選,從而 選擇最合適的字序列。
根據(jù)本發(fā)明的又一個觀點(diǎn),提供了一種用于對信息處理裝置進(jìn)行控制 的計(jì)算機(jī)的程序,所述裝置從搜索服務(wù)器獲取包含由搜索服務(wù)器搜索的搜 索關(guān)鍵字的搜索關(guān)鍵字列表并與其它信息處理裝置執(zhí)行語音聊天,所述程
序允許計(jì)算機(jī)執(zhí)行以下功能識別字字典生成功能,從搜索服務(wù)器獲取搜
索關(guān)鍵字列表以生成包含在話語識別時使用的字的識別字字典;話語識別
功能,通過參考包含識別字字典的識別數(shù)據(jù)庫來對從語音聊天期間的談話
對話中獲得的語音數(shù)據(jù)執(zhí)行話語識別;語音談話控制功能,執(zhí)行與其它信 息處理裝置之間的語音數(shù)據(jù)的通信控制;以及關(guān)鍵字檢測功能,從話語識 別的結(jié)果中檢測與語音聊天期間的談話內(nèi)容相關(guān)的關(guān)鍵字。
根據(jù)上述實(shí)施例,計(jì)算機(jī)程序被存儲在計(jì)算機(jī)的存儲單元中,并且在 計(jì)算機(jī)的CPU讀取該程序時被執(zhí)行,從而致使計(jì)算機(jī)作為信息處理裝置來 進(jìn)行工作。也可以提供在其中記錄計(jì)算機(jī)程序的計(jì)算機(jī)可讀記錄介質(zhì)。該 記錄介質(zhì)例如可以是磁盤、光盤、磁性光盤、和閃存。計(jì)算機(jī)程序可以例 如經(jīng)由網(wǎng)絡(luò)而不是使用記錄介質(zhì)來分發(fā)。
根據(jù)本發(fā)明的又一個觀點(diǎn),提供了一種用于對信息處理裝置進(jìn)行控制 的計(jì)算機(jī)的程序,所述裝置從搜索服務(wù)器獲取包含由搜索服務(wù)器搜索的搜 索關(guān)鍵字的搜索關(guān)鍵字列表、從搜索關(guān)鍵字列表中選擇字、從對所選擇的 字施加在話語識別時使用的權(quán)重信息的識別字字典生成設(shè)備獲取被施加了 權(quán)重信息的字、并與其它信息處理裝置執(zhí)行語音聊天,所述程序允許計(jì)算 機(jī)執(zhí)行以下功能話語識別功能,通過參考包含從識別字字典生成設(shè)備獲
取的字的識別數(shù)據(jù)庫來對從語音聊天期間的談話對話中獲得的語音數(shù)據(jù)執(zhí)行話語識別;語音談話控制功能,執(zhí)行與其它信息處理裝置之間的語音數(shù) 據(jù)的通信控制;以及關(guān)鍵字檢測功能,從話語識別的結(jié)果中檢測與語音聊
天期間的談話內(nèi)容相關(guān)的關(guān)鍵字。
根據(jù)本發(fā)明的又一個觀點(diǎn),提供了一種信息處理裝置,包括識別字 字典生成單元,該識別字字典生成單元從搜索服務(wù)器獲取包含由搜索服務(wù) 器搜索的搜索關(guān)鍵字的搜索關(guān)鍵字列表,以生成包含在語言識別時使用的
字的識別字字典;廣播文本信息接收單元,該廣播文本信息接收單元接收 從廣播站發(fā)送而來的廣播文本信息;關(guān)鍵字檢測單元,該關(guān)鍵字檢測單元 通過參考識別字字典來從廣播文本信息中檢測預(yù)定關(guān)鍵字;以及外部顯示 設(shè)備連接控制單元,該外部顯示設(shè)備連接控制單元執(zhí)行與外部顯示設(shè)備的 連接控制并將從廣播文本信息中檢測到的關(guān)鍵字輸出到該外部顯示設(shè)備。
廣播文本信息接收單元可以從與信息處理裝置相連接的外部顯示設(shè)備 獲取關(guān)于該外部顯示設(shè)備正通過其接收的廣播頻道的接收頻道信息以及與 該廣播頻道相對應(yīng)的廣播文本信息?;蛘?,廣播文本信息接收單元可以從 與信息處理裝置相連接的外部顯示設(shè)備獲取關(guān)于該外部顯示設(shè)備正通過其 接收的廣播頻道的接收頻道信息,并從廣播站獲取與所述廣播頻道相對應(yīng) 的廣播文本信息。
信息處理裝置可以將所述關(guān)鍵字的參考?xì)v史存儲在外部顯示設(shè)備中, 并且外部顯示設(shè)備連接控制單元可以將外部顯示設(shè)備所選擇的關(guān)鍵字通知 給搜索引擎。
根據(jù)本發(fā)明的又一個觀點(diǎn),提供了一種信息處理裝置,包括識別字
字典生成單元,該識別字字典生成單元從搜索服務(wù)器獲取包含由搜索服務(wù) 器搜索的搜索關(guān)鍵字的搜索關(guān)鍵字列表,以生成包含在話語識別時使用的
字的識別字字典;廣播音頻信息接收單元,該廣播音頻信息接收單元接收 從廣播站發(fā)送而來的廣播音頻信息;話語識別單元,該話語識別單元通過 參考包含識別字字典的識別數(shù)據(jù)庫來對廣播音頻信息執(zhí)行話語識別;關(guān)鍵 字檢測單元,該關(guān)鍵字檢測單元從對廣播音頻信息的話語識別的結(jié)果中檢 測預(yù)定關(guān)鍵字;以及外部顯示設(shè)備連接控制單元,該外部顯示設(shè)備連接控 制單元執(zhí)行與外部顯示設(shè)備的連接控制并將從廣播音頻信息中檢測到的關(guān)鍵字輸出到外部顯示設(shè)備。
廣播音頻信息接收單元可以從與信息處理裝置相連接的外部顯示設(shè)備 獲取關(guān)于該外部顯示設(shè)備正通過其接收的廣播頻道的接收頻道信息以及與 該廣播頻道相對應(yīng)的廣播音頻信息?;蛘撸瑥V播音頻信息接收單元可以從 與信息處理裝置相連接的外部顯示設(shè)備獲取關(guān)于該外部顯示設(shè)備正通過其 接收的廣播頻道的接收頻道信息,并從廣播站獲取與所述廣播頻道相對應(yīng) 的廣播音頻信息。
信息處理裝置可以將所述關(guān)鍵字的參考?xì)v史存儲在外部顯示設(shè)備中, 并且外部顯示設(shè)備連接控制單元可以將外部顯示設(shè)備所選擇的關(guān)鍵字通知 給搜索引擎。
根據(jù)本發(fā)明的又一個觀點(diǎn),提供了一種關(guān)鍵字檢測方法,包括以下步 驟從搜索服務(wù)器獲取包含由搜索服務(wù)器搜索的搜索關(guān)鍵字的搜索關(guān)鍵字 列表,以生成包含在語言識別時使用的字的識別字字典;接收從廣播站發(fā)
送而來的廣播文本信息;通過參考識別字字典來從廣播文本信息中檢測預(yù) 定關(guān)鍵字;以及執(zhí)行與外部顯示設(shè)備的連接控制,并將從廣播文本信息中 檢測到的關(guān)鍵字輸出到外部顯示設(shè)備。
根據(jù)本發(fā)明的又一個觀點(diǎn),提供了一種關(guān)鍵字檢測方法,包括以下步 驟從搜索服務(wù)器獲取包含由搜索服務(wù)器搜索的搜索關(guān)鍵字的搜索關(guān)鍵字 列表,以生成包含在話語識別時使用的字的識別字字典;接收從廣播站發(fā) 送而來的廣播音頻信息;通過參考包含識別字字典的識別數(shù)據(jù)庫來對廣播 音頻信息執(zhí)行話語識別;從對廣播音頻信息的話語識別的結(jié)果中檢測預(yù)定 關(guān)鍵字;以及執(zhí)行與外部顯示設(shè)備的連接控制并將從廣播音頻信息中檢測 到的關(guān)鍵字輸出到外部顯示設(shè)備。
根據(jù)本發(fā)明的又一個觀點(diǎn),提供了一種程序,允許計(jì)算機(jī)實(shí)現(xiàn)以下功 能識別字字典生成功能,從搜索服務(wù)器獲取包含由搜索服務(wù)器搜索的搜 索關(guān)鍵字的搜索關(guān)鍵字列表,以生成包含在語言識別時使用的字的識別字 字典;廣播文本信息接收功能,接收從廣播站發(fā)送而來的廣播文本信息; 關(guān)鍵字檢測功能,通過參考識別字字典從廣播文本信息中檢測預(yù)定關(guān)鍵 字;以及外部顯示設(shè)備連接控制功能,執(zhí)行與外部顯示設(shè)備的連接控制,并將從廣播文本信息中檢測到的關(guān)鍵字輸出到外部顯示設(shè)備。
根據(jù)上述實(shí)施例,計(jì)算機(jī)程序被存儲在計(jì)算機(jī)的存儲單元中,并且在 計(jì)算機(jī)的CPU讀取該程序時被執(zhí)行,從而致使計(jì)算機(jī)作為信息處理裝置來 進(jìn)行工作??梢蕴峁┰谄渲杏涗浻?jì)算機(jī)程序的計(jì)算機(jī)可讀記錄介質(zhì)。該記 錄介質(zhì)例如可以是磁盤、光盤、磁性光盤、和閃存。計(jì)算機(jī)程序可以例如 經(jīng)由網(wǎng)絡(luò)而不是使用記錄介質(zhì)來分發(fā)。
根據(jù)本發(fā)明的又一個觀點(diǎn),提供了一種程序,該程序允許計(jì)算機(jī)實(shí)現(xiàn) 以下功能識別字字典生成功能,從搜索服務(wù)器獲取包含由搜索服務(wù)器搜 索的搜索關(guān)鍵字的搜索關(guān)鍵字列表,以生成包含在話語識別時使用的字的 識別字字典;廣播音頻信息接收功能,接收從廣播站發(fā)送而來的廣播音頻
信息;話語識別功能,通過參考包含識別字字典的識別數(shù)據(jù)庫來對廣播音 頻信息執(zhí)行話語識別;關(guān)鍵字檢測功能,從對廣播音頻信息的話語識別的 結(jié)果中檢測預(yù)定關(guān)鍵字;以及外部顯示設(shè)備連接控制功能,執(zhí)行與外部顯 示設(shè)備的連接控制并將從廣播音頻信息中檢測到的關(guān)鍵字輸出到外部顯示
根據(jù)上述實(shí)施例,計(jì)算機(jī)程序被存儲在計(jì)算機(jī)的存儲單元中,并且在 計(jì)算機(jī)的CPU讀取該程序時被執(zhí)行,從而致使計(jì)算機(jī)作為信息處理裝置來 進(jìn)行工作。也可以提供在其中記錄計(jì)算機(jī)程序的計(jì)算機(jī)可讀記錄介質(zhì)。該 記錄介質(zhì)例如可以是磁盤、光盤、磁性光盤、和閃存。計(jì)算機(jī)程序可以例 如經(jīng)由網(wǎng)絡(luò)而不是使用記錄介質(zhì)來分發(fā)。
根據(jù)上述本發(fā)明的實(shí)施例,用于話語識別的識別字字典被使用從搜索 服務(wù)器獲得的數(shù)據(jù)庫來創(chuàng)建,并且話語識別被使用識別字字典來執(zhí)行。因 此,可以以高精確度來識別存在于語音聊天期間的談話對話中的關(guān)鍵字。 此外,用于語言識別的識別字字典被使用從搜索服務(wù)器獲得的數(shù)據(jù)庫來創(chuàng) 建,并且關(guān)鍵字檢測被使用識別字字典來執(zhí)行。因此,可以以高精確度來 檢測存在于廣播信息(節(jié)目信息)中的關(guān)鍵字。
圖1是示出根據(jù)本發(fā)明第一實(shí)施例的語音聊天系統(tǒng)的示意圖;圖2是用于說明根據(jù)第一實(shí)施例的信息處理裝置的硬件配置的框圖3是用于說明根據(jù)第一實(shí)施例的信息處理裝置的配置的框圖4是用于說明根據(jù)第一實(shí)施例的話語識別單元的配置的框圖5是示出根據(jù)第一實(shí)施例的識別數(shù)據(jù)庫的示意圖6是示出根據(jù)第一實(shí)施例的固定字字典的一個示例的示意圖7是示出根據(jù)第一實(shí)施例的固定字字典的另一個示例的示意圖8是示出根據(jù)第一實(shí)施例的可變字字典的一個示例的示意圖9是示出根據(jù)第一實(shí)施例的類別表格的一個示例的示意圖IO是示出根據(jù)第一實(shí)施例的類別表格的另一個示例的示意圖11是示出根據(jù)第一實(shí)施例的語言模型的一個示例的示意圖12是示出根據(jù)第一實(shí)施例的音素列表的一個示例的示意圖13是示出根據(jù)第一實(shí)施例的假名-音素轉(zhuǎn)換規(guī)則的示意圖14是用于說明根據(jù)第一實(shí)施例的話語識別處理的一個示例的流程
圖15是示出根據(jù)第一實(shí)施例的語言分?jǐn)?shù)的計(jì)算公式的一個示例的示 意圖16是示出根據(jù)第一實(shí)施例的常用字典的一個修改示例的示意圖; 圖17是示出根據(jù)第一實(shí)施例的固定字字典的一個修改示例的示意
圖18是示出根據(jù)第一實(shí)施例的類別表格的一個修改示例的示意圖; 圖19是用于說明根據(jù)第一實(shí)施例的識別字字典生成單元的框圖; 圖20是示出根據(jù)第一實(shí)施例的識別字字典生成/更新處理的示意圖; 圖21A是示出根據(jù)第一實(shí)施例的語音聊天系統(tǒng)的配置的示意圖; 圖21B是示出根據(jù)第一實(shí)施例的語音聊天系統(tǒng)的一個修改示例的示意
圖22是示出根據(jù)本發(fā)明第二實(shí)施例的關(guān)鍵字檢測系統(tǒng)的配置的示意
圖23是用于說明根據(jù)第二實(shí)施例的信息處理裝置的配置的框圖; 圖24是用于說明根據(jù)第二實(shí)施例的外部顯示設(shè)備的配置的框圖;圖25是示出根據(jù)第二實(shí)施例的外部顯示設(shè)備的信息顯示屏幕的示意
圖26是用于說明根據(jù)第二實(shí)施例的關(guān)鍵字檢測方法的流程圖27是用于說明根據(jù)第二實(shí)施例的信息處理裝置的第一修改示例的 配置的框圖28是用于說明根據(jù)本修改示例的關(guān)鍵字檢測方法的流程圖; 圖29是示出根據(jù)本發(fā)明第三實(shí)施例的語音聊天系統(tǒng)的示意圖30是用于說明根據(jù)第三實(shí)施例的信息處理裝置的硬件配置的框
圖31是用于說明根據(jù)第三實(shí)施例的信息處理裝置的配置的框圖32是用于說明根據(jù)第三實(shí)施例的信息處理裝置所使用的話語識別
方法和關(guān)鍵字提取方法的一個示例的流程圖33是用于說明在根據(jù)第三實(shí)施例的語音聊天系統(tǒng)中的關(guān)鍵字同步
方法的流程圖34是示出由根據(jù)第三實(shí)施例的信息處理裝置顯示的搜索信息顯示 的示例的示意圖35是示出根據(jù)第三實(shí)施例的搜索信息的參考?xì)v史數(shù)據(jù)的示意圖; 圖36A是用于說明根據(jù)第三實(shí)施例的信息處理裝置的話語識別方法的 簡化框圖36B是用于說明根據(jù)第三實(shí)施例的信息處理裝置的話語識別方法的 第一修改示例的簡化框圖36C是用于說明根據(jù)第三實(shí)施例的信息處理裝置的話語識別方法的 第二修改示例的簡化框圖36D是用于說明根據(jù)第三實(shí)施例的信息處理裝置的話語識別方法的
第三修改示例的簡化框圖37是示出根據(jù)本發(fā)明第四實(shí)施例的關(guān)鍵字提取系統(tǒng)的示意圖; 圖38是用于說明根據(jù)第四實(shí)施例的信息處理裝置的配置的框圖; 圖39是用于說明根據(jù)第四實(shí)施例的外部顯示設(shè)備的配置的框圖; 圖40是示出根據(jù)第四實(shí)施例的外部顯示設(shè)備的信息顯示屏幕的示意圖41是用于說明根據(jù)第四實(shí)施例的關(guān)鍵字提取方法的流程圖; 圖42是用于說明根據(jù)第四實(shí)施例的信息處理裝置的第一修改示例的 配置的框圖;以及
圖43是用于說明根據(jù)本第一修改示例的關(guān)鍵字提取方法的流程圖。
具體實(shí)施例方式
以下將參考附圖來詳細(xì)描述本發(fā)明的優(yōu)選實(shí)施例。注意,在本說明書 和附圖中,實(shí)質(zhì)上具有相同功能和結(jié)構(gòu)的結(jié)構(gòu)元素被用相同的標(biāo)號來表 示,并且對這些結(jié)構(gòu)元素的重復(fù)說明被省略。 (第一實(shí)施例)
以下將詳細(xì)描述根據(jù)本發(fā)明第一實(shí)施例的語音聊天系統(tǒng)。
圖1是示出根據(jù)第一實(shí)施例的語音聊天系統(tǒng)的示意圖。語音聊天系統(tǒng) IO包括通信網(wǎng)絡(luò)12、搜索服務(wù)器14、以及信息處理裝置20A和20B (下 文中有時候統(tǒng)稱為信息處理裝置20)。
通信網(wǎng)絡(luò)12是連接信息處理裝置20和搜索服務(wù)器14以使能它們之間 的雙向或單向通信的通信網(wǎng)絡(luò)。通信網(wǎng)絡(luò)12例如可以由公共網(wǎng)絡(luò)(例 如,因特網(wǎng)、電話網(wǎng)絡(luò)、衛(wèi)星通信網(wǎng)絡(luò)、或者廣播通信頻道)或私有網(wǎng)絡(luò) (例如,WAN (廣域網(wǎng))、LAN (局域網(wǎng))、IP-VPN (因特網(wǎng)協(xié)議-虛擬 私有網(wǎng)絡(luò))、以太網(wǎng)(注冊商標(biāo))、或者無線LAN)構(gòu)成。通信網(wǎng)絡(luò)12 可以是有線的或無線的。
搜索服務(wù)器14是用戶可以使用關(guān)鍵字等通過因特網(wǎng)來搜索可用信息 的網(wǎng)站。在本實(shí)施例中,搜索服務(wù)器14可以提供全文搜索服務(wù),全文搜 索服務(wù)允許使用關(guān)鍵字來搜索所存儲的信息的全文;或者可以是目錄服 務(wù),目錄服務(wù)允許搜索經(jīng)類別分類的信息。
信息處理裝置20以語音方式來與經(jīng)由通信網(wǎng)絡(luò)12而與其相連接的另 一個信息處理裝置20進(jìn)行聊天(語音聊天)。信息處理裝置20可以經(jīng)由 通信網(wǎng)絡(luò)12來請求經(jīng)由通信網(wǎng)絡(luò)12而與其相連接的搜索服務(wù)器14執(zhí)行信 息搜索。執(zhí)行語言聊天的另一個信息處理裝置20可以經(jīng)由通信網(wǎng)絡(luò)12而與其相連接,如圖所示。或者,另一個信息處理裝置20可以不經(jīng)由通信
網(wǎng)絡(luò)12而直接連接到USB (通用串行總線)端口、諸如i丄ink之類的 IEEE 1394端口、 SCSI (小型計(jì)算機(jī)系統(tǒng)接口)端口、 RS-232C端口等。
在如圖所示的示例中,信息處理裝置20是臺式PC;但是,在本實(shí)施 例中,信息處理裝置20可以是筆記本式PC。在本實(shí)施例中,信息處理裝 置20并不限于如上所述的示例,而可以例如由電視機(jī)機(jī)頂盒(television set-top checkbox)、諸如家用游戲機(jī)之類的信息設(shè)備、移動電話、PDA (個人數(shù)字助理)等來構(gòu)成,只要是具有經(jīng)由網(wǎng)絡(luò)來通信的功能的設(shè)備就 可以。另外或者可替代地,信息處理裝置20可以是由擁有者攜帶的便攜 式設(shè)備,例如,便攜式游戲機(jī)、PHS、或者便攜式視頻/音頻播放機(jī)。
在圖1中,僅有兩個信息處理裝置20與通信網(wǎng)絡(luò)12相連接。但是, 本實(shí)施例并不限于該示例,而可以有多個信息處理裝置20與通信網(wǎng)絡(luò)12 相連接。
(信息處理裝置20的硬件配置) 接下來,將參考圖2來簡要描述根據(jù)本實(shí)施例的信息處理裝置20的 硬件配置。
圖2是用于說明根據(jù)第一實(shí)施例的信息處理裝置20的硬件配置的框 圖。信息處理裝置20包括中央處理單元(CPU) 201、只讀存儲器 (ROM) 203、隨機(jī)存取存儲器(RAM) 205、主機(jī)總線207、橋209、外 部總線211、接口 213、輸入設(shè)備215、輸出設(shè)備217、存儲設(shè)備219、驅(qū) 動器221、以及通信設(shè)備223。
CPU 201用作算術(shù)處理單元和控制單元。CPU 201根據(jù)記錄在ROM 203、 RAM 205、存儲設(shè)備219或可移動記錄介質(zhì)16中的各種程序來控制 信息處理裝置20中的內(nèi)部操作的全部或一部分。ROM 203存儲由CPU 201使用的程序、算術(shù)參數(shù)等。RAM 205暫時存儲CPU 201執(zhí)行時所使用 的程序和在CPU 201執(zhí)行時適當(dāng)?shù)刈兓膮?shù)。CPU 201、 ROM 203和 RAM 205經(jīng)由包括內(nèi)部總線(例如,CPU總線)在內(nèi)的主機(jī)總線207而相 互連接。
主機(jī)總線207經(jīng)由橋209而與外部總線211 (例如,外圍組件互連(PCI)總線)相連接。輸入設(shè)備215包括諸如鼠標(biāo)、鍵盤、觸摸屏、按鈕、開關(guān)、和控制桿之類的由用戶操作的操作單元和諸如麥克風(fēng)和頭戴式耳機(jī)之類的語音輸入單元。輸入設(shè)備215可以是使用紅外光或者其它電波的遙控單元(所謂的 遙控器),或者可以是與信息處理裝置20的操作相對應(yīng)的諸如移動電話 或PDA之類的外部連接設(shè)備。輸入設(shè)備215可以是一種輸入控制電路, 該輸入控制電路基于用戶使用操作單元或語言輸入單元輸入的信息來生成 輸入信號并將所生成的輸入信號輸出到CPU 201 。信息處理裝置20的用戶 可以操作輸入設(shè)備215來向信息處理裝置20輸入各種數(shù)據(jù)或者指示信息 處理裝置20執(zhí)行處理操作。輸出設(shè)備217例如可以由可以以可視或可聽的方式來通知用戶所獲得 的信息的顯示單元(例如,陰極射線管(CRT)顯示單元、液晶顯示 (LCD)單元、等離子顯示面板(PDP)單元、電致發(fā)光(EL)顯示單 元、或燈)、音頻輸出單元(包括揚(yáng)聲器和頭戴式耳機(jī))、以及諸如打印 機(jī)、移動電話或傳真機(jī)之類的設(shè)備來構(gòu)成。輸出設(shè)備217例如輸出搜索服 務(wù)器搜索的各種信息。具體而言,顯示單元將搜索服務(wù)器對各種信息的搜 索結(jié)果作為文本或圖像來顯示。同時,音頻輸出單元將被播放的語音數(shù)據(jù) 轉(zhuǎn)換成語音并輸出該語音。存儲設(shè)備219是作為根據(jù)本實(shí)施例的信息處理裝置20的存儲單元的 一個示例的數(shù)據(jù)存儲設(shè)備。存儲設(shè)備219例如由諸如硬盤驅(qū)動器(HDD) 之類的磁存儲單元、半導(dǎo)體存儲設(shè)備、光存儲設(shè)備、磁光存儲設(shè)備等來構(gòu) 成。存儲設(shè)備219存儲由CPU 201執(zhí)行的程序或各種數(shù)據(jù)以及從外部獲得 的各種數(shù)據(jù)。驅(qū)動器221是存儲介質(zhì)的讀寫器。驅(qū)動器221設(shè)置在信息處理裝置20 中,或者從外部附接于信息處理裝置20。驅(qū)動器221讀出記錄在諸如磁 盤、光盤、磁光盤、或半導(dǎo)體存儲器之類的可移動存儲介質(zhì)16中的信息 (該信息被載入到驅(qū)動器221),并將所讀出的信息輸出到RAM 205。驅(qū) 動器221可以將載入到驅(qū)動器221中的信息記錄在諸如磁盤、光盤、磁光 盤或半導(dǎo)體存儲器之類的可移動存儲介質(zhì)16中。可移動存儲介質(zhì)16例如可以是DVD介質(zhì)、HD-DVD介質(zhì)、藍(lán)光介質(zhì)、緊湊式閃存(CF)、記憶 棒、或安全數(shù)字(SD)存儲卡??梢苿哟鎯橘|(zhì)16例如可以是其上安裝 有非接觸式IC芯片的電子設(shè)備或集成電路(IC)卡。通信設(shè)備223是由用于連接到通信網(wǎng)絡(luò)12的通信設(shè)備構(gòu)成的通信接 口。通信設(shè)備223例如可以是用于有線或無線局域網(wǎng)(LAN)的通信卡、 藍(lán)牙或無線USB (WUSB)、用于光通信的路由器、用于非對稱數(shù)字用戶 線路(ADSL)的路由器、或者用于各種通信協(xié)議的調(diào)制解調(diào)器。通信設(shè) 備223在收發(fā)關(guān)于與另一個信息處理裝置20聊天的語音的信息時向因特 網(wǎng)或其它通信設(shè)備發(fā)送各種信息以及從其接收各種信息。連接到通信設(shè)備 223的通信網(wǎng)絡(luò)12可以由以有線或無線方式來連接的諸如因特網(wǎng)、家庭 LAN、紅外光通信、或者衛(wèi)星通信之類的網(wǎng)絡(luò)構(gòu)成。利用上述配置,信息處理裝置20可以與直接連接到信息處理裝置20 的另一個信息處理裝置或者與經(jīng)由通信網(wǎng)絡(luò)12來連接到其的另一個信息 處理裝置進(jìn)行語音聊天,同時從經(jīng)由通信網(wǎng)絡(luò)12來連接到其的搜索服務(wù) 器14等獲得各種信息。此外,信息處理裝置20可以使用可移動存儲介質(zhì) 16來取出存儲在信息處理裝置20中的信息。在上文中,已經(jīng)描述了可以實(shí)現(xiàn)根據(jù)本實(shí)施例的信息處理裝置20的 功能的硬件配置的示例。上述組件可以使用通用元件來構(gòu)成,或者利用專 用于各種組件的功能的專用硬件來構(gòu)成。因此,可以根據(jù)實(shí)施本實(shí)施例時 的技術(shù)水平來適當(dāng)?shù)匦薷挠布渲谩I鲜鲇布渲脙H僅用于說明性目的, 并且本發(fā)明決不局限于此??梢砸罁?jù)使用的形式來省略諸如主機(jī)總線 207、外部總線211或接口 213之類的一些組件。 (信息處理裝置20的配置)接下來,將詳細(xì)描述根據(jù)本實(shí)施例的信息處理裝置20的配置。在以 下描述中,執(zhí)行語音聊天的兩個信息處理裝置20將被稱為第一信息處理 裝置20A和第二信息處理裝置20B。第一和第二信息處理裝置20A和20B 根據(jù)信息處理裝置的各個用戶的聲音來生成語音數(shù)據(jù),并將該語音數(shù)據(jù)發(fā) 送到作為語音聊天的對應(yīng)方的另一個信息處理裝置。圖3是用于說明根據(jù) 第一實(shí)施例的第一信息處理裝置20A的配置的框圖。在以下描述中,術(shù)語"字"指的是在話語識別處理中便于作為單個字 來處理的單元。其并不一定與語言學(xué)上的字相同。例如,"夕口O君(發(fā)音為tarou kun)"可以視為一個字,或者可以視為"tarou"和"kun"形式的兩個字。此外,更大的單元"二入1;:$ 夕口,君(發(fā)音為konnichiwataroukun)"可以被視為一個字。另外,術(shù)語"音素"指的是從聲學(xué)的角度便于視為單個單元的單元。 其并不一定與語音音節(jié)或音素相同。例如,在字"東京(發(fā)音為tou kyou)"中,"tou"部分可以用三個音素符號"t/o/u"來表示,或者用 "to:" ( "o"的長音)來表示。此外,"tou"部分可以用"t/o/o"來表 示。另外,可以采用表示靜音的符號。此外,可以采用將靜音分成"發(fā)音 之前的靜音"、"插入在發(fā)音之間的短靜音"、"發(fā)音中的靜音"、以及 "與',(發(fā)音為tsu),相對應(yīng)的靜音"的符號。如圖3所示,根據(jù)本實(shí)施例的第一信息處理裝置20A包括語音輸入單 元251、話語識別單元253、關(guān)鍵字檢測單元255、關(guān)鍵字管理單元257、 語音談話控制單元259、顯示單元261、語音輸出單元263、通信單元 265、存儲單元267、以及識別字字典生成單元269。語音輸入單元251是在語音聊天期間向第一信息處理裝置20A輸入作 為由第一信息處理裝置20A的用戶發(fā)出的話語的談話對話的接口。語音輸 入單元251例如由與第一信息處理裝置20A相連接的諸如麥克風(fēng)或頭戴式 耳機(jī)之類的輸入設(shè)備來構(gòu)成。用戶向麥克風(fēng)或頭戴式耳機(jī)發(fā)出的話語被實(shí) 時自動地輸入到第一信息處理裝置20A,被轉(zhuǎn)換成作為電信號的語音信 號,并被經(jīng)由語音輸入單元251來發(fā)送到話語識別單元253。話語識別單元253例如由CPU、 ROM或RAM來構(gòu)成。話語識別單元 253根據(jù)由語音輸入單元251自發(fā)輸入并被實(shí)時發(fā)送的用戶的話語來生成 語音數(shù)據(jù),并將該語音數(shù)據(jù)發(fā)送到稍后將描述的語音談話控制單元259, 從而基于所生成的語音數(shù)據(jù)來執(zhí)行話語識別。作為話語識別的結(jié)果,話語 識別單元253生成了與所生成的語音數(shù)據(jù)相對應(yīng)的字序列,并將所生成的 字序列發(fā)送到稍后將描述的關(guān)鍵字檢測單元255。話語識別單元253可以 被配置成將所生成的字序列發(fā)送到稍后將描述的顯示單元261。稍后將描述話語識別單元253的細(xì)節(jié)。關(guān)鍵字檢測單元255判斷在從話語識別單元253發(fā)送而來的字序列中 是否存在由關(guān)鍵字管理單元257管理的關(guān)鍵字,并且如果關(guān)鍵字存在,則 將與該關(guān)鍵字相對應(yīng)的字作為關(guān)鍵字來輸出。如果在一個字序列中存在多 個關(guān)鍵字,則關(guān)鍵字檢測單元255可以被配置成檢測出所有對應(yīng)關(guān)鍵字。 關(guān)鍵字檢測單元255可以被配置成將從字序列中檢測得到的關(guān)鍵字發(fā)送到 稍后將描述的顯示單元261。例如,當(dāng)從話語識別單元253發(fā)送來識別結(jié)果"近年來結(jié)構(gòu)改革己凸 現(xiàn)"時,并且當(dāng)在關(guān)鍵字管理單元257所管理的關(guān)鍵字中存在關(guān)鍵字"結(jié) 構(gòu)改革"時,關(guān)鍵字檢測單元255輸出"結(jié)構(gòu)改革"作為關(guān)鍵字。關(guān)鍵字管理單元257對將從話語識別單元253所生成的字序列提取的 關(guān)鍵字進(jìn)行管理。關(guān)鍵字管理單元257將搜索歷史信息或聊天歷史信息存 儲在存儲單元267中,其中,搜索歷史信息是第一信息處理裝置20A的用 戶使用搜索服務(wù)器14來執(zhí)行搜索的歷史,而聊天歷史信息是用戶使用本 實(shí)施例的語音聊天系統(tǒng)的歷史。基于包含在歷史信息中的搜索關(guān)鍵字或者 所檢測到的關(guān)鍵字來選擇被管理的關(guān)鍵字。關(guān)鍵字管理單元257所管理的 關(guān)鍵字由關(guān)鍵字檢測單元255自由地參考。關(guān)鍵字管理單元257還可以向 話語識別單元253提供所管理的關(guān)鍵字,并且話語識別單元253可以基于 關(guān)鍵字管理單元257所提供的關(guān)鍵字來更新稍后將描述的諧振循環(huán)數(shù)據(jù)庫 (resonant cycle database)。語音談話控制單元259例如由CPU、 ROM和RAM來構(gòu)成,并且對與 經(jīng)由通信網(wǎng)絡(luò)12來連接的第二信息處理裝置20B的語音聊天進(jìn)行控制。 語音談話控制單元259接收話語識別單元253所生成的語音數(shù)據(jù),并經(jīng)由 通信單元265將該語音數(shù)據(jù)發(fā)送到第二信息處理裝置20B。語音談話控制 單元259接收經(jīng)由通信單元265從第二信息處理裝置20B發(fā)送而來的語音 數(shù)據(jù),并將該語音數(shù)據(jù)發(fā)送到語音輸出單元263。語音談話控制單元259 可以被配置成每次語音聊天被執(zhí)行時就以關(guān)聯(lián)方式來將執(zhí)行語音聊天的曰 期、用于標(biāo)識語音聊天的標(biāo)識符、以及用于標(biāo)識語音聊天的對應(yīng)方的標(biāo)識 符存儲在存儲單元267中,作為聊天歷史信息。語音談話控制單元259可以由專用于語音談話控制的專用硬件構(gòu)成, 或者可以被作為諸如語音聊天程序之類的應(yīng)用程序來提供。顯示單元261通過諸如第一信息處理裝置20A的顯示器之類的顯示設(shè) 備來向第一信息處理裝置20A的用戶顯示從關(guān)鍵字檢測單元255發(fā)送而來 的關(guān)鍵字。顯示單元261可以被配置成顯示作為從話語識別單元253發(fā)送 而來的話語識別的結(jié)果的字序列自身。語音輸出單元263是接收第二信息處理裝置20B的用戶所發(fā)出的話語 的語音數(shù)據(jù)并將所接收的語音數(shù)據(jù)輸入到第一信息處理裝置20A的接口。 語音輸出單元263例如由作為與第一信息處理裝置20A相連接的輸出設(shè)備 的揚(yáng)聲器或耳機(jī)構(gòu)成。經(jīng)由通信單元265從第二信息處理裝置20B接收的語音數(shù)據(jù)被經(jīng)由語 音輸出單元263來輸出給第一信息處理裝置20A的用戶。通信單元265例如是安裝在第一信息處理裝置20A中的通信設(shè)備。通 信單元265中繼在第一信息處理裝置20A (具體而言是話語識別單元 253、關(guān)鍵字管理單元257、語音談話控制單元259和識別字字典生成單元 269)和第一信息處理裝置20A的外部設(shè)備(具體而言是搜索服務(wù)器14) 或第二信息處理裝置20B之間的經(jīng)由通信網(wǎng)絡(luò)12來進(jìn)行的信息通信。此 外,通信單元265可以與直接而非經(jīng)由通信網(wǎng)絡(luò)12來連接到第一信息處 理裝置20A的其它信息處理裝置進(jìn)行信息通信。存儲單元267例如是安裝在第一信息處理裝置20A中的存儲設(shè)備,并 在其中存儲諸如由關(guān)鍵字檢測單元255檢測到的關(guān)鍵字或由關(guān)鍵字管理單 元257管理的關(guān)鍵字信息之類的數(shù)據(jù)。除了這些數(shù)據(jù)之外,存儲單元267 還可以在其中存儲諸如由話語識別單元253生成的字序列或語音數(shù)據(jù)之類 的識別結(jié)果或者各種數(shù)據(jù)庫。存儲單元267可以適當(dāng)?shù)卦谄渲写鎯υ诘谝?信息處理裝置20A執(zhí)行處理時需要存儲的各種參數(shù)以及該處理的進(jìn)程信 息。在話語識別單元253、關(guān)鍵字檢測單元255、關(guān)鍵字管理單元257、語 音談話控制單元259、識別字字典生成單元269等執(zhí)行對存儲單元267的 讀寫時,存儲單元267可以自由地被訪問。識別字字典生成單元269從搜索服務(wù)器14獲取搜索關(guān)鍵字列表等,并從所獲得的搜索關(guān)鍵字列表中僅選擇合適的關(guān)鍵字,從而生成在話語識 別時使用的識別字字典。識別字字典生成單元269不僅可以從所獲得的搜 索關(guān)鍵字列表中選擇關(guān)鍵字,而且還可以向所選擇的關(guān)鍵字添加這些關(guān)鍵 字的屬性信息或者相關(guān)的次關(guān)鍵字或者添加在話語識別時使用的識別權(quán)重。稍后將描述識別字字典生成單元269的細(xì)節(jié)。 (話語識別單元253)接下來,將參考圖4來詳細(xì)描述根據(jù)本實(shí)施例的話語識別單元253。 圖4是用于說明根據(jù)第一實(shí)施例的話語識別單元253的配置的框圖。如圖4所示,根據(jù)本實(shí)施例的話語識別單元253包括AD轉(zhuǎn)換單元 301、特征參數(shù)提取單元303、匹配單元305、常用字典存儲單元307、和 識別數(shù)據(jù)庫309。AD轉(zhuǎn)換單元301對語音信號(從語音輸入單元251發(fā)送而來的模擬 信號)進(jìn)行采樣和量化,并將該模擬語音信號轉(zhuǎn)換成作為數(shù)字信號的語音 數(shù)據(jù)。在完成向語音數(shù)據(jù)的轉(zhuǎn)換之后,AD轉(zhuǎn)換單元301將所生成的語音 數(shù)據(jù)發(fā)送到語音談話控制單元259和特征參數(shù)提取單元303。 AD轉(zhuǎn)換單元 301可以將所生成的語音數(shù)據(jù)存儲在存儲單元267中。特征參數(shù)提取單元303從AD轉(zhuǎn)換單元301所生成的適當(dāng)語音數(shù)據(jù)的 每一幀中提取諸如Mel頻率倒譜系數(shù)(MFCC)及其時差參數(shù)、頻譜、功 率線性預(yù)測系數(shù)、倒譜系數(shù)、和線譜對之類的特征參數(shù)。在完成特征參數(shù) 的提取之后,特征參數(shù)提取單元303將所提取的特征參數(shù)發(fā)送到稍后將描 述的匹配單元305。特征參數(shù)提取單元303可以將從語音數(shù)據(jù)中提取的各 種特征參數(shù)存儲在存儲單元267中。匹配單元305基于從特征參數(shù)提取單元303發(fā)送而來的各種特征參 數(shù)、通過適當(dāng)?shù)貐⒖甲R別數(shù)據(jù)庫309和常用字典存儲單元307來生成與輸 入到語音輸入單元251的話語(即,語音聊天期間的談話內(nèi)容)最接近的 字序列,作為話語識別的結(jié)果。字序列的生成方法將在稍后描述。在完成 字序列的生成之后,匹配單元305將所生成的字序列發(fā)送到關(guān)鍵字檢測單 元255。匹配單元305可以將所生成的字序列存儲在存儲單元267中。匹配單元305可以使用基于集束搜索(beam search)的維特比(Viterbi)解碼器或者基于A忖叟索的堆棧解碼器來執(zhí)行匹配。另外或者可 替代地,在匹配時可以使用所謂的關(guān)鍵字辨認(rèn)(keyword spotting)方法。 如果向匹配單元305所參考的各種字字典添加了稍后將描述的"識別權(quán) 重"信息,則可以對稍后將描述的語言分?jǐn)?shù)進(jìn)行加權(quán),并且識別結(jié)果可以 按加權(quán)后的分?jǐn)?shù)來分等級。常用字典存儲單元307存儲常用字典,該常用字典是在話語識別中通 常使用的字的字典。在存儲在常用字典存儲單元307中的常用字典中,登 記在其中的所有字都與發(fā)音信息和類別信息一起以關(guān)聯(lián)方式來記載。例如, 當(dāng)專有名詞"<于口一 (人名)"被登記在常用字典中時,專有名詞 于口一"與發(fā)音信息(音素信息)"ichiro"和類別"_人名—" 一起以關(guān)聯(lián) 方式來被登記。稍后將描述常用字典的細(xì)節(jié)。識別數(shù)據(jù)庫309是存儲由匹配單元305用于生成字序列的各種模型或 規(guī)則的數(shù)據(jù)庫。以下將描述識別數(shù)據(jù)庫309的細(xì)節(jié)。<識別數(shù)據(jù)庫309>接下來,將參考圖5來詳細(xì)描述根據(jù)本實(shí)施例的識別數(shù)據(jù)庫309。圖 5是示出根據(jù)第一實(shí)施例的識別數(shù)據(jù)庫309的示意圖。如圖5所示,根據(jù)本實(shí)施例的識別數(shù)據(jù)庫309包括識別字字典存儲單 元401、聲學(xué)模型存儲單元403、語言模型存儲單元405、音素列表407、 和假名-音素轉(zhuǎn)換規(guī)則409。識別字字典存儲單元401在其中存儲由匹配單元305在生成字序列時 使用的識別字字典。識別字字典例如包括固定字字典,可變字字典和類別 表格。在固定字字典中,記載了諸如不會經(jīng)歷登記和刪除的字(即,預(yù)先在 系統(tǒng)中建立的字(以下稱為固定字))的發(fā)音(音素序列)和描述了音素 的串聯(lián)關(guān)系的模型之類的各種信息。在可變字字典中,記載了諸如作為關(guān)鍵字的字(keyword word)的發(fā) 音和描述音素的串聯(lián)關(guān)系的模型之類的各種信息。諸如作為關(guān)鍵字的字的 登記和刪除以及發(fā)音的改變之類的處理主要是針對登記在固定字字典中的 字來執(zhí)行的??勺冏肿值淇梢圆辉谄渲写鎯θ魏涡畔ⅰ@?,在檢測與棒球相關(guān)的關(guān)鍵字的情況下,常用字典存儲單元307 可以在其中登記日常談話中通常會使用的字(例如,在諸如日語語言字典之類的普通字典中記載的字);在識別字字典存儲單元401中的固定字字 典可以在其中登記在棒球領(lǐng)域中通常會使用的字,例如,"擊打"、"雙 殺"、"擊球手"、或者"捕手"。在識別字字典存儲單元401中的可變 字字典可以在其中登記隨時間變化的專有名詞,例如"ichiro"。由于可變 字字典是按需來更新的,所以可以很容易地執(zhí)行包括與最近的關(guān)于棒球的 話題相關(guān)的關(guān)鍵字的識別。接下來,將參考圖6和7來描述根據(jù)本實(shí)施例的固定字字典。圖6和 7是示出根據(jù)第一實(shí)施例的固定字字典的示例的示意圖。在圖6中,"符號"是用于標(biāo)識字的字符串,并且可以例如用日語假 名記號來表示。相同符號的條目被視為相同字的條目。本實(shí)施例的語言模 型用這種符號來表示。"副本(transcription)"表示字的記號,并且作為 識別結(jié)果來輸出的字符串是副本。"音素序列"是用音素序列來表達(dá)的字 的發(fā)音。本實(shí)施例的固定字字典不僅記載如圖6所示的假名記號的符號, 而且還記載如圖7所示的混合有漢語字符和日語平假名的字符串。在圖6和7中記載的"<開始>"和"<結(jié)束>"是分別表示"發(fā)音之前 的靜音"和"發(fā)音之后的靜音"的特殊符號。因此,這些特殊符號在副本 欄中沒有相應(yīng)的記號,并且被表示為"[]"(空白)。除了圖6和7所記載的項(xiàng)目之外,本實(shí)施例的固定字字典還可以包括 對字的話語的各個部分進(jìn)行描述的"屬性"欄(例如,名詞或動詞,或者 字的類型)以及對在計(jì)算稍后將描述的語言分?jǐn)?shù)時使用的字的權(quán)重信息進(jìn) 行描述的"識別權(quán)重"欄。接下來,將參考圖8來描述根據(jù)本實(shí)施例的可變字字典。圖8是示出 根據(jù)第一實(shí)施例的可變字字典的一個示例的示意圖。如圖8所示,本實(shí)施例的可變字字典包括"符號"欄和"假名發(fā) 音"。在圖8所示的示例中,兩個類別"—人名一"和"—地名—"被描述成 "符號"。在"—人名—"類別中,兩個字"<千口一(發(fā)音為ichiro)" 和"廿二一夕口々(發(fā)音為sanitarou)"的發(fā)音被記載在假名發(fā)音中。在"—地名—"類別中,字"年夕V于力7 (發(fā)音為kitashinagawa)"的發(fā)音被記載在假名發(fā)音中。本實(shí)施例的可變字字典可以記載特定字以及類別, 如圖8所示。在將如圖所示的除了類別之外的特定字記載在可變字字典中 時,各個字被記載在"符號"欄中,并且將在可變字字典中提供與這些字 相對應(yīng)的"副本"或"音素序列"。類似于固定字字典的情況,本實(shí)施例的可變字字典可以包括對字的話 語的各個部分進(jìn)行描述的"屬性"欄(例如,名詞或動詞,或者字的類 型)以及對在計(jì)算稍后將描述的語言分?jǐn)?shù)時使用的字的權(quán)重信息進(jìn)行描述 的"識別權(quán)重"欄。由于記載在可變字字典中的字主要是隨時間變化的 字,所以記載在"識別權(quán)重"欄中的值優(yōu)選地被設(shè)置成大于記載在固定字 字典中的"識別權(quán)重"。這樣,對記載在可變字字典中的字設(shè)置了較大的 "識別權(quán)重"。因此,在用戶通常交談關(guān)于當(dāng)前的話題的語音聊天中,可 以基于偏好來選擇特定關(guān)鍵字或者與特定關(guān)鍵字相關(guān)的字。因此,可以執(zhí) 行高識別率的話語識別。稍后將描述根據(jù)本實(shí)施例的可變字字典的生成和更新處理的細(xì)節(jié)。在類別表格中,包含在語言模型存儲單元405中的語言模型所包含的 類別和關(guān)于包含在這些類別中的字的信息是以關(guān)聯(lián)方式來描述的。類別表 格可以以列表形式或者表格形式來描述。如果語言模型不包括任何類別, 則類別表格可以不在其中存儲任何信息或數(shù)據(jù)。這些類別可以基于語義屬性來分成各個類(例如,"一人名—"、 用戶名—"、"—地名—"、"—店名—"等),或者基于話語的各個部分來 分成各個類(例如,"—名詞—"、"—動詞—"、"—小品詞—"等)。以 下,記號指的是類別名稱。圖9示出了類別表格的一個示例。在該類別表格中,記載了在稍后將 描述的語言模型中使用的類別種類和有關(guān)屬于該類別的字的信息。例如, 當(dāng)在語言模型中使用兩個類別"—人名—"和"_地名—"時,這兩個類別 "—人名一"和"一地名一"被輸入到類別表格中,如圖9所示。當(dāng)向類別表 格添加新類別時,屬于該新添加的類別的字可以用空白來表示,并且可以 隨著語言模型的學(xué)習(xí)或調(diào)整的進(jìn)程而向其添加所屬字(belonging word)。在圖9中,屬于類別"_人名—"和"—地名—"的字被表示為"[]",這種 記號表示不存在所屬字。圖10示出了識別字字典存儲單元401的類別表格的另一個示例,其 中,輸入了關(guān)于字的信息。在圖10中,第一行上的條目表示字"<千口-(發(fā)音為ichiro)"和"廿二一夕口々(發(fā)音為sanitarou)"屬于類別 "—人名—"。聲學(xué)模型存儲單元403在其中存儲聲學(xué)模型,聲學(xué)模型表示將被識別 的話語的各個音素的聲學(xué)特征。這里,聲學(xué)模型是表示各個發(fā)音符號(例 如元音或輔音)的話語的聲學(xué)特征的模型。在對輸入話語的語音數(shù)據(jù)與識 別候選字進(jìn)行比較同時關(guān)注與聲音的相似度時會使用聲學(xué)模型。作為聲學(xué) 模型,例如可以使用隱馬爾可夫模型(HMM, Hidden Markov Model), 但是,根據(jù)本實(shí)施例的聲學(xué)模型并不限于HMM。作為存儲在聲學(xué)模型存儲單元403中的聲學(xué)模型,可以提供兩種模 型, 一種模型用于安靜的環(huán)境(在安靜環(huán)境下能夠提供高識別率的聲學(xué)模 型),而另一種模型用于嘈雜的環(huán)境(在嘈雜環(huán)境下能夠提供良好的識別 率的聲學(xué)模型),以使得可以依據(jù)環(huán)境來參考這兩種模型中的任一種。語言模型存儲單元405在其中存儲語言模型,語言模型描述了表示登 記在常用字典存儲單元307和識別字字典存儲單元401的各個字典中的字 如何串聯(lián)(連接)的信息(以下稱為串聯(lián)信息)。作為描述方法,可以使 用統(tǒng)計(jì)字串聯(lián)概率(n-gram或者基于類的n-gram (class n-gram))、生成 語法、有限狀態(tài)自動機(jī)(FSA)等。包含在語言模型存儲單元405中的語言模型包含從特定視角來分類的 字的類別的串聯(lián)信息以及這些字的串聯(lián)信息。例如,當(dāng)"表示人名的字所 屬于的類別"被表示為符號"—人名一"并且"表示食物的字所屬于的類 別"被表示為符號"一食物_"時,語言模型還描述了 "—人名_"和"_食 物—"的串聯(lián)信息,即,還描述了預(yù)先存儲在字典中的各種類別之間的串 聯(lián)以及類別和字之間的串聯(lián)。因此,可以獲得語言模型中沒有包含的字的串聯(lián)信息。例如,當(dāng)獲得 ""Y于口一 (發(fā)音為ichiro)"和(小品詞,發(fā)音為wa)"之間的串聯(lián)信息時,即使語言模型中沒有描述"<于口一(發(fā)音為ichiro)"的串 聯(lián)信息,如果可以獲悉"<千口一(發(fā)音為ichiro)"屬于表示為符號"— 人名—"的類別,也可以通過獲得"一人名—"和"y:(小品詞,發(fā)音為 wa)"之間的串聯(lián)信息來獲得"吖千口一 (發(fā)音為ichiro)"和(小 品詞,發(fā)音為wa)"之間的串聯(lián)信息。 <語言模型>接下來,將參考圖11來描述根據(jù)本實(shí)施例的語言模型的特定示例。 圖11是示出根據(jù)第一實(shí)施例的語言模型的一個示例的示意圖。在圖11中,使用統(tǒng)計(jì)語言模型作為語言模型。統(tǒng)計(jì)語言模型是使用 條件概率來描述字的串聯(lián)信息的模型。在圖11所示的語言模型中,使用 了三元組(tri-gram)作為統(tǒng)計(jì)語言模型,其中,三元組表示三個字1、 2 和3的連續(xù)概率,S卩,字的三串聯(lián)概率。在圖11中,"P (字31字1字2)"表示在字序列中在連續(xù)的"字 1"和"字2"之后出現(xiàn)"字3"的概率。在圖中示出的示例中,在連續(xù)的 "<開始>"和"—人名—"之后出現(xiàn)(發(fā)音為wa)"的概率是 "0.012"。這樣的概率可以通過分析描述了大量聊天談話的文本來獲得。 作為語言模型,除了三元組之外,還可以根據(jù)需要而使用二元組(二串聯(lián) 概率)或者一元組(出現(xiàn)一個字的概率)。在圖11的語言模型中,語法是使用類別和字來描述的。即,在圖11 中,"—人名_"和"—地名—"指的是類別"—人名_"和"—地名_",因 此,通過使用這樣的類別來描述三元組,如果表示人名或地名的字被登記 在可變字字典中,則這些字可以被話語識別單元253識別出來。音素列表407是在識別數(shù)據(jù)庫309中使用的音素符號的列表。音素列 表407將一個音素(或者對應(yīng)的一個)表示為一個符號,如圖12所示。 例如,在圖12的音素列表中,元音+冒號(例如,"a:")表示延長音, 并且"N"表示"/u (日語平假名,發(fā)音為ng)"。另外,"sp"、 "silB" 、 "silE"和"q"全都表示靜音,它們分別表示"發(fā)音中的靜 音"、"發(fā)音之前的靜音"、"發(fā)音之后的靜音"以及"與',,(發(fā)音 為tsu)相對應(yīng)的靜音"。假名-音素轉(zhuǎn)換規(guī)則409是用于將假名字符串轉(zhuǎn)換成音素序列的規(guī)則。這樣,通過存儲假名-音素轉(zhuǎn)換規(guī)則409,常用字典存儲單元307或者識別 字字典存儲單元401可以在其中存儲和維護(hù)與音素序列相獨(dú)立的假名字符 串,作為發(fā)音信息。假名-音素轉(zhuǎn)換規(guī)則409描述了從假名記號向音素(例 如,與記號或者所有可能的假名記號相關(guān)的音素的符號)轉(zhuǎn)換的規(guī)則。根 據(jù)圖13所示的假名-音素轉(zhuǎn)換規(guī)則409,例如,假名字符串"<千口一" 被轉(zhuǎn)換為音素序列"i/cM/r/o:"。在上文中,已經(jīng)描述了根據(jù)本發(fā)明的第一信息處理裝置20A的功能的 示例。上述組件可以使用通用元件或電路來構(gòu)成,或者可以用專用于各個 組件的功能的專用硬件來構(gòu)成。這些組件的全部功能可以利用CPU等來執(zhí) 行。因此,可以根據(jù)實(shí)施本實(shí)施例時的技術(shù)水平來適當(dāng)?shù)匦薷挠布渲谩5诙畔⑻幚硌b置20B的配置基本上與第一信息處理裝置20A的相 同,并且將省略它的描述。(話語識別單元253的話語識別處理)接下來,將參考圖14來描述根據(jù)本實(shí)施例的話語識別單元253的話 語識別處理。圖14是用于說明根據(jù)第一實(shí)施例的話語識別處理的一個示 例的流程圖。當(dāng)話語從第一信息處理裝置20A的用戶輸入到諸如麥克風(fēng)之類的語音 輸入單元251時,開始稍后將描述的話語識別處理。由語音輸入單元251生成的語音信號首先被AD轉(zhuǎn)換單元301轉(zhuǎn)換成 作為數(shù)字信號的語音數(shù)據(jù),并被發(fā)送到特征參數(shù)提取單元303 (步驟 S101)。此時,AD轉(zhuǎn)換單元301可以將所生成的語音數(shù)據(jù)存儲在存儲單 元267中。接下來,語音數(shù)據(jù)被發(fā)送到其的特征參數(shù)提取單元303從發(fā)送 而來的語音數(shù)據(jù)中提取諸如Mel倒譜之類的特征量(步驟S103)。在提取 特征參數(shù)時,可以使用各種分析方法,例如,倒譜分析、線性預(yù)測分析、 基于使用MFCC系數(shù)的聲學(xué)濾波器的分析。特征參數(shù)提取單元303可以在 存儲單元267中存儲從語音數(shù)據(jù)中提取得到的各種特征參數(shù)。一旦特征量被特征參數(shù)提取單元303提取出來,匹配單元305就參考 存儲在常用字典存儲單元307中的常用字典或者存儲在識別數(shù)據(jù)庫309的37識別字字典存儲單元401中的固定字字典和可變字字典,從而通過連接被 表示為這些字典中的符號的一些字來生成字序列(步驟S105)。隨后,匹配單元305基于存儲在識別數(shù)據(jù)庫309的聲學(xué)模型存儲單元403中的聲學(xué) 模型來計(jì)算所生成的字序列的聲學(xué)分?jǐn)?shù)(步驟S105)。這里,聲學(xué)分?jǐn)?shù)是 表示作為話語識別的結(jié)果的候選的字序列在聲音方面(從聲學(xué)的角度)與 輸入語音的相似程度的分?jǐn)?shù)。較高的聲學(xué)分?jǐn)?shù)意味著所生成的字序列在聲 學(xué)上接近于輸入語音。一旦基于特征參數(shù)來計(jì)算得到聲學(xué)分?jǐn)?shù),匹配單元305就基于計(jì)算得 到的聲學(xué)分?jǐn)?shù)來選擇預(yù)定數(shù)目的具有較高聲學(xué)分?jǐn)?shù)的字序列(步驟 S107)。順便提及,匹配單元305可以在存儲單元267中存儲計(jì)算得到的 聲學(xué)分?jǐn)?shù)或者所選擇的字序列。在完成聲學(xué)分?jǐn)?shù)計(jì)算之后,匹配單元305基于包含在識別數(shù)據(jù)庫309 的語言模型存儲單元405中的語言模型來計(jì)算在步驟S107中選擇的各個 字序列的語言分?jǐn)?shù)(步驟S109)。例如,如果使用存儲在語言模型存儲單 元405中的各種語言模型中的語法或者有限狀態(tài)自動機(jī),則當(dāng)字序列對于 該語言模型可接受時,該字序列的語言分?jǐn)?shù)為"1";當(dāng)字序列對于該語 言模型不可接受時,該字序列的語言分?jǐn)?shù)為"0"。當(dāng)所生成的字序列對于語言模型可接受時,匹配單元305可以留下在 步驟S107中選擇的字序列?;蛘?,當(dāng)所生成的字序列作為語言可接受, 但是對于語言模型不可接受時,匹配單元305可以刪除在步驟S107中選 擇的字序列。當(dāng)使用諸如n-gram或者基于類的n-gram之類的統(tǒng)計(jì)語言模型作為語 言模型時,使用字序列的生成概率作為語言分?jǐn)?shù)。在本申請人所提出的曰 本專利申請No. 2001-382579 (對應(yīng)于JP-ANO. 2003-186494)中描述了計(jì) 算語言分?jǐn)?shù)的詳細(xì)的方法。順便提及,匹配單元305可以將計(jì)算所得的語 言分?jǐn)?shù)存儲在存儲單元267中。根據(jù)本實(shí)施例的語言模型使用存儲在常用字典存儲單元307中的常用 字典或者存儲在識別數(shù)據(jù)庫309的識別字字典存儲單元401中的固定字字 典和可變字字典來計(jì)算語言分?jǐn)?shù)。由于在可變字字典中以按需更新方式來描述隨時間變化的專有名詞,所以可以對語音聊天期間頻繁用作話題的字 進(jìn)行語言分?jǐn)?shù)計(jì)算。在完成聲學(xué)分?jǐn)?shù)和語言分?jǐn)?shù)的計(jì)算之后,匹配單元305對在步驟S105 中計(jì)算得到的聲學(xué)分?jǐn)?shù)和在步驟S109中計(jì)算得到的語言分?jǐn)?shù)進(jìn)行合成并 對字序列進(jìn)行排序,從而將具有最大合成分?jǐn)?shù)的字序列確定為識別結(jié)果 (步驟S1U)。具體而言,匹配單元305將根據(jù)聲學(xué)模型來獲得的聲學(xué)分 數(shù)和根據(jù)語言模型來獲得的語言分?jǐn)?shù)的乘積或?qū)?shù)和為最大的字序列確定 為識別結(jié)果。當(dāng)諸如字的識別權(quán)重之類的信息被添加到在語言模型中使用 的字典時,可以使用在其中并入了識別權(quán)重的語言分?jǐn)?shù)。在這種情況下,從聲學(xué)和語言學(xué)角度來看最為合適的字序列被確定為 識別結(jié)果。 一旦最合適的字序列被確定為識別結(jié)果,匹配單元305就將所 確定的識別結(jié)果發(fā)送到關(guān)鍵字檢測單元255 (步驟S113)。順便提及,匹 配單元305可以將作為所確定的識別結(jié)果的字序列存儲在存儲單元267 中。這樣,在根據(jù)本實(shí)施例的話語識別處理中,在計(jì)算語言分?jǐn)?shù)時,通過 參考可變字字典(該可變字字典記載了與用戶在語音聊天期間可能交談的 最近的話題(特定話題)相關(guān)的詞匯),可以基于偏好來識別與最近的話 題相關(guān)的詞匯。因此,可以提高在通常的話語識別處理中很難識別的最近 的關(guān)鍵字或者與關(guān)鍵字相關(guān)的詞匯的識別率。作為識別結(jié)果來顯示的信息 很可能是關(guān)于最近的話題的信息,即,用戶感興趣的信息。因此,即使被 顯示的信息不知何故而與用戶語音聊天時的談話不同(即,即使話語識別 的結(jié)果存在錯誤),語音聊天的用戶也可能能夠展寬談話。在這種情況 下,執(zhí)行語音聊天的用戶可以設(shè)法允許話語識別處理中的錯誤。<語言分?jǐn)?shù)的計(jì)算方法>接下來,將參考圖15來描述根據(jù)本實(shí)施例的語言分?jǐn)?shù)的計(jì)算方法。 圖15是示出根據(jù)第一實(shí)施例的語言分?jǐn)?shù)的計(jì)算公式的示例的示意圖。圖 15示出了當(dāng)匹配單元305在圖14的步驟S109中選擇字序列"<幵始><千 口一 (發(fā)音為ichiro) (發(fā)音為wa)何時(發(fā)音為nanji) t二 (發(fā)音為 ni)起tt (發(fā)音為okita) (D (發(fā)音為no) <結(jié)束〉"時的語言分?jǐn)?shù)的計(jì)算公式。語言分?jǐn)?shù)"Score (<開始><千口一(發(fā)音為ichiro) (發(fā)音為 wa)何時(發(fā)音為nanji) t二 (發(fā)音為ni)起^;t (發(fā)音為okita) (D (發(fā) 音為no) <結(jié)束>)"是字序列"<開始><千口一 (發(fā)音為ichiro) & (發(fā) 音為wa)何時(發(fā)音為nanji) t二 (發(fā)音為ni)起^t (發(fā)音為okita) (7) (發(fā)音為no) <結(jié)束>"的生成概率,如公式(1)所示。語言分?jǐn)?shù)"Score(〈開始〉ichiro wa nanji ni okita no <結(jié)束〉"的準(zhǔn)確值 是利用"P(〈開始〉)P(ichiro I <開始〉)P(wa I <開始〉ichiro) P(nanji | <開始> ichiro) P(ni | <開始> ichiro wa nanji) P(okita | <開始> ichiro wa nanji ni) P(no | <開始> ichiro wa nanji ni okita) P(〈結(jié)束〉| <開始〉ichiro wa nanji ni okita no)"來計(jì)算的,如公式(2)所示。如圖16所示,由于語言模型112使用 了三元組,所以條件式"<開始〉ichiro wa"、"<開始〉ichiro wa nanji"、"<開始> ichiro wa nanji ni"、"<開始〉ichiro wa nanji ni okita" 和"<開始〉ichiro wa nanji ni okita no"是利用字序列局限于緊跟在前的兩 個字(即,分別為"ichiro wa" 、 "wa nanji" 、 "nanji ni" 、 "ni okita" 和"okita no")的條件概率來近似得到的(公式(3))。條件概率是通過參考如圖11所示的語言模型來獲得的。但是,由于 語言模型并不包含符號"ichiro",所以匹配單元305通過參考存儲在識別 數(shù)據(jù)庫309的識別字字典存儲單元401中的類別表格而識別出用符號 "ichiro"表示的字屬于"—人名_"類別,從而將"ichiro"轉(zhuǎn)換成"一人名具體而言,如公式(4)所示,"P(ichiro I <開始>)"被轉(zhuǎn)換成 "P(_personal name一 | <開始>)P(ichiro | _personal name—)",然后近似得到 "PCpersonal name—I <開始>>^"。這里,N是屬于類別表格中的"—人名一"類別的字的數(shù)目。具體而言,當(dāng)以P(X I Y)的形式來描述概率時,如果字X屬于類別 C,則首先根據(jù)語言模型來得到P(C I Y)的值,并且將所獲得的值乘以P(X IC)的值,其中,P(X I C)是從類別C中生成字X的概率。假設(shè)屬于類別C 的字的生成概率相同,那么如果屬于類別C的字的數(shù)目為N,則P(X I C)的值可以近似等于1/N。
例如,在"—人名」'類別中僅存在用符號"ichiro"表示的一個字,則 N的值為"1"。因此,如公式(5)所示,"P(wa I <開始> ichiro)"等于 "P(wa I 〈開始〉jersonal name—)"。另夕卜,"P(nanji | ichiro wa)"等于 "P(nanji I _personal name—wa)",如公式(6)所示。
通過使用語言分?jǐn)?shù)的計(jì)算方法,可以計(jì)算包含可變字的字序列的語言 分?jǐn)?shù)。其結(jié)果是,可變字可以被作為識別結(jié)果來輸出。
在上述示例中,在系統(tǒng)啟動時,常用字典存儲單元307的常用字典并 不包含任何信息或數(shù)據(jù)。但是,可以預(yù)先在常用字典中存儲若干字。
圖16示出了常用字典的一個示例,其中,在系統(tǒng)啟動時在"—人名 一"類別中輸入了關(guān)鍵字"ichiro"。在圖16的示例中,由于在系統(tǒng)啟動 時在"—人名—"類別中輸入了假名發(fā)音"<于口一",所以無需登記該關(guān) 鍵字就可以檢測到該關(guān)鍵字。
在上述示例中,在語言模型中描述了存儲在固定字字典中的字,并且 存儲在可變字字典中的字屬于至少一個類別。屬于該類別的一些字可以存 儲在固定字字典中。
圖17示出了固定字字典的一個示例,并且圖18示出了啟動時的類別 表格的示例。具體而言,在圖16的類別表格中,預(yù)先登記了類別"_人名 _"和屬于類別"_人名—"的字的符號"<千口一"。在圖17的固定字字 典131中,預(yù)先登記了符號"<千口一"、用符號"一于口一"表示的字 的副本"i千口一"以及音素序列"i/ch/i/r/o:"。
在以上情況下,話語識別處理被執(zhí)行以使得字"ichiro"屬于"—人名 —"類別。即,從一開始字"ichiro"就被視為人名。但是,由于字 "ichiro"存儲在固定字字典中,所以很難刪除或修改。
這樣,通過預(yù)先將可能的字存儲在固定字字典中,可以識別關(guān)鍵字而 無需將它們登記在字典中。
(識別字字典生成單元269)
接下來,將參考圖19來詳細(xì)描述根據(jù)本實(shí)施例的識別字字典生成單 元269。圖19是用于說明根據(jù)第一實(shí)施例的識別字字典生成單元的框圖。如圖19所示,根據(jù)本實(shí)施例的識別字字典生成單元269包括搜索關(guān)
鍵字列表獲取單元501、關(guān)鍵字選擇單元503、次關(guān)鍵字獲取單元505和 關(guān)鍵字信息添加單元507。
搜索關(guān)鍵字列表獲取單元501從經(jīng)由通信網(wǎng)絡(luò)12連接到其的搜索服 務(wù)器14獲取包含搜索服務(wù)器所搜索得到的較高等級的搜索關(guān)鍵字的較高 等級搜索關(guān)鍵字列表。所獲得的較高等級搜索關(guān)鍵字可以是搜索服務(wù)器14 的整體上的較高等級搜索關(guān)鍵字,或者可以是特定領(lǐng)域的較高等級搜索關(guān) 鍵字。所獲得的較高等級搜索關(guān)鍵字的數(shù)目是任意的。
當(dāng)從特定領(lǐng)域獲得較高等級搜索關(guān)鍵字時,搜索關(guān)鍵字列表獲取單元 501可以通過參考存儲在存儲單元267中的語音聊天歷史信息或者所識別 關(guān)鍵字的歷史信息來確定第一信息處理裝置20A的用戶的偏好,從而僅獲 取符合用戶偏好的較高等級搜索關(guān)鍵字。例如,搜索關(guān)鍵字列表獲取單元 501可以使用概率潛在語義分析(PLSA)等來將語音聊天的歷史信息和所 識別關(guān)鍵字的歷史信息轉(zhuǎn)換成具有預(yù)定維度的話題矢量的形式。類似地, 搜索服務(wù)器的較高等級搜索關(guān)鍵字可以被使用PLSA等來轉(zhuǎn)換成話題矢量 的形式??梢詫跉v史信息的話題矢量和基于較高等級搜索關(guān)鍵字的話 題矢量進(jìn)行比較,從而獲得具有與基于歷史信息來生成的話題矢量相似的 矢量的較高等級搜索關(guān)鍵字。
搜索關(guān)鍵字列表獲取單元501將從搜索服務(wù)器14獲得的搜索關(guān)鍵字 列表發(fā)送到關(guān)鍵字選擇單元503。搜索關(guān)鍵字列表獲取單元501可以將所 獲得的搜索關(guān)鍵字列表存儲在存儲單元267中。
關(guān)鍵字選擇單元503基于第一信息處理裝置20A的偏好來從搜索關(guān)鍵 字列表獲取單元501已經(jīng)從搜索服務(wù)器14獲得的搜索關(guān)鍵字列表中選擇 關(guān)鍵字??梢匀缦碌貓?zhí)行關(guān)鍵字的選擇。關(guān)鍵字檢測單元255所檢測到的 關(guān)鍵字的歷史信息被使用PLSA等來轉(zhuǎn)換成具有預(yù)定維度的話題矢量的形 式。類似地,所獲得的關(guān)鍵字可以被使用PLSA等來轉(zhuǎn)換成話題矢量的形 式??梢詫跉v史信息的話題矢量和基于所獲得的關(guān)鍵字列表的話題矢 量進(jìn)行比較,從而選擇具有與基于歷史信息來生成的話題矢量相似的矢量 的搜索關(guān)鍵字。當(dāng)可以從第二信息處理裝置20B (語音聊天的對應(yīng)方)獲得語音聊天 的歷史信息或者所識別關(guān)鍵字的歷史信息時,可以在執(zhí)行對從第二信息處
理裝置20B獲得的歷史信息和存儲在第一信息處理裝置20A中的歷史信息 的匹配處理的同時執(zhí)行關(guān)鍵字的選擇。在這種情況下,兩種歷史信息的匹 配可以取兩種歷史信息的并集(union)、合成(integration)或者XOR。 可替代地,可以針對第一或第二信息處理裝置20A或20B的用戶的偏好來 統(tǒng)一匹配。當(dāng)向所獲得的關(guān)鍵字添加稍后將描述的識別權(quán)重信息時,可以 使用識別權(quán)重的最大值、最小值或平均值來作為新的識別權(quán)重信息。
關(guān)鍵字選擇單元503可以從搜索關(guān)鍵字列表獲取單元501已經(jīng)從搜索 服務(wù)器14獲得的搜索關(guān)鍵字列表中刪除不適合登記在可變字字典中的 字。這里,不適合登記在可變字字典中的字可以包括(1)通用字
(general word) ; (2)從常識的角度來看不適合的字;以及(3)話語識 別難以識別的字,例如,僅具有一個或兩個音素的字。
在從搜索服務(wù)器14獲得的搜索關(guān)鍵字列表中選擇關(guān)鍵字之后,關(guān)鍵 字選擇單元503將所選擇的關(guān)鍵字發(fā)送給次關(guān)鍵字獲取單元505和關(guān)鍵字 信息添加單元507,并將所選擇的關(guān)鍵字存儲在可變字字典中,該可變字 字典被存儲在識別字字典存儲單元401中。關(guān)鍵字選擇單元503可以將所 選擇的關(guān)鍵字存儲在存儲單元267中。
次關(guān)鍵字獲取單元505使用搜索服務(wù)器14來搜索關(guān)鍵字選擇單元503 所選擇的關(guān)鍵字,以獲得與關(guān)鍵字選擇單元503所選擇的關(guān)鍵字相關(guān)的次 關(guān)鍵字。當(dāng)搜索服務(wù)器14搜索得到一個關(guān)鍵字時,作為搜索結(jié)果將獲得 多個文檔。次關(guān)鍵字獲取單元505使用諸如術(shù)語頻率-逆文檔頻率
(TFIDF, term frequency-inverted document frequency)之類的力口權(quán)方法來 從所獲得的多個文檔中獲取次關(guān)鍵字。通過搜索服務(wù)器14從搜索結(jié)果中 獲取次字的方法并不限于上述方法,而可以使用所有已知方法。例如,如 果字"廿、乂力一 日本代表(日本足球隊(duì)隊(duì)員)"被作為關(guān)鍵字從關(guān)鍵字選 擇單元503發(fā)送,則次關(guān)鍵字獲取單元505使用搜索服務(wù)器14利用關(guān)鍵字
"日本足球隊(duì)隊(duì)員"來執(zhí)行搜索,以從通過搜索所獲得的文檔中獲得諸如
"才、〉厶(Osim)"或者"中田(Nakata)"之類的關(guān)鍵字。在從搜索服務(wù)器14獲取次關(guān)鍵字完成之后,次關(guān)鍵字獲取單元505 將所獲得的次關(guān)鍵字以與在搜索時使用的關(guān)鍵字相關(guān)聯(lián)的方式來存儲在識
別字字典存儲單元401中的可變字字典中。次關(guān)鍵字獲取單元505將所獲 得的次關(guān)鍵字發(fā)送到稍后將描述的關(guān)鍵字信息添加單元507。順便提及, 次關(guān)鍵字獲取單元505可以將所獲得的次關(guān)鍵字存儲在存儲單元267中。
關(guān)鍵字信息添加單元507向關(guān)鍵字選擇單元503所選擇的關(guān)鍵字添加 關(guān)鍵字信息并將所選擇的關(guān)鍵字和關(guān)鍵字信息以關(guān)聯(lián)方式存儲在可變字字 典中,其中,關(guān)鍵字信息包括在計(jì)算語言分?jǐn)?shù)時使用的識別權(quán)重信息以及 話語的一部分或者關(guān)鍵字的類型。
可以向與關(guān)鍵字相關(guān)聯(lián)的次關(guān)鍵字添加關(guān)鍵字信息。
識別權(quán)重信息是描述了識別權(quán)重(在計(jì)算語言分?jǐn)?shù)時使用的校正系數(shù) (權(quán)重因子))的信息,語言分?jǐn)?shù)的校正值隨著識別權(quán)重的值的增大而增 大,因而具有較大識別權(quán)重的關(guān)鍵字很可能會被用作識別結(jié)果。例如,識 別權(quán)重為10的關(guān)鍵字被話語識別的概率將是識別權(quán)重為1的關(guān)鍵字 (即,未經(jīng)加權(quán)的關(guān)鍵字)的十倍。
關(guān)于識別權(quán)重的確定,可以使用從搜索服務(wù)器14獲得的搜索關(guān)鍵字 列表的等級信息或者關(guān)鍵字在話語識別的結(jié)果的輸出中的出現(xiàn)頻率。由于 搜索關(guān)鍵字列表是在搜索服務(wù)器14中被置于較高等級上的搜索關(guān)鍵字的 列表,所以可以按在搜索時關(guān)鍵字的出現(xiàn)頻率的遞減順序來向它們分配等 級;按等級順序來確定預(yù)定的識別權(quán)重。具體而言,按在搜索時關(guān)鍵字的 出現(xiàn)頻率的遞減順序來向它們分配預(yù)定系數(shù),并且將歸一化后的關(guān)鍵字頻 率乘以所分配的系數(shù),從而得到識別權(quán)重。
關(guān)于識別權(quán)重的確定,可以使用關(guān)于第一信息處理裝置20A的用戶是 否已經(jīng)使用搜索服務(wù)器14來對作為話語識別的結(jié)果而獲得的關(guān)鍵字執(zhí)行 搜索的信息或者第一信息處理裝置20A的用戶的偏好。
可以使用在設(shè)在因特網(wǎng)上的公告牌或網(wǎng)站中的描述內(nèi)容或者使用形態(tài) 分析工具來添加屬性信息,該屬性信息是關(guān)于話語的各個部分或者關(guān)鍵字 的類型的信息??商娲兀梢赃m當(dāng)?shù)厥褂靡蛱鼐W(wǎng)上可以得到的百科全 書、維基百科或者日語字典。關(guān)于搜索關(guān)鍵字列表和次關(guān)鍵字的獲取以及關(guān)鍵字信息的添加,取代 搜索服務(wù)器14可以使用存儲在經(jīng)由通信網(wǎng)絡(luò)12來連接的服務(wù)器上的辭
典、本體(ontology)數(shù)據(jù)庫、百科全書、日語字典、或者形態(tài)分析工
具。除了辭典、本體數(shù)據(jù)庫、百科全書、日語字典和形態(tài)分析工具之外,
還可以使用搜索服務(wù)器14。
<識別字字典生成/更新處理〉
接下來,將參考圖20來詳細(xì)描述根據(jù)本實(shí)施例的識別字字典生成單 元的操作。圖20是示出根據(jù)第一實(shí)施例的識別字字典生成/更新處理的示 意圖。
首先,識別字字典生成單元269的搜索關(guān)鍵字列表獲取單元501基于 用戶的偏好來從搜索服務(wù)器14獲得記載了較高等級的搜索關(guān)鍵字的搜索 關(guān)鍵字列表。如圖20所示,在搜索關(guān)鍵字列表中,記載了 力一日 本代表(日本足球隊(duì)隊(duì)員)"、"7—》卜-《一7求一》夕,-〉7夕(世 界棒球經(jīng)典賽事)"、"王監(jiān)督(王教練)"、"-一3 (濟(jì)科)"、 "歌詞(歌詞)"、"27"、"于< ,$ ^ (提拉米蘇)"、"萬座e' — f (曼扎海灘)"、"飲*會(下班后的聚會)"、"'〉二一卜(射 擊)"以及"卑猥(猥瑣)"。搜索關(guān)鍵字列表獲取單元501將所獲得的 關(guān)鍵字存儲在存儲單元267中,并將它們發(fā)送到識別字字典生成單元269 的關(guān)鍵字選擇單元503。
關(guān)鍵字選擇單元503通過參考發(fā)送而來的搜索關(guān)鍵字列表來刪除不適 于登記的字。在上述示例中,諸如"飲*會(下班后的聚會)"、 一卜(射擊)"、"歌詞(歌詞)"和"27"之類的通用字以及諸如"卑 猥(猥瑣)"之類的從常識角度來看并不合適的字被從搜索關(guān)鍵字列表中 刪除。關(guān)鍵字選擇單元503額外地在可變字字典中描述了這樣的字被刪除 了的搜索關(guān)鍵字列表。關(guān)于在可變字字典中的額外描述,關(guān)鍵字選擇單元 503還可以添加關(guān)于諸如音素序列或者副本之類的項(xiàng)目以及圖20所示的項(xiàng) 目的描述。
隨后,次關(guān)鍵字獲取單元505獲得這樣的在可變字字典中得到額外描 述的關(guān)鍵字,并使用搜索服務(wù)器14等來獲得與所獲得的關(guān)鍵字相關(guān)的次關(guān)鍵字。例如,如圖20所示,作為搜索服務(wù)器14基于關(guān)鍵字力一 日本代表(日本足球隊(duì)隊(duì)員)"來進(jìn)行搜索的結(jié)果,獲得了次關(guān)鍵字"才
少厶(Osim)"、"中田(Nakata)"、"巻(Maki)"禾Q " V—^ (Zico)"。這些次關(guān)鍵字被以與關(guān)鍵字"寸7力一日本代表(日本足球 隊(duì)隊(duì)員)"相關(guān)聯(lián)的方式來額外地記載在可變字字典中。類似地,其它關(guān) 鍵字的次關(guān)鍵字可以被獲得,并且按與它們相關(guān)聯(lián)的方式來記載在可變字 字典中。
接下來,關(guān)鍵字信息添加單元507按在搜索服務(wù)器14中的搜索關(guān)鍵 字的搜索等級的遞減順序來向刪除了不必要的字的搜索關(guān)鍵字分配預(yù)定系 數(shù)。例如,關(guān)鍵字信息添加單元507按在搜索關(guān)鍵字列表中的關(guān)鍵字的等 級的遞減順序來向關(guān)鍵字分配系數(shù)10、 9、 8、等,并將所分配的系數(shù)乘以 一個值(該值是將各個關(guān)鍵字的頻率除以正態(tài)期望值而得到的),從而計(jì) 算得到識別權(quán)重。這樣獲得的識別權(quán)重例如可以被乘以S型函數(shù)(sigmoid ftmction)。關(guān)鍵字信息添加單元507將按上述方式來獲得的識別權(quán)重信息 添加到各個關(guān)鍵字,并額外地將它們記載在可變字字典中。
識別權(quán)重信息的計(jì)算方法僅僅是用于說明目的的。根據(jù)本實(shí)施例的識 別權(quán)重信息的計(jì)算方法并不限于上述方法,并且在計(jì)算識別權(quán)重信息時可 以使用除了上述方法之外的其它方法。
如圖20所示,在固定字字典中,預(yù)先登記了諸如"食人3 (吃)" "飲tr (喝)"、"匕7卜(擊打)"、")二一卜(射擊)"、"選手
(選手)"和"飲*會(下班后的聚會)"之類的日常談話中通常使用的 字。預(yù)先登記在固定字字典中的這些字是如上所述的通用字,并且基于偏 好極有可能不被話語識別,因此,針對這些字,"l"被登記為識別權(quán)重
"f曰息。
關(guān)鍵字信息添加單元507從使用形態(tài)分析工具來獲得的或者可以從搜 索服務(wù)器14上的公告牌得到的信息中獲取屬性信息(例如,話語的一部 分或者各個字的類型),從而將它們額外地記載在可變字字典中。例如, 將"名詞運(yùn)動"作為屬性信息添加到關(guān)鍵字"廿'7力一日本代表(曰本 足球隊(duì)隊(duì)員)",如圖20所示。通過執(zhí)行上述處理,識別字字典生成單元269可以按需來執(zhí)行可變字
字典的生成和更新處理。當(dāng)本實(shí)施例的第一信息處理裝置20A第一次被啟
動時,可能存在沒有信息或數(shù)據(jù)被記載在可變字字典中的情況。出于這個
原因,識別字字典生成單元269根據(jù)上述方法來執(zhí)行可變字字典的生成。 可變字字典的更新可以按任意方式來執(zhí)行。例如,可變字字典的更新可以 周期性地每隔預(yù)定時間段地執(zhí)行,或者可以根據(jù)來自第一信息處理裝置 20A的用戶的更新命令來執(zhí)行。
關(guān)于可變字字典的更新,當(dāng)作為次關(guān)鍵字來記錄的一些字被高頻度地 話語識別時,被高頻度地話語識別出的這些次關(guān)鍵字可以被作為關(guān)鍵字重 新存儲在可變字字典中。
當(dāng)執(zhí)行話語識別處理時,匹配單元305基于存儲在識別數(shù)據(jù)庫309的 語言模型存儲單元405中的統(tǒng)計(jì)語言模型或者語法模型、使用記載在各種 字字典中的內(nèi)容來執(zhí)行語言模型的計(jì)算。當(dāng)計(jì)算存儲在可變字字典中的字 的語言分?jǐn)?shù)時,匹配單元305使用常用方法基于語言模型來計(jì)算語言分 數(shù),并將計(jì)算得到的語言分?jǐn)?shù)乘以添加給關(guān)鍵字的識別權(quán)重,從而獲得在 話語識別時實(shí)際使用的語言分?jǐn)?shù)。由于向存儲在可變字字典中的字添加了 大于或等于1的識別權(quán)重,如圖20所示,所以為這些字計(jì)算得到的語言 分?jǐn)?shù)相對地要大于存儲在常用字典或固定字字典中的字的語言分?jǐn)?shù)。出于 這個原因,在存儲在可變字字典中的字中,經(jīng)常出現(xiàn)在最近的話題中的特 定字被以高概率識別出。
在上述方法中,使用常用方法來計(jì)算得到的語言分?jǐn)?shù)被乘以識別權(quán) 重,因此,作為計(jì)算結(jié)果而得到的語言分?jǐn)?shù)在某種情況下可能等于或大于 1。但是,在話語識別處理中,各個關(guān)鍵字就語言分?jǐn)?shù)而言的相對等級比 語言分?jǐn)?shù)的絕對值更重要,因此,語言分?jǐn)?shù)可以具有等于或大于1的值。
如圖21A所示,可以向執(zhí)行語音聊天的第一和第二信息處理裝置20A 和20B兩者都提供識別字字典生成單元269。如圖21B所示,可以不向執(zhí) 行語音聊天的第一和第二信息處理裝置20A和20B提供識別字字典生成單 元269,而在服務(wù)器18中提供識別字字典生成單元269,服務(wù)器18對第 一和第二信息處理裝置20A和20B之間的通信進(jìn)行中繼。作為圖21B所示的服務(wù)器,當(dāng)在服務(wù)器18中提供識別字字典生成單元269時,圖21B 所示的服務(wù)器18充當(dāng)從搜索服務(wù)器14獲取搜索關(guān)鍵字列表、使用上述方 法從所獲得的搜索關(guān)鍵字列表中選擇關(guān)鍵字、并向所選擇的關(guān)鍵字添加上 述權(quán)重信息的識別字字典生成設(shè)備。
服務(wù)器18中的識別字字典生成單元183基于從語音談話控制單元181 獲得的語音談話的內(nèi)容來從搜索服務(wù)器14獲取搜索關(guān)鍵字列表,并根據(jù) 上述處理方法、使用所獲得的搜索關(guān)鍵字列表來執(zhí)行字的選擇和識別權(quán)重 信息的添加,從而創(chuàng)建可變字字典。之后,服務(wù)器18中的識別字字典生 成單元183將所創(chuàng)建的可變字字典發(fā)送到第一和第二信息處理裝置20A和 20B。這些信息處理裝置將發(fā)送而來的可變字字典存儲在各個識別數(shù)據(jù)庫 309中,因此,在話語識別處理中可以使用可變字字典。順便提及,第一 和第二信息處理裝置20A和20B可以從服務(wù)器18獲取添加了識別權(quán)重信 息的字的列表,并基于所獲得的字列表來創(chuàng)建可變字字典。
在圖21A和21B所示的第一和第二信息處理裝置20A和20B中,僅 示出了各個信息處理裝置的一些處理單元。不言而喻,除了所示出的處理 單元之外,這些信息處理裝置還包括圖3到5所示的處理單元。
根據(jù)上述本實(shí)施例的語音聊天系統(tǒng),在生成字典時搜索服務(wù)器14的 數(shù)據(jù)庫被用于話語識別。因此,可以使用在最近的話題中經(jīng)常出現(xiàn)的關(guān)鍵 字作為話語識別的語言知識。另外,與話題的關(guān)鍵字相關(guān)的字被使用銘記 (treasure)等來設(shè)置成具有高出現(xiàn)概率,因此,可以使用關(guān)聯(lián)關(guān)鍵字來執(zhí) 行話語識別。在這種情況下,在根據(jù)本實(shí)施例的語音聊天系統(tǒng)中,優(yōu)先識 別與用戶可能交談的最近的話題相關(guān)的詞匯,從而提高了識別率。作為識 別結(jié)果來顯示的信息很可能是關(guān)于最近的話題的信息,即,用戶感興趣的 信息。因此,即使被顯示的信息不知何故而與用戶的談話不同,也可以提 供語音聊天的用戶可以擴(kuò)寬談話的優(yōu)點(diǎn)。 (第二實(shí)施例)
以下將詳細(xì)描述根據(jù)本發(fā)明第二實(shí)施例的關(guān)鍵字檢測系統(tǒng)。
圖22是示出根據(jù)本發(fā)明第二實(shí)施例的關(guān)鍵字檢測系統(tǒng)的配置的示意圖。如圖22所示,根據(jù)本實(shí)施例的關(guān)鍵字檢測系統(tǒng)ll包括通信網(wǎng)絡(luò)12、
搜索服務(wù)器14、和信息處理裝置20A和20B (下文中,有時候統(tǒng)稱為信息 處理裝置20)。信息處理裝置20A與家庭網(wǎng)絡(luò)19內(nèi)的外部顯示設(shè)備70相 連接。信息處理裝置20A和20B以及外部顯示設(shè)備70可以接收從廣播站 80發(fā)送而來的廣播信息。
通信網(wǎng)絡(luò)12和搜索服務(wù)器14具有與根據(jù)第一實(shí)施例的通信網(wǎng)絡(luò)12和 搜索服務(wù)器14相同的配置,并提供基本上相同的效果,并且將省略對它 們的詳細(xì)描述。
信息處理裝置20A以語音方式與經(jīng)由通信網(wǎng)絡(luò)12連接到其的另一個 信息處理裝置20B執(zhí)行聊天(語音聊天)。信息處理裝置20A和20B可 以經(jīng)由通信網(wǎng)絡(luò)12來請求經(jīng)由通信網(wǎng)絡(luò)12連接到其的搜索服務(wù)器14執(zhí)行 數(shù)據(jù)庫的參考或信息的搜索。執(zhí)行語言聊天的另一個信息處理裝置20B可 以不經(jīng)由通信網(wǎng)絡(luò)12 (如圖所示)來與信息處理裝置20B相連接??商娲?地,另一個信息處理裝置20B可以直接而不是經(jīng)由通信網(wǎng)絡(luò)12來連接到 信息處理裝置20A,即,連接到USB端口、諸如i丄ink之類的IEEE 1394 端口、 SCSI端口、 RS-232C端口等。
信息處理裝置20A與家庭網(wǎng)絡(luò)19內(nèi)的稍后將描述的外部顯示設(shè)備70 相連接,因此,可以在信息處理裝置20A和外部顯示設(shè)備70之間進(jìn)行各 種數(shù)據(jù)的通信。信息處理裝置20A和外部顯示設(shè)備70之間的連接可以經(jīng) 由諸如HDMI-CEC (高清晰多媒體接口-消費(fèi)電子控件)之類的連接端口 來執(zhí)行。信息處理裝置20A可以使用在其中設(shè)置的接收功能來接收包含從 稍后將描述的廣播站80發(fā)送而來的廣播信息的廣播電波。
在如圖所示的示例中,信息處理裝置20是臺式PC,但是,在本實(shí)施 例中,信息處理裝置20可以是筆記本式PC。在本實(shí)施例中,信息處理裝 置20并不限于上述示例,而例如可以由電視機(jī)機(jī)頂盒、諸如家用游戲機(jī) 之類的信息設(shè)備、移動電話、PDA等來構(gòu)成,只要是能夠具有經(jīng)由網(wǎng)絡(luò)來 通信的功能的設(shè)備即可。另外或者是可替代地,信息處理裝置20可以是 由擁有者攜帶的便攜式設(shè)備,例如,便攜式游戲機(jī)、PHS、或者便攜式視 頻/音頻播放機(jī)。外部顯示設(shè)備70是顯示單元,例如,CRT顯示單元、液晶顯示單
元、等離子顯示面板單元、或者電致發(fā)光(EL)顯示單元。外部顯示設(shè)備 70接收包含從稍后將描述的廣播站80發(fā)送而來的廣播信息的廣播電波, 并在顯示單元的顯示區(qū)域上顯示廣播信息的內(nèi)容。這里,從廣播站發(fā)送而 來的廣播信息指的是通過諸如單波段數(shù)字廣播或者12波段數(shù)字廣播(以 下稱為全波段數(shù)字廣播)之類的地面數(shù)字廣播、有線廣播、或者經(jīng)由網(wǎng)絡(luò) 的因特網(wǎng)廣播來提供的諸如廣播文本信息、廣播音頻信息、或者視頻信息 之類的數(shù)據(jù)。包含廣播信息的廣播電波指的是諸如單波段數(shù)字廣播或者全 波段數(shù)字廣播之類的地面數(shù)字廣播的電波。外部顯示設(shè)備70可以經(jīng)由諸 如HDMI-CEC之類的連接端口將所接收的廣播信息發(fā)送到信息處理裝置 20。外部顯示設(shè)備70可以接收從信息處理裝置20發(fā)送而來的各種數(shù)據(jù), 并顯示與該數(shù)據(jù)相對應(yīng)的信息。
以下,將通過地面數(shù)字廣播的示例來描述第二實(shí)施例。
廣播站80發(fā)送包含廣播信息的廣播電波,其中,廣播信息包括以下 數(shù)據(jù)..廣播文本信息、廣播音頻信息、和視頻信息。外部顯示設(shè)備70接 收從廣播站80發(fā)送而來的廣播電波,并顯示字幕信息或者輸出基于包含 在廣播電波中的廣播文本信息的聲音。信息處理裝置20可以接收從廣播 站80發(fā)送而來的廣播電波,以在各種處理中使用該廣播電波的內(nèi)容。 (信息處理裝置20的配置)
接下來,將詳細(xì)描述根據(jù)本實(shí)施例的信息處理裝置20的配置。根據(jù) 本實(shí)施例的信息處理裝置20的硬件配置基本上與根據(jù)第一實(shí)施例的硬件 配置相同,并且將省略對它的詳細(xì)描述。
圖23是用于說明根據(jù)第二實(shí)施例的信息處理裝置20的配置的框圖。 如圖23所示,根據(jù)本實(shí)施例的信息處理裝置20包括關(guān)鍵字管理單元 257、顯示單元261、通信單元265、存儲單元267、識別字字典生成單元 269、廣播文本信息接收單元271、關(guān)鍵字檢測單元273、以及外部顯示設(shè) 備連接控制單元275。
關(guān)鍵字管理單元257管理將從與稍后將描述的廣播文本信息接收單元 271所接收的廣播文本信息相對應(yīng)的字序列中提取出來的關(guān)鍵字。關(guān)鍵字管理單元257將搜索歷史信息存儲在存儲單元267中,并基于包含在該歷
史信息中的搜索關(guān)鍵字或者所檢測到的關(guān)鍵字來選擇被管理的關(guān)鍵字,其
中,歷史信息是信息處理裝置20的用戶使用搜索服務(wù)器14來執(zhí)行搜索的 歷史。關(guān)鍵字管理單元257所管理的關(guān)鍵字由稍后將描述的關(guān)鍵字檢測單 元273自由參考。關(guān)鍵字管理單元257可以將所管理的關(guān)鍵字提供給稍后 將描述的識別字字典生成單元269,并且識別字字典生成單元269可以使 用關(guān)鍵字管理單元257所提供的關(guān)鍵字和從搜索服務(wù)器14獲得的搜索關(guān) 鍵字來執(zhí)行識別字字典的生成或更新。
顯示單元261通過諸如信息處理裝置20的顯示器之類的顯示設(shè)備向 信息處理裝置20的用戶顯示從關(guān)鍵字檢測單元273發(fā)送而來的關(guān)鍵字。 顯示單元261可以被配置成顯示與廣播文本信息接收單元271所接收的廣
播文本信息相對應(yīng)的字序列自身。
通信單元265是安裝在信息處理裝置20中的通信設(shè)備。通信單元265 經(jīng)由通信網(wǎng)絡(luò)12對在信息處理裝置20 (具體而言是關(guān)鍵字管理單元257 和識別字字典生成單元269)與信息處理裝置20的外部設(shè)備(具體而言是 搜索服務(wù)器14)或者另一個信息處理裝置20之間的信息通信進(jìn)行中繼。 此外,通信單元265可以與直接而非經(jīng)由通信網(wǎng)絡(luò)12來連接到信息處理 裝置20的另一個信息處理裝置進(jìn)行信息通信。
存儲單元267例如是安裝在信息處理裝置20中的存儲設(shè)備,并且在 其中存儲諸如由關(guān)鍵字檢測單元273檢測到的關(guān)鍵字或者由關(guān)鍵字管理單 元257管理的關(guān)鍵字信息之類的數(shù)據(jù)。除了這些數(shù)據(jù)之外,存儲單元267 可以在其中存儲各種數(shù)據(jù)庫或者由廣播文本信息接收單元271接收的廣播 文本信息。存儲單元267可以適當(dāng)?shù)卦谄渲写鎯υ谛畔⑻幚硌b置20執(zhí)行 處理時需要存儲的各種參數(shù)以及該處理的進(jìn)程信息。當(dāng)關(guān)鍵字管理單元 257、顯示單元261、通信單元265、識別字字典生成單元269、廣播文本 信息接收單元271、關(guān)鍵字檢測單元273、外部顯示設(shè)備連接控制單元275 等執(zhí)行對存儲單元267的讀寫時,可以自由地訪問存儲單元267。
識別字字典生成單元269從搜索服務(wù)器14獲得搜索關(guān)鍵字列表,并 從所獲得的搜索關(guān)鍵字列表中僅選擇適當(dāng)?shù)年P(guān)鍵字,從而生成在話語識別
51中使用的識別字字典。識別字字典生成單元269從所獲得的搜索關(guān)鍵字列 表中選擇關(guān)鍵字,并且可以向所選擇的關(guān)鍵字添加關(guān)鍵字的屬性信息或者 相關(guān)的次關(guān)鍵字或者添加在話語識別中使用的識別權(quán)重。另外,識別字字
典生成單元269可以使用從關(guān)鍵字管理單元257發(fā)送而來的關(guān)鍵字或者關(guān) 鍵字檢測單元273已經(jīng)從稍后將描述的廣播文本信息接收單元271所接收 的廣播文本信息中檢測到的關(guān)鍵字來執(zhí)行識別字字典的生成或更新。根據(jù) 本實(shí)施例的識別字字典生成單元269的詳細(xì)配置或者識別字字典的生成方 法基本上與根據(jù)第一實(shí)施例的識別字字典生成單元269的配置或者生成方 法相同,并且將省略對它們的詳細(xì)描述。
廣播文本信息接收單元271從外部顯示設(shè)備70獲得關(guān)于外部顯示設(shè) 備70當(dāng)前通過其來進(jìn)行接收的廣播頻道的接收頻道信息。這里,接收頻 道信息指的是表示下述廣播頻道的信息,其中,外部顯示設(shè)備1070當(dāng)前 正通過該廣播頻道來進(jìn)行接收。廣播文本信息接收單元271可以通過從外 部顯示設(shè)備70獲取接收頻道信息來同步廣播文本信息接收單元271的接 收廣播頻道和外部顯示設(shè)備70的接收廣播頻道。
廣播文本信息接收單元271基于所獲得的接收頻道信息來直接從廣播 站80接收與外部顯示設(shè)備70的接收廣播頻道相對應(yīng)的廣播電波。此時, 廣播文本信息接收單元271可以被配置成直接接收從廣播站80發(fā)送而來 的廣播電波中的單波段廣播電波,并從所接收的電波中獲取文本信息。廣 播文本信息接收單元271可以被配置成直接接收從廣播站80發(fā)送而來的 全波段廣播電波。
廣播文本信息接收單元271可以被配置成基于所獲得的接收頻道信息 來接收由外部顯示設(shè)備70接收的并從外部顯示設(shè)備70發(fā)送到信息處理裝 置20的廣播文本信息。
廣播文本信息接收單元271將所接收的廣播文本信息輸出到稍后將描 述的關(guān)鍵字檢測單元273。廣播文本信息接收單元271可以將所接收的廣 播文本信息記錄在存儲單元267中。
關(guān)鍵字檢測單元273判斷在與從廣播文本信息接收單元271發(fā)送而來 的廣播文本信息相對應(yīng)的字序列中是否存在由關(guān)鍵字管理單元257管理的關(guān)鍵字,并且如果存在該關(guān)鍵字就將與關(guān)鍵字相對應(yīng)的字作為關(guān)鍵字來輸 出。如果在一個字序列中存在多個關(guān)鍵字,則關(guān)鍵字檢測單元273可以被
配置成檢測所有的相應(yīng)關(guān)鍵字。關(guān)鍵字檢測單元273可以被配置成將從字 序列中檢測得到的關(guān)鍵字發(fā)送到顯示單元261。
例如,當(dāng)識別結(jié)果"最近的結(jié)構(gòu)改革已凸現(xiàn)"被從廣播文本信息接收 單元271發(fā)送,并且關(guān)鍵字"結(jié)構(gòu)改革"存在于由關(guān)鍵字管理單元257管 理的關(guān)鍵字中時,關(guān)鍵字檢測單元273輸出"結(jié)構(gòu)改革"作為關(guān)鍵字。
外部顯示設(shè)備連接控制單元275執(zhí)行信息處理裝置20和連接到信息 處理裝置20的外部顯示設(shè)備70之間的連接控制。外部顯示設(shè)備連接控制 單元275將關(guān)鍵字檢測單元273所檢測到的關(guān)鍵字等發(fā)送到外部顯示設(shè)備 70。在從外部顯示設(shè)備70得到關(guān)于外部顯示設(shè)備70的用戶已經(jīng)參考或者 選擇特定關(guān)鍵字或者與關(guān)鍵字相關(guān)的文章的通知時,外部顯示設(shè)備連接控 制單元275可以將參考?xì)v史或者選擇歷史記錄在存儲單元267中,并經(jīng)由 通信單元265來通知搜索服務(wù)器14。搜索服務(wù)器14可以在在搜索服務(wù)器 14內(nèi)執(zhí)行的各種處理中使用該參考?xì)v史或者選擇歷史。順便提及,當(dāng)向外 部顯示設(shè)備70發(fā)送與各種信息相對應(yīng)的數(shù)據(jù)時,外部顯示設(shè)備連接控制 單元275可以將有待發(fā)送的數(shù)據(jù)的格式轉(zhuǎn)換成可以由外部顯示設(shè)備70顯 示的格式。
在上文中,已經(jīng)描述了根據(jù)本實(shí)施例的信息處理裝置20的功能的示 例。上述組件可以使用通用元件或電路來構(gòu)成,或者可以由專用于各個組 件的功能的專用組件來構(gòu)成。這些組件的全部功能可以用CPU等來執(zhí) 行。因此,可以根據(jù)實(shí)施本實(shí)施例時的技術(shù)水平來適當(dāng)?shù)匦薷挠布渲谩?br>
根據(jù)本實(shí)施例的信息處理裝置20還可以包括根據(jù)第一實(shí)施例的信息 處理裝置20的話語識別單元或者語音談話控制單元。信息處理裝置20還 可以包括用于存儲記錄在搜索服務(wù)器14中的搜索關(guān)鍵字列表的內(nèi)容的數(shù) 據(jù)庫存儲單元。在這種情況下,搜索關(guān)鍵字列表的內(nèi)容可以存儲在設(shè)在信 息處理裝置20中的數(shù)據(jù)庫存儲單元中。因此,可以縮短信息處理裝置20 訪問搜索服務(wù)器14所需的時間。另外,通過周期性地更新數(shù)據(jù)庫存儲單 元的內(nèi)容,信息處理裝置20可以獲取記錄在搜索服務(wù)器14中的最近的搜索關(guān)鍵字列表的內(nèi)容。
(外部顯示設(shè)備70的配置)
接下來,將參考圖24和25來詳細(xì)描述根據(jù)本實(shí)施例的外部顯示設(shè)備 70的配置。圖24是用于說明根據(jù)第二實(shí)施例的外部顯示設(shè)備的配置的框 圖。圖25是示出根據(jù)第二實(shí)施例的外部顯示設(shè)備的信息顯示屏幕的示意 圖。
根據(jù)本實(shí)施例的外部顯示設(shè)備70的硬件包括諸如CRT、液晶顯示面 板、等離子顯示面板、或者EL面板之類的顯示元件,以及由CPU、 ROM 和RAM構(gòu)成且在控制顯示元件的驅(qū)動時使用的驅(qū)動控制電路。
如圖24所示,本實(shí)施例的外部顯示設(shè)備70包括廣播接收單元701、 連接端口控制單元703、廣播信息顯示控制單元705、關(guān)鍵字信息顯示控 制單元707以及顯示單元709。
廣播接收單元701接收從廣播站80發(fā)送而來的廣播電波并將廣播電 波中包含的諸如廣播文本信息、廣播音頻信息、或者視頻信息之類的數(shù)據(jù) 輸出到連接端口控制單元703和廣播信息顯示控制單元705 (稍后將描 述)。廣播接收單元701可以被配置成將所接收的信息記錄在設(shè)在外部顯 示設(shè)備70中的存儲單元(未示出)中,或者記錄在與外部顯示設(shè)備70相 連接的外部附接的存儲單元(未示出)中。
連接端口控制單元703控制能夠與信息處理裝置20進(jìn)行數(shù)字通信的 諸如HDMI-CEC之類的連接端口 。連接端口控制單元703將關(guān)于廣播接收 單元701正通過其來接收的廣播頻道的接收頻道信息經(jīng)由諸如MDMI-CEC 之類的連接端口來發(fā)送到信息處理裝置20。廣播接收單元701所接收的諸 如廣播文本信息、廣播音頻信息、以及視頻信息之類的數(shù)據(jù)可以經(jīng)由連接 端口控制單元703來輸出到信息處理裝置20。從信息處理裝置20發(fā)送而 來的各種數(shù)據(jù)被經(jīng)由連接端口控制單元703來輸入到外部顯示設(shè)備70。從 信息處理裝置20發(fā)送而來的各種數(shù)據(jù)被發(fā)送到稍后將描述的關(guān)鍵字信息 顯示控制單元707。
當(dāng)在稍后將描述的顯示單元709上顯示從廣播接收單元701發(fā)送而來 的廣播文本信息、廣播音頻信息和視頻信息時,廣播信息顯示控制單元705執(zhí)行顯示控制。
當(dāng)在稍后將描述的顯示單元709上顯示從信息處理裝置20發(fā)送而來 的關(guān)鍵字信息時,關(guān)鍵字信息顯示控制單元707執(zhí)行顯示控制。這里,從 信息處理裝置20發(fā)送而來的關(guān)鍵字信息指的是這樣的信息,該信息包括 由信息處理裝置20提取的關(guān)鍵字、對所提取的關(guān)鍵字的搜索結(jié)果、以及 與這些關(guān)鍵字相關(guān)的文章。在從顯示單元709接收到對關(guān)于外部顯示設(shè)備 70的用戶通過諸如鼠標(biāo)、鍵盤、或遙控器之類的輸入設(shè)備來選擇的在顯示 單元709上顯示的信息的詳細(xì)信息的獲取請求之后,關(guān)鍵字信息顯示控制 單元707將該詳細(xì)信息獲取請求經(jīng)由連接端口控制單元703來發(fā)送到信息 處理裝置20。
顯示單元709在外部顯示設(shè)備70的信息顯示屏幕上顯示由廣播信息 顯示控制單元705來進(jìn)行顯示控制的廣播文本信息、廣播音頻信息和視頻 信息,以及由關(guān)鍵字信息顯示控制單元707來進(jìn)行顯示控制的關(guān)鍵字信 息。
外部顯示設(shè)備70的信息顯示屏幕751通常包括圖像顯示區(qū)域753,廣 播文本信息、廣播音頻信息和視頻信息被顯示在圖像顯示區(qū)域753上。這 里,當(dāng)從'信息處理裝置20發(fā)送而來關(guān)鍵字信息時,信息顯示屏幕751的 顯示區(qū)域被分割以生成關(guān)鍵字信息顯示區(qū)域755,關(guān)鍵字信息被顯示在該 關(guān)鍵字信息顯示區(qū)域755上。圖像顯示區(qū)域753例如由廣播信息顯示控制 單元705來控制,并且關(guān)鍵字信息顯示區(qū)域755例如由關(guān)鍵字信息顯示控 制單元707來控制。
關(guān)鍵字信息顯示區(qū)域755的細(xì)節(jié)基本上與根據(jù)本發(fā)明第一實(shí)施例的信 息處理裝置的搜索結(jié)果顯示屏幕50相同,并且將省略對它的詳細(xì)描述。
在上文中,已經(jīng)描述了根據(jù)本發(fā)明的外部顯示設(shè)備70的功能的示 例。上述組件可以使用通用元件或電路來構(gòu)成,或者可以利用專用于各個 組件的功能的專用硬件來構(gòu)成。這些組件的全部功能可以利用CPU等來 執(zhí)行。因此,可以根據(jù)實(shí)施本實(shí)施例時的技術(shù)水平來適當(dāng)?shù)匦薷挠布?置。
(關(guān)鍵字檢測方法)接下來,將參考圖26來詳細(xì)描述由根據(jù)本實(shí)施例的信息處理裝置20
執(zhí)行的關(guān)鍵字檢測方法的示例。圖26是用于說明根據(jù)第二實(shí)施例的關(guān)鍵
字檢測方法的流程圖。
首先,信息處理裝置20的廣播文本信息接收單元271基于從外部顯 示設(shè)備70獲得的接收頻道信息來接收來自外部顯示設(shè)備70或者廣播站80 的廣播文本信息,從而獲得廣播字幕的字符串作為文本信息數(shù)據(jù)(步驟 S201)。廣播文本信息接收單元271將所獲得的文本信息數(shù)據(jù)輸出到關(guān)鍵 字檢測單元273。
接下來,關(guān)鍵字檢測單元273對發(fā)送而來的文本信息數(shù)據(jù)應(yīng)用形態(tài)分 析,以從字符串中提取字,并將所提取的字記錄在信息處理裝置20的存 儲器上(步驟S203)。
接下來,關(guān)鍵字檢測單元273使用關(guān)鍵字管理單元257的內(nèi)容來對所 提取的字進(jìn)行搜索(步驟S205)。
隨后,關(guān)鍵字檢測單元273判斷所提取的字是否存在于關(guān)鍵字管理單 元257中(步驟S207)。當(dāng)所提取的字存在于關(guān)鍵字管理單元257中時, 關(guān)鍵字檢測單元273將存在的所提取字記錄在存儲器上,作為廣播關(guān)鍵字 數(shù)據(jù)(步驟S209)。當(dāng)所提取的字并不存在于關(guān)鍵字管理單元257中時, 關(guān)鍵字檢測單元273執(zhí)行稍后將描述的步驟S211的處理。
接下來,關(guān)鍵字檢測單元273判斷所提取的、沒有在關(guān)鍵字管理單元 257中找到的字是否存在于存儲器上(步驟S211)。當(dāng)未找到的字存在于 存儲器上時,執(zhí)行步驟S205的處理。當(dāng)未找到的字并不存在于存儲器中 時,關(guān)鍵字檢測單元273輸出存在于存儲器上的廣播關(guān)鍵字?jǐn)?shù)據(jù),作為所 提取的關(guān)鍵字(步驟S213)。
通過使用上述方法,根據(jù)本實(shí)施例的信息處理裝置20可以從所接收 的廣播文本信息中提取關(guān)鍵字。
在根據(jù)本實(shí)施例的信息處理裝置20中,存在于關(guān)鍵字管理單元257 中的字(關(guān)鍵字)是被自動地從發(fā)送自廣播站的廣播文本信息中提取出 來。因此,可以向外部顯示設(shè)備70顯示所提取的關(guān)鍵字。通過使用這樣 的功能,使用信息處理裝置20或者外部顯示設(shè)備70來執(zhí)行諸如聊天之類的雙向通信的用戶可以使用所提取的關(guān)鍵字作為聊天的話題等。 (根據(jù)第二實(shí)施例的信息處理裝置的第一修改示例)
接下來,將參考圖27和28來詳細(xì)描述根據(jù)本實(shí)施例的信息處理裝置 20的第一修改示例。圖27是用于說明信息處理裝置20的第一修改示例的 配置的框圖。圖28是用于說明根據(jù)本修改示例的關(guān)鍵字檢測方法的流程 圖。根據(jù)本修改示例的信息處理裝置20的硬件配置基本上與本發(fā)明第二 實(shí)施例的硬件配置相同,并且將省略對它的詳細(xì)描述。
如圖27所示,根據(jù)本修改示例的信息處理裝置20包括話語識別單元 253、關(guān)鍵字檢測單元255、關(guān)鍵字管理單元257、顯示單元261、通信單 元265、存儲單元267、識別字字典生成單元269、廣播音頻信息接收單元 277、外部顯示設(shè)備連接控制單元275。
根據(jù)本修改示例的關(guān)鍵字管理單元257、顯示單元261、通信單元 265、存儲單元267和外部顯示設(shè)備連接控制單元275具有與根據(jù)第一實(shí) 施例的關(guān)鍵字管理單元257、顯示單元261、通信單元265、存儲單元 267、和外部顯示設(shè)備連接控制單元275基本相同的配置,并提供基本相 同的效果,并且將省略對它們的詳細(xì)描述。
話語識別單元253基于由稍后將描述的廣播音頻信息接收單元277接 收的廣播音頻信息來執(zhí)行話語識別。話語識別單元253生成與廣播音頻信 息相對應(yīng)的字序列作為話語識別的結(jié)果,并將所生成的字序列發(fā)送到稍后 將描述的關(guān)鍵字檢測單元255。話語識別單元253可以被配置成將所生成 的字序列發(fā)送給顯示單元261。話語識別單元253的詳細(xì)配置和話語識別 方法與根據(jù)本發(fā)明第一實(shí)施例的話語識別單元253的配置和話語識別方法 基本相同,并且將省略對它們的詳細(xì)描述。
關(guān)鍵字檢測單元255判斷在與從話語識別單元253發(fā)送而來的廣播音 頻信息相對應(yīng)的字序列中是否存在由關(guān)鍵字管理單元257管理的關(guān)鍵字, 并且如果存在該關(guān)鍵字,就將與該關(guān)鍵字相對應(yīng)的字作為關(guān)鍵字來輸出。 如果在一個字序列中存在多個關(guān)鍵字,則關(guān)鍵字檢測單元255可以被配置 成檢測所有的相應(yīng)關(guān)鍵字。關(guān)鍵字檢測單元255可以被配置成將從字序列 中檢測到的關(guān)鍵字發(fā)送到稍后將描述的顯示單元261。
57例如,當(dāng)識別結(jié)果"最近的結(jié)構(gòu)改革已凸現(xiàn)"被從話語識別單元253
發(fā)送時并且當(dāng)關(guān)鍵字"結(jié)構(gòu)改革"存在于關(guān)鍵字管理單元257所管理的關(guān) 鍵字中時,關(guān)鍵字檢測單元255輸出"結(jié)構(gòu)改革"作為關(guān)鍵字。
識別字字典生成單元269從搜索服務(wù)器14獲取搜索關(guān)鍵字列表等, 并從所獲得的搜索關(guān)鍵字列表中僅選擇合適的關(guān)鍵字,從而生成在話語識 別中使用的識別字字典。識別字字典生成單元269從所獲得的搜索關(guān)鍵字 列表中選擇關(guān)鍵字,并可以向所選擇的關(guān)鍵字添加關(guān)鍵字的屬性信息或者 相關(guān)的次關(guān)鍵字,或者添加在話語識別中使用的識別權(quán)重。另外,識別字 字典生成單元269可以使用從關(guān)鍵字管理單元257發(fā)送而來的關(guān)鍵字或者 關(guān)鍵字檢測單元255已經(jīng)從稍后將描述的廣播音頻信息接收單元277所接 收的廣播音頻信息中檢測得到的關(guān)鍵字來執(zhí)行識別字字典的生成或更新。 根據(jù)本實(shí)施例的識別字字典生成單元269的詳細(xì)配置或者識別字字典的生 成方法與根據(jù)第一實(shí)施例的識別字字典生成單元269的配置或者生成方法 基本相同,并且將省略對它們的詳細(xì)描述。
廣播音頻信息接收單元277從外部顯示設(shè)備70獲取關(guān)于外部顯示設(shè) 備當(dāng)前正通過其來接收的廣播頻道的接收頻道信息。廣播音頻信息接收單 元277可以通過從外部顯示設(shè)備70獲取接收頻道信息來同步廣播音頻信 息接收單元277的接收廣播頻道和外部顯示設(shè)備70的接收廣播頻道。
廣播音頻信息接收單元277基于所獲得的接收頻道信息來直接從廣播 站80接收與外部顯示設(shè)備70的接收廣播頻道相對應(yīng)的廣播電波。此時, 廣播音頻信息接收單元277可以被配置成直接接收從廣播站80發(fā)送而來 的廣播電波中的單波段廣播電波,并從所接收的電波中獲取音頻信息。廣 播音頻信息接收單元277可以被配置成直接接收從廣播站80發(fā)送而來的 全波段廣播電波。
廣播音頻信息接收單元277可以被配置成基于所獲得的接收頻道信息 來接收由外部顯示設(shè)備70接收的并且被從外部顯示設(shè)備70發(fā)送到信息處 理裝置20的廣播音頻信息。
廣播音頻信息接收單元277將所接收的廣播音頻信息輸出到話語識別 單元253。廣播音頻信息接收單元277可以將所接收的廣播音頻信息記錄在存儲單元267中。
在上文中,已經(jīng)描述了根據(jù)本修改示例的信息處理裝置20的功能的
示例。上述組件可以使用通用元件或電路來構(gòu)成,或者可以利用專用于各
個組件的功能的專用硬件來構(gòu)成。這些組件的全部功能可以利用CPU等
來執(zhí)行。因此,可以根據(jù)實(shí)施本實(shí)施例時的技術(shù)水平來適當(dāng)?shù)匦薷挠布?置。
根據(jù)本修改示例的信息處理裝置20還可以包括根據(jù)第一實(shí)施例的信 息處理裝置20的話語識別單元或者語音談話控制單元。信息處理裝置20 還可以包括用于存儲記錄在搜索服務(wù)器14中的搜索關(guān)鍵字列表的內(nèi)容的 數(shù)據(jù)庫存儲單元。在這種情況下,搜索關(guān)鍵字列表的內(nèi)容可以存儲在設(shè)在 信息處理裝置20中的數(shù)據(jù)庫存儲單元中。因此,可以縮短信息處理裝置 20訪問搜索服務(wù)器14所需的時間。另外,通過周期性地更新數(shù)據(jù)庫存儲 單元的內(nèi)容,信息處理裝置20可以獲取記錄在搜索服務(wù)器14中的最近的 搜索關(guān)鍵字列表的內(nèi)容。 (關(guān)鍵字檢測方法)
接下來,將參考圖28來詳細(xì)描述由根據(jù)本修改示例的信息處理裝置 20執(zhí)行的關(guān)鍵字檢測方法的示例。
首先,信息處理裝置20的廣播音頻信息接收單元277基于從外部顯 示設(shè)備70獲得的接收頻道信息來從外部顯示設(shè)備70或廣播站80接收廣播 音頻信息,并且話語識別單元253對該廣播音頻信息執(zhí)行話語識別,以確 定話語識別的結(jié)果(步驟S301)。話語識別單元253將所確定的話語識別 的結(jié)果輸出到關(guān)鍵字檢測單元255。
接下來,關(guān)鍵字檢測單元255對話語識別的結(jié)果應(yīng)用形態(tài)分析以從話 語識別的結(jié)果中提取字,并將所提取的字記錄在信息處理裝置20的存儲 器上(步驟S303)。
接下來,關(guān)鍵字檢測單元255使用關(guān)鍵字管理單元257的內(nèi)容來對所 提取的字進(jìn)行搜索(步驟S305)。
隨后,關(guān)鍵字檢測單元255判斷所提取的字是否存在于關(guān)鍵字管理單 元257中(步驟S307)。當(dāng)所提取的字存在于關(guān)鍵字管理單元257中時,關(guān)鍵字檢測單元255將存在的所提取字記錄在存儲器上,作為廣播關(guān)鍵字
數(shù)據(jù)(步驟S309)。當(dāng)所提取的字并不存在于關(guān)鍵字管理單元257中時, 關(guān)鍵字檢測單元255執(zhí)行稍后將描述的步驟S311的處理。
接下來,關(guān)鍵字檢測單元255判斷所提取的沒有在關(guān)鍵字管理單元 257中找到的字是否存在于存儲器上(步驟S311)。當(dāng)未找到的字存在于 存儲器上時,執(zhí)行步驟S305的處理。當(dāng)未找到的字并不存在于存儲器中 時,關(guān)鍵字檢測單元255將存在于存儲器上的廣播關(guān)鍵字?jǐn)?shù)據(jù)作為所提取 關(guān)鍵字來輸出(步驟S313)。
通過使用上述方法,根據(jù)本修改示例的信息處理裝置20可以從所接 收的廣播音頻信息中提取關(guān)鍵字。
在根據(jù)本修改示例的信息處理裝置20中,存在于關(guān)鍵字管理單元257 中的字(關(guān)鍵字)被自動地從發(fā)送自廣播站80的廣播音頻信息中提取。 因此,可以向外部顯示設(shè)備70顯示所提取的關(guān)鍵字。通過使用這樣的功 能,使用信息處理裝置20或者外部顯示設(shè)備70來執(zhí)行諸如聊天之類的雙 向通信的用戶可以使用所提取的關(guān)鍵字作為聊天的話題等。
本領(lǐng)域技術(shù)人員應(yīng)當(dāng)了解,在所附權(quán)利要求或其等同物的范圍內(nèi),可 以依據(jù)設(shè)計(jì)要求和其它因素來進(jìn)行各種修改、組合、子組合和變更。
例如,在上述實(shí)施例中,廣播站80發(fā)送地面數(shù)字廣播。但是,廣播 站80可以提供有線廣播或者因特網(wǎng)廣播。
在上述實(shí)施例中,圖27示出了廣播站80通過地面數(shù)字廣播來提供電 視節(jié)目的情況。但是,利用可攜式攝像機(jī)來提供的AV內(nèi)容也可以,其 中,用戶利用該可攜式攝像機(jī)來親自捕捉和再現(xiàn)圖像。
在上述實(shí)施例中,在話語識別中使用的各種字字典被存儲在常用字典 存儲單元307和識別數(shù)據(jù)庫309的識別字字典存儲單元401中。但是,在 話語識別中使用的各種字字典可以存儲在這些存儲單元的任意一個中。
在上述實(shí)施例中,在識別字字典存儲單元401中存儲了僅僅一個固定 字字典、僅僅一個可變字字典、以及僅僅一個類別表格。但是,在識別字 字典存儲單元401中可以存儲多個固定字字典、多個可變字字典、和/或多 個類別表格。通過在識別字字典存儲單元401中存儲多個固定字字典、多個可變字字典、和/或多個類別表格,可以生成專用于特定領(lǐng)域的多個識別
字典。關(guān)于與特定關(guān)鍵字高度相關(guān)的字,出現(xiàn)頻率或者N-gram或基于類 的N-gram概率可以被設(shè)置成較高,以增加該特定關(guān)鍵字的識別率。
順便提及,在本說明書中的步驟并不必須以這里所描述的順序、按時 間順序來處理,并且可以并行或單獨(dú)地處理。
同時,隨著因特網(wǎng)相關(guān)技術(shù)的發(fā)展,已經(jīng)變得可以在個人計(jì)算機(jī) (PC)之間通過語音來進(jìn)行聊天(這種聊天在下文中被稱為語音聊天)。
如果可以使用安裝在PC中的語音聊天應(yīng)用來在PC的顯示設(shè)備上顯示 與談話內(nèi)容相關(guān)的信息,則可以提高用戶在聊天時的便利性?;诖?,作 為相關(guān)技術(shù)的一個示例,JP-B-3526101公開了一種系統(tǒng),該系統(tǒng)對語音聊 天的談話內(nèi)容執(zhí)行話語識別,從談話內(nèi)容中提取關(guān)鍵字,從數(shù)據(jù)庫中搜索 相關(guān)信息,并將搜索結(jié)果顯示在屏幕上。
作為相關(guān)技術(shù)的另一個示例,公開了一種同步系統(tǒng),用于對兩臺PC 進(jìn)行同步,以使得可以利用兩臺PC的瀏覽器來顯示相同的屏幕顯示。但 是,該同步系統(tǒng)并不涉及語音聊天技術(shù)。
但是,在JP-B-3526101所公開的系統(tǒng)中,用戶必須手動地向語音聊天 的對應(yīng)方發(fā)送在屏幕上顯示的信息,以共享在屏幕上顯示的信息,因而該 系統(tǒng)并不適合通信。
在利用PC瀏覽器來允許用戶看見相同的顯示的同步系統(tǒng)中,由于該 系統(tǒng)并沒有被配置成與談話相關(guān),所以每次談話話題變化時,用戶可能就 必須手動地輸入信息以搜索與該談話相關(guān)的網(wǎng)站。因此,在實(shí)踐上可能很 難自動且有效地同步談話內(nèi)容和所有講話者的終端。
本發(fā)明是鑒于上述情形而設(shè)計(jì)出來的。存在對提供下述新的且改進(jìn)了 的語言聊天系統(tǒng)、信息處理裝置和程序的需要,這些系統(tǒng)、裝置和程序能 夠在語言聊天期間自動且高效地同步與談話內(nèi)容相關(guān)的關(guān)鍵字。
還存在對提供下述新的且改進(jìn)了的信息處理裝置和程序的需要,該信 息處理裝置和程序能夠自動且高效地同步在從廣播站發(fā)送而來的廣播信息 中包含的關(guān)鍵字。
根據(jù)本發(fā)明的觀點(diǎn),提供了一種語音聊天系統(tǒng),該語音聊天系統(tǒng)包括執(zhí)行語音聊天的多個信息處理裝置;在語音聊天期間從談話對話中提 取關(guān)鍵字時由信息處理裝置參考的關(guān)鍵字提取數(shù)據(jù)庫;以及在使用所提取 的關(guān)鍵字來搜索關(guān)鍵字和與這些關(guān)鍵字相關(guān)的文章時由信息處理裝置使用 的搜索引擎,其中,至少一個信息處理裝置包括參數(shù)提取單元,其從根 據(jù)談話來生成的語音數(shù)據(jù)中提取參數(shù),該參數(shù)表現(xiàn)了語音數(shù)據(jù)的特征;關(guān) 鍵字提取單元,其識別所生成的語音數(shù)據(jù)并基于參數(shù)和關(guān)鍵字提取數(shù)據(jù)庫 來從語音數(shù)據(jù)中提取關(guān)鍵字;信息搜索單元,其使用搜索引擎來搜索所提 取的關(guān)鍵字,并獲得針對這些關(guān)鍵字的搜索結(jié)果和與這些關(guān)鍵字相關(guān)的文 章;顯示單元,其顯示與針對所述關(guān)鍵字的搜索結(jié)果的地址信息相關(guān)聯(lián)的 關(guān)鍵字以及與和關(guān)鍵字相關(guān)的文章的地址信息相關(guān)聯(lián)的文章;以及關(guān)鍵字 同步單元,其將所提取的關(guān)鍵字發(fā)送給作為聊天的對應(yīng)方的信息處理裝 置,并執(zhí)行與對應(yīng)方信息處理裝置的關(guān)鍵字同步。
根據(jù)上述實(shí)施例,在執(zhí)行語音聊天的信息處理裝置中,參數(shù)提取單元 從根據(jù)語音聊天期間的談話對話來生成的語音數(shù)據(jù)中提取參數(shù),該參數(shù)表 現(xiàn)了語音數(shù)據(jù)的特征;關(guān)鍵字提取單元識別所生成的語音數(shù)據(jù),并基于所 述參數(shù)和關(guān)鍵字提取數(shù)據(jù)庫來從語音數(shù)據(jù)中提取關(guān)鍵字;信息搜索單元使 用搜索引擎來搜索所提取的關(guān)鍵字,并獲得針對這些關(guān)鍵字的搜索結(jié)果和 與這些關(guān)鍵字相關(guān)的文章;顯示單元以與針對所述關(guān)鍵字的搜索結(jié)果的地 址信息以及所述文章的地址信息相關(guān)聯(lián)的方式來顯示這些關(guān)鍵字和與這些 關(guān)鍵字相關(guān)的文章;并且關(guān)鍵字同步單元將所提取的關(guān)鍵字發(fā)送給作為聊 天的對應(yīng)方的信息處理裝置,并執(zhí)行與對應(yīng)方信息處理裝置的關(guān)鍵字同 步。在本發(fā)明實(shí)施例的語音聊天系統(tǒng)中,對語音聊天期間的談話內(nèi)容自動 地執(zhí)行話語識別以提取關(guān)鍵字,并且這些關(guān)鍵字被自動地發(fā)送到語音聊天 的對應(yīng)方。因此,可以提高用戶在語音聊天時的便利性。
根據(jù)本發(fā)明的另一個觀點(diǎn),提供了與另一個信息處理裝置執(zhí)行語音聊 天的信息處理裝置,該裝置包括參數(shù)提取單元,其從根據(jù)語音聊天期間 的談話對話來生成的語音數(shù)據(jù)中提取參數(shù),該參數(shù)表現(xiàn)了語音數(shù)據(jù)的特 征,-關(guān)鍵字提取單元,其識別所生成的語音數(shù)據(jù),并基于所述參數(shù)和關(guān)鍵 字提取數(shù)據(jù)庫來從語音數(shù)據(jù)中提取關(guān)鍵字;信息搜索單元,其使用搜索引擎來搜索所提取的關(guān)鍵字,并獲取針對這些關(guān)鍵字的搜索結(jié)果和與這些關(guān) 鍵字相關(guān)的文章;以及搜索信息聚積單元,其以分別與針對所述關(guān)鍵字的 搜索結(jié)果的地址信息以及所述文章的地址信息相關(guān)聯(lián)的方式來聚積關(guān)鍵字 和文章。
根據(jù)上述實(shí)施例,參數(shù)提取單元從根據(jù)語音聊天期間的談話對話來生
成的語音數(shù)據(jù)中提取參數(shù),該參數(shù)表現(xiàn)了語音數(shù)據(jù)的特征;關(guān)鍵字提取單
元識別所生成的語音數(shù)據(jù),并基于關(guān)鍵字提取數(shù)據(jù)庫來從語音數(shù)據(jù)中提取
關(guān)鍵字;信息搜索單元使用搜索引擎來搜索所提取的關(guān)鍵字,并獲得針對 這些關(guān)鍵字的搜索結(jié)果和與這些關(guān)鍵字相關(guān)的文章;并且搜索信息聚積單
元以分別與針對所述關(guān)鍵字的搜索結(jié)果的地址信息以及所述文章的地址信 息相關(guān)聯(lián)的方式來聚積關(guān)鍵字和文章。從語音數(shù)據(jù)的生成到搜索信息的獲 取的處理是自動地被執(zhí)行的。因此,信息處理裝置的用戶不必執(zhí)行任何額 外的操作,并且可以自動地獲取可以用作語音聊天的話題的信息。
信息處理裝置還可以包括關(guān)鍵字同步單元,該關(guān)鍵字同步單元將所提 取的關(guān)鍵字發(fā)送給作為聊天的對應(yīng)方的信息處理裝置,并執(zhí)行與對應(yīng)方信 息處理裝置的關(guān)鍵字同步。根據(jù)上述實(shí)施例,關(guān)鍵字同步單元將所提取的 關(guān)鍵字發(fā)送給作為聊天的對應(yīng)方的信息處理裝置,并執(zhí)行關(guān)鍵字同步。所 提取的關(guān)鍵字被自動地發(fā)送給聊天的對應(yīng)方信息處理裝置,因此,語音聊 天的對應(yīng)方可以共享所提取的關(guān)鍵字,而無需執(zhí)行額外的操作。
信息處理裝置還可以包括存儲關(guān)鍵字提取數(shù)據(jù)庫的數(shù)據(jù)庫存儲單元。 根據(jù)上述實(shí)施例,關(guān)鍵字提取數(shù)據(jù)庫被存儲在信息處理裝置的數(shù)據(jù)庫存儲 單元中,并因而可以縮短信息處理裝置訪問關(guān)鍵字提取數(shù)據(jù)庫所需的時 間。其結(jié)果是,可以縮短信息處理裝置執(zhí)行關(guān)鍵字檢測所需的時間。
搜索引擎可以設(shè)置在信息處理裝置內(nèi)。根據(jù)上述實(shí)施例,搜索引擎被 設(shè)置在信息處理裝置中。其結(jié)果是,可以縮短信息處理裝置訪問搜索引擎 所需的時間。結(jié)果,可以縮短搜索與關(guān)鍵字相關(guān)的信息所需的時間。
信息處理裝置還可以包括顯示單元,該顯示單元顯示與針對關(guān)鍵字的 搜索結(jié)果的地址信息相關(guān)聯(lián)的關(guān)鍵字以及與和關(guān)鍵字相關(guān)的文章的地址信 息相關(guān)聯(lián)的文章。根據(jù)上述實(shí)施例,關(guān)鍵字和與關(guān)鍵字相關(guān)的文章分別被以與針對關(guān)鍵字的搜索結(jié)果的地址信息以及文章的地址信息相關(guān)聯(lián)的方式 來顯示在顯示單元上。由于關(guān)鍵字和與關(guān)鍵字相關(guān)的文章都被顯示,所以 當(dāng)所顯示的文章包含用戶感興趣的信息時,用戶可以容易地訪問該信息。
信息處理裝置還可以包括參考?xì)v史存儲單元,該參考?xì)v史存儲單元存 儲關(guān)鍵字的參考?xì)v史。根據(jù)上述實(shí)施例,關(guān)鍵字的參考?xì)v史被存儲在信息 處理裝置的參考?xì)v史存儲單元中。信息處理裝置在從語音數(shù)據(jù)中提取關(guān)鍵 字時對參考?xì)v史存儲單元進(jìn)行參考,從而使能高效的關(guān)鍵字檢測。
參考?xì)v史存儲單元可以按與指派給各個聊天和聊天的對應(yīng)方的標(biāo)識符 相關(guān)聯(lián)的方式來存儲被參考的關(guān)鍵字。根據(jù)上述實(shí)施例,與被參考的關(guān)鍵 字相關(guān)的信息被以與指派給各個聊天和聊天的對應(yīng)方的標(biāo)識符相關(guān)聯(lián)的方 式來存儲在參考?xì)v史存儲單元中。因此,通過使用參考?xì)v史存儲單元的內(nèi) 容,可以使能更高效的關(guān)鍵字檢測。
關(guān)鍵字提取單元可以基于偏好來提取位于參考?xì)v史的更高等級的關(guān)鍵 字??商娲?,關(guān)鍵字提取單元可以基于偏好來提取搜索引擎的更高等級 搜索關(guān)鍵字。根據(jù)上述實(shí)施例,位于參考?xì)v史的更高等級的關(guān)鍵字或者搜 索引擎的更高等級搜索關(guān)鍵字是由關(guān)鍵字檢測單元基于偏好來提取的。由 于這樣的關(guān)鍵字高度可用作語音聊天的話題,所以可以提高話語識別的精 確度。
根據(jù)本發(fā)明的又一個實(shí)施例,提供了一種與另一個信息處理裝置執(zhí)行 語音聊天的信息處理裝置,至少一個信息處理裝置包括參數(shù)提取單元, 其從根據(jù)語音聊天期間的談話對話來生成的語音數(shù)據(jù)中提取參數(shù),該參數(shù) 表現(xiàn)了語音數(shù)據(jù)的特征;關(guān)鍵字提取單元,其識別所生成的語音數(shù)據(jù)并基
于所述參數(shù)和關(guān)鍵字提取數(shù)據(jù)庫來從語音數(shù)據(jù)中提取關(guān)鍵字;信息搜索單
元,其使用搜索引擎來搜索所提取的關(guān)鍵字,并獲得針對這些關(guān)鍵字的搜
索結(jié)果和與這些關(guān)鍵字相關(guān)的文章;以及搜索信息聚積單元,其以分別與 針對所述關(guān)鍵字的搜索結(jié)果的地址信息和所述文章的地址信息相關(guān)聯(lián)的方 式來聚積關(guān)鍵字和文章,其中,信息處理裝置包括關(guān)鍵字同步單元,該關(guān) 鍵字同步單元接收從所述至少一個信息處理裝置發(fā)送而來的關(guān)鍵字,并執(zhí) 行與相應(yīng)的信息處理裝置的關(guān)鍵字同步。根據(jù)上述實(shí)施例,關(guān)鍵字同步單元接收從作為語音聊天的對應(yīng)方的至 少一個信息處理裝置(具有參數(shù)提取單元、關(guān)鍵字提取單元、信息搜索單 元和搜索信息聚積單元)發(fā)送而來的關(guān)鍵字,并執(zhí)行與該信息處理裝置的 關(guān)鍵字同步。由于施加巨大處理負(fù)荷的話語識別或關(guān)鍵字檢測是由作為語 音聊天的對應(yīng)方的至少一個信息處理裝置執(zhí)行的,所以可以在沒有向用戶 自己的信息處理裝置施加額外負(fù)荷的情況下執(zhí)行語音聊天。
根據(jù)本發(fā)明的又一個觀點(diǎn),提供了一種用于允許計(jì)算機(jī)實(shí)現(xiàn)以下功能 的程序從根據(jù)語音聊天期間的談話對話來生成的語音數(shù)據(jù)中提取參數(shù)的 參數(shù)提取功能,所述參數(shù)表現(xiàn)了語音數(shù)據(jù)的特征;識別所生成的語音數(shù)據(jù) 并基于所述參數(shù)和關(guān)鍵字提取數(shù)據(jù)庫來從語音數(shù)據(jù)中提取關(guān)鍵字的關(guān)鍵字 提取功能;使用搜索引擎來搜索所提取的關(guān)鍵字并獲得針對所述關(guān)鍵字的
搜索結(jié)果和與這些關(guān)鍵字相關(guān)的文章的信息搜索功能;以及以分別與針對
所述關(guān)鍵字的搜索結(jié)果的地址信息和所述文章的地址信息相關(guān)聯(lián)的方式來 存儲關(guān)鍵字和文章的搜索信息存儲功能。
根據(jù)上述實(shí)施例,計(jì)算機(jī)程序被存儲在計(jì)算機(jī)的存儲單元中,并且在
計(jì)算機(jī)的CPU讀取程序時該計(jì)算機(jī)程序被執(zhí)行,從而致使計(jì)算機(jī)作為信 息處理裝置來進(jìn)行工作。可以提供在其中記錄計(jì)算機(jī)程序的計(jì)算機(jī)可讀記 錄介質(zhì)。該記錄介質(zhì)例如可以是磁盤、光盤、磁性光盤、以及閃存。計(jì)算 機(jī)程序可以例如經(jīng)由網(wǎng)絡(luò)來分發(fā),而無需使用記錄介質(zhì)。
根據(jù)本發(fā)明的又一個觀點(diǎn),提供了一種允許計(jì)算機(jī)實(shí)現(xiàn)以下功能的程 序接收從至少一個信息處理裝置發(fā)送而來的關(guān)鍵字,并執(zhí)行與相應(yīng)的信
息處理裝置的關(guān)鍵字同步的關(guān)鍵字同步功能。
根據(jù)上述實(shí)施例,計(jì)算機(jī)程序被存儲在計(jì)算機(jī)的存儲單元中,并且當(dāng)
計(jì)算機(jī)的CPU讀取程序時該計(jì)算機(jī)程序被執(zhí)行,從而致使計(jì)算機(jī)作為信
息處理裝置來進(jìn)行工作。可以提供在其中記錄計(jì)算機(jī)程序的計(jì)算機(jī)可讀記 錄介質(zhì)。該記錄介質(zhì)例如可以是磁盤、光盤、磁性光盤、和閃存。計(jì)算機(jī) 程序可以例如經(jīng)由網(wǎng)絡(luò)來分發(fā),而無需使用記錄介質(zhì)。
根據(jù)本發(fā)明的又一個觀點(diǎn),提供了一種信息處理裝置,該裝置包括
廣播文本信息接收單元,其接收從廣播站發(fā)送而來的廣播文本信息;關(guān)鍵字提取單元,其基于關(guān)鍵字提取數(shù)據(jù)庫來從廣播文本信息中提取關(guān)鍵字; 信息搜索單元,其使用搜索引擎來搜索所提取的關(guān)鍵字,并獲得針對這些 關(guān)鍵字的搜索結(jié)果和與這些關(guān)鍵字相關(guān)的文章;以及外部顯示設(shè)備連接控 制單元,其執(zhí)行與外部顯示設(shè)備的連接控制,并將所述關(guān)鍵字、針對這些 關(guān)鍵字的搜索結(jié)果、以及與這些關(guān)鍵字相關(guān)的文章輸出到外部顯示設(shè)備。
根據(jù)上述實(shí)施例,廣播文本信息接收單元接收從廣播站發(fā)送而來的廣 播文本信息;關(guān)鍵字提取單元基于關(guān)鍵字提取數(shù)據(jù)庫來從廣播文本信息中 提取關(guān)鍵字;信息搜索單元使用搜索引擎來搜索所提取的關(guān)鍵字,并獲得 針對這些關(guān)鍵字的搜索結(jié)果和與這些關(guān)鍵字相關(guān)的文章;并且外部顯示設(shè) 備連接控制單元執(zhí)行與外部顯示設(shè)備的連接控制,并將所述關(guān)鍵字、針對 這些關(guān)鍵字的搜索結(jié)果、以及與這些關(guān)鍵字相關(guān)的文章輸出到外部顯示設(shè) 備。從廣播文本信息的接收到搜索信息的獲取的處理被自動地執(zhí)行。因 此,信息處理裝置的用戶不必執(zhí)行任何額外的操作,并且所獲得的搜索信 息可以自動地被顯示到外部顯示設(shè)備。
廣播文本信息接收單元可以從與信息處理裝置相連接的外部顯示設(shè)備 獲取有關(guān)外部顯示設(shè)備正通過其來進(jìn)行接收的廣播頻道的接收頻道信息以 及與該廣播頻道相對應(yīng)的廣播文本信息??商娲?,廣播文本信息接收單 元可以從與信息處理裝置相連接的外部顯示設(shè)備獲取有關(guān)外部顯示設(shè)備正 通過其來進(jìn)行接收的廣播頻道的接收頻道信息,并從廣播站獲取與該廣播 頻道相對應(yīng)的廣播文本信息。
信息處理裝置還可以包括參考?xì)v史存儲單元,該單元存儲在外部顯示 設(shè)備中的關(guān)鍵字的參考?xì)v史,并且外部顯示設(shè)備連接控制單元可以將外部 顯示設(shè)備所選擇的關(guān)鍵字通知給搜索引擎。
信息處理裝置還可以包括關(guān)鍵字同步單元,該單元將所提取的關(guān)鍵字 發(fā)送給至少一個信息處理裝置,并執(zhí)行與該至少一個信息處理裝置的關(guān)鍵 字同步。
根據(jù)本發(fā)明的又一個觀點(diǎn),提供了一種信息處理裝置,該裝置包括
廣播音頻信息接收單元,其接收從廣播站發(fā)送而來的廣播音頻信息;參數(shù) 提取單元,其從包含在廣播音頻信息中的語音數(shù)據(jù)中提取參數(shù),該參數(shù)表現(xiàn)了語音數(shù)據(jù)的特征;關(guān)鍵字提取單元,其識別所述語音數(shù)據(jù),并基于所 述參數(shù)和關(guān)鍵字提取數(shù)據(jù)庫來從語音數(shù)據(jù)中提取關(guān)鍵字;信息搜索單元, 其使用搜索引擎來搜索所提取的關(guān)鍵字,并獲取針對這些關(guān)鍵字的搜索結(jié) 果和與這些關(guān)鍵字相關(guān)的文章;以及外部顯示設(shè)備連接控制單元,其執(zhí)行 與外部顯示設(shè)備的連接控制,并將所述關(guān)鍵字、針對這些關(guān)鍵字的搜索結(jié) 果、以及與這些關(guān)鍵字相關(guān)的文章輸出到外部顯示設(shè)備。
根據(jù)上述實(shí)施例,廣播音頻信息接收單元接收從廣播站發(fā)送而來的廣 播音頻信息;參數(shù)提取單元從包含在廣播音頻信息中的語音數(shù)據(jù)中提取參 數(shù),該參數(shù)表現(xiàn)了語音數(shù)據(jù)的特征;關(guān)鍵字提取單元識別所述語音數(shù)據(jù), 并基于所述參數(shù)和關(guān)鍵字提取數(shù)據(jù)庫來從語音數(shù)據(jù)中提取關(guān)鍵字;信息搜 索單元使用搜索引擎來搜索所提取的關(guān)鍵字,并獲取針對這些關(guān)鍵字的搜 索結(jié)果和與這些關(guān)鍵字相關(guān)的文章;并且外部顯示設(shè)備連接控制單元執(zhí)行 與外部顯示設(shè)備的連接控制,并將所述關(guān)鍵字、針對這些關(guān)鍵字的搜索結(jié) 果、以及與這些關(guān)鍵字相關(guān)的文章輸出到外部顯示設(shè)備。從包含在廣播音 頻信息中的語音數(shù)據(jù)的接收到搜索信息的獲取的處理被自動地執(zhí)行。因 此,信息處理裝置的用戶不必執(zhí)行任何額外的操作,并且所獲得的搜索信 息可以自動地被顯示到外部顯示設(shè)備。
廣播音頻信息接收單元可以從與信息處理裝置相連接的外部顯示設(shè)備 獲取有關(guān)外部顯示設(shè)備正通過其來進(jìn)行接收的廣播頻道的接收頻道信息以 及與該廣播頻道相對應(yīng)的廣播音頻信息。可替代地,廣播音頻信息接收單 元可以從與信息處理裝置相連接的外部顯示設(shè)備獲取有關(guān)外部顯示設(shè)備正 通過其來進(jìn)行接收的廣播頻道的接收頻道信息,并從廣播站獲取與該廣播 頻道相對應(yīng)的廣播音頻信息。
信息處理裝置還可以包括參考?xì)v史存儲單元,該單元存儲在外部顯示 設(shè)備中的關(guān)鍵字的參考?xì)v史,并且外部顯示設(shè)備連接控制單元可以將外部 顯示設(shè)備所選擇的關(guān)鍵字通知給搜索引擎。
信息處理裝置還可以包括關(guān)鍵字同步單元,該單元將所提取的關(guān)鍵字 發(fā)送給至少一個信息處理裝置,并執(zhí)行與該至少一個信息處理裝置的關(guān)鍵 字同步。根據(jù)本發(fā)明的又一個觀點(diǎn),提供了一種用于允許計(jì)算機(jī)實(shí)現(xiàn)以下功能 的程序接收從廣播站廣播的廣播文本信息的廣播文本信息接收功能;基 于關(guān)鍵字提取數(shù)據(jù)庫從廣播文本信息中提取關(guān)鍵字的關(guān)鍵字提取功能;使 用搜索引擎來搜索所提取的關(guān)鍵字并獲取針對這些關(guān)鍵字的搜索結(jié)果和與 這些關(guān)鍵字相關(guān)的文章的信息搜索功能;以及執(zhí)行與外部顯示設(shè)備的連接 控制并將所述關(guān)鍵字、針對這些關(guān)鍵字的搜索結(jié)果、以及與這些關(guān)鍵字相 關(guān)的文章輸出到外部顯示設(shè)備的外部顯示設(shè)備連接控制功能。
根據(jù)上述實(shí)施例,計(jì)算機(jī)程序被存儲在計(jì)算機(jī)的存儲單元中,并且在 計(jì)算機(jī)的CPU讀取程序時該計(jì)算機(jī)程序被執(zhí)行,從而致使計(jì)算機(jī)作為信 息處理裝置來進(jìn)行工作??梢蕴峁┰谄渲杏涗浻?jì)算機(jī)程序的計(jì)算機(jī)可讀記 錄介質(zhì)。該記錄介質(zhì)例如可以是磁盤、光盤、磁性光盤、和閃存。計(jì)算機(jī) 程序可以例如經(jīng)由網(wǎng)絡(luò)而不是使用記錄介質(zhì)來分發(fā)。
根據(jù)本發(fā)明的又一個觀點(diǎn),提供了一種用于允許計(jì)算機(jī)實(shí)現(xiàn)以下功能 的程序接收從廣播站發(fā)送而來的廣播音頻信息的廣播音頻信息接收功 能;從包含在廣播音頻信息中的語音數(shù)據(jù)中提取參數(shù)的參數(shù)提取功能,其 中,所述參數(shù)表現(xiàn)了語音數(shù)據(jù)的特征;識別所述語音數(shù)據(jù)并基于所述參數(shù) 和關(guān)鍵字提取數(shù)據(jù)庫從語音數(shù)據(jù)中提取關(guān)鍵字的關(guān)鍵字提取功能;使用搜 索引擎來搜索所提取的關(guān)鍵字并獲取針對這些關(guān)鍵字的搜索結(jié)果和與這些 關(guān)鍵字相關(guān)的文章的信息搜索功能;以及執(zhí)行與外部顯示設(shè)備的連接控制 并將所述關(guān)鍵字、針對這些關(guān)鍵字的搜索結(jié)果、以及與這些關(guān)鍵字相關(guān)的 文章輸出到外部顯示設(shè)備的外部顯示設(shè)備連接控制功能。
根據(jù)上述實(shí)施例,計(jì)算機(jī)程序被存儲在計(jì)算機(jī)的存儲單元中,并且在 計(jì)算機(jī)的CPU讀取程序時該計(jì)算機(jī)程序被執(zhí)行,從而致使計(jì)算機(jī)作為信 息處理裝置來工作??梢蕴峁┰谄渲杏涗浻?jì)算機(jī)程序的計(jì)算機(jī)可讀記錄介 質(zhì)。該記錄介質(zhì)例如可以是磁盤、光盤、磁性光盤、和閃存。計(jì)算機(jī)程序 可以例如經(jīng)由網(wǎng)絡(luò)而不是使用記錄介質(zhì)來分發(fā)。
以下將參考附圖來詳細(xì)描述本發(fā)明的優(yōu)選實(shí)施例。注意,在本說明書 和附圖中,具有基本相同的功能和結(jié)構(gòu)的結(jié)構(gòu)元件被用相同的標(biāo)號來表 示,并且將省略對這些結(jié)構(gòu)元件的重復(fù)說明。(第三實(shí)施例)
以下,將詳細(xì)描述根據(jù)本發(fā)明第三實(shí)施例的語音聊天系統(tǒng)。
圖29是示出根據(jù)第三實(shí)施例的語音聊天系統(tǒng)的示意圖。語音聊天系
統(tǒng)1010包括通信網(wǎng)絡(luò)1012、關(guān)鍵字提取數(shù)據(jù)庫1030、搜索引擎1040、以 及信息處理裝置1020A和1020B (下文中,有時候統(tǒng)稱為信息處理裝置 1020)。
通信網(wǎng)絡(luò)1012是連接信息處理裝置1020、關(guān)鍵字提取數(shù)據(jù)庫1030和 搜索引擎1040以使能在它們之間的雙向或單向通信的通信網(wǎng)絡(luò)。通信網(wǎng) 絡(luò)1012例如可以由諸如因特網(wǎng)、電話網(wǎng)絡(luò)、衛(wèi)星通信網(wǎng)絡(luò)或廣播通信頻 道之類的公共網(wǎng)絡(luò)或者諸如WAN (廣域網(wǎng))、LAN (局域網(wǎng))、IP-VPN (因特網(wǎng)協(xié)議-虛擬私有網(wǎng)絡(luò))、以太網(wǎng)(注冊商標(biāo))、或者無線LAN之 類的私有網(wǎng)絡(luò)來構(gòu)成。通信網(wǎng)絡(luò)1012可以是有線的或者是無線的。
信息處理裝置1020以語音的方式與經(jīng)由通信網(wǎng)絡(luò)1012連接到其的另 一個信息處理裝置1020執(zhí)行聊天(語音聊天)。信息處理裝置1020可以 經(jīng)由通信網(wǎng)絡(luò)1012來請求經(jīng)由通信網(wǎng)絡(luò)1012連接到其的關(guān)鍵字提取數(shù)據(jù) 庫1030和搜索引擎1040執(zhí)行數(shù)據(jù)庫的參考或信息的搜索。
執(zhí)行語音聊天的另一個信息處理裝置1020可以經(jīng)由通信網(wǎng)絡(luò)1012來 與其相連接,如圖所示??商娲?,另一個信息處理裝置1020可以直接 而非經(jīng)由通信網(wǎng)絡(luò)1012來連接到USB (通用串行總線)端口、諸如i丄ink 之類的IEEE 1394端口、 SCSI (小型計(jì)算機(jī)系統(tǒng)接口)端口、 RS-232C端 口等。
在圖示的示例中,信息處理裝置1020是臺式PC,但是,在本實(shí)施例 中,信息處理裝置1020可以是筆記本式PC。在本實(shí)施例中,信息處理裝 置1020并不限于上述示例,而可以例如由電視機(jī)機(jī)頂盒、諸如家用游戲 機(jī)之類的信息設(shè)備、移動電話、PDA (個人數(shù)字助手)等來構(gòu)成,只要是 能夠具有經(jīng)由網(wǎng)絡(luò)來通信的功能的設(shè)備即可。另外或者可替代地,信息處 理裝置1020可以是由擁有者攜帶的便攜式設(shè)備,例如,便攜式游戲機(jī)、 PHS、或便攜式視頻/音頻播放機(jī)。
在圖29中,僅僅兩個信息處理裝置1020與通信網(wǎng)絡(luò)1012相連接。但是,本實(shí)施例并不限于此示例,并且多個信息處理裝置1020可以與通信 網(wǎng)絡(luò)1012相連接。
關(guān)鍵字提取數(shù)據(jù)庫1030是在信息處理裝置1020從根據(jù)語音聊天期間 的談話內(nèi)容來獲得的語音數(shù)據(jù)中提取關(guān)鍵字時信息處理裝置1020所參考 的數(shù)據(jù)庫。在關(guān)鍵字提取數(shù)據(jù)庫1030中,描述了諸如充當(dāng)關(guān)鍵字的字的 發(fā)音、音素和音節(jié)的串聯(lián)關(guān)系以及關(guān)鍵字的類別之類的各種信息。例如, 在關(guān)鍵字提取數(shù)據(jù)庫1030中,搜索引擎的較高等級搜索關(guān)鍵字或者頻繁 地被用作博客中的話題的術(shù)語被描述成關(guān)鍵字。關(guān)鍵字提取數(shù)據(jù)庫1030 可以是根據(jù)搜索引擎(搜索服務(wù)器)的較高等級搜索關(guān)鍵字或者頻繁地被 用作博客中的話題的術(shù)語的變化而按需來更新的動態(tài)數(shù)據(jù)庫;或者,關(guān)鍵 字提取數(shù)據(jù)庫1030可以是靜態(tài)數(shù)據(jù)庫。在關(guān)鍵字提取數(shù)據(jù)庫1030中描述 的關(guān)鍵字可以利用概率潛在語義分析(PLSA)模型等來處理,并且被轉(zhuǎn) 換成合適的話題矢量的形式。這里,話題矢量指的是話題的矢量空間表 示,并且被用于確定話題的共性。另外,可以向在關(guān)鍵字提取數(shù)據(jù)庫1030 中描述的關(guān)鍵字添加稍后將描述的識別權(quán)重信息。
充當(dāng)關(guān)鍵字的字的發(fā)音、音素和音節(jié)的串聯(lián)關(guān)系指的是這樣的關(guān)系, 該關(guān)系表示出被描述成關(guān)鍵字提取數(shù)據(jù)庫1030中的關(guān)鍵字的字是如何在 它們的發(fā)音、音素和音節(jié)方面相互串聯(lián)(連接)的。作為描述該串聯(lián)關(guān)系 的一種方法,可以使用統(tǒng)計(jì)字串聯(lián)概率(n-gram或者基于類的n-gmrn)、 生成語法、有限狀態(tài)自動機(jī)(FSA)等。
搜索引擎1040是用戶可以使用關(guān)鍵字等通過因特網(wǎng)來搜索可用信息 的網(wǎng)站的數(shù)據(jù)庫。這里,所述信息可以是向公眾開放的或者是不公開的。 在本實(shí)施例中,搜索引擎1040可以提供允許使用關(guān)鍵字來搜索所存儲的 信息的全文的全文搜索服務(wù);或者可以是允許搜索按類別來分類的信息的 目錄服務(wù)。
(信息處理裝置1020的配置)
接下來,將參考圖30來簡要描述根據(jù)本實(shí)施例的信息處理裝置1020 的配置。
在以下描述中,術(shù)語"字"指的是在話語識別處理中便于作為單個字
70來處理的單元。其并不一定與語言學(xué)上的字相同。例如,"夕口々君(發(fā)
音為ta醒kun)"可以處理為一個字,或者可以處理為"tarou"和"kun"
形式的兩個字。此外,更大的單元"二入t;:sy:夕口o君(發(fā)音為
konnichiwataroukun)"可以被作為一個字來處理。
另外,術(shù)語"音素"指的是從聲學(xué)的角度便于作為單個單元來處理的 單元。其并不一定與語音音節(jié)或音素相同。例如,在字"東京(發(fā)音為 tou kyou)"中,"tou"部分可以用三個音素符號"t/o/u"來表示,或者 用"to:" ( "o"的長音)來表示。此外,"tou"部分可以用"t/o/o"來 表示。另外,可以采用表示靜音的符號。此外,可以采用將靜音分成"發(fā) 音之前的靜音"、"插入在發(fā)音之間的短靜音"、"發(fā)音中的靜音"、以 及"與'3 (發(fā)音為tsu)'相對應(yīng)的靜音"的符號。
圖30是示出根據(jù)本實(shí)施例的信息處理裝置1020的硬件配置的示意 圖。信息處理裝置1020包括中央處理單元(CPU) 1201、只讀存儲器 (ROM) 1203、隨機(jī)存取存儲器(RAM) 1205、主機(jī)總線1207、橋 1209、外部總線1211、接口 1213、輸入設(shè)備1215、輸出設(shè)備1217、存儲 設(shè)備1219、驅(qū)動器1221、以及通信設(shè)備1233。
CPU 1201用作算術(shù)處理單元和控制單元。CPU 1201根據(jù)記錄在ROM 1203、 RAM 1205、存儲設(shè)備1219或可移動記錄介質(zhì)1014中的各種程序 來控制信息處理裝置1020中的內(nèi)部操作的全部或一部分。ROM 1203存儲 由CPU 1201使用的程序、算術(shù)參數(shù)等。RAM 1205暫時存儲CPU 1201執(zhí) 行時所使用的程序和在CPU 1201執(zhí)行時適當(dāng)?shù)刈兓膮?shù)。CPU 1201、 ROM 1203和RAM 1205經(jīng)由主機(jī)總線1207 (例如,CPU總線)而相互連 接。
主機(jī)總線1207經(jīng)由橋1209而與外部總線1211 (例如,外圍組件互連 (PCI)總線)相連接。
輸入設(shè)備1215包括諸如鼠標(biāo)、鍵盤、觸摸屏、按鈕、開關(guān)、和控制 桿之類的由用戶操作的操作單元和諸如麥克風(fēng)和頭戴式耳機(jī)之類的語音輸 入單元。輸入設(shè)備1215可以是使用紅外光或者其它電波的遙控單元(所 謂的遙控器),或者可以是與信息處理裝置1020的操作相對應(yīng)的諸如移動電話或PDA之類的外部連接設(shè)備。輸入設(shè)備1215可以是一種輸入控制 電路,該輸入控制電路基于用戶使用操作單元或語音輸入單元輸入的信息
來生成輸入信號并將所生成的輸入信號輸出到CPU 1201。信息處理裝置 1020的用戶操作輸入設(shè)備1215來向信息處理裝置1020輸入各種數(shù)據(jù)或者 指示信息處理裝置1020執(zhí)行處理操作。
輸出設(shè)備1217例如可以由可以以可視或可聽的方式來將所獲得的信 息通知給用戶的顯示單元(例如,陰極射線管(CRT)顯示單元、液晶顯 示(液晶顯示)單元、等離子顯示面板(PDP)單元、電致發(fā)光(EL)顯 示單元、或燈)、音頻輸出單元(包括揚(yáng)聲器和頭戴式耳機(jī))、以及諸如 打印機(jī)、移動電話或傳真機(jī)之類的設(shè)備來構(gòu)成。輸出設(shè)備1217例如輸出 搜索服務(wù)器搜索的各種信息。具體而言,顯示單元將搜索服務(wù)器對各種信 息的搜索結(jié)果作為文本或圖像來顯示。同時,音頻輸出單元將被播放的語 音數(shù)據(jù)轉(zhuǎn)換成語音并輸出該語音。
存儲設(shè)備1219是作為根據(jù)本實(shí)施例的信息處理裝置1020的存儲單元 的一個示例的數(shù)據(jù)存儲設(shè)備。存儲設(shè)備1219例如由諸如硬盤驅(qū)動器 (HDD)之類的磁存儲單元、半導(dǎo)體存儲設(shè)備、光存儲設(shè)備、磁光存儲設(shè) 備等來構(gòu)成。存儲設(shè)備1219存儲由CPU 1201執(zhí)行的程序或各種數(shù)據(jù)以及 從外部獲得的各種數(shù)據(jù)。
驅(qū)動器1221是存儲介質(zhì)的讀寫器。驅(qū)動器1221被設(shè)置在信息處理裝 置1020中,或者從外部附接于信息處理裝置1020。驅(qū)動器1221讀出記錄 在諸如磁盤、光盤、磁光盤、或半導(dǎo)體存儲器之類的可移動存儲介質(zhì)1014 中的信息(該信息被載入到驅(qū)動器1221),并將所讀出的信息輸出到 RAM 1205。驅(qū)動器1221可以將載入到驅(qū)動器1221中的信息記錄在諸如 磁盤、光盤、磁光盤或半導(dǎo)體存儲器之類的可移動存儲介質(zhì)1014中???移動存儲介質(zhì)1014例如可以是DVD介質(zhì)、HD-DVD介質(zhì)、藍(lán)光介質(zhì)、緊 湊式閃存(CF)、記憶棒、或安全數(shù)字(SD)存儲卡。可移動存儲介質(zhì) 1014例如可以是其上安裝有非接觸式IC芯片的電子設(shè)備或集成電路 (IC)卡。
通信設(shè)備1223是由用于連接到通信網(wǎng)絡(luò)1012的通信設(shè)備構(gòu)成的通信接口。通信設(shè)備1223例如可以是用于有線或無線局域網(wǎng)(LAN)的通信 卡、藍(lán)牙或無線USB (WUSB)、用于光通信的路由器、用于非對稱數(shù)字 用戶線路(ADSL)的路由器、或者用于各種通信協(xié)議的調(diào)制解調(diào)器。通 信設(shè)備1223在收發(fā)有關(guān)與另一個信息處理裝置1020語音聊天的信息時向 因特網(wǎng)或其它通信設(shè)備發(fā)送各種信息以及從其接收各種信息。連接到通信 設(shè)備1223的通信網(wǎng)絡(luò)1012可以由以有線或無線方式來連接的諸如因特 網(wǎng)、家庭LAN、紅外光通信、或者衛(wèi)星通信之類的網(wǎng)絡(luò)構(gòu)成。
利用上述配置,信息處理裝置1020可以與直接連接到信息處理裝置 1020的另一個信息處理裝置或者與經(jīng)由通信網(wǎng)絡(luò)1012來連接到其的另一 個信息處理裝置進(jìn)行語音聊天,同時從經(jīng)由通信網(wǎng)絡(luò)1012來連接到其的 關(guān)鍵字提取數(shù)據(jù)庫1030、搜索引擎1040等獲取各種信息。此外,信息處 理裝置1020可以使用可移動存儲介質(zhì)1014來取出存儲在信息處理裝置 1020中的信息。
在上文中,已經(jīng)描述了可以實(shí)現(xiàn)根據(jù)本實(shí)施例的信息處理裝置1020 的功能的硬件配置的示例。上述組件可以使用通用元件來構(gòu)成,或者可以 利用專用于各種組件的功能的專用硬件來構(gòu)成。因此,可以根據(jù)實(shí)施本實(shí) 施例時的技術(shù)水平來適當(dāng)?shù)匦薷挠布渲谩I鲜鲇布渲脙H僅用于說明性 目的,并且本發(fā)明決不局限于此??梢砸罁?jù)使用的形式來省略諸如主機(jī)總 線1207、外部總線1211或接口 1213之類的一些組件。
接下來,將詳細(xì)描述根據(jù)本實(shí)施例的信息處理裝置1020的配置。在 以下描述中,執(zhí)行語音聊天的兩個信息處理裝置1020將被稱為第一信息 處理裝置1020A和第二信息處理裝置1020B。第一和第二信息處理裝置 1020A和1020B根據(jù)信息處理裝置的各個用戶的聲音來生成語音數(shù)據(jù),并 將該語音數(shù)據(jù)發(fā)送到作為語音聊天的對應(yīng)方的另一個信息處理裝置。圖31 是用于說明根據(jù)第三實(shí)施例的第一信息處理裝置1020A的配置的框圖。
根據(jù)本實(shí)施例的第一信息處理裝置1020A包括語音輸入單元1231、 話語識別單元1233、語音談話控制單元1239、語音輸出單元1241、信息 搜索單元1243、關(guān)鍵字同步單元1245、顯示單元1247、通信單元1249和 存儲單元1251。語音輸入單元1231是向第一信息處理裝置1020A輸入語音聊天期間 的談話對話(第一信息處理裝置1020A的用戶所發(fā)出的話語)的接口。語 音輸入單元1231例如由與第一信息處理裝置1020A相連接的諸如麥克風(fēng) 或頭戴式耳機(jī)之類的輸入設(shè)備來構(gòu)成。用戶向麥克風(fēng)或頭戴式耳機(jī)發(fā)出的 話語被自動實(shí)時地輸入到第一信息處理裝置1020A。所輸入的模擬信號被 通過AD轉(zhuǎn)換來采樣量化,并被作為語音數(shù)據(jù)(數(shù)字信號)經(jīng)由語音輸入 單元1231來發(fā)送到話語識別單元1233。
話語識別單元1233例如由CPU、 ROM或RAM來構(gòu)成。話語識別單 元1233基于從語音輸入單元1231發(fā)送而來的語音數(shù)據(jù)實(shí)時地執(zhí)行話語識 別。話語識別單元1233還包括參數(shù)提取單元1235和關(guān)鍵字提取單元 1237。
參數(shù)提取單元1235從所生成的語音數(shù)據(jù)的每一幀(按適當(dāng)?shù)臅r間間 隔)中提取諸如Mel頻率倒譜系數(shù)(MFCC)及其時差參數(shù)、語音數(shù)據(jù)的 頻譜、功率線性預(yù)測系數(shù)、倒譜系數(shù)、和線譜對之類的特征參數(shù)。
參數(shù)提取單元1235將所提取的特征參數(shù)發(fā)送到關(guān)鍵字提取單元 1237。關(guān)鍵字提取單元1237可以將所提取的特征參數(shù)存儲在稍后將描述 的存儲單元1251中。
關(guān)鍵字提取單元1237基于關(guān)鍵字提取數(shù)據(jù)庫1030和由參數(shù)提取單元 1235提取并生成的特征參數(shù)來從語音數(shù)據(jù)(第一信息處理裝置1020A的用 戶所發(fā)出的話語的數(shù)字信號)中提取關(guān)鍵字。當(dāng)關(guān)鍵字提取單元1237提 取關(guān)鍵字時,關(guān)鍵字提取單元1237可以經(jīng)由通信單元1249來參考與通信 網(wǎng)絡(luò)1012相連接的關(guān)鍵字提取數(shù)據(jù)庫1030。
在語音聊天期間用戶所發(fā)出的話語的語句中包含多個關(guān)鍵字。關(guān)鍵字 提取單元1237自動地提取存在于話語語句中的所有關(guān)鍵字。關(guān)鍵字提取 單元1237將所提取的關(guān)鍵字發(fā)送到稍后將描述的信息搜索單元1243。關(guān) 鍵字提取單元1237可以將所提取的關(guān)鍵字存儲在存儲單元1251中。
稍后將描述話語識別單元1233識別從語音輸入單元1231發(fā)送而來的 語音并從所識別的語音中提取關(guān)鍵字的方法。
語音談話控制單元1239例如由CPU、 ROM禾n RAM來構(gòu)成,并控制與經(jīng)由通信網(wǎng)絡(luò)1012來連接的第二信息處理裝置1020B的語音聊天。語
音談話控制單元1239接收語音輸入單元1231所生成的語音數(shù)據(jù),并經(jīng)由 通信單元1249將該語音數(shù)據(jù)發(fā)送到第二信息處理裝置1020B。語音談話控 制單元1239經(jīng)由通信單元1249來接收從第二信息處理裝置1020B發(fā)送而 來的語音數(shù)據(jù),并將該語音數(shù)據(jù)發(fā)送到語音輸出單元1241。語音談話控制 單元1239可以被配置成,每次語音聊天被執(zhí)行時就將執(zhí)行語音聊天的日 期、用于標(biāo)識語音聊天的標(biāo)識符、和用于標(biāo)識語音聊天的對應(yīng)方的標(biāo)識符 以關(guān)聯(lián)方式來存儲在存儲單元1251中。
語音談話控制單元1239可以用專用于語音談話控制的專用硬件來構(gòu) 成,并且可以被設(shè)置為諸如語音聊天程序之類的應(yīng)用程序。
語音輸出單元1241是這樣的接口,該接口接收由第二信息處理裝置 1020B的用戶發(fā)出的話語的語音數(shù)據(jù),并將所接收的語音數(shù)據(jù)輸入到第一 信息處理裝置1020A。語音輸出單元1241例如由作為與第一信息處理裝 置1020A相連接的輸出設(shè)備的揚(yáng)聲器或耳機(jī)來構(gòu)成。
經(jīng)由通信單元1249從第二信息處理裝置1020B接收的語音數(shù)據(jù)被經(jīng) 由語音輸出單元1241來輸入給第一信息處理裝置1020A的用戶。
信息搜索單元1243以關(guān)聯(lián)方式將從關(guān)鍵字提取單元1237發(fā)送而來的 關(guān)鍵字和這些關(guān)鍵字被從關(guān)鍵字提取單元1237發(fā)送的時間存儲在存儲單 元1251中。信息搜索單元1243判斷是否將對從關(guān)鍵字提取單元1237發(fā)送 而來的關(guān)鍵字執(zhí)行關(guān)鍵字同步處理。當(dāng)判定關(guān)鍵字同步處理應(yīng)當(dāng)被執(zhí)行 時,信息搜索單元1243將這些關(guān)鍵字發(fā)送到關(guān)鍵字同步單元1245,從而 請求執(zhí)行關(guān)鍵字同步處理。信息搜索單元1243經(jīng)由通信單元1249來訪問 搜索引擎1040,并執(zhí)行從關(guān)鍵字提取單元1237發(fā)送而來的關(guān)鍵字的信息 搜索,從而獲取針對所述關(guān)鍵字的搜索結(jié)果和與這些關(guān)鍵字相關(guān)的文章。 信息搜索單元1243將所獲得的搜索結(jié)果存儲在存儲單元1251的搜索結(jié)果 存儲單元1253中,并將該搜索結(jié)果發(fā)送到顯示單元1247。這里,信息搜 索單元1243從搜索引擎1040獲得的搜索結(jié)果包括關(guān)于搜索關(guān)鍵字的信息 在搜索引擎1040中的標(biāo)題或URL以及信息的元數(shù)據(jù),例如信息的類型。
當(dāng)顯示單元1247請求獲取關(guān)于特定關(guān)鍵字或與該關(guān)鍵字相關(guān)的文章的更詳細(xì)的信息時,信息搜索單元1243經(jīng)由通信單元1249來訪問搜索引 擎1040以獲取更詳細(xì)的信息,并將從顯示單元1247通知的特定關(guān)鍵字存 儲在存儲單元1251的參考?xì)v史存儲單元1255中。
關(guān)鍵字同步單元1245將關(guān)鍵字提取單元1237從語音數(shù)據(jù)中提取的關(guān) 鍵字經(jīng)由通信單元1249來發(fā)送到第二信息處理裝置1020B,從而同步第一 和第二信息處理裝置1020A和1020B。關(guān)鍵字同步處理不僅可以在從第一 信息處理裝置1020 A到第二信息處理裝置1020B的方向上執(zhí)行,而且可 以按以下方式在從第二信息處理裝置1020B到第一信息處理裝置1020A的 方向上執(zhí)行。即,第一信息處理裝置1020A可以響應(yīng)于由第二信息處理裝 置1020B啟動的關(guān)鍵字同步處理,以使得從第二信息處理裝置1020B發(fā)送 的關(guān)鍵字被第一信息處理裝置1020A所接收。
顯示單元1247將從信息搜索單元1243發(fā)送而來的信息搜索結(jié)果例如 經(jīng)由瀏覽器應(yīng)用來顯示給對第一信息處理裝置1020A提供的諸如顯示器等 的輸出設(shè)備。信息搜索單元1243從搜索引擎1040獲得的信息包含信息或 文章在搜索引擎1040中的URL等。因此,當(dāng)?shù)谝恍畔⑻幚硌b置1020A的 用戶通過與第一信息處理裝置1020A相連接的諸如鼠標(biāo)或鍵盤之類的輸入 設(shè)備來選擇被顯示的信息時,顯示單元1247請求信息搜索單元1243獲取 被選擇的信息的細(xì)節(jié)。
通信單元1249例如是安裝在第一信息處理裝置1020A中的通信設(shè) 備。通信單元1249對經(jīng)由通信網(wǎng)絡(luò)1012的在第一信息處理裝置1020A (具體而言,是關(guān)鍵字提取單元1237、語音談話控制單元1239、信息搜 索單元1243和關(guān)鍵字同步單元1245)與第一信息處理裝置1020A的外部 設(shè)備(具體而言,關(guān)鍵字提取數(shù)據(jù)庫1030、搜索引擎1040)或者第二信 息處理裝置1020B之間信息通信進(jìn)行中繼。此外,通信單元1249可以與 直接而非經(jīng)由通信網(wǎng)絡(luò)1012來與第一信息處理裝置1020A相連接的其它 信息處理裝置進(jìn)行信息通信。
存儲單元1251例如是安裝在第一信息處理裝置1020A中的存儲設(shè) 備,并且在其中存儲諸如關(guān)鍵字提取單元1237所提取的關(guān)鍵字或者信息 搜索單元1243所獲得的搜索信息之類的數(shù)據(jù)。除了這些數(shù)據(jù)之外,存儲單元1251還可以在其中存儲各種數(shù)據(jù)庫或者由語音輸入單元1231生成的 語音數(shù)據(jù)。此外,存儲單元1251還可以在其中存儲在第一信息處理裝置 1020A執(zhí)行處理時需要存儲的各種參數(shù)以及該處理的進(jìn)程信息。在話語識 別單元1233、語音談話控制單元1239、信息搜索單元1243、關(guān)鍵字同步 單元1245等對存儲單元1251自由地執(zhí)行讀取時,存儲單元1251可以自由 地被訪問。存儲單元1251還可以包括搜索信息聚積單元1253和參考?xì)v史 存儲單元1255。
搜索信息聚積單元1253以關(guān)聯(lián)方式來聚積信息獲取數(shù)據(jù)和信息搜索 單元1243所獲得的搜索信息。當(dāng)需要顯示已經(jīng)獲得的搜索信息時,可以 參考存儲在搜索信息聚積單元1253中的信息以顯示該己經(jīng)獲得的信息。
參考?xì)v史存儲單元1255將在顯示單元1247上顯示的關(guān)鍵字或文章中 的、第一信息處理裝置1020A的用戶為了更詳細(xì)的信息而參考的關(guān)鍵字存 儲作為參考?xì)v史。參考?xì)v史是這樣的數(shù)據(jù),該數(shù)據(jù)包括所參考的關(guān)鍵字、 所參考關(guān)鍵字的權(quán)重信息、已經(jīng)參考關(guān)鍵字的語音聊天自身的標(biāo)識符、以 及語音聊天的對應(yīng)方。當(dāng)關(guān)鍵字提取單元1237提取關(guān)鍵字時可以使用存 儲在參考?xì)v史存儲單元1255中的參考?xì)v史。
信息搜索單元1243、關(guān)鍵字同步單元1245、和顯示單元1247可以用 專用于各種功能的專用硬件來構(gòu)成,并且可以被設(shè)置為諸如話語識別程序 之類的應(yīng)用程序。
第二信息處理裝置1020B的配置與第一信息處理裝置1020A基本相 同,并且將省略對它的描述。
在上文中,己經(jīng)描述了根據(jù)本發(fā)明的信息處理裝置1020的功能的示 例。上述組件可以使用通用元件或電路來構(gòu)成,或者可以用專用于各個組 件的功能的專用硬件來構(gòu)成。這些組件的全部功能可以利用CPU等來執(zhí) 行。因此,可以根據(jù)實(shí)施本實(shí)施例時的技術(shù)水平來適當(dāng)?shù)匦薷挠布渲谩?(話語識別方法和關(guān)鍵字提取方法)
以下,將參考圖32來簡要描述話語識別單元1233執(zhí)行話語識別以從 話語識別的結(jié)果中提取關(guān)鍵字的方法。根據(jù)本實(shí)施例的話語識別單元1233 所使用的話語識別方法和關(guān)鍵字提取方法并不限于以下所描述的示例。圖32是用于說明根據(jù)本實(shí)施例的話語識別單元1233所使用的話語識別方法
和關(guān)鍵字提取方法的示例的流程圖。
語音輸入單元1231根據(jù)輸入到其的第一信息處理裝置1020A的用戶 的話語來生成語音數(shù)據(jù)。在語音輸入單元1231中,所輸入的用戶話語被 AD轉(zhuǎn)換以對該作為模擬信號的話語進(jìn)行采樣量化,并且該模擬話語信號 被轉(zhuǎn)換成作為數(shù)字信號的語音數(shù)據(jù)(步驟S1101)。在完成向語音數(shù)據(jù)的 轉(zhuǎn)換之后,語音輸入單元1231將所生成的語音數(shù)據(jù)發(fā)送到話語識別單元 1233和語音談話控制單元1239。
隨后,參數(shù)提取單元1235從所生成的語音數(shù)據(jù)的每一幀(以適當(dāng)?shù)?時間間隔)中提取諸如Mel頻率倒譜系數(shù)(MFCC)及其時差參數(shù)、語音 數(shù)據(jù)的頻譜、功率線性預(yù)測系數(shù)、倒譜系數(shù)、和線譜對之類的特征參數(shù) (步驟S1103)。
關(guān)鍵字提取單元1237計(jì)算與輸入到語音輸入單元1231的話語(輸入 語音)最接近的字序列作為識別結(jié)果,并例如通過參考關(guān)鍵字提取數(shù)據(jù)庫 1030、聲學(xué)模型、語音模型、以及在聲學(xué)模型或語音模型中使用的字典基 于從參數(shù)提取單元1235獲得的特征參數(shù)來從識別結(jié)果中提取關(guān)鍵字。
這里,聲學(xué)模型在其中存儲這樣的模型,該模型表示將被識別的話語 的各個音素、音節(jié)等的聲學(xué)特征。作為聲學(xué)模型,例如可以使用隱馬爾可 夫模型(HMM)。作為聲學(xué)模型,可以提供兩種模型, 一種模型用于安 靜的環(huán)境(能夠在安靜環(huán)境下提供高識別率的聲學(xué)模型),而另一種模型 用于嘈雜環(huán)境(能夠在嘈雜環(huán)境下提供良好的識別率的聲學(xué)模型),從而 可以依據(jù)環(huán)境來參考任一種模型。
語言模型在其中存儲這樣的模型,該模型描述了表示登記在各個字典 中的字是如何串聯(lián)(連接)的信息(串聯(lián)信息)。作為語言模型,可以使 用統(tǒng)計(jì)字串聯(lián)概率(n-gram或者基于類的n-gram)、生成語法、有限狀態(tài) 自動機(jī)(FSA)等。
語言模型可以在其中存儲字的類別的串聯(lián)信息以及字的串聯(lián)信息。例 如,當(dāng)"表示人名的字所屬于的類別"被表示為符號"—人名—"并且"表 示食物的字所屬于的類別"被表示為符號"—食物—"時,語言模型還描述了 "—人名」,和"—食物一"的串聯(lián)信息,艮P,還描述了預(yù)先存儲在字典中 的各種類別之間的串聯(lián)以及類別和字之間的串聯(lián)。
因此,可以獲得語言模型中沒有包含的字的串聯(lián)信息。例如,當(dāng)獲得
"丫于口一 (發(fā)音為ichiro)"和(小品詞,發(fā)音為wa)"之間的串 聯(lián)信息時,即使語言模型中沒有描述"吖于口一 (發(fā)音為ichiro)"的串 聯(lián)信息,如果可以獲悉"吖于口一 (發(fā)音為ichiro)"屬于表示為符號"— 人名—"的類別,也可以通過獲得"_人名—"和"1* (小品詞,發(fā)音為 wa)"之間的串聯(lián)信息來獲得"一千口一 (發(fā)音為ichiro)"和(小 品詞,發(fā)音為wa)"之間的串聯(lián)信息。
在從語音輸入單元1231接收到語音數(shù)據(jù)之后,關(guān)鍵字提取單元1237 通過基于聲學(xué)模型按照字的發(fā)音或音素來連接這些字中的一些從而生成字 序列。關(guān)鍵字提取單元1237基于聲學(xué)模型來計(jì)算所生成的字序列的聲學(xué) 分?jǐn)?shù)(步驟S1105)。這里,聲學(xué)分?jǐn)?shù)是表示作為話語識別的結(jié)果的字序 列與輸入語音在聲音方面(從聲學(xué)角度)的相似程度的數(shù)值。關(guān)鍵字提取 單元1237基于計(jì)算得到的聲學(xué)分?jǐn)?shù)來選擇具有較高聲學(xué)分?jǐn)?shù)的預(yù)定數(shù)目 的字序列。
關(guān)鍵字提取單元1237可以使用基于集束搜索的維特比解碼器或者基 于A4叟索的堆棧解碼器來執(zhí)行匹配。另外或者可替代地,在匹配時可以 使用所謂的關(guān)鍵字辨認(rèn)方法。如果向關(guān)鍵字提取單元1237所參考的各種 字字典添加"識別權(quán)重"信息,則可以對稍后將描述的語言分?jǐn)?shù)進(jìn)行加 權(quán),并且識別結(jié)果可以按加權(quán)后的分?jǐn)?shù)來分等級。識別權(quán)重信息是描述了 識別權(quán)重的信息,其中,識別權(quán)重是在計(jì)算語音分?jǐn)?shù)時使用的校正系數(shù) (權(quán)重系數(shù));當(dāng)識別權(quán)重具有較大值時,語言分?jǐn)?shù)的校正值隨之增加, 因而具有較大識別權(quán)重的關(guān)鍵字極有可能被用作識別結(jié)果。例如,識別權(quán) 重為10的關(guān)鍵字將被話語識別的概率是識別權(quán)重為1的關(guān)鍵字(即,未 經(jīng)加權(quán)的關(guān)鍵字)將被話語識別的概率的10倍。
關(guān)于識別權(quán)重的確定,可以使用從搜索引擎1040獲得的搜索關(guān)鍵字 列表的等級信息或者關(guān)鍵字在話語識別的結(jié)果的輸出中的出現(xiàn)頻率。由于 搜索關(guān)鍵字列表是在搜索引擎1040中被置于較高等級上的搜索關(guān)鍵字的列表,所以可以按關(guān)鍵字在搜索時的出現(xiàn)頻率的遞減順序來向這些關(guān)鍵字 賦予等級;預(yù)定的識別權(quán)重是按等級的順序來確定的。
具體而言,按關(guān)鍵字在搜索時的出現(xiàn)頻率的遞減順序來向這些關(guān)鍵字 賦予預(yù)定系數(shù),并且歸一化的關(guān)鍵字頻率被乘以所賦予的系數(shù),從而獲得 識別權(quán)重。關(guān)于搜索關(guān)鍵字列表和次關(guān)鍵字的獲取以及關(guān)鍵字信息的添
加,取代搜索引擎1040可以使用存儲在經(jīng)由通信網(wǎng)絡(luò)1012來連接的服務(wù)
器中的辭典、本體數(shù)據(jù)庫、百科全書、日語字典、或者形態(tài)分析工具。除 了辭典、本體數(shù)據(jù)庫、百科全書、日語字典和形態(tài)分析工具之外,還可以
使用搜索引擎1040。
關(guān)于識別權(quán)重的確定,可以使用關(guān)于第一信息處理裝置1020A的用戶 是否己經(jīng)使用搜索引擎1040來對作為話語識別的結(jié)果而獲得的關(guān)鍵字執(zhí) 行搜索的信息,或者第一信息處理裝置1020A的用戶的偏好。
隨后,關(guān)鍵字提取單元1237基于語言模型來計(jì)算各個所選擇的字序 列的語言分?jǐn)?shù)(步驟S1109)。這里,語言分?jǐn)?shù)是用于判斷所選擇的字序 列是否適合語言模型的數(shù)值。如果使用語法或者有限狀態(tài)自動機(jī)來作為語 言模型,則語言分?jǐn)?shù)是指示出字序列對于該語言模型是否可接受的數(shù)值。 如果使用靜態(tài)語言模型作為語言模型,則語言分?jǐn)?shù)是字序列的生成概率。 具體而言,如果使用語法或有限狀態(tài)自動機(jī)作為語言模型,則當(dāng)字序列對 于該語言模型可接受時,字序列的語言分?jǐn)?shù)為"1";當(dāng)字序列對于該語 言模型不可接受時,字序列的語言分?jǐn)?shù)為"0"。當(dāng)使用諸如n-gram或基 于類的n-gram之類的靜態(tài)語言模型來作為語言模型時,使用字序列的生成 概率作為語言分?jǐn)?shù)。在由本申請人提出的日本專利申請No. 2001-382579 (對應(yīng)于JP-A NO. 2003-186494)中描述了計(jì)算語言分?jǐn)?shù)的詳細(xì)方法。
隨后,關(guān)鍵字提取單元1237對在之前的步驟中計(jì)算得到的聲學(xué)分?jǐn)?shù) 和語言分?jǐn)?shù)進(jìn)行合成和排序,并利用該分?jǐn)?shù)來選擇字序列(步驟 Sllll),從而確定具有最大合成分?jǐn)?shù)的字序列作為識別結(jié)果(步驟 S1113)。具體而言,關(guān)鍵字提取單元1237將根據(jù)聲學(xué)模型來獲得的聲學(xué) 分?jǐn)?shù)和根據(jù)語言模型來獲得的語言分?jǐn)?shù)的乘積或算術(shù)和為最大的字序列確 定為識別結(jié)果。當(dāng)向在語言模型中使用的字典添加了諸如字的識別權(quán)重之類的信息時,可以使用其中并入了識別權(quán)重信息的語言分?jǐn)?shù)。
在這種情況下,從聲學(xué)和語言學(xué)角度來看最適合的字序列別確定為識 別結(jié)果。
隨后,關(guān)鍵字提取單元1237經(jīng)由通信單元1249來訪問關(guān)鍵字提取數(shù) 據(jù)庫1030,以對話語識別的結(jié)果和登記在關(guān)鍵字提取數(shù)據(jù)庫1030中的關(guān) 鍵字進(jìn)行比較(步驟S1115)。如果在話語識別的結(jié)果中包含登記在關(guān)鍵 字提取數(shù)據(jù)庫1030中的字,則關(guān)鍵字提取單元1237確定將提取該包含在 話語識別的結(jié)果中的字(步驟S1117)。
關(guān)鍵字提取單元1237可以被配置成在訪問關(guān)鍵字提取數(shù)據(jù)庫1030之 前訪問作為語音聊天的對應(yīng)方的第二信息處理裝置1020B,從而交換語音 聊天的識別結(jié)果。例如,通過交換語音信息或者講話者的說話方式,可以 提高話語識別的精確度。為了使信息處理裝置的話語識別的結(jié)果生效,可 以交換話語識別的結(jié)果的話題矢量。
通過使用上述話語識別方法和關(guān)鍵字提取方法,不僅可以適當(dāng)?shù)刈R別 語音聊天期間的談話內(nèi)容,而且可以適當(dāng)?shù)貜脑捳Z識別的結(jié)果中提取關(guān)鍵 字。
(關(guān)鍵字同步方法)
接下來,將參考圖33來詳細(xì)描述在根據(jù)本實(shí)施例的語音聊天系統(tǒng)中 的關(guān)鍵字同步方法。圖33是用于說明在根據(jù)第三實(shí)施例的語言聊天系統(tǒng) 中的關(guān)鍵字同步的流程圖。圖33示出了第一信息處理裝置1020A的用戶 對第二信息處理裝置1020B說話的情況。
當(dāng)?shù)谝恍畔⑻幚硌b置1020A的用戶向與第一信息處理裝置1020A相連 接的諸如麥克風(fēng)或頭戴式耳機(jī)之類的語音輸入單元1231發(fā)出聲音時,語 音輸入單元1231根據(jù)用戶所發(fā)出的聲音來生成語音數(shù)據(jù)(步驟S1201)。 所生成的語音數(shù)據(jù)被發(fā)送到參數(shù)提取單元1235和語音談話控制單元 1239。語音談話控制單元1239經(jīng)由通信單元1249將所生成的語音數(shù)據(jù)發(fā) 送到第二信息處理裝置1020B,從而在第一和第二信息處理裝置1020A和 1020B之間進(jìn)行語音談話(步驟S1203)。
參數(shù)提取單元1235將語音數(shù)據(jù)和所提取的各種參數(shù)發(fā)送到關(guān)鍵字提取單元1237,并且關(guān)鍵字提取單元1237對語音數(shù)據(jù)執(zhí)行話語識別,以從 話語識別的結(jié)果中提取關(guān)鍵字。隨后,關(guān)鍵字提取單元1237經(jīng)由通信單 元1249來與第二信息處理裝置1020B交換話語識別的結(jié)果(步驟 S1205),以提高話語識別的結(jié)果的精確度。之后,關(guān)鍵字提取單元1237 經(jīng)由通信單元1249來訪問與通信網(wǎng)絡(luò)1012相連接的關(guān)鍵字提取數(shù)據(jù)庫 1030 (步驟S1207)。關(guān)鍵字提取數(shù)據(jù)庫1030向第一信息處理裝置1020A 發(fā)出參考許可,從而允許參考登記在其中的數(shù)據(jù)庫(步驟S1209)。第-一 信息處理裝置1020A的關(guān)鍵字提取單元1237通過參考關(guān)鍵字提取數(shù)據(jù)庫 1030來提取關(guān)鍵字(步驟S1211)。
當(dāng)提取關(guān)鍵字時,關(guān)鍵字提取單元1237可以被配置成訪問搜索引擎 1040等,并基于偏好來提取搜索引擎1040的較高等級的搜索關(guān)鍵字或者 頻繁地被用作博客中的話題的術(shù)語。語音聊天的話題通常是在語音聊天時 流行的話題。因此,與這樣的話題相關(guān)的關(guān)鍵字極有可能是搜索引擎1040 的較高等級的搜索關(guān)鍵字或者頻繁地被用作博客中的話題的術(shù)語。因此, 通過基于偏好來提取這樣的關(guān)鍵字,可以更高效地執(zhí)行關(guān)鍵字提取。
隨后,關(guān)鍵字提取單元1237將所提取的關(guān)鍵字發(fā)送到信息搜索單元 1243,并且信息搜索單元1243將發(fā)送而來的關(guān)鍵字以與發(fā)送時間相關(guān)聯(lián) 的方式來存儲在存儲單元1251中(步驟S1213)。隨后,信息搜索單元 1243判斷所發(fā)送而來的關(guān)鍵字是否為在當(dāng)前的語音聊天期間之前提取的舊 關(guān)鍵字(步驟S1215)。如果所發(fā)送而來的關(guān)鍵字是之前沒有提取的新關(guān) 鍵字,則關(guān)鍵字提取單元1237新登記這些關(guān)鍵字(步驟S1219)。
如果所發(fā)送而來的關(guān)鍵字是舊關(guān)鍵字,則信息搜索單元1243搜索這 些舊關(guān)鍵字的發(fā)送時間,并判斷在發(fā)送時間之后是否已經(jīng)過了預(yù)定時間段 (例如,5分鐘)(步驟S1217)。在以上判斷步驟中使用的預(yù)定時間段 并不限于此,而可以設(shè)置成任意時間段。如果在這些舊關(guān)鍵字的發(fā)送時間 之后還沒有過預(yù)定時間段,則信息搜索單元1243丟棄所發(fā)送而來的關(guān)鍵 字,并且關(guān)鍵字提取處理結(jié)束。如果在這些舊關(guān)鍵字的發(fā)送時間之后已經(jīng) 過了預(yù)定時間段,則信息搜索單元1243更新新關(guān)鍵字的發(fā)送時間并重新 登記這些關(guān)鍵字(步驟S1219)。當(dāng)關(guān)鍵字被新登記時,信息搜索單元1243將新登記的關(guān)鍵字發(fā)送到
關(guān)鍵字同步單元1245。在接收到這些關(guān)鍵字之后,關(guān)鍵字同步單元1245 經(jīng)由通信單元1249將發(fā)送而來的關(guān)鍵字發(fā)送給第二信息處理裝置1020B
(步驟S1221)。利用這樣的發(fā)送處理來進(jìn)行對第一信息處理裝置1020A 所提取的關(guān)鍵字與作為語音聊天的對應(yīng)方的第二信息處理裝置1020B進(jìn)行 同步的同步處理。這里,同步處理僅涉及關(guān)鍵字的交換。因此,無需在信 息處理裝置的存儲器上準(zhǔn)備同步區(qū)域。
在登記了新關(guān)鍵字的第一信息處理裝置1020A中,信息搜索單元 1243經(jīng)由通信單元1249來訪問與通信網(wǎng)絡(luò)1012相連接的搜索引擎1040
(步驟S1223),并獲取針對這些新關(guān)鍵字的搜索結(jié)果以及描述了與這些 關(guān)鍵字相關(guān)的文章的URL等的元數(shù)據(jù)(步驟S1225)。之后,信息搜索單 元1243將所獲得的信息存儲在搜索信息聚積單元1253中,并將所獲得的 信息發(fā)送到顯示單元1247。隨后,顯示單元1247通過瀏覽器等來在顯示 設(shè)備上顯示發(fā)送而來的信息(步驟S1227)。
在關(guān)鍵字被發(fā)往的第二信息處理裝置1020B中,與第一信息處理裝置 1020A相獨(dú)立地執(zhí)行對關(guān)鍵字是否是舊的的判斷,并且如果是舊的則判斷 是否已經(jīng)過了預(yù)定時間段。如果關(guān)鍵字不是舊的,或者雖然是舊的但已經(jīng) 過了預(yù)定時間段,則第二信息處理裝置1020B新登記所發(fā)送而來的關(guān)鍵 字。
之后,第二信息處理裝置1020B訪問搜索引擎1040 (步驟S1229), 并獲取描述了發(fā)送而來的關(guān)鍵字的URL等的元數(shù)據(jù)(步驟S1231)。與第 一信息處理裝置1020A相同,第二信息處理裝置1020B將所獲得的信息存 儲在搜索信息聚積單元1253中,并將所獲得的信息發(fā)送到顯示單元 1247。隨后,顯示單元1247通過瀏覽器等來在顯示設(shè)備上顯示所發(fā)送來 的信息(步驟S1233)。
從將語音聊天期間的談話內(nèi)容輸入到第一信息處理裝置1020A的步驟 開始到對關(guān)鍵字進(jìn)行同步以顯示針對與關(guān)鍵字相關(guān)的信息的搜索結(jié)果的步 驟為止的處理被第一信息處理裝置1020A自動地執(zhí)行。因此,第一信息處 理裝置1020A的用戶無需做任何針對話語識別、關(guān)鍵字檢測、和關(guān)鍵字同步處理的專門操作。因此,第一信息處理裝置1020A的用戶可以全神貫注
于語音聊天。同時,在第二信息處理裝置1020B中,關(guān)鍵字同步處理和信 息搜索結(jié)果顯示處理也被自動地執(zhí)行。第二信息處理裝置1020B的用戶無 需做任何針對這些處理的專門操作,并且可以全神貫注于語音聊天。
如上所述,第一信息處理裝置1020A基于第一信息處理裝置1020A的 用戶所發(fā)出的聲音來執(zhí)行關(guān)鍵字提取,隨后針對第二信息處理裝置1020B 來執(zhí)行關(guān)鍵字同步。其結(jié)果是,己經(jīng)執(zhí)行關(guān)鍵字提取的第一信息處理裝置 1020A和已經(jīng)進(jìn)行關(guān)鍵字同步的第二信息處理裝置1020B使用搜索引擎 1040來執(zhí)行搜索并以相互獨(dú)立的方式來顯示搜索結(jié)果。利用這樣的處理, 在第一和第二信息處理裝置1020A和1020B的顯示設(shè)備上,在具有與固有 通信延時相對應(yīng)的很小的時間延遲的情況下基本同時顯示相同的關(guān)鍵字和 相同的與關(guān)鍵字相關(guān)的文章。由于與關(guān)鍵字相關(guān)的信息也被顯示,所以可 以自動地提供可以用作語音聊天的話題的信息,并因而擴(kuò)展了語音聊天的 談話。
已經(jīng)描述了第一信息處理裝置1020A的用戶向第二信息處理裝置 1020B發(fā)出聲音的情況。但是,針對第二信息處理裝置1020B的用戶向第 一信息處理裝置1020A發(fā)出聲音的情況可以類似地執(zhí)行上述處理。在這種 情況下,第二信息處理裝置1020B執(zhí)行語音數(shù)據(jù)的生成和關(guān)鍵字的提取, 獲得新登記的關(guān)鍵字,并執(zhí)行針對第一信息處理裝置1020A的關(guān)鍵字同步 處理。其結(jié)果是,由第一和第二信息處理裝置1020A和1020B以類似于上 述方式的獨(dú)立且并行的方式來執(zhí)行關(guān)鍵字相關(guān)信息的搜索和搜索結(jié)果的顯 示。這樣,語音聊天期間的談話的輸入(語音數(shù)據(jù)的生成)和關(guān)鍵字的提
取被各個信息處理裝置以獨(dú)立且并行的方式來處理。
當(dāng)?shù)谝缓偷诙畔⑻幚硌b置1020A和1020B之間的語音聊天結(jié)束時,
登記在信息處理裝置1020A和1020B中的關(guān)鍵字和與關(guān)鍵字相關(guān)的臨時信 息被刪除,并且新的關(guān)鍵字被登記以待稍后使用。
在以上描述中,關(guān)鍵字提取數(shù)據(jù)庫1030被獨(dú)立地與連接到第一信息 處理裝置1020A的通信網(wǎng)絡(luò)1012相連接。關(guān)鍵字提取數(shù)據(jù)庫1030可以設(shè) 置在第一信息處理裝置1020A中。在這種情況下,關(guān)鍵字提取數(shù)據(jù)庫1030例如被存儲在第一信息處理裝置1020A的數(shù)據(jù)庫存儲單元中。當(dāng)關(guān)鍵 字提取數(shù)據(jù)庫1030被設(shè)置在第一信息處理裝置1020A中時,可以消除關(guān) 鍵字提取期間的通信時間延遲。因此,可以以縮短的時間段來執(zhí)行關(guān)鍵字 提取。數(shù)據(jù)庫存儲單元可以獨(dú)立地設(shè)置在第一信息處理裝置1020A中,或 者可以設(shè)置在第一信息處理裝置1020A的存儲單元1251中。
在以上描述中,搜索引擎1040被獨(dú)立地與連接到第一信息處理裝置 1020A的通信網(wǎng)絡(luò)1012相連接。但是,第一信息處理裝置1020A可以包 括搜索引擎1040。當(dāng)搜索引擎1040設(shè)置在第一信息處理裝置1020A中 時,可以消除信息搜索期間的通信時間延遲。因此,可以以縮短的時間段 來執(zhí)行信息搜索。
(搜索結(jié)果顯示屏幕)
接下來,將參考圖34來詳細(xì)描述根據(jù)本實(shí)施例的信息搜索結(jié)果顯示 屏幕的示例。圖34是示出由根據(jù)第三實(shí)施例的信息處理裝置顯示的搜索 信息顯示的示例的示意圖。
搜索結(jié)果顯示屏幕1050以更新方式顯示了在顯示屏幕上的、語音聊 天期間檢測到的關(guān)鍵字。在該顯示屏幕上,較新的關(guān)鍵字被置于上面部 分,而較舊的關(guān)鍵字被置于下面部分??梢赃m當(dāng)?shù)卦O(shè)置可以在一個屏幕上 顯示的關(guān)鍵字的最大數(shù)目。當(dāng)關(guān)鍵字的數(shù)目超過該最大值時,首先刪除屏 幕上最下方的關(guān)鍵字。
在圖34的示例中,關(guān)鍵字被顯示在欄1503中,其中,具有在欄1501 中的按它們的登記時間來指派的索引號。較新的關(guān)鍵字,即,在欄1503 中的、欄1501中的索引號較大的關(guān)鍵字被顯示在上面部分。除了索引號 欄1501和關(guān)鍵字欄1503之外,顯示屏幕還包括鎖定(pin lock)復(fù)選框欄 1505和刪除復(fù)選框欄1507。對各個關(guān)鍵字提供鎖定復(fù)選框和刪除復(fù)選 框。鎖定復(fù)選框用于鎖定關(guān)鍵字,以使得被鎖定的關(guān)鍵字保留在屏幕上。 刪除復(fù)選框用于選擇在更新所顯示的內(nèi)容時將被刪除的關(guān)鍵字。
欄1503中的關(guān)鍵字與它們的搜索結(jié)果顯示屏幕相鏈接,搜索結(jié)果顯 示屏幕示出了欄1503中的關(guān)鍵字被使用搜索引擎1040來搜索時的搜索結(jié) 果。當(dāng)例如使用鼠標(biāo)來點(diǎn)擊欄1503中的關(guān)鍵字時,用戶可以看到針對該
85關(guān)鍵字的由搜索引擎1040搜索得到的搜索結(jié)果。
如果欄1505中的鎖定復(fù)選框被打鉤,則鎖定復(fù)選框選中的關(guān)鍵字被
移動到最上面的部分并且被鎖定。因此,即使當(dāng)在屏幕上顯示新的關(guān)鍵字 時,鎖定的關(guān)鍵字也不會被往下移動。如果存在多個鎖定關(guān)鍵字,則可以 按它們的登記時間來顯示它們。
在所登記的從語音聊天期間的談話對話中提取出來的關(guān)鍵字中,可能 存在對信息處理裝置的用戶在語音聊天時沒有用的關(guān)鍵字。在這樣的情況
下,通過對相應(yīng)的關(guān)鍵字旁邊的欄1507中的刪除復(fù)選框打鉤,可以在更 新所顯示的內(nèi)容時刪除該關(guān)鍵字。
關(guān)于欄1503中的一個關(guān)鍵字,不僅顯示該關(guān)鍵字的表示,而且還例 如在欄1503中的相應(yīng)關(guān)鍵字下方的欄1509中的縮略圖中顯示記載在搜索 引擎1040中的與欄1503中的關(guān)鍵字相關(guān)的文章。當(dāng)用戶例如使用鼠標(biāo)指 針來點(diǎn)擊欄1509中的與關(guān)鍵字相關(guān)的文章時,欄1509中的文章被鏈接到 記載在搜索引擎1040中的文章的全文。也對欄1509中的各篇文章提供欄 1505中的鎖定復(fù)選框和欄1507中的刪除復(fù)選框??梢燥@示在欄1509中的 與欄1503中的關(guān)鍵字相關(guān)的文章的數(shù)目并不限于圖中所示的情況,而可 以被任意地設(shè)置。顯示在搜索結(jié)果顯示屏幕1050的欄1509中的文章可以 是在搜索引擎1040中頻繁參考的文章。
在圖34所示的搜索結(jié)果顯示屏幕1050的示例中,在語音聊天期間, 關(guān)鍵字"力、〉厶(人名,發(fā)音為Cassim)"、"代表(代表,發(fā)音為 daihyou )"、" <工乂 > (國名,Yemen )"、"千葉(地名, Chiba)"、"牧(發(fā)音為boku)"被順序地提取。由于關(guān)鍵字"力-〉厶 (人名,發(fā)音為Cassim)"的鎖定復(fù)選框被打鉤,因此雖然它是所登記的 關(guān)鍵字中的最舊的關(guān)鍵字,但是它被顯示在顯示屏幕1050的最上面部分。 關(guān)鍵字"代表(代表,發(fā)音為daihyou)"和與關(guān)鍵字"牧(發(fā)音為 boku)"相關(guān)的信息"新潟市牧支所*一^《一7'(新滹市社會福利協(xié)會 的主頁)"的刪除復(fù)選框被打鉤。因此,該關(guān)鍵字和關(guān)鍵字相關(guān)信息在所 顯示的內(nèi)容被更新時被刪除。
關(guān)于在顯示屏幕1050的欄1503中顯示的關(guān)鍵字,相同的關(guān)鍵字基本同時被安裝在語音聊天的各個講話者的信息處理裝置1020中的關(guān)鍵字同
步單元1245顯示在各個信息處理裝置1020的屏幕上。但是,由于鎖定復(fù) 選框和刪除復(fù)選框的打鉤是由各個講話者獨(dú)立操作的,所以隨著語音聊天 的進(jìn)展,不同的內(nèi)容可以被顯示在信息處理裝置1020的各個顯示屏幕 1050上。
(搜索信息的參考?xì)v史數(shù)據(jù))
接下來,將參考圖35來描述根據(jù)本實(shí)施例的、在關(guān)鍵字提取期間使 用搜索信息的參考?xì)v史的方法。圖35是示出根據(jù)第三實(shí)施例的搜索信息 的參考?xì)v史數(shù)據(jù)的示意圖。
在根據(jù)本實(shí)施例的信息處理裝置1020中,信息處理裝置1020的用戶 在搜索結(jié)果顯示屏幕1050上選擇的欄1503中的關(guān)鍵字被以與信息相關(guān)聯(lián) 的方式、作為參考?xì)v史數(shù)據(jù)來存儲在參考?xì)v史存儲單元1255中,例如如 圖35所示。
如圖35所示,參考?xì)v史數(shù)據(jù)包括欄1601中的用戶所選擇的關(guān)鍵字、 欄1603中的表示欄1601中的關(guān)鍵字的選擇次數(shù)的權(quán)重信息、欄1605中的 會話(session) ID、以及欄1607中的表示被賦予了會話ID的各個語音聊 天的對應(yīng)方的談話對應(yīng)方信息,其中,欄1605中的會話ID是用于標(biāo)識欄 1601中的關(guān)鍵字被選擇的語音聊天的標(biāo)識符。
欄1603中的權(quán)重信息是表示在本實(shí)施例的語音聊天系統(tǒng)1010中選擇 欄1601中的關(guān)鍵字的次數(shù)的信息。在圖35所示的參考?xì)v史信息中,關(guān)鍵 字"- x八。 > 力'7 y (japan Cup)"總共被選擇兩次;而關(guān)鍵字"寸'> 7" 口 " (Zanblock)"和"牧(Maki)"分別被選擇一次。
在根據(jù)本實(shí)施例的語音聊天系統(tǒng)中,無論何時執(zhí)行語音聊天,都對各 個語音聊天會話賦予欄1605中的包括語音聊天的日期和在該日期中的語 音聊天的會話次數(shù)在內(nèi)的會話ID。在圖35所示的參考?xì)v史數(shù)據(jù)中,關(guān)鍵 字"、y、 X /、° >力7 7° (japan Cup)"被選擇兩次 一次在會話ID "200609150001"的語音聊天中; 一次在會話ID "200609150002"的語音 聊天中。
欄1607中的談話對應(yīng)方信息是表示欄1601中的關(guān)鍵字被選擇的語音聊天的對應(yīng)方的數(shù)據(jù)。在圖35所示的參考?xì)v史數(shù)據(jù)中,關(guān)鍵字〃 >力'乂 7。 (Japan Cup)"被兩個參與者選擇了兩次 一次在會話ID "200609150001 "的語音聊天中被參與者"A"選擇; 一次在會話ID "200609150002"的語音聊天中被參與者"B"選擇。
在根據(jù)本實(shí)施例的信息處理裝置1020中,可以在從語音數(shù)據(jù)中提取 關(guān)鍵字時使用這樣的參考?xì)v史數(shù)據(jù)。通過使用參考?xì)v史數(shù)據(jù),可以獲取諸 如談話對應(yīng)方談話題的定向性或者字之間的相關(guān)性之類的信息。利用這樣 的信息,可以更高效地執(zhí)行話語識別或者關(guān)鍵字提取。以下,將簡要描述 使用參考?xì)v史信息的方式。
根據(jù)本實(shí)施例的關(guān)鍵字提取單元1237可以參考存儲了上述參考?xì)v史 數(shù)據(jù)的參考?xì)v史存儲單元1255,以在執(zhí)行話語識別時使用在參考?xì)v史數(shù)據(jù) 中包含的各種信息來作為在話語識別中使用的參考信息中的一個。例如, 當(dāng)執(zhí)行話語識別時,關(guān)鍵字提取單元1237可以通過參考參考?xì)v史存儲單 元1255來提高參考?xì)v史數(shù)據(jù)的權(quán)重信息欄1603中的數(shù)目較大的關(guān)鍵字的 話語識別優(yōu)先級。因此,可以高效地執(zhí)行話語識別。
當(dāng)關(guān)鍵字提取單元1237所識別的關(guān)鍵字被登記在參考?xì)v史數(shù)據(jù)中 時,可以提高在會話ID與所登記的關(guān)鍵字相同的聊天會話中選擇的另一 個關(guān)鍵字的話語識別優(yōu)先級。這是因?yàn)榭梢灶A(yù)測到具有相同會話ID的關(guān) 鍵字彼此強(qiáng)相關(guān)。
當(dāng)關(guān)鍵字提取單元1237所識別的關(guān)鍵字被登記在參考?xì)v史數(shù)據(jù)中 時,可以提高由與所登記的關(guān)鍵字相同的談話對應(yīng)方選擇的另一個關(guān)鍵字 的話語識別優(yōu)先級。這是因?yàn)榭梢灶A(yù)測到在語音聊天期間由同一談話對應(yīng) 方選擇的關(guān)鍵字在談話對應(yīng)方談話題的定向性方面相互一致。
如上所述,根據(jù)本實(shí)施例的信息處理裝置1020,通過有效地反饋參考 歷史數(shù)據(jù),變得可以更高效地執(zhí)行話語識別和關(guān)鍵字提取。 (信息處理裝置的修改示例)
接下來,將參考圖36A到36D來簡要描述根據(jù)本實(shí)施例的信息處理裝 置1020的修改示例。圖36A是用于說明根據(jù)第三實(shí)施例的信息處理裝置 的話語識別方法的簡要框圖。圖36B到36D是用于說明根據(jù)第三實(shí)施例的信息處理裝置的話語識別方法的修改示例的簡要框圖。
在圖36A到36D所示的信息處理裝置1020A和1020B中,僅示出了 各個信息處理裝置的一些處理單元。不言而言,除了所示出的處理單元之 外,圖31所示的處理單元也包括在這些信息處理裝置中。
在根據(jù)本實(shí)施例的信息處理裝置1020中,如圖36A所示,已經(jīng)描述 了這樣的情況,其中,執(zhí)行語音聊天的第一和第二信息處理裝置1020A和 1020B接收由相應(yīng)用戶發(fā)出的聲音,從而致使話語識別單元1233執(zhí)行話語 識別并致使關(guān)鍵字同步單元1245執(zhí)行關(guān)鍵字同步處理。但是,本實(shí)施例 的信息處理裝置可以按以下方式來修改。 (第一修改示例)
圖36B的第一修改示例示出了執(zhí)行這樣的情況,其中,語音聊天的信 息處理裝置1020A和1020B將相應(yīng)用戶所發(fā)出的聲音如其原樣地發(fā)送給它 們的對應(yīng)方信息處理裝置,并對所接收的由對應(yīng)方信息處理裝置的用戶發(fā) 出的聲音執(zhí)行話語識別。
具體而言,第一信息處理裝置1020A的用戶所發(fā)出的聲音經(jīng)由語音談 話控制單元1239和通信單元1249而被如其原樣地發(fā)送到第二信息處理裝 置1020B,并被第二信息處理裝置1020B話語識別。類似地,第二信息處 理裝置1020B的用戶所發(fā)出的聲音經(jīng)由語音談話控制單元1239和通信單 元1249而被如其原樣地發(fā)送到第一信息處理裝置1020A,并被第一信息 處理裝置1020A話語識別。在本修改示例中,在第一和第二信息處理裝置 1020A和1020B中都執(zhí)行話語識別、關(guān)鍵字提取、和關(guān)鍵字相關(guān)信息搜 索。
(第二修改示例)
圖36C的第二修改示例示出了這樣的情況,其中,僅在一個信息處理 裝置中執(zhí)行話語識別,并在另一個信息處理裝置中執(zhí)行關(guān)鍵字同步和信息 搜索。具體而言,在第一信息處理裝置1020A中執(zhí)行話語識別,并在第二 信息處理裝置1020B中執(zhí)行關(guān)鍵字同步處理。第一信息處理裝置1020A的 用戶所發(fā)出的聲音被話語識別單元1233話語識別并被關(guān)鍵字提取,然后 被發(fā)送到第二信息處理裝置1020B。然后,第二信息處理裝置1020B執(zhí)行關(guān)鍵字同步處理和關(guān)鍵字相關(guān)信息的搜索。第二信息處理裝置1020B的用
戶所發(fā)出的聲音被如其原樣地發(fā)送到第一信息處理裝置1020A,隨后被話 語識別單元1257話語識別并被關(guān)鍵字提取。
在圖36C的示例中,話語識別在第一信息處理裝置1020A中被獨(dú)立地 執(zhí)行。但是,話語識別可以在第二信息處理裝置1020B中被獨(dú)立地執(zhí)行。 在圖36C的示例中,在第一信息處理裝置1020A中提供了兩個獨(dú)立話語識 別單元。但是,上述話語識別可以僅通過一個話語識別單元來執(zhí)行。當(dāng)一 個信息處理裝置的處理能力遠(yuǎn)高于另一個信息處理裝置時,本修改示例會 很有用,反之亦然。 (第三修改示例)
圖36D的第三修改示例示出了這樣的情況,其中,幾乎不在信息處理 裝置中而是在中繼信息處理裝置之間的連接的服務(wù)器1016中執(zhí)行話語識 別,并且信息處理裝置僅執(zhí)行關(guān)鍵字同步和信息搜索。具體而言,第一信 息處理裝置1020A的用戶所發(fā)出的聲音被如其原樣地發(fā)送到服務(wù)器 1016,并被服務(wù)器1016的話語識別單元1161話語識別,從而被發(fā)送到第 二信息處理裝置1020B。同時,第二信息處理裝置1020B的用戶所發(fā)出的 聲音被如其原樣地發(fā)送到服務(wù)器1016,并被服務(wù)器1016的話語識別單元 1163話語識別,從而被發(fā)送到第一信息處理裝置1020A。在圖36D的示例 中,在服務(wù)器1016中提供了兩個獨(dú)立的話語識別單元。但是,上述話語 識別可以僅由 一個話語識別單元來執(zhí)行。 (第四實(shí)施例)
以下,將詳細(xì)描述根據(jù)本發(fā)明第四實(shí)施例的關(guān)鍵字提取系統(tǒng)。 圖37是示出根據(jù)本發(fā)明第四實(shí)施例的關(guān)鍵字提取系統(tǒng)的配置的示意 圖。如圖37所示,根據(jù)本實(shí)施例的關(guān)鍵字提取系統(tǒng)1011包括通信網(wǎng)絡(luò) 1012、關(guān)鍵字提取數(shù)據(jù)庫1030、搜索引擎1040、以及信息處理裝置 1020A和1020B (在下文中,有時候統(tǒng)稱為信息處理裝置1020)。信息處 理裝置1020A與家庭網(wǎng)絡(luò)1018內(nèi)的外部顯示設(shè)備1070相連接。信息處理 裝置1020A和1020B以及外部顯示設(shè)備1070可以接收從廣播站1080發(fā)送 而來的廣播信息。通信網(wǎng)絡(luò)1012、關(guān)鍵字提取數(shù)據(jù)庫1030和搜索引擎1040具有與根據(jù) 第三實(shí)施例的通信網(wǎng)絡(luò)1012、關(guān)鍵字提取數(shù)據(jù)庫1030和搜索引擎1040相 同的配置并提供基本相同的效果,并且將省略對它們的詳細(xì)描述。
信息處理裝置1020以語音方式與經(jīng)由通信網(wǎng)絡(luò)1012而連接到其的另 一個信息處理裝置1020執(zhí)行聊天(語音聊天)。信息處理裝置1020可以 經(jīng)由通信網(wǎng)絡(luò)1012來請求經(jīng)由通信網(wǎng)絡(luò)1012而與其相連接的搜索引擎 1040執(zhí)行數(shù)據(jù)庫的參考或者信息的搜索。
執(zhí)行語音聊天的另一個信息處理裝置1020可以經(jīng)由通信網(wǎng)絡(luò)1012來 連接到信息處理裝置1020,如圖所示。可替代地,另一個信息處理裝置 1020可以直接而非經(jīng)由通信網(wǎng)絡(luò)1012來連接到USB端口、諸如i丄ink之 類的IEEE 1394端口、 SCSI端口、 RS-232C端口等。
信息處理裝置1020與家庭網(wǎng)絡(luò)1018內(nèi)的稍后將描述的外部顯示設(shè)備 1070相連接,因此,可以在信息處理裝置1020和外部顯示設(shè)備1070之間 進(jìn)行各種數(shù)據(jù)的通信。信息處理裝置1020和外部顯示設(shè)備1070之間的連 接可以經(jīng)由諸如HDMI-CEC (高清晰多媒體接口-消費(fèi)電子控件)之類的 連接端口來執(zhí)行。信息處理裝置1020可以使用設(shè)置在其中的接收功能來 接收包含從稍后將描述的廣播站1080發(fā)送而來的廣播信息的廣播電波。
在圖示的示例中,信息處理裝置1020是臺式PC,但是,在本實(shí)施例 中,信息處理裝置1020可以是筆記本式PC。
在本實(shí)施例中,信息處理裝置1020并不限于上述示例,而可以例如 由電視機(jī)機(jī)頂盒、諸如家用游戲機(jī)之類的信息設(shè)備、移動電話、PDA等來 構(gòu)成,只要是能夠具有經(jīng)由網(wǎng)絡(luò)來通信的功能的設(shè)備即可。另外或者可替 代地,信息處理裝置1020可以是由擁有者攜帶的便攜式設(shè)備,例如,便 攜式游戲機(jī)、PHS、或者便攜式視頻/音頻播放機(jī)。
外部顯示設(shè)備1070是顯示單元,例如,CRT顯示單元、液晶顯示單 元、等離子顯示面板單元、或者電致發(fā)光(EL)顯示單元。外部顯示設(shè)備 1070接收包含從稍后將描述的廣播站1080發(fā)送而來的廣播信息的廣播電 波,并在顯示單元的顯示區(qū)域上顯示廣播信息的內(nèi)容。這里,從廣播站發(fā) 送而來的廣播信息指的是通過諸如單波段數(shù)字廣播或者12波段數(shù)字廣播(下文中稱為全波段數(shù)字廣播)之類的地面數(shù)字廣播、有線廣播、或者經(jīng) 由網(wǎng)絡(luò)的因特網(wǎng)廣播來提供的諸如廣播文本信息、廣播音頻信息、或者視 頻信息之類的數(shù)據(jù)。包含廣播信息的廣播電波指的是諸如單波段數(shù)字廣播 或者全波段數(shù)字廣播之類的地面數(shù)字廣播的電波。外部顯示設(shè)備1070可
以經(jīng)由諸如HDMI-CEC之類的連接端口將所接收的廣播信息發(fā)送到信息 處理裝置1020。外部顯示設(shè)備1070可以接收從信息處理裝置1020發(fā)送而 來的各種數(shù)據(jù),并顯示與該數(shù)據(jù)相對應(yīng)的信息。
以下,將通過地面數(shù)字廣播的示例來描述第四實(shí)施例。 廣播站1080發(fā)送包含廣播信息的廣播電波,其中,該廣播信息包含 以下數(shù)據(jù)廣播文本信息、廣播音頻信息和視頻信息。外部顯示設(shè)備1070 接收從廣播站1080發(fā)送而來的廣播電波,并顯示字幕信息或者輸出基于 在廣播電波中包含的廣播文本信息的聲音。信息處理裝置1020可以接收 從廣播站1080發(fā)送而來的廣播電波,以在各種處理中使用廣播電波的內(nèi) 容。
(信息處理裝置1020的配置)
接下來,將詳細(xì)描述根據(jù)本實(shí)施例的信息處理裝置1020的配置。根 據(jù)本實(shí)施例的信息處理裝置1020的硬件配置與根據(jù)第三實(shí)施例的硬件配 置基本相同,并且將省略對它的詳細(xì)描述。
圖38是用于說明根據(jù)第四實(shí)施例的信息處理裝置1020的配置的框 圖。如圖38所示,根據(jù)本實(shí)施例的信息處理裝置1020包括關(guān)鍵字同步單 元1245、顯示單元1247、通信單元1249、存儲單元1251、廣播文本信息 接收單元1261、關(guān)鍵字提取單元1263、信息搜索單元1265、以及外部顯 示設(shè)備連接控制單元1267。
關(guān)鍵字同步單元1245經(jīng)由通信單元1249將關(guān)鍵字提取單元1237從語 音數(shù)據(jù)中提取的關(guān)鍵字發(fā)送到其它信息處理裝置1020,從而同步第一和第 二信息處理裝置1020A和1020B。關(guān)鍵字同步處理不僅可以在從信息處理 裝置1020到另一個信息處理裝置1020的方向上執(zhí)行,而且可以按以下方 式在從另一個信息處理裝置1020到信息處理裝置1020的方向上執(zhí)行。 即,信息處理裝置1020可以響應(yīng)于由另一個信息處理裝置1020啟動的關(guān)鍵字同步處理,從而使得從另一個信息處理裝置1020發(fā)送的關(guān)鍵字被信
息處理裝置1020接收。
顯示單元1247例如經(jīng)由瀏覽器應(yīng)用將從信息搜索單元1265發(fā)送而來 的信息搜索結(jié)果顯示給為信息處理裝置1020設(shè)置的諸如顯示器等的輸出 設(shè)備。信息搜索單元1265從搜索引擎1040獲得的信息包含信息或文章在 搜索引擎1040中的URL等。因此,當(dāng)信息處理裝置1020的用戶通過與信 息處理裝置1020相連接的諸如鼠標(biāo)或鍵盤之類的輸入設(shè)備來選擇被顯示 的信息時,顯示單元1247請求信息搜索單元1265獲取被選擇的信息的細(xì)
通信單元1249例如是安裝在信息處理裝置1020中的通信設(shè)備。通信 單元1249對在信息處理裝置1020 (具體而言,是信息處理裝置1020的信 息搜索單元1265、關(guān)鍵字提取單元1263、和關(guān)鍵字同步單元1245)與信 息處理裝置1020的外部設(shè)備(具體而言,是關(guān)鍵字提取數(shù)據(jù)庫1030、搜 索引擎1040)或者另一個信息處理裝置1020之間的經(jīng)由通信網(wǎng)絡(luò)1012的 信息通信進(jìn)行中繼。
此外,通信單元1249可以與直接而非經(jīng)由通信網(wǎng)絡(luò)1012來連接到信 息處理裝置1020的另一個信息處理裝置進(jìn)行信息通信。
存儲單元1251例如是安裝在信息處理裝置1020中的存儲設(shè)備,并且 在其中存儲諸如關(guān)鍵字提取單元1263所提取的關(guān)鍵字或信息搜索單元 1265所獲得的搜索信息之類的數(shù)據(jù)。除了這些數(shù)據(jù)之外,存儲單元1251 還可以在其中存儲各種數(shù)據(jù)庫。此外,存儲單元1251還可以適當(dāng)?shù)卦谄?中存儲在信息處理裝置1020執(zhí)行處理時需要存儲的各種參數(shù)以及該處理 的進(jìn)程信息。在廣播文本信息接收單元1261、關(guān)鍵字同步單元1245等自 由地執(zhí)行對存儲單元1251的讀寫時,存儲單元1251可被訪問。存儲單元 1251還包括搜索信息聚積單元1253和參考?xì)v史存儲單元1255。
搜索信息聚積單元1253以關(guān)聯(lián)方式來聚積信息獲取數(shù)據(jù)和信息搜索 單元1265所獲得的搜索信息。當(dāng)需要顯示已經(jīng)獲得的搜索信息時,可以 參考存儲在搜索信息聚積單元1253中的信息以顯示該已經(jīng)獲得的搜索信 息。參考?xì)v史存儲單元1255將在顯示單元1247上顯示的關(guān)鍵字或文章中 的、信息處理裝置1020的用戶為了更詳細(xì)的信息而參考的關(guān)鍵字存儲作 為參考?xì)v史。參考?xì)v史是這樣的數(shù)據(jù),該數(shù)據(jù)包括所參考的關(guān)鍵字、所參 考關(guān)鍵字的權(quán)重信息、已經(jīng)參考關(guān)鍵字的語音聊天自身的標(biāo)識符、以及語 音聊天的對應(yīng)方。當(dāng)關(guān)鍵字提取單元1263提取關(guān)鍵字時可以使用存儲在 參考?xì)v史存儲單元1255中的參考?xì)v史。信息搜索單元1265、關(guān)鍵字同步單元1245、和顯示單元1247可以用 專用于各種功能的專用硬件來構(gòu)成,并且可以被設(shè)置為諸如話語識別程序 之類的應(yīng)用程序。廣播文本信息接收單元1261從外部顯示設(shè)備1070獲取關(guān)于外部顯示 設(shè)備1070當(dāng)前正通過其來接收的廣播頻道的接收頻道信息。這里,接收 頻道信息指的是表示下述廣播頻道的信息,其中,外部顯示設(shè)備1070當(dāng) 前正通過該廣播頻道來進(jìn)行接收。廣播文本信息接收單元1261可以通過 從外部顯示設(shè)備1070獲取接收頻道信息來同步廣播文本信息接收單元 1261的接收廣播頻道與外部顯示設(shè)備1070的接收廣播頻道。廣播文本信息接收單元1261基于所獲得的接收頻道信息直接從廣播 站1080接收與外部顯示設(shè)備1070的接收廣播頻道相對應(yīng)的廣播電波。此 時,廣播文本信息接收單元1261可以被配置成直接接收從廣播站1080發(fā) 送而來的廣播電波中的單波段廣播電波,并從所接收的電波中獲取文本信 息。廣播文本信息接收單元1261可以被配置成直接接收從廣播站1080發(fā) 送而來的全波段廣播電波。廣播文本信息接收單元1261可以被配置成基于所獲得的接收頻道信 息來接收外部顯示設(shè)備1070所接收的并被從外部顯示設(shè)備1070發(fā)送到信 息處理裝置1020的廣播文本信息。廣播文本信息接收單元1261將所接收的廣播文本信息輸出到稍后將 描述的關(guān)鍵字提取單元1263。廣播文本信息接收單元1261可以將所接收 的廣播文本信息記錄在存儲單元1251中。關(guān)鍵字提取單元1263基于關(guān)鍵字提取數(shù)據(jù)庫1030從在廣播文本信息 接收單元1261所接收的廣播文本信息中包含的字符串中提取關(guān)鍵字。當(dāng)關(guān)鍵字提取單元1263提取關(guān)鍵字時,關(guān)鍵字提取單元1263可以經(jīng) 由通信單元1249來參考與通信網(wǎng)絡(luò)1012相連接的關(guān)鍵字提取數(shù)據(jù)庫 1030。
在表示廣播文本信息的字符串中包含多個關(guān)鍵字。關(guān)鍵字提取單元 1263自動地提取存在于該字符串中的所有關(guān)鍵字。關(guān)鍵字提取單元1263 將所提取的關(guān)鍵字發(fā)送給信息搜索單元1265和外部顯示設(shè)備連接控制單 元1267 (稍后將描述)。關(guān)鍵字提取單元1263可以將所提取的關(guān)鍵字存 儲在存儲單元1251中。
信息搜索單元1265以關(guān)聯(lián)方式將從關(guān)鍵字提取單元1263發(fā)送而來的 關(guān)鍵字和這些關(guān)鍵字被從關(guān)鍵字提取單元1263發(fā)送的時間存儲在存儲單 元1251中。信息搜索單元1265判斷是否要對從關(guān)鍵字提取單元1263發(fā)送 而來的關(guān)鍵字執(zhí)行關(guān)鍵字同步處理。當(dāng)判定關(guān)鍵字同歩處理應(yīng)當(dāng)被執(zhí)行 時,信息搜索單元1265將這些關(guān)鍵字發(fā)送到關(guān)鍵字同步單元1245,從而 請求執(zhí)行關(guān)鍵字同步處理。信息搜索單元1265經(jīng)由通信單元1249來訪問 搜索引擎1040,并執(zhí)行對從關(guān)鍵字提取單元1263發(fā)送而來的關(guān)鍵字的信 息搜索,從而獲取針對這些關(guān)鍵字的搜索結(jié)果和與這些關(guān)鍵字相關(guān)的文 章。信息搜索單元1265將所獲得的搜索結(jié)果存儲在存儲單元1251的搜索 搜索結(jié)果存儲單元1253中,并將搜索結(jié)果發(fā)送到顯示單元1247和外部顯 示設(shè)備連接控制單元1267 (稍后將描述)。這里,信息搜索單元1265從 搜索引擎1040獲得的搜索結(jié)果包括關(guān)于搜索關(guān)鍵字的信息在搜索引擎 1040中的標(biāo)題或URL以及信息的元數(shù)據(jù),例如信息的類型。
當(dāng)顯示單元1247或外部顯示設(shè)備連接控制單元1267請求獲取關(guān)于特 定關(guān)鍵字或與該關(guān)鍵字相關(guān)的文章的更詳細(xì)的信息時,信息搜索單元1265 經(jīng)由通信單元1249來訪問搜索引擎1040以獲取更詳細(xì)的信息,并將從顯 示單元1247或外部顯示設(shè)備連接控制單元1267通知的特定關(guān)鍵字存儲在 存儲單元1251的參考?xì)v史存儲單元1255中。
外部顯示設(shè)備連接控制單元1267執(zhí)行信息處理裝置1020和與信息處 理裝置1020相連接的外部顯示設(shè)備1070之間的連接控制。外部顯示設(shè)備 連接控制單元1267將關(guān)鍵字提取單元1263所提取的關(guān)鍵字和信息搜索單元1265所獲得的針對關(guān)鍵字的搜索結(jié)果發(fā)送到外部顯示設(shè)備1070。當(dāng)外 部顯示設(shè)備1070請求獲取關(guān)于特定關(guān)鍵字和與該關(guān)鍵字相關(guān)的文章的更 詳細(xì)的信息時,外部顯示設(shè)備連接控制單元1267可以將該請求發(fā)送到信 息搜索單元1265。當(dāng)信息搜索單元1265響應(yīng)于該請求而從搜索引擎1040 等獲得更詳細(xì)的信息時,外部顯示設(shè)備連接控制單元1267將信息搜索單 元1265所獲得的更詳細(xì)信息輸出到外部顯示設(shè)備1070。順便提及,當(dāng)將 與各種信息相對應(yīng)的數(shù)據(jù)發(fā)送到外部顯示設(shè)備1070時,外部顯示設(shè)備連 接控制單元1267可以將有待發(fā)送的數(shù)據(jù)的格式轉(zhuǎn)換成可以被外部顯示設(shè) 備1070顯示的格式。外部顯示設(shè)備連接控制單元1267可以基于記錄在參考?xì)v史存儲單元 1255中的內(nèi)容向搜索引擎1040發(fā)送關(guān)于被選擇的關(guān)鍵字的信息。搜索引 擎1040可以在在搜索引擎1040內(nèi)執(zhí)行的各種處理中使用從外部顯示設(shè)備 連接控制單元1267發(fā)送而來的信息。在上文中,已經(jīng)描述了根據(jù)本實(shí)施例的信息處理裝置1020的功能的 示例。上述組件可以使用通用元件或電路來構(gòu)成,或者可以用專用于各個 組件的功能的專用硬件來構(gòu)成。這些組件的全部功能可以利用CPU等來 執(zhí)行。因此,可以根據(jù)實(shí)施本實(shí)施例時的技術(shù)水平來適當(dāng)?shù)匦薷挠布?置。根據(jù)本實(shí)施例的信息處理裝置1020還可以包括根據(jù)第三實(shí)施例的信 息處理裝置1020的話語識別單元或語音談話控制單元。信息處理裝置 1020還可以包括存儲關(guān)鍵字提取數(shù)據(jù)庫1030的內(nèi)容的數(shù)據(jù)庫存儲單元。 在這種情況下,關(guān)鍵字提取數(shù)據(jù)庫1030的內(nèi)容可以被存儲在設(shè)置在信息 處理裝置1020中的數(shù)據(jù)庫存儲單元中。因此,可以縮短信息處理裝置 1020訪問關(guān)鍵字提取數(shù)據(jù)庫1030所需的時間。其結(jié)果是,可以縮短信息 處理裝置1020執(zhí)行關(guān)鍵字提取所需的時間。另外,通過周期性地更新數(shù) 據(jù)庫存儲單元的內(nèi)容,信息處理裝置1020可以獲取記錄在關(guān)鍵字提取數(shù)據(jù)庫1030中的更新后的數(shù)據(jù)庫的內(nèi)容。 (外部顯示設(shè)備1070的配置) 接下來,將參考圖39和40來詳細(xì)描述根據(jù)本實(shí)施例的外部顯示設(shè)備1070的配置。圖39是用于說明根據(jù)第四實(shí)施例的外部顯示設(shè)備的配置的
框圖。圖40是示出根據(jù)第四實(shí)施例的外部顯示設(shè)備的信息顯示屏幕的示意圖。
根據(jù)本實(shí)施例的外部顯示設(shè)備1070的硬件包括諸如CRT、液晶顯示 面板、等離子顯示面板或者EL面板之類的顯示元件以及由CPU、 ROM和 RAM構(gòu)成的并且在控制顯示元件的驅(qū)動時使用的驅(qū)動控制電路。
如圖39所示,本實(shí)施例的外部顯示設(shè)備1070包括廣播接收單元 1701、連接端口控制單元1703、廣播信息顯示控制單元1705、關(guān)鍵字信 息顯示控制單元1707和顯示單元1709。
廣播接收單元1701接收從廣播站1080發(fā)送而來的廣播電波并將廣播 電波中包含的諸如廣播文本信息、廣播音頻信息或視頻信息之類的數(shù)據(jù)輸 出到連接端口控制單元1703和廣播信息顯示控制單元1705 (稍后將描 述)。廣播接收單元1701可以被配置成將所接收的信息記錄在設(shè)置在外 部顯示設(shè)備1070中的存儲單元(未示出)中,或者存儲在與外部顯示設(shè) 備1070相連接的外部附接存儲單元(未示出)中。
連接端口控制單元1703控制能夠與信息處理裝置1020進(jìn)行數(shù)字通信 的諸如HDMI-CEC之類的連接端口。連接端口控制單元1703經(jīng)由諸如 HMDMI-CEC之類的連接端口將關(guān)于廣播接收單元1701正通過其接收的 廣播頻道的接收頻道信息發(fā)送到信息處理裝置1020。諸如廣播文本信息、 廣播音頻信息和視頻信息之類的由廣播接收單元1701接收的數(shù)據(jù)可以經(jīng) 由連接端口控制單元1703而被輸出到信息處理裝置1020。從信息處理裝 置1020發(fā)送而來的各種數(shù)據(jù)經(jīng)由連接端口控制單元1703而被輸入到外部 顯示設(shè)備1070。從信息處理裝置1020發(fā)送而來的各種數(shù)據(jù)被發(fā)送到稍后 將描述的關(guān)鍵字信息顯示控制單元1707。
當(dāng)在稍后將描述的顯示單元1709上顯示從廣播接收單元1701發(fā)送而 來的廣播文本信息、廣播音頻信息和視頻信息時,廣播信息顯示控制單元 1705執(zhí)行顯示控制。
當(dāng)在稍后將描述的顯示單元1709上顯示從信息處理裝置1020發(fā)送而 來的關(guān)鍵字信息時,關(guān)鍵字信息顯示控制單元1707執(zhí)行顯示控制。這里,從信息處理裝置1020發(fā)送而來的關(guān)鍵字信息指的是這樣的信息,該 信息包括信息處理裝置1020所提取的關(guān)鍵字、針對所提取的關(guān)鍵字的搜索結(jié)果、以及與這些關(guān)鍵字相關(guān)的文章。在從顯示單元1709接收到對關(guān) 于外部顯示設(shè)備1070的用戶通過諸如鼠標(biāo)、鍵盤或遙控器之類的輸入設(shè) 備而在顯示單元1709上顯示的信息中所選擇的信息的更詳細(xì)信息的獲取 請求之后,關(guān)鍵字信息顯示控制單元1707經(jīng)由連接端口控制單元1703將 該更詳細(xì)信息的獲取請求發(fā)送到信息處理裝置1020。顯示單元1709在外部顯示設(shè)備1070的信息顯示屏幕上顯示由廣播信 息顯示控制單元1705進(jìn)行顯示控制的廣播文本信息、廣播音頻信息和視 信息以及由關(guān)鍵字信息顯示控制單元1707進(jìn)行顯示控制的關(guān)鍵字信息。外部顯示設(shè)備1070的信息顯示屏幕1751通常包括圖像顯示區(qū)域 1753,廣播文本信息、廣播音頻信息和視頻信息被顯示在圖像顯示區(qū)域 1753上。這里,當(dāng)從信息處理裝置1020發(fā)送而來關(guān)鍵字信息時,信息顯 示屏幕1751的顯示區(qū)域被分割以生成關(guān)鍵字信息顯示區(qū)域1755,關(guān)鍵字 信息被顯示在該關(guān)鍵字信息顯示區(qū)域1755上。圖像顯示區(qū)域1753例如由 廣播信息顯示控制單元1705來控制,并且關(guān)鍵字信息顯示區(qū)域1755例如 由關(guān)鍵字信息顯示控制單元1707來控制。關(guān)鍵字信息顯示區(qū)域1755的細(xì)節(jié)基本上與根據(jù)本發(fā)明第三實(shí)施例的 信息處理裝置的搜索結(jié)果顯示屏幕1050相同,并且將省略對它的詳細(xì)描 述。在上文中,已經(jīng)描述了根據(jù)本發(fā)明的外部顯示設(shè)備1070的功能的示 例。上述組件可以使用通用元件或電路來構(gòu)成,或者可以利用專用于各個 組件的功能的專用硬件來構(gòu)成。這些組件的全部功能可以利用CPU等來 執(zhí)行。因此,可以根據(jù)實(shí)施本實(shí)施例時的技術(shù)水平來適當(dāng)?shù)匦薷挠布?置。(關(guān)鍵字提取方法) 接下來,將參考圖41來詳細(xì)描述由根據(jù)本實(shí)施例的信息處理裝置 1020執(zhí)行的關(guān)鍵字提取方法的示例。圖41是用于說明根據(jù)第四實(shí)施例的 關(guān)鍵字提取方法的流程圖。首先,信息處理裝置1020的廣播文本信息接收單元1261基于從外部
顯示設(shè)備1070獲得的接收頻道信息而從外部顯示設(shè)備1070或者廣播站 1080接收廣播文本信息,從而獲取廣播字幕的字符串作為文本信息數(shù)據(jù) (步驟S1301)。廣播文本信息接收單元1261將所獲得的文本信息數(shù)據(jù)輸 出到關(guān)鍵字提取單元1263。
接下來,關(guān)鍵字提取單元1263對發(fā)送而來的文本信息數(shù)據(jù)應(yīng)用形態(tài) 分析以從字符串中提取字,并將所提取的字記錄在信息處理裝置1020的 存儲器上(步驟S1303)。
接下來,關(guān)鍵字提取單元1263使用與通信網(wǎng)絡(luò)1012相連接的關(guān)鍵字 提取數(shù)據(jù)庫1030的信息或者關(guān)鍵字提取數(shù)據(jù)庫1030的內(nèi)容來搜索所提取 的字(步驟S1305)。
隨后,關(guān)鍵字提取單元1263判斷所提取的字是否存在于關(guān)鍵字提取 數(shù)據(jù)庫1030中(步驟S1307)。當(dāng)所提取的字存在于關(guān)鍵字提取數(shù)據(jù)庫 1030中時,關(guān)鍵字提取單元1263將存在的所提取字記錄在存儲器上作為 廣播關(guān)鍵字?jǐn)?shù)據(jù)(步驟S1309)。當(dāng)所提取字并不存在于關(guān)鍵字提取數(shù)據(jù) 庫1030中時,關(guān)鍵字提取單元1263執(zhí)行稍后將描述的步驟S1311的處 理。
接下來,關(guān)鍵字提取單元1263判斷沒有在關(guān)鍵字提取數(shù)據(jù)庫1030中 找到的所提取字是否存在于存儲器上(步驟S1311)。當(dāng)未找到的字存在 于存儲器上時,執(zhí)行步驟S1305的處理。當(dāng)未找到的字不存在于存儲器中 時,關(guān)鍵字提取單元1263將存在于存儲器上的廣播關(guān)鍵字?jǐn)?shù)據(jù)輸出作為 所提取關(guān)鍵字(步驟S1313)。
通過使用上述方法,根據(jù)本實(shí)施例的信息處理裝置1020可以從所接 收的廣播文本信息中提取關(guān)鍵字。
由根據(jù)本實(shí)施例的信息處理裝置1020執(zhí)行的關(guān)鍵字同步方法與由根 據(jù)本發(fā)明第三實(shí)施例的信息處理裝置1020執(zhí)行的關(guān)鍵字同步方法基本相 同,并且將省略對它的詳細(xì)描述。
在根據(jù)本實(shí)施例的信息處理裝置1020中,存在于關(guān)鍵字提取數(shù)據(jù)庫 1030中的字(關(guān)鍵字)被自動地從發(fā)送自廣播站1080的廣播文本信息中提取。因此,可以向外部顯示設(shè)備1070顯示所提取的關(guān)鍵字。通過使用這樣的功能,使用信息處理裝置1020或外部顯示設(shè)備1070來執(zhí)行諸如聊天之類的雙向通信的用戶可以使用所提取的關(guān)鍵字作為聊天的話題等。 (根據(jù)第四實(shí)施例的信息處理裝置的第一修改示例)接下來,將參考圖42和43來詳細(xì)描述根據(jù)本實(shí)施例的信息處理裝置 1020的第一修改示例。圖42是用于說明根據(jù)本修改示例的信息處理裝置 1020的配置的框圖。圖43是用于說明根據(jù)本修改示例的關(guān)鍵字提取方法 的流程圖。根據(jù)本修改示例的信息處理裝置1020的硬件配置與本發(fā)明第 四實(shí)施例的硬件配置基本相同,并且將省略對它的詳細(xì)描述。如圖42所示,根據(jù)本修改示例的信息處理裝置1020包括關(guān)鍵字同步 單元1245、顯示單元1247、通信單元1249、存儲單元1251、廣播音頻信 息接收單元1269、信息搜索單元1265、外部顯示設(shè)備連接控制單元 1267、參數(shù)提取單元1271、和關(guān)鍵字提取單元1273。根據(jù)本修改示例的關(guān)鍵字同步單元1245、顯示單元1247、通信單元 1249、存儲單元1251、信息搜索單元1265和外部顯示設(shè)備連接控制單元 1267具有與根據(jù)第四實(shí)施例的關(guān)鍵字同步單元1245、顯示單元1247、通 信單元1249、存儲單元1251、信息搜索單元1265和外部顯示設(shè)備連接控 制單元1267基本相同的配置,并提供基本相同的效果,并且將省略對它 們的詳細(xì)描述。廣播音頻信息接收單元1269從外部顯示設(shè)備1070獲取關(guān)于外部顯示 設(shè)備1070當(dāng)前正通過其接收的廣播頻道的接收頻道信息。廣播音頻信息 接收單元1269通過從外部顯示設(shè)備1070獲取接收頻道信息可以同步廣播 音頻信息接收單元1269的接收廣播頻道和外部顯示設(shè)備1070的接收廣播 頻道。廣播音頻信息接收單元1269基于所獲得的接收頻道信息直接從廣播 站1080接收與外部顯示設(shè)備1070的接收廣播頻道相對應(yīng)的廣播電波。此 時,廣播音頻信息接收單元1269可以直接接收從廣播站1080發(fā)送的廣播 電波中的單波段廣播電波,并從所接收的電波中獲取音頻信息。廣播音頻 信息接收單元1269可以被配置成直接接收從廣播站1080發(fā)送的全波段廣廣播音頻信息接收單元1269可以被配置成基于所獲得的接收頻道信
息來接收外部顯示設(shè)備1070所接收的并且被從外部顯示設(shè)備1070發(fā)送到 信息處理裝置1020的廣播音頻信息。
廣播音頻信息接收單元1269將所接收的廣播音頻信息輸出到參數(shù)提 取單元1271。廣播音頻信息接收單元1269可以將所接收的廣播音頻信息 記錄在存儲單元1251中。
參數(shù)提取單元1271和關(guān)鍵字提取單元1273是根據(jù)本修改示例的信息 處理裝置1020的話語識別單元1233的處理單元。參數(shù)提取單元1271從所 生成的語音數(shù)據(jù)的每一幀(以適當(dāng)?shù)臅r間間隔)中提取諸如Mel頻率倒譜 系數(shù)(MFCC)及其時差參數(shù)、語音數(shù)據(jù)的頻譜、功率線性預(yù)測系數(shù)、倒 譜系數(shù)、和線譜對之類的特征參數(shù)。
參數(shù)提取單元1271將所提取的特征參數(shù)發(fā)送給關(guān)鍵字提取單元 1273。關(guān)鍵字提取單元1273可以將所提取的特征參數(shù)存儲在稍后將描述 的存儲單元1251中。
關(guān)鍵字提取單元1273基于關(guān)鍵字提取數(shù)據(jù)庫1030和由參數(shù)提取單元 1271生成并提取的特征參數(shù)來從在廣播音頻信息中包含的語音數(shù)據(jù)中提取 關(guān)鍵字。當(dāng)關(guān)鍵字提取單元1273提取關(guān)鍵字時,關(guān)鍵字提取單元1273可 以經(jīng)由通信單元1249來參考與通信網(wǎng)絡(luò)1012相連接的關(guān)鍵字提取數(shù)據(jù)庫 1030。
在包含在廣播音頻信息中的語音數(shù)據(jù)中一般包含多個關(guān)鍵字。關(guān)鍵字 提取單元1273自動地提取存在于該語音數(shù)據(jù)中的所有關(guān)鍵字。關(guān)鍵字提 取單元1273將所提取的關(guān)鍵字發(fā)送到信息搜索單元1265。關(guān)鍵字提取單 元1273可以將所提取的關(guān)鍵字存儲在存儲單元1251中。
在上文中,已經(jīng)描述了根據(jù)本修改示例的信息處理裝置1020的功能 的示例。上述組件可以使用通用元件或電路來構(gòu)成,或者可以利用專用于 各個組件的功能的專用硬件來構(gòu)成。這些組件的全部功能可以利用CPU 等來執(zhí)行。因此,可以根據(jù)實(shí)施本實(shí)施例時的技術(shù)水平來適當(dāng)?shù)匦薷挠布?配置。根據(jù)本修改示例的信息處理裝置1020還可以包括根據(jù)本發(fā)明第三實(shí)施例的信息處理裝置1020的語音談話控制單元。信息處理裝置1020還可 以包括存儲關(guān)鍵字提取數(shù)據(jù)庫1030的內(nèi)容的數(shù)據(jù)庫存儲單元。在這種情 況下,關(guān)鍵字提取數(shù)據(jù)庫1030的內(nèi)容可以被存儲在設(shè)置在信息處理裝置 1020中的數(shù)據(jù)庫存儲單元中。因此可以縮短信息處理裝置1020訪問關(guān)鍵 字提取數(shù)據(jù)庫1030所需的時間。其結(jié)果是,可以縮短信息處理裝置1020 執(zhí)行關(guān)鍵字提取所需的時間。 (關(guān)鍵字提取方法)接下來,將參考圖43來詳細(xì)描述根據(jù)本修改示例的信息處理裝置 1020所執(zhí)行的關(guān)鍵字提取方法的示例。首先,信息處理裝置1020的廣播音頻信息接收單元1269基于從外部 顯示設(shè)備1070獲得的接收頻道信息來從外部顯示設(shè)備1070或廣播站1080 接收廣播音頻信息。參數(shù)提取單元1271和關(guān)鍵字提取單元1273對語音數(shù) 據(jù)執(zhí)行話語識別并確定話語識別的結(jié)果(步驟S1401)。接下來,關(guān)鍵字提取單元1273對話語識別的結(jié)果應(yīng)用形態(tài)分析,以 從話語識別的結(jié)果中提取字,并將所提取的字存儲在信息處理裝置1020 的存儲器上(步驟S1403)。接下來,關(guān)鍵字提取單元1273使用與通信網(wǎng)絡(luò)1012相連接的關(guān)鍵字 提取數(shù)據(jù)庫1030的信息或者關(guān)鍵字提取數(shù)據(jù)庫1030的內(nèi)容來搜索所提取 的字(步驟S1405)。隨后,關(guān)鍵字提取單元1273判斷所提取字是否存在于關(guān)鍵字提取數(shù) 據(jù)庫1030中(步驟S1407)。當(dāng)所提取字存在于關(guān)鍵字提取數(shù)據(jù)庫1030 中時,關(guān)鍵字提取單元1273將存在的所提取字記錄在存儲器上作為廣播 關(guān)鍵字?jǐn)?shù)據(jù)(步驟S1409)。當(dāng)所提取字并不存在于關(guān)鍵字提取數(shù)據(jù)庫 1030中時,關(guān)鍵字提取單元1273執(zhí)行稍后將描述的步驟S1411的處理。接下來,關(guān)鍵字提取單元1273判斷沒有在關(guān)鍵字提取數(shù)據(jù)庫1030中 找到的所提取字是否存在于存儲器上(步驟S1411)。當(dāng)未找到的字存在 于存儲器上時,執(zhí)行步驟S1405的處理。當(dāng)未找到的字不存在于存儲器中 時,關(guān)鍵字提取單元1273將存在于存儲器上的廣播關(guān)鍵字?jǐn)?shù)據(jù)輸出作為102所提取關(guān)鍵字(步驟S1413)。通過使用上述方法,根據(jù)本修改示例的信息處理裝置1020可以從所接收的廣播音頻信息中提取關(guān)鍵字。由根據(jù)本修改示例的信息處理裝置1020執(zhí)行的關(guān)鍵字同步方法與由 根據(jù)本發(fā)明第三實(shí)施例的信息處理裝置1020執(zhí)行的關(guān)鍵字同步方法基本 相同,并且將省略對它的詳細(xì)描述。在根據(jù)本修改示例的信息處理裝置1020中,存在于關(guān)鍵字提取數(shù)據(jù) 庫1030中的字(關(guān)鍵字)被自動地從發(fā)送自廣播站1080的廣播音頻信息 中提取。因此,可以向外部顯示設(shè)備1070顯示所提取的關(guān)鍵字。通過使 用這樣的功能,使用信息處理裝置1020或外部顯示設(shè)備1070來執(zhí)行諸如 聊天之類的雙向通信的用戶可以使用所提取的關(guān)鍵字作為聊天的話題等。本領(lǐng)域技術(shù)人員應(yīng)當(dāng)了解,在所附權(quán)利要求或其等同物的范圍內(nèi),根 據(jù)設(shè)計(jì)要求和其它因素可以進(jìn)行各種修改、組合、子組合和變更。例如,在上述實(shí)施例中,廣播站1080發(fā)送地面數(shù)字廣播。但是,廣 播站1080可以提供有線廣播或者因特網(wǎng)廣播。在上述實(shí)施例中,圖38示出了廣播站1080通過地面數(shù)字廣播來提供 電視節(jié)目的情況。但是,利用可攜式攝像機(jī)來提供的AV內(nèi)容也可以,用 戶可以親自使用該可攜式攝像機(jī)來捕捉和再現(xiàn)圖像。在上述實(shí)施例中,兩個信息處理裝置執(zhí)行語音聊天。但是,在根據(jù)本 實(shí)施例的語音聊天系統(tǒng)中,可以在多個信息處理裝置中執(zhí)行語音聊天,并 且可以在各個信息處理裝置之間執(zhí)行關(guān)鍵字同步。如上所述,根據(jù)本發(fā)明的實(shí)施例,與語音聊天期間的會話內(nèi)容相關(guān)的 關(guān)鍵字被自動高效地同步。另外,在廣播信息中包含的關(guān)鍵字被自動高效 地同步。本發(fā)明包含與2007年4月16日向日本專利局提交的日本專利申請JP 2007-107319、 2007年4月16日向日本專利局提交的日本專利申請JP 2007-107324、 2007年12月17日向日本專利局提交的日本專利申請JP 2007-325274、以及2007年12月17日向日本專利局提交的日本專利申請 JP 2007-325275相關(guān)的主題,這些申請的全部內(nèi)容通過引用而結(jié)合于此。
權(quán)利要求
1.一種語音聊天系統(tǒng),包括執(zhí)行語音聊天同時執(zhí)行話語識別的多個信息處理裝置;以及經(jīng)由通信網(wǎng)絡(luò)而與所述多個信息處理裝置相連接的搜索服務(wù)器,其中,所述搜索服務(wù)器向至少一個所述信息處理裝置公開搜索關(guān)鍵字列表,所述搜索關(guān)鍵字列表包含由所述搜索服務(wù)器搜索的搜索關(guān)鍵字,所述至少一個信息處理裝置包括識別字字典生成單元,該識別字字典生成單元從所述搜索服務(wù)器獲取所述搜索關(guān)鍵字列表,以生成包含在話語識別時使用的字的識別字字典;話語識別單元,該話語識別單元通過參考包含所述識別字字典的識別數(shù)據(jù)庫來對從所述語音聊天期間的談話對話中獲得的語音數(shù)據(jù)執(zhí)行話語識別;語音談話控制單元,該語音談話控制單元執(zhí)行與至少一個信息處理裝置之間的所述語音數(shù)據(jù)的通信控制;以及關(guān)鍵字檢測單元,該關(guān)鍵字檢測單元從所述話語識別的結(jié)果中檢測與所述語音聊天期間的談話內(nèi)容相關(guān)的關(guān)鍵字。
2. —種信息處理裝置,該裝置從搜索服務(wù)器獲取搜索關(guān)鍵字列表并 執(zhí)行與其它信息處理裝置的語音聊天,所述搜索關(guān)鍵字列表包含由所述搜 索服務(wù)器搜索的搜索關(guān)鍵字,所述裝置包括識別字字典生成單元,該識別字字典生成單元從所述搜索服務(wù)器獲取 所述搜索關(guān)鍵字列表,以生成包含在話語識別時使用的字的識別字字典;話語識別單元,該話語識別單元通過參考包含所述識別字字典的識別 數(shù)據(jù)庫來對從所述語音聊天期間的談話對話中獲得的語音數(shù)據(jù)執(zhí)行話語識 別;語音談話控制單元,該語音談話控制單元執(zhí)行與所述其它信息處理裝 置之間的所述語音數(shù)據(jù)的通信控制;以及關(guān)鍵字檢測單元,該關(guān)鍵字檢測單元從所述話語識別的結(jié)果中檢測與 所述語音聊天期間的談話內(nèi)容相關(guān)的關(guān)鍵字。
3. 如權(quán)利要求2所述的信息處理裝置,其中,所述識別字字典包括固定字字典,在該固定字字典中預(yù)先登記了預(yù)定的字;和可變字字典,在該可變字字典中按需來更新所登記的字,并且其中,所述識別字字典生成單元從所述搜索服務(wù)器的包含較高等級的搜索關(guān)鍵字的所述搜索關(guān)鍵字列表中選擇將被登記在所述可變字字典中的字,以生成所述可變字字典。
4. 如權(quán)利要求3所述的信息處理裝置,其中,所述識別字字典生成單元基于由所述關(guān)鍵字檢測單元檢測得到的所述關(guān)鍵字的歷史信息來確定 所述信息處理裝置的用戶的偏好,并基于所述偏好來從所述搜索關(guān)鍵字列 表中選擇所述字。
5. 如權(quán)利要求3所述的信息處理裝置,其中,所述識別字字典生成單元使用所述搜索服務(wù)器來搜索從所述搜索關(guān)鍵字列表中選擇出來的所述 字,并從通過所述搜索而獲得的搜索結(jié)果中獲取與所述字相關(guān)的次關(guān)鍵 字,從而以與所述字相關(guān)聯(lián)的方式來將所述次關(guān)鍵字登記在所述可變字字典中°
6. 如權(quán)利要求3所述的信息處理裝置,其中,所述識別字字典生成 單元基于搜索等級信息來對從所述搜索關(guān)鍵字列表中選擇的各個字進(jìn)行加 權(quán),其中,所述搜索等級信息是利用所屬字被所述搜索服務(wù)器搜索的頻率 來確定的。
7. 如權(quán)利要求6所述的信息處理裝置,其中,所述識別字字典生成 單元基于由所述關(guān)鍵字檢測單元檢測到的所述關(guān)鍵字的歷史信息來計(jì)算所 述關(guān)鍵字的頻率,并改變登記在所述可變字字典中且與所述關(guān)鍵字相對應(yīng) 的字的權(quán)重。
8. —種信息處理裝置,該裝置從搜索服務(wù)器獲取包含由所述搜索服 務(wù)器搜索的搜索關(guān)鍵字的搜索關(guān)鍵字列表,從所述搜索關(guān)鍵字列表中選擇 字,從對所選擇的字施加在話語識別時使用的權(quán)重信息的識別字字典生成 設(shè)備獲取被施加了權(quán)重信息的字,并與其它信息處理裝置執(zhí)行語音聊天, 所述信息處理裝置包括 .話語識別單元,該話語識別單元通過參考包含從所述識別字字典生成 設(shè)備獲得的所述字的識別數(shù)據(jù)庫來對從語音聊天期間的談話對話中獲得的 語音數(shù)據(jù)執(zhí)行話語識別;語音談話控制單元,該語音談話控制單元執(zhí)行與所述其它信息處理裝 置之間的所述語音數(shù)據(jù)的通信控制;以及關(guān)鍵字檢測單元,該關(guān)鍵字檢測單元從所述話語識別的結(jié)果中檢測與 所述語音聊天期間的談話內(nèi)容相關(guān)的關(guān)鍵字。
9. 一種在信息處理裝置中使用的話語識別方法,所述裝置從搜索服務(wù)器獲取包含由所述搜索服務(wù)器搜索的搜索關(guān)鍵字的搜索關(guān)鍵字列表并與其它信息處理裝置執(zhí)行語音聊天,所述方法包括以下步驟從所述搜索服務(wù)器獲取所述搜索關(guān)鍵字列表,以生成包含在話語識別時使用的字的識別字字典;從所述語音聊天期間的談話內(nèi)容中獲得語音數(shù)據(jù);基于所述語音數(shù)據(jù)的聲學(xué)特征來分析所述語音數(shù)據(jù),并生成與所述談 話內(nèi)容相對應(yīng)的字序列候選;以及通過參考在所述話語識別時使用的包含所述識別字字典的識別數(shù)據(jù) 庫、基于在構(gòu)成所述字序列的字之間的語言學(xué)串聯(lián)特征來分析所生成的字 序列候選,從而選擇最合適的字序列。
10. —種在信息處理裝置中使用的話語識別方法,所述裝置從搜索服 務(wù)器獲取包含由所述搜索服務(wù)器搜索的搜索關(guān)鍵字的搜索關(guān)鍵字列表、從 所述搜索關(guān)鍵字列表中選擇字、從對所選擇的字施加在話語識別時使用的 權(quán)重信息的識別字字典生成設(shè)備獲取被施加了權(quán)重信息的字、并與其它信 息處理裝置執(zhí)行語音聊天,所述方法包括以下步驟從所述識別字字典生成設(shè)備獲取被施加了所述權(quán)重信息的字,并將所 述字存儲在識別數(shù)據(jù)庫中以在話語識別時使用;從所述語音聊天期間的談話內(nèi)容中獲得語音數(shù)據(jù);基于所述語音數(shù)據(jù)的聲學(xué)特征來分析所述語音數(shù)據(jù),并生成與所述談 話內(nèi)容相對應(yīng)的字序列候選;以及通過參考所述識別數(shù)據(jù)庫、基于在構(gòu)成所述字序列的字之間的語言學(xué)串聯(lián)特征來分析所生成的字序列候選,從而選擇最合適的字序列。
11. 一種用于對信息處理裝置進(jìn)行控制的計(jì)算機(jī)的程序,所述裝置從 搜索服務(wù)器獲取包含由所述搜索服務(wù)器搜索的搜索關(guān)鍵字的搜索關(guān)鍵字列 表并與其它信息處理裝置執(zhí)行語音聊天,所述程序允許所述計(jì)算機(jī)執(zhí)行以 下功能識別字字典生成功能,從所述搜索服務(wù)器獲取所述搜索關(guān)鍵字列表以 生成包含在話語識別時使用的字的識別字字典;話語識別功能,通過參考包含所述識別字字典的識別數(shù)據(jù)庫來對從所 述語音聊天期間的談話對話中獲得的語音數(shù)據(jù)執(zhí)行話語識別;語音談話控制功能,執(zhí)行與所述其它信息處理裝置之間的所述語音數(shù) 據(jù)的通信控制;以及關(guān)鍵字檢測功能,從所述話語識別的結(jié)果中檢測與所述語音聊天期間 的談話內(nèi)容相關(guān)的關(guān)鍵字。
12. —種用于對信息處理裝置進(jìn)行控制的計(jì)算機(jī)的程序,所述裝置從 搜索服務(wù)器獲取包含由所述搜索服務(wù)器搜索的搜索關(guān)鍵字的搜索關(guān)鍵字列 表、從所述搜索關(guān)鍵字列表中選擇字、從對所選擇的字施加在話語識別時 使用的權(quán)重信息的識別字字典生成設(shè)備獲取被施加了權(quán)重信息的字、并與 其它信息處理裝置執(zhí)行語音聊天,所述程序允許計(jì)算機(jī)執(zhí)行以下功能話語識別功能,通過參考包含從所述識別字字典生成設(shè)備獲取的所述 字的識別數(shù)據(jù)庫來對從所述語音聊天期間的談話對話中獲得的語音數(shù)據(jù)執(zhí)行話語識別;語音談話控制功能,執(zhí)行與所述其它信息處理裝置之間的所述語音數(shù)據(jù)的通信控制;以及關(guān)鍵字檢測功能,從所述話語識別的結(jié)果中檢測與所述語音聊天期間 的談話內(nèi)容相關(guān)的關(guān)鍵字。
13. —種信息處理裝置,包括識別字字典生成單元,該識別字字典生成單元從搜索服務(wù)器獲取包含 由所述搜索服務(wù)器搜索的搜索關(guān)鍵字的搜索關(guān)鍵字列表,以生成包含在語 言識別時使用的字的識別字字典;廣播文本信息接收單元,該廣播文本信息接收單元接收從廣播站發(fā)送 而來的廣播文本信息;關(guān)鍵字檢測單元,該關(guān)鍵字檢測單元通過參考所述識別字字典來從所述廣播文本信息中檢測預(yù)定關(guān)鍵字;以及外部顯示設(shè)備連接控制單元,該外部顯示設(shè)備連接控制單元執(zhí)行與外 部顯示設(shè)備的連接控制并將從所述廣播文本信息中檢測到的所述關(guān)鍵字輸 出到所述外部顯示設(shè)備。
14. 如權(quán)利要求13所述的信息處理裝置,其中,所述廣播文本信息 接收單元從與所述信息處理裝置相連接的所述外部顯示設(shè)備獲取關(guān)于所述 外部顯示設(shè)備正通過其接收的廣播頻道的接收頻道信息以及與所述廣播頻 道相對應(yīng)的廣播文本信息。
15. 如權(quán)利要求13所述的信息處理裝置,其中,所述廣播文本信息 接收單元從與所述信息處理裝置相連接的所述外部顯示設(shè)備獲取關(guān)于所述 外部顯示設(shè)備正通過其接收的廣播頻道的接收頻道信息,并從所述廣播站 獲取與所述廣播頻道相對應(yīng)的廣播文本信息。
16. 如權(quán)利要求13所述的信息處理裝置,其中,所述信息處理裝置 將所述關(guān)鍵字的參考?xì)v史存儲在所述外部顯示設(shè)備中,并且其中,所述外部顯示設(shè)備連接控制單元將所述外部顯示設(shè)備所選擇的 關(guān)鍵字通知給所述搜索引擎。
17. —種信息處理裝置,包括識別字字典生成單元,該識別字字典生成單元從搜索服務(wù)器獲取包含 由所述搜索服務(wù)器搜索的搜索關(guān)鍵字的搜索關(guān)鍵字列表,以生成包含在話 語識別時使用的字的識別字字典;廣播音頻信息接收單元,該廣播音頻信息接收單元接收從廣播站發(fā)送 而來的廣播音頻信息;話語識別單元,該話語識別單元通過參考包含所述識別字字典的識別 數(shù)據(jù)庫來對所述廣播音頻信息執(zhí)行話語識別;關(guān)鍵字檢測單元,該關(guān)鍵字檢測單元從對所述廣播音頻信息的所述話 語識別的結(jié)果中檢測預(yù)定關(guān)鍵字;以及外部顯示設(shè)備連接控制單元,該外部顯示設(shè)備連接控制單元執(zhí)行與外 部顯示設(shè)備的連接控制并將從所述廣播音頻信息中檢測到的所述關(guān)鍵字輸 出到所述外部顯示設(shè)備。
18. 如權(quán)利要求17所述的信息處理裝置,其中,所述廣播音頻信息接收單元從與所述信息處理裝置相連接的所述外部顯示設(shè)備獲取關(guān)于所述 外部顯示設(shè)備正通過其接收的廣播頻道的接收頻道信息以及與所述廣播頻 道相對應(yīng)的廣播音頻信息。
19. 如權(quán)利要求17所述的信息處理裝置,其中,所述廣播音頻信息 接收單元從與所述信息處理裝置相連接的所述外部顯示設(shè)備獲取關(guān)于所述 外部顯示設(shè)備正通過其接收的廣播頻道的接收頻道信息,并從所述廣播站 獲取與所述廣播頻道相對應(yīng)的廣播音頻信息。
20. 如權(quán)利要求17所述的信息處理裝置,其中,所述信息處理裝置 將所述關(guān)鍵字的參考?xì)v史存儲在所述外部顯示設(shè)備中,并且其中,所述外部顯示設(shè)備連接控制單元將所述外部顯示設(shè)備所選擇的 關(guān)鍵字通知給所述搜索引擎。
21. —種關(guān)鍵字檢測方法,包括以下步驟從搜索服務(wù)器獲取包含由所述搜索服務(wù)器搜索的搜索關(guān)鍵字的搜索關(guān) 鍵字列表,以生成包含在語言識別時使用的字的識別字字典; 接收從廣播站發(fā)送而來的廣播文本信息;通過參考所述識別字字典來從所述廣播文本信息中檢測預(yù)定關(guān)鍵字;以及執(zhí)行與外部顯示設(shè)備的連接控制,并將從所述廣播文本信息中檢測到 的所述關(guān)鍵字輸出到所述外部顯示設(shè)備。
22. —種關(guān)鍵字檢測方法,包括以下步驟從搜索服務(wù)器獲取包含由所述搜索服務(wù)器搜索的搜索關(guān)鍵字的搜索關(guān) 鍵字列表,以生成包含在話語識別時使用的字的識別字字典; 接收從廣播站發(fā)送而來的廣播音頻信息;通過參考包含所述識別字字典的識別數(shù)據(jù)庫來對所述廣播音頻信息執(zhí) 行話語識別;從對所述廣播音頻信息的所述話語識別的結(jié)果中檢測預(yù)定關(guān)鍵字;以及執(zhí)行與外部顯示設(shè)備的連接控制并將從所述廣播音頻信息中檢測到的 所述關(guān)鍵字輸出到所述外部顯示設(shè)備。
23. —種程序,允許計(jì)算機(jī)實(shí)現(xiàn)以下功能識別字字典生成功能,從搜索服務(wù)器獲取包含由所述搜索服務(wù)器搜索 的搜索關(guān)鍵字的搜索關(guān)鍵字列表,以生成包含在語言識別時使用的字的識別字字典;廣播文本信息接收功能,接收從廣播站發(fā)送而來的廣播文本信息; 關(guān)鍵字檢測功能,通過參考所述識別字字典來從所述廣播文本信息中檢測預(yù)定關(guān)鍵字;以及外部顯示設(shè)備連接控制功能,執(zhí)行與外部顯示設(shè)備的連接控制,并將從所述廣播文本信息中檢測到的所述關(guān)鍵字輸出到所述外部顯示設(shè)備。
24. —種程序,允許計(jì)算機(jī)實(shí)現(xiàn)以下功能識別字字典生成功能,從搜索服務(wù)器獲取包含由所述搜索服務(wù)器搜索 的搜索關(guān)鍵字的搜索關(guān)鍵字列表,以生成包含在話語識別時使用的字的識 別字字典;廣播音頻信息接收功能,接收從廣播站發(fā)送而來的廣播音頻信息;話語識別功能,通過參考包含所述識別字字典的識別數(shù)據(jù)庫來對所述 廣播音頻信息執(zhí)行話語識別;關(guān)鍵字檢測功能,從對所述廣播音頻信息的所述話語識別的結(jié)果中檢 測預(yù)定關(guān)鍵字;以及外部顯示設(shè)備連接控制功能,執(zhí)行與外部顯示設(shè)備的連接控制并將從 所述廣播音頻信息中檢測到的所述關(guān)鍵字輸出到所述外部顯示設(shè)備。
25. —種語音聊天系統(tǒng),包括 執(zhí)行語音聊天的多個信息處理裝置;在從所述語音聊天期間的談話對話中提取關(guān)鍵字時由所述信息處理裝 置參考的關(guān)鍵字提取數(shù)據(jù)庫;以及在使用所提取的關(guān)鍵字來搜索所述關(guān)鍵字以及與所述關(guān)鍵字相關(guān)的文章時由所述信息處理裝置使用的搜索引擎, 其中,至少一個信息處理裝置包括參數(shù)提取單元,該參數(shù)提取單元從根據(jù)所述對話來生成的語音數(shù)據(jù)中 提取參數(shù),所述參數(shù)表現(xiàn)了所述語音數(shù)據(jù)的特征;關(guān)鍵字提取單元,該關(guān)鍵字提取單元識別所生成的語音數(shù)據(jù),并基于 所述參數(shù)和所述關(guān)鍵字提取數(shù)據(jù)庫來從所述語音數(shù)據(jù)中提取所述關(guān)鍵字;信息搜索單元,該信息搜索單元使用所述搜索引擎來搜索所提取的關(guān) 鍵字,并獲取針對所述關(guān)鍵字的搜索結(jié)果和與所述關(guān)鍵字相關(guān)的文章;顯示單元,該顯示單元顯示與針對所述關(guān)鍵字的搜索結(jié)果的地址信息 相關(guān)聯(lián)的關(guān)鍵字以及與和所述關(guān)鍵字相關(guān)的文章的地址信息相關(guān)聯(lián)的文 章;以及關(guān)鍵字同步單元,該關(guān)鍵字同步單元將所提取的關(guān)鍵字發(fā)送到作為所 述聊天的對應(yīng)方的信息處理裝置,并執(zhí)行與該對應(yīng)方信息處理裝置的關(guān)鍵 字同步。
26. —種與其它信息處理裝置執(zhí)行語音聊天的信息處理裝置,該裝置 包括參數(shù)提取單元,該參數(shù)提取單元從根據(jù)所述語音聊天期間的談話對話 來生成的語音數(shù)據(jù)中提取參數(shù),所述參數(shù)表現(xiàn)了所述語音數(shù)據(jù)的特征;關(guān)鍵字提取單元,該關(guān)鍵字提取單元識別所生成的語音數(shù)據(jù),并基于 所述參數(shù)和關(guān)鍵字提取數(shù)據(jù)庫來從所述語音數(shù)據(jù)中提取關(guān)鍵字;信息搜索單元,該信息搜索單元使用搜索引擎來搜索所提取的關(guān)鍵 字,并獲取針對所述關(guān)鍵字的搜索結(jié)果和與所述關(guān)鍵字相關(guān)的文章;以及搜索信息聚積單元,該搜索信息聚積單元分別以與針對所述關(guān)鍵字的 搜索結(jié)果的地址信息和所述文章的地址信息相關(guān)聯(lián)的方式來聚積所述關(guān)鍵 字和所述文章。
27. 如權(quán)利要求26所述的信息處理裝置,還包括關(guān)鍵字同步單元, 該關(guān)鍵字同步單元將所提取的關(guān)鍵字發(fā)送到作為所述聊天的對應(yīng)方的信息 處理裝置,并執(zhí)行與所述對應(yīng)方信息處理裝置的關(guān)鍵字同步。
28. 如權(quán)利要求26所述的信息處理裝置,還包括存儲關(guān)鍵字提取數(shù)據(jù)庫的數(shù)據(jù)庫存儲單元。
29. 如權(quán)利要求26所述的信息處理裝置,其中,所述搜索引擎被設(shè)置在所述信息處理裝置中。
30. 如權(quán)利要求26所述的信息處理裝置,還包括顯示單元,該顯示 單元顯示與針對所述關(guān)鍵字的搜索結(jié)果的地址信息相關(guān)聯(lián)的關(guān)鍵字以及與 和所述關(guān)鍵字相關(guān)的文章的地址信息相關(guān)聯(lián)的文章。
31. 如權(quán)利要求26所述的信息處理裝置,還包括參考?xì)v史存儲單 元,該參考?xì)v史存儲單元存儲所述關(guān)鍵字的參考?xì)v史。
32. 如權(quán)利要求31所述的信息處理裝置,其中,所述參考?xì)v史存儲 單元以與被賦予相應(yīng)聊天和該聊天的對應(yīng)方的標(biāo)識符相關(guān)聯(lián)的方式來存儲 所述被參考的關(guān)鍵字。
33. 如權(quán)利要求31所述的信息處理裝置,其中,所述關(guān)鍵字提取單 元基于偏好來提取位于所述參考?xì)v史的較高等級的關(guān)鍵字。
34. 如權(quán)利要求26所述的信息處理裝置,其中,所述關(guān)鍵字提取單 元基于偏好來提取所述搜索引擎的較高等級處搜索關(guān)鍵字。
35. —種與其它信息處理裝置執(zhí)行語音聊天的信息處理裝置,至少一 個所述信息處理裝置包括參數(shù)提取單元,該參數(shù)提取單元從根據(jù)所述語 音聊天期間的談話對話來生成的語音數(shù)據(jù)中提取參數(shù),所述參數(shù)表現(xiàn)了所 述語音數(shù)據(jù)的特征;關(guān)鍵字提取單元,該關(guān)鍵字提取單元識別所生成的語 音數(shù)據(jù),并基于所述參數(shù)和關(guān)鍵字提取數(shù)據(jù)庫來從所述語音數(shù)據(jù)中提取關(guān) 鍵字;信息搜索單元,該信息搜索單元使用搜索引擎來搜索所提取的關(guān)鍵 字,并獲取針對所述關(guān)鍵字的搜索結(jié)果和與所述關(guān)鍵字相關(guān)的文章;以及 搜索信息聚積單元,該搜索信息聚積單元分別以與針對所述關(guān)鍵字的搜索 結(jié)果的地址信息和所述文章的地址信息相關(guān)聯(lián)的方式來聚積所述關(guān)鍵字和 所述文章,其中,所述信息處理裝置包括關(guān)鍵字同步單元,該關(guān)鍵字同步單元接 收從所述至少一個信息處理裝置發(fā)送而來的所述關(guān)鍵字,并執(zhí)行與相應(yīng)的 信息處理裝置的關(guān)鍵字同步。
36. —種程序,允許計(jì)算機(jī)實(shí)現(xiàn)以下功能參數(shù)提取功能,從根據(jù)語音聊天期間的談話對話來生成的語音數(shù)據(jù)中 提取參數(shù),所述參數(shù)表現(xiàn)了所述語音數(shù)據(jù)的特征;關(guān)鍵字提取功能,識別所生成的語音數(shù)據(jù),并基于所述參數(shù)和關(guān)鍵字 提取數(shù)據(jù)庫來從所述語音數(shù)據(jù)中提取關(guān)鍵字;信息搜索功能,使用搜索引擎來搜索所提取的關(guān)鍵字,并獲取針對所述關(guān)鍵字的搜索結(jié)果和與所述關(guān)鍵字相關(guān)的文章;以及搜索信息存儲功能,分別以與針對所述關(guān)鍵字的搜索結(jié)果的地址信息 和所述文章的地址信息相關(guān)聯(lián)的方式來存儲所述關(guān)鍵字和所述文章。
37. —種程序,允許計(jì)算機(jī)實(shí)現(xiàn)以下功能關(guān)鍵字同步功能,接收從至少一個信息處理裝置發(fā)送而來的關(guān)鍵字, 并執(zhí)行與相應(yīng)信息處理裝置的關(guān)鍵字同步。
38. —種信息處理裝置,包括廣播文本信息接收單元,該廣播文本信息接收單元接收從廣播站發(fā)送而來的廣播文本信息;關(guān)鍵字提取單元,該關(guān)鍵字提取單元基于關(guān)鍵字提取數(shù)據(jù)庫來從所述 廣播文本信息中提取關(guān)鍵字;信息搜索單元,該信息搜索單元使用搜索引擎來搜索所提取的關(guān)鍵 字,并獲取與所述關(guān)鍵字相關(guān)的文章;以及外部顯示設(shè)備連接控制單元,該外部顯示設(shè)備連接控制單元執(zhí)行與外 部顯示設(shè)備的連接控制,并將所述關(guān)鍵字、針對所述關(guān)鍵字的搜索結(jié)果、 以及與所述關(guān)鍵字相關(guān)的文章輸出到所述外部顯示設(shè)備。
39. 如權(quán)利要求38所述的信息處理裝置,其中,所述廣播文本信息接收單元從與所述信息處理裝置相連接的所述外部顯示設(shè)備獲取關(guān)于所述 外部顯示設(shè)備正通過其接收的廣播頻道的接收頻道信息以及與所述廣播頻 道相對應(yīng)的廣播文本信息。
40. 如權(quán)利要求38所述的信息處理裝置,其中所述廣播文本信息接 收單元從與所述信息處理裝置相連接的所述外部顯示設(shè)備獲取關(guān)于所述外 部顯示設(shè)備正通過其接收的廣播頻道的接收頻道信息,并從所述廣播站獲 取與所述廣播頻道相對應(yīng)的廣播文本信息。
41. 如權(quán)利要求38所述的信息處理裝置,還包括參考?xì)v史存儲單元,該參考?xì)v史存儲單元將所述關(guān)鍵字的參考?xì)v史存儲在所述外部顯示設(shè) 備中,其中,所述外部顯示設(shè)備連接控制單元將所述外部顯示設(shè)備所選擇的 關(guān)鍵字通知給所述搜索引擎。
42. 如權(quán)利要求38所述的信息處理裝置,還包括關(guān)鍵字同步單元, 該關(guān)鍵字同步單元將所提取的關(guān)鍵字發(fā)送到至少一個信息處理裝置,并執(zhí) 行與所述至少一個信息處理裝置的關(guān)鍵字同步。
43. —種信息處理裝置,包括廣播音頻信息接收單元,該廣播音頻信息接收單元接收從廣播站發(fā)送 而來的廣播音頻信息;參數(shù)提取單元,該參數(shù)提取單元從包含在所述廣播音頻信息中的語音 數(shù)據(jù)中提取參數(shù),所述參數(shù)表現(xiàn)了所述語音數(shù)據(jù)的特征;關(guān)鍵字提取單元,該關(guān)鍵字提取單元識別所述語音數(shù)據(jù)并基于所述參 數(shù)和關(guān)鍵字提取數(shù)據(jù)庫來從所述語音數(shù)據(jù)中提取關(guān)鍵字;信息搜索單元,該信息搜索單元使用搜索引擎來搜索所提取的關(guān)鍵 字,并獲取針對所述關(guān)鍵字的搜索結(jié)果和與所述關(guān)鍵字相關(guān)的文章;以及外部顯示設(shè)備連接控制單元,該外部顯示設(shè)備連接控制單元執(zhí)行與外 部顯示設(shè)備的連接控制,并將所述關(guān)鍵字、針對所述關(guān)鍵字的搜索結(jié)果、 以及與所述關(guān)鍵字相關(guān)的文章輸出到所述外部顯示設(shè)備。
44. 如權(quán)利要求43所述的信息處理裝置,其中,所述廣播音頻信息 接收單元從與所述信息處理裝置相連接的所述外部顯示設(shè)備獲取關(guān)于所述 外部顯示設(shè)備正通過其接收的廣播頻道的接收頻道信息以及與所述廣播頻 道相對應(yīng)的廣播音頻信息。
45. 如權(quán)利要求43所述的信息處理裝置,其中所述廣播音頻信息接 收單元從與所述信息處理裝置相連接的所述外部顯示設(shè)備獲取關(guān)于所述外 部顯示設(shè)備正通過其接收的廣播頻道的接收頻道信息,并從所述廣播站獲 取與所述廣播頻道相對應(yīng)的廣播音頻信息。
46. 如權(quán)利要求43所述的信息處理裝置,還包括參考?xì)v史存儲單元,該參考?xì)v史存儲單元將所述關(guān)鍵字的參考?xì)v史存儲在所述外部顯示設(shè) 備中,其中,所述外部顯示設(shè)備連接控制單元將所述外部顯示設(shè)備所選擇的 關(guān)鍵字通知給所述搜索引擎。
47. 如權(quán)利要求43所述的信息處理裝置,還包括關(guān)鍵字同步單元, 該關(guān)鍵字同步單元將所提取的關(guān)鍵字發(fā)送到至少一個信息處理裝置,并執(zhí) 行與所述至少一個信息處理裝置的關(guān)鍵字同步。
48. —種程序,允許計(jì)算機(jī)實(shí)現(xiàn)以下功能 廣播文本信息接收功能,接收從廣播站廣播的廣播文本信息;關(guān)鍵字提取功能,基于關(guān)鍵字提取數(shù)據(jù)庫來從所述廣播文本信息中提取關(guān)鍵字;信息搜索功能,使用搜索引擎來搜索所提取的關(guān)鍵字,并獲取針對所 述關(guān)鍵字的搜索結(jié)果和與所述關(guān)鍵字相關(guān)的文章;以及外部顯示設(shè)備連接控制功能,執(zhí)行與外部顯示設(shè)備的連接控制,并將 所述關(guān)鍵字、針對所述關(guān)鍵字的搜索結(jié)果、以及與所述關(guān)鍵字相關(guān)的文章 輸出到所述外部顯示設(shè)備。
49. 一種程序,允許計(jì)算機(jī)實(shí)現(xiàn)以下功能廣播音頻信息接收功能,接收從廣播站發(fā)送而來的廣播音頻信息;參數(shù)提取功能,從包含在所述廣播音頻信息中的語音數(shù)據(jù)中提取參 數(shù),所述參數(shù)表現(xiàn)了所述語音數(shù)據(jù)的特征;關(guān)鍵字提取功能,識別所述語音數(shù)據(jù)并基于所述參數(shù)和關(guān)鍵字提取數(shù) 據(jù)庫來從所述語音數(shù)據(jù)中提取關(guān)鍵字;信息搜索功能,使用搜索引擎來搜索所提取的關(guān)鍵字,并獲取針對所 述關(guān)鍵字的搜索結(jié)果和與所述關(guān)鍵字相關(guān)的文章;以及外部顯示設(shè)備連接控制功能,執(zhí)行與外部顯示設(shè)備的連接控制,并將 所述關(guān)鍵字、針對所述關(guān)鍵字的搜索結(jié)果、以及與所述關(guān)鍵字相關(guān)的文章 輸出到所述外部顯示設(shè)備。
全文摘要
本發(fā)明提供了語音聊天系統(tǒng)、信息處理裝置、話語識別方法。語音聊天系統(tǒng)包括執(zhí)行語音聊天同時執(zhí)行話語識別的多個信息處理裝置;和經(jīng)由通信網(wǎng)絡(luò)而與所述多個信息處理裝置相連接的搜索服務(wù)器。搜索服務(wù)器向至少一個信息處理裝置公開搜索關(guān)鍵字列表,該搜索關(guān)鍵字列表包含由搜索服務(wù)器搜索的搜索關(guān)鍵字。至少一個信息處理裝置包括識別字字典生成單元,該識別字字典生成單元從搜索服務(wù)器獲取搜索關(guān)鍵字列表,以生成包含在話語識別時使用的字的識別字字典;以及話語識別單元,該話語識別單元通過參考包含該識別字字典的識別數(shù)據(jù)庫來對從語音聊天期間的談話對話中獲得的語音數(shù)據(jù)執(zhí)行語音識別。
文檔編號H04M3/56GK101309327SQ20081009048
公開日2008年11月19日 申請日期2008年4月16日 優(yōu)先權(quán)日2007年4月16日
發(fā)明者中出元樹, 倉田宜典, 小川浩明, 本田等, 石塚大介 申請人:索尼株式會社;索尼通訊網(wǎng)路公司