識別裝置100中處理(service)的內(nèi)容的列表的內(nèi)容列表、作為事先收集用戶很可能說出的句子的列表的語言資料庫、以及針對用戶之前實際說過的句子的識別結(jié)果的話語日志。例如,響應(yīng)于語音識別裝置100是顯示裝置(例如電視(TV)),各種廣播節(jié)目的標(biāo)題可以在存儲單元140中存儲為內(nèi)容列表。例如“搜索XXX”、“提高音量”、“頻道增加”、或“當(dāng)播放《絕命毒師》時提醒我(remind me when breaking bad ison)”之類的句子可以在存儲單元140中存儲為語言資料庫。用戶的實際話語的識別結(jié)果可在存儲單元140中存儲為話語日志。
[0052]存儲器120可以通過按預(yù)定的令牌單位劃分存儲在存儲單元140中的內(nèi)容列表、語言資料庫和話語日志來生成多個令牌,并且可以在存儲單元140中存儲該多個生成的令牌。令牌可以指代包括在組單位(group unit)中具有意義的一個或多個字符的字符串。也就是說,令牌可以指代由預(yù)定的單位(例如音節(jié)單位、詞素單位或詞單位)劃分用戶可能說出的各種詞或句子。例如,在英語中,令牌可以基于空格來劃分。在該示例中,一個令牌可以是一個詞。
[0053]響應(yīng)于通過語音識別器110識別用戶話語,處理器120可以生成針對用戶話語的文本數(shù)據(jù)。處理器120可以向令牌網(wǎng)絡(luò)生成器130提供生成的文本數(shù)據(jù)。令牌網(wǎng)絡(luò)生成器130可以通過解析文本數(shù)據(jù)來按預(yù)定的令牌單位劃分針對用戶話語的文本數(shù)據(jù)。
[0054]處理器120可以計算指示事先生成并存儲的多個令牌之間的相似程度的相似度,并且在存儲單元140中存儲相似度。計算相似度的詳細(xì)方法可以使用現(xiàn)有技術(shù),并且因此省略其詳細(xì)描述。處理器120可以存儲對哪些令牌存在于來自內(nèi)容列表、語言資料庫和話語日志的具體令牌的外圍進(jìn)行指示的信息。也就是說,處理器120可以在存儲單元140中存儲指示與令牌一起使用的歷史的信息,該信息是對在具體令牌被劃分為令牌之前,哪些令牌存在于對應(yīng)的令牌之前和之后進(jìn)行指示的信息。
[0055]也就是說,根據(jù)內(nèi)容列表、語言資料庫和話語日志生成的多個令牌、多個令牌之間的相似度、以及具有與多個令牌一起使用的歷史的令牌的信息可以預(yù)先存儲在存儲單元140 中。
[0056]存儲單元140可以存儲針對內(nèi)容、語言資料庫和話語日志的語言模型。例如,處理器120可以根據(jù)存儲在存儲單元140中的內(nèi)容列表、語言資料庫和話語日志來生成針對內(nèi)容列表、語言資料庫和話語日志的語言模型,并且在存儲單元140中存儲生成的語言模型。語言模型可以是通過對人們使用的詞進(jìn)行建模來計算詞字符串與實際使用的語言之間的匹配程度的模型。也就是說,語言模型可以是計算任意句子存在的概率的模型,并且處理器120可以使用語言模型來計算令牌網(wǎng)絡(luò)上的每個令牌轉(zhuǎn)移到下一個令牌的概率。能夠計算令牌之間的轉(zhuǎn)移概率的任何語言模型可被用作該語言模型,并且因此將省略其詳細(xì)描述。
[0057]令牌網(wǎng)絡(luò)生成器130可以根據(jù)處理器120的控制來生成令牌網(wǎng)絡(luò)。例如,令牌網(wǎng)絡(luò)生成器130可以根據(jù)通過語音識別器110識別出的用戶話語來生成多個識別令牌,在存儲單元140中存儲的多個令牌中搜索與生成的識別令牌相似的相似令牌以及具有與生成的識別令牌一起使用的歷史的外圍令牌,并使用生成的識別令牌以及搜索到的相似令牌和外圍令牌來生成令牌網(wǎng)絡(luò)。
[0058]更具體地,令牌網(wǎng)絡(luò)生成器130可以通過按預(yù)定的單位劃分通過語音識別器110識別出的用戶話語來生成多個識別令牌。例如,響應(yīng)于通過語音識別器110識別用戶話語,處理器120可以生成針對用戶話語的文本數(shù)據(jù)并且向令牌網(wǎng)絡(luò)生成器130提供生成的文本數(shù)據(jù),并且令牌網(wǎng)絡(luò)生成器130可以通過按預(yù)定的單位劃分針對用戶話語的文本數(shù)據(jù)來生成多個識別令牌。
[0059]令牌網(wǎng)絡(luò)生成器130可以搜索生成的識別令牌的相似令牌和外圍令牌。例如,響應(yīng)于在存儲在存儲單元140中的多個令牌中出現(xiàn)對應(yīng)的識別令牌,令牌網(wǎng)絡(luò)生成器130可以使用存儲在存儲單元中的對應(yīng)的識別令牌與其它令牌之間的相似度來搜索相似令牌。在該示例中,令牌網(wǎng)絡(luò)生成器130可以搜索具有大于或等于預(yù)定值的相似度的令牌來作為識別令牌的相似令牌。令牌網(wǎng)絡(luò)生成器130可以使用與存儲在存儲單元140中的多個令牌一起使用的歷史來搜索對應(yīng)識別令牌的外圍令牌。
[0060]根據(jù)示例性實施例,響應(yīng)于在存儲在存儲單元140中的多個令牌中不存在識別令牌,也就是說,響應(yīng)于在存儲在存儲單元140中的多個令牌中不存在與對應(yīng)的識別令牌相同的令牌并因此使用相似度沒有搜索到相似令牌,令牌網(wǎng)絡(luò)生成器130可以使用字符串搜索算法來搜索相似令牌??梢允褂锰綔y法、q-gram等作為字符串搜索算法,并且字符串搜索算法并不限于此。
[0061]響應(yīng)于在存儲在存儲單元140中的多個令牌中不存在識別令牌,令牌網(wǎng)絡(luò)生成器130可以搜索外圍令牌。將參照圖3和圖5來描述搜索外圍令牌的方法。
[0062]令牌網(wǎng)絡(luò)生成器130可以使用多個識別令牌、以及上述搜索到的針對多個識別令牌的相似令牌和外圍令牌來生成令牌網(wǎng)絡(luò)。例如,令牌網(wǎng)絡(luò)生成器130可以通過將相似令牌和外圍令牌布置為與多個識別令牌中的每一個相對應(yīng)來生成令牌網(wǎng)絡(luò)。在該示例中,令牌網(wǎng)絡(luò)可以具有例如以識別出的用戶話語的順序布置有多個識別令牌的格子,以及與識別令牌相對應(yīng)的相似令牌和外圍令牌被布置在識別令牌的下方以對應(yīng)于識別令牌,但是令牌網(wǎng)絡(luò)的結(jié)構(gòu)并不限于此。圖6示出了具有格子的令牌網(wǎng)絡(luò)的示例。
[0063]處理器120可以控制語音識別器110和令牌網(wǎng)絡(luò)生成器130。例如,處理器120可以計算構(gòu)成令牌網(wǎng)絡(luò)的令牌之間的轉(zhuǎn)移概率,并且使用計算出的轉(zhuǎn)移概率來生成針對已校正的用戶話語的文本數(shù)據(jù)。令牌網(wǎng)絡(luò)生成器130可以在處理器120中實現(xiàn)。
[0064]例如,處理器120可以使用針對存儲在存儲單元140中的內(nèi)容列表、語言資料庫和話語日志的語言模型來計算轉(zhuǎn)移概率。例如,響應(yīng)于計算在如圖6所示的令牌網(wǎng)絡(luò)中令牌“jugeulrae”轉(zhuǎn)移到令牌“daewang”的概率,處理器120可以通過以下方式來計算在如圖6所示的令牌網(wǎng)絡(luò)上令牌“jugeulrae”轉(zhuǎn)移到令牌“daewang”的概率:計算在內(nèi)容列表語言模型中令牌“jugeulrae”轉(zhuǎn)移到令牌“daewang”的概率,計算在語言資料庫語言模型中令牌“jugeulrae”轉(zhuǎn)移到令牌“daewang”的概率,計算在話語日志語言模型中令牌“jugeulrae”轉(zhuǎn)移到令牌“daewang”的概率,并且通過向計算出的轉(zhuǎn)移概率指派權(quán)重來將計算出的概率相加。通過上述方法,處理器120可以計算關(guān)于構(gòu)成圖6的令牌網(wǎng)絡(luò)的所有令牌,每個令牌轉(zhuǎn)移到下一個令牌的轉(zhuǎn)移概率。
[0065]在示例中,響應(yīng)于在如圖11所示的令牌網(wǎng)絡(luò)中令牌“remind”轉(zhuǎn)移到令牌“me”的概率,處理器120可以通過以下方式來計算在如圖11所示的令牌網(wǎng)絡(luò)上令牌“remind”轉(zhuǎn)移到令牌“me”的概率:計算在內(nèi)容列表語言模型中令牌“remind”轉(zhuǎn)移到令牌“me”的概率,計算在語言資料庫語言模型中令牌“remind”轉(zhuǎn)移到令牌“me”的概率,以及計算在話語日志語言模型中令牌“remind”轉(zhuǎn)移到令牌“me”的概率,并且通過向計算出的轉(zhuǎn)移概率指派權(quán)重來將計算出的概率相加。通過上述方法,處理器120可以計算關(guān)于構(gòu)成圖11的令牌網(wǎng)絡(luò)的所有令牌,每個令牌轉(zhuǎn)移到下一個令牌的轉(zhuǎn)移概率。
[0066]處理器120可以通過基于計算出的轉(zhuǎn)移概率搜索令牌網(wǎng)絡(luò)上的最佳路徑來生成針對已校正的用戶話語的文本數(shù)據(jù)。處理器120可以通過使用Viterbi和A星算法中的至少一個搜索最佳路徑以減小搜索最佳路徑的計算量。
[0067]因此,響應(yīng)于搜索最佳路徑,處理器120可以通過將位于該路徑中的用于連接最佳路徑的令牌連接起來,來生成已校正的用戶話語的文本數(shù)據(jù)。
[0068]圖2是示出根據(jù)示例實施例的語音識別裝置的配置的框圖。除了圖1的語音識別裝置100的配置組件以外,圖2中示出的語音識別裝置還可以包括顯示器150和音頻輸出單元160。圖2的語音識別裝置100的剩余組件與圖1的語音識別裝置100中的相同,并且因此省略重復(fù)配置的描述。
[0069]顯示器150可以顯示圖像。例如,顯示器150可以根據(jù)處理器120的控制來顯示向用戶請求再次講話的消息。顯示器150可以包括能夠顯示用戶再次講話請求消息的任何顯示器,并且顯示器150可以使用液晶顯示器(IXD)、陰極射線管(CRT)、等離子顯示板(PDP)、發(fā)光二極管(LED)、有機(jī)發(fā)光二極管(OLED)等等來實現(xiàn)。
[0070]音頻輸出單元160可以輸出語音信號。例如,音頻輸出單元160可以根據(jù)處理器120的控制來以語音輸出用戶再次講話請求消息。音頻輸出單元160可以包括能夠以語音輸出用戶再次講話請求消息的任何設(shè)備,并且可以使用揚(yáng)聲器、耳機(jī)等來實現(xiàn)。
[0071]處理器120可以計算出現(xiàn)已校正的用戶話語的概率。例如,響應(yīng)于生成針對已校正的用戶話語的文本數(shù)據(jù),處理器120可以計算出現(xiàn)該用戶話語的總概率。在該示例中,處理器120可以例如使用存儲在存儲單元140中的各種語言模型來計算出現(xiàn)已校正的用戶話語的概率。
[0072]響應(yīng)于計算出的概率小于或等于預(yù)定值,處理器120可以控制顯示器150和音頻輸出單元160中的任意一個生成再次講話請求消息,并且輸出生成的消息。例如,響應(yīng)于已校正的用戶話語出現(xiàn)的概率小于或等于預(yù)定值,處理器120可以控制顯示器150和音頻輸出單元160生成例如“請再說一遍”之類的再次講話請求消息,并輸出生成的消息。
[0073]根據(jù)示例性實施例,處理器120可以控制顯示器150顯示針對已校正的用戶話語的文本數(shù)據(jù),并且控制音頻輸出單元160以語音輸出針對已校正的話語的文本數(shù)據(jù)。因此,用戶可以確定是否正確地識別出他/她的話語。
[0074]如上所述,響應(yīng)于即使通過語音識別裝置100對用戶話語的識別誤差進(jìn)行校正也還存在識別誤差,語音識別裝置100可以確定剩余的識別誤差,并且通過向用戶請求再次講話來校正識別誤差。
[0075]圖1和圖2的示例性實