本申請(qǐng)涉及語音識(shí)別領(lǐng)域,具體為一種語音識(shí)別文本的糾錯(cuò)方法與裝置。
背景技術(shù):
:隨著語音識(shí)別技術(shù)的發(fā)展,很多企業(yè)開始提供第三方語音識(shí)別服務(wù),在此基礎(chǔ)上,越來越多的電子設(shè)備開始支持智能語音控制。然而在實(shí)際應(yīng)用中,由于受周圍噪音、個(gè)人發(fā)音差異等因素的影響,語音識(shí)別的文本結(jié)果往往與用戶語音輸入不一致,這勢必會(huì)影響此后的文本分詞、語義分析、語法分析等一系列自然語言處理任務(wù)。因此,如果能夠智能地對(duì)語音識(shí)別后的文本進(jìn)行分析,有針對(duì)性的查找、定位出錯(cuò)詞并進(jìn)行糾正,必將有效提高語音識(shí)別的準(zhǔn)確率。近年來,國內(nèi)外學(xué)者提出了一系列語音識(shí)別后的文本校驗(yàn)與糾錯(cuò)方法,包括:基于N-Gram模型、基于混淆矩陣、基于自定義語法規(guī)則等方法。然而這些方法大都面向通用自然語言的語音識(shí)別文本,方法涉及的場景及方法自身較復(fù)雜,并且對(duì)計(jì)算、存儲(chǔ)和系統(tǒng)資源的消耗也很大,不適合在資源有限的語音識(shí)別設(shè)備中使用。同時(shí)語音控制設(shè)備中的應(yīng)用也具有一定的特殊性,如:用戶可以自定義設(shè)備名、語音控制指令一般較短、口語表述具有多樣性、語音識(shí)別文本更容易出現(xiàn)缺字、多字現(xiàn)象等等。因此,現(xiàn)有語音識(shí)別文本的糾錯(cuò)方法并不完全適用于語音控制設(shè)備中的應(yīng)用。申請(qǐng)內(nèi)容本申請(qǐng)的目的是提供一種語音識(shí)別文本的糾錯(cuò)方法與裝置,用于解決現(xiàn)有技術(shù)下語音識(shí)別文本的糾錯(cuò)方法復(fù)雜、資源消耗大、不適合在語音識(shí)別設(shè)備中使用的問題,實(shí)現(xiàn)外部依賴資源的減少、系統(tǒng)負(fù)擔(dān)的降低和語音控制指令識(shí)別準(zhǔn)確率的提高。根據(jù)本申請(qǐng)的一個(gè)方面,提供了一種語音識(shí)別文本的糾錯(cuò)方法,該方法包括:獲取語音識(shí)別文本;根據(jù)預(yù)設(shè)的候選糾錯(cuò)文本生成所述語音識(shí)別文本對(duì)應(yīng)的糾錯(cuò)記錄;輸出所述語音識(shí)別文本對(duì)應(yīng)的糾錯(cuò)記錄。進(jìn)一步地,根據(jù)預(yù)設(shè)的候選糾錯(cuò)文本生成所述語音識(shí)別文本對(duì)應(yīng)的糾錯(cuò)記錄,包括:根據(jù)所述候選糾錯(cuò)文本在所述語音識(shí)別文本中進(jìn)行匹配,以確定所述語音識(shí)別文本中,是否存在與所述候選糾錯(cuò)文本的匹配置信度超過閾值的匹配文本;在所述語音識(shí)別文本中存在與所述候選糾錯(cuò)文本的匹配置信度超過閾值的匹配文本時(shí),根據(jù)所述匹配文本生成語音識(shí)別文本對(duì)應(yīng)的糾錯(cuò)記錄。進(jìn)一步地,根據(jù)所述候選糾錯(cuò)文本在所述語音識(shí)別文本中進(jìn)行匹配,包括:采用基于編輯距離模型的模式匹配算法,并根據(jù)所述候選糾錯(cuò)文本在所述語音識(shí)別文本中進(jìn)行匹配。進(jìn)一步地,采用基于編輯距離模型的模式匹配算法,并根據(jù)所述候選糾錯(cuò)文本在所述語音識(shí)別文本中進(jìn)行匹配,包括:計(jì)算所述候選糾錯(cuò)文本與所述語音識(shí)別文本中的匹配文本之間的編輯距離;根據(jù)所述編輯距離與所述候選糾錯(cuò)文本的長度,獲取所述候選糾錯(cuò)文本與所述匹配文本之間的匹配置信度;確定所述語音識(shí)別文本中存在與所述候選糾錯(cuò)文本的匹配置信度超過閾值的匹配文本。進(jìn)一步地,計(jì)算所述候選糾錯(cuò)文本與所述語音識(shí)別文本中的匹配文本之間的編輯距離之前,還包括:對(duì)所述候選糾錯(cuò)文本與所述語音識(shí)別文本進(jìn)行預(yù)處理,其中,所述預(yù)處理包括在所述候選糾錯(cuò)文本與所述語音識(shí)別文本中添加分隔符。進(jìn)一步地,根據(jù)所述匹配文本生成語音識(shí)別文本對(duì)應(yīng)的糾錯(cuò)記錄,包括:根據(jù)所述匹配文本獲取糾錯(cuò)邊界,其中,所述糾錯(cuò)邊界包括糾錯(cuò)起始位置和匹配文本長度;生成語音識(shí)別文本對(duì)應(yīng)的糾錯(cuò)記錄,其中,所述糾錯(cuò)記錄至少包括候選糾錯(cuò)文本、糾錯(cuò)邊界和匹配置信度。進(jìn)一步地,輸出所述語音識(shí)別文本對(duì)應(yīng)的糾錯(cuò)記錄,包括:采用篩選和/或組合排序的方式對(duì)所述語音識(shí)別文本對(duì)應(yīng)的多條糾錯(cuò)記錄進(jìn)行優(yōu)化后輸出。進(jìn)一步地,采用篩選的方式對(duì)所述語音識(shí)別文本對(duì)應(yīng)的多條糾錯(cuò)記錄進(jìn)行優(yōu)化,包括:當(dāng)候選糾錯(cuò)文本與語音識(shí)別文本中匹配文本的匹配置信度超過閾值時(shí),從糾錯(cuò)記錄中刪除糾錯(cuò)邊界相交的其它糾錯(cuò)記錄,其中,所述糾錯(cuò)邊界包括糾錯(cuò)起始位置和匹配文本長度。進(jìn)一步地,采用組合排序的方式對(duì)所述語音識(shí)別文本對(duì)應(yīng)的多條糾錯(cuò)記錄進(jìn)行優(yōu)化,包括:根據(jù)糾錯(cuò)邊界不相交的多條糾錯(cuò)記錄生成合成記錄,其中,所述糾錯(cuò)邊界包括糾錯(cuò)起始位置和匹配文本長度;利用預(yù)設(shè)方法對(duì)組合記錄組進(jìn)行排序,其中,所述組合記錄組包含所述糾錯(cuò)記錄和由所述糾錯(cuò)記錄生成的合成記錄。進(jìn)一步地,利用預(yù)設(shè)方法對(duì)組合記錄組進(jìn)行排序,其中,所述預(yù)設(shè)方法包括如下一種或多種任意的組合:根據(jù)組合記錄組中糾錯(cuò)記錄的糾錯(cuò)評(píng)估分?jǐn)?shù)計(jì)算平均糾錯(cuò)評(píng)估分?jǐn)?shù),按所述平均糾錯(cuò)評(píng)估分?jǐn)?shù)從高到低排列;統(tǒng)計(jì)組合記錄組中的糾錯(cuò)記錄數(shù),按所述糾錯(cuò)記錄數(shù)從多到少排列;統(tǒng)計(jì)組合記錄組中語音識(shí)別文本的匹配文本的總長度,按所述匹配文本的總長度從短到長排列。進(jìn)一步地,所述糾錯(cuò)評(píng)估分?jǐn)?shù)的獲取方法,包括:根據(jù)糾錯(cuò)記錄對(duì)應(yīng)的匹配置信度和/或相似度得分和/或統(tǒng)計(jì)語言模型得分獲取糾錯(cuò)評(píng)估分?jǐn)?shù)。根據(jù)本申請(qǐng)的另一方面,還提供了一種語音識(shí)別文本的糾錯(cuò)裝置,所述裝置包括:讀取模塊,用于獲取語音識(shí)別文本;匹配模塊,用于根據(jù)預(yù)設(shè)的候選糾錯(cuò)文本生成所述語音識(shí)別文本對(duì)應(yīng)的糾錯(cuò)記錄;輸出模塊,用于輸出所述語音識(shí)別文本對(duì)應(yīng)的糾錯(cuò)記錄。進(jìn)一步地,所述匹配模塊,用于:根據(jù)所述候選糾錯(cuò)文本在所述語音識(shí)別文本中進(jìn)行匹配,以確定所述語音識(shí)別文本中,是否存在與所述候選糾錯(cuò)文本的匹配置信度超過閾值的匹配文本;在所述語音識(shí)別文本中存在與所述候選糾錯(cuò)文本的匹配置信度超過閾值的匹配文本時(shí),根據(jù)所述匹配文本生成語音識(shí)別文本對(duì)應(yīng)的糾錯(cuò)記錄。進(jìn)一步地,所述匹配模塊,用于:采用基于編輯距離模型的模式匹配算法,并根據(jù)所述候選糾錯(cuò)文本在所述語音識(shí)別文本中進(jìn)行匹配。進(jìn)一步地,所述匹配模塊,用于:計(jì)算所述候選糾錯(cuò)文本與所述語音識(shí)別文本中的匹配文本之間的編輯距離;根據(jù)所述編輯距離與所述候選糾錯(cuò)文本的長度,獲取所述候選糾錯(cuò)文本與所述匹配文本之間的匹配置信度;確定所述語音識(shí)別文本中存在與所述候選糾錯(cuò)文本的匹配置信度超過閾值的匹配文本。進(jìn)一步地,所述匹配模塊,還用于:對(duì)所述候選糾錯(cuò)文本與所述語音識(shí)別文本進(jìn)行預(yù)處理,其中,所述預(yù)處理包括在所述候選糾錯(cuò)文本與所述語音識(shí)別文本中添加分隔符。進(jìn)一步地,所述匹配模塊,用于:根據(jù)所述匹配文本獲取糾錯(cuò)邊界,其中,所述糾錯(cuò)邊界包括糾錯(cuò)起始位置和匹配文本長度;生成語音識(shí)別文本對(duì)應(yīng)的糾錯(cuò)記錄,其中,所述糾錯(cuò)記錄至少包括候選糾錯(cuò)文本、糾錯(cuò)邊界和匹配置信度。進(jìn)一步地,所述輸出模塊,用于:采用篩選和/或組合排序的方式對(duì)所述語音識(shí)別文本對(duì)應(yīng)的多條糾錯(cuò)記錄進(jìn)行優(yōu)化后輸出。進(jìn)一步地,所述輸出模塊,用于:當(dāng)候選糾錯(cuò)文本與語音識(shí)別文本中匹配文本的匹配置信度超過閾值時(shí),從糾錯(cuò)記錄中刪除糾錯(cuò)邊界相交的其它糾錯(cuò)記錄,其中,所述糾錯(cuò)邊界包括糾錯(cuò)起始位置和匹配文本長度。進(jìn)一步地,所述輸出模塊,用于:根據(jù)糾錯(cuò)邊界不相交的多條糾錯(cuò)記錄生成合成記錄,其中,所述糾錯(cuò)邊界包括糾錯(cuò)起始位置和匹配文本長度;利用預(yù)設(shè)方法對(duì)組合記錄組進(jìn)行排序,其中,所述組合記錄組包含所述糾錯(cuò)記錄和由所述糾錯(cuò)記錄生成的合成記錄。進(jìn)一步地,所述輸出模塊,用于:根據(jù)組合記錄組中糾錯(cuò)記錄的糾錯(cuò)評(píng)估分?jǐn)?shù)計(jì)算平均糾錯(cuò)評(píng)估分?jǐn)?shù),按所述平均糾錯(cuò)評(píng)估分?jǐn)?shù)從高到低排列;統(tǒng)計(jì)組合記錄組中的糾錯(cuò)記錄數(shù),按所述糾錯(cuò)記錄數(shù)從多到少排列;統(tǒng)計(jì)組合記錄組中語音識(shí)別文本的匹配文本的總長度,按所述匹配文本的總長度從短到長排列。進(jìn)一步地,所述輸出模塊,用于:根據(jù)糾錯(cuò)記錄對(duì)應(yīng)的匹配置信度和/或相似度得分和/或統(tǒng)計(jì)語言模型得分獲取糾錯(cuò)評(píng)估分?jǐn)?shù)。附圖說明通過閱讀參照以下附圖所作的對(duì)非限制性實(shí)施例所作的詳細(xì)描述,本申請(qǐng)的其它特征、目的和優(yōu)點(diǎn)將會(huì)變得更明顯:圖1為本申請(qǐng)實(shí)施例提供的語音識(shí)別文本的糾錯(cuò)方法的流程圖;圖2為本申請(qǐng)實(shí)施例提供的根據(jù)語音識(shí)別文本和候選糾錯(cuò)文本生成糾錯(cuò)記錄的流程圖;圖3為本申請(qǐng)實(shí)施例提供的編輯距離矩陣示例圖;圖4為本申請(qǐng)實(shí)施例提供的輸出糾錯(cuò)記錄的流程圖;圖5為本申請(qǐng)實(shí)施例提供的計(jì)算糾錯(cuò)評(píng)估分?jǐn)?shù)的流程圖;圖6為本申請(qǐng)實(shí)施例提供的維特比算法原理示意圖;圖7為本申請(qǐng)實(shí)施例提供的分詞路徑示例圖;圖8為本申請(qǐng)實(shí)施例提供的語音識(shí)別文本的糾錯(cuò)裝置的結(jié)構(gòu)示意圖。附圖中相同或相似的附圖標(biāo)記代表相同或相似的部件。具體實(shí)施方式下面將結(jié)合本申請(qǐng)實(shí)施例中的附圖,對(duì)本申請(qǐng)實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是本申請(qǐng)一部分實(shí)施例,而不是全部的實(shí)施例。基于本申請(qǐng)中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有作出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都屬于本申請(qǐng)保護(hù)的范圍。圖1示出了本申請(qǐng)實(shí)施例提供的一種語音識(shí)別文本的糾錯(cuò)方法,該方法包括如下幾個(gè)步驟:步驟S101,獲取語音識(shí)別文本;步驟S102,根據(jù)預(yù)設(shè)的候選糾錯(cuò)文本生成所述語音識(shí)別文本對(duì)應(yīng)的糾錯(cuò)記錄;步驟S103,輸出所述語音識(shí)別文本對(duì)應(yīng)的糾錯(cuò)記錄。在此,步驟S101中的語音識(shí)別文本是任何語音識(shí)別軟件對(duì)用戶語音識(shí)別后產(chǎn)生的文本,是本申請(qǐng)方案的輸入對(duì)象。步驟S102根據(jù)預(yù)設(shè)的候選糾錯(cuò)文本生成所述語音識(shí)別文本對(duì)應(yīng)的糾錯(cuò)記錄,其中,預(yù)設(shè)的候選糾錯(cuò)文本是用于對(duì)語音識(shí)別文本進(jìn)行糾錯(cuò)的多條文本,本申請(qǐng)方案面向的場景是對(duì)涉及語音控制設(shè)備的語音識(shí)別文本進(jìn)行糾錯(cuò),語音識(shí)別文本同語音控制設(shè)備的信息有很強(qiáng)的關(guān)聯(lián),因此可以使用語音控制設(shè)備的信息作為候選的糾錯(cuò)文本,提高糾錯(cuò)的準(zhǔn)確性,同時(shí),由于具體系統(tǒng)中語音控制設(shè)備的數(shù)量是有限的,因此對(duì)語音識(shí)別文本進(jìn)行糾錯(cuò)匹配需要的系統(tǒng)資源也減少很多。預(yù)設(shè)的候選糾錯(cuò)文本的生成方法是通過獲取用戶能操作的所有語音控制設(shè)備信息,選定部分字段信息作為語音識(shí)別文本的候選糾錯(cuò)文本,具體地,本申請(qǐng)實(shí)施例中將語音控制設(shè)備列表名、語音控制設(shè)備類型名作為候選糾錯(cuò)文本。步驟S102根據(jù)預(yù)設(shè)的候選糾錯(cuò)文本生成所述語音識(shí)別文本對(duì)應(yīng)的糾錯(cuò)記錄,如圖2所示,具體包括:一、根據(jù)所述候選糾錯(cuò)文本在所述語音識(shí)別文本中進(jìn)行匹配,以確定所述語音識(shí)別文本中,是否存在與所述候選糾錯(cuò)文本的匹配置信度超過閾值的匹配文本;在使用候選糾錯(cuò)文本對(duì)語音識(shí)別文本進(jìn)行匹配之前,需要對(duì)這兩種文本進(jìn)行預(yù)處理,以提高匹配算法的運(yùn)行效率和匹配準(zhǔn)確性。文本的預(yù)處理方法可以是字符預(yù)處理方法,也可以是文本轉(zhuǎn)拼音預(yù)處理方法或兩者的組合。字符預(yù)處理方法用于對(duì)語音識(shí)別文本和候選糾錯(cuò)文本進(jìn)行分隔與字符轉(zhuǎn)換,包括如下多種方式:在語音識(shí)別文本和候選糾錯(cuò)文本中插入分隔符,語音識(shí)別文本插入分隔符的位置在首字符前、尾字符后和相鄰字符間,候選糾錯(cuò)文本插入分隔符的位置在首字符之前,本申請(qǐng)實(shí)施例中使用的分隔符為空格符“”;將語音識(shí)別文本和候選糾錯(cuò)文本中的字符全部轉(zhuǎn)換為全角/半角字符;將語音識(shí)別文本和候選糾錯(cuò)文本中的字符全部轉(zhuǎn)換為大寫/小寫字符;將未知字符從語音識(shí)別文本和候選糾錯(cuò)文本中移除。文本轉(zhuǎn)拼音預(yù)處理方法用于對(duì)語音識(shí)別文本和候選糾錯(cuò)文本中的字符進(jìn)行轉(zhuǎn)拼音處理,包括如下多種方式:將語音識(shí)別文本和候選糾錯(cuò)文本中的漢字字符和數(shù)字字符轉(zhuǎn)換為漢語拼音字符串,所述漢語拼音字符串既可以是帶音調(diào)的字符串,也可以是不帶音調(diào)的純英文字符串,甚至可以是由聲、韻母及聲調(diào)構(gòu)成的拼音字符串;語音識(shí)別文本和候選糾錯(cuò)文本中的英文字符保持不變;將語音識(shí)別文本和候選糾錯(cuò)文本中的未知字符或特殊字符使用替換符替換,本申請(qǐng)實(shí)施例中使用的替換符為“*”。對(duì)候選糾錯(cuò)文本和語音識(shí)別文本進(jìn)行匹配采用的是基于編輯距離模型的模式匹配算法,候選糾錯(cuò)文本和語音識(shí)別文本可以是進(jìn)行了轉(zhuǎn)拼音處理后的英文字符串,也可以是沒有進(jìn)行轉(zhuǎn)拼音處理的漢字文本。編輯距離(EditDistance)是指兩個(gè)字符串,從一個(gè)字符串改變成另一個(gè)字符串所需要進(jìn)行的編輯操作的最少次數(shù)。本申請(qǐng)實(shí)施例中的編輯操作僅包括將一個(gè)字符替換成另一個(gè)字符、插入一個(gè)字符和刪除一個(gè)字符這三種編輯操作。一般來說,編輯距離越小,表明兩個(gè)字符串的相似度越高。采用基于編輯距離模型的模式匹配算法對(duì)候選糾錯(cuò)文本和語音識(shí)別文本進(jìn)行匹配,具體包括:1)計(jì)算所述候選糾錯(cuò)文本與所述語音識(shí)別文本中的匹配文本之間的編輯距離;表1示出了語音識(shí)別文本“打開下午茶座吧”和候選糾錯(cuò)文本“小虎插座”之間的(編輯距離,糾錯(cuò)起始位置)對(duì)。其中,“[]”代表分隔符。[]打[]開[]下[]午[]茶[]座[]吧[][]0,02,00,13,10,23,20,32,30,43,40,53,50,62,60,7小4,03,03,03,13,11,21,22,22,23,43,43,53,53,63,6虎6,05,05,05,15,13,23,22,22,24,24,25,55,55,65,6插9,08,08,08,18,16,26,25,25,22,22,25,25,26,46,4座12,011,011,010,010,09,29,28,28,25,25,22,22,24,24,2表1圖3示出了語音識(shí)別文本“打開下午茶座吧”和候選糾錯(cuò)文本“小虎插座”進(jìn)行了文本轉(zhuǎn)拼音預(yù)處理后,根據(jù)相應(yīng)拼音字符串計(jì)算得到的編輯距離矩陣。本申請(qǐng)實(shí)施例中使用如下算法來計(jì)算編輯距離矩陣:(a)編輯距離向量和糾錯(cuò)邊界初始值定義如下:editDistance[i]=i,start[i]=0,length[i]=0。其中,editDistance表示當(dāng)前編輯距離列向量,start表示相應(yīng)糾錯(cuò)邊界的起始位置,length表示匹配文本長度,i表示候選糾錯(cuò)文本中字符的索引下標(biāo)(從0開始)。editDistance[i]=i的含意為:候選糾錯(cuò)文本的前i個(gè)字符轉(zhuǎn)換成空字符所需的編輯距離為i。(b)編輯距離列向量和糾錯(cuò)邊界的計(jì)算方法如下:如果當(dāng)前語音識(shí)別文本的拼音字符是分隔符“”,那么:editDistance[i]=min(editDistanceOld[i],i);length[i]=wordIndex-start[i].否則:length[i]=wordIndex-start[i].其中,wordIndex表示當(dāng)前語音識(shí)別文本的拼音字符c,對(duì)應(yīng)的漢字在原文本中的索引位置(從0開始),p[i]表示候選糾錯(cuò)文本中的第i個(gè)拼音字符,定義如下:其中,editDistance為當(dāng)前列向量,editDistanceOld為前一列向量,如圖3所示的編輯距離矩陣的計(jì)算是從左往右、自上而下,逐列計(jì)算編輯距離列向量。與傳統(tǒng)的編輯距離算法相比,上述算法實(shí)現(xiàn)了在輸入文本中模糊匹配、定位指定模式串的功能。計(jì)算編輯距離向量的同時(shí),也更新了模糊匹配的起始位置,免去了再次對(duì)整個(gè)編輯距離矩陣進(jìn)行回溯求解最優(yōu)路徑的開銷。本申請(qǐng)實(shí)施例中,分隔符是整個(gè)計(jì)算過程的核心,其作用在于:分隔符并不參與實(shí)際的字符串相似度計(jì)算;分隔符對(duì)拼音字符串起到分隔、標(biāo)識(shí)對(duì)應(yīng)漢字的作用;只有遇到分隔符才需要計(jì)算當(dāng)前糾錯(cuò)邊界(即糾錯(cuò)起始位置和匹配文本長度)下的匹配置信度,并根據(jù)閾值,判斷是否需要保存糾錯(cuò)記錄;分隔符是定位糾錯(cuò)起始位置的關(guān)鍵。2)根據(jù)所述編輯距離與所述候選糾錯(cuò)文本的長度,獲取所述候選糾錯(cuò)文本與所述匹配文本之間的匹配置信度;本申請(qǐng)實(shí)施例中候選糾錯(cuò)文本與語音識(shí)別文本中的匹配文本之間的匹配置信度計(jì)算公式如下:匹配置信度=1-拼音編輯距離/候選糾錯(cuò)文本拼音長度.需要注意的是,由于語音識(shí)別文本中可能存在錯(cuò)字,也可能存在缺字、多字的情況,所以每個(gè)候選糾錯(cuò)文本的糾錯(cuò)邊界并不唯一,相應(yīng)的匹配置信度也不完全相同。3)確定所述語音識(shí)別文本中存在與所述候選糾錯(cuò)文本的匹配置信度超過閾值的匹配文本。本申請(qǐng)實(shí)施例中將閾值設(shè)定為0.8,參照表1,遍歷最后一行中“[]”對(duì)應(yīng)的(編輯距離,糾錯(cuò)起始位置)對(duì),可知超過閾值的匹配文本只有:“下午茶座”。該匹配文本的匹配置信度為1–2/12,即0.833333。二、在所述語音識(shí)別文本中存在與所述候選糾錯(cuò)文本的匹配置信度超過閾值的匹配文本時(shí),根據(jù)所述匹配文本生成語音識(shí)別文本對(duì)應(yīng)的糾錯(cuò)記錄。本申請(qǐng)實(shí)施例中每條糾錯(cuò)記錄內(nèi)容包括候選糾錯(cuò)文本、糾錯(cuò)邊界(即糾錯(cuò)起始位置和匹配文本長度)和糾錯(cuò)置信度。由前述可知,本申請(qǐng)實(shí)施例中將閾值設(shè)定為0.8后超過閾值的匹配文本只有:“下午茶座”。根據(jù)語音識(shí)別文本“打開下午茶座吧”中的匹配文本“下午茶座”和編輯距離矩陣可得到如下的糾錯(cuò)記錄:候選糾錯(cuò)文本:小虎插座糾錯(cuò)起始位置:2匹配文本長度:4匹配置信度:0.833333步驟S103輸出所述語音識(shí)別文本對(duì)應(yīng)的糾錯(cuò)記錄,具體是采用篩選和/或組合排序的方式對(duì)所述語音識(shí)別文本對(duì)應(yīng)的多條糾錯(cuò)記錄進(jìn)行優(yōu)化后輸出,圖4示出了輸出糾錯(cuò)記錄的流程。采用篩選的方式對(duì)所述語音識(shí)別文本對(duì)應(yīng)的多條糾錯(cuò)記錄進(jìn)行優(yōu)化,具體包括:當(dāng)候選糾錯(cuò)文本與語音識(shí)別文本中匹配文本的匹配置信度超過閾值時(shí),從糾錯(cuò)記錄中刪除糾錯(cuò)邊界相交的其它糾錯(cuò)記錄。其中,糾錯(cuò)邊界相交的解釋為:兩組糾錯(cuò)邊界對(duì)應(yīng)的匹配文本間存在重疊。由于前述匹配算法充分考慮了語音識(shí)別文本中不僅可能存在錯(cuò)字,還可能存在缺字、多字的情形,所以即使指定了匹配置信度閾值,每個(gè)候選糾錯(cuò)文本的糾錯(cuò)邊界也可能并不唯一,對(duì)應(yīng)的匹配置信度也不完全相同。因此當(dāng)匹配置信度足夠大(比如>0.95),糾錯(cuò)記錄足夠可靠時(shí),其它糾錯(cuò)記錄就顯得多余了。以語音識(shí)別文本“打開我是臺(tái)燈”和候選糾錯(cuò)文本“臥室臺(tái)燈”為例,在匹配置信度閾值為0.75時(shí),所有糾錯(cuò)記錄列表如下:(1)候選糾錯(cuò)文本:臥室臺(tái)燈糾錯(cuò)起始位置:2匹配文本長度:4匹配置信度:1.0糾錯(cuò)后的語音文本為:打開臥室臺(tái)燈。(2)候選糾錯(cuò)文本:臥室臺(tái)燈糾錯(cuò)起始位置:3匹配文本長度:3匹配置信度:0.833333(即1–2/12)糾錯(cuò)后的語音文本為:打開我臥室臺(tái)燈。顯然,第一條糾錯(cuò)記錄已經(jīng)足夠可靠了。采用組合排序的方式對(duì)所述語音識(shí)別文本對(duì)應(yīng)的多條糾錯(cuò)記錄進(jìn)行優(yōu)化,具體包括:1、根據(jù)糾錯(cuò)邊界不相交的多條糾錯(cuò)記錄生成合成記錄;以語音識(shí)別文本“打開我是臺(tái)風(fēng)和下午茶座”和候選糾錯(cuò)文本“臥室臺(tái)燈”、“小虎插座”為例,在匹配置信度閾值為0.75時(shí),所有糾錯(cuò)記錄列表如下:(1)候選糾錯(cuò)文本:臥室臺(tái)燈糾錯(cuò)起始位置:2匹配文本長度:4匹配置信度:0.9167(即1–1/12)(2)候選糾錯(cuò)文本:臥室臺(tái)燈糾錯(cuò)起始位置:3匹配文本長度:3匹配置信度:0.75(即1–3/12)(3)候選糾錯(cuò)文本:小虎插座糾錯(cuò)起始位置:7匹配文本長度:4匹配置信度:0.833333(即1–2/12)生成的合成記錄有{(1),(3)}和{(2),(3)}。2、利用預(yù)設(shè)方法對(duì)組合記錄組進(jìn)行排序,其中,所述組合記錄組包含所述糾錯(cuò)記錄和由所述糾錯(cuò)記錄生成的合成記錄。仍以前述語音識(shí)別文本“打開我是臺(tái)風(fēng)和下午茶座”和候選糾錯(cuò)文本“臥室臺(tái)燈”、“小虎插座”為例,在匹配置信度閾值為0.75時(shí),生成的組合記錄組中共有有{(1),(3)}、{(2),(3)}、{(1)}、{(2)}、{(3)}五條記錄,包括2條合成記錄和3條糾錯(cuò)記錄。相應(yīng)糾錯(cuò)后的語音識(shí)別文本如下:{(1),(3)}:打開臥室臺(tái)燈和小虎插座。{(2),(3)}:打開我臥室臺(tái)燈和小虎插座。{(1)}:打開臥室臺(tái)燈和下午茶座。{(2)}:打開我臥室臺(tái)燈和下午茶座。{(3)}:打開我是臺(tái)風(fēng)和小虎插座。對(duì)組合記錄組進(jìn)行排序的預(yù)設(shè)方法,可以選擇如下一種或多種方法的組合:(a)根據(jù)組合記錄組中糾錯(cuò)記錄的糾錯(cuò)評(píng)估分?jǐn)?shù)計(jì)算平均糾錯(cuò)評(píng)估分?jǐn)?shù),按所述平均糾錯(cuò)評(píng)估分?jǐn)?shù)從高到低排列;(b)統(tǒng)計(jì)組合記錄組中的糾錯(cuò)記錄數(shù),按所述糾錯(cuò)記錄數(shù)從多到少排列;(c)統(tǒng)計(jì)組合記錄組中語音識(shí)別文本的匹配文本的總長度,按所述匹配文本的總長度從短到長排列。在此,平均糾錯(cuò)評(píng)估分?jǐn)?shù)越高,表明糾錯(cuò)后的語音識(shí)別文本越可靠;匹配文本的總長度越短,表明原語音識(shí)別文本中被保留的信息越多。糾錯(cuò)記錄的糾錯(cuò)評(píng)估分?jǐn)?shù)根據(jù)糾錯(cuò)記錄對(duì)應(yīng)的匹配置信度和/或相似度得分和/或統(tǒng)計(jì)語言模型得分加權(quán)計(jì)算得到,圖5示出了糾錯(cuò)評(píng)估分?jǐn)?shù)的計(jì)算流程。本申請(qǐng)實(shí)施例中糾錯(cuò)記錄的糾錯(cuò)評(píng)估分?jǐn)?shù)計(jì)算公式如下:糾錯(cuò)評(píng)估分?jǐn)?shù)=匹配置信度+相似度權(quán)重*相似度得分+分詞權(quán)重*統(tǒng)計(jì)語言模型得分;其中,相似度權(quán)重和分詞權(quán)重為經(jīng)驗(yàn)參數(shù),視語料庫及模塊效果而調(diào)整。相似度得分根據(jù)候選糾錯(cuò)文本和匹配文本間的相似度得到。其中,匹配文本是指根據(jù)當(dāng)前糾錯(cuò)記錄從語音識(shí)別文本中截取的一個(gè)子文本。該子文本是語音識(shí)別文本中以糾錯(cuò)起始位置開始,以匹配文本長度為長度的字符串。例如,根據(jù)語音識(shí)別文本“打開下午茶座吧”和候選糾錯(cuò)文本“小虎插座”生成的糾錯(cuò)記錄中糾錯(cuò)起始位置為2(對(duì)應(yīng)漢字為‘下’),匹配文本長度為4,因此匹配文本為“下午茶座”。計(jì)算文本間相似度的算法,既可以是最長公共子序列算法,也可以是最長公共子串等其它用于計(jì)算字符串相似度的算法。最長公共子序列(LongestCommonSubsequence)是指序列S是兩個(gè)或多個(gè)已知序列的子序列,且是所有符合條件序列中最長的。它并不要求子序列在已知序列中連續(xù)。如果添上連續(xù)性條件,則就成為了最長公共子串(LongestCommonSubstring)。以字符串“abcfbc”和“abfcab”為例,最長公共子序列為“abcb”或“abfb”,長度為4;最長公共子串為“ab”,長度為2。本申請(qǐng)實(shí)施例中采用的相似度算法是基于漢字字符串的最長公共子序列算法。相似度得分計(jì)算公式如下:相似度得分=最長公共子序列長度/候選糾錯(cuò)文本長度。例如,“小虎插座”與“下午茶座”的相似度得分為:sim(小虎插座,下午茶座)=1/4=0.25。統(tǒng)計(jì)語言模型得分可以用來表示糾錯(cuò)后,語音識(shí)別文本的合理性。不同于英文字符串,中文字符串中并不存在天然的單詞分隔符,所以計(jì)算漢語的統(tǒng)計(jì)語言模型得分時(shí),首先需要進(jìn)行分詞。本申請(qǐng)實(shí)施例中采用的分詞算法為基于維特比算法的分詞算法,語料庫可以為帶詞性標(biāo)注的2014人民日?qǐng)?bào)語料庫。對(duì)語料庫進(jìn)行簡單的預(yù)處理(如移除特殊字符等)后,可以統(tǒng)計(jì)得到語料庫中所有單詞和漢字出現(xiàn)的詞頻。維特比算法是一種動(dòng)態(tài)規(guī)劃算法,用于解決圖中的最短路徑問題,能有效降低計(jì)算復(fù)雜度,如圖6所示。維特比算法的核心在于,假設(shè)已知到第i列所有節(jié)點(diǎn)的最短路徑Xi,j,那么:Xi+1,k=min{Xi,j+dj,k|j=1,2,…,ni;k=1,2,…,ni+1}.其中,ni表示第i列節(jié)點(diǎn)個(gè)數(shù),ni+1表示第i+1列節(jié)點(diǎn)個(gè)數(shù)。仍以糾錯(cuò)后的語音識(shí)別文本“打開小虎插座吧”為例,簡單說明維特比分詞算法。首先,基于當(dāng)前語料庫下的詞典,生成詞圖。詞圖即輸入文本中所有可能出現(xiàn)的單詞及漢字構(gòu)成的圖。如果一個(gè)詞A的下一個(gè)詞可能是B的話,那么A和B之間就有一條路徑(A,B)。一個(gè)詞可能有多個(gè)后續(xù)詞,也可能有多個(gè)前驅(qū)詞,它們構(gòu)成的圖即為詞圖。如果將一個(gè)詞的起始位置作為行,終止位置作為列,則又可以將詞圖轉(zhuǎn)換為一個(gè)二維矩陣。如下表2示出了“打開小虎插座吧”在語料庫詞典下的詞圖矩陣。012345670始##始1打打開2開3小小虎4虎5插插座6座7末##末表2表2所示的詞圖矩陣中,從起始節(jié)點(diǎn)(始##始)到結(jié)尾節(jié)點(diǎn)(末##末)存在如下路徑:始##始—>打—>開—>小—>虎—>插—>座—>末##末;始##始—>打—>開—>小—>虎—>插座—>末##末;始##始—>打—>開—>小虎—>插—>座—>末##末;始##始—>打開—>小—>虎—>插—>座—>末##末;始##始—>打—>開—>小虎—>插座—>末##末;始##始—>打開—>小—>虎—>插座—>末##末;始##始—>打開—>小虎—>插—>座—>末##末;始##始—>打開—>小虎—>插座—>末##末。顯然,隨著語音文本增長,詞節(jié)點(diǎn)增加,路徑數(shù)將激增,遍歷計(jì)算所有路徑的開銷也將隨之上升。本申請(qǐng)實(shí)施例中,任意兩分詞節(jié)點(diǎn)間距離的基本計(jì)算公式為:其中,from、to表示兩分詞節(jié)點(diǎn),freq(from)表示單詞from在語料庫中的出現(xiàn)的次數(shù),freq(from,to)表示單詞對(duì)(from、to)在語料庫中的共現(xiàn)次數(shù),total_freq表示語料庫中所有單詞出現(xiàn)的總數(shù),w為預(yù)定義權(quán)重0.2。上式中,freq(from)/total_freq度量了單詞from在語料庫中出現(xiàn)的概率,(1+freq(from,to))/(1+freq(from))度量了單詞對(duì)(from、to)在語料庫中出現(xiàn)的條件概率。為進(jìn)一步降低計(jì)算復(fù)雜度,直接基于相鄰節(jié)點(diǎn)間的距離,從末節(jié)點(diǎn)開始依次選取距離最短的節(jié)點(diǎn),得到局部最優(yōu)分詞路徑作為最終分詞路徑。本申請(qǐng)實(shí)施例中的統(tǒng)計(jì)語言模型得分定義為:score=1/distance(始##始,末##末)圖7示出了糾錯(cuò)后的語音識(shí)別文本“打開小虎插座”的分詞路徑,其中最終分詞路徑中分詞節(jié)點(diǎn)的選取依次為:插座—>小虎—>打開,根據(jù)上述公式計(jì)算統(tǒng)計(jì)語言模型得分為:1/17=1/(1+5+5+6)。得到糾錯(cuò)記錄的相似度得分和統(tǒng)計(jì)語言模型得分之后,根據(jù)糾錯(cuò)記錄的糾錯(cuò)評(píng)估分?jǐn)?shù)計(jì)算公式得到最終的糾錯(cuò)評(píng)估分?jǐn)?shù)。例如,根據(jù)語音識(shí)別文本“打開下午茶座吧”和候選糾錯(cuò)文本“小虎插座”生成的糾錯(cuò)記錄中糾錯(cuò)起始位置為2(對(duì)應(yīng)漢字為‘下’),匹配文本長度為4,可得到匹配置信度為0.8333,將相似度權(quán)重設(shè)置為0.2,分詞權(quán)重設(shè)置為0.5,可計(jì)算得到糾錯(cuò)評(píng)估分?jǐn)?shù)為:0.913=0.8333+0.2*0.25+0.5/17。需要說明的是,相似度得分和統(tǒng)計(jì)語言模型得分并不是必要的,但加上后可以進(jìn)一步優(yōu)化糾錯(cuò)記錄的可靠性。分詞權(quán)重設(shè)置為0,表明不考慮統(tǒng)計(jì)語言模型,可以減少計(jì)算開銷。類似的,也可以將相似度權(quán)重設(shè)置為0。仍以語音識(shí)別文本“打開我是臺(tái)風(fēng)和下午茶座”和候選糾錯(cuò)文本“臥室臺(tái)燈”、“小虎插座”為例(不考慮相似度得分和統(tǒng)計(jì)語言模型得分,即權(quán)重均設(shè)置為0),對(duì)糾錯(cuò)記錄組先按糾錯(cuò)記錄數(shù)從多到少排序,再按糾錯(cuò)評(píng)估分?jǐn)?shù)從高到低排序后的結(jié)果如下:{(1),(3)},均分:0.875,匹配文本長度:8,糾錯(cuò)后語音識(shí)別文本:打開臥室臺(tái)燈和小虎插座。{(2),(3)},均分:0.792,匹配文本長度:7,糾錯(cuò)后語音識(shí)別文本:打開我臥室臺(tái)燈和小虎插座。{(1)},均分:0.9167,匹配文本長度:4,糾錯(cuò)后語音識(shí)別文本:打開臥室臺(tái)燈和下午茶座。{(3)},均分:0.833,匹配文本長度:4,糾錯(cuò)后語音識(shí)別文本:打開我是臺(tái)風(fēng)和小虎插座。{(2)},均分:0.750,匹配文本長度:3,糾錯(cuò)后語音識(shí)別文本:打開我臥室臺(tái)燈和下午茶座。更一般地,還可以為每個(gè)組合記錄組定義如下排序得分,據(jù)此由高到低排序:其中,fi表示糾錯(cuò)記錄組的第i個(gè)排序因子的數(shù)值,wi為相應(yīng)權(quán)重,n為預(yù)先選定的排序因子數(shù)目。排序因子可以為:糾錯(cuò)記錄個(gè)數(shù)、糾錯(cuò)記錄平均最終得分、糾錯(cuò)記錄平均匹配置信度、糾錯(cuò)文本總長度、候選糾錯(cuò)文本總長度等等。根據(jù)本申請(qǐng)的另一方面,還提供了一種語音識(shí)別文本的糾錯(cuò)裝置,該裝置的結(jié)構(gòu)如圖8所示,包括讀取模塊210、匹配模塊220和輸出模塊230。具體地,讀取模塊210用于獲取語音識(shí)別文本;匹配模塊220用于根據(jù)預(yù)設(shè)的候選糾錯(cuò)文本生成所述語音識(shí)別文本對(duì)應(yīng)的糾錯(cuò)記錄;輸出模塊230用于輸出所述語音識(shí)別文本對(duì)應(yīng)的糾錯(cuò)記錄。在此,讀取模塊210獲取的語音識(shí)別文本是任何語音識(shí)別軟件對(duì)用戶語音識(shí)別后產(chǎn)生的文本,是本申請(qǐng)方案的輸入對(duì)象。匹配模塊220用于根據(jù)預(yù)設(shè)的候選糾錯(cuò)文本生成所述語音識(shí)別文本對(duì)應(yīng)的糾錯(cuò)記錄,其中,預(yù)設(shè)的候選糾錯(cuò)文本是用于對(duì)語音識(shí)別文本進(jìn)行糾錯(cuò)的多條文本,本申請(qǐng)方案面向的場景是對(duì)涉及語音控制設(shè)備的語音識(shí)別文本進(jìn)行糾錯(cuò),語音識(shí)別文本同語音控制設(shè)備的信息有很強(qiáng)的關(guān)聯(lián),因此可以使用語音控制設(shè)備的信息作為候選的糾錯(cuò)文本,提高糾錯(cuò)的準(zhǔn)確性。同時(shí),由于具體系統(tǒng)中語音控制設(shè)備的數(shù)量是有限的,因此對(duì)語音識(shí)別文本進(jìn)行糾錯(cuò)匹配需要的系統(tǒng)資源也減少很多。預(yù)設(shè)的候選糾錯(cuò)文本的生成方法是通過獲取用戶能操作的所有語音控制設(shè)備信息,選定部分字段信息作為語音識(shí)別文本的候選糾錯(cuò)文本。具體地,本申請(qǐng)實(shí)施例中將語音控制設(shè)備列表名、語音控制設(shè)備類型名作為候選糾錯(cuò)文本。匹配模塊220用于根據(jù)預(yù)設(shè)的候選糾錯(cuò)文本生成所述語音識(shí)別文本對(duì)應(yīng)的糾錯(cuò)記錄,如圖2所示,具體用于:一、根據(jù)所述候選糾錯(cuò)文本在所述語音識(shí)別文本中進(jìn)行匹配,以確定所述語音識(shí)別文本中,是否存在與所述候選糾錯(cuò)文本的匹配置信度超過閾值的匹配文本;在使用候選糾錯(cuò)文本對(duì)語音識(shí)別文本進(jìn)行匹配之前,需要對(duì)這兩種文本進(jìn)行預(yù)處理,以提高匹配算法的運(yùn)行效率和匹配準(zhǔn)確性。文本的預(yù)處理方法可以是字符預(yù)處理方法,也可以是文本轉(zhuǎn)拼音預(yù)處理方法或兩者的組合。字符預(yù)處理方法用于對(duì)語音識(shí)別文本和候選糾錯(cuò)文本進(jìn)行分隔與字符轉(zhuǎn)換,包括如下多種方式:在語音識(shí)別文本和候選糾錯(cuò)文本中插入分隔符,語音識(shí)別文本插入分隔符的位置在首字符前、尾字符后和相鄰字符間,候選糾錯(cuò)文本插入分隔符的位置在首字符之前,本申請(qǐng)實(shí)施例中使用的分隔符為空格符“”;將語音識(shí)別文本和候選糾錯(cuò)文本中的字符全部轉(zhuǎn)換為全角/半角字符;將語音識(shí)別文本和候選糾錯(cuò)文本中的字符全部轉(zhuǎn)換為大寫/小寫字符;將未知字符從語音識(shí)別文本和候選糾錯(cuò)文本中移除。文本轉(zhuǎn)拼音預(yù)處理方法用于對(duì)語音識(shí)別文本和候選糾錯(cuò)文本中的字符進(jìn)行轉(zhuǎn)拼音處理,包括如下多種方式:將語音識(shí)別文本和候選糾錯(cuò)文本中的漢字字符和數(shù)字字符轉(zhuǎn)換為漢語拼音字符串,所述漢語拼音字符串既可以是帶音調(diào)的字符串,也可以是不帶音調(diào)的純英文字符串,甚至可以是由聲、韻母及聲調(diào)構(gòu)成的拼音字符串;語音識(shí)別文本和候選糾錯(cuò)文本中的英文字符保持不變;將語音識(shí)別文本和候選糾錯(cuò)文本中的未知字符或特殊字符使用替換符替換,本申請(qǐng)實(shí)施例中使用的替換符為“*”。對(duì)候選糾錯(cuò)文本和語音識(shí)別文本進(jìn)行匹配采用的是基于編輯距離模型的模式匹配算法,候選糾錯(cuò)文本和語音識(shí)別文本可以是進(jìn)行了轉(zhuǎn)拼音處理后的英文字符串,也可以是沒有進(jìn)行轉(zhuǎn)拼音處理的漢字文本。編輯距離(EditDistance)是指兩個(gè)字符串從一個(gè)字符串改變成另一個(gè)字符串所需要進(jìn)行的編輯操作的最少次數(shù)。本申請(qǐng)實(shí)施例中的編輯操作僅包括將一個(gè)字符替換成另一個(gè)字符、插入一個(gè)字符和刪除一個(gè)字符這三種編輯操作。一般來說,編輯距離越小,表明兩個(gè)字符串的相似度越高。采用基于編輯距離模型的模式匹配算法對(duì)候選糾錯(cuò)文本和語音識(shí)別文本進(jìn)行匹配,具體包括:1)計(jì)算所述候選糾錯(cuò)文本與所述語音識(shí)別文本中的匹配文本之間的編輯距離;表1示出了語音識(shí)別文本“打開下午茶座吧”和候選糾錯(cuò)文本“小虎插座”之間的(編輯距離,糾錯(cuò)起始位置)對(duì)。其中,“[]”代表分隔符。圖3示出了語音識(shí)別文本“打開下午茶座吧”和候選糾錯(cuò)文本“小虎插座”進(jìn)行了文本轉(zhuǎn)拼音預(yù)處理后,根據(jù)相應(yīng)拼音字符串計(jì)算得到的編輯距離矩陣。本申請(qǐng)實(shí)施例中使用如下算法來計(jì)算編輯距離矩陣:(a)編輯距離向量和糾錯(cuò)邊界初始值定義如下:editDistance[i]=i,start[i]=0,length[i]=0。其中,editDistance表示當(dāng)前編輯距離列向量,start表示相應(yīng)糾錯(cuò)邊界的起始位置,length表示匹配文本長度,i表示候選糾錯(cuò)文本中字符的索引下標(biāo)(從0開始)。editDistance[i]=i的含意為:候選糾錯(cuò)文本的前i個(gè)字符轉(zhuǎn)換成空字符所需的編輯距離為i。(b)編輯距離列向量和糾錯(cuò)邊界的計(jì)算方法如下:如果當(dāng)前語音識(shí)別文本的拼音字符是分隔符“”,那么:editDistance[i]=min(editDistanceOld[i],i);length[i]=wordIndex-start[i].否則:length[i]=wordIndex-start[i].其中,wordIndex表示當(dāng)前語音識(shí)別文本的拼音字符c,對(duì)應(yīng)的漢字在原文本中的索引位置(從0開始),p[i]表示候選糾錯(cuò)文本中的第i個(gè)拼音字符,定義如下:其中,editDistance為當(dāng)前列向量,editDistanceOld為前一列向量,如圖3所示的編輯距離矩陣的計(jì)算是從左往右、自上而下,逐列計(jì)算編輯距離列向量。與傳統(tǒng)的編輯距離算法相比,上述算法實(shí)現(xiàn)了在輸入文本中模糊匹配、定位指定模式串的功能。計(jì)算編輯距離向量的同時(shí),也更新了模糊匹配的起始位置,免去了再次對(duì)整個(gè)編輯距離矩陣進(jìn)行回溯求解最優(yōu)路徑的開銷。本申請(qǐng)實(shí)施例中,分隔符是整個(gè)計(jì)算過程的核心,其作用在于:分隔符并不參與實(shí)際的字符串相似度計(jì)算;分隔符對(duì)拼音字符串起到分隔、標(biāo)識(shí)對(duì)應(yīng)漢字的作用;只有遇到分隔符才需要計(jì)算當(dāng)前糾錯(cuò)邊界(即糾錯(cuò)起始位置和匹配文本長度)下的匹配置信度,并判斷是否需要保存糾錯(cuò)記錄;分隔符是定位糾錯(cuò)起始位置的關(guān)鍵。2)根據(jù)所述編輯距離與所述候選糾錯(cuò)文本的長度,獲取所述候選糾錯(cuò)文本與所述匹配文本之間的匹配置信度;本申請(qǐng)實(shí)施例中候選糾錯(cuò)文本與語音識(shí)別文本中的匹配文本之間的匹配置信度計(jì)算公式如下:匹配置信度=1-拼音編輯距離/候選糾錯(cuò)文本拼音長度.需要注意的是,由于語音識(shí)別文本中可能存在錯(cuò)字,也可能存在缺字、多字的情況,所以每個(gè)候選糾錯(cuò)文本的糾錯(cuò)邊界并不唯一,相應(yīng)的匹配置信度也不完全相同。3)確定所述語音識(shí)別文本中存在與所述候選糾錯(cuò)文本的匹配置信度超過閾值的匹配文本。本申請(qǐng)實(shí)施例中將閾值設(shè)定為0.8,參照表1,遍歷最后一行中“[]”對(duì)應(yīng)的(編輯距離,糾錯(cuò)起始位置)對(duì),可知超過閾值的匹配文本只有:“下午茶座”。該匹配文本的匹配置信度為1–2/12,即0.833333。二、在所述語音識(shí)別文本中存在與所述候選糾錯(cuò)文本的匹配置信度超過閾值的匹配文本時(shí),根據(jù)所述匹配文本生成語音識(shí)別文本對(duì)應(yīng)的糾錯(cuò)記錄。本申請(qǐng)實(shí)施例中每條糾錯(cuò)記錄內(nèi)容包括候選糾錯(cuò)文本、糾錯(cuò)邊界(即糾錯(cuò)起始位置和匹配文本長度)和糾錯(cuò)置信度。由前述可知,本申請(qǐng)實(shí)施例中將閾值設(shè)定為0.8后超過閾值的匹配文本只有:“下午茶座”。根據(jù)語音識(shí)別文本“打開下午茶座吧”中的匹配文本“下午茶座”和編輯距離矩陣可得到如下的糾錯(cuò)記錄:候選糾錯(cuò)文本:小虎插座糾錯(cuò)起始位置:2匹配文本長度:4匹配置信度:0.833333輸出模塊230用于輸出所述語音識(shí)別文本對(duì)應(yīng)的糾錯(cuò)記錄,具體地,用于采用篩選和/或組合排序的方式對(duì)所述語音識(shí)別文本對(duì)應(yīng)的多條糾錯(cuò)記錄進(jìn)行優(yōu)化后輸出,圖4示出了輸出模塊的工作流程。采用篩選的方式對(duì)所述語音識(shí)別文本對(duì)應(yīng)的多條糾錯(cuò)記錄進(jìn)行優(yōu)化,具體包括:當(dāng)候選糾錯(cuò)文本與語音識(shí)別文本中匹配文本的匹配置信度超過閾值時(shí),從糾錯(cuò)記錄結(jié)果集合中刪除糾錯(cuò)邊界相交的其它糾錯(cuò)記錄。其中,糾錯(cuò)邊界相交的解釋為:兩組糾錯(cuò)邊界對(duì)應(yīng)的匹配文本間存在重疊。由于前述匹配算法充分考慮了語音識(shí)別文本中不僅可能存在錯(cuò)字,還可能存在缺字、多字的情形,所以即使指定了匹配置信度閾值,每個(gè)候選糾錯(cuò)文本的糾錯(cuò)邊界也可能并不唯一,對(duì)應(yīng)的匹配置信度也不完全相同。因此當(dāng)匹配置信度足夠大(比如>0.95),糾錯(cuò)記錄足夠可靠時(shí),其它糾錯(cuò)記錄就顯得多余了。以語音識(shí)別文本“打開我是臺(tái)燈”和候選糾錯(cuò)文本“臥室臺(tái)燈”為例,在匹配置信度閾值為0.75時(shí),所有糾錯(cuò)記錄列表如下:(1)候選糾錯(cuò)文本:臥室臺(tái)燈糾錯(cuò)起始位置:2匹配文本長度:4匹配置信度:1.0糾錯(cuò)后的語音文本為:打開臥室臺(tái)燈。(2)候選糾錯(cuò)文本:臥室臺(tái)燈糾錯(cuò)起始位置:3匹配文本長度:3匹配置信度:0.833333(即1–2/12)糾錯(cuò)后的語音文本為:打開我臥室臺(tái)燈。顯然,第一條糾錯(cuò)記錄已經(jīng)足夠可靠了。采用組合排序的方式對(duì)所述語音識(shí)別文本對(duì)應(yīng)的多條糾錯(cuò)記錄進(jìn)行優(yōu)化,具體包括:1、根據(jù)糾錯(cuò)邊界不相交的多條糾錯(cuò)記錄生成合成記錄;以語音識(shí)別文本“打開我是臺(tái)風(fēng)和下午茶座”和候選糾錯(cuò)文本“臥室臺(tái)燈”、“小虎插座”為例,在匹配置信度閾值為0.75時(shí),所有糾錯(cuò)記錄列表如下:(1)候選糾錯(cuò)文本:臥室臺(tái)燈糾錯(cuò)起始位置:2匹配文本長度:4匹配置信度:0.9167(即1–1/12)(2)候選糾錯(cuò)文本:臥室臺(tái)燈糾錯(cuò)起始位置:3匹配文本長度:3匹配置信度:0.75(即1–3/12)(3)候選糾錯(cuò)文本:小虎插座糾錯(cuò)起始位置:7匹配文本長度:4匹配置信度:0.833333(即1–2/12)生成的合成記錄有{(1),(3)}和{(2),(3)}。2、利用預(yù)設(shè)方法對(duì)組合記錄組進(jìn)行排序,其中,所述組合記錄組包含所述糾錯(cuò)記錄和由所述糾錯(cuò)記錄生成的合成記錄。仍以前述語音識(shí)別文本“打開我是臺(tái)風(fēng)和下午茶座”和候選糾錯(cuò)文本“臥室臺(tái)燈”、“小虎插座”為例,在匹配置信度閾值為0.75時(shí),生成的組合記錄組中共有有{(1),(3)}、{(2),(3)}、{(1)}、{(2)}、{(3)}五條記錄,包括2條合成記錄和3條糾錯(cuò)記錄。相應(yīng)糾錯(cuò)后的語音識(shí)別文本如下:{(1),(3)}:打開臥室臺(tái)燈和小虎插座。{(2),3)}:打開我臥室臺(tái)燈和小虎插座。{(1)}:打開臥室臺(tái)燈和下午茶座。{(2)}:打開我臥室臺(tái)燈和下午茶座。{(3)}:打開我是臺(tái)風(fēng)和小虎插座。對(duì)組合記錄組進(jìn)行排序的預(yù)設(shè)方法,可以選擇如下一種或多種的組合:(a)根據(jù)組合記錄組中糾錯(cuò)記錄的糾錯(cuò)評(píng)估分?jǐn)?shù)計(jì)算平均糾錯(cuò)評(píng)估分?jǐn)?shù),按所述平均糾錯(cuò)評(píng)估分?jǐn)?shù)從高到低排列;(b)統(tǒng)計(jì)組合記錄組中的糾錯(cuò)記錄數(shù),按所述糾錯(cuò)記錄數(shù)從多到少排列;(c)統(tǒng)計(jì)組合記錄組中語音識(shí)別文本的匹配文本的總長度,按所述匹配文本的總長度從短到長排列。在此,平均糾錯(cuò)評(píng)估分?jǐn)?shù)越高,表明糾錯(cuò)后的語音識(shí)別文本越可靠;匹配文本的總長度越短,表明原語音識(shí)別文本中被保留的信息越多。糾錯(cuò)記錄的糾錯(cuò)評(píng)估分?jǐn)?shù)根據(jù)糾錯(cuò)記錄對(duì)應(yīng)的匹配置信度和/或相似度得分和/或統(tǒng)計(jì)語言模型得分加權(quán)計(jì)算得到,圖5示出了糾錯(cuò)評(píng)估分?jǐn)?shù)的計(jì)算流程。本申請(qǐng)實(shí)施例中糾錯(cuò)記錄的糾錯(cuò)評(píng)估分?jǐn)?shù)計(jì)算公式如下:糾錯(cuò)評(píng)估分?jǐn)?shù)=匹配置信度+相似度權(quán)重*相似度得分+分詞權(quán)重*統(tǒng)計(jì)語言模型得分;其中,相似度權(quán)重和分詞權(quán)重為經(jīng)驗(yàn)參數(shù),視語料庫及模塊效果而調(diào)整。相似度得分根據(jù)候選糾錯(cuò)文本和匹配文本間的相似度得到。其中,匹配文本是指根據(jù)當(dāng)前糾錯(cuò)記錄從語音識(shí)別文本中截取的一個(gè)子文本。該子文本是語音識(shí)別文本中以糾錯(cuò)起始位置開始,以匹配文本長度為長度的字符串。例如,根據(jù)語音識(shí)別文本“打開下午茶座吧”和候選糾錯(cuò)文本“小虎插座”生成的糾錯(cuò)記錄中糾錯(cuò)起始位置為2(對(duì)應(yīng)漢字為‘下’),匹配文本長度為4,因此匹配文本為“下午茶座”。計(jì)算文本間相似度的算法,既可以是最長公共子序列算法,也可以是最長公共子串等其它用于計(jì)算字符串相似度的算法。最長公共子序列(LongestCommonSubsequence)是指序列S是兩個(gè)或多個(gè)已知序列的子序列,且是所有符合條件序列中最長的。它并不要求子序列在已知序列中連續(xù)。如果添上連續(xù)性條件,則就成為了最長公共子串(LongestCommonSubstring)。以字符串“abcfbc”和“abfcab”為例,最長公共子序列為“abcb”或“abfb”,長度為4;最長公共子串為“ab”,長度為2。本申請(qǐng)實(shí)施例中采用的相似度算法是基于漢字字符串的最長公共子序列算法。相似度得分計(jì)算公式如下:相似度得分=最長公共子序列長度/候選糾錯(cuò)文本長度。例如,“小虎插座”與“下午茶座”的相似度得分為:sim(小虎插座,下午茶座)=1/4=0.25。統(tǒng)計(jì)語言模型得分可以用來表示糾錯(cuò)后,語音識(shí)別文本的合理性。不同于英文字符串,中文字符串中并不存在天然的單詞分隔符,所以計(jì)算漢語的統(tǒng)計(jì)語言模型得分時(shí),首先需要進(jìn)行分詞。本申請(qǐng)實(shí)施例中采用的分詞算法為基于維特比算法的分詞算法,語料庫可以為帶詞性標(biāo)注的2014人民日?qǐng)?bào)語料庫。對(duì)語料庫進(jìn)行簡單的預(yù)處理(如移除特殊字符等)后,可以統(tǒng)計(jì)得到語料庫中所有單詞和漢字出現(xiàn)的詞頻。維特比算法是一種動(dòng)態(tài)規(guī)劃算法,用于解決圖中的最短路徑問題,能有效降低計(jì)算復(fù)雜度,如圖6所示。維特比算法的核心在于,假設(shè)已知到第i列所有節(jié)點(diǎn)的最短路徑Xi,j,那么:Xi+1,k=min{Xi,j+dj,k|j=1,2,…,ni;k=1,2,…,ni+1}.其中,ni表示第i列節(jié)點(diǎn)個(gè)數(shù),ni+1表示第i+1列節(jié)點(diǎn)個(gè)數(shù)。仍以糾錯(cuò)后的語音識(shí)別文本“打開小虎插座吧”為例,簡單說明維特比分詞算法。首先,基于當(dāng)前語料庫下的詞典,生成詞圖。詞圖即輸入文本中所有可能出現(xiàn)的單詞及漢字構(gòu)成的圖。如果一個(gè)詞A的下一個(gè)詞可能是B的話,那么A和B之間就有一條路徑(A,B)。一個(gè)詞可能有多個(gè)后續(xù)詞,也可能有多個(gè)前驅(qū)詞,它們構(gòu)成的圖即為詞圖。如果將一個(gè)詞的起始位置作為行,終止位置作為列,則又可以將詞圖轉(zhuǎn)換為一個(gè)二維矩陣。表2示出了“打開小虎插座吧”在語料庫詞典下的詞圖矩陣。表2所示的詞圖矩陣中,從起始節(jié)點(diǎn)(始##始)到結(jié)尾節(jié)點(diǎn)(末##末)存在如下路徑:始##始—>打—>開—>小—>虎—>插—>座—>末##末;始##始—>打—>開—>小—>虎—>插座—>末##末;始##始—>打—>開—>小虎—>插—>座—>末##末;始##始—>打開—>小—>虎—>插—>座—>末##末;始##始—>打—>開—>小虎—>插座—>末##末;始##始—>打開—>小—>虎—>插座—>末##末;始##始—>打開—>小虎—>插—>座—>末##末;始##始—>打開—>小虎—>插座—>末##末。顯然,隨著語音文本增長,詞節(jié)點(diǎn)增加,路徑數(shù)將激增,遍歷計(jì)算所有路徑的開銷也將隨之上升。本申請(qǐng)實(shí)施例中,任意兩分詞節(jié)點(diǎn)間距離的基本計(jì)算公式為:其中,from、to表示兩分詞節(jié)點(diǎn),freq(from)表示單詞from在語料庫中的出現(xiàn)的次數(shù),freq(from,to)表示單詞對(duì)(from、to)在語料庫中的共現(xiàn)次數(shù),total_freq表示語料庫中所有單詞出現(xiàn)的總數(shù),w為預(yù)定義權(quán)重0.2。上式中,freq(from)/total_freq度量了單詞from在語料庫中出現(xiàn)的概率,(1+freq(from,to))/(1+freq(from))度量了單詞對(duì)(from、to)在語料庫中出現(xiàn)的條件概率。為進(jìn)一步降低計(jì)算復(fù)雜度,直接基于相鄰節(jié)點(diǎn)間的距離,從末節(jié)點(diǎn)開始依次選取距離最短的節(jié)點(diǎn),得到局部最優(yōu)分詞路徑作為最終分詞路徑。本申請(qǐng)實(shí)施例中的統(tǒng)計(jì)語言模型得分定義為:score=1/distance(始##始,末##末)圖7示出了糾錯(cuò)后的語音識(shí)別文本“打開小虎插座”的分詞路徑,其中最終分詞路徑中分詞節(jié)點(diǎn)的選取依次為:插座—>小虎—>打開,根據(jù)上述公式計(jì)算統(tǒng)計(jì)語言模型得分為:1/17=1/(1+5+5+6)。得到糾錯(cuò)記錄的相似度得分和統(tǒng)計(jì)語言模型得分之后,根據(jù)糾錯(cuò)記錄的糾錯(cuò)評(píng)估分?jǐn)?shù)計(jì)算公式得到最終的糾錯(cuò)評(píng)估分?jǐn)?shù)。例如,根據(jù)語音識(shí)別文本“打開下午茶座吧”和候選糾錯(cuò)文本“小虎插座”生成的糾錯(cuò)記錄中糾錯(cuò)起始位置為2(對(duì)應(yīng)漢字為‘下’),匹配文本長度為4,可得到匹配置信度為0.8333,將相似度權(quán)重設(shè)置為0.2,分詞權(quán)重設(shè)置為0.5,可計(jì)算得到糾錯(cuò)評(píng)估分?jǐn)?shù)為:0.913=0.8333+0.2*0.25+0.5/17。需要說明的是,相似度得分和統(tǒng)計(jì)語言模型得分并不是必要的,但加上后可以進(jìn)一步優(yōu)化糾錯(cuò)記錄的可靠性。分詞權(quán)重設(shè)置為0,表明不考慮統(tǒng)計(jì)語言模型,可以減少計(jì)算開銷。類似的,也可以將相似度權(quán)重設(shè)置為0。仍以語音識(shí)別文本“打開我是臺(tái)風(fēng)和下午茶座”和候選糾錯(cuò)文本“臥室臺(tái)燈”、“小虎插座”為例(不考慮相似度得分和統(tǒng)計(jì)語言模型得分,即權(quán)重均設(shè)置為0),對(duì)糾錯(cuò)記錄組先按糾錯(cuò)記錄數(shù)從多到少排序,再按糾錯(cuò)評(píng)估分?jǐn)?shù)從高到低排序后的結(jié)果如下:{(1),(3)},均分:0.875,匹配文本長度:8,糾錯(cuò)后語音識(shí)別文本:打開臥室臺(tái)燈和小虎插座。{(2),(3)},均分:0.792,匹配文本長度:7,糾錯(cuò)后語音識(shí)別文本:打開我臥室臺(tái)燈和小虎插座。{(1)},均分:0.9167,匹配文本長度:4,糾錯(cuò)后語音識(shí)別文本:打開臥室臺(tái)燈和下午茶座。{(3)},均分:0.833,匹配文本長度:4,糾錯(cuò)后語音識(shí)別文本:打開我是臺(tái)燈和小虎插座。{(2)},均分:0.750,匹配文本長度:3,糾錯(cuò)后語音識(shí)別文本:打開我臥室臺(tái)燈和下午茶座。更一般地,還可以為每個(gè)組合記錄組定義如下排序得分,據(jù)此由高到低排序:其中,fi表示糾錯(cuò)記錄組的第i個(gè)排序因子的數(shù)值,wi為相應(yīng)權(quán)重,n為預(yù)先選定的排序因子數(shù)目。排序因子可以為:糾錯(cuò)記錄個(gè)數(shù)、糾錯(cuò)記錄平均最終得分、糾錯(cuò)記錄平均匹配置信度、糾錯(cuò)文本總長度、候選糾錯(cuò)文本總長度等等。與現(xiàn)有技術(shù)相比,本申請(qǐng)的技術(shù)方案不同于傳統(tǒng)的對(duì)語音識(shí)別文本先分詞,再進(jìn)行糾錯(cuò)評(píng)估的糾錯(cuò)方式,而是采用直接糾錯(cuò)再評(píng)估的方法,大幅降低了對(duì)外部資源數(shù)據(jù)的依賴性,減輕了系統(tǒng)計(jì)算負(fù)擔(dān),而且也更有針對(duì)性地提高了用戶語音控制指令的識(shí)別率。在此,本領(lǐng)域技術(shù)人員應(yīng)當(dāng)理解,方位詞均是結(jié)合操作者和使用者的日常操作習(xí)慣以及說明書附圖而設(shè)立的,它們的出現(xiàn)不應(yīng)當(dāng)影響本申請(qǐng)的保護(hù)范圍。以上結(jié)合附圖實(shí)施例對(duì)本申請(qǐng)進(jìn)行了詳細(xì)說明,本領(lǐng)域中普通技術(shù)人員可根據(jù)上述說明對(duì)本申請(qǐng)做出種種變化例。因而,實(shí)施例中的某些細(xì)節(jié)不應(yīng)構(gòu)成對(duì)本申請(qǐng)的限定,本申請(qǐng)將以所附權(quán)利要求書界定的范圍作為本申請(qǐng)的保護(hù)范圍。當(dāng)前第1頁1 2 3