国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      基于人工智能的語(yǔ)音識(shí)別糾錯(cuò)方法、裝置及存儲(chǔ)介質(zhì)與流程

      文檔序號(hào):11199189閱讀:871來(lái)源:國(guó)知局
      基于人工智能的語(yǔ)音識(shí)別糾錯(cuò)方法、裝置及存儲(chǔ)介質(zhì)與流程

      技術(shù)領(lǐng)域
      】本發(fā)明涉及計(jì)算機(jī)應(yīng)用技術(shù),特別涉及基于人工智能的語(yǔ)音識(shí)別糾錯(cuò)方法、裝置及存儲(chǔ)介質(zhì)。
      背景技術(shù)
      :人工智能(artificialintelligence),英文縮寫(xiě)為ai。它是研究、開(kāi)發(fā)用于模擬、延伸和擴(kuò)展人的智能的理論、方法、技術(shù)及應(yīng)用系統(tǒng)的一門(mén)新的技術(shù)科學(xué)。人工智能是計(jì)算機(jī)科學(xué)的一個(gè)分支,它企圖了解智能的實(shí)質(zhì),并生產(chǎn)出一種新的能以人類(lèi)智能相似的方式做出反應(yīng)的智能機(jī)器,該領(lǐng)域的研究包括機(jī)器人、語(yǔ)言識(shí)別、圖像識(shí)別、自然語(yǔ)言處理和專(zhuān)家系統(tǒng)等。隨著語(yǔ)音及自然語(yǔ)言處理相關(guān)技術(shù)的發(fā)展,越來(lái)越多的應(yīng)用場(chǎng)景提供語(yǔ)音方式同用戶(hù)進(jìn)行交互。但是,在用戶(hù)輸入語(yǔ)音query后,對(duì)用戶(hù)的語(yǔ)音query進(jìn)行識(shí)別時(shí),得到的語(yǔ)音識(shí)別結(jié)果中很可能會(huì)出現(xiàn)錯(cuò)誤。比如,對(duì)于長(zhǎng)度較大的語(yǔ)音query,語(yǔ)音識(shí)別結(jié)果中很容易出現(xiàn)錯(cuò)誤片段,當(dāng)語(yǔ)音query中涉及實(shí)體名稱(chēng)時(shí),對(duì)實(shí)體名稱(chēng)的識(shí)別會(huì)很容易出現(xiàn)錯(cuò)誤,又或者,用戶(hù)在輸入時(shí)帶有口音、口誤或比較特殊的表述習(xí)慣等,均可能造成識(shí)別錯(cuò)誤?,F(xiàn)有技術(shù)中,針對(duì)用戶(hù)輸入的語(yǔ)音query的語(yǔ)音識(shí)別結(jié)果,可利用背景知識(shí)及統(tǒng)計(jì)方法等進(jìn)行計(jì)算,從而找出可能錯(cuò)誤的地方并進(jìn)行替換,但這種糾錯(cuò)方式的糾錯(cuò)效果很差,且很多場(chǎng)景下均無(wú)法識(shí)別出錯(cuò)誤。比如,用戶(hù)通過(guò)語(yǔ)音query輸入搜索對(duì)象“陳育娟”,語(yǔ)音識(shí)別結(jié)果出現(xiàn)錯(cuò)誤,將“陳育娟”識(shí)別為“陳玉娟”,那么利用現(xiàn)有的糾錯(cuò)方式則無(wú)法對(duì)這種錯(cuò)誤進(jìn)行糾正,只能通過(guò)用戶(hù)的手動(dòng)輸入進(jìn)行修改,從而為用戶(hù)帶來(lái)了很大的不便,尤其是在一些體積較小的穿戴、車(chē)載等設(shè)備使用中,文字輸入非常不便,從而增大了糾錯(cuò)難度??梢?jiàn),采用現(xiàn)有的糾錯(cuò)方式,會(huì)導(dǎo)致糾錯(cuò)結(jié)果的準(zhǔn)確性較低,并增大了糾錯(cuò)難度。技術(shù)實(shí)現(xiàn)要素:有鑒于此,本發(fā)明提供了基于人工智能的語(yǔ)音識(shí)別糾錯(cuò)方法、裝置及存儲(chǔ)介質(zhì),能夠提高糾錯(cuò)結(jié)果的準(zhǔn)確性并降低糾錯(cuò)難度。具體技術(shù)方案如下:一種基于人工智能的語(yǔ)音識(shí)別糾錯(cuò)方法包括:獲取用戶(hù)輸入的第二語(yǔ)音query的第二語(yǔ)音識(shí)別結(jié)果;根據(jù)所述第二語(yǔ)音識(shí)別結(jié)果進(jìn)行糾錯(cuò)意圖識(shí)別;若確定用戶(hù)具有糾錯(cuò)意圖,則從所述第二語(yǔ)音識(shí)別結(jié)果中提取出糾錯(cuò)信息;根據(jù)所述糾錯(cuò)信息對(duì)各糾錯(cuò)資源進(jìn)行篩選,利用選出的最為匹配的糾錯(cuò)資源對(duì)第一語(yǔ)音識(shí)別結(jié)果進(jìn)行糾錯(cuò),所述第一語(yǔ)音識(shí)別結(jié)果為在所述第二語(yǔ)音query之前輸入的第一語(yǔ)音query的語(yǔ)音識(shí)別結(jié)果。根據(jù)本發(fā)明一優(yōu)選實(shí)施例,所述根據(jù)所述第二語(yǔ)音識(shí)別結(jié)果進(jìn)行糾錯(cuò)意圖識(shí)別包括:確定所述第二語(yǔ)音識(shí)別結(jié)果是否與預(yù)先設(shè)定的m個(gè)糾錯(cuò)意圖模板中的至少一個(gè)相匹配,m為正整數(shù);若是,則確定用戶(hù)具有糾錯(cuò)意圖;若否,則利用深度神經(jīng)網(wǎng)絡(luò)模型對(duì)所述第二語(yǔ)音識(shí)別結(jié)果進(jìn)行意圖分類(lèi),分類(lèi)結(jié)果包括具有糾錯(cuò)意圖以及不具有糾錯(cuò)意圖。根據(jù)本發(fā)明一優(yōu)選實(shí)施例,所述從所述第二語(yǔ)音識(shí)別結(jié)果中提取出糾錯(cuò)信息包括:若利用所述糾錯(cuò)意圖模板確定出用戶(hù)具有糾錯(cuò)意圖,則通過(guò)所述糾錯(cuò)意圖模板的槽位信息確定出所述糾錯(cuò)信息;若利用所述深度神經(jīng)網(wǎng)絡(luò)模型確定出用戶(hù)具有糾錯(cuò)意圖,則通過(guò)序列標(biāo)注模型,分別對(duì)所述第二語(yǔ)音識(shí)別結(jié)果中的每個(gè)字進(jìn)行標(biāo)注,利用標(biāo)注為屬于糾錯(cuò)信息的字組成所述糾錯(cuò)信息。根據(jù)本發(fā)明一優(yōu)選實(shí)施例,當(dāng)糾錯(cuò)資源的種類(lèi)為拆字資源時(shí),該方法進(jìn)一步包括:針對(duì)每個(gè)糾錯(cuò)資源,分別將所述糾錯(cuò)資源中的每個(gè)字轉(zhuǎn)為對(duì)應(yīng)的拼音,并根據(jù)所述糾錯(cuò)資源中的各個(gè)字及拼音,生成所述糾錯(cuò)資源的key;建立key與對(duì)應(yīng)的糾錯(cuò)資源之間的倒排索引;所述根據(jù)所述糾錯(cuò)信息對(duì)各糾錯(cuò)資源進(jìn)行篩選包括:將所述糾錯(cuò)信息中的每個(gè)字分別轉(zhuǎn)為對(duì)應(yīng)的拼音;確定所述糾錯(cuò)信息中的各個(gè)字是否組成一個(gè)key,如果是,則將所述key對(duì)應(yīng)的糾錯(cuò)資源作為篩選出的糾錯(cuò)資源;確定所述糾錯(cuò)信息中的各個(gè)字對(duì)應(yīng)的拼音是否組成一個(gè)key,如果是,則將所述key對(duì)應(yīng)的糾錯(cuò)資源作為篩選出的糾錯(cuò)資源。根據(jù)本發(fā)明一優(yōu)選實(shí)施例,所述生成所述糾錯(cuò)資源的key包括:針對(duì)所述糾錯(cuò)資源中的各個(gè)字,分別以連續(xù)i個(gè)term為最小粒度得到連續(xù)kgram集合,并針對(duì)所述糾錯(cuò)資源中的各個(gè)字對(duì)應(yīng)的拼音,分別以連續(xù)i個(gè)term為最小粒度得到連續(xù)kgram集合,i為正整數(shù),且2≤i≤n,n為所述糾錯(cuò)資源中包括的字?jǐn)?shù);針對(duì)所述糾錯(cuò)資源中的各個(gè)字,分別以j個(gè)term為最小粒度得到不連續(xù)的跳躍kgram集合,并針對(duì)所述糾錯(cuò)資源中的各個(gè)字對(duì)應(yīng)的拼音,分別以j個(gè)term為最小粒度得到不連續(xù)的跳躍kgram集合,j為正整數(shù),且2≤j≤n-1。將所述連續(xù)kgram集合以及所述跳躍kgram集合中的元素分別作為所述糾錯(cuò)資源的key。根據(jù)本發(fā)明一優(yōu)選實(shí)施例,所述利用選出的最為匹配的糾錯(cuò)資源對(duì)第一語(yǔ)音識(shí)別結(jié)果進(jìn)行糾錯(cuò)包括:針對(duì)篩選出的每個(gè)糾錯(cuò)資源,分別計(jì)算所述糾錯(cuò)資源中的各個(gè)字的拼音所組成的字符串與所述糾錯(cuò)信息中的各個(gè)字的拼音所組成的字符串之間的帶權(quán)編輯距離;將計(jì)算出的帶權(quán)編輯距離最小的糾錯(cuò)資源作為所述最為匹配的糾錯(cuò)資源,利用所述最為匹配的糾錯(cuò)資源對(duì)所述第一語(yǔ)音識(shí)別結(jié)果進(jìn)行糾錯(cuò)。根據(jù)本發(fā)明一優(yōu)選實(shí)施例,所述計(jì)算帶權(quán)編輯距離包括:在計(jì)算編輯距離時(shí),對(duì)于增加和刪除兩種操作,編輯距離均為1,對(duì)于替換操作,計(jì)算兩個(gè)音節(jié)之間的發(fā)音距離,發(fā)音距離越近,產(chǎn)生的編輯距離增加量越小。一種基于人工智能的語(yǔ)音識(shí)別糾錯(cuò)裝置,包括:糾錯(cuò)意圖識(shí)別單元、糾錯(cuò)信息提取單元以及糾錯(cuò)資源匹配單元;所述糾錯(cuò)意圖識(shí)別單元,用于獲取用戶(hù)輸入的第二語(yǔ)音query的第二語(yǔ)音識(shí)別結(jié)果,并根據(jù)所述第二語(yǔ)音識(shí)別結(jié)果進(jìn)行糾錯(cuò)意圖識(shí)別;所述糾錯(cuò)信息提取單元,用于當(dāng)所述糾錯(cuò)意圖識(shí)別單元識(shí)別出用戶(hù)具有糾錯(cuò)意圖時(shí),從所述第二語(yǔ)音識(shí)別結(jié)果中提取出糾錯(cuò)信息;所述糾錯(cuò)資源匹配單元,用于根據(jù)所述糾錯(cuò)信息對(duì)各糾錯(cuò)資源進(jìn)行篩選,利用選出的最為匹配的糾錯(cuò)資源對(duì)第一語(yǔ)音識(shí)別結(jié)果進(jìn)行糾錯(cuò),所述第一語(yǔ)音識(shí)別結(jié)果為在所述第二語(yǔ)音query之前輸入的第一語(yǔ)音query的語(yǔ)音識(shí)別結(jié)果。根據(jù)本發(fā)明一優(yōu)選實(shí)施例,所述糾錯(cuò)意圖識(shí)別單元確定所述第二語(yǔ)音識(shí)別結(jié)果是否與預(yù)先設(shè)定的m個(gè)糾錯(cuò)意圖模板中的至少一個(gè)相匹配,m為正整數(shù);若是,則確定用戶(hù)具有糾錯(cuò)意圖;若否,則利用深度神經(jīng)網(wǎng)絡(luò)模型對(duì)所述第二語(yǔ)音識(shí)別結(jié)果進(jìn)行意圖分類(lèi),分類(lèi)結(jié)果包括具有糾錯(cuò)意圖以及不具有糾錯(cuò)意圖。根據(jù)本發(fā)明一優(yōu)選實(shí)施例,若所述糾錯(cuò)意圖識(shí)別單元利用所述糾錯(cuò)意圖模板確定出用戶(hù)具有糾錯(cuò)意圖,則所述糾錯(cuò)信息提取單元通過(guò)所述糾錯(cuò)意圖模板的槽位信息確定出所述糾錯(cuò)信息;若所述糾錯(cuò)意圖識(shí)別單元利用所述深度神經(jīng)網(wǎng)絡(luò)模型確定出用戶(hù)具有糾錯(cuò)意圖,則所述糾錯(cuò)信息提取單元通過(guò)序列標(biāo)注模型,分別對(duì)所述第二語(yǔ)音識(shí)別結(jié)果中的每個(gè)字進(jìn)行標(biāo)注,利用標(biāo)注為屬于糾錯(cuò)信息的字組成所述糾錯(cuò)信息。根據(jù)本發(fā)明一優(yōu)選實(shí)施例,所述裝置中進(jìn)一步包括:預(yù)處理單元;所述預(yù)處理單元,用于當(dāng)糾錯(cuò)資源的種類(lèi)為拆字資源時(shí),針對(duì)每個(gè)糾錯(cuò)資源,分別將所述糾錯(cuò)資源中的每個(gè)字轉(zhuǎn)為對(duì)應(yīng)的拼音,并根據(jù)所述糾錯(cuò)資源中的各個(gè)字及拼音,生成所述糾錯(cuò)資源的key;建立key與對(duì)應(yīng)的糾錯(cuò)資源之間的倒排索引;所述糾錯(cuò)資源匹配單元將所述糾錯(cuò)信息中的每個(gè)字分別轉(zhuǎn)為對(duì)應(yīng)的拼音;確定所述糾錯(cuò)信息中的各個(gè)字是否組成一個(gè)key,如果是,則將所述key對(duì)應(yīng)的糾錯(cuò)資源作為篩選出的糾錯(cuò)資源;確定所述糾錯(cuò)信息中的各個(gè)字對(duì)應(yīng)的拼音是否組成一個(gè)key,如果是,則將所述key對(duì)應(yīng)的糾錯(cuò)資源作為篩選出的糾錯(cuò)資源。根據(jù)本發(fā)明一優(yōu)選實(shí)施例,所述預(yù)處理單元針對(duì)所述糾錯(cuò)資源中的各個(gè)字,分別以連續(xù)i個(gè)term為最小粒度得到連續(xù)kgram集合,并針對(duì)所述糾錯(cuò)資源中的各個(gè)字對(duì)應(yīng)的拼音,分別以連續(xù)i個(gè)term為最小粒度得到連續(xù)kgram集合,i為正整數(shù),且2≤i≤n,n為所述糾錯(cuò)資源中包括的字?jǐn)?shù);針對(duì)所述糾錯(cuò)資源中的各個(gè)字,分別以j個(gè)term為最小粒度得到不連續(xù)的跳躍kgram集合,并針對(duì)所述糾錯(cuò)資源中的各個(gè)字對(duì)應(yīng)的拼音,分別以j個(gè)term為最小粒度得到不連續(xù)的跳躍kgram集合,j為正整數(shù),且2≤j≤n-1。將所述連續(xù)kgram集合以及所述跳躍kgram集合中的元素分別作為所述糾錯(cuò)資源的key。根據(jù)本發(fā)明一優(yōu)選實(shí)施例,所述糾錯(cuò)資源匹配單元針對(duì)篩選出的每個(gè)糾錯(cuò)資源,分別計(jì)算所述糾錯(cuò)資源中的各個(gè)字的拼音所組成的字符串與所述糾錯(cuò)信息中的各個(gè)字的拼音所組成的字符串之間的帶權(quán)編輯距離;將計(jì)算出的帶權(quán)編輯距離最小的糾錯(cuò)資源作為所述最為匹配的糾錯(cuò)資源,利用所述最為匹配的糾錯(cuò)資源對(duì)所述第一語(yǔ)音識(shí)別結(jié)果進(jìn)行糾錯(cuò)。根據(jù)本發(fā)明一優(yōu)選實(shí)施例,所述糾錯(cuò)資源匹配單元在計(jì)算編輯距離時(shí),對(duì)于增加和刪除兩種操作,編輯距離均為1,對(duì)于替換操作,計(jì)算兩個(gè)音節(jié)之間的發(fā)音距離,發(fā)音距離越近,產(chǎn)生的編輯距離增加量越小。一種計(jì)算機(jī)設(shè)備,包括存儲(chǔ)器、處理器及存儲(chǔ)在所述存儲(chǔ)器上并可在所述處理器上運(yùn)行的計(jì)算機(jī)程序,所述處理器執(zhí)行所述程序時(shí)實(shí)現(xiàn)如以上所述的方法。一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序,所述程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如以上所述的方法?;谏鲜鼋榻B可以看出,采用本發(fā)明所述方案,獲取用戶(hù)輸入的第二語(yǔ)音識(shí)別結(jié)果,并根據(jù)第二語(yǔ)音識(shí)別結(jié)果進(jìn)行糾錯(cuò)意圖識(shí)別,如果確定用戶(hù)具有糾錯(cuò)意圖,則可從第二語(yǔ)音識(shí)別結(jié)果中提取出糾錯(cuò)信息,并根據(jù)糾錯(cuò)信息對(duì)各糾錯(cuò)資源進(jìn)行篩選,從而利用選出的最為匹配的糾錯(cuò)資源對(duì)第一語(yǔ)音識(shí)別結(jié)果進(jìn)行糾錯(cuò),對(duì)于用戶(hù)來(lái)說(shuō),可以像人與人之間對(duì)話(huà)時(shí)一樣,描述錯(cuò)誤或強(qiáng)調(diào)正解,相應(yīng)地,可根據(jù)用戶(hù)的描述對(duì)語(yǔ)音識(shí)別結(jié)果進(jìn)行修正,從而實(shí)現(xiàn)了對(duì)于語(yǔ)音識(shí)別結(jié)果的準(zhǔn)確糾錯(cuò),即提高了糾錯(cuò)結(jié)果的準(zhǔn)確性,并且,用戶(hù)只需要通過(guò)語(yǔ)音的方式發(fā)出糾錯(cuò)指令即可,無(wú)需進(jìn)行手動(dòng)輸入操作,從而對(duì)于用戶(hù)來(lái)說(shuō)降低了糾錯(cuò)難度?!靖綀D說(shuō)明】圖1為本發(fā)明所述基于人工智能的語(yǔ)音識(shí)別糾錯(cuò)方法實(shí)施例的流程圖。圖2為本發(fā)明所述第一語(yǔ)音識(shí)別結(jié)果“陳玉娟”的輸入界面示意圖。圖3為本發(fā)明所述第一語(yǔ)音識(shí)別結(jié)果“陳玉娟”對(duì)應(yīng)的搜索結(jié)果的界面示意圖。圖4為本發(fā)明所述第二語(yǔ)音識(shí)別結(jié)果“下面是一個(gè)月的育”的輸入界面示意圖。圖5為本發(fā)明所述糾錯(cuò)后的第一語(yǔ)音識(shí)別結(jié)果“陳育娟”對(duì)應(yīng)的搜索結(jié)果的界面示意圖。圖6為本發(fā)明所述深度神經(jīng)網(wǎng)絡(luò)模型的框架示意圖。圖7為本發(fā)明所述序列標(biāo)注模型的框架示意圖。圖8為本發(fā)明所述基于人工智能的語(yǔ)音識(shí)別糾錯(cuò)裝置實(shí)施例的組成結(jié)構(gòu)示意圖。圖9示出了適于用來(lái)實(shí)現(xiàn)本發(fā)明實(shí)施方式的示例性計(jì)算機(jī)系統(tǒng)/服務(wù)器12的框圖?!揪唧w實(shí)施方式】為了使本發(fā)明的技術(shù)方案更加清楚、明白,以下參照附圖并舉實(shí)施例,對(duì)本發(fā)明所述方案進(jìn)行進(jìn)一步說(shuō)明。顯然,所描述的實(shí)施例是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例。基于本發(fā)明中的實(shí)施例,本領(lǐng)域技術(shù)人員在沒(méi)有作出創(chuàng)造性勞動(dòng)前提下所獲得的所有其它實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。圖1為本發(fā)明所述基于人工智能的語(yǔ)音識(shí)別糾錯(cuò)方法實(shí)施例的流程圖,如圖1所示,包括以下具體實(shí)現(xiàn)方式。在101中,獲取用戶(hù)輸入的第二語(yǔ)音query的第二語(yǔ)音識(shí)別結(jié)果。在102中,根據(jù)第二語(yǔ)音識(shí)別結(jié)果進(jìn)行糾錯(cuò)意圖識(shí)別。在103中,若確定用戶(hù)具有糾錯(cuò)意圖,則從第二語(yǔ)音識(shí)別結(jié)果中提取出糾錯(cuò)信息。在104中,根據(jù)獲取到的糾錯(cuò)信息對(duì)各糾錯(cuò)資源進(jìn)行篩選,利用選出的最為匹配的糾錯(cuò)資源對(duì)第一語(yǔ)音識(shí)別結(jié)果進(jìn)行糾錯(cuò)。其中,第一語(yǔ)音識(shí)別結(jié)果為在第二語(yǔ)音query之前輸入的第一語(yǔ)音query的語(yǔ)音識(shí)別結(jié)果。比如,在進(jìn)行搜索時(shí),用戶(hù)通過(guò)第一語(yǔ)音query輸入搜索對(duì)象“陳育娟”,第一語(yǔ)音識(shí)別結(jié)果出現(xiàn)錯(cuò)誤,將“陳育娟”識(shí)別為“陳玉娟”,相應(yīng)地,則會(huì)為用戶(hù)展示“陳玉娟”的搜索結(jié)果,這種情況下,用戶(hù)則可輸入第二語(yǔ)音query,如“下面是一個(gè)月的育”,從而對(duì)第一語(yǔ)音識(shí)別結(jié)果進(jìn)行糾錯(cuò),進(jìn)而可按照糾錯(cuò)后的第一語(yǔ)音識(shí)別結(jié)果為用戶(hù)展示搜索結(jié)果,如圖2~5所示。圖2為本發(fā)明所述第一語(yǔ)音識(shí)別結(jié)果“陳玉娟”的輸入界面示意圖,圖3為本發(fā)明所述第一語(yǔ)音識(shí)別結(jié)果“陳玉娟”對(duì)應(yīng)的搜索結(jié)果的界面示意圖,圖4為本發(fā)明所述第二語(yǔ)音識(shí)別結(jié)果“下面是一個(gè)月的育”的輸入界面示意圖,圖5為本發(fā)明所述糾錯(cuò)后的第一語(yǔ)音識(shí)別結(jié)果“陳育娟”對(duì)應(yīng)的搜索結(jié)果的界面示意圖??梢钥闯?,圖1所示實(shí)施例中提出了一種基于多輪對(duì)話(huà)的交互式語(yǔ)音識(shí)別糾錯(cuò)方式,整個(gè)糾錯(cuò)流程可主要分為三個(gè)階段,分別為:糾錯(cuò)意圖識(shí)別、糾錯(cuò)信息提取以及糾錯(cuò)資源匹配,通過(guò)這三個(gè)階段,對(duì)用戶(hù)在語(yǔ)音query中提供的信息進(jìn)行遞進(jìn)式的判別、挖掘和利用,從而幫助用戶(hù)實(shí)現(xiàn)糾錯(cuò)意圖。以下分別對(duì)上述各階段的具體實(shí)現(xiàn)進(jìn)行詳細(xì)說(shuō)明。1)糾錯(cuò)意圖識(shí)別在接收到用戶(hù)輸入的第二語(yǔ)音query之后,可首先按照現(xiàn)有技術(shù)對(duì)其進(jìn)行語(yǔ)音識(shí)別,從而得到第二語(yǔ)音識(shí)別結(jié)果。之后,可根據(jù)第二語(yǔ)音識(shí)別結(jié)果進(jìn)行糾錯(cuò)意圖識(shí)別,即確定用戶(hù)是否具有糾錯(cuò)意圖,確定用戶(hù)具有糾錯(cuò)意圖之后,才會(huì)進(jìn)行后續(xù)的糾錯(cuò)流程。考慮到不同的用戶(hù)可能會(huì)采用不同的表達(dá)方式,有的表達(dá)方式比較明確,可以比較容易地識(shí)別出用戶(hù)的糾錯(cuò)意圖,而有的表達(dá)方式則比較復(fù)雜,識(shí)別起來(lái)比較困難,因此,本實(shí)施例中提供了兩種識(shí)別方式,即基于規(guī)則的糾錯(cuò)意圖識(shí)別方式以及基于統(tǒng)計(jì)的糾錯(cuò)意圖識(shí)別方式,兩種方式可結(jié)合使用。其中,基于規(guī)則的糾錯(cuò)意圖識(shí)別方式可以是指預(yù)先生成m個(gè)糾錯(cuò)意圖模板,m為正整數(shù),具體取值可根據(jù)實(shí)際需要而定,通常大于一,這樣,當(dāng)獲取到第二語(yǔ)音識(shí)別結(jié)果之后,可確定其是否與m個(gè)糾錯(cuò)意圖模板中的至少一個(gè)相匹配,如果是,則可確定用戶(hù)具有糾錯(cuò)意圖。第二語(yǔ)音識(shí)別結(jié)果與糾錯(cuò)意圖模板可如表一所示:模板示例第二語(yǔ)音識(shí)別結(jié)果是[偏旁]的[字]我要的是單人旁的倒是[聲調(diào)]的那個(gè)[字]是三聲的那個(gè)倒表一第二語(yǔ)音識(shí)別結(jié)果與糾錯(cuò)意圖模板如果第二語(yǔ)音識(shí)別結(jié)果與任一糾錯(cuò)意圖模板均不匹配,那么可進(jìn)一步采用基于統(tǒng)計(jì)的糾錯(cuò)意圖識(shí)別方式對(duì)第二語(yǔ)音識(shí)別結(jié)果進(jìn)行識(shí)別。比如,可利用深度神經(jīng)網(wǎng)絡(luò)模型對(duì)第二語(yǔ)音識(shí)別結(jié)果進(jìn)行意圖分類(lèi),分類(lèi)結(jié)果包括具有糾錯(cuò)意圖以及不具有糾錯(cuò)意圖。圖6為本發(fā)明所述深度神經(jīng)網(wǎng)絡(luò)模型的框架示意圖,如圖6所示,可采用詞向量特征與統(tǒng)計(jì)特征相結(jié)合的方式,利用embedding及長(zhǎng)短時(shí)間記憶網(wǎng)絡(luò)(lstm,longshorttermmemorynetworks)分別得到第二語(yǔ)音識(shí)別結(jié)果中的每個(gè)字的詞向量,并針對(duì)第二語(yǔ)音識(shí)別結(jié)果中的每個(gè)字,開(kāi)發(fā)特征工程用以提取統(tǒng)計(jì)特征,二者相結(jié)合確定意圖分類(lèi)結(jié)果,分類(lèi)結(jié)果包括具有糾錯(cuò)意圖以及不具有糾錯(cuò)意圖。具體提取哪些統(tǒng)計(jì)特征可根據(jù)實(shí)際需要而定,比如可包括拼音特征、發(fā)音距離特征以及規(guī)則特征等。2)糾錯(cuò)信息提取在確定用戶(hù)具有糾錯(cuò)意圖之后,并不能直接利用第二語(yǔ)音識(shí)別結(jié)果來(lái)對(duì)第一語(yǔ)音識(shí)別結(jié)果進(jìn)行糾錯(cuò),因?yàn)榈诙Z(yǔ)音識(shí)別結(jié)果中不但包含糾錯(cuò)信息,還包含其它噪聲信息,因此需要對(duì)有用的糾錯(cuò)信息進(jìn)行提取,去除無(wú)關(guān)信息,才能完成后續(xù)的糾錯(cuò)處理。根據(jù)在對(duì)第二語(yǔ)音識(shí)別結(jié)果進(jìn)行糾錯(cuò)意圖識(shí)別時(shí)所采用的識(shí)別方式的不同,從第二語(yǔ)音識(shí)別結(jié)果中提取糾錯(cuò)信息的方式也會(huì)不同。其中,若利用糾錯(cuò)意圖模板確定出用戶(hù)具有糾錯(cuò)意圖,那么可直接通過(guò)糾錯(cuò)意圖模板的槽位信息來(lái)提取出糾錯(cuò)信息。比如,第二語(yǔ)音識(shí)別結(jié)果為“我要的是單人旁的倒”,相匹配的糾錯(cuò)意圖模板為“是[偏旁]的[字]”,那么提取出糾錯(cuò)信息則為[偏旁:?jiǎn)稳伺註、[字:倒]。若利用深度神經(jīng)網(wǎng)絡(luò)模型確定出用戶(hù)具有糾錯(cuò)意圖,那么則可通過(guò)序列標(biāo)注模型,分別對(duì)第二語(yǔ)音識(shí)別結(jié)果中的每個(gè)字進(jìn)行標(biāo)注,利用標(biāo)注為屬于糾錯(cuò)信息的字組成糾錯(cuò)信息。即利用序列標(biāo)注模型,對(duì)第二語(yǔ)音識(shí)別結(jié)果中的不同類(lèi)別信息進(jìn)行標(biāo)注,從而確定有用信息。不同于傳統(tǒng)的命名實(shí)體識(shí)別(ner,namedentityrecognition)序列標(biāo)注,對(duì)第二語(yǔ)音識(shí)別結(jié)果的標(biāo)注需要以字粒度進(jìn)行,因此難度更大、精度要求更高。圖7為本發(fā)明所述序列標(biāo)注模型的框架示意圖,如圖7所示,可采用詞向量特征與統(tǒng)計(jì)特征相結(jié)合的方式來(lái)對(duì)第二語(yǔ)音識(shí)別結(jié)果中的每個(gè)字進(jìn)行標(biāo)注,詞向量方面,實(shí)驗(yàn)顯示,采用廣義回歸神經(jīng)網(wǎng)絡(luò)(grnn,generalregressionneuralnetwork)的效果更優(yōu),特征工程對(duì)每個(gè)字生成統(tǒng)計(jì)特征,每個(gè)字的統(tǒng)計(jì)特征與詞向量合并得到字特征,再通過(guò)全連接的神經(jīng)網(wǎng)絡(luò)進(jìn)行標(biāo)注,對(duì)于每個(gè)字來(lái)說(shuō),其能夠體現(xiàn)糾錯(cuò)信息或不能夠體現(xiàn)糾錯(cuò)信息,即屬于糾錯(cuò)信息或不屬于糾錯(cuò)信息,利用能夠體現(xiàn)糾錯(cuò)信息的各個(gè)字即可組成所需的糾錯(cuò)信息。比如,“我要的是單人旁的倒”中的“單”字,其用于描述字的偏旁,因此能夠體現(xiàn)糾錯(cuò)信息。3)糾錯(cuò)資源匹配在獲取到糾錯(cuò)信息之后,即可利用糾錯(cuò)信息來(lái)與各糾錯(cuò)資源進(jìn)行匹配,以確定糾錯(cuò)信息所描述的對(duì)象,即用戶(hù)通過(guò)描述想要找到的是哪個(gè)字。糾錯(cuò)資源的種類(lèi)很多,比如使用偏旁部首資源和拆字資源等,偏方部首資源即指(偏旁:字)的kv對(duì),如(單人旁:倒),拆字資源即描述字的拆解信息及原字,如(人到:倒)。以下以拆字資源為例,說(shuō)明如何根據(jù)糾錯(cuò)信息對(duì)各糾錯(cuò)資源進(jìn)行篩選,利用選出的最為匹配的糾錯(cuò)資源對(duì)第一語(yǔ)音識(shí)別結(jié)果進(jìn)行糾錯(cuò)。由于針對(duì)的是語(yǔ)音query,所以不能直接通過(guò)文字信息來(lái)索引資源,因?yàn)榈诙Z(yǔ)音識(shí)別結(jié)果中也可能會(huì)出現(xiàn)錯(cuò)誤,如將“人到:倒”識(shí)別為“人道:倒”或“人到:到”等,需要轉(zhuǎn)為對(duì)應(yīng)的拼音,以解決第二語(yǔ)音識(shí)別結(jié)果中的識(shí)別錯(cuò)誤問(wèn)題。另外,還會(huì)存在其它問(wèn)題,比如,糾錯(cuò)資源(日四又:曼),第二語(yǔ)音識(shí)別結(jié)果可能為“上面是四字下面又的那個(gè)曼”,提取到的糾錯(cuò)信息為[四又:曼],因此需要計(jì)算糾錯(cuò)信息與糾錯(cuò)資源的相似度,獲取相似度最高的糾錯(cuò)資源作為最終的匹配結(jié)果,但線(xiàn)性的相似度計(jì)算耗時(shí)太大,無(wú)法接受,因此本實(shí)施例中提出,可按照key的kgram集合來(lái)對(duì)糾錯(cuò)資源進(jìn)行倒排拉鏈,從而減少相似度計(jì)算量。為此,針對(duì)每個(gè)糾錯(cuò)資源,可分別將該糾錯(cuò)資源中的每個(gè)字轉(zhuǎn)為對(duì)應(yīng)的拼音,并根據(jù)該糾錯(cuò)資源中的各個(gè)字及拼音,生成該糾錯(cuò)資源的key,所述key可為kgramkey,進(jìn)而可建立key與對(duì)應(yīng)的糾錯(cuò)資源之間的倒排索引。這樣,在根據(jù)糾錯(cuò)信息對(duì)各糾錯(cuò)資源進(jìn)行篩選時(shí),可首先將糾錯(cuò)信息中的每個(gè)字分別轉(zhuǎn)為對(duì)應(yīng)的拼音,之后,確定糾錯(cuò)信息中的各個(gè)字是否組成一個(gè)key,如果是,則將這個(gè)key對(duì)應(yīng)的糾錯(cuò)資源作為篩選出的糾錯(cuò)資源,并確定糾錯(cuò)信息中的各個(gè)字對(duì)應(yīng)的拼音是否組成一個(gè)key,如果是,則將這個(gè)key對(duì)應(yīng)的糾錯(cuò)資源作為篩選出的糾錯(cuò)資源。具體地,對(duì)于每個(gè)糾錯(cuò)資源,可分別按照以下方式確定出該糾錯(cuò)資源的key:針對(duì)該糾錯(cuò)資源中的各個(gè)字,分別以連續(xù)i個(gè)term為最小粒度得到連續(xù)kgram集合,并針對(duì)該糾錯(cuò)資源中的各個(gè)字對(duì)應(yīng)的拼音,分別以連續(xù)i個(gè)term為最小粒度得到連續(xù)kgram集合,i為正整數(shù),且2≤i≤n,n為該糾錯(cuò)資源中包括的字?jǐn)?shù);針對(duì)該糾錯(cuò)資源中的各個(gè)字,分別以j個(gè)term為最小粒度得到不連續(xù)的跳躍kgram集合,并針對(duì)該糾錯(cuò)資源中的各個(gè)字對(duì)應(yīng)的拼音,分別以j個(gè)term為最小粒度得到不連續(xù)的跳躍kgram集合,j為正整數(shù),且2≤j≤n-1。將各連續(xù)kgram集合以及各跳躍kgram集合中的元素分別作為該糾錯(cuò)資源的key。舉例說(shuō)明:假設(shè)糾錯(cuò)資源為(日四又:曼);以連續(xù)2個(gè)term為最小粒度得到的連續(xù)kgram集合為{日四,四又,又曼};以連續(xù)3個(gè)term為最小粒度得到的連續(xù)kgram集合為{日四又,四又曼};以連續(xù)4個(gè)term為最小粒度得到的連續(xù)kgram集合為{日四又曼};以2個(gè)term為最小粒度得到的不連續(xù)的跳躍kgram集合為{日又,日曼,四曼};以3個(gè)term為最小粒度得到的不連續(xù)的跳躍kgram集合為{日又曼,日四曼};相應(yīng)地,對(duì)于糾錯(cuò)資源的拼音(ri’si’you:man);以連續(xù)2個(gè)term為最小粒度得到的連續(xù)kgram集合為{ri,si,si’you,you’man};以連續(xù)3個(gè)term為最小粒度得到的連續(xù)kgram集合為{ri’si’you,si’you’man};以連續(xù)4個(gè)term為最小粒度得到的連續(xù)kgram集合為{ri’si’you’man};以2個(gè)term為最小粒度得到的不連續(xù)的跳躍kgram集合為{ri’you,ri’man,si’man};以3個(gè)term為最小粒度得到的不連續(xù)的跳躍kgram集合為{ri’you’man,ri’si’man};上述各連續(xù)kgram集合以及各跳躍kgram集合中的元素均為糾錯(cuò)資源(日四又:曼)的key,通過(guò)任一key拉取的list中均將包含糾錯(cuò)資源(日四又:曼),比如,“日四”是一個(gè)key,“四又曼”也是一個(gè)key,通過(guò)“日四”拉取的list中將包含糾錯(cuò)資源(日四又:曼),同樣,通過(guò)“四又曼”拉取的list中也將包含糾錯(cuò)資源(日四又:曼)。假設(shè)第二語(yǔ)音識(shí)別結(jié)果為“上面是四字下面又的那個(gè)曼”,提取到的糾錯(cuò)信息為[四又:曼],那么根據(jù)該糾錯(cuò)信息可組成兩個(gè)key,分別為“四又曼”和“si’you’man”,將“四又曼”和“si’you’man”這兩個(gè)key對(duì)應(yīng)的糾錯(cuò)資源作為篩選出的糾錯(cuò)資源,其中包含了糾錯(cuò)資源(日四又:曼),也可能包含了其它糾錯(cuò)資源。之后,可從篩選出的各糾錯(cuò)資源中進(jìn)一步選出與糾錯(cuò)信息最為匹配的糾錯(cuò)資源,并利用選出的最為匹配的糾錯(cuò)資源對(duì)第一語(yǔ)音識(shí)別結(jié)果進(jìn)行糾錯(cuò)。具體地,針對(duì)篩選出的每個(gè)糾錯(cuò)資源,可分別計(jì)算該糾錯(cuò)資源中的各個(gè)字的拼音所組成的字符串與糾錯(cuò)信息中的各個(gè)字的拼音所組成的字符串之間的帶權(quán)編輯距離,進(jìn)而將計(jì)算出的帶權(quán)編輯距離最小的糾錯(cuò)資源作為最為匹配的糾錯(cuò)資源,利用最為匹配的糾錯(cuò)資源對(duì)第一語(yǔ)音識(shí)別結(jié)果進(jìn)行糾錯(cuò)。編輯距離,是指兩個(gè)字符串之間,由一個(gè)轉(zhuǎn)成另一個(gè)所需的最少編輯操作次數(shù),許可的編輯操作包括將一個(gè)字符替換成另一個(gè)字符,增加(插入)一個(gè)字符,刪除一個(gè)字符。一般來(lái)說(shuō),編輯距離越小,兩個(gè)字符串的相似度越大。本實(shí)施例中,在計(jì)算編輯距離時(shí),對(duì)于增加和刪除兩種操作,編輯距離均可與傳統(tǒng)的編輯距離度量方式相同,為1,而對(duì)于替換操作,可計(jì)算兩個(gè)音節(jié)之間的發(fā)音距離,發(fā)音距離越近,產(chǎn)生的編輯距離增加量越小。以上是以糾錯(cuò)資源的種類(lèi)為拆字資源為例,對(duì)如何根據(jù)糾錯(cuò)信息對(duì)各糾錯(cuò)資源進(jìn)行篩選,利用選出的最為匹配的糾錯(cuò)資源對(duì)第一語(yǔ)音識(shí)別結(jié)果進(jìn)行糾錯(cuò)進(jìn)行說(shuō)明,對(duì)于其它種類(lèi),本發(fā)明所述方案同樣適用,只是具體實(shí)現(xiàn)上可能會(huì)有所不同。比如,對(duì)于偏旁部首資源,針對(duì)每個(gè)糾錯(cuò)資源,可分別將其中的每個(gè)字轉(zhuǎn)為對(duì)應(yīng)的拼音,假設(shè)糾錯(cuò)信息為(單人旁:倒),同樣地,可將糾錯(cuò)信息中的每個(gè)字分別轉(zhuǎn)為對(duì)應(yīng)的拼音,并根據(jù)拼音,查找與糾錯(cuò)信息完全匹配的糾錯(cuò)資源,如果只有一個(gè),該糾錯(cuò)資源即為最為匹配的糾錯(cuò)資源,如果有多個(gè),可按照預(yù)定方式,比如使用頻率、上下文信息等進(jìn)一步從中選出最為匹配的糾錯(cuò)資源。另外,還可通過(guò)詞語(yǔ)或聲調(diào)等來(lái)進(jìn)行糾錯(cuò)。比如,用戶(hù)輸入的第一語(yǔ)音query為“李爍”,第一語(yǔ)音識(shí)別結(jié)果出現(xiàn)錯(cuò)誤,識(shí)別為“李樹(shù)”,那么用戶(hù)可進(jìn)一步輸入第二語(yǔ)音query“第二個(gè)字是閃爍的爍”,從而來(lái)對(duì)第一語(yǔ)音識(shí)別結(jié)果進(jìn)行糾錯(cuò)??傊捎蒙鲜鰧?shí)施例所述方案,可獲取用戶(hù)輸入的第二語(yǔ)音識(shí)別結(jié)果,并根據(jù)第二語(yǔ)音識(shí)別結(jié)果進(jìn)行糾錯(cuò)意圖識(shí)別,如果確定用戶(hù)具有糾錯(cuò)意圖,則可從第二語(yǔ)音識(shí)別結(jié)果中提取出糾錯(cuò)信息,并根據(jù)糾錯(cuò)信息對(duì)各糾錯(cuò)資源進(jìn)行篩選,從而利用選出的最為匹配的糾錯(cuò)資源對(duì)第一語(yǔ)音識(shí)別結(jié)果進(jìn)行糾錯(cuò),對(duì)于用戶(hù)來(lái)說(shuō),可以像人與人之間對(duì)話(huà)時(shí)一樣,描述錯(cuò)誤或強(qiáng)調(diào)正解,相應(yīng)地,可根據(jù)用戶(hù)的描述對(duì)語(yǔ)音識(shí)別結(jié)果進(jìn)行修正,從而實(shí)現(xiàn)了對(duì)于語(yǔ)音識(shí)別結(jié)果的準(zhǔn)確糾錯(cuò),即提高了糾錯(cuò)結(jié)果的準(zhǔn)確性,并且,用戶(hù)只需要通過(guò)語(yǔ)音的方式發(fā)出糾錯(cuò)指令即可,無(wú)需進(jìn)行手動(dòng)輸入操作,從而對(duì)于用戶(hù)來(lái)說(shuō)降低了糾錯(cuò)難度。另外,采用上述實(shí)施例所述方案,可通過(guò)將糾錯(cuò)信息等轉(zhuǎn)為拼音來(lái)進(jìn)行糾錯(cuò)資源的篩選,從而盡可能地確保了在第二語(yǔ)音識(shí)別結(jié)果出現(xiàn)錯(cuò)誤時(shí),仍能準(zhǔn)確地對(duì)第一語(yǔ)音識(shí)別結(jié)果進(jìn)行糾錯(cuò)。再有,采用上述實(shí)施例所述方案,可為糾錯(cuò)資源通過(guò)kgram集合建立倒排索引,從而減少了相似度計(jì)算量,進(jìn)而節(jié)省了計(jì)算資源。以上是關(guān)于方法實(shí)施例的介紹,以下通過(guò)裝置實(shí)施例,對(duì)本發(fā)明所述方案進(jìn)行進(jìn)一步說(shuō)明。圖8為本發(fā)明所述基于人工智能的語(yǔ)音識(shí)別糾錯(cuò)裝置實(shí)施例的組成結(jié)構(gòu)示意圖,如圖8所示,包括:糾錯(cuò)意圖識(shí)別單元801、糾錯(cuò)信息提取單元802以及糾錯(cuò)資源匹配單元803。糾錯(cuò)意圖識(shí)別單元801,用于獲取用戶(hù)輸入的第二語(yǔ)音query的第二語(yǔ)音識(shí)別結(jié)果,并根據(jù)第二語(yǔ)音識(shí)別結(jié)果進(jìn)行糾錯(cuò)意圖識(shí)別。糾錯(cuò)信息提取單元802,用于當(dāng)糾錯(cuò)意圖識(shí)別單元801識(shí)別出用戶(hù)具有糾錯(cuò)意圖時(shí),從第二語(yǔ)音識(shí)別結(jié)果中提取出糾錯(cuò)信息。糾錯(cuò)資源匹配單元803,用于根據(jù)糾錯(cuò)信息對(duì)各糾錯(cuò)資源進(jìn)行篩選,利用選出的最為匹配的糾錯(cuò)資源對(duì)第一語(yǔ)音識(shí)別結(jié)果進(jìn)行糾錯(cuò),第一語(yǔ)音識(shí)別結(jié)果為在第二語(yǔ)音query之前輸入的第一語(yǔ)音query的語(yǔ)音識(shí)別結(jié)果。糾錯(cuò)意圖識(shí)別單元801在接收到用戶(hù)輸入的第二語(yǔ)音query之后,可首先按照現(xiàn)有技術(shù)對(duì)其進(jìn)行語(yǔ)音識(shí)別,從而得到第二語(yǔ)音識(shí)別結(jié)果。之后,糾錯(cuò)意圖識(shí)別單元801可根據(jù)第二語(yǔ)音識(shí)別結(jié)果進(jìn)行糾錯(cuò)意圖識(shí)別,即確定用戶(hù)是否具有糾錯(cuò)意圖,確定用戶(hù)具有糾錯(cuò)意圖之后,才會(huì)進(jìn)行后續(xù)的糾錯(cuò)流程??紤]到不同的用戶(hù)可能會(huì)采用不同的表達(dá)方式,有的表達(dá)方式比較明確,可以比較容易地識(shí)別出用戶(hù)的糾錯(cuò)意圖,而有的表達(dá)方式則比較復(fù)雜,識(shí)別起來(lái)比較困難,因此,本實(shí)施例中提供了兩種識(shí)別方式,即基于規(guī)則的糾錯(cuò)意圖識(shí)別方式以及基于統(tǒng)計(jì)的糾錯(cuò)意圖識(shí)別方式,兩種方式可結(jié)合使用。其中,基于規(guī)則的糾錯(cuò)意圖識(shí)別方式可以是指預(yù)先生成m個(gè)糾錯(cuò)意圖模板,m為正整數(shù),具體取值可根據(jù)實(shí)際需要而定,通常大于一,這樣,糾錯(cuò)意圖識(shí)別單元801在獲取到第二語(yǔ)音識(shí)別結(jié)果之后,可確定其是否與m個(gè)糾錯(cuò)意圖模板中的至少一個(gè)相匹配,如果是,則可確定用戶(hù)具有糾錯(cuò)意圖。如果第二語(yǔ)音識(shí)別結(jié)果與任一糾錯(cuò)意圖模板均不匹配,那么可進(jìn)一步采用基于統(tǒng)計(jì)的糾錯(cuò)意圖識(shí)別方式對(duì)第二語(yǔ)音識(shí)別結(jié)果進(jìn)行識(shí)別。比如,糾錯(cuò)意圖識(shí)別單元801可利用深度神經(jīng)網(wǎng)絡(luò)模型對(duì)第二語(yǔ)音識(shí)別結(jié)果進(jìn)行意圖分類(lèi),分類(lèi)結(jié)果包括具有糾錯(cuò)意圖以及不具有糾錯(cuò)意圖。深度神經(jīng)網(wǎng)絡(luò)模型的框架可如圖6所示。在確定用戶(hù)具有糾錯(cuò)意圖之后,并不能直接利用第二語(yǔ)音識(shí)別結(jié)果來(lái)對(duì)第一語(yǔ)音識(shí)別結(jié)果進(jìn)行糾錯(cuò),因?yàn)榈诙Z(yǔ)音識(shí)別結(jié)果中不但包含糾錯(cuò)信息,還包含其它噪聲信息,因此需要對(duì)有用的糾錯(cuò)信息進(jìn)行提取,去除無(wú)關(guān)信息,才能完成后續(xù)的糾錯(cuò)處理。根據(jù)在對(duì)第二語(yǔ)音識(shí)別結(jié)果進(jìn)行糾錯(cuò)意圖識(shí)別時(shí)所采用的識(shí)別方式的不同,從第二語(yǔ)音識(shí)別結(jié)果中提取糾錯(cuò)信息的方式也會(huì)不同。其中,若糾錯(cuò)意圖識(shí)別單元801利用糾錯(cuò)意圖模板確定出用戶(hù)具有糾錯(cuò)意圖,那么糾錯(cuò)信息提取單元802可通過(guò)糾錯(cuò)意圖模板的槽位信息確定出糾錯(cuò)信息。若糾錯(cuò)意圖識(shí)別單元801利用深度神經(jīng)網(wǎng)絡(luò)模型確定出用戶(hù)具有糾錯(cuò)意圖,那么糾錯(cuò)信息提取單元802可通過(guò)序列標(biāo)注模型,分別對(duì)第二語(yǔ)音識(shí)別結(jié)果中的每個(gè)字進(jìn)行標(biāo)注,利用標(biāo)注為屬于糾錯(cuò)信息的字組成糾錯(cuò)信息。序列標(biāo)注模型的框架可如圖7所示。在獲取到糾錯(cuò)信息之后,即可利用糾錯(cuò)信息來(lái)與各糾錯(cuò)資源進(jìn)行匹配,以確定糾錯(cuò)信息所描述的對(duì)象,即用戶(hù)通過(guò)描述想要找到的是哪個(gè)字。糾錯(cuò)資源的種類(lèi)很多,比如使用偏旁部首資源和拆字資源等,偏方部首資源即指(偏旁:字)的kv對(duì),如(單人旁:倒),拆字資源即描述字的拆解信息及原字,如(人到:倒)。以下以拆字資源為例,對(duì)糾錯(cuò)資源匹配單元803的具體工作方式進(jìn)行說(shuō)明。相應(yīng)地,如圖8所示,本實(shí)施例所述裝置中還可進(jìn)一步包括:預(yù)處理單元800。預(yù)處理單元800,用于當(dāng)糾錯(cuò)資源的種類(lèi)為拆字資源時(shí),針對(duì)每個(gè)糾錯(cuò)資源,分別將糾錯(cuò)資源中的每個(gè)字轉(zhuǎn)為對(duì)應(yīng)的拼音,并根據(jù)糾錯(cuò)資源中的各個(gè)字及拼音,生成糾錯(cuò)資源的key;建立key與對(duì)應(yīng)的糾錯(cuò)資源之間的倒排索引。糾錯(cuò)資源匹配單元803可將糾錯(cuò)信息中的每個(gè)字分別轉(zhuǎn)為對(duì)應(yīng)的拼音;確定糾錯(cuò)信息中的各個(gè)字是否組成一個(gè)key,如果是,則將key對(duì)應(yīng)的糾錯(cuò)資源作為篩選出的糾錯(cuò)資源;確定糾錯(cuò)信息中的各個(gè)字對(duì)應(yīng)的拼音是否組成一個(gè)key,如果是,則將key對(duì)應(yīng)的糾錯(cuò)資源作為篩選出的糾錯(cuò)資源。具體地,對(duì)于每個(gè)糾錯(cuò)資源,預(yù)處理單元800可分別按照以下方式確定出該糾錯(cuò)資源的key:針對(duì)糾錯(cuò)資源中的各個(gè)字,分別以連續(xù)i個(gè)term為最小粒度得到連續(xù)kgram集合,并針對(duì)糾錯(cuò)資源中的各個(gè)字對(duì)應(yīng)的拼音,分別以連續(xù)i個(gè)term為最小粒度得到連續(xù)kgram集合,i為正整數(shù),且2≤i≤n,n為糾錯(cuò)資源中包括的字?jǐn)?shù);針對(duì)糾錯(cuò)資源中的各個(gè)字,分別以j個(gè)term為最小粒度得到不連續(xù)的跳躍kgram集合,并針對(duì)糾錯(cuò)資源中的各個(gè)字對(duì)應(yīng)的拼音,分別以j個(gè)term為最小粒度得到不連續(xù)的跳躍kgram集合,j為正整數(shù),且2≤j≤n-1。將連續(xù)kgram集合以及跳躍kgram集合中的元素分別作為糾錯(cuò)資源的key。之后,糾錯(cuò)資源匹配單元803可從篩選出的各糾錯(cuò)資源中進(jìn)一步選出與糾錯(cuò)信息最為匹配的糾錯(cuò)資源,并利用選出的最為匹配的糾錯(cuò)資源對(duì)第一語(yǔ)音識(shí)別結(jié)果進(jìn)行糾錯(cuò)。具體地,糾錯(cuò)資源匹配單元803可針對(duì)篩選出的每個(gè)糾錯(cuò)資源,分別計(jì)算糾錯(cuò)資源中的各個(gè)字的拼音所組成的字符串與糾錯(cuò)信息中的各個(gè)字的拼音所組成的字符串之間的帶權(quán)編輯距離;將計(jì)算出的帶權(quán)編輯距離最小的糾錯(cuò)資源作為最為匹配的糾錯(cuò)資源,利用最為匹配的糾錯(cuò)資源對(duì)第一語(yǔ)音識(shí)別結(jié)果進(jìn)行糾錯(cuò)。其中,在計(jì)算編輯距離時(shí),對(duì)于增加和刪除兩種操作,編輯距離均為1,對(duì)于替換操作,可計(jì)算兩個(gè)音節(jié)之間的發(fā)音距離,發(fā)音距離越近,產(chǎn)生的編輯距離增加量越小。圖8所示裝置實(shí)施例的具體工作流程請(qǐng)參照前述方法實(shí)施例中的相應(yīng)說(shuō)明,不再贅述。圖9示出了適于用來(lái)實(shí)現(xiàn)本發(fā)明實(shí)施方式的示例性計(jì)算機(jī)系統(tǒng)/服務(wù)器12的框圖。圖9顯示的計(jì)算機(jī)系統(tǒng)/服務(wù)器12僅僅是一個(gè)示例,不應(yīng)對(duì)本發(fā)明實(shí)施例的功能和使用范圍帶來(lái)任何限制。如圖9所示,計(jì)算機(jī)系統(tǒng)/服務(wù)器12以通用計(jì)算設(shè)備的形式表現(xiàn)。計(jì)算機(jī)系統(tǒng)/服務(wù)器12的組件可以包括但不限于:一個(gè)或者多個(gè)處理器(處理單元)16,存儲(chǔ)器28,連接不同系統(tǒng)組件(包括存儲(chǔ)器28和處理器16)的總線(xiàn)18。總線(xiàn)18表示幾類(lèi)總線(xiàn)結(jié)構(gòu)中的一種或多種,包括存儲(chǔ)器總線(xiàn)或者存儲(chǔ)器控制器,外圍總線(xiàn),圖形加速端口,處理器或者使用多種總線(xiàn)結(jié)構(gòu)中的任意總線(xiàn)結(jié)構(gòu)的局域總線(xiàn)。舉例來(lái)說(shuō),這些體系結(jié)構(gòu)包括但不限于工業(yè)標(biāo)準(zhǔn)體系結(jié)構(gòu)(isa)總線(xiàn),微通道體系結(jié)構(gòu)(mac)總線(xiàn),增強(qiáng)型isa總線(xiàn)、視頻電子標(biāo)準(zhǔn)協(xié)會(huì)(vesa)局域總線(xiàn)以及外圍組件互連(pci)總線(xiàn)。計(jì)算機(jī)系統(tǒng)/服務(wù)器12典型地包括多種計(jì)算機(jī)系統(tǒng)可讀介質(zhì)。這些介質(zhì)可以是任何能夠被計(jì)算機(jī)系統(tǒng)/服務(wù)器12訪(fǎng)問(wèn)的可用介質(zhì),包括易失性和非易失性介質(zhì),可移動(dòng)的和不可移動(dòng)的介質(zhì)。存儲(chǔ)器28可以包括易失性存儲(chǔ)器形式的計(jì)算機(jī)系統(tǒng)可讀介質(zhì),例如隨機(jī)存取存儲(chǔ)器(ram)30和/或高速緩存存儲(chǔ)器32。計(jì)算機(jī)系統(tǒng)/服務(wù)器12可以進(jìn)一步包括其它可移動(dòng)/不可移動(dòng)的、易失性/非易失性計(jì)算機(jī)系統(tǒng)存儲(chǔ)介質(zhì)。僅作為舉例,存儲(chǔ)系統(tǒng)34可以用于讀寫(xiě)不可移動(dòng)的、非易失性磁介質(zhì)(圖9未顯示,通常稱(chēng)為“硬盤(pán)驅(qū)動(dòng)器”)。盡管圖9中未示出,可以提供用于對(duì)可移動(dòng)非易失性磁盤(pán)(例如“軟盤(pán)”)讀寫(xiě)的磁盤(pán)驅(qū)動(dòng)器,以及對(duì)可移動(dòng)非易失性光盤(pán)(例如cd-rom,dvd-rom或者其它光介質(zhì))讀寫(xiě)的光盤(pán)驅(qū)動(dòng)器。在這些情況下,每個(gè)驅(qū)動(dòng)器可以通過(guò)一個(gè)或者多個(gè)數(shù)據(jù)介質(zhì)接口與總線(xiàn)18相連。存儲(chǔ)器28可以包括至少一個(gè)程序產(chǎn)品,該程序產(chǎn)品具有一組(例如至少一個(gè))程序模塊,這些程序模塊被配置以執(zhí)行本發(fā)明各實(shí)施例的功能。具有一組(至少一個(gè))程序模塊42的程序/實(shí)用工具40,可以存儲(chǔ)在例如存儲(chǔ)器28中,這樣的程序模塊42包括——但不限于——操作系統(tǒng)、一個(gè)或者多個(gè)應(yīng)用程序、其它程序模塊以及程序數(shù)據(jù),這些示例中的每一個(gè)或某種組合中可能包括網(wǎng)絡(luò)環(huán)境的實(shí)現(xiàn)。程序模塊42通常執(zhí)行本發(fā)明所描述的實(shí)施例中的功能和/或方法。計(jì)算機(jī)系統(tǒng)/服務(wù)器12也可以與一個(gè)或多個(gè)外部設(shè)備14(例如鍵盤(pán)、指向設(shè)備、顯示器24等)通信,還可與一個(gè)或者多個(gè)使得用戶(hù)能與該計(jì)算機(jī)系統(tǒng)/服務(wù)器12交互的設(shè)備通信,和/或與使得該計(jì)算機(jī)系統(tǒng)/服務(wù)器12能與一個(gè)或多個(gè)其它計(jì)算設(shè)備進(jìn)行通信的任何設(shè)備(例如網(wǎng)卡,調(diào)制解調(diào)器等等)通信。這種通信可以通過(guò)輸入/輸出(i/o)接口22進(jìn)行。并且,計(jì)算機(jī)系統(tǒng)/服務(wù)器12還可以通過(guò)網(wǎng)絡(luò)適配器20與一個(gè)或者多個(gè)網(wǎng)絡(luò)(例如局域網(wǎng)(lan),廣域網(wǎng)(wan)和/或公共網(wǎng)絡(luò),例如因特網(wǎng))通信。如圖9所示,網(wǎng)絡(luò)適配器20通過(guò)總線(xiàn)18與計(jì)算機(jī)系統(tǒng)/服務(wù)器12的其它模塊通信。應(yīng)當(dāng)明白,盡管圖中未示出,可以結(jié)合計(jì)算機(jī)系統(tǒng)/服務(wù)器12使用其它硬件和/或軟件模塊,包括但不限于:微代碼、設(shè)備驅(qū)動(dòng)器、冗余處理單元、外部磁盤(pán)驅(qū)動(dòng)陣列、raid系統(tǒng)、磁帶驅(qū)動(dòng)器以及數(shù)據(jù)備份存儲(chǔ)系統(tǒng)等。處理器16通過(guò)運(yùn)行存儲(chǔ)在存儲(chǔ)器28中的程序,從而執(zhí)行各種功能應(yīng)用以及數(shù)據(jù)處理,例如實(shí)現(xiàn)圖1所示實(shí)施例中的方法,即獲取用戶(hù)輸入的第二語(yǔ)音query的第二語(yǔ)音識(shí)別結(jié)果,根據(jù)第二語(yǔ)音識(shí)別結(jié)果進(jìn)行糾錯(cuò)意圖識(shí)別,若確定用戶(hù)具有糾錯(cuò)意圖,則從第二語(yǔ)音識(shí)別結(jié)果中提取出糾錯(cuò)信息,根據(jù)糾錯(cuò)信息對(duì)各糾錯(cuò)資源進(jìn)行篩選,利用選出的最為匹配的糾錯(cuò)資源對(duì)第一語(yǔ)音識(shí)別結(jié)果進(jìn)行糾錯(cuò),第一語(yǔ)音識(shí)別結(jié)果為在第二語(yǔ)音query之前輸入的第一語(yǔ)音query的語(yǔ)音識(shí)別結(jié)果。具體實(shí)現(xiàn)請(qǐng)參照前述各實(shí)施例中的相關(guān)說(shuō)明,不再贅述。本發(fā)明同時(shí)公開(kāi)了一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序,該程序被處理器執(zhí)行時(shí)將實(shí)現(xiàn)如圖1所示實(shí)施例中的方法??梢圆捎靡粋€(gè)或多個(gè)計(jì)算機(jī)可讀的介質(zhì)的任意組合。計(jì)算機(jī)可讀介質(zhì)可以是計(jì)算機(jī)可讀信號(hào)介質(zhì)或者計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)。計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)例如可以是——但不限于——電、磁、光、電磁、紅外線(xiàn)、或半導(dǎo)體的系統(tǒng)、裝置或器件,或者任意以上的組合。計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)的更具體的例子(非窮舉的列表)包括:具有一個(gè)或多個(gè)導(dǎo)線(xiàn)的電連接、便攜式計(jì)算機(jī)磁盤(pán)、硬盤(pán)、隨機(jī)存取存儲(chǔ)器(ram)、只讀存儲(chǔ)器(rom)、可擦式可編程只讀存儲(chǔ)器(eprom或閃存)、光纖、便攜式緊湊磁盤(pán)只讀存儲(chǔ)器(cd-rom)、光存儲(chǔ)器件、磁存儲(chǔ)器件、或者上述的任意合適的組合。在本文件中,計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)可以是任何包含或存儲(chǔ)程序的有形介質(zhì),該程序可以被指令執(zhí)行系統(tǒng)、裝置或者器件使用或者與其結(jié)合使用。計(jì)算機(jī)可讀的信號(hào)介質(zhì)可以包括在基帶中或者作為載波一部分傳播的數(shù)據(jù)信號(hào),其中承載了計(jì)算機(jī)可讀的程序代碼。這種傳播的數(shù)據(jù)信號(hào)可以采用多種形式,包括——但不限于——電磁信號(hào)、光信號(hào)或上述的任意合適的組合。計(jì)算機(jī)可讀的信號(hào)介質(zhì)還可以是計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)以外的任何計(jì)算機(jī)可讀介質(zhì),該計(jì)算機(jī)可讀介質(zhì)可以發(fā)送、傳播或者傳輸用于由指令執(zhí)行系統(tǒng)、裝置或者器件使用或者與其結(jié)合使用的程序。計(jì)算機(jī)可讀介質(zhì)上包含的程序代碼可以用任何適當(dāng)?shù)慕橘|(zhì)傳輸,包括——但不限于——無(wú)線(xiàn)、電線(xiàn)、光纜、rf等等,或者上述的任意合適的組合??梢砸砸环N或多種程序設(shè)計(jì)語(yǔ)言或其組合來(lái)編寫(xiě)用于執(zhí)行本發(fā)明操作的計(jì)算機(jī)程序代碼,所述程序設(shè)計(jì)語(yǔ)言包括面向?qū)ο蟮某绦蛟O(shè)計(jì)語(yǔ)言—諸如java、smalltalk、c++,還包括常規(guī)的過(guò)程式程序設(shè)計(jì)語(yǔ)言—諸如”c”語(yǔ)言或類(lèi)似的程序設(shè)計(jì)語(yǔ)言。程序代碼可以完全地在用戶(hù)計(jì)算機(jī)上執(zhí)行、部分地在用戶(hù)計(jì)算機(jī)上執(zhí)行、作為一個(gè)獨(dú)立的軟件包執(zhí)行、部分在用戶(hù)計(jì)算機(jī)上部分在遠(yuǎn)程計(jì)算機(jī)上執(zhí)行、或者完全在遠(yuǎn)程計(jì)算機(jī)或服務(wù)器上執(zhí)行。在涉及遠(yuǎn)程計(jì)算機(jī)的情形中,遠(yuǎn)程計(jì)算機(jī)可以通過(guò)任意種類(lèi)的網(wǎng)絡(luò)——包括局域網(wǎng)(lan)或廣域網(wǎng)(wan)—連接到用戶(hù)計(jì)算機(jī),或者,可以連接到外部計(jì)算機(jī)(例如利用因特網(wǎng)服務(wù)提供商來(lái)通過(guò)因特網(wǎng)連接)。在本發(fā)明所提供的幾個(gè)實(shí)施例中,應(yīng)該理解到,所揭露的裝置和方法等,可以通過(guò)其它的方式實(shí)現(xiàn)。例如,以上所描述的裝置實(shí)施例僅僅是示意性的,例如,所述單元的劃分,僅僅為一種邏輯功能劃分,實(shí)際實(shí)現(xiàn)時(shí)可以有另外的劃分方式。所述作為分離部件說(shuō)明的單元可以是或者也可以不是物理上分開(kāi)的,作為單元顯示的部件可以是或者也可以不是物理單元,即可以位于一個(gè)地方,或者也可以分布到多個(gè)網(wǎng)絡(luò)單元上。可以根據(jù)實(shí)際的需要選擇其中的部分或者全部單元來(lái)實(shí)現(xiàn)本實(shí)施例方案的目的。另外,在本發(fā)明各個(gè)實(shí)施例中的各功能單元可以集成在一個(gè)處理單元中,也可以是各個(gè)單元單獨(dú)物理存在,也可以?xún)蓚€(gè)或兩個(gè)以上單元集成在一個(gè)單元中。上述集成的單元既可以采用硬件的形式實(shí)現(xiàn),也可以采用硬件加軟件功能單元的形式實(shí)現(xiàn)。上述以軟件功能單元的形式實(shí)現(xiàn)的集成的單元,可以存儲(chǔ)在一個(gè)計(jì)算機(jī)可讀取存儲(chǔ)介質(zhì)中。上述軟件功能單元存儲(chǔ)在一個(gè)存儲(chǔ)介質(zhì)中,包括若干指令用以使得一臺(tái)計(jì)算機(jī)設(shè)備(可以是個(gè)人計(jì)算機(jī),服務(wù)器,或者網(wǎng)絡(luò)設(shè)備等)或處理器(processor)執(zhí)行本發(fā)明各個(gè)實(shí)施例所述方法的部分步驟。而前述的存儲(chǔ)介質(zhì)包括:u盤(pán)、移動(dòng)硬盤(pán)、只讀存儲(chǔ)器(rom,read-onlymemory)、隨機(jī)存取存儲(chǔ)器(ram,randomaccessmemory)、磁碟或者光盤(pán)等各種可以存儲(chǔ)程序代碼的介質(zhì)。以上所述僅為本發(fā)明的較佳實(shí)施例而已,并不用以限制本發(fā)明,凡在本發(fā)明的精神和原則之內(nèi),所做的任何修改、等同替換、改進(jìn)等,均應(yīng)包含在本發(fā)明保護(hù)的范圍之內(nèi)。當(dāng)前第1頁(yè)12
      當(dāng)前第1頁(yè)1 2 
      網(wǎng)友詢(xún)問(wèn)留言 已有0條留言
      • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
      1