国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      語音識別方法、裝置及終端的制作方法

      文檔序號:10554000閱讀:597來源:國知局
      語音識別方法、裝置及終端的制作方法
      【專利摘要】本公開是關(guān)于一種語音識別方法、裝置及終端。該方法包括:獲取輸入的待識別語音;根據(jù)字母校準(zhǔn)語音或文字校準(zhǔn)語音識別所述待識別語音,其中所述字母校準(zhǔn)語音替換系統(tǒng)默認(rèn)字母標(biāo)準(zhǔn)語音。應(yīng)用本公開實(shí)施例的方案,能更準(zhǔn)確識別用戶的語音。
      【專利說明】
      語音識別方法、裝置及終端
      技術(shù)領(lǐng)域
      [0001]本公開涉及移動通信技術(shù)領(lǐng)域,尤其涉及一種語音識別方法、裝置及終端。
      【背景技術(shù)】
      [0002]目前,語音識別技術(shù)在現(xiàn)階段得到了廣泛應(yīng)用,其目標(biāo)是將人類的語音中的詞匯內(nèi)容轉(zhuǎn)換為計(jì)算機(jī)可讀的輸入,例如按鍵、二進(jìn)制編碼或者字符序列。語音識別技術(shù)的應(yīng)用包括語音撥號、語音導(dǎo)航、室內(nèi)設(shè)備控制、語音文檔檢索、簡單的聽寫數(shù)據(jù)錄入等。
      [0003]為了適應(yīng)用戶的不同需求,語音識別技術(shù)中開始增加方言適配,例如:粵語、四川話等。但是,對于有標(biāo)準(zhǔn)發(fā)音字母結(jié)構(gòu)的語種,例如普通話和英語,在語音識別系統(tǒng)中都是設(shè)置了默認(rèn)字母標(biāo)準(zhǔn)語音,如果用戶發(fā)出的語音是帶地方口音的拼讀方式,且口音相差很大,就會導(dǎo)致語音識別率極低,語音識別功能幾乎失效。

      【發(fā)明內(nèi)容】

      [0004]本公開提供了一種語音識別方法、裝置及終端,能更準(zhǔn)確識別用戶的語音。
      [0005]根據(jù)本公開實(shí)施例的第一方面,提供一種語音識別方法,包括:
      [0006]獲取輸入的待識別語音;
      [0007]根據(jù)字母校準(zhǔn)語音或文字校準(zhǔn)語音識別所述待識別語音,其中所述字母校準(zhǔn)語音替換系統(tǒng)默認(rèn)字母標(biāo)準(zhǔn)語音。
      [0008]可選的,所述根據(jù)文字校準(zhǔn)語音識別所述待識別語音,包括:
      [0009]使用所述字母校準(zhǔn)語音組成新的文字校準(zhǔn)語音;
      [0010]根據(jù)所述文字校準(zhǔn)語音識別所述輸入的待識別語音。
      [0011 ]可選的,所述根據(jù)文字校準(zhǔn)語音識別所述待識別語音,包括:
      [0012]獲取存儲的文字校準(zhǔn)語音,其中所述存儲的文字校準(zhǔn)語音是根據(jù)所述字母校準(zhǔn)語音識別出歷史待識別語音后,由識別出的語音組成的新的文字校準(zhǔn)語音;
      [0013]根據(jù)所述獲取的文字校準(zhǔn)語音識別所述輸入的待識別語音。
      [0014]可選的,所述字母校準(zhǔn)語音替換系統(tǒng)默認(rèn)字母標(biāo)準(zhǔn)語音包括:
      [0015]通過錄制字母表所有字母的發(fā)音采集字母校準(zhǔn)語音;
      [0016]將所述采集的字母標(biāo)準(zhǔn)語音替換系統(tǒng)默認(rèn)字母標(biāo)準(zhǔn)語音。
      [0017]可選的,所述根據(jù)所述文字校準(zhǔn)語音識別輸入的待識別語音,包括:
      [0018]獲取所述文字校準(zhǔn)語音和所述待識別語音的語音特征信息;
      [0019]根據(jù)所述文字校準(zhǔn)語音與所述待識別語音的語音特征信息之間的匹配關(guān)系,識別輸入的待識別語音。
      [0020]可選的,所述語音特征信息可包括下述一項(xiàng)或多項(xiàng):語音的音色、音高、音長和音強(qiáng)。
      [0021 ]可選的,所述使用所述字母校準(zhǔn)語音組成新的文字校準(zhǔn)語音包括:
      [0022]通過單個字母校準(zhǔn)音拼讀得到新的文字校準(zhǔn)語音;或,
      [0023]通過組合多個字母校準(zhǔn)語音并按照連讀規(guī)則拼讀得到新的文字校準(zhǔn)語音。
      [0024]可選的,所述字母校準(zhǔn)語音中的設(shè)定字母之間設(shè)置模糊近似關(guān)系。
      [0025]根據(jù)本公開實(shí)施例的第二方面,提供一種語音識別裝置,包括:
      [0026]獲取模塊,用于獲取輸入的待識別語音;
      [0027]語音識別模塊,用于根據(jù)字母校準(zhǔn)語音或文字校準(zhǔn)語音識別所述獲取模塊的待識別語音,其中所述字母校準(zhǔn)語音替換系統(tǒng)默認(rèn)字母標(biāo)準(zhǔn)語音。
      [0028]可選的,所述語音識別模塊包括:
      [0029]第一識別子模塊,用于使用所述字母校準(zhǔn)語音組成新的文字校準(zhǔn)語音,根據(jù)所述文字校準(zhǔn)語音識別所述輸入的待識別語音;或者,
      [0030]第二識別子模塊,用于獲取存儲的文字校準(zhǔn)語音,其中所述存儲的文字校準(zhǔn)語音是根據(jù)所述字母校準(zhǔn)語音識別出歷史待識別語音后,由識別出的語音組成的新的文字校準(zhǔn)語音,根據(jù)所述獲取的文字校準(zhǔn)語音識別所述輸入的待識別語音。
      [0031]可選的,所述裝置還包括:
      [0032]字母語音替換模塊,用于通過錄制字母表所有字母的發(fā)音采集字母校準(zhǔn)語音,將所述采集的字母標(biāo)準(zhǔn)語音替換系統(tǒng)默認(rèn)字母標(biāo)準(zhǔn)語音。
      [0033]可選的,所述語音識別模塊獲取所述文字校準(zhǔn)語音和所述待識別語音的語音特征信息,根據(jù)所述文字校準(zhǔn)語音與所述待識別語音的語音特征信息之間的匹配關(guān)系,識別輸入的待識別語音。
      [0034]可選的,所述第一識別子模塊通過單個字母校準(zhǔn)音拼讀得到新的文字校準(zhǔn)語音或通過組合多個字母校準(zhǔn)語音并按照連讀規(guī)則拼讀得到新的文字校準(zhǔn)語音。
      [0035]可選的,所述裝置還包括:
      [0036]模糊設(shè)置模塊,用于在所述字母校準(zhǔn)語音中的設(shè)定字母之間設(shè)置模糊近似關(guān)系。
      [0037]根據(jù)本公開實(shí)施例的第三方面,提供一種移動終端,包括:
      [0038]處理器和用于存儲處理器可執(zhí)行指令的存儲器;
      [0039]其中,所述處理器被配置為:
      [0040]獲取輸入的待識別語音;
      [0041]根據(jù)字母校準(zhǔn)語音或文字校準(zhǔn)語音識別所述待識別語音,其中所述字母校準(zhǔn)語音替換系統(tǒng)默認(rèn)字母標(biāo)準(zhǔn)語音。
      [0042]本公開的實(shí)施例提供的技術(shù)方案可以包括以下有益效果:
      [0043]本公開在獲取輸入的待識別語音后,可以根據(jù)字母校準(zhǔn)語音或文字校準(zhǔn)語音來識別所述待識別語音,其中所述字母校準(zhǔn)語音替換了系統(tǒng)默認(rèn)字母標(biāo)準(zhǔn)語音,這樣就使得用戶即使語音帶有地方口音也可以被準(zhǔn)確識別,提高語音識別能力。
      [0044]進(jìn)一步的,本公開還可以有兩種處理方式,可以是使用所述字母校準(zhǔn)語音組成新的文字校準(zhǔn)語音,根據(jù)所述文字校準(zhǔn)語音識別所述輸入的待識別語音;還可以是獲取存儲的文字校準(zhǔn)語音,其中所述存儲的文字校準(zhǔn)語音是根據(jù)所述字母校準(zhǔn)語音識別出歷史待識別語音后,由識別出的語音組成的新的文字校準(zhǔn)語音;根據(jù)所述獲取的文字校準(zhǔn)語音識別所述輸入的待識別語音,因此就可以根據(jù)文字校準(zhǔn)語音識別輸入的待識別語音,這樣也可以提高語音識別能力和識別效率。
      [0045]進(jìn)一步的,本公開可以通過錄制字母表所有字母的發(fā)音作為字母校準(zhǔn)語音。
      [0046]進(jìn)一步的,本公開可以根據(jù)所述文字校準(zhǔn)語音與所述待識別語音的語音特征信息之間的匹配關(guān)系,識別輸入的待識別語音。
      [0047]進(jìn)一步的,本公開可以通過單個字母校準(zhǔn)音拼讀得到新的文字校準(zhǔn)語音,或者通過組合多個字母校準(zhǔn)語音并按照連讀規(guī)則拼讀得到新的文字校準(zhǔn)語音。
      [0048]進(jìn)一步的,本公開可以將字母校準(zhǔn)語音中的設(shè)定字母之間設(shè)置模糊近似關(guān)系,可以解決一些地方口音的個別字母發(fā)音相似的問題。
      [0049]應(yīng)當(dāng)理解的是,以上的一般描述和后文的細(xì)節(jié)描述僅是示例性和解釋性的,并不能限制本公開。
      【附圖說明】
      [0050]此處的附圖被并入說明書中并構(gòu)成本說明書的一部分,示出了符合本公開的實(shí)施例,并與說明書一起用于解釋本公開的原理。
      [0051 ]圖1是本公開根據(jù)一示例性實(shí)施例示出的一種語音識別方法的流程圖。
      [0052]圖2是本公開根據(jù)一示例性實(shí)施例示出的另一種語音識別方法的流程圖。
      [0053]圖3是本公開根據(jù)一示例性實(shí)施例示出的一種語音識別裝置的框圖。
      [0054]圖4是本公開根據(jù)一示例性實(shí)施例示出的另一種語音識別裝置的框圖。
      [0055]圖5是本公開根據(jù)一示例性實(shí)施例示出的一種移動終端的一結(jié)構(gòu)框圖。
      [0056]圖6是本公開根據(jù)一示例性實(shí)施例示出的一種設(shè)備的一結(jié)構(gòu)框圖。
      【具體實(shí)施方式】
      [0057]這里將詳細(xì)地對示例性實(shí)施例進(jìn)行說明,其示例表示在附圖中。下面的描述涉及附圖時,除非另有表示,不同附圖中的相同數(shù)字表示相同或相似的要素。以下示例性實(shí)施例中所描述的實(shí)施方式并不代表與本公開相一致的所有實(shí)施方式。相反,它們僅是與如所附權(quán)利要求書中所詳述的、本公開的一些方面相一致的裝置和方法的例子。
      [0058]在本公開使用的術(shù)語是僅僅出于描述特定實(shí)施例的目的,而非旨在限制本公開。在本公開和所附權(quán)利要求書中所使用的單數(shù)形式的“一種”、“所述”和“該”也旨在包括多數(shù)形式,除非上下文清楚地表示其他含義。還應(yīng)當(dāng)理解,本文中使用的術(shù)語“和/或”是指并包含一個或多個相關(guān)聯(lián)的列出項(xiàng)目的任何或所有可能組合。
      [0059]應(yīng)當(dāng)理解,盡管在本公開可能采用術(shù)語第一、第二、第三等來描述各種信息,但這些信息不應(yīng)限于這些術(shù)語。這些術(shù)語僅用來將同一類型的信息彼此區(qū)分開。例如,在不脫離本公開范圍的情況下,第一信息也可以被稱為第二信息,類似地,第二信息也可以被稱為第一信息。取決于語境,如在此所使用的詞語“如果”可以被解釋成為“在……時”或“當(dāng)……時”或“響應(yīng)于確定”。
      [0060]本公開提供了一種語音識別方法、裝置及終端,能更準(zhǔn)確識別用戶的語音。
      [0061 ]圖1是本公開根據(jù)一示例性實(shí)施例示出的一種語音識別方法的流程圖。
      [0062]該方法可以應(yīng)用于終端中,如圖1所示,該方法可以包括以下步驟:
      [0063]在步驟101中,獲取輸入的待識別語音。
      [0064]在步驟102中,根據(jù)字母校準(zhǔn)語音或文字校準(zhǔn)語音識別所述待識別語音,其中所述字母校準(zhǔn)語音替換系統(tǒng)默認(rèn)字母標(biāo)準(zhǔn)語音。
      [0065]該步驟可以使用所述字母校準(zhǔn)語音組成新的文字校準(zhǔn)語音,根據(jù)所述文字校準(zhǔn)語音識別所述輸入的待識別語音;或者,獲取存儲的文字校準(zhǔn)語音,其中所述存儲的文字校準(zhǔn)語音是根據(jù)所述字母校準(zhǔn)語音識別出歷史待識別語音后,由識別出的語音組成的新的文字校準(zhǔn)語音,根據(jù)所述獲取的文字校準(zhǔn)語音識別所述輸入的待識別語音。
      [0066]其中,該步驟可以通過錄制字母表所有字母的發(fā)音采集字母校準(zhǔn)語音;將采集的字母標(biāo)準(zhǔn)語音替換系統(tǒng)默認(rèn)字母標(biāo)準(zhǔn)語音。
      [0067]該步驟可以獲取所述文字校準(zhǔn)語音和所述待識別語音的語音特征信息,根據(jù)所述文字校準(zhǔn)語音與所述待識別語音的語音特征信息之間的匹配關(guān)系,識別輸入的待識別語
      ■~>V.曰O
      [0068]該步驟使用所述字母校準(zhǔn)語音組成新的文字校準(zhǔn)語音可以包括:通過單個字母校準(zhǔn)音拼讀得到新的文字校準(zhǔn)語音;或,通過組合多個字母校準(zhǔn)語音并按照連讀規(guī)則拼讀得到新的文字校準(zhǔn)語音。
      [0069]該步驟可以獲取文字校準(zhǔn)語音和待識別語音的語音特征信息;根據(jù)文字校準(zhǔn)語音與待識別語音的語音特征信息之間的匹配關(guān)系,識別輸入的待識別語音。其中,語音特征信息可包括下述一項(xiàng)或多項(xiàng):語音的音色、音高、音長和音強(qiáng)。
      [0070]由該實(shí)施例可見,本公開的實(shí)施例提供的技術(shù)方案可以包括以下有益效果:本公開在獲取輸入的待識別語音后,可以根據(jù)字母校準(zhǔn)語音或文字校準(zhǔn)語音來識別所述待識別語音,其中所述字母校準(zhǔn)語音替換了系統(tǒng)默認(rèn)字母標(biāo)準(zhǔn)語音,這樣就使得用戶即使語音帶有地方口音也可以被準(zhǔn)確識別,提高語音識別能力。
      [0071 ]圖2是本公開根據(jù)一示例性實(shí)施例示出的另一種語音識別方法流程圖。
      [0072]該方法可以應(yīng)用于終端中,該實(shí)施例相對于圖1更詳細(xì)描述了本公開的技術(shù)方案。
      [0073]以下結(jié)合圖2詳細(xì)描述技術(shù)方案。如圖2所示,該方法可以包括以下步驟:
      [0074]在步驟201中,采集用戶將字母表所有的字母發(fā)音一一自行錄制所得到的字母校準(zhǔn)語音。
      [0075]本公開將用戶錄制的所有字母發(fā)音稱為字母校準(zhǔn)語音。本公開提供針對標(biāo)準(zhǔn)發(fā)音字母的自行錄入功能,用戶將所有發(fā)音字母自行錄制一遍,得到字母校準(zhǔn)語音,后續(xù)以字母校準(zhǔn)語音作為標(biāo)準(zhǔn),這樣可以解決有標(biāo)準(zhǔn)發(fā)音字母結(jié)構(gòu)的發(fā)音的口音問題。
      [0076]其中,上述字母例如可以為英文字母、中文字母或其他語言的字母等。
      [0077]在步驟202中,將獲取的用戶錄制的字母校準(zhǔn)語音替換系統(tǒng)原來的默認(rèn)字母標(biāo)準(zhǔn)語音。
      [0078]因?yàn)橄到y(tǒng)的默認(rèn)字母標(biāo)準(zhǔn)語音是很難識別帶有地方口音的字母發(fā)音,因此本公開將獲取的用戶錄制的字母校準(zhǔn)語音替換系統(tǒng)原來的默認(rèn)字母標(biāo)準(zhǔn)語音,這樣系統(tǒng)設(shè)置的字母發(fā)音標(biāo)準(zhǔn)將以采集的字母校準(zhǔn)語音作為識別標(biāo)準(zhǔn),帶有地方口音的字母發(fā)音就很容易被識別。
      [0079]在步驟203中,使用字母校準(zhǔn)語音組成新的文字校準(zhǔn)語音。
      [0080]考慮到人在朗讀任何一個字或單詞的發(fā)音時,都是通過單個字母發(fā)出發(fā)音或組合多個單字母并根據(jù)相應(yīng)連讀規(guī)則發(fā)出發(fā)音,語音識別系統(tǒng)也可以學(xué)習(xí)人的這種連讀行為。因此本公開該步驟可以通過單個字母校準(zhǔn)音拼讀得到新的文字校準(zhǔn)語音;或,通過組合多個字母校準(zhǔn)語音并按照連讀規(guī)則拼讀得到新的文字校準(zhǔn)語音。[0081 ]例如:蘋果的拼音為pingguo,可以組合單個字母或字母組合p、ing、g、u、o并按照連讀方式p-1ng-g-u-o來拼讀,從而可得到新的文字標(biāo)準(zhǔn)語音。也就是說,語音識別系統(tǒng)使用用戶自行錄制的字母校準(zhǔn)語音替換掉默認(rèn)配置的字母標(biāo)準(zhǔn)語音后,再用相同的連讀規(guī)則重新組合多個字母校準(zhǔn)語音或直接使用單個字母校準(zhǔn)音(例如有些是單個字母組成一個字)得到新的文字校準(zhǔn)語音,并可以將新的文字校準(zhǔn)語音替換系統(tǒng)自帶的根據(jù)字母標(biāo)準(zhǔn)語音得到的文字語音。
      [0082]其中,所說的連讀,是指例如在英語的同一意群中,前一詞以輔音音素結(jié)尾,后一詞以元音音素開頭,在說話或朗讀句子時,習(xí)慣上很自然地將這兩個音素合拼在一起讀出來,這種語音現(xiàn)象叫連讀。連讀所構(gòu)成的音節(jié)一般都不重讀,只需順其自然地一帶而過,不可讀得太重。連讀規(guī)則,是指連讀的習(xí)慣,例如對于“輔音+元音”型連讀的情況,連讀規(guī)則是如果相鄰兩詞中的前一個詞是以輔音結(jié)尾,后一個詞是以元音開頭,這就要將輔音與元音拼起來連讀。
      [0083]需說明的是,系統(tǒng)一般可以自帶文字語音庫,將一些常用單詞或詞匯按默認(rèn)字母標(biāo)準(zhǔn)語音拼讀并存儲。本公開可以將系統(tǒng)自帶的所有文字語音用字母校準(zhǔn)語音重新拼讀得到新的文字標(biāo)準(zhǔn)語首后,替換掉原來的文字語首。
      [0084]在步驟204中,根據(jù)文字校準(zhǔn)語音識別用戶所說的待識別語音。
      [0085]該步驟,獲取文字校準(zhǔn)語音和待識別語音的語音特征信息;根據(jù)文字校準(zhǔn)語音與待識別語音的語音特征信息之間的匹配關(guān)系,識別輸入的待識別語音。其中,語音特征信息可包括下述一項(xiàng)或多項(xiàng):語音的音色、音高、音長和音強(qiáng)。
      [0086]需說明的是,根據(jù)語音特征信息識別輸入的待識別語音,可以采用現(xiàn)有的識別算法進(jìn)行識別,本公開不加以限定。
      [0087]還需說明的是,考慮到地方口音會存在一些發(fā)音混淆的發(fā)音,本公開可以在字母校準(zhǔn)語音中的設(shè)定字母之間設(shè)置模糊近似關(guān)系,將可能會存在發(fā)音混淆的發(fā)音關(guān)聯(lián)起來,例如:設(shè)置字母發(fā)音s = sh,c = ch等。
      [0088]本公開的方案,用戶根據(jù)自己口音情況設(shè)置字母校準(zhǔn)語音,將所有發(fā)音字母自行錄制一遍作為字母校準(zhǔn)語音,替換系統(tǒng)的字母標(biāo)準(zhǔn)語音,再用使用字母校準(zhǔn)語音組成新的文字校準(zhǔn)語音來識別輸入的待識別語音,這樣可以解決有標(biāo)準(zhǔn)發(fā)音字母結(jié)構(gòu)的發(fā)音的口音問題,可以提升語音輸入的識別度。
      [0089]還需說明的是,本公開還可以根據(jù)字母校準(zhǔn)語音識別出歷史待識別語音后,由識別出的語音組成的新的文字校準(zhǔn)語音,然后就可以直接獲取存儲的文字校準(zhǔn)語音,根據(jù)所述獲取的文字校準(zhǔn)語音識別所述輸入的待識別語音。
      [0090]與前述應(yīng)用功能實(shí)現(xiàn)方法實(shí)施例相對應(yīng),本公開還提供了一種語音識別裝置、終端及相應(yīng)的的實(shí)施例。
      [0091 ]圖3是本公開根據(jù)一示例性實(shí)施例示出的一種語音識別裝置的框圖。
      [0092]該裝置可以是設(shè)置在終端中。如圖3所示,在一種語音識別裝置中可以包括:獲取模塊31、語音識別模塊32。
      [0093]獲取模塊31,用于獲取輸入的待識別語音。
      [0094]語音識別模塊32,用于根據(jù)字母校準(zhǔn)語音或文字校準(zhǔn)語音識別所述獲取模塊的待識別語音,其中所述字母校準(zhǔn)語音替換系統(tǒng)默認(rèn)字母標(biāo)準(zhǔn)語音。
      [0095]其中,語音識別模塊32可以使用所述字母校準(zhǔn)語音組成新的文字校準(zhǔn)語音,根據(jù)所述文字校準(zhǔn)語音識別所述輸入的待識別語音;或者,獲取存儲的文字校準(zhǔn)語音,其中所述存儲的文字校準(zhǔn)語音是根據(jù)所述字母校準(zhǔn)語音識別出歷史待識別語音后,由識別出的語音組成的新的文字校準(zhǔn)語音,根據(jù)所述獲取的文字校準(zhǔn)語音識別所述輸入的待識別語音。
      [0096]由該實(shí)施例可見,本公開在獲取輸入的待識別語音后,可以根據(jù)字母校準(zhǔn)語音或文字校準(zhǔn)語音來識別所述待識別語音,其中所述字母校準(zhǔn)語音替換了系統(tǒng)默認(rèn)字母標(biāo)準(zhǔn)語音,這樣就使得用戶即使語音帶有地方口音也可以被準(zhǔn)確識別,提高語音識別能力。
      [0097]圖4是本公開根據(jù)一示例性實(shí)施例示出的多方通話的裝置的另一框圖。
      [0098]該裝置可以是設(shè)置在終端中。如圖4所示,在一種語音識別裝置中可以包括:獲取模塊31、語音識別模塊32、字母語音替換模塊33、模糊設(shè)置模塊34。
      [0099 ]獲取模塊31、語音識別模塊32的功能可參見圖3中的描述。
      [0100]其中,語音識別模塊32可以包括:第一識別子模塊321或第二識別子模塊322。
      [0101]第一識別子模塊321,用于使用所述字母校準(zhǔn)語音組成新的文字校準(zhǔn)語音,根據(jù)所述文字校準(zhǔn)語音識別所述輸入的待識別語音。
      [0102]第二識別子模塊322,用于獲取存儲的文字校準(zhǔn)語音,其中所述存儲的文字校準(zhǔn)語音是根據(jù)所述字母校準(zhǔn)語音識別出歷史待識別語音后,由識別出的語音組成的新的文字校準(zhǔn)語音,根據(jù)所述獲取的文字校準(zhǔn)語音識別所述輸入的待識別語音。
      [0103]其中,根據(jù)文字校準(zhǔn)語音識別輸入的待識別語音可以包括:獲取文字校準(zhǔn)語音和待識別語音的語音特征信息;根據(jù)文字校準(zhǔn)語音與待識別語音的語音特征信息之間的匹配關(guān)系,識別輸入的待識別語音。其中,語音特征信息可包括下述一項(xiàng)或多項(xiàng):語音的音色、音高、音長和音強(qiáng)。
      [0104]其中,所述裝置還可以包括:字母語音替換模塊33。
      [0105]字母語音替換模塊33,用于通過錄制字母表所有字母的發(fā)音采集字母校準(zhǔn)語音,將所述采集的字母標(biāo)準(zhǔn)語音替換系統(tǒng)默認(rèn)字母標(biāo)準(zhǔn)語音。因?yàn)橄到y(tǒng)的默認(rèn)字母標(biāo)準(zhǔn)語音是很難識別帶有地方口音的字母發(fā)音,因此本公開將獲取的用戶錄制的字母校準(zhǔn)語音替換系統(tǒng)原來的默認(rèn)字母標(biāo)準(zhǔn)語音,這樣系統(tǒng)設(shè)置的字母發(fā)音標(biāo)準(zhǔn)將以采集的字母校準(zhǔn)語音作為識別標(biāo)準(zhǔn),帶有地方口音的字母發(fā)音就很容易被識別。
      [0106]其中,所述語音識別模塊32獲取所述文字校準(zhǔn)語音和所述待識別語音的語音特征信息,根據(jù)所述文字校準(zhǔn)語音與所述待識別語音的語音特征信息之間的匹配關(guān)系,識別輸入的待識別語音。
      [0107]其中,所述第一識別子模塊321通過單個字母校準(zhǔn)音拼讀得到新的文字校準(zhǔn)語音或通過組合多個字母校準(zhǔn)語音并按照連讀規(guī)則拼讀得到新的文字校準(zhǔn)語音。
      [0108]其中,所述裝置還可以包括:模糊設(shè)置模塊34。
      [0109]模糊設(shè)置模塊34,用于在字母校準(zhǔn)語音中的設(shè)定字母之間設(shè)置模糊近似關(guān)系??紤]到地方口音會存在一些發(fā)音混淆的發(fā)音,本公開可以在字母校準(zhǔn)語音中的設(shè)定字母之間設(shè)置模糊近似關(guān)系,將可能會存在發(fā)音混淆的發(fā)音關(guān)聯(lián)起來,例如:設(shè)置字母發(fā)音s = sh,c=ch 等。
      [0110]因此,本公開的方案,用戶根據(jù)自己口音情況設(shè)置字母校準(zhǔn)語音,將所有發(fā)音字母自行錄制一遍作為字母校準(zhǔn)語音,替換系統(tǒng)的字母標(biāo)準(zhǔn)語音,再用使用字母校準(zhǔn)語音組成新的文字校準(zhǔn)語音來識別輸入的待識別語音,這樣可以解決有標(biāo)準(zhǔn)發(fā)音字母結(jié)構(gòu)的發(fā)音的口音問題,可以提升語音輸入的識別度。
      [0111]上述裝置中各個單元的功能和作用的實(shí)現(xiàn)過程具體詳見上述方法中對應(yīng)步驟的實(shí)現(xiàn)過程,在此不再贅述。
      [0112]對于裝置實(shí)施例而言,由于其基本對應(yīng)于方法實(shí)施例,所以相關(guān)之處參見方法實(shí)施例的部分說明即可。以上所描述的裝置實(shí)施例僅僅是示意性的,其中作為分離部件說明的單元可以是或者也可以不是物理上分開的,作為單元顯示的部件可以是或者也可以不是物理單元,即可以位于一個地方,或者也可以分布到多個網(wǎng)絡(luò)單元上??梢愿鶕?jù)實(shí)際的需要選擇其中的部分或者全部模塊來實(shí)現(xiàn)本公開方案的目的。本領(lǐng)域普通技術(shù)人員在不付出創(chuàng)造性勞動的情況下,即可以理解并實(shí)施。
      [0113]圖5是本公開根據(jù)一示例性實(shí)施例示出的一種框圖。
      [0114]如圖5所示,包括:處理器501和用于存儲處理器可執(zhí)行指令的存儲器502;
      [0115]其中,處理器501被配置為:
      [0116]獲取輸入的待識別語音;
      [0117]根據(jù)字母校準(zhǔn)語音或文字校準(zhǔn)語音識別所述待識別語音,其中所述字母校準(zhǔn)語音替換系統(tǒng)默認(rèn)字母標(biāo)準(zhǔn)語音。
      [0118]還需說明的是,存儲器502存儲的其他程序,具體參見前面方法流程中的描述,此處不再贅述,處理器501還用于執(zhí)行存儲器502存儲的其他程序。
      [0119]圖6是本公開根據(jù)一示例性實(shí)施例示出的一種設(shè)備的一結(jié)構(gòu)框圖。
      [0120]例如,設(shè)備600可以是移動電話,計(jì)算機(jī),數(shù)字廣播終端,消息收發(fā)設(shè)備,游戲控制臺,平板設(shè)備,醫(yī)療設(shè)備,健身設(shè)備,個人數(shù)字助理等。
      [0121]參照圖6,設(shè)備600可以包括以下一個或多個組件:處理組件602,存儲器604,電源組件606,多媒體組件608,音頻組件610,輸入/輸出(I/O)的接口 612,傳感器組件614,以及通信組件616。
      [0122]處理組件602通??刂圃O(shè)備600的整體操作,諸如與顯示,電話呼叫,數(shù)據(jù)通信,相機(jī)操作和記錄操作相關(guān)聯(lián)的操作。處理組件602可以包括一個或多個處理器620來執(zhí)行指令,以完成上述的方法的全部或部分步驟。此外,處理組件602可以包括一個或多個模塊,便于處理組件602和其他組件之間的交互。例如,處理組件602可以包括多媒體模塊,以方便多媒體組件608和處理組件602之間的交互。
      [0123]存儲器604被配置為存儲各種類型的數(shù)據(jù)以支持在設(shè)備600的操作。這些數(shù)據(jù)的示例包括用于在設(shè)備600上操作的任何應(yīng)用程序或方法的指令,聯(lián)系人數(shù)據(jù),電話簿數(shù)據(jù),消息,圖片,視頻等。存儲器704可以由任何類型的易失性或非易失性存儲設(shè)備或者它們的組合實(shí)現(xiàn),如靜態(tài)隨機(jī)存取存儲器(SRAM),電可擦除可編程只讀存儲器(EEPROM),可擦除可編程只讀存儲器(EPROM),可編程只讀存儲器(PROM),只讀存儲器(ROM),磁存儲器,快閃存儲器,磁盤或光盤。
      [0124]電源組件606為設(shè)備600的各種組件提供電力。電源組件606可以包括電源管理系統(tǒng),一個或多個電源,及其他與為設(shè)備600生成、管理和分配電力相關(guān)聯(lián)的組件。
      [0125]多媒體組件608包括在設(shè)備600和用戶之間的提供一個輸出接口的屏幕。在一些實(shí)施例中,屏幕可以包括液晶顯示器(LCD)和觸摸面板(TP)。如果屏幕包括觸摸面板,屏幕可以被實(shí)現(xiàn)為觸摸屏,以接收來自用戶的輸入信號。觸摸面板包括一個或多個觸摸傳感器以感測觸摸、滑動和觸摸面板上的手勢。觸摸傳感器可以不僅感測觸摸或滑動動作的邊界,而且還檢測與觸摸或滑動操作相關(guān)的持續(xù)時間和壓力。在一些實(shí)施例中,多媒體組件608包括一個前置攝像頭和/或后置攝像頭。當(dāng)設(shè)備600處于操作模式,如拍攝模式或視頻模式時,前置攝像頭和/或后置攝像頭可以接收外部的多媒體數(shù)據(jù)。每個前置攝像頭和后置攝像頭可以是一個固定的光學(xué)透鏡系統(tǒng)或具有焦距和光學(xué)變焦能力。
      [0126]音頻組件610被配置為輸出和/或輸入音頻信號。例如,音頻組件610包括一個麥克風(fēng)(MIC),當(dāng)設(shè)備600處于操作模式,如呼叫模式、記錄模式和語音識別模式時,麥克風(fēng)被配置為接收外部音頻信號。所接收的音頻信號可以被進(jìn)一步存儲在存儲器604或經(jīng)由通信組件616發(fā)送。在一些實(shí)施例中,音頻組件610還包括一個揚(yáng)聲器,用于輸出音頻信號。
      [0127]I/O接口612為處理組件602和外圍接口模塊之間提供接口,上述外圍接口模塊可以是鍵盤,點(diǎn)擊輪,按鈕等。這些按鈕可包括但不限于:主頁按鈕、音量按鈕、啟動按鈕和鎖定按鈕。
      [0128]傳感器組件614包括一個或多個傳感器,用于為設(shè)備600提供各個方面的狀態(tài)評估。例如,傳感器組件614可以檢測到設(shè)備600的打開/關(guān)閉狀態(tài),組件的相對定位,例如組件為設(shè)備600的顯示器和小鍵盤,傳感器組件614還可以檢測設(shè)備600或設(shè)備600—個組件的位置改變,用戶與設(shè)備600接觸的存在或不存在,設(shè)備600方位或加速/減速和設(shè)備600的溫度變化。傳感器組件614可以包括接近傳感器,被配置用來在沒有任何的物理接觸時檢測附近物體的存在。傳感器組件614還可以包括光傳感器,如CMOS或CCD圖像傳感器,用于在成像應(yīng)用中使用。在一些實(shí)施例中,該傳感器組件614還可以包括加速度傳感器,陀螺儀傳感器,磁傳感器,壓力傳感器或溫度傳感器。
      [0129]通信組件616被配置為便于設(shè)備600和其他設(shè)備之間有線或無線方式的通信。設(shè)備600可以接入基于通信標(biāo)準(zhǔn)的無線網(wǎng)絡(luò),如WiFi,2G或3G,或它們的組合。在一個示例性實(shí)施例中,通信組件616經(jīng)由廣播信道接收來自外部廣播管理系統(tǒng)的廣播信號或廣播相關(guān)信息。在一個示例性實(shí)施例中,通信組件616還包括近場通信(NFC)模塊,以促進(jìn)短程通信。例如,在NFC模塊可基于射頻識別(RFID)技術(shù),紅外數(shù)據(jù)協(xié)會(IrDA)技術(shù),超寬帶(UWB)技術(shù),藍(lán)牙(BT)技術(shù)和其他技術(shù)來實(shí)現(xiàn)。
      [0130]在示例性實(shí)施例中,設(shè)備600可以被一個或多個應(yīng)用專用集成電路(ASIC)、數(shù)字信號處理器(DSP)、數(shù)字信號處理設(shè)備(DSPD)、可編程邏輯器件(PLD)、現(xiàn)場可編程門陣列(FPGA)、控制器、微控制器、微處理器或其他電子元件實(shí)現(xiàn),用于執(zhí)行上述方法。
      [0131]在示例性實(shí)施例中,還提供了一種包括指令的非臨時性計(jì)算機(jī)可讀存儲介質(zhì),例如包括指令的存儲器604,上述指令可由設(shè)備600的處理器620執(zhí)行以完成上述方法。例如,非臨時性計(jì)算機(jī)可讀存儲介質(zhì)可以是R0M、隨機(jī)存取存儲器(RAM)、⑶-R0M、磁帶、軟盤和光數(shù)據(jù)存儲設(shè)備等。
      [0132]—種非臨時性計(jì)算機(jī)可讀存儲介質(zhì),當(dāng)存儲介質(zhì)中的指令由終端設(shè)備的處理器執(zhí)行時,使得終端能夠執(zhí)行語音識別方法,方法包括:
      [0133]獲取輸入的待識別語音;
      [0134]根據(jù)字母校準(zhǔn)語音或文字校準(zhǔn)語音識別所述待識別語音,其中所述字母校準(zhǔn)語音替換系統(tǒng)默認(rèn)字母標(biāo)準(zhǔn)語音。
      [0135]本領(lǐng)域技術(shù)人員在考慮說明書及實(shí)踐這里公開的發(fā)明后,將容易想到本公開的其它實(shí)施方案。本公開旨在涵蓋本公開的任何變型、用途或者適應(yīng)性變化,這些變型、用途或者適應(yīng)性變化遵循本公開的一般性原理并包括本公開未公開的本技術(shù)領(lǐng)域中的公知常識或慣用技術(shù)手段。說明書和實(shí)施例僅被視為示例性的,本公開的真正范圍和精神由下面的權(quán)利要求指出。
      [0136]應(yīng)當(dāng)理解的是,本公開并不局限于上面已經(jīng)描述并在附圖中示出的精確結(jié)構(gòu),并且可以在不脫離其范圍進(jìn)行各種修改和改變。本公開的范圍僅由所附的權(quán)利要求來限制。
      【主權(quán)項(xiàng)】
      1.一種語音識別方法,其特征在于,包括: 獲取輸入的待識別語音; 根據(jù)字母校準(zhǔn)語音或文字校準(zhǔn)語音識別所述待識別語音,其中所述字母校準(zhǔn)語音替換系統(tǒng)默認(rèn)字母標(biāo)準(zhǔn)語音。2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述根據(jù)文字校準(zhǔn)語音識別所述待識別語首,包括: 使用所述字母校準(zhǔn)語音組成新的文字校準(zhǔn)語音; 根據(jù)所述文字校準(zhǔn)語音識別所述輸入的待識別語音。3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述根據(jù)文字校準(zhǔn)語音識別所述待識別語音,包括: 獲取存儲的文字校準(zhǔn)語音,其中所述存儲的文字校準(zhǔn)語音是根據(jù)所述字母校準(zhǔn)語音識別出歷史待識別語音后,由識別出的語音組成的新的文字校準(zhǔn)語音; 根據(jù)所述獲取的文字校準(zhǔn)語音識別所述輸入的待識別語音。4.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述字母校準(zhǔn)語音替換系統(tǒng)默認(rèn)字母標(biāo)準(zhǔn)語音包括: 通過錄制字母表所有字母的發(fā)音采集字母校準(zhǔn)語音; 將所述采集的字母標(biāo)準(zhǔn)語音替換系統(tǒng)默認(rèn)字母標(biāo)準(zhǔn)語音。5.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述根據(jù)所述文字校準(zhǔn)語音識別輸入的待識別語音,包括: 獲取所述文字校準(zhǔn)語音和所述待識別語音的語音特征信息; 根據(jù)所述文字校準(zhǔn)語音與所述待識別語音的語音特征信息之間的匹配關(guān)系,識別輸入的待識別語首。6.根據(jù)權(quán)利要求5所述的方法,其特征在于,所述語音特征信息可包括下述一項(xiàng)或多項(xiàng):語音的音色、音高、音長和音強(qiáng)。7.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述使用所述字母校準(zhǔn)語音組成新的文字校準(zhǔn)語音包括: 通過單個字母校準(zhǔn)音拼讀得到新的文字校準(zhǔn)語音;或, 通過組合多個字母校準(zhǔn)語音并按照連讀規(guī)則拼讀得到新的文字校準(zhǔn)語音。8.根據(jù)權(quán)利要求1至7任一項(xiàng)所述的方法,其特征在于: 所述字母校準(zhǔn)語音中的設(shè)定字母之間設(shè)置模糊近似關(guān)系。9.一種語音識別裝置,其特征在于,包括: 獲取模塊,用于獲取輸入的待識別語音; 語音識別模塊,用于根據(jù)字母校準(zhǔn)語音或文字校準(zhǔn)語音識別所述獲取模塊的待識別語音,其中所述字母校準(zhǔn)語音替換系統(tǒng)默認(rèn)字母標(biāo)準(zhǔn)語音。10.根據(jù)權(quán)利要求9所述的語音識別裝置,其特征在于,所述語音識別模塊包括: 第一識別子模塊,用于使用所述字母校準(zhǔn)語音組成新的文字校準(zhǔn)語音,根據(jù)所述文字校準(zhǔn)語音識別所述輸入的待識別語音;或者, 第二識別子模塊,用于獲取存儲的文字校準(zhǔn)語音,其中所述存儲的文字校準(zhǔn)語音是根據(jù)所述字母校準(zhǔn)語音識別出歷史待識別語音后,由識別出的語音組成的新的文字校準(zhǔn)語音,根據(jù)所述獲取的文字校準(zhǔn)語音識別所述輸入的待識別語音。11.根據(jù)權(quán)利要求9所述的裝置,其特征在于,還包括: 字母語音替換模塊,用于通過錄制字母表所有字母的發(fā)音采集字母校準(zhǔn)語音,將所述采集的字母標(biāo)準(zhǔn)語音替換系統(tǒng)默認(rèn)字母標(biāo)準(zhǔn)語音。12.根據(jù)權(quán)利要求9所述的裝置,其特征在于: 所述語音識別模塊獲取所述文字校準(zhǔn)語音和所述待識別語音的語音特征信息,根據(jù)所述文字校準(zhǔn)語音與所述待識別語音的語音特征信息之間的匹配關(guān)系,識別輸入的待識別語■~>V.曰O13.根據(jù)權(quán)利要求10所述的裝置,其特征在于: 所述第一識別子模塊通過單個字母校準(zhǔn)音拼讀得到新的文字校準(zhǔn)語音或通過組合多個字母校準(zhǔn)語音并按照連讀規(guī)則拼讀得到新的文字校準(zhǔn)語音。14.根據(jù)權(quán)利要求9至13任一項(xiàng)所述的裝置,其特征在于,所述裝置還包括: 模糊設(shè)置模塊,用于在所述字母校準(zhǔn)語音中的設(shè)定字母之間設(shè)置模糊近似關(guān)系。15.一種移動終端,其特征在于,包括: 處理器和用于存儲處理器可執(zhí)行指令的存儲器; 其中,所述處理器被配置為: 獲取輸入的待識別語音; 根據(jù)字母校準(zhǔn)語音或文字校準(zhǔn)語音識別所述待識別語音,其中所述字母校準(zhǔn)語音替換系統(tǒng)默認(rèn)字母標(biāo)準(zhǔn)語音。
      【文檔編號】G10L15/02GK105913841SQ201610509372
      【公開日】2016年8月31日
      【申請日】2016年6月30日
      【發(fā)明人】伍亮雄, 劉鳴, 王樂
      【申請人】北京小米移動軟件有限公司
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
      1