三子集合和第四子集合,規(guī)范文本集的特征量優(yōu)選同時包括規(guī)范化的特征詞和規(guī)范化的句式結構。
[0043]第一映射關系,優(yōu)選可以通過關系列表的形式進行體現(xiàn)。具體的第一映射關系中,存儲有口語文本集和規(guī)范文本集中各特征量對應的語音文本為口語文本的概率。
[0044]這里需要說明的是,由于口語文本中也可能出現(xiàn)規(guī)范的特征詞和句式結構,因此,本實施例中,口語文本集和規(guī)范文本集中的特征量可能有重疊的部分。
[0045]進一步的,在獲取用戶輸入的語音文本后,可以通過分詞等方法獲取語音文本的特征量(特征詞和/或句式結構),并于獲得語音文本的特征量后,從第一映射關系中查找各特征量對應的語音文本為口語文本的概率,并根據(jù)各特征量對應的概率,計算該語音文本為口語文本的復合概率,通過將計算獲得的復合概率與預設的閾值進行對比,判斷該語音文本是否是口語文本。例如,口語文本的判斷方法可以是:若判斷復合概率大于預設的閾值,則確定語音文本為口語文本,否則為規(guī)范文本。
[0046]舉例來說,假設用戶輸入的語音文本為“看個電影吧劉德華演的”,則對該語音文本進行分詞處理后的結果為“看個/電影/吧/劉德華/演的”。進一步的,在分詞處理后可以根據(jù)分詞處理的結果獲取語音文本的特征量,該特征量可以包括特征詞和/或句式結構,就此例來說,特征量可以包括特征詞“看個”、“電影”、“吧”、“劉德華”、“演的”,和/或句式結構“倒裝”。在獲得特征量后,根據(jù)第一映射關系查找每個特征量對應的概率,并將各特征量對應的概率輸入預設的復合概率計算公式中,以對語音文本為口語文本的復合概率進行計算。在獲得所述復合概率后,將所述復合概率與預設的閾值進行對比,若所述復合概率大于預設閾值,則確定語音文本為口語文本,否則為規(guī)范文本,本舉例經(jīng)過上述處理后,語音文本“看個電影吧劉德華演的”應識別為口語文本。
[0047]這里需要說明的是,本實施例中計算復合概率所采用的方法可以是本領域中任意一種復合概率的計算方法,也可以是任意幾種方法的組合。
[0048]示例的,采用公式:
[0049]P(A| ti,t2,t3......tn) = (Pi*P2*......Pn)/[Pi*P2*......Pn+(1-Pi)*(1_
P2)*......(1-Pn)]對復合概率進行計算。其中,P(A I ,t2,t3......tn)為語音文本為口語文本的復合概率,...tn為對應語音文本的η個特征量,P^P2,...?~分別為以〖1,七2,...^為參考時,對應所述語音文本為口語文本的概率。當然,此處僅是舉例說明,并不代表本發(fā)明的復合概率計算公式局限于此。
[0050]具體的,在步驟S102中,若判斷到用戶輸入的語音文本為規(guī)范文本,則直接跳轉到步驟S104執(zhí)行,若判斷到用戶輸入的語音文本為口語化文本,則跳轉到步驟S103執(zhí)行。
[0051]步驟S103、若所述語音文本為口語文本,則對所述語音文本進行歸一化和標準化處理,生成規(guī)范化的語音文本。
[0052]在判斷用戶輸入的語音文本為口語文本后,可以根據(jù)預先設定的語氣詞庫,去除語音文本中口語化的語氣詞,從而消除語音文本識別過程中口語化語氣詞所造成的影響。
[0053]進一步的,在去除口語化語氣詞后,可以通過歸一化的處理方法,將語音文本中口語化的特征詞,轉化為規(guī)范化的特證詞,并通過標準化的處理方法將語音文本的句式結構轉化為規(guī)范化的句式結構。
[0054]具體的,在進行歸一化處理的過程中,可以采用諸如同義詞替換等方法將口語化的特征詞轉化為規(guī)范化的特征詞。比如,可以通過設置對應關系列表的方式,實現(xiàn)歸一化的處理。即可以根據(jù)相同語義的口語化特征詞和規(guī)范化特征詞之間的對應關系,建立口語化特征詞和規(guī)范化特征詞之間的對應關系列表。當判斷語音文本為口語文本時,可以通過查找該對應關系列表,獲取與對應口語化特征詞對應的規(guī)范化特征詞,從而利用規(guī)范化的特征詞代替口語化的特征詞,實現(xiàn)歸一化處理。
[0055]進一步的,在對語音文本進行特征詞獲取的同時,還可以對語音文本的句式結構進行獲取。與歸一化處理類似的,同樣可以通過建立對應關系的方式,實現(xiàn)口語化句式的標準化處理。即可以根據(jù)每個口語化句式結構的特點,以及每個口語化句式結構與標準化句式結構的差別,建立口語化句式結構與句式轉換方法的對應關系,從而在確定語音文本為口語文本后,即可以根據(jù)語音文本的句式結構查找對應的句式轉換方法,從而達到將口語化句式結構轉化為標準化句式結構的目的。
[0056]舉例來說,假設用戶輸入的語音文本為“看個電影吧劉德華演的”,則對該語音文本進行分詞處理后的結果為“看個/電影/吧/劉德華/演的”,進一步的,在判斷該語音文本為口語文本后,通過將口語化的語氣詞“吧”去掉,并將口語化特征詞“看個”歸一化為“搜索”,將顛倒的語句結構糾正為“劉德華演的電影”,從而生成規(guī)范化的語音文本“搜索劉德華演的電影”。
[0057]步驟S104、對所述規(guī)范化的語音文本,進行語義解析。
[0058]具體的,首先對該規(guī)范化的語音文本進行語義解析,根據(jù)語義解析進行相關業(yè)務的定位。示例的,用戶輸入的是規(guī)范化語音文本“播放電影一個人的江湖”,進行語義解析后,獲取到用戶的目的是想要播放電影《一個人的江湖》,進而根據(jù)用戶的目的生成相應的控制指令:播放電影《一個人的江湖》,進而根據(jù)該控制指令執(zhí)行播放《一個人的江湖》。示例的,用戶輸入的是口語化語音文本“看個電影吧劉德華演的”,對其進行標準化和歸一化處理之后,生成規(guī)范化的語音文本“搜索劉德華演的電影”,進而對語音文本“搜索劉德華演的電影”進行語義解析,獲取到用戶的目的是搜索演員劉德華主演的電影,進而根據(jù)用戶的目的生成相應的搜索指令:搜索演員劉德華主演的影視資源,進而根據(jù)該搜索指令進行相關的網(wǎng)絡搜索。
[0059]步驟S104的執(zhí)行方法與現(xiàn)有的規(guī)范語音文本的語義解析和業(yè)務定位方法相同,在此不再贅述。
[0060]本實施例通過預先建立的語音文本識別模型對口語文本進行識別,若輸入的語音文本為口語文本,則通過歸一化和標準化的處理方法,將口語文本轉化為規(guī)范化的語音文本,從而根據(jù)規(guī)范化語音文本的解析方法和業(yè)務定位方法對轉化后的口語文本進行語義解析和業(yè)務定位,解決了現(xiàn)有技術無法識別口語文本的問題,提高了用戶的使用體驗。
[0061]圖2為本發(fā)明實施例二提供的基于口語化的語音識別方法的流程示意圖,如圖2所示,本實施例在圖1所示方法的基礎上包括如下步驟:
[0062]步驟S201、采集口語文本和規(guī)范文本,建立口語文本集和規(guī)范文本集。
[0063]具體的,口語文本和規(guī)范文本的采集渠道可以有多種,本實施例優(yōu)選的采集渠道有用戶的歷史數(shù)據(jù)、標注數(shù)據(jù),以及網(wǎng)絡數(shù)據(jù),其中,標注數(shù)據(jù)是指,用戶利用文字對事物或事件進行標注、解釋、說明的文字數(shù)據(jù)。
[0064]通過對用戶的歷史數(shù)據(jù)、標注數(shù)據(jù),以及網(wǎng)絡數(shù)據(jù)進行采集,可以在滿足樣本數(shù)量、實現(xiàn)統(tǒng)計分析目的的同時,還能達到充分利用用戶的歷史數(shù)據(jù)的目的,使得采集獲得的口語文本集和規(guī)范文本集更加符合用戶的使用習慣,從而間接提高了口語文本識別的準確性。
[0065]步驟S202、根據(jù)所述口語文本集和所述規(guī)范文本集,建立所述第一映射關系。
[0066]圖3為本發(fā)明實施例二中第一映射關系的建立方法的流程示意圖,如圖3所示,第一映射關系的建立方法包括:
[0067]步驟S2021、根據(jù)所述口語文本集,確定所述口語文本集中每個特征量出現(xiàn)的概率,并根據(jù)所述規(guī)范文本集,確定所述規(guī)范文本集中每個特征量出現(xiàn)的概率。
[0068]具體的,本實施例中可以采用決策樹、貝葉斯算法、人工網(wǎng)絡以及深度學習算法中的任意一種或者幾種結合的方式對口語文本集或規(guī)范文本集中每個特征量出現(xiàn)的概率進行計算。
[0069]以貝葉斯算法為例,在采集獲得口語文本集和規(guī)范文本集后,可以從口語文本集中提取口語說法中的口語特征詞和口語語句結構,從規(guī)范文本集中提取規(guī)范說法中的規(guī)范特征詞和規(guī)范語句結構。在獲得口語特征詞和口語語句結構,以及規(guī)范特征詞和規(guī)范語句結構后,分別統(tǒng)計各口語特征詞和各口語語句結構在口語文本集中出現(xiàn)的次數(shù),以及各規(guī)范特征詞和各規(guī)范語句結構在規(guī)范文本集中出現(xiàn)的次數(shù)。
[0070]進一步的,建立兩個哈希表,將口語文本集的特征量(口語特征詞或口語語句結構),以及各特征量對應的出現(xiàn)次數(shù)放在一個哈希表中,并將規(guī)范文本集的特征量(規(guī)范特征詞或規(guī)范語句