多語(yǔ)音識(shí)別模型切換方法及裝置的制造方法
【專利摘要】本發(fā)明實(shí)施例公開了一種多語(yǔ)音識(shí)別模型切換方法及裝置,所述方法包括:獲取用戶輸入語(yǔ)音中的至少一條語(yǔ)音信息;對(duì)所述語(yǔ)音信息進(jìn)行識(shí)別和語(yǔ)言類別的匹配,以根據(jù)匹配度確定對(duì)應(yīng)的目標(biāo)語(yǔ)言類別;將當(dāng)前使用的語(yǔ)音識(shí)別模型切換至與目標(biāo)語(yǔ)言類別對(duì)應(yīng)的語(yǔ)音識(shí)別模型。本發(fā)明實(shí)施例通過對(duì)獲取的語(yǔ)音信息進(jìn)行識(shí)別和語(yǔ)言類別的匹配,以根據(jù)匹配度確定對(duì)應(yīng)的目標(biāo)語(yǔ)言類別;將當(dāng)前使用的語(yǔ)音識(shí)別模型切換至與目標(biāo)語(yǔ)言類別對(duì)應(yīng)的語(yǔ)音識(shí)別模型,能夠?qū)崿F(xiàn)不同語(yǔ)言間的語(yǔ)音識(shí)別模型的自動(dòng)切換,不僅提高語(yǔ)音識(shí)別模型切換效率,而且使語(yǔ)音識(shí)別更加智能化。
【專利說明】
多語(yǔ)音識(shí)別模型切換方法及裝置
技術(shù)領(lǐng)域
[0001] 本發(fā)明實(shí)施例設(shè)及語(yǔ)音識(shí)別技術(shù)領(lǐng)域,尤其設(shè)及一種多語(yǔ)音識(shí)別模型切換方法及 裝置。
【背景技術(shù)】
[0002] 隨著科學(xué)技術(shù)的發(fā)展,語(yǔ)音輸入技術(shù)由于其使用起來(lái)受場(chǎng)景的限制較少,且相對(duì) 于手寫輸入更加快捷方便,因此逐漸得到普遍使用。例如,現(xiàn)有的捜索引擎都加入了語(yǔ)音捜 索功能。
[0003] 目前雖然普通話已經(jīng)成為了國(guó)人的主要交流語(yǔ)言,但是就局部地區(qū)而言,當(dāng)?shù)氐?方言的交流仍然有很大的需求?,F(xiàn)有的語(yǔ)音識(shí)別引擎僅僅支持特定的語(yǔ)言,對(duì)于該語(yǔ)言W 外的語(yǔ)音識(shí)別性能基本無(wú)法使用,因此用戶在使用前一般需要提前選定特定語(yǔ)言的語(yǔ)音識(shí) 別引擎。
[0004] 然而一旦用戶需要進(jìn)行語(yǔ)言切換,則需要進(jìn)入語(yǔ)音識(shí)別引擎設(shè)置界面,手動(dòng)切換 成使用的方言,才能進(jìn)行語(yǔ)音識(shí)別。顯然,運(yùn)種語(yǔ)言切換方式效率比較低下,不夠智能化。
【發(fā)明內(nèi)容】
[0005] 本發(fā)明實(shí)施例提供一種多語(yǔ)音識(shí)別模型切換方法及裝置,W實(shí)現(xiàn)不同語(yǔ)言間的語(yǔ) 音識(shí)別模型的自動(dòng)切換,提高語(yǔ)音識(shí)別模型切換效率,使語(yǔ)音識(shí)別更加智能化。
[0006] 第一方面,本發(fā)明實(shí)施例提供了一種多語(yǔ)音識(shí)別模型切換方法,包括:
[0007] 獲取用戶輸入語(yǔ)音中的至少一條語(yǔ)音信息;
[000引對(duì)所述語(yǔ)音信息進(jìn)行識(shí)別和語(yǔ)言類別的匹配,W根據(jù)匹配度確定對(duì)應(yīng)的目標(biāo)語(yǔ)言 類別;
[0009] 將當(dāng)前使用的語(yǔ)音識(shí)別模型切換至與目標(biāo)語(yǔ)言類別對(duì)應(yīng)的語(yǔ)音識(shí)別模型。
[0010] 第二方面,本發(fā)明實(shí)施例還提供了一種多語(yǔ)音識(shí)別切換裝置,包括:
[0011] 語(yǔ)音獲取模塊,用于獲取用戶輸入語(yǔ)音中的至少一條語(yǔ)音信息;
[0012] 語(yǔ)言識(shí)別模塊,用于對(duì)所述語(yǔ)音信息進(jìn)行識(shí)別和語(yǔ)言類別的匹配,W根據(jù)匹配度 確定對(duì)應(yīng)的目標(biāo)語(yǔ)言類別;
[0013] 模型切換模塊,用于將當(dāng)前使用的語(yǔ)音識(shí)別模型切換至與目標(biāo)語(yǔ)言類別對(duì)應(yīng)的語(yǔ) 音識(shí)別模型。
[0014] 本發(fā)明實(shí)施例通過對(duì)獲取的語(yǔ)音信息進(jìn)行識(shí)別和語(yǔ)言類別的匹配,W根據(jù)匹配度 確定對(duì)應(yīng)的目標(biāo)語(yǔ)言類別;將當(dāng)前使用的語(yǔ)音識(shí)別模型切換至與目標(biāo)語(yǔ)言類別對(duì)應(yīng)的語(yǔ)音 識(shí)別模型,能夠?qū)崿F(xiàn)不同語(yǔ)言間的語(yǔ)音識(shí)別模型的自動(dòng)切換,不僅提高語(yǔ)音識(shí)別模型切換 效率,而且使語(yǔ)音識(shí)別更加智能化。
【附圖說明】
[0015] 圖1是本發(fā)明實(shí)施例一中的一種多語(yǔ)音識(shí)別模型切換方法的流程圖;
[0016] 圖2是本發(fā)明實(shí)施例二中的一種多語(yǔ)音識(shí)別模型切換方法的流程圖;
[0017] 圖3是本發(fā)明實(shí)施例=中的一種多語(yǔ)音識(shí)別模型切換方法的流程圖;
[0018] 圖4是本發(fā)明實(shí)施例四中的一種多語(yǔ)音識(shí)別模型切換方法的流程圖;
[0019] 圖5是本發(fā)明實(shí)施例五中的一種多語(yǔ)音識(shí)別切換裝置的結(jié)構(gòu)圖。
【具體實(shí)施方式】
[0020] 下面結(jié)合附圖和實(shí)施例對(duì)本發(fā)明作進(jìn)一步的詳細(xì)說明。可W理解的是,此處所描 述的具體實(shí)施例僅僅用于解釋本發(fā)明,而非對(duì)本發(fā)明的限定。另外還需要說明的是,為了便 于描述,附圖中僅示出了與本發(fā)明相關(guān)的部分而非全部結(jié)構(gòu)。
[0021 ]實(shí)施例一
[0022] 圖1為本發(fā)明實(shí)施例一提供的一種多語(yǔ)音識(shí)別模型切換方法的流程圖,本實(shí)施例 可適用于在多個(gè)語(yǔ)音識(shí)別模型下進(jìn)行切換的情況,該方法可W由本發(fā)明實(shí)施例提供的多語(yǔ) 音識(shí)別切換裝置來(lái)執(zhí)行,該裝置可集成于移動(dòng)終端、固定終端或服務(wù)器中,如圖1所示,具體 包括:
[0023] S101、獲取用戶輸入語(yǔ)音中的至少一條語(yǔ)音信息。
[0024] 其中,所述語(yǔ)音信息可W為截取的輸入語(yǔ)音中的部分語(yǔ)音信息,也可W為用戶一 條完整的語(yǔ)音信息。所述語(yǔ)音信息中可包含一條或多條語(yǔ)音語(yǔ)句。
[0025] 具體的,可通過終端的麥克風(fēng)來(lái)采集語(yǔ)音。例如,在語(yǔ)音輸入界面提供語(yǔ)音輸入按 鈕,當(dāng)用戶啟動(dòng)該按鈕時(shí),即可采集用戶的語(yǔ)音信息。
[0026] S102、對(duì)所述語(yǔ)音信息進(jìn)行識(shí)別和語(yǔ)言類別的匹配,W根據(jù)匹配度確定對(duì)應(yīng)的目 標(biāo)語(yǔ)言類別。
[0027] 其中,所述語(yǔ)言類別包含但不限于語(yǔ)種類別和方言類別。其中,所述語(yǔ)種類別包含 各國(guó)的語(yǔ)種,例如包括漢語(yǔ)、英語(yǔ)、俄語(yǔ)、法語(yǔ)、德語(yǔ)等等,所述方言類別包含但不限于各國(guó) 的方言,W中國(guó)為例,例如包括山東方言、東北方言、北京方言、陜西方言、廣東方言等等。
[0028] 具體的,可預(yù)先采集用戶使用各語(yǔ)言類別輸入的語(yǔ)音信息,通過分類算法訓(xùn)練得 到語(yǔ)音識(shí)別模型,所述語(yǔ)音識(shí)別模型中包含各語(yǔ)言類別輸入的語(yǔ)音。在使用語(yǔ)音識(shí)別模型 對(duì)待分類的語(yǔ)音信息進(jìn)行識(shí)別時(shí),再次采用分類算法對(duì)待分類的語(yǔ)音信息進(jìn)行分類處理, 如果該待分類的語(yǔ)音信息被歸類到山東方言,則將山東方言作為與該語(yǔ)音信息匹配的方 言。
[0029] S103、將當(dāng)前使用的語(yǔ)音識(shí)別模型切換至與目標(biāo)語(yǔ)言類別對(duì)應(yīng)的語(yǔ)音識(shí)別模型。
[0030] 當(dāng)確定了與所述語(yǔ)音信息匹配的目標(biāo)語(yǔ)言類別之后,則將當(dāng)前使用的語(yǔ)音識(shí)別模 型切換至與目標(biāo)語(yǔ)言類別對(duì)應(yīng)的語(yǔ)音識(shí)別模型,使用該對(duì)應(yīng)的語(yǔ)音識(shí)別模型對(duì)用戶后續(xù)的 語(yǔ)音輸入進(jìn)行識(shí)別。
[0031] 當(dāng)與所述語(yǔ)音信息匹配的目標(biāo)語(yǔ)言類別有多個(gè)時(shí),例如除了被歸類到山東方言之 夕h還被歸類到了河南方言,此時(shí)根據(jù)匹配度確定目標(biāo)語(yǔ)言類別,例如,將與所述語(yǔ)音信息 匹配度最高的語(yǔ)言類別作為目標(biāo)語(yǔ)言類別。或者,將與所述匹配度超過預(yù)設(shè)闊值的語(yǔ)言類 別作為目標(biāo)語(yǔ)言類別。
[0032] 本實(shí)施例通過對(duì)獲取的語(yǔ)音信息進(jìn)行識(shí)別和語(yǔ)言類別的匹配,W根據(jù)匹配度確定 對(duì)應(yīng)的目標(biāo)語(yǔ)言類別;將當(dāng)前使用的語(yǔ)音識(shí)別模型切換至與目標(biāo)語(yǔ)言類別對(duì)應(yīng)的語(yǔ)音識(shí)別 模型,能夠?qū)崿F(xiàn)不同語(yǔ)言間的語(yǔ)音識(shí)別模型的自動(dòng)切換,不僅提高語(yǔ)音識(shí)別模型切換效率, 而且使語(yǔ)音識(shí)別更加智能化。
[0033] 在上述實(shí)施例的基礎(chǔ)上,對(duì)所述語(yǔ)音信息進(jìn)行識(shí)別和語(yǔ)言類別的匹配,W根據(jù)匹 配度確定對(duì)應(yīng)的目標(biāo)語(yǔ)言類別,包括:
[0034] 對(duì)所述語(yǔ)音信息基于至少兩種語(yǔ)言類別的特征進(jìn)行識(shí)別,并得到所述語(yǔ)音信息與 各個(gè)語(yǔ)言類別的相似程度,將所述相似程度作為語(yǔ)言類別的匹配度。
[0035] 其中,可通過W下任意一種方法獲得所述語(yǔ)音信息與各個(gè)語(yǔ)言類別的相似程度: 對(duì)所述語(yǔ)音信息基于至少兩種為各語(yǔ)言類別的特征進(jìn)行識(shí)別并得到所述語(yǔ)音信息為各語(yǔ) 言類別的置信度,將置信度作為語(yǔ)言類別的相似度;或?qū)λ稣Z(yǔ)音信息基于至少兩種為各 語(yǔ)言類別的特征進(jìn)行識(shí)別并得到所述語(yǔ)音信息為各語(yǔ)言類別語(yǔ)言得分,將語(yǔ)音得分作為語(yǔ) 言類別的相似度;或?qū)λ稣Z(yǔ)音信息基于至少兩種為各語(yǔ)言類別的特征進(jìn)行識(shí)別并得到所 述語(yǔ)音信息為各語(yǔ)言類別的概率,將概率作為語(yǔ)言類別的相似度。
[0036] 其中,所述語(yǔ)言得分可采用的現(xiàn)有的語(yǔ)音測(cè)試模型打分得到,所述概率可根據(jù)語(yǔ) 言得分采用概率轉(zhuǎn)換公式轉(zhuǎn)換得到,所述置信度為概率區(qū)間。
[0037] 在上述實(shí)施例的基礎(chǔ)上,當(dāng)僅根據(jù)一條語(yǔ)音語(yǔ)句不能足W判斷出對(duì)應(yīng)的目標(biāo)語(yǔ)言 類別時(shí),為進(jìn)一步提高識(shí)別準(zhǔn)確率,對(duì)所述語(yǔ)音信息進(jìn)行識(shí)別和語(yǔ)言類別的匹配,W根據(jù)匹 配度確定對(duì)應(yīng)的目標(biāo)語(yǔ)言類別,包括:
[0038] 對(duì)所述語(yǔ)音信息包含的至少兩條語(yǔ)音語(yǔ)句進(jìn)行識(shí)別,得到各條語(yǔ)音語(yǔ)句與語(yǔ)言類 別的匹配度;
[0039] 根據(jù)所述匹配度確定初始語(yǔ)言類別,根據(jù)各條語(yǔ)音語(yǔ)句與初始語(yǔ)言類別的匹配度 確定對(duì)應(yīng)的目標(biāo)語(yǔ)言類別。
[0040] 其中,所述至少兩條語(yǔ)音語(yǔ)句按照時(shí)序依次獲取,如果根據(jù)第一條語(yǔ)音語(yǔ)句不能 判斷出對(duì)應(yīng)的目標(biāo)語(yǔ)言類別,則獲取第二條語(yǔ)音語(yǔ)句,依次類推,直至能夠判處對(duì)應(yīng)的目標(biāo) 語(yǔ)言類別為止。如果根據(jù)第一條語(yǔ)音語(yǔ)句能夠判斷出對(duì)應(yīng)的目標(biāo)語(yǔ)言類別,則無(wú)需獲取第 二條語(yǔ)音語(yǔ)句。
[0041] 具體的,首先獲取第一條語(yǔ)音語(yǔ)句,通過對(duì)所述第一條語(yǔ)音語(yǔ)句進(jìn)行識(shí)別,得到第 一條語(yǔ)音語(yǔ)句與語(yǔ)言類別的匹配度,如果該匹配度超過預(yù)設(shè)匹配度,則將該第一條語(yǔ)音語(yǔ) 句對(duì)應(yīng)的語(yǔ)言類別作為目標(biāo)語(yǔ)言類別。如果該匹配度未超過預(yù)設(shè)匹配度,則提示用戶是否 手動(dòng)切換語(yǔ)音識(shí)別模型,和/或,獲取第二條語(yǔ)音語(yǔ)句,通過對(duì)所述第二條語(yǔ)音語(yǔ)句進(jìn)行識(shí) 另IJ,得到第二條語(yǔ)音語(yǔ)句與語(yǔ)言類別的匹配度,依次類推,直至得到滿足預(yù)設(shè)條件的目標(biāo)語(yǔ) 言類別。
[0042] 另外,一條語(yǔ)音語(yǔ)句可能對(duì)應(yīng)多個(gè)語(yǔ)言類別,如下表一所示,可根據(jù)該條語(yǔ)音語(yǔ)句 相對(duì)于各個(gè)語(yǔ)言類別的匹配度,將匹配最高的語(yǔ)言類別作為初始語(yǔ)言類別。例如,如表一所 示,由于山東方言相對(duì)于河南方言和安徽方言概率較高,因此將山東方言作為語(yǔ)音語(yǔ)句1的 初始語(yǔ)言類別。
[0043] 例如,對(duì)于語(yǔ)音語(yǔ)句1,如果經(jīng)過識(shí)別得到為山東方言的概率為0.99,由于該0.99 超過預(yù)設(shè)闊值(例如,0.95),則確定該語(yǔ)音信息對(duì)應(yīng)的目標(biāo)語(yǔ)言類別為山東方言。如果經(jīng)過 識(shí)別得到為山東方言的概率為0.93,則提示用戶是否手動(dòng)切換語(yǔ)音識(shí)別模型,或者獲取第 二條語(yǔ)音語(yǔ)句即語(yǔ)音語(yǔ)句2,如果經(jīng)過識(shí)別得到仍然為山東方言,且對(duì)應(yīng)的概率為0.95,貝。 確定該語(yǔ)音信息對(duì)應(yīng)的目標(biāo)語(yǔ)言類別為山東方言。
[0044] 在上述實(shí)施例的基礎(chǔ)上,根據(jù)各條語(yǔ)音語(yǔ)句與初始語(yǔ)言類別的匹配度確定對(duì)應(yīng)的 目標(biāo)語(yǔ)言類別,包括:
[0045] 計(jì)算將各條語(yǔ)音語(yǔ)句不是初始語(yǔ)言類別的概率的乘積,根據(jù)所述乘積確定對(duì)應(yīng)的 目標(biāo)語(yǔ)言類別。
[0046] 具體的,計(jì)算將各條語(yǔ)音語(yǔ)句不是初始語(yǔ)言類別的概率的乘積,如果概率的乘積 小于預(yù)設(shè)闊值,則確定初始語(yǔ)言類別為對(duì)應(yīng)的目標(biāo)語(yǔ)言類別。
[0047] 例如,如果所述語(yǔ)音信息包含=條語(yǔ)音語(yǔ)句,為便于描述分別記為語(yǔ)音語(yǔ)句1、語(yǔ) 音語(yǔ)句2和語(yǔ)音語(yǔ)句3,通過對(duì)上述=條語(yǔ)音語(yǔ)句的識(shí)別,假設(shè)得到各條語(yǔ)音語(yǔ)句與語(yǔ)言類 別的匹配度結(jié)果如下表一所示:
[004引 表一
[0049]
[0050] 根據(jù)各方言對(duì)應(yīng)的概率大小,可初步確定語(yǔ)音語(yǔ)句1、語(yǔ)音語(yǔ)句2和語(yǔ)音語(yǔ)句3對(duì)應(yīng) 的方言均為山東方言,由于各條語(yǔ)音語(yǔ)句對(duì)應(yīng)為山東方言的概率均未超過預(yù)設(shè)闊值0.99, 則進(jìn)一步計(jì)算不是山東方言的概率,結(jié)果如表二所示,
[0051] 根據(jù)此概率進(jìn)一步確定該語(yǔ)音信息是否為山東方言。表二
[0化2]
[0053] 則通過計(jì)算,連續(xù)兩次不是山東話的概率為0.017,大于預(yù)設(shè)闊值(例如0.005),不 進(jìn)行切換,繼續(xù)進(jìn)行判別;連續(xù)=次不是山東話的概率為0.00255,該切換錯(cuò)誤的概率小于 預(yù)設(shè)闊值,則W高置信度確定該語(yǔ)音信息為山東方言,進(jìn)行切換。
[0054] 在上述實(shí)施例的基礎(chǔ)上,對(duì)所述語(yǔ)音信息進(jìn)行識(shí)別和語(yǔ)言類別的匹配,W根據(jù)匹 配度確定對(duì)應(yīng)的目標(biāo)語(yǔ)言類別之前,還包括:
[0055] 對(duì)所述語(yǔ)音信息進(jìn)行W下任意一項(xiàng)預(yù)處理:語(yǔ)音特征提取、有效語(yǔ)音檢測(cè)、語(yǔ)音矢 量表示和模型打分測(cè)試。
[0056] 在上述實(shí)施例的基礎(chǔ)上,為方便用戶操作,提高識(shí)別率,所述方法還包括:
[0057] 對(duì)所述語(yǔ)音信息進(jìn)行識(shí)別,若識(shí)別結(jié)果不符合預(yù)設(shè)條件,則顯示提示消息,W提示 用戶進(jìn)行手動(dòng)切換。
[005引其中,所述預(yù)設(shè)條件為與所述語(yǔ)音信息匹配的語(yǔ)音類別的匹配度超過預(yù)設(shè)闊值, 所述匹配度可通過語(yǔ)言得分、概率和置信度進(jìn)行衡量。
[0059] 在上述實(shí)施例的基礎(chǔ)上,為進(jìn)一步提高識(shí)別準(zhǔn)確率,對(duì)所述語(yǔ)音信息進(jìn)行識(shí)別和 語(yǔ)言類別的匹配,W根據(jù)匹配度確定對(duì)應(yīng)的目標(biāo)語(yǔ)言類別,包括:
[0060] 對(duì)所述語(yǔ)音信息進(jìn)行識(shí)別和語(yǔ)言類別的匹配;
[0061 ]確定匹配度符合預(yù)設(shè)條件的至少兩種備選語(yǔ)言類別;
[0062] 查詢用戶歷史語(yǔ)音識(shí)別記錄確定用戶歷史使用的語(yǔ)言類別;
[0063] 從至少兩個(gè)所述備選語(yǔ)言類別中選取與用戶歷史使用的語(yǔ)言類別一致的語(yǔ)言類 別作為目標(biāo)語(yǔ)言類別。
[0064] 例如,如果針對(duì)某一條語(yǔ)音信息,得到至少兩個(gè)匹配度相似的備選語(yǔ)言類別,此時(shí) 若難W確定到底哪一個(gè)目標(biāo)語(yǔ)言類別,為提高識(shí)別準(zhǔn)確率,則獲取該用戶對(duì)應(yīng)的歷史語(yǔ)音 識(shí)別記錄,所述歷史語(yǔ)音識(shí)別記錄中包含用戶常用的語(yǔ)言類別,如果歷史語(yǔ)音識(shí)別記錄中 包含備選語(yǔ)言類別中的其中一個(gè),則將該包含的語(yǔ)言類別作為目標(biāo)語(yǔ)言類別。
[0065] 上述實(shí)施例通過對(duì)獲取的語(yǔ)音信息進(jìn)行識(shí)別和語(yǔ)言類別的匹配,W根據(jù)匹配度確 定對(duì)應(yīng)的目標(biāo)語(yǔ)言類別;將當(dāng)前使用的語(yǔ)音識(shí)別模型切換至與目標(biāo)語(yǔ)言類別對(duì)應(yīng)的語(yǔ)音識(shí) 別模型,能夠?qū)崿F(xiàn)不同語(yǔ)言間的語(yǔ)音識(shí)別模型的自動(dòng)切換,不僅提高語(yǔ)音識(shí)別模型切換效 率,而且使語(yǔ)音識(shí)別更加智能化。
[0066] 實(shí)施例二
[0067] 圖2為本發(fā)明實(shí)施例二提供的一種多語(yǔ)音識(shí)別模型切換方法的流程圖,本實(shí)施例 在上述實(shí)施例的基礎(chǔ)上,將對(duì)所述語(yǔ)音信息進(jìn)行識(shí)別和語(yǔ)言類別的匹配,W根據(jù)匹配度確 定對(duì)應(yīng)的目標(biāo)語(yǔ)言類別,優(yōu)化為對(duì)所述語(yǔ)音信息基于至少兩種語(yǔ)言類別的特征進(jìn)行識(shí)別, 并得到所述語(yǔ)音信息與各個(gè)語(yǔ)言類別的相似程度,將所述相似程度作為語(yǔ)言類別的匹配 度。如圖2所示,具體包括:
[0068] S201、獲取用戶輸入語(yǔ)音中的至少一條語(yǔ)音信息。
[0069] S202、對(duì)所述語(yǔ)音信息基于至少兩種語(yǔ)言類別的特征進(jìn)行識(shí)別,并得到所述語(yǔ)音 信息與各個(gè)語(yǔ)言類別的相似程度,W根據(jù)所述相似程度確定對(duì)應(yīng)的目標(biāo)語(yǔ)言類別。
[0070] S203、將當(dāng)前使用的語(yǔ)音識(shí)別模型切換至與目標(biāo)語(yǔ)言類別對(duì)應(yīng)的語(yǔ)音識(shí)別模型。
[0071] 關(guān)于上述各步驟的詳細(xì)描述具體參見上述實(shí)施例,運(yùn)里不再寶述。
[0072] 本實(shí)施例通過對(duì)獲取的語(yǔ)音信息基于至少兩種語(yǔ)言類別的特征進(jìn)行識(shí)別,得到所 述語(yǔ)音信息與各個(gè)語(yǔ)言類別的相似程度,W根據(jù)相似程度確定對(duì)應(yīng)的目標(biāo)語(yǔ)言類別,將當(dāng) 前使用的語(yǔ)音識(shí)別模型切換至與目標(biāo)語(yǔ)言類別對(duì)應(yīng)的語(yǔ)音識(shí)別模型,能夠?qū)崿F(xiàn)不同語(yǔ)言間 的語(yǔ)音識(shí)別模型的自動(dòng)切換,不僅提高語(yǔ)音識(shí)別模型切換效率,而且使語(yǔ)音識(shí)別更加智能 化。
[0073] 實(shí)施例S
[0074] 圖3為本發(fā)明實(shí)施例=提供的一種多語(yǔ)音識(shí)別模型切換方法的流程圖,本實(shí)施例 在上述實(shí)施例的基礎(chǔ)上,對(duì)所述語(yǔ)音信息進(jìn)行識(shí)別和語(yǔ)言類別的匹配,W根據(jù)匹配度確定 對(duì)應(yīng)的目標(biāo)語(yǔ)言類別,優(yōu)化為對(duì)所述語(yǔ)音信息包含的至少兩條語(yǔ)音語(yǔ)句進(jìn)行識(shí)別,得到各 條語(yǔ)音語(yǔ)句與語(yǔ)言類別的匹配度;根據(jù)所述匹配度確定初始語(yǔ)言類別,根據(jù)各條語(yǔ)音語(yǔ)句 與初始語(yǔ)言類別的匹配度確定對(duì)應(yīng)的目標(biāo)語(yǔ)言類別。如圖3所示,具體包括:
[0075] S301、獲取用戶輸入語(yǔ)音中的至少兩條語(yǔ)音語(yǔ)句。
[0076] S302、對(duì)所述至少兩條語(yǔ)音語(yǔ)句進(jìn)行識(shí)別,得到各條語(yǔ)音語(yǔ)句與語(yǔ)言類別的匹配 度。
[0077] S303、根據(jù)所述匹配度確定初始語(yǔ)言類別,根據(jù)各條語(yǔ)音語(yǔ)句與初始語(yǔ)言類別的 匹配度確定對(duì)應(yīng)的目標(biāo)語(yǔ)言類別。
[0078] 計(jì)算將各條語(yǔ)音語(yǔ)句不是初始語(yǔ)言類別的概率的乘積,根據(jù)所述乘積確定對(duì)應(yīng)的 目標(biāo)語(yǔ)言類別。
[0079] 例如,計(jì)算將各條語(yǔ)音語(yǔ)句不是初始語(yǔ)言類別的概率的乘積,如果概率的乘積小 于預(yù)設(shè)闊值,則確定初始語(yǔ)言類別為對(duì)應(yīng)的目標(biāo)語(yǔ)言類別。否則,顯示提示信息,提示用戶 進(jìn)行手動(dòng)切換。
[0080] S304、將當(dāng)前使用的語(yǔ)音識(shí)別模型切換至與目標(biāo)語(yǔ)言類別對(duì)應(yīng)的語(yǔ)音識(shí)別模型。
[0081] 在短時(shí)語(yǔ)音復(fù)雜環(huán)境下,如果單句語(yǔ)音語(yǔ)句的識(shí)別準(zhǔn)確率在90% W上,運(yùn)樣采用 高置信度判決策略,單句語(yǔ)音錯(cuò)誤切換識(shí)別器的概率為0.1,那么N句語(yǔ)音語(yǔ)句后還仍然進(jìn) 行誤操作的概率的為0.1的N次幕。例如,如果設(shè)置用戶的誤判口限為0.0001下,N=4,即一 般情況下,最多只要獲取用戶的4個(gè)輸入語(yǔ)音語(yǔ)句,就可W實(shí)現(xiàn)超低精度的誤判,進(jìn)行切換 準(zhǔn)確概率達(dá)到99.9999%。同時(shí),為了方便用戶進(jìn)行友好的交互,在一定口限下,可W實(shí)時(shí)提 醒用戶是否進(jìn)行語(yǔ)音識(shí)別模型切換,更為友好的方便用戶進(jìn)行切換操作。
[0082] 實(shí)施例四
[0083] 圖4為本發(fā)明實(shí)施例四提供的一種多語(yǔ)音識(shí)別模型切換方法的流程圖,本實(shí)施例 在上述實(shí)施例的基礎(chǔ)上,對(duì)所述語(yǔ)音信息進(jìn)行識(shí)別和語(yǔ)言類別的匹配,W根據(jù)匹配度確定 對(duì)應(yīng)的目標(biāo)語(yǔ)言類別,優(yōu)選為對(duì)所述語(yǔ)音信息進(jìn)行識(shí)別和語(yǔ)言類別的匹配;確定匹配度符 合預(yù)設(shè)條件的至少兩種備選語(yǔ)言類別;查詢用戶歷史語(yǔ)音識(shí)別記錄確定用戶歷史使用的語(yǔ) 言類別;從至少兩個(gè)所述備選語(yǔ)言類別中選取與用戶歷史使用的語(yǔ)言類別一致的語(yǔ)言類別 作為目標(biāo)語(yǔ)言類別。如圖4所示,具體包括:
[0084] S401、獲取用戶輸入語(yǔ)音中的至少一條語(yǔ)音信息。
[0085] S402、對(duì)所述語(yǔ)音信息進(jìn)行識(shí)別和語(yǔ)言類別的匹配,確定匹配度符合預(yù)設(shè)條件的 至少兩種備選語(yǔ)言類別。
[0086] S403、查詢用戶歷史語(yǔ)音識(shí)別記錄確定用戶歷史使用的語(yǔ)言類別。
[0087] S404、從至少兩個(gè)所述備選語(yǔ)言類別中選取與用戶歷史使用的語(yǔ)言類別一致的語(yǔ) 言類別作為目標(biāo)語(yǔ)言類別。
[0088] S405、將當(dāng)前使用的語(yǔ)音識(shí)別模型切換至與目標(biāo)語(yǔ)言類別對(duì)應(yīng)的語(yǔ)音識(shí)別模型。
[0089] 本實(shí)施例通過對(duì)獲取的語(yǔ)音信息進(jìn)行識(shí)別和語(yǔ)言類別的匹配,W根據(jù)匹配度確定 對(duì)應(yīng)的目標(biāo)語(yǔ)言類別;將當(dāng)前使用的語(yǔ)音識(shí)別模型切換至與目標(biāo)語(yǔ)言類別對(duì)應(yīng)的語(yǔ)音識(shí)別 模型,能夠?qū)崿F(xiàn)不同語(yǔ)言間的語(yǔ)音識(shí)別模型的自動(dòng)切換,不僅提高語(yǔ)音識(shí)別模型切換效率, 而且使語(yǔ)音識(shí)別更加智能化。
[0090] 實(shí)施例五
[0091] 圖5所示為本發(fā)明實(shí)施例五提供的一種多語(yǔ)音識(shí)別切換裝置的結(jié)構(gòu)示意圖,該裝 置可采用軟件或硬件的方式實(shí)現(xiàn),該裝置可集成于移動(dòng)終端、固定終端或服務(wù)器中,如圖5 所示,該裝置的具體結(jié)構(gòu)如下:語(yǔ)音獲取模塊51、語(yǔ)言識(shí)別模塊52和模型切換模塊53;
[0092] 所述語(yǔ)音獲取模塊51用于獲取用戶輸入語(yǔ)音中的至少一條語(yǔ)音信息;
[0093] 所述語(yǔ)言識(shí)別模塊52用于對(duì)所述語(yǔ)音信息進(jìn)行識(shí)別和語(yǔ)言類別的匹配,W根據(jù)匹 配度確定對(duì)應(yīng)的目標(biāo)語(yǔ)言類別;
[0094] 所述模型切換模塊53用于將當(dāng)前使用的語(yǔ)音識(shí)別模型切換至與目標(biāo)語(yǔ)言類別對(duì) 應(yīng)的語(yǔ)音識(shí)別模型。
[0095] 本實(shí)施例所述多語(yǔ)音識(shí)別切換裝置用于執(zhí)行上述各實(shí)施例所述的多語(yǔ)音識(shí)別模 型切換方法,其技術(shù)原理和產(chǎn)生的技術(shù)效果類似,運(yùn)里不再寶述。
[0096] 在上述實(shí)施例的基礎(chǔ)上,所述語(yǔ)言識(shí)別模塊52具體用于,對(duì)所述語(yǔ)音信息基于至 少兩種語(yǔ)言類別的特征進(jìn)行識(shí)別,并得到所述語(yǔ)音信息與各個(gè)語(yǔ)言類別的相似程度,將所 述相似程度作為語(yǔ)言類別的匹配度。
[0097] 在上述實(shí)施例的基礎(chǔ)上,所述語(yǔ)言識(shí)別模塊52包括:語(yǔ)言識(shí)別單元521和匹配度確 定單元522。
[0098] 所述語(yǔ)言識(shí)別單元521用于對(duì)所述語(yǔ)音信息包含的至少兩條語(yǔ)音語(yǔ)句進(jìn)行識(shí)別, 得到各條語(yǔ)音語(yǔ)句與語(yǔ)言類別的匹配度;
[0099] 所述匹配度確定單元522用于根據(jù)所述匹配度確定初始語(yǔ)言類別,根據(jù)各條語(yǔ)音 語(yǔ)句與初始語(yǔ)言類別的匹配度確定對(duì)應(yīng)的目標(biāo)語(yǔ)言類別。
[0100] 在上述實(shí)施例的基礎(chǔ)上,所述匹配度確定單元522具體用于,計(jì)算將各條語(yǔ)音語(yǔ)句 不是初始語(yǔ)言類別的概率的乘積,根據(jù)所述乘積確定對(duì)應(yīng)的目標(biāo)語(yǔ)言類別。
[0101] 在上述實(shí)施例的基礎(chǔ)上,所述裝置還包括:預(yù)處理模塊54;
[0102] 所述預(yù)處理模塊54用于在所述語(yǔ)言識(shí)別模塊52對(duì)所述語(yǔ)音信息進(jìn)行識(shí)別和語(yǔ)言 類別的匹配,W根據(jù)匹配度確定對(duì)應(yīng)的目標(biāo)語(yǔ)言類別之前,對(duì)所述語(yǔ)音信息進(jìn)行W下任意 一項(xiàng)預(yù)處理:語(yǔ)音特征提取、有效語(yǔ)音檢測(cè)、語(yǔ)音矢量表示和模型打分測(cè)試。
[0103] 在上述實(shí)施例的基礎(chǔ)上,所述裝置還包括:切換提示模塊55;
[0104] 所述切換提示模塊55用于提示對(duì)所述語(yǔ)音信息進(jìn)行識(shí)別,若識(shí)別結(jié)果不符合預(yù)設(shè) 條件,則顯示提示消息,W提示用戶進(jìn)行手動(dòng)切換。
[0105] 在上述實(shí)施例的基礎(chǔ)上,所述語(yǔ)言識(shí)別模,52具體用于,對(duì)所述語(yǔ)音信息進(jìn)行識(shí)別 和語(yǔ)言類別的匹配;確定匹配度符合預(yù)設(shè)條件的至少兩種備選語(yǔ)言類別;查詢用戶歷史語(yǔ) 音識(shí)別記錄確定用戶歷史使用的語(yǔ)言類別;從至少兩個(gè)所述備選語(yǔ)言類別中選取與用戶歷 史使用的語(yǔ)言類別一致的語(yǔ)言類別作為目標(biāo)語(yǔ)言類別。
[0106] 上述各實(shí)施例所述多語(yǔ)音識(shí)別切換裝置用于執(zhí)行上述各實(shí)施例所述的多語(yǔ)音識(shí) 別模型切換方法,其技術(shù)原理和產(chǎn)生的技術(shù)效果類似,運(yùn)里不再寶述。
[0107] 注意,上述僅為本發(fā)明的較佳實(shí)施例及所運(yùn)用技術(shù)原理。本領(lǐng)域技術(shù)人員會(huì)理解, 本發(fā)明不限于運(yùn)里所述的特定實(shí)施例,對(duì)本領(lǐng)域技術(shù)人員來(lái)說能夠進(jìn)行各種明顯的變化、 重新調(diào)整和替代而不會(huì)脫離本發(fā)明的保護(hù)范圍。因此,雖然通過W上實(shí)施例對(duì)本發(fā)明進(jìn)行 了較為詳細(xì)的說明,但是本發(fā)明不僅僅限于W上實(shí)施例,在不脫離本發(fā)明構(gòu)思的情況下,還 可W包括更多其他等效實(shí)施例,而本發(fā)明的范圍由所附的權(quán)利要求范圍決定。
【主權(quán)項(xiàng)】
1. 一種多語(yǔ)音識(shí)別模型切換方法,其特征在于,包括: 獲取用戶輸入語(yǔ)音中的至少一條語(yǔ)音信息; 對(duì)所述語(yǔ)音信息進(jìn)行識(shí)別和語(yǔ)言類別的匹配,以根據(jù)匹配度確定對(duì)應(yīng)的目標(biāo)語(yǔ)言類 別; 將當(dāng)前使用的語(yǔ)音識(shí)別模型切換至與目標(biāo)語(yǔ)言類別對(duì)應(yīng)的語(yǔ)音識(shí)別模型。2. 根據(jù)權(quán)利要求1所述的方法,其特征在于,對(duì)所述語(yǔ)音信息進(jìn)行識(shí)別和語(yǔ)言類別的匹 配,以根據(jù)匹配度確定對(duì)應(yīng)的目標(biāo)語(yǔ)言類別,包括: 對(duì)所述語(yǔ)音信息基于至少兩種語(yǔ)言類別的特征進(jìn)行識(shí)別,并得到所述語(yǔ)音信息與各個(gè) 語(yǔ)言類別的相似程度,將所述相似程度作為語(yǔ)言類別的匹配度。3. 根據(jù)權(quán)利要求1所述的方法,其特征在于,對(duì)所述語(yǔ)音信息進(jìn)行識(shí)別和語(yǔ)言類別的匹 配,以根據(jù)匹配度確定對(duì)應(yīng)的目標(biāo)語(yǔ)言類別,包括: 對(duì)所述語(yǔ)音信息包含的至少兩條語(yǔ)音語(yǔ)句進(jìn)行識(shí)別,得到各條語(yǔ)音語(yǔ)句與語(yǔ)言類別的 匹配度; 根據(jù)所述匹配度確定初始語(yǔ)言類別,根據(jù)各條語(yǔ)音語(yǔ)句與初始語(yǔ)言類別的匹配度確定 對(duì)應(yīng)的目標(biāo)語(yǔ)言類別。4. 根據(jù)權(quán)利要求3所述的方法,其特征在于,根據(jù)各條語(yǔ)音語(yǔ)句與初始語(yǔ)言類別的匹配 度確定對(duì)應(yīng)的目標(biāo)語(yǔ)言類別,包括: 計(jì)算將各條語(yǔ)音語(yǔ)句不是初始語(yǔ)言類別的概率的乘積,根據(jù)所述乘積確定對(duì)應(yīng)的目標(biāo) 語(yǔ)言類別。5. 根據(jù)權(quán)利要求1~4任一項(xiàng)所述的方法,其特征在于,對(duì)所述語(yǔ)音信息進(jìn)行識(shí)別和語(yǔ) 言類別的匹配,以根據(jù)匹配度確定對(duì)應(yīng)的目標(biāo)語(yǔ)言類別之前,還包括: 對(duì)所述語(yǔ)音信息進(jìn)行以下任意一項(xiàng)預(yù)處理:語(yǔ)音特征提取、有效語(yǔ)音檢測(cè)、語(yǔ)音矢量表 示和模型打分測(cè)試。6. 根據(jù)權(quán)利要求1~4任一項(xiàng)所述的方法,其特征在于,還包括: 對(duì)所述語(yǔ)音信息進(jìn)行識(shí)別,若識(shí)別結(jié)果不符合預(yù)設(shè)條件,則顯示提示消息,以提示用戶 進(jìn)行手動(dòng)切換。7. 根據(jù)權(quán)利要求1~4任一項(xiàng)所述的方法,其特征在于,對(duì)所述語(yǔ)音信息進(jìn)行識(shí)別和語(yǔ) 言類別的匹配,以根據(jù)匹配度確定對(duì)應(yīng)的目標(biāo)語(yǔ)言類別,包括: 對(duì)所述語(yǔ)音信息進(jìn)行識(shí)別和語(yǔ)言類別的匹配; 確定匹配度符合預(yù)設(shè)條件的至少兩種備選語(yǔ)言類別; 查詢用戶歷史語(yǔ)音識(shí)別記錄確定用戶歷史使用的語(yǔ)言類別; 從至少兩個(gè)所述備選語(yǔ)言類別中選取與用戶歷史使用的語(yǔ)言類別一致的語(yǔ)言類別作 為目標(biāo)語(yǔ)言類別。8. -種多語(yǔ)音識(shí)別切換裝置,其特征在于,包括: 語(yǔ)音獲取模塊,用于獲取用戶輸入語(yǔ)音中的至少一條語(yǔ)音信息; 語(yǔ)言識(shí)別模塊,用于對(duì)所述語(yǔ)音信息進(jìn)行識(shí)別和語(yǔ)言類別的匹配,以根據(jù)匹配度確定 對(duì)應(yīng)的目標(biāo)語(yǔ)言類別; 模型切換模塊,用于將當(dāng)前使用的語(yǔ)音識(shí)別模型切換至與目標(biāo)語(yǔ)言類別對(duì)應(yīng)的語(yǔ)音識(shí) 別模型。9. 根據(jù)權(quán)利要求8所述的裝置,其特征在于,所述語(yǔ)言識(shí)別模塊具體用于,對(duì)所述語(yǔ)音 信息基于至少兩種語(yǔ)言類別的特征進(jìn)行識(shí)別,并得到所述語(yǔ)音信息與各個(gè)語(yǔ)言類別的相似 程度,將所述相似程度作為語(yǔ)言類別的匹配度。10. 根據(jù)權(quán)利要求8所述的裝置,其特征在于,所述語(yǔ)言識(shí)別模塊包括: 語(yǔ)言識(shí)別單元,用于對(duì)所述語(yǔ)音信息包含的至少兩條語(yǔ)音語(yǔ)句進(jìn)行識(shí)別,得到各條語(yǔ) 音語(yǔ)句與語(yǔ)言類別的匹配度; 匹配度確定單元,用于根據(jù)所述匹配度確定初始語(yǔ)言類別,根據(jù)各條語(yǔ)音語(yǔ)句與初始 語(yǔ)言類別的匹配度確定對(duì)應(yīng)的目標(biāo)語(yǔ)言類別。11. 根據(jù)權(quán)利要求10所述的裝置,其特征在于,所述匹配度確定單元具體用于,計(jì)算將 各條語(yǔ)音語(yǔ)句不是初始語(yǔ)言類別的概率的乘積,根據(jù)所述乘積確定對(duì)應(yīng)的目標(biāo)語(yǔ)言類別。12. 根據(jù)權(quán)利要求8~11任一項(xiàng)所述的裝置,其特征在于,還包括: 預(yù)處理模塊,用于在所述語(yǔ)言識(shí)別模塊對(duì)所述語(yǔ)音信息進(jìn)行識(shí)別和語(yǔ)言類別的匹配, 以根據(jù)匹配度確定對(duì)應(yīng)的目標(biāo)語(yǔ)言類別之前,對(duì)所述語(yǔ)音信息進(jìn)行以下任意一項(xiàng)預(yù)處理: 語(yǔ)音特征提取、有效語(yǔ)音檢測(cè)、語(yǔ)音矢量表示和模型打分測(cè)試。13. 根據(jù)權(quán)利要求8~11任一項(xiàng)所述的裝置,其特征在于,還包括: 切換提示模塊,用于提示對(duì)所述語(yǔ)音信息進(jìn)行識(shí)別,若識(shí)別結(jié)果不符合預(yù)設(shè)條件,則顯 示提示消息,以提示用戶進(jìn)行手動(dòng)切換。14. 根據(jù)權(quán)利要求8~11任一項(xiàng)所述的裝置,其特征在于,所述語(yǔ)言識(shí)別模塊具體用于, 對(duì)所述語(yǔ)音信息進(jìn)行識(shí)別和語(yǔ)言類別的匹配;確定匹配度符合預(yù)設(shè)條件的至少兩種備選語(yǔ) 言類別;查詢用戶歷史語(yǔ)音識(shí)別記錄確定用戶歷史使用的語(yǔ)言類別;從至少兩個(gè)所述備選 語(yǔ)言類別中選取與用戶歷史使用的語(yǔ)言類別一致的語(yǔ)言類別作為目標(biāo)語(yǔ)言類別。
【文檔編號(hào)】G10L15/00GK105957516SQ201610429948
【公開日】2016年9月21日
【申請(qǐng)日】2016年6月16日
【發(fā)明人】蔣兵, 李先剛, 丁科
【申請(qǐng)人】百度在線網(wǎng)絡(luò)技術(shù)(北京)有限公司