一種基于語音識別的人機交互系統(tǒng)的制作方法

文檔序號：39433960發(fā)布日期：2024-09-20 22:33閱讀：57來源：國知局

本發(fā)明涉及語音識別，具體涉及一種基于語音識別的人機交互系統(tǒng)。

背景技術：

1、在信息技術迅猛發(fā)展、智能化時代已然來臨的當下，人機交互模式持續(xù)進化與創(chuàng)新，傳統(tǒng)的人機交互手段，像是鍵盤輸入、鼠標點擊等，于部分情境中逐步顯露出自身的局限，難以契合人們對更為自然、便捷且高效交互形式的渴求；

2、在此形勢下，語音識別技術順勢而起，逐步成為人機交互范疇的研究焦點，語音，作為人類最為自然和直接的交流途徑，具備信息傳遞迅速、便捷，且無需額外學習成本的突出優(yōu)點，基于語音識別的人機交互系統(tǒng)，意在憑借對人類語音的理解與處置，達成人與機器之間更為自然、順暢和智能化的交流；

3、然而，現(xiàn)有的一種基于語音識別的人機交互系統(tǒng)在用戶申請使用功能時，存在明顯缺陷，其通過采集用戶的語音信息，運用語音識別技術識別后，與內(nèi)部預存儲的若干功能的文本信息進行相似度比較，選取相似度最高的文本信息所對應的功能作為識別功能供用戶識別、確認并最終執(zhí)行；但當存在若干相似的功能文本信息時，這種方式的準確性欠佳，并且，此方式未考慮相鄰指令的相關度，同時，授權用戶對功能的使用通常具有相關性和重復性，而當前技術卻未將此應用于識別功能的選定，這無疑致使識別功能的識別準確率偏低；

4、為了解決上述問題，本發(fā)明提出了一種解決方案。

技術實現(xiàn)思路

1、本發(fā)明的目的在于提供一種基于語音識別的人機交互系統(tǒng)，為了解決上述背景技術中提出的問題；

2、本發(fā)明的目的可以通過以下技術方案實現(xiàn)：

3、一種基于語音識別的人機交互系統(tǒng)，包括：

4、語音采集模塊，用于對授權用戶發(fā)出的語音信息進行采集；

5、識別匹配單元，用于在接收到當前時刻授權用戶發(fā)出的語音信息后對其進行識別得到當前語音信息的特征文本；

6、根據(jù)當前語音信息的特征文本的得到時刻獲取向前回溯p1時間內(nèi)所述授權用戶發(fā)出的若干語音信息，并對向前回溯p1時間內(nèi)所述授權用戶發(fā)出的語音信息的條數(shù)進行非0判定，基于判定結果選定得到當前語音信息的待確認功能；

7、交互顯示單元將當前語音信息的待確認功能顯示給授權用戶進行功能確認，授權用戶確認完畢后將當前語音信息的待確認功能作為當前語音信息的識別功能；

8、功能實現(xiàn)單元根據(jù)當前語音信息的識別功能后執(zhí)行對應的實現(xiàn)邏輯，執(zhí)行過程中交互顯示單元根據(jù)當前語音信息的發(fā)出時刻獲取向前回溯p3時間內(nèi)所述授權用戶發(fā)出的若干語音信息，p3為預設的輔助顯示選定參考時長閾值；

9、對向前回溯p3時間內(nèi)所述授權用戶發(fā)出的語音信息的條數(shù)進行非0判定，基于判定結果選定授權用戶下一次發(fā)出語音信息的三個輔助顯示選定功能，將其的特征文本顯示給授權用戶進行查看，為授權用戶下一次發(fā)出語音信息提供輔助。

10、進一步的，若向前回溯p1時間內(nèi)所述授權用戶發(fā)出的語音信息的條數(shù)不為0，選定得到當前語音信息的待確認功能的步驟如下：

11、s21：識別匹配單元從向前回溯p1時間內(nèi)所有授權用戶發(fā)出的所有語音信息中獲取發(fā)出時刻與當前時刻的語音信息的發(fā)出時刻時間上最相近的一條語音信息的識別功能，將所述識別功能作為標識選定功能；

12、s22：根據(jù)標識選定功能的級聯(lián)功能表，提取出所述級聯(lián)功能表中包含的所有級聯(lián)功能的特征文本，按照每個級聯(lián)功能在所述級聯(lián)功能表中的排列順序從上到下，依次計算所述級聯(lián)功能表中包含的所有級聯(lián)功能的特征文本與當前語音信息的特征文本的相似度，每計算出一個相似度，將所述相似度與p2進行大小比較，若所述相似度大于p2，則將參與所述相似度計算的特征文本對應的級聯(lián)功能作為當前語音信息的待確認功能，同時停止其余級聯(lián)功能的特征文本與當前語音信息的特征文本的相似度計算，p2為預設的選定相似度比較閾值。

13、進一步的，s22中，若所述級聯(lián)功能表中包含的所有級聯(lián)功能的特征文本與當前語音信息的特征文本的相似度計算完成后得到的相似度都小于等于p2，則根據(jù)所有業(yè)務功能在功能頻次表中的排列順序，從上到下依次提取出所有業(yè)務功能的特征文本，每提取一個業(yè)務功能的特征文本，將所述特征文本和當前語音信息的特征文本進行相似度計算，并在所有業(yè)務功能的特征文本都提取完全后獲取參與數(shù)值最大的相似度計算的特征文本對應的業(yè)務功能作為當前語音信息的待確認功能。

14、進一步的，若向前回溯p3時間內(nèi)所述授權用戶發(fā)出的語音信息的條數(shù)不為0，則選定授權用戶下一次發(fā)出語音信息的三個輔助顯示選定功能的步驟如下：

15、s31：按照語音信息發(fā)出的時間先后順序，將向前回溯p3時間內(nèi)授權用戶發(fā)出的所有語音信息的識別功能依次標記為h1、h2、...、hh，h≥1；

16、s32：從交互顯示單元中獲取包含有當前語音信息的識別功能的所有識別功能鏈表，分別標記為i1、i2、...、ii,i≥1；

17、s33：按照預設的計算規(guī)則計算獲取識別功能h1、h2、...、hh基于識別功能鏈表i1的差異度指數(shù)l1、l2、...、lh，計算規(guī)則如下：

18、s331：按照從左到右的順序，從識別功能鏈表i1中依次提取出排列在所述當前語音信息的識別功能左邊的所有識別功能，并按照提取的先后順序，將提取出的所有識別功能依次標記為j1、j2、...、jj，j≥1；

19、s332：依次將識別功能j1、j2、...、jj和識別功能h1進行一致性比較，獲取第一個與識別功能h1相一致的識別功能的標記下標k1；

20、s333：利用公式l1=|k1-(h-1)|計算獲取識別功能h1基于識別功能鏈表i1的差異度指數(shù)l1，若對識別功能j1、j2、...、jj都遍歷完全后，并沒有與識別功能h1相一致的識別功能，則將p4賦值給識別功能h1基于識別功能鏈表i1的差異度指數(shù)l1，p4為預設的差異度均補指標；

21、s334：按照s331到s333依次計算獲取識別功能h2、h3、...、hh基于識別功能鏈表i1的差異度指數(shù)l2、l3、...、lh；

22、s34：利用公式計算獲取當前語音信息基于識別功能鏈表i1的輔助評估指數(shù)n1，公式中的m1為識別功能j1、j2、...、jj中與識別功能h1、h2、...、hh中任意一個識別功能都不相一致的識別功能的總數(shù)量，ɑ1為預設的協(xié)和補償系，ll指代的是差異度指數(shù)l1、l2、...、ll，l的取值為1、2、...、h；

23、s35：按照s31到s34依次計算獲取當前語音信息基于識別功能鏈表i2、i3、...、ii的輔助評估指數(shù)n2、n3、...、ni，從中選定數(shù)值第一小、第二小以及第三小的輔助評估指數(shù)對應的識別功能鏈表作為授權用戶下一次發(fā)出語音信息的輔助鏈表；

24、針對選定作為授權用戶下一次發(fā)出語音信息的一條輔助鏈表，按照從左到右的順序，提取出位于第一個當前語音信息識別功能相鄰右邊的識別功能作為授權用戶下一次發(fā)出語音信息的一個輔助顯示選定功能，同理可得授權用戶下一次發(fā)出語音信息的三個輔助顯示選定功能。

25、本發(fā)明的有益效果：

26、（1）本發(fā)明通過設置語音采集模塊對授權用戶發(fā)出的語音信息進行采集，識別匹配單元對語音信息進行識別并由交互顯示單元顯示供給授權用戶進行識別功能確認，功能實現(xiàn)單元對識別功能進行邏輯實現(xiàn)的同時由交互顯示單元基于當前語音信息的識別功能為授權用戶下一次發(fā)出的語音信息選定輔助顯示選定功能，通過此種方式為授權用戶下一次發(fā)出語音信息提供輔助，優(yōu)化其下一個語音信息的識別功能實現(xiàn)；

27、（2）本發(fā)明通過識別匹配單元對語音信息進行識別的過程中，采用語音識別技術識別出語音信息的特征文本，并基于當前語音信息的發(fā)出時刻獲取向前回溯p1時間的語音信息，基于語音信息的條數(shù)以及對應的識別功能確定當前語音信息的待確認功能，通過此種方式避免了特征文本相似的識別功能對識別結果造成的影響，增強了語音信息特征文本匹配識別功能的準確率，進一步地提高了語音識別的準確度；

28、（3）本發(fā)明通過設置功能解構模塊對授權用戶在若干語音交互周期內(nèi)發(fā)出的所有語音信息的識別功能進行解構分析，確定基于授權用戶的所有識別功能的級聯(lián)功能表以及若干語音交互周期的識別功能鏈表，確定級聯(lián)功能表時糅合了對授權用戶發(fā)出的單個語音信息的識別功能以及單個語音信息及其相鄰語音信息的分析，通過此種方式使當前語音信息的待確認功能的選定更加準確和全面，這樣不僅能夠充分考慮單個語音信息的獨立特征，還能兼顧其與相鄰語音信息之間的關聯(lián)和影響，有效地提升了語音信息識別功能的精準度和有效性；

29、（4）本發(fā)明在當前語音信息的識別功能執(zhí)行過程中，同步向前回溯預設時間內(nèi)的若干語音信息結合若干語音交互周期的識別功能鏈表中當前語音信息的識別功能，為授權用戶下依次發(fā)出語音信息提供輔助顯示選定功能推薦，通過此種方式通過結合授權用戶往期語音信息對應的識別功能，使對授權用戶的輔助顯示選定功能推薦融入了授權用戶對于功能的相關性和重復性分析，極大地提高了輔助顯示選定功能推薦的準確性，也為用戶下一次發(fā)出語音信息提供便利。

完整全部詳細技術資料下載

當前第1頁1 2

該技術已申請專利。僅供學習研究，如用于商業(yè)用途，請聯(lián)系技術所有人。
技術研發(fā)人員：徐洪軍,王燕濱,謝師文,孫勛
技術所有人：南京科睿金信技術有限公司
我是此專利的發(fā)明人

上一篇：一種防止行人及動物攀爬的鋼管桿的制作方法
上一篇：一種廢氣處理設備的制作方法

相關技術

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

一種基于語音識別的人機交互系統(tǒng)的制作方法