一種顯示設(shè)備及基于喚醒詞聲紋的指令識(shí)別方法與流程

文檔序號(hào)：39341807發(fā)布日期：2024-09-10 12:01閱讀：來源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專利>樂器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)>一種顯示設(shè)備及基于喚醒詞聲紋的指令識(shí)別方法與流程

技術(shù)特征：

1.一種顯示設(shè)備，其特征在于，包括：

2.根據(jù)權(quán)利要求1所述的顯示設(shè)備，其特征在于，所述語(yǔ)音提取模型包括第一模塊，所述第一模塊被配置為提取所述喚醒詞音頻的目標(biāo)聲紋向量，所述控制器還被配置為：

3.根據(jù)權(quán)利要求2所述的顯示設(shè)備，其特征在于，所述語(yǔ)音提取模型還包括第二模塊，所述第二模塊被配置為根據(jù)目標(biāo)聲紋向量在所述待提取音頻中提取目標(biāo)指令詞音頻，所述控制器還被配置為：

4.根據(jù)權(quán)利要求3所述的顯示設(shè)備，其特征在于，所述控制器執(zhí)行提取所述疊加樣本音頻的疊加聲紋向量的步驟后，還被配置為：

5.根據(jù)權(quán)利要求3所述的顯示設(shè)備，其特征在于，所述控制器還被配置為：

6.根據(jù)權(quán)利要求3所述的顯示設(shè)備，其特征在于，所述控制器執(zhí)行疊加所述樣本喚醒詞音頻、所述樣本指令詞音頻和所述干擾指令詞音頻，被配置為：

7.根據(jù)權(quán)利要求2所述的顯示設(shè)備，其特征在于，所述第一模塊包括編碼器和聲紋提取器，所述控制器還被配置為：

8.根據(jù)權(quán)利要求7所述的顯示設(shè)備，其特征在于，所述控制器執(zhí)行通過所述編碼器編碼所述喚醒詞音頻，被配置為：

9.根據(jù)權(quán)利要求3所述的顯示設(shè)備，其特征在于，所述控制器執(zhí)行根據(jù)所述第一學(xué)習(xí)器向量從所述疊加樣本音頻中提取訓(xùn)練指令詞音頻，被配置為：

10.一種基于喚醒詞聲紋的指令識(shí)別方法，其特征在于，應(yīng)用于顯示設(shè)備，所述顯示設(shè)備包括顯示器、存儲(chǔ)器、聲音采集器和控制器，所述顯示器用于顯示用戶界面，所述存儲(chǔ)器用于存儲(chǔ)語(yǔ)音提取模型，所述語(yǔ)音提取模型根據(jù)樣本數(shù)據(jù)訓(xùn)練得到，所述樣本數(shù)據(jù)包括來源于相同聲源的喚醒詞音頻和指令詞音頻；所述聲音采集器被配置為獲取音頻數(shù)據(jù)，所述方法包括：

技術(shù)總結(jié)
本申請(qǐng)?zhí)峁┮环N顯示設(shè)備及基于喚醒詞聲紋的指令識(shí)別方法，所述方法通過聲音采集器獲取待提取音頻后，通過語(yǔ)音提取模型在待提取音頻中識(shí)別喚醒詞音頻，并通過語(yǔ)音提取模型提取喚醒詞音頻的目標(biāo)聲紋向量，根據(jù)目標(biāo)聲紋向量在待提取音頻中提取目標(biāo)指令詞音頻，根據(jù)目標(biāo)指令詞音頻生成控制指令，以及，響應(yīng)于控制指令，控制顯示器顯示執(zhí)行控制指令后的目標(biāo)用戶界面。本申請(qǐng)通過對(duì)喚醒詞音頻對(duì)應(yīng)的聲紋向量進(jìn)行識(shí)別，并基于聲紋向量獲取有效的指令詞音頻以生成對(duì)應(yīng)的控制指令，減少待提取音頻中的其他指令詞音頻對(duì)有效指令詞音頻的干擾，提高顯示設(shè)備識(shí)別指令的準(zhǔn)確性。

技術(shù)研發(fā)人員：潘程,馬明,肖炳環(huán),張寶軍
受保護(hù)的技術(shù)使用者：海信視像科技股份有限公司
技術(shù)研發(fā)日：
技術(shù)公布日：2024/9/9

完整全部詳細(xì)技術(shù)資料下載

當(dāng)前第2頁(yè)1 2

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

一種顯示設(shè)備及基于喚醒詞聲紋的指令識(shí)別方法與流程