1.一種顯示設(shè)備,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的顯示設(shè)備,其特征在于,所述語(yǔ)音提取模型包括第一模塊,所述第一模塊被配置為提取所述喚醒詞音頻的目標(biāo)聲紋向量,所述控制器還被配置為:
3.根據(jù)權(quán)利要求2所述的顯示設(shè)備,其特征在于,所述語(yǔ)音提取模型還包括第二模塊,所述第二模塊被配置為根據(jù)目標(biāo)聲紋向量在所述待提取音頻中提取目標(biāo)指令詞音頻,所述控制器還被配置為:
4.根據(jù)權(quán)利要求3所述的顯示設(shè)備,其特征在于,所述控制器執(zhí)行提取所述疊加樣本音頻的疊加聲紋向量的步驟后,還被配置為:
5.根據(jù)權(quán)利要求3所述的顯示設(shè)備,其特征在于,所述控制器還被配置為:
6.根據(jù)權(quán)利要求3所述的顯示設(shè)備,其特征在于,所述控制器執(zhí)行疊加所述樣本喚醒詞音頻、所述樣本指令詞音頻和所述干擾指令詞音頻,被配置為:
7.根據(jù)權(quán)利要求2所述的顯示設(shè)備,其特征在于,所述第一模塊包括編碼器和聲紋提取器,所述控制器還被配置為:
8.根據(jù)權(quán)利要求7所述的顯示設(shè)備,其特征在于,所述控制器執(zhí)行通過所述編碼器編碼所述喚醒詞音頻,被配置為:
9.根據(jù)權(quán)利要求3所述的顯示設(shè)備,其特征在于,所述控制器執(zhí)行根據(jù)所述第一學(xué)習(xí)器向量從所述疊加樣本音頻中提取訓(xùn)練指令詞音頻,被配置為:
10.一種基于喚醒詞聲紋的指令識(shí)別方法,其特征在于,應(yīng)用于顯示設(shè)備,所述顯示設(shè)備包括顯示器、存儲(chǔ)器、聲音采集器和控制器,所述顯示器用于顯示用戶界面,所述存儲(chǔ)器用于存儲(chǔ)語(yǔ)音提取模型,所述語(yǔ)音提取模型根據(jù)樣本數(shù)據(jù)訓(xùn)練得到,所述樣本數(shù)據(jù)包括來源于相同聲源的喚醒詞音頻和指令詞音頻;所述聲音采集器被配置為獲取音頻數(shù)據(jù),所述方法包括: