国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      說(shuō)話(huà)人識(shí)別方法和裝置的制造方法_3

      文檔序號(hào):9490332閱讀:來(lái)源:國(guó)知局
      人的音頻數(shù)據(jù),對(duì)所述音頻數(shù)據(jù)進(jìn)行語(yǔ)音識(shí)別得到語(yǔ)音文本,并提取語(yǔ)音文本中的關(guān)鍵詞,提取音頻數(shù)據(jù)的聲紋特征,根據(jù)所述關(guān)鍵詞在聲紋數(shù)據(jù)庫(kù)中搜索具有該關(guān)鍵詞的聲紋樣本,計(jì)算聲紋特征與聲紋樣本的聲紋特征的相似度,提取相似度超過(guò)設(shè)定閾值的聲紋樣本,根據(jù)所述聲紋樣本及聲紋樣本與身份信息的對(duì)應(yīng)關(guān)系,確定所述說(shuō)話(huà)人的身份信息,提高了語(yǔ)音監(jiān)控的效率,與實(shí)施例一相比,并實(shí)施例先根據(jù)音頻數(shù)據(jù)的語(yǔ)音文本中的關(guān)鍵詞在聲紋數(shù)據(jù)庫(kù)中搜索相關(guān)的聲紋樣本,后續(xù)再將聲紋樣本的聲紋特征與聲紋特征進(jìn)行比對(duì),計(jì)算相似度,根據(jù)相似度超過(guò)設(shè)定值的聲紋樣本,可以確定說(shuō)話(huà)人的身份信息,進(jìn)一步提高了聲紋比對(duì)的速度,從而進(jìn)一步提高了語(yǔ)音監(jiān)控的效率。
      [0068]實(shí)施例三
      [0069]圖6是本發(fā)明實(shí)施例三提供的一種說(shuō)話(huà)人識(shí)別裝置的結(jié)構(gòu)示意圖。如圖6所示,本實(shí)施例所述的說(shuō)話(huà)人識(shí)別裝置包括:音頻數(shù)據(jù)采集模塊610、聲紋特征提取模塊620、聲紋樣本搜索模塊630和身份信息確定模塊640。
      [0070]其中,音頻數(shù)據(jù)采集模塊610用于采集說(shuō)話(huà)人的音頻數(shù)據(jù);
      [0071]聲紋特征提取模塊620用于提取所述音頻數(shù)據(jù)的聲紋特征;
      [0072]聲紋樣本搜索模塊630用于在聲紋數(shù)據(jù)庫(kù)中搜索具有所述聲紋特征的聲紋樣本,所述聲紋數(shù)據(jù)庫(kù)保存身份信息和聲紋樣本的對(duì)應(yīng)關(guān)系;
      [0073]身份信息確定模塊640用于根據(jù)所述聲紋樣本及聲紋樣本與身份信息的對(duì)應(yīng)關(guān)系,確定所述說(shuō)話(huà)人的身份信息。
      [0074]優(yōu)選的,該說(shuō)話(huà)人識(shí)別裝置還包括:
      [0075]語(yǔ)音識(shí)別模塊,用于在采集說(shuō)話(huà)人的音頻數(shù)據(jù)之后,對(duì)所述音頻數(shù)據(jù)進(jìn)行語(yǔ)音識(shí)另IJ,得到語(yǔ)音文本;
      [0076]關(guān)鍵詞提取模塊,用于提取所述語(yǔ)音文本中的關(guān)鍵詞;
      [0077]所述聲紋樣本搜索模塊包括:
      [0078]聲紋樣本搜索單元,用于根據(jù)所述關(guān)鍵詞,在聲紋數(shù)據(jù)庫(kù)中搜索具有所述關(guān)鍵詞的聲紋樣本;
      [0079]相似度計(jì)算單元,用于計(jì)算所述聲紋特征與所述聲紋樣本的聲紋特征的相似度;
      [0080]聲紋樣本提取單元,用于提取相似度超過(guò)設(shè)定閾值的聲紋樣本。
      [0081]優(yōu)選的,所述聲紋樣本搜索模塊還包括:
      [0082]時(shí)間位置標(biāo)注單元,用于在聲紋數(shù)據(jù)庫(kù)中搜索具有所述關(guān)鍵詞的聲紋樣本之后,在搜索結(jié)果中標(biāo)注所述關(guān)鍵詞所出現(xiàn)的時(shí)間位置。
      [0083]優(yōu)選的,該說(shuō)話(huà)人識(shí)別裝置還包括:
      [0084]搜索入口提供模塊,用于提供聲紋數(shù)據(jù)庫(kù)搜索入口,供用戶(hù)通過(guò)關(guān)鍵詞查詢(xún)聲紋樣本。
      [0085]優(yōu)選的,該說(shuō)話(huà)人識(shí)別裝置還包括:
      [0086]聲紋樣本采集模塊,用于在采集說(shuō)話(huà)人的音頻數(shù)據(jù)之前,采集已知身份的說(shuō)話(huà)人的音頻數(shù)據(jù),提取該音頻數(shù)據(jù)的聲紋特征,該音頻數(shù)據(jù)、與該音頻數(shù)據(jù)對(duì)應(yīng)的聲紋樣本及身份信息形成聲紋樣本,將該聲紋樣本保存到聲紋數(shù)據(jù)庫(kù)中。
      [0087]上述產(chǎn)品可執(zhí)行本發(fā)明任意實(shí)施例所提供的方法,具備執(zhí)行方法相應(yīng)的功能模塊和有益效果。
      [0088]注意,上述僅為本發(fā)明的較佳實(shí)施例及所運(yùn)用技術(shù)原理。本領(lǐng)域技術(shù)人員會(huì)理解,本發(fā)明不限于這里所述的特定實(shí)施例,對(duì)本領(lǐng)域技術(shù)人員來(lái)說(shuō)能夠進(jìn)行各種明顯的變化、重新調(diào)整和替代而不會(huì)脫離本發(fā)明的保護(hù)范圍。因此,雖然通過(guò)以上實(shí)施例對(duì)本發(fā)明進(jìn)行了較為詳細(xì)的說(shuō)明,但是本發(fā)明不僅僅限于以上實(shí)施例,在不脫離本發(fā)明構(gòu)思的情況下,還可以包括更多其他等效實(shí)施例,而本發(fā)明的范圍由所附的權(quán)利要求范圍決定。
      【主權(quán)項(xiàng)】
      1.一種說(shuō)話(huà)人識(shí)別方法,其特征在于,所述方法包括: 采集說(shuō)話(huà)人的音頻數(shù)據(jù); 提取所述音頻數(shù)據(jù)的聲紋特征; 在聲紋數(shù)據(jù)庫(kù)中搜索具有所述聲紋特征的聲紋樣本,所述聲紋數(shù)據(jù)庫(kù)保存身份信息和聲紋樣本的對(duì)應(yīng)關(guān)系; 根據(jù)所述聲紋樣本及聲紋樣本與身份信息的對(duì)應(yīng)關(guān)系,確定所述說(shuō)話(huà)人的身份信息。2.根據(jù)權(quán)利要求1所述的方法,其特征在于,在采集說(shuō)話(huà)人的音頻數(shù)據(jù)之后,還包括: 對(duì)所述音頻數(shù)據(jù)進(jìn)行語(yǔ)音識(shí)別,得到語(yǔ)音文本; 提取所述語(yǔ)音文本中的關(guān)鍵詞; 在聲紋數(shù)據(jù)庫(kù)中搜索具有所述聲紋特征的聲紋樣本,包括: 根據(jù)所述關(guān)鍵詞,在聲紋數(shù)據(jù)庫(kù)中搜索具有所述關(guān)鍵詞的聲紋樣本; 計(jì)算所述聲紋特征與所述聲紋樣本的聲紋特征的相似度; 提取相似度超過(guò)設(shè)定閾值的聲紋樣本。3.根據(jù)權(quán)利要求2所述的方法,其特征在于,在聲紋數(shù)據(jù)庫(kù)中搜索具有所述關(guān)鍵詞的聲紋樣本之后,還包括: 在搜索結(jié)果中標(biāo)注所述關(guān)鍵詞所出現(xiàn)的時(shí)間位置。4.根據(jù)權(quán)利要求2所述的方法,其特征在于,還包括: 提供聲紋數(shù)據(jù)庫(kù)搜索入口,供用戶(hù)通過(guò)關(guān)鍵詞查詢(xún)聲紋樣本。5.根據(jù)權(quán)利要求1-4任一所述的方法,其特征在于,在采集說(shuō)話(huà)人的音頻數(shù)據(jù)之前,還包括: 采集已知身份的說(shuō)話(huà)人的音頻數(shù)據(jù),提取該音頻數(shù)據(jù)的聲紋特征,該音頻數(shù)據(jù)、與該音頻數(shù)據(jù)對(duì)應(yīng)的聲紋特征及身份信息形成聲紋樣本,將該聲紋樣本保存到聲紋數(shù)據(jù)庫(kù)中。6.一種說(shuō)話(huà)人識(shí)別裝置,其特征在于,所述裝置包括: 音頻數(shù)據(jù)采集模塊,用于采集說(shuō)話(huà)人的音頻數(shù)據(jù); 聲紋特征提取模塊,用于提取所述音頻數(shù)據(jù)的聲紋特征; 聲紋樣本搜索模塊,用于在聲紋數(shù)據(jù)庫(kù)中搜索具有所述聲紋特征的聲紋樣本,所述聲紋數(shù)據(jù)庫(kù)保存身份信息和聲紋樣本的對(duì)應(yīng)關(guān)系; 身份信息確定模塊,用于根據(jù)所述聲紋樣本及聲紋樣本與身份信息的對(duì)應(yīng)關(guān)系,確定所述說(shuō)話(huà)人的身份信息。7.根據(jù)權(quán)利要求6所述的裝置,其特征在于,還包括: 語(yǔ)音識(shí)別模塊,用于在采集說(shuō)話(huà)人的音頻數(shù)據(jù)之后,對(duì)所述音頻數(shù)據(jù)進(jìn)行語(yǔ)音識(shí)別,得到語(yǔ)音文本; 關(guān)鍵詞提取模塊,用于提取所述語(yǔ)音文本中的關(guān)鍵詞; 所述聲紋樣本搜索模塊包括: 聲紋樣本搜索單元,用于根據(jù)所述關(guān)鍵詞,在聲紋數(shù)據(jù)庫(kù)中搜索具有所述關(guān)鍵詞的聲紋樣本; 相似度計(jì)算單元,用于計(jì)算所述聲紋特征與所述聲紋樣本的聲紋特征的相似度; 聲紋樣本提取單元,用于提取相似度超過(guò)設(shè)定閾值的聲紋樣本。8.根據(jù)權(quán)利要求7所述的裝置,其特征在于,所述聲紋樣本搜索模塊還包括: 時(shí)間位置標(biāo)注單元,用于在聲紋數(shù)據(jù)庫(kù)中搜索具有所述關(guān)鍵詞的聲紋樣本之后,在搜索結(jié)果中標(biāo)注所述關(guān)鍵詞所出現(xiàn)的時(shí)間位置。9.根據(jù)權(quán)利要求7所述的裝置,其特征在于,還包括: 搜索入口提供模塊,用于提供聲紋數(shù)據(jù)庫(kù)搜索入口,供用戶(hù)通過(guò)關(guān)鍵詞查詢(xún)聲紋樣本。10.根據(jù)權(quán)利要求6-9任一所述的裝置,其特征在于,還包括: 聲紋樣本采集模塊,用于在采集說(shuō)話(huà)人的音頻數(shù)據(jù)之前,采集已知身份的說(shuō)話(huà)人的音頻數(shù)據(jù),提取該音頻數(shù)據(jù)的聲紋特征,該音頻數(shù)據(jù)、與該音頻數(shù)據(jù)對(duì)應(yīng)的聲紋樣本及身份信息形成聲紋樣本,將該聲紋樣本保存到聲紋數(shù)據(jù)庫(kù)中。
      【專(zhuān)利摘要】本發(fā)明公開(kāi)了一種說(shuō)話(huà)人識(shí)別方法和裝置。該方法包括:采集說(shuō)話(huà)人的音頻數(shù)據(jù);提取所述音頻數(shù)據(jù)的聲紋特征;在聲紋數(shù)據(jù)庫(kù)中搜索具有所述聲紋特征的聲紋樣本,所述聲紋數(shù)據(jù)庫(kù)保存身份信息和聲紋樣本的對(duì)應(yīng)關(guān)系;根據(jù)所述聲紋樣本及聲紋樣本與身份信息的對(duì)應(yīng)關(guān)系,確定所述說(shuō)話(huà)人的身份信息。本發(fā)明提高了語(yǔ)音監(jiān)控的效率,為公共安全提供了保障。
      【IPC分類(lèi)】G10L17/02, G10L17/14
      【公開(kāi)號(hào)】CN105244031
      【申請(qǐng)?zhí)枴緾N201510702800
      【發(fā)明人】王旭東
      【申請(qǐng)人】北京銳安科技有限公司
      【公開(kāi)日】2016年1月13日
      【申請(qǐng)日】2015年10月26日
      當(dāng)前第3頁(yè)1 2 3 
      網(wǎng)友詢(xún)問(wèn)留言 已有0條留言
      • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
      1