国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      多人語音通話方法以及相關(guān)設(shè)備與流程

      文檔序號:40284297發(fā)布日期:2024-12-13 10:58閱讀:7來源:國知局
      多人語音通話方法以及相關(guān)設(shè)備與流程

      本發(fā)明涉及通信,具體涉及一種多人語音通話方法以及相關(guān)設(shè)備。


      背景技術(shù):

      1、近年來,隨著互聯(lián)網(wǎng)技術(shù)的飛速發(fā)展,語音通話也變得越來越方便,尤其是多人語音通話。多人語音通話涉及到多方通過不同設(shè)備(終端)進行音頻信號采集以及各種音頻處理。由于人耳對不同聲源同時發(fā)聲的辨識能力有限,因此,需要對不同參與方的音頻數(shù)據(jù)(信號)做篩選,從而保證多人語音通話下的通話質(zhì)量?,F(xiàn)有的多人語音通話往往通過各個音頻數(shù)據(jù)的語音特征和預(yù)設(shè)選擇參數(shù)進行音頻數(shù)據(jù)篩選,并將篩選出的目標(biāo)音頻數(shù)據(jù)發(fā)送至接收終端,從而實現(xiàn)多人語音通話。

      2、在對現(xiàn)有技術(shù)的研究和實踐過程中,本技術(shù)的發(fā)明人對于現(xiàn)有的多人語音通話方式來說,多人語音通話中的不同接收終端所處的網(wǎng)絡(luò)環(huán)境可能不同,而且,同一接收終端在不同時段下的網(wǎng)絡(luò)環(huán)境也可能不同,預(yù)設(shè)選擇參數(shù)就可能存在不適配網(wǎng)絡(luò)環(huán)境的風(fēng)險,使得多人語音通話中的參與方在聽感上出現(xiàn)卡頓或者搶話失敗的情況,因此,導(dǎo)致多人語音通話的通話質(zhì)量較低。


      技術(shù)實現(xiàn)思路

      1、本發(fā)明實施例提供一種多人語音通話方法以及相關(guān)設(shè)備,相關(guān)設(shè)備可以包括多人語音通話裝置、電子設(shè)備和計算機可讀存儲介質(zhì),可以提高多人語音通話的通話質(zhì)量。

      2、一種多人語音通話方法,包括:

      3、獲取在當(dāng)前語音通話中目標(biāo)接收終端的當(dāng)前音頻選擇參數(shù)和網(wǎng)絡(luò)丟包參數(shù);

      4、根據(jù)所述網(wǎng)絡(luò)丟包參數(shù),對所述當(dāng)前音頻選擇參數(shù)進行調(diào)整,得到目標(biāo)音頻選擇參數(shù);

      5、當(dāng)接收到多個發(fā)送終端發(fā)送的當(dāng)前音頻數(shù)據(jù)時,獲取所述當(dāng)前音頻數(shù)據(jù)的音頻特征;

      6、基于所述音頻特征和所述目標(biāo)音頻選擇參數(shù),在所述當(dāng)前音頻數(shù)據(jù)中篩選出所述目標(biāo)接收終端對應(yīng)的至少一個目標(biāo)音頻數(shù)據(jù);

      7、將所述目標(biāo)音頻數(shù)據(jù)發(fā)送至所述目標(biāo)接收終端,以保障所述目標(biāo)接收終端與所述發(fā)送終端的當(dāng)前語音通話。

      8、可選的,本技術(shù)實施例還可以提供一種多人語音通話方法,包括:

      9、采集當(dāng)前語音通話中的音頻信號,得到當(dāng)前音頻數(shù)據(jù);

      10、在所述當(dāng)前音頻數(shù)據(jù)中識別出所述音頻信號對應(yīng)的語音能量值;

      11、預(yù)測所述當(dāng)前音頻數(shù)據(jù)中的噪聲能量值,并將所述噪聲能量值和語音能量值作為所述當(dāng)前音頻數(shù)據(jù)的音頻特征;

      12、將所述當(dāng)前音頻數(shù)據(jù)和音頻特征發(fā)送至服務(wù)器,以便所述服務(wù)器基于所述音頻特征和當(dāng)前音頻數(shù)據(jù)確定出目標(biāo)接收終端對應(yīng)的目標(biāo)音頻數(shù)據(jù),并將所述目標(biāo)音頻數(shù)據(jù)發(fā)送至所述目標(biāo)接收終端。

      13、相應(yīng)的,本發(fā)明實施例提供一種多人語音通話裝置,包括:

      14、第一獲取單元,用于獲取在當(dāng)前語音通話中目標(biāo)接收終端的當(dāng)前音頻選擇參數(shù)和網(wǎng)絡(luò)丟包參數(shù);

      15、調(diào)整單元,用于根據(jù)所述網(wǎng)絡(luò)丟包參數(shù),對所述當(dāng)前音頻選擇參數(shù)進行調(diào)整,得到目標(biāo)音頻選擇參數(shù);

      16、第二獲取單元,用于當(dāng)接收到多個發(fā)送終端發(fā)送的當(dāng)前音頻數(shù)據(jù)時,獲取所述當(dāng)前音頻數(shù)據(jù)的音頻特征;

      17、篩選單元,用于基于所述音頻特征和所述目標(biāo)音頻選擇參數(shù),在所述當(dāng)前音頻數(shù)據(jù)中篩選出所述目標(biāo)接收終端對應(yīng)的至少一個目標(biāo)音頻數(shù)據(jù);

      18、發(fā)送單元,用于將所述目標(biāo)音頻數(shù)據(jù)發(fā)送至所述目標(biāo)接收終端,以保障所述目標(biāo)接收終端與所述發(fā)送終端的當(dāng)前語音通話。

      19、可選的,本技術(shù)實施例還可以提供另一種多人語音通話裝置,包括:

      20、采集單元,用于采集當(dāng)前語音通話中的音頻信號,得到當(dāng)前音頻數(shù)據(jù);

      21、識別單元,用于在所述當(dāng)前音頻數(shù)據(jù)中識別出所述音頻信號對應(yīng)的語音能量值;

      22、預(yù)測單元,用于預(yù)測所述當(dāng)前音頻數(shù)據(jù)中的噪聲能量值,并將所述噪聲能量值和語音能量值作為所述當(dāng)前音頻數(shù)據(jù)的音頻特征;

      23、通話單元,用于將所述當(dāng)前音頻數(shù)據(jù)和音頻特征發(fā)送至服務(wù)器,以便所述服務(wù)器基于所述音頻特征和當(dāng)前音頻數(shù)據(jù)確定出目標(biāo)接收終端對應(yīng)的目標(biāo)音頻數(shù)據(jù),并將所述目標(biāo)音頻數(shù)據(jù)發(fā)送至所述目標(biāo)接收終端。

      24、可選的,在一些實施例中,所述調(diào)整單元,具體可以用于將所述網(wǎng)絡(luò)丟包參數(shù)與預(yù)設(shè)丟包參數(shù)閾值進行對比;根據(jù)對比結(jié)果,對所述當(dāng)前音頻選擇參數(shù)進行調(diào)整,得到目標(biāo)音頻選擇參數(shù)。

      25、可選的,在一些實施例中,所述調(diào)整單元,具體可以用于當(dāng)所述網(wǎng)絡(luò)丟包參數(shù)大于預(yù)設(shè)丟包參數(shù)閾值時,對所述當(dāng)前音頻選擇參數(shù)進行調(diào)整,得到目標(biāo)音頻選擇參數(shù);當(dāng)所述網(wǎng)絡(luò)丟包參數(shù)小于或等于所述預(yù)設(shè)丟包參數(shù)閾值時,將所述當(dāng)前音頻選擇參數(shù)替換為預(yù)設(shè)初始音頻選擇參數(shù),得到目標(biāo)音頻選擇參數(shù)。

      26、可選的,在一些實施例中,所述調(diào)整單元,具體可以用于基于預(yù)設(shè)參數(shù)生成函數(shù),生成所述網(wǎng)絡(luò)丟包參數(shù)對應(yīng)的候選音頻選擇參數(shù),所述候選音頻選擇參數(shù)包括候選音頻數(shù)量閾值和候選噪聲能量閾值;將所述當(dāng)前音頻數(shù)量閾值替換為所述候選音頻數(shù)量閾值,得到目標(biāo)音頻數(shù)量閾值;將所述當(dāng)前噪聲能量閾值替換為所述候選噪聲能量閾值,得到目標(biāo)噪聲能量閾值,并將所述目標(biāo)音頻數(shù)量閾值和目標(biāo)噪聲能量閾值作為目標(biāo)音頻選擇參數(shù)。

      27、可選的,在一些實施例中,所述調(diào)整單元,具體可以用于采用所述音頻數(shù)量生成函數(shù),生成所述網(wǎng)絡(luò)丟包參數(shù)對應(yīng)的候選音頻數(shù)量閾值,所述音頻數(shù)量生成函數(shù)為單調(diào)遞減函數(shù);采用所述噪聲能量生成函數(shù),生成所述網(wǎng)絡(luò)丟包參數(shù)對應(yīng)的候選噪聲能量閾值,所述噪聲能量生成函數(shù)為單調(diào)遞增函數(shù);將所述候選音頻數(shù)量閾值和所述候選噪聲能量閾值作為所述候選音頻選擇參數(shù)。

      28、可選的,在一些實施例中,所述調(diào)整單元,具體可以用于獲取所述候選音頻數(shù)量閾值對應(yīng)的預(yù)設(shè)閾值范圍;當(dāng)所述候選音頻數(shù)量閾值在所述預(yù)設(shè)閾值范圍內(nèi)時,將所述當(dāng)前音頻數(shù)量閾值替換為所述候選音頻數(shù)量閾值,得到目標(biāo)音頻數(shù)量閾值;當(dāng)所述候選音頻數(shù)量閾值在所述預(yù)設(shè)閾值范圍外時,在所述預(yù)設(shè)閾值范圍內(nèi)篩選出基礎(chǔ)音頻數(shù)量閾值,將所述基礎(chǔ)音頻數(shù)量閾值作為所述候選音頻數(shù)量閾值,并將所述當(dāng)前音頻數(shù)量閾值替換為所述候選音頻數(shù)量閾值,得到目標(biāo)音頻數(shù)量閾值。

      29、可選的,在一些實施例中,所述篩選單元,具體可以用于在所述當(dāng)前音頻數(shù)據(jù)中篩選出所述噪聲能量值小于或等于所述目標(biāo)噪聲能量閾值的至少一個音頻數(shù)據(jù),得到所述目標(biāo)接收終端對應(yīng)的候選音頻數(shù)據(jù);基于所述語音能量值,對所述目標(biāo)接收終端對應(yīng)的候選音頻數(shù)據(jù)進行排序;根據(jù)排序結(jié)果和所述目標(biāo)音頻數(shù)量閾值,在所述候選音頻數(shù)據(jù)中篩選出至少一個音頻數(shù)據(jù),得到目標(biāo)音頻數(shù)據(jù)。

      30、可選的,在一些實施例中,所述篩選單元,具體可以用于基于所述目標(biāo)音頻數(shù)量閾值,確定所述候選音頻數(shù)據(jù)對應(yīng)的目標(biāo)排序范圍;根據(jù)所述排序結(jié)果,在所述候選音頻數(shù)據(jù)中篩選出所述目標(biāo)排序范圍對應(yīng)的至少一個音頻數(shù)據(jù),得到目標(biāo)音頻數(shù)據(jù)。

      31、可選的,在一些實施例中,所述第一獲取單元,具體可以用于獲取在當(dāng)前語音通話中目標(biāo)接收終端的當(dāng)前音頻選擇參數(shù);接收所述目標(biāo)接收終端返回的所述當(dāng)前音頻選擇參數(shù)對應(yīng)的當(dāng)前周期的當(dāng)前網(wǎng)絡(luò)丟包參數(shù)或所述當(dāng)前周期的下一周期的預(yù)測網(wǎng)絡(luò)丟包參數(shù);將所述當(dāng)前網(wǎng)絡(luò)丟包參數(shù)或預(yù)測網(wǎng)絡(luò)丟包參數(shù)作為所述目標(biāo)接收終端的網(wǎng)絡(luò)丟包參數(shù)。

      32、可選的,在一些實施例中,所述第一發(fā)送單元,具體可以用于當(dāng)接收到所述目標(biāo)接收終端基于所述目標(biāo)音頻數(shù)據(jù)返回的更新后網(wǎng)絡(luò)丟包參數(shù)時,將所述更新后網(wǎng)絡(luò)丟包參數(shù)作為所述網(wǎng)絡(luò)丟包參數(shù),并將所述目標(biāo)音頻選擇參數(shù)作為所述當(dāng)前音頻選擇參數(shù);返回執(zhí)行所述根據(jù)所述網(wǎng)絡(luò)丟包參數(shù),對所述當(dāng)前音頻選擇參數(shù)進行調(diào)整的步驟,直至所述當(dāng)前語音通話結(jié)束為止。

      33、可選的,在一些實施例中,所述識別單元,具體可以用于對所述當(dāng)前音頻數(shù)據(jù)進行頻域變換,以得到每一幀音頻中頻點的功率譜值;將所述功率譜值進行融合,得到每一幀音頻對應(yīng)的初始語音能量值;對所述初始語音能量值進行平滑處理,以得到所述音頻信號對應(yīng)的語音能量值。

      34、可選的,在一些實施例中,所述識別單元,具體可以用于對所述當(dāng)前音頻數(shù)據(jù)進行分幀,得到每一幀音頻對應(yīng)的時域信號數(shù)據(jù);對所述時域信號數(shù)據(jù)進行頻域轉(zhuǎn)換,得到每一幀音頻對應(yīng)的頻域信號數(shù)據(jù);根據(jù)所述頻域信號數(shù)據(jù),確定出每一幀音頻中頻點的功率譜值。

      35、可選的,在一些實施例中,所述預(yù)測單元,具體可以用于將所述功率譜值進行對比,以得到所述頻點的初始噪聲功率譜值;根據(jù)所述初始噪聲功率譜值,計算所述頻點的語音存在概率;將所述語音存在概率與所述功率譜值進行融合,以得到當(dāng)前音頻數(shù)據(jù)中的噪聲能量值。

      36、此外,本發(fā)明實施例還提供一種電子設(shè)備,包括處理器和存儲器,所述存儲器存儲有應(yīng)用程序,所述處理器用于運行所述存儲器內(nèi)的應(yīng)用程序?qū)崿F(xiàn)本發(fā)明實施例提供的多人語音通話方法。

      37、此外,本發(fā)明實施例還提供一種計算機可讀存儲介質(zhì),所述計算機可讀存儲介質(zhì)存儲有多條指令,所述指令適于處理器進行加載,以執(zhí)行本發(fā)明實施例所提供的任一種多人語音通話方法中的步驟。

      38、此外,本技術(shù)實施例還提供一種計算機程序產(chǎn)品,包括計算機程序或指令,該計算機程序或指令被處理器執(zhí)行時實現(xiàn)本技術(shù)實施例提供的多人語音通話方法中的步驟。

      39、本發(fā)明實施例在獲取在當(dāng)前語音通話中目標(biāo)接收終端的當(dāng)前音頻選擇參數(shù)和網(wǎng)絡(luò)丟包參數(shù)后,根據(jù)網(wǎng)絡(luò)丟包參數(shù),對當(dāng)前音頻選擇參數(shù)進行調(diào)整,得到目標(biāo)音頻選擇參數(shù),當(dāng)接收到多個發(fā)送終端發(fā)送的當(dāng)前音頻數(shù)據(jù)時,獲取當(dāng)前音頻數(shù)據(jù)的音頻特征,然后,基于音頻特征和所述目標(biāo)音頻選擇參數(shù),在當(dāng)前音頻數(shù)據(jù)中篩選出目標(biāo)接收終端對應(yīng)的至少一個目標(biāo)音頻數(shù)據(jù),然后,將目標(biāo)音頻數(shù)據(jù)發(fā)送至目標(biāo)接收終端,以保障目標(biāo)接收終端與發(fā)送終端的當(dāng)前語音通話;由于該方案可以通過表征接收方的傳輸質(zhì)量的網(wǎng)絡(luò)丟包參數(shù),對音頻選擇參數(shù)進行調(diào)整,使得音頻選擇參數(shù)可以在不同網(wǎng)絡(luò)環(huán)境下自適應(yīng)調(diào)整或調(diào)節(jié),從而適配不同的網(wǎng)絡(luò)環(huán)境,減少通話卡頓或者搶話失敗的情況發(fā)生,因此,可以提升多人語音通話的通話質(zhì)量。

      當(dāng)前第1頁1 2 
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會獲得點贊!
      1