多人語音通話方法以及相關(guān)設(shè)備與流程

文檔序號：40284297發(fā)布日期：2024-12-13 10:58閱讀：7來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>電子通信裝置的制造及其應(yīng)用技術(shù)

本發(fā)明涉及通信，具體涉及一種多人語音通話方法以及相關(guān)設(shè)備。

背景技術(shù)：

1、近年來，隨著互聯(lián)網(wǎng)技術(shù)的飛速發(fā)展，語音通話也變得越來越方便，尤其是多人語音通話。多人語音通話涉及到多方通過不同設(shè)備(終端)進行音頻信號采集以及各種音頻處理。由于人耳對不同聲源同時發(fā)聲的辨識能力有限，因此，需要對不同參與方的音頻數(shù)據(jù)(信號)做篩選，從而保證多人語音通話下的通話質(zhì)量?，F(xiàn)有的多人語音通話往往通過各個音頻數(shù)據(jù)的語音特征和預(yù)設(shè)選擇參數(shù)進行音頻數(shù)據(jù)篩選，并將篩選出的目標(biāo)音頻數(shù)據(jù)發(fā)送至接收終端，從而實現(xiàn)多人語音通話。

2、在對現(xiàn)有技術(shù)的研究和實踐過程中，本技術(shù)的發(fā)明人對于現(xiàn)有的多人語音通話方式來說，多人語音通話中的不同接收終端所處的網(wǎng)絡(luò)環(huán)境可能不同，而且，同一接收終端在不同時段下的網(wǎng)絡(luò)環(huán)境也可能不同，預(yù)設(shè)選擇參數(shù)就可能存在不適配網(wǎng)絡(luò)環(huán)境的風(fēng)險，使得多人語音通話中的參與方在聽感上出現(xiàn)卡頓或者搶話失敗的情況，因此，導(dǎo)致多人語音通話的通話質(zhì)量較低。

技術(shù)實現(xiàn)思路

1、本發(fā)明實施例提供一種多人語音通話方法以及相關(guān)設(shè)備，相關(guān)設(shè)備可以包括多人語音通話裝置、電子設(shè)備和計算機可讀存儲介質(zhì)，可以提高多人語音通話的通話質(zhì)量。

2、一種多人語音通話方法，包括：

3、獲取在當(dāng)前語音通話中目標(biāo)接收終端的當(dāng)前音頻選擇參數(shù)和網(wǎng)絡(luò)丟包參數(shù)；

4、根據(jù)所述網(wǎng)絡(luò)丟包參數(shù)，對所述當(dāng)前音頻選擇參數(shù)進行調(diào)整，得到目標(biāo)音頻選擇參數(shù)；

5、當(dāng)接收到多個發(fā)送終端發(fā)送的當(dāng)前音頻數(shù)據(jù)時，獲取所述當(dāng)前音頻數(shù)據(jù)的音頻特征；

6、基于所述音頻特征和所述目標(biāo)音頻選擇參數(shù)，在所述當(dāng)前音頻數(shù)據(jù)中篩選出所述目標(biāo)接收終端對應(yīng)的至少一個目標(biāo)音頻數(shù)據(jù)；

7、將所述目標(biāo)音頻數(shù)據(jù)發(fā)送至所述目標(biāo)接收終端，以保障所述目標(biāo)接收終端與所述發(fā)送終端的當(dāng)前語音通話。

8、可選的，本技術(shù)實施例還可以提供一種多人語音通話方法，包括：

9、采集當(dāng)前語音通話中的音頻信號，得到當(dāng)前音頻數(shù)據(jù)；

10、在所述當(dāng)前音頻數(shù)據(jù)中識別出所述音頻信號對應(yīng)的語音能量值；

11、預(yù)測所述當(dāng)前音頻數(shù)據(jù)中的噪聲能量值，并將所述噪聲能量值和語音能量值作為所述當(dāng)前音頻數(shù)據(jù)的音頻特征；

12、將所述當(dāng)前音頻數(shù)據(jù)和音頻特征發(fā)送至服務(wù)器，以便所述服務(wù)器基于所述音頻特征和當(dāng)前音頻數(shù)據(jù)確定出目標(biāo)接收終端對應(yīng)的目標(biāo)音頻數(shù)據(jù)，并將所述目標(biāo)音頻數(shù)據(jù)發(fā)送至所述目標(biāo)接收終端。

13、相應(yīng)的，本發(fā)明實施例提供一種多人語音通話裝置，包括：

14、第一獲取單元，用于獲取在當(dāng)前語音通話中目標(biāo)接收終端的當(dāng)前音頻選擇參數(shù)和網(wǎng)絡(luò)丟包參數(shù)；

15、調(diào)整單元，用于根據(jù)所述網(wǎng)絡(luò)丟包參數(shù)，對所述當(dāng)前音頻選擇參數(shù)進行調(diào)整，得到目標(biāo)音頻選擇參數(shù)；

16、第二獲取單元，用于當(dāng)接收到多個發(fā)送終端發(fā)送的當(dāng)前音頻數(shù)據(jù)時，獲取所述當(dāng)前音頻數(shù)據(jù)的音頻特征；

17、篩選單元，用于基于所述音頻特征和所述目標(biāo)音頻選擇參數(shù)，在所述當(dāng)前音頻數(shù)據(jù)中篩選出所述目標(biāo)接收終端對應(yīng)的至少一個目標(biāo)音頻數(shù)據(jù)；

18、發(fā)送單元，用于將所述目標(biāo)音頻數(shù)據(jù)發(fā)送至所述目標(biāo)接收終端，以保障所述目標(biāo)接收終端與所述發(fā)送終端的當(dāng)前語音通話。

19、可選的，本技術(shù)實施例還可以提供另一種多人語音通話裝置，包括：

20、采集單元，用于采集當(dāng)前語音通話中的音頻信號，得到當(dāng)前音頻數(shù)據(jù)；

21、識別單元，用于在所述當(dāng)前音頻數(shù)據(jù)中識別出所述音頻信號對應(yīng)的語音能量值；

22、預(yù)測單元，用于預(yù)測所述當(dāng)前音頻數(shù)據(jù)中的噪聲能量值，并將所述噪聲能量值和語音能量值作為所述當(dāng)前音頻數(shù)據(jù)的音頻特征；

23、通話單元，用于將所述當(dāng)前音頻數(shù)據(jù)和音頻特征發(fā)送至服務(wù)器，以便所述服務(wù)器基于所述音頻特征和當(dāng)前音頻數(shù)據(jù)確定出目標(biāo)接收終端對應(yīng)的目標(biāo)音頻數(shù)據(jù)，并將所述目標(biāo)音頻數(shù)據(jù)發(fā)送至所述目標(biāo)接收終端。

24、可選的，在一些實施例中，所述調(diào)整單元，具體可以用于將所述網(wǎng)絡(luò)丟包參數(shù)與預(yù)設(shè)丟包參數(shù)閾值進行對比；根據(jù)對比結(jié)果，對所述當(dāng)前音頻選擇參數(shù)進行調(diào)整，得到目標(biāo)音頻選擇參數(shù)。

25、可選的，在一些實施例中，所述調(diào)整單元，具體可以用于當(dāng)所述網(wǎng)絡(luò)丟包參數(shù)大于預(yù)設(shè)丟包參數(shù)閾值時，對所述當(dāng)前音頻選擇參數(shù)進行調(diào)整，得到目標(biāo)音頻選擇參數(shù)；當(dāng)所述網(wǎng)絡(luò)丟包參數(shù)小于或等于所述預(yù)設(shè)丟包參數(shù)閾值時，將所述當(dāng)前音頻選擇參數(shù)替換為預(yù)設(shè)初始音頻選擇參數(shù)，得到目標(biāo)音頻選擇參數(shù)。

26、可選的，在一些實施例中，所述調(diào)整單元，具體可以用于基于預(yù)設(shè)參數(shù)生成函數(shù)，生成所述網(wǎng)絡(luò)丟包參數(shù)對應(yīng)的候選音頻選擇參數(shù)，所述候選音頻選擇參數(shù)包括候選音頻數(shù)量閾值和候選噪聲能量閾值；將所述當(dāng)前音頻數(shù)量閾值替換為所述候選音頻數(shù)量閾值，得到目標(biāo)音頻數(shù)量閾值；將所述當(dāng)前噪聲能量閾值替換為所述候選噪聲能量閾值，得到目標(biāo)噪聲能量閾值，并將所述目標(biāo)音頻數(shù)量閾值和目標(biāo)噪聲能量閾值作為目標(biāo)音頻選擇參數(shù)。

27、可選的，在一些實施例中，所述調(diào)整單元，具體可以用于采用所述音頻數(shù)量生成函數(shù)，生成所述網(wǎng)絡(luò)丟包參數(shù)對應(yīng)的候選音頻數(shù)量閾值，所述音頻數(shù)量生成函數(shù)為單調(diào)遞減函數(shù)；采用所述噪聲能量生成函數(shù)，生成所述網(wǎng)絡(luò)丟包參數(shù)對應(yīng)的候選噪聲能量閾值，所述噪聲能量生成函數(shù)為單調(diào)遞增函數(shù)；將所述候選音頻數(shù)量閾值和所述候選噪聲能量閾值作為所述候選音頻選擇參數(shù)。

28、可選的，在一些實施例中，所述調(diào)整單元，具體可以用于獲取所述候選音頻數(shù)量閾值對應(yīng)的預(yù)設(shè)閾值范圍；當(dāng)所述候選音頻數(shù)量閾值在所述預(yù)設(shè)閾值范圍內(nèi)時，將所述當(dāng)前音頻數(shù)量閾值替換為所述候選音頻數(shù)量閾值，得到目標(biāo)音頻數(shù)量閾值；當(dāng)所述候選音頻數(shù)量閾值在所述預(yù)設(shè)閾值范圍外時，在所述預(yù)設(shè)閾值范圍內(nèi)篩選出基礎(chǔ)音頻數(shù)量閾值，將所述基礎(chǔ)音頻數(shù)量閾值作為所述候選音頻數(shù)量閾值，并將所述當(dāng)前音頻數(shù)量閾值替換為所述候選音頻數(shù)量閾值，得到目標(biāo)音頻數(shù)量閾值。

29、可選的，在一些實施例中，所述篩選單元，具體可以用于在所述當(dāng)前音頻數(shù)據(jù)中篩選出所述噪聲能量值小于或等于所述目標(biāo)噪聲能量閾值的至少一個音頻數(shù)據(jù)，得到所述目標(biāo)接收終端對應(yīng)的候選音頻數(shù)據(jù)；基于所述語音能量值，對所述目標(biāo)接收終端對應(yīng)的候選音頻數(shù)據(jù)進行排序；根據(jù)排序結(jié)果和所述目標(biāo)音頻數(shù)量閾值，在所述候選音頻數(shù)據(jù)中篩選出至少一個音頻數(shù)據(jù)，得到目標(biāo)音頻數(shù)據(jù)。

30、可選的，在一些實施例中，所述篩選單元，具體可以用于基于所述目標(biāo)音頻數(shù)量閾值，確定所述候選音頻數(shù)據(jù)對應(yīng)的目標(biāo)排序范圍；根據(jù)所述排序結(jié)果，在所述候選音頻數(shù)據(jù)中篩選出所述目標(biāo)排序范圍對應(yīng)的至少一個音頻數(shù)據(jù)，得到目標(biāo)音頻數(shù)據(jù)。

31、可選的，在一些實施例中，所述第一獲取單元，具體可以用于獲取在當(dāng)前語音通話中目標(biāo)接收終端的當(dāng)前音頻選擇參數(shù)；接收所述目標(biāo)接收終端返回的所述當(dāng)前音頻選擇參數(shù)對應(yīng)的當(dāng)前周期的當(dāng)前網(wǎng)絡(luò)丟包參數(shù)或所述當(dāng)前周期的下一周期的預(yù)測網(wǎng)絡(luò)丟包參數(shù)；將所述當(dāng)前網(wǎng)絡(luò)丟包參數(shù)或預(yù)測網(wǎng)絡(luò)丟包參數(shù)作為所述目標(biāo)接收終端的網(wǎng)絡(luò)丟包參數(shù)。

32、可選的，在一些實施例中，所述第一發(fā)送單元，具體可以用于當(dāng)接收到所述目標(biāo)接收終端基于所述目標(biāo)音頻數(shù)據(jù)返回的更新后網(wǎng)絡(luò)丟包參數(shù)時，將所述更新后網(wǎng)絡(luò)丟包參數(shù)作為所述網(wǎng)絡(luò)丟包參數(shù)，并將所述目標(biāo)音頻選擇參數(shù)作為所述當(dāng)前音頻選擇參數(shù)；返回執(zhí)行所述根據(jù)所述網(wǎng)絡(luò)丟包參數(shù)，對所述當(dāng)前音頻選擇參數(shù)進行調(diào)整的步驟，直至所述當(dāng)前語音通話結(jié)束為止。

33、可選的，在一些實施例中，所述識別單元，具體可以用于對所述當(dāng)前音頻數(shù)據(jù)進行頻域變換，以得到每一幀音頻中頻點的功率譜值；將所述功率譜值進行融合，得到每一幀音頻對應(yīng)的初始語音能量值；對所述初始語音能量值進行平滑處理，以得到所述音頻信號對應(yīng)的語音能量值。

34、可選的，在一些實施例中，所述識別單元，具體可以用于對所述當(dāng)前音頻數(shù)據(jù)進行分幀，得到每一幀音頻對應(yīng)的時域信號數(shù)據(jù)；對所述時域信號數(shù)據(jù)進行頻域轉(zhuǎn)換，得到每一幀音頻對應(yīng)的頻域信號數(shù)據(jù)；根據(jù)所述頻域信號數(shù)據(jù)，確定出每一幀音頻中頻點的功率譜值。

35、可選的，在一些實施例中，所述預(yù)測單元，具體可以用于將所述功率譜值進行對比，以得到所述頻點的初始噪聲功率譜值；根據(jù)所述初始噪聲功率譜值，計算所述頻點的語音存在概率；將所述語音存在概率與所述功率譜值進行融合，以得到當(dāng)前音頻數(shù)據(jù)中的噪聲能量值。

36、此外，本發(fā)明實施例還提供一種電子設(shè)備，包括處理器和存儲器，所述存儲器存儲有應(yīng)用程序，所述處理器用于運行所述存儲器內(nèi)的應(yīng)用程序?qū)崿F(xiàn)本發(fā)明實施例提供的多人語音通話方法。

37、此外，本發(fā)明實施例還提供一種計算機可讀存儲介質(zhì)，所述計算機可讀存儲介質(zhì)存儲有多條指令，所述指令適于處理器進行加載，以執(zhí)行本發(fā)明實施例所提供的任一種多人語音通話方法中的步驟。

38、此外，本技術(shù)實施例還提供一種計算機程序產(chǎn)品，包括計算機程序或指令，該計算機程序或指令被處理器執(zhí)行時實現(xiàn)本技術(shù)實施例提供的多人語音通話方法中的步驟。

39、本發(fā)明實施例在獲取在當(dāng)前語音通話中目標(biāo)接收終端的當(dāng)前音頻選擇參數(shù)和網(wǎng)絡(luò)丟包參數(shù)后，根據(jù)網(wǎng)絡(luò)丟包參數(shù)，對當(dāng)前音頻選擇參數(shù)進行調(diào)整，得到目標(biāo)音頻選擇參數(shù)，當(dāng)接收到多個發(fā)送終端發(fā)送的當(dāng)前音頻數(shù)據(jù)時，獲取當(dāng)前音頻數(shù)據(jù)的音頻特征，然后，基于音頻特征和所述目標(biāo)音頻選擇參數(shù)，在當(dāng)前音頻數(shù)據(jù)中篩選出目標(biāo)接收終端對應(yīng)的至少一個目標(biāo)音頻數(shù)據(jù)，然后，將目標(biāo)音頻數(shù)據(jù)發(fā)送至目標(biāo)接收終端，以保障目標(biāo)接收終端與發(fā)送終端的當(dāng)前語音通話；由于該方案可以通過表征接收方的傳輸質(zhì)量的網(wǎng)絡(luò)丟包參數(shù)，對音頻選擇參數(shù)進行調(diào)整，使得音頻選擇參數(shù)可以在不同網(wǎng)絡(luò)環(huán)境下自適應(yīng)調(diào)整或調(diào)節(jié)，從而適配不同的網(wǎng)絡(luò)環(huán)境，減少通話卡頓或者搶話失敗的情況發(fā)生，因此，可以提升多人語音通話的通話質(zhì)量。

完整全部詳細技術(shù)資料下載

當(dāng)前第1頁1 2

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：梁俊斌
技術(shù)所有人：騰訊科技（深圳）有限公司
我是此專利的發(fā)明人

上一篇：一種檔案分類柜
上一篇：一種半導(dǎo)體集成電路封裝結(jié)構(gòu)的制作方法

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請點此查看客服電話進行咨詢。
1、王老師：1.數(shù)字信號處理 2.傳感器技術(shù)及應(yīng)用 3.機電一體化產(chǎn)品開發(fā) 4.機械工程測試技術(shù) 5.逆向工程技術(shù)研究
2、王老師：1.機器人 2.嵌入式控制系統(tǒng)開發(fā)
3、孫老師：1.振動信號時頻分析理論與測試系統(tǒng)設(shè)計 2.汽車檢測系統(tǒng)設(shè)計 3.汽車電子控制系統(tǒng)設(shè)計
4、畢老師：機構(gòu)動力學(xué)與控制
5、袁老師：1.計算機視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
如您是高校老師，可以點此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

多人語音通話方法以及相關(guān)設(shè)備與流程