本發(fā)明涉及通信,具體涉及一種多人語音通話方法以及相關(guān)設(shè)備。
背景技術(shù):
1、近年來,隨著互聯(lián)網(wǎng)技術(shù)的飛速發(fā)展,語音通話也變得越來越方便,尤其是多人語音通話。多人語音通話涉及到多方通過不同設(shè)備(終端)進行音頻信號采集以及各種音頻處理。由于人耳對不同聲源同時發(fā)聲的辨識能力有限,因此,需要對不同參與方的音頻數(shù)據(jù)(信號)做篩選,從而保證多人語音通話下的通話質(zhì)量?,F(xiàn)有的多人語音通話往往通過各個音頻數(shù)據(jù)的語音特征和預(yù)設(shè)選擇參數(shù)進行音頻數(shù)據(jù)篩選,并將篩選出的目標(biāo)音頻數(shù)據(jù)發(fā)送至接收終端,從而實現(xiàn)多人語音通話。
2、在對現(xiàn)有技術(shù)的研究和實踐過程中,本技術(shù)的發(fā)明人對于現(xiàn)有的多人語音通話方式來說,多人語音通話中的不同接收終端所處的網(wǎng)絡(luò)環(huán)境可能不同,而且,同一接收終端在不同時段下的網(wǎng)絡(luò)環(huán)境也可能不同,預(yù)設(shè)選擇參數(shù)就可能存在不適配網(wǎng)絡(luò)環(huán)境的風(fēng)險,使得多人語音通話中的參與方在聽感上出現(xiàn)卡頓或者搶話失敗的情況,因此,導(dǎo)致多人語音通話的通話質(zhì)量較低。
技術(shù)實現(xiàn)思路
1、本發(fā)明實施例提供一種多人語音通話方法以及相關(guān)設(shè)備,相關(guān)設(shè)備可以包括多人語音通話裝置、電子設(shè)備和計算機可讀存儲介質(zhì),可以提高多人語音通話的通話質(zhì)量。
2、一種多人語音通話方法,包括:
3、獲取在當(dāng)前語音通話中目標(biāo)接收終端的當(dāng)前音頻選擇參數(shù)和網(wǎng)絡(luò)丟包參數(shù);
4、根據(jù)所述網(wǎng)絡(luò)丟包參數(shù),對所述當(dāng)前音頻選擇參數(shù)進行調(diào)整,得到目標(biāo)音頻選擇參數(shù);
5、當(dāng)接收到多個發(fā)送終端發(fā)送的當(dāng)前音頻數(shù)據(jù)時,獲取所述當(dāng)前音頻數(shù)據(jù)的音頻特征;
6、基于所述音頻特征和所述目標(biāo)音頻選擇參數(shù),在所述當(dāng)前音頻數(shù)據(jù)中篩選出所述目標(biāo)接收終端對應(yīng)的至少一個目標(biāo)音頻數(shù)據(jù);
7、將所述目標(biāo)音頻數(shù)據(jù)發(fā)送至所述目標(biāo)接收終端,以保障所述目標(biāo)接收終端與所述發(fā)送終端的當(dāng)前語音通話。
8、可選的,本技術(shù)實施例還可以提供一種多人語音通話方法,包括:
9、采集當(dāng)前語音通話中的音頻信號,得到當(dāng)前音頻數(shù)據(jù);
10、在所述當(dāng)前音頻數(shù)據(jù)中識別出所述音頻信號對應(yīng)的語音能量值;
11、預(yù)測所述當(dāng)前音頻數(shù)據(jù)中的噪聲能量值,并將所述噪聲能量值和語音能量值作為所述當(dāng)前音頻數(shù)據(jù)的音頻特征;
12、將所述當(dāng)前音頻數(shù)據(jù)和音頻特征發(fā)送至服務(wù)器,以便所述服務(wù)器基于所述音頻特征和當(dāng)前音頻數(shù)據(jù)確定出目標(biāo)接收終端對應(yīng)的目標(biāo)音頻數(shù)據(jù),并將所述目標(biāo)音頻數(shù)據(jù)發(fā)送至所述目標(biāo)接收終端。
13、相應(yīng)的,本發(fā)明實施例提供一種多人語音通話裝置,包括:
14、第一獲取單元,用于獲取在當(dāng)前語音通話中目標(biāo)接收終端的當(dāng)前音頻選擇參數(shù)和網(wǎng)絡(luò)丟包參數(shù);
15、調(diào)整單元,用于根據(jù)所述網(wǎng)絡(luò)丟包參數(shù),對所述當(dāng)前音頻選擇參數(shù)進行調(diào)整,得到目標(biāo)音頻選擇參數(shù);
16、第二獲取單元,用于當(dāng)接收到多個發(fā)送終端發(fā)送的當(dāng)前音頻數(shù)據(jù)時,獲取所述當(dāng)前音頻數(shù)據(jù)的音頻特征;
17、篩選單元,用于基于所述音頻特征和所述目標(biāo)音頻選擇參數(shù),在所述當(dāng)前音頻數(shù)據(jù)中篩選出所述目標(biāo)接收終端對應(yīng)的至少一個目標(biāo)音頻數(shù)據(jù);
18、發(fā)送單元,用于將所述目標(biāo)音頻數(shù)據(jù)發(fā)送至所述目標(biāo)接收終端,以保障所述目標(biāo)接收終端與所述發(fā)送終端的當(dāng)前語音通話。
19、可選的,本技術(shù)實施例還可以提供另一種多人語音通話裝置,包括:
20、采集單元,用于采集當(dāng)前語音通話中的音頻信號,得到當(dāng)前音頻數(shù)據(jù);
21、識別單元,用于在所述當(dāng)前音頻數(shù)據(jù)中識別出所述音頻信號對應(yīng)的語音能量值;
22、預(yù)測單元,用于預(yù)測所述當(dāng)前音頻數(shù)據(jù)中的噪聲能量值,并將所述噪聲能量值和語音能量值作為所述當(dāng)前音頻數(shù)據(jù)的音頻特征;
23、通話單元,用于將所述當(dāng)前音頻數(shù)據(jù)和音頻特征發(fā)送至服務(wù)器,以便所述服務(wù)器基于所述音頻特征和當(dāng)前音頻數(shù)據(jù)確定出目標(biāo)接收終端對應(yīng)的目標(biāo)音頻數(shù)據(jù),并將所述目標(biāo)音頻數(shù)據(jù)發(fā)送至所述目標(biāo)接收終端。
24、可選的,在一些實施例中,所述調(diào)整單元,具體可以用于將所述網(wǎng)絡(luò)丟包參數(shù)與預(yù)設(shè)丟包參數(shù)閾值進行對比;根據(jù)對比結(jié)果,對所述當(dāng)前音頻選擇參數(shù)進行調(diào)整,得到目標(biāo)音頻選擇參數(shù)。
25、可選的,在一些實施例中,所述調(diào)整單元,具體可以用于當(dāng)所述網(wǎng)絡(luò)丟包參數(shù)大于預(yù)設(shè)丟包參數(shù)閾值時,對所述當(dāng)前音頻選擇參數(shù)進行調(diào)整,得到目標(biāo)音頻選擇參數(shù);當(dāng)所述網(wǎng)絡(luò)丟包參數(shù)小于或等于所述預(yù)設(shè)丟包參數(shù)閾值時,將所述當(dāng)前音頻選擇參數(shù)替換為預(yù)設(shè)初始音頻選擇參數(shù),得到目標(biāo)音頻選擇參數(shù)。
26、可選的,在一些實施例中,所述調(diào)整單元,具體可以用于基于預(yù)設(shè)參數(shù)生成函數(shù),生成所述網(wǎng)絡(luò)丟包參數(shù)對應(yīng)的候選音頻選擇參數(shù),所述候選音頻選擇參數(shù)包括候選音頻數(shù)量閾值和候選噪聲能量閾值;將所述當(dāng)前音頻數(shù)量閾值替換為所述候選音頻數(shù)量閾值,得到目標(biāo)音頻數(shù)量閾值;將所述當(dāng)前噪聲能量閾值替換為所述候選噪聲能量閾值,得到目標(biāo)噪聲能量閾值,并將所述目標(biāo)音頻數(shù)量閾值和目標(biāo)噪聲能量閾值作為目標(biāo)音頻選擇參數(shù)。
27、可選的,在一些實施例中,所述調(diào)整單元,具體可以用于采用所述音頻數(shù)量生成函數(shù),生成所述網(wǎng)絡(luò)丟包參數(shù)對應(yīng)的候選音頻數(shù)量閾值,所述音頻數(shù)量生成函數(shù)為單調(diào)遞減函數(shù);采用所述噪聲能量生成函數(shù),生成所述網(wǎng)絡(luò)丟包參數(shù)對應(yīng)的候選噪聲能量閾值,所述噪聲能量生成函數(shù)為單調(diào)遞增函數(shù);將所述候選音頻數(shù)量閾值和所述候選噪聲能量閾值作為所述候選音頻選擇參數(shù)。
28、可選的,在一些實施例中,所述調(diào)整單元,具體可以用于獲取所述候選音頻數(shù)量閾值對應(yīng)的預(yù)設(shè)閾值范圍;當(dāng)所述候選音頻數(shù)量閾值在所述預(yù)設(shè)閾值范圍內(nèi)時,將所述當(dāng)前音頻數(shù)量閾值替換為所述候選音頻數(shù)量閾值,得到目標(biāo)音頻數(shù)量閾值;當(dāng)所述候選音頻數(shù)量閾值在所述預(yù)設(shè)閾值范圍外時,在所述預(yù)設(shè)閾值范圍內(nèi)篩選出基礎(chǔ)音頻數(shù)量閾值,將所述基礎(chǔ)音頻數(shù)量閾值作為所述候選音頻數(shù)量閾值,并將所述當(dāng)前音頻數(shù)量閾值替換為所述候選音頻數(shù)量閾值,得到目標(biāo)音頻數(shù)量閾值。
29、可選的,在一些實施例中,所述篩選單元,具體可以用于在所述當(dāng)前音頻數(shù)據(jù)中篩選出所述噪聲能量值小于或等于所述目標(biāo)噪聲能量閾值的至少一個音頻數(shù)據(jù),得到所述目標(biāo)接收終端對應(yīng)的候選音頻數(shù)據(jù);基于所述語音能量值,對所述目標(biāo)接收終端對應(yīng)的候選音頻數(shù)據(jù)進行排序;根據(jù)排序結(jié)果和所述目標(biāo)音頻數(shù)量閾值,在所述候選音頻數(shù)據(jù)中篩選出至少一個音頻數(shù)據(jù),得到目標(biāo)音頻數(shù)據(jù)。
30、可選的,在一些實施例中,所述篩選單元,具體可以用于基于所述目標(biāo)音頻數(shù)量閾值,確定所述候選音頻數(shù)據(jù)對應(yīng)的目標(biāo)排序范圍;根據(jù)所述排序結(jié)果,在所述候選音頻數(shù)據(jù)中篩選出所述目標(biāo)排序范圍對應(yīng)的至少一個音頻數(shù)據(jù),得到目標(biāo)音頻數(shù)據(jù)。
31、可選的,在一些實施例中,所述第一獲取單元,具體可以用于獲取在當(dāng)前語音通話中目標(biāo)接收終端的當(dāng)前音頻選擇參數(shù);接收所述目標(biāo)接收終端返回的所述當(dāng)前音頻選擇參數(shù)對應(yīng)的當(dāng)前周期的當(dāng)前網(wǎng)絡(luò)丟包參數(shù)或所述當(dāng)前周期的下一周期的預(yù)測網(wǎng)絡(luò)丟包參數(shù);將所述當(dāng)前網(wǎng)絡(luò)丟包參數(shù)或預(yù)測網(wǎng)絡(luò)丟包參數(shù)作為所述目標(biāo)接收終端的網(wǎng)絡(luò)丟包參數(shù)。
32、可選的,在一些實施例中,所述第一發(fā)送單元,具體可以用于當(dāng)接收到所述目標(biāo)接收終端基于所述目標(biāo)音頻數(shù)據(jù)返回的更新后網(wǎng)絡(luò)丟包參數(shù)時,將所述更新后網(wǎng)絡(luò)丟包參數(shù)作為所述網(wǎng)絡(luò)丟包參數(shù),并將所述目標(biāo)音頻選擇參數(shù)作為所述當(dāng)前音頻選擇參數(shù);返回執(zhí)行所述根據(jù)所述網(wǎng)絡(luò)丟包參數(shù),對所述當(dāng)前音頻選擇參數(shù)進行調(diào)整的步驟,直至所述當(dāng)前語音通話結(jié)束為止。
33、可選的,在一些實施例中,所述識別單元,具體可以用于對所述當(dāng)前音頻數(shù)據(jù)進行頻域變換,以得到每一幀音頻中頻點的功率譜值;將所述功率譜值進行融合,得到每一幀音頻對應(yīng)的初始語音能量值;對所述初始語音能量值進行平滑處理,以得到所述音頻信號對應(yīng)的語音能量值。
34、可選的,在一些實施例中,所述識別單元,具體可以用于對所述當(dāng)前音頻數(shù)據(jù)進行分幀,得到每一幀音頻對應(yīng)的時域信號數(shù)據(jù);對所述時域信號數(shù)據(jù)進行頻域轉(zhuǎn)換,得到每一幀音頻對應(yīng)的頻域信號數(shù)據(jù);根據(jù)所述頻域信號數(shù)據(jù),確定出每一幀音頻中頻點的功率譜值。
35、可選的,在一些實施例中,所述預(yù)測單元,具體可以用于將所述功率譜值進行對比,以得到所述頻點的初始噪聲功率譜值;根據(jù)所述初始噪聲功率譜值,計算所述頻點的語音存在概率;將所述語音存在概率與所述功率譜值進行融合,以得到當(dāng)前音頻數(shù)據(jù)中的噪聲能量值。
36、此外,本發(fā)明實施例還提供一種電子設(shè)備,包括處理器和存儲器,所述存儲器存儲有應(yīng)用程序,所述處理器用于運行所述存儲器內(nèi)的應(yīng)用程序?qū)崿F(xiàn)本發(fā)明實施例提供的多人語音通話方法。
37、此外,本發(fā)明實施例還提供一種計算機可讀存儲介質(zhì),所述計算機可讀存儲介質(zhì)存儲有多條指令,所述指令適于處理器進行加載,以執(zhí)行本發(fā)明實施例所提供的任一種多人語音通話方法中的步驟。
38、此外,本技術(shù)實施例還提供一種計算機程序產(chǎn)品,包括計算機程序或指令,該計算機程序或指令被處理器執(zhí)行時實現(xiàn)本技術(shù)實施例提供的多人語音通話方法中的步驟。
39、本發(fā)明實施例在獲取在當(dāng)前語音通話中目標(biāo)接收終端的當(dāng)前音頻選擇參數(shù)和網(wǎng)絡(luò)丟包參數(shù)后,根據(jù)網(wǎng)絡(luò)丟包參數(shù),對當(dāng)前音頻選擇參數(shù)進行調(diào)整,得到目標(biāo)音頻選擇參數(shù),當(dāng)接收到多個發(fā)送終端發(fā)送的當(dāng)前音頻數(shù)據(jù)時,獲取當(dāng)前音頻數(shù)據(jù)的音頻特征,然后,基于音頻特征和所述目標(biāo)音頻選擇參數(shù),在當(dāng)前音頻數(shù)據(jù)中篩選出目標(biāo)接收終端對應(yīng)的至少一個目標(biāo)音頻數(shù)據(jù),然后,將目標(biāo)音頻數(shù)據(jù)發(fā)送至目標(biāo)接收終端,以保障目標(biāo)接收終端與發(fā)送終端的當(dāng)前語音通話;由于該方案可以通過表征接收方的傳輸質(zhì)量的網(wǎng)絡(luò)丟包參數(shù),對音頻選擇參數(shù)進行調(diào)整,使得音頻選擇參數(shù)可以在不同網(wǎng)絡(luò)環(huán)境下自適應(yīng)調(diào)整或調(diào)節(jié),從而適配不同的網(wǎng)絡(luò)環(huán)境,減少通話卡頓或者搶話失敗的情況發(fā)生,因此,可以提升多人語音通話的通話質(zhì)量。