專利名稱:音頻數(shù)據(jù)流的發(fā)送、接收裝置及方法
技術領域:
本發(fā)明涉及通信領域,具體而言,涉及一種音頻數(shù)據(jù)流的發(fā)送、接收裝置及方法。
背景技術:
目前,語音即時通信在很多方面得到了廣泛應用,例如QQ,飛信等即時通信軟件以及能應用于國內外長途電話的SKYEP網(wǎng)絡電話軟件,還有其他各種音視頻聊天軟件。在這些應用中,通話質量會受到網(wǎng)絡環(huán)境以及硬件配置的影響,尤其在基于移動終端的IP電話(Voice over IP,簡稱為VOIP)網(wǎng)絡電話應用中。由于目前我國大部分人使用的移動終端網(wǎng)絡還處于2G時代的GPRS通信,而且移動終端的硬件配置較低導致通話質量較差。盡管現(xiàn)今3G和WIFI網(wǎng)絡發(fā)展迅猛,但是由于用戶需求過剩經(jīng)常會發(fā)生嚴重的網(wǎng)絡擁堵現(xiàn)象。在VOIP音頻通話中,通話質量是影響用戶體驗的至關重要的因素,而在評估通話 質量的各項指標中,噪音又是重大觀察指標之一。VOIP通話噪音的來源以及產生因素是非常復雜的,例如聲音在空氣中傳播時就會加入噪音;還有麥克風錄制時也會產生噪音;除此之外,噪音還可以產生在網(wǎng)絡傳輸、編解碼、音頻預處理等各個環(huán)節(jié)。由于噪音是困擾用戶體驗的重要因素,因此,噪音的消除和抑制是VOIP技術中的一個重大難題。相關技術中采用的噪音去除方法很多,其中,可以包括通過頻譜分析領域的低通濾波以及時域分析領域的經(jīng)驗分析等等。頻譜分析所采用的技術手段是先將聲音的時域信號轉化為頻譜領域的信號,然后過濾掉高頻部分信號以達到抑制噪音的目的;而時域分析領域采用的技術手段是根據(jù)噪音的某種特征去尋找噪音信號,然后將其去除。眾所周知,由于音視頻的數(shù)據(jù)量很大,所以需要對音視頻數(shù)據(jù)進行壓縮。但是壓縮后的數(shù)據(jù)量依舊較大,尤其是視頻數(shù)據(jù),所以VOIP類軟件的數(shù)據(jù)實時性傳輸對網(wǎng)絡帶寬的要求較高。由于目前移動互聯(lián)網(wǎng)的網(wǎng)絡環(huán)境依然很差,針對移動終端如何解決在網(wǎng)絡環(huán)境較差的情形下依然能夠進行實時通話,是我們迫切需要解決的問題之一。一個完整的VOIP網(wǎng)絡電話軟件包含了音頻編碼,解碼,音頻擴大,噪音、回音消除等運算復雜的環(huán)節(jié),如果計算機的CPU無法實時完成這些運算,那么通信的即時性就會受到嚴重影響。隨著移動互聯(lián)網(wǎng)的飛速發(fā)展,移動終端上的VOIP技術又增加了新的需求。然而,目前市場上的移動終端大多受到硬件配置的制約,其計算能力難以滿足VOIP軟件運行的需求,尤其是在此類軟件又要添加即時視頻通信功能的情況下,上述問題就愈發(fā)突出了。因此,移動終端的硬件運算能力不足導致音頻通話無法滿足實時性的要求,也是我們迫切需要解決的問題之一。不僅如此,現(xiàn)今運營商都是按照流量來計算網(wǎng)絡費用的,而且移動終端又是依靠電池作為動力的。因此,當前連接移動互聯(lián)網(wǎng)的移動終端對節(jié)省電和節(jié)省流量的需求很高,但是VOIP軟件的運算量較大以及傳輸?shù)臄?shù)據(jù)量較大,因此,在進行音頻通話時如何節(jié)省電量和網(wǎng)絡流量同樣是我們迫切需要解決的問題之一
發(fā)明內容
本發(fā)明提供了一種音頻數(shù)據(jù)流的發(fā)送、接收裝置及方法,以至少解決相關技術中在使用移動終端進行網(wǎng)絡音頻通話時,通話質量較差,耗費網(wǎng)絡流量和移動終端電量的問題。根據(jù)本發(fā)明的一個方面,提供了一種音頻數(shù)據(jù)流的發(fā)送裝置。根據(jù)本發(fā)明的音頻數(shù)據(jù)流的發(fā)送裝置包括處理模塊,用于對當前采集的待發(fā)送的音頻數(shù)據(jù)流進行劃分,并根據(jù)劃分后的各段音頻數(shù)據(jù)流中的靜音數(shù)據(jù)流執(zhí)行過濾處理并記錄被過濾的數(shù)據(jù)流在待發(fā)送的音頻數(shù)據(jù)流中的位置信息,其中,被過濾的數(shù)據(jù)流是由劃分后的各段音頻數(shù)據(jù)流的能量值確定的;編碼模塊,用于對經(jīng)過處理模塊處理后的音頻數(shù)據(jù)流進行編碼處理;發(fā)送模塊,用于將經(jīng)過編碼模塊處理后的音頻數(shù)據(jù)流以及指示信息進行發(fā)送,其中,該指示信息中攜帶有處理模塊記錄的被過濾的數(shù)據(jù)流在待發(fā)送的音頻數(shù)據(jù)流中的位置。優(yōu)選地,處理模塊包括劃分模塊,用于按照預設單位長度對待發(fā)送的音頻數(shù)據(jù)流 進行劃分;計算模塊,用于分別計算出劃分后的各段音頻數(shù)據(jù)流的能量值;過濾模塊,用于對劃分后的音頻數(shù)據(jù)流的能量值小于預設能量閾值的一段或多段音頻數(shù)據(jù)流執(zhí)行過濾處理;記錄模塊,用于記錄被過濾的數(shù)據(jù)流在待發(fā)送的音頻數(shù)據(jù)流中的位置信息。優(yōu)選地,計算模塊包括設置單元,用于在劃分后的各段音頻數(shù)據(jù)流中設置預設個數(shù)的采樣點;計算單元,用于根據(jù)劃分后的各段音頻數(shù)據(jù)流中設置的預設個數(shù)的采樣點計算出劃分后的各段音頻數(shù)據(jù)流的能量值。優(yōu)選地,過濾模塊包括建立單元,用于以第一預設范圍內的能量值作為橫坐標,以第二預設范圍內的劃分后的音頻數(shù)據(jù)流的段數(shù)為縱坐標,建立劃分后的各段音頻數(shù)據(jù)流的能量值統(tǒng)計直方圖;過濾單元,用于在第一預設范圍內的能量值中選取預設能量閾值,對劃分后的音頻數(shù)據(jù)流的能量值小于預設能量閾值的一段或多段音頻數(shù)據(jù)流執(zhí)行過濾處理。根據(jù)本發(fā)明的另一方面,提供了一種音頻數(shù)據(jù)流的接收裝置。根據(jù)本發(fā)明的音頻數(shù)據(jù)流的接收裝置包括接收模塊,用于接收經(jīng)過編碼處理和過濾處理的音頻數(shù)據(jù)流以及指示信息,其中,過濾處理是根據(jù)劃分后的各段音頻數(shù)據(jù)流的能量值來進行的,指示信息用于指示被過濾的數(shù)據(jù)流在待發(fā)送的音頻數(shù)據(jù)流中的位置;解碼填充模塊,用于在對音頻數(shù)據(jù)流進行解碼處理后,在上述位置上填充靜音數(shù)據(jù),或者,在上述位置上填充靜音數(shù)據(jù)后,對經(jīng)過填充處理后的音頻數(shù)據(jù)流進行解碼處理。根據(jù)本發(fā)明的又一方面,提供了一種音頻數(shù)據(jù)流的發(fā)送方法。根據(jù)本發(fā)明的音頻數(shù)據(jù)流的發(fā)送方法包括對當前采集的待發(fā)送的音頻數(shù)據(jù)流進行劃分,并根據(jù)劃分后的各段音頻數(shù)據(jù)流中的靜音數(shù)據(jù)流執(zhí)行過濾處理并記錄被過濾的數(shù)據(jù)流在待發(fā)送的音頻數(shù)據(jù)流中的位置信息,其中,被過濾的數(shù)據(jù)流是由劃分后的各段音頻數(shù)據(jù)流的能量值確定的;對經(jīng)過處理模塊處理后的音頻數(shù)據(jù)流進行編碼處理;將經(jīng)過編碼模塊處理后的音頻數(shù)據(jù)流以及指示信息進行發(fā)送,其中,該指示信息中攜帶有已經(jīng)記錄的被過濾的數(shù)據(jù)流在待發(fā)送的音頻數(shù)據(jù)流中的位置。優(yōu)選地,對當前采集的待發(fā)送的音頻數(shù)據(jù)流進行劃分,并根據(jù)劃分后的各段音頻數(shù)據(jù)流中的靜音數(shù)據(jù)流執(zhí)行過濾處理并記錄被過濾的數(shù)據(jù)流在待發(fā)送的音頻數(shù)據(jù)流中的位置信息包括按照預設單位長度對待發(fā)送的音頻數(shù)據(jù)流進行劃分;分別計算出劃分后的各段音頻數(shù)據(jù)流的能量值;對劃分后的音頻數(shù)據(jù)流的能量值小于預設能量閾值的一段或多段音頻數(shù)據(jù)流執(zhí)行過濾處理;記錄被過濾的數(shù)據(jù)流在待發(fā)送的音頻數(shù)據(jù)流中的位置信息。優(yōu)選地,分別計算出劃分后的各段音頻數(shù)據(jù)流的能量值包括在劃分后的各段音頻數(shù)據(jù)流中設置預設個數(shù)的采樣點;根據(jù)劃分后的各段音頻數(shù)據(jù)流中設置的預設個數(shù)的采樣點計算出劃分后的各段音頻數(shù)據(jù)流的能量值。優(yōu)選地,對劃分后的音頻數(shù)據(jù)流的能量值小于預設能量閾值的一段或多段音頻數(shù)據(jù)流執(zhí)行過濾處理包括以第一預設范圍內的能量值作為橫坐標,以第二預設范圍內的劃分后的音頻數(shù)據(jù)流的段數(shù)為縱坐標,建立劃分后的各段音頻數(shù)據(jù)流的能量值統(tǒng)計直方圖;在第一預設范圍內的能量值中選取預設能量閾值,對劃分后的音頻數(shù)據(jù)流的能量值小于預設能量閾值的一段或多段音頻數(shù)據(jù)流執(zhí)行過濾處理。根據(jù)本發(fā)明的再一方面,提供了一種音頻數(shù)據(jù)流的接收方法。根據(jù)本發(fā)明的音頻數(shù)據(jù)流的接收方法包括接收經(jīng)過編碼處理和過濾處理的音頻數(shù)據(jù)流以及指示信息,其中,過濾處理是根據(jù)劃分后的各段音頻數(shù)據(jù)流的能量值來進行的, 指示信息用于指示被過濾的數(shù)據(jù)流在待發(fā)送的音頻數(shù)據(jù)流中的位置;在對音頻數(shù)據(jù)流進行解碼處理后,在上述位置上填充靜音數(shù)據(jù),或者,在上述位置上填充靜音數(shù)據(jù)后,對經(jīng)過填充處理后的音頻數(shù)據(jù)流進行解碼處理。通過本發(fā)明,采用對當前采集的待發(fā)送的音頻數(shù)據(jù)流進行劃分,并在劃分后的各段音頻數(shù)據(jù)流中獲取靜音數(shù)據(jù),然后對獲取到的靜音數(shù)據(jù)執(zhí)行過濾處理。在執(zhí)行丟包處理的同時,還需要記錄被丟棄的數(shù)據(jù)在待發(fā)送的音頻數(shù)據(jù)流中的位置信息,由于是在執(zhí)行編碼處理前將數(shù)據(jù)丟棄,不但可以減少編碼和解碼處理的運算量,還可以減少網(wǎng)絡傳輸?shù)臄?shù)據(jù)量,解決了相關技術中在使用移動終端進行網(wǎng)絡音頻通話時,通話質量較差,耗費網(wǎng)絡流量和移動終端電量的問題,進而通過消除噪音數(shù)據(jù)提高了通話質量,降低了網(wǎng)絡流量和移動終端耗電量,減輕了網(wǎng)絡傳輸?shù)膲毫?,減緩網(wǎng)絡延遲。
此處所說明的附圖用來提供對本發(fā)明的進一步理解,構成本申請的一部分,本發(fā)明的示意性實施例及其說明用于解釋本發(fā)明,并不構成對本發(fā)明的不當限定。在附圖中圖I是根據(jù)本發(fā)明實施例的音頻數(shù)據(jù)流的發(fā)送裝置;圖2是根據(jù)本發(fā)明優(yōu)選實施例的音頻數(shù)據(jù)流的發(fā)送裝置;圖3是根據(jù)本發(fā)明優(yōu)選實施例的各音頻數(shù)據(jù)段計算出的能量值的直方圖;圖4是根據(jù)本發(fā)明實施例的音頻數(shù)據(jù)流的接收裝置的結構框圖;圖5是根據(jù)本發(fā)明實施例的音頻數(shù)據(jù)流的發(fā)送方法的流程圖;以及圖6是根據(jù)本發(fā)明實施例的音頻數(shù)據(jù)流的接收方法的流程圖。
具體實施例方式下文中將參考附圖并結合實施例來詳細說明本發(fā)明。需要說明的是,在不沖突的情況下,本申請中的實施例及實施例中的特征可以相互組合。圖I是根據(jù)本發(fā)明實施例的音頻數(shù)據(jù)流的發(fā)送裝置。如圖I所示,該音頻數(shù)據(jù)流的發(fā)送裝置可以包括處理模塊10,用于對當前采集的待發(fā)送的音頻數(shù)據(jù)流進行劃分,并根據(jù)劃分后的各段音頻數(shù)據(jù)流中的靜音數(shù)據(jù)流執(zhí)行過濾處理并記錄被過濾的數(shù)據(jù)流在待發(fā)送的音頻數(shù)據(jù)流中的位置信息,其中,被過濾的數(shù)據(jù)流是由劃分后的各段音頻數(shù)據(jù)流的能量值確定的;編碼模塊20,用于對經(jīng)過處理模塊處理后的音頻數(shù)據(jù)流進行編碼處理;發(fā)送模塊30,用于將經(jīng)過編碼模塊處理后的音頻數(shù)據(jù)流以及指示信息進行發(fā)送,其中,該指示信息中攜帶有處理模塊記錄的被過濾的數(shù)據(jù)流在待發(fā)送的音頻數(shù)據(jù)流中的位置。
相關技術中,在使用移動終端進行網(wǎng)絡音頻通話時,通話質量較差,耗費網(wǎng)絡流量和移動終端電量。例如在使用VOIP的通話過程中,甲和乙正在進行通話,假設甲和乙都需要花費一半的通話時間傾聽對方講話,這個聽的過程是不需要說話的。因此,上述部分音頻數(shù)據(jù)流應該為靜音數(shù)據(jù),當然也可能是背景聲音。但是由于系統(tǒng)原因可能在發(fā)送給對方的音頻數(shù)據(jù)流中夾雜了預想不到的噪音數(shù)據(jù),造成說話時斷時續(xù),即音頻的聲音幅度有一部分是趨于零的??紤]到這些音頻數(shù)據(jù)自帶的噪音并不是VOIP通話所需要傳輸?shù)男畔ⅲ丛撛胍魯?shù)據(jù)為冗余數(shù)據(jù)。如果能將這些冗余數(shù)據(jù)在發(fā)送端執(zhí)行編碼處理前就將其丟掉,不但可以減少網(wǎng)絡傳輸?shù)臄?shù)據(jù)量(即節(jié)省網(wǎng)絡流量),還可以減少編解碼處理的運算量(即節(jié)省移動終端的電量)。采用如圖I所示的裝置,對當前采集的待發(fā)送的音頻數(shù)據(jù)流進行劃分,并在劃分后的各段音頻數(shù)據(jù)流中獲取靜音數(shù)據(jù),然后對獲取到的噪音數(shù)據(jù)執(zhí)行過濾處理。在執(zhí)行過濾處理的同時,還需要記錄被過濾的數(shù)據(jù)在待發(fā)送的音頻數(shù)據(jù)流中的位置信息,由于是在執(zhí)行編碼處理前將數(shù)據(jù)丟棄,不但可以減少編碼和解碼處理的運算量,還可以減少網(wǎng)絡傳輸?shù)臄?shù)據(jù)量,解決了相關技術中在使用移動終端進行網(wǎng)絡音頻通話時,通話質量較差,耗費網(wǎng)絡流量和移動終端電量的問題,進而通過消除噪音數(shù)據(jù)提高了通話質量,降低了網(wǎng)絡流量和移動終端耗電量,減輕了網(wǎng)絡傳輸?shù)膲毫?,減緩網(wǎng)絡延遲。優(yōu)選地,如圖2所示,上述處理模塊10可以包括劃分模塊100,用于按照預設單位長度對待發(fā)送的音頻數(shù)據(jù)流進行劃分;計算模塊102,用于分別計算出劃分后的各段音頻數(shù)據(jù)流的能量值;過濾模塊104,用于對劃分后的音頻數(shù)據(jù)流的能量值小于預設能量閾值的一段或多段音頻數(shù)據(jù)流執(zhí)行過濾處理;記錄模塊106,用于記錄被過濾的數(shù)據(jù)流在待發(fā)送的音頻數(shù)據(jù)流中的位置信息。在優(yōu)選實施例中,首先,在執(zhí)行編碼處理之前可以按照預設單位長度(例如以IOms為單位長度)對音頻數(shù)據(jù)流進行劃分。劃分后的各音頻數(shù)據(jù)段分別進行單獨運算,得出各段音頻數(shù)據(jù)流的能量值。然后將各段音頻數(shù)據(jù)流的能量值與預設能量閾值(例如10)進行比較,將小于預設能量閾值的音頻數(shù)據(jù)段全部丟棄。最后,還要記錄被丟棄的音頻數(shù)據(jù)段在音頻數(shù)據(jù)流中的位置。優(yōu)選地,上述計算模塊102可以包括設置單元(圖中未示出),用于在劃分后的各段音頻數(shù)據(jù)流中設置預設個數(shù)的采樣點;計算單元(圖中未示出),用于根據(jù)劃分后的各段音頻數(shù)據(jù)流中設置的預設個數(shù)的采樣點計算出劃分后的各段音頻數(shù)據(jù)流的能量值。在優(yōu)選實施例中,假設劃分后的音頻數(shù)據(jù)段有n個采樣點數(shù),則該段音頻的能量值可用n個采樣點數(shù)的平方和來表示,公式如下
nE = YjXi,2
0其中,n對應IOms時間長度的音頻采樣點數(shù)。當然,在該優(yōu)選實施例中,還可以將IOms修改為20ms等其它時間長度來計算。在優(yōu)選實施例中,為了簡化運算,可以采用絕對值運算代替平方運算,計算公式如下^ = XKI
{;)優(yōu)選地,過濾模塊104可以包括建立單元(圖中未示出),用于以第一預設范圍內的能量值作為橫坐標,以第二預設范圍內的劃分后的音頻數(shù)據(jù)流的段數(shù)為縱坐標,建立劃分后的各段音頻數(shù)據(jù)流的能量值統(tǒng)計直方圖;過濾單元(圖中未示出),用于在第一預設范圍內的能量值中選取預設能量閾值,對劃分后的音頻數(shù)據(jù)流的能量值小于預設能量閾值的一段或多段音頻數(shù)據(jù)流執(zhí)行過濾處理。下面結合圖3所示的優(yōu)選實施例對上述優(yōu)選實施過程做進一步的描述。圖3是根據(jù)本發(fā)明優(yōu)選實施例的各音頻數(shù)據(jù)段計算出的能量值的直方圖。如圖3所示,對于整個音頻數(shù)據(jù)流,以IOms時間長度的音頻數(shù)據(jù)作為計算單位進行能量計算。 然后對每個能量值E建立直方圖進行統(tǒng)一歸類,由于相關技術中的計算機軟件中普遍以16bit數(shù)據(jù)來表示每個采樣的音頻數(shù)據(jù),所以為了建立更加直觀的直方圖,可以將能量值E映射到0-100的數(shù)值范圍。最終可以建立一個橫坐標(單位E)數(shù)值范圍為0到100,縱坐標(單位段)數(shù)值范圍為0到正無窮(在該優(yōu)選實施例中縱坐標的數(shù)值范圍為0 100)的直方圖,其中,將橫坐標分成100個單元,每個單元為I的數(shù)值單位,具體計算公式如下
n £ = wo |Yn|在該優(yōu)選實施例中,如圖3所示,橫坐標10對應的縱坐標為57,即在被統(tǒng)計的音頻數(shù)據(jù)流中,有57段長度IOms的音頻數(shù)據(jù)的能量值為10??梢愿鶕?jù)經(jīng)驗設置一個能量閾值,能量小于該閾值的所有音頻數(shù)據(jù)段都被當作冗余信息而丟掉,從而達到了減少數(shù)據(jù)傳輸量的目的。需要說明的是,上述預設能量閾值越大,丟掉的語音數(shù)據(jù)越多;預設能量閾值越小,丟掉的語音數(shù)據(jù)就越少。由于直方圖中已經(jīng)計算出每個音頻數(shù)據(jù)段的能量值大小,以及已被統(tǒng)計的單位數(shù)量,可以通過丟包率(需要丟掉百分之多少的語音數(shù)據(jù))來計算出上述能量閾值。而丟包率的大小可以根據(jù)網(wǎng)絡狀態(tài)實時改變,由此可以動態(tài)計算出適當?shù)哪芰块撝?。不僅如此,為了讓直方圖更加直觀而把數(shù)值范圍映射到了 0-100,只要是通過直方圖來尋找這些偏靜音數(shù)據(jù)均在本發(fā)明的保護范圍之內,而與映射值范圍無關。圖4是根據(jù)本發(fā)明實施例的音頻數(shù)據(jù)流的接收裝置的結構框圖。如圖4所示,該音頻數(shù)據(jù)流的接收裝置可以包括接收模塊40,用于接收經(jīng)過編碼處理和過濾處理的音頻數(shù)據(jù)流以及指示信息,其中,過濾處理是根據(jù)劃分后的各段音頻數(shù)據(jù)流的能量值來進行的,指示信息用于指示被過濾的數(shù)據(jù)流在待發(fā)送的音頻數(shù)據(jù)流中的位置;解碼填充模塊50,用于在對音頻數(shù)據(jù)流進行解碼處理后,在上述位置上填充靜音數(shù)據(jù),或者,在上述位置上填充靜音數(shù)據(jù)后,對經(jīng)過填充處理后的音頻數(shù)據(jù)流進行解碼處理。在優(yōu)選實施例中,接收端可以采用靜音數(shù)據(jù)(例如0)彌補發(fā)送端經(jīng)過過濾處理后丟棄的語音數(shù)據(jù),即采用靜音數(shù)據(jù)代替了噪音數(shù)據(jù)和背景音數(shù)據(jù),從而可以達到去除噪音的目的,至于那些未被替代的音頻信息中夾雜的噪音,可以采用相關技術中的方法進行去除處理。本發(fā)明提供的技術方案大大改善了網(wǎng)絡語音通話的通話質量,尤其是網(wǎng)絡欠佳的情況下提升效果尤為明顯。在優(yōu)選實施例中,可以選擇在解碼處理之后填充靜音數(shù)據(jù),也可以選擇在解碼處理之前填充靜音數(shù)據(jù),只是前一種方式會增加解碼的運算量。圖5是根據(jù)本發(fā)明實施例的音頻數(shù)據(jù)流的發(fā)送方法的流程圖。如圖5所示,該方法可以包括以下處理步驟步驟S502 :對當前采集的待發(fā)送的音頻數(shù)據(jù)流進行劃分,并根據(jù)劃分后的各段音頻數(shù)據(jù)流中的靜音數(shù)據(jù)流執(zhí)行過濾處理并記錄被過濾的數(shù)據(jù)流在待發(fā)送的音頻數(shù)據(jù)流中的位置信息,其中,被過濾的數(shù)據(jù)流是由劃分后的各段音頻數(shù)據(jù)流的能量值確定的;步驟S504 :對經(jīng)過處理模塊處理后的音頻數(shù)據(jù)流進行編碼處理;步驟S506 :將經(jīng)過編碼模塊處理后的音頻數(shù)據(jù)流以及指示信息進行發(fā)送,其中,該指示信息中攜帶有已經(jīng)記錄的被過濾的數(shù)據(jù)流在待發(fā)送的音頻數(shù)據(jù)流中的位置。 在優(yōu)選實施例中,在編碼處理之前就選擇性的丟掉冗余的音頻信息,編碼處理的音頻數(shù)據(jù)量就會大大減少,從而減輕了音頻編碼的運算壓力。而且既然編碼處理的編碼數(shù)據(jù)量減少了,那么與之相對應的解碼處理的解碼數(shù)據(jù)量也會相應減少。對于運算能力有限的移動終端而言,因為編碼和解碼運算量的減少意味著移動終端可以將更多的運算能力分配到其他處理流程中,從而提高移動終端的整體運算性能。不僅如此,對于依靠電池作為動力的移動終端而言,上述方法還能夠極大程度的節(jié)省電量,延長了電池的使用時間。還有由于編碼處理后的數(shù)據(jù)量減少,需要網(wǎng)絡傳輸?shù)臄?shù)據(jù)量也會隨之減少,從而達到了節(jié)省網(wǎng)絡流量的目的。尤其在網(wǎng)絡擁堵、網(wǎng)絡丟包率較高,影響通話質量的情況下,通過減少需要網(wǎng)絡傳輸?shù)臄?shù)據(jù)量,可以降低網(wǎng)絡擁堵時的丟包率,極大提高了音頻通話質量。優(yōu)選地,在步驟S502中,對當前采集的待發(fā)送的音頻數(shù)據(jù)流進行劃分,并根據(jù)劃分后的各段音頻數(shù)據(jù)流中的靜音數(shù)據(jù)流執(zhí)行過濾處理并記錄被過濾的數(shù)據(jù)流在待發(fā)送的音頻數(shù)據(jù)流中的位置信息可以包括以下操作步驟SI :按照預設單位長度對待發(fā)送的音頻數(shù)據(jù)流進行劃分;步驟S2 :分別計算出劃分后的各段音頻數(shù)據(jù)流的能量值;步驟S3 :對劃分后的音頻數(shù)據(jù)流的能量值小于預設能量閾值的一段或多段音頻數(shù)據(jù)流執(zhí)行過濾處理;步驟S4 :記錄被過濾的數(shù)據(jù)流在待發(fā)送的音頻數(shù)據(jù)流中的位置信息。優(yōu)選地,在步驟S2中,分別計算出劃分后的各段音頻數(shù)據(jù)流的能量值可以包括以下步驟步驟S21 :在劃分后的各段音頻數(shù)據(jù)流中設置預設個數(shù)的采樣點;步驟S22 :根據(jù)劃分后的各段音頻數(shù)據(jù)流中設置的預設個數(shù)的采樣點計算出劃分后的各段音頻數(shù)據(jù)流的能量值。優(yōu)選地,在步驟S3中,對劃分后的音頻數(shù)據(jù)流的能量值小于預設能量閾值的一段或多段音頻數(shù)據(jù)流執(zhí)行過濾處理可以包括以下步驟步驟S31 :以第一預設范圍內的能量值作為橫坐標,以第二預設范圍內的劃分后的音頻數(shù)據(jù)流的段數(shù)為縱坐標,建立劃分后的各段音頻數(shù)據(jù)流的能量值統(tǒng)計直方圖;步驟S32 :在第一預設范圍內的能量值中選取預設能量閾值,對劃分后的音頻數(shù)據(jù)流的能量值小于預設能量閾值的一段或多段音頻數(shù)據(jù)流執(zhí)行過濾處理。
圖6是根據(jù)本發(fā)明實施例的音頻數(shù)據(jù)流的接收方法的流程圖。如圖6所示,該方法可以包括以下處理步驟步驟S602 :接收經(jīng)過編碼處理和過濾處理的音頻數(shù)據(jù)流以及指示信息,其中,過濾處理是根據(jù)劃分后的各段音頻數(shù)據(jù)流的能量值來進行的,指示信息用于指示被過濾的數(shù)據(jù)流在待發(fā)送的音頻數(shù)據(jù)流中的位置;步驟S604 :在對音頻數(shù)據(jù)流進行解碼處理后,在上述位置上填充靜音數(shù)據(jù),或者,在上述位置上填充靜音數(shù)據(jù)后,對經(jīng)過填充處理后的音頻數(shù)據(jù)流進行解碼處理。在優(yōu)選實施例中,接收端為了保持通話時長的一致性,可以用0來填補在發(fā)送端被丟棄的冗余數(shù)據(jù)。原本這些冗余數(shù)據(jù)本身就夾雜了背景音和/或噪音,現(xiàn)在用0來代替意味著是用靜音數(shù)據(jù)代替了這些噪音數(shù)據(jù),從而達到了去掉噪音的效果。從以上的描述中,可以看出,上述實施例實現(xiàn)了如下技術效果(需要說明的是這些效果是某些優(yōu)選實施例可以達到的效果)采用本發(fā)明提供的技術方案,在使用網(wǎng)絡和對方進行通話時,實時性問題得到了很大程度的緩解;同時由于在網(wǎng)絡數(shù)據(jù)傳輸之前就選擇性的丟包,減少數(shù)據(jù)傳輸量,確保重要數(shù)據(jù)能夠最大程度的傳輸至接收端,從而提高了通話質量。顯然,本領域的技術人員應該明白,上述的本發(fā)明的各模塊或各步驟可以用通用的計算裝置來實現(xiàn),它們可以集中在單個的計算裝置上,或者分布在多個計算裝置所組成的網(wǎng)絡上,可選地,它們可以用計算裝置可執(zhí)行的程序代碼來實現(xiàn),從而,可以將它們存儲在存儲裝置中由計算裝置來執(zhí)行,并且在某些情況下,可以以不同于此處的順序執(zhí)行所示出或描述的步驟,或者將它們分別制作成各個集成電路模塊,或者將它們中的多個模塊或步驟制作成單個集成電路模塊來實現(xiàn)。這樣,本發(fā)明不限制于任何特定的硬件和軟件結合。以上所述僅為本發(fā)明的優(yōu)選實施例而已,并不用于限制本發(fā)明,對于本領域的技術人員來說,本發(fā)明可以有各種更改和變化。凡在本發(fā)明的精神和原則之內,所作的任何修改、等同替換、改進等,均應包含在本發(fā)明的保護范圍之內。
權利要求
1.一種音頻數(shù)據(jù)流的發(fā)送裝置,其特征在于,包括 處理模塊,用于對當前采集的待發(fā)送的音頻數(shù)據(jù)流進行劃分,井根據(jù)劃分后的各段音頻數(shù)據(jù)流中的靜音數(shù)據(jù)流執(zhí)行過濾處理并記錄被過濾的數(shù)據(jù)流在所述待發(fā)送的音頻數(shù)據(jù)流中的位置信息,其中,所述被過濾的數(shù)據(jù)流是由所述劃分后的各段音頻數(shù)據(jù)流的能量值確定的; 編碼模塊,用于對經(jīng)過所述處理模塊處理后的音頻數(shù)據(jù)流進行編碼處理; 發(fā)送模塊,用于將經(jīng)過所述編碼模塊處理后的音頻數(shù)據(jù)流以及指示信息進行發(fā)送,其中,所述指示信息中攜帯有所述處理模塊記錄的所述被過濾的數(shù)據(jù)流在所述待發(fā)送的音頻數(shù)據(jù)流中的位置。
2.根據(jù)權利要求I所述的裝置,其特征在于,所述處理模塊包括 劃分模塊,用于按照預設單位長度對所述待發(fā)送的音頻數(shù)據(jù)流進行劃分; 計算模塊,用于分別計算出所述劃分后的各段音頻數(shù)據(jù)流的能量值; 過濾模塊,用于對劃分后的音頻數(shù)據(jù)流的能量值小于預設能量閾值的一段或多段音頻數(shù)據(jù)流執(zhí)行過濾處理; 記錄模塊,用于記錄所述被過濾的數(shù)據(jù)流在所述待發(fā)送的音頻數(shù)據(jù)流中的位置信息。
3.根據(jù)權利要求2所述的裝置,其特征在于,所述計算模塊包括 設置單元,用于在所述劃分后的各段音頻數(shù)據(jù)流中設置預設個數(shù)的采樣點; 計算單元,用于根據(jù)所述劃分后的各段音頻數(shù)據(jù)流中設置的所述預設個數(shù)的采樣點計算出所述劃分后的各段音頻數(shù)據(jù)流的能量值。
4.根據(jù)權利要求3所述的裝置,其特征在于,所述過濾模塊包括 建立単元,用于以第一預設范圍內的能量值作為橫坐標,以第二預設范圍內的劃分后的音頻數(shù)據(jù)流的段數(shù)為縱坐標,建立所述劃分后的各段音頻數(shù)據(jù)流的能量值統(tǒng)計直方圖;過濾單元,用于在所述第一預設范圍內的能量值中選取所述預設能量閾值,對劃分后的音頻數(shù)據(jù)流的能量值小于所述預設能量閾值的一段或多段音頻數(shù)據(jù)流執(zhí)行過濾處理。
5.一種音頻數(shù)據(jù)流的接收裝置,其特征在于,包括 接收模塊,用于接收經(jīng)過編碼處理和過濾處理的音頻數(shù)據(jù)流以及指示信息,其中,所述過濾處理是根據(jù)劃分后的各段音頻數(shù)據(jù)流的能量值來進行的,所述指示信息用于指示所述被過濾的數(shù)據(jù)流在所述待發(fā)送的音頻數(shù)據(jù)流中的位置; 解碼填充模塊,用于在對所述音頻數(shù)據(jù)流進行解碼處理后,在所述位置上填充靜音數(shù)據(jù),或者,在所述位置上填充靜音數(shù)據(jù)后,對經(jīng)過填充處理后的音頻數(shù)據(jù)流進行解碼處理。
6.一種音頻數(shù)據(jù)流的發(fā)送方法,其特征在于,包括 對當前采集的待發(fā)送的音頻數(shù)據(jù)流進行劃分,井根據(jù)劃分后的各段音頻數(shù)據(jù)流中的靜音數(shù)據(jù)流執(zhí)行過濾處理并記錄被過濾的數(shù)據(jù)流在所述待發(fā)送的音頻數(shù)據(jù)流中的位置信息,其中,所述被過濾的數(shù)據(jù)流是由所述劃分后的各段音頻數(shù)據(jù)流的能量值確定的; 對經(jīng)過所述處理模塊處理后的音頻數(shù)據(jù)流進行編碼處理; 將經(jīng)過所述編碼模塊處理后的音頻數(shù)據(jù)流以及指示信息進行發(fā)送,其中,所述指示信息中攜帯有已經(jīng)記錄的所述被過濾的數(shù)據(jù)流在所述待發(fā)送的音頻數(shù)據(jù)流中的位置。
7.根據(jù)權利要求6所述的方法,其特征在干,對所述當前采集的待發(fā)送的音頻數(shù)據(jù)流進行劃分,井根據(jù)劃分后的各段音頻數(shù)據(jù)流中的靜音數(shù)據(jù)流執(zhí)行過濾處理并記錄被過濾的數(shù)據(jù)流在所述待發(fā)送的音頻數(shù)據(jù)流中的位置信息包括 按照預設單位長度對所述待發(fā)送的音頻數(shù)據(jù)流進行劃分; 分別計算出所述劃分后的各段音頻數(shù)據(jù)流的能量值; 對劃分后的音頻數(shù)據(jù)流的能量值小于預設能量閾值的一段或多段音頻數(shù)據(jù)流執(zhí)行過濾處理; 記錄所述被過濾的數(shù)據(jù)流在所述待發(fā)送的音頻數(shù)據(jù)流中的位置信息。
8.根據(jù)權利要求7所述的方法,其特征在于,分別計算出所述劃分后的各段音頻數(shù)據(jù)流的能量值包括 在所述劃分后的各段音頻數(shù)據(jù)流中設置預設個數(shù)的采樣點; 根據(jù)所述劃分后的各段音頻數(shù)據(jù)流中設置的所述預設個數(shù)的采樣點計算出所述劃分后的各段音頻數(shù)據(jù)流的能量值。
9.根據(jù)權利要求8所述的方法,其特征在干,對劃分后的音頻數(shù)據(jù)流的能量值小于預設能量閾值的一段或多段音頻數(shù)據(jù)流執(zhí)行過濾處理包括 以第一預設范圍內的能量值作為橫坐標,以第二預設范圍內的劃分后的音頻數(shù)據(jù)流的段數(shù)為縱坐標,建立所述劃分后的各段音頻數(shù)據(jù)流的能量值統(tǒng)計直方圖; 在所述第一預設范圍內的能量值中選取所述預設能量閾值,對劃分后的音頻數(shù)據(jù)流的能量值小于所述預設能量閾值的一段或多段音頻數(shù)據(jù)流執(zhí)行過濾處理。
10.一種音頻數(shù)據(jù)流的接收方法,其特征在于,包括 接收經(jīng)過編碼處理和過濾處理的音頻數(shù)據(jù)流以及指示信息,其中,所述過濾處理是根據(jù)劃分后的各段音頻數(shù)據(jù)流的能量值來進行的,所述指示信息用于指示所述被過濾的數(shù)據(jù)流在所述待發(fā)送的音頻數(shù)據(jù)流中的位置; 在對所述音頻數(shù)據(jù)流進行解碼處理后,在所述位置上填充靜音數(shù)據(jù),或者,在所述位置上填充靜音數(shù)據(jù)后,對經(jīng)過填充處理后的音頻數(shù)據(jù)流進行解碼處理。
全文摘要
本發(fā)明公開了一種音頻數(shù)據(jù)流的發(fā)送、接收裝置及方法,在上述裝置中,處理模塊,用于對當前采集的待發(fā)送的音頻數(shù)據(jù)流進行劃分,并根據(jù)劃分后的各段音頻數(shù)據(jù)流中的靜音數(shù)據(jù)流執(zhí)行過濾處理并記錄被過濾的數(shù)據(jù)流在待發(fā)送的音頻數(shù)據(jù)流中的位置信息,其中,被過濾的數(shù)據(jù)流是由劃分后的各段音頻數(shù)據(jù)流的能量值確定的;編碼模塊,用于對經(jīng)過處理模塊處理后的音頻數(shù)據(jù)流進行編碼處理;發(fā)送模塊,用于將經(jīng)過編碼模塊處理后的音頻數(shù)據(jù)流以及指示信息進行發(fā)送,其中,該指示信息中攜帶有處理模塊記錄的被過濾的數(shù)據(jù)流在待發(fā)送的音頻數(shù)據(jù)流中的位置。根據(jù)本發(fā)明提供的技術方案,通過消除噪音數(shù)據(jù)提高了通話質量,降低了網(wǎng)絡流量和移動終端耗電量。
文檔編號G10L19/02GK102800318SQ20121021777
公開日2012年11月28日 申請日期2012年6月27日 優(yōu)先權日2012年6月27日
發(fā)明者梁捷, 俞永福, 何小鵬, 朱順炎, 溫才燚 申請人:優(yōu)視科技有限公司