專(zhuān)利名稱(chēng):一種即時(shí)語(yǔ)音通信方法
技術(shù)領(lǐng)域:
本軟件給用戶提供了一種方法,可以對(duì)滿足高保真語(yǔ)音通信的質(zhì)量。
背景技術(shù):
目前,現(xiàn)代信息技術(shù)的發(fā)展及應(yīng)用越來(lái)越廣泛,網(wǎng)絡(luò)上的語(yǔ)音通信技術(shù)即網(wǎng)絡(luò)電話技術(shù)在現(xiàn)代科技領(lǐng)域的應(yīng)用也日趨深入,對(duì)網(wǎng)絡(luò)語(yǔ)音通信質(zhì)量的要求也越來(lái)越高,這樣就需要優(yōu)質(zhì)的語(yǔ)音編碼技術(shù)與高效的網(wǎng)絡(luò)傳輸技術(shù)的有機(jī)結(jié)合。消費(fèi)者對(duì)網(wǎng)絡(luò)電話的最基本的要求是通話清晰,目前網(wǎng)絡(luò)的語(yǔ)音通信軟件普遍存在傳輸延遲與失真的問(wèn)題。
影響網(wǎng)絡(luò)即時(shí)通信的話音質(zhì)量因素有很多,其中帶寬和網(wǎng)絡(luò)環(huán)境的是原因之一,而語(yǔ)音編解碼技術(shù)和落地運(yùn)營(yíng)商的選擇(話音的落地路由的質(zhì)量)也是影響話音質(zhì)量的關(guān)鍵因素。
發(fā)明內(nèi)容
本發(fā)明的目的是針對(duì)現(xiàn)有問(wèn)題的上述不足,優(yōu)化了MPEG-4語(yǔ)音編碼算法。并將其整合在網(wǎng)絡(luò)通信模塊,以降低了信號(hào)延遲,減小了信號(hào)的失真。
本發(fā)明的一種即時(shí)語(yǔ)音通信方法,主要針對(duì)用于局域網(wǎng)辦公環(huán)境的語(yǔ)音通信進(jìn)行優(yōu)化,其特征在包含以下步驟
步驟1:音頻信號(hào)采集,即使用錄音設(shè)備對(duì)聲音的激勵(lì)信號(hào)進(jìn)行采集,并通過(guò)windows自帶的windowsAPI函數(shù)完成對(duì)音頻數(shù)據(jù)的采樣、量化等基本處理;
步驟2:語(yǔ)音編碼,即首先將輸入的音頻數(shù)據(jù)進(jìn)行分頻處理,并將不同碼率的音頻數(shù)據(jù)分塊,采用不同碼率的音頻編碼方法將語(yǔ)音數(shù)據(jù)編碼處理;
步驟3:語(yǔ)音信息傳輸,即通過(guò)網(wǎng)絡(luò)將音頻數(shù)據(jù)分幀傳輸至接收端;
步驟4:語(yǔ)音解碼,即以幀為單位進(jìn)行,主要對(duì)碼流進(jìn)行解碼;
步驟5:音頻回放,即針對(duì)解碼后所得的相應(yīng)參數(shù),根據(jù)語(yǔ)音產(chǎn)生原理,合成語(yǔ)音。通過(guò)本發(fā)明的這種方法可以實(shí)現(xiàn)的有益效果有優(yōu)化的編碼算法減小了語(yǔ)音信號(hào)的失真,有效降低了傳輸?shù)难舆t。這是一款專(zhuān)用于要求高清網(wǎng)絡(luò)語(yǔ)音通信的用戶,提供給用戶在進(jìn)行網(wǎng)絡(luò)語(yǔ)音傳輸過(guò)程中失真小、延遲小的高保真語(yǔ)音通信質(zhì)量。軟件包括了一個(gè)可執(zhí)行文件、高效網(wǎng)絡(luò)傳輸技術(shù)Socket傳輸模塊、及優(yōu)化的高保真語(yǔ)音編碼算法MPEG-4。通過(guò)在網(wǎng)絡(luò)傳輸模塊中寫(xiě)入對(duì)語(yǔ)音編碼模塊的應(yīng)用程序,將兩大模塊結(jié)合,進(jìn)而完成音頻通信功能。
圖l:即時(shí)語(yǔ)音通信流程圖;圖2:優(yōu)化語(yǔ)音編碼流程;圖3:網(wǎng)絡(luò)通信流程。
具體實(shí)施例方式
下面結(jié)合附圖對(duì)本發(fā)明進(jìn)行更詳細(xì)的闡述。
如圖1所示, 一個(gè)完整的音頻通信程序要完成以下工作
語(yǔ)音信息的采集、音頻數(shù)據(jù)的編碼、將處理后的音頻數(shù)據(jù)進(jìn)行壓縮打包發(fā)送、接收音頻數(shù)據(jù)、音頻數(shù)據(jù)的解碼、語(yǔ)音信息的輸出。
為了使本發(fā)明的目的、技術(shù)方案即優(yōu)點(diǎn)更加清楚明白,以下結(jié)合上述通信工程,給出具體實(shí)例,對(duì)本發(fā)明進(jìn)行進(jìn)一步的詳細(xì)說(shuō)明。
1. 音頻信息的采集。錄音設(shè)備對(duì)聲音的激勵(lì)信號(hào)進(jìn)行采集,輸出設(shè)備對(duì)對(duì)解碼后的激勵(lì)信號(hào)進(jìn)行回放。音頻的采集和回放兩個(gè)基本處理過(guò)程采用直接、高效的波形輸出方法,這種方法包含在Windows機(jī)制之下,更具推廣性。音頻采集及回放部分使用windows API函數(shù),完成對(duì)音頻數(shù)據(jù)的基本處理,如采樣,量化等。
2. 音頻數(shù)據(jù)的編碼與解碼。經(jīng)過(guò)音頻采集模塊進(jìn)行初步處理后的數(shù)據(jù)難以保證高保真的
通信要求。通過(guò)語(yǔ)音編碼模塊對(duì)音頻數(shù)據(jù)進(jìn)行深度處理。
如圖2所示,左側(cè)是本發(fā)明音頻數(shù)據(jù)的編碼流程圖、右側(cè)是本發(fā)明音頻數(shù)據(jù)的解碼流程圖。由于音頻數(shù)據(jù)的編碼和解碼流程近似,所以此處進(jìn)行對(duì)比說(shuō)明。
首先將輸入的音頻數(shù)據(jù)進(jìn)行分頻處理,并將不同碼率的音頻數(shù)據(jù)分塊,采用不同碼率的音頻編碼方法將語(yǔ)音數(shù)據(jù)編碼處理,將處理后的音頻數(shù)據(jù)分幀,傳輸至網(wǎng)絡(luò)傳輸模塊。
本發(fā)明標(biāo)準(zhǔn)化了不同碼率從2kbit/s到高于64kbit/s范圍的音頻編碼。為了在整個(gè)碼率范圍內(nèi)實(shí)現(xiàn)最好的音頻效果,并同時(shí)提供額外的函數(shù)功能,語(yǔ)音編碼技術(shù)和通用的音頻編碼技術(shù)同時(shí)整和在一個(gè)公用的框架中。在低碼率的語(yǔ)音編碼通過(guò)諧音矢量激勵(lì)編碼和碼激勵(lì)線性預(yù)測(cè)來(lái)實(shí)現(xiàn),其中,諧音矢量激勵(lì)編碼用于碼流在2kbit/s到4kbit/s的語(yǔ)音編碼,碼激勵(lì)線性預(yù)測(cè)用于碼流在2kbit/s到25kbit/s的語(yǔ)音編碼。此外諧音矢量激勵(lì)編碼能在其可變碼率模式下實(shí)現(xiàn)平均碼流下降到1.2kbit/s的語(yǔ)音編碼。碼率在更高情況下應(yīng)用音頻變換編碼技術(shù)變換編碼。通常在這一區(qū)域的音頻信號(hào)的采樣碼率從8kHz開(kāi)始。
從低碼率的編碼開(kāi)始,逐步向通用音頻編碼器中加入增強(qiáng)部分。這樣一來(lái),編碼質(zhì)量和音頻帶寬都可以得到提高。編碼算法具有一定的抗信道誤碼的能力,且不會(huì)引入大的干擾。另外,如果信道衰減很大,或傳輸?shù)膸耆珌G失,解碼器能在最少損失話音質(zhì)量的情況下隱去所丟失的幀。提供了較低速的高質(zhì)量的低延遲的語(yǔ)音編碼,是當(dāng)前較理想的編碼算法。編碼器是基于碼激勵(lì)線性預(yù)測(cè)聲碼器模型的。運(yùn)算的幀長(zhǎng)為10ms,相應(yīng)于抽樣率為8kHz的語(yǔ)音數(shù)據(jù)流的80個(gè)樣值。對(duì)于每10ms的一幀,語(yǔ)音信號(hào)經(jīng)過(guò)分析,得到編碼參數(shù)。
3. 音頻信號(hào)的傳輸。經(jīng)過(guò)高保真編碼算法處理后的音頻數(shù)據(jù),通過(guò)網(wǎng)絡(luò)傳輸模塊發(fā)送至接收端。采用數(shù)據(jù)報(bào)式類(lèi)型的傳輸方式。
如圖4所示,給出了數(shù)據(jù)報(bào)方式傳輸?shù)倪^(guò)程。
負(fù)責(zé)接收連接的服務(wù)端Socket模塊該程序作為服務(wù)器網(wǎng)絡(luò)端口。在該模塊中,設(shè)置緩存中音頻的結(jié)構(gòu)與本地計(jì)算機(jī)具體參數(shù)(音頻格式、通道數(shù)、采樣碼率等)。
負(fù)責(zé)接收/發(fā)送數(shù)據(jù)的客戶端Socket模塊對(duì)套接字的發(fā)送數(shù)據(jù)和接收數(shù)據(jù)進(jìn)行消息處理。簡(jiǎn)單的重載基礎(chǔ)類(lèi)的接收和發(fā)送函數(shù)。
該模塊中,設(shè)計(jì)了具體的傳輸協(xié)議面向無(wú)連接的用戶數(shù)據(jù)報(bào)傳輸協(xié)議,形成數(shù)據(jù)報(bào),校驗(yàn)和用于檢査傳輸中是否出現(xiàn)錯(cuò)誤,數(shù)據(jù)報(bào)長(zhǎng)度包含五個(gè)域的字節(jié)數(shù)。
4. 音頻信號(hào)的輸出。解碼是以幀為單位進(jìn)行,主要是對(duì)碼流進(jìn)行解碼。解碼完成后,得到相應(yīng)的參數(shù),并根據(jù)語(yǔ)音產(chǎn)生的原理,合成語(yǔ)音。其主要部分大致有參數(shù)解碼、后濾波處理、丟幀處理。音頻的解碼過(guò)程,在解碼器端解出激勵(lì)信號(hào)與合成濾波器參數(shù)。重建語(yǔ)音信號(hào)是將激勵(lì)信號(hào)通過(guò)短時(shí)合成濾波器而得到的。
在本發(fā)明中,首先將音頻數(shù)據(jù)中按照不同碼率進(jìn)行分塊分幀,然后將多個(gè)碼率幀的音頻數(shù)據(jù)進(jìn)行編碼處理,最后將處理后的數(shù)據(jù)發(fā)送給接收端進(jìn)行解碼和音頻數(shù)據(jù)的回復(fù)接收。由此可知,本發(fā)明的基本傳輸單元是不同碼率幀。這樣就解決了傳統(tǒng)的對(duì)于音頻數(shù)據(jù)不能進(jìn)行完整編碼的弊端,進(jìn)而優(yōu)化了語(yǔ)音傳輸?shù)氖д妗?br>
權(quán)利要求
1. 一種即時(shí)語(yǔ)音通信方法,主要針對(duì)用于局域網(wǎng)辦公環(huán)境的語(yǔ)音通信進(jìn)行優(yōu)化,其特征在包含以下步驟步驟1音頻信號(hào)采集,即使用錄音設(shè)備對(duì)聲音的激勵(lì)信號(hào)進(jìn)行采集,并通過(guò)windows自帶的windows API函數(shù)完成對(duì)音頻數(shù)據(jù)的采樣、量化等基本處理;步驟2語(yǔ)音編碼,即首先將輸入的音頻數(shù)據(jù)進(jìn)行分頻處理,并將不同碼率的音頻數(shù)據(jù)分塊,采用不同碼率的音頻編碼方法將語(yǔ)音數(shù)據(jù)編碼處理;步驟3語(yǔ)音信息傳輸,即通過(guò)網(wǎng)絡(luò)將音頻數(shù)據(jù)分幀傳輸至接收端;步驟4語(yǔ)音解碼,即以幀為單位進(jìn)行,主要對(duì)碼流進(jìn)行解碼;步驟5音頻回放,即針對(duì)解碼后所得的相應(yīng)參數(shù),根據(jù)語(yǔ)音產(chǎn)生原理,合成語(yǔ)音。
2. 如權(quán)利要求1所述的一種即時(shí)語(yǔ)音通信方法,其特征在于,所述語(yǔ)音編碼步驟,標(biāo)準(zhǔn)化了 從2kbit/s到高于64kbit/s范圍的不同碼率的音頻編碼。
3. 如權(quán)利要求1所述的一種即時(shí)語(yǔ)音通信方法,其特征在于,所述語(yǔ)音編碼步驟,在低碼率 的語(yǔ)音編碼通過(guò)諧音矢量激勵(lì)編碼和碼激勵(lì)線性預(yù)測(cè)來(lái)實(shí)現(xiàn),其中,諧音矢量激勵(lì)編碼用 于碼流在2kbit/s到4kbit/s的語(yǔ)音編碼,碼激勵(lì)線性預(yù)測(cè)用于碼流在2kbit/s到25kbit/s的語(yǔ) 音編碼;碼率在更高情況下應(yīng)用音頻變換編碼技術(shù)變換編碼。
4. 如權(quán)利要求1所述的一種即時(shí)語(yǔ)音通信方法,其特征在于,所述語(yǔ)音編碼步驟,從低碼率 的編碼開(kāi)始,逐步向通用音頻編碼器中加入增強(qiáng)部分。
5. 如權(quán)利要求l所述的一種即時(shí)語(yǔ)音通信方法,其特征在于,所述語(yǔ)音信息傳輸步驟,其基 本傳輸單元是不同碼率幀。
全文摘要
網(wǎng)絡(luò)上的語(yǔ)音通信技術(shù)即網(wǎng)絡(luò)電話技術(shù)在現(xiàn)代科技領(lǐng)域的應(yīng)用日趨深入,對(duì)網(wǎng)絡(luò)語(yǔ)音通信質(zhì)量的要求也越來(lái)越高,這樣就需要優(yōu)質(zhì)的語(yǔ)音編碼技術(shù)與高效的網(wǎng)絡(luò)傳輸技術(shù)的有機(jī)結(jié)合。根據(jù)語(yǔ)音通信模塊與網(wǎng)絡(luò)傳輸模塊的整合,設(shè)計(jì)優(yōu)質(zhì)的網(wǎng)絡(luò)語(yǔ)音傳輸技術(shù)。在此背景下研究并設(shè)計(jì)了一個(gè)網(wǎng)絡(luò)語(yǔ)音通信的軟件平臺(tái)。本發(fā)明通過(guò)將音頻數(shù)據(jù)中不同碼率的數(shù)據(jù)采用針對(duì)的編碼處理方法,然后將處理后的數(shù)據(jù)發(fā)送給接收端,這樣音頻數(shù)據(jù)處理方法保證了對(duì)整個(gè)語(yǔ)音碼率范圍內(nèi)的數(shù)據(jù)進(jìn)行處理,從而保證了通常碼率的語(yǔ)音傳輸中出現(xiàn)的失真現(xiàn)象。本設(shè)計(jì)應(yīng)用Socket編程技術(shù)完成網(wǎng)絡(luò)通信的功能模塊,有效地降低了網(wǎng)絡(luò)傳輸中的延遲。
文檔編號(hào)H04M7/00GK101478616SQ20081018853
公開(kāi)日2009年7月8日 申請(qǐng)日期2008年12月19日 優(yōu)先權(quán)日2008年12月19日
發(fā)明者璽 遇 申請(qǐng)人:深圳市神舟電腦股份有限公司