一種評估lte通信系統(tǒng)語音質(zhì)量的方法
【專利摘要】本發(fā)明公開了一種評估LTE通信系統(tǒng)語音質(zhì)量的方法,包括以下步驟:E-Model模型參數(shù)初始化;提取相關(guān)參數(shù);提取語音片段;計(jì)算語音編解碼損耗;計(jì)算時(shí)延損耗;計(jì)算抖動(dòng)損耗;計(jì)算語音評估的MOS分?jǐn)?shù)和傳輸?shù)燃壱蜃覴,并將其換算為相應(yīng)的MOS分?jǐn)?shù)。本發(fā)明將應(yīng)用層RTP和RTCP協(xié)議引入到LTE通信系統(tǒng)的語音質(zhì)量評估方案中,可有效地評估LTE通信系統(tǒng)中時(shí)延抖動(dòng)所造成的語音質(zhì)量損失;將RTCP協(xié)議引入LTE通信系統(tǒng)網(wǎng)絡(luò)包時(shí)延的估計(jì)方法,可有效提高時(shí)延對語音質(zhì)量損失的評估性能;將RTP協(xié)議引入LTE通信系統(tǒng)網(wǎng)絡(luò)包抖動(dòng)的估計(jì)方法,可有效提高抖動(dòng)對語音質(zhì)量損失的評估性能,可自適應(yīng)進(jìn)行調(diào)度控制和無線資源分配。
【專利說明】一種評估LTE通信系統(tǒng)語音質(zhì)量的方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及一種語音質(zhì)量評估技術(shù),特別是一種評估LTE通信系統(tǒng)語音質(zhì)量的方 法。
【背景技術(shù)】
[0002] LTE (Long-Term Evolution,長期演進(jìn))是 XPP (3rd Generation Partnership Project,第三代合作伙伴計(jì)劃)對包括核心網(wǎng)在內(nèi)的第三代移動(dòng)通信網(wǎng)絡(luò)的全面演進(jìn),它 采用了一些先進(jìn)技術(shù),包括正交頻分復(fù)用技術(shù)、多輸入多輸出技術(shù)(MM0)、以波束成型為主 的智能天線技術(shù)、調(diào)制和編碼鏈路自適應(yīng)技術(shù)(AMC)等。在接入網(wǎng)層面,LTE通信系統(tǒng)主要 由空中無線接口和無線接入網(wǎng)兩部分組成。在下行鏈路,LTE通信系統(tǒng)采用正交頻分復(fù)用 多址接入(0FDMA)技術(shù);在上行鏈路,則采用單載波-頻分復(fù)用多址接入(SC-FDMA)技術(shù)。 在核心交換層面,LTE通信系統(tǒng)取消了傳統(tǒng)的電路交換,全面采用IP網(wǎng)絡(luò)來承載語音通信 和其它通信業(yè)務(wù)。LTE通信系統(tǒng)采用了先進(jìn)的無線接入技術(shù)和IP網(wǎng)絡(luò)技術(shù),可顯著提升語 音通信質(zhì)量和數(shù)據(jù)傳輸速率。
[0003] 話音業(yè)務(wù)是通信系統(tǒng)的基礎(chǔ)業(yè)務(wù),話音質(zhì)量是LTE通信系統(tǒng)性能的一項(xiàng)重要指 標(biāo)。為了保證較高的通話質(zhì)量,在LTE通信系統(tǒng)中,通信資源的調(diào)度和分配控制策略變得越 來越重要,這就需要根據(jù)當(dāng)前LTE通信網(wǎng)絡(luò)的語音質(zhì)量對無線資源進(jìn)行靈活的管理。為了 對移動(dòng)通信網(wǎng)絡(luò)的語音質(zhì)量進(jìn)行評價(jià),ITU-T G. 107標(biāo)準(zhǔn)給出了基于E-Model模型的語音 質(zhì)量客觀評估技術(shù),該技術(shù)考慮了通話時(shí)延、回聲、噪聲等語音通信中存在的性能損失,也 在一定程度上考慮了抖動(dòng)、丟包等分組網(wǎng)絡(luò)中特有的問題。下面對現(xiàn)有技術(shù)進(jìn)行描述:
[0004] 一、主觀M0S評價(jià)
[0005] 主觀評價(jià)是通過人的主觀感受來劃分語音質(zhì)量的等級,進(jìn)而衡量語音質(zhì)量的方 法。它直接反映了評價(jià)者對語音質(zhì)量的主觀印象,符合人類對語音質(zhì)量的真實(shí)感受。
[0006] 在MOS (Mean Opinion Scores,平均意見得分)評分法中,參加語音質(zhì)量評價(jià)的測 試人員對待測語音進(jìn)行評分,分?jǐn)?shù)根據(jù)表1分為5個(gè)等級;然后,將所有測試人員的平均分 數(shù)作為所測語音質(zhì)量的M0S分?jǐn)?shù)。由于人的心理等主觀因素以及客觀環(huán)境的不斷變化,每 次測試出的M0S分?jǐn)?shù)結(jié)果都不盡相同,并且存在波動(dòng)。為了抑制這種波動(dòng),參與評分的人數(shù) 需40人以上,而且待測的語音數(shù)據(jù)應(yīng)該包括男聲、女聲以及童聲等各種類型,測試環(huán)境也 要盡量保持相同。主觀評價(jià)要求投入大量的人力,并且需要進(jìn)行多次的測試,過程費(fèi)時(shí)費(fèi)力 且受人主觀感受的影響,難以實(shí)現(xiàn)對語音的實(shí)時(shí)評測。
[0007] 表1 M0S分值標(biāo)準(zhǔn)
[0008]
【權(quán)利要求】
1. 一種評估LTE通信系統(tǒng)語音質(zhì)量的方法,其特征在于:包括以下步驟: A、E-Model模型參數(shù)初始化:從E-Model模型的配置文件中讀取相關(guān)的默認(rèn)參數(shù),并對 E-Model模型進(jìn)行初始化; B、 提取相關(guān)參數(shù):從配置文件和實(shí)時(shí)網(wǎng)絡(luò)包的反饋信息中提取相關(guān)參數(shù),所述的相關(guān) 參數(shù)包括網(wǎng)絡(luò)包的編解碼方式、載荷長度、時(shí)間戳、語音/靜音標(biāo)記以及是否丟包的標(biāo)記, 并進(jìn)行網(wǎng)絡(luò)包的實(shí)時(shí)存儲(chǔ)和處理; C、 提取語音片段:根據(jù)網(wǎng)絡(luò)包的語音/靜音標(biāo)記,提取靜音包之間連續(xù)的語音包作為 一次評估的語音片段; D、 計(jì)算語音編解碼損耗:根據(jù)步驟B中得到的編解碼方式及下表求出的值,并作為 輸出值備用; 各種編碼器的取值表
E、 計(jì)算時(shí)延損耗;根據(jù)網(wǎng)絡(luò)包中的RTCP時(shí)間戳信息,計(jì)算時(shí)延損耗因子Id; 時(shí)延的估計(jì)過程通過傳送三次RTCP包完成:發(fā)送者報(bào)告SR包、接收者報(bào)告RR包、發(fā)送 者報(bào)告SR包;具體步驟如下: E1、在接收端收到的從用戶設(shè)備UE端發(fā)送的第一個(gè)SR包中,記錄UE端SR包生成的開 始時(shí)間ts,以及UE端的處理時(shí)延td_s,;所述的開始時(shí)間ts,記錄在LSR包中,所述的處理時(shí) 延td_sli己錄在DLSR包中; E2、接收端向UE端發(fā)送的RR包中,記錄生成RR包的起始時(shí)間以及接收端的處理時(shí) 延td_CT;所述的起始時(shí)間t"記錄在LSR包中,所述的處理時(shí)延td_"記錄在DLS包R中; E3、接收端收到的從UE端發(fā)送的第二個(gè)SR包中記錄UE端SR包生成的開始時(shí)間 所述的開始時(shí)間記錄在LSR包中; E4、計(jì)算時(shí)延: 從UE端到接收端的單向路徑時(shí)延為 從接收端到UE端的單向路徑時(shí)延為:T2=t'sr-trr-td_rr; UE端的處理時(shí)延為:Td_ue=td_w接收端的處理時(shí)延為:Tdi=td_CT; E5、計(jì)算時(shí)延損傷因子Id; E-Model模型中與時(shí)延有關(guān)的參數(shù)有:平均單路回聲路徑時(shí)延T,四線路徑環(huán)路時(shí)延I; 和無回聲連接中的全程時(shí)延Ta;根據(jù)步驟E4,得到這三個(gè)參數(shù)的求解公式為: Tr=Td-ue+T^+Ti+^=trsr-tsr
至此,將平均單路回聲路徑時(shí)延T,四線路徑環(huán)路時(shí)延I;和無回聲連接中的全程時(shí)延Ta 代入E-Model模型中,即求得時(shí)延損傷因子Id; 式中,SLR為發(fā)送端響度評測值,RLR為接收端響度評測值,TELR為說話者回音響度額 定值,WEPL為加權(quán)回聲通道損耗; F、計(jì)算抖動(dòng)損耗:根據(jù)網(wǎng)絡(luò)包中的RTP時(shí)間戳信息計(jì)算抖動(dòng)損耗因子Ij: RTCP包頭中的抖動(dòng)信息反映了相鄰語音包的時(shí)延抖動(dòng);利用一組語音包的平均抖動(dòng) 和方差對E-Model模型進(jìn)行改進(jìn),提出抖動(dòng)損耗因子L的概念,通過平均抖動(dòng)時(shí)間、抖動(dòng)方 差和語音片段的實(shí)際長度對抖動(dòng)損耗進(jìn)行估計(jì); 進(jìn)行一次語音評估的對象是兩個(gè)靜音包之間的有效語音片段;設(shè)語音包的數(shù)目為n, 記錄的抖動(dòng)分別為i、j2、…、jn,則該語音片段的平均抖動(dòng)J和抖動(dòng)方差D分別為:
其中,a?d為多項(xiàng)式系數(shù),它們通過最小二乘擬合方法來確定,分別取值為:-15. 5、 33. 5、4. 4 和 13. 6 ; G、 計(jì)算E-Model模型中的其余參數(shù),其余參數(shù)采用默認(rèn)值; H、 計(jì)算語音評估的MOS分?jǐn)?shù)和傳輸?shù)燃壱蜃覴,并將其換算為相應(yīng)的MOS分?jǐn)?shù)。
【文檔編號】G10L25/60GK104506387SQ201410830695
【公開日】2015年4月8日 申請日期:2014年12月26日 優(yōu)先權(quán)日:2014年12月26日
【發(fā)明者】陳喆, 殷福亮, 王冰倩, 賀銳 申請人:大連理工大學(xué)