本發(fā)明涉及語(yǔ)音數(shù)據(jù)處理
技術(shù)領(lǐng)域:
,特別涉及一種基于客戶語(yǔ)音情感的客服服務(wù)質(zhì)量評(píng)價(jià)方法及系統(tǒng)。
背景技術(shù):
:在現(xiàn)代生活中,每天我們都會(huì)接到大量的推銷(xiāo)電話,內(nèi)容覆蓋股票、貸款、房產(chǎn)等內(nèi)容,背后都是有公司提供callcenter服務(wù)。這些公司每天生成大量的客服錄音文件,為了考核客服人員,一般需要另外雇傭質(zhì)檢人員手工聽(tīng)取錄音文件。然而,質(zhì)檢人員往往只是抽查部分錄音,既浪費(fèi)人力又容易遺漏有用信息。事實(shí)上,如何能夠從錄音文件中分析出客戶的情感變化,以評(píng)價(jià)客服的服務(wù)質(zhì)量是一種能夠?qū)崿F(xiàn)自動(dòng)考核克服的有用方法?,F(xiàn)有的技術(shù)中,目前的情感識(shí)別研究還是基于單個(gè)人的說(shuō)話錄音,比如臺(tái)州學(xué)院的趙小明和張石清提出的專(zhuān)利“基于壓縮感知的魯棒性語(yǔ)音情感識(shí)別方法”,江蘇大學(xué)提出的專(zhuān)利“非特定人語(yǔ)音情感識(shí)別方法及系統(tǒng)”等,都沒(méi)有考慮對(duì)話中一個(gè)人的情感和另外一個(gè)人存在著某種關(guān)系。因此,并不適用于考核客服人員的服務(wù)質(zhì)量。技術(shù)實(shí)現(xiàn)要素:本發(fā)明的目的在于提供一種基于客戶語(yǔ)音情感的客服服務(wù)質(zhì)量評(píng)價(jià)方法及系統(tǒng),以解決現(xiàn)有的客服評(píng)價(jià)方法需依賴人工檢測(cè)所造成的效率較低、有效性較差的問(wèn)題。為實(shí)現(xiàn)上述目的,本發(fā)明提供了一種基于客戶語(yǔ)音情感的客服服務(wù)質(zhì)量評(píng)價(jià)方法,包括以下步驟:獲取錄音文件并提取得到其中的客戶錄音;對(duì)所述客戶錄音進(jìn)行處理得到代表客戶初期情緒和最終情緒的語(yǔ)音片段;根據(jù)初期情緒和最終情緒的語(yǔ)音片段的情感差異評(píng)價(jià)對(duì)應(yīng)的客服的服務(wù)質(zhì)量。較佳地,具體包括:將所述客戶錄音分隔得到不含雜音的語(yǔ)音片段序列;然后從所述語(yǔ)音片段序列中選出代表客戶初期情緒和最終情緒的語(yǔ)音片段。較佳地,獲取錄音文件后,還包括分割出客服錄音及客戶錄音后,截取客服錄音的一個(gè)片段,識(shí)別客服身份。較佳地,截取客服錄音的一個(gè)片段后,提取其中的mfcc特征,利用高斯模型識(shí)別客服身份。較佳地,將客戶錄音分隔得到語(yǔ)音片段序列的過(guò)程包括:s21:根據(jù)客戶錄音的頻率及強(qiáng)度的不同,標(biāo)注有聲語(yǔ)音片段和靜音語(yǔ)音片段;s22:從所述客戶錄音中分隔出有聲語(yǔ)音片段;s23:識(shí)別出所述有聲語(yǔ)音片段中的雜音片段并刪除;s24:將剩余的有聲語(yǔ)音片段對(duì)應(yīng)的數(shù)據(jù)組合作為所述語(yǔ)音片段序列。較佳地,進(jìn)一步包括:獲取所述語(yǔ)音片段序列中每個(gè)語(yǔ)音片段的時(shí)長(zhǎng);則初期情緒的語(yǔ)音片段的選取方法為:選取所述語(yǔ)音片段序列中的前k個(gè)語(yǔ)音片段作為代表客戶初期情緒的語(yǔ)音片段,該k個(gè)語(yǔ)音片段滿足:k個(gè)語(yǔ)音片段的時(shí)長(zhǎng)總和小于等于t,當(dāng)所述語(yǔ)音片段序列中的第一個(gè)語(yǔ)音片段時(shí)長(zhǎng)大于t時(shí),則將第一個(gè)語(yǔ)音片段作為代表客戶初期情緒的語(yǔ)音片段;最終情緒的語(yǔ)音片段的選取方法為:選取所述語(yǔ)音片段序列中的后l個(gè)語(yǔ)音片段作為代表客戶最終情緒的語(yǔ)音片段,該l個(gè)語(yǔ)音片段滿足:l個(gè)語(yǔ)音片段的時(shí)長(zhǎng)總和小于等于t,當(dāng)所述語(yǔ)音片段序列中的最后一個(gè)語(yǔ)音片段時(shí)長(zhǎng)大于t時(shí),則將該最后一個(gè)語(yǔ)音片段作為代表客戶最終情緒的語(yǔ)音片段;其中,k、l均為正整數(shù),t為預(yù)設(shè)的語(yǔ)音時(shí)長(zhǎng)閾值。較佳地,進(jìn)一步包括:分別提取所述初期情緒和最終情緒的語(yǔ)音片段的聲學(xué)特征,并采用情感識(shí)別算法分析所述聲學(xué)特征,得到客戶的初期情感特征和最終情感特征。較佳地,進(jìn)一步包括:為所述初期情感特征和最終情感特征分別賦予情感權(quán)值,得到初期情感值rs和最終情感值ts,采用(ts-rs)作為情感差異來(lái)評(píng)價(jià)對(duì)應(yīng)的客服的服務(wù)質(zhì)量。較佳地,還包括獲取基本情感分類(lèi)表,并在所述基本情感分類(lèi)表中查找所述初期情感特征和最終情感特征分別對(duì)應(yīng)的預(yù)設(shè)權(quán)值,將預(yù)設(shè)權(quán)值作為情感權(quán)值分別對(duì)應(yīng)賦予給所述初期情感特征和最終情感特征。本發(fā)明還提供了一種基于客戶語(yǔ)音情感的客服服務(wù)質(zhì)量評(píng)價(jià)系統(tǒng),包括:錄音文件預(yù)處理模塊,用于獲取錄音文件并提取得到其中的客戶錄音;語(yǔ)音片段提取模塊,用于獲取所述客戶錄音并處理得到代表客戶初期情緒和最終情緒的語(yǔ)音片段;服務(wù)質(zhì)量評(píng)價(jià)模塊,用于根據(jù)初期情緒和最終情緒的語(yǔ)音片段進(jìn)行分析,得到兩者的情感差異以評(píng)價(jià)對(duì)應(yīng)的客服的服務(wù)質(zhì)量。本發(fā)明具有以下有益效果:通過(guò)對(duì)錄音文件中對(duì)話的語(yǔ)音進(jìn)行分離,再使用單個(gè)人(客戶)的情感識(shí)別算法,從對(duì)話錄音中解析出客戶的情感序列,通過(guò)分析情感序列的情感的變化程度來(lái)評(píng)價(jià)客服的服務(wù)質(zhì)量,實(shí)現(xiàn)自動(dòng)進(jìn)行客服的服務(wù)質(zhì)量的評(píng)價(jià)。附圖說(shuō)明圖1為本發(fā)明方法基本流程圖;圖2為一優(yōu)選實(shí)施例提供的基于客戶語(yǔ)音情感的客服服務(wù)質(zhì)量評(píng)價(jià)方法流程圖;圖3為具體實(shí)施例的原始錄音文件數(shù)據(jù)波形圖;圖4為具體實(shí)施例獲取的客服錄音的數(shù)據(jù)波形圖;圖5為具體實(shí)施例提取的客服錄音的片段的數(shù)據(jù)波形圖;圖6為優(yōu)選實(shí)施例將提取的片段的客戶錄音分隔得到語(yǔ)音片段序列的流程圖;圖7為優(yōu)選實(shí)施例中處理后得到的客戶語(yǔ)音對(duì)應(yīng)的語(yǔ)音片段序列;圖8為進(jìn)一步優(yōu)選實(shí)施例中對(duì)錄音片段提取聲學(xué)特征的結(jié)構(gòu)示意圖;圖9為優(yōu)選實(shí)施例基于客戶語(yǔ)音情感的客服服務(wù)質(zhì)量評(píng)價(jià)系統(tǒng)組成圖。具體實(shí)施方式以下將結(jié)合本發(fā)明的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整的描述和討論,顯然,這里所描述的僅僅是本發(fā)明的一部分實(shí)例,并不是全部的實(shí)例,基于本發(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒(méi)有做出創(chuàng)造性勞動(dòng)的前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明的保護(hù)范圍。為了便于對(duì)本發(fā)明實(shí)施例的理解,下面將結(jié)合附圖以具體實(shí)施例為例作進(jìn)一步的解釋說(shuō)明,且各個(gè)實(shí)施例不構(gòu)成對(duì)本發(fā)明實(shí)施例的限定。本實(shí)施例提供了一種基于客戶語(yǔ)音情感的客服服務(wù)質(zhì)量評(píng)價(jià)方法,如圖1所示,該方法包括以下步驟:a.獲取錄音文件并提取得到其中的客戶錄音;b.對(duì)客戶錄音進(jìn)行處理得到代表客戶初期情緒和最終情緒的語(yǔ)音片段;c.根據(jù)初期情緒和最終情緒的語(yǔ)音片段的情感差異評(píng)價(jià)對(duì)應(yīng)的客服的服務(wù)質(zhì)量。該方法不需要手工聽(tīng)取錄音,可完全自動(dòng)進(jìn)行評(píng)價(jià)客服質(zhì)量;且服務(wù)質(zhì)量評(píng)價(jià)綜合考慮最終結(jié)果和服務(wù)難度(具體通過(guò)最終情緒與初期情緒的差異的大小即可判斷客戶情緒的變化,通過(guò)初期情緒即可有效地判斷服務(wù)難度),因而評(píng)價(jià)方法更為客觀。在一優(yōu)選實(shí)施例中,上述過(guò)程進(jìn)一步包括將所述客戶錄音分隔得到不含雜音的語(yǔ)音片段序列;然后從上述語(yǔ)音片段序列中選出代表客戶初期情緒和最終情緒的語(yǔ)音片段。這個(gè)過(guò)程可以剔除錄音文件中的非客戶聲音的雜音,進(jìn)而提高后續(xù)進(jìn)行情感分析的準(zhǔn)確度。在另一優(yōu)選實(shí)施例中,獲取錄音文件后,還包括分割出客服錄音及客戶錄音后,截取客服錄音的一個(gè)片段,識(shí)別客服身份。通過(guò)自動(dòng)識(shí)別客服的身份,進(jìn)而方便對(duì)后續(xù)該客服的服務(wù)質(zhì)量進(jìn)行評(píng)價(jià)。進(jìn)一步的,如圖2所示,本實(shí)施例的一種優(yōu)選實(shí)施例中,上述方法具體地包括以下步驟:s1:獲取錄音文件,并分割出客服錄音及客戶錄音;s2:截取客服錄音的一個(gè)片段,識(shí)別客服身份,以及將客戶錄音分隔得到語(yǔ)音片段序列;s3:從所述語(yǔ)音片段序列中選出代表客戶初期情緒和最終情緒的語(yǔ)音片段;s4:識(shí)別代表客戶初期情緒和最終情緒的語(yǔ)音片段的情感特征,獲得客戶初期情感特征和最終情感特征;s5:根據(jù)初期情感特征和最終情感特征的差異評(píng)價(jià)對(duì)應(yīng)的客服的服務(wù)質(zhì)量。其中,這里的步驟s2中,識(shí)別客服身份與分隔得到語(yǔ)音片段序列兩個(gè)過(guò)程可以先后進(jìn)行也可同時(shí)進(jìn)行,可根據(jù)方法具體應(yīng)用時(shí)的需要而自定義設(shè)置。此外,識(shí)別客服身份的過(guò)程也可在其他實(shí)施例中單獨(dú)完成,而不必整合在步驟s2中。本實(shí)施例的方法通過(guò)首先根據(jù)錄音文件中不同的人物而分割出客服錄音及客戶錄音,再對(duì)客戶錄音進(jìn)行情緒的識(shí)別、判斷及分析,實(shí)現(xiàn)了充分考慮對(duì)話中一個(gè)人的情感與另外一個(gè)人存在關(guān)系的情況下的對(duì)客戶情感變化的分析。并基于客戶初期情感和最終情感進(jìn)行比較,通過(guò)兩者的差異來(lái)評(píng)價(jià)對(duì)應(yīng)的客服的服務(wù)質(zhì)量,這種方式實(shí)現(xiàn)了基于情感變化的自動(dòng)的客服服務(wù)質(zhì)量評(píng)價(jià),進(jìn)而實(shí)現(xiàn)了全面的、系統(tǒng)的、不依賴人工的客服服務(wù)質(zhì)量評(píng)價(jià),避免了傳統(tǒng)需依賴人工進(jìn)行客服服務(wù)質(zhì)量評(píng)價(jià)的不全面性。此外,通過(guò)結(jié)合語(yǔ)音情感的數(shù)據(jù)特征,還可以進(jìn)行海量數(shù)據(jù)的對(duì)比分析,對(duì)客服服務(wù)質(zhì)量的整體有效提升提供了有益的輔助手段。下面以對(duì)一個(gè)錄音文件進(jìn)行處理以評(píng)估客服的服務(wù)質(zhì)量為例,對(duì)上述方法做進(jìn)一步的詳細(xì)說(shuō)明(其中,各步驟的具體內(nèi)容可獨(dú)立于上述方法組成互相獨(dú)立的多個(gè)優(yōu)選實(shí)施例):首先,執(zhí)行步驟s1,讀取獲取錄音文件(如圖3所示),并分割出該錄音文件中的客服錄音及客戶錄音。具體地:錄音文件由兩個(gè)通道組成,分別對(duì)應(yīng)客服錄音或客戶錄音。采用語(yǔ)音學(xué)軟件能夠分別獲取通道1(channel1)及通道2(channel2)對(duì)應(yīng)的語(yǔ)音文件,本實(shí)施例中,設(shè)通道1對(duì)應(yīng)的語(yǔ)音文件為客服語(yǔ)音,通道2對(duì)應(yīng)的語(yǔ)音文件為客戶錄音。如圖3中所示,這里采用praat軟件抽取得到通道1的語(yǔ)音文件及通道2的語(yǔ)音文件,其中,通道1的語(yǔ)音文件即為客服錄音,通道2的語(yǔ)音文件即為客戶錄音。當(dāng)然,在其他的實(shí)施例中,也可設(shè)通道1對(duì)應(yīng)的語(yǔ)音文件為客戶錄音,而通道2對(duì)應(yīng)的語(yǔ)音文件為客服語(yǔ)音。因而,不同的通道與不同的語(yǔ)音文件的對(duì)應(yīng)關(guān)系取決于實(shí)際的錄音系統(tǒng)的通道設(shè)置形式。然后,執(zhí)行步驟s2,截取客服錄音的一個(gè)片段,參見(jiàn)圖4所示,為本實(shí)施例中所提取的客服錄音中的一個(gè)片段(該片段參見(jiàn)圖4中虛線標(biāo)注的第一個(gè)語(yǔ)音片段),通過(guò)提取該片段中的mfcc特征,利用高斯模型即可識(shí)別客服身份。這里的mfcc是指梅爾倒譜系數(shù)(mel-scalefrequencycepstralcoefficients,簡(jiǎn)稱(chēng)mfcc),其為在mel標(biāo)度頻率域提取出來(lái)的倒譜參數(shù),mel標(biāo)度描述了人耳頻率的非線性特性。而本實(shí)施例中,采用高斯模型識(shí)別客服身份具體包括以下兩個(gè)階段:訓(xùn)練階段和預(yù)測(cè)階段。在訓(xùn)練階段,對(duì)于帶有標(biāo)簽的錄音片段,采用工具(比如praat)讀取mfcc特征,得到一個(gè)p*l矩陣,p不妨設(shè)為12,l是幀的數(shù)目。在行方向計(jì)算平均值后,每個(gè)錄音片段得到一個(gè)p維數(shù)組,和標(biāo)簽一起作為訓(xùn)練樣本。然后,混合高斯模型(gmm)對(duì)所有訓(xùn)練樣本的概率密度分布進(jìn)行期望最大化估計(jì),而估計(jì)采用的模型是k個(gè)高斯模型的加權(quán)和,每個(gè)高斯模型就代表了一個(gè)類(lèi)。在預(yù)測(cè)階段,類(lèi)似的取得語(yǔ)音片斷的mfcc平均值后,分別在k個(gè)高斯模型上投影,就會(huì)分別得到在各個(gè)類(lèi)上的概率,然后選取概率最大的類(lèi)作為判決結(jié)果。不同的判決結(jié)果對(duì)應(yīng)不同的客服,根據(jù)判決結(jié)果即可識(shí)別客服身份。同時(shí),還需要將客戶錄音分隔得到語(yǔ)音片段序列,具體地,由于客戶錄音是由聲音片段和靜音片段組成,而聲音片段中還包括鈴聲片段、環(huán)境噪聲片段等不屬于客戶聲音的雜音片段,未分隔的客戶錄音數(shù)據(jù)參見(jiàn)圖5所示。則參見(jiàn)圖6所示,本步驟中將上述的客戶錄音分隔得到語(yǔ)音片段序列的過(guò)程具體包括:s21:根據(jù)客戶錄音的頻率及強(qiáng)度的不同,標(biāo)注出有聲語(yǔ)音片段和靜音語(yǔ)音片段;s22:從所述客戶錄音中分隔出有聲語(yǔ)音片段;s23:識(shí)別出所述有聲語(yǔ)音片段中的雜音片段并刪除;s24:將剩余的有聲語(yǔ)音片段對(duì)應(yīng)的數(shù)據(jù)組合作為所述語(yǔ)音片段序列。其中,根據(jù)圖6中的數(shù)據(jù),步驟s21中標(biāo)注的有聲語(yǔ)音片段和靜音語(yǔ)音片段的數(shù)據(jù)具體如下(第一行為數(shù)據(jù)類(lèi)型,其余為數(shù)據(jù)具體內(nèi)容):根據(jù)上述數(shù)據(jù)中的標(biāo)簽類(lèi)型,剔除靜音的語(yǔ)音片段的數(shù)據(jù)后,即可從所述客戶錄音中分隔出有聲語(yǔ)音片段。然后,應(yīng)用說(shuō)話人識(shí)別算法,識(shí)別出說(shuō)話人的語(yǔ)音片段,并篩出說(shuō)話人的語(yǔ)音片段,即可進(jìn)一步的識(shí)別并剔除鈴聲片段、環(huán)境噪聲片段等不屬于客戶聲音的雜音片段。說(shuō)話人識(shí)別算法參考上述的高斯模型識(shí)別人員的方法,其中,在預(yù)測(cè)階段,先把語(yǔ)音片斷轉(zhuǎn)化為代表mfcc特征的p*l矩陣,然后取平均值得到p維數(shù)組。然后分別在k個(gè)高斯模型上投影,就會(huì)分別得到在各個(gè)類(lèi)上的概率,然后選取概率最大的類(lèi)作為判決結(jié)果。根據(jù)判決結(jié)果即可識(shí)別說(shuō)話人。剔除了雜音片段后,將剩余的有聲語(yǔ)音片段對(duì)應(yīng)的數(shù)據(jù)組合作為語(yǔ)音片段序列,例如,如圖7所示的語(yǔ)音片段,本實(shí)施例剔除雜音后,對(duì)應(yīng)的客戶語(yǔ)音內(nèi)容為:“我聽(tīng)不清楚,你說(shuō)的什么意思呢,你說(shuō)?”得到上述的語(yǔ)音片段序列后,再執(zhí)行步驟s3,從所述語(yǔ)音片段序列中選出代表客戶初期情緒和最終情緒的語(yǔ)音片段。具體地,對(duì)于客戶語(yǔ)音片段序列,其由多個(gè)語(yǔ)音片斷組成,語(yǔ)音片斷序列可以用向量表示,例如:s=<(s1,e1),(s2,e2),…,(sn,en)>,其中sx代表第x個(gè)語(yǔ)音片斷的開(kāi)始時(shí)間,ex代表第x個(gè)語(yǔ)音片斷的結(jié)束時(shí)間,n代表序列總的片斷數(shù)。則本步驟進(jìn)一步包括:首先獲取所述語(yǔ)音片段序列中每個(gè)語(yǔ)音片段的時(shí)長(zhǎng),例如,(s1,e1)的時(shí)長(zhǎng)為(e1-s1),對(duì)應(yīng)地,(sn,en)的時(shí)長(zhǎng)為(en-sn),其余片段以此類(lèi)推。則初期情緒的語(yǔ)音片段的選取方法為:選取語(yǔ)音片段序列中的前k個(gè)語(yǔ)音片段作為代表客戶初期情緒的語(yǔ)音片段,該k個(gè)語(yǔ)音片段需滿足:k個(gè)語(yǔ)音片段的時(shí)長(zhǎng)總和小于等于t。定義客戶初期情緒的語(yǔ)音片段為sstart,這里的t值預(yù)設(shè)為3秒,則對(duì)應(yīng)的,sstart=<(s1,e1),(s2,e2),…,(sk,ek)>,且需滿足(e1-s1)+(e2-s2)+…+(ek-sk)<=3秒,然后合并該k個(gè)語(yǔ)音片斷成為一個(gè)更大的語(yǔ)音片斷<sstart,estart>作為初期情緒的語(yǔ)音片段為sstart。當(dāng)所述語(yǔ)音片段序列中的第一個(gè)語(yǔ)音片段時(shí)長(zhǎng)大于t時(shí),e1-s1>3秒,則將第一個(gè)語(yǔ)音片段作為代表客戶初期情緒的語(yǔ)音片段,此時(shí)<sstart,estart>=<s1,e1>。同理,最終情緒的語(yǔ)音片段的選取方法為:選取語(yǔ)音片段序列中的后l個(gè)語(yǔ)音片段作為代表客戶最終情緒的語(yǔ)音片段,該l個(gè)語(yǔ)音片段滿足:l個(gè)語(yǔ)音片段的時(shí)長(zhǎng)總和小于等于t。定義最終情緒的語(yǔ)音片段為send,且這里的t的取值也為3秒,其中,l=n-m+1,則有send=<(sm,em),(sm+1,em+1),…,(sn,en)>,且(em-sm)+(em+1-sm+1)+…+(en-sn)<=3秒,然后合并該l個(gè)語(yǔ)音片斷成為一個(gè)更大的語(yǔ)音片斷<send,eend>作為最終情緒的語(yǔ)音片段為send。同樣地,當(dāng)上述的語(yǔ)音片段序列中的最后一個(gè)語(yǔ)音片段時(shí)長(zhǎng)大于t時(shí),即當(dāng)en-sn>3秒時(shí),則將該最后一個(gè)語(yǔ)音片段作為代表客戶最終情緒的語(yǔ)音片段,此時(shí)有<send,eend>=<sn,en>。其中,上述的k、l、m均為正整數(shù),而t為預(yù)設(shè)的語(yǔ)音時(shí)長(zhǎng)閾值,t值還可以為4s、2s或其他值,其值的大小可根據(jù)不同實(shí)施例或應(yīng)用場(chǎng)景而適應(yīng)性改變,不限制為上述的3秒。得到上述的代表客戶初期情緒和最終情緒的語(yǔ)音片段后,再執(zhí)行步驟s4,對(duì)得到的語(yǔ)音片段進(jìn)行處理,以識(shí)別代表客戶初期情緒和最終情緒的語(yǔ)音片段的情感特征,進(jìn)而獲得客戶初期情感特征和最終情感特征。處理的過(guò)程進(jìn)一步的包括以下內(nèi)容:首先,獲取代表客戶的初期情緒的語(yǔ)音片段和代表客戶的最終情緒的語(yǔ)音片段,也即上述的<sstart,estart>及<send,eend>對(duì)應(yīng)的錄音片段。然后分別提取初期情緒和最終情緒的語(yǔ)音片段的聲學(xué)特征,這里的聲學(xué)特征包括但不限于mfcc、頻幅微擾及/或振幅微擾中的一種或多種的組合。最后,采用情感識(shí)別算法分析得到的聲學(xué)特征,從而得到客戶的初期情感特征和最終情感特征。如圖8所示,為praat處理得到的包含了12個(gè)特征的mfcc圖,該12個(gè)特征在3.264秒內(nèi)在頻率微擾和振幅微擾方面(其中這里的頻率微擾和振幅微擾并不是mfcc直接的映射,而是一種變化趨勢(shì)),分別表現(xiàn)為為:jitter(頻率微擾):local(局部):2.147%local,absolute(局部,絕對(duì)):105.810e-6秒rap(拍擊):0.914%ppq5(間期系數(shù)5):0.844%ddp(周期二次差):2.743%shimmer(振幅微擾):local(局部):10.935%local,db(局部,分貝):1.041apq3(間期系數(shù)3):3.762%apq5(間期系數(shù)5):4.877%apq11(間期系數(shù)11):9.804%ddp(周期二次差):11.285%。對(duì)于每個(gè)聲音片段,通過(guò)分析上述的特征,然后應(yīng)用hmm(hiddenmarkovmodel)作為識(shí)別器,即可對(duì)應(yīng)地識(shí)別出<sstart,estart>及<send,eend>中所隱藏的情感。最后,再執(zhí)行步驟s5,根據(jù)初期情感特征和最終情感特征的差異評(píng)價(jià)對(duì)應(yīng)的客服的服務(wù)質(zhì)量,具體地,本步驟進(jìn)一步包括:為所述初期情感特征和最終情感特征分別賦予情感權(quán)值,得到初期情感值rs和最終情感值ts,采用(ts-rs)作為差異來(lái)評(píng)價(jià)對(duì)應(yīng)的客服的服務(wù)質(zhì)量。本步驟中還包括獲取基本情感分類(lèi)表,并在基本情感分類(lèi)表中查找初期情感特征和最終情感特征分別對(duì)應(yīng)的預(yù)設(shè)權(quán)值,將預(yù)設(shè)權(quán)值作為情感權(quán)值分別對(duì)應(yīng)賦予給初期情感特征和最終情感特征。由于現(xiàn)有技術(shù)中對(duì)基本情感的定義有所區(qū)別,本實(shí)施例中以美國(guó)心理學(xué)家ekman提出的6大基本情感為例對(duì)上述的基本情感分類(lèi)表的定義進(jìn)行說(shuō)明,其中,6大基本情感包括憤怒、厭惡、害怕、高興、悲傷、驚奇,再加上中性情感,共有7大情感。預(yù)先根據(jù)需要指定每個(gè)情感具有對(duì)應(yīng)的權(quán)值,,其中,正數(shù)代表正面情感,負(fù)數(shù)代表負(fù)面情感,具體參見(jiàn)下表1的內(nèi)容所示:表1基本情感分類(lèi)及對(duì)應(yīng)權(quán)值情感權(quán)值憤怒-2厭惡-2害怕-1悲傷-1中性0高興2驚奇1那么,上述處理得到的客戶初期情感特征和最終情感特征即可轉(zhuǎn)化為rs和ts,進(jìn)而可以用(ts-rs)代表客服服務(wù)質(zhì)量的高低。這里的ts越高,代表服務(wù)質(zhì)量越高;反而服務(wù)質(zhì)量越低。而rs代表著服務(wù)難度,rs越高,意味著客服需要更多的耐心和更專(zhuān)業(yè)的能力去服務(wù)客戶;反之,服務(wù)要求則偏低。當(dāng)然,在其他優(yōu)選實(shí)施例中,上述的情感分類(lèi)及權(quán)值賦予可根據(jù)需要采取其他形式,上表僅為本發(fā)明方法的一種執(zhí)行示例,根據(jù)需要作出的其他的情感分類(lèi)或權(quán)值賦予方法用于解決本發(fā)明技術(shù)問(wèn)題的,均包含在本發(fā)明范圍內(nèi)。此外,應(yīng)當(dāng)理解,本發(fā)明方法中各個(gè)步驟中的具體細(xì)節(jié)均分別為圖1所示方法流程的優(yōu)選實(shí)施例,各個(gè)步驟的具體實(shí)現(xiàn)方案之間可相互結(jié)合,也可分別作為附圖1對(duì)應(yīng)方案的優(yōu)選實(shí)施方案而作為彼此獨(dú)立的獨(dú)立實(shí)施例,并不必須限定于上述的實(shí)施例的陳述方式。這種差值對(duì)客服的服務(wù)質(zhì)量評(píng)價(jià)時(shí)考慮了客戶初期的情緒及最終情緒與初期情緒間的差異,進(jìn)而對(duì)服務(wù)質(zhì)量進(jìn)行評(píng)價(jià)時(shí),更加科學(xué)和有效。在本發(fā)明的另一個(gè)實(shí)施例中,還提供了基于客戶語(yǔ)音情感的客服服務(wù)質(zhì)量評(píng)價(jià)系統(tǒng),該系統(tǒng)如圖9所示,具體包括:錄音文件預(yù)處理模塊901,用于獲取錄音文件并提取得到其中的客戶錄音;語(yǔ)音片段提取模塊902,用于獲取所述客戶錄音并處理得到代表客戶初期情緒和最終情緒的語(yǔ)音片段;服務(wù)質(zhì)量評(píng)價(jià)模塊903,用于根據(jù)初期情緒和最終情緒的語(yǔ)音片段進(jìn)行分析,得到兩者的情感差異以評(píng)價(jià)對(duì)應(yīng)的客服的服務(wù)質(zhì)量。進(jìn)一步的,上述的錄音文件預(yù)處理模塊901還包括客服身份識(shí)別單元,用于在錄音文件預(yù)處理模塊901獲取錄音文件后,分割錄音文件得到客服錄音及客戶錄音后截取客服錄音的一個(gè)片段,識(shí)別客服身份。具體可通過(guò)提取其中的mfcc特征,利用高斯模型識(shí)別客服身份進(jìn)一步的,上述的語(yǔ)音片段提取模塊902還包括客戶語(yǔ)音識(shí)別模塊、雜音剔除模塊及語(yǔ)音片段提取模塊。其中,客戶語(yǔ)音識(shí)別模塊用于識(shí)別和提取有聲語(yǔ)音片段,并從所述有聲語(yǔ)音片段中提取客戶語(yǔ)音對(duì)應(yīng)的片段;雜音剔除模塊用于根據(jù)提取得到的客戶語(yǔ)音片段而剔除雜音片段得到語(yǔ)音片段序列,如鈴音,環(huán)境噪聲等;語(yǔ)音片段提取模塊用于從語(yǔ)音片段序列中選出代表客戶初期情緒和最終情緒的語(yǔ)音片段。進(jìn)一步的,上述的服務(wù)質(zhì)量評(píng)價(jià)模塊903還包括:情感特征提取模塊、情感賦值模塊及服務(wù)質(zhì)量評(píng)價(jià)模塊。其中,情感特征提取模塊用于提取初期情緒和最終情緒的語(yǔ)音片段的聲學(xué)特征并進(jìn)行分析,得到客戶的初期情感特征和最終情感特征;情感賦值模塊用于根據(jù)基本情感分類(lèi)表為初期情感特征和最終情感特征進(jìn)行賦值;服務(wù)質(zhì)量評(píng)價(jià)模塊用于根據(jù)初期情感特征和最終情感特征的值所代表的情感差異評(píng)價(jià)對(duì)應(yīng)的客服的服務(wù)質(zhì)量。當(dāng)然,上述系統(tǒng)的各個(gè)組成模塊中的具體工作細(xì)節(jié)可參考上述方法對(duì)應(yīng)的各個(gè)實(shí)施例的具體細(xì)節(jié),此處不再贅述。以上所述,僅為本發(fā)明的具體實(shí)施方式,但本發(fā)明的保護(hù)范圍并不局限于此,任何本領(lǐng)域的技術(shù)人員在本發(fā)明揭露的技術(shù)范圍內(nèi),特別是基于本發(fā)明方法,通過(guò)對(duì)話錄音進(jìn)行評(píng)價(jià)服務(wù)質(zhì)量的設(shè)備或軟件方法等均屬于本發(fā)明的保護(hù)范圍,此外,本領(lǐng)域技術(shù)人員在本發(fā)明的啟發(fā)下對(duì)本發(fā)明所做的變形或替換,也都應(yīng)涵蓋在本發(fā)明的保護(hù)范圍之內(nèi)。因此,本發(fā)明的保護(hù)范圍應(yīng)以所述的權(quán)利要求的保護(hù)范圍為準(zhǔn)。當(dāng)前第1頁(yè)12