本公開(kāi)涉及人工智能,尤其涉及一種云客服服務(wù)質(zhì)量評(píng)估方法、裝置、電子設(shè)備及介質(zhì)。
背景技術(shù):
1、云客服作為依托于云技術(shù)的重要應(yīng)用之一,其逐漸被如個(gè)人、政府企業(yè)等用戶(hù)重視并使用??头?wù)體驗(yàn)質(zhì)量是云客服產(chǎn)品質(zhì)量的直接體現(xiàn),也是評(píng)估云客服產(chǎn)品優(yōu)劣的最重要指標(biāo)之一,因此如何對(duì)云客服服務(wù)質(zhì)量做出有效的評(píng)估,對(duì)于云客服產(chǎn)品的完善和優(yōu)化起到舉足輕重的作用。
2、目前,相關(guān)技術(shù)中對(duì)云客服客服質(zhì)量進(jìn)行評(píng)估的方法主要依賴(lài)于基于語(yǔ)音情緒的深度學(xué)習(xí)技術(shù)。然而,基于語(yǔ)音情緒的深度學(xué)習(xí)技術(shù)的模型參數(shù)復(fù)雜,計(jì)算量大,可能會(huì)導(dǎo)致資源消耗大且效率不高的問(wèn)題。
技術(shù)實(shí)現(xiàn)思路
1、本公開(kāi)提供一種云客服服務(wù)質(zhì)量評(píng)估方法、裝置、電子設(shè)備及介質(zhì),以解決相關(guān)技術(shù)中的問(wèn)題,通過(guò)在云客服服務(wù)質(zhì)量評(píng)估過(guò)程中對(duì)具有待識(shí)別語(yǔ)音的梅爾頻譜特征圖和線性預(yù)測(cè)系數(shù)特征圖的多重聲音特征圖進(jìn)行三次不同的卷積處理,并利用卷積處理后的多重聲音特征圖的時(shí)域頻域聯(lián)合特征圖、頻域特征圖以及多尺度時(shí)間特征圖進(jìn)行情緒分類(lèi),以得到待識(shí)別語(yǔ)音對(duì)應(yīng)的云客服服務(wù)體驗(yàn)評(píng)分。由于梅爾頻譜特征圖可以有效的模擬人耳聽(tīng)到的聲音并直觀地表現(xiàn)出來(lái);線性預(yù)測(cè)系數(shù)特征圖可以預(yù)測(cè)聲音信息,更好的表達(dá)聲音的共振與帶寬。因此本公開(kāi)將兩者疊加能夠?qū)崿F(xiàn)低參數(shù)量為網(wǎng)絡(luò)模型提供更豐富的原始信息,降低網(wǎng)絡(luò)模型的計(jì)算量,從而提高云客服服務(wù)質(zhì)量評(píng)估的效率和準(zhǔn)確性。
2、本公開(kāi)的第一方面實(shí)施例提出了一種云客服服務(wù)質(zhì)量評(píng)估方法,該方法包括:依據(jù)提取的待識(shí)別語(yǔ)音中的梅爾頻譜特征圖和線性預(yù)測(cè)系數(shù)特征圖的通道,對(duì)梅爾頻譜特征圖和線性預(yù)測(cè)系數(shù)特征圖進(jìn)行堆疊處理,得到堆疊處理后的多重聲音特征圖;將多重聲音特征圖分別經(jīng)過(guò)三次卷積處理,得到多重聲音特征圖的時(shí)域頻域聯(lián)合特征圖、頻域特征圖以及多尺度時(shí)間特征圖;對(duì)時(shí)域頻域聯(lián)合特征圖、頻域特征圖以及多尺度時(shí)間特征圖進(jìn)行拼接后的融合特征圖進(jìn)行情緒分類(lèi),確定待識(shí)別語(yǔ)音的云客服服務(wù)體驗(yàn)評(píng)分。
3、在本公開(kāi)的一些實(shí)施例中,依據(jù)提取的待識(shí)別語(yǔ)音中的梅爾頻譜特征圖和線性預(yù)測(cè)系數(shù)特征圖的通道,對(duì)梅爾頻譜特征圖和線性預(yù)測(cè)系數(shù)特征圖進(jìn)行堆疊拼接,得到堆疊拼接后的多重聲音特征圖,之前,方法包括:在輸入語(yǔ)音的二范數(shù)值大于或等于預(yù)設(shè)值的情況下,以預(yù)設(shè)長(zhǎng)度對(duì)輸入語(yǔ)音進(jìn)行切片處理,得到輸入語(yǔ)音中的待識(shí)別語(yǔ)音;對(duì)待識(shí)別語(yǔ)音進(jìn)行特征提取,得到待識(shí)別語(yǔ)音中的梅爾頻譜特征圖和線性預(yù)測(cè)系數(shù)特征圖,梅爾頻譜特征圖的長(zhǎng)和寬與線性預(yù)設(shè)系數(shù)特征圖的長(zhǎng)和寬相同。
4、在本公開(kāi)的一些實(shí)施例中,對(duì)多重聲音特征圖分別進(jìn)行三次卷積處理,得到多重聲音特征圖的譜時(shí)間特征、譜特征以及多尺度時(shí)間特征包括:依據(jù)多重聲音特征圖中的長(zhǎng)和寬,對(duì)多重聲音特征圖進(jìn)行第一卷積處理,得到多重聲音特征圖的時(shí)域頻域聯(lián)合特征圖;依據(jù)多重聲音特征圖中的寬,對(duì)多重聲音特征圖進(jìn)行第二卷積處理,得到多重聲音特征的頻域特征圖;利用多時(shí)間尺度模塊,對(duì)多重聲音特征圖進(jìn)行第三卷積處理,得到多重聲音特征圖的多尺度時(shí)間特征圖。
5、在本公開(kāi)的一些實(shí)施例中,利用多時(shí)間尺度模塊,對(duì)多重聲音特征圖進(jìn)行第三卷積處理,得到多重聲音特征圖的多尺度時(shí)間特征圖包括:利用多時(shí)間尺度模塊對(duì)多重聲音特征圖分別進(jìn)行上采樣處理和下采樣處理,得到上采樣處理后的第一尺寸特征圖和下采樣處理后的第二尺寸特征圖;對(duì)第一尺寸特征圖、多重聲音特征圖以及第二尺寸特征圖進(jìn)行第三卷積處理,得到長(zhǎng)和寬相同的第一尺寸特征圖、多重聲音特征圖以及第二尺寸特征圖;依據(jù)第一尺寸特征圖、多重聲音特征圖以及第二尺寸特征圖的通道,將長(zhǎng)和寬相同的第一尺寸特征圖、多重聲音特征圖以及第二尺寸特征圖進(jìn)行拼接處理,得到拼接處理后的多尺度多重聲音特征圖;利用通道注意力機(jī)制,對(duì)多尺度多重聲音特征圖進(jìn)行特征增強(qiáng),得到多尺度時(shí)間特征圖。
6、在本公開(kāi)的一些實(shí)施例中,對(duì)時(shí)域頻域聯(lián)合特征圖、頻域特征圖以及多尺度時(shí)間特征圖進(jìn)行拼接后的融合特征圖進(jìn)行情緒分類(lèi),確定待識(shí)別語(yǔ)音的云客服服務(wù)體驗(yàn)評(píng)分包括:依次對(duì)時(shí)域頻域聯(lián)合特征圖、頻域特征圖以及多尺度時(shí)間特征圖進(jìn)行拼接后的融合特征圖進(jìn)行預(yù)設(shè)次數(shù)的第四卷積處理,得到待分類(lèi)特征圖;對(duì)待分類(lèi)特征圖進(jìn)行情緒分類(lèi),得到待分類(lèi)特征圖的情緒檢測(cè)結(jié)果,并將情緒檢測(cè)結(jié)果存儲(chǔ)至數(shù)據(jù)庫(kù),情緒檢測(cè)結(jié)果包括每個(gè)情緒類(lèi)別的概率;若數(shù)據(jù)庫(kù)中存儲(chǔ)的情緒檢測(cè)結(jié)果的存儲(chǔ)數(shù)量大于或等于預(yù)設(shè)數(shù)量,則依據(jù)存儲(chǔ)數(shù)量中每個(gè)情緒檢測(cè)結(jié)果,確定待識(shí)別語(yǔ)音的體驗(yàn)分?jǐn)?shù)。
7、在本公開(kāi)的一些實(shí)施例中,依據(jù)存儲(chǔ)數(shù)量中每個(gè)情緒檢測(cè)結(jié)果,確定待識(shí)別語(yǔ)音的體驗(yàn)分?jǐn)?shù)包括:依據(jù)存儲(chǔ)數(shù)量中每個(gè)情緒檢測(cè)結(jié)果中每個(gè)情緒類(lèi)別的概率,通過(guò)融合算法分別對(duì)每個(gè)情緒類(lèi)別進(jìn)行融合,得到整體情緒檢測(cè)結(jié)果;分別確定整體情緒檢測(cè)結(jié)果和存儲(chǔ)數(shù)量中每個(gè)情緒檢測(cè)結(jié)果中概率為第一概率的情緒類(lèi)別,并依據(jù)情緒類(lèi)別與云客服服務(wù)體驗(yàn)評(píng)分之間的映射關(guān)系,確定整體情緒檢測(cè)結(jié)果的第一云客服服務(wù)體驗(yàn)分?jǐn)?shù)和存儲(chǔ)數(shù)量中每個(gè)情緒檢測(cè)結(jié)果的第二云客服服務(wù)體驗(yàn)分?jǐn)?shù);通過(guò)預(yù)設(shè)權(quán)重,對(duì)第一云客服服務(wù)體驗(yàn)分?jǐn)?shù)和第二云客服服務(wù)體驗(yàn)分?jǐn)?shù)進(jìn)行加權(quán)融合,得到待識(shí)別語(yǔ)音的云客服服務(wù)體驗(yàn)評(píng)分。
8、本公開(kāi)的第二方面實(shí)施例提出了一種云客服服務(wù)質(zhì)量評(píng)估裝置,該裝置包括:
9、堆疊單元,用于依據(jù)提取的待識(shí)別語(yǔ)音中的梅爾頻譜特征圖和線性預(yù)測(cè)系數(shù)特征圖的通道,對(duì)梅爾頻譜特征圖和線性預(yù)測(cè)系數(shù)特征圖進(jìn)行堆疊處理,得到堆疊處理后的多重聲音特征圖;
10、特征提取單元,用于將多重聲音特征圖分別經(jīng)過(guò)三次卷積處理,得到多重聲音特征圖的時(shí)域頻域聯(lián)合特征圖、頻域特征圖以及多尺度時(shí)間特征圖;
11、云客服服務(wù)體驗(yàn)評(píng)分單元,用于對(duì)時(shí)域頻域聯(lián)合特征圖、頻域特征圖以及多尺度時(shí)間特征圖進(jìn)行拼接后的融合特征圖進(jìn)行情緒分類(lèi),確定待識(shí)別語(yǔ)音的云客服服務(wù)體驗(yàn)評(píng)分。
12、本公開(kāi)的第三方面實(shí)施例提出了一種電子設(shè)備,包括:處理器和用于存儲(chǔ)能夠在處理器上運(yùn)行的計(jì)算機(jī)程序的存儲(chǔ)器,其中,處理器用于運(yùn)行計(jì)算機(jī)程序時(shí),執(zhí)行本公開(kāi)第一方面實(shí)施例中描述的方法。
13、本公開(kāi)的第四方面實(shí)施例提出了一種存儲(chǔ)有計(jì)算機(jī)指令的非瞬時(shí)計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其中,計(jì)算機(jī)指令用于使計(jì)算機(jī)執(zhí)行本公開(kāi)第一方面實(shí)施例中描述的方法。
14、本公開(kāi)的第五方面實(shí)施例提出了一種計(jì)算機(jī)程序產(chǎn)品,包括計(jì)算機(jī)程序,計(jì)算機(jī)程序在被處理器執(zhí)行時(shí)實(shí)現(xiàn)本公開(kāi)第一方面實(shí)施例中描述的方法。
15、綜上,根據(jù)本公開(kāi)提出的云客服服務(wù)質(zhì)量評(píng)估方法,通過(guò)依據(jù)提取的待識(shí)別語(yǔ)音中的梅爾頻譜特征圖和線性預(yù)測(cè)系數(shù)特征圖的通道,對(duì)梅爾頻譜特征圖和線性預(yù)測(cè)系數(shù)特征圖進(jìn)行堆疊處理,得到堆疊處理后的多重聲音特征圖;將多重聲音特征圖分別經(jīng)過(guò)三次卷積處理,得到多重聲音特征圖的時(shí)域頻域聯(lián)合特征圖、頻域特征圖以及多尺度時(shí)間特征圖;對(duì)時(shí)域頻域聯(lián)合特征圖、頻域特征圖以及多尺度時(shí)間特征圖進(jìn)行拼接后的融合特征圖進(jìn)行情緒分類(lèi),確定待識(shí)別語(yǔ)音的云客服服務(wù)體驗(yàn)評(píng)分。由于梅爾頻譜特征圖可以有效的模擬人耳聽(tīng)到的聲音并直觀地表現(xiàn)出來(lái);線性預(yù)測(cè)系數(shù)特征圖可以預(yù)測(cè)聲音信息,更好的表達(dá)聲音的共振與帶寬。因此本公開(kāi)將兩者疊加能夠?qū)崿F(xiàn)低參數(shù)量為網(wǎng)絡(luò)模型提供更豐富的原始信息,降低網(wǎng)絡(luò)模型的計(jì)算量,從而提高云客服服務(wù)質(zhì)量評(píng)估的效率和準(zhǔn)確性。
16、應(yīng)當(dāng)理解的是,以上的一般描述和后文的細(xì)節(jié)描述僅是示例性和解釋性的,并不能限制本公開(kāi)。