本發(fā)明涉及通信技術(shù)領(lǐng)域,尤其涉及一種處理客服電話的錄音數(shù)據(jù)的方法及裝置。
背景技術(shù):
客服熱線錄音滿意度評價之前主要是通過互動式語音應(yīng)答(Interactive Voice Response,IVR)或者下發(fā)短信的方式直接從用戶側(cè)獲取,但由于用戶參與度與回復(fù)率并不是非常高,大部分的熱線電話并沒有完成滿意度評價。因此產(chǎn)生了自動滿意度評價,但是自動滿意度評價當(dāng)前主要是通過語音識別引擎將錄音數(shù)據(jù)轉(zhuǎn)換成為識別后的文本,再通過文本情感詞相關(guān)情況來建模,完成對該錄音的自動滿意度評價。其中,主要涉及了語音分析技術(shù)和機(jī)器學(xué)習(xí)技術(shù)。
語音分析技術(shù)是通過語音信號處理技術(shù),將輸入語音信號分解為在不同變換維度上的特征矢量。主要包括語音信號預(yù)處理技術(shù),語音信號處理變換,語音各個域的語音特征提取技術(shù)及語音編解碼技術(shù)等。
機(jī)器學(xué)習(xí)是人工智能領(lǐng)域的重要分支,尤其是語音識別技術(shù)是人工智能領(lǐng)域的一個重要研究領(lǐng)域。通過特征提取,統(tǒng)計(jì)模型建立,模型優(yōu)化,模式識別,數(shù)據(jù)挖掘等完成人工智能的具體實(shí)踐。
因此,現(xiàn)有技術(shù)中主要通過如下三種方案來獲取客服熱線錄音的滿意度評價結(jié)果。
方案一:通過語音識別引擎將熱線錄音數(shù)據(jù)“翻譯”為文本內(nèi)容,然后通過自然語言理解技術(shù)得到文本的滿意度相關(guān)分析,從而判斷此通電話錄音的用戶滿意度情況。
方案二:通過語音情感分析得到用戶的通話中情緒變化,從而分析確定該通電話的用戶滿意度情況。
方案三:通過結(jié)合語音特征及識別后文本特征組成聯(lián)合特征來分析建模自 動得到該通電話的用戶滿意度。
然而,上述三種方案中,方案一由于使用語音識別引擎得到識別后文本,處理此文本信息從而得到用戶滿意度信息,實(shí)際上丟失了原本錄音中的語音滿意度信息,很多用戶不滿意的情況并沒有完全反應(yīng)出來,影響了滿意度評價準(zhǔn)確性。方案二單純從語音情感來判斷該用戶的滿意度并不能特別好的得到評價效果,一方面因?yàn)榍楦斜旧砭褪且粋€模糊的主觀的概念,評價標(biāo)準(zhǔn)因人而異;另一方面因?yàn)閬G掉了文本中所含有的語義信息,所以需要使用聯(lián)合特征來更好的完成自動評價任務(wù)。
然而,雖然方案三通過聯(lián)合語音情感特征及識別后文本情感特征,自動滿意度評價取得了較大的提升,但由于情感及滿意度本身就是一個模糊的主觀的概念,當(dāng)前的效果仍有較大的提升空間,需要結(jié)合更多類型的特征來提高現(xiàn)有自動評價效果。
技術(shù)實(shí)現(xiàn)要素:
為了克服現(xiàn)有技術(shù)中存在的上述問題,本發(fā)明的實(shí)施例提供了一種處理客服電話的錄音數(shù)據(jù)的方法及裝置,能夠在對話節(jié)奏層面自動評價客服錄音的用戶滿意度情況,擴(kuò)大了滿意度評價的特征空間,從新的角度更好的為客服熱線運(yùn)營提供技術(shù)支撐。
為了解決上述技術(shù)問題,本發(fā)明采用如下技術(shù)方案:
依據(jù)本發(fā)明實(shí)施例的一個方面,提供了一種處理客服電話的錄音數(shù)據(jù)的方法,所述客服電話的錄音數(shù)據(jù)中記錄有用戶和客服代表的對話,所述方法包括:
根據(jù)待評價錄音數(shù)據(jù),得到所述待評價錄音數(shù)據(jù)的用戶對話節(jié)奏特征和客服代表對話節(jié)奏特征;
根據(jù)所述待評價錄音數(shù)據(jù)的用戶對話節(jié)奏特征和客服代表對話節(jié)奏特征,利用預(yù)先確定的滿意度評價模型,確定所述待評價錄音數(shù)據(jù)的滿意度評價結(jié)果。
其中,上述方案中,所述根據(jù)待評價錄音數(shù)據(jù),得到所述待評價錄音數(shù)據(jù)的用戶對話節(jié)奏特征和客服代表對話節(jié)奏特征,包括:
從所述待評價錄音數(shù)據(jù)中獲取第一預(yù)設(shè)時長的錄音數(shù)據(jù);
對所述第一預(yù)設(shè)時長的錄音數(shù)據(jù)進(jìn)行對話雙方語音切分,得到用戶的第一 語音段集和客服代表的第一語音段集;
根據(jù)所述用戶的第一語音段集,得到所述待評價錄音數(shù)據(jù)的用戶對話節(jié)奏特征,以及根據(jù)所述客服代表的第一語音段集,得到所述待評價錄音數(shù)據(jù)的客服代表對話節(jié)奏特征。
其中,上述方案中,所述用戶對話節(jié)奏特征至少包括所述第一預(yù)設(shè)時長、所述第一預(yù)設(shè)時長的錄音數(shù)據(jù)中包括的靜音總時長、所述第一預(yù)設(shè)時長的錄音數(shù)據(jù)中包括的話語總時長、所述第一預(yù)設(shè)時長的錄音數(shù)據(jù)中包括的靜音的段數(shù)、所述第一預(yù)設(shè)時長的錄音數(shù)據(jù)中包括的靜音段的平均時長、所述第一預(yù)設(shè)時長的錄音數(shù)據(jù)中包括的所有話語段的段數(shù)、所述第一預(yù)設(shè)時長的錄音數(shù)據(jù)中包括的話語段的平均時長、所述用戶的話語總時長、所述用戶的話語段數(shù)、所述用戶的話語段的平均時長、所述用戶的話語總時長與所述客服代表的話語總時長的比值、所述用戶的話語段數(shù)與所述客服代表的話語段數(shù)的比值中的一種或多種;
所述客服代表對話節(jié)奏特征至少包括所述客服代表的話語總時長、所述客服代表的話語段數(shù)、所述客服代表的話語段的平均時長中的一種或多種。
其中,上述方案中,在根據(jù)所述待評價錄音數(shù)據(jù)的用戶對話節(jié)奏特征和客服代表對話節(jié)奏特征,利用預(yù)先確定的滿意度評價模型,確定所述待評價錄音數(shù)據(jù)的滿意度評價結(jié)果之前,所述方法還包括:
根據(jù)已知滿意度評價結(jié)果的錄音數(shù)據(jù),得到所述已知滿意度評價結(jié)果的錄音數(shù)據(jù)的用戶對話節(jié)奏特征和客服代表對話節(jié)奏特征;
根據(jù)所述已知滿意度評價結(jié)果的錄音數(shù)據(jù)的用戶對話節(jié)奏特征和客服代表對話節(jié)奏特征,利用支持向量機(jī)(SVM)算法確定所述滿意度評價模型。
其中,上述方案中,所述滿意度評價模型包括代表滿意評價的第一支撐向量和代表不滿意評價的第二支撐向量;
所述根據(jù)所述已知滿意度評價結(jié)果的錄音數(shù)據(jù)的用戶對話節(jié)奏特征和客服代表對話節(jié)奏特征,利用SVM算法確定所述滿意度評價模型,包括:
根據(jù)所述已知滿意度評價結(jié)果的錄音數(shù)據(jù)的用戶對話節(jié)奏特征和客服代表對話節(jié)奏特征,獲得第一對話節(jié)奏特征向量,所述第一對話節(jié)奏特征向量的維數(shù)等于所述已知滿意度評價結(jié)果的錄音數(shù)據(jù)的用戶對話節(jié)奏特征和客服代 表對話節(jié)奏特征的數(shù)目之和;
根據(jù)多個所述第一對話節(jié)奏特征向量,利用所述SVM算法的多項(xiàng)式核函數(shù),確定所述第一支撐向量和所述第二支撐向量。
其中,上述方案中,所述根據(jù)所述待評價錄音數(shù)據(jù)的用戶對話節(jié)奏特征和客服代表對話節(jié)奏特征,利用預(yù)先確定的滿意度評價模型,確定所述待評價錄音數(shù)據(jù)的滿意度評價結(jié)果,包括:
根據(jù)所述待評價錄音數(shù)據(jù)的用戶對話節(jié)奏特征和客服代表對話節(jié)奏特征,獲得第二對話節(jié)奏特征向量,所述第二對話節(jié)奏特征向量的維數(shù)等于所述待評價錄音數(shù)據(jù)的用戶對話節(jié)奏特征和客服代表對話節(jié)奏特征的數(shù)目之和;
獲取所第二對話節(jié)奏特征向量與所述第一支撐向量之間的第一距離,以及所述第二對話節(jié)奏特征向量與所述第二支撐向量之間的第二距離;
判斷所述第一距離是否小于第一預(yù)設(shè)閾值,若是,則所述待評價錄音數(shù)據(jù)的滿意度評價結(jié)果為滿意;
若否,則判斷所述第二距離是否小于第二預(yù)設(shè)閾值,若所述第二距離小于所述第二預(yù)設(shè)閾值,則所述待評價錄音數(shù)據(jù)的滿意度評價結(jié)果為不滿意。
其中,上述方案中,所述根據(jù)已知滿意度評價結(jié)果的所述錄音數(shù)據(jù),得到所述已知滿意度評價結(jié)果的錄音數(shù)據(jù)的用戶對話節(jié)奏特征和客服代表對話節(jié)奏特征,包括:
從所述已知評價結(jié)果的錄音數(shù)據(jù)中獲取第二預(yù)設(shè)時長的錄音數(shù)據(jù);
對所述第二預(yù)設(shè)時長的錄音數(shù)據(jù)進(jìn)行對話雙方語音切分,得到用戶的第二語音段集和客服代表的第二語音段集;
根據(jù)所述用戶的第二語音段集,得到所述已知滿意度評價結(jié)果的錄音數(shù)據(jù)的用戶對話節(jié)奏特征,以及根據(jù)所述客服代表的第二語音段集,得到所述已知滿意度評價結(jié)果的錄音數(shù)據(jù)的客服代表對話節(jié)奏特征。
依據(jù)本發(fā)明實(shí)施例的另一個方面,還提供了一種處理客服電話的錄音數(shù)據(jù)的裝置,所述客服電話的錄音數(shù)據(jù)中記錄有用戶和客服代表的對話,所述裝置包括:
第一提取模塊,用于根據(jù)待評價錄音數(shù)據(jù),得到所述待評價錄音數(shù)據(jù)的用戶對話節(jié)奏特征和客服代表對話節(jié)奏特征;
評價模塊,用于根據(jù)所述待評價錄音數(shù)據(jù)的用戶對話節(jié)奏特征和客服代表對話節(jié)奏特征,利用預(yù)先確定的滿意度評價模型,確定所述待評價錄音數(shù)據(jù)的滿意度評價結(jié)果。
其中,上述方案中,所述第一提取模塊包括:
第一獲取單元,用于從所述待評價錄音數(shù)據(jù)中獲取第一預(yù)設(shè)時長的錄音數(shù)據(jù);
第一切分單元,用于對所述第一預(yù)設(shè)時長的錄音數(shù)據(jù)進(jìn)行對話雙方語音切分,得到用戶的第一語音段集和客服代表的第一語音段集;
特征獲取單元,用于根據(jù)所述用戶的第一語音段集,得到所述待評價錄音數(shù)據(jù)的用戶對話節(jié)奏特征,以及根據(jù)所述客服代表的第一語音段集,得到所述待評價錄音數(shù)據(jù)的客服代表對話節(jié)奏特征。
其中,上述方案中,所述用戶對話節(jié)奏特征至少包括所述第一預(yù)設(shè)時長、所述第一預(yù)設(shè)時長的錄音數(shù)據(jù)中包括的靜音總時長、所述第一預(yù)設(shè)時長的錄音數(shù)據(jù)中包括的話語總時長、所述第一預(yù)設(shè)時長的錄音數(shù)據(jù)中包括的靜音的段數(shù)、所述第一預(yù)設(shè)時長的錄音數(shù)據(jù)中包括的靜音段的平均時長、所述第一預(yù)設(shè)時長的錄音數(shù)據(jù)中包括的所有話語段的段數(shù)、所述第一預(yù)設(shè)時長的錄音數(shù)據(jù)中包括的話語段的平均時長、所述用戶的話語總時長、所述用戶的話語段數(shù)、所述用戶的話語段的平均時長、所述用戶的話語總時長與所述客服代表的話語總時長的比值、所述用戶的話語段數(shù)與所述客服代表的話語段數(shù)的比值中的一種或多種;
所述客服代表對話節(jié)奏特征至少包括所述客服代表的話語總時長、所述客服代表的話語段數(shù)、所述客服代表的話語段的平均時長中的一種或多種。
其中,上述方案中,所述裝置還包括:
第二提取模塊,用于根據(jù)已知滿意度評價結(jié)果的錄音數(shù)據(jù),得到所述已知滿意度評價結(jié)果的錄音數(shù)據(jù)的用戶對話節(jié)奏特征和客服代表對話節(jié)奏特征;
模型建立模塊,用于根據(jù)所述已知滿意度評價結(jié)果的錄音數(shù)據(jù)的用戶對話節(jié)奏特征和客服代表對話節(jié)奏特征,利用SVM算法確定所述滿意度評價模型。
其中,上述方案中,所述滿意度評價模型包括代表滿意評價的第一支撐向量和代表不滿意評價的第二支撐向量;
所述模型建立模塊包括:
第二獲取單元,用于根據(jù)所述已知滿意度評價結(jié)果的錄音數(shù)據(jù)的用戶對話節(jié)奏特征和客服代表對話節(jié)奏特征,獲得第一對話節(jié)奏特征向量,所述第一對話節(jié)奏特征向量的維數(shù)等于所述已知滿意度評價結(jié)果的錄音數(shù)據(jù)的用戶對話節(jié)奏特征和客服代表對話節(jié)奏特征的數(shù)目之和;
模型建立單元,用于根據(jù)多個所述第一對話節(jié)奏特征向量,利用所述SVM算法的多項(xiàng)式核函數(shù),確定所述第一支撐向量和所述第二支撐向量。
其中,上述方案中,所述評價模塊包括:
第三獲取單元,用于根據(jù)所述待評價錄音數(shù)據(jù)的用戶對話節(jié)奏特征和客服代表對話節(jié)奏特征,獲得第二對話節(jié)奏特征向量,所述第二對話節(jié)奏特征向量的維數(shù)等于所述待評價錄音數(shù)據(jù)的用戶對話節(jié)奏特征和客服代表對話節(jié)奏特征的數(shù)目之和;
第四獲取單元,用于獲取所第二對話節(jié)奏特征向量與所述第一支撐向量之間的第一距離,以及所述第二對話節(jié)奏特征向量與所述第二支撐向量之間的第二距離;
第一判斷單元,用于判斷所述第一距離是否小于第一預(yù)設(shè)閾值,若是,則所述待評價錄音數(shù)據(jù)的滿意度評價結(jié)果為滿意;
第二判斷單元,用于當(dāng)所述第一判斷單元的判斷結(jié)果為否時,判斷所述第二距離是否小于第二預(yù)設(shè)閾值,若所述第二距離小于所述第二預(yù)設(shè)閾值,則所述待評價錄音數(shù)據(jù)的滿意度評價結(jié)果為不滿意。
其中,上述方案中,所述第二提取模塊包括:
第五獲取單元,用于從所述已知評價結(jié)果的錄音數(shù)據(jù)中獲取第二預(yù)設(shè)時長的錄音數(shù)據(jù);
第二切分單元,用于對所述第二預(yù)設(shè)時長的錄音數(shù)據(jù)進(jìn)行對話雙方語音切分,得到用戶的第二語音段集和客服代表的第二語音段集;
第六獲取單元,用于根據(jù)所述用戶的第二語音段集,得到所述已知滿意度評價結(jié)果的錄音數(shù)據(jù)的用戶對話節(jié)奏特征,以及根據(jù)所述客服代表的第二語音段集,得到所述已知滿意度評價結(jié)果的錄音數(shù)據(jù)的客服代表對話節(jié)奏特征。
本發(fā)明實(shí)施例的有益效果是:
本發(fā)明實(shí)施例的處理客服電話的錄音數(shù)據(jù)的方法及裝置,從待評價錄音數(shù)據(jù)中獲得用戶對話節(jié)奏特征和客服代表對話節(jié)奏特征,并依據(jù)獲得的用戶對話節(jié)奏特征和客服代表對話節(jié)奏特征,利用預(yù)先確定的滿意度評價模型,確定待評價錄音數(shù)據(jù)的滿意度評價結(jié)果。因此,本發(fā)明的實(shí)施例將對話節(jié)奏特征作為滿意度評價的依據(jù),能夠在對話節(jié)奏層面自動評價客服錄音的用戶滿意度情況,擴(kuò)大了滿意度評價的特征空間,從新的角度更好的為客服熱線運(yùn)營提供了技術(shù)支撐。
附圖說明
圖1表示本發(fā)明實(shí)施例的第一實(shí)施例的處理客服電話的錄音數(shù)據(jù)的方法流程圖;
圖2表示本發(fā)明實(shí)施例的第二實(shí)施例的處理客服電話的錄音數(shù)據(jù)的裝置的結(jié)構(gòu)框圖;
圖3表示本發(fā)明實(shí)施例的第三實(shí)施例的處理客服電話的錄音數(shù)據(jù)的裝置的結(jié)構(gòu)框圖。
具體實(shí)施方式
下面將參照附圖更詳細(xì)地描述本公開的示例性實(shí)施例。雖然附圖中顯示了本公開的示例性實(shí)施例,然而應(yīng)當(dāng)理解,可以以各種形式實(shí)現(xiàn)本公開而不應(yīng)被這里闡述的實(shí)施例所限制。相反,提供這些實(shí)施例是為了能夠更透徹地理解本公開,并且能夠?qū)⒈竟_的范圍完整的傳達(dá)給本領(lǐng)域的技術(shù)人員。
第一實(shí)施例
依據(jù)本發(fā)明實(shí)施例的一個方面,提供了一種處理客服電話的錄音數(shù)據(jù)的方法,該方法首先,根據(jù)待評價錄音數(shù)據(jù),得到所述待評價錄音數(shù)據(jù)的用戶對話節(jié)奏特征和客服代表對話節(jié)奏特征;然后,根據(jù)所述待評價錄音數(shù)據(jù)的用戶對話節(jié)奏特征和客服代表對話節(jié)奏特征,利用預(yù)先確定的滿意度評價模型,確定所述待評價錄音數(shù)據(jù)的滿意度評價結(jié)果。
因此,本發(fā)明實(shí)施例的處理客服電話的錄音數(shù)據(jù)的方法,提供了一個新的滿意度評價角度,擴(kuò)大了滿意度評價的特征空間,從新的角度更好的為客服熱 線運(yùn)營提供了技術(shù)支撐。
如圖1所示,該方法包括:
步驟S11、根據(jù)待評價錄音數(shù)據(jù),得到所述待評價錄音數(shù)據(jù)的用戶對話節(jié)奏特征和客服代表對話節(jié)奏特征。
在客服電話的錄音數(shù)據(jù)中記錄的是用戶與客服代表的對話。其中,通過這種錄音形式存儲的用戶與客服代表之間的對話,不僅僅記錄了對話內(nèi)容,而且還記錄了用戶與客服代表的對話節(jié)奏。在用戶與客服代表之間的對話中,對于用戶在對話過程中所保持的態(tài)度,一般會影響對話的節(jié)奏。因此,本發(fā)明實(shí)施例的處理客服電話的錄音數(shù)據(jù)的方法中,將對話節(jié)奏作為判斷用戶滿意度評價的依據(jù)。
因此,在需要確定某一條待評價錄音數(shù)據(jù)的滿意度評價結(jié)果之前,需要從該待評價錄音數(shù)據(jù)中獲得所述待評價錄音數(shù)據(jù)的用戶對話節(jié)奏特征和客服代表對話節(jié)奏特征。
具體地,步驟S11包括:
從所述待評價錄音數(shù)據(jù)中獲取第一預(yù)設(shè)時長的錄音數(shù)據(jù);
對所述第一預(yù)設(shè)時長的錄音數(shù)據(jù)進(jìn)行對話雙方語音切分,得到用戶的第一語音段集和客服代表的第一語音段集;
根據(jù)所述用戶的第一語音段集,得到所述待評價錄音數(shù)據(jù)的用戶對話節(jié)奏特征,以及根據(jù)所述客服代表的第一語音段集,得到所述待評價錄音數(shù)據(jù)的客服代表對話節(jié)奏特征。
對于任意一條客服電話的錄音數(shù)據(jù)中,其中,在錄音開始的前一部分時間一般是用戶與客服代表對基本信息的溝通內(nèi)容,與所需要確定的滿意度評價結(jié)果一般關(guān)系不大。所以,為了減少對不必要信息的統(tǒng)計(jì),加快滿意度評價結(jié)果的獲取,在從待評價錄音數(shù)據(jù)中獲得所述待評價錄音數(shù)據(jù)的用戶對話節(jié)奏特征和客服代表對話特征時,需要首先從待評價錄音數(shù)據(jù)中截取第一預(yù)設(shè)時長的錄音數(shù)據(jù),例如,獲取待評價錄音數(shù)據(jù)的后半段時長的錄音數(shù)據(jù)。當(dāng)然,可以理解的是,對于第一預(yù)設(shè)時長具體所占待評價錄音數(shù)據(jù)全部時長的百分比,并不限于是百分之五十,還可是待評價錄音數(shù)據(jù)全部時長的后三分之二等。
其中,所述用戶對話節(jié)奏特征至少包括所述第一預(yù)設(shè)時長、所述第一預(yù)設(shè) 時長的錄音數(shù)據(jù)中包括的靜音總時長、所述第一預(yù)設(shè)時長的錄音數(shù)據(jù)中包括的話語總時長、所述第一預(yù)設(shè)時長的錄音數(shù)據(jù)中包括的靜音的段數(shù)、所述第一預(yù)設(shè)時長的錄音數(shù)據(jù)中包括的靜音段的平均時長、所述第一預(yù)設(shè)時長的錄音數(shù)據(jù)中包括的所有話語段的段數(shù)、所述第一預(yù)設(shè)時長的錄音數(shù)據(jù)中包括的話語段的平均時長、所述用戶的話語總時長、所述用戶的話語段數(shù)、所述用戶的話語段的平均時長、所述用戶的話語總時長與所述客服代表的話語總時長的比值、所述用戶的話語段數(shù)與所述客服代表的話語段數(shù)的比值中的一種或多種;
所述客服代表對話節(jié)奏特征至少包括所述客服代表的話語總時長、所述客服代表的話語段數(shù)、所述客服代表的話語段的平均時長中的一種或多種。
其中,用戶對話節(jié)奏特征和客服代表對話節(jié)奏特征可統(tǒng)稱為對話節(jié)奏特征,這些對話節(jié)奏特征是經(jīng)過對大量已知滿意度評價結(jié)果的錄音數(shù)據(jù)的統(tǒng)計(jì)后,根據(jù)統(tǒng)計(jì)結(jié)果從中選取的。
具體地,將錄音數(shù)據(jù)利用語音分割技術(shù)進(jìn)行對話雙方語音切分之后,先統(tǒng)計(jì)目標(biāo)的統(tǒng)計(jì)量在客服代表與用戶數(shù)據(jù)之間的差別,以及目標(biāo)統(tǒng)計(jì)量在對話前段和后段的差別,比如利用如下公式:
X1=(B1+B2+B3+…)/(A1+A2+A3+…)
計(jì)算在對話的后半段用戶話語總時長與客服代表話語總時長的比例X1,其中,B1是后一分段用戶的第一個話語時長,A1是后一分段客服代表的第一個話語時長;
再或者利用如下公式:
X2=max(B)/max(A)
計(jì)算后半段用戶單個切分段的最大時長與后半段客服代表單個切分段的最大時長的比例X2。其中,B表示后半段用戶單個切分段的時長,A表示后半段客服代表單個切分段的時長。max函數(shù)表征尋找所有目標(biāo)集合中的最大值。
因此,通過上述類似的統(tǒng)計(jì)方法,可以獲得大約近千個此類節(jié)奏特征。這時,可以將獲得的上述多個節(jié)奏特征按照用戶與客服代表之間的差別從大到小排列,選擇位列前若干位的特征作為最終的特征。
步驟S13、根據(jù)所述待評價錄音數(shù)據(jù)的用戶對話節(jié)奏特征和客服代表對話節(jié)奏特征,利用預(yù)先確定的滿意度評價模型,確定所述待評價錄音數(shù)據(jù)的滿意 度評價結(jié)果。
其中,滿意度評價模塊是預(yù)先根據(jù)多條已知滿意度評價結(jié)果的錄音數(shù)據(jù)確定的。具體地,首先,根據(jù)已知滿意度評價結(jié)果的錄音數(shù)據(jù),得到所述已知滿意度評價結(jié)果的錄音數(shù)據(jù)的用戶對話節(jié)奏特征和客服代表對話節(jié)奏特征;然后,根據(jù)所述已知滿意度評價結(jié)果的錄音數(shù)據(jù)的用戶對話節(jié)奏特征和客服代表對話節(jié)奏特征,利用SVM算法確定所述滿意度評價模型。
其中,在根據(jù)已知滿意度評價結(jié)果的所述錄音數(shù)據(jù),得到所述已知滿意度評價結(jié)果的錄音數(shù)據(jù)的用戶對話節(jié)奏特征和客服代表對話節(jié)奏特征時,具體地,首先,需要從所述已知評價結(jié)果的錄音數(shù)據(jù)中獲取第二預(yù)設(shè)時長的錄音數(shù)據(jù),即獲取已知評價結(jié)果的錄音數(shù)據(jù)的全部時長中后一段的錄音數(shù)據(jù),以減少對不必要數(shù)據(jù)的處理,提高數(shù)據(jù)處理速度;然后,對所述第二預(yù)設(shè)時長的錄音數(shù)據(jù)進(jìn)行對話雙方語音切分,得到用戶的第二語音段集和客服代表的第二語音段集;最后,根據(jù)所述用戶的第二語音段集,得到所述已知滿意度評價結(jié)果的錄音數(shù)據(jù)的用戶對話節(jié)奏特征,以及根據(jù)所述客服代表的第二語音段集,得到所述已知滿意度評價結(jié)果的錄音數(shù)據(jù)的客服代表對話節(jié)奏特征。
通過上述方法獲得了已知評價結(jié)果的錄音數(shù)據(jù)的用戶對話節(jié)奏特征和客服代表對話節(jié)奏特征后,則可利用SVM算法,根據(jù)大量已知滿意度評價結(jié)果的錄音數(shù)據(jù)的用戶對話節(jié)奏特征和客服代表對話節(jié)奏特征,得到滿意度評價模型。
具體地,在根據(jù)所述已知滿意度評價結(jié)果的錄音數(shù)據(jù)的用戶對話節(jié)奏特征和客服代表對話節(jié)奏特征,利用SVM算法確定所述滿意度評價模型時,可首先,根據(jù)所述已知滿意度評價結(jié)果的錄音數(shù)據(jù)的用戶對話節(jié)奏特征和客服代表對話節(jié)奏特征,獲得第一對話節(jié)奏特征向量,所述第一對話節(jié)奏特征向量的維數(shù)等于所述已知滿意度評價結(jié)果的錄音數(shù)據(jù)的用戶對話節(jié)奏特征和客服代表對話節(jié)奏特征的數(shù)目之和;然后,根據(jù)多個所述第一對話節(jié)奏特征向量,利用所述SVM算法的多項(xiàng)式核函數(shù),確定所述第一支撐向量和所述第二支撐向量。
其中,SVM是一個有監(jiān)督的學(xué)習(xí)模型,在機(jī)器學(xué)習(xí)領(lǐng)域,通常用來進(jìn)行模式識別、分類、以及回歸分析。SVM方法是通過一個非線性映射p,把樣本空間映射到一個高維乃至無窮維的特征空間中,使得在原來的樣本空間中非 線性可分的問題轉(zhuǎn)化為在特征空間中的線性可分的問題。
在本發(fā)明實(shí)施例的處理客服電話的錄音數(shù)據(jù)的方法中,假設(shè)每一條已知滿意度評價結(jié)果的錄音數(shù)據(jù)的用戶對話節(jié)奏特征和客服代表對話節(jié)奏特征共有13個,則每一條已知滿意度評價結(jié)果的錄音數(shù)據(jù)對應(yīng)13個特征值。這時,根據(jù)每一條已知滿意度評價結(jié)果的錄音數(shù)據(jù)對應(yīng)的13個特征值可獲得一個13維的對話節(jié)奏特征向量Xt。那么,每一個對話節(jié)奏特征向量Xt對應(yīng)一個滿意度評價結(jié)果,為滿意或者為不滿意。
此時,可利用SVM的多項(xiàng)式核函數(shù)k(x,y)=[(ax*y)+c]d,對已知滿意度評價結(jié)果的對話節(jié)奏特征向量進(jìn)行訓(xùn)練,從而找到代表滿意評價的第一支撐向量Xa和代表不滿意評價的第二支撐向量Xb。其中,a、c和d均為常數(shù),可根據(jù)實(shí)際需求自行設(shè)定。
因此,步驟S13包括:
根據(jù)所述待評價錄音數(shù)據(jù)的用戶對話節(jié)奏特征和客服代表對話節(jié)奏特征,獲得第二對話節(jié)奏特征向量,所述第二對話節(jié)奏特征向量的維數(shù)等于所述待評價錄音數(shù)據(jù)的用戶對話節(jié)奏特征和客服代表對話節(jié)奏特征的數(shù)目之和;
獲取所第二對話節(jié)奏特征向量與所述第一支撐向量之間的第一距離,以及所述第二對話節(jié)奏特征向量與所述第二支撐向量之間的第二距離;
判斷所述第一距離是否小于第一預(yù)設(shè)閾值,若是,則所述待評價錄音數(shù)據(jù)的滿意度評價結(jié)果為滿意;
若否,則判斷所述第二距離是否小于第二預(yù)設(shè)閾值,若所述第二距離小于所述第二預(yù)設(shè)閾值,則所述待評價錄音數(shù)據(jù)的滿意度評價結(jié)果為不滿意。
其中,第一距離Da=sqrt(∑(Xt_i-Xa_i)^2),第二距離Db=sqrt(∑(Xt_i-X_b i)^2,其中,i=1,2..n,n是特征維度。Xt_i是第二對話節(jié)奏特征向量的第i個坐標(biāo)表示,Xa_i是第一支撐向量的第i個坐標(biāo)表示,Xb_i是第二支撐向量的第i個坐標(biāo)表示。
另外,還可通過計(jì)算召回率來確定從評估數(shù)據(jù)中得到多少目標(biāo)不滿意數(shù)據(jù),從而確定對應(yīng)系統(tǒng)的精確度。
綜上所述,當(dāng)需要確定某一條待評價錄音數(shù)據(jù)的滿意度評價結(jié)果時,需要從該條待評價錄音數(shù)據(jù)中獲得用戶對話特征和客服代表對話特征,即對話節(jié)奏 特征,然后根據(jù)這些對話節(jié)奏特征獲得一個多維對話節(jié)奏特征向量Xt;接著,分別計(jì)算這個對話節(jié)奏特征向量與第一支撐向量Xa和第二支撐向量Xb的距離;最后,判斷該對話節(jié)奏特征向量與哪一個支撐向量的距離在一定閾值范圍之內(nèi),則給對話節(jié)奏特征向量對應(yīng)的待評價錄音數(shù)據(jù)的評價結(jié)果即為哪一個支撐向量對應(yīng)的滿意度評價結(jié)果。
由此可知,本發(fā)明實(shí)施例的處理客服電話的錄音數(shù)據(jù)的方法是一個新的滿意度評價角度,其計(jì)算過程非常簡單,可以快速的評估滿意度,而且能夠達(dá)到幾乎原有相同的評價性能,從而適合快速的處理各個公司大量的客服錄音數(shù)據(jù)。
第二實(shí)施例
依據(jù)本發(fā)明實(shí)施例的另一個方面,還提供了一種處理客服電話的錄音數(shù)據(jù)的裝置,如圖2所示,該裝置200包括:
第一提取模塊205,用于根據(jù)待評價錄音數(shù)據(jù),得到所述待評價錄音數(shù)據(jù)的用戶對話節(jié)奏特征和客服代表對話節(jié)奏特征;
評價模塊207,用于根據(jù)所述待評價錄音數(shù)據(jù)的用戶對話節(jié)奏特征和客服代表對話節(jié)奏特征,利用預(yù)先確定的滿意度評價模型,確定所述待評價錄音數(shù)據(jù)的滿意度評價結(jié)果。
第三實(shí)施例
依據(jù)本發(fā)明實(shí)施例的另一個方面,還提供了一種處理客服電話的錄音數(shù)據(jù)的裝置,如圖3所示,該裝置200包括:
第一提取模塊205,用于根據(jù)待評價錄音數(shù)據(jù),得到所述待評價錄音數(shù)據(jù)的用戶對話節(jié)奏特征和客服代表對話節(jié)奏特征;
評價模塊207,用于根據(jù)所述待評價錄音數(shù)據(jù)的用戶對話節(jié)奏特征和客服代表對話節(jié)奏特征,利用預(yù)先確定的滿意度評價模型,確定所述待評價錄音數(shù)據(jù)的滿意度評價結(jié)果。
可選地,所述第一提取模塊205包括:
第一獲取單元2051,用于從所述待評價錄音數(shù)據(jù)中獲取第一預(yù)設(shè)時長的錄音數(shù)據(jù);
第一切分單元2052,用于對所述第一預(yù)設(shè)時長的錄音數(shù)據(jù)進(jìn)行對話雙方語音切分,得到用戶的第一語音段集和客服代表的第一語音段集;
特征獲取單元2053,用于根據(jù)所述用戶的第一語音段集,得到所述待評價錄音數(shù)據(jù)的用戶對話節(jié)奏特征,以及根據(jù)所述客服代表的第一語音段集,得到所述待評價錄音數(shù)據(jù)的客服代表對話節(jié)奏特征。
可選地,所述用戶對話節(jié)奏特征至少包括所述第一預(yù)設(shè)時長、所述第一預(yù)設(shè)時長的錄音數(shù)據(jù)中包括的靜音總時長、所述第一預(yù)設(shè)時長的錄音數(shù)據(jù)中包括的話語總時長、所述第一預(yù)設(shè)時長的錄音數(shù)據(jù)中包括的靜音的段數(shù)、所述第一預(yù)設(shè)時長的錄音數(shù)據(jù)中包括的靜音段的平均時長、所述第一預(yù)設(shè)時長的錄音數(shù)據(jù)中包括的所有話語段的段數(shù)、所述第一預(yù)設(shè)時長的錄音數(shù)據(jù)中包括的話語段的平均時長、所述用戶的話語總時長、所述用戶的話語段數(shù)、所述用戶的話語段的平均時長、所述用戶的話語總時長與所述客服代表的話語總時長的比值、所述用戶的話語段數(shù)與所述客服代表的話語段數(shù)的比值中的一種或多種;
所述客服代表對話節(jié)奏特征至少包括所述客服代表的話語總時長、所述客服代表的話語段數(shù)、所述客服代表的話語段的平均時長中的一種或多種。
可選地,該裝置200還包括:
第二提取模塊201,用于根據(jù)已知滿意度評價結(jié)果的錄音數(shù)據(jù),得到所述已知滿意度評價結(jié)果的錄音數(shù)據(jù)的用戶對話節(jié)奏特征和客服代表對話節(jié)奏特征;
模型建立模塊203,用于根據(jù)所述已知滿意度評價結(jié)果的錄音數(shù)據(jù)的用戶對話節(jié)奏特征和客服代表對話節(jié)奏特征,利用SVM算法確定所述滿意度評價模型。
可選地,所述滿意度評價模型包括代表滿意評價的第一支撐向量和代表不滿意評價的第二支撐向量;
所述模型建立模塊203包括:
第二獲取單元2031,用于根據(jù)所述已知滿意度評價結(jié)果的錄音數(shù)據(jù)的用戶對話節(jié)奏特征和客服代表對話節(jié)奏特征,獲得第一對話節(jié)奏特征向量,所述第一對話節(jié)奏特征向量的維數(shù)等于所述已知滿意度評價結(jié)果的錄音數(shù)據(jù)的用戶對話節(jié)奏特征和客服代表對話節(jié)奏特征的數(shù)目之和;
模型建立單元2032,用于根據(jù)多個所述第一對話節(jié)奏特征向量,利用所述SVM算法的多項(xiàng)式核函數(shù),確定所述第一支撐向量和所述第二支撐向量。
可選地,所述評價模塊207包括:
第三獲取單元2071,用于根據(jù)所述待評價錄音數(shù)據(jù)的用戶對話節(jié)奏特征和客服代表對話節(jié)奏特征,獲得第二對話節(jié)奏特征向量,所述第二對話節(jié)奏特征向量的維數(shù)等于所述待評價錄音數(shù)據(jù)的用戶對話節(jié)奏特征和客服代表對話節(jié)奏特征的數(shù)目之和;
第四獲取單元2072,用于獲取所第二對話節(jié)奏特征向量與所述第一支撐向量之間的第一距離,以及所述第二對話節(jié)奏特征向量與所述第二支撐向量之間的第二距離;
第一判斷單元2073,用于判斷所述第一距離是否小于第一預(yù)設(shè)閾值,若是,則所述待評價錄音數(shù)據(jù)的滿意度評價結(jié)果為滿意;
第二判斷單元2074,用于當(dāng)所述第一判斷單元2073的判斷結(jié)果為否時,判斷所述第二距離是否小于第二預(yù)設(shè)閾值,若所述第二距離小于所述第二預(yù)設(shè)閾值,則所述待評價錄音數(shù)據(jù)的滿意度評價結(jié)果為不滿意。
可選地,所述第二提取模塊201包括:
第五獲取單元2011,用于從所述已知評價結(jié)果的錄音數(shù)據(jù)中獲取第二預(yù)設(shè)時長的錄音數(shù)據(jù);
第二切分單元2012,用于對所述第二預(yù)設(shè)時長的錄音數(shù)據(jù)進(jìn)行對話雙方語音切分,得到用戶的第二語音段集和客服代表的第二語音段集;
第六獲取單元2013,用于根據(jù)所述用戶的第二語音段集,得到所述已知滿意度評價結(jié)果的錄音數(shù)據(jù)的用戶對話節(jié)奏特征,以及根據(jù)所述客服代表的第二語音段集,得到所述已知滿意度評價結(jié)果的錄音數(shù)據(jù)的客服代表對話節(jié)奏特征。
以上所述的是本發(fā)明的優(yōu)選實(shí)施方式,應(yīng)當(dāng)指出對于本技術(shù)領(lǐng)域的普通人員來說,在不脫離本發(fā)明所述的原理前提下還可以作出若干改進(jìn)和潤飾,這些改進(jìn)和潤飾也在本發(fā)明的保護(hù)范圍內(nèi)。