一種基于語音情感識別的信息反饋方法和系統(tǒng)的制作方法
【專利摘要】本發(fā)明提出一種基于語音情感識別的信息反饋方法和系統(tǒng),其中方法包括:預(yù)先保存語音韻律特征與用戶類別的對應(yīng)關(guān)系和用戶類別與情感識別所需特征參數(shù)類型的對應(yīng)關(guān)系;獲取用戶輸入的語音數(shù)據(jù),根據(jù)該語音數(shù)據(jù)的韻律特征查找所述語音韻律特征與用戶類別的對應(yīng)關(guān)系,獲取所述該用戶所屬的類別;根據(jù)所述用戶所屬的類別查找所述用戶類別與情感識別所需參數(shù)類型的對應(yīng)關(guān)系,獲取該用戶的語音數(shù)據(jù)所需提取的特征參數(shù)類型;從該用戶的語音數(shù)據(jù)中提取對應(yīng)的特征參數(shù)值;采用匹配算法對提取的特征參數(shù)值進行處理,得到所述語音數(shù)據(jù)所對應(yīng)的情感數(shù)據(jù),將所述情感數(shù)據(jù)作為該用戶反饋的信息。本發(fā)明能夠支持用戶以語音的方式反饋信息。
【專利說明】一種基于語音情感識別的信息反饋方法和系統(tǒng)
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及計算機網(wǎng)絡(luò)【技術(shù)領(lǐng)域】,尤其涉及一種基于語音情感識別的信息反饋方法和系統(tǒng)。
【背景技術(shù)】
[0002]電子商務(wù)從本質(zhì)上來說是一種線上購物方式,因而對于購物的流程,如售前推銷、購買、售后服務(wù)等它都具備,當(dāng)消費者第一次選擇某個網(wǎng)站購物時,可能隨機性比較大,但是之后再去選擇這個網(wǎng)站時,就會考慮在這個網(wǎng)站已有的購物體驗。毫無疑問,售后服務(wù)是整個購物過程的一個重要環(huán)節(jié),由于都是通過線上完成,因而對于商品的評價機制便成為能夠得到用戶購物體驗的最佳方式。
[0003]電子商務(wù)從誕生之初便離不開計算機技術(shù)的發(fā)展,從靜態(tài)網(wǎng)頁到動態(tài)的人機交互網(wǎng)站,計算機技術(shù)一次又一次的使在線購物更加方便。目前,大多數(shù)購物網(wǎng)站都將注意力放在購物前和購物中,而購物完成后的售后服務(wù)卻飽受詬病,究其原因,很大程度由于不能及時得到消費者在購物后的體驗。
[0004]目前對于用戶對于購物體驗的信息反饋都是基于網(wǎng)站對相關(guān)商品的手動輸入方式,如圖1所示,如通過文字評價、到評星級以及曬單等,完成用戶向網(wǎng)站反饋購物體驗的過程。商品評價系統(tǒng)會記錄消費者反饋的信息,進行顯示,一方面給予其他消費者做出購物決策提供信息,另一方面會給電子商務(wù)公司提供用戶體驗信息。用戶反饋的評價信息的應(yīng)用流程如圖2所示,當(dāng)電子商務(wù)公司收集到評價信息后,通過評估和分析,更正或者提高相關(guān)服務(wù),以便能更好提高用戶滿意度,增加用戶粘性。
[0005]用戶體驗歸根結(jié)底是消費者對于此次購物過程的情緒表達(dá),而傳統(tǒng)的文字輸入式反饋信息并不能完全真實的反映消費者的購物體驗,由于有些人不善于通過文字去表達(dá)情緒或者由于家庭職業(yè)等原因,對于文字的使用有所保留。這就使得評價系統(tǒng)所得到的信息有很大失真,因而通過評價系統(tǒng)得到的數(shù)據(jù)對于網(wǎng)站端商品推薦和更正營銷決策上的幫助微乎其微。這就使得電子商務(wù)公司提供的購物環(huán)境沒有充分考慮消費者的體驗,必然帶來用戶流失的嚴(yán)重后果;
[0006]另一方面,系統(tǒng)不得不耗費大量的空間去保存用戶反饋的文字信息,而模糊不清的評價信息對于后續(xù)的數(shù)據(jù)分析上貢獻度非常低,保存這部分信息會浪費已有空間,如果不保存,又會造成數(shù)據(jù)丟失。
[0007]最后,單一的信息反饋方式無法滿足人們所要求的購物便捷,如用戶通過移動端購物時,以文字的方式輸入反饋信息不方便。
【發(fā)明內(nèi)容】
[0008]本發(fā)明提供了一種基于語音情感識別的信息反饋方法,能夠支持用戶以語音的方式反饋信息。
[0009]本發(fā)明還提供了一種基于語音情感識別的信息反饋系統(tǒng),能夠支持用戶以語音的方式反饋信息。
[0010]本發(fā)明的技術(shù)方案是這樣實現(xiàn)的:
[0011]一種基于語音情感識別的信息反饋方法,包括:
[0012]預(yù)先保存語音韻律特征與用戶類別的對應(yīng)關(guān)系和用戶類別與情感識別所需特征參數(shù)類型的對應(yīng)關(guān)系;
[0013]獲取用戶輸入的語音數(shù)據(jù),根據(jù)該語音數(shù)據(jù)的韻律特征查找所述語音韻律特征與用戶類別的對應(yīng)關(guān)系,獲取所述該用戶所屬的類別;
[0014]根據(jù)所述用戶所屬的類別查找所述用戶類別與情感識別所需參數(shù)類型的對應(yīng)關(guān)系,獲取該用戶的語音數(shù)據(jù)所需提取的特征參數(shù)類型;從該用戶的語音數(shù)據(jù)中提取對應(yīng)的特征參數(shù)值;
[0015]采用匹配算法對提取的特征參數(shù)值進行處理,得到所述語音數(shù)據(jù)所對應(yīng)的情感數(shù)據(jù),將所述情感數(shù)據(jù)作為該用戶反饋的信息。
[0016]上述方法中,特征參數(shù)類型可以為梅爾頻率倒譜系數(shù)或線性倒譜系數(shù)。
[0017]匹配算法可以為最優(yōu)模糊量化算法、隱馬爾科夫模型算法或人工神經(jīng)網(wǎng)絡(luò)算法;
[0018]其中,最優(yōu)模糊量化算法具體可以為:
[0019]通過矢量量化訓(xùn)練得到預(yù)先保存的各個標(biāo)準(zhǔn)情感語音所對應(yīng)的標(biāo)準(zhǔn)碼本,所述標(biāo)準(zhǔn)碼本為多維向量;
[0020]分別以各個標(biāo)準(zhǔn)情感語音對應(yīng)的標(biāo)準(zhǔn)碼本為中心確定多維環(huán)空間,其中,確定多維環(huán)空間的方式為:將作為中心的標(biāo)準(zhǔn)情感語音對應(yīng)的標(biāo)準(zhǔn)碼本作為圓心,分別計算作為中心的標(biāo)準(zhǔn)情感語音對應(yīng)的標(biāo)準(zhǔn)碼本與其他標(biāo)準(zhǔn)情感語音對應(yīng)的標(biāo)準(zhǔn)碼本的歐式距離,將計算出的多個歐式距離作為半徑,形成環(huán)域,將各個環(huán)域所劃分的的區(qū)域分別作為各個標(biāo)準(zhǔn)情感語音對應(yīng)的區(qū)域;
[0021]確定所述用戶輸入的語音數(shù)據(jù)的特征參數(shù)值所組成的多維向量在各個多維環(huán)空間中的位置,選取出現(xiàn)次數(shù)最多的區(qū)域所對應(yīng)的標(biāo)準(zhǔn)情感語音作為該語音數(shù)據(jù)所對應(yīng)的情感數(shù)據(jù)。
[0022]上述方法可以進一步包括:
[0023]保存所述情感數(shù)據(jù);
[0024]根據(jù)所述情感數(shù)據(jù)查找預(yù)先保存的情感數(shù)據(jù)與影響因子的對應(yīng)關(guān)系,獲取所述情感數(shù)據(jù)所對應(yīng)的情感因子,采用所述影響因子對相關(guān)決策系統(tǒng)提供決策支持。
[0025]獲取用戶輸入的語音數(shù)據(jù)的方式可以為:
[0026]接收用戶輸入的語音數(shù)據(jù),當(dāng)所述語音數(shù)據(jù)的時長不超過預(yù)先設(shè)定的閾值時,獲取該語音數(shù)據(jù)。
[0027]一種基于語音情感識別的信息反饋系統(tǒng),包括:
[0028]數(shù)據(jù)庫,用于保存語音韻律特征與用戶類別的對應(yīng)關(guān)系和用戶類別與情感識別所需特征參數(shù)類型的對應(yīng)關(guān)系;
[0029]參數(shù)提取模塊,用于獲取用戶輸入的語音數(shù)據(jù),根據(jù)該語音數(shù)據(jù)的韻律特征查找所述語音韻律特征與用戶類別的對應(yīng)關(guān)系,獲取所述該用戶所屬的類別;根據(jù)所述用戶所屬的類別查找所述用戶類別與情感識別所需參數(shù)類型的對應(yīng)關(guān)系,獲取該用戶的語音數(shù)據(jù)所需提取的特征參數(shù)類型;從該用戶的語音數(shù)據(jù)中提取對應(yīng)的特征參數(shù)值;[0030]識別模塊,用于采用匹配算法對提取的特征參數(shù)值進行處理,得到所述語音數(shù)據(jù)所對應(yīng)的情感數(shù)據(jù),將所述情感數(shù)據(jù)作為該用戶反饋的信息。
[0031]上述系統(tǒng)中,特征參數(shù)類型可以為梅爾頻率倒譜系數(shù)或線性倒譜系數(shù)。
[0032]識別模塊采用的匹配算法可以為最優(yōu)模糊量化算法、隱馬爾科夫模型算法或人工神經(jīng)網(wǎng)絡(luò)算法;
[0033]其中,最優(yōu)模糊量化算法具體可以為:
[0034]通過矢量量化訓(xùn)練得到預(yù)先保存的各個標(biāo)準(zhǔn)情感語音所對應(yīng)的標(biāo)準(zhǔn)碼本,所述標(biāo)準(zhǔn)碼本為多維向量;
[0035]分別以各個標(biāo)準(zhǔn)情感語音對應(yīng)的標(biāo)準(zhǔn)碼本為中心確定多維環(huán)空間,其中,確定多維環(huán)空間的方式為:將作為中心的標(biāo)準(zhǔn)情感語音對應(yīng)的標(biāo)準(zhǔn)碼本作為圓心,分別計算作為中心的標(biāo)準(zhǔn)情感語音對應(yīng)的標(biāo)準(zhǔn)碼本與其他標(biāo)準(zhǔn)情感語音對應(yīng)的標(biāo)準(zhǔn)碼本的歐式距離,將計算出的多個歐式距離作為半徑,形成環(huán)域,將各個環(huán)域所劃分的的區(qū)域分別作為各個標(biāo)準(zhǔn)情感語音對應(yīng)的區(qū)域;
[0036]確定所述用戶輸入的語音數(shù)據(jù)的特征參數(shù)值所組成的多維向量在各個多維環(huán)空間中的位置,選取出現(xiàn)次數(shù)最多的區(qū)域所對應(yīng)的標(biāo)準(zhǔn)情感語音作為該語音數(shù)據(jù)所對應(yīng)的情感數(shù)據(jù)。
[0037]上述系統(tǒng)還可以包括:
[0038]決策支持模塊,用于保存所述情感數(shù)據(jù),并根據(jù)所述情感數(shù)據(jù)查找預(yù)先保存的情感數(shù)據(jù)與影響因子的對應(yīng)關(guān)系,獲取所述情感數(shù)據(jù)所對應(yīng)的情感因子,采用所述影響因子對相關(guān)決策系統(tǒng)提供決策支持。
[0039]上述系統(tǒng)中,參數(shù)提取模塊獲取用戶輸入的語音數(shù)據(jù)的方式可以為:接收用戶輸入的語音數(shù)據(jù),當(dāng)所述語音數(shù)據(jù)的時長不超過預(yù)先設(shè)定的閾值時,獲取該語音數(shù)據(jù)。
[0040]可見,本發(fā)明提出的基于語音情感識別的信息反饋方法和系統(tǒng),通過識別用戶輸入的語音數(shù)據(jù)所對應(yīng)的情感數(shù)據(jù),并將該情感數(shù)據(jù)作為用戶反饋的信息,從而支持用戶以語音的方式反饋信息。
【專利附圖】
【附圖說明】
[0041]圖1現(xiàn)有技術(shù)中用戶的購物體驗信息反饋方式示意圖;
[0042]圖2現(xiàn)有技術(shù)中用戶的購物體驗信息應(yīng)用方式示意圖;
[0043]圖3為本發(fā)明提出的基于語音情感識別的信息反饋方法實現(xiàn)流程圖;
[0044]圖4為本發(fā)明實施例一的實現(xiàn)流程圖;
[0045]圖5為本發(fā)明實施例一中的最優(yōu)模糊量化算法示意圖;
[0046]圖6為本發(fā)明實施例二的實現(xiàn)流程圖;
[0047]圖7為本發(fā)明提出的基于語音情感識別的信息反饋裝置結(jié)構(gòu)示意圖。
【具體實施方式】
[0048]本發(fā)明提出一種基于語音情感識別的信息反饋方法,預(yù)先保存保存語音韻律特征與用戶類別的對應(yīng)關(guān)系和用戶類別與情感識別所需特征參數(shù)類型的對應(yīng)關(guān)系,如圖3為該方法實現(xiàn)流程圖,包括:[0049]步驟301:獲取用戶輸入的語音數(shù)據(jù),根據(jù)該語音數(shù)據(jù)的韻律特征查找所述語音韻律特征與用戶類別的對應(yīng)關(guān)系,獲取該用戶所屬的類別;
[0050]步驟302:根據(jù)所述用戶所屬的類別查找所述用戶類別與情感識別所需參數(shù)類型的對應(yīng)關(guān)系,獲取該用戶的語音數(shù)據(jù)所需提取的特征參數(shù)類型;從該用戶的語音數(shù)據(jù)中提取對應(yīng)的特征參數(shù)值;
[0051]步驟303:采用匹配算法對提取的特征參數(shù)值進行處理,得到所述語音數(shù)據(jù)所對應(yīng)的情感數(shù)據(jù),將所述情感數(shù)據(jù)作為該用戶反饋的信息。
[0052]上述步驟302中,特征參數(shù)類型可以為梅爾頻率倒譜系數(shù)或線性倒譜系數(shù)等,可以根據(jù)用戶類型(即用戶群)的特點綜合選擇所需特征參數(shù)類型的個數(shù),并根據(jù)實際測試選擇適用性強的特征參數(shù)類型。
[0053]上述步驟303中,匹配算法可以為本發(fā)明提出的最優(yōu)模糊量化算法、隱馬爾科夫模型算法或人工神經(jīng)網(wǎng)絡(luò)算法等;得到的情感數(shù)據(jù)可以用單一字符標(biāo)識,例如“O”標(biāo)識高興、“ I”標(biāo)識憤怒、“ 2 ”標(biāo)識平靜,等等。
[0054]其中,最優(yōu)模糊量化算法具體可以為:
[0055]通過矢量量化訓(xùn)練得到預(yù)先保存的各個標(biāo)準(zhǔn)情感語音所對應(yīng)的標(biāo)準(zhǔn)碼本,所述標(biāo)準(zhǔn)碼本為多維向量;
[0056]分別以各個標(biāo)準(zhǔn)情感語音對應(yīng)的標(biāo)準(zhǔn)碼本為中心確定多維環(huán)空間,其中,確定多維環(huán)空間的方式為:將作為中心的標(biāo)準(zhǔn)情感語音對應(yīng)的標(biāo)準(zhǔn)碼本作為圓心,分別計算作為中心的標(biāo)準(zhǔn)情感語音對應(yīng)的標(biāo)準(zhǔn)碼本與其他標(biāo)準(zhǔn)情感語音對應(yīng)的標(biāo)準(zhǔn)碼本的歐式距離,將計算出的多個歐式距離作為半徑,形成環(huán)域,將各個環(huán)域所劃分的的區(qū)域分別作為各個標(biāo)準(zhǔn)情感語音對應(yīng)的區(qū)域;
[0057]確定所述用戶輸入的語音數(shù)據(jù)的特征參數(shù)值所組成的多維向量在各個多維環(huán)空間中的位置,選取出現(xiàn)次數(shù)最多的區(qū)域所對應(yīng)的標(biāo)準(zhǔn)情感語音作為該語音數(shù)據(jù)所對應(yīng)的情感數(shù)據(jù)。
[0058]上述方法可以進一步包括:保存情感數(shù)據(jù);
[0059]根據(jù)情感數(shù)據(jù)查找預(yù)先保存的情感數(shù)據(jù)與影響因子的對應(yīng)關(guān)系,獲取所述情感數(shù)據(jù)所對應(yīng)的情感因子,采用影響因子對相關(guān)決策系統(tǒng)提供決策支持,以便得到最佳的營銷方案,從而提高用戶滿意度和用戶粘性。
[0060]此外,上述步驟101中,為了防止惡意評價,可以預(yù)先設(shè)定閾值來限定用戶輸入語音的時長,當(dāng)語音數(shù)據(jù)的時長不超過預(yù)先設(shè)定的閾值時,獲取該語音數(shù)據(jù)。在處理用戶輸入的語音數(shù)據(jù)時,根據(jù)語音數(shù)據(jù)的特點,可以采用分段處理的方式,將語音數(shù)據(jù)劃分成多個語音片段進行處理。
[0061]以下舉具體的實施例詳細(xì)介紹。
[0062]實施例一:
[0063]本實施例在用戶評價系統(tǒng)應(yīng)用語音情感識別技術(shù),開設(shè)語音評價功能;為了滿足不同用戶群的需要,可以保留傳統(tǒng)的文本輸入方式,用戶可以自由選擇文本輸入式評價或者語音評價。
[0064]如圖4為本實施例的實現(xiàn)流程圖,包括以下步驟:
[0065]步驟401:判斷用戶是否選擇語音評價的輸入方式,如果是,則繼續(xù)執(zhí)行步驟402 ;否則,根據(jù)用戶的選擇,采用其他評價方式處理。
[0066]步驟402:接收用戶輸入的語音數(shù)據(jù)。
[0067]步驟403:為了方式惡意評價,設(shè)定動態(tài)閾值限定用戶的輸入時長。
[0068]步驟404:判斷用戶輸入的語音數(shù)據(jù)是否有效,判斷的方式可以具體為:如果用戶輸入語音數(shù)據(jù)的時長超過預(yù)先設(shè)定的動態(tài)閾值,則判定該語音數(shù)據(jù)無效,返回執(zhí)行步驟402 ;如果用戶輸入語音數(shù)據(jù)的時長不超過預(yù)先設(shè)定的動態(tài)閾值,則判定該語音數(shù)據(jù)有效,繼續(xù)執(zhí)行步驟405。[0069]步驟405:針對用戶輸入的語音數(shù)據(jù),通過語音情感識別系統(tǒng)進行處理。語音情感識別系統(tǒng)的處理過程包括:語音數(shù)據(jù)的特征參數(shù)提取和語音數(shù)據(jù)的情感識別。
[0070]其中,在語音數(shù)據(jù)的特征參數(shù)提取階段,可以根據(jù)用戶群的特點設(shè)定提取特征參數(shù)的個數(shù)及類型,在設(shè)定時具體可以先選取幾個不同的特征參數(shù)類型,例如梅爾頻率倒譜系數(shù)或線性倒譜系數(shù)等,然后可以根據(jù)實際測試選擇適應(yīng)性強的特征參數(shù)類型。在對用戶的語音數(shù)據(jù)提取特征參數(shù)時,首先根據(jù)語音數(shù)據(jù)的韻律特征判斷該用戶所屬的類別(即用戶群,可以根據(jù)性別、年齡等劃分不同類別),然后確定該類別用戶的語音數(shù)據(jù)需要提取的特征參數(shù)類型,之后提取相應(yīng)的特征參數(shù)值。
[0071]在語音數(shù)據(jù)的情感識別階段,可以選擇不同的匹配算法對提取的特征參數(shù)值進行處理,如隱馬爾科夫模型算法或人工神經(jīng)網(wǎng)絡(luò)算法等,考慮到評價系統(tǒng)需要時效性和準(zhǔn)確性,需要采用計算相對簡潔并不失準(zhǔn)確性的匹配算法,本發(fā)明提出最優(yōu)模糊量化(MFVQ—Most Fuzzy Vector Quantization)算法:它以矢量量化技術(shù)為基礎(chǔ),結(jié)合評價系統(tǒng)實際識別的情感狀態(tài)的粗粒度模糊性,故在確定情感狀態(tài)的計算上不采用以最小歐氏距離為最終標(biāo)準(zhǔn),而是通過得到待匹配情感語音處在各標(biāo)準(zhǔn)情感語音作為多個環(huán)域中心時形成的混合多維環(huán)空間的最終位置,得出最終所屬的那種情感語音。處理結(jié)果為用戶此次語音評價的情感數(shù)據(jù),即情感狀態(tài)。情感數(shù)據(jù)可以用單一字符標(biāo)識。
[0072]結(jié)合附圖5,介紹本實施例提出的最優(yōu)模糊量化算法。
[0073]首先,通過矢量量化訓(xùn)練得到預(yù)先保存的各個標(biāo)準(zhǔn)情感語音所對應(yīng)的標(biāo)準(zhǔn)碼本,所述標(biāo)準(zhǔn)碼本為多維向量;以取3個標(biāo)準(zhǔn)情感語音為例,
[0074]標(biāo)準(zhǔn)情感語音A對應(yīng)的標(biāo)準(zhǔn)碼本為Vl= (al, bl,......)
[0075]標(biāo)準(zhǔn)情感語音B對應(yīng)的標(biāo)準(zhǔn)碼本為V2= (a2, b2,......)
[0076]標(biāo)準(zhǔn)情感語音C對應(yīng)的標(biāo)準(zhǔn)碼本為V3= (a3,b3,……)
[0077]之后,分別以各個標(biāo)準(zhǔn)情感語音對應(yīng)的標(biāo)準(zhǔn)碼本為中心確定多維環(huán)空間,確定用戶輸入的待識別語音數(shù)據(jù)對應(yīng)的多維向量在各個多維環(huán)空間中的位置。
[0078]以采用標(biāo)準(zhǔn)情感語音A為中心為例,如圖5顯示了以標(biāo)準(zhǔn)情感語音A對應(yīng)的標(biāo)準(zhǔn)碼本為中心確定的多維環(huán)空間,其中,圓心為Vl確定出的點,小圓的半徑為Vl與V2的歐式距離,大圓的半徑為Vl與V3的歐式距離;兩個圓形將整個空間劃分為3個區(qū)域,其中,小圓內(nèi)的區(qū)域為標(biāo)準(zhǔn)情感語音A對應(yīng)的區(qū)域,小圓外大圓內(nèi)的區(qū)域為標(biāo)準(zhǔn)情感語音B對應(yīng)的區(qū)域,大圓外的區(qū)域為標(biāo)準(zhǔn)情感語音C對應(yīng)的區(qū)域。然后,計算用戶輸入的待識別語音數(shù)據(jù)對應(yīng)的多維向量與Vl的歐式距離,根據(jù)該距離確定待識別語音數(shù)據(jù)在多維環(huán)空間中的位置;在圖5中,待識別語音數(shù)據(jù)位于標(biāo)準(zhǔn)情感語音B對應(yīng)的區(qū)域內(nèi),則得到標(biāo)準(zhǔn)情感語音B位置票數(shù)I。[0079]再分別以標(biāo)準(zhǔn)情感語音B和C為中心確定多維環(huán)空間,確定待識別語音數(shù)據(jù)在多維環(huán)空間中的位置,最終票數(shù)最多的標(biāo)準(zhǔn)情感語音即為最終確定的待識別語音數(shù)據(jù)的情感數(shù)據(jù)。如果每種票數(shù)相等,則可以通過計算待識別語音數(shù)據(jù)對應(yīng)的的多維向量與標(biāo)準(zhǔn)情感語音對應(yīng)的多維向量的歐式距離確定待識別語音數(shù)據(jù)的情感數(shù)據(jù)。
[0080]步驟406:將上述情感數(shù)據(jù)保存入數(shù)據(jù)庫中,并在前端展示。
[0081]在本實施例中,應(yīng)用語音情感識別技術(shù)進行語音數(shù)據(jù)處理,得到情感數(shù)據(jù),顯示并保存情感數(shù)據(jù)。這里的語音信號處理可以得到不依賴說話人和說話內(nèi)容的特征,這樣就可以得到具有普適性的訓(xùn)練集。在處理用戶輸入語音時,根據(jù)語音所具有的特點,可以采用分治思想,設(shè)定段長,將用戶一次輸入的語音數(shù)據(jù)劃分成一個個語音片段進行處理。
[0082]實施例二:
[0083]在本實施例中,通過上述實施例一保存的情感數(shù)據(jù)可以作為用戶體驗的直接信息(好壞),應(yīng)用這些直接信息,可以為相關(guān)系統(tǒng)提供決策支持,做出最佳的營銷方式,從而提升用戶滿意度以及用戶粘性。
[0084]如圖6為本實施例的實現(xiàn)流程圖,包括:
[0085]根據(jù)預(yù)先設(shè)定的情感數(shù)據(jù)與影響因子的對應(yīng)關(guān)系,將情感數(shù)據(jù)映射為影響因子,例如影響因子越高表示用戶的滿意度越高。
[0086]之后,系統(tǒng)根據(jù)大量用戶反饋的情感數(shù)據(jù)所對應(yīng)的影響因子調(diào)整相關(guān)系統(tǒng)的營銷決策,例如,購物前端系統(tǒng)、運營系統(tǒng)和客服系統(tǒng)等。
[0087]本發(fā)明還提出一種基于語音情感識別的信息反饋系統(tǒng),如圖7為該系統(tǒng)的結(jié)構(gòu)示意圖,包括:
[0088]數(shù)據(jù)庫701,用于保存語音韻律特征與用戶類別的對應(yīng)關(guān)系和用戶類別與情感識別所需特征參數(shù)類型的對應(yīng)關(guān)系;
[0089]參數(shù)提取模塊702,用于獲取用戶輸入的語音數(shù)據(jù),根據(jù)該語音數(shù)據(jù)的韻律特征查找所述語音韻律特征與用戶類別的對應(yīng)關(guān)系,獲取所述該用戶所屬的類別;根據(jù)所述用戶所屬的類別查找所述用戶類別與情感識別所需參數(shù)類型的對應(yīng)關(guān)系,獲取該用戶的語音數(shù)據(jù)所需提取的特征參數(shù)類型;從該用戶的語音數(shù)據(jù)中提取對應(yīng)的特征參數(shù)值;
[0090]識別模塊703,用于采用匹配算法對提取的特征參數(shù)值進行處理,得到所述語音數(shù)據(jù)所對應(yīng)的情感數(shù)據(jù),將所述情感數(shù)據(jù)作為該用戶反饋的信息。
[0091]上述系統(tǒng)中,特征參數(shù)類型可以為:梅爾頻率倒譜系數(shù)或線性倒譜系數(shù)等。
[0092]上述系統(tǒng)中,識別模塊703采用的匹配算法可以為本發(fā)明提出的最優(yōu)模糊量化算法、隱馬爾科夫模型算法或人工神經(jīng)網(wǎng)絡(luò)算法等;
[0093]其中,最優(yōu)模糊量化算法具體可以為:
[0094]通過矢量量化訓(xùn)練得到預(yù)先保存的各個標(biāo)準(zhǔn)情感語音所對應(yīng)的標(biāo)準(zhǔn)碼本,所述標(biāo)準(zhǔn)碼本為多維向量;
[0095]分別以各個標(biāo)準(zhǔn)情感語音對應(yīng)的標(biāo)準(zhǔn)碼本為中心確定多維環(huán)空間,其中,確定多維環(huán)空間的方式為:將作為中心的標(biāo)準(zhǔn)情感語音對應(yīng)的標(biāo)準(zhǔn)碼本作為圓心,分別計算作為中心的標(biāo)準(zhǔn)情感語音對應(yīng)的標(biāo)準(zhǔn)碼本與其他標(biāo)準(zhǔn)情感語音對應(yīng)的標(biāo)準(zhǔn)碼本的歐式距離,將計算出的多個歐式距離作為半徑,形成環(huán)域,將各個環(huán)域所劃分的的區(qū)域分別作為各個標(biāo)準(zhǔn)情感語音對應(yīng)的區(qū)域;[0096]確定所述用戶輸入的語音數(shù)據(jù)的特征參數(shù)值所組成的多維向量在各個多維環(huán)空間中的位置,選取出現(xiàn)次數(shù)最多的區(qū)域所對應(yīng)的標(biāo)準(zhǔn)情感語音作為該語音數(shù)據(jù)所對應(yīng)的情感數(shù)據(jù)。
[0097]上述系統(tǒng)還可以包括:
[0098]決策支持模塊704,用于保存所述情感數(shù)據(jù),并根據(jù)所述情感數(shù)據(jù)查找預(yù)先保存的情感數(shù)據(jù)與影響因子的對應(yīng)關(guān)系,獲取所述情感數(shù)據(jù)所對應(yīng)的情感因子,采用所述影響因子對相關(guān)決策系統(tǒng)提供決策支持。
[0099]上述系統(tǒng)中,參數(shù)提取模塊702獲取用戶輸入的語音數(shù)據(jù)的方式可以為:接收用戶輸入的語音數(shù)據(jù),當(dāng)所述語音數(shù)據(jù)的時長不大于預(yù)先設(shè)定的閾值時,獲取該語音數(shù)據(jù)。
[0100]綜上可見,本發(fā)明能夠改進目前電子商務(wù)網(wǎng)站的評價系統(tǒng),提供了多種評價方式選擇,方便了不同消費者進行購物體驗的反饋,并且可以獲得相對真實有效的購物體驗信息。有利于后續(xù)使用這些數(shù)據(jù)提供相關(guān)決策支持。在數(shù)據(jù)存儲上也提高了系統(tǒng)性能,方便后續(xù)的操作??傮w說來,基于語音情感識別技術(shù)的用戶評價信息反饋系統(tǒng)可以獲得相對真實的用戶體驗,在后續(xù)制定營銷策略時相對來說會更準(zhǔn)確,進而提升了用戶粘性。
[0101]以上所述僅為本發(fā)明的較佳實施例而已,并不用以限制本發(fā)明,凡在本發(fā)明的精神和原則之內(nèi),所做的任何修改、等同替換、改進等,均應(yīng)包含在本發(fā)明保護的范圍之內(nèi)。
【權(quán)利要求】
1.一種基于語音情感識別的信息反饋方法,其特征在于,所述方法包括: 預(yù)先保存語音韻律特征與用戶類別的對應(yīng)關(guān)系和用戶類別與情感識別所需特征參數(shù)類型的對應(yīng)關(guān)系; 獲取用戶輸入的語音數(shù)據(jù),根據(jù)該語音數(shù)據(jù)的韻律特征查找所述語音韻律特征與用戶類別的對應(yīng)關(guān)系,獲取所述該用戶所屬的類別; 根據(jù)所述用戶所屬的類別查找所述用戶類別與情感識別所需參數(shù)類型的對應(yīng)關(guān)系,獲取該用戶的語音數(shù)據(jù)所需提取的特征參數(shù)類型;從該用戶的語音數(shù)據(jù)中提取對應(yīng)的特征參數(shù)值; 采用匹配算法對提取的特征參數(shù)值進行處理,得到所述語音數(shù)據(jù)所對應(yīng)的情感數(shù)據(jù),將所述情感數(shù)據(jù)作為該用戶反饋的信息。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述特征參數(shù)類型為梅爾頻率倒譜系數(shù)或線性倒譜系數(shù)。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述匹配算法為最優(yōu)模糊量化算法、隱馬爾科夫模型算法或人工神經(jīng)網(wǎng)絡(luò)算法; 所述最優(yōu)模糊量化算法為: 通過矢量量化訓(xùn)練得到預(yù)先保存的各個標(biāo)準(zhǔn)情感語音所對應(yīng)的標(biāo)準(zhǔn)碼本,所述標(biāo)準(zhǔn)碼本為多維向量; 分別以各個標(biāo)準(zhǔn)情感語音對應(yīng)的標(biāo)準(zhǔn)碼本為中心確定多維環(huán)空間,其中,確定多維環(huán)空間的方式為:將作為中心的標(biāo)準(zhǔn)情感語音對應(yīng)的標(biāo)準(zhǔn)碼本作為圓心,分別計算作為中心的標(biāo)準(zhǔn)情感語音對應(yīng)的標(biāo)準(zhǔn)碼本與其他標(biāo)準(zhǔn)情感語音對應(yīng)的標(biāo)準(zhǔn)碼本的歐式距離,將計算出的多個歐式距離作為半徑,形成 環(huán)域,將各個環(huán)域所劃分的的區(qū)域分別作為各個標(biāo)準(zhǔn)情感語音對應(yīng)的區(qū)域; 確定所述用戶輸入的語音數(shù)據(jù)的特征參數(shù)值所組成的多維向量在各個多維環(huán)空間中的位置,選取出現(xiàn)次數(shù)最多的區(qū)域所對應(yīng)的標(biāo)準(zhǔn)情感語音作為該語音數(shù)據(jù)所對應(yīng)的情感數(shù)據(jù)。
4.根據(jù)權(quán)利要求1、2或3所述的方法,其特征在于,所述方法進一步包括: 保存所述情感數(shù)據(jù); 根據(jù)所述情感數(shù)據(jù)查找預(yù)先保存的情感數(shù)據(jù)與影響因子的對應(yīng)關(guān)系,獲取所述情感數(shù)據(jù)所對應(yīng)的情感因子,采用所述影響因子對相關(guān)決策系統(tǒng)提供決策支持。
5.根據(jù)權(quán)利要求1、2或3所述的方法,其特征在于,所述獲取用戶輸入的語音數(shù)據(jù)的方式為: 接收用戶輸入的語音數(shù)據(jù),當(dāng)所述語音數(shù)據(jù)的時長不超過預(yù)先設(shè)定的閾值時,獲取該語音數(shù)據(jù)。
6.一種基于語音情感識別的信息反饋系統(tǒng),其特征在于,所述系統(tǒng)包括: 數(shù)據(jù)庫,用于保存語音韻律特征與用戶類別的對應(yīng)關(guān)系和用戶類別與情感識別所需特征參數(shù)類型的對應(yīng)關(guān)系; 參數(shù)提取模塊,用于獲取用戶輸入的語音數(shù)據(jù),根據(jù)該語音數(shù)據(jù)的韻律特征查找所述語音韻律特征與用戶類別的對應(yīng)關(guān)系,獲取所述該用戶所屬的類別;根據(jù)所述用戶所屬的類別查找所述用戶類別與情感識別所需參數(shù)類型的對應(yīng)關(guān)系,獲取該用戶的語音數(shù)據(jù)所需提取的特征參數(shù)類型;從該用戶的語音數(shù)據(jù)中提取對應(yīng)的特征參數(shù)值; 識別模塊,用于采用匹配算法對提取的特征參數(shù)值進行處理,得到所述語音數(shù)據(jù)所對應(yīng)的情感數(shù)據(jù),將所述情感數(shù)據(jù)作為該用戶反饋的信息。
7.根據(jù)權(quán)利要求6所述的系統(tǒng),其特征在于,所述特征參數(shù)類型為梅爾頻率倒譜系數(shù)或線性倒譜系數(shù)。
8.根據(jù)權(quán)利要求6所述的系統(tǒng),其特征在于,所述識別模塊采用的匹配算法為最優(yōu)模糊量化算法、隱馬爾科夫模型算法或人工神經(jīng)網(wǎng)絡(luò)算法; 所述最優(yōu)模糊量化算法為: 通過矢量量化訓(xùn)練得到預(yù)先保存的各個標(biāo)準(zhǔn)情感語音所對應(yīng)的標(biāo)準(zhǔn)碼本,所述標(biāo)準(zhǔn)碼本為多維向量; 分別以各個標(biāo)準(zhǔn)情感語音對應(yīng)的標(biāo)準(zhǔn)碼本為中心確定多維環(huán)空間,其中,確定多維環(huán)空間的方式為:將作為中心的標(biāo)準(zhǔn)情感語音對應(yīng)的標(biāo)準(zhǔn)碼本作為圓心,分別計算作為中心的標(biāo)準(zhǔn)情感語音對應(yīng)的標(biāo)準(zhǔn)碼本與其他標(biāo)準(zhǔn)情感語音對應(yīng)的標(biāo)準(zhǔn)碼本的歐式距離,將計算出的多個歐式距離作為半徑,形成環(huán)域,將各個環(huán)域所劃分的的區(qū)域分別作為各個標(biāo)準(zhǔn)情感語音對應(yīng)的區(qū)域; 確定所述用戶輸入的語音數(shù)據(jù)的特征參數(shù)值所組成的多維向量在各個多維環(huán)空間中的位置,選取出現(xiàn)次數(shù)最多的區(qū)域所對應(yīng)的標(biāo)準(zhǔn)情感語音作為該語音數(shù)據(jù)所對應(yīng)的情感數(shù)據(jù)。
9.根據(jù)權(quán)利要求6、8或8所述的系統(tǒng),其特征在于,所述系統(tǒng)還包括: 決策支持模塊,用于保存所述情感數(shù)據(jù),并根據(jù)所述情感數(shù)據(jù)查找預(yù)先保存的情感數(shù)據(jù)與影響因子的對應(yīng)關(guān)系,獲取所述情感數(shù)據(jù)所對應(yīng)的情感因子,采用所述影響因子對相關(guān)決策系統(tǒng)提供決策支持。
10.根據(jù)權(quán)利要求6、8或8所述的系統(tǒng),其特征在于,所述參數(shù)提取模塊獲取用戶輸入的語音數(shù)據(jù)的方式為:接收用戶輸入的語音數(shù)據(jù),當(dāng)所述語音數(shù)據(jù)的時長不超過預(yù)先設(shè)定的閾值時,獲取該語音數(shù)據(jù)。
【文檔編號】G10L25/63GK103886869SQ201410138889
【公開日】2014年6月25日 申請日期:2014年4月9日 優(yōu)先權(quán)日:2014年4月9日
【發(fā)明者】郝建鈞 申請人:北京京東尚科信息技術(shù)有限公司, 北京京東世紀(jì)貿(mào)易有限公司