專利名稱:數(shù)據(jù)分析設(shè)備和方法
技術(shù)領(lǐng)域:
本發(fā)明涉及數(shù)據(jù)分析領(lǐng)域,具體涉及一種應(yīng)用于客戶服務(wù)中心的數(shù)據(jù)分析設(shè)備和方法。
背景技術(shù):
電信、網(wǎng)店、銀行、保險等多個行業(yè)都具有各自的客服中心??头行慕?jīng)常接收到客戶對企業(yè)服務(wù)/產(chǎn)品的投訴及咨詢,這些投訴/咨詢往往是自然語言的形式,例如“如何開通GPRS ? ”、“我的GPRS上網(wǎng)怎么這么慢,你們也太過分了 ! ”。客服中心可以針對客戶自然語言形式的投訴/咨詢數(shù)據(jù),挖掘出客戶對服務(wù)/產(chǎn)品的意見。通過對客戶的投訴/咨詢數(shù)據(jù)的分析,可以幫助企業(yè)發(fā)現(xiàn)哪些客戶對服務(wù)/產(chǎn)品感興趣或不感興趣,從而滿足客戶個性化需求,為客戶提供更好的服務(wù)。當(dāng)前,已經(jīng)存在一些相關(guān)的數(shù)據(jù)分析方法。其中一些方法可以從客戶的投訴/咨詢數(shù)據(jù)中分析出客戶的顯式需求(即,客戶在問什么)。例如,從“GPRS還有流量,為什么還要扣費(fèi)”中分析出“業(yè)務(wù)=GPRS,問題=扣費(fèi)”。但是,當(dāng)前的方法不能分析客戶的隱含需求并基于分析結(jié)果提供進(jìn)一步的個性化業(yè)務(wù)。另一些方法可以基于客戶的購買歷史/基本信息等結(jié)構(gòu)化數(shù)據(jù)提供個性化業(yè)務(wù),但不能基于客戶的投訴/咨詢數(shù)據(jù)提供個性化業(yè)務(wù)。T. Nasukawa在IBM SYSTEMS JOURNAL發(fā)表的論文中提到了一種從客戶的投訴/咨詢數(shù)據(jù)中分析客戶顯式需求的方法,但不能分析客戶的隱含需求并基于分析結(jié)果來提供個性化業(yè)務(wù)。專利文獻(xiàn)W02002073331A2描述了一種從客戶的投訴/咨詢數(shù)據(jù)中分析客戶顯式需求的方法,但同樣不能分析客戶的隱含需求并基于分析結(jié)果來提供個性化業(yè)務(wù)。專利文獻(xiàn)US7536002B1描述了一種基于客戶的賬戶/行為數(shù)據(jù)來進(jìn)行個性化業(yè)務(wù)的方法,但不能基于客戶的投訴/咨詢數(shù)據(jù)來提供個性化業(yè)務(wù)。因此,存在對來自客戶的投訴/咨詢數(shù)據(jù)進(jìn)行分析以獲取用戶的隱含需求、并提供個性化業(yè)務(wù)的需求。
發(fā)明內(nèi)容
為了解決上述問題,本發(fā)明提出了一種對客戶的投訴/咨詢數(shù)據(jù)進(jìn)行分析以獲得客戶的隱含需求,并可以提供進(jìn)一步的個性化業(yè)務(wù)的數(shù)據(jù)分析設(shè)備和方法。在本發(fā)明中,“隱含需求”的定義與現(xiàn)有技術(shù)中的“顯式需求”有所不同?!帮@式需求”是指僅理解用戶表面上的需求,即與用戶在咨詢或投訴的業(yè)務(wù)有關(guān)的需求;而“隱含需求”是指用戶的咨詢/投訴背后所隱藏的信息,如用戶對所投訴的業(yè)務(wù)的價格敏感度、接受度等等,下文對此有更加詳細(xì)的描述。即,“隱含需求”能夠更加準(zhǔn)確和深入的信息。根據(jù)本發(fā)明的一個方面,提供了一種數(shù)據(jù)分析設(shè)備,包括識別單元,基于語義知識和語言模型,從客戶的投訴/咨詢數(shù)據(jù)中識別出業(yè)務(wù)、主題和子主題;隱含特征計(jì)算單元,基于語義知識和情緒字典,根據(jù)所識別的業(yè)務(wù)、主題和子主題來計(jì)算客戶的隱含特征;以及隱含需求獲取單元,將客戶的隱含特征匯總以獲取客戶的隱含需求。優(yōu)選地,該隱含特征計(jì)算單元包括敏感度計(jì)算子單元,計(jì)算客戶的價格敏感度和質(zhì)量敏感度;使用水平計(jì)算子單元,計(jì)算客戶對所識別的業(yè)務(wù)的使用水平;接受度計(jì)算子單元,計(jì)算客戶對所識別的業(yè)務(wù)的接受度;以及不滿原因獲取子單元,獲取客戶對所識別的業(yè)務(wù)的不滿原因。優(yōu)選地,該數(shù)據(jù)分析設(shè)備還包括隱含需求統(tǒng)計(jì)單元,對客戶的隱含需求進(jìn)行統(tǒng)計(jì)。更優(yōu)選地,該隱含需求統(tǒng)計(jì)單元進(jìn)行以下至少一項(xiàng)統(tǒng)計(jì)業(yè)務(wù)接受度統(tǒng)計(jì)、業(yè)務(wù)不滿原因統(tǒng)計(jì)和客戶分群統(tǒng)計(jì)。優(yōu)選地,該數(shù)據(jù)分析設(shè)備還包括個性化業(yè)務(wù)推薦單元,根據(jù)客戶的隱含需求,向客戶推薦個性化業(yè)務(wù)。更優(yōu)選地,個性化業(yè)務(wù)推薦單元提供以下至少一項(xiàng)業(yè)務(wù)更高質(zhì)量的業(yè)務(wù)、價格更實(shí)惠的業(yè)務(wù)、升級現(xiàn)有業(yè)務(wù)、語義相關(guān)業(yè)務(wù)、提升現(xiàn)有業(yè)務(wù)價值和挽留業(yè)務(wù)。優(yōu)選地,該數(shù)據(jù)分析設(shè)備還包括個性化業(yè)務(wù)效果評價單元,根據(jù)客戶對個性化業(yè)務(wù)推薦單元推薦的業(yè)務(wù)的反饋,評價個性化業(yè)務(wù)推薦的效果。根據(jù)本發(fā)明的另一個方面,提供了一種數(shù)據(jù)分析方法,包括基于語義知識和語言模型,從客戶的投訴/咨詢數(shù)據(jù)中識別出業(yè)務(wù)、主題和子主題;基于語義知識和情緒字典, 根據(jù)所識別的業(yè)務(wù)、主題和子主題來計(jì)算客戶的隱含特征;以及將客戶的隱含特征匯總以獲取客戶的隱含需求。優(yōu)選地,隱含特征包括客戶的價格敏感度和質(zhì)量敏感度、客戶對所識別的業(yè)務(wù)的使用水平、客戶對所識別的業(yè)務(wù)的接受度和客戶對所識別的業(yè)務(wù)的不滿原因。優(yōu)選地,該數(shù)據(jù)分析方法還包括對客戶的隱含需求進(jìn)行統(tǒng)計(jì)。更優(yōu)選地,該統(tǒng)計(jì)包括以下至少一項(xiàng)業(yè)務(wù)接受度統(tǒng)計(jì)、業(yè)務(wù)不滿原因統(tǒng)計(jì)和客戶分群統(tǒng)計(jì)。優(yōu)選地,該數(shù)據(jù)分析方法還包括根據(jù)客戶的隱含需求,向客戶推薦個性化業(yè)務(wù)。 更優(yōu)選地,個性化業(yè)務(wù)包括以下至少一項(xiàng)業(yè)務(wù)更高質(zhì)量的業(yè)務(wù)、價格更實(shí)惠的業(yè)務(wù)、升級現(xiàn)有業(yè)務(wù)、語義相關(guān)業(yè)務(wù)、提升現(xiàn)有業(yè)務(wù)價值和挽留業(yè)務(wù)。優(yōu)選地,該數(shù)據(jù)分析方法還包括根據(jù)客戶對所推薦的個性化業(yè)務(wù)的反饋,評價個性化業(yè)務(wù)推薦的效果。根據(jù)本發(fā)明的數(shù)據(jù)分析設(shè)備和方法可以根據(jù)來自客戶的投訴/咨詢數(shù)據(jù)準(zhǔn)確地理解客戶的隱含需求。此外,還可以根據(jù)客戶的隱含需求,向客戶推薦個性化業(yè)務(wù)。因此, 本發(fā)明能夠更加準(zhǔn)確地識別客戶的需求并提供具有針對性的服務(wù),從而極大地提升了客戶的使用感受。
通過下文結(jié)合附圖的詳細(xì)描述,本發(fā)明的上述和其它特征將會變得更加明顯,其中圖1是示出了根據(jù)本發(fā)明第一實(shí)施例的數(shù)據(jù)分析設(shè)備的框圖;圖2是示出了投訴/咨詢數(shù)據(jù)的具體示例的示意圖;圖3是示出了根據(jù)本發(fā)明第一實(shí)施例的本體庫單元中存儲的語義知識的示例的示意圖;圖4是示出了根據(jù)本發(fā)明第一實(shí)施例的語言庫單元中存儲的語言模型的示例的示意圖;圖5是示出了根據(jù)本發(fā)明第一實(shí)施例的情緒字典單元中存儲的關(guān)系表的示例的示意圖;圖6是詳細(xì)示出圖1中的隱含特征計(jì)算單元的內(nèi)部結(jié)構(gòu)的框圖;圖7是示出了根據(jù)本發(fā)明第一實(shí)施例的識別單元執(zhí)行業(yè)務(wù)、主題和子主題識別的示意圖;圖8是示出了根據(jù)本發(fā)明第一實(shí)施例的敏感度計(jì)算子單元計(jì)算客戶的敏感度的示意圖;圖9是示出了根據(jù)本發(fā)明第一實(shí)施例的使用水平計(jì)算子單元計(jì)算客戶的使用水平的示意圖;圖10是示出了根據(jù)本發(fā)明第一實(shí)施例的接受度計(jì)算子單元計(jì)算客戶的接受度的示意圖;圖11是示出了根據(jù)本發(fā)明第一實(shí)施例的不滿原因獲取子單元獲取客戶的不滿原因的示意圖;圖12是示出了根據(jù)本發(fā)明第一實(shí)施例的隱含需求獲取單元獲取隱含需求的示意圖;圖13是示出了根據(jù)本發(fā)明第二實(shí)施例的數(shù)據(jù)分析設(shè)備的框圖;圖14是示出了根據(jù)本發(fā)明第二實(shí)施例的隱含需求統(tǒng)計(jì)單元執(zhí)行隱含需求統(tǒng)計(jì)的示意圖;圖15是示出了根據(jù)本發(fā)明第三實(shí)施例的數(shù)據(jù)分析設(shè)備的框圖;圖16是示出了根據(jù)本發(fā)明第三實(shí)施例的個性化業(yè)務(wù)推薦單元所推薦的個性化業(yè)務(wù)的示意圖;圖17是示出了根據(jù)本發(fā)明第三實(shí)施例的個性化業(yè)務(wù)推薦單元推薦個性化業(yè)務(wù)的示意圖;圖18是示出了根據(jù)本發(fā)明第四實(shí)施例的數(shù)據(jù)分析設(shè)備的框圖;圖19是示出了根據(jù)本發(fā)明第四實(shí)施例的個性化業(yè)務(wù)效果評價單元執(zhí)行個性化業(yè)務(wù)推薦效果評價的示意圖;以及圖20是示出了根據(jù)本發(fā)明的一個實(shí)施例的數(shù)據(jù)分析方法的流程圖。
具體實(shí)施例方式下面,通過結(jié)合附圖對本發(fā)明的具體實(shí)施例的描述,本發(fā)明的原理和實(shí)現(xiàn)將會變得明顯。應(yīng)當(dāng)注意的是,本發(fā)明不應(yīng)局限于下文所述的具體實(shí)施例。另外,為了簡便起見, 省略了對公知元件的描述。首先,結(jié)合附圖1-18來描述根據(jù)本發(fā)明的若干實(shí)施例的數(shù)據(jù)分析設(shè)備。第一實(shí)施例圖1是示出了根據(jù)本發(fā)明第一實(shí)施例的數(shù)據(jù)分析設(shè)備1的框圖。如圖1所示,本實(shí)施例中的數(shù)據(jù)分析設(shè)備1包括識別單元210、隱含特征計(jì)算單元200和隱含需求獲取單元沈0。識別單元210輸入是來自客戶的投訴/咨詢數(shù)據(jù),該數(shù)據(jù)至少包括客戶的投訴 /咨詢時間、客戶編號和投訴/咨詢的內(nèi)容。其中,投訴/咨詢的內(nèi)容是以自然語言的形式描述的。例如,圖2示出了投訴/咨詢數(shù)據(jù)的一個具體示例,其中某條投訴/咨詢數(shù)據(jù)是 “2010/06/0518:20:15,客戶135XXXX1234提交了一條投訴/咨詢,內(nèi)容是,怎么飛信經(jīng)常無法成功登陸呢’”。如圖1所示,在本實(shí)施例中,存儲設(shè)備10包括本體庫單元110,用于存儲企業(yè)客服中心的語義知識;語言庫單元120,用于存儲理解投訴/咨詢數(shù)據(jù)的語言模型;以及情緒字典單元130,用于存儲各個情緒詞語及其屬于各種情緒的概率關(guān)系表。下面結(jié)合附圖3-5 詳細(xì)說明各個單元的結(jié)構(gòu)和功能。本體庫單元110存儲客服中心的語義知識。其中,語義知識包括兩部分類別樹和主題樹。類別樹是存儲所有的服務(wù)或產(chǎn)品的樹狀結(jié)構(gòu),由類別和實(shí)例組成。其中,實(shí)例是葉子結(jié)點(diǎn),類別是非葉子結(jié)點(diǎn)。每個實(shí)例屬于一個類別,小類別還可以屬于一個大類別。圖3 中示出了某個電信行業(yè)的客服中心類別樹的例子,其包括某電信運(yùn)營商的所有業(yè)務(wù)及業(yè)務(wù)類別。例如,如圖3上半部分所示,所有業(yè)務(wù)分為上網(wǎng)類業(yè)務(wù)、彩鈴類業(yè)務(wù)等,其中上網(wǎng)類業(yè)務(wù)進(jìn)一步包括GPRS、G3上網(wǎng)等業(yè)務(wù)。主題樹是存儲所有服務(wù)或產(chǎn)品的相關(guān)主題和子主題的樹狀結(jié)構(gòu),由類別、主題和子主題組成。每個類別可以定義一組主題,用來描述該類別的各個方面。一個主題又可以進(jìn)一步細(xì)分為多個子主題。屬于某類別的所有子類別或?qū)嵗梢岳^承該類別的主題和子主題。圖3中示出了某個電信行業(yè)客服中心主題樹的例子,其包括某電信運(yùn)營商各業(yè)務(wù)類別的主題及子主題。例如,如圖3下半部分所示,上網(wǎng)類業(yè)務(wù)包括的主題有“使用”、“資費(fèi)”、 “優(yōu)惠”等,“資費(fèi)”進(jìn)一步包括的子主題有“資費(fèi)標(biāo)準(zhǔn)”和“錯誤扣費(fèi)”,這些主題和子主題可以適用于所有的上網(wǎng)類業(yè)務(wù),如GPRS、G3上網(wǎng)等。本體庫單元110中存儲的信息可以手工地生成,或采用本領(lǐng)域中其他的公知方法生成。為了簡便起見,本文省略了對本體庫單元110的具體生成過程的描述。 語言庫單元120存儲用于分析投訴/咨詢內(nèi)容的語言模型,具體包括兩部分業(yè)務(wù)術(shù)語映射規(guī)則和子主題提取規(guī)則。客戶的投訴/咨詢數(shù)據(jù)中可能不直接出現(xiàn)業(yè)務(wù)的名稱,而是以其他術(shù)語出現(xiàn)。例如“充100送30”對應(yīng)的業(yè)務(wù)是“充值優(yōu)惠”,“短號網(wǎng)”對應(yīng)的業(yè)務(wù)是“短號集群網(wǎng)”。業(yè)務(wù)術(shù)語映射規(guī)則使用靈活的文法方式來描述各業(yè)務(wù)術(shù)語與業(yè)務(wù)的對應(yīng)關(guān)系。每條業(yè)務(wù)術(shù)語映射規(guī)則由術(shù)語文法和業(yè)務(wù)名稱組成,其含義為“當(dāng)業(yè)務(wù)術(shù)語和某術(shù)語文法匹配時,則為該術(shù)語文法對應(yīng)的業(yè)務(wù)”。在術(shù)語文法中,定義了一些特殊的符號“<X>”指此處可以出現(xiàn)的詞;“<X1 |X2 I…〉”指此處可以出現(xiàn)XI,X2等詞之一;“< ?數(shù)字 >”指此處可以是任意數(shù)字;“ [m-n] ”指的是此處可以出現(xiàn)介于m到η之間的任意一個字符;{k}指的是前面的詞需要出現(xiàn)k遍。圖4示出了客服中心業(yè)務(wù)術(shù)語映射規(guī)則的例子。例如,業(yè)務(wù)術(shù)語“充100送30”可以與規(guī)則“〈充>< 數(shù)字 >< 贈I送>< 數(shù)字 >—充值優(yōu)惠”匹配,其對應(yīng)的業(yè)務(wù)是“充值優(yōu)惠”。業(yè)務(wù)術(shù)語“GS13661209810”可以與規(guī)則“GS[l-9]
{10}—查詢歸屬地”匹配, 其對應(yīng)的業(yè)務(wù)是“查詢歸屬地”。子主題提取規(guī)則由特征詞序列和子主題組成,其含義為“當(dāng)客戶的投訴/咨詢內(nèi)容中出現(xiàn)某特征詞序列時,則為該特征詞序列對應(yīng)的子主題”。在特征詞序列中定義了一些特殊的符號“<X>”此處可以出現(xiàn)的詞;“〈XIIX2 I…〉”指此處可以出現(xiàn)XI,X2等詞之一;“ ; ”是不同特征詞之間的間隔符;“ [] ”指的是在“[”和“]”中間的內(nèi)容可有可無。圖4示出了某個電信行業(yè)客服中心子主題提取規(guī)則的例子。例如,客戶投訴/咨詢內(nèi)容“GPRS上網(wǎng)怎么這么慢”可以與“< 上網(wǎng) > ;< 慢I不快 > —上網(wǎng)速度”匹配,其對應(yīng)的子主題是“上網(wǎng)速度”。語言庫單元120中存儲的信息可以手工地生成,或采用本領(lǐng)域中其他的公知方法生成。為了簡便起見,本文省略了對語言庫單元120的具體生成過程的描述。情緒字典單元130存儲各個情緒詞及其屬于各種情緒類型的概率的關(guān)系表。圖5 示出了情緒字典單元130的例子。例如,如圖5所示,情緒詞“過分”屬于憤怒的概率是0. 8, 屬于失望的概率是0. 2,而情緒詞“滿意”屬于高興的概率是1。情緒字典單元130中存儲的信息可以手工地生成,或采用本領(lǐng)域中其他的公知方法生成。為了簡便起見,本文省略了對情緒字典單元130的具體生成過程的描述?;氐綀D1,識別單元210基于本體庫單元110和語言庫單元120中存儲的信息,從每條投訴/咨詢數(shù)據(jù)中識別出業(yè)務(wù)、主題和子主題的名稱。具體地,識別單元210首先從投訴/咨詢數(shù)據(jù)中提取出業(yè)務(wù)術(shù)語,其關(guān)鍵在于確定業(yè)務(wù)術(shù)語在投訴/咨詢數(shù)據(jù)中的左右邊界。例如,其具體過程可以包括首先收集一組投訴/咨詢數(shù)據(jù)作為訓(xùn)練語料,并進(jìn)行分詞, 轉(zhuǎn)換成CRF模型可訓(xùn)練的文件格式,人工標(biāo)注每個詞的標(biāo)簽(B_NP代表術(shù)語的開始,I_NP代表術(shù)語的中間或結(jié)尾,NN代表非術(shù)語詞);然后用CRF工具訓(xùn)練出一個模型;接下來,對投訴/咨詢數(shù)據(jù)進(jìn)行分詞,基于訓(xùn)練模型得到各詞的標(biāo)簽;最后,根據(jù)各詞的標(biāo)簽,得到業(yè)務(wù)術(shù)語(依據(jù)業(yè)務(wù)術(shù)語中各詞的標(biāo)簽序列是“B_NP I_NP I_NP…I_NP”)。接下來,識別單元210從投訴/咨詢內(nèi)容中識別出業(yè)務(wù)名稱。例如,其具體過程可以包括將業(yè)務(wù)術(shù)語與語言庫單元120中各個業(yè)務(wù)映射規(guī)則的術(shù)語文法進(jìn)行匹配,匹配方法是檢查業(yè)務(wù)術(shù)語中包含的各詞是否在術(shù)語文法的相應(yīng)位置;若匹配了某項(xiàng)映射規(guī)則,則將該規(guī)則的業(yè)務(wù)名稱作為業(yè)務(wù)識別結(jié)果。然后,識別單元210從投訴/咨詢內(nèi)容中識別出子主題名稱。具體過程可以包括 將投訴/咨詢數(shù)據(jù)與語言庫單元120中各個子主題提取規(guī)則的特征詞序列進(jìn)行匹配,匹配方法是檢查特征詞序列中的各個特征詞是否出現(xiàn)在投訴/咨詢數(shù)據(jù)中,然后得到所有候選的子主題提取規(guī)則;當(dāng)匹配到多個子主題提取規(guī)則時,通過如下步驟從所有候選的子主題提取規(guī)則中挑選出最優(yōu)規(guī)則基于詞性和詞長來計(jì)算投訴/咨詢內(nèi)容中各詞的權(quán)重(例如, 詞長度越大,則權(quán)重越高;名詞和動詞的權(quán)重大于形容詞和副詞;等等),計(jì)算每個候選子主題提取規(guī)則的匹配度(匹配度=投訴咨詢數(shù)據(jù)與候選規(guī)則的特征詞序列匹配上的各特征詞的權(quán)重之和/投訴咨詢數(shù)據(jù)中各詞的權(quán)重之和),以及選取匹配度最高的候選子主題提取規(guī)則作為最優(yōu)規(guī)則,然后將最優(yōu)規(guī)則的子主題作為子主題識別結(jié)果。最后,識別單元210根據(jù)業(yè)務(wù)識別結(jié)果和子主題識別結(jié)果,從本體庫單元110中找到關(guān)聯(lián)的主題。
圖7示出了由識別單元210執(zhí)行業(yè)務(wù)、主題和子主題識別的例子。對于客戶的投訴/咨詢數(shù)據(jù)“集群怎么取消失?。?”,識別單元210首先執(zhí)行分詞,得到“集/名詞群/名詞怎么/疑問詞取消/動詞失敗/動詞”,根據(jù)訓(xùn)練模型可知“集群”是一個業(yè)務(wù)術(shù)語,然后和業(yè)務(wù)術(shù)語映射規(guī)則“〈短號網(wǎng)I集群 >—短號集群網(wǎng)”匹配成功,從而識別出業(yè)務(wù)“短號集群網(wǎng)”。然后,識別單元210通過與子主題提取規(guī)則匹配,找到兩條候選規(guī)則“〈怎么I如何 > ;<取消I退訂 > —取消方法”和“[< 怎么I如何 >];< 取消I退訂 > ;< 失敗I不了 > —取消失敗”,經(jīng)過匹配度計(jì)算發(fā)現(xiàn)第二條規(guī)則的匹配度要高于第一條規(guī)則,因此將“取消失敗” 作為子主題。最后,識別單元210通過查找本體庫單元110得到“類別=所有業(yè)務(wù),主題= 取消,子主題=取消失敗”,從而將“取消”作為主題。下面,結(jié)合附圖6-11詳細(xì)描述圖1中所示的隱含特征計(jì)算單元200的結(jié)構(gòu)和功能。圖6詳細(xì)示出了圖1所示的隱含特征計(jì)算單元200的內(nèi)部結(jié)構(gòu)圖。如圖6所示, 隱含特征計(jì)算單元200包括敏感度計(jì)算子單元220、使用水平計(jì)算子單元230、接受度計(jì)算子單元MO以及不滿原因獲取子單元250。下面分別對這些單元和子單元進(jìn)行詳細(xì)描述。隱含特征計(jì)算單元200基于存儲設(shè)備10 (本體庫單元110、語言庫單元120和情緒字典單元130)中存儲的信息,針對每個客戶的投訴/咨詢數(shù)據(jù),提取每個客戶的隱含特征。例如,隱含特征可以包括敏感度(包括價格敏感度和質(zhì)量敏感度)、對具體業(yè)務(wù)的使用水平、對具體業(yè)務(wù)的接受度以及對具體業(yè)務(wù)的不滿原因。敏感度計(jì)算子單元220基于本體庫單元110和情緒字典單元130中存儲的信息, 根據(jù)每個客戶的投訴/咨詢歷史及業(yè)務(wù)、主題、子主題識別結(jié)果,計(jì)算該客戶的價格敏感度和質(zhì)量敏感度。具體地,敏感度計(jì)算子單元220基于情緒字典單元130以及投訴/咨詢數(shù)據(jù)是否與價格相關(guān),針對客戶的投訴/咨詢歷史中的每條記錄,計(jì)算價格敏感度如果投訴 /咨詢數(shù)據(jù)與價格不相關(guān),則價格敏感值為0 ;否則,價格敏感值等于該客戶的情緒值。投訴/咨詢數(shù)據(jù)與價格相關(guān)的判斷準(zhǔn)則是主題為“資費(fèi)”或“優(yōu)惠”,或者子主題中包含“資費(fèi)”、“優(yōu)惠”、“扣費(fèi)”、“話費(fèi)”或“收費(fèi)”,或者業(yè)務(wù)中包含“優(yōu)惠”、“資費(fèi)”、“話費(fèi)”、 “欠費(fèi)”或“套餐”??蛻羟榫w值的計(jì)算準(zhǔn)則是首先基于情緒字典單元130找到投訴/咨詢數(shù)據(jù)中出現(xiàn)的所有情緒詞,然后利用程度詞對情緒詞加權(quán)重(例如“太過分”比“過分”屬于“憤怒”的概率更大),接下來根據(jù)否定詞轉(zhuǎn)變情緒詞的情緒類型(例如“滿意”屬于“高興”,但“不滿意”屬于“憤怒”),然后通過累加投訴/咨詢數(shù)據(jù)中所有情緒詞屬于每種情緒類型的概率,得到投訴/咨詢內(nèi)容屬于每種情緒類型的概率,最后選擇概率最大的情緒類型并賦予一個相應(yīng)的分值(例如無情緒為1,失望為2,憤怒為3,威脅為4),作為客戶情緒值。敏感度計(jì)算子單元220把客戶投訴/咨詢歷史中每條記錄的價格敏感值乘以一個時間衰減參數(shù)(時間衰減參數(shù)的值域?yàn)閃-i],其中記錄的時間離現(xiàn)在時間越遠(yuǎn),時間衰減參數(shù)值越小),然后求和得到總體價格敏感值,最后根據(jù)總體價格敏感值的大小依次劃分為 “低度敏感”、“中度敏感”和“高度敏感”,以獲得價格敏感度。另一方面,敏感度計(jì)算子單元220計(jì)算質(zhì)量敏感度,其過程類似于價格敏感度的計(jì)算首先,基于情緒字典單元130以及投訴/咨詢數(shù)據(jù)是否與質(zhì)量相關(guān),針對客戶投訴/ 咨詢歷史中的每條記錄計(jì)算質(zhì)量敏感值。具體地,如果投訴/咨詢與質(zhì)量不相關(guān),則質(zhì)量敏感值為0 ;否則質(zhì)量敏感值等于該客戶的情緒值。投訴/咨詢與質(zhì)量相關(guān)的判斷準(zhǔn)則是主題為“使用”,或者子主題中包含“質(zhì)量”。 此外,客戶情緒值的計(jì)算與價格敏感度中的計(jì)算過程相同。敏感度計(jì)算子單元220把對客戶投訴/咨詢歷史中每條記錄的質(zhì)量敏感值乘以一個時間衰減參數(shù)(時間衰減參數(shù)的值域?yàn)閃-i],其中記錄的時間離現(xiàn)在時間越遠(yuǎn),時間衰減參數(shù)值越小),然后求和得到總體質(zhì)量敏感值,最后根據(jù)值大小依次劃分為“低度敏感”、 “中度敏感”和“高度敏感”,以獲得質(zhì)量敏感度。圖8示出了敏感度計(jì)算子單元220計(jì)算客戶的敏感度的例子。如圖8中所示,某客戶曾經(jīng)投訴/咨詢過“怎么飛信經(jīng)常無法成功登陸呢”、“我的GPRS還有流量,為什么還要扣我費(fèi)?”和“GPRS上網(wǎng)怎么這么慢,你們也太過分了! ”。其中第一條投訴/咨詢的主題是 “使用”,因此與質(zhì)量相關(guān),另外投訴/咨詢內(nèi)容中出現(xiàn)了情緒詞“成功”屬于高興情緒,但前面的否定詞“無法”和程度詞“經(jīng)常”使“經(jīng)常無法成功”變成了憤怒情緒,因此質(zhì)量敏感值為3。第二條投訴/咨詢的主題是“資費(fèi)”,因此與價格相關(guān),另外投訴/咨詢內(nèi)容中出現(xiàn)了情緒詞“為什么”和“扣”,這兩個情緒詞屬于失望情緒的概率之和最高(0. 2+0. 8 = 1),因此價格敏感值為2。第三條投訴/咨詢的主題是“使用”,因此與質(zhì)量相關(guān),另外投訴/咨詢內(nèi)容中出現(xiàn)了情緒詞“慢”(前面的程度詞為“這么”,“這么慢”為憤怒情緒)和“過分”(前面的程度詞為“太”,“太過分”為憤怒情緒),因此質(zhì)量敏感值為3。最后,敏感度計(jì)算子單元 220對這三條投訴/咨詢數(shù)據(jù)進(jìn)行處理,得到該客戶的價格敏感度是中度敏感,質(zhì)量敏感度是高度敏感。使用水平計(jì)算子單元230基于本體庫單元110中存儲的信息,根據(jù)每個客戶對每個業(yè)務(wù)的投訴/咨詢歷史及業(yè)務(wù)、主題、子主題識別結(jié)果,計(jì)算出該客戶對該業(yè)務(wù)的使用水平。具體地,使用水平計(jì)算子單元230執(zhí)行以下計(jì)算 子主題基礎(chǔ)性計(jì)算使用水平計(jì)算子單元230基于本體庫單元110,計(jì)算某客戶對某業(yè)務(wù)投訴/咨詢過的每個子主題的基礎(chǔ)性。子主題的基礎(chǔ)性可以通過有該子主題的業(yè)務(wù)數(shù)量來衡量越多的業(yè)務(wù)有共同的子主題,則該子主題越基礎(chǔ)。子主題基礎(chǔ)性的計(jì)算準(zhǔn)則為本體庫中有該子主題的業(yè)務(wù)的個數(shù)/本體庫中所有業(yè)務(wù)的個數(shù)。 子主題典型性計(jì)算使用水平計(jì)算子單元230基于所有用戶的投訴/咨詢歷史及業(yè)務(wù)、主題、子主題識別結(jié)果,計(jì)算某客戶對某業(yè)務(wù)投訴/咨詢過的每個子主題的典型性。子主題的典型性可以通過所有客戶咨詢過該子主題的次數(shù)來衡量某子主題被投訴/ 咨詢過的次數(shù)越多,則該子主題越典型。子主題典型性的計(jì)算準(zhǔn)則為所有客戶投訴/咨詢過該子主題的次數(shù)/所有客戶的投訴/咨詢總數(shù)。 業(yè)務(wù)的使用水平計(jì)算使用水平計(jì)算子單元230針對某客戶對某業(yè)務(wù)投訴/咨詢過的所有子主題的基礎(chǔ)性和典型性,求平均得到客戶對該業(yè)務(wù)的使用水平值,然后根據(jù)使用水平值大小將使用水平依次劃分為“初級”、“中等”和“熟練”。圖9示出了使用水平計(jì)算子單元230計(jì)算客戶對業(yè)務(wù)的使用水平的例子。如圖9 所示,某客戶對GPRS業(yè)務(wù)曾經(jīng)投訴/咨詢過“我的GPRS還有流量,為什么還要扣我費(fèi)? ”、 “GPRS上網(wǎng)怎么這么慢,你們也太過分了 !”子主題分別為“錯誤扣費(fèi)”和“上網(wǎng)速度”。圖9 的本體庫單元中包括4個業(yè)務(wù),其中3個業(yè)務(wù)具有子主題“錯誤扣費(fèi)”,2個業(yè)務(wù)具有子主題 “上網(wǎng)速度”;因此,使用水平計(jì)算子單元230計(jì)算出“錯誤扣費(fèi)”的基礎(chǔ)性為3/4 = 0. 75,“上網(wǎng)速度”的基礎(chǔ)性為2/4 = 0. 5。另外,圖9的所有客戶投訴/咨詢歷史中包括3條記錄,其中2條的子主題是“錯誤扣費(fèi)”,1條是“上網(wǎng)速度”,因此使用水平計(jì)算子單元230計(jì)算出“錯誤扣費(fèi)”的典型性為2/3 = 0. 67,“上網(wǎng)速度”的典型性為1/3 = 0. 33。最后,使用水平計(jì)算子單元230將上述各個子主題的基礎(chǔ)性和典型性求平均,得到該客戶對GPRS的使用水平為(0. 75+0. 5+0.67+0. 33)/4 = 0. 56,為“中等”使用水平。接受度計(jì)算子單元240基于情緒字典單元130中存儲的信息,根據(jù)每個客戶對每個業(yè)務(wù)的投訴/咨詢歷史及業(yè)務(wù)、主題、子主題識別結(jié)果,計(jì)算出該客戶對該業(yè)務(wù)的接受度。具體地,接受度計(jì)算子單元240執(zhí)行以下計(jì)算 各個投訴/咨詢數(shù)據(jù)的接受度計(jì)算每條投訴/咨詢數(shù)據(jù)的接受度可以基于情緒字典單元130和本體庫單元110來計(jì)算。首先,接受度計(jì)算子單元240基于情緒字典單元130計(jì)算客戶情緒值,計(jì)算方法與上文中描述的價格敏感度的計(jì)算相同,此處不再詳述。 其次,接受度計(jì)算子單元240判斷投訴/咨詢數(shù)據(jù)的主題是否為“取消”。最后,結(jié)合客戶情緒值以及主題是否為取消,接受度計(jì)算子單元240計(jì)算每條投訴/咨詢數(shù)據(jù)的接受度??蛻羟榫w值越高,則客戶對該業(yè)務(wù)的接受度越差;主題若為取消,說明客戶準(zhǔn)備取消該業(yè)務(wù), 則客戶對該業(yè)務(wù)的接受度很差。每條投訴/咨詢數(shù)據(jù)的接受度計(jì)算準(zhǔn)則例如可以是1/(客戶情緒值+取消值),其中取消值可人為設(shè)定,例如當(dāng)主題為取消時為10,否則為0。 客戶對業(yè)務(wù)的接受度計(jì)算接受度計(jì)算子單元240把上述各個投訴/咨詢數(shù)據(jù)的接受度乘以一個時間衰減參數(shù)(時間衰減參數(shù)的值域?yàn)閃-i],記錄的時間離現(xiàn)在時間越遠(yuǎn),時間衰減參數(shù)值越小),然后求平均得到總體接受度。最后,接受度計(jì)算子單元240根據(jù)總體接受度值的大小將接受度依次劃分為“拒絕”、“弱接受”和“強(qiáng)接受”。圖10示出了接受度計(jì)算子單元240計(jì)算客戶對業(yè)務(wù)的接受度的例子。如圖 10中所示,某客戶對GPRS業(yè)務(wù)曾經(jīng)投訴/咨詢過“我的GPRS還有流量,為什么還要扣我費(fèi)?”、“GPRS上網(wǎng)怎么這么慢,你們也太過分了! ”、“如何取消GPRS”,其中第一條數(shù)據(jù)的客戶情緒值為3 (憤怒),主題不為取消,因此接受度為1/3 = 0. 33,類似地第二條和第三條數(shù)據(jù)的接受度分別為1/3 = 0. 33和1/10 = 0.1o假設(shè)2010年6月和2010年7 月的時間衰減參數(shù)分別為2/3和1,則對各個數(shù)據(jù)的接受度求和平均得到總體接受度為 (0. 33*2/3+0. 33*1+0. 1*1) /3 = 0. 2 (拒絕)。不滿原因獲取子單元250基于情緒字典單元130中存儲的信息,根據(jù)每個客戶對每個業(yè)務(wù)的投訴/咨詢歷史及業(yè)務(wù)、主題、子主題識別結(jié)果,獲取該客戶對該業(yè)務(wù)的不滿原因。具體地,不滿原因獲取子單元250執(zhí)行以下處理 各個投訴/咨詢數(shù)據(jù)的投訴/咨詢分類首先,不滿原因獲取子單元250基于情緒字典單元I30來計(jì)算客戶情緒值,該計(jì)算過程與上文描述的價格敏感度的計(jì)算相同,此處不再詳述。其次,不滿原因獲取子單元250按情緒值大小,將其依次分類為“咨詢”或“投訴”。 客戶對業(yè)務(wù)不滿原因的獲取針對分類為“投訴”的各個投訴/咨詢數(shù)據(jù),不滿原因獲取子單元250獲取其子主題作為客戶對該業(yè)務(wù)的不滿原因。圖11示出了不滿原因獲取子單元250獲取客戶對業(yè)務(wù)的不滿原因的例子。如圖 11所示,某客戶對GPRS業(yè)務(wù)曾經(jīng)投訴/咨詢過“我的GPRS還有流量,為什么還要扣我費(fèi)?”、 "GPRS上網(wǎng)怎么這么慢,你們也太過分了 ! ”、“如何取消GPRS”,不滿原因獲取子單元250將這些投訴/咨詢數(shù)據(jù)分別被歸類為“投訴”、“投訴”和“咨詢”。因此,該客戶對GPRS的不滿原因?yàn)殄e誤扣費(fèi)、上網(wǎng)速度。返回圖1,隱含需求獲取單元260將隱含特征計(jì)算單元200所計(jì)算得到的客戶的隱含特征加以匯總,以獲取客戶的隱含需求。圖12示出了隱含需求獲取單元獲取隱含需求的一個具體示例。將客戶135XXXX1234的敏感度計(jì)算結(jié)果“價格敏感度中度敏感;質(zhì)量敏感度高度敏感”、使用水平計(jì)算結(jié)果“客戶對GPRS的使用水平0. 56 (中等)”、接受度計(jì)算結(jié)果“客戶對GPRS的接受度0.2(拒絕)”和不滿原因獲取結(jié)果“客戶對GPRS的不滿原因 錯誤扣費(fèi)、上網(wǎng)速度”合并到一起,生成隱含需求。第二實(shí)施例圖13示出了根據(jù)本發(fā)明第二實(shí)施例的數(shù)據(jù)分析設(shè)備2的框圖。如圖13所示,本實(shí)施例中的數(shù)據(jù)分析設(shè)備2與第一實(shí)施例中的數(shù)據(jù)分析設(shè)備1的不同之處在于還包含隱含需求統(tǒng)計(jì)單元300。由于第二實(shí)施例中除了隱含需求統(tǒng)計(jì)單元300之外的其他組件與第一實(shí)施例中的相同,因此這里不再對其進(jìn)行詳細(xì)描述。隱含需求統(tǒng)計(jì)單元300根據(jù)隱含特征計(jì)算單元200的輸出,針對所有客戶的隱含需求,進(jìn)行各方面的統(tǒng)計(jì)。例如,這些統(tǒng)計(jì)結(jié)果可以為企業(yè)客服中心提供決策支持。在本實(shí)施例中,統(tǒng)計(jì)功能包括以下至少一項(xiàng)業(yè)務(wù)接受度統(tǒng)計(jì)、業(yè)務(wù)不滿原因統(tǒng)計(jì)、客戶分群。具體地, 業(yè)務(wù)接受度統(tǒng)計(jì)隱含需求統(tǒng)計(jì)單元300根據(jù)所有客戶對每個業(yè)務(wù)的接受度, 統(tǒng)計(jì)得到每個業(yè)務(wù)的接受客戶比例(例如,該比例的計(jì)算準(zhǔn)則是接受度不為“拒絕”的客戶的個數(shù)/所有客戶的個數(shù))。 業(yè)務(wù)不滿原因統(tǒng)計(jì)隱含需求統(tǒng)計(jì)單元300根據(jù)所有客戶的不滿原因,統(tǒng)計(jì)得到每個業(yè)務(wù)及每種不滿原因的不滿客戶的個數(shù)。 客戶分群隱含需求統(tǒng)計(jì)單元300根據(jù)所有客戶的價格敏感度和質(zhì)量敏感度, 對所有客戶進(jìn)行分群。例如價格高度敏感客戶群、價格低度敏感客戶群、質(zhì)量高度敏感客戶軒寸。圖14是示出了根據(jù)本發(fā)明第二實(shí)施例的隱含需求統(tǒng)計(jì)單元執(zhí)行隱含需求統(tǒng)計(jì)的示意圖。在業(yè)務(wù)接受度統(tǒng)計(jì)中,有76%的客戶對GPRS的接受度為“強(qiáng)接受”或“弱接受”,
的客戶對GPRS的接受度為“拒絕”,因此GPRS的接受客戶比例為76%。在業(yè)務(wù)不滿原因統(tǒng)計(jì)中,135XXXX1234等512個客戶的不滿原因中有GPRS的上網(wǎng)速度,因此GPRS的上網(wǎng)速度的不滿客戶數(shù)為512。在客戶分群中,客戶135XXXX1234和135XXXX9120的價格敏感度為中度敏感,因此分到價格中度敏感客戶群。第三實(shí)施例圖15示出了根據(jù)本發(fā)明第三實(shí)施例的數(shù)據(jù)分析設(shè)備3的框圖。如圖15所示,本實(shí)施例中的數(shù)據(jù)分析設(shè)備3與第一實(shí)施例中的數(shù)據(jù)分析設(shè)備1的不同之處在于還包含個性化業(yè)務(wù)推薦單元400。由于第三實(shí)施例中除了個性化業(yè)務(wù)推薦單元400之外的其他組件與第一實(shí)施例中的相同,因此這里不再對其進(jìn)行詳細(xì)描述。個性化業(yè)務(wù)推薦單元400基于客戶的隱含需求,查找推薦策略庫從而找到適合的推薦策略,然后向該客戶推薦個性化業(yè)務(wù)。如圖16所示,推薦個性化業(yè)務(wù)包括以下至少一項(xiàng)
推薦更高質(zhì)量的業(yè)務(wù)若客戶對質(zhì)量敏感,而且客戶對某業(yè)務(wù)的接受度差,而且可以分析出客戶對該業(yè)務(wù)的不滿原因,則向該客戶推薦一個在客戶不滿方面有更高滿意度的同類業(yè)務(wù)。其中,兩個業(yè)務(wù)是否同類需要查找本體庫得到,業(yè)務(wù)在不滿方面是否有更高滿意度需要根據(jù)業(yè)務(wù)不滿原因統(tǒng)計(jì)結(jié)果得到。推薦類型設(shè)為“更高質(zhì)量業(yè)務(wù)”。 推薦價格更實(shí)惠的業(yè)務(wù)若客戶對價格的敏感度很高,則基于外部的價格數(shù)據(jù)庫,向該客戶推薦價格更加實(shí)惠的業(yè)務(wù)。推薦類型設(shè)為“價格實(shí)惠業(yè)務(wù)”。 升級現(xiàn)有業(yè)務(wù)若客戶對某業(yè)務(wù)的接受度很高,則基于外部的業(yè)務(wù)數(shù)據(jù)庫,當(dāng)該業(yè)務(wù)出現(xiàn)了升級業(yè)務(wù)時,向客戶推薦升級業(yè)務(wù)。推薦類型設(shè)為“升級現(xiàn)有業(yè)務(wù)”。 推薦語義相關(guān)業(yè)務(wù)若客戶對某業(yè)務(wù)的接受度很高,則基于外部的業(yè)務(wù)數(shù)據(jù)庫, 向該客戶推薦與當(dāng)前業(yè)務(wù)語義相關(guān)的其他業(yè)務(wù)。推薦類型設(shè)為“語義相關(guān)業(yè)務(wù)”。 提升現(xiàn)有業(yè)務(wù)價值若客戶對某業(yè)務(wù)的使用水平很低,則基于外部的業(yè)務(wù)數(shù)據(jù)庫,給該客戶發(fā)送該業(yè)務(wù)的深入介紹,以幫助客戶熟練使用該業(yè)務(wù)。推薦類型設(shè)為“提升現(xiàn)有業(yè)務(wù)價值”。 提供挽留業(yè)務(wù)若客戶對某業(yè)務(wù)的接受度很差,則基于外部的挽留策略數(shù)據(jù)庫, 對該客戶進(jìn)行促銷、贈送等挽留策略。推薦類型設(shè)為“挽留”。圖17示出了根據(jù)本發(fā)明第三實(shí)施例的個性化業(yè)務(wù)推薦單元推薦個性化業(yè)務(wù)的例子。某客戶的質(zhì)量敏感度為高度敏感,對GPRS業(yè)務(wù)的接受度為0. 2 (拒絕),對GPRS業(yè)務(wù)的不滿原因是上網(wǎng)速度。從業(yè)務(wù)不滿原因統(tǒng)計(jì)結(jié)果中發(fā)現(xiàn)G3上網(wǎng)業(yè)務(wù)的上網(wǎng)速度的不滿客戶數(shù)很少,因此,個性化業(yè)務(wù)推薦單元向該客戶推薦G3上網(wǎng)業(yè)務(wù)。第四實(shí)施例圖18示出了根據(jù)本發(fā)明第四實(shí)施例的數(shù)據(jù)分析設(shè)備4的框圖。如圖18所示,本實(shí)施例中的數(shù)據(jù)分析設(shè)備4與第三實(shí)施例中的數(shù)據(jù)分析設(shè)備3的不同之處在于還包括個性化業(yè)務(wù)效果評價單元500。由于第四實(shí)施例中除了個性化業(yè)務(wù)效果評價單元500之外的組件與第三實(shí)施例中的相同,因此這里不再對其進(jìn)行詳細(xì)描述。在本實(shí)施例中,個性化業(yè)務(wù)效果評價單元500根據(jù)客戶對個性化業(yè)務(wù)推薦單元 400所推薦的業(yè)務(wù)的反饋,評價個性化業(yè)務(wù)推薦的效果。具體地,客戶在收到推薦的個性化業(yè)務(wù)后,通常會做出一些反饋動作(例如,是否使用該業(yè)務(wù))。根據(jù)所有客戶的反饋,可以對以下效果進(jìn)行自動評價 推薦業(yè)務(wù)的效果統(tǒng)計(jì)各個推薦業(yè)務(wù)的推薦次數(shù)、成功次數(shù)(例如,推薦成功判定方式可以是客戶收到推薦業(yè)務(wù)后不久就開通了該業(yè)務(wù))、成功率。 推薦類型的效果統(tǒng)計(jì)各個推薦類型的推薦次數(shù)、成功次數(shù)(例如,推薦成功判定方式可以是客戶收到系統(tǒng)使用推薦類型所產(chǎn)生的推薦業(yè)務(wù)后不久就開通了該業(yè)務(wù))、 成功率。圖19示出了根據(jù)本發(fā)明第四實(shí)施例的個性化業(yè)務(wù)效果評價單元執(zhí)行個性化業(yè)務(wù)推薦效果評價的例子。如圖19所示,通過對所有客戶的反饋歷史進(jìn)行統(tǒng)計(jì),個性化業(yè)務(wù)效果評價單元500可以得到各個推薦業(yè)務(wù)及各個推薦類型的推薦效果。下面,結(jié)合附圖20來描述根據(jù)本發(fā)明的一個實(shí)施例的數(shù)據(jù)分析方法。圖20是示出了根據(jù)本發(fā)明的一個實(shí)施例的數(shù)據(jù)分析方法19的流程圖。例如,該方法19可以由上文描述的根據(jù)本發(fā)明的數(shù)據(jù)分析設(shè)備來執(zhí)行。
最初,方法19從步驟S1900開始。在步驟S1901,基于語義知識、語言模型等已存儲的信息,從客戶的投訴/咨詢數(shù)據(jù)中識別業(yè)務(wù)、主題和子主題的名稱。該步驟例如可以由上文描述的根據(jù)本發(fā)明的數(shù)據(jù)分析設(shè)備中的識別單元來執(zhí)行。具體過程可參見上文的相應(yīng)描述,此處不再重復(fù)說明。在步驟S1902-S1905,基于步驟S1901的結(jié)果,計(jì)算客戶的隱含特征,具體包括計(jì)算客戶的價格敏感度和質(zhì)量敏感度、計(jì)算客戶對所識別的業(yè)務(wù)的使用水平、計(jì)算客戶對所識別的業(yè)務(wù)的接受度并獲取客戶對所識別的業(yè)務(wù)的不滿原因。隱含特征的計(jì)算例如可以由上文描述的根據(jù)本發(fā)明的數(shù)據(jù)分析設(shè)備中的隱含特征計(jì)算單元來執(zhí)行。具體過程可參見上文的相應(yīng)描述,此處不再重復(fù)說明。需要指出,雖然步驟S1902-S1905在附圖20中是依次示出的,然而可以理解的是, 這些步驟不一定全部執(zhí)行,而且不一定按照附圖19中所示的順序來執(zhí)行。例如,可以根據(jù)實(shí)際需要僅執(zhí)行所示步驟S1902-S1905中的一個或更多個步驟,而且可以按照不同的順序來執(zhí)行或者以并行的方式來執(zhí)行。接下來,在步驟S1906處,可根據(jù)需要決定是否執(zhí)行對客戶的隱含需求的統(tǒng)計(jì)。如果要執(zhí)行統(tǒng)計(jì),則方法進(jìn)行至步驟S1907。在步驟S1907,可以執(zhí)行業(yè)務(wù)接受度統(tǒng)計(jì)、業(yè)務(wù)不滿原因統(tǒng)計(jì)和客戶分群統(tǒng)計(jì),等等。這些統(tǒng)計(jì)例如可以由上文描述的根據(jù)本發(fā)明的數(shù)據(jù)分析設(shè)備中的隱含需求統(tǒng)計(jì)單元來執(zhí)行。具體過程可參見上文的相應(yīng)描述,此處不再重復(fù)說明。之后,方法進(jìn)行至步驟S1908。否則,如果不需要執(zhí)行統(tǒng)計(jì),則方法直接來到步驟S1908。在步驟S1908,判斷是否向客戶推薦個性化業(yè)務(wù)。如果是,則方法進(jìn)行至步驟S1909。在步驟S1909,根據(jù)客戶的隱含需求,向客戶推薦個性化業(yè)務(wù),包括更高質(zhì)量的業(yè)務(wù)、價格更實(shí)惠的業(yè)務(wù)、升級現(xiàn)有業(yè)務(wù)、語義相關(guān)業(yè)務(wù)、提升現(xiàn)有業(yè)務(wù)價值和挽留業(yè)務(wù),等等??蛇x地,還可接收客戶對所推薦的個性化業(yè)務(wù)的反饋,以評價個性化業(yè)務(wù)推薦的效果。步驟S1909例如可以由上文描述的根據(jù)本發(fā)明的數(shù)據(jù)分析設(shè)備中的個性化業(yè)務(wù)推薦單元和個性化業(yè)務(wù)效果評價單元來執(zhí)行。具體過程可參見上文的相應(yīng)描述,此處不再重復(fù)說明。在此之后,方法進(jìn)行至步驟S1910并結(jié)束。否則,如果不需要推薦個性化業(yè)務(wù),則該方法在步驟S1908后直接進(jìn)行到步驟 S1910并結(jié)束。綜上所述,根據(jù)本發(fā)明的數(shù)據(jù)分析設(shè)備和方法可以根據(jù)來自客戶的投訴/咨詢數(shù)據(jù)準(zhǔn)確地理解客戶的隱含需求。此外,還可以根據(jù)客戶的隱含需求,向客戶推薦個性化業(yè)務(wù)。因此,本發(fā)明能夠極大地提升客戶的使用感受。盡管以上已經(jīng)結(jié)合本發(fā)明的優(yōu)選實(shí)施例示出了本發(fā)明,但是本領(lǐng)域的技術(shù)人員將會理解,在不脫離本發(fā)明的精神和范圍的情況下,可以對本發(fā)明進(jìn)行各種修改、替換和改變。因此,本發(fā)明不應(yīng)由上述實(shí)施例來限定,而應(yīng)由所附權(quán)利要求及其等價物來限定。
權(quán)利要求
1.一種數(shù)據(jù)分析設(shè)備,包括識別單元,基于語義知識和語言模型,從客戶的投訴/咨詢數(shù)據(jù)中識別出業(yè)務(wù)、主題和子主題;隱含特征計(jì)算單元,基于語義知識和情緒字典,根據(jù)所識別的業(yè)務(wù)、主題和子主題來計(jì)算客戶的隱含特征;以及隱含需求獲取單元,將客戶的隱含特征匯總以獲取客戶的隱含需求。
2.如權(quán)利要求1所述的數(shù)據(jù)分析設(shè)備,其中,所述隱含特征計(jì)算單元包括 敏感度計(jì)算子單元,計(jì)算客戶的價格敏感度和質(zhì)量敏感度;使用水平計(jì)算子單元,計(jì)算客戶對所識別的業(yè)務(wù)的使用水平; 接受度計(jì)算子單元,計(jì)算客戶對所識別的業(yè)務(wù)的接受度;以及不滿原因獲取子單元,獲取客戶對所識別的業(yè)務(wù)的不滿原因。
3.如權(quán)利要求1所述的數(shù)據(jù)分析設(shè)備,還包括 隱含需求統(tǒng)計(jì)單元,對客戶的隱含需求進(jìn)行統(tǒng)計(jì)。
4.如權(quán)利要求3所述的數(shù)據(jù)分析設(shè)備,其中,所述隱含需求統(tǒng)計(jì)單元進(jìn)行以下至少一項(xiàng)統(tǒng)計(jì)業(yè)務(wù)接受度統(tǒng)計(jì)、業(yè)務(wù)不滿原因統(tǒng)計(jì)和客戶分群統(tǒng)計(jì)。
5.如權(quán)利要求1所述的數(shù)據(jù)分析設(shè)備,還包括個性化業(yè)務(wù)推薦單元,根據(jù)客戶的隱含需求,向客戶推薦個性化業(yè)務(wù)。
6.如權(quán)利要求5所述的數(shù)據(jù)分析設(shè)備,其中,所述個性化業(yè)務(wù)推薦單元提供以下至少一項(xiàng)業(yè)務(wù)更高質(zhì)量的業(yè)務(wù)、價格更實(shí)惠的業(yè)務(wù)、升級現(xiàn)有業(yè)務(wù)、語義相關(guān)業(yè)務(wù)、提升現(xiàn)有業(yè)務(wù)價值和挽留業(yè)務(wù)。
7.如權(quán)利要求5所述的數(shù)據(jù)分析設(shè)備,還包括個性化業(yè)務(wù)效果評價單元,根據(jù)客戶對所述個性化業(yè)務(wù)推薦單元推薦的業(yè)務(wù)的反饋, 評價個性化業(yè)務(wù)推薦的效果。
8.一種數(shù)據(jù)分析方法,包括基于語義知識和語言模型,從客戶的投訴/咨詢數(shù)據(jù)中識別出業(yè)務(wù)、主題和子主題; 基于語義知識和情緒字典,根據(jù)所識別的業(yè)務(wù)、主題和子主題來計(jì)算客戶的隱含特征;以及將客戶的隱含特征匯總以獲取客戶的隱含需求。
9.如權(quán)利要求8所述的數(shù)據(jù)分析方法,其中,所述隱含特征包括客戶的價格敏感度和質(zhì)量敏感度、客戶對所識別的業(yè)務(wù)的使用水平、客戶對所識別的業(yè)務(wù)的接受度和客戶對所識別的業(yè)務(wù)的不滿原因。
10.如權(quán)利要求8所述的數(shù)據(jù)分析方法,還包括 對客戶的隱含需求進(jìn)行統(tǒng)計(jì)。
11.如權(quán)利要求10所述的數(shù)據(jù)分析方法,其中,所述統(tǒng)計(jì)包括以下至少一項(xiàng)業(yè)務(wù)接受度統(tǒng)計(jì)、業(yè)務(wù)不滿原因統(tǒng)計(jì)和客戶分群統(tǒng)計(jì)。
12.如權(quán)利要求8所述的數(shù)據(jù)分析方法,還包括 根據(jù)客戶的隱含需求,向客戶推薦個性化業(yè)務(wù)。
13.如權(quán)利要求12所述的數(shù)據(jù)分析方法,其中,所述個性化業(yè)務(wù)包括以下至少一項(xiàng)業(yè)務(wù)更高質(zhì)量的業(yè)務(wù)、價格更實(shí)惠的業(yè)務(wù)、升級現(xiàn)有業(yè)務(wù)、語義相關(guān)業(yè)務(wù)、提升現(xiàn)有業(yè)務(wù)價值和挽留業(yè)務(wù)。
14.如權(quán)利要求12所述的數(shù)據(jù)分析方法,還包括 根據(jù)客戶對所推薦的個性化業(yè)務(wù)的反饋,評價個性化業(yè)務(wù)推薦的效果。
全文摘要
本發(fā)明提供了一種數(shù)據(jù)分析設(shè)備,包括識別單元,基于語義知識和語言模型,從客戶的投訴/咨詢數(shù)據(jù)中識別出業(yè)務(wù)、主題和子主題;隱含特征計(jì)算單元,基于語義知識和情緒字典,根據(jù)所識別的業(yè)務(wù)、主題和子主題來計(jì)算客戶的隱含特征;以及隱含需求獲取單元,將客戶的隱含特征匯總以獲取客戶的隱含需求。本發(fā)明還提供了一種數(shù)據(jù)分析方法。
文檔編號G06Q10/00GK102402717SQ20101028292
公開日2012年4月4日 申請日期2010年9月13日 優(yōu)先權(quán)日2010年9月13日
發(fā)明者豐強(qiáng)澤, 何滔, 趙凱, 趙岷, 齊紅威 申請人:日電(中國)有限公司