基于自定義分類規(guī)則的業(yè)務(wù)模型分析方法和裝置制造方法
【專利摘要】本發(fā)明公開了一種基于自定義分類規(guī)則的業(yè)務(wù)模型分析方法和裝置,其中的方法包括:獲取識別文本;利用已成功建立的業(yè)務(wù)模型對所述識別文本進(jìn)行業(yè)務(wù)分類識別;其中,所述業(yè)務(wù)模型的建立過程包括:針對一行業(yè),匯集該行業(yè)的業(yè)務(wù)目標(biāo);確定各業(yè)務(wù)目標(biāo)分別對應(yīng)的關(guān)聯(lián)關(guān)鍵詞;利用所述關(guān)聯(lián)關(guān)鍵詞為各業(yè)務(wù)目標(biāo)分別設(shè)置識別規(guī)則,以建立各業(yè)務(wù)目標(biāo)的業(yè)務(wù)模型初型;利用多個(gè)識別訓(xùn)練文本對所述各業(yè)務(wù)目標(biāo)的業(yè)務(wù)模型初型進(jìn)行訓(xùn)練,以完善各業(yè)務(wù)目標(biāo)的識別規(guī)則,從而成功建立各業(yè)務(wù)目標(biāo)的業(yè)務(wù)模型。本發(fā)明提供的技術(shù)方案能夠自動(dòng)實(shí)現(xiàn)業(yè)務(wù)分類。
【專利說明】基于自定義分類規(guī)則的業(yè)務(wù)模型分析方法和裝置
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及業(yè)務(wù)分類管理技術(shù),特別是涉及一種基于自定義分類規(guī)則的業(yè)務(wù)模型分析方法和裝置。
【背景技術(shù)】
[0002]在語音分析【技術(shù)領(lǐng)域】中,對通話進(jìn)行業(yè)務(wù)分類是非常重要的。
[0003]通常情況下,在呼叫中心的管理系統(tǒng)所記錄的隨錄信息中,往往含有對通話進(jìn)行業(yè)務(wù)分類的類別描述,利用隨錄信息中的類別描述可以對通話業(yè)務(wù)進(jìn)行分類。然而,現(xiàn)有的隨錄?目息存在以下問題:
[0004]1、隨錄信息不完整;即并不是所有的隨錄信息中都包含有對通話進(jìn)行業(yè)務(wù)分類的類別描述,有些呼叫中心的管理系統(tǒng)甚至完全沒有隨錄信息。
[0005]2、隨錄信息不嚴(yán)謹(jǐn);即對通話類別的描述往往是由坐席手工操作記錄下來的,存在敷衍應(yīng)付以及主觀出錯(cuò)等情況。
[0006]3、對于自定義類別(如專項(xiàng)調(diào)查中的類別)的業(yè)務(wù)通常無法在系統(tǒng)中事先記錄。
[0007]隨錄信息存在的上述問題會導(dǎo)致業(yè)務(wù)分類不能準(zhǔn)確并順利的進(jìn)行,甚至無法進(jìn)行業(yè)務(wù)分類,這對呼叫中心的管理系統(tǒng)來說是非常不利的。
[0008]有鑒于現(xiàn)有的業(yè)務(wù)分類存在的問題,本發(fā)明人積極加以研究創(chuàng)新,以期創(chuàng)設(shè)一種新的基于自定義分類規(guī)則的業(yè)務(wù)模型分析方法和裝置,能夠克服現(xiàn)有的業(yè)務(wù)分類存在的問題,使其更具有實(shí)用性。經(jīng)過不斷`的研究設(shè)計(jì),并經(jīng)過反復(fù)試作樣品及改進(jìn),終于創(chuàng)設(shè)出確具實(shí)用價(jià)值的本發(fā)明。
【發(fā)明內(nèi)容】
[0009]本發(fā)明的主要目的在于,克服現(xiàn)有的業(yè)務(wù)分類存在的問題,而提供一種新的基于自定義分類規(guī)則的業(yè)務(wù)模型分析方法和裝置,所要解決的問題是,能夠自動(dòng)地對業(yè)務(wù)進(jìn)行分類處理。
[0010]本發(fā)明的目的以及解決其技術(shù)問題可以采用以下的技術(shù)方案來實(shí)現(xiàn)。
[0011]依據(jù)本發(fā)明提出的一種基于自定義分類規(guī)則的業(yè)務(wù)模型分析方法,包括:獲取識別文本;
[0012]利用已成功建立的各業(yè)務(wù)目標(biāo)的業(yè)務(wù)模型對所述識別文本進(jìn)行業(yè)務(wù)分類識別;
[0013]其中,所述業(yè)務(wù)模型的建立過程包括:
[0014]針對一行業(yè),匯集該行業(yè)的業(yè)務(wù)目標(biāo);
[0015]確定各業(yè)務(wù)目標(biāo)分別對應(yīng)的關(guān)聯(lián)關(guān)鍵詞;
[0016]利用所述關(guān)聯(lián)關(guān)鍵詞為各業(yè)務(wù)目標(biāo)分別設(shè)置識別規(guī)則,以建立各業(yè)務(wù)目標(biāo)的業(yè)務(wù)模型初型;
[0017]利用多個(gè)識別訓(xùn)練文本對所述各業(yè)務(wù)目標(biāo)的業(yè)務(wù)模型初型進(jìn)行訓(xùn)練,以完善各業(yè)務(wù)目標(biāo)的識別規(guī)則,從而成功建立各業(yè)務(wù)目標(biāo)的業(yè)務(wù)模型。[0018]依據(jù)本發(fā)明提出的一種基于自定義分類規(guī)則的業(yè)務(wù)模型分析裝置,包括:獲取模塊、識別模塊以及建立模塊;
[0019]所述獲取模塊,用于獲取識別文本;
[0020]所述識別模塊,用于利用已成功建立的各業(yè)務(wù)目標(biāo)的業(yè)務(wù)模型對所述識別文本進(jìn)行業(yè)務(wù)分類識別;
[0021]其中,所述業(yè)務(wù)模型由所述建立模塊建立,且所述建立模塊包括:
[0022]匯集子模塊,用于針對一行業(yè),匯集該行業(yè)的業(yè)務(wù)目標(biāo);
[0023]確定子模塊,用于確定各業(yè)務(wù)目標(biāo)分別對應(yīng)的關(guān)聯(lián)關(guān)鍵詞;
[0024]設(shè)置子模塊,用于利用所述關(guān)聯(lián)關(guān)鍵詞為各業(yè)務(wù)目標(biāo)分別設(shè)置識別規(guī)則,以建立各業(yè)務(wù)目標(biāo)的業(yè)務(wù)模型初型;
[0025]訓(xùn)練子模塊,用于利用多個(gè)識別訓(xùn)練文本對所述各業(yè)務(wù)目標(biāo)的業(yè)務(wù)模型初型進(jìn)行訓(xùn)練,以完善各業(yè)務(wù)目標(biāo)的識別規(guī)則,從而成功建立各業(yè)務(wù)目標(biāo)的業(yè)務(wù)模型。
[0026]借由上述技術(shù)方案,本發(fā)明的基于自定義分類規(guī)則的業(yè)務(wù)模型分析方法和裝置至少具有下列優(yōu)點(diǎn)以及有益效果:本發(fā)明通過為各業(yè)務(wù)目標(biāo)建立業(yè)務(wù)模型,并利用成功建立的業(yè)務(wù)模型來對識別文本進(jìn)行業(yè)務(wù)分類識別,可以對語音通話等業(yè)務(wù)自動(dòng)且快速準(zhǔn)確的進(jìn)行業(yè)務(wù)分類處理;從而提高了業(yè)務(wù)管理的自動(dòng)化程度。
[0027]上述說明僅是本發(fā)明技術(shù)方案的概述,為了能夠更清楚了解本發(fā)明的技術(shù)手段,而可依照說明書的內(nèi)容予以實(shí)施,并且為了讓本發(fā)明的上述和其他目的、特征和優(yōu)點(diǎn)能夠更明顯易懂,以下特舉較佳實(shí)施例,并配合說明書附圖,詳細(xì)說明如下。
【專利附圖】
【附圖說明】
[0028]圖1為本發(fā)明的基于自定義分類規(guī)則的業(yè)務(wù)模型分析方法的流程圖;
[0029]圖2為本發(fā)明的基于自定義分類規(guī)則的業(yè)務(wù)模型分析裝置的示意圖。
【具體實(shí)施方式】
[0030]為更進(jìn)一步闡述本發(fā)明為達(dá)成預(yù)定發(fā)明目的所采取的技術(shù)手段及功效,以下結(jié)合附圖及較佳實(shí)施例,對依據(jù)本發(fā)明提出的基于自定義分類規(guī)則的業(yè)務(wù)模型分析方法和裝置的【具體實(shí)施方式】、結(jié)構(gòu)、特征及其功效,詳細(xì)說明如后。
[0031]實(shí)施例一、基于自定義分類規(guī)則的業(yè)務(wù)模型分析方法。該方法的流程如圖1所示。
[0032]在圖1中,S100、獲取識別文本。
[0033]具體的,該識別文本可以是由語音通話轉(zhuǎn)換而來的識別文本,如對當(dāng)前正在進(jìn)行的語音通話或者錄音的語音通話進(jìn)行語音識別,從而根據(jù)語音識別結(jié)果獲得該語音通話對應(yīng)的識別文本。本實(shí)施例可以采用現(xiàn)有的語音識別技術(shù)來獲取識別文本,在此不再對語音識別過程進(jìn)行詳細(xì)說明。
[0034]S110、利用已成功建立的業(yè)務(wù)模型對上述獲取到的識別文本進(jìn)行業(yè)務(wù)分類識別,以確定該識別文本所屬的業(yè)務(wù)目標(biāo)。
[0035]具體的,可以將上述獲取到的識別文本與已成功建立的業(yè)務(wù)模型進(jìn)行匹配操作,并根據(jù)匹配結(jié)果確定該識別文本所屬的業(yè)務(wù)目標(biāo),從而實(shí)現(xiàn)了對識別文本的業(yè)務(wù)分類。
[0036]一個(gè)具體的例子,確定識別文本中的關(guān)鍵字,并依照業(yè)務(wù)模型的先后順序判斷識別文本中的關(guān)鍵字符合業(yè)務(wù)模型的識別規(guī)則的程度,本實(shí)施例可以在關(guān)鍵字與某業(yè)務(wù)模型的符合程度達(dá)到預(yù)定程度時(shí),確定當(dāng)前的業(yè)務(wù)模型與識別文本相匹配,并確定該識別文本屬于當(dāng)前的業(yè)務(wù)模型對應(yīng)的業(yè)務(wù)目標(biāo),不再進(jìn)行后續(xù)的判斷過程,從而實(shí)現(xiàn)了對該識別文本的業(yè)務(wù)分類。另外,在上述例子中,也可以分別判斷識別文本與所有業(yè)務(wù)模型的符合程度,并從中選取符合程度最好的業(yè)務(wù)模型,將該選取出的業(yè)務(wù)模型對應(yīng)的業(yè)務(wù)目標(biāo)作為識別文本所屬的業(yè)務(wù)目標(biāo)。當(dāng)然,本發(fā)明還可以在已成功建立的業(yè)務(wù)模型的基礎(chǔ)上,采用其他方式對識別文本進(jìn)行業(yè)務(wù)分類識別,在此不再一一詳細(xì)說明。
[0037]本發(fā)明的業(yè)務(wù)模型的建立過程具體如下所述:
[0038]S200、針對一行業(yè),匯集該行業(yè)的業(yè)務(wù)目標(biāo)。
[0039]具體的,不同行業(yè)所包含的業(yè)務(wù)目標(biāo)也會有所不同,業(yè)務(wù)目標(biāo)的一個(gè)具體例子為,針對中國移動(dòng)這一行業(yè)而言,其業(yè)務(wù)目標(biāo)通常可以包括:10086 ;補(bǔ)卡、換卡和備卡;開戶、過戶和銷戶;來電提醒;GPRS ;彩鈴等。
[0040]針對一個(gè)具體的行業(yè)而言,該行業(yè)中的所有業(yè)務(wù)目標(biāo)可以以業(yè)務(wù)目標(biāo)列表的形式
匯集在一起。
[0041]S210、確定各業(yè)務(wù)目標(biāo)分別對應(yīng)的關(guān)聯(lián)關(guān)鍵詞。
[0042]具體的,一個(gè)行業(yè)中的每個(gè)業(yè)務(wù)目標(biāo)都會對應(yīng)有相應(yīng)的關(guān)聯(lián)關(guān)鍵詞,且不同業(yè)務(wù)目標(biāo)對應(yīng)的關(guān)聯(lián)關(guān)鍵詞通常應(yīng)不完全相同。
[0043]業(yè)務(wù)目標(biāo)對應(yīng)的關(guān)聯(lián)關(guān)鍵詞的一個(gè)具體的例子為,與“GPRS”這一業(yè)務(wù)目標(biāo)可能相關(guān)的關(guān)聯(lián)關(guān)鍵詞包括:GPRS、流量、手機(jī)上網(wǎng)以及WAP等。
[0044]S220、利用上述關(guān)聯(lián)關(guān)鍵詞為各業(yè)務(wù)目標(biāo)分別設(shè)置識別規(guī)則,以建立各業(yè)務(wù)目標(biāo)的業(yè)務(wù)模型初型。該識別規(guī)則可以稱為業(yè)務(wù)模型初型的識別規(guī)則。
[0045]具體的,本實(shí)施例中的識別規(guī)則主要包括兩部分內(nèi)容,即關(guān)聯(lián)關(guān)鍵詞以及關(guān)聯(lián)關(guān)鍵詞之間的邏輯關(guān)系。
[0046]上述邏輯關(guān)系可以包括:與、或、非以及鄰接邏輯關(guān)系中的至少一個(gè);其中:
[0047]“與”邏輯關(guān)系為二元邏輯關(guān)系,可以使用規(guī)則符號“&”來表示;“與”邏輯關(guān)系的優(yōu)先級可以設(shè)置為普通優(yōu)先級;“與”邏輯關(guān)系是指“必須同時(shí)出現(xiàn)”,即兩個(gè)部分必須同時(shí)存在才會認(rèn)為符合“與”邏輯關(guān)系,例如,“我想辦理寬帶上網(wǎng)”符合“上網(wǎng)&寬帶”規(guī)則,而“我想辦理手機(jī)上網(wǎng)”則不符合“上網(wǎng)&寬帶”規(guī)則;
[0048]“或”邏輯關(guān)系為二元邏輯關(guān)系,可以使用規(guī)則符號“ I ”來表示;“或”邏輯關(guān)系的優(yōu)先級可以設(shè)置為普通優(yōu)先級;“或”邏輯關(guān)系是指“只要出現(xiàn)其中任何一個(gè)”;
[0049]“非”邏輯關(guān)系為一元邏輯關(guān)系,可以使用規(guī)則符號“!”來表示;“非”邏輯關(guān)系的優(yōu)先級可以設(shè)置為高優(yōu)先級;“非”邏輯關(guān)系是指“不能出現(xiàn)”,即該邏輯關(guān)系中的關(guān)鍵詞必須不存在;
[0050]“鄰接”邏輯關(guān)系為二元邏輯關(guān)系,可以使用規(guī)則符號來表示;“鄰接”邏輯關(guān)系的優(yōu)先級可以設(shè)置為普通優(yōu)先級鄰接”邏輯關(guān)系是指“相繼出現(xiàn)”,關(guān)系中的兩個(gè)部分必須同時(shí)存在且具有前后順序以及較近距離才會被認(rèn)為符合“鄰接”關(guān)系,較近距離的一個(gè)具體的例子為,較近距離可以預(yù)先定義為兩個(gè)部分距離5個(gè)漢字以內(nèi)(含5個(gè)漢字),如“我想辦一張卡”符合“辦#卡”規(guī)則。
[0051]在設(shè)置識別規(guī)則時(shí),應(yīng)使識別規(guī)則符合下述規(guī)定:[0052]A、表征邏輯關(guān)系的符號為半角字符;
[0053]B、一條識別規(guī)則必須具有表征開始的半角符號以及表征結(jié)束的半角符號,例如,一條識別規(guī)則以半角符號“(”開始,并以半角符號“)”結(jié)束;
[0054]C、在一條識別規(guī)則中,除了 “非”和“鄰接邏輯關(guān)系”之外的其他邏輯關(guān)系可以連續(xù)使用,例如,一條識別規(guī)則可以為“(全球通I動(dòng)感地帶I神州行)”;
[0055]D、考慮到計(jì)算的復(fù)雜度,在一條識別規(guī)則中,除了鄰接邏輯關(guān)系之外的其他邏輯關(guān)系可以相互嵌套,而鄰接邏輯關(guān)系只能被嵌套;例如,一條具有相互嵌套的識別規(guī)則可以為“(全球通I (動(dòng)感&地帶)I神州行)”,而一條具有被嵌套的鄰接邏輯關(guān)系可以為“(全球通I (動(dòng)感#地帶)I神州行)”,類似于“((開通I開了)#(GPRSI手機(jī)上網(wǎng)))”這樣的識別規(guī)則,基于計(jì)算復(fù)雜度的考慮,本實(shí)施例可以暫不支持;
[0056]E、在一條識別規(guī)則中,在一條識別規(guī)則中,除了非邏輯關(guān)系之外的其他邏輯關(guān)系的優(yōu)先級應(yīng)顯式的使用表征優(yōu)先級的符號來表示;例如,如果一條識別規(guī)則為“(品牌互轉(zhuǎn)
(轉(zhuǎn)#全球通))”,則“轉(zhuǎn)#全球通”具有比“品牌互轉(zhuǎn)”更高的優(yōu)先級;但是,該識別規(guī)則如果寫成“(品牌互轉(zhuǎn)I轉(zhuǎn)#全球通)”,則按序順序排定各邏輯關(guān)系的優(yōu)先級,可能會導(dǎo)致不符合業(yè)務(wù)邏輯;
[0057]F、括號應(yīng)成對出現(xiàn),即“(”和“)”出現(xiàn)的次數(shù)應(yīng)相同,否則可以認(rèn)為是語法錯(cuò)誤;
[0058]G、兩個(gè)前后相鄰的關(guān)聯(lián)關(guān)鍵詞之間應(yīng)具有表征邏輯關(guān)系的符號,即任意兩個(gè)相鄰的關(guān)鍵詞之間必須存在邏輯關(guān)系符號;
[0059]H、可以在邏輯關(guān)系符號的前后設(shè)置若干空格,以增強(qiáng)識別規(guī)則的可讀性;
[0060]1、可以在識別規(guī)則中插入無實(shí)際邏輯意義的符號,以增強(qiáng)識別規(guī)則的可讀性,如可以在識別規(guī)則中插入無實(shí)際邏輯意義的“(”和“)”。
[0061]在為各業(yè)務(wù)目標(biāo)設(shè)置了識別規(guī)則之后,各業(yè)務(wù)目標(biāo)的業(yè)務(wù)模型初型也就成功建立起來了。
[0062]S230、利用多個(gè)識別訓(xùn)練文本對各業(yè)務(wù)目標(biāo)的業(yè)務(wù)模型初型進(jìn)行訓(xùn)練,以完善各業(yè)務(wù)目標(biāo)的識別規(guī)則,從而形成各業(yè)務(wù)目標(biāo)的業(yè)務(wù)模型。訓(xùn)練的過程具體如下:
[0063]訓(xùn)練步驟1、首先利用單個(gè)業(yè)務(wù)模型初型對多個(gè)識別訓(xùn)練文本進(jìn)行識別驗(yàn)證,并根據(jù)識別驗(yàn)證結(jié)果來對多個(gè)識別訓(xùn)練文本進(jìn)行篩選;即利用多個(gè)識別訓(xùn)練文本(如不少于10萬條的錄音識別文本)對某業(yè)務(wù)模型初型進(jìn)行訓(xùn)練,從而可以將所有的識別訓(xùn)練文本區(qū)分為符合該業(yè)務(wù)模型初型的識別訓(xùn)練文本以及不符合該業(yè)務(wù)模型初型的識別訓(xùn)練文本。到訓(xùn)練步驟2。
[0064]訓(xùn)練步驟2、根據(jù)上述篩選獲得的結(jié)果來修正該單個(gè)業(yè)務(wù)模型初型。到訓(xùn)練步驟3。
[0065]具體的,如果某個(gè)識別訓(xùn)練文本應(yīng)該符合該業(yè)務(wù)模型初型,而通過上述訓(xùn)練步驟I之后,該識別訓(xùn)練文本并沒有符合該業(yè)務(wù)模型初型,則應(yīng)根據(jù)該識別訓(xùn)練文本來補(bǔ)充該業(yè)務(wù)模型初型的識別規(guī)則;如果某個(gè)識別訓(xùn)練文本不應(yīng)該符合該業(yè)務(wù)模型初型,而通過上述訓(xùn)練步驟I之后,該識別訓(xùn)練文本符合該業(yè)務(wù)模型初型,則應(yīng)根據(jù)該識別訓(xùn)練文本來調(diào)整該業(yè)務(wù)模型初型的識別規(guī)則。
[0066]訓(xùn)練步驟3、重復(fù)上述訓(xùn)練步驟1-2,以逐個(gè)地對所有業(yè)務(wù)模型初型進(jìn)行修正,即修正所有業(yè)務(wù)模型初型的識別規(guī)則。到訓(xùn)練步驟4。[0067]訓(xùn)練步驟4、利用當(dāng)前修正后的所有業(yè)務(wù)模型初型對多個(gè)識別訓(xùn)練文本(如不少于10萬條的錄音識別文本)進(jìn)行識別驗(yàn)證,以獲得兩種類型的識別訓(xùn)練文本,即,a、不能被當(dāng)前修正后的所有業(yè)務(wù)模型初型均識別驗(yàn)證的識別訓(xùn)練文本,b、同時(shí)符合多個(gè)當(dāng)前修正后的業(yè)務(wù)模型初型的識別訓(xùn)練文本;并根據(jù)這兩種類型的識別訓(xùn)練文本繼續(xù)修正相應(yīng)的業(yè)務(wù)模型初型。
[0068]具體的,如果某個(gè)識別訓(xùn)練文本應(yīng)該符合當(dāng)前的某一業(yè)務(wù)模型初型,然而,在本步驟的訓(xùn)練中,該識別訓(xùn)練文本并沒有符合任一業(yè)務(wù)模型初型,則應(yīng)根據(jù)該識別訓(xùn)練文本來補(bǔ)充相應(yīng)的業(yè)務(wù)模型初型的識別規(guī)則,以使其可以符合某一業(yè)務(wù)模型初型;如果某個(gè)識別訓(xùn)練文本不應(yīng)該同時(shí)符合多個(gè)業(yè)務(wù)模型初型,而在本步驟的訓(xùn)練中,該識別訓(xùn)練文本同時(shí)符合了多個(gè)業(yè)務(wù)模型初型,則應(yīng)根據(jù)該識別訓(xùn)練文本來調(diào)整相應(yīng)的業(yè)務(wù)模型初型的識別規(guī)貝U,以使其僅符合某一業(yè)務(wù)模型初型。
[0069]訓(xùn)練步驟5、重復(fù)調(diào)用上述訓(xùn)練步驟4,直到當(dāng)前獲得的兩種識別訓(xùn)練文本的數(shù)量與前次獲得的兩種識別訓(xùn)練文本的數(shù)量均相同(既沒有增多也沒有減少),從而將各業(yè)務(wù)目標(biāo)當(dāng)前的業(yè)務(wù)模型初型作為各業(yè)務(wù)目標(biāo)的業(yè)務(wù)模型,當(dāng)前的業(yè)務(wù)模型初型的識別規(guī)則即為業(yè)務(wù)模型的識別規(guī)則。
[0070]通過上述訓(xùn)練獲得的業(yè)務(wù)模型的識別規(guī)則應(yīng)包含可以充分描述該業(yè)務(wù)模型對應(yīng)的業(yè)務(wù)目標(biāo)的存在某個(gè)/某些邏輯關(guān)系的關(guān)鍵詞序列,也就是說,業(yè)務(wù)模型的識別規(guī)則描述了對于某個(gè)特定業(yè)務(wù)目標(biāo)類別的實(shí)際通話中可能出現(xiàn)的關(guān)鍵詞及其邏輯關(guān)系。
[0071]業(yè)務(wù)目標(biāo)類別可以是指,期望通過對應(yīng)的業(yè)務(wù)模型的規(guī)則所能夠識別出的一條通話所屬的屬性,該屬性可以是業(yè)務(wù)名稱、操作類型以及自定義的專題屬性等(如投訴預(yù)警或者校園優(yōu)惠活動(dòng)等)。
[0072]表述一業(yè)務(wù)目標(biāo)類別及對應(yīng)的識別規(guī)則的具體例子如下:
[0073]信息服務(wù)類_>GPRS: ((GPRS |流量|手機(jī)上網(wǎng)| WAP))。
[0074]實(shí)施例二、基于自定義分類規(guī)則的業(yè)務(wù)模型分析裝置,該裝置的結(jié)構(gòu)如圖2所示。
[0075]圖2中,該裝置主要包括:獲取模塊1、識別模塊2以及建立模塊3。
[0076]獲取模塊I主要用于獲取識別文本。該識別文本可以是由語音通話轉(zhuǎn)換而來的識別文本,如獲取模塊I中的語音識別子模塊11對當(dāng)前正在進(jìn)行的語音通話或者錄音的語音通話進(jìn)行語音識別,從而語音識別子模塊11可以根據(jù)語音識別結(jié)果獲得該語音通話對應(yīng)的識別文本。語音識別子模塊11可以采用現(xiàn)有的語音識別技術(shù)來獲取識別文本,在此不再詳細(xì)說明。
[0077]識別模塊2主要用于利用已成功建立的各業(yè)務(wù)目標(biāo)的業(yè)務(wù)模型對上述獲取模塊I獲取到的識別文本進(jìn)行業(yè)務(wù)分類識別。識別模塊2可以將上述獲取到的識別文本與已成功建立的業(yè)務(wù)模型進(jìn)行匹配操作,并根據(jù)匹配結(jié)果確定該識別文本所屬的業(yè)務(wù)目標(biāo),從而實(shí)現(xiàn)了對識別文本的業(yè)務(wù)分類。
[0078]—個(gè)具體的例子,識別模塊2確定識別文本中的關(guān)鍵字,并依照業(yè)務(wù)模型的先后順序判斷識別文本中的關(guān)鍵字符合業(yè)務(wù)模型的識別規(guī)則的程度,識別模塊2可以在關(guān)鍵字與某業(yè)務(wù)模型的符合程度達(dá)到預(yù)定程度時(shí),確定當(dāng)前的業(yè)務(wù)模型與識別文本相匹配,并確定該識別文本屬于當(dāng)前的業(yè)務(wù)模型對應(yīng)的業(yè)務(wù)目標(biāo),識別模塊2不再進(jìn)行后續(xù)的判斷過程,從而實(shí)現(xiàn)了對該識別文本的業(yè)務(wù)分類。另外,在上述例子中,識別模塊2也可以分別判斷識別文本與所有業(yè)務(wù)模型的符合程度,并從中選取符合程度最好的業(yè)務(wù)模型,將該選取出的業(yè)務(wù)模型對應(yīng)的業(yè)務(wù)目標(biāo)作為識別文本所屬的業(yè)務(wù)目標(biāo)。當(dāng)然,識別模塊2還可以在已成功建立的業(yè)務(wù)模型的基礎(chǔ)上,采用其他方式對識別文本進(jìn)行業(yè)務(wù)分類識別,在此不再詳細(xì)說明
[0079]建立模塊3主要用于建立業(yè)務(wù)模型。由建立模塊3成功建立的業(yè)務(wù)模型可以存儲于建立模塊3中,也可以存儲于識別模塊2中,亦可以存儲于獨(dú)立于識別模塊2和建立模塊3的存儲模塊中。
[0080]建立模塊3主要包括:匯集子模塊31、確定子模塊32、設(shè)置子模塊33以及訓(xùn)練子模塊34。
[0081]匯集子模塊31主要用于針對一行業(yè),匯集該行業(yè)的業(yè)務(wù)目標(biāo)。匯集子模塊31可以將該行業(yè)中的所有業(yè)務(wù)目標(biāo)以業(yè)務(wù)目標(biāo)列表的形式匯集在一起。
[0082]確定子模塊32主要用于確定各業(yè)務(wù)目標(biāo)分別對應(yīng)的關(guān)聯(lián)關(guān)鍵詞。確定子模塊32為該行業(yè)中的每個(gè)業(yè)務(wù)目標(biāo)設(shè)置的關(guān)聯(lián)關(guān)鍵詞通常應(yīng)不完全相同。
[0083]設(shè)置子模塊33主要用于利用上述關(guān)聯(lián)關(guān)鍵詞為各業(yè)務(wù)目標(biāo)分別設(shè)置識別規(guī)則,以建立各業(yè)務(wù)目標(biāo)的業(yè)務(wù)模型初型。設(shè)置子模塊33設(shè)置的識別規(guī)則主要包括的內(nèi)容、以及識別規(guī)則應(yīng)符合的規(guī)定等等具體如上述實(shí)施例一中的描述,在此不再重復(fù)說明。設(shè)置子模塊33所設(shè)置的識別規(guī)則可以具體為:信息服務(wù)類_>GPRS: ((GPRS流量|手機(jī)上網(wǎng)|WAP))。
[0084]在設(shè)置子模塊33為各業(yè)務(wù)目標(biāo)設(shè)置了識別規(guī)則之后,各業(yè)務(wù)目標(biāo)的業(yè)務(wù)模型初型也就成功建立起來了。
[0085]訓(xùn)練子模塊34主要用于利用多個(gè)識別訓(xùn)練文本對各業(yè)務(wù)目標(biāo)的業(yè)務(wù)模型初型進(jìn)行訓(xùn)練,以完善各業(yè)務(wù)目標(biāo)的識別規(guī)則,從而成功建立各業(yè)務(wù)目標(biāo)的業(yè)務(wù)模型。
[0086]上述訓(xùn)練子模塊34主要包括:第一單元、第二單元、第三單元、第四單元以及第五單元。
[0087]第一單元主要用于利用單個(gè)業(yè)務(wù)模型初型對多個(gè)識別訓(xùn)練文本進(jìn)行識別驗(yàn)證,以對多個(gè)識別訓(xùn)練文本進(jìn)行篩選。
[0088]第二單元主要用于根據(jù)第一單元的篩選結(jié)果修正該單個(gè)業(yè)務(wù)模型初型。
[0089]第三單元主要用于重復(fù)調(diào)用第一單元和第二單元執(zhí)行相應(yīng)的操作,以逐個(gè)地對所有業(yè)務(wù)模型初型進(jìn)行修正。
[0090]第四單元主要用于利用當(dāng)前修正后的所有業(yè)務(wù)模型初型對多個(gè)識別訓(xùn)練文本進(jìn)行識別驗(yàn)證,以獲得兩種識別訓(xùn)練文本,即不能被當(dāng)前修正后的所有業(yè)務(wù)模型初型識別驗(yàn)證的識別訓(xùn)練文本以及同時(shí)符合多個(gè)當(dāng)前修正后的業(yè)務(wù)模型初型的識別訓(xùn)練文本,并根據(jù)這兩種識別訓(xùn)練文本繼續(xù)修正相應(yīng)業(yè)務(wù)模型初型。
[0091]第五單元主要用于重復(fù)調(diào)用第四單元,直到當(dāng)前獲得的兩種識別訓(xùn)練文本的數(shù)量與前次獲得的兩種識別訓(xùn)練文本的數(shù)量分別相同,從而成功建立各業(yè)務(wù)目標(biāo)的業(yè)務(wù)模型。
[0092]第一單元至第五單元所執(zhí)行的具體操作請參見上述實(shí)施例一中的訓(xùn)練步驟1-5的描述,在此不再詳細(xì)說明。
[0093]本說明書中的各個(gè)實(shí)施例均采用遞進(jìn)的方式描述,各個(gè)實(shí)施例之間相同相似的部分互相參見即可,每個(gè)實(shí)施例重點(diǎn)說明的都是與其他實(shí)施例的不同之處。尤其,對于裝置實(shí)施例而言,由于其基本相似于方法實(shí)施例,所以描述得比較簡單,相關(guān)之處參見方法實(shí)施例的部分說明即可。以上所描述的裝置實(shí)施例僅僅是示意性的,其中所述作為分離部件說明的模塊和單元可以是或者也可以不是物理上分開的,作為單元顯示的部件可以是或者也可以不是物理單元,即可以位于一個(gè)地方,或者也可以分布到多個(gè)網(wǎng)絡(luò)單元上??梢愿鶕?jù)實(shí)際的需要選擇其中的部分或者全部模塊來實(shí)現(xiàn)本實(shí)施例方案的目的。本領(lǐng)域普通技術(shù)人員在不付出創(chuàng)造性勞動(dòng)的情況下,即可以理解并實(shí)施。
[0094]以上所述僅是本發(fā)明的較佳實(shí)施例而已,并非對本發(fā)明作任何形式上的限制,雖然本發(fā)明已以較佳實(shí)施例揭示如上,然而并非用以限定本發(fā)明的技術(shù),任何熟悉本專業(yè)的技術(shù)人員在不脫離本發(fā)明技術(shù)方案范圍內(nèi),當(dāng)可利用上述揭示的技術(shù)內(nèi)容作出些許更動(dòng)或修飾為等同變化的等效實(shí)施例,但凡是未脫離本發(fā)明技術(shù)方案的內(nèi)容,依據(jù)本發(fā)明的技術(shù)實(shí)質(zhì)對以上實(shí)施例所作的任何簡單修改、等同變化與修飾,均仍屬于本發(fā)明技術(shù)方案的范圍內(nèi)。
【權(quán)利要求】
1.一種基于自定義分類規(guī)則的業(yè)務(wù)模型分析方法,其特征在于,所述方法包括: 獲取識別文本; 利用已成功建立的各業(yè)務(wù)目標(biāo)的業(yè)務(wù)模型對所述識別文本進(jìn)行業(yè)務(wù)分類識別; 其中,所述業(yè)務(wù)模型的建立過程包括: 針對一行業(yè),匯集該行業(yè)的業(yè)務(wù)目標(biāo); 確定各業(yè)務(wù)目標(biāo)分別對應(yīng)的關(guān)聯(lián)關(guān)鍵詞; 利用所述關(guān)聯(lián)關(guān)鍵詞為各業(yè)務(wù)目標(biāo)分別設(shè)置識別規(guī)則,以建立各業(yè)務(wù)目標(biāo)的業(yè)務(wù)模型初型; 利用多個(gè)識別訓(xùn)練文本對所述各業(yè)務(wù)目標(biāo)的業(yè)務(wù)模型初型進(jìn)行訓(xùn)練,以完善各業(yè)務(wù)目標(biāo)的識別規(guī)則,從而成功建立各業(yè)務(wù)目標(biāo)的業(yè)務(wù)模型。
2.如權(quán)利要求1所述的分析方法,其特征在于,所述識別規(guī)則包括:關(guān)聯(lián)關(guān)鍵詞以及關(guān)聯(lián)關(guān)鍵詞之間的邏輯關(guān)系,且所述邏輯關(guān)系包括:與、或、非以及鄰接邏輯關(guān)系中的至少一個(gè);其中,所述鄰接邏輯關(guān)系是指同時(shí)存在的兩個(gè)關(guān)聯(lián)關(guān)鍵詞之間的字符間隔距離滿足預(yù)定條件且這兩個(gè)關(guān)聯(lián)關(guān)鍵詞具有預(yù)定如后順序。
3.如權(quán)利要求2所述的分析方法,其特征在于,所述識別規(guī)則應(yīng)滿足下述條件: A、表征邏輯關(guān)系的符號為半角字符; B、一條識別規(guī)則必須具有表征開始的半角符號以及表征結(jié)束的半角符號; C、在一條識別規(guī)則中,除了非和鄰接邏輯關(guān)系之外的其他邏輯關(guān)系可以連續(xù)使用; D、在一條識別規(guī)則中,除了鄰接邏輯關(guān)系之外的其他邏輯關(guān)系可以相互嵌套,而鄰接邏輯關(guān)系只能被嵌套; E、在一條識別規(guī)則中,除了非邏輯關(guān)系之外的其他邏輯關(guān)系的優(yōu)先級應(yīng)顯式的使用表征優(yōu)先級的符號來表示; F、括號應(yīng)成對出現(xiàn); G、兩個(gè)前后相鄰的關(guān)聯(lián)關(guān)鍵詞之間應(yīng)具有表征邏輯關(guān)系的符號。
4.如權(quán)利要求1或2或3所述的分析方法,其特征在于,所述利用多個(gè)識別訓(xùn)練文本對所述各業(yè)務(wù)目標(biāo)的業(yè)務(wù)模型初型進(jìn)行訓(xùn)練包括: 步驟1、利用單個(gè)業(yè)務(wù)模型初型對多個(gè)識別訓(xùn)練文本進(jìn)行識別驗(yàn)證,以對所述多個(gè)識別訓(xùn)練文本進(jìn)行篩選; 步驟2、根據(jù)所述篩選的結(jié)果修正該單個(gè)業(yè)務(wù)模型初型; 步驟3、重復(fù)上述步驟1-2,以逐個(gè)地對所有業(yè)務(wù)模型初型進(jìn)行修正; 步驟4、利用當(dāng)前修正后的所有業(yè)務(wù)模型初型對多個(gè)識別訓(xùn)練文本進(jìn)行識別驗(yàn)證,以獲得兩種識別訓(xùn)練文本,即不能被當(dāng)前修正后的所有業(yè)務(wù)模型初型識別驗(yàn)證的識別訓(xùn)練文本以及同時(shí)符合多個(gè)當(dāng)前修正后的業(yè)務(wù)模型初型的識別訓(xùn)練文本,并根據(jù)這兩種識別訓(xùn)練文本繼續(xù)修正相應(yīng)業(yè)務(wù)模型初型; 步驟5、重復(fù)上述步驟4,直到當(dāng)前獲得的兩種識別訓(xùn)練文本的數(shù)量與前次獲得的兩種識別訓(xùn)練文本的數(shù)量分別相同,從而成功建立各業(yè)務(wù)目標(biāo)的業(yè)務(wù)模型。
5.如權(quán)利要求1或2或3所述的分析方法,其特征在于,所述獲取識別文本包括:對語音通話進(jìn)行語音識別,以獲得該語音通話對應(yīng)的識別文本。
6.一種基于自定義分類規(guī)則的業(yè)務(wù)模型分析裝置,其特征在于,所述裝置包括:獲取模塊、識別模塊以及建立模塊; 所述獲取模塊,用于獲取識別文本; 所述識別模塊,用于利用已成功建立的各業(yè)務(wù)目標(biāo)的業(yè)務(wù)模型對所述識別文本進(jìn)行業(yè)務(wù)分類識別; 其中,所述業(yè)務(wù)模型由所述建立模塊建立,且所述建立模塊包括: 匯集子模塊,用于針對一行業(yè),匯集該行業(yè)的業(yè)務(wù)目標(biāo); 確定子模塊,用于確定各業(yè)務(wù)目標(biāo)分別對應(yīng)的關(guān)聯(lián)關(guān)鍵詞; 設(shè)置子模塊,用于利用所述關(guān)聯(lián)關(guān)鍵詞為各業(yè)務(wù)目標(biāo)分別設(shè)置識別規(guī)則,以建立各業(yè)務(wù)目標(biāo)的業(yè)務(wù)模型初型; 訓(xùn)練子模塊,用于利用多個(gè)識別訓(xùn)練文本對所述各業(yè)務(wù)目標(biāo)的業(yè)務(wù)模型初型進(jìn)行訓(xùn)練,以完善各業(yè)務(wù)目標(biāo)的識別規(guī)則,從而成功建立各業(yè)務(wù)目標(biāo)的業(yè)務(wù)模型。
7.如權(quán)利要求6所述的分析裝置,其特征在于,所述識別規(guī)則包括:關(guān)聯(lián)關(guān)鍵詞以及關(guān)聯(lián)關(guān)鍵詞之間的邏輯關(guān)系,且所述邏輯關(guān)系包括:與、或、非以及鄰接邏輯關(guān)系中的至少一個(gè);其中,所述鄰接邏輯關(guān)系是指同時(shí)存在的兩個(gè)關(guān)聯(lián)關(guān)鍵詞之間的字符間隔距離滿足預(yù)定條件且這兩個(gè)關(guān)聯(lián)關(guān)鍵詞具有預(yù)定如后順序。
8.如權(quán)利要求7所述的分析裝置,其特征在于,所述識別規(guī)則應(yīng)滿足的條件包括: A、表征邏輯關(guān)系的符號為半角字符; B、一條識別規(guī)則必須具有表征開始的半角符號以及表征結(jié)束的半角符號; C、在一條識別規(guī)則中,除了非和鄰接邏輯關(guān)系之外的其他邏輯關(guān)系可以連續(xù)使用; D、在一條識別規(guī)則中,除了鄰接邏輯關(guān)系之外的其他邏輯關(guān)系可以相互嵌套,而鄰接邏輯關(guān)系只能被嵌套; E、在一條識別規(guī)則中,除了非邏輯關(guān)系之外的其他邏輯關(guān)系的優(yōu)先級應(yīng)顯式的使用表征優(yōu)先級的符號來表示; F、括號應(yīng)成對出現(xiàn); G、兩個(gè)前后相鄰的關(guān)聯(lián)關(guān)鍵詞之間應(yīng)具有表征邏輯關(guān)系的符號。
9.如權(quán)利要求6或7或8所述的分析裝置,其特征在于,所述訓(xùn)練子模塊包括: 第一單元,用于利用單個(gè)業(yè)務(wù)模型初型對多個(gè)識別訓(xùn)練文本進(jìn)行識別驗(yàn)證,以對所述多個(gè)識別訓(xùn)練文本進(jìn)行篩選; 第二單元,用于根據(jù)所述篩選的結(jié)果修正該單個(gè)業(yè)務(wù)模型初型; 第三單元,用于重復(fù)調(diào)用所述第一單元和第二單元,以逐個(gè)地對所有業(yè)務(wù)模型初型進(jìn)行修正; 第四單元,用于利用當(dāng)前修正后的所有業(yè)務(wù)模型初型對多個(gè)識別訓(xùn)練文本進(jìn)行識別驗(yàn)證,以獲得兩種識別訓(xùn)練文本,即不能被當(dāng)前修正后的所有業(yè)務(wù)模型初型識別驗(yàn)證的識別訓(xùn)練文本以及同時(shí)符合多個(gè)當(dāng)前修正后的業(yè)務(wù)模型初型的識別訓(xùn)練文本,并根據(jù)這兩種識別訓(xùn)練文本繼續(xù)修正相應(yīng)業(yè)務(wù)模型初型; 第五單元,用于重復(fù)調(diào)用所述第四單元,直到當(dāng)前獲得的兩種識別訓(xùn)練文本的數(shù)量與前次獲得的兩種識別訓(xùn)練文本的數(shù)量分別相同,從而成功建立各業(yè)務(wù)目標(biāo)的業(yè)務(wù)模型。
10.如權(quán)利要求6或7或8所述的分析裝置,其特征在于,所述獲取模塊包括: 語音識別子模塊,用于對語音通話進(jìn)行語音識別,以獲得該語音通話對應(yīng)的識別文本。
【文檔編號】G06Q10/06GK103699955SQ201310589864
【公開日】2014年4月2日 申請日期:2013年11月20日 優(yōu)先權(quán)日:2013年9月6日
【發(fā)明者】易中華, 伍球, 李瓊翔 申請人:安徽科大訊飛信息科技股份有限公司