汽車養(yǎng)護(hù)方向的智能溝通平臺的制作方法
【專利摘要】汽車養(yǎng)護(hù)方向的智能溝通平臺,屬于智能溝通領(lǐng)域,解決答案庫中存在問題解答的答案,但是,由于問題的表述問題,卻無法匹配該答案的問題,以此實(shí)現(xiàn),問題與答案的高度匹配,加快問題匹配速度。技術(shù)要點(diǎn)是,包括:提取關(guān)鍵字單元,建立汽車養(yǎng)護(hù)問題的答案庫,將答案庫中的客戶問題分詞,并提取得到關(guān)鍵字;近似詞匹配單元,汽車專業(yè)類語料庫作近似詞匹配,得到答案庫中關(guān)鍵字的多個(gè)近似詞,并計(jì)算得到關(guān)鍵字和近似詞的相似度;問答實(shí)施單元,自動(dòng)機(jī)器問答實(shí)施,對客戶問題分詞,并提取關(guān)鍵字,將提取的關(guān)鍵字匹配答案庫中的關(guān)鍵字,匹配成功時(shí)返回答案;匹配不成功時(shí),匹配關(guān)鍵字的近似詞,并重新匹配答案庫中的關(guān)鍵字。
【專利說明】
汽車養(yǎng)護(hù)方向的智能溝通平臺
技術(shù)領(lǐng)域
[0001] 本發(fā)明屬于智能溝通領(lǐng)域,涉及汽車養(yǎng)護(hù)問題的自動(dòng)機(jī)器問答溝通方法的建立和 應(yīng)用。
【背景技術(shù)】
[0002] 近年來,隨著汽車保有量的日益增多,汽車故障維修咨詢的需求也越來越大,傳統(tǒng) 汽車4S店由于其增長量遠(yuǎn)遠(yuǎn)不及汽車的增長量,導(dǎo)致服務(wù)不能到位,而且一些4S店存在不 誠信的行為,因此弊端日益凸顯。
[0003] 另外,汽車養(yǎng)護(hù)方向問題智能人機(jī)溝通技術(shù)的出現(xiàn),使得客戶問題可以被收集,組 織技術(shù)人員對客戶問題進(jìn)行解答,形成對應(yīng)于客戶問題的答案庫;經(jīng)過大量的調(diào)研,對問題 中的關(guān)鍵字進(jìn)行統(tǒng)計(jì),客戶問題往往集中于幾個(gè)方面,大部分的問題,可以在答案庫中尋求 答案,為了可以快速和精確的尋找問題答案,需要對答案庫進(jìn)行分詞和提取關(guān)鍵字;而往往 由于語言系統(tǒng)的龐大,客戶問題與答案庫中的關(guān)鍵字不對應(yīng),或者是用答案庫中關(guān)鍵字的 近似詞表示,這會降低答案的準(zhǔn)確率,存在這樣的情況,答案庫中存在問題解答的答案,但 是,由于問題的表述問題,卻無法匹配該答案。
【發(fā)明內(nèi)容】
[0004] 為了解決上述答案庫中存在問題解答的答案,但是,由于問題的表述問題,卻無法 匹配該答案的問題,本發(fā)明提供了一種汽車養(yǎng)護(hù)方向的智能溝通平臺,以此實(shí)現(xiàn),問題與答 案的高度匹配,加快問題匹配速度。
[0005] 為了實(shí)現(xiàn)上述目的,本發(fā)明技術(shù)方案的要點(diǎn)是:
[0006] -種汽車養(yǎng)護(hù)方向的智能溝通平臺,
[0007] 有益效果:本發(fā)明可及時(shí)有效地回答車主關(guān)于汽車養(yǎng)護(hù)方法的問題,并可擴(kuò)展到 故障及車輛保險(xiǎn)方面的問題的回答,問題匹配時(shí),匹配速度快,精度高,還可以在無法匹配 的情況下,進(jìn)行關(guān)鍵詞的近似詞匹配,增加了問題回答的范圍,避免了由于客戶表述問題差 異,導(dǎo)致的具有答案,卻無法匹配的問題。
【附圖說明】
[0008] 圖1是實(shí)施例中自動(dòng)機(jī)器問答實(shí)施步驟的流程圖。
【具體實(shí)施方式】
[0009] 實(shí)施例1: 一種汽車養(yǎng)護(hù)方向的智能溝通方法,包括如下步驟:
[0010] Sl.建立汽車養(yǎng)護(hù)問題的答案庫,將答案庫中的客戶問題分詞,并提取得到關(guān)鍵 字;
[0011] S2.汽車專業(yè)類語料庫作近似詞匹配,得到答案庫中關(guān)鍵字的多個(gè)近似詞,并計(jì)算 得到關(guān)鍵字和近似詞的相似度;
[0012] 其中,優(yōu)選汽車專業(yè)類語料庫作近似詞匹配的步驟是:通過神經(jīng)網(wǎng)絡(luò)的詞向量計(jì) 算模型,對汽車專業(yè)類語料庫做近似詞匹配,得到答案庫中關(guān)鍵字的多個(gè)近似詞,并通過余 弦相似度方法得到關(guān)鍵字和相似詞的相似度,將相似度最大的詞作為相似詞保留。
[0013] S3.自動(dòng)機(jī)器問答實(shí)施,對客戶問題分詞,并提取關(guān)鍵字,將提取的關(guān)鍵字匹配答 案庫中的關(guān)鍵字,匹配成功時(shí)返回答案;匹配不成功時(shí),匹配關(guān)鍵字的近似詞,并重新匹配 答案庫中的關(guān)鍵字。
[0014]其中,優(yōu)選自動(dòng)機(jī)器問答實(shí)施的步驟是:
[0015] 第一步:得到客戶問題,用基于隱馬定理的常規(guī)語言自然方法將客戶問題分詞;
[0016] 第二步:通過TF-IDF方法得到分詞里的關(guān)鍵字;
[0017]第三步:將客戶問題里的關(guān)鍵字與答案庫的關(guān)鍵字匹配,匹配成功則直接得到解 決問題的答案;
[0018] 第四步:第三步?jīng)]有匹配成功,則通過神經(jīng)網(wǎng)絡(luò)的詞向量計(jì)算模型得到客戶問題 里的關(guān)鍵字的近似詞再重新匹配答案庫關(guān)鍵字,直到得到解決問題的答案。
[0019] 作為本實(shí)施例優(yōu)選技術(shù)方案,所述客戶問題分詞,并提取關(guān)鍵字的方法是:
[0020] 第一步:計(jì)算詞頻;
[0021] 第二步:計(jì)算逆文檔頻率;
[0022] 第三步:計(jì)算TF-IDF。
[0023]該上述步驟的具體實(shí)現(xiàn)是:
[0024] 所述的計(jì)算詞頻的步驟是:
[0025] -個(gè)客戶問題出現(xiàn)了(&1,&2,^^)共!11個(gè)詞,每個(gè)詞在客戶問題中出現(xiàn)的頻率分別 為(111,112,"_111 11),則第:[(1<:[<111)個(gè)詞的詞頻1?為
(3. 2. 1)
[0026]
[0027] 所述的計(jì)算逆文檔頻率的步驟是:
[0028] 通過汽車專業(yè)類語料庫模擬語言使用環(huán)境,汽車專業(yè)類語料庫中的文檔總數(shù)為q, 包含所述的第i個(gè)詞的文檔總數(shù)為P,則詞ai的逆文檔頻率IDF為:
Γ ? (3. 2. 2)
[0029]
[0030] 所述計(jì)算TF-IDF的步驟是:
[0031] TF-IDF(ai) =TF(ai) X IDF(ai) (3.2.3)
[0032] 將TF-IDF算法,用于分詞和關(guān)鍵字提取,并協(xié)同于近似詞匹配,可以在加速匹配的 同時(shí),可以增加問題匹配的寬度;使得問題被解答的可能性增加,且避免了提高速度,卻犧 牲了準(zhǔn)確度的缺陷。
[0033] 實(shí)施例2: -種汽車養(yǎng)護(hù)方向的智能溝通裝置,包括:
[0034] 答案庫建立模塊,建立汽車養(yǎng)護(hù)問題的答案庫,將答案庫中的客戶問題分詞,并提 取得到關(guān)鍵字;
[0035] 近似詞匹配模塊,汽車專業(yè)類語料庫作近似詞匹配,得到答案庫中關(guān)鍵字的多個(gè) 近似詞,并計(jì)算得到關(guān)鍵字和近似詞的相似度;
[0036] 自動(dòng)機(jī)器問答實(shí)施模塊,自動(dòng)機(jī)器問答實(shí)施,對客戶問題分詞,并提取關(guān)鍵字,將 提取的關(guān)鍵字匹配答案庫中的關(guān)鍵字,匹配成功時(shí)返回答案;匹配不成功時(shí),匹配關(guān)鍵字的 近似詞,并重新匹配答案庫中的關(guān)鍵字。
[0037] 該裝置與實(shí)施例1中任意方法技術(shù)方案相對應(yīng),該裝置可用于執(zhí)行實(shí)施例1中所述 的任意種汽車養(yǎng)護(hù)方向的智能溝通平臺的技術(shù)方案。
[0038] 實(shí)施例3:本實(shí)施例記載了實(shí)施例1中的方法和實(shí)施例2中的裝置技術(shù)方案的形成 路線:
[0039] 3.1.大數(shù)據(jù)統(tǒng)計(jì)結(jié)果
[0040]在建立上述方法和裝置或者建立系統(tǒng)之前,我們針對幾千名奧迪車主的咨詢問題 做了大量細(xì)致的大數(shù)據(jù)分類研究,發(fā)現(xiàn)車主所提問題主要集中在表1所示的幾個(gè)方面:
[0042] 表1
[0043] 在上述提問中,76%的問題都可以通過技術(shù)經(jīng)理和專門的車險(xiǎn)行業(yè)專家所建立的 答案庫得到答案。
[0044] 3.2.建立答案庫
[0045] 通過對上千名車主問題的提取,我們組成了專門的解答團(tuán)隊(duì)做解答,形成了答案 庫,并通過TF-IDF算法提取了問題的關(guān)鍵詞,以方便下一階段機(jī)器自主回答技術(shù)的實(shí)現(xiàn)。如 表2所示:
[0047] TF-IDF算法步驟如下:
[0048]第一步:計(jì)算詞頻
[0049] 假設(shè)一個(gè)車主問題出現(xiàn)了(ai,a2,一am)共m個(gè)詞,每個(gè)詞在車主問題中出現(xiàn)的頻率 分別為(11 1,112,"_1〇,則第1(1<<111)個(gè)詞的詞頻了?為
(3. 2. 1)
[0050]
[00511第二步:計(jì)算逆文檔頻率
[0052]第二步中,我們通過一個(gè)汽車相關(guān)的語料庫,來模擬了語言的使用環(huán)境。
[0053]假設(shè),語料庫中的文檔總數(shù)為q,包含該詞的文檔總數(shù)為p,則詞的逆文檔頻率 IDF為
[0054] (3. 2. 2)
[0055] 通過3.2.2式可知,如果一個(gè)詞越常見,那么分母就越大,逆文檔頻率IDF(ai)就越 接近于0。
[0056] 第三步:計(jì)算TF-IDF
[0057] TF-IDF(ai) =TF(ai) X IDF(ai) (3.2.3)
[0058] 通過3.2.3式可以看到,TF-IDF與一個(gè)詞在文檔中的出現(xiàn)次數(shù)成正比,與該詞在整 個(gè)語言中的出現(xiàn)次數(shù)成反比。所以,自動(dòng)提取關(guān)鍵詞的算法就是計(jì)算出文檔的每個(gè)詞的TF-IDF值,然后按降序排列,取排在最前面的幾個(gè)詞做為關(guān)鍵詞。
[0059] 3.3.語料庫匹配近似詞
[0060]通過神經(jīng)網(wǎng)絡(luò)的詞向量計(jì)算模型,我們對汽車專業(yè)類語料庫做了近似詞匹配,得 到了答案庫中關(guān)鍵字的多個(gè)近似詞,并通過余弦相似度方法得到了關(guān)鍵字和相似詞的相似 度,將相似度最大的詞作為相似詞保留。如胎壓警告可以得到如表3所示的近似詞表,我們 保留"胎壓異常"作為"胎壓警告"的相似詞
[0062] 表 3
[0063] 3.4.自動(dòng)機(jī)器問答系統(tǒng)實(shí)施步驟
[0064] 第一步:得到客戶問題后,用基于隱馬定理的常規(guī)語言自然方法將客戶問題分詞; [0065]第二步:通過TF-IDF方法得到分詞里的關(guān)鍵詞;
[0066]第三步:將客戶問題里的關(guān)鍵詞與答案庫的關(guān)鍵字匹配,如果匹配成功則直接得 到解決方案;
[0067]第四步:如果第三步?jīng)]有匹配成功,則通過神經(jīng)網(wǎng)絡(luò)的詞向量計(jì)算模型得到關(guān)鍵 詞的近似詞再重新匹配答案庫關(guān)鍵字,得到解決方案。
[0068] 具體流程見圖1。針對實(shí)施例1和2的技術(shù)方案,基于大數(shù)據(jù)的統(tǒng)計(jì)結(jié)果,將傳統(tǒng)的 面對面問答模式由線下發(fā)展到線上,解決了 76%的客戶所提出的問題,滿足了車主的咨詢 需求,而且以機(jī)器回答為主的方式,也節(jié)省了車主的時(shí)間,同時(shí)減少了車主的經(jīng)濟(jì)支出。
[0069] 實(shí)施例4: 一種汽車養(yǎng)護(hù)方向的智能溝通系統(tǒng),包括:
[0070] 答案庫,所述答案庫具有汽車養(yǎng)護(hù)問題,答案庫中的客戶問題被分詞,并提取得到 客戶問題的關(guān)鍵字;
[0071 ]汽車專業(yè)類語料庫,為答案庫中關(guān)鍵字提供多個(gè)近似詞,并計(jì)算得到關(guān)鍵字和近 似詞的相似度;
[0072] 匹配庫,用于自動(dòng)機(jī)器問答實(shí)施,對客戶提出的問題分詞,并提取關(guān)鍵字,將提取 的關(guān)鍵字匹配答案庫中的關(guān)鍵字,匹配成功時(shí)返回答案;匹配不成功時(shí),匹配關(guān)鍵字的近似 詞,并重新匹配答案庫中的關(guān)鍵字。
[0073] 該系統(tǒng)與實(shí)施例1中任意方法技術(shù)方案相對應(yīng),該裝置可用于執(zhí)行實(shí)施例1中所述 的任意種汽車養(yǎng)護(hù)方向的智能溝通平臺的技術(shù)方案。
[0074]實(shí)施例5:-種TF-IDF算法在汽車養(yǎng)護(hù)方向的智能溝通系統(tǒng)或汽車養(yǎng)護(hù)方向的智 能溝通平臺中的應(yīng)用。其應(yīng)用過程,詳見實(shí)施例1-4,另,本實(shí)施例還公開了近似詞匹配和 TF-IDF算法協(xié)同在汽車養(yǎng)護(hù)方向的智能溝通系統(tǒng)或汽車養(yǎng)護(hù)方向的智能溝通平臺中的應(yīng) 用。
[0075] 實(shí)施例6:-種汽車養(yǎng)護(hù)方向的智能溝通平臺,包括
[0076] 提取關(guān)鍵字單元,建立汽車養(yǎng)護(hù)問題的答案庫,將答案庫中的客戶問題分詞,并提 取得到關(guān)鍵字;
[0077]近似詞匹配單元,汽車專業(yè)類語料庫作近似詞匹配,得到答案庫中關(guān)鍵字的多個(gè) 近似詞,并計(jì)算得到關(guān)鍵字和近似詞的相似度;
[0078] 問答實(shí)施單元,自動(dòng)機(jī)器問答實(shí)施,對客戶問題分詞,并提取關(guān)鍵字,將提取的關(guān) 鍵字匹配答案庫中的關(guān)鍵字,匹配成功時(shí)返回答案;匹配不成功時(shí),匹配關(guān)鍵字的近似詞, 并重新匹配答案庫中的關(guān)鍵字。
[0079] 本實(shí)施例所述的平臺,為計(jì)算機(jī)實(shí)現(xiàn)實(shí)施例1-5中所述的方法。
[0080] 所述提取關(guān)鍵字單元中,客戶問題分詞,并提取關(guān)鍵字的方法是:
[0081] 第一步:計(jì)算詞頻;
[0082] 第二步:計(jì)算逆文檔頻率;
[0083] 第三步:計(jì)算TF-IDF。
[0084]所述的計(jì)算詞頻的步驟是:
[0085] -個(gè)客戶問題出現(xiàn)了(&1,&2,^^)共!11個(gè)詞,每個(gè)詞在客戶問題中出現(xiàn)的頻率分別 為(111,112,"_111 11),則第:[(1<:[<111)個(gè)詞的詞頻1?為
(3.2.1):
[0086]
[0087] 所述的計(jì)算逆文檔頻率的步驟是:
[0088] 通過汽車專業(yè)類語料庫模擬語言使用環(huán)境,汽車專業(yè)類語料庫中的文檔總數(shù)為q, 包含所述的第i個(gè)詞的文檔總數(shù)為P,則詞ai的逆文檔頻率IDF為:
(3.2.2)
[0089]
[0090] 所述計(jì)算TF-IDF的步驟是:
[0091] TF-IDF(ai) =TF(ai) X IDF(ai) (3.2.3)
[0092] 所述近似詞匹配單元,汽車專業(yè)類語料庫作近似詞匹配的步驟是:通過神經(jīng)網(wǎng)絡(luò) 的詞向量計(jì)算模型,對汽車專業(yè)類語料庫做近似詞匹配,得到答案庫中關(guān)鍵字的多個(gè)近似 詞,并通過余弦相似度方法得到關(guān)鍵字和相似詞的相似度,將相似度最大的詞作為相似詞 保留。
[0093] 所述問答實(shí)施單元,自動(dòng)機(jī)器問答實(shí)施的步驟是:
[0094] 第一步:得到客戶問題,用基于隱馬定理的常規(guī)語言自然方法將客戶問題分詞; [0095]第二步:通過TF-IDF方法得到分詞里的關(guān)鍵字;
[0096]第三步:將客戶問題里的關(guān)鍵字與答案庫的關(guān)鍵字匹配,匹配成功則直接得到解 決問題的答案;
[0097]第四步:第三步?jīng)]有匹配成功,則通過神經(jīng)網(wǎng)絡(luò)的詞向量計(jì)算模型得到客戶問題 里的關(guān)鍵字的近似詞再重新匹配答案庫關(guān)鍵字,直到得到解決問題的答案。
[0098]以上所述,僅為本發(fā)明創(chuàng)造較佳的【具體實(shí)施方式】,但本發(fā)明創(chuàng)造的保護(hù)范圍并不 局限于此,任何熟悉本技術(shù)領(lǐng)域的技術(shù)人員在本發(fā)明創(chuàng)造披露的技術(shù)范圍內(nèi),根據(jù)本發(fā)明 創(chuàng)造的技術(shù)方案及其發(fā)明構(gòu)思加以等同替換或改變,都應(yīng)涵蓋在本發(fā)明創(chuàng)造的保護(hù)范圍之 內(nèi)。
【主權(quán)項(xiàng)】
1. 一種汽車養(yǎng)護(hù)方向的智能溝通平臺,其特征在于:包括 提取關(guān)鍵字單元,建立汽車養(yǎng)護(hù)問題的答案庫,將答案庫中的客戶問題分詞,并提取得 到關(guān)鍵字; 近似詞匹配單元,汽車專業(yè)類語料庫作近似詞匹配,得到答案庫中關(guān)鍵字的多個(gè)近似 詞,并計(jì)算得到關(guān)鍵字和近似詞的相似度; 問答實(shí)施單元,自動(dòng)機(jī)器問答實(shí)施,對客戶問題分詞,并提取關(guān)鍵字,將提取的關(guān)鍵字 匹配答案庫中的關(guān)鍵字,匹配成功時(shí)返回答案;匹配不成功時(shí),匹配關(guān)鍵字的近似詞,并重 新匹配答案庫中的關(guān)鍵字。2. 如權(quán)利要求1所述的汽車養(yǎng)護(hù)方向的智能溝通平臺,其特征在于,所述提取關(guān)鍵字單 元中,客戶問題分詞,并提取關(guān)鍵字的方法是: 第一步:計(jì)算詞頻; 第二步:計(jì)算逆文檔頻率; 第三步:計(jì)算TF-IDF。3. 如權(quán)利要求2所述的汽車養(yǎng)護(hù)方向的智能溝通平臺,其特征在于, 所述的計(jì)算詞頻的步驟是: 一個(gè)客戶問題出現(xiàn)了(ai,a2, 共m個(gè)詞,每個(gè)詞在客戶問題中出現(xiàn)的頻率分別為 (ni,n2,"_nm),則第i(l<i<m)個(gè)詞的詞頻TF為所述的計(jì)算逆文檔頻率的步驟是: 通過汽車專業(yè)類語料庫模擬語言使用環(huán)境,汽車專業(yè)類語料庫中的文檔總數(shù)為q,包含 所述的第i個(gè)詞的文檔總數(shù)為P,則詞ai的逆文檔頻率IDF為:所述計(jì)算TF-IDF的步驟是: TF-IDF(ai) =TF(ai) X IDF(ai) (3.2.3)。4. 如權(quán)利要求1或4所述的汽車養(yǎng)護(hù)方向的智能溝通平臺,其特征在于,所述近似詞匹 配單元,汽車專業(yè)類語料庫作近似詞匹配的步驟是:通過神經(jīng)網(wǎng)絡(luò)的詞向量計(jì)算模型,對汽 車專業(yè)類語料庫做近似詞匹配,得到答案庫中關(guān)鍵字的多個(gè)近似詞,并通過余弦相似度方 法得到關(guān)鍵字和相似詞的相似度,將相似度最大的詞作為相似詞保留。5. 如權(quán)利要求1或4所述的汽車養(yǎng)護(hù)方向的智能溝通平臺,其特征在于,所述問答實(shí)施 單元,自動(dòng)機(jī)器問答實(shí)施的步驟是: 第一步:得到客戶問題,用基于隱馬定理的常規(guī)語言自然方法將客戶問題分詞; 第二步:通過TF-IDF方法得到分詞里的關(guān)鍵字; 第三步:將客戶問題里的關(guān)鍵字與答案庫的關(guān)鍵字匹配,匹配成功則直接得到解決問 題的答案; 第四步:第三步?jīng)]有匹配成功,則通過神經(jīng)網(wǎng)絡(luò)的詞向量計(jì)算模型得到客戶問題里的 關(guān)鍵字的近似詞再重新匹配答案庫關(guān)鍵字,直到得到解決問題的答案。
【文檔編號】G06Q10/00GK106056220SQ201610363331
【公開日】2016年10月26日
【申請日】2016年5月27日
【發(fā)明人】田雨農(nóng), 董向前
【申請人】大連樓蘭科技股份有限公司