基于決策樹分類和故障碼分類的車輛遠(yuǎn)程診斷與備件檢索的方法
【專利摘要】基于決策樹分類和故障碼分類的車輛遠(yuǎn)程診斷與備件檢索的方法,屬于信息檢索領(lǐng)域,由于不同的備件在主組號相同的情況下,分組號仍有差異,為了能夠解決精確匹配備件的問題,技術(shù)要點(diǎn)是:對故障碼識別和分類;解析車輛VIN碼得到變量,所述變量包括由VIN碼解析得到的發(fā)動(dòng)機(jī)排量、車身類型、發(fā)動(dòng)機(jī)變速箱類型;對變量所對應(yīng)的備件代碼做決策樹分析,完成變量數(shù)據(jù)歸類形成備件信息,并建立索引,形成診斷知識庫;創(chuàng)建語言模型,建立細(xì)胞詞庫,在所述細(xì)胞詞庫中切詞檢索細(xì)胞詞,并排列所述細(xì)胞詞,利用決策樹模型的決策分類,形成故障碼對應(yīng)工項(xiàng)的診斷數(shù)據(jù)庫;將診斷數(shù)據(jù)庫與診斷知識庫關(guān)聯(lián),并建立主鍵;效果是:可在獲取故障碼后,快速找到常見故障的解決方案和對應(yīng)備件、工項(xiàng)。
【專利說明】
基于決策樹分類和故障碼分類的車輛遠(yuǎn)程診斷與備件檢索的 方法
技術(shù)領(lǐng)域
[0001] 本發(fā)明屬于信息檢索領(lǐng)域,涉及一種用于車輛遠(yuǎn)程診斷與備件檢索的方法
【背景技術(shù)】
[0002] 目前我國汽車維修行業(yè)已經(jīng)從完全依靠檢查者的感覺和實(shí)踐經(jīng)驗(yàn)進(jìn)行診斷的階 段,發(fā)展到了利用專門設(shè)備進(jìn)行綜合檢測診斷階段,但是在傳統(tǒng)汽車維修行業(yè)中普遍存在 著很多問題,比如維修工人技術(shù)老化,經(jīng)常無法快速、經(jīng)濟(jì)地利用各方面的技術(shù)力量解決故 障;隨著汽車保有量的日益增多,汽車后市場各項(xiàng)服務(wù)如雨后春筍般大量涌現(xiàn)。那么從車主 角度,如何才能更好更全面的了解車況,發(fā)生故障時(shí),如何快速獲取愛車待解決方案及所需 工時(shí)及備件相關(guān)信息,精準(zhǔn)的汽車可穿戴設(shè)備對滿足車主實(shí)時(shí)需求是完全必要的。一般的 0BD車載設(shè)備,只能讀取到相關(guān)車輛故障信息,不能對故障做出詳細(xì)解決方案及相關(guān)維修人 工費(fèi)、備件費(fèi),從而造成車主盲目進(jìn)店,盲目消費(fèi)。
【發(fā)明內(nèi)容】
[0003] 為了解決車主車輛出現(xiàn)故障時(shí),能夠準(zhǔn)確和快速匹配該故障碼所對應(yīng)的工項(xiàng)與備 件,本發(fā)明提出如下技術(shù)方案:一種基于決策樹分類和故障碼分類的車輛遠(yuǎn)程診斷與備件 檢索的方法,包括
[0004] 步驟一.采集車輛信息數(shù)據(jù);
[0005] 步驟二.對故障碼識別和分類;
[0006]步驟三.解析車輛VIN碼得到變量,所述變量包括由VIN碼解析得到的發(fā)動(dòng)機(jī)排量、 車身類型、發(fā)動(dòng)機(jī)變速箱類型;
[0007] 步驟四.對變量所對應(yīng)的備件代碼做決策樹分析,完成變量數(shù)據(jù)歸類形成備件信 息,并建立索引,形成診斷知識庫;
[0008] 步驟五.創(chuàng)建語言模型,建立細(xì)胞詞庫,在所述細(xì)胞詞庫中切詞檢索細(xì)胞詞,并排 列所述細(xì)胞詞,利用決策樹模型的決策分類,形成故障碼對應(yīng)工項(xiàng)的診斷數(shù)據(jù)庫;
[0009] 步驟六.將診斷數(shù)據(jù)庫與診斷知識庫關(guān)聯(lián),并建立主鍵;
[0010]步驟七.對車輛故障生成的故障碼識別,并通過關(guān)鍵字解析車輛VIN碼得到的變 量以進(jìn)行分類檢索,得到工項(xiàng)及備件信息。
[0011]有意效果:本發(fā)明可以在獲取故障碼后,快速找到常見故障的解決方案和對應(yīng)備 件、工項(xiàng)。有效解決技師和備件員的經(jīng)驗(yàn)局限性問題,從大數(shù)據(jù)出發(fā),獲得故障的解決方案。 本發(fā)明其具有對故障碼識別和分類的步驟,可以在不同車型間的故障碼出現(xiàn)差異時(shí),判斷 其一致性;且,本發(fā)明的步驟五構(gòu)建了一個(gè)從故障描述到詞向量分解,建立維修細(xì)胞詞庫; 通過故障描述在細(xì)胞詞庫的切詞檢索,依據(jù)細(xì)胞詞權(quán)重建立的句法規(guī)則,實(shí)現(xiàn)從決策過程 到?jīng)Q策建議再到維修解決方案的維修決策樹,最終實(shí)現(xiàn)故障遠(yuǎn)程診斷。
【附圖說明】
[0012]圖1為本發(fā)明用于車輛遠(yuǎn)程診斷與備件檢索的方法的流程圖;
[0013] 圖2為底盤號為LFV5A14B8Y3000001的車輛的VIN號碼翻譯示意圖。
【具體實(shí)施方式】
[0014] 實(shí)施例1: 一種基于決策樹分類和故障碼分類的車輛遠(yuǎn)程診斷與備件檢索的方法, 包括
[0015] 步驟一.采集車輛信息數(shù)據(jù);
[0016] 步驟二.對故障碼識別和分類;
[0017] 步驟三.解析車輛VIN碼得到變量,所述變量包括由VIN碼解析得到的發(fā)動(dòng)機(jī)排量、 車身類型、發(fā)動(dòng)機(jī)變速箱類型;
[0018] 步驟四.對變量所對應(yīng)的備件代碼做決策樹分析,完成變量數(shù)據(jù)歸類形成備件信 息,并建立索引,形成診斷知識庫;
[0019] 步驟五.創(chuàng)建語言模型,建立細(xì)胞詞庫,在所述細(xì)胞詞庫中切詞檢索細(xì)胞詞,并排 列所述細(xì)胞詞,利用決策樹模型的決策分類,形成故障碼對應(yīng)工項(xiàng)的診斷數(shù)據(jù)庫;
[0020] 步驟六.將診斷數(shù)據(jù)庫與診斷知識庫關(guān)聯(lián),并建立主鍵;
[0021] 步驟七.對車輛故障生成的故障碼識別,并通過關(guān)鍵字進(jìn)行分類檢索,得到工項(xiàng)及 備件信息。
[0022] 實(shí)施例2 :具有與實(shí)施例1相同的技術(shù)方案,更為具體的,對于實(shí)施例1的步驟四來 說,
[0023] 所述步驟四中以維修備件表的歷史記錄為數(shù)據(jù)基礎(chǔ),通過決策樹模型對備件做 分類,維修備件表樣例如表一所不:
[0024] 表一
[0026] 決策樹模型的基本原理如下:
[0027] 首先:確定每一維度備件不同分類的熵,以VIN4為例,熵定義為
[0028] E = sum(_p(I)*log(p(I)))
[0029] 其中I = 1: N(N類結(jié)果,如本例1種,即該備件屬于此車型,故概率P( I) = 1)
[0030] 則E(5)=-( 1/1 )Log2( 1/1 )-(0/l)Log2(0/l )=0+0 = 0
[0031] E(3) =-( 1/1 )Log2( 1/1 )-(0/l)Log2(0/l )=0+0 = 0
[0032] E(4) =-( 1/1 )Log2( 1/1 )-(0/l)Log2(0/l )=0+0 = 0 [0033]如果熵為0,則表明區(qū)分度越高;熵為1,則表明沒有區(qū)分度;
[0034] 故這三個(gè)不同的備件代碼可以通過VIN4做區(qū)分。
[0035]確定完每個(gè)維度如何分類后,不同維度之間的優(yōu)先級別通過信息增益區(qū)分Gain (Sample,Action) = E(sample)_sum( | Sample(v) | /Sample*E(Sample(v)))則Gain(VIM)= E(S)-(l/3)*E(5)-(l/3)*E(3)-(l/3)*E(4) = l-0 = lGain(VIN6)=E(S)-(l/3)*E(l)-(2/ 3)*E(2) = l-0-2/3=l/3Gain(VIN78)=E(S)-(l/3)*E(4B)-(l/3)*E(8K)-(l/3)*E(4F) = 1-0 = 1
[0036]如果信息增益越大,則表明分類優(yōu)先級越高;反之,優(yōu)先級越低。
[0037]所以,底盤號第4位(VIN4)和底盤號78位(VIN78)的分類優(yōu)先級相同,其次是底盤 號第6位(VIN6)。
[0038] 通過以上關(guān)鍵步驟,可將備件代碼按照底盤號第4位(VIN4)、底盤號第6位(VIN6) 和底盤號78位(VIN78)區(qū)分。
[0039] 綜上所述,備件檢索方法的基本步驟是:
[0040] 將維修備件表同一維度按信息熵做區(qū)分;
[0041 ]將維修備件表不同維度按信息增益劃分優(yōu)先級;
[0042]按照1、2步劃分的優(yōu)先級和區(qū)分程度畫出決策樹;
[0043] 輸入一個(gè)規(guī)則的底盤號,系統(tǒng)根據(jù)¥預(yù)123、¥1財(cái)、¥預(yù)6、¥預(yù)78以及得出的決策樹輸 出該車型下的備件代碼。
[0044] 該備件代碼通過關(guān)聯(lián)備件價(jià)格表,得到備件的中文名稱、價(jià)格和現(xiàn)在使用狀態(tài)以 及備件的適用車型信息。
[0045] 上述技術(shù)方案的獲得,是在將不同車型、不同排量、不同發(fā)動(dòng)機(jī)變速箱類型所對應(yīng) 的備件代碼逐一歸類進(jìn)行分析對比后,發(fā)現(xiàn)在相同主組號前提下,車型排量等信息不同,所 對應(yīng)的備件代碼也不盡相同,為了找尋其中規(guī)律,使用了上述方法,以形成較完備且全面的 理論知識信息庫。
[0046] 實(shí)施例3:具有與實(shí)施例1或2相同的技術(shù)方案,更為具體的,對于實(shí)施例1的步驟五 來說,
[0047] 所述步驟五中的創(chuàng)建語言模型,建立細(xì)胞詞庫包含如下步驟:
[0048] S1.1采集專業(yè)故障描述語言;
[0049] S1.2對所述專業(yè)故障描述語言進(jìn)行詞向量分解。
[0050] 所述語言模型的創(chuàng)建基于第n個(gè)所述細(xì)胞詞的出現(xiàn)只與前面n-1個(gè)所述細(xì)胞詞相 關(guān)的假設(shè);所述一故障描述語句T出現(xiàn)權(quán)重的計(jì)算公式為:
[0051] P(T) =P(W1,W2,W3, ,Wn)
[0052] =P(W1) XP(W2 I Wl) XP(W3 I W1,W2) X …XP(Wn| W1,W2,…,Wn-1)
[0053] ~P(W1) XP(W2 I Wl) XP(W3 I W2)…P(Wn I Wn-1);
[0054] 其中,P⑴為所述故障描述語句T的權(quán)重,P(wn| wi,W2, ???,wn-i)為第n個(gè)所述細(xì)胞詞 的權(quán)重。
[0055] 所述步驟五中的細(xì)胞詞庫中切詞檢索細(xì)胞詞,并排列所述細(xì)胞詞的步驟是:
[0056] S2.1針對所述一故障描述語句T在所述細(xì)胞詞庫中進(jìn)行切詞檢索;
[0057] S2.2若檢索到所述細(xì)胞詞,計(jì)算所述細(xì)胞詞的權(quán)重;
[0058] S2.3按照所述細(xì)胞詞權(quán)重的大小排列所述細(xì)胞詞。
[0059] S2.4若沒有檢索到所述細(xì)胞詞,則將此次未檢索到的所述細(xì)胞詞存入新增細(xì)胞詞 庫。
[0060]所述S2.2步驟中所述細(xì)胞詞權(quán)重的計(jì)算方法為:
[0061 ] S2.2.1計(jì)算每個(gè)所述細(xì)胞詞的卡方統(tǒng)計(jì)量;
[0062] S2.2.2取所述卡方統(tǒng)計(jì)量分值最高的第i個(gè)細(xì)胞詞,計(jì)算所述第i個(gè)細(xì)胞詞在第j 個(gè)故障描述中出現(xiàn)的次數(shù);所述S2.2.1步驟所述卡方統(tǒng)計(jì)量分值的計(jì)算方法為:
[0063] weight = round( (10 X (l+lg(tfij))/(l+lg(lj))),n);
[0064] 其中tfij為第i個(gè)細(xì)胞詞在第j個(gè)故障描述中出現(xiàn)的次數(shù),lj為第j個(gè)故障描述的長 度,n為3-6的整數(shù)。
[0065] 利用決策樹模型的決策分類,形成故障碼對應(yīng)工項(xiàng)的診斷數(shù)據(jù)庫,該步驟中,還包 括結(jié)合元器件測量值給出維修解決方案(工項(xiàng))。
[0066]更為具體的,
[0067]本實(shí)施例通過將自然語言數(shù)字化達(dá)成將自然語言理解的問題轉(zhuǎn)化為機(jī)器自學(xué)習(xí) 的問題。
[0068] (1)構(gòu)建基礎(chǔ)語料庫
[0069] 創(chuàng)建基礎(chǔ)語料庫的方法為給定一個(gè)字符串,它的自然語言的概率是P(wl,w2, w3,…,wn),wl到wn依次是這句話的各個(gè)細(xì)胞詞。
[0070] 模型基于這樣一種假設(shè),第n個(gè)詞的出現(xiàn)只與前面n-1個(gè)詞相關(guān),而與其它任何詞 都不相關(guān),整句的概率就是各個(gè)分詞出現(xiàn)概率的乘積。
[0071] 對于一個(gè)故障描述T,它的概率計(jì)算公式為:
[0072] P(T) =P(wi,W2,W3, ,Wn)
[0073] =P(W1) XP(W2 I Wl) XP(W3 I W1,W2) X …XP(Wn| W1,W2,…,Wn-1)
[0074] ~P(W1) XP(W2 I Wl) XP(W3 I W2)…P(Wn I Wn-1)
[0075] (2)詞向量分解:詞向量為切分成若干個(gè)細(xì)胞詞后的語句。每個(gè)故障描述T都可表 示成n維的詞向量,T=(wi,W2, . . .,wn),其中wi到wn為各個(gè)詞向量中包含的各個(gè)細(xì)胞詞。 [0076]以汽車故障為例:
[0077]故障描述為:
[0078] P0021 A凸輪軸位置(氣缸列2)_正時(shí)過度超前
[0079] 以詞向量表示上述故障描述語句,上述故障描述語句可以用詞向量(Wl,W2,W3,…, Wn)。其中,W1為凸輪軸,W2為位置,W3為氣缸,W4為正時(shí),W5為過度。選取各個(gè)細(xì)胞詞作為特征 項(xiàng),其中Wi表示第i個(gè)特征項(xiàng)。
[0080] 算出各個(gè)細(xì)胞詞的卡方統(tǒng)計(jì)量,然后在訓(xùn)練集中取分值最高的第i個(gè)細(xì)胞詞作為 代表詞,從而找出與詞向量(¥1,'\¥2,'?3,一,'?〇相關(guān)性最小的細(xì)胞詞。
[0081] Wi的權(quán)重的計(jì)算公式為:
[0082] weight = round( (10 X (l+lg(tfij))/(l+lg(lj))),3);
[0083]其中tfij為第i個(gè)詞向量在第j個(gè)故障描述中出現(xiàn)的次數(shù),lj為第j個(gè)故障描述的長 度。Round函數(shù)四舍五入到指定的小數(shù)位,在上式中為小數(shù)點(diǎn)后第三位。
[0084]計(jì)算權(quán)重之后的故障描述詞向量的特征表述為:
[0086] (1)檢索排列細(xì)胞詞:
[0087] 如圖1所示,當(dāng)用戶輸入故障描述T后,首先對故障描述T進(jìn)行詞向量分解將完整語 句切分成多個(gè)細(xì)胞詞的組合。然后針對各個(gè)細(xì)胞詞,在細(xì)胞詞庫中進(jìn)行切詞檢索。如果檢索 到了,則計(jì)算該細(xì)胞詞的權(quán)重;如果沒有檢索到,則將此次未檢索到的細(xì)胞詞存入新增行業(yè) 細(xì)胞詞庫,再針對剩余細(xì)胞詞進(jìn)行檢索,計(jì)算其概率。
[0088] 根據(jù)在細(xì)胞詞庫中檢索到的各個(gè)細(xì)胞詞并計(jì)算權(quán)重,按照權(quán)重從大到小排列細(xì)胞 。
[0089] (2)分析結(jié)果:
[0090] 以汽車故障為例:
[0091] 故障描述為:
[0092] P0021 A凸輪軸位置(氣缸列2)_正時(shí)過度超前
[0093]在細(xì)胞詞庫中檢索到的各個(gè)細(xì)胞詞并計(jì)算權(quán)重,按照權(quán)重從大到小排列細(xì)胞詞:
[0095] (3)使用判別分析法:
[0096] 故障描述T的詞向量序列為T=(wl,w2,w3, . . .,wn),故障描述T中每個(gè)細(xì)胞詞計(jì)算 權(quán)重后的序列為3=(81,82, 83,...,811)。詞向量分類匹配最大概率的計(jì)算公式為:¥ = argmaxP(S|T)〇
[0097] 按照詞向量分類匹配最大概率從高到低排列的句法規(guī)則進(jìn)行分級:
[0099] (4)決策樹分析
[0100] 根據(jù)上述句法規(guī)則針對細(xì)胞詞分級的結(jié)果建立決策樹。
[0101] 分類模型1
[0102] 如圖2所示,凸輪軸為一級,位置、轉(zhuǎn)換、調(diào)節(jié)為二級,傳感器、促動(dòng)器、響應(yīng)、正時(shí)、 排氣為三級。相對應(yīng)的解決方案分別是:傳感器對應(yīng)凸輪軸位置傳感器、發(fā)動(dòng)機(jī)線束和發(fā)動(dòng) 機(jī)控制單元,促動(dòng)器對應(yīng)發(fā)動(dòng)機(jī)線束、發(fā)動(dòng)機(jī)控制單元和凸輪軸調(diào)節(jié)器,正時(shí)對應(yīng)發(fā)動(dòng)機(jī)線 束、發(fā)動(dòng)機(jī)控制單元、凸輪軸調(diào)節(jié)器、凸輪軸張緊器和正時(shí)鏈條,以此類推。粗箭頭指向的解 決方案表示需要更換此配件的概率遠(yuǎn)大于更換其他細(xì)箭頭指向的配件的概率,此概率為根 據(jù)大量維修數(shù)據(jù)而預(yù)先設(shè)定入決策樹模型中的。因此,通過對故障描述"凸輪軸位置(氣缸 列2)-正時(shí)過度超前"進(jìn)行詞向量分解并在細(xì)胞詞庫中進(jìn)行檢索,得到凸輪軸、位置和正時(shí) 三個(gè)細(xì)胞詞,經(jīng)計(jì)算細(xì)胞詞權(quán)重并根據(jù)句法規(guī)則對細(xì)胞詞進(jìn)行排列得出凸輪軸位于一級, 位置位于二級,正時(shí)位于三級。經(jīng)過決策樹模型的決策分類,得出最有可能的維修解決方案 為更換或維修凸輪軸張緊器。
[0103] 分類模型2
[0104] 對故障描述語句"凸輪軸位置傳感器= > 傳感器不可信信號"進(jìn)行詞向量分解并在 細(xì)胞詞庫中檢索,得到凸輪軸、位置、傳感器三個(gè)細(xì)胞詞。針對三個(gè)細(xì)胞詞計(jì)算細(xì)胞詞權(quán)重 并根據(jù)句法規(guī)則對細(xì)胞詞進(jìn)行排列得出凸輪軸位于一級,位置位于二級,傳感器位于三級。 再結(jié)合元器件測量值,判斷需要更換的配件。首先檢查電線插頭有無接觸不良,針頭彎曲。 如果是,則需要更換電線插頭。如果否,則進(jìn)入下一級決策樹,檢查凸輪軸傳感器電壓供應(yīng) 是否在4.5-5.5V之間。如果是則檢查發(fā)動(dòng)機(jī)控制單元的信號電壓,是否在4.5-5.5V之間。如 果否則需要更換發(fā)動(dòng)機(jī)線束。以此類推,經(jīng)過決策樹模型的決策分類結(jié)合元器件測量值,給 出維修解決方案。
[0105] 本實(shí)施例可以遠(yuǎn)程并快速地識別設(shè)備的故障,準(zhǔn)確的給出有效維修解決方案。檢 測標(biāo)準(zhǔn)統(tǒng)一,避免由于人工判斷帶來的誤差。并且節(jié)省了大量人力物力。
[0106] 實(shí)施例四:具有與實(shí)施例1或2或3相同的技術(shù)方案,更為具體的,對于實(shí)施例1的步 驟二來說,
[0107] 所述對故障碼識別和分類的方法,包括:
[0108] 首先利用訓(xùn)練數(shù)據(jù)集構(gòu)建樸素貝葉斯分類器,具體步驟為:
[0109] S1:對訓(xùn)練集中的故障碼進(jìn)行人工分類,人工分類后的類別集為c:
[0110] C= {ci,C2,…,Ci,…,cn};
[0111] S2:將每個(gè)類別中的故障碼進(jìn)行分詞并計(jì)算每個(gè)詞的TF-IDF權(quán)重值;
[0113] TFiS特征詞i的詞頻;^為特征詞i在所有故障碼中出現(xiàn)的次數(shù),表示故障碼 中所有特征詞的出現(xiàn)次數(shù)總和;
[0115] IDFi為特征詞i的逆向文件頻率;E為語料庫中故障碼的總數(shù),{k:Wi G ek}表示包含 特征詞i的故障碼數(shù);
[0116] TF-IDF權(quán)重值為:TF-IDF = TF X IDF,也就是是詞頻與逆向文件頻率的乘積;
[0117] S3:根據(jù)TF-IDF權(quán)重值篩選出特征詞并建立特征詞庫,將故障碼e定義成若干個(gè)特 征詞的集合:
[0118] e= {wi,W2,…,Wn}
[0119] S4:分別計(jì)算每個(gè)類別中特征詞在該類別條件下的條件概率,依據(jù)貝葉斯定理計(jì) 算出某個(gè)故障碼e屬于Cl類故障的概率,具體公式如下:
[0120] P(ci|e) = [P(e|ci)P(ci)]/P(e)
[0121] 其中,P(e)為從故障碼空間中隨機(jī)抽取一個(gè)故障碼e的概率;P(Cl)為一個(gè)故障碼 類別Cl在故障碼空間所占比率;P(e| Cl)為對于給定的故障碼類別(^中故障碼e的出現(xiàn)概率;
[0122] 對于每個(gè)故障碼類別而言,從故障碼空間中隨機(jī)抽取一個(gè)故障碼的概率都是一樣 的,因此P(e)可以忽略不予計(jì)算,這樣公式(1)就可以寫成如下形式:
[0123] P(ci | e) °cP(e | Ci)P(Ci)
[0124] 計(jì)算某個(gè)故障碼在每個(gè)分類中概率,取擁有最大概率值的類別為該故障碼的分類 結(jié)果,具體為:
[0125] G(e) =argmax{P(e | Ci)P(ci)} 〇
[0126] S5:構(gòu)建樸素貝葉斯分類器。
[0127] 然后對新故障碼進(jìn)行具體分類,具體為:
[0128] 更具體的,對新故障碼進(jìn)行具體分類,設(shè)在類別i中的故障碼為ei,同時(shí)還有個(gè)待 匹配的故障碼enew,它們的分詞情況如下:
[0129] ei= {W1,W2,W3,W4}
[0130] enew= {w2,W3,W5}
[0131 ]步驟1:由這兩組的特征詞集合構(gòu)成一個(gè)向量空間:
[0133]步驟2:結(jié)合向量空間,分別得到兩個(gè)故障碼的詞向量值:
[0136]步驟3:利用余弦相似度計(jì)算兩個(gè)故障碼近似情況,具體公式如下:
[0138] 步驟4:如果所計(jì)算的相似度值大于80%,則可以判斷這兩個(gè)故障碼是相同的;如 果所計(jì)算的相似度值小于閾值,則繼續(xù)與已知故障碼庫中的其他類別故障碼進(jìn)行余弦相似 度計(jì)算。
[0139] 采用以上技術(shù)方法,能夠取得如下的技術(shù)效果:準(zhǔn)確地自動(dòng)分類不同車型的故障 碼,將數(shù)以億級的故障碼進(jìn)行收斂,實(shí)現(xiàn)不同車廠車型間故障問題、解決方案的探索。能節(jié) 省大量的勞動(dòng)力,縮短工作周期,降低成本。
[0140]以上所述,僅為本發(fā)明創(chuàng)造較佳的【具體實(shí)施方式】,但本發(fā)明創(chuàng)造的保護(hù)范圍并不 局限于此,任何熟悉本技術(shù)領(lǐng)域的技術(shù)人員在本發(fā)明創(chuàng)造披露的技術(shù)范圍內(nèi),根據(jù)本發(fā)明 創(chuàng)造的技術(shù)方案及其發(fā)明構(gòu)思加以等同替換或改變,都應(yīng)涵蓋在本發(fā)明創(chuàng)造的保護(hù)范圍之 內(nèi)。
【主權(quán)項(xiàng)】
1. 一種基于決策樹分類和故障碼分類的車輛遠(yuǎn)程診斷與備件檢索的方法,其特征在 于,包括 步驟一.采集車輛信息數(shù)據(jù); 步驟二.對故障碼識別和分類; 步驟三.解析車輛VIN碼得到變量,所述變量包括由VIN碼解析得到的發(fā)動(dòng)機(jī)排量、車身 類型、發(fā)動(dòng)機(jī)變速箱類型; 步驟四.對變量所對應(yīng)的備件代碼做決策樹分析,完成變量數(shù)據(jù)歸類形成備件信息,并 建立索引,形成診斷知識庫; 步驟五.創(chuàng)建語言模型,建立細(xì)胞詞庫,在所述細(xì)胞詞庫中切詞檢索細(xì)胞詞,并排列所 述細(xì)胞詞,利用決策樹模型的決策分類,形成故障碼對應(yīng)工項(xiàng)的診斷數(shù)據(jù)庫; 步驟六.將診斷數(shù)據(jù)庫與診斷知識庫關(guān)聯(lián),并建立主鍵; 步驟七.對車輛故障生成的故障碼識別,并通過關(guān)鍵字解析車輛VIN碼得到的變量以進(jìn) 行分類檢索,得到工項(xiàng)及備件信息。2. 如權(quán)利要求1所述的基于決策樹分類和故障碼分類的車輛遠(yuǎn)程診斷與備件檢索的方 法,其特征在于,所述步驟四中以維修備件表的歷史記錄為數(shù)據(jù)基礎(chǔ),通過決策樹模型對備 件做分類; 備件檢索方法的步驟是: (1) 將維修備件表同一維度按信息熵做區(qū)分; (2) 將維修備件表不同維度按信息增益劃分優(yōu)先級; (3) 按照步驟(1)、(2)劃分的優(yōu)先級和區(qū)分程度畫出決策樹; (4) 輸入一個(gè)規(guī)則的VIN碼,根據(jù)VIN碼以及得出的決策樹輸出該車型下的備件代碼。3. 如權(quán)利要求2所述的基于決策樹分類和故障碼分類的車輛遠(yuǎn)程診斷與備件檢索的方 法,其特征在于,所述備件代碼關(guān)聯(lián)備件的價(jià)格表,所述備件信息包括備件的中文名稱、價(jià) 格和現(xiàn)在使用狀態(tài)以及備件的適用車型信息。4. 如權(quán)利要求1所述的基于決策樹分類和故障碼分類的車輛遠(yuǎn)程診斷與備件檢索的方 法,其特征在于,所述步驟五中的創(chuàng)建語言模型,建立細(xì)胞詞庫包含如下步驟: S1.1采集專業(yè)故障描述語言; S1.2對所述專業(yè)故障描述語言進(jìn)行詞向量分解。5. 如權(quán)利要求4所述的基于決策樹分類和故障碼分類的車輛遠(yuǎn)程診斷與備件檢索的方 法,其特征在于:所述語言模型的創(chuàng)建基于第n個(gè)所述細(xì)胞詞的出現(xiàn)只與前面n-1個(gè)所述細(xì) 胞詞相關(guān)的假設(shè);所述一故障描述語句T出現(xiàn)權(quán)重的計(jì)算公式為: P(T)=P(wi,W2,W3,-- - ,Wn) = P(W1) XP(W2 | Wl) XP(W3 | W1,W2) X …XP(Wn | W1,W2,…,Wn-1) ~P(W1) XP(W2 | Wl) XP(W3 | W2)…P(Wn| Wn-1); 其中,P ( T )為所述故障描述語句T的權(quán)重,P ( Wn I Wl,W2,???,Wn-1)為第n個(gè)所述細(xì)胞詞的權(quán) 重。6. 如權(quán)利要求1所述的基于決策樹分類和故障碼分類的車輛遠(yuǎn)程診斷與備件檢索的方 法,其特征在于,所述步驟五中的細(xì)胞詞庫中切詞檢索細(xì)胞詞,并排列所述細(xì)胞詞的步驟 是: S2.1針對所述一故障描述語句T在所述細(xì)胞詞庫中進(jìn)行切詞檢索; S2.2若檢索到所述細(xì)胞詞,計(jì)算所述細(xì)胞詞的權(quán)重; S2.3按照所述細(xì)胞詞權(quán)重的大小排列所述細(xì)胞詞。7. 如權(quán)利要求6所述的基于決策樹分類和故障碼分類的車輛遠(yuǎn)程診斷與備件檢索的方 法,其特征在于, S2.2.1計(jì)算每個(gè)所述細(xì)胞詞的卡方統(tǒng)計(jì)量; S2.2.2取所述卡方統(tǒng)計(jì)量分值最高的第i個(gè)細(xì)胞詞,計(jì)算所述第i個(gè)細(xì)胞詞在第j個(gè)故 障描述中出現(xiàn)的次數(shù);所述S2.2.1步驟所述卡方統(tǒng)計(jì)量分值的計(jì)算方法為: weight = round( (10 X (l+lg(tfij))/(l+lg( lj))) ,n); 其中tfij為第i個(gè)細(xì)胞詞在第j個(gè)故障描述中出現(xiàn)的次數(shù),lj為第j個(gè)故障描述的長度,n 為3-6的整數(shù)。8. 如權(quán)利要求1所述的基于決策樹分類和故障碼分類的車輛遠(yuǎn)程診斷與備件檢索的方 法,其特征在于,所述對故障碼識別和分類的方法,包括: 首先利用訓(xùn)練數(shù)據(jù)集構(gòu)建樸素貝葉斯分類器; 然后對新故障碼進(jìn)行具體分類; 構(gòu)建樸素貝葉斯分類器的步驟為: S1:對訓(xùn)練集中的故障碼進(jìn)行人工分類; S2:將每個(gè)類別中的故障碼進(jìn)行分詞并計(jì)算每個(gè)詞的TF-IDF權(quán)重值; S3:根據(jù)TF-IDF權(quán)重值篩選出特征詞并建立特征詞庫; S4:分別計(jì)算每個(gè)類別中特征詞在該類別條件下的條件概率; S5:構(gòu)建樸素貝葉斯分類器。9. 如權(quán)利要求8所述的基于決策樹分類和故障碼分類的車輛遠(yuǎn)程診斷與備件檢索的方法,其特征在于,步驟S2中的 TFiS特征詞i的詞頻;^為特征詞i在所有故障 ). 碼中出現(xiàn)的次數(shù),EjWj表示故障碼中所有特征詞的出現(xiàn)次數(shù)總和;IDFi為特征詞i的逆向文件頻率;E為語料 j 庫中故障碼的總數(shù),{k:WlGek}表示包含特征詞i的故障碼數(shù); 步驟S2中的TF-IDF權(quán)重值為: TF-IDF = TFXIDF TF-IDF權(quán)重值是詞頻與逆向文件頻率的乘積。10. 如權(quán)利要求8所述的基于決策樹分類和故障碼分類的車輛遠(yuǎn)程診斷與備件檢索的 方法,其特征在于,對新故障碼進(jìn)行具體分類,設(shè)在類別i中的故障碼為 ei,同時(shí)還有個(gè)待匹 配的故障碼enew: 步驟1:由這兩組的特征詞集合構(gòu)成一個(gè)向量空間: 步驟2:結(jié)合向量空間,分別得到兩個(gè)故障碼的詞向量值: 步驟3:利用余弦相似度計(jì)算兩個(gè)故障碼近似情況; 步驟4:如果所計(jì)算的相似度值大于閾值,則可以判斷這兩個(gè)故障碼是相同的;如果所 計(jì)算的相似度值小于閾值,則繼續(xù)與已知故障碼庫中的其他類別故障碼進(jìn)行余弦相似度計(jì) 算;步驟S3中判斷兩個(gè)故障碼近似情況,具體公式如下:
【文檔編號】G05B23/02GK106054858SQ201610365652
【公開日】2016年10月26日
【申請日】2016年5月27日
【發(fā)明人】田雨農(nóng), 劉亮
【申請人】大連樓蘭科技股份有限公司