基于決策樹(shù)分類(lèi)的故障碼診斷車(chē)輛工項(xiàng)與備件檢索方法
【專(zhuān)利摘要】基于決策樹(shù)分類(lèi)的故障碼診斷車(chē)輛工項(xiàng)與備件檢索方法,屬于信息檢索領(lǐng)域,由于不同的備件在主組號(hào)相同的情況下,分組號(hào)仍有差異,為了能夠解決精確匹配備件的問(wèn)題,技術(shù)要點(diǎn)是:解析車(chē)輛VIN碼得到變量,所述變量包括由VIN碼解析得到的發(fā)動(dòng)機(jī)排量、車(chē)身類(lèi)型、發(fā)動(dòng)機(jī)變速箱類(lèi)型;對(duì)變量所對(duì)應(yīng)的備件代碼做決策樹(shù)分析,完成變量數(shù)據(jù)歸類(lèi)形成備件信息,并建立索引,形成診斷知識(shí)庫(kù);創(chuàng)建語(yǔ)言模型,建立細(xì)胞詞庫(kù),在所述細(xì)胞詞庫(kù)中切詞檢索細(xì)胞詞,并排列所述細(xì)胞詞,利用決策樹(shù)模型的決策分類(lèi),形成故障碼對(duì)應(yīng)工項(xiàng)的診斷數(shù)據(jù)庫(kù);將診斷數(shù)據(jù)庫(kù)與診斷知識(shí)庫(kù)關(guān)聯(lián),并建立主鍵;效果是:可在獲取故障碼后,快速找到常見(jiàn)故障的解決方案和對(duì)應(yīng)備件、工項(xiàng)。
【專(zhuān)利說(shuō)明】
基于決策樹(shù)分類(lèi)的故障碼診斷車(chē)輛工項(xiàng)與備件檢索方法
技術(shù)領(lǐng)域
[0001] 本發(fā)明屬于信息檢索領(lǐng)域,涉及一種用于車(chē)輛遠(yuǎn)程診斷與備件檢索的方法
【背景技術(shù)】
[0002] 目前我國(guó)汽車(chē)維修行業(yè)已經(jīng)從完全依靠檢查者的感覺(jué)和實(shí)踐經(jīng)驗(yàn)進(jìn)行診斷的階 段,發(fā)展到了利用專(zhuān)門(mén)設(shè)備進(jìn)行綜合檢測(cè)診斷階段,但是在傳統(tǒng)汽車(chē)維修行業(yè)中普遍存在 著很多問(wèn)題,比如維修工人技術(shù)老化,經(jīng)常無(wú)法快速、經(jīng)濟(jì)地利用各方面的技術(shù)力量解決故 障;隨著汽車(chē)保有量的日益增多,汽車(chē)后市場(chǎng)各項(xiàng)服務(wù)如雨后春筍般大量涌現(xiàn)。那么從車(chē)主 角度,如何才能更好更全面的了解車(chē)況,發(fā)生故障時(shí),如何快速獲取愛(ài)車(chē)待解決方案及所需 工時(shí)及備件相關(guān)信息,精準(zhǔn)的汽車(chē)可穿戴設(shè)備對(duì)滿足車(chē)主實(shí)時(shí)需求是完全必要的。一般的 0BD車(chē)載設(shè)備,只能讀取到相關(guān)車(chē)輛故障信息,不能對(duì)故障做出詳細(xì)解決方案及相關(guān)維修人 工費(fèi)、備件費(fèi),從而造成車(chē)主盲目進(jìn)店,盲目消費(fèi)。
【發(fā)明內(nèi)容】
[0003] 為了解決對(duì)于無(wú)需識(shí)別和分類(lèi)的故障碼車(chē)輛出現(xiàn)故障時(shí),能夠由故障碼準(zhǔn)確和快 速匹配該故障碼所對(duì)應(yīng)的工項(xiàng)與備件,本發(fā)明提出如下技術(shù)方案:一種基于決策樹(shù)分類(lèi)的 故障碼診斷車(chē)輛工項(xiàng)與備件檢索方法,包括
[0004] 步驟一.采集車(chē)輛信息數(shù)據(jù);
[0005] 步驟二.解析車(chē)輛VIN碼得到變量,所述變量包括由VIN碼解析得到的發(fā)動(dòng)機(jī)排量、 車(chē)身類(lèi)型、發(fā)動(dòng)機(jī)變速箱類(lèi)型;
[0006] 步驟三.對(duì)變量所對(duì)應(yīng)的備件代碼做決策樹(shù)分析,完成變量數(shù)據(jù)歸類(lèi)形成備件信 息,并建立索引,形成診斷知識(shí)庫(kù);
[0007] 步驟四.創(chuàng)建語(yǔ)言模型,建立細(xì)胞詞庫(kù),在所述細(xì)胞詞庫(kù)中切詞檢索細(xì)胞詞,并排 列所述細(xì)胞詞,利用決策樹(shù)模型的決策分類(lèi),形成故障碼對(duì)應(yīng)工項(xiàng)的診斷數(shù)據(jù)庫(kù);
[0008] 步驟五.將診斷數(shù)據(jù)庫(kù)與診斷知識(shí)庫(kù)關(guān)聯(lián),并建立主鍵;
[0009] 有益效果:本發(fā)明可以在獲取故障碼后,快速找到常見(jiàn)故障的解決方案和對(duì)應(yīng)備 件、工項(xiàng)。有效解決技師和備件員的經(jīng)驗(yàn)局限性問(wèn)題,從大數(shù)據(jù)出發(fā),獲得故障的解決方 案。本發(fā)明的步驟四構(gòu)建了一個(gè)從故障描述到詞向量分解,建立維修細(xì)胞詞庫(kù);通過(guò)故障描 述在細(xì)胞詞庫(kù)的切詞檢索,依據(jù)細(xì)胞詞權(quán)重建立的句法規(guī)則,實(shí)現(xiàn)從決策過(guò)程到?jīng)Q策建議 再到維修解決方案的維修決策樹(shù),最終實(shí)現(xiàn)故障遠(yuǎn)程診斷
【附圖說(shuō)明】
[0010] 圖1為本發(fā)明用于車(chē)輛遠(yuǎn)程診斷與備件檢索的方法的流程圖;
[0011] 圖2為底盤(pán)號(hào)為L(zhǎng)FV5A14B8Y3000001的車(chē)輛的VIN號(hào)碼翻譯示意圖。
【具體實(shí)施方式】
[0012] 實(shí)施例1: 一種基于決策樹(shù)分類(lèi)的故障碼診斷車(chē)輛工項(xiàng)與備件檢索方法,包括
[0013] 步驟一.采集車(chē)輛信息數(shù)據(jù);
[0014] 步驟二.解析車(chē)輛VIN碼得到變量,所述變量包括由VIN碼解析得到的發(fā)動(dòng)機(jī)排量、 車(chē)身類(lèi)型、發(fā)動(dòng)機(jī)變速箱類(lèi)型;
[0015] 步驟三.對(duì)變量所對(duì)應(yīng)的備件代碼做決策樹(shù)分析,完成變量數(shù)據(jù)歸類(lèi)形成備件信 息,并建立索引,形成診斷知識(shí)庫(kù);
[0016] 步驟四.創(chuàng)建語(yǔ)言模型,建立細(xì)胞詞庫(kù),在所述細(xì)胞詞庫(kù)中切詞檢索細(xì)胞詞,并排 列所述細(xì)胞詞,利用決策樹(shù)模型的決策分類(lèi),形成故障碼對(duì)應(yīng)工項(xiàng)的診斷數(shù)據(jù)庫(kù);
[0017] 步驟五.將診斷數(shù)據(jù)庫(kù)與診斷知識(shí)庫(kù)關(guān)聯(lián),并建立主鍵。
[0018] 由上述方案,在采集到車(chē)輛故障碼時(shí),執(zhí)行步驟六.對(duì)車(chē)輛故障生成的故障碼識(shí) 另IJ,并通過(guò)關(guān)鍵字解析車(chē)輛VIN碼得到的變量以進(jìn)行分類(lèi)檢索,得到工項(xiàng)及備件信息。
[0019]實(shí)施例2:具有與實(shí)施例1相同的技術(shù)方案,更為具體的,對(duì)于實(shí)施例1的步驟四來(lái) 說(shuō),
[0020] 所述步驟三中以維修備件表的歷史記錄為數(shù)據(jù)基礎(chǔ),通過(guò)決策樹(shù)模型對(duì)備件做分 類(lèi),維修備件表樣例如表一所不:
[0021] 表一
[0024]決策樹(shù)模型的基本原理如下:
[0025]首先:確定每一維度備件不同分類(lèi)的熵,以VIN4為例,熵定義為
[0026] E = sum(_p(I)*log(p(I)))
[0027] 其中I = 1: N(N類(lèi)結(jié)果,如本例1種,即該備件屬于此車(chē)型,故概率P( I) = 1)
[0028] 則E(5) =-(1/1 )Log2( 1/1 )-(0/1 )Log2(0/l )=0+0 = 0
[0029] E(3) =-( 1/1 )Log2( 1/1 )-(0/1 )Log2(0/l )=0+0 = 0
[0030] E(4) =-( 1/1 )Log2( 1/1 )-(0/1 )Log2(0/l )=0+0 = 0
[0031 ]如果熵為0,則表明區(qū)分度越高;熵為1,則表明沒(méi)有區(qū)分度;
[0032] 故這三個(gè)不同的備件代碼可以通過(guò)VIN4做區(qū)分。
[0033] 確定完每個(gè)維度如何分類(lèi)后,不同維度之間的優(yōu)先級(jí)別通過(guò)信息增益區(qū)分
[0034] Gain(Sample,Action)=E(sample)-sum(|Sample(v)|/Sample*E(Sample(v)))
[0035] 貝 ljGain(VIN4)=E(S)-(l/3)*E(5)-(l/3)*E(3)-(l/3)*E(4) = l-0 = l
[0036] Gain(VIN6)=E(S)-(l/3)*E(l)-(2/3)*E(2) = 1-0-2/3 = 1/3
[0037] Gain(VIN78)=E(S)-(l/3)*E(4B)-(l/3)*E(8K)-(l/3)*E(4F) = 1-0 = 1
[0038] 如果信息增益越大,則表明分類(lèi)優(yōu)先級(jí)越高;反之,優(yōu)先級(jí)越低。
[0039] 所以,底盤(pán)號(hào)第4位(VIN4)和底盤(pán)號(hào)78位(VIN78)的分類(lèi)優(yōu)先級(jí)相同,其次是底盤(pán) 號(hào)第6位(VIN6)。
[0040] 通過(guò)以上關(guān)鍵步驟,可將備件代碼按照底盤(pán)號(hào)第4位(VIN4)、底盤(pán)號(hào)第6位(VIN6) 和底盤(pán)號(hào)78位(VIN78)區(qū)分。
[0041] 綜上所述,備件檢索方法的基本步驟是:
[0042] 將維修備件表同一維度按信息熵做區(qū)分;
[0043] 將維修備件表不同維度按信息增益劃分優(yōu)先級(jí);
[0044] 按照1、2步劃分的優(yōu)先級(jí)和區(qū)分程度畫(huà)出決策樹(shù);
[0045] 輸入一個(gè)規(guī)則的底盤(pán)號(hào),系統(tǒng)根據(jù)¥預(yù)123、¥1財(cái)、¥預(yù)6、¥預(yù)78以及得出的決策樹(shù)輸 出該車(chē)型下的備件代碼。
[0046] 該備件代碼通過(guò)關(guān)聯(lián)備件價(jià)格表,得到備件的中文名稱(chēng)、價(jià)格和現(xiàn)在使用狀態(tài)以 及備件的適用車(chē)型信息。
[0047] 上述技術(shù)方案的獲得,是在將不同車(chē)型、不同排量、不同發(fā)動(dòng)機(jī)變速箱類(lèi)型所對(duì)應(yīng) 的備件代碼逐一歸類(lèi)進(jìn)行分析對(duì)比后,發(fā)現(xiàn)在相同主組號(hào)前提下,車(chē)型排量等信息不同,所 對(duì)應(yīng)的備件代碼也不盡相同,為了找尋其中規(guī)律,使用了上述方法,以形成較完備且全面的 理論知識(shí)信息庫(kù)。
[0048] 實(shí)施例3:具有與實(shí)施例1或2相同的技術(shù)方案,更為具體的,對(duì)于實(shí)施例1的步驟四 來(lái)說(shuō),
[0049] 所述步驟四中的創(chuàng)建語(yǔ)言模型,建立細(xì)胞詞庫(kù)包含如下步驟:
[0050] S1.1采集專(zhuān)業(yè)故障描述語(yǔ)言;
[0051 ] S1.2對(duì)所述專(zhuān)業(yè)故障描述語(yǔ)言進(jìn)行詞向量分解。
[0052] 所述語(yǔ)言模型的創(chuàng)建基于第η個(gè)所述細(xì)胞詞的出現(xiàn)只與前面n-1個(gè)所述細(xì)胞詞相 關(guān)的假設(shè);所述一故障描述語(yǔ)句T出現(xiàn)權(quán)重的計(jì)算公式為:
[0053] P(T) =P(wi,W2,W3, · ,Wn)
[0054] =P(W1) XP(W2 I Wl) XP(W3 I W1,W2) X …XP(Wn| W1,W2,…,Wn-1)
[0055] ~P(W1) XP(W2 I Wl) XP(W3 I W2)…P(Wn I Wn-1);
[0056] 其中{⑴為所述故障描述語(yǔ)句T的權(quán)重,P(wn| W1,W2, ···,wn-i)為第n個(gè)所述細(xì)胞詞 的權(quán)重。
[0057] 所述步驟四中的細(xì)胞詞庫(kù)中切詞檢索細(xì)胞詞,并排列所述細(xì)胞詞的步驟是:
[0058] S2.1針對(duì)所述一故障描述語(yǔ)句T在所述細(xì)胞詞庫(kù)中進(jìn)行切詞檢索;
[0059] S2.2若檢索到所述細(xì)胞詞,計(jì)算所述細(xì)胞詞的權(quán)重;
[0060] S2.3按照所述細(xì)胞詞權(quán)重的大小排列所述細(xì)胞詞。
[0061 ] S2.4若沒(méi)有檢索到所述細(xì)胞詞,則將此次未檢索到的所述細(xì)胞詞存入新增細(xì)胞詞 庫(kù)。
[0062] 所述S2.2步驟中所述細(xì)胞詞權(quán)重的計(jì)算方法為:
[0063] S2.2.1計(jì)算每個(gè)所述細(xì)胞詞的卡方統(tǒng)計(jì)量;
[0064] S2.2.2取所述卡方統(tǒng)計(jì)量分值最高的第i個(gè)細(xì)胞詞,計(jì)算所述第i個(gè)細(xì)胞詞在第j 個(gè)故障描述中出現(xiàn)的次數(shù);所述S2.2.1步驟所述卡方統(tǒng)計(jì)量分值的計(jì)算方法為:
[0065] weight = round( (10 X (l+lg(tfij))/(l+lg(lj))),n);
[0066] 其中tfij為第i個(gè)細(xì)胞詞在第j個(gè)故障描述中出現(xiàn)的次數(shù),lj為第j個(gè)故障描述的長(zhǎng) 度,η為3-6的整數(shù)。
[0067] 利用決策樹(shù)模型的決策分類(lèi),形成故障碼對(duì)應(yīng)工項(xiàng)的診斷數(shù)據(jù)庫(kù),該步驟中,還包 括結(jié)合元器件測(cè)量值給出維修解決方案(工項(xiàng))。
[0068]更為具體的,
[0069]本實(shí)施例通過(guò)將自然語(yǔ)言數(shù)字化達(dá)成將自然語(yǔ)言理解的問(wèn)題轉(zhuǎn)化為機(jī)器自學(xué)習(xí) 的問(wèn)題。
[0070] (1)構(gòu)建基礎(chǔ)語(yǔ)料庫(kù)
[0071 ]創(chuàng)建基礎(chǔ)語(yǔ)料庫(kù)的方法為給定一個(gè)字符串,它的自然語(yǔ)言的概率是P(wl,w2, w3,…,wn),wl到wn依次是這句話的各個(gè)細(xì)胞詞。
[0072] 模型基于這樣一種假設(shè),第η個(gè)詞的出現(xiàn)只與前面η-I個(gè)詞相關(guān),而與其它任何詞 都不相關(guān),整句的概率就是各個(gè)分詞出現(xiàn)概率的乘積。
[0073] 對(duì)于一個(gè)故障描述T,它的概率計(jì)算公式為:
[0074] P(T) =P(wi,W2,W3, · ,Wn)
[0075] =P(W1) XP(W2 I Wl) XP(W3 I W1,W2) X …XP(Wn| W1,W2,…,Wn-1)
[0076] ~P(W1) XP(W2 I Wl) XP(W3 I W2)…P(Wn I Wn-1)
[0077] (2)詞向量分解:詞向量為切分成若干個(gè)細(xì)胞詞后的語(yǔ)句。每個(gè)故障描述T都可表 示成η維的詞向量,T=(W1,W2,. . .,wn),其中W1到wn為各個(gè)詞向量中包含的各個(gè)細(xì)胞詞。
[0078] 以汽車(chē)故障為例:
[0079] 故障描述為:
[0080] P0021A凸輪軸位置(氣缸列2)-正時(shí)過(guò)度超前
[0081 ] 以詞向量表示上述故障描述語(yǔ)句,上述故障描述語(yǔ)句可以用詞向量(Wl,W2,W3,…, Wn)。其中,W1為凸輪軸,W2為位置,W3為氣缸,W4為正時(shí),W5為過(guò)度。選取各個(gè)細(xì)胞詞作為特征 項(xiàng),其中Wi表示第i個(gè)特征項(xiàng)。
[0082]算出各個(gè)細(xì)胞詞的卡方統(tǒng)計(jì)量,然后在訓(xùn)練集中取分值最高的第i個(gè)細(xì)胞詞作為 代表詞,從而找出與詞向量(¥1,'\¥2,'?3,一,'?11)相關(guān)性最小的細(xì)胞詞。
[0083] Wi的權(quán)重的計(jì)算公式為:
[0084] weight = round( (10 X (l+lg(tfij))/(l+lg(lj))),3);
[0085] 其中tfij為第i個(gè)詞向量在第j個(gè)故障描述中出現(xiàn)的次數(shù),lj為第j個(gè)故障描述的長(zhǎng) 度。Round函數(shù)四舍五入到指定的小數(shù)位,在上式中為小數(shù)點(diǎn)后第三位。
[0086] 計(jì)算權(quán)重之后的故障描述詞向量的特征表述為:
[0088] (1)檢索排列細(xì)胞詞:
[0089] 如圖1所示,當(dāng)用戶輸入故障描述T后,首先對(duì)故障描述T進(jìn)行詞向量分解將完整語(yǔ) 句切分成多個(gè)細(xì)胞詞的組合。然后針對(duì)各個(gè)細(xì)胞詞,在細(xì)胞詞庫(kù)中進(jìn)行切詞檢索。如果檢索 到了,則計(jì)算該細(xì)胞詞的權(quán)重;如果沒(méi)有檢索到,則將此次未檢索到的細(xì)胞詞存入新增行業(yè) 細(xì)胞詞庫(kù),再針對(duì)剩余細(xì)胞詞進(jìn)行檢索,計(jì)算其概率。
[0090] 根據(jù)在細(xì)胞詞庫(kù)中檢索到的各個(gè)細(xì)胞詞并計(jì)算權(quán)重,按照權(quán)重從大到小排列細(xì)胞 1·^] 〇
[0091] (2)分析結(jié)果:
[0092]以汽車(chē)故障為例:
[0093] 故障描述為:
[0094] Ρ0021 Α凸輪軸位置(氣缸列2)_正時(shí)過(guò)度超前
[0095]在細(xì)胞詞庫(kù)中檢索到的各個(gè)細(xì)胞詞并計(jì)算權(quán)重,按照權(quán)重從大到小排列細(xì)胞詞:
[0097] (3)使用判別分析法:
[0098] 故障描述T的詞向量序列為T(mén)=(wl,w2,w3, . . .,wn),故障描述T中每個(gè)細(xì)胞詞計(jì)算 權(quán)重后的序列為3=(81,82, 83,...,811)。詞向量分類(lèi)匹配最大概率的計(jì)算公式為:¥ = argmaxP(S|T)〇
[0099] 按照詞向量分類(lèi)匹配最大概率從高到低排列的句法規(guī)則進(jìn)行分級(jí):
[0101] (4)決策樹(shù)分析
[0102] 根據(jù)上述句法規(guī)則針對(duì)細(xì)胞詞分級(jí)的結(jié)果建立決策樹(shù)。
[0103] 分類(lèi)模型1
[0104] 如圖2所示,凸輪軸為一級(jí),位置、轉(zhuǎn)換、調(diào)節(jié)為二級(jí),傳感器、促動(dòng)器、響應(yīng)、正時(shí)、 排氣為三級(jí)。相對(duì)應(yīng)的解決方案分別是:傳感器對(duì)應(yīng)凸輪軸位置傳感器、發(fā)動(dòng)機(jī)線束和發(fā)動(dòng) 機(jī)控制單元,促動(dòng)器對(duì)應(yīng)發(fā)動(dòng)機(jī)線束、發(fā)動(dòng)機(jī)控制單元和凸輪軸調(diào)節(jié)器,正時(shí)對(duì)應(yīng)發(fā)動(dòng)機(jī)線 束、發(fā)動(dòng)機(jī)控制單元、凸輪軸調(diào)節(jié)器、凸輪軸張緊器和正時(shí)鏈條,以此類(lèi)推。粗箭頭指向的解 決方案表示需要更換此配件的概率遠(yuǎn)大于更換其他細(xì)箭頭指向的配件的概率,此概率為根 據(jù)大量維修數(shù)據(jù)而預(yù)先設(shè)定入決策樹(shù)模型中的。因此,通過(guò)對(duì)故障描述"凸輪軸位置(氣缸 列2)-正時(shí)過(guò)度超前"進(jìn)行詞向量分解并在細(xì)胞詞庫(kù)中進(jìn)行檢索,得到凸輪軸、位置和正時(shí) 三個(gè)細(xì)胞詞,經(jīng)計(jì)算細(xì)胞詞權(quán)重并根據(jù)句法規(guī)則對(duì)細(xì)胞詞進(jìn)行排列得出凸輪軸位于一級(jí), 位置位于二級(jí),正時(shí)位于三級(jí)。經(jīng)過(guò)決策樹(shù)模型的決策分類(lèi),得出最有可能的維修解決方案 為更換或維修凸輪軸張緊器。
[0105] 分類(lèi)模型2
[0106] 對(duì)故障描述語(yǔ)句"凸輪軸位置傳感器= > 傳感器不可信信號(hào)"進(jìn)行詞向量分解并在 細(xì)胞詞庫(kù)中檢索,得到凸輪軸、位置、傳感器三個(gè)細(xì)胞詞。針對(duì)三個(gè)細(xì)胞詞計(jì)算細(xì)胞詞權(quán)重 并根據(jù)句法規(guī)則對(duì)細(xì)胞詞進(jìn)行排列得出凸輪軸位于一級(jí),位置位于二級(jí),傳感器位于三級(jí)。 再結(jié)合元器件測(cè)量值,判斷需要更換的配件。首先檢查電線插頭有無(wú)接觸不良,針頭彎曲。 如果是,則需要更換電線插頭。如果否,則進(jìn)入下一級(jí)決策樹(shù),檢查凸輪軸傳感器電壓供應(yīng) 是否在4.5-5.5V之間。如果是則檢查發(fā)動(dòng)機(jī)控制單元的信號(hào)電壓,是否在4.5-5.5V之間。如 果否則需要更換發(fā)動(dòng)機(jī)線束。以此類(lèi)推,經(jīng)過(guò)決策樹(shù)模型的決策分類(lèi)結(jié)合元器件測(cè)量值,給 出維修解決方案。
[0107] 本實(shí)施例可以遠(yuǎn)程并快速地識(shí)別設(shè)備的故障,準(zhǔn)確的給出有效維修解決方案。檢 測(cè)標(biāo)準(zhǔn)統(tǒng)一,避免由于人工判斷帶來(lái)的誤差。并且節(jié)省了大量人力物力。
[0108] 以上所述,僅為本發(fā)明創(chuàng)造較佳的【具體實(shí)施方式】,但本發(fā)明創(chuàng)造的保護(hù)范圍并不 局限于此,任何熟悉本技術(shù)領(lǐng)域的技術(shù)人員在本發(fā)明創(chuàng)造披露的技術(shù)范圍內(nèi),根據(jù)本發(fā)明 創(chuàng)造的技術(shù)方案及其發(fā)明構(gòu)思加以等同替換或改變,都應(yīng)涵蓋在本發(fā)明創(chuàng)造的保護(hù)范圍之 內(nèi)。
【主權(quán)項(xiàng)】
1. 一種基于決策樹(shù)分類(lèi)的故障碼診斷車(chē)輛工項(xiàng)與備件檢索方法,其特征在于,包括 步驟一.采集車(chē)輛信息數(shù)據(jù); 步驟二.解析車(chē)輛VIN碼得到變量,所述變量包括由VIN碼解析得到的發(fā)動(dòng)機(jī)排量、車(chē)身 類(lèi)型、發(fā)動(dòng)機(jī)變速箱類(lèi)型; 步驟三.對(duì)變量所對(duì)應(yīng)的備件代碼做決策樹(shù)分析,完成變量數(shù)據(jù)歸類(lèi)形成備件信息,并 建立索引,形成診斷知識(shí)庫(kù); 步驟四.創(chuàng)建語(yǔ)言模型,建立細(xì)胞詞庫(kù),在所述細(xì)胞詞庫(kù)中切詞檢索細(xì)胞詞,并排列所 述細(xì)胞詞,利用決策樹(shù)模型的決策分類(lèi),形成故障碼對(duì)應(yīng)工項(xiàng)的診斷數(shù)據(jù)庫(kù); 步驟五.將診斷數(shù)據(jù)庫(kù)與診斷知識(shí)庫(kù)關(guān)聯(lián),并建立主鍵。2. 如權(quán)利要求1所述的基于決策樹(shù)分類(lèi)的故障碼診斷車(chē)輛工項(xiàng)與備件檢索方法,其特 征在于,還包括步驟六.對(duì)車(chē)輛故障生成的故障碼識(shí)別,并通過(guò)關(guān)鍵字解析車(chē)輛VIN碼得到 的變量以進(jìn)行分類(lèi)檢索,得到工項(xiàng)及備件信息。3. 如權(quán)利要求1或2所述的基于決策樹(shù)分類(lèi)的故障碼診斷車(chē)輛工項(xiàng)與備件檢索方法,其 特征在于,所述步驟四中以維修備件表的歷史記錄為數(shù)據(jù)基礎(chǔ),通過(guò)決策樹(shù)模型對(duì)備件做 分類(lèi); 備件檢索方法的步驟是: (1) 將維修備件表同一維度按信息熵做區(qū)分; (2) 將維修備件表不同維度按信息增益劃分優(yōu)先級(jí); (3) 按照步驟(1)、(2)劃分的優(yōu)先級(jí)和區(qū)分程度畫(huà)出決策樹(shù); (4) 輸入一個(gè)規(guī)則的VIN碼,根據(jù)VIN碼以及得出的決策樹(shù)輸出該車(chē)型下的備件代碼。4. 如權(quán)利要求1或2所述的基于決策樹(shù)分類(lèi)的故障碼診斷車(chē)輛工項(xiàng)與備件檢索方法,其 特征在于,所述備件代碼關(guān)聯(lián)備件的價(jià)格表,所述備件信息包括備件的中文名稱(chēng)、價(jià)格和現(xiàn) 在使用狀態(tài)以及備件的適用車(chē)型信息。5. 如權(quán)利要求1所述的基于決策樹(shù)分類(lèi)的故障碼診斷車(chē)輛工項(xiàng)與備件檢索方法,其特 征在于,所述步驟四中的創(chuàng)建語(yǔ)言模型,建立細(xì)胞詞庫(kù)包含如下步驟: S1.1采集專(zhuān)業(yè)故障描述語(yǔ)言; S1.2對(duì)所述專(zhuān)業(yè)故障描述語(yǔ)言進(jìn)行詞向量分解。6. 如權(quán)利要求5所述的基于決策樹(shù)分類(lèi)的故障碼診斷車(chē)輛工項(xiàng)與備件檢索方法,其特 征在于:所述語(yǔ)言模型的創(chuàng)建基于第η個(gè)所述細(xì)胞詞的出現(xiàn)只與前面n-1個(gè)所述細(xì)胞詞相關(guān) 的假設(shè);所述一故障描述語(yǔ)句T出現(xiàn)權(quán)重的計(jì)算公式為: P(T)=P(wi,W2,W3,··· ,Wn) = P(W1) XP(W2 I Wl) XP(W3 I W1,W2) X …XP(Wn I W1,W2,…,Wn-1) ~P(W1) XP(W2 I Wl) XP(W3 I W2)…P(Wn| Wn-1); 其中,P ( T )為所述故障描述語(yǔ)句T的權(quán)重,P ( Wn I Wl,W2,···,Wn-1 )為第n個(gè)所述細(xì)胞詞的權(quán) 重。7. 如權(quán)利要求1或2所述的基于決策樹(shù)分類(lèi)的故障碼診斷車(chē)輛工項(xiàng)與備件檢索方法,其 特征在于,所述步驟四中的細(xì)胞詞庫(kù)中切詞檢索細(xì)胞詞,并排列所述細(xì)胞詞的步驟是: S2.1針對(duì)所述一故障描述語(yǔ)句T在所述細(xì)胞詞庫(kù)中進(jìn)行切詞檢索; S2.2若檢索到所述細(xì)胞詞,計(jì)算所述細(xì)胞詞的權(quán)重; S2.3按照所述細(xì)胞詞權(quán)重的大小排列所述細(xì)胞詞。8.如權(quán)利要求7所述的基于決策樹(shù)分類(lèi)的故障碼診斷車(chē)輛工項(xiàng)與備件檢索方法,其特 征在于, S2.2.1計(jì)算每個(gè)所述細(xì)胞詞的卡方統(tǒng)計(jì)量; S2.2.2取所述卡方統(tǒng)計(jì)量分值最高的第i個(gè)細(xì)胞詞,計(jì)算所述第i個(gè)細(xì)胞詞在第j個(gè)故 障描述中出現(xiàn)的次數(shù);所述S2.2.1步驟所述卡方統(tǒng)計(jì)量分值的計(jì)算方法為: weight = round( (10 X (l+lg(tfij))/(l+lg( lj))) ,η); 其中tfij為第i個(gè)細(xì)胞詞在第j個(gè)故障描述中出現(xiàn)的次數(shù),lj為第j個(gè)故障描述的長(zhǎng)度,η 為3-6的整數(shù)。
【文檔編號(hào)】G06N5/02GK106095785SQ201610365653
【公開(kāi)日】2016年11月9日
【申請(qǐng)日】2016年5月27日
【發(fā)明人】田雨農(nóng), 劉亮
【申請(qǐng)人】大連樓蘭科技股份有限公司