基于決策樹分類和故障碼分類的車輛遠(yuǎn)程診斷與備件檢索的方法

文檔序號：10686380閱讀：445來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>控制;調(diào)節(jié)裝置的制造及其應(yīng)用技術(shù)

基于決策樹分類和故障碼分類的車輛遠(yuǎn)程診斷與備件檢索的方法
【專利摘要】基于決策樹分類和故障碼分類的車輛遠(yuǎn)程診斷與備件檢索的方法，屬于信息檢索領(lǐng)域，由于不同的備件在主組號相同的情況下，分組號仍有差異，為了能夠解決精確匹配備件的問題，技術(shù)要點(diǎn)是：對故障碼識別和分類；解析車輛VIN碼得到變量，所述變量包括由VIN碼解析得到的發(fā)動(dòng)機(jī)排量、車身類型、發(fā)動(dòng)機(jī)變速箱類型；對變量所對應(yīng)的備件代碼做決策樹分析，完成變量數(shù)據(jù)歸類形成備件信息，并建立索引，形成診斷知識庫；創(chuàng)建語言模型，建立細(xì)胞詞庫，在所述細(xì)胞詞庫中切詞檢索細(xì)胞詞，并排列所述細(xì)胞詞，利用決策樹模型的決策分類，形成故障碼對應(yīng)工項(xiàng)的診斷數(shù)據(jù)庫；將診斷數(shù)據(jù)庫與診斷知識庫關(guān)聯(lián)，并建立主鍵；效果是：可在獲取故障碼后，快速找到常見故障的解決方案和對應(yīng)備件、工項(xiàng)。
【專利說明】
基于決策樹分類和故障碼分類的車輛遠(yuǎn)程診斷與備件檢索的方法
技術(shù)領(lǐng)域
[0001] 本發(fā)明屬于信息檢索領(lǐng)域，涉及一種用于車輛遠(yuǎn)程診斷與備件檢索的方法
【背景技術(shù)】
[0002] 目前我國汽車維修行業(yè)已經(jīng)從完全依靠檢查者的感覺和實(shí)踐經(jīng)驗(yàn)進(jìn)行診斷的階段，發(fā)展到了利用專門設(shè)備進(jìn)行綜合檢測診斷階段，但是在傳統(tǒng)汽車維修行業(yè)中普遍存在著很多問題，比如維修工人技術(shù)老化，經(jīng)常無法快速、經(jīng)濟(jì)地利用各方面的技術(shù)力量解決故障；隨著汽車保有量的日益增多，汽車后市場各項(xiàng)服務(wù)如雨后春筍般大量涌現(xiàn)。那么從車主角度，如何才能更好更全面的了解車況，發(fā)生故障時(shí)，如何快速獲取愛車待解決方案及所需工時(shí)及備件相關(guān)信息，精準(zhǔn)的汽車可穿戴設(shè)備對滿足車主實(shí)時(shí)需求是完全必要的。一般的 0BD車載設(shè)備，只能讀取到相關(guān)車輛故障信息，不能對故障做出詳細(xì)解決方案及相關(guān)維修人工費(fèi)、備件費(fèi)，從而造成車主盲目進(jìn)店，盲目消費(fèi)。

【發(fā)明內(nèi)容】

[0003] 為了解決車主車輛出現(xiàn)故障時(shí)，能夠準(zhǔn)確和快速匹配該故障碼所對應(yīng)的工項(xiàng)與備件，本發(fā)明提出如下技術(shù)方案:一種基于決策樹分類和故障碼分類的車輛遠(yuǎn)程診斷與備件檢索的方法，包括
[0004] 步驟一.采集車輛信息數(shù)據(jù)；
[0005] 步驟二.對故障碼識別和分類；
[0006]步驟三.解析車輛VIN碼得到變量，所述變量包括由VIN碼解析得到的發(fā)動(dòng)機(jī)排量、車身類型、發(fā)動(dòng)機(jī)變速箱類型；
[0007] 步驟四.對變量所對應(yīng)的備件代碼做決策樹分析，完成變量數(shù)據(jù)歸類形成備件信息，并建立索引，形成診斷知識庫；
[0008] 步驟五.創(chuàng)建語言模型，建立細(xì)胞詞庫，在所述細(xì)胞詞庫中切詞檢索細(xì)胞詞，并排列所述細(xì)胞詞，利用決策樹模型的決策分類，形成故障碼對應(yīng)工項(xiàng)的診斷數(shù)據(jù)庫；
[0009] 步驟六.將診斷數(shù)據(jù)庫與診斷知識庫關(guān)聯(lián)，并建立主鍵；
[0010]步驟七.對車輛故障生成的故障碼識別，并通過關(guān)鍵字解析車輛VIN碼得到的變量以進(jìn)行分類檢索，得到工項(xiàng)及備件信息。
[0011]有意效果:本發(fā)明可以在獲取故障碼后，快速找到常見故障的解決方案和對應(yīng)備件、工項(xiàng)。有效解決技師和備件員的經(jīng)驗(yàn)局限性問題，從大數(shù)據(jù)出發(fā)，獲得故障的解決方案。本發(fā)明其具有對故障碼識別和分類的步驟，可以在不同車型間的故障碼出現(xiàn)差異時(shí)，判斷其一致性;且，本發(fā)明的步驟五構(gòu)建了一個(gè)從故障描述到詞向量分解，建立維修細(xì)胞詞庫；通過故障描述在細(xì)胞詞庫的切詞檢索，依據(jù)細(xì)胞詞權(quán)重建立的句法規(guī)則，實(shí)現(xiàn)從決策過程到?jīng)Q策建議再到維修解決方案的維修決策樹，最終實(shí)現(xiàn)故障遠(yuǎn)程診斷。
【附圖說明】
[0012]圖1為本發(fā)明用于車輛遠(yuǎn)程診斷與備件檢索的方法的流程圖；
[0013] 圖2為底盤號為LFV5A14B8Y3000001的車輛的VIN號碼翻譯示意圖。
【具體實(shí)施方式】
[0014] 實(shí)施例1: 一種基于決策樹分類和故障碼分類的車輛遠(yuǎn)程診斷與備件檢索的方法，包括
[0015] 步驟一.采集車輛信息數(shù)據(jù)；
[0016] 步驟二.對故障碼識別和分類；
[0017] 步驟三.解析車輛VIN碼得到變量，所述變量包括由VIN碼解析得到的發(fā)動(dòng)機(jī)排量、車身類型、發(fā)動(dòng)機(jī)變速箱類型；
[0018] 步驟四.對變量所對應(yīng)的備件代碼做決策樹分析，完成變量數(shù)據(jù)歸類形成備件信息，并建立索引，形成診斷知識庫；
[0019] 步驟五.創(chuàng)建語言模型，建立細(xì)胞詞庫，在所述細(xì)胞詞庫中切詞檢索細(xì)胞詞，并排列所述細(xì)胞詞，利用決策樹模型的決策分類，形成故障碼對應(yīng)工項(xiàng)的診斷數(shù)據(jù)庫；
[0020] 步驟六.將診斷數(shù)據(jù)庫與診斷知識庫關(guān)聯(lián)，并建立主鍵；
[0021] 步驟七.對車輛故障生成的故障碼識別，并通過關(guān)鍵字進(jìn)行分類檢索，得到工項(xiàng)及備件信息。
[0022] 實(shí)施例2 :具有與實(shí)施例1相同的技術(shù)方案，更為具體的，對于實(shí)施例1的步驟四來說，
[0023] 所述步驟四中以維修備件表的歷史記錄為數(shù)據(jù)基礎(chǔ)，通過決策樹模型對備件做分類，維修備件表樣例如表一所不：
[0024] 表一
[0026] 決策樹模型的基本原理如下：
[0027] 首先:確定每一維度備件不同分類的熵，以VIN4為例，熵定義為
[0028] E = sum(_p(I)*log(p(I)))
[0029] 其中I = 1: N(N類結(jié)果，如本例1種，即該備件屬于此車型，故概率P( I) = 1)
[0030] 則E(5)=-( 1/1 )Log2( 1/1 )-(0/l)Log2(0/l )=0+0 = 0
[0031] E(3) =-( 1/1 )Log2( 1/1 )-(0/l)Log2(0/l )=0+0 = 0
[0032] E(4) =-( 1/1 )Log2( 1/1 )-(0/l)Log2(0/l )=0+0 = 0 [0033]如果熵為0，則表明區(qū)分度越高;熵為1，則表明沒有區(qū)分度；
[0034] 故這三個(gè)不同的備件代碼可以通過VIN4做區(qū)分。
[0035]確定完每個(gè)維度如何分類后，不同維度之間的優(yōu)先級別通過信息增益區(qū)分Gain (Sample，Action) = E(sample)_sum( | Sample(v) | /Sample*E(Sample(v)))則Gain(VIM)= E(S)-(l/3)*E(5)-(l/3)*E(3)-(l/3)*E(4) = l-0 = lGain(VIN6)=E(S)-(l/3)*E(l)-(2/ 3)*E(2) = l-0-2/3=l/3Gain(VIN78)=E(S)-(l/3)*E(4B)-(l/3)*E(8K)-(l/3)*E(4F) = 1-0 = 1
[0036]如果信息增益越大，則表明分類優(yōu)先級越高;反之，優(yōu)先級越低。
[0037]所以，底盤號第4位(VIN4)和底盤號78位(VIN78)的分類優(yōu)先級相同，其次是底盤號第6位(VIN6)。
[0038] 通過以上關(guān)鍵步驟，可將備件代碼按照底盤號第4位(VIN4)、底盤號第6位(VIN6) 和底盤號78位(VIN78)區(qū)分。
[0039] 綜上所述，備件檢索方法的基本步驟是：
[0040] 將維修備件表同一維度按信息熵做區(qū)分；
[0041 ]將維修備件表不同維度按信息增益劃分優(yōu)先級；
[0042]按照1、2步劃分的優(yōu)先級和區(qū)分程度畫出決策樹；
[0043] 輸入一個(gè)規(guī)則的底盤號，系統(tǒng)根據(jù)￥預(yù)123、￥1財(cái)、￥預(yù)6、￥預(yù)78以及得出的決策樹輸出該車型下的備件代碼。
[0044] 該備件代碼通過關(guān)聯(lián)備件價(jià)格表，得到備件的中文名稱、價(jià)格和現(xiàn)在使用狀態(tài)以及備件的適用車型信息。
[0045] 上述技術(shù)方案的獲得，是在將不同車型、不同排量、不同發(fā)動(dòng)機(jī)變速箱類型所對應(yīng) 的備件代碼逐一歸類進(jìn)行分析對比后，發(fā)現(xiàn)在相同主組號前提下，車型排量等信息不同，所對應(yīng)的備件代碼也不盡相同，為了找尋其中規(guī)律，使用了上述方法，以形成較完備且全面的理論知識信息庫。
[0046] 實(shí)施例3:具有與實(shí)施例1或2相同的技術(shù)方案，更為具體的，對于實(shí)施例1的步驟五來說，
[0047] 所述步驟五中的創(chuàng)建語言模型，建立細(xì)胞詞庫包含如下步驟：
[0048] S1.1采集專業(yè)故障描述語言；
[0049] S1.2對所述專業(yè)故障描述語言進(jìn)行詞向量分解。
[0050] 所述語言模型的創(chuàng)建基于第n個(gè)所述細(xì)胞詞的出現(xiàn)只與前面n-1個(gè)所述細(xì)胞詞相關(guān)的假設(shè);所述一故障描述語句T出現(xiàn)權(quán)重的計(jì)算公式為：
[0051] P(T) =P(W1,W2,W3, ,Wn)
[0052] =P(W1) XP(W2 I Wl) XP(W3 I W1，W2) X …XP(Wn| W1，W2,…，Wn-1)
[0053] ~P(W1) XP(W2 I Wl) XP(W3 I W2)…P(Wn I Wn-1);
[0054] 其中，P⑴為所述故障描述語句T的權(quán)重，P(wn| wi，W2, ???，wn-i)為第n個(gè)所述細(xì)胞詞的權(quán)重。
[0055] 所述步驟五中的細(xì)胞詞庫中切詞檢索細(xì)胞詞，并排列所述細(xì)胞詞的步驟是：
[0056] S2.1針對所述一故障描述語句T在所述細(xì)胞詞庫中進(jìn)行切詞檢索；
[0057] S2.2若檢索到所述細(xì)胞詞，計(jì)算所述細(xì)胞詞的權(quán)重；
[0058] S2.3按照所述細(xì)胞詞權(quán)重的大小排列所述細(xì)胞詞。
[0059] S2.4若沒有檢索到所述細(xì)胞詞，則將此次未檢索到的所述細(xì)胞詞存入新增細(xì)胞詞庫。
[0060]所述S2.2步驟中所述細(xì)胞詞權(quán)重的計(jì)算方法為：
[0061 ] S2.2.1計(jì)算每個(gè)所述細(xì)胞詞的卡方統(tǒng)計(jì)量；
[0062] S2.2.2取所述卡方統(tǒng)計(jì)量分值最高的第i個(gè)細(xì)胞詞，計(jì)算所述第i個(gè)細(xì)胞詞在第j 個(gè)故障描述中出現(xiàn)的次數(shù);所述S2.2.1步驟所述卡方統(tǒng)計(jì)量分值的計(jì)算方法為：
[0063] weight = round( (10 X (l+lg(tfij))/(l+lg(lj))),n)；
[0064] 其中tfij為第i個(gè)細(xì)胞詞在第j個(gè)故障描述中出現(xiàn)的次數(shù)，lj為第j個(gè)故障描述的長度，n為3-6的整數(shù)。
[0065] 利用決策樹模型的決策分類，形成故障碼對應(yīng)工項(xiàng)的診斷數(shù)據(jù)庫，該步驟中，還包括結(jié)合元器件測量值給出維修解決方案(工項(xiàng)）。
[0066]更為具體的，
[0067]本實(shí)施例通過將自然語言數(shù)字化達(dá)成將自然語言理解的問題轉(zhuǎn)化為機(jī)器自學(xué)習(xí) 的問題。
[0068] (1)構(gòu)建基礎(chǔ)語料庫
[0069] 創(chuàng)建基礎(chǔ)語料庫的方法為給定一個(gè)字符串，它的自然語言的概率是P(wl，w2， w3,…，wn)，wl到wn依次是這句話的各個(gè)細(xì)胞詞。
[0070] 模型基于這樣一種假設(shè)，第n個(gè)詞的出現(xiàn)只與前面n-1個(gè)詞相關(guān)，而與其它任何詞都不相關(guān)，整句的概率就是各個(gè)分詞出現(xiàn)概率的乘積。
[0071] 對于一個(gè)故障描述T，它的概率計(jì)算公式為：
[0072] P(T) =P(wi,W2,W3, ,Wn)
[0073] =P(W1) XP(W2 I Wl) XP(W3 I W1，W2) X …XP(Wn| W1，W2,…，Wn-1)
[0074] ~P(W1) XP(W2 I Wl) XP(W3 I W2)…P(Wn I Wn-1)
[0075] (2)詞向量分解:詞向量為切分成若干個(gè)細(xì)胞詞后的語句。每個(gè)故障描述T都可表示成n維的詞向量，T=(wi，W2, . . .，wn)，其中wi到wn為各個(gè)詞向量中包含的各個(gè)細(xì)胞詞。 [0076]以汽車故障為例：
[0077]故障描述為：
[0078] P0021 A凸輪軸位置(氣缸列2)_正時(shí)過度超前
[0079] 以詞向量表示上述故障描述語句，上述故障描述語句可以用詞向量(Wl，W2，W3，…， Wn)。其中，W1為凸輪軸，W2為位置，W3為氣缸，W4為正時(shí)，W5為過度。選取各個(gè)細(xì)胞詞作為特征項(xiàng)，其中Wi表示第i個(gè)特征項(xiàng)。
[0080] 算出各個(gè)細(xì)胞詞的卡方統(tǒng)計(jì)量，然后在訓(xùn)練集中取分值最高的第i個(gè)細(xì)胞詞作為代表詞，從而找出與詞向量(￥1，'\￥2，'?3，一，'?〇相關(guān)性最小的細(xì)胞詞。
[0081] Wi的權(quán)重的計(jì)算公式為：
[0082] weight = round( (10 X (l+lg(tfij))/(l+lg(lj))),3)；
[0083]其中tfij為第i個(gè)詞向量在第j個(gè)故障描述中出現(xiàn)的次數(shù)，lj為第j個(gè)故障描述的長度。Round函數(shù)四舍五入到指定的小數(shù)位，在上式中為小數(shù)點(diǎn)后第三位。
[0084]計(jì)算權(quán)重之后的故障描述詞向量的特征表述為：

[0086] (1)檢索排列細(xì)胞詞：
[0087] 如圖1所示，當(dāng)用戶輸入故障描述T后，首先對故障描述T進(jìn)行詞向量分解將完整語句切分成多個(gè)細(xì)胞詞的組合。然后針對各個(gè)細(xì)胞詞，在細(xì)胞詞庫中進(jìn)行切詞檢索。如果檢索到了，則計(jì)算該細(xì)胞詞的權(quán)重;如果沒有檢索到，則將此次未檢索到的細(xì)胞詞存入新增行業(yè) 細(xì)胞詞庫，再針對剩余細(xì)胞詞進(jìn)行檢索，計(jì)算其概率。
[0088] 根據(jù)在細(xì)胞詞庫中檢索到的各個(gè)細(xì)胞詞并計(jì)算權(quán)重，按照權(quán)重從大到小排列細(xì)胞。
[0089] (2)分析結(jié)果：
[0090] 以汽車故障為例：
[0091] 故障描述為：
[0092] P0021 A凸輪軸位置(氣缸列2)_正時(shí)過度超前
[0093]在細(xì)胞詞庫中檢索到的各個(gè)細(xì)胞詞并計(jì)算權(quán)重，按照權(quán)重從大到小排列細(xì)胞詞：
[0095] (3)使用判別分析法：
[0096] 故障描述T的詞向量序列為T=(wl，w2，w3, . . .，wn)，故障描述T中每個(gè)細(xì)胞詞計(jì)算權(quán)重后的序列為3=(81，82, 83，...，811)。詞向量分類匹配最大概率的計(jì)算公式為:￥ = argmaxP(S|T)〇
[0097] 按照詞向量分類匹配最大概率從高到低排列的句法規(guī)則進(jìn)行分級：
[0099] (4)決策樹分析
[0100] 根據(jù)上述句法規(guī)則針對細(xì)胞詞分級的結(jié)果建立決策樹。
[0101] 分類模型1
[0102] 如圖2所示，凸輪軸為一級，位置、轉(zhuǎn)換、調(diào)節(jié)為二級，傳感器、促動(dòng)器、響應(yīng)、正時(shí)、排氣為三級。相對應(yīng)的解決方案分別是:傳感器對應(yīng)凸輪軸位置傳感器、發(fā)動(dòng)機(jī)線束和發(fā)動(dòng) 機(jī)控制單元，促動(dòng)器對應(yīng)發(fā)動(dòng)機(jī)線束、發(fā)動(dòng)機(jī)控制單元和凸輪軸調(diào)節(jié)器，正時(shí)對應(yīng)發(fā)動(dòng)機(jī)線束、發(fā)動(dòng)機(jī)控制單元、凸輪軸調(diào)節(jié)器、凸輪軸張緊器和正時(shí)鏈條，以此類推。粗箭頭指向的解決方案表示需要更換此配件的概率遠(yuǎn)大于更換其他細(xì)箭頭指向的配件的概率，此概率為根據(jù)大量維修數(shù)據(jù)而預(yù)先設(shè)定入決策樹模型中的。因此，通過對故障描述"凸輪軸位置(氣缸列2)-正時(shí)過度超前"進(jìn)行詞向量分解并在細(xì)胞詞庫中進(jìn)行檢索，得到凸輪軸、位置和正時(shí) 三個(gè)細(xì)胞詞，經(jīng)計(jì)算細(xì)胞詞權(quán)重并根據(jù)句法規(guī)則對細(xì)胞詞進(jìn)行排列得出凸輪軸位于一級，位置位于二級，正時(shí)位于三級。經(jīng)過決策樹模型的決策分類，得出最有可能的維修解決方案為更換或維修凸輪軸張緊器。
[0103] 分類模型2
[0104] 對故障描述語句"凸輪軸位置傳感器= > 傳感器不可信信號"進(jìn)行詞向量分解并在細(xì)胞詞庫中檢索，得到凸輪軸、位置、傳感器三個(gè)細(xì)胞詞。針對三個(gè)細(xì)胞詞計(jì)算細(xì)胞詞權(quán)重并根據(jù)句法規(guī)則對細(xì)胞詞進(jìn)行排列得出凸輪軸位于一級，位置位于二級，傳感器位于三級。再結(jié)合元器件測量值，判斷需要更換的配件。首先檢查電線插頭有無接觸不良，針頭彎曲。如果是，則需要更換電線插頭。如果否，則進(jìn)入下一級決策樹，檢查凸輪軸傳感器電壓供應(yīng) 是否在4.5-5.5V之間。如果是則檢查發(fā)動(dòng)機(jī)控制單元的信號電壓，是否在4.5-5.5V之間。如果否則需要更換發(fā)動(dòng)機(jī)線束。以此類推，經(jīng)過決策樹模型的決策分類結(jié)合元器件測量值，給出維修解決方案。
[0105] 本實(shí)施例可以遠(yuǎn)程并快速地識別設(shè)備的故障，準(zhǔn)確的給出有效維修解決方案。檢測標(biāo)準(zhǔn)統(tǒng)一，避免由于人工判斷帶來的誤差。并且節(jié)省了大量人力物力。
[0106] 實(shí)施例四：具有與實(shí)施例1或2或3相同的技術(shù)方案，更為具體的，對于實(shí)施例1的步驟二來說，
[0107] 所述對故障碼識別和分類的方法，包括：
[0108] 首先利用訓(xùn)練數(shù)據(jù)集構(gòu)建樸素貝葉斯分類器，具體步驟為：
[0109] S1:對訓(xùn)練集中的故障碼進(jìn)行人工分類，人工分類后的類別集為c:
[0110] C= {ci，C2,…，Ci，…，cn};
[0111] S2:將每個(gè)類別中的故障碼進(jìn)行分詞并計(jì)算每個(gè)詞的TF-IDF權(quán)重值；
[0113] TFiS特征詞i的詞頻;^為特征詞i在所有故障碼中出現(xiàn)的次數(shù)，表示故障碼中所有特征詞的出現(xiàn)次數(shù)總和；
[0115] IDFi為特征詞i的逆向文件頻率;E為語料庫中故障碼的總數(shù)，{k:Wi G ek}表示包含特征詞i的故障碼數(shù)；
[0116] TF-IDF權(quán)重值為:TF-IDF = TF X IDF，也就是是詞頻與逆向文件頻率的乘積；
[0117] S3:根據(jù)TF-IDF權(quán)重值篩選出特征詞并建立特征詞庫，將故障碼e定義成若干個(gè)特征詞的集合：
[0118] e= {wi，W2，…，Wn}
[0119] S4:分別計(jì)算每個(gè)類別中特征詞在該類別條件下的條件概率，依據(jù)貝葉斯定理計(jì) 算出某個(gè)故障碼e屬于Cl類故障的概率，具體公式如下：
[0120] P(ci|e) = [P(e|ci)P(ci)]/P(e)
[0121] 其中，P(e)為從故障碼空間中隨機(jī)抽取一個(gè)故障碼e的概率;P(Cl)為一個(gè)故障碼類別Cl在故障碼空間所占比率;P(e| Cl)為對于給定的故障碼類別(^中故障碼e的出現(xiàn)概率；
[0122] 對于每個(gè)故障碼類別而言，從故障碼空間中隨機(jī)抽取一個(gè)故障碼的概率都是一樣的，因此P(e)可以忽略不予計(jì)算，這樣公式（1)就可以寫成如下形式：
[0123] P(ci | e) °cP(e | Ci)P(Ci)
[0124] 計(jì)算某個(gè)故障碼在每個(gè)分類中概率，取擁有最大概率值的類別為該故障碼的分類結(jié)果，具體為：
[0125] G(e) =argmax{P(e | Ci)P(ci)} 〇
[0126] S5:構(gòu)建樸素貝葉斯分類器。
[0127] 然后對新故障碼進(jìn)行具體分類，具體為：
[0128] 更具體的，對新故障碼進(jìn)行具體分類，設(shè)在類別i中的故障碼為ei，同時(shí)還有個(gè)待匹配的故障碼enew，它們的分詞情況如下：
[0129] ei= {W1，W2，W3，W4}
[0130] enew= {w2，W3，W5}
[0131 ]步驟1:由這兩組的特征詞集合構(gòu)成一個(gè)向量空間：
[0133]步驟2:結(jié)合向量空間，分別得到兩個(gè)故障碼的詞向量值：

[0136]步驟3:利用余弦相似度計(jì)算兩個(gè)故障碼近似情況，具體公式如下：
[0138] 步驟4:如果所計(jì)算的相似度值大于80%，則可以判斷這兩個(gè)故障碼是相同的；如果所計(jì)算的相似度值小于閾值，則繼續(xù)與已知故障碼庫中的其他類別故障碼進(jìn)行余弦相似度計(jì)算。
[0139] 采用以上技術(shù)方法，能夠取得如下的技術(shù)效果:準(zhǔn)確地自動(dòng)分類不同車型的故障碼，將數(shù)以億級的故障碼進(jìn)行收斂，實(shí)現(xiàn)不同車廠車型間故障問題、解決方案的探索。能節(jié) 省大量的勞動(dòng)力，縮短工作周期，降低成本。
[0140]以上所述，僅為本發(fā)明創(chuàng)造較佳的【具體實(shí)施方式】，但本發(fā)明創(chuàng)造的保護(hù)范圍并不局限于此，任何熟悉本技術(shù)領(lǐng)域的技術(shù)人員在本發(fā)明創(chuàng)造披露的技術(shù)范圍內(nèi)，根據(jù)本發(fā)明創(chuàng)造的技術(shù)方案及其發(fā)明構(gòu)思加以等同替換或改變，都應(yīng)涵蓋在本發(fā)明創(chuàng)造的保護(hù)范圍之內(nèi)。
【主權(quán)項(xiàng)】
1. 一種基于決策樹分類和故障碼分類的車輛遠(yuǎn)程診斷與備件檢索的方法，其特征在于，包括步驟一.采集車輛信息數(shù)據(jù)；步驟二.對故障碼識別和分類；步驟三.解析車輛VIN碼得到變量，所述變量包括由VIN碼解析得到的發(fā)動(dòng)機(jī)排量、車身類型、發(fā)動(dòng)機(jī)變速箱類型；步驟四.對變量所對應(yīng)的備件代碼做決策樹分析，完成變量數(shù)據(jù)歸類形成備件信息，并建立索引，形成診斷知識庫；步驟五.創(chuàng)建語言模型，建立細(xì)胞詞庫，在所述細(xì)胞詞庫中切詞檢索細(xì)胞詞，并排列所述細(xì)胞詞，利用決策樹模型的決策分類，形成故障碼對應(yīng)工項(xiàng)的診斷數(shù)據(jù)庫；步驟六.將診斷數(shù)據(jù)庫與診斷知識庫關(guān)聯(lián)，并建立主鍵；步驟七.對車輛故障生成的故障碼識別，并通過關(guān)鍵字解析車輛VIN碼得到的變量以進(jìn) 行分類檢索，得到工項(xiàng)及備件信息。2. 如權(quán)利要求1所述的基于決策樹分類和故障碼分類的車輛遠(yuǎn)程診斷與備件檢索的方法，其特征在于，所述步驟四中以維修備件表的歷史記錄為數(shù)據(jù)基礎(chǔ)，通過決策樹模型對備件做分類；備件檢索方法的步驟是： (1) 將維修備件表同一維度按信息熵做區(qū)分； (2) 將維修備件表不同維度按信息增益劃分優(yōu)先級； (3) 按照步驟(1)、（2)劃分的優(yōu)先級和區(qū)分程度畫出決策樹； (4) 輸入一個(gè)規(guī)則的VIN碼，根據(jù)VIN碼以及得出的決策樹輸出該車型下的備件代碼。3. 如權(quán)利要求2所述的基于決策樹分類和故障碼分類的車輛遠(yuǎn)程診斷與備件檢索的方法，其特征在于，所述備件代碼關(guān)聯(lián)備件的價(jià)格表，所述備件信息包括備件的中文名稱、價(jià) 格和現(xiàn)在使用狀態(tài)以及備件的適用車型信息。4. 如權(quán)利要求1所述的基于決策樹分類和故障碼分類的車輛遠(yuǎn)程診斷與備件檢索的方法，其特征在于，所述步驟五中的創(chuàng)建語言模型，建立細(xì)胞詞庫包含如下步驟： S1.1采集專業(yè)故障描述語言； S1.2對所述專業(yè)故障描述語言進(jìn)行詞向量分解。5. 如權(quán)利要求4所述的基于決策樹分類和故障碼分類的車輛遠(yuǎn)程診斷與備件檢索的方法，其特征在于:所述語言模型的創(chuàng)建基于第n個(gè)所述細(xì)胞詞的出現(xiàn)只與前面n-1個(gè)所述細(xì) 胞詞相關(guān)的假設(shè);所述一故障描述語句T出現(xiàn)權(quán)重的計(jì)算公式為： P(T)=P(wi,W2,W3,-- - ,Wn) = P(W1) XP(W2 | Wl) XP(W3 | W1，W2) X …XP(Wn | W1，W2，…，Wn-1) ~P(W1) XP(W2 | Wl) XP(W3 | W2)…P(Wn| Wn-1); 其中，P ( T )為所述故障描述語句T的權(quán)重，P ( Wn I Wl，W2，???，Wn-1)為第n個(gè)所述細(xì)胞詞的權(quán) 重。6. 如權(quán)利要求1所述的基于決策樹分類和故障碼分類的車輛遠(yuǎn)程診斷與備件檢索的方法，其特征在于，所述步驟五中的細(xì)胞詞庫中切詞檢索細(xì)胞詞，并排列所述細(xì)胞詞的步驟是： S2.1針對所述一故障描述語句T在所述細(xì)胞詞庫中進(jìn)行切詞檢索； S2.2若檢索到所述細(xì)胞詞，計(jì)算所述細(xì)胞詞的權(quán)重； S2.3按照所述細(xì)胞詞權(quán)重的大小排列所述細(xì)胞詞。7. 如權(quán)利要求6所述的基于決策樹分類和故障碼分類的車輛遠(yuǎn)程診斷與備件檢索的方法，其特征在于， S2.2.1計(jì)算每個(gè)所述細(xì)胞詞的卡方統(tǒng)計(jì)量； S2.2.2取所述卡方統(tǒng)計(jì)量分值最高的第i個(gè)細(xì)胞詞，計(jì)算所述第i個(gè)細(xì)胞詞在第j個(gè)故障描述中出現(xiàn)的次數(shù);所述S2.2.1步驟所述卡方統(tǒng)計(jì)量分值的計(jì)算方法為： weight = round( (10 X (l+lg(tfij))/(l+lg( lj))) ,n)；其中tfij為第i個(gè)細(xì)胞詞在第j個(gè)故障描述中出現(xiàn)的次數(shù)，lj為第j個(gè)故障描述的長度，n 為3-6的整數(shù)。8. 如權(quán)利要求1所述的基于決策樹分類和故障碼分類的車輛遠(yuǎn)程診斷與備件檢索的方法，其特征在于，所述對故障碼識別和分類的方法，包括：首先利用訓(xùn)練數(shù)據(jù)集構(gòu)建樸素貝葉斯分類器；然后對新故障碼進(jìn)行具體分類；構(gòu)建樸素貝葉斯分類器的步驟為： S1:對訓(xùn)練集中的故障碼進(jìn)行人工分類； S2:將每個(gè)類別中的故障碼進(jìn)行分詞并計(jì)算每個(gè)詞的TF-IDF權(quán)重值； S3:根據(jù)TF-IDF權(quán)重值篩選出特征詞并建立特征詞庫； S4:分別計(jì)算每個(gè)類別中特征詞在該類別條件下的條件概率； S5:構(gòu)建樸素貝葉斯分類器。9. 如權(quán)利要求8所述的基于決策樹分類和故障碼分類的車輛遠(yuǎn)程診斷與備件檢索的方法，其特征在于，步驟S2中的 TFiS特征詞i的詞頻;^為特征詞i在所有故障 ). 碼中出現(xiàn)的次數(shù)，EjWj表示故障碼中所有特征詞的出現(xiàn)次數(shù)總和；IDFi為特征詞i的逆向文件頻率;E為語料 j 庫中故障碼的總數(shù)，{k:WlGek}表示包含特征詞i的故障碼數(shù)；步驟S2中的TF-IDF權(quán)重值為： TF-IDF = TFXIDF TF-IDF權(quán)重值是詞頻與逆向文件頻率的乘積。10. 如權(quán)利要求8所述的基于決策樹分類和故障碼分類的車輛遠(yuǎn)程診斷與備件檢索的方法，其特征在于，對新故障碼進(jìn)行具體分類，設(shè)在類別i中的故障碼為 ei，同時(shí)還有個(gè)待匹配的故障碼enew: 步驟1:由這兩組的特征詞集合構(gòu)成一個(gè)向量空間：步驟2:結(jié)合向量空間，分別得到兩個(gè)故障碼的詞向量值：步驟3:利用余弦相似度計(jì)算兩個(gè)故障碼近似情況；步驟4:如果所計(jì)算的相似度值大于閾值，則可以判斷這兩個(gè)故障碼是相同的；如果所計(jì)算的相似度值小于閾值，則繼續(xù)與已知故障碼庫中的其他類別故障碼進(jìn)行余弦相似度計(jì) 算;步驟S3中判斷兩個(gè)故障碼近似情況，具體公式如下：
【文檔編號】G05B23/02GK106054858SQ201610365652
【公開日】2016年10月26日
【申請日】2016年5月27日
【發(fā)明人】田雨農(nóng), 劉亮
【申請人】大連樓蘭科技股份有限公司

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：田雨農(nóng);劉亮;
技術(shù)所有人：大連樓蘭科技股份有限公司;
我是此專利的發(fā)明人

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請點(diǎn)此查看客服電話進(jìn)行咨詢。
1、唐老師：1.高效節(jié)能裝備 2.流動(dòng)穩(wěn)定性 3.汽車流場分析和淀粉糖工藝技術(shù)。
2、孫老師：1.振動(dòng)信號時(shí)頻分析理論與測試系統(tǒng)設(shè)計(jì) 2.汽車檢測系統(tǒng)設(shè)計(jì) 3.汽車電子控制系統(tǒng)設(shè)計(jì)
3、王老師：電子信息處理、先進(jìn)檢測方法和智能化儀表
4、周老師：1.智能電網(wǎng) 2.新能源利用 3.泛在電力物聯(lián)網(wǎng)
5、趙老師：檢測與控制技術(shù)、機(jī)器人技術(shù)、機(jī)電一體化技術(shù)
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點(diǎn)贊！

精彩留言，會給你點(diǎn)贊！

車輛故障診斷相關(guān)技術(shù)

機(jī)車車輛故障診斷相關(guān)技術(shù)

中南大學(xué)車輛故障診斷相關(guān)技術(shù)

車輛故障診斷論文相關(guān)技術(shù)

車輛振動(dòng)故障診斷相關(guān)技術(shù)

遠(yuǎn)程故障診斷相關(guān)技術(shù)

遠(yuǎn)程故障診斷系統(tǒng)相關(guān)技術(shù)

車輛遠(yuǎn)程診斷相關(guān)技術(shù)

国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

基于決策樹分類和故障碼分類的車輛遠(yuǎn)程診斷與備件檢索的方法