基于FP?Tree序列模式挖掘和故障碼分類的車輛遠(yuǎn)程診斷與備件檢索的方法
【專利摘要】基于FP?Tree序列模式挖掘和故障碼分類的車輛遠(yuǎn)程診斷與備件檢索的方法,屬于信息檢索領(lǐng)域,技術(shù)要點(diǎn)是:對(duì)故障碼識(shí)別和分類;根據(jù)事務(wù)數(shù)據(jù)庫(kù),通過(guò)FP?Tree算法創(chuàng)建故障碼和更換備件對(duì)應(yīng)關(guān)系的頻繁項(xiàng)集;利用備件位置和故障所在的ECU位置之間的拓?fù)潢P(guān)系,進(jìn)行拓?fù)渌阉鳎噙x頻繁項(xiàng)集;構(gòu)建備件與維修工項(xiàng)的對(duì)應(yīng)關(guān)系,形成故障碼對(duì)應(yīng)工項(xiàng)的診斷數(shù)據(jù)庫(kù);將診斷數(shù)據(jù)庫(kù)與診斷知識(shí)庫(kù)關(guān)聯(lián),并建立主鍵;效果是:可在獲取故障碼后,快速找到常見(jiàn)故障的解決方案和對(duì)應(yīng)備件、工項(xiàng)。
【專利說(shuō)明】
基于FP-Tree序列模式挖掘和故障碼分類的車輛遠(yuǎn)程診斷與 備件檢索的方法
技術(shù)領(lǐng)域
[0001] 本發(fā)明屬于信息檢索領(lǐng)域,涉及一種用于車輛遠(yuǎn)程診斷與備件檢索的方法
【背景技術(shù)】
[0002] 目前我國(guó)汽車維修行業(yè)已經(jīng)從完全依靠檢查者的感覺(jué)和實(shí)踐經(jīng)驗(yàn)進(jìn)行診斷的階 段,發(fā)展到了利用專門設(shè)備進(jìn)行綜合檢測(cè)診斷階段,但是在傳統(tǒng)汽車維修行業(yè)中普遍存在 著很多問(wèn)題,比如維修工人技術(shù)老化,經(jīng)常無(wú)法快速、經(jīng)濟(jì)地利用各方面的技術(shù)力量解決故 障;隨著汽車保有量的日益增多,汽車后市場(chǎng)各項(xiàng)服務(wù)如雨后春筍般大量涌現(xiàn)。那么從車主 角度,如何才能更好更全面的了解車況,發(fā)生故障時(shí),如何快速獲取愛(ài)車待解決方案及所需 工時(shí)及備件相關(guān)信息,精準(zhǔn)的汽車可穿戴設(shè)備對(duì)滿足車主實(shí)時(shí)需求是完全必要的。一般的 OBD車載設(shè)備,只能讀取到相關(guān)車輛故障信息,不能對(duì)故障做出詳細(xì)解決方案及相關(guān)維修人 工費(fèi)、備件費(fèi),從而造成車主盲目進(jìn)店,盲目消費(fèi)。
【發(fā)明內(nèi)容】
[0003] 為了解決車主車輛出現(xiàn)故障時(shí),能夠準(zhǔn)確和快速匹配該故障碼所對(duì)應(yīng)的工項(xiàng)與備 件,本發(fā)明提出如下技術(shù)方案:一種基于FP-Tree序列模式挖掘和故障碼分類的車輛遠(yuǎn)程診 斷與備件檢索的方法,包括
[0004] 步驟一.采集車輛信息數(shù)據(jù);
[0005] 步驟二.對(duì)故障碼識(shí)別和分類;
[0006]步驟三.解析車輛VIN碼得到變量,所述變量包括由VIN碼解析得到的發(fā)動(dòng)機(jī)排量、 車身類型、發(fā)動(dòng)機(jī)變速箱類型;
[0007] 步驟四.對(duì)變量所對(duì)應(yīng)的備件代碼做決策樹(shù)分析,完成變量數(shù)據(jù)歸類形成備件信 息,并建立索引,形成診斷知識(shí)庫(kù);
[0008] 步驟五.根據(jù)事務(wù)數(shù)據(jù)庫(kù),通過(guò)FP-Tree算法創(chuàng)建故障碼和更換備件對(duì)應(yīng)關(guān)系的頻 繁項(xiàng)集;利用備件位置和故障所在的ECU位置之間的拓?fù)潢P(guān)系,進(jìn)行拓?fù)渌阉鳎噙x頻繁項(xiàng) 集;構(gòu)建備件與維修工項(xiàng)的對(duì)應(yīng)關(guān)系,形成故障碼對(duì)應(yīng)工項(xiàng)的診斷數(shù)據(jù)庫(kù);
[0009] 步驟六.將診斷數(shù)據(jù)庫(kù)與診斷知識(shí)庫(kù)關(guān)聯(lián),并建立主鍵;
[0010]步驟七.對(duì)車輛故障生成的故障碼識(shí)別,并通過(guò)關(guān)鍵字解析車輛VIN碼得到的變量 以進(jìn)行分類檢索,得到工項(xiàng)及備件信息。
[0011]有意效果:本發(fā)明可以在獲取故障碼后,快速找到常見(jiàn)故障的解決方案和對(duì)應(yīng)備 件、工項(xiàng)。有效解決技師和備件員的經(jīng)驗(yàn)局限性問(wèn)題,從大數(shù)據(jù)出發(fā),獲得故障的解決方案。 本發(fā)明其具有對(duì)故障碼識(shí)別和分類的步驟,可以在不同車型間的故障碼出現(xiàn)差異時(shí),判斷 其一致性;且,本發(fā)明通過(guò)頻繁項(xiàng)集算法FP-Tree和序列模式挖掘?qū)ふ覍?duì)應(yīng)關(guān)系。采用兩算 法融合使用,提供了能基于大數(shù)據(jù),獲知準(zhǔn)確度高的故障碼和更換備件的對(duì)應(yīng)關(guān)系,適用于 除了單一故障還有多故障并行解決的可能性,遠(yuǎn)程估算車輛的故障碼判斷需要維修的備件 和工項(xiàng),提供完整解決方案,為車輛的維修提供參考和借鑒。
【附圖說(shuō)明】
[0012] 圖1為本發(fā)明用于車輛遠(yuǎn)程診斷與備件檢索的方法的流程圖;
[0013] 圖2為底盤(pán)號(hào)為L(zhǎng)FV5A14B8Y3000001的車輛的VIN號(hào)碼翻譯示意圖;
[0014]圖3為本發(fā)明實(shí)施例插入第一條故障碼和備件對(duì)應(yīng)關(guān)系的FP-Tree結(jié)構(gòu)示意圖; [0015]圖4為本發(fā)明實(shí)施例插入第二條故障碼和備件對(duì)應(yīng)關(guān)系的FP-Tree結(jié)構(gòu)示意圖; [0016]圖5為本發(fā)明實(shí)施例插入第三條故障碼和備件對(duì)應(yīng)關(guān)系的FP-Tree結(jié)構(gòu)示意圖; [00 17]圖6為本發(fā)明實(shí)施例生成的故障碼和備件對(duì)應(yīng)關(guān)系的FP-Tree結(jié)構(gòu)示意圖;
[0018] 圖7為本發(fā)明備件位置和車輛故障所在的ECU位置之間的拓?fù)潢P(guān)系圖。
【具體實(shí)施方式】
[0019] 實(shí)施例1: 一種基于FP-Tree序列模式挖掘和故障碼分類的車輛遠(yuǎn)程診斷與備件檢 索的方法,包括
[0020] 步驟一.采集車輛信息數(shù)據(jù);
[0021 ]步驟二.對(duì)故障碼識(shí)別和分類;
[0022]步驟三.解析車輛VIN碼得到變量,所述變量包括由VIN碼解析得到的發(fā)動(dòng)機(jī)排量、 車身類型、發(fā)動(dòng)機(jī)變速箱類型;
[0023]步驟四.對(duì)變量所對(duì)應(yīng)的備件代碼做決策樹(shù)分析,完成變量數(shù)據(jù)歸類形成備件信 息,并建立索引,形成診斷知識(shí)庫(kù);
[0024] 步驟五.根據(jù)事務(wù)數(shù)據(jù)庫(kù),通過(guò)FP-Tree算法創(chuàng)建故障碼和更換備件對(duì)應(yīng)關(guān)系的頻 繁項(xiàng)集;利用備件位置和故障所在的ECU位置之間的拓?fù)潢P(guān)系,進(jìn)行拓?fù)渌阉?,遴選頻繁項(xiàng) 集;構(gòu)建備件與維修工項(xiàng)的對(duì)應(yīng)關(guān)系,形成故障碼對(duì)應(yīng)工項(xiàng)的診斷數(shù)據(jù)庫(kù);
[0025] 步驟六.將診斷數(shù)據(jù)庫(kù)與診斷知識(shí)庫(kù)關(guān)聯(lián),并建立主鍵;
[0026] 步驟七.對(duì)車輛故障生成的故障碼識(shí)別,并通過(guò)關(guān)鍵字解析車輛VIN碼得到的變量 以進(jìn)行分類檢索,得到工項(xiàng)及備件信息。
[0027] 實(shí)施例2:具有與實(shí)施例1相同的技術(shù)方案,更為具體的,對(duì)于實(shí)施例1的步驟四來(lái) 說(shuō),
[0028] 所述步驟四中以維修備件表的歷史記錄為數(shù)據(jù)基礎(chǔ),通過(guò)決策樹(shù)模型對(duì)備件做分 類,維修備件表樣例如表一所不:
[0029] 表一
[0031] 決策樹(shù)模型的基本原理如下:
[0032] 首先:確定每一維度備件不同分類的熵,以VIM為例,熵定義為
[0033] E = sum(_p(I)*log(p(I)))
[0034] 其中I = I:N(N類結(jié)果,如本例1種,即該備件屬于此車型,故概率P( I) = I)
[0035] 則E(5) =-(1/1 )Log2( 1/1 )-(0/1 )Log2(0/l )=0+0 = 0
[0036] E(3) =-( 1/1 )Log2( 1/1 )-(0/1 )Log2(0/l )=0+0 = 0
[0037] E(4) =-( 1/1 )Log2( 1/1 )-(0/1 )Log2(0/l )=0+0 = 0
[0038] 如果熵為0,則表明區(qū)分度越高;熵為I,則表明沒(méi)有區(qū)分度;
[0039] 故這三個(gè)不同的備件代碼可以通過(guò)VIM做區(qū)分。
[0040]確定完每個(gè)維度如何分類后,不同維度之間的優(yōu)先級(jí)別通過(guò)信息增益區(qū)分 [0041 ] Gain(SamplejAction)=E(sample)-sum(|Sample(v)|/Sample*E(Sample(v)))
[0042] 貝 IjGain(VIM) =E(S)-(1/3)*E(5)-(1/3)*E(3)-(1/3)*E(4) = 1-0 = I
[0043] Gain(VIN6) =E(S)-( 1/3)*E( I )-(2/3)*E(2) = 1-0-2/3 = 1/3
[0044] Gain(VIN78)=E(S)-(l/3)*E(4B)-(l/3)*E(8K)-(l/3)*E(4F) = 1-0 = 1
[0045] 如果信息增益越大,則表明分類優(yōu)先級(jí)越高;反之,優(yōu)先級(jí)越低。
[0046]所以,底盤(pán)號(hào)第4位(VIN4)和底盤(pán)號(hào)78位(VIN78)的分類優(yōu)先級(jí)相同,其次是底盤(pán) 號(hào)第6位(VIN6)。
[0047] 通過(guò)以上關(guān)鍵步驟,可將備件代碼按照底盤(pán)號(hào)第4位(VIN4)、底盤(pán)號(hào)第6位(VIN6) 和底盤(pán)號(hào)78位(VIN78)區(qū)分。
[0048] 綜上所述,備件檢索方法的基本步驟是:
[0049] 將維修備件表同一維度按信息熵做區(qū)分;
[0050] 將維修備件表不同維度按信息增益劃分優(yōu)先級(jí);
[0051] 按照1、2步劃分的優(yōu)先級(jí)和區(qū)分程度畫(huà)出決策樹(shù);
[0052] 輸入一個(gè)規(guī)則的底盤(pán)號(hào),系統(tǒng)根據(jù)¥預(yù)123、¥1財(cái)、¥預(yù)6、¥預(yù)78以及得出的決策樹(shù)輸 出該車型下的備件代碼。
[0053] 該備件代碼通過(guò)關(guān)聯(lián)備件價(jià)格表,得到備件的中文名稱、價(jià)格和現(xiàn)在使用狀態(tài)以 及備件的適用車型信息。
[0054] 上述技術(shù)方案的獲得,是在將不同車型、不同排量、不同發(fā)動(dòng)機(jī)變速箱類型所對(duì)應(yīng) 的備件代碼逐一歸類進(jìn)行分析對(duì)比后,發(fā)現(xiàn)在相同主組號(hào)前提下,車型排量等信息不同,所 對(duì)應(yīng)的備件代碼也不盡相同,為了找尋其中規(guī)律,使用了上述方法,以形成較完備且全面的 理論知識(shí)信息庫(kù)。
[0055] 實(shí)施例3:具有與實(shí)施例1或2相同的技術(shù)方案,更為具體的,對(duì)于實(shí)施例1的步驟五 來(lái)說(shuō),
[0056]所述步驟五中,根據(jù)事務(wù)數(shù)據(jù)庫(kù),通過(guò)FP-Tree算法創(chuàng)建故障碼和更換備件對(duì)應(yīng)關(guān) 系的頻繁項(xiàng)集的步驟,包含
[0057] SI. 1輸入事務(wù)數(shù)據(jù)庫(kù)和最小支持度閾值min〇,掃描事務(wù)數(shù)據(jù)庫(kù),刪除頻數(shù)小于最 小支持度的項(xiàng)目,得到全部頻繁項(xiàng)集Fl,對(duì)Fl中的頻繁項(xiàng)按其支持度降序排列得到L;
[0058] Sl. 2創(chuàng)建FP-Tree的根節(jié)點(diǎn),以"null"標(biāo)記,再次掃描事務(wù)數(shù)據(jù)庫(kù),把事務(wù)數(shù)據(jù)庫(kù) 中的每一條記錄按照L中的順序排列,生成FP-Tree;
[0059] Sl. 3從FP-Tree中找到所有的頻繁模式。
[0060]所述步驟五中,利用備件位置和故障所在的ECU位置之間的拓?fù)潢P(guān)系,進(jìn)行拓?fù)渌?索,遴選頻繁項(xiàng)集的步驟包括:
[0061 ] S2.1根據(jù)備件碼的構(gòu)造規(guī)則將備件進(jìn)行分類;
[0062] S2.2對(duì)備件和故障所在的ECU位置構(gòu)建拓?fù)潢P(guān)系,并將所述拓?fù)潢P(guān)系進(jìn)行標(biāo)識(shí),得 到備件和ECU位置的對(duì)應(yīng)關(guān)系。
[0063] 所述步驟五中,構(gòu)建備件與維修工項(xiàng)的對(duì)應(yīng)關(guān)系,形成故障碼對(duì)應(yīng)工項(xiàng)的診斷數(shù) 據(jù)庫(kù)的步驟包括:
[0064] S3.1掃描備件與維修工項(xiàng)的數(shù)據(jù)庫(kù),獲得備件與維修工項(xiàng)的頻繁項(xiàng)集F2;對(duì)F2中 的頻繁項(xiàng)按其支持度降序排列得到L' ;
[0065] S3.2創(chuàng)建FP-Tree的根節(jié)點(diǎn),以"null"標(biāo)記,再次數(shù)據(jù)庫(kù),把數(shù)據(jù)庫(kù)中的每一條記 錄按照L'中的順序排列,生成FP-Tree;
[0066] S3.3從FP-Tree中找到所有的頻繁模式,構(gòu)建備件與維修工項(xiàng)的對(duì)應(yīng)關(guān)系。
[0067] 按照SI. 1或S3.1排序后的頻繁項(xiàng)表為[p|P],其中p是第一個(gè)頻繁項(xiàng),而P是剩余的 頻繁項(xiàng)的列表。調(diào)用insert_tree( [p |P],T),insert_tree([p |P],T)過(guò)程執(zhí)行情況如下:如 果T有子節(jié)點(diǎn)N使Ν. item_name = p. item_name,則N的計(jì)數(shù)增加1;否則創(chuàng)建一個(gè)新節(jié)點(diǎn)Ν,將 其計(jì)數(shù)設(shè)置為1,鏈接到它的父節(jié)點(diǎn)T,并且通過(guò)node_link將其鏈接到具有相同名稱item_ name的節(jié)點(diǎn);如果P非空,遞歸調(diào)用insert_tree(P,N)。8、對(duì)于FP-Tree是單枝的情況,直接 輸出整條路徑上所有節(jié)點(diǎn)的組合+PostModel。
[0068] 所述的備件分別按照附件、娛樂(lè)信息,發(fā)動(dòng)機(jī),燃油、排氣、空調(diào),變速箱,前軸、轉(zhuǎn) 向裝置,后軸,車輪、制動(dòng)器,踏板機(jī)構(gòu),車身,電子設(shè)備進(jìn)行〇~9分類。
[0069] 實(shí)施例4:具有與實(shí)施例1或2或3相同的技術(shù)方案,更為具體的,對(duì)于實(shí)施例1的步 驟二來(lái)說(shuō),
[0070] 所述對(duì)故障碼識(shí)別和分類的方法,包括:
[0071] 首先利用訓(xùn)練數(shù)據(jù)集構(gòu)建樸素貝葉斯分類器,具體步驟為:
[0072] SI:對(duì)訓(xùn)練集中的故障碼進(jìn)行人工分類,人工分類后的類別集為c:
[0073] C= {ci,C2,…,Ci,…,cn};
[0074] S2:將每個(gè)類別中的故障碼進(jìn)行分詞并計(jì)算每個(gè)詞的TF-IDF權(quán)重值;
[0075]
[0076] TF1S特征詞i的詞頻;^為特征詞i在所有故障碼中出現(xiàn)的次數(shù),表示故障碼 中所有特征詞的出現(xiàn)次數(shù)總和;
[0077]
[0078] IDFi為特征詞i的逆向文件頻率;E為語(yǔ)料庫(kù)中故障碼的總數(shù),{k:Wi e 表示包含 特征詞i的故障碼數(shù);
[0079] TF-IDF權(quán)重值為:TF-IDF = TF X IDF,也就是是詞頻與逆向文件頻率的乘積;
[0080] S3:根據(jù)TF-IDF權(quán)重值篩選出特征詞并建立特征詞庫(kù),將故障碼e定義成若干個(gè)特 征詞的集合:
[0081] e = {wi,W2,…,wn}
[0082] S4:分別計(jì)算每個(gè)類別中特征詞在該類別條件下的條件概率,依據(jù)貝葉斯定理計(jì) 算出某個(gè)故障碼e屬于C1類故障的概率,具體公式如下:
[0083] P(Ci|e) = [P(e|ci)P(ci)]/P(e)
[0084] 其中,P(e)為從故障碼空間中隨機(jī)抽取一個(gè)故障碼e的概率;P(C1)為一個(gè)故障碼 類別C1在故障碼空間所占比率;P(e Ic1)為對(duì)于給定的故障碼類別(^中故障碼e的出現(xiàn)概率;
[0085] 對(duì)于每個(gè)故障碼類別而言,從故障碼空間中隨機(jī)抽取一個(gè)故障碼的概率都是一樣 的,因此P(e)可以忽略不予計(jì)算,這樣公式(1)就可以寫(xiě)成如下形式:
[0086] P(ci I e) °cP(e I Ci)P(Ci)
[0087] 計(jì)算某個(gè)故障碼在每個(gè)分類中概率,取擁有最大概率值的類別為該故障碼的分類 結(jié)果,具體為:
[0088] G(e) =argmax{P(e | Ci)P(ci)} 〇
[0089] S5:構(gòu)建樸素貝葉斯分類器。
[0090] 然后對(duì)新故障碼進(jìn)行具體分類,具體為:
[0091] 更具體的,對(duì)新故障碼進(jìn)行具體分類,設(shè)在類別i中的故障碼為ei,同時(shí)還有個(gè)待 匹配的故障碼e new,它們的分詞情況如下:
[0092] ei= {W1,W2,W3,W4}
[0093] enew= {w2,W3,W5}
[0094] 步驟I:由這兩組的特征詞集合構(gòu)成一個(gè)向量空間:
[0095]
[0096] 步驟2:結(jié)合向量空間,分別得到兩個(gè)故障碼的詞向量值:
[0097:
[0098:
[0099] 步驟3:利用余弦相似度計(jì)算兩個(gè)故障碼近似情況,具體公式如下:
[0100]
[0101]步驟4:如果所計(jì)算的相似度值大于80%,則可以判斷這兩個(gè)故障碼是相同的;如 果所計(jì)算的相似度值小于閾值,則繼續(xù)與已知故障碼庫(kù)中的其他類別故障碼進(jìn)行余弦相似 度計(jì)算。
[0102] 采用以上技術(shù)方法,能夠取得如下的技術(shù)效果:準(zhǔn)確地自動(dòng)分類不同車型的故障 碼,將數(shù)以億級(jí)的故障碼進(jìn)行收斂,實(shí)現(xiàn)不同車廠車型間故障問(wèn)題、解決方案的探索。能節(jié) 省大量的勞動(dòng)力,縮短工作周期,降低成本。
[0103] 實(shí)施例5:具有與實(shí)施例3相同的技術(shù)方案,作為實(shí)施例3的補(bǔ)充,還具有如下技術(shù) 方案:
[0104] 一、FP-Tree 算法
[0105]利用FP-Tree,緊縮的數(shù)據(jù)結(jié)構(gòu)來(lái)存儲(chǔ)查找頻繁項(xiàng)集,挖掘關(guān)聯(lián)規(guī)則,根據(jù)置信度、 支持度等提取出故障和備件的可能項(xiàng)集。
[0106]輸入:事務(wù)數(shù)據(jù)庫(kù)D(故障碼和更換備件的連接關(guān)系)和最小支持度閾值mino;
[0107]輸出:事務(wù)數(shù)據(jù)庫(kù)D所對(duì)應(yīng)的FP-tree。
[0108] FP-tree是按以下步驟構(gòu)造的:
[0109] 1、掃描事務(wù)數(shù)據(jù)庫(kù)D,獲得事務(wù)數(shù)據(jù)庫(kù)D中所包含的全部頻繁項(xiàng)集Fl,及它們各自 的支持度。對(duì)Fl中的頻繁項(xiàng)按其支持度降序排序得到L。
[0110] 2、創(chuàng)建FP-tree的根節(jié)點(diǎn)T,以"null"標(biāo)記,再次掃描事務(wù)數(shù)據(jù)庫(kù)D,對(duì)于事務(wù)數(shù)據(jù) 庫(kù)D中每個(gè)事務(wù),將其中的頻繁項(xiàng)選出并按L中的次序排序。設(shè)排序后的頻繁項(xiàng)表為[p|P], 其中P是第一個(gè)頻繁項(xiàng),而P是剩余的頻繁項(xiàng)。調(diào)用insert_tree([p IP],T)。insert_tree([p |P],T)過(guò)程執(zhí)行情況如下:如果T有子節(jié)點(diǎn)N使Ν· item_name = p. item_name,則N的計(jì)數(shù)增加 1;否則創(chuàng)建一個(gè)新節(jié)點(diǎn)N,將其計(jì)數(shù)設(shè)置為1,鏈接到它的父節(jié)點(diǎn)T,并且通過(guò)node_link將其 鏈接到具有相同item_name的節(jié)點(diǎn)。如果P非空,遞歸地調(diào)用insert_tree(P,N) AP-tree是 一個(gè)高度壓縮的結(jié)構(gòu),它存儲(chǔ)了用于挖掘頻繁項(xiàng)集的全部信息。
[0111] 對(duì)于FP-Tree已經(jīng)是單枝的情況,就沒(méi)有必要再遞歸調(diào)用FPGrowth了,直接輸出整 條路徑上所有節(jié)點(diǎn)的各種組合+PostModel就可了。
[0112] 事務(wù)數(shù)據(jù)庫(kù)如下,每一行代表一次故障碼和更換備件的可能關(guān)系:
[0114]~~目的:找出一種總是相伴出現(xiàn)的組合,比如故障B和備件D總一起出現(xiàn),則[故障B, 備件D]是一條頻繁模式。通過(guò)FP-Tree得到一部分粗略的關(guān)系,然后通過(guò)拓?fù)渌阉骷?xì)化,剔 除不滿足拓?fù)潢P(guān)系的組合。
[0115] (1)掃描數(shù)據(jù)庫(kù),每項(xiàng)按頻數(shù)遞減排序,并刪除頻數(shù)小于最小支持度MinSup的項(xiàng) 目。
[0116] 故障A :7
[0117] 故障B :8
[0118] 備件C :7
[0119] 備件D:7
[0120]
[0121] 備件F :5
[0122] 備科^
[0123] * 本次掃描{Minsup = 3}
[0124] 則故障B、備件C、備件D、故障A、備件F為頻繁1項(xiàng)集,計(jì)為Fl。
[0125] (2)對(duì)于每一條故障碼和更換備件的可能關(guān)系,按照Fl中的順序重新排序。
[0127] (3)把第(2)步驟中得到的各條記錄插入到FP-Tree中。初始后綴模式為空,最終生 成FP-Tree如圖1~4所示。
[0128] 圖4中最左邊的一側(cè)叫做表頭項(xiàng),樹(shù)中相同名稱的節(jié)點(diǎn)要鏈接起來(lái),鏈表的第一個(gè) 元素就是表頭項(xiàng)里的元素。如果FP-Tree為空(只含一個(gè)虛的root節(jié)點(diǎn)),則FP-Growth函數(shù) 返回。此時(shí)輸出表頭項(xiàng)的每一項(xiàng)+pos tMode 1,支持度為表頭項(xiàng)中對(duì)應(yīng)項(xiàng)的計(jì)數(shù)。
[0129] (4)表頭項(xiàng)中的每一項(xiàng)(我們拿"故障A:7"為例),對(duì)于各項(xiàng)都執(zhí)行以下①到⑤的操 作:
[0130] ①?gòu)腇P-Tree中找到所有的"故障A"節(jié)點(diǎn),向上遍歷它的祖先節(jié)點(diǎn),得到4條路徑:
[0134]③因?yàn)槊恳豁?xiàng)末尾都是故障A,可以把故障A去掉,得到條件模式基(Conditional Pattern Base,CPB),此時(shí)的后綴模式是:(故障A)。
[0136] ④把上面的結(jié)果當(dāng)作原始的事務(wù)數(shù)據(jù)庫(kù),返回到第3步,遞歸迭代運(yùn)行。
[0137] ⑤最終得到的頻繁項(xiàng)集為(去除只有備件或者只有故障的關(guān)系集)
[0140] 二、拓?fù)渌阉?br>[0141] 對(duì)關(guān)聯(lián)算法得出的故障和備件(項(xiàng)目)的可能項(xiàng)集進(jìn)行進(jìn)一步收縮,利用車輛構(gòu) 造,限制備件位置和車輛故障所在的ECU位置之間的拓?fù)潢P(guān)系,在有限范圍內(nèi)遴選頻繁項(xiàng) 集。
[0142] 根據(jù)備件碼的構(gòu)造規(guī)則,進(jìn)行備件分類,具體如下:
[0143] 1(發(fā)動(dòng)機(jī)):發(fā)動(dòng)機(jī)總成、缸體、缸蓋、活塞、連桿、連接部件、發(fā)動(dòng)機(jī)托架、支架急緊 固件,燃油噴射如進(jìn)氣管、空氣流量計(jì)等;
[0144] 2(燃油、排氣、空調(diào)冷卻):燃油箱、排氣管、空調(diào)制冷系統(tǒng)等;
[0145] 3(變速箱):變速箱總成及內(nèi)部部件;
[0146] 4(前軸、轉(zhuǎn)向裝置):前輪驅(qū)動(dòng)差速器、轉(zhuǎn)向系統(tǒng)(轉(zhuǎn)向機(jī))、前減震器等;
[0147] 5(后軸):后軸、后輪驅(qū)動(dòng)差速器,后減震器,如后橋、后輪軸承等;
[0148] 6(車輪、制動(dòng)器):車輪、車輪裝飾蓋、剎車系統(tǒng);
[0149] 7(踏板機(jī)構(gòu)):手腳制動(dòng)系統(tǒng);
[0150] 8(車身):車身及裝飾件,空調(diào)殼體,前后保險(xiǎn)杠,如車身總成、空調(diào)通風(fēng)系統(tǒng)等;
[0151] 9 (電子設(shè)備):電器,如發(fā)動(dòng)機(jī)、起動(dòng)機(jī)、控制器、燈具、線束等;
[0152] 0(附件、信息娛樂(lè)):附件(千斤頂,天線,收音機(jī),發(fā)動(dòng)機(jī)底護(hù)板)及油漆材料等。
[0153] 采用FP-Free頻繁項(xiàng)集算法構(gòu)建備件與維修項(xiàng)目(工項(xiàng))之間的對(duì)應(yīng)關(guān)系,從而獲 得故障碼對(duì)應(yīng)備件和工項(xiàng)的完整解決方案。
[0154] 2、備件號(hào)碼分類對(duì)應(yīng)車輛ECU名稱拓?fù)潢P(guān)系
[0165] 通過(guò)上述方法結(jié)合找到故障與備件的對(duì)應(yīng)關(guān)系,獲得故障碼對(duì)應(yīng)備件和工項(xiàng)的完 整解決方案。
[0166] 以上所述,僅為本發(fā)明創(chuàng)造較佳的【具體實(shí)施方式】,但本發(fā)明創(chuàng)造的保護(hù)范圍并不 局限于此,任何熟悉本技術(shù)領(lǐng)域的技術(shù)人員在本發(fā)明創(chuàng)造披露的技術(shù)范圍內(nèi),根據(jù)本發(fā)明 創(chuàng)造的技術(shù)方案及其發(fā)明構(gòu)思加以等同替換或改變,都應(yīng)涵蓋在本發(fā)明創(chuàng)造的保護(hù)范圍之 內(nèi)。
【主權(quán)項(xiàng)】
1. 一種基于FP-Tree序列模式挖掘和故障碼分類的車輛遠(yuǎn)程診斷與備件檢索的方法, 其特征在于,包括 步驟一.采集車輛信息數(shù)據(jù); 步驟二.對(duì)故障碼識(shí)別和分類; 步驟三.解析車輛VIN碼得到變量,所述變量包括由VIN碼解析得到的發(fā)動(dòng)機(jī)排量、車身 類型、發(fā)動(dòng)機(jī)變速箱類型; 步驟四.對(duì)變量所對(duì)應(yīng)的備件代碼做決策樹(shù)分析,完成變量數(shù)據(jù)歸類形成備件信息,并 建立索引,形成診斷知識(shí)庫(kù); 步驟五.根據(jù)事務(wù)數(shù)據(jù)庫(kù),通過(guò)FP-Tree算法創(chuàng)建故障碼和更換備件對(duì)應(yīng)關(guān)系的頻繁項(xiàng) 集;利用備件位置和故障所在的ECU位置之間的拓?fù)潢P(guān)系,進(jìn)行拓?fù)渌阉?,遴選頻繁項(xiàng)集;構(gòu) 建備件與維修工項(xiàng)的對(duì)應(yīng)關(guān)系,形成故障碼對(duì)應(yīng)工項(xiàng)的診斷數(shù)據(jù)庫(kù); 步驟六.將診斷數(shù)據(jù)庫(kù)與診斷知識(shí)庫(kù)關(guān)聯(lián),并建立主鍵; 步驟七.對(duì)車輛故障生成的故障碼識(shí)別,并通過(guò)關(guān)鍵字解析車輛VIN碼得到的變量以進(jìn) 行分類檢索,得到工項(xiàng)及備件信息。2. 如權(quán)利要求1所述的基于FP-Tree序列模式挖掘和故障碼分類的車輛遠(yuǎn)程診斷與備 件檢索的方法,其特征在于,所述步驟四中以維修備件表的歷史記錄為數(shù)據(jù)基礎(chǔ),通過(guò)決策 樹(shù)模型對(duì)備件做分類; 備件檢索方法的步驟是: (1) 將維修備件表同一維度按信息熵做區(qū)分; (2) 將維修備件表不同維度按信息增益劃分優(yōu)先級(jí); (3) 按照步驟(1)、(2)劃分的優(yōu)先級(jí)和區(qū)分程度畫(huà)出決策樹(shù); (4) 輸入一個(gè)規(guī)則的VIN碼,根據(jù)VIN碼以及得出的決策樹(shù)輸出該車型下的備件代碼。3. 如權(quán)利要求2所述的基于FP-Tree序列模式挖掘和故障碼分類的車輛遠(yuǎn)程診斷與備 件檢索的方法,其特征在于,所述備件代碼關(guān)聯(lián)備件的價(jià)格表,所述備件信息包括備件的中 文名稱、價(jià)格和現(xiàn)在使用狀態(tài)以及備件的適用車型信息。4. 如權(quán)利要求1所述的基于FP-Tree序列模式挖掘和故障碼分類的車輛遠(yuǎn)程診斷與備 件檢索的方法,其特征在于,所述步驟五中,根據(jù)事務(wù)數(shù)據(jù)庫(kù),通過(guò)FP-Tree算法創(chuàng)建故障碼 和更換備件對(duì)應(yīng)關(guān)系的頻繁項(xiàng)集的步驟,包含 SI. 1輸入事務(wù)數(shù)據(jù)庫(kù)和最小支持度閾值η?ησ,掃描事務(wù)數(shù)據(jù)庫(kù),刪除頻數(shù)小于最小支 持度的項(xiàng)目,得到全部頻繁項(xiàng)集F1,對(duì)F1中的頻繁項(xiàng)按其支持度降序排列得到L; S1.2創(chuàng)建FP-Tree的根節(jié)點(diǎn),以"nulΓ標(biāo)記,再次掃描事務(wù)數(shù)據(jù)庫(kù),把事務(wù)數(shù)據(jù)庫(kù)中的 每一條記錄按照L中的順序排列,生成FP-Tree; S1.3從FP-Tree中找到所有的頻繁模式。5. 如權(quán)利要求1所述的基于FP-Tree序列模式挖掘和故障碼分類的車輛遠(yuǎn)程診斷與備 件檢索的方法,其特征在于,所述步驟五中,利用備件位置和故障所在的ECU位置之間的拓 撲關(guān)系,進(jìn)行拓?fù)渌阉鳎噙x頻繁項(xiàng)集的步驟包括: S2.1根據(jù)備件碼的構(gòu)造規(guī)則將備件進(jìn)行分類; S2.2對(duì)備件和故障所在的ECU位置構(gòu)建拓?fù)潢P(guān)系,并將所述拓?fù)潢P(guān)系進(jìn)行標(biāo)識(shí),得到備 件和ECU位置的對(duì)應(yīng)關(guān)系。6. 如權(quán)利要求1所述的基于FP-Tree序列模式挖掘和故障碼分類的車輛遠(yuǎn)程診斷與備 件檢索的方法,其特征在于,所述步驟五中,構(gòu)建備件與維修工項(xiàng)的對(duì)應(yīng)關(guān)系,形成故障碼 對(duì)應(yīng)工項(xiàng)的診斷數(shù)據(jù)庫(kù)的步驟包括: S3.1掃描備件與維修工項(xiàng)的數(shù)據(jù)庫(kù),獲得備件與維修工項(xiàng)的頻繁項(xiàng)集F2;對(duì)F2中的頻 繁項(xiàng)按其支持度降序排列得到L' ; S3.2創(chuàng)建FP-Tree的根節(jié)點(diǎn),以"nulΓ標(biāo)記,再次數(shù)據(jù)庫(kù),把數(shù)據(jù)庫(kù)中的每一條記錄按 照L'中的順序排列,生成FP-Tree; S3.3從FP-Tree中找到所有的頻繁模式,構(gòu)建備件與維修工項(xiàng)的對(duì)應(yīng)關(guān)系。7. 如權(quán)利要求4或5或6所述的基于FP-Tree序列模式挖掘和故障碼分類的車輛遠(yuǎn)程診 斷與備件檢索的方法,其特征在于,按照S1.1或S3.1排序后的頻繁項(xiàng)表為[p|P],其中p是第 一個(gè)頻繁項(xiàng),而P是剩余的頻繁項(xiàng)的列表,調(diào)用insert_tree([p |p],T),insert_tree([p P],T)過(guò)程執(zhí)行情況如下:如果T有子節(jié)點(diǎn)N使N. item_name = p. item_name,貝ijN的計(jì)數(shù)增加 1;否則創(chuàng)建一個(gè)新節(jié)點(diǎn)N,將其計(jì)數(shù)設(shè)置為1,鏈接到它的父節(jié)點(diǎn)T,并且通過(guò)node_link將其 鏈接到具有相同名稱item_name的節(jié)點(diǎn);如果P非空,遞歸調(diào)用insert_tree(P,N)。8. 如權(quán)利要求1所述的基于FP-Tree序列模式挖掘和故障碼分類的車輛遠(yuǎn)程診斷與備 件檢索的方法,其特征在于,所述對(duì)故障碼識(shí)別和分類的方法,包括: 首先利用訓(xùn)練數(shù)據(jù)集構(gòu)建樸素貝葉斯分類器; 然后對(duì)新故障碼進(jìn)行具體分類; 構(gòu)建樸素貝葉斯分類器的步驟為: S1:對(duì)訓(xùn)練集中的故障碼進(jìn)行人工分類; S2:將每個(gè)類別中的故障碼進(jìn)行分詞并計(jì)算每個(gè)詞的TF-IDF權(quán)重值; S3:根據(jù)TF-IDF權(quán)重值篩選出特征詞并建立特征詞庫(kù); S4:分別計(jì)算每個(gè)類別中特征詞在該類別條件下的條件概率; S5:構(gòu)建樸素貝葉斯分類器。9. 如權(quán)利要求8所述的基于FP-Tree序列模式挖掘和故障碼分類的車輛遠(yuǎn)程診斷與備 件檢索的方法,其特征在于,步驟S2中的為特征詞i的詞頻;Wi為特征詞i在 所有故障碼中出現(xiàn)的次數(shù),表示故障碼中所有特征詞的出現(xiàn)次數(shù)總和;為特征詞i的逆向文件頻率;Ε為語(yǔ)料 庫(kù)中故障碼的總數(shù),表示包含特征詞i的故障碼數(shù); 步驟S2中的TF-IDF權(quán)重值為: TF-IDF = TFXIDF TF-IDF權(quán)重值是詞頻與逆向文件頻率的乘積。10. 如權(quán)利要求8所述的基于FP-Tree序列模式挖掘和故障碼分類的車輛遠(yuǎn)程診斷與備 件檢索的方法,其特征在于,對(duì)新故障碼進(jìn)行具體分類,設(shè)在類別i中的故障碼為 ei,同時(shí)還 有個(gè)待匹配的故障碼enew: 步驟1:由這兩組的特征詞集合構(gòu)成一個(gè)向量空間: 步驟2:結(jié)合向量空間,分別得到兩個(gè)故障碼的詞向量值: 步驟3:利用余弦相似度計(jì)算兩個(gè)故障碼近似情況; 步驟4:如果所計(jì)算的相似度值大于閾值,則可以判斷這兩個(gè)故障碼是相同的;如果所 計(jì)算的相似度值小于閾值,則繼續(xù)與已知故障碼庫(kù)中的其他類別故障碼進(jìn)行余弦相似度計(jì) 算;步驟S3中判斷兩個(gè)故障碼近似情況,具體公式如下:
【文檔編號(hào)】G06Q10/00GK106056221SQ201610363507
【公開(kāi)日】2016年10月26日
【申請(qǐng)日】2016年5月27日
【發(fā)明人】田雨農(nóng), 劉亮
【申請(qǐng)人】大連樓蘭科技股份有限公司