離群值檢測(cè)設(shè)備、離群值檢測(cè)方法和車輛故障診斷系統(tǒng)的制作方法
【專利摘要】本發(fā)明提供了一種離群值檢測(cè)設(shè)備等,該離群值檢測(cè)設(shè)備等輔助或執(zhí)行在實(shí)用時(shí)間內(nèi)的離群值的檢測(cè),而不對(duì)非線性數(shù)據(jù)集執(zhí)行參數(shù)調(diào)整操作。離群值檢測(cè)設(shè)備(1)針對(duì)每一個(gè)維度轉(zhuǎn)換數(shù)據(jù)集中包括的多個(gè)數(shù)據(jù)的每一個(gè),并且基于比特序列來(lái)建立用于數(shù)據(jù)集的觀察區(qū)域。然后,離群值檢測(cè)設(shè)備(1)從在數(shù)據(jù)集中包括的多個(gè)數(shù)據(jù)逐個(gè)地確定一個(gè)目標(biāo)數(shù)據(jù),并且基于當(dāng)從觀察區(qū)域去除與目標(biāo)數(shù)據(jù)對(duì)應(yīng)的區(qū)域時(shí)與該目標(biāo)數(shù)據(jù)相鄰的數(shù)據(jù)的數(shù)據(jù)密度來(lái)計(jì)算該目標(biāo)數(shù)據(jù)的偏離度。
【專利說(shuō)明】離群值檢測(cè)設(shè)備、離群值檢測(cè)方法和車輛故障診斷系統(tǒng)
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及離群值檢測(cè)設(shè)備等,該離群值檢測(cè)設(shè)備等輔助或執(zhí)行從包括多個(gè)數(shù)據(jù)的數(shù)據(jù)集中檢測(cè)離群值,該多個(gè)數(shù)據(jù)的每一個(gè)具有一個(gè)或多個(gè)維度。
【背景技術(shù)】
[0002]離群值檢測(cè)問(wèn)題被認(rèn)為是用于從給定的數(shù)據(jù)集中找出作為離群值的屬于低數(shù)據(jù)密度區(qū)域的數(shù)據(jù)。用于解決離群值檢測(cè)問(wèn)題的技術(shù)的應(yīng)用示例例如包括:用于去除在數(shù)據(jù)集中包含的噪聲數(shù)據(jù)的處理(用于數(shù)據(jù)篩選的預(yù)處理);用于從信用交易的數(shù)據(jù)集中檢測(cè)進(jìn)行異常交易的客戶的處理;用于從在生產(chǎn)線中的產(chǎn)品的數(shù)據(jù)集中檢測(cè)缺陷的處理等。
[0003]作為用于解決離群值檢測(cè)問(wèn)題的技術(shù),例如,已知馬哈拉諾比斯距離、單類支持向量機(jī)(以下縮寫為“0C-SVM”)和局部離群因子(以下,縮寫為“L0F”)。
[0004]NPLl描述了馬哈拉諾比斯距離。在NPLl中,計(jì)算整個(gè)給定的數(shù)據(jù)集的質(zhì)心(平均值)和協(xié)方差矩陣,使用協(xié)方差矩陣來(lái)計(jì)算從每一個(gè)數(shù)據(jù)到歸一化的質(zhì)心的距離,并且,將具有大距離的數(shù)據(jù)看作離群值。
[0005]在馬哈拉諾比斯距離中,假定數(shù)據(jù)集符合多變量正態(tài)分布。在不能使用多變量正態(tài)分布來(lái)描述數(shù)據(jù)集的情況下,即,在數(shù)據(jù)集是非線性的情況下,不能檢測(cè)適當(dāng)?shù)碾x群值。
[0006]NPL2描述了 0C-SVM。在NPL2中,通過(guò)非線性映射將接收的數(shù)據(jù)集映射到高階特征空間F內(nèi),并且從其中每一個(gè)將映射的數(shù)據(jù)組與原點(diǎn)分離的超平面中選擇相對(duì)于原點(diǎn)最遠(yuǎn)的超平面。在采用OC-SVM來(lái)解決離群值檢測(cè)問(wèn)題的情況下,以下述方式來(lái)確定超平面:允許特定百分比的數(shù)據(jù)被分組在原點(diǎn)附近,而不是在超平面附近,并且,將被分組在原點(diǎn)附近的數(shù)據(jù)看作離群值。
[0007]在OC-SVM中,通過(guò)求解可以容易找到其解的凸優(yōu)化問(wèn)題,可以獲得超平面。而且,因?yàn)镺C-SVM采用非線性映射,所以O(shè)C-SVM適合于非線性數(shù)據(jù)集。
[0008]NPL3描述了 L0F。在NPL3中,從數(shù)據(jù)x至與數(shù)據(jù)x相鄰的k個(gè)數(shù)據(jù)的距離的平均值被計(jì)算為k-最近距離。因此,通過(guò)將數(shù)據(jù)X的k-最近距離除以k個(gè)相鄰數(shù)據(jù)的k-最近距離而獲得的值被計(jì)算為數(shù)據(jù)X的L0F。從如上所述的處理清楚,隨著在數(shù)據(jù)X的k-最近距離和k個(gè)相鄰數(shù)據(jù)的k-最近距離的平均值之間的差(S卩,通過(guò)從數(shù)據(jù)X的k-最近距離減去k個(gè)相鄰數(shù)據(jù)的k-最近距離的平均值而獲得的值)增大時(shí),LOF呈現(xiàn)更大的值。因此,具有大的LOF的數(shù)據(jù)被看作離群值。
[0009]LOF也適用于非線性數(shù)據(jù)集。
[0010]然而,上述的現(xiàn)有技術(shù)的三個(gè)示例具有下述的問(wèn)題。
[0011]如上所述,馬哈拉諾比斯距離具有問(wèn)題:在非線性數(shù)據(jù)集的情況下,不能檢測(cè)適當(dāng)?shù)碾x群值。
[0012]OC-SVM具有未解決的問(wèn)題:難以選擇適當(dāng)?shù)姆蔷€性映射。這導(dǎo)致問(wèn)題:需要參數(shù)調(diào)整操作,其中,人通過(guò)反復(fù)試驗(yàn)來(lái)確定用于確定非線性映射的參數(shù)。
[0013]而且,在OC-SVM中,在要處理大量數(shù)據(jù)的情況下,需要長(zhǎng)時(shí)間來(lái)解優(yōu)化問(wèn)題。設(shè)數(shù)據(jù)的數(shù)量是N,則在OC-SVM中的計(jì)算量的數(shù)量級(jí)是O (N3),除非不進(jìn)行調(diào)整。
[0014]LOF具有未解決的問(wèn)題:難以選擇適當(dāng)?shù)膋。這也導(dǎo)致問(wèn)題:需要參數(shù)調(diào)整操作,就像在OC-SVM中那樣。
[0015]而且,LOF需要較高的計(jì)算負(fù)載。設(shè)數(shù)據(jù)的數(shù)量是N,則在LOF中的計(jì)算量的數(shù)量級(jí)是O (N2),除非不進(jìn)行調(diào)整。
[0016]引用列表
[0017]非專利文獻(xiàn)
[0018]NPLl:Mahalanobis, P.C., On the Generalized Distance in Statistics (關(guān)于統(tǒng)計(jì)中的廣義距離),Proceedings of the National Institute of Science (美國(guó)國(guó)家科學(xué)院院刊),49-55,1936
[0019]NPL2:Scholkopf, B.等,Estimating the Support of a High-DimensionalDistribution(估計(jì)高維分布的支持),Neural Computation(神經(jīng)計(jì)算),7,1443-1471, 2001
[0020]NPL3:Breunig,M.Μ.等,L0F:1dentifying Density-Based Local OutliersCLOF:基于識(shí)別密度的局部離群值),SIGMOD Conference (SIGMOD會(huì)議),93-104,2000
【發(fā)明內(nèi)容】
[0021]技術(shù)問(wèn)題
[0022]已經(jīng)鑒于上述問(wèn)題而設(shè)計(jì)了本發(fā)明,并且本發(fā)明的目的是提供一種離群值檢測(cè)設(shè)備等,該離群值檢測(cè)設(shè)備等輔助或執(zhí)行在實(shí)用時(shí)間內(nèi)的離群值的檢測(cè),而不對(duì)非線性數(shù)據(jù)集執(zhí)行參數(shù)調(diào)整操作。
[0023]對(duì)于問(wèn)題的解決方案
[0024]為了實(shí)現(xiàn)上述目的,根據(jù)本發(fā)明的第一方面,提供了一種離群值檢測(cè)設(shè)備,該離群值檢測(cè)設(shè)備輔助或執(zhí)行從包括多個(gè)數(shù)據(jù)的數(shù)據(jù)集中檢測(cè)離群值,所述多個(gè)數(shù)據(jù)的每一個(gè)具有一個(gè)或多個(gè)維度,所述離群值檢測(cè)設(shè)備包括控制器,所述控制器針對(duì)一個(gè)或多個(gè)維度的每一個(gè)將在所述數(shù)據(jù)集中包括的所述多個(gè)數(shù)據(jù)的每一個(gè)轉(zhuǎn)換為比特序列、基于所述比特序列來(lái)建立用于所述數(shù)據(jù)集的觀察區(qū)域、從在所述數(shù)據(jù)集中包括的所述多個(gè)數(shù)據(jù)逐個(gè)地確定一個(gè)目標(biāo)數(shù)據(jù),并且基于當(dāng)從所述觀察區(qū)域去除與所述一個(gè)目標(biāo)數(shù)據(jù)對(duì)應(yīng)的區(qū)域時(shí),與所述一個(gè)目標(biāo)數(shù)據(jù)相鄰的數(shù)據(jù)的數(shù)據(jù)密度,來(lái)計(jì)算所述一個(gè)目標(biāo)數(shù)據(jù)的偏離度。
[0025]根據(jù)本發(fā)明的第一方面,可以在實(shí)用時(shí)間內(nèi)執(zhí)行離群值的檢測(cè)的輔助或執(zhí)行,而不對(duì)非線性數(shù)據(jù)集執(zhí)行參數(shù)調(diào)整操作。
[0026]優(yōu)選的是,在本發(fā)明的第一方面中的所述控制器將所述觀察區(qū)域建立為二分決策圖、將通過(guò)從每一個(gè)節(jié)點(diǎn)的局部密度減去等同于單個(gè)數(shù)據(jù)的密度而獲得的值定義為去除了單個(gè)數(shù)據(jù)的局部密度,并且基于所述去除了單個(gè)數(shù)據(jù)的局部密度來(lái)計(jì)算所述一個(gè)目標(biāo)數(shù)據(jù)的偏離度。
[0027]因此,在本發(fā)明的第一方面中的計(jì)算量的數(shù)量級(jí)至少由O(NXD)表示,并且相對(duì)于OC-SVM或LOF具有優(yōu)勢(shì),其中,N表示數(shù)據(jù)的數(shù)量,并且D表示節(jié)點(diǎn)的數(shù)量。
[0028]優(yōu)選的是,在本發(fā)明的第一方面中的所述控制器通過(guò)以從最高有效位至最低有效位的順序針對(duì)數(shù)值屬性的維度對(duì)比特序列組進(jìn)行排序來(lái)分級(jí)地建立二分決策圖、在所述二分決策圖中搜索用于表示所述一個(gè)目標(biāo)數(shù)據(jù)的路徑,并且基于等級(jí)被改變的節(jié)點(diǎn)的去除了單個(gè)數(shù)據(jù)的局部密度來(lái)計(jì)算所述一個(gè)目標(biāo)數(shù)據(jù)的偏離度。
[0029]因此,即使在未預(yù)先提供關(guān)于數(shù)據(jù)集的特性的信息的情況下,也可以計(jì)算適當(dāng)?shù)钠x度。
[0030]例如,在本發(fā)明的第一方面中的所述控制器將等級(jí)被改變的節(jié)點(diǎn)的去除了單個(gè)數(shù)據(jù)的局部密度中的一些或全部的最大值、中值或平均值定義為所述一個(gè)目標(biāo)數(shù)據(jù)的偏離度。
[0031]例如,在本發(fā)明的第一方面中的所述控制器通過(guò)將所述偏離度與閾值作比較來(lái)檢測(cè)尚群值。
[0032]根據(jù)本發(fā)明的第二方面,提供了一種離群值檢測(cè)方法,所述離群值檢測(cè)方法用于輔助或執(zhí)行從包括多個(gè)數(shù)據(jù)的數(shù)據(jù)集中檢測(cè)離群值,所述多個(gè)數(shù)據(jù)中的每一個(gè)具有一個(gè)或多個(gè)維度,所述方法包括:針對(duì)所述一個(gè)或多個(gè)維度中的每一個(gè)將在所述數(shù)據(jù)集中包括的所述多個(gè)數(shù)據(jù)的每一個(gè)轉(zhuǎn)換為比特序列;基于所述比特序列來(lái)建立用于所述數(shù)據(jù)集的觀察區(qū)域、從在所述數(shù)據(jù)集中包括的所述多個(gè)數(shù)據(jù)確定一個(gè)目標(biāo)數(shù)據(jù);并且,基于當(dāng)從所述觀察區(qū)域去除與所述一個(gè)目標(biāo)數(shù)據(jù)對(duì)應(yīng)的區(qū)域時(shí)與所述一個(gè)目標(biāo)數(shù)據(jù)相鄰的數(shù)據(jù)的數(shù)據(jù)密度,來(lái)計(jì)算所述一個(gè)目標(biāo)數(shù)據(jù)的偏離度。
[0033]根據(jù)本發(fā)明的第三方面,提供了一種車輛故障診斷系統(tǒng),該車輛故障診斷系統(tǒng)包括:離群值檢測(cè)設(shè)備,所述離群值檢測(cè)設(shè)備輔助或執(zhí)行從包括多個(gè)數(shù)據(jù)的數(shù)據(jù)集中檢測(cè)離群值,所述多個(gè)數(shù)據(jù)的每一個(gè)具有一個(gè)或多個(gè)維度;以及,數(shù)據(jù)收集設(shè)備,所述數(shù)據(jù)收集設(shè)備收集車輛數(shù)據(jù),其中,所述離群值檢測(cè)設(shè)備包括控制器,所述控制器通過(guò)下述方式來(lái)檢測(cè)離群值:針對(duì)所述一個(gè)或多個(gè)維度中的每一個(gè)將在所述數(shù)據(jù)集中包括的所述多個(gè)數(shù)據(jù)的每一個(gè)轉(zhuǎn)換為比特序列,由所述數(shù)據(jù)收集設(shè)備收集的車輛數(shù)據(jù)被定義為所述數(shù)據(jù)集;基于所述比特序列來(lái)建立用于所述數(shù)據(jù)集的觀察區(qū)域;從在所述數(shù)據(jù)集中包括的所述多個(gè)數(shù)據(jù)逐個(gè)地確定一個(gè)目標(biāo)數(shù)據(jù);基于當(dāng)從所述觀察區(qū)域去除與所述一個(gè)目標(biāo)數(shù)據(jù)對(duì)應(yīng)的區(qū)域時(shí)與所述一個(gè)目標(biāo)數(shù)據(jù)相鄰的數(shù)據(jù)的數(shù)據(jù)密度,來(lái)計(jì)算所述一個(gè)目標(biāo)數(shù)據(jù)的偏離度;并且,將所述偏離度與閾值作比較。
[0034]本發(fā)明的有益效果
[0035]根據(jù)本發(fā)明,可以提供離群值檢測(cè)設(shè)備等,該離群值檢測(cè)設(shè)備等輔助或執(zhí)行在實(shí)用時(shí)間內(nèi)的離群值的檢測(cè),而不對(duì)非線性數(shù)據(jù)集執(zhí)行參數(shù)調(diào)整操作。
【專利附圖】
【附圖說(shuō)明】
[0036]圖1圖示離群值檢測(cè)設(shè)備的硬件配置的示例。
[0037]圖2是詳細(xì)圖示由離群值檢測(cè)設(shè)備執(zhí)行的處理的流程圖。
[0038]圖3是用于說(shuō)明轉(zhuǎn)換數(shù)據(jù)集的處理的圖。
[0039]圖4是圖示卡諾圖。
[0040]圖5圖示二分決策圖。
[0041]圖6A是用于說(shuō)明計(jì)算最小項(xiàng)(minterm)的數(shù)量的處理的圖。
[0042]圖6B是用于說(shuō)明計(jì)算最小項(xiàng)的數(shù)量的處理的圖。
[0043]圖7圖示最小項(xiàng)的數(shù)量的計(jì)算的結(jié)果。
[0044]圖8A是用于說(shuō)明計(jì)算局部密度的處理的圖。[0045]圖SB是用于說(shuō)明計(jì)算局部密度的處理的圖。
[0046]圖9圖示局部密度的計(jì)算的結(jié)果。
[0047]圖10圖示LOO密度的計(jì)算的結(jié)果。
[0048]圖11圖示表示在二分決策圖中的一個(gè)目標(biāo)數(shù)據(jù)的路徑。
[0049]圖12圖示在卡諾圖中的一個(gè)目標(biāo)數(shù)據(jù)的區(qū)域。
[0050]圖13A是用于說(shuō)明要提取的LOO密度的圖。
[0051]圖13B是用于說(shuō)明要提取的LOO密度的圖。
[0052]圖13C是用于說(shuō)明要提取的LOO密度的圖。
[0053]圖13D是用于說(shuō)明要提取的LOO密度的圖。
[0054]圖14A圖示在本發(fā)明的第一實(shí)施例中的示例I和比較示例中使用的數(shù)據(jù)集。
[0055]圖14B圖示在本發(fā)明的第一實(shí)施例中的示例I和比較示例中使用的數(shù)據(jù)集。
[0056]圖15A圖示在示例I中的離群值的檢測(cè)的結(jié)果。
[0057]圖15B圖示在示例I中的離群值的檢測(cè)的結(jié)果。
[0058]圖16A圖示在比較示例I中的離群值的檢測(cè)的結(jié)果。
[0059]圖16B圖示在比較示例I中的離群值的檢測(cè)的結(jié)果。
[0060]圖17A圖示在比較示例2中的離群值的檢測(cè)的結(jié)果。
[0061]圖17B圖示在比較示例2中的離群值的檢測(cè)的結(jié)果。
[0062]圖18A圖示在比較示例3中的離群值的檢測(cè)的結(jié)果。
[0063]圖18B圖示在比較示例3中的離群值的檢測(cè)的結(jié)果。
[0064]圖19A圖示在比較示例4中的離群值的檢測(cè)的結(jié)果。
[0065]圖19B圖示在比較示例4中的離群值的檢測(cè)的結(jié)果。
[0066]圖20圖示根據(jù)本發(fā)明的第二實(shí)施例的車輛故障診斷系統(tǒng)的配置的示例。
[0067]圖21是圖示根據(jù)第二實(shí)施例的由車輛故障診斷系統(tǒng)執(zhí)行的處理的流程圖。
[0068]圖22A圖示在第二實(shí)施例中的離群值的檢測(cè)的結(jié)果。
[0069]圖22B圖示在第二實(shí)施例中的離群值的檢測(cè)的結(jié)果。
[0070]圖22C圖示在第二實(shí)施例中的離群值的檢測(cè)的結(jié)果。
【具體實(shí)施方式】
[0071 ] 以下,將參考附圖詳細(xì)描述本發(fā)明的實(shí)施例。
[0072]在本發(fā)明的實(shí)施例中,解決了離群值檢測(cè)問(wèn)題,離群值檢測(cè)問(wèn)題是用于從給定的數(shù)據(jù)集中找到屬于低數(shù)據(jù)密度區(qū)域的數(shù)據(jù)作為離群值的。
[0073]首先,將以信用交易作為示例來(lái)描述“數(shù)據(jù)集”。例如,關(guān)于信用交易的數(shù)據(jù)集,將描述客戶的性別、客戶的年齡和在交易中涉及的錢的數(shù)量這三種類型的信息的組合被給出作為單個(gè)數(shù)據(jù)的情況。然后,將描述兩個(gè)數(shù)據(jù)Xl =(男,25歲,10,000日元)和x2=(女,30歲,20,000元)被給出作為數(shù)據(jù)集的情況。
[0074]在上述示例中,給出了包括“ 2 ”個(gè)數(shù)據(jù)的數(shù)據(jù)集,每一個(gè)數(shù)據(jù)具有“ 3 ”個(gè)維度。數(shù)據(jù)的維度也被稱為變量(例如,多變量分析表示多維數(shù)據(jù)的分析)。另外,數(shù)據(jù)的數(shù)量也被稱為采樣的數(shù)量。
[0075]數(shù)據(jù)的每一個(gè)維度或者是類別屬性或者是數(shù)值屬性。在上述示例中,客戶的性別是類別屬性,并且客戶的年齡和在交易中涉及的錢的數(shù)量是數(shù)值屬性。
[0076]數(shù)據(jù)集的其他示例包括由車輛安裝的裝置獲取的數(shù)據(jù)集。在該情況下,在特定時(shí)刻觀察到的車輛速度、轉(zhuǎn)數(shù)和自動(dòng)巡航控制(ACC)的開/關(guān)等是維度(變量)。車輛速度和轉(zhuǎn)數(shù)是數(shù)值屬性,并且ACC的開/關(guān)是類別屬性。在多個(gè)時(shí)刻觀察到的多個(gè)數(shù)據(jù)被給出作為數(shù)據(jù)集。
[0077]以下,將說(shuō)明離群值檢測(cè)設(shè)備,其輔助或執(zhí)行從包括多個(gè)數(shù)據(jù)的數(shù)據(jù)集中檢測(cè)離群值,該多個(gè)數(shù)據(jù)每一個(gè)具有一個(gè)或多個(gè)維度。根據(jù)本發(fā)明的一個(gè)實(shí)施例的離群值檢測(cè)設(shè)備能夠輔助或執(zhí)行在實(shí)用時(shí)間內(nèi)的離群值的檢測(cè),而不對(duì)非線性數(shù)據(jù)集執(zhí)行參數(shù)調(diào)整操作。
[0078]圖1圖示離群值檢測(cè)設(shè)備的硬件配置的示例。在圖1中所示的硬件配置僅是示例,并且可以根據(jù)用途和目的來(lái)采用各種配置。
[0079]在離群值檢測(cè)設(shè)備I中,經(jīng)由總線18連接控制器11、存儲(chǔ)單元12、介質(zhì)輸入/輸出單元13、通信控制器14、輸入單元15、顯示單元16、外圍裝置接口(I/F)單元17等。
[0080]控制器11包括中央處理單元(CPU)、只讀存儲(chǔ)器(ROM)和隨機(jī)存取存儲(chǔ)器(RAM)
坐寸ο
[0081]CPU將在存儲(chǔ)單元12、ROM、記錄介質(zhì)等中存儲(chǔ)的程序調(diào)用到RAM上的工作存儲(chǔ)器區(qū)域,并且執(zhí)行該程序。CPU執(zhí)行經(jīng)由總線18連接的各個(gè)裝置的驅(qū)動(dòng)控制,并且實(shí)現(xiàn)要由離群值檢測(cè)設(shè)備I執(zhí)行的處理,這將在下文描述。
[0082]ROM是非易失性存儲(chǔ)器。ROM永久存儲(chǔ)用于離群值檢測(cè)設(shè)備I的引導(dǎo)程序、用于BIOS等的程序、數(shù)據(jù)等。
[0083]RAM是易失性存儲(chǔ)器。RAM暫時(shí)存儲(chǔ)從存儲(chǔ)單元12、R0M、記錄介質(zhì)等加載的程序、數(shù)據(jù)等。RAM包括由控制器11用于執(zhí)行各種類型的處理所使用的工作區(qū)域。
[0084]存儲(chǔ)單元12是硬盤驅(qū)動(dòng)器(HDD)。存儲(chǔ)單元12存儲(chǔ)要由控制器11執(zhí)行的程序、程序的執(zhí)行所需的數(shù)據(jù)、操作系統(tǒng)(OS)等。關(guān)于程序,在存儲(chǔ)單元12中存儲(chǔ)與OS對(duì)應(yīng)的控制程序和用于使得離群值檢測(cè)設(shè)備I執(zhí)行下文描述的處理的應(yīng)用程序。
[0085]控制器11根據(jù)需要讀取和向RAM傳送上述程序的程序代碼,并且CPU然后讀取該程序代碼來(lái)執(zhí)行作為各種裝置。
[0086]介質(zhì)輸入/輸出單兀13 (驅(qū)動(dòng)裝置)執(zhí)行數(shù)據(jù)的輸入和輸出。介質(zhì)輸入/輸出單元13例如包括介質(zhì)輸入/輸出裝置,諸如壓縮盤(⑶)驅(qū)動(dòng)器(用于⑶-ROM、⑶-R、⑶-RW等)、數(shù)字通用盤(DVD )驅(qū)動(dòng)器(用于DVD-ROM、DVD-R、DVD-Rff等)等。
[0087]通信控制器14包括通信控制裝置、通信端口等。通信控制器14是允許在離群值檢測(cè)設(shè)備I和網(wǎng)絡(luò)之間的通信的通信接口,并且控制經(jīng)由網(wǎng)絡(luò)與外部計(jì)算機(jī)的通信。網(wǎng)絡(luò)可以為有線的或無(wú)線的。
[0088]輸入單元15接收數(shù)據(jù)。輸入單元15包括輸入裝置,諸如鍵盤、諸如鼠標(biāo)的指示裝
置、數(shù)字小鍵盤等。
[0089]利用輸入單元15,可以對(duì)于離群值檢測(cè)設(shè)備I進(jìn)行操作指令、行為指令、數(shù)據(jù)輸入
坐寸ο
[0090]顯示單元16包括諸如液晶板的顯示裝置、用于與顯示裝置相結(jié)合地實(shí)現(xiàn)離群值檢測(cè)設(shè)備I的視頻功能的邏輯電路(視頻適配器等)。[0091]外圍裝置接口單元17是用于將外圍裝置連接到離群值檢測(cè)設(shè)備I的端口。離群值檢測(cè)設(shè)備I執(zhí)行數(shù)據(jù)經(jīng)由外圍裝置接口單元17向外圍裝置的發(fā)送和從外圍裝置的接收。外圍裝置接口單元17包括通用串行總線(USB)、IEEE1394、RS-232C等。在通常的情況下,提供了多個(gè)外圍裝置接口。離群值檢測(cè)設(shè)備I可以以有線或無(wú)線方式與外圍裝置連接。
[0092]總線18是允許在裝置之間的控制信號(hào)、數(shù)據(jù)信號(hào)等的傳送的路徑。
[0093]上面已經(jīng)描述了離群值檢測(cè)設(shè)備I的硬件配置。被實(shí)現(xiàn)為離群值檢測(cè)設(shè)備I的設(shè)備不限于上述示例。例如,通過(guò)向車輛安裝裝置、用于家用電器的控制裝置、用于檢測(cè)在生產(chǎn)線中的缺陷的檢測(cè)裝置安裝用于實(shí)現(xiàn)下述處理的程序,離群值檢測(cè)設(shè)備I可以被實(shí)現(xiàn)為汽車、家用電器、生產(chǎn)線等的一部分。而且,例如,離群值檢測(cè)設(shè)備I可以被實(shí)現(xiàn)為包括多個(gè)計(jì)算機(jī)的服務(wù)器設(shè)備。
[0094]以下,將說(shuō)明通過(guò)單個(gè)計(jì)算機(jī)來(lái)實(shí)現(xiàn)離群值檢測(cè)設(shè)備I的示例。
[0095]圖2是詳細(xì)圖示由離群值檢測(cè)設(shè)備I執(zhí)行的處理的流程圖。以下,將根據(jù)需要參考圖3至13來(lái)說(shuō)明用于數(shù)據(jù)集的示例的處理。
[0096]如圖2中所示,離群值檢測(cè)設(shè)備I的控制器11經(jīng)由輸入裝置(介質(zhì)輸入/輸出單元13、通信控制器14、輸入單元15、外圍裝置接口單元17等)來(lái)接收數(shù)據(jù)集(步驟SI)??刂破?1可以接收在存儲(chǔ)單元12中作為文件存儲(chǔ)的數(shù)據(jù)集。
[0097]圖3是用于說(shuō)明轉(zhuǎn)換數(shù)據(jù)集的處理的圖。圖3圖示數(shù)據(jù)集21。數(shù)據(jù)集21包括“19”個(gè)數(shù)據(jù),每一個(gè)數(shù)據(jù)具有“2”個(gè)維度。各個(gè)維度是數(shù)值屬性,并且可以取值在O和7之間的范圍內(nèi)的整數(shù)。
[0098]控制器11不必接收如在圖2中圖示的數(shù)據(jù)集21的歸一化的數(shù)據(jù)集??刂破?1可以接收原始數(shù)據(jù)集,并且對(duì)于接收的原始數(shù)據(jù)集執(zhí)行歸一化處理。例如,控制器11對(duì)于原始數(shù)據(jù)集執(zhí)行各種類型的處理,使得原始數(shù)據(jù)集可以取值在特定范圍內(nèi)的整數(shù)。
[0099]在原始數(shù)據(jù)集的一些維度(變量)是數(shù)值屬性的情況下,控制器11通過(guò)細(xì)分來(lái)執(zhí)行原始數(shù)據(jù)集的離散化,以實(shí)現(xiàn)數(shù)字化。例如,控制器11將實(shí)際值四舍五入為整數(shù),使得計(jì)算機(jī)可以將該值看作int類型。在要取的值的范圍極窄或?qū)挼那闆r下,控制器11執(zhí)行與適當(dāng)系數(shù)的相乘,使得該值可以均勻地分布在所假定的范圍上。而且,在混和具有不同度量的多個(gè)數(shù)據(jù)的情況下,控制器11執(zhí)行歸一化以具有O的平均值和I的方差。在分布極其偏離的情況下,控制器11執(zhí)行對(duì)數(shù)變換等。
[0100]另外,即使關(guān)于數(shù)值屬性的維度(變量),在要取的值在窄范圍中的情況下,例如,在值僅取值在O和3之間的范圍內(nèi)的整數(shù)的情況下,控制器11可以將值看作類別屬性的維度(變量)。而且,即使關(guān)于類別屬性的維度(變量),在向要取的值引入某個(gè)距離的概念的情況下,控制器11可以將值看作數(shù)值屬性的維度(變量)。
[0101]返回參見參考圖2的說(shuō)明,控制器11針對(duì)每一個(gè)維度(變量)將各個(gè)數(shù)據(jù)轉(zhuǎn)換為比特序列(步驟S2)。在圖3中圖示與數(shù)據(jù)Xl對(duì)應(yīng)的比特序列22a和與數(shù)據(jù)x2對(duì)應(yīng)的比特序列22bο例如,用于數(shù)據(jù)xl = 6的比特序列22a表示(dl, d2, d3) = (l, I, O)。例如,用于數(shù)據(jù) x2 = 2 的比特序列 22b 表示(el, e2, e3) = (0, I, O)。
[0102]控制器11以從最高有效位至最低有效位的順序來(lái)排序數(shù)值屬性的比特序列組(步驟S3)。在圖3中圖示排序的比特序列23。例如,對(duì)于(dl,d2, d3) = (l, 1,0)的比特序列22a和(el, e2, e3) = (0, I, O)白勺比特序列22b,排序的比特序列23表不(dl, el, d2, e2, d3,e3) = (l,0,I, 1,0,0)。
[0103]以下,使用“最高有效位(MSB)”來(lái)指示如dl或el的最左比特,并且使用“最低有效位(LSB)”來(lái)指示如d3或e3的最右比特。
[0104]不必執(zhí)行在步驟S3中的排序處理。因?yàn)樵诓襟ES3中的排序處理中以等同的方式來(lái)處理所有的維度(變量),所以在預(yù)先提供關(guān)于數(shù)據(jù)集的特性的一些信息的情況下,不執(zhí)行排序可能更好。例如,在很清楚數(shù)據(jù)xl的維度(變量)充分呈現(xiàn)數(shù)據(jù)的特性并且數(shù)據(jù)χ2的維度(變量)以很小的改變未充分呈現(xiàn)數(shù)據(jù)的特性的情況下,推薦不執(zhí)行在步驟S3中的排序處理,并且不等同地處理數(shù)據(jù)xl和數(shù)據(jù)χ2。
[0105]當(dāng)未預(yù)先提供關(guān)于數(shù)據(jù)集的特性的信息時(shí),在步驟S3中的排序處理是有效的。
[0106]期望將類別屬性的比特序列組與數(shù)值屬性的比特序列組相區(qū)別,并且將類別屬性的比特序列排列為優(yōu)先于數(shù)值屬性的比特序列。例如,在數(shù)據(jù)集包括在圖3中所示的類別屬性的數(shù)據(jù)x3以及數(shù)值屬性的數(shù)據(jù)xl和數(shù)據(jù)x2的情況下,通過(guò)(fl,f2,f3)表示通過(guò)轉(zhuǎn)換類別屬性的數(shù)據(jù)x3而獲得的比特序列。在該情況下,期望控制器11以(Π,f2, f3, dl, el, d2, e2, d3, e3)的順序來(lái)執(zhí)行排序。
[0107]類別屬性和數(shù)值屬性彼此相區(qū)別,因?yàn)橥ǔ2荒芟蛞≈禐轭悇e屬性的值的值引入距離的概念,并且因此難以與數(shù)值屬性的值類似地處理這樣的值。
[0108]在未預(yù)先提供關(guān)于數(shù)據(jù)集的特性的信息的情況下,可以與優(yōu)先順序無(wú)關(guān)地排列類別屬性和數(shù)值屬性。
[0109]返回參見參考圖2的說(shuō)明,控制器11建立二分決策圖(BDD)作為觀察區(qū)域F (步驟S4)。控制器11可以建立卡諾圖等而不是二分決策圖作為觀察區(qū)域F。二分決策圖或卡諾圖是要用于表達(dá)邏輯函數(shù)的數(shù)據(jù)結(jié)構(gòu)。即,觀察區(qū)域F可以表示邏輯函數(shù)。
[0110]如下所述,在建立二分決策圖作為觀察區(qū)域F的情況下,離群值檢測(cè)設(shè)備I能夠輔助或執(zhí)行在實(shí)用時(shí)間內(nèi)的離群值的檢測(cè),即使數(shù)據(jù)的數(shù)量增加。以下,為了避免不必要地混淆本發(fā)明,將描述離群值檢測(cè)設(shè)備I建立二分決策圖作為觀察區(qū)域F的情況。而且,為了清楚地說(shuō)明由離群值檢測(cè)設(shè)備I執(zhí)行的處理,也將圖示卡諾圖。
[0111]圖4圖示了卡諾圖。
[0112]在圖4中所示的卡諾圖30a中,在圖3中所示的比特序列22a垂直排列,并且,在圖3中所示的比特序列22b的(el,e2, e3)水平排列。在圖3中的一個(gè)黑色正方形對(duì)應(yīng)于一個(gè)數(shù)據(jù)。在圖4中所示的卡諾圖30a中圖示了 19個(gè)黑色正方形。
[0113]圖5圖示了二分決策圖。基于在圖3中所示的排序的比特序列23來(lái)建立在圖5中所示的二分決策圖31。
[0114]因?yàn)樵谟?jì)算機(jī)中根據(jù)指針的排列來(lái)表示二分決策圖,所以可以減少所需的存儲(chǔ)容量的量。在減小的有序二分決策圖的情況下,對(duì)于邏輯函數(shù)的計(jì)算需要與圖的大小大體成比例的計(jì)算時(shí)間。圖的大小對(duì)應(yīng)于節(jié)點(diǎn)的數(shù)量。
[0115]在圖5中所示的示例中,圖示了具有橢圓形狀等的節(jié)點(diǎn)32??梢詫⒃趫D3中所示的排序的比特序列23的各個(gè)比特看作布爾變量(或者真或者假)。例如,第一比特dl對(duì)應(yīng)于節(jié)點(diǎn)32a。
[0116]有序二分決策圖被定義為:(1)定義在節(jié)點(diǎn)中的總的順序關(guān)系,以及,(2)變量對(duì)于從頂節(jié)點(diǎn)到常量節(jié)點(diǎn)的所有路徑出現(xiàn)的順序與總的順序關(guān)系一致。在圖5中所示的示例中,圖示了頂節(jié)點(diǎn)(根節(jié)點(diǎn))33和常量節(jié)點(diǎn)34。在圖5中所示的示例中,常量節(jié)點(diǎn)表示“I”(真)。因?yàn)轫敼?jié)點(diǎn)和常量節(jié)點(diǎn)是特殊的,所以使用與其他普通節(jié)點(diǎn)不同的附圖標(biāo)記來(lái)指示這些節(jié)點(diǎn)。
[0117]減小的二分決策圖是對(duì)其盡可能多地應(yīng)用下面兩個(gè)簡(jiǎn)化規(guī)則的二分決策圖:(I)刪除所有的冗余節(jié)點(diǎn);以及,(2)共享所有的等同節(jié)點(diǎn)。
[0118]因此,在圖5中所示的二分決策圖是減小的有序二分決策圖。
[0119]在圖5中所示的二分決策圖采用三種類型的分支:被表示為實(shí)線的“Then”分支、被表示為寬間隔點(diǎn)線的“Else”和被表示為包括符號(hào)的窄間隔點(diǎn)線的“負(fù)Else”分支。利用“負(fù)Else”分支,執(zhí)行NOT操作需要短的時(shí)間。例如,在圖5中圖示了“Else”分支35a。
[0120]返回參見參考圖2的說(shuō)明,控制器11計(jì)算在二分決策圖中對(duì)于每一個(gè)節(jié)點(diǎn)的最小項(xiàng)的數(shù)量(步驟S5)。下面參考圖6A和6B與圖7來(lái)說(shuō)明用于計(jì)算最小項(xiàng)的數(shù)量的處理。
[0121]圖6A和6B是用于說(shuō)明計(jì)算最小項(xiàng)的數(shù)量的處理的圖。圖7圖示了最小項(xiàng)的數(shù)量的計(jì)算。
[0122]最小項(xiàng)是在給出布爾變量集的情況下包括所有布爾變量的字面值的乘積項(xiàng)。例如,對(duì)于布爾變量集是(a, b, c)的情況,“a!bc”是最小項(xiàng),但是“a!b”不是最小項(xiàng)。表達(dá)“比”表示非訃”。
[0123]控制器11對(duì)于每一個(gè)節(jié)點(diǎn)計(jì)算在從頂節(jié)點(diǎn)起經(jīng)過(guò)負(fù)分支偶數(shù)次的情況下的最小項(xiàng)的數(shù)量P和在從頂節(jié)點(diǎn)起經(jīng)過(guò)負(fù)分支奇數(shù)次的情況下的最小項(xiàng)的數(shù)量N。
[0124]首先,控制器11計(jì)算常量節(jié)點(diǎn)的最小項(xiàng)的數(shù)量。常量節(jié)點(diǎn)的最小項(xiàng)的數(shù)量P是2"(η表示布爾變量的數(shù)量,即,排序的比特序列23的比特的數(shù)量),并且常量節(jié)點(diǎn)的最小項(xiàng)的數(shù)量N是“O”。如圖3中所示,因 為排序的比特序列的比特的數(shù)量是“6”,所以對(duì)于常量節(jié)點(diǎn)的最小項(xiàng)的數(shù)量P是26 = 64。因此,對(duì)于在圖7中所示的常量節(jié)點(diǎn)34,最小項(xiàng)的數(shù)量P是64,并且最小項(xiàng)的數(shù)量N是O。
[0125]接下來(lái),控制器11通過(guò)深度優(yōu)先搜索來(lái)遞歸地計(jì)算對(duì)于除了常量節(jié)點(diǎn)之外的各個(gè)節(jié)點(diǎn)的最小項(xiàng)的數(shù)量。
[0126]如圖6Α和6Β中所示,控制器11對(duì)于下述情況計(jì)算各個(gè)節(jié)點(diǎn)的最小項(xiàng)的數(shù)量:情況(a),其中,“Else”分支不是負(fù)分支;以及,情況(b),其中,“Else”分支是負(fù)分支。
[0127]現(xiàn)在說(shuō)明在圖6A中圖示的情況。參見圖6A,節(jié)點(diǎn)32d是對(duì)于其而言要執(zhí)行計(jì)算的節(jié)點(diǎn),通過(guò)“Then”分支連接的下節(jié)點(diǎn)32b的值P是“t_p”(已知),節(jié)點(diǎn)32b的值N是“t_n”(已知),通過(guò)“Else”分支連接的下節(jié)點(diǎn)32c的值P是“e_p”(已知),并且,節(jié)點(diǎn)32c的值N是“e_n”(已知)。此時(shí),控制器11使用等式:P=t_p/2+e_p/2, N=t_n/2+e_n/2,根據(jù)對(duì)于下節(jié)點(diǎn)32b和32c的計(jì)算結(jié)果來(lái)計(jì)算節(jié)點(diǎn)32d的最小項(xiàng)的數(shù)量。
[0128]現(xiàn)在說(shuō)明在圖6B中圖示的情況。參見圖6B,節(jié)點(diǎn)32g是對(duì)于其而言要執(zhí)行計(jì)算的節(jié)點(diǎn),通過(guò)“Then”分支連接的下節(jié)點(diǎn)32e的值P是“t_p”(已知),節(jié)點(diǎn)32e的值N是“t_n”(已知),通過(guò)“負(fù)Else”分支連接的下節(jié)點(diǎn)32f的值P是“e_p”(已知),并且,節(jié)點(diǎn)32f的值N是“e_n”(已知)。此時(shí),控制器11使用等式:P=t_p/2+e_n/2, N=t_n/2+e_p/2,根據(jù)對(duì)于下節(jié)點(diǎn)32e和32f的計(jì)算結(jié)果來(lái)計(jì)算節(jié)點(diǎn)32g的最小項(xiàng)的數(shù)量。
[0129]例如,在圖7中圖示的節(jié)點(diǎn)32h的情況下,節(jié)點(diǎn)32h通過(guò)其連接到下節(jié)點(diǎn)(=常量節(jié)點(diǎn)34)的“Else”分支是負(fù)分支。因此,以圖6B中所示的計(jì)算方法中計(jì)算最小項(xiàng)的數(shù)量。即,對(duì)于節(jié)點(diǎn) 32h,P=64/2+0/2=32,并且 N=64/2+0/2=32。
[0130]例如,在圖7中圖示的節(jié)點(diǎn)32i的情況下,節(jié)點(diǎn)32i通過(guò)其連接到下節(jié)點(diǎn)的“Else”分支不是負(fù)分支。因此,以圖6A中所示的計(jì)算方法中計(jì)算最小項(xiàng)的數(shù)量。即,對(duì)于節(jié)點(diǎn)32i,P=32/2+64/2=48,并且 N=32/2+0/2=16。
[0131]返回參見參考圖2的說(shuō)明,控制器11計(jì)算對(duì)于二分決策圖的每個(gè)節(jié)點(diǎn)的局部密度(步驟S6)。下面參考圖8A和SB與圖9來(lái)說(shuō)明用于計(jì)算局部密度的處理。
[0132]圖8A和SB是用于說(shuō)明計(jì)算局部密度的處理的圖。圖9圖示了局部密度的計(jì)算結(jié)果。注意,在圖9中所示的P和N的值具有與在圖7中所示的P和N的值不同的含義。
[0133]為了方便,圖8A使用卡諾圖30b來(lái)圖示了在圖7中所示的節(jié)點(diǎn)32j的P-連接的局部密度。為了方便,圖8B使用卡諾圖30c來(lái)圖示了在圖7中所示的節(jié)點(diǎn)32k的P-連接的局部密度。
[0134]“P-連接”表示從頂節(jié)點(diǎn)到目標(biāo)節(jié)點(diǎn)的路徑,其中,負(fù)分支被經(jīng)過(guò)了偶數(shù)次。“N-連接”表示從頂節(jié)點(diǎn)到目標(biāo)節(jié)點(diǎn)的路徑,其中,負(fù)分支被經(jīng)過(guò)了奇數(shù)次。
[0135]現(xiàn)在考慮節(jié)點(diǎn)32j。
[0136]從圖7清楚,僅存在順序經(jīng)過(guò)分支35a和35b的路徑作為從頂節(jié)點(diǎn)33至節(jié)點(diǎn)32j的路徑。
[0137]分支35a是“Else”分支,其指示布爾變量dl是“O”。類似地,分支35b是“Else”分支,其指示布爾變量el是“O”。其他布爾變量d2、e2、d3和e3 “無(wú)關(guān)”(“無(wú)關(guān)”變量可以取值“O”或“I”)。圖8A中所示的虛線圍繞的矩形區(qū)域41a表示與路徑對(duì)應(yīng)的區(qū)域,其中,布爾變量“dl”表示“0”,布爾變量“el”表示“0”,并且其他布爾變量“無(wú)關(guān)”。
[0138]當(dāng)將在卡諾圖30a中的矩形區(qū)域41a的圖案重復(fù)四次時(shí)獲得在圖8A中所示的卡諾圖30b。節(jié)點(diǎn)32j的P-連接的局部密度對(duì)應(yīng)于卡諾圖30b的總的密度。S卩,如在圖9中所示,節(jié)點(diǎn)32j的P-連接的局部密度是“0.25”。
[0139]現(xiàn)在考慮節(jié)點(diǎn)32k。
[0140]從圖7清楚,存在順序經(jīng)過(guò)分支35a、35b、35c和35d的第一路徑和順序經(jīng)過(guò)分支35a、35b、35e和35f的第二路徑作為從頂節(jié)點(diǎn)33至節(jié)點(diǎn)32k的路徑。
[0141]關(guān)于第一路徑,布爾變量dl是“0”,布爾變量el是“0”,布爾變量d2是“1”,布爾變量e2是“0”,并且其他布爾變量d3和e3 “無(wú)關(guān)”。圖SB中所示的虛線圍繞的矩形區(qū)域41b表示與第一路徑對(duì)應(yīng)的區(qū)域。
[0142]關(guān)于第二路徑,布爾變量dl是“0”,布爾變量el是“0”,布爾變量d2是“0”,布爾變量e2是“1”,并且其他布爾變量d3和e3 “無(wú)關(guān)”。圖SB中所示的虛線圍繞的矩形區(qū)域41c表示與第二路徑對(duì)應(yīng)的區(qū)域。
[0143]當(dāng)將在卡諾圖30a中的矩形區(qū)域41b (或41c)的圖案重復(fù)16次時(shí)獲得在圖8B中所示的卡諾圖30c。節(jié)點(diǎn)32k的P-連接的局部密度對(duì)應(yīng)于卡諾圖30c的總的密度。S卩,如在圖9中所示,節(jié)點(diǎn)32k的P-連接的局部密度是“0.25”。
[0144]在本發(fā)明的實(shí)施例中,控制器11在步驟S5中計(jì)算在二分決策圖31中的各個(gè)節(jié)點(diǎn)的最小項(xiàng)的數(shù)量。因此,控制器11能夠通過(guò)將二分決策圖31的節(jié)點(diǎn)的最小項(xiàng)的數(shù)量除以2n來(lái)計(jì)算每一個(gè)節(jié)點(diǎn)的P-連接的局部密度,其中,η表示比特序列的比特的數(shù)量。S卩,控制器11不必利用各個(gè)節(jié)點(diǎn)的最小項(xiàng)的數(shù)量來(lái)執(zhí)行用于建立在圖8Α和SB中所示的卡諾圖30b和30c的處理。
[0145]例如,節(jié)點(diǎn)32j的P-連接的局部密度=節(jié)點(diǎn)32j的最小項(xiàng)的數(shù)量/2n = 16/26 =0.25。例如,節(jié)點(diǎn)32k的P-連接的局部密度=節(jié)點(diǎn)32k的最小項(xiàng)的數(shù)量/2n= 16/26 =0.25。可以以類似的方式來(lái)獲得其他節(jié)點(diǎn)的局部密度。
[0146]通過(guò)“從I減去節(jié)點(diǎn)的P-連接的局部密度”來(lái)獲得每一個(gè)節(jié)點(diǎn)的N-連接的局部
山/又ο
[0147]返回參見參考圖2的說(shuō)明,控制器11計(jì)算通過(guò)從局部密度減去等同于單個(gè)數(shù)據(jù)的密度而獲得的值作為去除了單個(gè)數(shù)據(jù)的局部密度(步驟S7 )。
[0148]以下,將去除了單個(gè)數(shù)據(jù)的局部密度縮寫為“留一(LOO)密度”。將參考圖10來(lái)描述用于計(jì)算LOO密度的處理。
[0149]圖10圖示了 LOO密度的計(jì)算結(jié)果。注意,在圖10中所示的P和N的值具有與在圖7或9中所示的P和N的值不同的含義。
[0150]通過(guò)“從局部密度減去等同于單個(gè)數(shù)據(jù)的密度”來(lái)獲得LOO密度。等同于每一個(gè)節(jié)點(diǎn)的密度被定義為“2αχΜ)的倒數(shù)”,其被求和到等式:L00密度=局部密度-2ttXM)的倒數(shù)。M是數(shù)值屬性的數(shù)量。
[0151]控制器11計(jì)算各個(gè)節(jié)點(diǎn)的LOO密度。
[0152]現(xiàn)在說(shuō)明等級(jí)L。如圖10中所示,常量節(jié)點(diǎn)34被定義為“等級(jí)O”。與作為“最低有效位(LSB)”的d3和e3對(duì)應(yīng)的節(jié)點(diǎn)被定義為“等級(jí)I”。與作為在下一等級(jí)中的比特的d2和e2對(duì)應(yīng)的節(jié)點(diǎn)被定義為“等級(jí)2”。與作為“最高有效位(MSB)”的dl和el對(duì)應(yīng)的節(jié)點(diǎn)被定義為“等級(jí)3”。即,用于表示數(shù)值屬性的維度(變量)的比特序列的長(zhǎng)度K對(duì)應(yīng)于等級(jí)L的最大值,并且等級(jí)L取值在O和K之間的范圍內(nèi)的整數(shù)。
[0153]將參考圖10來(lái)說(shuō)明LOO密度的計(jì)算示例。
[0154]例如,通過(guò)下述表達(dá)式來(lái)獲得節(jié)點(diǎn)32j的P-連接的LOO密度:0.25-1/2(2Χ2)=0.25-1/16=3/16,近似等于 0.19。
[0155]例如,通過(guò)下述表達(dá)式來(lái)獲得節(jié)點(diǎn)32j的N-連接的LOO密度:0.75-1/2(2Χ2)=0.75-1/16=11/16,近似等于 0.69。
[0156]例如,通過(guò)下述表達(dá)式來(lái)獲得節(jié)點(diǎn)32k的P-連接的LOO密度:0.25-1/2(1Χ2)=0.25-1/4=0。
[0157]例如,通過(guò)下述表達(dá)式來(lái)獲得節(jié)點(diǎn)32k的N-連接的LOO密度:0.75-l/2(1X2)=0.75-1/4=0.5。
[0158]使用等式:L00密度=max {O,局部密度_2(LXM)的倒數(shù)}來(lái)計(jì)算常量節(jié)點(diǎn)34的LOO密度,以便防止LOO密度取負(fù)值。然而,這不是必要的。在本發(fā)明中LOO密度取值負(fù)值不存在問(wèn)題
[0159]返回參見參考圖2的說(shuō)明,控制器11基于LOO密度來(lái)計(jì)算各個(gè)數(shù)據(jù)的偏離度(步驟S8)。將參考圖11和12與圖13A至13D來(lái)說(shuō)明用于計(jì)算偏離度的處理。
[0160]圖11圖示了用于表示在二分決策圖中的一個(gè)目標(biāo)數(shù)據(jù)的路徑。圖12圖示了用于表示在卡諾圖中的一個(gè)目標(biāo)數(shù)據(jù)的區(qū)域。圖13A至13D是用于說(shuō)明要提取的LOO密度的圖。
[0161]控制器11從數(shù)據(jù)集逐個(gè)地確定一個(gè)目標(biāo)數(shù)據(jù),并且對(duì)于該目標(biāo)數(shù)據(jù)執(zhí)行處理。以下,將說(shuō)明將(dl,el, d2, e2, d3, e3) = (l, 0,0,I, I, 0)確定為一個(gè)目標(biāo)數(shù)據(jù)x的示例。[0162]控制器11在二分決策圖中搜索用于表示一個(gè)目標(biāo)數(shù)據(jù)X的路徑、提取其等級(jí)(層)被改變的節(jié)點(diǎn)的LOO密度,并且基于所提取的LOO密度來(lái)計(jì)算該目標(biāo)數(shù)據(jù)X的偏離度。
[0163]在圖11中所示的示例中,節(jié)點(diǎn)32a、321、32m和34的等級(jí)(層)改變。
[0164]基于從頂節(jié)點(diǎn)起經(jīng)過(guò)負(fù)分支的次數(shù)來(lái)確定關(guān)于是否要提取P-連接的LOO密度或是否要提取N-連接的LOO密度。S卩,控制器11在從頂節(jié)點(diǎn)起經(jīng)過(guò)負(fù)分支偶數(shù)次數(shù)的情況下提取P-連接的LOO密度,并且在從頂節(jié)點(diǎn)起經(jīng)過(guò)負(fù)分支奇數(shù)次數(shù)的情況下提取N-連接的LOO密度。
[0165]對(duì)于節(jié)點(diǎn)32a,因?yàn)榻?jīng)過(guò)一個(gè)負(fù)分支,所以控制器11提取N-連接的LOO密度“0.28”。對(duì)于節(jié)點(diǎn)321,因?yàn)榻?jīng)過(guò)一個(gè)負(fù)分支,所以控制器11提取N-連接的LOO密度“0.38”。對(duì)于節(jié)點(diǎn)32m,因?yàn)榻?jīng)過(guò)一個(gè)負(fù)分支,所以控制器11提取N-連接的LOO密度“0.25”。對(duì)于常量節(jié)點(diǎn)34,因?yàn)榻?jīng)過(guò)兩個(gè)負(fù)分支,所以控制器11提取P-連接的LOO密度“O”。
[0166]因此,控制器11 提取(0.28,0.38,0.25,O)。
[0167]將參考圖13A至13D來(lái)說(shuō)明各個(gè)提取的LOO密度的含義。
[0168]如圖13A中所示,當(dāng)作為單個(gè)單位區(qū)域(=由目標(biāo)數(shù)據(jù)X占據(jù)的區(qū)域)的矩形區(qū)域41d被定義為整個(gè)區(qū)域時(shí),對(duì)于等級(jí)O的LOO密度,即,常量節(jié)點(diǎn)34的LOO密度對(duì)應(yīng)于在去除目標(biāo)數(shù)據(jù)X的情況下的數(shù)據(jù)密度。
[0169]如圖13B中所示,當(dāng)包括四個(gè)單位區(qū)域的矩形區(qū)域41e被定義為整個(gè)區(qū)域時(shí),對(duì)于等級(jí)I的LOO密度,即,節(jié)點(diǎn)32m的LOO密度對(duì)應(yīng)于在去除目標(biāo)數(shù)據(jù)x的情況下的數(shù)據(jù)密度。
[0170]如圖13C中所示,當(dāng)包括16個(gè)單位區(qū)域的矩形區(qū)域41f被定義為整個(gè)區(qū)域時(shí),對(duì)于等級(jí)2的LOO密度,即,節(jié)點(diǎn)321的LOO密度對(duì)應(yīng)于在去除目標(biāo)數(shù)據(jù)x的情況下的數(shù)據(jù)密度。
[0171]如圖13D中所示,當(dāng)包括64個(gè)單位區(qū)域的矩形區(qū)域41g被定義為整個(gè)區(qū)域時(shí),對(duì)于等級(jí)3的LOO密度,即,節(jié)點(diǎn)32a的LOO密度對(duì)應(yīng)于在去除目標(biāo)數(shù)據(jù)x的情況下的數(shù)據(jù)密度。
[0172]如上所述,可以將提取的LOO密度表達(dá)為分級(jí)局部密度(HLD)。
[0173]例如,控制器11將提取的LOO密度(HLD)的最大值定義為目標(biāo)數(shù)據(jù)的偏離度。在圖11中所示的示例中,控制器11將值(0.28,0.38,0.25,O)的最大值“0.38”定義為目標(biāo)數(shù)據(jù)的偏離度。
[0174]而且,控制器11可以將提取的LOO密度的平均值或中值而不是提取的LOO密度的最大值定義為目標(biāo)數(shù)據(jù)的偏離度。
[0175]而且,控制器11可以基于提取的LOO密度的一些而不是提取的LOO密度的全部來(lái)
計(jì)算偏離度。
[0176]例如,控制器11可以基于在提取的LOO密度中的在更高等級(jí)(層)中的節(jié)點(diǎn)的LOO密度來(lái)計(jì)算偏離度。在圖11中所示的示例中,控制器11可以基于在“等級(jí)3”和“等級(jí)2”中的節(jié)點(diǎn)的LOO密度(0.28,0.38)來(lái)計(jì)算偏離度。也在該情況下,控制器11可以采用最大值、平均值或中值等來(lái)用于一個(gè)目標(biāo)數(shù)據(jù)的偏離度。
[0177]在上面的說(shuō)明中,將觀察區(qū)域建立為二分決策圖。然而,本發(fā)明也可以被應(yīng)用到使用卡諾圖或其他數(shù)據(jù)結(jié)構(gòu)來(lái)建立觀察區(qū)域的情況。[0178]控制器11可以從在數(shù)據(jù)集中包括的多個(gè)數(shù)據(jù)逐個(gè)地確定一個(gè)目標(biāo)數(shù)據(jù),并且基于當(dāng)從觀察區(qū)域去除與這一個(gè)目標(biāo)數(shù)據(jù)對(duì)應(yīng)的區(qū)域時(shí)與這一個(gè)目標(biāo)數(shù)據(jù)相鄰的數(shù)據(jù)的數(shù)據(jù)密度來(lái)計(jì)算目標(biāo)數(shù)據(jù)的偏離度。LOO密度是當(dāng)從觀察區(qū)域去除與一個(gè)目標(biāo)數(shù)據(jù)對(duì)應(yīng)的區(qū)域時(shí)與這一個(gè)目標(biāo)數(shù)據(jù)相鄰的數(shù)據(jù)的數(shù)據(jù)密度的示例。
[0179]返回參見參考圖2的說(shuō)明,控制器11通過(guò)將在步驟S8中計(jì)算的偏離度與預(yù)定閾值作比較來(lái)檢測(cè)離群值(步驟S9)。然而,不必執(zhí)行步驟S9的處理。例如,控制器11可以經(jīng)由輸出裝置(介質(zhì)輸入/輸出單元13、通信控制器14、顯示單元16、外圍裝置接口單元17等)來(lái)輸出在步驟S8中計(jì)算的偏離度的列表。用戶可以觀看偏離度的列表,并且檢測(cè)離群值。
[0180]在圖2中所示的處理步驟中的具有最重的計(jì)算負(fù)荷的處理步驟是用于在步驟S4中建立二分決策圖的處理。用于建立二分決策圖的處理的計(jì)算量的數(shù)量級(jí)被表示為O(NXD),其中,N表示在數(shù)據(jù)集中的數(shù)據(jù)的數(shù)量,并且D表示在二分決策圖中的節(jié)點(diǎn)的數(shù)量。
[0181]在數(shù)據(jù)集的維度的數(shù)量小的情況下,節(jié)點(diǎn)的數(shù)量D通常不很大。因此,在給定的數(shù)據(jù)集的維度的數(shù)量大的情況下,可以使用維度減少方法來(lái)減少維度的數(shù)量。利用適當(dāng)?shù)木S度減少,可以減少維度的數(shù)量,而不影響結(jié)果。另外,可以通過(guò)將數(shù)值屬性的數(shù)據(jù)四舍五入以限制比特的數(shù)量來(lái)減少節(jié)點(diǎn)的數(shù)量D。
[0182]因此,通過(guò)在用于在步驟S4中建立二分決策圖的處理的執(zhí)行之前執(zhí)行適當(dāng)?shù)念A(yù)處理,可以獲得關(guān)系:D〈〈N。即,可以將計(jì)算量的數(shù)量級(jí)看作O(M)。
[0183]而且,從在圖2中所示的各個(gè)處理步驟清楚,僅有在步驟S9中使用的閾值是要由用戶調(diào)整的參數(shù)。在步驟S9中使用的閾值是用于確定值是否是離群值的參數(shù)而不是用于計(jì)算偏離度的參數(shù)。即,離群值檢測(cè)設(shè)備I能夠計(jì)算偏離度,而不執(zhí)行參數(shù)調(diào)整操作。
[0184]即使當(dāng)改變?cè)诓襟ES9中使用的閾值時(shí),也不必再一次執(zhí)行步驟SI至S8的處理,并且在步驟S9的處理中的計(jì)算負(fù)荷是可忽略地小。因此,離群值檢測(cè)設(shè)備I能夠輔助或執(zhí)行在實(shí)用時(shí)間內(nèi)的離群值的檢測(cè)。
[0185]如上所述,在本發(fā)明的實(shí)施例中,離群值檢測(cè)設(shè)備I針對(duì)每一個(gè)維度將在數(shù)據(jù)集中包括的各個(gè)數(shù)據(jù)轉(zhuǎn)換為比特序列,并且基于該比特序列來(lái)建立數(shù)據(jù)集的觀察區(qū)域。然后,離群值檢測(cè)設(shè)備I從在數(shù)據(jù)集中包括的多個(gè)數(shù)據(jù)逐個(gè)地確定每一個(gè)目標(biāo)數(shù)據(jù),并且基于當(dāng)從觀察區(qū)域去除與目標(biāo)數(shù)據(jù)對(duì)應(yīng)的區(qū)域時(shí)與目標(biāo)數(shù)據(jù)相鄰的數(shù)據(jù)的數(shù)據(jù)密度來(lái)計(jì)算目標(biāo)數(shù)據(jù)的偏離度。
[0186]因此,離群值檢測(cè)設(shè)備I能夠輔助或執(zhí)行在實(shí)用時(shí)間內(nèi)的離群值的檢測(cè),而不對(duì)非線性數(shù)據(jù)集執(zhí)行參數(shù)調(diào)整操作。
[0187]第一實(shí)施例
[0188]以下,在本發(fā)明的第一實(shí)施例中,將參考圖14至19來(lái)描述示例I和比較示例。
[0189]圖14A和14B每一個(gè)圖示了在示例I和比較示例中使用的數(shù)據(jù)集。通過(guò)在二維空間中示意地繪制在夜空中的月亮(Moon)和星星(Star)的光來(lái)獲得在圖14A和14B中所示的數(shù)據(jù)集。以下,在圖14A和14B中所示的數(shù)據(jù)集被稱為MoonStar數(shù)據(jù)集。MoonStar數(shù)據(jù)集的屬性是:人為產(chǎn)生的數(shù)據(jù);維度的數(shù)量M是2 ;數(shù)據(jù)的95%被分布在新月形狀的區(qū)域內(nèi),并且數(shù)據(jù)的5%任意分布;以及,數(shù)據(jù)的數(shù)量N是1000、5000。[0190]圖14A圖示了包括1000個(gè)數(shù)據(jù)(N = 1000)的數(shù)據(jù)集,并且在圖14A中所示的數(shù)據(jù)集被稱為MoonStarlOOO。圖14B圖示了包括5000個(gè)數(shù)據(jù)的數(shù)據(jù)集(N = 5000),并且在圖14B中所示的數(shù)據(jù)集被稱為MoonStar5000。在圖14A和14B中,圓圈標(biāo)記表示各個(gè)數(shù)據(jù)。
[0191]如下所述,為了實(shí)現(xiàn)確定準(zhǔn)確度的適當(dāng)?shù)谋容^,在示例I和比較示例中,將數(shù)據(jù)的5%確定為離群值(星星)。而且,為了實(shí)現(xiàn)計(jì)算時(shí)間的適當(dāng)?shù)谋容^,使用同一計(jì)算機(jī)來(lái)執(zhí)行處理。
[0192]在示例I中,離群值檢測(cè)設(shè)備I計(jì)算偏離度,并且將具有小值(在步驟S9中使用的閾值)的數(shù)據(jù)集的5%確定為離群值。
[0193]在比較示例I中,在OC-SVM中,用于確定非線性映射的核心參數(shù)伽馬被設(shè)置為“0.5”,并且用于指定離群值的比例的參數(shù)V被設(shè)置為“0.05”。
[0194]在比較示例2中,在OC-SVM中,用于確定非線性映射的核心參數(shù)伽馬被設(shè)置為“2”,并且用于指定離群值的比例的參數(shù)V被設(shè)置為“0.05”。
[0195]在比較示例3中,在LOF中,參數(shù)k被設(shè)置為“ 10”,并且具有大值的數(shù)據(jù)集的5%被確定為離群值。
[0196]在比較示例4中,在LOF中,參數(shù)k被設(shè)置為“100”,并且具有大值的數(shù)據(jù)集的5%被確定為離群值。
[0197]對(duì)于在OC-SVM中的所有計(jì)算,使用在統(tǒng)計(jì)計(jì)算語(yǔ)言R的庫(kù)el071中的svm函數(shù)。對(duì)于在LOF中的所有計(jì)算,使用在統(tǒng)計(jì)計(jì)算語(yǔ)言R的庫(kù)dprep中的1factor函數(shù)。
[0198]圖15A和15B圖`示了在示例I中的離群值的檢測(cè)結(jié)果。圖15A圖示了對(duì)于MoonStarlOOO的結(jié)果。圖15B圖示了對(duì)于MoonStar5000的結(jié)果。在圖15和15B中,十字標(biāo)記表示被檢測(cè)為離群值(星星)的數(shù)據(jù),并且圓形標(biāo)記表示被確定為月亮(Moon)的數(shù)據(jù)。為了十字標(biāo)記(離群值)更清楚的可視化,以光線來(lái)圖示圓形標(biāo)記。這適用于圖16A和16B、圖17A和17B、圖18A和18B以及圖19A和19B。
[0199]表1表不在不例I中對(duì)于MoonStarlOOO的確定結(jié)果。表2表不在不例I中對(duì)于MoonStar5000的確定結(jié)果
[0200][表 I]
確定結(jié)果
~MM^
[0201]
一、月焭9437
正確答案---
_星星 _8_ 42
[0202][表2]
_確定結(jié)果_
~MM~
[0203]"TI
月焭473218
正確答案---
_星星_32_ 218
[0204]在表1和2的每一個(gè)中,在四個(gè)單元格中,在左上單元格中的值表示將“Moon (月亮)”檢測(cè)為“Moon”的結(jié)果的數(shù)量。在右上單元格中的值表示將“Moon”檢測(cè)為“Star (星星)”的結(jié)果的數(shù)量。在左下單元格中的值表示將“Star”檢測(cè)為“Moon”的結(jié)果的數(shù)量。在右下單元格中的值表示將“Star”檢測(cè)為“Star”的結(jié)果的數(shù)量。在左上單元格和右下單元格中的值的和表示準(zhǔn)確的檢測(cè)結(jié)果的數(shù)量。在左下單元格和右上單元格中的值的和表示不準(zhǔn)確的檢測(cè)結(jié)果的數(shù)量。這適用于表3至10。
[0205]在示例I中,對(duì)于MoonStarlOOO需要0.03秒的計(jì)算時(shí)間,并且,對(duì)于MoonStar5000需要0.17秒的計(jì)算時(shí)間。即,因?yàn)橄鄬?duì)于數(shù)據(jù)的數(shù)量的5倍的增大,呈現(xiàn)出計(jì)算時(shí)間的大約5.7倍的增大,所以可以說(shuō)在示例I中的計(jì)算時(shí)間的數(shù)量級(jí)是O(M),其中,N表示數(shù)據(jù)的數(shù)量。
[0206]圖16A和16B圖示了在比較示例I中的離群值的檢測(cè)結(jié)果。表3圖示了在比較示例中對(duì)于MoonStarlOOO的確定結(jié)果。表4圖示了在比較示例中對(duì)于MoonStar5000的確定結(jié)果。
[0207][表3]
【權(quán)利要求】
1.一種離群值檢測(cè)設(shè)備,所述離群值檢測(cè)設(shè)備輔助或執(zhí)行從包括多個(gè)數(shù)據(jù)的數(shù)據(jù)集中檢測(cè)離群值,所述多個(gè)數(shù)據(jù)的每一個(gè)具有一個(gè)或多個(gè)維度,所述設(shè)備包括: 控制器,所述控制器針對(duì)所述一個(gè)或多個(gè)維度的每一個(gè)將在所述數(shù)據(jù)集中包括的所述多個(gè)數(shù)據(jù)的每一個(gè)轉(zhuǎn)換為比特序列、基于所述比特序列來(lái)建立用于所述數(shù)據(jù)集的觀察區(qū)域、從在所述數(shù)據(jù)集中包括的所述多個(gè)數(shù)據(jù)逐個(gè)地確定一個(gè)目標(biāo)數(shù)據(jù),并且基于當(dāng)從所述觀察區(qū)域去除與所述一個(gè)目標(biāo)數(shù)據(jù)對(duì)應(yīng)的區(qū)域時(shí)與所述一個(gè)目標(biāo)數(shù)據(jù)相鄰的數(shù)據(jù)的數(shù)據(jù)密度來(lái)計(jì)算所述一個(gè)目標(biāo)數(shù)據(jù)的偏離度。
2.根據(jù)權(quán)利要求1所述的離群值檢測(cè)設(shè)備,其中,所述控制器將所述觀察區(qū)域建立為二分決策圖、將通過(guò)從每一個(gè)節(jié)點(diǎn)的局部密度減去等同于單個(gè)數(shù)據(jù)的密度而獲得的值定義為去除了單個(gè)數(shù)據(jù)的局部密度,并且基于所述去除了單個(gè)數(shù)據(jù)的局部密度來(lái)計(jì)算所述一個(gè)目標(biāo)數(shù)據(jù)的所述偏離度。
3.根據(jù)權(quán)利要求2所述的離群值檢測(cè)設(shè)備,其中,所述控制器通過(guò)以從最高有效位至最低有效位的順序針對(duì)數(shù)值屬性的維度對(duì)比特序列組進(jìn)行排序來(lái)分級(jí)地建立所述二分決策圖、在所述二分決策圖中搜索用于表示所述一個(gè)目標(biāo)數(shù)據(jù)的路徑,并且基于等級(jí)被改變的節(jié)點(diǎn)的所述去除了單個(gè)數(shù)據(jù)的局部密度來(lái)計(jì)算所述一個(gè)目標(biāo)數(shù)據(jù)的所述偏離度。
4.根據(jù)權(quán)利要求3所述的離群值檢測(cè)設(shè)備,其中,所述控制器將等級(jí)被改變的節(jié)點(diǎn)的所述去除了單個(gè)數(shù)據(jù)的局部密度中的一些或全部的最大值、中值或平均值定義為所述一個(gè)目標(biāo)數(shù)據(jù)的所述偏離度。
5.根據(jù)權(quán)利要求4所述的離群值檢測(cè)設(shè)備,其中,所述控制器通過(guò)將所述偏離度與閾值作比較來(lái)檢測(cè)所述離群值。
6.一種離群值檢測(cè)方法,用于輔助或執(zhí)行從包括多個(gè)數(shù)據(jù)的數(shù)據(jù)集中檢測(cè)離群值,所述多個(gè)數(shù)據(jù)的每一個(gè)具有一個(gè)或多個(gè)維度,所述方法包括: 針對(duì)所述一個(gè)或多個(gè)維度的每一個(gè)將在所述數(shù)據(jù)集中包括的所述多個(gè)數(shù)據(jù)的每一個(gè)轉(zhuǎn)換為比特序列; 基于所述比特序列來(lái)建立用于所述數(shù)據(jù)集的觀察區(qū)域; 從在所述數(shù)據(jù)集中包括的所述多個(gè)數(shù)據(jù)確定一個(gè)目標(biāo)數(shù)據(jù);并且 基于當(dāng)從所述觀察區(qū)域去除與所述一個(gè)目標(biāo)數(shù)據(jù)對(duì)應(yīng)的區(qū)域時(shí)與所述一個(gè)目標(biāo)數(shù)據(jù)相鄰的數(shù)據(jù)的數(shù)據(jù)密度,來(lái)計(jì)算所述一個(gè)目標(biāo)數(shù)據(jù)的偏離度。
7.—種車輛故障診斷系統(tǒng),包括: 離群值檢測(cè)設(shè)備,所述離群值檢測(cè)設(shè)備輔助或執(zhí)行從包括多個(gè)數(shù)據(jù)的數(shù)據(jù)集中檢測(cè)離群值,所述多個(gè)數(shù)據(jù)的每一個(gè)具有一個(gè)或多個(gè)維度;以及, 數(shù)據(jù)收集設(shè)備,所述數(shù)據(jù)收集設(shè)備收集車輛數(shù)據(jù),其中,所述離群值檢測(cè)設(shè)備包括控制器,所述控制器通過(guò)下述方式來(lái)檢測(cè)離群值:針對(duì)所述一個(gè)或多個(gè)維度的每一個(gè)將在所述數(shù)據(jù)集中包括的所述多個(gè)數(shù)據(jù)的每一個(gè)轉(zhuǎn)換為比特序列,由所述數(shù)據(jù)收集設(shè)備收集的所述車輛數(shù)據(jù)被定義為所述數(shù)據(jù)集;基于所述比特序列來(lái)建立用于所述數(shù)據(jù)集的觀察區(qū)域;從在所述數(shù)據(jù)集中包括的所述多個(gè)數(shù)據(jù)逐個(gè)地確定一個(gè)目標(biāo)數(shù)據(jù);基于當(dāng)從所述觀察區(qū)域去除與所述一個(gè)目標(biāo)數(shù)據(jù)對(duì)應(yīng)的區(qū)域時(shí)與所述一個(gè)目標(biāo)數(shù)據(jù)相鄰的數(shù)據(jù)的數(shù)據(jù)密度,來(lái)計(jì)算所述一個(gè)目標(biāo)數(shù)據(jù)的偏離度;以及將所述偏離度與閾值作比較。
【文檔編號(hào)】G06N7/00GK103493075SQ201280018268
【公開日】2014年1月1日 申請(qǐng)日期:2012年2月27日 優(yōu)先權(quán)日:2011年5月17日
【發(fā)明者】沓名拓郎, 佐藤守一 申請(qǐng)人:株式會(huì)社豐田中央研究所