0]預(yù)處理數(shù)據(jù)的特征選擇可以包括從所有特征的集合選擇最相關(guān)特征的子集??梢曰谠趯?shí)體的特征與性能度量之間的相關(guān)性或其他所確定的關(guān)系而選擇最相關(guān)特征的子集。為此目的,可以使用多個(gè)已知的自動(dòng)化特征選擇方法中的任意一種,例如,使用子集選擇,使用諸如相關(guān)性、互信息的度量,使用諸如卡方測(cè)試的統(tǒng)計(jì)測(cè)試,使用基于包裝的特征選擇方法,等等,除了以上列出的自動(dòng)化特征選擇方法之外,領(lǐng)域?qū)<疫€可以選擇、丟棄或轉(zhuǎn)換特征或變量。
[0021]除了特征選擇之外,可以將維度縮減應(yīng)用于數(shù)據(jù)。預(yù)處理數(shù)據(jù)的維度縮減可以包括將所有特征或者所有特征的子集從較高維度空間映射至較低維度空間。維度縮減可以通過使用例如主成分分析(PCA)、多維度縮放(MDS)、拉普拉斯特征映射等而實(shí)施。因此,根據(jù)示例,預(yù)處理數(shù)據(jù)的轉(zhuǎn)換可以導(dǎo)致特征化了實(shí)體工作的相對(duì)較少數(shù)目的特征。特別地,可以丟棄可以不影響實(shí)體的那些特征。作為另一示例,可以通過維度縮減來丟棄影響實(shí)體但是可以具有其他變量冗余的特征。
[0022]所產(chǎn)生的狀態(tài)機(jī)模型352可以包括特征化了實(shí)體的不同工作行為并且將不同狀態(tài)與一個(gè)或多個(gè)度量(例如性能度量、可維持性度量)相關(guān)聯(lián)的多個(gè)狀態(tài)。狀態(tài)可以視作在時(shí)間周期之內(nèi)的實(shí)體的工作的抽象化。例如,所記錄的數(shù)據(jù)可以表示在時(shí)間周期之內(nèi)的實(shí)體的所觀測(cè)/感測(cè)行為和其他參數(shù)(例如天氣)的時(shí)間序列。每個(gè)狀態(tài)表示在時(shí)間周期的一些部分期間實(shí)體的一類工作行為的抽象化。例如,為冷卻器而產(chǎn)生的狀態(tài)機(jī)模型可以包括在訓(xùn)練過程之內(nèi)特征化了冷卻器的不同操作行為的五個(gè)狀態(tài)(例如特征化了冷卻器的不同維持水平的“關(guān)”狀態(tài)和各種“開”狀態(tài)一例如在與不同周圍溫度組合的不同恒溫器設(shè)置下)。用于冷卻器的該狀態(tài)機(jī)模型也可以與用于所定義五個(gè)狀態(tài)中的每個(gè)狀態(tài)的各種度量相關(guān)聯(lián),諸如與在每個(gè)狀態(tài)期間的平均能耗有關(guān)的性能度量。此外,狀態(tài)機(jī)模型可以與多個(gè)特征模式相關(guān)聯(lián),多個(gè)特征模式將各種特征值與不同的狀態(tài)以及與狀態(tài)之間的轉(zhuǎn)換相映射。關(guān)于根據(jù)這些技術(shù)的特征選擇、維度縮減、以及構(gòu)建狀態(tài)機(jī)模型的額外信息可以在共同未決的2013年I月31日提交的美國(guó)專利申請(qǐng)?zhí)?3/755,768中找到,在此通過引用的方式并入本文。
[0023]另一方面,如果使用該架構(gòu)早先已經(jīng)特征化(訓(xùn)練)了給定實(shí)體或相同類型的另一實(shí)體,則可以選擇早先(也即在訓(xùn)練期間)所使用的特征。通過使用相同的特征選擇和維度縮減技術(shù),可以提取相同的特征以用于映射至狀態(tài)機(jī)模型的狀態(tài)中。
[0024]在120處,所提取的特征可以映射至多個(gè)狀態(tài)以使用狀態(tài)序列模塊320產(chǎn)生狀態(tài)序列。至少一些狀態(tài)可以與其他區(qū)分。所提取的特征可以根據(jù)存儲(chǔ)在存儲(chǔ)器350中的狀態(tài)機(jī)模型352而被映射。
[0025]所提取的特征可以使用與狀態(tài)機(jī)模型352相關(guān)聯(lián)的特征模式而映射至多個(gè)狀態(tài)中。結(jié)果是,可以產(chǎn)生了在被監(jiān)控時(shí)間周期期間特征化了實(shí)體360的工作的狀態(tài)序列。在一些情形中,一系列所提取的特征可以并非基于特征模式而良好地映射至狀態(tài)中。在該情形中,可以如潛在地指示了新狀態(tài)而標(biāo)記所提取的特征。這可以由狀態(tài)序列模塊320的新狀態(tài)檢測(cè)模塊322所處理。所提取的特征可以在當(dāng)前處理期間被忽略,并且可以產(chǎn)生最可能的狀態(tài)序列以用于方法100。然后可以在稍后訓(xùn)練階段期間再訪問已標(biāo)記的特征。例如,可以在后續(xù)訓(xùn)練階段中考慮所有數(shù)據(jù)或所提取的特征以便于識(shí)別并添加新狀態(tài)和/或特征模式至狀態(tài)機(jī)模型352。特別地,可以由訓(xùn)練模塊340通過周期性地(例如每I個(gè)月、3個(gè)月等)再訓(xùn)練實(shí)體或者通過每當(dāng)由新狀態(tài)檢測(cè)模塊322檢測(cè)到新狀態(tài)時(shí)再訓(xùn)練而周期性地更新狀態(tài)機(jī)模型 352。
[0026]在130和140處,可以基于狀態(tài)序列并且使用異常檢測(cè)模塊330與度量的所觀測(cè)值比較而確定度量的預(yù)期值。度量可以是各種度量中的任意一種,諸如性能度量或可維持性度量。這種度量可以包括對(duì)資源消耗(例如電力、水、燃?xì)獾?、工作效率(例如性能系數(shù)(C0P))、故障率、環(huán)境影響(例如碳足跡、毒性等)的測(cè)量,或者其他任何感興趣的測(cè)量,包括例如維護(hù)成本、實(shí)體所展現(xiàn)的任何使用模式(例如每天使用周期)等。此外,可以檢查多個(gè)度量,以使得在任意一個(gè)度量或度量的組合的預(yù)期值與觀測(cè)值之間的發(fā)散性可以指示異常行為。
[0027]可以從所記錄數(shù)據(jù)或所提取特征得到度量的觀測(cè)值。備選地,可以外部地確定度量的觀測(cè)值,諸如參考指示了電能消耗的物業(yè)帳單??梢詤⒖紶顟B(tài)機(jī)模型基于狀態(tài)序列而確定度量的預(yù)期值。例如,如在訓(xùn)練階段期間觀測(cè)到的、在對(duì)應(yīng)狀態(tài)中的度量值的特征可以用于對(duì)于狀態(tài)序列中的每個(gè)狀態(tài)而確定度量的預(yù)期值。各種技術(shù)可以用于計(jì)算度量的預(yù)期值并且將其與度量的觀測(cè)值比較。例如,可以使用平均值比較技術(shù)、分布比較技術(shù)、或可能性比較技術(shù)。
[0028]在平均值比較中,可以基于對(duì)于每個(gè)狀態(tài)的該度量的平均值而計(jì)算度量的預(yù)期平均值。給定狀態(tài)序列,假設(shè)Wi指示處于狀態(tài)i的實(shí)體的實(shí)例的小部分,以及假設(shè)m是處于該狀態(tài)的可維持性度量的平均值。則,對(duì)于給定狀態(tài)序列的可維持性度量的預(yù)期值可以計(jì)算為(2Wl*m)/( ΣWl)。該值與所觀測(cè)平均值之間的絕對(duì)差值可以與閾值比較以確定測(cè)試序列是否異常。該閾值可以取決于測(cè)試序列的長(zhǎng)度,也即測(cè)試點(diǎn)的數(shù)目。如果序列是時(shí)間序列,則隨著其持續(xù)時(shí)間增長(zhǎng),閾值減小。例如,閾值T可以如下確定:
[0029]ρ = λ.exp(_ Δ t2/B)
[0030]T=mre/p
[0031]其中Δt是序列的持續(xù)時(shí)間,B是帶寬參數(shù),λ是縮放參數(shù),并且mref是如上計(jì)算的度量的預(yù)期值。
[0032]在分布比較中,可以比較度量的整個(gè)分布而不僅是它們的平均值。使用如上的相同符號(hào),可維持性度量的預(yù)期分布由(給出,其中fi是處于狀態(tài)i的可維持性度量的分布。該分布隨后與觀測(cè)到的分布(在測(cè)試周期期間從觀測(cè)到值而計(jì)算得到)比較以識(shí)別任何異?;顒?dòng)。兩個(gè)分布可以使用諸如重疊的程度、Kullback-Leibler發(fā)散性的許多技術(shù)而比較,或者通過使用諸如Ko Imogorov-Smirnoff測(cè)試的統(tǒng)計(jì)測(cè)試而比較。
[0033]在可能性比較中,可以給定下層狀態(tài)而計(jì)算所觀測(cè)度量序列的可能性。此外,可以給定相同的潛在狀態(tài)序列而計(jì)算用于若干個(gè)隨機(jī)產(chǎn)生的獨(dú)立序列的可能性值。所觀測(cè)的可能性值可以隨后與從隨機(jī)序列產(chǎn)生的可能性值的分布比較以確定狀態(tài)序列的異常。
[0034]在150處,如果度量的觀測(cè)值與度量的預(yù)期值相差閾值量,則可以諸如經(jīng)由用戶界面呈現(xiàn)異常行為的通知??梢愿鶕?jù)如上所述的比較技術(shù)而測(cè)量閾值量??梢愿鶕?jù)不同異常的重要性級(jí)別而以有序或排序的方式呈現(xiàn)異常。例如,對(duì)于給定的異常類型,可以從最大違規(guī)行為至最小違規(guī)行為(而不是以違規(guī)行為所發(fā)生的順序)而列出發(fā)生情況。最大違規(guī)行為可以由觀測(cè)值從度量的預(yù)期值偏離的幅度、可以通過解決異常所實(shí)現(xiàn)的潛在成本節(jié)省而確定,或者由用戶定義成本函數(shù)、異常的嚴(yán)重性(例如將導(dǎo)致實(shí)體故障,將僅引起占有人不適)以及商業(yè)影響而確定。類似地,一些異常類型可以比其他具有更嚴(yán)重的后果(例如過熱的電機(jī)可能需要立即關(guān)注以防止機(jī)械故障,而比正常稍微較溫?zé)岬臅?huì)議室可能不需要來自設(shè)備職員的任何關(guān)注)。因此,用戶界面可以配置為以能夠使設(shè)備職員首先對(duì)最高優(yōu)先級(jí)項(xiàng)目做出行動(dòng)的方式而呈現(xiàn)異常。
[0035]圖4(a)至圖4(f)圖示了根據(jù)示例的對(duì)冷卻器系統(tǒng)異常檢測(cè)的使用情況示例。圖4(a)圖示了具有多個(gè)實(shí)體的建筑物400。建筑物400包括HVAC系統(tǒng)401,其包括兩個(gè)冷卻器,冷卻器I 402和冷卻器2 403。在該示例中,冷卻器I和冷卻器2是水冷冷卻器。HVAC系統(tǒng)401可以也包括許多其他實(shí)體,諸如栗、鼓風(fēng)機(jī)、空氣處理單元和冷卻塔。建筑物400還包括計(jì)算機(jī)網(wǎng)絡(luò)404,其包括多個(gè)計(jì)算機(jī)和其他裝置、以及照明設(shè)備405。建筑物400還可以包括其他實(shí)體406。在此所述的異常檢測(cè)技術(shù)可以用于監(jiān)控所有這些