電場多元運(yùn)行數(shù)據(jù)分析方法及裝置的制造方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及電力技術(shù),具體的將是一種電場多元運(yùn)行數(shù)據(jù)分析方法及裝置。
【背景技術(shù)】
[0002] 隨著風(fēng)電的飛速發(fā)展、電力設(shè)備自動化的逐步加深以及大數(shù)據(jù)時代的到來,風(fēng)電 運(yùn)行數(shù)據(jù)海量的積累且類型多樣,而現(xiàn)有技術(shù)對運(yùn)行數(shù)據(jù)的主要分析方法還集中在統(tǒng)計(jì)分 析層面上,包括概率分布、回歸分析、方差等,數(shù)據(jù)與數(shù)據(jù)之間潛在的相關(guān)性并沒有得到充 分的利用。
[0003] 數(shù)據(jù)挖掘技術(shù)按其承擔(dān)的任務(wù)可分為分類、預(yù)測、關(guān)聯(lián)規(guī)則分析、聚類分析和離群 分析這五大類,而關(guān)聯(lián)規(guī)則是數(shù)據(jù)挖掘領(lǐng)域中一個十分重要的挖掘算法,其側(cè)重于確定數(shù) 據(jù)中不同數(shù)據(jù)項(xiàng)之間的關(guān)系。R.Agrawal等人于1993年首次提出了布爾型關(guān)聯(lián)規(guī)則挖掘算 法(Apriori算法),但布爾型關(guān)聯(lián)規(guī)則處理的值都是離散的、種類化的,它顯示了這些變量 之間的關(guān)系(即數(shù)據(jù)的數(shù)值只能為〇或者1)。
【發(fā)明內(nèi)容】
[0004] 為定量給出電場多元數(shù)據(jù)中每個因素的影響度,本發(fā)明實(shí)施例提供了一種電場多 元運(yùn)行數(shù)據(jù)分析方法,方法包括:
[0005] 對電場多元運(yùn)行數(shù)據(jù)的各指標(biāo)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,生成各指標(biāo)數(shù)據(jù)的標(biāo)準(zhǔn)化事 物項(xiàng)集;
[0006] 利用正態(tài)分布隸屬度函數(shù)對所述標(biāo)準(zhǔn)化事物項(xiàng)集進(jìn)行分區(qū)以及模糊化處理生成 模糊集,并確定各模糊集的隸屬度值;
[0007] 根據(jù)各指標(biāo)數(shù)據(jù)在各模糊集的隸屬度值確定頻繁1項(xiàng)集;
[0008] 根據(jù)確定的頻繁1項(xiàng)集通過該迭代識別計(jì)算出頻繁K項(xiàng)集;
[0009] 利用Apr iori算法中構(gòu)造關(guān)聯(lián)規(guī)則的相關(guān)步驟確定所述頻繁K項(xiàng)集的關(guān)聯(lián)規(guī)則及 可信度,生成電場多元數(shù)據(jù)分析結(jié)果。
[0010] 本發(fā)明實(shí)施例中,對電場多元運(yùn)行數(shù)據(jù)中的各指標(biāo)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理包括: [0011]采用極值標(biāo)準(zhǔn)化方法對電場多元運(yùn)行數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理。
[0012] 本發(fā)明實(shí)施例中,所述的利用正態(tài)分布隸屬度函數(shù)對所述標(biāo)準(zhǔn)化事物項(xiàng)集進(jìn)行模 糊化處理生成模糊集,并確定各模糊集的隸屬度值包括:
[0013] 確定所述標(biāo)準(zhǔn)化事物項(xiàng)集中各指標(biāo)數(shù)據(jù)的期望值;
[0014] 根據(jù)所述各指標(biāo)數(shù)據(jù)的期望值、各指標(biāo)數(shù)據(jù)的標(biāo)準(zhǔn)化事物項(xiàng)集中的最大值、最小 值對所述標(biāo)準(zhǔn)化事物項(xiàng)集中的每一指標(biāo)數(shù)據(jù)分別進(jìn)行分區(qū);
[0015] 根據(jù)預(yù)設(shè)的各分區(qū)的正態(tài)分布隸屬度函數(shù)將所述標(biāo)準(zhǔn)化事物項(xiàng)集轉(zhuǎn)化為模糊集 并確定模糊集的隸屬度值。
[0016] 本發(fā)明實(shí)施例中,所述的預(yù)設(shè)的各分區(qū)的正態(tài)分布隸屬度函數(shù)為:
[0020] 其中,< 為所述標(biāo)準(zhǔn)化事物項(xiàng)集中標(biāo)準(zhǔn)化后的數(shù)據(jù),μΜη、μ_χ為各指標(biāo)數(shù)據(jù)的標(biāo)準(zhǔn) 化事物項(xiàng)集中的的最小值和最大值,μ〇為指標(biāo)數(shù)據(jù)的期望值。。
[0021] 本發(fā)明實(shí)施例中,所述的根據(jù)各指標(biāo)數(shù)據(jù)在各模糊集的隸屬度值確定頻繁1項(xiàng)集 包括:
[0022] 將各指標(biāo)數(shù)據(jù)在對應(yīng)的模糊集合中的隸屬度權(quán)值;
[0023]判斷模糊集合的隸屬度權(quán)值不小于預(yù)設(shè)的最小支持度時,將該模糊集合放入頻繁 1項(xiàng)集中。
[0024]同時,本發(fā)明還提供一種電場多元運(yùn)行數(shù)據(jù)分析裝置,裝置包括:
[0025]標(biāo)準(zhǔn)化處理模塊,用于對電場多元運(yùn)行數(shù)據(jù)的各指標(biāo)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,生成 各指標(biāo)數(shù)據(jù)的標(biāo)準(zhǔn)化事物項(xiàng)集;
[0026]模糊處理模塊,用于利用正態(tài)分布隸屬度函數(shù)對所述標(biāo)準(zhǔn)化事物項(xiàng)集進(jìn)行模糊化 處理生成模糊集,并確定各模糊集的隸屬度值;
[0027] 頻繁1項(xiàng)集生成模塊,用于根據(jù)各指標(biāo)數(shù)據(jù)在各模糊集的隸屬度值確定頻繁1項(xiàng) 集;
[0028] 頻繁Κ項(xiàng)集生成模塊,用于根據(jù)確定的頻繁1項(xiàng)集通過該迭代識別計(jì)算出頻繁Κ項(xiàng) 集;
[0029] 分析結(jié)果生成模塊,利用Apriori算法中構(gòu)造關(guān)聯(lián)規(guī)則的相關(guān)步驟確定所述頻繁Κ 項(xiàng)集的關(guān)聯(lián)規(guī)則及可信度,生成電場多元數(shù)據(jù)分析結(jié)果。
[0030] 本發(fā)明實(shí)施例中,標(biāo)準(zhǔn)化處理模塊采用極值標(biāo)準(zhǔn)化方法對電場多元運(yùn)行數(shù)據(jù)進(jìn)行 標(biāo)準(zhǔn)化處理。
[0031 ]本發(fā)明實(shí)施例中,所述的模糊處理模塊包括:
[0032] 期望值確定單元,用于確定所述標(biāo)準(zhǔn)化事物項(xiàng)集中各指標(biāo)數(shù)據(jù)的期望值;
[0033] 分區(qū)單元,根據(jù)所述各指標(biāo)數(shù)據(jù)的期望值、各指標(biāo)數(shù)據(jù)的標(biāo)準(zhǔn)化事物項(xiàng)集中的最 大值、最小值對所述標(biāo)準(zhǔn)化事物項(xiàng)集進(jìn)行分區(qū);
[0034] 模糊集生成單元,根據(jù)預(yù)設(shè)的各分區(qū)的正態(tài)分布隸屬度函數(shù)將所述標(biāo)準(zhǔn)化事物項(xiàng) 集轉(zhuǎn)化為模糊集并確定模糊集的隸屬度值。
[0035] 本發(fā)明實(shí)施例中,所述的頻繁1項(xiàng)集生成模塊包括:
[0036] 隸屬度權(quán)值生成單元,用于將各指標(biāo)數(shù)據(jù)在對應(yīng)的模糊集合中的隸屬度權(quán)值; [0037]判斷單元,判斷模糊集合的隸屬度權(quán)值不小于預(yù)設(shè)的最小支持度時,將該模糊集 合放入頻繁1項(xiàng)集中。
[0038] 本發(fā)明提出了改進(jìn)模糊函數(shù)關(guān)聯(lián)規(guī)則挖掘算法,將其引入風(fēng)電場多元海量運(yùn)行數(shù) 據(jù)的分析工作中。該算法用分區(qū)的概念將布爾型關(guān)聯(lián)規(guī)則轉(zhuǎn)化為數(shù)值型關(guān)聯(lián)規(guī)則,并且引 入模糊數(shù)學(xué)中正態(tài)分布隸屬函數(shù)的概念,使其邊界更加合理有效。
[0039] 為讓本發(fā)明的上述和其他目的、特征和優(yōu)點(diǎn)能更明顯易懂,下文特舉較佳實(shí)施例, 并配合所附圖式,作詳細(xì)說明如下。
【附圖說明】
[0040] 為了更清楚地說明本發(fā)明實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對實(shí)施例或現(xiàn) 有技術(shù)描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本 發(fā)明的一些實(shí)施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以 根據(jù)這些附圖獲得其他的附圖。
[0041 ]圖1為關(guān)聯(lián)規(guī)則基本模型;
[0042] 圖2為本發(fā)明實(shí)施例提供的電場多元運(yùn)行數(shù)據(jù)分析方法流程圖;
[0043] 圖3為本發(fā)明實(shí)施例中的模糊函數(shù)關(guān)聯(lián)規(guī)則算法流程圖;
[0044] 圖4為本發(fā)明實(shí)施例中的隸屬度函數(shù);
[0045] 圖5為本發(fā)明實(shí)施例中風(fēng)機(jī)年發(fā)電量統(tǒng)計(jì)圖。
【具體實(shí)施方式】
[0046]下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完 整地描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例?;?本發(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動前提下所獲得的所有其他 實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
[0047]縮略語和關(guān)鍵術(shù)語定義:
[0048] (1)關(guān)聯(lián)規(guī)則的定義:
[0049]關(guān)聯(lián)規(guī)則挖掘用于發(fā)現(xiàn)存在于數(shù)據(jù)庫中的項(xiàng)目或?qū)傩蚤g的有趣的關(guān)聯(lián)或相關(guān)關(guān) 系,即從數(shù)據(jù)集中識別出頻繁出現(xiàn)的屬性集(又稱頻繁項(xiàng)集),然后再利用這些頻繁集創(chuàng)建 描述關(guān)聯(lián)關(guān)系的規(guī)則的過程。這些關(guān)系是預(yù)先未知和被隱藏的,即不能通過數(shù)據(jù)庫的邏輯 操作(如表的聯(lián)接)或統(tǒng)計(jì)方法得出。這說明關(guān)聯(lián)規(guī)則不是基于數(shù)據(jù)自身的固有屬性(如函 數(shù)依賴關(guān)系),而是基于數(shù)據(jù)項(xiàng)目的同時出現(xiàn)特征。
[0050] (2)關(guān)聯(lián)規(guī)則的概念:
[0051] ……im}是項(xiàng)的集合。設(shè)任務(wù)相關(guān)的數(shù)據(jù)D是數(shù)據(jù)庫事務(wù)的集合,其中 每個事務(wù)T是項(xiàng)的集合,使得Γ&/。每一個事務(wù)有一個標(biāo)識符,稱作TID。設(shè)A是一個項(xiàng)集,若 事務(wù)T包含A,則一定有j
[0052] 定義1:關(guān)聯(lián)規(guī)則挖掘的記錄集記為D(D為事務(wù)數(shù)據(jù)庫),D= {ti,t2,…,tk,···,tn}, tk={ii,i2,"_,ij,…,iP}(k=l,2,···,]!)為一條事務(wù);tk中的元素 ij( j = l,2,......,ρ)稱為 項(xiàng)目。
[0053] 定義2:設(shè)I = {h,i2,……im}是D中全體項(xiàng)目組成的集合,I的任何子集A稱為D中的 項(xiàng)目集,IA | = k稱集合A為k項(xiàng)目集。
[0054] 定義3:關(guān)聯(lián)規(guī)則是形如3=>苕的蘊(yùn)涵式,其中』e/,5c/,并且ΑΠΒ= Φ。規(guī)則 j 3 5在事務(wù)集D中出現(xiàn),具有支持度s,其中s是D中事務(wù)包含A U Β(即Α和Β二者)的百分比。 它是概率P(A U B)。規(guī)則d 4 B在事務(wù)集D中具有置信度c,如果D中包含A事務(wù)的同時也包含 B的百分比是c,那么它是條件概率P(B|A)。即支持度為:
[0058] 支持度和置信度是描述關(guān)聯(lián)規(guī)則的兩個重要概念,前者用于衡量關(guān)聯(lián)規(guī)則在整個 數(shù)據(jù)集中的統(tǒng)計(jì)重要性,后者用于衡量關(guān)聯(lián)規(guī)則的可信程度。通常用戶根據(jù)采掘需要指定 最小支持度(記為minsupport)和最小置信度(記為minconfidence)。前者描述了關(guān)聯(lián)規(guī)則 的最低重要程度,后者規(guī)定了關(guān)聯(lián)規(guī)則必須滿足的最低可靠性。
[0059] 定義4
且
為強(qiáng)規(guī)則............. 為弱規(guī)則。
[0060] 關(guān)聯(lián)規(guī)則挖掘問題就是在D中求解所有支持度和置信度均超過minsupport 和m i n c ο n f i d e n c e的關(guān)聯(lián)規(guī)則,即要求解滿足
[0061] Apriori 算法:
[0062] Apriori算法是一種挖掘布爾關(guān)聯(lián)規(guī)則頻繁項(xiàng)集的算法,關(guān)聯(lián)規(guī)則的發(fā)現(xiàn)可分為 兩步:
[0063] (1)根據(jù)用戶設(shè)定的頻