本發(fā)明屬于雷電預(yù)警技術(shù),尤其涉及一種雷電活動(dòng)氣象關(guān)聯(lián)規(guī)則挖掘方法、裝置及電子設(shè)備。
背景技術(shù):
1、雷電活動(dòng)是影響電力系統(tǒng)穩(wěn)定性和安全性的重要因素之一,強(qiáng)雷暴天氣往往導(dǎo)致輸電線路跳閘和設(shè)備損壞,因此,為了確保輸電線路的安全運(yùn)行,有必要采取有效的措施來預(yù)防和減輕雷電災(zāi)害對(duì)電力系統(tǒng)的影響,其中對(duì)雷電活動(dòng)的監(jiān)測(cè)預(yù)警顯得尤為重要。
2、要評(píng)估雷電活動(dòng)對(duì)電力系統(tǒng)的影響,往往要考慮地理位置、氣候、輸電線路的設(shè)計(jì)等因素,其中氣象條件是對(duì)雷電活動(dòng)最具影響力的環(huán)境因素之一,是雷電活動(dòng)預(yù)警的重要參考依據(jù),因此有必要開展雷電活動(dòng)與氣象條件的關(guān)聯(lián)性分析,獲取雷電活動(dòng)的多參量氣象驅(qū)動(dòng)參數(shù)。
3、有相當(dāng)?shù)难芯块_展了雷電活動(dòng)與氣象條件的關(guān)聯(lián)性分析,這些分析方法大多數(shù)基于熵權(quán)法、卡方檢驗(yàn)等,往往需要多次掃描數(shù)據(jù)集,并產(chǎn)生大量的候選集,在處理大規(guī)模數(shù)據(jù)集時(shí)會(huì)導(dǎo)致較高的時(shí)間和空間復(fù)雜度,降低分析效率,此外,這些方法在數(shù)據(jù)集稀疏時(shí)表現(xiàn)變差,無法有效利用數(shù)據(jù)集的結(jié)構(gòu)信息。其他一些新穎的挖掘方法在大數(shù)據(jù)集的適用性上同樣表現(xiàn)不理想。
技術(shù)實(shí)現(xiàn)思路
1、基于此,本發(fā)明旨在提供一種雷電活動(dòng)氣象關(guān)聯(lián)規(guī)則挖掘方法、裝置及電子設(shè)備,基于大容量的雷電氣象數(shù)據(jù)集準(zhǔn)確高效挖掘出雷電活動(dòng)的多參量強(qiáng)關(guān)聯(lián)氣象因子。
2、第一方面,本發(fā)明提出一種雷電活動(dòng)氣象關(guān)聯(lián)規(guī)則挖掘方法,包括:
3、獲取目標(biāo)區(qū)域的氣象因子數(shù)據(jù)和雷電活動(dòng)數(shù)據(jù);
4、以氣象因子數(shù)據(jù)為自變量,雷電活動(dòng)數(shù)據(jù)為因變量,利用bi-eclat算法進(jìn)行雷電活動(dòng)的關(guān)聯(lián)規(guī)則挖掘,生成雷電活動(dòng)的第一氣象關(guān)聯(lián)規(guī)則;
5、把目標(biāo)區(qū)域劃分為若干網(wǎng)格,利用knn模型對(duì)網(wǎng)格進(jìn)行二分類,確定屬于多雷區(qū)的網(wǎng)格及其k個(gè)鄰域網(wǎng)格;
6、遍歷與屬于多雷區(qū)的網(wǎng)格對(duì)應(yīng)的k個(gè)鄰域網(wǎng)格的氣象因子數(shù)據(jù),根據(jù)k個(gè)鄰域網(wǎng)格的氣象因子數(shù)據(jù)生成雷電活動(dòng)的第二氣象關(guān)聯(lián)規(guī)則;
7、對(duì)第一氣象關(guān)聯(lián)規(guī)則和第二氣象關(guān)聯(lián)規(guī)則求取交集得到第三氣象關(guān)聯(lián)規(guī)則,第三氣象關(guān)聯(lián)規(guī)則為最終的雷電活動(dòng)的氣象關(guān)聯(lián)規(guī)則。
8、進(jìn)一步地,利用bi-eclat算法進(jìn)行雷電活動(dòng)的關(guān)聯(lián)規(guī)則挖掘,生成氣象因子與雷電活動(dòng)的第一氣象關(guān)聯(lián)規(guī)則包括:
9、根據(jù)氣象因子數(shù)據(jù)和雷電活動(dòng)數(shù)據(jù)確定輸入數(shù)據(jù)集,輸入數(shù)據(jù)集表征氣象因子數(shù)據(jù)和雷電活動(dòng)數(shù)據(jù)的映射關(guān)系;
10、基于輸入數(shù)據(jù)集識(shí)別得到按支持度降序排列的頻繁1項(xiàng)集;
11、令屬于k項(xiàng)集的任意兩個(gè)長(zhǎng)度為k-1的子集相交,得到每個(gè)類中所有k項(xiàng)集的支持度;
12、按支持度升序?qū)項(xiàng)集進(jìn)行遍歷刪除低于支持度閾值的項(xiàng),再基于eclat算法挖掘頻繁項(xiàng)集生成雷電活動(dòng)的第一氣象關(guān)聯(lián)規(guī)則。
13、進(jìn)一步地,knn模型的訓(xùn)練過程包括:
14、構(gòu)建knn模型,利用不同的距離度量和距離權(quán)重組合對(duì)初始knn模型訓(xùn)練,以準(zhǔn)確度最高和虛假度最小為訓(xùn)練目標(biāo),得到使得knn模型的超參數(shù)最優(yōu)的距離度量和距離權(quán)重組合,以及k值的最優(yōu)取值范圍。
15、進(jìn)一步地,訓(xùn)練好的knn模型以歐氏距離或街區(qū)距離為距離度量,以反距離平方為距離權(quán)重,k值的取值范圍為8~18。
16、進(jìn)一步地,利用knn模型對(duì)網(wǎng)格進(jìn)行二分類,確定屬于多雷區(qū)的網(wǎng)格及其對(duì)應(yīng)的k個(gè)鄰域網(wǎng)格包括:
17、根據(jù)雷電活動(dòng)數(shù)據(jù)把網(wǎng)格分類為多雷區(qū)和其他雷區(qū),并生成網(wǎng)格的雷區(qū)分類標(biāo)簽;
18、利用knn模型生成各網(wǎng)格的雷區(qū)分類結(jié)果;
19、根據(jù)網(wǎng)格的雷區(qū)分類標(biāo)簽和雷區(qū)分類結(jié)果確定被正確分類為多雷區(qū)的網(wǎng)格;
20、對(duì)被正確分類為多雷區(qū)的網(wǎng)格再次使用knn模型確定其k個(gè)鄰域網(wǎng)格,根據(jù)k個(gè)鄰域網(wǎng)格的雷區(qū)分類標(biāo)簽確定屬于多雷區(qū)的鄰域網(wǎng)格。
21、進(jìn)一步地,根據(jù)雷電活動(dòng)數(shù)據(jù)確定每個(gè)網(wǎng)格的雷區(qū)分類標(biāo)簽包括:
22、根據(jù)網(wǎng)格的劃分精度對(duì)雷電活動(dòng)數(shù)據(jù)網(wǎng)格化,確定每個(gè)網(wǎng)格對(duì)應(yīng)的雷電活動(dòng)數(shù)據(jù),其中雷電活動(dòng)數(shù)據(jù)包括雷電地閃密度;
23、比較各網(wǎng)格對(duì)應(yīng)的雷電地閃密度和地閃密度閾值,把雷電地閃密度高于地閃密度閾值的網(wǎng)格分類為多雷區(qū),否則分類為其他雷區(qū)。
24、進(jìn)一步地,遍歷與屬于多雷區(qū)的網(wǎng)格對(duì)應(yīng)的k個(gè)鄰域網(wǎng)格的氣象因子數(shù)據(jù),生成雷電活動(dòng)的第二氣象關(guān)聯(lián)規(guī)則包括:
25、遍歷k個(gè)鄰域網(wǎng)格中屬于多雷區(qū)的鄰域網(wǎng)格的氣象因子數(shù)據(jù),根據(jù)被遍歷的鄰域網(wǎng)格的氣象因子數(shù)據(jù)確定各氣象因子的最小值和最大值,基于各氣象因子的最小值和最大值確定各氣象因子的取值范圍;
26、根據(jù)各氣象因子的取值范圍生成雷電活動(dòng)的第二氣象關(guān)聯(lián)規(guī)則。
27、第二方面,本發(fā)明提供一種關(guān)聯(lián)規(guī)則挖掘裝置,用于挖掘雷電活動(dòng)的氣象關(guān)聯(lián)規(guī)則,包括:
28、數(shù)據(jù)獲取模塊,用于獲取目標(biāo)區(qū)域的氣象因子數(shù)據(jù)和雷電活動(dòng)數(shù)據(jù);
29、第一關(guān)聯(lián)規(guī)則挖掘模塊,用于以氣象因子數(shù)據(jù)為自變量,雷電活動(dòng)數(shù)據(jù)為因變量,利用bi-eclat算法進(jìn)行雷電活動(dòng)的關(guān)聯(lián)規(guī)則挖掘,生成雷電活動(dòng)的第一氣象關(guān)聯(lián)規(guī)則;
30、雷區(qū)分類模塊,用于把目標(biāo)區(qū)域劃分為若干網(wǎng)格,利用knn模型對(duì)網(wǎng)格進(jìn)行二分類,確定屬于多雷區(qū)的網(wǎng)格及其k個(gè)鄰域網(wǎng)格;
31、第二關(guān)聯(lián)規(guī)則挖掘模塊,用于遍歷與屬于多雷區(qū)的網(wǎng)格對(duì)應(yīng)的k個(gè)鄰域網(wǎng)格的氣象因子數(shù)據(jù),生成雷電活動(dòng)的第二氣象關(guān)聯(lián)規(guī)則;
32、規(guī)則合并模塊,用于對(duì)第一氣象關(guān)聯(lián)規(guī)則和第二氣象關(guān)聯(lián)規(guī)則求取交集得到第三氣象關(guān)聯(lián)規(guī)則,第三氣象關(guān)聯(lián)規(guī)則為最終的雷電活動(dòng)的氣象關(guān)聯(lián)規(guī)則。
33、第三方面,本發(fā)明提供一種電子設(shè)備,包括存儲(chǔ)有計(jì)算機(jī)可執(zhí)行指令的存儲(chǔ)器和處理器,當(dāng)計(jì)算機(jī)可執(zhí)行指令被所述處理器執(zhí)行時(shí)使得該設(shè)備執(zhí)行第一方面提供的雷電活動(dòng)氣象關(guān)聯(lián)規(guī)則挖掘方法的各個(gè)步驟。
34、第四方面,本發(fā)明提供一種可讀存儲(chǔ)介質(zhì),存儲(chǔ)有計(jì)算機(jī)可執(zhí)行程序,當(dāng)該程序被執(zhí)行時(shí)可實(shí)現(xiàn)第一方面提供的雷電活動(dòng)氣象關(guān)聯(lián)規(guī)則挖掘方法的各個(gè)步驟。
35、從以上技術(shù)方案可以看出,本發(fā)明具有如下有益效果:
36、本發(fā)明提供了一種雷電活動(dòng)氣象關(guān)聯(lián)規(guī)則挖掘方法,首先利用bi-eclat算法的雙向擴(kuò)展優(yōu)勢(shì)盡早找到不頻繁項(xiàng)集進(jìn)行修剪,從而挖掘出雷電活動(dòng)的第一氣象關(guān)聯(lián)規(guī)則,相較于常規(guī)的eclat算法逐步縮小搜索空間,減小冗余度、減小內(nèi)存并提高挖掘效率,在此基礎(chǔ)上利用knn模型確定每個(gè)地理網(wǎng)格的鄰域網(wǎng)格,利用鄰域網(wǎng)格的氣象因子數(shù)據(jù)挖掘出雷電活動(dòng)的第二氣象關(guān)聯(lián)規(guī)則,求第一氣象關(guān)聯(lián)規(guī)則和第二氣象關(guān)聯(lián)規(guī)則的交集得到最終的氣象關(guān)聯(lián)規(guī)則,bi-eclat算法和knn模型的挖掘結(jié)果相互修正,克服了傳統(tǒng)方法低效、內(nèi)存占用大、對(duì)數(shù)據(jù)密集度敏感、適應(yīng)性有限、需要多次掃描數(shù)據(jù)等缺點(diǎn),實(shí)現(xiàn)了更高效率及更強(qiáng)適用性。
1.一種雷電活動(dòng)氣象關(guān)聯(lián)規(guī)則挖掘方法,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述利用bi-eclat算法進(jìn)行雷電活動(dòng)的關(guān)聯(lián)規(guī)則挖掘,生成氣象因子與雷電活動(dòng)的第一氣象關(guān)聯(lián)規(guī)則包括:
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述knn模型的訓(xùn)練過程包括:
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,訓(xùn)練好的所述knn模型以歐氏距離或街區(qū)距離為距離度量,以反距離平方為距離權(quán)重,k值的取值范圍為8~18。
5.根據(jù)權(quán)利要求3或4所述的方法,其特征在于,利用所述knn模型對(duì)網(wǎng)格進(jìn)行二分類,確定屬于多雷區(qū)的網(wǎng)格及其對(duì)應(yīng)的k個(gè)鄰域網(wǎng)格包括:
6.根據(jù)權(quán)利要求5所述的方法,其特征在于,所述根據(jù)雷電活動(dòng)數(shù)據(jù)把網(wǎng)格分類為多雷區(qū)和其他雷區(qū)包括:
7.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述遍歷與屬于多雷區(qū)的網(wǎng)格對(duì)應(yīng)的k個(gè)鄰域網(wǎng)格的氣象因子數(shù)據(jù),生成雷電活動(dòng)的第二氣象關(guān)聯(lián)規(guī)則包括:
8.一種關(guān)聯(lián)規(guī)則挖掘裝置,其特征在于,所述裝置用于挖掘雷電活動(dòng)的氣象關(guān)聯(lián)規(guī)則,包括:
9.一種電子設(shè)備,其特征在于,包括存儲(chǔ)有計(jì)算機(jī)可執(zhí)行指令的存儲(chǔ)器和處理器,當(dāng)計(jì)算機(jī)可執(zhí)行指令被所述處理器執(zhí)行時(shí)使得該設(shè)備執(zhí)行如權(quán)利要求1~7任一項(xiàng)所述的雷電活動(dòng)氣象關(guān)聯(lián)規(guī)則挖掘方法。
10.一種可讀存儲(chǔ)介質(zhì),其特征在于,存儲(chǔ)有計(jì)算機(jī)可執(zhí)行程序,當(dāng)該程序被執(zhí)行時(shí)可實(shí)現(xiàn)如權(quán)利要求1~7任一項(xiàng)所述的雷電活動(dòng)氣象關(guān)聯(lián)規(guī)則挖掘方法。