本發(fā)明涉及自然語言處理和電力系統(tǒng)安全,具體為基于lstm的電網(wǎng)事故處置預案文本相似度匹配方法及系統(tǒng)。
背景技術:
1、電網(wǎng)運行過程中,斷面越限事故的預防和處理是保證電網(wǎng)安全穩(wěn)定運行的重要環(huán)節(jié)。傳統(tǒng)的預案文本相似度評估方法主要依賴人工經(jīng)驗和簡單的文本匹配算法,存在效率低、準確性差的問題。隨著自然語言處理技術的發(fā)展,深度學習模型(如lstm)在文本相似度計算中的應用日益廣泛,能夠更好地理解文本的語義信息,提高相似度評估的準確性。
2、在現(xiàn)代電網(wǎng)運行過程中,電網(wǎng)事故的頻發(fā)性和復雜性給電力系統(tǒng)的穩(wěn)定運行帶來了巨大挑戰(zhàn)。為了有效應對和處置電網(wǎng)事故,電網(wǎng)運營機構通常會制定詳細的事故處置預案。然而,隨著電力系統(tǒng)規(guī)模的不斷擴大和運行條件的復雜化,電網(wǎng)事故處置預案的數(shù)量和復雜程度也在不斷增加。傳統(tǒng)的預案管理和匹配方法難以滿足快速、精準的預案檢索需求,亟需一種高效、智能的預案匹配方法來提高電網(wǎng)事故的應急響應能力。
3、現(xiàn)有的電網(wǎng)事故處置預案匹配技術主要依賴于關鍵詞匹配和基于規(guī)則的檢索方法。這些方法在處理簡單、結構化的信息時具有一定的優(yōu)勢,但在面對大規(guī)模、非結構化的預案文本時,表現(xiàn)出顯著的不足。關鍵詞匹配方法容易受到詞匯多樣性和語義歧義的影響,導致匹配結果的準確性較低。而基于規(guī)則的檢索方法雖然能夠在一定程度上提高匹配的精準度,但其規(guī)則的設計和維護成本較高,且難以適應電網(wǎng)事故處置預案的快速更新和變化。此外,傳統(tǒng)方法在處理語義相似度和上下文理解方面存在較大局限,難以充分挖掘預案文本中的深層信息。
技術實現(xiàn)思路
1、鑒于上述存在的問題,提出了本發(fā)明。
2、因此,本發(fā)明解決的技術問題是:現(xiàn)有的預案文本相似度評估方法存在文本特征表示的準確性低,多樣性低,相似度計算可靠性和精度低,以及無法實現(xiàn)電網(wǎng)事故的快速響應和處理的問題。
3、為解決上述技術問題,本發(fā)明提供如下技術方案:基于lstm的電網(wǎng)事故處置預案文本相似度匹配方法,包括對文本庫抽樣并對抽樣文本進行分割;通過lstm模型分別對事故后方式和事故處置步驟進行語義特征提??;提取事故后方式中的結構化特征和事故處置步驟中的結構化特征,進行特征融合;基于輸出融合特征向量余弦相似度輸出綜合相似度得分。
4、作為本發(fā)明所述的基于lstm的電網(wǎng)事故處置預案文本相似度匹配方法的一種優(yōu)選方案,其中:所述對文本庫抽樣并對抽樣文本進行分割包括從預案文本庫中隨機抽樣選擇兩個預案文本,將每個預案文本分割為事故后方式和事故處置步驟兩個部分。
5、作為本發(fā)明所述的基于lstm的電網(wǎng)事故處置預案文本相似度匹配方法的一種優(yōu)選方案,其中:所述通過lstm模型分別對事故后方式和事故處置步驟進行語義特征提取包括使用lstm模型分別對事故后方式和事故處置步驟進行語義特征提取,輸出相應的特征向量;
6、所述lstm-self-attention模型為一種結合長短期記憶和自注意力機制的深度學習模型;
7、對于給定的兩個待匹配電網(wǎng)事故預案文本text-a和text-b,假定text-a和text-b分別由la和lb個詞語組成,每個詞語經(jīng)self-attention訓練后輸出相應的文本向量,將文本中每個詞語對應的詞向量vi按原始順序拼接得到初始句向量表示ma和mb;
8、對于text-a文本,使用已有的嵌入模型word2vec將文本中的每個詞表示為一個la1維度的事故后方式向量和la2維度的事故處置步驟向量,表示為:
9、
10、其中,表示la1維度的詞向量,對于事故后方式中的每一個詞在中都存在一個向量對應,表示文本中的詞,與相同;
11、對xa向量使用lstm進行編碼,轉(zhuǎn)換為固定維度的向量表示,表示為:
12、
13、其中,ha1、ha1表示和的固定維度的向量。
14、作為本發(fā)明所述的基于lstm的電網(wǎng)事故處置預案文本相似度匹配方法的一種優(yōu)選方案,其中:所述提取事故后方式中的結構化特征和事故處置步驟中的結構化特征包括提取事故后方式中的結構化特征和事故處置步驟中的結構化特征;
15、所述結構化特征包括越限設備、越限值;
16、所述結構化特征包括操作設備、操作方式;
17、對于預案文本text-a,從文本的事故后方式中提取如事件類型、事故等級、故障設備、越限值作為文本的向量,從文本的事故處置步驟中提取如操作設備、操作方式作為文本的特征向量,對于文本text-a輸出如下的結構化的特征向量,表示為:
18、
19、其中,表示事故后方式的特征向量,表示事件類型,表示事故等級,和表示故障設備和對應的越限值,表示事故處置步驟的特征向量,和表示操作設備、操作方式;
20、由于在兩個文本中的事故后方式與事故處置步驟中的結構化的特征存在不同,則以文本中較多特征數(shù)量的文本為主,對其中特征數(shù)量較小的特征向量進補0向量。
21、作為本發(fā)明所述的基于lstm的電網(wǎng)事故處置預案文本相似度匹配方法的一種優(yōu)選方案,其中:所述進行特征融合包括將語義特征與結構化特征進行融合,形成綜合特征向量,表示為:
22、
23、其中,fa1、fa2分別表示是通過lstm模型對事故后方式和事故處置步驟提取的語義特征向量。
24、作為本發(fā)明所述的基于lstm的電網(wǎng)事故處置預案文本相似度匹配方法的一種優(yōu)選方案,其中:所述基于輸出融合特征向量余弦相似度輸出綜合相似度得分包括通過計算融合特征向量之間的余弦相似度,輸出兩個預案文本的綜合相似度得分,表示為:
25、
26、其中,θa1,b1與θa2,b2表示兩個文本的事故后方式部分的相似度與事故處置步驟部分的相似度;
27、θall=αθa1,b1+(1-α)θa2,b2
28、其中,θall即為兩個電網(wǎng)事故處置預案文本的相似度,當θall的值越大時,兩個預案文本的相似度越高。
29、作為本發(fā)明所述的基于lstm的電網(wǎng)事故處置預案文本相似度匹配方法的一種優(yōu)選方案,其中:所述基于輸出融合特征向量余弦相似度輸出綜合相似度得分包括通過引入權重矩陣和加權內(nèi)積,根據(jù)具體應用場景動態(tài)調(diào)整特征權重,考慮特征向量的直接匹配,構建綜合相似度得分模型表示為:
30、
31、其中,θ表示綜合相似度得分,兩個預案文本之間的相似度,wj表示權重矩陣,用于調(diào)整特征的重要性,uj表示權重矩陣,用于調(diào)整特征的重要性;
32、當θ輸出靠近1,表示fa1和fa2的各個元素之間存在線性相關性;
33、當θ輸出靠近0,表示fa1和fa2的各個元素之間缺乏線性相關性。
34、本發(fā)明的另外一個目的是提供基于lstm的電網(wǎng)事故處置預案文本相似度匹配系統(tǒng),其能基于輸出融合特征向量余弦相似度輸出綜合相似度得分,解決了目前的預案文本相似度評估方法含有相似度計算可靠性和精度低的問題。
35、作為本發(fā)明所述的基于lstm的電網(wǎng)事故處置預案文本相似度匹配系統(tǒng)的一種優(yōu)選方案,其中:包括文本抽樣分割模塊,語義特征提取模塊,結構化特征提取模塊,特征融合模塊,相似度輸出模塊;所述文本抽樣分割模塊用于從預案文本庫中抽樣選擇兩個預案文本并進行文本分割;所述語義特征提取模塊用于使用lstm模型分別對事故后方式和事故處置步驟進行語義特征提取;所述結構化特征提取模塊用于提取事故后方式中的結構化特征和事故處置步驟中的結構化特征;所述特征融合模塊用于將語義特征與結構化特征進行融合,形成綜合特征向量;所述相似度輸出模塊用于輸出融合特征向量之間的余弦相似度,得到兩個預案文本的所述特征融合模塊用于綜合相似度得分
36、一種計算機設備,包括存儲器和處理器,所述存儲器存儲有計算機程序,所述處理器執(zhí)行所述計算機程序是實現(xiàn)基于lstm的電網(wǎng)事故處置預案文本相似度匹配方法的步驟。
37、一種計算機可讀存儲介質(zhì),其上存儲有計算機程序,所述計算機程序被處理器執(zhí)行時實現(xiàn)基于lstm的電網(wǎng)事故處置預案文本相似度匹配方法的步驟。
38、本發(fā)明的有益效果:本發(fā)明提供的基于lstm的電網(wǎng)事故處置預案文本相似度匹配方法通過對預案文本庫中的文本進行隨機抽樣,提升模型對預案文本的理解能力和處理效率,通過lstm模型分別對事故后方式和事故處置步驟進行語義特征提取,提高文本特征表示的準確性,提取事故后方式中的結構化特征和事故處置步驟中的結構化特征,進行特征融合,提升特征表示多樣性和準確性,通過計算融合特征向量之間的余弦相似度,輸出兩個預案文本的綜合相似度得分,提高相似度計算可靠性和精度,引入權重矩陣和加權內(nèi)積,根據(jù)具體應用場景動態(tài)調(diào)整特征權重,增強模型適應性和提高相似度計算精度,本發(fā)明在相似度計算可靠性和精度、適應性以及文本特征表示準確性方面都取得更加良好的效果。