本發(fā)明涉及水上交通,尤其涉及一種基于知識圖譜的海域違法事件追源方法、裝置和電子設(shè)備。
背景技術(shù):
1、通用知識圖譜實體數(shù)量多,但其準(zhǔn)確度較低,無法實現(xiàn)海上違法事件的精準(zhǔn)應(yīng)用。通過多源異構(gòu)數(shù)據(jù)的信息融合結(jié)果進(jìn)行實體識別、知識抽取、知識融合質(zhì)量評估,構(gòu)建違法事件本體關(guān)系識別-知識抽取融合-知識過程存儲的知識圖譜模型,彌補了通用知識圖譜在實體屬性和數(shù)據(jù)模式不夠豐富的缺陷,可兼顧不同違法事件的應(yīng)用場景與使用人員的需求。
2、圖卷積神經(jīng)網(wǎng)絡(luò)是一種用來高效處理圖結(jié)構(gòu)數(shù)據(jù)的神經(jīng)網(wǎng)絡(luò),傳統(tǒng)的卷積神經(jīng)網(wǎng)絡(luò)模型只能用來處理具有歐幾里德結(jié)構(gòu)類型的數(shù)據(jù),圖結(jié)構(gòu)中的節(jié)點由于不具備平移不變性,因此不能通過共享相同大小的卷積核來對其進(jìn)行卷積運算。graphsage(graph?sampleand?aggregate)算法與其他圖神經(jīng)網(wǎng)絡(luò)相比,其特點在于其強大的歸納學(xué)習(xí)能力,使得它能夠處理未見節(jié)點并為新節(jié)點快速生成嵌入;同時,通過鄰域采樣和多樣化的聚合函數(shù),graphsage實現(xiàn)了對大規(guī)模圖的高效處理與豐富特征的捕獲,從而在實際應(yīng)用中顯示出更高的靈活性和可擴展性。
3、現(xiàn)有的線索挖掘和事故追源方法存在以下幾個問題:1.目前已有研究人員使用事理圖譜來進(jìn)行事件的追源,但是往往只是將事件以圖譜的方式結(jié)構(gòu)化表示,未進(jìn)行深度的學(xué)習(xí);2.當(dāng)前的事故追源基本上都是在固定節(jié)點的圖譜上進(jìn)行的,當(dāng)有新事件出現(xiàn)時,當(dāng)前的圖譜需要重新進(jìn)行學(xué)習(xí),增加了計算的復(fù)雜度。
技術(shù)實現(xiàn)思路
1、有鑒于此,有必要提供一種基于知識圖譜的海域違法事件追源方法、裝置和電子設(shè)備,用以解決現(xiàn)有技術(shù)中海上違法事件的追源方法在固定節(jié)點上進(jìn)行,動態(tài)更新新事件時會導(dǎo)致圖譜計算量大,從而導(dǎo)致追源效率低的技術(shù)問題。
2、為了解決上述問題,本發(fā)明提供一種基于知識圖譜的海域違法事件追源方法,包括:
3、基于海域違法事件數(shù)據(jù)集構(gòu)建目標(biāo)知識圖譜,確定違法事件知識三元組;
4、根據(jù)違法事件知識三元組,建立實際海域違法數(shù)據(jù)的特征矩陣數(shù)據(jù)集;
5、以所述特征矩陣數(shù)據(jù)集為輸入,對初始圖神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,得到訓(xùn)練完備的目標(biāo)圖神經(jīng)網(wǎng)絡(luò);
6、根據(jù)目標(biāo)圖神經(jīng)網(wǎng)絡(luò)和實時海域數(shù)據(jù),對海域違法事件進(jìn)行追源。
7、在一種可能的實現(xiàn)方式中,所述基于海域違法案例數(shù)據(jù)集構(gòu)建目標(biāo)知識圖譜,確定違法事件知識三元組,包括:
8、獲取海域違法事件的歷史數(shù)據(jù),其中,歷史數(shù)據(jù)至少包括涉事船舶信息、事件發(fā)生位置、發(fā)生事件、涉事人員和事件背景;
9、對歷史數(shù)據(jù)進(jìn)行分析,確定本體關(guān)系模型;
10、根據(jù)本體關(guān)系模型訓(xùn)練海域違法知識抽取模型的實體識別模塊和關(guān)系抽取模塊;
11、采用訓(xùn)練完備的海域違法知識抽取模型對歷史數(shù)據(jù)進(jìn)行知識動抽,確定違法事件知識三元組。
12、在一種可能的實現(xiàn)方式中,所述根據(jù)違法事件知識三元組,建立實際海域違法數(shù)據(jù)的特征矩陣數(shù)據(jù)集,包括:
13、對海域違法事件的歷史數(shù)據(jù)進(jìn)行分類,得到一般數(shù)據(jù)集和特殊數(shù)據(jù)集;
14、基于目標(biāo)知識圖譜的知識三元組導(dǎo)出一般數(shù)據(jù)集對應(yīng)的一般特征集,以及導(dǎo)出特殊數(shù)據(jù)集對應(yīng)的特殊特征集;
15、采用預(yù)設(shè)同義詞挖掘算法分別對一般特征集和特殊數(shù)據(jù)集進(jìn)行同義詞挖替換,得到文本特征;
16、對文本特征進(jìn)行編碼,得到實際海域違法數(shù)據(jù)的特征矩陣數(shù)據(jù)集。
17、在一種可能的實現(xiàn)方式中,所述對文本特征進(jìn)行編碼,得到實際海域違法數(shù)據(jù)的特征矩陣數(shù)據(jù)集,包括:
18、采用預(yù)設(shè)獨熱編碼法對文本特征進(jìn)行編碼,得到實際海域違法數(shù)據(jù)的特征矩陣數(shù)據(jù)集。
19、在一種可能的實現(xiàn)方式中,所述以所述特征矩陣數(shù)據(jù)集為輸入,對初始圖神經(jīng)網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練,得到訓(xùn)練完備的目標(biāo)圖神經(jīng)網(wǎng)絡(luò)模型,包括:
20、基于目標(biāo)知識圖譜的節(jié)點進(jìn)行鄰接節(jié)點采樣,得到局部領(lǐng)域信息;
21、對所有采樣的鄰接節(jié)點的特征進(jìn)行逐元素的均值計算,得到聚合特征;
22、根據(jù)聚合特征確定各個節(jié)點的鄰接關(guān)系,得到目標(biāo)圖神經(jīng)網(wǎng)絡(luò)模型。
23、在一種可能的實現(xiàn)方式中,所述基于目標(biāo)知識圖譜的節(jié)點進(jìn)行鄰接節(jié)點采樣,得到局部領(lǐng)域信息,包括:
24、初始圖神經(jīng)網(wǎng)絡(luò)模型對基于知識圖譜導(dǎo)出的節(jié)點鄰接列表進(jìn)行采樣,獲得起始節(jié)點的局部領(lǐng)域信息。
25、在一種可能的實現(xiàn)方式中,所述對所有采樣的鄰接節(jié)點的特征進(jìn)行逐元素的均值計算,可通過如下公式表示:
26、
27、其中表示節(jié)點在第層的隱藏狀態(tài)(或特征),表示節(jié)點的鄰居節(jié)點集合,表示求均值的操作,表示聚合特征。
28、第二方面,本發(fā)明還提供一種基于知識圖譜的海域違法事件追源裝置,包括:
29、知識三元組確定模塊,用于基于海域違法事件數(shù)據(jù)集構(gòu)建目標(biāo)知識圖譜,確定違法事件知識三元組;
30、特征矩陣建立模塊,用于根據(jù)違法事件知識三元組,建立實際海域違法數(shù)據(jù)的特征矩陣數(shù)據(jù)集;
31、模型訓(xùn)練模塊,用于以所述特征矩陣數(shù)據(jù)集為輸入,對初始圖神經(jīng)網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練,得到訓(xùn)練完備的目標(biāo)圖神經(jīng)網(wǎng)絡(luò)模型;
32、追源模塊,用于根據(jù)目標(biāo)圖神經(jīng)網(wǎng)絡(luò)模型和實時海域數(shù)據(jù),對海域違法事件進(jìn)行追源。
33、第三方面,本發(fā)明還提供了一種電子設(shè)備,包括:處理器和存儲器;
34、所述存儲器上存儲有可被所述處理器執(zhí)行的計算機可讀程序;
35、所述處理器執(zhí)行所述計算機可讀程序時實現(xiàn)如上所述的基于知識圖譜的海域違法事件追源方法中的步驟。
36、第四方面,本發(fā)明還提供了一種計算機可讀存儲介質(zhì),所述計算機可讀存儲介質(zhì)存儲有一個或者多個程序,所述一個或者多個程序可被一個或者多個處理器執(zhí)行,以實現(xiàn)如上所述的基于知識圖譜的海域違法事件追源方法中的步驟。
37、本發(fā)明的有益效果是:首先構(gòu)建知識圖譜,并基于知識圖譜對海域違法事件數(shù)據(jù)集抽取對應(yīng)的知識三元組,隨后基于違法事件知識三元組建立實際海域違法數(shù)據(jù)的特征矩陣數(shù)據(jù),并通過海域違法數(shù)據(jù)的特征矩陣數(shù)據(jù)對初始圖神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,以通過圖神經(jīng)網(wǎng)絡(luò)對知識圖譜中的節(jié)點進(jìn)行聚合、學(xué)習(xí),能針對知識圖譜新增節(jié)點進(jìn)行學(xué)習(xí),不用進(jìn)行全圖的學(xué)習(xí),既提高了計算效率,又保留了圖數(shù)據(jù)的豐富信息。
1.一種基于知識圖譜的海域違法事件追源方法,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的基于知識圖譜的海域違法事件追源方法,其特征在于,所述基于海域違法案例數(shù)據(jù)集構(gòu)建目標(biāo)知識圖譜,確定違法事件知識三元組,包括:
3.根據(jù)權(quán)利要求1所述的基于知識圖譜的海域違法事件追源方法,其特征在于,所述根據(jù)違法事件知識三元組,建立實際海域違法數(shù)據(jù)的特征矩陣數(shù)據(jù)集,包括:
4.根據(jù)權(quán)利要求3所述的基于知識圖譜的海域違法事件追源方法,其特征在于,所述對文本特征進(jìn)行編碼,得到實際海域違法數(shù)據(jù)的特征矩陣數(shù)據(jù)集,包括:
5.根據(jù)權(quán)利要求1所述的基于知識圖譜的海域違法事件追源方法,其特征在于,所述以所述特征矩陣數(shù)據(jù)集為輸入,對初始圖神經(jīng)網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練,得到訓(xùn)練完備的目標(biāo)圖神經(jīng)網(wǎng)絡(luò)模型,包括:
6.根據(jù)權(quán)利要求5所述的基于知識圖譜的海域違法事件追源方法,其特征在于,所述基于目標(biāo)知識圖譜的節(jié)點進(jìn)行鄰接節(jié)點采樣,得到局部領(lǐng)域信息,包括:
7.根據(jù)權(quán)利要求5所述的基于知識圖譜的海域違法事件追源方法,其特征在于,所述對所有采樣的鄰接節(jié)點的特征進(jìn)行逐元素的均值計算,可通過如下公式表示:
8.一種基于知識圖譜的海域違法事件追源裝置,其特征在于,包括:
9.一種電子設(shè)備,其特征在于,包括:處理器和存儲器;
10.一種計算機可讀存儲介質(zhì),其特征在于,所述計算機可讀存儲介質(zhì)存儲有一個或者多個程序,所述一個或者多個程序可被一個或者多個處理器執(zhí)行,以實現(xiàn)如權(quán)利要求1-7任一項所述的基于知識圖譜的海域違法事件追源方法中的步驟。