一種基于搜索引擎的重復報警識別方法和系統(tǒng)的制作方法
【專利摘要】本發(fā)明涉及一種基于搜索引擎的重復報警識別方法和系統(tǒng),所述方法包括以下步驟:S1、構建GIS地址庫;S2、設定事發(fā)要素權重值及重復報警閾值;S3、基于搜索引擎在GIS地址庫匹配最相似的事發(fā)地址地圖坐標,將匹配度最高的地址庫地圖坐標賦值給當前事發(fā)地址地圖坐標;S4、確定事發(fā)地址覆蓋范圍半徑r,根據(jù)事發(fā)地址地圖坐標計算Δt時期內(nèi)覆蓋半徑范圍內(nèi)的報警信息;S5、基于步驟S4的查詢結果,將當前報警信息的事發(fā)要素與查詢結果的事發(fā)要素通過搜索引擎及分詞技術計算匹配度,比較匹配度與閾值,匹配度高于閾值的報警則提示當前報警可能為重復報警,并將對應報警信息對比展示。能夠識別有效重復報警,識別準確率較高,能夠提高接處警效率。
【專利說明】
一種基于搜索引擎的重復報警識別方法和系統(tǒng)
技術領域
[0001]本發(fā)明涉及公安、醫(yī)療接警領域,更具體的說,是涉及一種基于搜索引擎的重復報警識別方法和系統(tǒng)。
【背景技術】
[0002]現(xiàn)有重復信息識別的方法主要是對單要素文本進行分詞計算匹配度,而沒有對多要素分詞匹配計算信息綜合匹配度,導致匹配度不高。且現(xiàn)有重復信息識別的方法沒有涉及時間、空間的匹配處理。對于公安、醫(yī)療接警領域,時間、空間是很重要的要素,對于時間、空間的匹配處理能夠大大提到重復信息識別的準確率。
[0003]在公安、醫(yī)療接警領域,目前能夠給接警員提供識別有效重復警情的工具幾乎沒有,識別重復警情更多的依賴于人的經(jīng)驗及運氣,重復警情識別率低,導致接警、派警、處警各環(huán)節(jié)處理重復警情時均存在人力資源浪費的情況。如何通過智能方法有效識別重復警情,減少資源浪費,提高接處警效率,成為亟待解決的問題。
【發(fā)明內(nèi)容】
[0004]有鑒于此,有必要針對上述問題,提供一種基于搜索引擎的重復報警識別方法和系統(tǒng),能夠識別有效重復報警,識別準確率較高,能夠提高接處警效率。
[0005]為了實現(xiàn)上述目的,本發(fā)明的技術方案如下:
[0006]—種基于搜索引擎的重復報警識別方法,包括以下步驟:
[0007]S1、構建GIS地址庫;
[0008]S2、設定事發(fā)要素權重值及重復報警閾值;
[0009]S3、基于搜索引擎在GIS地址庫匹配最相似的事發(fā)地址地圖坐標,將匹配度最高的地址庫地圖坐標賦值給當前事發(fā)地址地圖坐標;
[0010]S4、確定事發(fā)地址覆蓋范圍半徑r,根據(jù)事發(fā)地址地圖坐標計算At時期內(nèi)覆蓋半徑范圍內(nèi)的報警信息;
[0011]S5、基于步驟S4的查詢結果,將當前報警信息的事發(fā)要素與查詢結果的事發(fā)要素通過搜索引擎及分詞技術計算匹配度,比較匹配度與閾值,匹配度高于閾值的報警則提示當前報警可能為重復報警,并將對應報警信息對比展示。
[0012]作為優(yōu)選的,在步驟S2中,所述事發(fā)要素包括事發(fā)地址、事發(fā)時間、事發(fā)類型、報警人姓名、報警人電話、報警描述。
[0013]作為優(yōu)選的,所述步驟S3具體包括:將事發(fā)地址進行分詞,并通過搜索引擎將分詞結果與GIS地址庫地址進行匹配,將匹配度最高的地址庫地圖坐標賦值給當前事發(fā)地址地圖坐標。
[0014]作為優(yōu)選的,所述步驟S4中,一定時期At內(nèi)覆蓋半徑范圍內(nèi)的報警信息滿足的條件為:
[0015]事發(fā)時間tl一待查詢的事發(fā)時間t2〈 Δ t
[0016](事發(fā)地址坐標經(jīng)度1n—待查詢的事發(fā)地址坐標經(jīng)度x)2+(事發(fā)地址坐標瑋度Iat—待查詢的事發(fā)地址坐標瑋度y)2〈事發(fā)地址覆蓋范圍半徑r2(距離轉(zhuǎn)換為經(jīng)瑋度單位)。
[0017]作為優(yōu)選的,所述步驟S2中,根據(jù)事發(fā)要素屬性及批量數(shù)據(jù)實驗確定各要素權重值(vl ,v2,v3...vN),閾值Vmin。
[0018]作為優(yōu)選的,所述步驟S5具體包括:將當前報警信息的事發(fā)要素與查詢結果的事發(fā)要素通過搜索引擎及分詞技術計算匹配度,得到各要素匹配度(ml,m2,m3...mN),與每條報警信息匹配度(vl*ml,v2*m2,v3*m3...vN*mN),匹配度與閾值Vmin進行比較,大于Vmin的報警信息則提示為可能重復報警。
[0019]作為優(yōu)選的,所述事發(fā)各要素匹配度計算報警信息匹配度與閾值比較的過程包括:
[0020]vl*ml+v2*m2+v3*m3...+vN*mN>Vmin。
[0021 ]作為優(yōu)選的,還包括步驟S6:
[0022]將當前報警信息與識別的重復報警信息對比展示,進行人工二次確認。
[0023]—種根據(jù)上述方法進行重復報警識別的系統(tǒng),包括報警模塊和重復報警識別模塊,所述報警模塊包括接警系統(tǒng)客戶端和接警系統(tǒng)數(shù)據(jù)庫;所述重復報警識別模塊包括地址庫、分詞工具、搜索引擎、比較判斷單元;
[0024]所述接警系統(tǒng)客戶端用于將報警數(shù)據(jù)錄入到接警系統(tǒng)數(shù)據(jù)庫;所述接警系統(tǒng)數(shù)據(jù)庫用于存儲報警數(shù)據(jù);
[0025]所述地址庫用于構建GIS地址庫;所述分詞工具用于對關鍵詞進行自動分詞;所述搜索引擎用于將分詞結果進行匹配,并計算匹配度;
[0026]所述比較判斷單元用于設置閾值,將匹配度與閾值進行比較,并大于閾值的報警信息則提示為可能重復報警信的信息。
[0027]作為優(yōu)選的,所述重復報警模塊還包括一顯示單元,用于顯示識別為可能重復報警的報警信息。
[0028]與現(xiàn)有技術相比,本發(fā)明的有益效果在于:本發(fā)明結合GIS地址庫,分詞匹配賦予事發(fā)地址地圖坐標,而不依賴于報警人必須提供GPS坐標信息,根據(jù)事發(fā)各要素計算當前報警信息與歷史報警信息的匹配度與閾值的比較,給接警員提供是否為重復警情的有效參考,能夠有效的識別是否為重復警情,提高接處警效率。
【附圖說明】
[0029]圖1為本發(fā)明實施例的方法流程圖;
[0030]圖2為本發(fā)明實施例系統(tǒng)結構框圖。
【具體實施方式】
[0031]下面結合附圖和實施例對本發(fā)明所述的一種基于搜索引擎的重復報警識別方法和系統(tǒng)作進一步說明。
[0032]以下是本發(fā)明所述的一種基于搜索引擎的重復報警識別方法和系統(tǒng)的最佳實例,并不因此限定本發(fā)明的保護范圍。
[0033]圖1示出了一種基于搜索引擎的重復報警識別方法,包括以下步驟:
[0034]S1、構建GIS(Geographic Informat1n System,,地理信息系統(tǒng))地址庫;在本實施例中,GIS地址庫數(shù)據(jù)來源有以下幾種方式:公安標準地址庫、高德或其他GIS廠家地址庫、自主學習的地址,根據(jù)事發(fā)地址人工定位后自動歸入地址庫。
[0035]S2、設定事發(fā)要素權重值及重復報警閾值;
[0036]S3、基于搜索引擎在GIS地址庫匹配最相似的事發(fā)地址地圖坐標,將匹配度最高的地址庫地圖坐標賦值給當前事發(fā)地址地圖坐標;
[0037]S4、確定事發(fā)地址覆蓋范圍半徑r,根據(jù)事發(fā)地址地圖坐標計算At時期內(nèi)覆蓋半徑范圍內(nèi)的報警信息;
[0038]S5、基于步驟S4的查詢結果,將當前報警信息的事發(fā)要素與查詢結果的事發(fā)要素通過搜索引擎及分詞技術計算匹配度,比較匹配度與閾值,匹配度高于閾值的報警則提示當前報警可能為重復報警,并將對應報警信息對比展示。分詞工具可選擇HTTPCWS、IKAnalyzer等。搜索引擎,也有多種可以選擇,如Solr、Elasticsearch等
[0039]作為優(yōu)選的,在步驟S2中,所述事發(fā)要素包括事發(fā)地址、事發(fā)時間、事發(fā)類型、報警人姓名、報警人電話、報警描述。
[0040]作為優(yōu)選的,所述步驟S3具體包括:將事發(fā)地址進行分詞,并通過搜索引擎將分詞結果與GIS地址庫地址進行匹配,將匹配度最高的地址庫地圖坐標賦值給當前事發(fā)地址地圖坐標。
[0041]作為優(yōu)選的,所述步驟S4中,事發(fā)地址坐標經(jīng)瑋度(lon,lat),待查詢的事發(fā)地址坐標經(jīng)瑋度(x,y),事發(fā)時間tl,待查詢的事發(fā)時間t2,一定時期范圍At,計算滿足條件的歷史報警信息。一定時期At內(nèi)覆蓋半徑范圍內(nèi)的報警信息滿足的條件為:
[0042]tl—t2<At
[0043](1n—x)2+(lat—y)2〈r2(距離轉(zhuǎn)換為經(jīng)瑋度單位)。
[0044]作為優(yōu)選的,所述步驟S2中,根據(jù)事發(fā)要素屬性及批量數(shù)據(jù)實驗確定各要素權重值(vl ,v2,v3...vN),閾值Vmin。
[0045]作為優(yōu)選的,所述步驟S5具體包括:將當前報警信息的事發(fā)要素與查詢結果的事發(fā)要素通過搜索引擎及分詞技術計算匹配度,得到各要素匹配度(ml,m2,m3...mN),與每條報警信息匹配度(vl*ml,v2*m2,v3*m3...vN*mN),匹配度與閾值Vmin進行比較,大于Vmin的報警信息則提示為可能重復報警。
[0046]作為優(yōu)選的,所述事發(fā)各要素匹配度計算報警信息匹配度與閾值比較的過程包括:
[0047]vl*ml+v2*m2+v3*m3...+vN*mN>Vmin;其中各要素匹配度(ml,m2,m3...mN)值的獲取是基于搜索引擎對各要素分詞后的結果進行計算得到。
[0048]作為優(yōu)選的,還包括步驟S6:
[0049]將當前報警信息與識別的重復報警信息對比展示,進行人工二次確認。
[0050]圖2示出了一種根據(jù)上述方法進行重復報警識別的系統(tǒng),包括報警模塊和重復報警識別模塊,所述報警模塊包括接警系統(tǒng)客戶端和接警系統(tǒng)數(shù)據(jù)庫;所述重復報警識別模塊包括地址庫、分詞工具、搜索引擎、比較判斷單元;
[0051]所述接警系統(tǒng)客戶端用于將報警數(shù)據(jù)錄入到接警系統(tǒng)數(shù)據(jù)庫;所述接警系統(tǒng)數(shù)據(jù)庫用于存儲報警數(shù)據(jù);
[0052]所述地址庫用于構建GIS地址庫;所述分詞工具用于對關鍵詞進行自動分詞;所述搜索引擎用于將分詞結果進行匹配,并計算匹配度;
[0053]所述比較判斷單元用于設置閾值,將匹配度與閾值進行比較,并大于閾值的報警信息則提示為可能重復報警信的信息。
[0054]作為優(yōu)選的,所述重復報警模塊還包括一顯示單元,用于顯示識別為可能重復報警的報警信息,可以將當前報警信息與識別的重復報警信息對比展示,進行人工二次確認。
[0055]與現(xiàn)有技術相比,本發(fā)明的有益效果在于:本發(fā)明結合GIS地址庫,分詞匹配賦予事發(fā)地址地圖坐標,而不依賴于報警人必須提供GPS坐標信息,根據(jù)事發(fā)各要素計算當前報警信息與歷史報警信息的匹配度與閾值的比較,給接警員提供是否為重復警情的有效參考,能夠有效的識別是否為重復警情,提高接處警效率。
[0056]以上所述實施例僅表達了本發(fā)明的幾種實施方式,其描述較為具體和詳細,但并不能因此而理解為對本發(fā)明專利范圍的限制。應當指出的是,對于本領域的普通技術人員來說,在不脫離本發(fā)明構思的前提下,還可以做出若干變形和改進,這些都屬于本發(fā)明的保護范圍。因此,本發(fā)明專利的保護范圍應以所附權利要求為準。
【主權項】
1.一種基于搜索引擎的重復報警識別方法,其特征在于,包括以下步驟: 51、構建GIS地址庫; 52、設定事發(fā)要素權重值及重復報警閾值; 53、基于搜索引擎在GIS地址庫匹配最相似的事發(fā)地址地圖坐標,將匹配度最高的地址庫地圖坐標賦值給當前事發(fā)地址地圖坐標; 54、確定事發(fā)地址覆蓋范圍半徑r,根據(jù)事發(fā)地址地圖坐標計算At時期內(nèi)覆蓋半徑范圍內(nèi)的報警信息; 55、基于步驟S4的查詢結果,將當前報警信息的事發(fā)要素與查詢結果的事發(fā)要素通過搜索引擎及分詞技術計算匹配度,比較匹配度與閾值,匹配度高于閾值的報警則提示當前報警可能為重復報警,并將對應報警信息對比展示。2.根據(jù)權利要求1所述的基于搜索引擎的重復報警識別方法,其特征在于,在步驟S2中,所述事發(fā)要素包括事發(fā)地址、事發(fā)時間、事發(fā)類型、報警人姓名、報警人電話、報警描述。3.根據(jù)權利要求1所述的基于搜索引擎的重復報警識別方法,其特征在于,所述步驟S3具體包括:將事發(fā)地址進行分詞,并通過搜索引擎將分詞結果與GIS地址庫地址進行匹配,將匹配度最高的地址庫地圖坐標賦值給當前事發(fā)地址地圖坐標。4.根據(jù)權利要求1所述的基于搜索引擎的重復報警識別方法,其特征在于,所述步驟S4中,一定時期A t內(nèi)覆蓋半徑范圍內(nèi)的報警信息滿足的條件為: 事發(fā)時間tl一待查詢的事發(fā)時間t2〈 Δ t (事發(fā)地址坐標經(jīng)度1n—待查詢的事發(fā)地址坐標經(jīng)度x)2+(事發(fā)地址坐標瑋度Iat—待查詢的事發(fā)地址坐標瑋度y)2〈事發(fā)地址覆蓋范圍半徑r2(距離轉(zhuǎn)換為經(jīng)瑋度單位)。5.根據(jù)權利要求1所述的基于搜索引擎的重復報警識別方法,其特征在于,所述步驟S2中,根據(jù)事發(fā)要素屬性及批量數(shù)據(jù)實驗確定各要素權重值(vl,v2,v3...vN),閾值Vmin。6.根據(jù)權利要求5所述的基于搜索引擎的重復報警識別方法,其特征在于,所述步驟S5具體包括:將當前報警信息的事發(fā)要素與查詢結果的事發(fā)要素通過搜索引擎及分詞技術計算匹配度’得到各要素匹配度^^^…^^^與每條報警信息匹配度…*!!!^*!^^*m3...vN*mN),匹配度與閾值Vmin進行比較,大于Vmin的報警信息則提示為可能重復報警。7.根據(jù)權利要求6所述的基于搜索引擎的重復報警識別方法,其特征在于,所述事發(fā)各要素匹配度計算報警信息匹配度與閾值比較的過程包括: vl*ml+v2*m2+v3*m3...+vN*mN>Vmin。8.根據(jù)權利要求6所述的基于搜索引擎的重復報警識別方法,其特征在于,還包括步驟S6: 將當前報警信息與識別的重復報警信息對比展示,進行人工二次確認。9.一種根據(jù)權利要求1至8任一所述的方法進行重復報警識別的系統(tǒng),其特征在于,包括報警模塊和重復報警識別模塊,所述報警模塊包括接警系統(tǒng)客戶端和接警系統(tǒng)數(shù)據(jù)庫;所述重復報警識別模塊包括地址庫、分詞工具、搜索引擎、比較判斷單元; 所述接警系統(tǒng)客戶端用于將報警數(shù)據(jù)錄入到接警系統(tǒng)數(shù)據(jù)庫;所述接警系統(tǒng)數(shù)據(jù)庫用于存儲報警數(shù)據(jù); 所述地址庫用于構建GIS地址庫;所述分詞工具用于對關鍵詞進行自動分詞;所述搜索引擎用于將分詞結果進行匹配,并計算匹配度; 所述比較判斷單元用于設置閾值,將匹配度與閾值進行比較,并大于閾值的報警信息則提示為可能重復報警信的信息。10.根據(jù)權利要求1所述的重復報警識別系統(tǒng),其特征在于,所述重復報警模塊還包括一顯示單元,用于顯示識別為可能重復報警的報警信息。
【文檔編號】G06F17/30GK106095967SQ201610436993
【公開日】2016年11月9日
【申請日】2016年6月17日
【發(fā)明人】李小龍, 楊波, 賀珊, 張雪瓊
【申請人】武漢烽火眾智數(shù)字技術有限責任公司