本發(fā)明涉及大數(shù)據(jù)挖掘
技術(shù)領(lǐng)域:
:,尤其涉及一種高速公路異車換卡逃費車輛篩查方法及系統(tǒng)。
背景技術(shù):
::高速公路的收費業(yè)務是高速公路運營中的一項基本業(yè)務,對使用者征收合理費用,用于償還修路貸款,提供改善公路路網(wǎng)建設資金,是高速公路賴以生存與發(fā)展的基礎。目前國內(nèi)各省內(nèi)高速公路已實行聯(lián)網(wǎng)收費,隨著聯(lián)網(wǎng)收費的進行,聯(lián)網(wǎng)的距離越來越長,單次收費的金額也越來越大,在巨大的經(jīng)濟利益的驅(qū)使下,偷逃通行費的行為變得越來越猖獗。不法司機通過異車換卡、倒卡、沖崗闖關(guān)、與收費員串通違規(guī)免費、車輛改裝以及假冒免費車輛等手段進行逃費,給高速公路運營單位和國家造成了巨額的經(jīng)濟損失,甚至影響到高速公路的安全運行。目前,高速公路運營單位沒有采用大數(shù)據(jù)挖掘算法對異車換卡逃費車輛進行篩查,對于異車換卡逃費行為的篩查主要是通過收費員現(xiàn)場篩查和稽查員事后篩查兩種方式。1、收費員現(xiàn)場篩查收費員現(xiàn)場篩查是指車輛在駛?cè)胧召M車道時,收費員現(xiàn)場核對車輛的車牌、車型、及入口時間等信息,如發(fā)現(xiàn)出入口車牌不符,或入口車型與出口判型不符,以及超時等現(xiàn)象,則懷疑為逃費車輛,收費員通過系統(tǒng)報警并上報監(jiān)控員,監(jiān)控員調(diào)出通行卡內(nèi)入口抓拍圖片或視頻進行進一步核實,以確定是否為換卡逃費車輛。2、稽查員事后篩查事后篩查是指收費員現(xiàn)場很難判斷,或者判斷時間很長、流程復雜,為避免影響車道暢通,收費員讓可疑車輛正常通行,將通行記錄交由后臺稽查人員調(diào)取相應圖片和視頻,進行詳細比對判斷是否存在換卡逃費行為。上述篩查方式均是采取人工篩查手段,不僅造成收費人員工作強度增加,同時容易引發(fā)司機和收費人員發(fā)生沖突,影響正常的收費秩序?,F(xiàn)有的車輛篩查手段,主要的不足表現(xiàn)在以下幾點:1、人工篩查速度慢,效率低收費員現(xiàn)場篩查對出入口服務時間有影響,對收費員操作的熟練程度也有很高的要求,在車流量不大的情況下,操作基本沒多大問題,如果車流量增大,很容易造成車道出口擁堵,引起公眾的不滿情緒。2、圖像、視頻信息查找慢,不易存儲目前車輛信息的核對主要依賴車輛圖片和視頻信息,圖片、視頻信息由于過大,一方面查找不太方便,查找起來時間較長;另一方面存儲時間較短,對于時間較長的信息,一旦丟失,將無從查詢。3、人工篩查容易造成遺漏目前對異車換卡逃費車輛的篩查,無論是現(xiàn)場還是事后,都是基于收費員現(xiàn)場已檢查到的疑似車輛進行篩查,而隨著對逃費車打擊力度的加大,司機也“推陳出新”想出各種方法制造正常通行的假象以迷惑收費人員,收費人員由于經(jīng)驗不足、業(yè)務不熟,以及時間有限等原因,不能對所有逃費車輛一一識別,因此難免有漏網(wǎng)之魚。技術(shù)實現(xiàn)要素:為克服現(xiàn)有技術(shù)存在的上述技術(shù)問題,本發(fā)明提供了一種高速公路異車換卡逃費車輛篩查方法,其應用大數(shù)據(jù)挖掘技術(shù),挖掘車輛行為規(guī)律,可快速查找異車換卡的交易記錄,自動篩查所有逃費車輛,解決了目前通過人為方式造成的耗時,耗力,和由于人員業(yè)務能力參差不齊,事件處理不規(guī)范等問題。本發(fā)明解決上述技術(shù)問題的技術(shù)方案如下:一種高速公路異車換卡逃費車輛篩查方法,其包括:獲取出口交易信息表;篩選車牌不一致的記錄:從所述出口交易信息表中查找所記錄的入口車牌與出口車牌不一致的記錄,生成入口車牌與出口車牌不一致的交易記錄表;異牌換卡交易記錄配對:從所述生成的入口車牌與出口車牌不一致的交易記錄表中,根據(jù)各個車牌、各個車牌對應車輛的入口交易時間和出口交易時間進行配對,生成交易記錄配對信息表;核對費用:針對所述配對信息表中的車輛,計算配對車輛的不倒換通行卡的通行費用和倒換后的實交費用之差,如果差值大于零,則判定為該配對車輛中的兩車為換卡車輛。在上述技術(shù)方案的基礎上,本發(fā)明還可以做如下改進。進一步,所述出口交易信息表中記錄了每一張通行卡的交易信息,一張通行卡信息為一條記錄,每條記錄存儲了使用該通行卡的車輛的入口及出口信息。進一步,在所述異牌換卡交易記錄配對過程中,假設交易記錄配對信息表中任一對交易記錄為A交易記錄和B交易記錄,所述A交易記錄和B交易記錄滿足以下條件:所述A交易記錄的入口車牌=所述B交易記錄的出口車牌,且所述B交易記錄的入口車牌=所述A交易記錄的出口車牌;所述A交易記錄對應車輛的出口交易時間>所述B交易記錄對應車輛的入口交易時間,且所述B交易記錄出口交易時間>所述A交易記錄對應車輛的入口交易時間。進一步,在所述核對費用過程中,所述計算配對車輛的不倒換通行券的通行費用和倒換后的實交費用之差,即為逃費金額,其計算公式為:逃費金額=A交易記錄入口車型*A交易記錄入口廣場到B交易記錄出口廣場的費用+B交易記錄入口車型*B交易記錄入口廣場到A交易記錄出口廣場的費用-A交易記錄實際收費-B交易記錄實際收費。進一步,在所述異牌換卡交易記錄配對的步驟之后還包括去除重復數(shù)據(jù)的步驟,即將配對后的兩個相同的交易記錄中的一個刪除。進一步,在核對費用之后,若判定為配對車輛中的兩車為換卡車輛時,則生成逃費信息數(shù)據(jù)表。進一步,還包括輸出所述逃費信息數(shù)據(jù)表并保存的步驟。本發(fā)明還提供一種高速公路異車換卡逃費車輛篩查系統(tǒng),其包括:讀取模塊,用于讀取出口交易信息表;篩選模塊,用于篩選入口車牌與出口車牌不一致的記錄,并用于生成入口車牌與出口車牌不一致的交易記錄表;配對模塊,用于根據(jù)各個車牌、各個車牌對應車輛的入口交易時間和出口交易時間,將所述入口車牌與出口車牌不一致的交易記錄表中交易記錄進行配對,并用于生成交易記錄配對信息表;費用核對模塊,用于計算交易記錄配對信息表中的配對車輛的不倒換通行卡的通行費用和倒換后的實交費用之差,并根據(jù)所述計算的費用之差判定該配對車輛中的兩車是否為換卡車輛。進一步,還包括刪除模塊和逃費信息生成模塊;所述刪除模塊用于將配對后的兩個相同的交易記錄中的一個刪除;所述逃費信息生成模塊用于將判定為換卡車輛的逃費信息生成逃費信息數(shù)據(jù)表。進一步,還包括用于輸出所述逃費信息表的輸出模塊和用于保存所述逃費信息表的保存模塊。與現(xiàn)有技術(shù)相比,本發(fā)明提供的高速公路異車換卡逃費車輛篩查方法及系統(tǒng),其具有以下有益效果:1、運用時間和空間交錯的方法可精確、快速地查找到異車換卡的交易記錄,進而判斷是否存在逃費行為,解決了目前通過人為方式造成的耗時,耗力,和由于人員業(yè)務能力參差不齊,事件處理不規(guī)范等問題;2、運用車道交易數(shù)據(jù),解決了查找圖片或視頻緩慢和不易存儲的問題,車道交易數(shù)據(jù)存儲時間較長,便于隨時查詢交易記錄;3、挖掘車輛行為規(guī)律,自動篩查所有逃費車輛,并進一步匯總車輛全部歷史交易,通過對有異車換卡逃費行為的車輛進行分析,發(fā)現(xiàn)并總結(jié)其行為規(guī)律,用大數(shù)據(jù)算法模型從海量歷史數(shù)據(jù)中自動篩查出所有符合規(guī)則的嫌疑車輛,并且能夠?qū)γ枯v逃費車的歷史逃費信息進行匯總和分析,便于進一步的對逃費車輛進行分類稽查管理。附圖說明圖1為大、小車換卡示意圖;圖2為長途變短途換卡示意圖;圖3為本發(fā)明實施例一示例性提供的高速公路異車換卡逃費車輛篩查方法的流程圖;圖4為本發(fā)明實施例二示例性提供的時空交錯法執(zhí)行流程圖。具體實施方式以下結(jié)合附圖對本發(fā)明的原理和特征進行描述,所舉實例只用于解釋本發(fā)明,并非用于限定本發(fā)明的范圍。需要說明的是,在不沖突的情況下,本申請的實施例及實施例中的特征可以相互組合。在本發(fā)明的描述中,異車換卡逃費是指不同的兩輛車通過交換通行卡,以期縮短通行里程的方式實現(xiàn)逃費。高速公路異車換卡逃費車輛篩查是指通過一定的規(guī)則,對異車換卡逃費行為的車輛進行甄別和確認,從而篩選出逃費車輛的過程。通行卡是指封閉式收費系統(tǒng)在入口車導向通過車輛(公路使用者)發(fā)放的記錄有入口收費站名(編號)等入口信息的票券。實施例一目前,高速公路逃費車輛識別和檢測缺少行之有效的技術(shù)手段,部分收費站局限于基礎設施和硬件設施,更多的是采取人工篩查手段,人工篩查不僅造成收費人員工作強度增加,同時容易引發(fā)司機和收費人員發(fā)生沖突,影響正常的收費秩序。本實施例提供的高速公路異車換卡逃費車輛篩查方法,其利用大數(shù)據(jù)的數(shù)據(jù)挖掘技術(shù),從大量數(shù)據(jù)中提取有用的信息,發(fā)現(xiàn)數(shù)據(jù)之間的潛在關(guān)系,針對現(xiàn)有的聯(lián)網(wǎng)收費系統(tǒng)交易流水數(shù)據(jù)大而齊全,隱含著豐富但尚未發(fā)現(xiàn)的偷逃費用信息,這些偷逃費用信息或是直觀的,更多是潛在的,但所有的具有潛在偷逃行為的車輛記錄數(shù)據(jù)具有很多共同的特征,例如超時、里程記錄較短、出入口站點有悖常理等,因此,本實施例運用數(shù)據(jù)挖掘技術(shù)對高速公路逃費車輛進行篩查,研究高速公司偷逃費用的問題。針對高速公路異車換卡逃費情況,常見的有兩種逃費方式:1、大車變小車如圖1所示,A車為大型貨車,從K站入,B車為小型車,從L站入,A、B兩車在離M站、N站出口前的服務區(qū)換卡,之后,A車從M口出,B車從N口出,根據(jù)收費標準,A、B兩車車型不同,出站是以車型分類為準計算路費,這樣就會造成大型貨車A支付短途LM段的通行費,小車B支付長途KN段的通行費,以此達到逃費目的。2、長途變短途如圖2所示,A、B兩車相對行駛,A車在K站上路往N站行駛,B車在L站上路往M站行駛,A、B兩車在服務區(qū)處交換通行卡,A車在N出口出高速,只支付LN段通行費,B車在M出口出高速,只支付KM段通行費,這樣A、B兩輛車通過互換通行卡,達到長途車了變短途車,少交通行費的目的。不管是哪種異車換卡逃費情況,不同車輛的兩輛車在交換通行卡后,在高速出口繳費時,收費員會收到車牌不一致的提示,但由于目前市場上的車牌識別產(chǎn)品,都還無法做到100%正確,如果車主提出車牌不一致是因為車牌識別錯誤,特別是后方等待車輛較多時,收費員可能無法進行入口視頻確認,而直接放行,這樣在交易記錄中就存在入口車牌與出口車牌不一致的記錄。換卡的兩輛車在高速上行駛的時間和空間路線上一定會有交錯,也就是時空交錯,這是換卡的必要條件,時間交錯是指換卡的兩車,有同時在高速上的一段時間,這是換卡的時間條件;空間交錯是指換卡的兩車,在滿足時間交錯的基礎上,還要在實際行駛路徑上有交集,這是換卡的空間條件。通過時空交錯分析法,可以找出有換卡嫌疑的車輛,最后還要核對費率,也就是,實際行駛路徑的費用要大于其換卡后實際繳納的費用,也就是逃費金額要大于零,這是換卡的動機?;谏鲜龇治觯鐖D3所示,本實施例提供的高速公路異車換卡逃費車輛篩查方法,其具體包括以下步驟:S1:獲取出口交易信息表。在該出口交易信息表中,記錄了每一張通行卡的交易信息,一張通行卡信息為一條記錄,每條記錄又存儲了使用該通行卡的車輛的入口及出口信息,包括入口站名、入口車牌、入口時間、入口判定車型以及出口站名、出口車牌、出口時間、出口判定車型等。S2:篩選車牌不一致的記錄:從所述出口交易信息表中查找所記錄的入口車牌與出口車牌不一致的記錄,生成入口車牌與出口車牌不一致的交易記錄表。基于出口交易信息表中的數(shù)據(jù),篩選出口車輛與入口車輛不一致的記錄,即篩選出出口車牌號≠入口車牌號的交易記錄,并生成入口車牌與出口車牌不一致的交易記錄表。S3:異牌換卡交易記錄配對:從所述生成的入口車牌與出口車牌不一致的交易記錄表中,根據(jù)各個車牌、各個車牌對應車輛的入口交易時間和出口交易時間進行配對,生成交易記錄配對信息表。不同車牌的兩車進入高速后,交換通行卡后離開高速,會產(chǎn)生兩條交易記錄,找出關(guān)聯(lián)的這兩條記錄,就稱之為異牌換卡交易記錄配對,配對是基于S2篩選出的交易記錄,根據(jù)出入口交易時間和車牌進行配對。也就是說,兩個不同車牌的車輛通過換卡實現(xiàn)逃費后,滿足S2中的交易記錄應該是成對出現(xiàn)的,它們的出入口車牌交叉相等,滿足兩車換卡的空間交錯條件。滿足兩車換卡的空間交錯條件的兩條交易記錄還需要有一段共同在高速上的時間,即需要滿足兩車換卡的時間交錯條件,將滿足空間交錯條件和時間交錯條件的交易記錄生成交易記錄配對信息表。S4:核對費用:針對所述配對信息表中的車輛,計算配對車輛的不倒換通行卡的通行費用和倒換后的實交費用之差,如果差值大于零,則判定為該配對車輛中的兩車為換卡車輛。在生成交易記錄配對信息表后,計算配對信息表中的車輛不倒換通行卡的通行費用和倒換后的實交費用之差,這個差值如果大于0,則初步判定為兩車為換卡車輛,差值就是逃費金額?;诒緦嵤├峁┑纳鲜霎愜嚀Q卡逃費車輛篩查方法,可精確、快速查找異車換卡的交易記錄,進而判斷是否存在逃費行為,解決了目前通過人為方式造成的耗時,耗力,和由于人員業(yè)務能力參差不齊,事件處理不規(guī)范等問題;同時,運用大數(shù)據(jù)時空交錯法,能從海量數(shù)據(jù)中自動篩查出所有異車換卡逃費車輛,并能夠匯總出所有逃費車輛的歷史逃費信息,很大程度上能夠挽回因異車換卡造成的經(jīng)濟損失和不良的社會影響。實施例二針對實施例一所述的高速公路異車換卡逃費車輛篩查方法所應用的是時空交錯分析篩查方法,其具體規(guī)則如下:第一條規(guī)則,交易記錄中存在入口車牌與出口車牌不一致的記錄,即交易的出口車牌號≠交易的入口車牌號。第二條規(guī)則,空間交錯:兩個不同車牌的車輛通過換卡實現(xiàn)逃費后,符合第一條規(guī)則的記錄應該是成對出現(xiàn)的,它們的出入口車牌交叉相等,。假設交易記錄配對信息表中任一成對出現(xiàn)的兩條交易記錄為A交易記錄和B交易記錄,則A交易記錄和B交易記錄滿足以下條件:所述A交易記錄的入口車牌=所述B交易記錄的出口車牌,且所述B交易記錄的入口車牌=所述A交易記錄的出口車牌。第三條規(guī)則,時間交錯:符合第二條規(guī)則的兩條交易記錄,還需要有一段共同在高速上的時間,即滿足A交易記錄對應車輛的出口交易時間>所述B交易記錄對應車輛的入口交易時間,且所述B交易記錄出口交易時間>所述A交易記錄對應車輛的入口交易時間。第四條規(guī)則,核對費用:同時符合以上三條規(guī)則的記錄,需要計算逃費金額,逃費金額大于0才能確認為逃費嫌疑車輛,逃費金額的計算方法如下:逃費金額=A交易記錄入口車型*A交易記錄入口廣場到B交易記錄出口廣場的費用+B交易記錄入口車型*B交易記錄入口廣場到A交易記錄出口廣場的費用-A交易記錄實際收費-B交易記錄實際收費。上述時空交錯分析法依賴于收費數(shù)據(jù)的出口交易表和費率表,收費數(shù)據(jù)存儲于Hive中,Hive是基于Hadoop的一個數(shù)據(jù)倉庫工具,可以將結(jié)構(gòu)化的數(shù)據(jù)文件映射為一張數(shù)據(jù)庫表,并提供簡單的sql查詢功能,可以將sql語句轉(zhuǎn)換為MapReduce任務進行運行。與傳統(tǒng)關(guān)系型數(shù)據(jù)庫相比,Hive在處理超大數(shù)據(jù)方面具有容量和速度優(yōu)勢,因此本發(fā)明提供的算法是在大數(shù)據(jù)Hadoop環(huán)境下,通過SQL語句執(zhí)行完成的,具體執(zhí)行流程如圖4所示:1、篩選車牌不一致記錄從Hive數(shù)據(jù)庫中調(diào)出出口交易信息表,從該表中篩選車牌不一致的記錄。在出口交易表中,記錄了每一張通行卡的交易信息,一張通行卡信息為一條記錄,每條記錄又存儲了使用該通行卡的車輛的入口及出口信息,包括入口站名、入口車牌、入口時間、入口判定車型、以及出口站名、出口車牌、出口時間、出口判定車型等。出口交易表如表1所示:表1出口交易表基于此,篩選入口車牌與出口車牌不一致的記錄,在Hive中執(zhí)行sql語句,如下:truncatetableantifraud.one;--清空數(shù)據(jù)表insertintoantifraud.oneselect*fromoaa.L05_Exit_TranwhereDataSource=0--人工交易andlength(carlicense)>5–車牌正常的記錄andlength(ent_carlicense)>5–車牌正常的記錄andcarlicense<>ent_carlicense;–入口車牌與出口車牌不一致2、可將上述篩選的入口車牌與出口車牌不一致的交易記錄表復制一份,用于下一步操作:truncatetableantifraud.two;insertintoantifraud.twoselect*fromantifraud.one;3、異牌換卡交易記錄配對不同車牌的兩車進入高速后,交換通行卡后離開高速,會產(chǎn)生兩條交易記錄。找出關(guān)聯(lián)的這兩條記錄,就稱之為異牌換卡交易記錄配對。配對是基于步驟1篩選出的交易記錄,根據(jù)出入口交易時間和車牌進行配對,在Hive中執(zhí)行的sql語句如下:a.CarLicense=b.ENT_CarLicenseb交易記錄進入高速的車牌等于a交易記錄離開高速的車牌;andb.CarLicense=a.ENT_CarLicensea交易記錄進入高速的車牌等于b交易記錄離開高速的車牌;anda.ENT_OccurTime<b.TransOccurTime—a記錄進入高速時間小于b記錄離開高速時間;andb.ENT_OccurTime<a.TransOccurTime;—b記錄進入高速時間小于a記錄離開高速時間。4、去除重復數(shù)據(jù)配對后,一條逃費信息,會有兩輛車的兩條記錄,由于加法與前后順序無關(guān),所以利用合成的id去掉重復的記錄,其可通過以下程序?qū)崿F(xiàn):5、計算換卡前后費用差值關(guān)聯(lián)費率表,用實際行駛路徑的費用減去其換卡后實際繳納的費用,費率表記錄了不同車型的車輛通過不同的路段所需繳納的通行費,將車輛行駛路徑與費率相結(jié)合,計算出換卡前兩輛車應交的費用,再減去與換卡后兩車的實繳費用,得出其差值,若差值大于0,則初步判定為逃費換卡車輛,生成包括出入口收費站,車道號,車牌,實繳費,應繳費等完整逃費信息的數(shù)據(jù)表,具體計算過程由下述代碼實現(xiàn):6、將步驟5中生成的完整的逃費信息數(shù)據(jù)表導出并保存將逃費車輛數(shù)據(jù)信息導出到mysql關(guān)系型數(shù)據(jù)庫,作為逃費證據(jù)信息保存,便于用戶使用。實施例三基于上述實施例一或二所述的高速公路異車換卡逃費車輛篩查方法,本實施例提供了其對應的高速公路異車換卡逃費車輛篩查系統(tǒng),其具體包括:讀取模塊,用于讀取出口交易信息表;篩選模塊,用于篩選入口車牌與出口車牌不一致的記錄,并用于生成入口車牌與出口車牌不一致的交易記錄表;配對模塊,用于根據(jù)各個車牌、各個車牌對應車輛的入口交易時間和出口交易時間,將所述入口車牌與出口車牌不一致的交易記錄表中交易記錄進行配對,并用于生成交易記錄配對信息表;費用核對模塊,用于計算交易記錄配對信息表中的配對車輛的不倒換通行卡的通行費用和倒換后的實交費用之差,并根據(jù)所述計算的費用之差判定該配對車輛中的兩車是否為換卡車輛。還包括刪除模塊和逃費信息生成模塊;所述刪除模塊用于將配對后的兩個相同的交易記錄中的一個刪除;所述逃費信息生成模塊用于將判定為換卡車輛的逃費信息生成逃費信息數(shù)據(jù)表。還包括用于輸出所述逃費信息表的輸出模塊和用于保存所述逃費信息表的保存模塊。利用本實施例提供的高速公路異車換卡逃費車輛篩查系統(tǒng)可精確、快速查找異車換卡的交易記錄,判斷是否存在逃費行為,能從海量數(shù)據(jù)中自動篩查出所有異車換卡逃費車輛,并能夠匯總出所有逃費車輛的歷史逃費信息,便于進一步的對逃費車輛進行分類稽查管理。以上所述僅為本發(fā)明的較佳實施例,并不用以限制本發(fā)明,凡在本發(fā)明的精神和原則之內(nèi),所作的任何修改、等同替換、改進等,均應包含在本發(fā)明的保護范圍之內(nèi)。當前第1頁1 2 3 當前第1頁1 2 3