的粗細(xì)來體現(xiàn)概率的大 小,進(jìn)一步地,可以展現(xiàn)號(hào)牌1在全地圖的落腳點(diǎn)分布情況以及習(xí)慣行駛路線,便于對(duì)卡口 進(jìn)行有針對(duì)性地重點(diǎn)布控。
[0101] 以杭州2014年4月-2015年9月的卡口過車記錄,截至2015年9月的杭州車輛登記信 息數(shù)據(jù),以及杭州部分駕駛?cè)诉`法信息數(shù)據(jù)為例,對(duì)本發(fā)明的實(shí)施例進(jìn)行簡單說明。為保護(hù) 個(gè)人隱私,對(duì)于實(shí)施例中的一些個(gè)人信息和車輛信息進(jìn)行特殊處理。
[0102] -種非現(xiàn)場的失駕人員篩選和稽查布控方法,所述的數(shù)據(jù)處理和分析方法包括以 下步驟:
[0103] (1)數(shù)據(jù)預(yù)處理
[0104] (1.1)車輛信息數(shù)據(jù)預(yù)處理,主要步驟如下:
[0105] (1.1.1)數(shù)據(jù)清洗:獲得車輛信息數(shù)據(jù),根據(jù)設(shè)定的清洗規(guī)則,刪除不符合規(guī)則的 數(shù)據(jù),如特殊字符的車牌等。在本實(shí)施例中,對(duì)特殊號(hào)牌(學(xué)、軍、警、試)進(jìn)行清洗。
[0106] (1.1.2)維度削減:刪除與失駕分析無關(guān)的維度,如發(fā)動(dòng)機(jī)號(hào)、經(jīng)辦人等。在本實(shí)施 例中,保留"號(hào)牌號(hào)碼"、"所有人"、"身份證明信息"三個(gè)維度。
[0107] (1.1.3)將篩選后的數(shù)據(jù)存入到數(shù)據(jù)倉庫中,獲得預(yù)處理后的車輛信息數(shù)據(jù)集X。 在本實(shí)施例中,車輛信息數(shù)據(jù)集的數(shù)據(jù)示例如下:
[0109] (1.2)違法信息數(shù)據(jù)預(yù)處理,主要步驟如下:
[0110] (1.2.1)數(shù)據(jù)清洗:獲得違法信息數(shù)據(jù),根據(jù)設(shè)定的清洗規(guī)則,刪除違法時(shí)間登記 不全的數(shù)據(jù)。
[0111] (1.2.2)維度削減:刪除與失駕分析無關(guān)的維度,如經(jīng)辦人等。在本實(shí)施例中,保 留,"號(hào)牌號(hào)碼","駕駛證號(hào)碼","違法行為","違法時(shí)間"四個(gè)維度。
[0112] (1.2.3)將篩選后的數(shù)據(jù)存入到數(shù)據(jù)倉庫中,獲得預(yù)處理后的違法信息數(shù)據(jù)集W。 在本實(shí)施例中,違法信息數(shù)據(jù)集的示例如下:
[0114] (1.3)卡口過車記錄數(shù)據(jù)預(yù)處理,主要步驟如下:
[0115] (1.3.1)數(shù)據(jù)清洗:獲得卡口過車記錄數(shù)據(jù),刪除車牌號(hào)為空的數(shù)據(jù),刪除設(shè)備識(shí) 別錯(cuò)誤的數(shù)據(jù),如車牌字符帶"?"的數(shù)據(jù),以及車牌字符出現(xiàn)字母多于3個(gè)字母的錯(cuò)牌等。在 本實(shí)施例中,在本實(shí)施例中,主要針對(duì)杭州車輛進(jìn)行假牌篩選,因此對(duì)于非"浙A"牌照、車牌 號(hào)碼為空或帶"? "字符、因識(shí)別錯(cuò)誤導(dǎo)致車牌后五位字符中出現(xiàn)超過3個(gè)字母以上、特殊號(hào) 牌(學(xué)、警、試、軍)等進(jìn)行清洗。
[0116] (1.3.2)數(shù)據(jù)去重和維度削減:根據(jù)步驟(1.3.1)進(jìn)行數(shù)據(jù)清洗后的數(shù)據(jù),進(jìn)行數(shù) 據(jù)去重處理,去重方法為:對(duì)于一個(gè)車牌在同一卡口、方向、時(shí)間的多條重復(fù)數(shù)據(jù),只保留1 條數(shù)據(jù)。并通過削減維度,保留"卡口編號(hào)"、"方向編號(hào)"、"號(hào)牌類型"、"車輛類型"、"號(hào)牌號(hào) 碼"、"經(jīng)過時(shí)間"、"車身顏色"6個(gè)維度。
[0117] (1.3.3)將清洗和去重后的數(shù)據(jù)存入到數(shù)據(jù)倉庫中,獲得預(yù)處理后的過車記錄信 息數(shù)據(jù)K。卡口過車記錄數(shù)據(jù)集的示例如下:
[0120] (2)嫌疑失駕信息獲取
[0121] (2.1)失駕人信息和失駕時(shí)間信息獲取
[0122] 利用違法信息數(shù)據(jù)集W中"違法行為"字段,查找違法行為編碼對(duì)應(yīng)的違法名稱,結(jié) 合實(shí)際交通法規(guī),獲得導(dǎo)致駕駛證吊銷的違法行為,以及嫌疑失駕人信息和嫌疑失駕時(shí)間 信息,存儲(chǔ)為嫌疑失駕人信息數(shù)據(jù)集W P。其中\(zhòng) c fF。在本實(shí)施例中,只針對(duì)因"酒駕"導(dǎo)致 的架勢證吊銷的違法行為作為舉例。
[0123] (2.2)嫌疑失駕車信息獲取
[0124] 根據(jù)步驟(2.1)獲得的嫌疑失駕人信息數(shù)據(jù)集^,結(jié)合步驟(1.1)獲得的車輛信息 數(shù)據(jù)集X,獲得嫌疑失駕人名下的車輛信息數(shù)據(jù),存儲(chǔ)為嫌疑失駕車信息數(shù)據(jù)集Xw。其中 rf。
[0125] (3)嫌疑失駕車的時(shí)-空軌跡分析
[0126] (3.1)嫌疑失駕車失駕前與失駕后的時(shí)-空軌跡信息獲取
[0127] (3.1.1)根據(jù)步驟(2.1)獲得的嫌疑失駕人信息數(shù)據(jù)集WP,利用其中的"違法時(shí)間" 字段,作為嫌疑失駕車失駕前與失駕后的臨界時(shí)間t。
[0128] (3.1.2)結(jié)合步驟(2.2)獲得的嫌疑失駕車信息數(shù)據(jù)集XW和步驟(1.3)獲得的卡口 過車信息數(shù)據(jù)集K,獲得嫌疑失駕車的過車信息數(shù)據(jù)K W。根據(jù)臨界時(shí)間t,將嫌疑失駕車的過 車信息數(shù)據(jù)劃分為失駕前過車信息數(shù)據(jù)X纟和。
[0129] (3.1.3)在本實(shí)施例中,以1小時(shí)為時(shí)間槽,則1天共有24個(gè)時(shí)間槽,并共有627個(gè)卡 口,分別在失駕前過車信息數(shù)據(jù)£(,和失駕后過車信息數(shù)據(jù)中統(tǒng)計(jì)嫌疑失駕車在各個(gè)時(shí) 間槽內(nèi)經(jīng)過各個(gè)卡口的總次數(shù),形成一個(gè)用以描述某個(gè)嫌疑失駕車在失駕前的軌跡時(shí)-空 特征的矩陣Ui,j和失駕后的軌跡時(shí)-空特征的矩陣Vi, j。在本實(shí)施例中,由于采用Hive作為數(shù) 據(jù)倉庫,因此,對(duì)于嫌疑失駕車失駕前的時(shí)-空軌跡矩陣存儲(chǔ)形式為
[0131] 其中第一列為嫌疑失駕車車牌,第二列為時(shí)間槽,1表示"0:00-1:00",2表示"1: 00-2:00",依次類推,第三列表示經(jīng)過的卡口編號(hào),第四列表示在對(duì)應(yīng)時(shí)間槽和卡口編號(hào)經(jīng) 過的次數(shù)。
[0132] 類似地,嫌疑失駕車失駕后的時(shí)-空軌跡矩陣存儲(chǔ)為
[0134] (3.2)嫌疑失駕車失駕前與失駕后的時(shí)-空軌跡匹配度計(jì)算
[0135] 在本實(shí)施例中,由于采用Hive作為數(shù)據(jù)倉庫,利用HiveQL計(jì)算嫌疑失駕車的失駕 前軌跡特征矩陣與失駕后的軌跡特征矩陣之間的相似度的計(jì)算過程如下:
[0136] (3.2.1)根據(jù)嫌疑失駕車號(hào)牌號(hào)碼,獲得嫌疑失駕車失駕前和失駕后的時(shí)-空軌跡 矩陣Ui,j和矩陣Vi,j,如步驟(3.1)所不。
[0137] (3.2.2)利用向量空間的余弦相似度量,作為嫌疑失駕車失駕前與失駕后的軌跡 匹配度ω。針對(duì)步驟(3.1)中的嫌疑失駕車"浙A8##90"的時(shí)-空軌跡,其軌跡匹配度計(jì)算方 法為
[0139]根據(jù)計(jì)算得到的軌跡匹配度ω,確定嫌疑失駕車嫌疑度分為"高"、"中"、"低"三個(gè) 等級(jí)。軌跡匹配度越高,表明失駕后與失駕前是同一個(gè)人駕駛的可能性越高,則失駕嫌疑越 高;軌跡匹配度越低,表明失駕后與失駕前是同一個(gè)人駕駛的可能性越低,則失駕嫌疑度越 低。在本實(shí)施例中,設(shè)定〇.6<ω < 1時(shí)嫌疑度為"高";當(dāng)〇.3<ω <0.6時(shí)嫌疑度為"中";當(dāng)0 < ω <0.3時(shí)嫌疑度為"低"。在本實(shí)施例中,號(hào)牌號(hào)碼"浙Α8**90"計(jì)算得到的失駕嫌疑度為 "中,,。
[0140] (4)失駕人員篩選系統(tǒng)展示方法
[0141] 根據(jù)步驟(3)計(jì)算得到的嫌疑失駕車的嫌疑度結(jié)果,結(jié)合嫌疑失駕車車主基本信 息、卡口抓拍的圖片信息以及地圖信息,進(jìn)行嫌疑失駕車的稽查布控。展示方法如附圖2所 示。主要步驟如下:
[0142] (4.1)在嫌疑失駕車的嫌疑度排名區(qū)域,選取某個(gè)嫌疑失駕車。
[0143] (4.2)選取某個(gè)嫌疑失駕車后,在車輛基本信息展示區(qū)域會(huì)展示該嫌疑失駕車輛 的一些基本信息,如品牌,顏色,車型等,以及該車車主的駕駛證基本信息和違法信息
[0144] (4.3)與步驟(4.2)同步地,系統(tǒng)會(huì)選取該嫌疑失駕車在失駕前與失駕后的卡口抓 拍圖片作為一組進(jìn)行對(duì)比展示。
[0145] (4.4)根據(jù)卡口抓拍圖片對(duì)比以及車主的駕駛證信息,確定該嫌疑失駕車是否由 失駕人員駕駛,如果需要進(jìn)一步了解該嫌疑失駕車的落腳點(diǎn)分布,則可以使用"落腳點(diǎn)稽查 布控"功能,系統(tǒng)會(huì)結(jié)合地圖對(duì)該嫌疑失駕車的頻繁落腳點(diǎn)進(jìn)行展現(xiàn),嫌疑失駕車經(jīng)過的卡 口點(diǎn)位越頻繁,該卡口點(diǎn)位展示的圓形圖案越大且顏色越深。同時(shí)針對(duì)某個(gè)落腳點(diǎn)卡口 i, 系統(tǒng)會(huì)計(jì)算出該嫌疑失駕車在卡口 i的到達(dá)概率pa(即時(shí)間相鄰的其他卡口到達(dá)卡口 i的概 率)以及在卡口 i前往的前往概率Pi(即時(shí)間相鄰的卡口 i前往其他卡口的概率)。計(jì)算步驟 如下:
[0146] (4.4.1)根據(jù)步驟(3.1.2)中獲得的嫌疑失駕車過程信息數(shù)據(jù)集&,獲得同一車牌 經(jīng)過的卡口編號(hào)和經(jīng)過時(shí)間進(jìn)行升序排列,以保證過車信息的時(shí)序特征。對(duì)于本實(shí)施例中 的號(hào)牌"浙A8#90",其在2015年6月-2015年9月按時(shí)間