本發(fā)明涉及票務(wù)銷售領(lǐng)域,具體而言,涉及一種惡意占座訂單的處理方法和系統(tǒng)。
背景技術(shù):
:在銷售機(jī)票的電子客票官網(wǎng)上,用戶可直接下單,售票系統(tǒng)會(huì)為該用戶保留座位半個(gè)小時(shí)或一個(gè)小時(shí)(國(guó)內(nèi)半個(gè)小時(shí),國(guó)際機(jī)票一個(gè)小時(shí)),到約定時(shí)間后,如果該用戶還未支付,座位會(huì)被釋放掉。這是一種建立在誠(chéng)信基礎(chǔ)上的營(yíng)銷。與飯店提供的免費(fèi)預(yù)約訂座服務(wù)不同的是,機(jī)票銷售中特意為一個(gè)用戶保留的艙位具有明顯的“擠占效應(yīng)”,其他用戶看不到該艙位。在一個(gè)航班上,如果有過(guò)多的無(wú)支付意愿的訂單,就形成了惡意占座。建立在誠(chéng)信基礎(chǔ)上的電子客票銷售方式,用戶和代理人單方違約成本幾乎為零,即使違約了,用戶或代理人還可以選擇其他航空公司。加上國(guó)內(nèi)民航業(yè)是相對(duì)充分競(jìng)爭(zhēng)市場(chǎng)(少數(shù)航線已經(jīng)接近于過(guò)度競(jìng)爭(zhēng)),惡意占座現(xiàn)象在機(jī)票銷售系統(tǒng)中較為頻繁。一個(gè)例子可以方便說(shuō)明惡意占座現(xiàn)狀。2014年7月4日,從北京到鄂爾多斯的熱門(mén)旅游路線,東航MU3721,被某君,在10分鐘之內(nèi),連續(xù)下單6次,每次訂座數(shù)目多達(dá)9個(gè),而且該人在7月4日所在的一個(gè)星期內(nèi),沒(méi)有在東航電子客票官網(wǎng)購(gòu)買過(guò)一張東航機(jī)票。在旅游旺季,惡意占座會(huì)天天上演,這迫使東航B2C官網(wǎng)做出交易限制:縮減單筆交易中艙位數(shù)量,允許購(gòu)買該艙位座位的個(gè)數(shù)從9個(gè)減少為3個(gè);一個(gè)交易賬戶在一天之內(nèi)只允許有2張未支付訂單;對(duì)最近違約棄單次數(shù)過(guò)多的賬號(hào)實(shí)行查封(即黑白名單)。如上交易限制,雖然湊效,但對(duì)于惡意占座者,仍略顯粗放。比如,下表統(tǒng)計(jì)了航班MU3711(北京-鄂爾多斯)在2014-08-28起飛當(dāng)天上午11點(diǎn)近一個(gè)小時(shí),惡意占座另外一種演進(jìn)的表現(xiàn):表1:短頻快地惡意占座統(tǒng)計(jì)展示表訂單號(hào)User_id下單時(shí)間訂座數(shù)IP城市711140828610304462576832014-8-2811:163125.64.211.105宜賓市711140828610661462576832014-8-2811:193125.64.211.105宜賓市711140828611214462580322014-8-2811:233125.64.211.105宜賓市711140828611307462580322014-8-2811:233125.64.211.105宜賓市711140828611535422528142014-8-2811:253125.64.211.105宜賓市711140828611599461499312014-8-2811:253125.64.211.105宜賓市711140828611602422528142014-8-2811:253125.64.211.105宜賓市711140828611689423739242014-8-2811:263125.64.211.105宜賓市711140828611782423739242014-8-2811:273125.64.211.105宜賓市711140828612066461499312014-8-2811:293125.64.211.105宜賓市711140828612245462583322014-8-2811:303125.64.211.105宜賓市711140828612320462583322014-8-2811:313125.64.211.105宜賓市711140828612647462585862014-8-2811:333125.64.211.105宜賓市711140828612926462585862014-8-2811:353125.64.211.105宜賓市711140828613060462590262014-8-2811:363125.64.211.105宜賓市711140828613471462590262014-8-2811:393125.64.211.105宜賓市711140828613623462592942014-8-2811:413125.64.211.105宜賓市711140828613705462592942014-8-2811:413125.64.211.105宜賓市711140828613872462596282014-8-2811:423125.64.211.105宜賓市711140828613962462596282014-8-2811:433125.64.211.105宜賓市表1的惡意占座統(tǒng)計(jì)似乎展現(xiàn)出交易規(guī)則中的這樣一些破綻:(1)雖每筆交易中預(yù)訂艙位從9個(gè)減少到3個(gè),但快而多的小筆惡意訂單貌似也能彌補(bǔ)這個(gè)規(guī)定帶來(lái)的不便;(2)雖因棄單過(guò)多賬號(hào)被封殺,但免費(fèi)的注冊(cè)機(jī)制,只是增加了額外的機(jī)器輸入而已。一個(gè)大代理,可以擁有成千上萬(wàn)個(gè)正式注冊(cè)賬號(hào)。更何況,交易系統(tǒng)不會(huì)封殺一個(gè)經(jīng)常出票的賬號(hào),利用經(jīng)常出票的賬號(hào),也可以時(shí)而不時(shí)地合理占座;(3)雖限定了未支付訂單數(shù)目,用眾多的賬號(hào)產(chǎn)生惡意訂單,只是增加了代理人微小的輸入成本而已?;陔娮由虅?wù)的售票系統(tǒng)與eTerm存在不一樣地方:黑屏銷售系統(tǒng)對(duì)于惡意占座的ID進(jìn)程標(biāo)識(shí)符(PID或OFFICE)可以直接封交易端口,而電子商務(wù)商戶-個(gè)人(B2C)網(wǎng)站共享一個(gè)客戶端號(hào)碼,比如SHA777,像黑屏交易系統(tǒng)那樣封交易端口會(huì)可能影響網(wǎng)站交易。一般采用“完成支付后展現(xiàn)電子客票訂單號(hào)”交易方式,即“先付款,再占座出票”,也能較好治理惡意占座行為。這種做法要求下單人完成支付后,才為該下單人保留艙位。如果下單人不完成支付,將看不到訂單號(hào),交易系統(tǒng)還沒(méi)有為該下單人保留艙位,故惡意占座未發(fā)生。如果下單人花費(fèi)較長(zhǎng)時(shí)間完成支付后,交易系統(tǒng)再保留座位,可能會(huì)出現(xiàn)無(wú)艙位情況,會(huì)帶來(lái)一系列交易問(wèn)題。比如,交易系統(tǒng)可能因?yàn)闊o(wú)此艙位,從而可能進(jìn)入“K座”狀態(tài);或者要求用戶增加支付金額;或者給用戶道歉退款。這會(huì)帶來(lái)較差的用戶體驗(yàn),在交易系統(tǒng)繁忙時(shí),甚至?xí)兄螺^多的用戶投訴。惡意占座直接影響被占航班上正常銷售:(1)高性價(jià)比艙位銷售不出去。性價(jià)比高的艙位因被搶占(形成虛假銷售),真正有購(gòu)買意愿的用戶,查詢不到,無(wú)法買。(2)縮小用戶選擇范圍。被搶占的艙位信息,在機(jī)票搜索引擎(包括攜程、去哪兒、藝龍等搜索引擎)中或因艙位銷售狀態(tài)變成不可得,可能無(wú)法顯現(xiàn),從而縮小了用戶選擇范圍;(3)減小了艙位出售機(jī)會(huì)?;蛞騼r(jià)格等原因,即使能被搜索引擎檢索到,也會(huì)排在搜索結(jié)果集后面,從而減少了該航班艙位的銷售機(jī)會(huì)。因?yàn)殡娮由虅?wù)網(wǎng)站上,排序靠前的,無(wú)疑被用戶選擇的概率會(huì)增加。術(shù)語(yǔ)解釋惡意占座是指在電子客票自動(dòng)銷售系統(tǒng)中,搶先下單,但無(wú)支付意愿的一種行為。即自動(dòng)售票系統(tǒng)為該訂單產(chǎn)生了封口(預(yù)留了艙位),但下單人并無(wú)支付意愿,直至交易系統(tǒng)因超時(shí),而自動(dòng)取消該筆訂單,釋放所占艙位。二分模型是一種回答是或否的數(shù)學(xué)模型。技術(shù)實(shí)現(xiàn)要素:本發(fā)明提供了一種惡意占座訂單的處理方法和系統(tǒng),以至少解決相關(guān)技術(shù)中惡意占座甄別和防范方法存在的問(wèn)題。根據(jù)本發(fā)明的一個(gè)方面,提供了一種惡意占座訂單的處理方法,包括:從票務(wù)數(shù)據(jù)庫(kù)抽取下單人在執(zhí)行下單操作前和/或執(zhí)行下單操作時(shí)的行為特征和所述下單人本次將下的訂單的訂單信息;根據(jù)所述行為特征和所述訂單信息,判斷所述訂單的惡意程度;在判斷到所述訂單的惡意程度超過(guò)預(yù)設(shè)閥值的情況下,針對(duì)所述訂單采取惡意占座防范手段??蛇x地,所述行為特征和所述訂單信息包括以下至少之一:下單人ID對(duì)應(yīng)棄單率、下單人重復(fù)次數(shù)、訂單人姓名重復(fù)次數(shù)、訂單人Email重復(fù)次數(shù)、訂單人電話重復(fù)次數(shù)、訂單人??吞?hào)重復(fù)次數(shù)、PNR的ID重復(fù)次數(shù)、PNR姓名重復(fù)次數(shù)、占座數(shù)目、最近一次棄單時(shí)間、距離起飛時(shí)間、是否占熱門(mén)航班、是否有等待支付訂單??蛇x地,所述行為特征和所述訂單信息還包括以下至少之一:根據(jù)日志信息抽取的下單人對(duì)路線價(jià)格搜索的耗時(shí)、根據(jù)日志信息抽取的下單人填寫(xiě)乘機(jī)人信息的耗時(shí)。可選地,根據(jù)所述行為特征和所述訂單信息,判斷所述訂單的惡意程度包括:建立基于二分模型的惡意度模型;將歷史訂單中交易成功的訂單作為非惡意占座訂單,將歷史訂單中交易失敗且未嘗試進(jìn)行過(guò)支付操作的訂單作為惡意占座訂單,通過(guò)所述非惡意占座訂單和所述惡意占座訂單分別對(duì)應(yīng)的行為特征和訂單信息,對(duì)所述惡意度模型進(jìn)行訓(xùn)練;使用經(jīng)過(guò)訓(xùn)練的惡意度模型,判斷所述下單人本次將下的所述訂單的惡意程度??蛇x地,所述二分模型包括以下之一:決策樹(shù)模型、神經(jīng)網(wǎng)絡(luò)模型、貝葉斯模型、邏輯斯蒂回歸模型、支持向量機(jī)模型??蛇x地,針對(duì)所述訂單采取惡意占座防范手段包括:根據(jù)所述訂單所處的操作階段確定防范點(diǎn);在所述防范點(diǎn)采取惡意占座防范手段??蛇x地,所述防范點(diǎn)包括以下至少之一:乘機(jī)人信息的提交時(shí)、確認(rèn)乘機(jī)人和線路信息時(shí)、生成訂單號(hào)并準(zhǔn)備進(jìn)入支付流程時(shí)??蛇x地,所述惡意占座防范手段包括以下至少之一:圖片驗(yàn)證、手機(jī)短信驗(yàn)證、縮短支付時(shí)間、主動(dòng)放棄訂單、拒絕交易、訂單支付成功后再提供訂單號(hào)且短時(shí)間內(nèi)未支付訂單則釋放座位。根據(jù)本發(fā)明的另一個(gè)方面,提供了一種惡意占座訂單的處理系統(tǒng),包括:抽取模塊,用于從票務(wù)數(shù)據(jù)庫(kù)抽取下單人在執(zhí)行下單操作前和/或執(zhí)行下單操作時(shí)的行為特征和所述下單人本次將下的訂單的訂單信息;判斷模塊,用于根據(jù)所述行為特征和所述訂單信息,判斷所述訂單的惡意程度;防范模塊,用于在判斷到所述訂單的惡意程度超過(guò)預(yù)設(shè)閥值的情況下,針對(duì)所述訂單采取惡意占座防范手段??蛇x地,所述行為特征和所述訂單信息包括以下至少之一:下單人ID對(duì)應(yīng)棄單率、下單人重復(fù)次數(shù)、訂單人姓名重復(fù)次數(shù)、訂單人Email重復(fù)次數(shù)、訂單人電話重復(fù)次數(shù)、訂單人??吞?hào)重復(fù)次數(shù)、PNR的ID重復(fù)次數(shù)、PNR姓名重復(fù)次數(shù)、占座數(shù)目、最近一次棄單時(shí)間、距離起飛時(shí)間、是否占熱門(mén)航班、是否有等待支付訂單??蛇x地,所述行為特征和所述訂單信息還包括以下至少之一:根據(jù)日志信息抽取的下單人對(duì)路線價(jià)格搜索的耗時(shí)、根據(jù)日志信息抽取的下單人填寫(xiě)乘機(jī)人信息的耗時(shí)??蛇x地,所述判斷模塊包括:建模單元,用于建立基于二分模型的惡意度模型;訓(xùn)練單元,用于將歷史訂單中交易成功的訂單作為非惡意占座訂單,將歷史訂單中交易失敗且未嘗試進(jìn)行過(guò)支付操作的訂單作為惡意占座訂單,通過(guò)所述非惡意占座訂單和所述惡意占座訂單分別對(duì)應(yīng)的行為特征和訂單信息,對(duì)所述惡意度模型進(jìn)行訓(xùn)練;判斷單元,用于使用經(jīng)過(guò)訓(xùn)練的惡意度模型,判斷所述下單人本次將下的所述訂單的惡意程度??蛇x地,所述二分模型包括以下之一:決策樹(shù)模型、神經(jīng)網(wǎng)絡(luò)模型、貝葉斯模型、邏輯斯蒂回歸模型、支持向量機(jī)模型??蛇x地,所述防范模塊包括:確定單元,用于根據(jù)所述訂單所處的操作階段確定防范點(diǎn);防范單元,用于在所述防范點(diǎn)采取惡意占座防范手段。可選地,所述防范點(diǎn)包括以下至少之一:乘機(jī)人信息的提交時(shí)、確認(rèn)乘機(jī)人和線路信息時(shí)、生成訂單號(hào)并準(zhǔn)備進(jìn)入支付流程時(shí)。可選地,所述惡意占座防范手段包括以下至少之一:圖片驗(yàn)證、手機(jī)短信驗(yàn)證、縮短支付時(shí)間、主動(dòng)放棄訂單、拒絕交易、訂單支付成功后再提供訂單號(hào)且短時(shí)間內(nèi)未支付訂單則釋放座位。通過(guò)本發(fā)明,采用從票務(wù)數(shù)據(jù)庫(kù)抽取下單人在執(zhí)行下單操作前和/或執(zhí)行下單操作時(shí)的行為特征和下單人本次將下的訂單的訂單信息;根據(jù)行為特征和訂單信息,判斷訂單的惡意程度;在判斷到訂單的惡意程度超過(guò)預(yù)設(shè)閥值的情況下,針對(duì)訂單采取惡意占座防范手段的方式,從而可以根據(jù)下單人的行為特征和下單人的訂單信息來(lái)判斷一張訂單是否為惡意占座訂單,并在判斷為惡意占座訂單的情況下采取惡意占座防范手段,解決了相關(guān)技術(shù)中的惡意占座防范手段因無(wú)法以訂單為粒度判斷惡意占座訂單而導(dǎo)致的防范效果差、影響艙位的銷售的問(wèn)題,提高了惡意占座訂單的識(shí)別和防范效果。附圖說(shuō)明此處所說(shuō)明的附圖用來(lái)提供對(duì)本發(fā)明的進(jìn)一步理解,構(gòu)成本申請(qǐng)的一部分,本發(fā)明的示意性實(shí)施例及其說(shuō)明用于解釋本發(fā)明,并不構(gòu)成對(duì)本發(fā)明的不當(dāng)限定。在附圖中:圖1是根據(jù)本發(fā)明實(shí)施例的惡意占座訂單的處理系統(tǒng)的結(jié)構(gòu)示意圖;圖2是根據(jù)本發(fā)明實(shí)施例的惡意占座訂單的處理系統(tǒng)的工作流程圖;圖3是根據(jù)本發(fā)明實(shí)施例的惡意占座訂單的處理系統(tǒng)與傳統(tǒng)系統(tǒng)的防范效果對(duì)比圖;圖4是根據(jù)本發(fā)明實(shí)施例的惡意占座訂單的處理系統(tǒng)與電子客票交互時(shí)序圖;圖5是根據(jù)本發(fā)明優(yōu)選實(shí)施例的惡意占座訂單的處理系統(tǒng)與電子客票交易系統(tǒng)的數(shù)據(jù)流向圖;圖6是根據(jù)本發(fā)明優(yōu)選實(shí)施例的惡意占座訂單的處理系統(tǒng)的網(wǎng)絡(luò)結(jié)構(gòu)圖;圖7是根據(jù)本發(fā)明優(yōu)選實(shí)施例的惡意度模型選擇界面的示意圖;圖8是根據(jù)本發(fā)明優(yōu)選實(shí)施例的有選擇性保護(hù)航班的配置界面的示意圖;圖9是根據(jù)本發(fā)明優(yōu)選實(shí)施例的防范措施配置界面的示意圖。具體實(shí)施方式下文中將參考附圖并結(jié)合實(shí)施例來(lái)詳細(xì)說(shuō)明本發(fā)明。需要說(shuō)明的是,在不沖突的情況下,本申請(qǐng)中的實(shí)施例及實(shí)施例中的特征可以相互組合。雖然本發(fā)明實(shí)施例是以民航售票中惡意占座訂單防范為例來(lái)進(jìn)行描述和說(shuō)明的,但是本發(fā)明并不限于應(yīng)用在民航售票中,在其他的票務(wù)系統(tǒng)中也可以利用本發(fā)明的構(gòu)思實(shí)現(xiàn)惡意訂單的防范處理。本實(shí)施例提供了一種惡意占座訂單的處理方案以防范惡意占座行為。本方案是基于行為特征來(lái)防范惡意占座的。該技術(shù)方案基于二分模型,在綜合包容了現(xiàn)有防范維度的同時(shí),抽取了更多的能反映下單人行為特征的維度,從更廣泛、更綜合的視野去考量一張訂單是否構(gòu)成惡意占座,以及多大程度上是惡意占座。進(jìn)而能做到基于一張訂單這個(gè)最小粒度來(lái)防范、打擊惡意占座行為。試驗(yàn)結(jié)果顯示,本實(shí)施例構(gòu)造的基于行為特征的、易擴(kuò)展的惡意占座訂單的處理系統(tǒng),不僅能以較高精度識(shí)別一張用來(lái)占座的惡意訂單,而且惡意占座訂單的處理系統(tǒng)在下單前(又可稱為事先防范,此時(shí)交易系統(tǒng)還沒(méi)有產(chǎn)生封口),就能在0.1s內(nèi)識(shí)別出該訂單的惡意程度。并且,惡意占座訂單的處理系統(tǒng)做好的配套防范措施,能根據(jù)不同的惡意程度,采用不同防范措施,能有效減少惡意訂單。圖1是根據(jù)本發(fā)明實(shí)施例的惡意占座訂單的處理系統(tǒng)的結(jié)構(gòu)示意圖,如圖1所示,對(duì)于現(xiàn)有電子客票交易系統(tǒng),通過(guò)消息傳送的方式與惡意占座訂單的處理系統(tǒng)進(jìn)行交互:交易節(jié)點(diǎn)將下單人信息和訂單內(nèi)容傳送給惡意占座訂單的處理系統(tǒng),惡意占座訂單的處理系統(tǒng)將診斷結(jié)果傳送給帶有防范措施的交易節(jié)點(diǎn)。帶有防范措施的交易系統(tǒng)根據(jù)惡意占座訂單的處理系統(tǒng)返回結(jié)果決定啟用相應(yīng)防范措施。圖2是根據(jù)本發(fā)明實(shí)施例的惡意占座訂單的處理系統(tǒng)的工作流程圖,圖2表明惡意占座訂單的處理系統(tǒng)是一種以模型為基礎(chǔ)診斷系統(tǒng)。其技術(shù)方案思路為:規(guī)避判斷一個(gè)代理人兩面性問(wèn)題,直接面向一張訂單,根據(jù)下單人的行為特征,區(qū)分是否是惡意訂單(惡意訂單是用來(lái)占座的訂單)。一個(gè)電子客票交易系統(tǒng),完成一張訂單,通常需要經(jīng)過(guò)路線價(jià)格查詢,錄入乘機(jī)人(PNR)信息等一系列過(guò)程。在這一系列過(guò)程中每一步,可以根據(jù)詳盡日志信息,分析出下單人的行為特征。如果找到這些差異,可以較為成功區(qū)分惡意占座訂單和正常訂單。下面將以圖1和圖2為中心介紹惡意占座訂單的處理系統(tǒng)技術(shù)方案的實(shí)現(xiàn):特征抽取從不同的維度描述一張訂單生成過(guò)程,從而也能考察一張訂單的惡意程度。比如,惡意占座者,基本上屬于下單技術(shù)熟練類型的。一般他們較強(qiáng)目的性,或針對(duì)行將起飛的航班,或針對(duì)熱門(mén)航線中的熱門(mén)航班,或針對(duì)性價(jià)比高的艙位。他們搜索路線的速度,填寫(xiě)乘機(jī)人信息速度,支付速度,都要明顯快于平均速度。特征抽取的過(guò)程,也需要考慮到抽取的難度和便宜性。在實(shí)踐中,根據(jù)自己的實(shí)際情況,可以采用了如表2的特征抽?。罕?:特征維度表維度獲取數(shù)據(jù)來(lái)源功能下單人ID對(duì)應(yīng)棄單率線下隔日計(jì)算下訂單人的以往品質(zhì)下單人重復(fù)次數(shù)棄單集合中crt_id下單人有多黑的一種描述訂單人姓名重復(fù)次數(shù)下單人聯(lián)系表該姓名有多黑訂單人email重復(fù)次數(shù)下單人聯(lián)系表該email有多黑訂單人電話重復(fù)次數(shù)下單人聯(lián)系電話該電話有多黑訂單人??吞?hào)重復(fù)次數(shù)下單人用戶管理表該唯一標(biāo)示有多黑PNR的ID重復(fù)次數(shù)乘機(jī)人表該P(yáng)NR的ID有多黑PNR姓名重復(fù)次數(shù)乘機(jī)人表該P(yáng)NR的姓名有多黑占座數(shù)目訂單表一單占多少座位最近一次棄單時(shí)間棄單表黑的新鮮度距離起飛時(shí)間訂單表和行程表緊急程度是否占熱門(mén)航班行程表正在被惡意占座航班集合是否有等待支付訂單訂單表下單人當(dāng)下的品質(zhì)特征抽取應(yīng)不限于上述表2所列舉特征。建議有實(shí)現(xiàn)和抽取條件的,增加搜索耗時(shí)維度,填寫(xiě)乘機(jī)人耗時(shí)維度等。惡意度模型選擇和建立根據(jù)該技術(shù)方案的思路,要實(shí)現(xiàn)的是判斷一張訂單的惡意程度。而回答一張訂單是正常訂單,還是用來(lái)占座的訂單,可以用二分模型來(lái)描述。如果采用二分模型來(lái)描述一張訂單是正常訂單,還是惡意訂單,可以簡(jiǎn)單回答是-1或者+1這個(gè)問(wèn)題。比如,用“+1”代表正常訂單(正例),用“-1”代表一張惡意訂單(負(fù)例)。如果采用表2所描述的那樣特征,可以從現(xiàn)有的交易數(shù)據(jù)庫(kù)中,很容易找到。比如,從近一個(gè)月的成功交易的訂單中,可以獲得若干正例,因?yàn)檫@些訂單已經(jīng)完成交易。也可以從近一個(gè)月的訂單庫(kù)中,找出那些交易失敗的訂單作為反例。在尋找反例的時(shí)候,可以扣除那些多次支付不成功情況。在實(shí)踐中,我們選擇了那些未點(diǎn)擊“立即支付”按鈕的棄單(惡意占座者都沒(méi)有考慮過(guò)要支付),作為反例。有了正反例,又有了特征,就可以訓(xùn)練模型了。有很多現(xiàn)有的分類模型可以用于二分模型的建模,比如,決策樹(shù)模型(C5.0),神經(jīng)網(wǎng)絡(luò)模型(BP),貝葉斯模型(NB),邏輯斯蒂回歸模型(LG),支持向量機(jī)模型(SVM),等等。如何選擇模型,需要根據(jù)開(kāi)發(fā)人員對(duì)于模型熟練使用程度。比如,如何將模型翻譯成現(xiàn)有系統(tǒng)支持的語(yǔ)言,如何引入現(xiàn)有的工程中。在我們的實(shí)踐中,我們選擇了支持向量機(jī)模型,并將該模型引入基于J2EE平臺(tái)的交易系統(tǒng)中。交易系統(tǒng)加入防范措施上述建模步驟獲得的模型,可以量化地考量一張訂單的惡意程度。如果發(fā)現(xiàn)某張訂單是惡意的,我們需要交易系統(tǒng)能根據(jù)惡意程度作出防范。即回答這樣兩個(gè)問(wèn)題:防范點(diǎn)設(shè)置在哪里?如何防范?(1)防范點(diǎn)設(shè)置:一般可以根據(jù)一張訂單完成需要的步驟來(lái)設(shè)置。惡意占座訂單的處理系統(tǒng)需要根據(jù)下單人填寫(xiě)的乘機(jī)人信息,來(lái)分析該訂單的惡意程度。故防范點(diǎn)設(shè)置,最早能在下單人提交乘機(jī)人信息開(kāi)始。一般提交乘機(jī)人信息之后,還需要下單人再次確認(rèn)。再次確認(rèn)也可以設(shè)置防范。再次確認(rèn)完畢,就進(jìn)入支付階段。進(jìn)入支付階段,生成訂單號(hào)之前,也可以設(shè)置防范。本實(shí)施例梳理了如表3所示的防范點(diǎn)設(shè)置:表3:電子客票交易系統(tǒng)防范點(diǎn)設(shè)置交易步驟交易步驟說(shuō)明防范可能性搜索線路尚未開(kāi)始交易需要更多挖掘IP信息填寫(xiě)乘機(jī)人信息已登錄,提交信息開(kāi)始在提交時(shí),可以設(shè)防確認(rèn)乘機(jī)人和線路信息確認(rèn)提交信息點(diǎn)擊確認(rèn)時(shí),可以設(shè)防生成訂單號(hào),等待支付未點(diǎn)擊支付按鈕準(zhǔn)備進(jìn)入支付,可以設(shè)防選擇支付方式點(diǎn)擊支付按鈕等待支付完成,無(wú)需設(shè)防支付完成支付已經(jīng)完成支付完成,無(wú)需設(shè)防表3給出了開(kāi)發(fā)人員時(shí)機(jī)設(shè)置,即如何觸發(fā)防范措施生效。(2)防范措施。防范措施的目的是讓惡意占座者知難而退,達(dá)到不預(yù)定艙位或者少預(yù)定艙位的目的。本實(shí)施例提供了如下表4所示的有效防范措施:表4:電子客票交易系統(tǒng)防范點(diǎn)設(shè)置表4中所述的措施“先付款,再給訂單號(hào)”,改進(jìn)了“先付款,再出票”這種防范的不足之處,先還是為該下單人留座位,但留座位的時(shí)間很短僅3分鐘,而且,訂單號(hào)也沒(méi)有顯示給下單人。根據(jù)我們最新的支付完成時(shí)間的統(tǒng)計(jì),一般5分鐘之類,96%以上的下單人都可以完成支付操作。熟練的下單人,一般不足20秒就完成支付,留3分鐘給一個(gè)熟練的下單人,是很充足的。主動(dòng)放棄訂單,是讓下單人自己放棄當(dāng)前所占座位。在下單人查看當(dāng)前訂單信息時(shí),交易系統(tǒng)應(yīng)該主動(dòng)加上“放棄訂單”的按鈕。這樣可以方便下單人隨時(shí)糾正自己因操作失誤造成的占座。主動(dòng)放棄訂單,也可以加快所占艙位的及時(shí)釋放。有了防范措施電子客票交易系統(tǒng),將根據(jù)下單人的行為特征信息,診斷出當(dāng)前訂單是否是惡意訂單。如果是惡意訂單,可以根據(jù)交易系統(tǒng)配置的防范點(diǎn),防范方法,相機(jī)彈出手機(jī)短信驗(yàn)證碼、拒絕交易等防范措施。帶有防范措施的電子客票交易系統(tǒng),增加了惡意占座者的交易成本,形成一種相對(duì)嚴(yán)密交易機(jī)制,可以達(dá)到讓惡意占座者不能為所欲為的目的。圖3展示了旅游旺季2015年惡意占座訂單的處理系統(tǒng)在東航B2C官網(wǎng)試驗(yàn)上線后,與2014年(惡意占座訂單的處理系統(tǒng)未上線)同日占座最嚴(yán)重前10名航班,占座次數(shù)加總對(duì)比。從圖3中可以看出采用了惡意占座訂單的處理系統(tǒng)后,惡意占座情況得到了很大程度緩解。圖4展示了惡意占座訂單的處理系統(tǒng)與電子客票交互時(shí)序圖。下面通過(guò)優(yōu)選實(shí)例對(duì)上述實(shí)施例進(jìn)行描述和說(shuō)明。行為特征抽取和轉(zhuǎn)化實(shí)現(xiàn)一般行為特征的抽取轉(zhuǎn)化包括了線下和線上部分。線下部分抽取是要為找到一個(gè)合適的模型服務(wù)。而線上部分,則是將一個(gè)原始訂單,立即轉(zhuǎn)化成一個(gè)可以被模型識(shí)別的向量。線下抽取和轉(zhuǎn)化。按照表2的抽取的維度,表5選擇性地展示了如何將這些特征數(shù)字化,以便形成向量。按照表5指導(dǎo)的特征數(shù)字化公式,就可以制造出具有區(qū)分特征的向量,讓模型能輕松識(shí)別正常訂單和棄單。表5:線下特征數(shù)字化示例表表5示例性展示了,如何將一張歷史訂單號(hào)為711140718412498的訂單轉(zhuǎn)化成向量的過(guò)程。表5的公式也表明,只要找到相應(yīng)的分子值,就能快速地將一張訂單轉(zhuǎn)化成向量,因?yàn)榉帜缚梢钥闯沙A浚鎯?chǔ)在內(nèi)存中。表5中的訂單號(hào)只是一種標(biāo)示,用來(lái)唯一標(biāo)示一個(gè)訂單向量。線上抽取和轉(zhuǎn)化線上的抽取過(guò)程需要根據(jù)交易流程,梳理出在什么位置能找到相應(yīng)的特征(即找到表5要求的各個(gè)維度的分母值),并將該特征匯合,發(fā)送給惡意占座訂單的處理系統(tǒng)服務(wù)器。按照表6就能抽取到需要的特征:表6:基于訂單狀態(tài)的特殊梳理惡意占座訂單的處理系統(tǒng)服務(wù)器根據(jù)各個(gè)維度的分子值,按照表5就能將該訂單轉(zhuǎn)化成訂單向量,交給訓(xùn)練好的二分模型處理。在線部分訂單號(hào)與表5不一樣,一張正在處理的訂單可能沒(méi)有正規(guī)的訂單號(hào),需要其他的標(biāo)示。比如,我們實(shí)踐中采用系統(tǒng)交易時(shí)間(精確到微秒)附加一個(gè)隨機(jī)數(shù),作為任意一訂單的標(biāo)示。模型獲取、訓(xùn)練、驗(yàn)證正例和反例獲取按照表5將一張訂單向量化之后,根據(jù)該訂單是成功交易,還是棄單,分別貼上“+1”和“-1”標(biāo)簽之后,形成訓(xùn)練文件train.dat和測(cè)試文件test.dat,就可以放入模型進(jìn)行學(xué)習(xí)訓(xùn)練。訓(xùn)練文檔中的數(shù)據(jù)格式可以如下:-11:0.292942:0.407463:0.442914:0.247365:0.000006:0.313437:0.008118:0.055989:0.0737010:0.3531511:0.4429112:0.2510913:0.0000014:0.00000其中“-1”就是反例,編號(hào)1到14就是向量維度,對(duì)應(yīng)的數(shù)值,就是每個(gè)維度按照表5公式計(jì)算得出的值。模型訓(xùn)練將正例和反例數(shù)據(jù)形成訓(xùn)練文本文件train.dat放入模型獲取程序中進(jìn)行訓(xùn)練。按照如下命令步驟,就能完成SVM模型訓(xùn)練:svm_learn-e0.01train.datbmodel_0920如上命令中,svm_learn是可執(zhí)行模型程序(有很多公開(kāi)方式可以免費(fèi)獲取各種算法模型),負(fù)責(zé)將train.dat轉(zhuǎn)化成一種二分模型bmodel_0920。按照如下如下命令:svm_classifybmodel_0920test.dat能獲取二分模型bmodel_0920測(cè)試test.dat的結(jié)果。如果采用神經(jīng)網(wǎng)絡(luò)BP算法訓(xùn)練之后的結(jié)果,就是BP模型。這個(gè)模型要用來(lái)區(qū)分正常訂單和惡意占座訂單的模型。一般模型在投入應(yīng)用之前,是需要知道其準(zhǔn)確性。即該模型準(zhǔn)確程度有多高。模型驗(yàn)證和評(píng)價(jià)一般模型的測(cè)試數(shù)據(jù)相對(duì)于訓(xùn)練模型是不可見(jiàn)的。為了達(dá)到這樣的測(cè)試效果,可以直接使用線上最新棄單數(shù)據(jù)來(lái)測(cè)試模型。按照數(shù)據(jù)挖掘理論中的模型精度分析方法來(lái)評(píng)價(jià)獲得的模型精度。按照表7和表8就能完成模型精度評(píng)定。表7:惡意占座訂單的處理系統(tǒng)識(shí)別成功訂單統(tǒng)計(jì)表在實(shí)踐中,表8的考察方法可能更加有效:表8:惡意占座訂單的處理系統(tǒng)識(shí)別棄單統(tǒng)計(jì)表檢查項(xiàng)目項(xiàng)目值指標(biāo)意義檢查日期2015-1-3~4考察時(shí)間段棄單單數(shù)2,181棄單總數(shù)目成功識(shí)別數(shù)43模型識(shí)別出來(lái)的總數(shù)目成功訂單判成棄單數(shù)0錯(cuò)判情況統(tǒng)計(jì)識(shí)別棄單精度100%=43/(43+0)模型識(shí)別惡意定單的精度正確率0.95%識(shí)別惡意定單的正確率表7和表8是將學(xué)術(shù)上的評(píng)價(jià)分類模型精度和召回率等概念具體化,從兩個(gè)角度驗(yàn)證和考核所建立模型的正確率。表7在壓測(cè)環(huán)境下,考察線上惡意占座訂單防范模型是否存在大量錯(cuò)殺情況。測(cè)試結(jié)果表明,惡意占座訂單的處理系統(tǒng)線上的模型(經(jīng)過(guò)參數(shù)調(diào)整之后的模型)對(duì)于惡意訂單識(shí)別精度非常高。防范措施選取和實(shí)施針對(duì)表4所描述的防范措施。按照表9就能落實(shí)到實(shí)現(xiàn):表9:電子客票交易系統(tǒng)防范措施實(shí)施表9最后一種措施,可能需要更改現(xiàn)有的交易流程。但我們的實(shí)踐表明,這些改動(dòng)量都不大。以聯(lián)航的實(shí)施為例,我們僅用了3天就完成所有交易流程的修改,在聯(lián)航的實(shí)施過(guò)程中,我們只采用了手機(jī)短信驗(yàn)證碼、縮短支付時(shí)間和拒接交易三種措施,就達(dá)到了良好的效果。在線實(shí)施、驗(yàn)證和調(diào)整惡意占座訂單的處理系統(tǒng)按照如上描述實(shí)現(xiàn)完成之后,與原來(lái)的電子客票交易系統(tǒng)構(gòu)成如圖4所示的交互時(shí)序圖和如圖5所示的數(shù)據(jù)流向圖。惡意占座訂單的處理系統(tǒng)技術(shù)方案可以隨著不同的交易應(yīng)用而調(diào)整。惡意占座訂單的處理系統(tǒng)技術(shù)方案實(shí)施過(guò)程如下:硬件機(jī)器圖6顯示,惡意占座訂單的處理系統(tǒng)技術(shù)方案需要運(yùn)行在獨(dú)立的服務(wù)器上。惡意占座訂單的處理系統(tǒng)可以使用死活的硬件配置方式。惡意占座訂單的處理系統(tǒng)對(duì)硬件無(wú)特殊要求,只需要在兩臺(tái)機(jī)器雙核2G內(nèi)存,安裝linux或者windows系統(tǒng)就能運(yùn)行。數(shù)據(jù)庫(kù)為方便數(shù)據(jù)積累和日志追溯查詢,惡意占座訂單的處理系統(tǒng)需要連接數(shù)據(jù)庫(kù)。惡意占座訂單的處理系統(tǒng)可以很便捷地同各種數(shù)據(jù)庫(kù)打交道,因?yàn)閷?shí)現(xiàn)過(guò)程采用了MyBatis數(shù)據(jù)庫(kù)連接技術(shù)。能防止SQL注入攻擊的MyBatis,采用標(biāo)準(zhǔn)SQL語(yǔ)言描述支持SQL數(shù)據(jù)庫(kù)操作。惡意占座訂單的處理系統(tǒng)能方便接入較經(jīng)典的數(shù)據(jù)庫(kù),比如,oracle,mysql,informix,db2,sqlserver,teradata,sybase,BDB等。連接器實(shí)現(xiàn)部署惡意占座訂單的處理系統(tǒng)的連接器是基于Web的通訊的。惡意占座訂單的處理系統(tǒng)已經(jīng)根據(jù)采用httpclient協(xié)議,用JSON格式的文本將數(shù)據(jù)發(fā)送給惡意占座訂單的處理系統(tǒng)服務(wù)器,實(shí)現(xiàn)惡意占座訂單的處理系統(tǒng)與現(xiàn)有交易系統(tǒng)相互通信。這種通信使用類HttpClient就可以完成,這個(gè)類只需要引入org.apache.http.client.HttpClient,調(diào)用現(xiàn)成execute方法就可以實(shí)現(xiàn)。惡意占座訂單的處理系統(tǒng)的服務(wù)以及自身管理服務(wù)可以部署在流行的web服務(wù)器上,比如,websphere,tomcat,jetty,resin,jboss等發(fā)布容器,也可以是基于servlet的獨(dú)立進(jìn)程。惡意占座訂單的處理系統(tǒng)的服務(wù)基于struts2.3+json+httpclient方式實(shí)現(xiàn)。惡意占座訂單的處理系統(tǒng)客戶端與交易系統(tǒng)交互實(shí)現(xiàn)如圖2示意圖所示,惡意占座訂單的處理系統(tǒng)需要一種客戶端完成與現(xiàn)有的電子客票交易系統(tǒng)交互。該客戶端就是連接器一種延伸,采用HttpClient+JSON完成。該客戶端需要完成兩種類型的功能:其一,將現(xiàn)有交易系統(tǒng)的訂單信息發(fā)送給惡意占座訂單的處理系統(tǒng),同時(shí)也需要將訂單的變更狀態(tài)信息告訴惡意占座訂單的處理系統(tǒng)。因?yàn)閻阂庹甲唵蔚奶幚硐到y(tǒng)采用訂單生命周期的方式來(lái)管理任何一張機(jī)票訂單,即全程監(jiān)控一張訂單從提交,到生成訂單,到等待支付,到支付完成,或者成為棄單,并在此過(guò)程監(jiān)控中,不停地學(xué)習(xí)和更新線上模型。其二,將惡意占座訂單的處理系統(tǒng)診斷結(jié)果及配置好的防范策略帶回交易系統(tǒng)。方便交易系統(tǒng)及時(shí)在后續(xù)步驟中做出相應(yīng)的防范措施。本優(yōu)選實(shí)施例中整理出如下表10所示的交互方式和信息抽取方式:表10:基于訂單狀態(tài)的交互實(shí)施按照表10的指示,就能完成在交易系統(tǒng)中抽取出惡意占座訂單的處理系統(tǒng)所需要信息。著重標(biāo)出的是惡意占座訂單的處理系統(tǒng)與交易系統(tǒng)交互的最核心的一次。該來(lái)回交互完成了診斷結(jié)果和防范策略的傳輸。而后續(xù)四個(gè)狀態(tài)的管理,可以讓惡意占座訂單的處理系統(tǒng)及時(shí)掌握最新的訂單消息和狀態(tài),完成自身的在線學(xué)習(xí)和更新。惡意占座訂單的處理系統(tǒng)之所以能在第二單交易就能準(zhǔn)確判斷一個(gè)新的惡意占座用戶,依賴的邏輯就是訂單狀態(tài)的嚴(yán)格追蹤和判斷。模型準(zhǔn)備按照表2和表4的所述的方法,可以很快從交易系統(tǒng)的歷史訂單庫(kù)中,找到正例和反例。這個(gè)過(guò)程中,需要維持正例和反例的一種均衡。我們建議將正例和反例的比例控制在5:1左右。如果采用神經(jīng)網(wǎng)絡(luò)BP模型,最后得到的模型需要開(kāi)發(fā)人員能導(dǎo)出模型數(shù)據(jù)。否則,需要用Java本地化化技術(shù)封裝該模型,以方便接受一個(gè)一個(gè)地測(cè)試向量的輸入。我們建議開(kāi)發(fā)人員認(rèn)真看懂newff(matlab中BP實(shí)現(xiàn)的方法之一)方法返回的學(xué)習(xí)矩陣值。以便能方便錄入數(shù)據(jù)庫(kù)和J2EE平臺(tái)。比如,對(duì)于支持向量機(jī)模型(SVM),我們?cè)趯?shí)踐中認(rèn)真解析了訓(xùn)練后獲得的模型,讓該模型能以學(xué)習(xí)參數(shù)的方式,展現(xiàn)在數(shù)據(jù)庫(kù)表中,明確地標(biāo)示出各個(gè)抽取維度值的重要性以及相互關(guān)系??梢宰C明的是,任何SVM訓(xùn)練后的模型,最終可以轉(zhuǎn)化為一個(gè)超平面方程。如果SVM模型難于被開(kāi)發(fā)人員所理解,決策樹(shù)和貝葉斯模型也是不錯(cuò)的選擇,訓(xùn)練出的模型可以很快拿到參數(shù)。將模型解析成學(xué)習(xí)參數(shù)可以帶來(lái)很多好處??梢灾庇^察看,可以存入表中,可以方便放入內(nèi)存中,也可以方便地人為干預(yù)模型。驗(yàn)證采用表8和表7的方法,可以很直觀地觀測(cè)線上模型的準(zhǔn)確性。在調(diào)整線上模型的精度過(guò)程中,實(shí)踐告知我們:表8和表7的最后的準(zhǔn)確度不可能都很高,即惡意訂單正確識(shí)別準(zhǔn)確度和正常訂單正確識(shí)別準(zhǔn)確度都很高,這可能是不現(xiàn)實(shí)的,這符合ROC(模型精度召回率檢驗(yàn))理論闡述。針對(duì)機(jī)票銷售的淡旺季采用春、夏、秋、冬都不一樣的模型,如圖7所示。正常運(yùn)營(yíng)惡意占座訂單的處理系統(tǒng)正常投入營(yíng)運(yùn)后,可以其中占座相對(duì)頻繁的航班進(jìn)行管理,如圖8所示。選擇保護(hù)航班的條件可以是根據(jù)當(dāng)前棄單狀態(tài)推算出來(lái)的排名前10的航班,也可以是客座率超過(guò)閾值的航班(一般客座率超過(guò)經(jīng)典閾值,說(shuō)明屆時(shí)正是該航班銷售機(jī)票的黃金時(shí)機(jī))。有選擇性保護(hù)航班可以緩解兩個(gè)顧慮:對(duì)模型可能會(huì)錯(cuò)殺的過(guò)渡憂慮,以及對(duì)可能帶來(lái)較差用戶體驗(yàn)過(guò)濾。而且,防范措施中,可以盡量不選擇強(qiáng)硬的拒絕交易,如圖9所示。按照?qǐng)D9所示的配置,即使在保護(hù)航班出現(xiàn)惡意占座者,交易系統(tǒng)只是彈出手機(jī)驗(yàn)證碼而已,當(dāng)該下單人認(rèn)真輸入正確的手機(jī)驗(yàn)證碼之后,仍然可以完成交易。這種方式相對(duì)“拒絕服務(wù)”要寬松?;诙帜P偷膼阂庹甲唵蔚奶幚硐到y(tǒng)已經(jīng)較好的精度彈出驗(yàn)證碼,這對(duì)于經(jīng)常的惡意占座者是一種警告和威懾。防范措施中,也可以采用多種防范措施同時(shí)生效。比如,針對(duì)性采用“先付款,再給訂單號(hào)”的防范措施。上述方案與“先付款,再占座”防范措施相比,惡意占座訂單的處理系統(tǒng)具有以下顯著特點(diǎn):(1)事先防范??梢圆挥酶淖儸F(xiàn)有的交易習(xí)慣,即“先留座,再付款”。因?yàn)閻阂庹甲唵蔚奶幚硐到y(tǒng)在下單人填寫(xiě)完成乘機(jī)人信息之后,就能分析出該訂單的惡意程度。(2)多特征綜合分析。惡意占座訂單的處理系統(tǒng)是一套基于下單人查詢、填寫(xiě)訂單內(nèi)容為基礎(chǔ)的分析技術(shù)。一個(gè)經(jīng)常惡意占座的IP,也可能正常下單。只是在正常下單時(shí),正常下單人表現(xiàn)的行為特征與其惡意占座時(shí)表現(xiàn)不一樣。(3)在線學(xué)習(xí)。對(duì)于一個(gè)無(wú)任何歷史記錄的惡意占座者,第二單就能判斷出其惡意占座行為。對(duì)于一個(gè)有占座記錄的下單人,第一單就能判斷。(4)防范點(diǎn)設(shè)置靈活。由于惡意占座訂單的處理系統(tǒng)能事先分析訂單惡意程度,從而可以讓電子客票交易系統(tǒng)靈活地設(shè)置防范點(diǎn)。比如,防范點(diǎn)可以在下單人填寫(xiě)完乘機(jī)人信息之后,當(dāng)下單人填寫(xiě)完信息之后,如果該訂單惡意程度高,可以立即彈出手機(jī)短信驗(yàn)證碼輸入頁(yè)面,要求該下單人輸入驗(yàn)證碼,而99%的正常下單人,是看不到這樣的驗(yàn)證碼頁(yè)面。當(dāng)然也能針對(duì)這樣惡意用戶采用“先付款,再留座”的交易方法,但不會(huì)針對(duì)廣大正常下單用戶。此外,惡意占座訂單的處理系統(tǒng)用分類的方法來(lái)定量回答一張訂單多大程度上是惡意訂單,目標(biāo)是(-1,+1)。如果我們將目標(biāo)連續(xù)化,這種基于二分模型的回歸做法,也可以用于判斷任意一個(gè)代理人對(duì)于整個(gè)民航電子客票交易中貢獻(xiàn)程度,以及在整個(gè)電子客票交易中權(quán)重順序。并根據(jù)這種順序和貢獻(xiàn)程度,安排不同的訪問(wèn)資源權(quán)限。比如,如果采用惡意占座訂單的處理系統(tǒng)的思路進(jìn)行民航系統(tǒng)內(nèi)部收益管理,給不同的代理打分,然后,根據(jù)不同的代理人分值給予代理人不同的優(yōu)惠程度。該優(yōu)惠可以AV資源訪問(wèn)次數(shù)上的優(yōu)惠,運(yùn)價(jià)查詢次數(shù)上的優(yōu)惠。我們完全可以按照表2所示的方法,尋找一些能反映代理人身份的維度,比如,代理人近一個(gè)月的出票量,棄單量,K座次數(shù),特殊操作次數(shù),違規(guī)次數(shù)等作為數(shù)據(jù)向量維度。對(duì)于目標(biāo)值,我們可以根據(jù)其查定比率,棄單率綜合起來(lái),人工打分。然后規(guī)一化到(0,1),使用所建議的模型,就能很快得到學(xué)習(xí)模型,指導(dǎo)我們對(duì)所有代理人進(jìn)行打分了。以上所述僅為本發(fā)明的優(yōu)選實(shí)施例而已,并不用于限制本發(fā)明,對(duì)于本領(lǐng)域的技術(shù)人員來(lái)說(shuō),本發(fā)明可以有各種更改和變化。凡在本發(fā)明的精神和原則之內(nèi),所作的任何修改、等同替換、改進(jìn)等,均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。當(dāng)前第1頁(yè)1 2 3