基于鼠標(biāo)行為的電子商務(wù)中用戶異常行為應(yīng)用系統(tǒng)及檢測方法
【專利摘要】本發(fā)明涉及一種基于鼠標(biāo)行為的電子商務(wù)中用戶異常行為應(yīng)用系統(tǒng)及檢測方法,應(yīng)用系統(tǒng)包括B2C電商網(wǎng)站、鼠標(biāo)行為數(shù)據(jù)采集模塊、檢測模塊、數(shù)據(jù)庫。方法包括步驟一,正常用戶模式提取;步驟二,匹配檢測。本發(fā)明針對特殊應(yīng)用環(huán)境,設(shè)計(jì)個(gè)性化的鼠標(biāo)行為特征向量,增強(qiáng)身份認(rèn)證可靠,保證電子商務(wù)的交易安全。
【專利說明】基于鼠標(biāo)行為的電子商務(wù)中用戶異常行為應(yīng)用系統(tǒng)及檢測方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明屬于基于鼠標(biāo)行為的身份認(rèn)證輔助方法。
【背景技術(shù)】
[0002]隨著社會(huì)的不斷進(jìn)步,互聯(lián)網(wǎng)正以質(zhì)的飛躍在發(fā)展,隨之出現(xiàn)的通過網(wǎng)絡(luò)進(jìn)行商品和服務(wù)營銷的電子商務(wù)已成為全球企業(yè)不可阻擋的趨勢。從1997年至今,中國的電子商務(wù)蓬勃成長,從最初的阿里巴巴集團(tuán)等幾家網(wǎng)站競爭,已發(fā)展到了如今百家爭鳴的狀態(tài),吸引越來越多的人通過網(wǎng)絡(luò)交易和網(wǎng)上支付開展商務(wù)活動(dòng)。 [0003]安全性是電子商務(wù)中一個(gè)至關(guān)重要的核心問題,它要求網(wǎng)絡(luò)能提供一種端到端的安全解決方案。針對網(wǎng)站釣魚,也出現(xiàn)了不同的防治技術(shù)手段,如郵件過濾(微軟推出的IE7),電子郵件認(rèn)證(微軟推出的Sender ID Framework, Yahoo使用的DK計(jì)劃),StandfordUniversity提出兩種基于瀏覽器客戶端的防范方法PwdHash和SpoofGuard,以及SSL數(shù)字證書等技術(shù)。這些手段的技術(shù)重點(diǎn)都定位在防范上面,目的在于預(yù)防用戶遭到釣魚攻擊。為了保護(hù)受到釣魚攻擊的用戶的權(quán)益,解決用戶的身份驗(yàn)證問題也是必要的,從而在技術(shù)層面上保證參與網(wǎng)絡(luò)交易的用戶是“可信用戶”。
[0004]本專利面向的情況是目前在網(wǎng)絡(luò)交易中普遍采用數(shù)字證書的方法進(jìn)行身份驗(yàn)證,這種機(jī)制最大的弊端就是口令等信息容易泄露,存在著嚴(yán)重的安全隱患。當(dāng)口令較簡單時(shí),通過基于字典的暴力破解就能夠破獲。同時(shí)由于網(wǎng)絡(luò)釣魚和正規(guī)網(wǎng)站的信息泄露,黑客可以獲取用戶的數(shù)字證書,進(jìn)而假冒用戶身份進(jìn)行商務(wù)活動(dòng),因此采用數(shù)字證書方式并不能完美地解決用戶身份可信的問題,存在一定的缺陷。
【發(fā)明內(nèi)容】
[0005]本發(fā)明目的在于公開一種基于鼠標(biāo)行為的電子商務(wù)中用戶異常行為檢測方法,針對特殊應(yīng)用環(huán)境,設(shè)計(jì)個(gè)性化的鼠標(biāo)行為特征向量,增強(qiáng)身份認(rèn)證可靠,保證電子商務(wù)的交
易安全。
[0006]本發(fā)明給出的技術(shù)方案為:
一種基于鼠標(biāo)行為的電子商務(wù)中用戶異常行為檢測的應(yīng)用系統(tǒng),其特征在于,
包括B2C電商網(wǎng)站,為用戶提供購物環(huán)境;
包括鼠標(biāo)行為數(shù)據(jù)采集模塊,用于收集用戶購物過程中操作鼠標(biāo)產(chǎn)生的數(shù)據(jù);所述鼠標(biāo)行為數(shù)據(jù)采集模塊內(nèi)嵌在電子商務(wù)網(wǎng)站中,使用JavaScript腳本語言。鼠標(biāo)單擊時(shí)采集的數(shù)據(jù)項(xiàng)主要有:頁面序號,X、Y軸坐標(biāo)值,時(shí)間戳等。采集鼠標(biāo)移動(dòng)時(shí)的數(shù)據(jù),需要預(yù)設(shè)一個(gè)采樣率,采集數(shù)據(jù)包括頁面序號,Χ、y軸坐標(biāo)值,時(shí)間戳,移動(dòng)速度,加速度,移動(dòng)角度值等,其中后三項(xiàng)無法直接采集,需要通過對采集的原始數(shù)據(jù)經(jīng)過一系列數(shù)學(xué)運(yùn)算而得出。 [0007]包括檢測模塊,利用聚類等算法對訓(xùn)練期間采集到的鼠標(biāo)數(shù)據(jù)進(jìn)行正常行為模式的固化,對當(dāng)前用戶行為模式進(jìn)行計(jì)算生成,最后進(jìn)行匹配檢測操作。[0008]包括數(shù)據(jù)庫,用于存儲(chǔ)數(shù)據(jù)采集模塊在用戶購物過程中操作鼠標(biāo)產(chǎn)生的數(shù)據(jù),同時(shí)將已備的正常行為模式提供給檢測模塊用于對與當(dāng)前用戶行為模式進(jìn)行匹配檢測。
[0009]一種基于鼠標(biāo)行為的電子商務(wù)中用戶異常行為檢測方法,其特征在于,
步驟一,正常用戶模式提取:對訓(xùn)練期間采集的正常鼠標(biāo)行為數(shù)據(jù)進(jìn)行預(yù)處理,利用基于歐氏距離的K-means聚類算法等方法,提取用戶的正常行為模式。
[0010]步驟二,匹配檢測:對當(dāng)前用戶鼠標(biāo)數(shù)據(jù)進(jìn)行相同處理,得到當(dāng)前用戶的鼠標(biāo)行為模式,與正常模式進(jìn)行匹配分析。
[0011]本發(fā)明屬于基于鼠標(biāo)行為的身份認(rèn)證方法,是通過研究鼠標(biāo)這種計(jì)算機(jī)輸入設(shè)備的行為特征,來識別用戶的身份。該認(rèn)證方法可從人機(jī)交互和生理層面對用戶的鼠標(biāo)行為進(jìn)行研究。
[0012]鼠標(biāo)行為數(shù)據(jù)采集模塊,通過實(shí)時(shí)采集用戶在進(jìn)行電子商務(wù)過程中操作鼠標(biāo)設(shè)備運(yùn)動(dòng)所產(chǎn)生的數(shù)據(jù),并通過一定步驟的數(shù)學(xué)計(jì)算提取并存儲(chǔ)必要的數(shù)據(jù)信息。
[0013]用戶鼠標(biāo)行為檢測系統(tǒng)由正常用戶模式提取和當(dāng)前用戶行為匹配檢測兩個(gè)模塊構(gòu)成。正常用戶模式提取模塊,對訓(xùn)練期間采集的正常鼠標(biāo)行為數(shù)據(jù)進(jìn)行預(yù)處理,利用基于歐氏距離的K-means聚類算法等方法,提取用戶的正常行為模式。當(dāng)前用戶行為匹配檢測模塊,對當(dāng)前用戶鼠標(biāo)數(shù)據(jù)進(jìn)行相同處理,得到當(dāng)前用戶的鼠標(biāo)行為模式,與正常模式進(jìn)行匹配分析, 從而判斷用戶行為異常與否。
[0014]本發(fā)明的創(chuàng)新點(diǎn)及有益效果:
1、將計(jì)算機(jī)系統(tǒng)中基于鼠標(biāo)行為進(jìn)行身份認(rèn)證的思想,運(yùn)用在電子商務(wù)的用戶異常行為檢測中,作為數(shù)字認(rèn)證的輔助手段。
[0015]2、結(jié)合電子商務(wù)中用戶購物的流程,提出一種借鑒自動(dòng)機(jī)想法的檢測模型。
[0016]3、針對特殊應(yīng)用環(huán)境,設(shè)計(jì)個(gè)性化的鼠標(biāo)行為特征向量。
【專利附圖】
【附圖說明】
[0017]下面結(jié)合附圖和實(shí)施方式對本發(fā)明作進(jìn)一步的詳細(xì)說明:
圖1為系統(tǒng)整體架構(gòu)圖;
圖2為窗口坐標(biāo)系;
圖3為檢測模型;
圖4為特征向量的提取流程圖;
圖5為匹配檢測流程圖。
【具體實(shí)施方式】
[0018]如圖1、2所示:B2C電商網(wǎng)站用于模擬用戶購物環(huán)境,鼠標(biāo)行為數(shù)據(jù)采集模塊收集和存儲(chǔ)用戶購物過程中操作鼠標(biāo)產(chǎn)生的數(shù)據(jù),檢測模塊則利用聚類等算法對訓(xùn)練期間采集到的鼠標(biāo)數(shù)據(jù)進(jìn)行正常行為模式的固化,對當(dāng)前用戶行為模式進(jìn)行計(jì)算生成,最后進(jìn)行匹配檢測操作。
[0019]鼠標(biāo)行為數(shù)據(jù)采集模塊內(nèi)嵌在電子商務(wù)網(wǎng)站中,使用JavaScript腳本語言。鼠標(biāo)單擊時(shí)采集的數(shù)據(jù)項(xiàng)主要有:頁面序號,χ、y軸坐標(biāo)值,時(shí)間戳等。采集鼠標(biāo)移動(dòng)時(shí)的數(shù)據(jù),需要預(yù)設(shè)一個(gè)采樣率,采集數(shù)據(jù)包括頁面序號,Χ、y軸坐標(biāo)值,時(shí)間戳,移動(dòng)速度,加速度,移動(dòng)角度值等,其中后三項(xiàng)無法直接采集,需要通過對采集的原始數(shù)據(jù)經(jīng)過一系列數(shù)學(xué)運(yùn)算兒而得到。采集數(shù)據(jù)時(shí)采用下圖2設(shè)立的坐標(biāo)系。
[0020]如圖3所示:檢測模塊的工作原理,是選擇用戶在電商網(wǎng)站進(jìn)行購物操作時(shí),所發(fā)生的真正對用戶利益可能有實(shí)質(zhì)性傷害的有序行為進(jìn)行分析。具體如圖3所示,該檢測模型借鑒了自動(dòng)機(jī)中狀態(tài)集、輸入字符和轉(zhuǎn)移函數(shù)的想法,每個(gè)圓表示一個(gè)狀態(tài),箭頭表示轉(zhuǎn)移函數(shù),符號I和O分別表示行為模式匹配與否。每一次轉(zhuǎn)移時(shí),都需要用到定制的特征向量,分別為 FeatureVectorO, FeatureVectorl, FeatureVector2, FeatureVector3。對當(dāng)前用戶行為進(jìn)行檢測時(shí),對生成的特征向量進(jìn)行匹配,任意一次轉(zhuǎn)移時(shí)匹配超出一定的閾值,都直接判斷為異常。
[0021]如圖4所示:特征向量的設(shè)計(jì),則利用采集到的數(shù)據(jù),同時(shí)考慮到應(yīng)用環(huán)境為電子商務(wù)購物網(wǎng)站,為體現(xiàn)特性,故在購物過程中每個(gè)狀態(tài)跳轉(zhuǎn)都有自己定制的特征向量。具體地,如在登錄狀態(tài)轉(zhuǎn)移時(shí),考慮到每個(gè)用戶的用戶名與密碼的長度、輸入難度、輸入手速等不同,把用戶點(diǎn)擊用戶名文本框、密碼文本框和登錄按鈕之間的時(shí)間差作為特征向量的一部分,取其平均值作為特征值;另一方面,用戶在點(diǎn)擊登錄按鍵時(shí)的單擊區(qū)域也因人而異,該坐標(biāo)值也選為特征向量的一部分,將采集到的大量單擊點(diǎn)坐標(biāo),通過基于歐氏距離的K-Means聚類算法,得到最密集簇的簇心坐標(biāo)的坐標(biāo)值作為特征值。定義為FeatureVectorO= (Tl, T2, Point),其中Tl表示單擊用戶名文本框和密碼文本框之間的時(shí)間差,T2表示單擊密碼文本框和登錄按鈕之間的時(shí)間差,Point是最密集幾個(gè)簇的簇心坐標(biāo)點(diǎn)數(shù)據(jù)。在瀏覽選購狀態(tài)時(shí),不同用戶喜好不同,生理習(xí)慣各異,將頻繁單擊區(qū)域和鼠標(biāo)移動(dòng)速度、加速度、移動(dòng)角度值等均作為特征向量。定義FeatureVectorl= (Point, v, a,angle),其中Point是單擊點(diǎn)分布最密集的幾個(gè)簇的簇心坐標(biāo)點(diǎn)數(shù)據(jù)集合,v表示移動(dòng)速度的最小值、最大值和分布密集平均值數(shù)組,a表示移動(dòng)加速度的最大值和分布密集平均值數(shù)組,angle表示移動(dòng)角度值的分布密集值數(shù)組。
[0022]如圖5所示:匹配檢測的具體流程如下圖所示。匹配時(shí),直接計(jì)算特征向量之間的距離,由于每個(gè)特征向量的每個(gè)分量不同,故分別求相同類型的分量之間的距離,超過一定閾值(閾值由大量實(shí)驗(yàn)結(jié)果和經(jīng)驗(yàn)總結(jié)得出),即判斷為異常。
【權(quán)利要求】
1.一種基于鼠標(biāo)行為的電子商務(wù)中用戶異常行為檢測的應(yīng)用系統(tǒng),其特征在于, 包括B2C電商網(wǎng)站,為用戶提供購物環(huán)境; 包括鼠標(biāo)行為數(shù)據(jù)采集模塊,用于收集用戶購物過程中操作鼠標(biāo)產(chǎn)生的數(shù)據(jù);所述鼠標(biāo)行為數(shù)據(jù)采集模塊內(nèi)嵌在電子商務(wù)網(wǎng)站中,使用JavaScript腳本語言; 鼠標(biāo)單擊時(shí)采集的數(shù)據(jù)項(xiàng)主要有:頁面序號,X、Y軸坐標(biāo)值,時(shí)間戳等; 采集鼠標(biāo)移動(dòng)時(shí)的數(shù)據(jù),需要預(yù)設(shè)采樣率,采集數(shù)據(jù)包括頁面序號,X、Y軸坐標(biāo)值,時(shí)間戳,移動(dòng)速度,加速度,移動(dòng)角度值等,其中后三項(xiàng)需要通過對采集的原始數(shù)據(jù)經(jīng)過間接數(shù)學(xué)運(yùn)算后而得出; 包括檢測模塊,利用聚類等算法對訓(xùn)練期間采集到的鼠標(biāo)數(shù)據(jù)進(jìn)行正常行為模式的固化,對當(dāng)前用戶行為模式進(jìn)行計(jì)算生成,最后進(jìn)行匹配檢測操作; 包括數(shù)據(jù)庫,用于存儲(chǔ)數(shù)據(jù)采集模塊在用戶購物過程中操作鼠標(biāo)產(chǎn)生的數(shù)據(jù),同時(shí)將已備的正常行為模式提供給檢測模塊用于對與當(dāng)前用戶行為模式進(jìn)行匹配檢測。
2.一種基于鼠標(biāo)行為的電子商務(wù)中用戶異常行為檢測方法,其特征在于, 步驟一,正常用戶模式提取:對訓(xùn)練期間采集的正常鼠標(biāo)行為數(shù)據(jù)進(jìn)行預(yù)處理,利用基于歐氏距離的K-means聚類算法等方法,提取用戶的正常行為模式; 步驟二,匹配檢測:對當(dāng)前用戶鼠標(biāo)數(shù)據(jù)進(jìn)行相同處理,得到當(dāng)前用戶的鼠標(biāo)行為模式,與正常模式進(jìn)行匹配分析。`
3.根據(jù)權(quán)利要求2所述的基于鼠標(biāo)行為的電子商務(wù)中用戶異常行為檢測方法,其特征在于,所述模式提取是采用提取特征向量的方法來實(shí)現(xiàn)的,具體包括: 預(yù)處理階段,對采集數(shù)據(jù)坐標(biāo)點(diǎn)進(jìn)行聚類處理并剔除異常點(diǎn); 生成模式階段,按照特征向量定義計(jì)算,并向數(shù)據(jù)庫存儲(chǔ)特征向量; 更新階段,不定時(shí)的循環(huán)至預(yù)處理階段對特征向量進(jìn)行優(yōu)化更新。
4.根據(jù)權(quán)利要求2所述的基于鼠標(biāo)行為的電子商務(wù)中用戶異常行為檢測方法,其特征在于,所述匹配檢測,其方法為: 匹配時(shí),直接計(jì)算特征向量之間的距離,由于每個(gè)特征向量的每個(gè)分量不同,故分別求相同類型的分量之間的距離; 超過一定閾值(閾值由大量實(shí)驗(yàn)結(jié)果和經(jīng)驗(yàn)總結(jié)得出),即判斷為異常。
5.根據(jù)權(quán)利要求3所述的基于鼠標(biāo)行為的電子商務(wù)中用戶異常行為檢測方法,其特征在于,所述特征向量的設(shè)計(jì),則利用采集到的數(shù)據(jù),同時(shí)考慮到應(yīng)用環(huán)境為電子商務(wù)購物網(wǎng)站,為體現(xiàn)特性,故在購物過程中每個(gè)狀態(tài)跳轉(zhuǎn)都有自己定制的特征向量; 具體地,如在登錄狀態(tài)轉(zhuǎn)移時(shí),考慮到每個(gè)用戶的用戶名與密碼的長度、輸入難度、輸入手速等不同,把用戶點(diǎn)擊用戶名文本框、密碼文本框和登錄按鈕之間的時(shí)間差作為特征向量的一部分,取其平均值作為特征值;另一方面,用戶在點(diǎn)擊登錄按鍵時(shí)的單擊區(qū)域也因人而異,該坐標(biāo)值也選為特征向量的一部分,將采集到的大量單擊點(diǎn)坐標(biāo),通過基于歐氏距離的K-Means聚類算法,得到最密集簇的簇心坐標(biāo)的坐標(biāo)值作為特征值; 定義為FeatureVectorO= (Tl,T2,Point),其中Tl表示單擊用戶名文本框和密碼文本框之間的時(shí)間差,T2表示單擊密碼文本框和登錄按鈕之間的時(shí)間差,Point是最密集幾個(gè)簇的簇心坐標(biāo)點(diǎn)數(shù)據(jù); 在瀏覽選購狀態(tài)時(shí),不同用戶喜好不同,生理習(xí)慣各異,將頻繁單擊區(qū)域和鼠標(biāo)移動(dòng)速度、加速度、移動(dòng)角度值等均作為特征向量; 定義FeatureVectorl= (Point, v, a, angle),其中Point是單擊點(diǎn)分布最密集的幾個(gè)簇的簇心坐標(biāo)點(diǎn)數(shù)據(jù)集合,V表示移動(dòng)速度的最小值、最大值和分布密集平均值數(shù)組,a表示移動(dòng)加速度的最大值和分布密集平均值數(shù)組,angle表示移動(dòng)角度值的分布密集值數(shù)組。
6.根據(jù)權(quán)利要求2所述的基于鼠標(biāo)行為的電子商務(wù)中用戶異常行為檢測方法,其特征在于,所述匹配檢測,是選擇用戶在電商網(wǎng)站進(jìn)行購物操作時(shí),所發(fā)生的真正對用戶利益可能有實(shí)質(zhì)性傷害的有序行為進(jìn)行分析; 該檢測模型借鑒了自動(dòng)機(jī)中狀態(tài)集、輸入字符和轉(zhuǎn)移函數(shù)的想法,每個(gè)圓表示一個(gè)狀態(tài),箭頭表示轉(zhuǎn)移函數(shù),符號I和O分別表示行為模式匹配與否; 每一次轉(zhuǎn)移時(shí),都需要用到定制的特征向量,分別為FeatureVectorO, FeatureVectorl,FeatureVector2, FeatureVector3 ; 對當(dāng)前用戶行為進(jìn)行檢測時(shí),對生成的特征向量進(jìn)行匹配,任意一次轉(zhuǎn)移時(shí)匹配超出一定的閾值,都直接判斷為異常。
【文檔編號】G06Q30/00GK103699822SQ201310747420
【公開日】2014年4月2日 申請日期:2013年12月31日 優(yōu)先權(quán)日:2013年12月31日
【發(fā)明者】蔣昌俊, 陳閎中, 閆春鋼, 丁志軍, 馬磊 申請人:同濟(jì)大學(xué)