一種基于圖形匹配的仿冒網(wǎng)站檢測(cè)系統(tǒng)及檢測(cè)方法
【專利摘要】一種基于圖形匹配的仿冒網(wǎng)站檢測(cè)系統(tǒng)及檢測(cè)方法,本發(fā)明涉及信息安全領(lǐng)領(lǐng)域;它包含仿冒網(wǎng)站logo圖片識(shí)別系統(tǒng);所述的仿冒網(wǎng)站logo圖片識(shí)別系統(tǒng)包含仿冒網(wǎng)站域名管理模塊、仿冒網(wǎng)站logo圖片提取模塊和仿冒網(wǎng)站相似度計(jì)算模塊。解決現(xiàn)有技術(shù)中存在的問(wèn)題,準(zhǔn)確率更高,不容易誤報(bào)。
【專利說(shuō)明】
-種基于圖形匹配的仿冒網(wǎng)站檢測(cè)系統(tǒng)及檢測(cè)方法
技術(shù)領(lǐng)域
[0001] 本發(fā)明設(shè)及信息安全領(lǐng)域,具體設(shè)及一種基于圖形匹配的仿冒網(wǎng)站檢測(cè)系統(tǒng)及檢 測(cè)方法。
【背景技術(shù)】
[0002] 仿冒網(wǎng)站,指未經(jīng)授權(quán)建立的相似網(wǎng)站,如果是出于惡意目的,稱為釣魚網(wǎng)站。對(duì) 仿冒網(wǎng)站的檢測(cè)一直是安全行業(yè)的一個(gè)重要問(wèn)題,需要更精確和有效的技術(shù)來(lái)識(shí)別判斷仿 冒網(wǎng)站。
[0003] 經(jīng)對(duì)現(xiàn)有技術(shù)的文獻(xiàn)檢索發(fā)現(xiàn),中國(guó)專利申請(qǐng)?zhí)朇N201110402085.2,專利名稱"釣 魚網(wǎng)站檢測(cè)方法及裝置",提供一種釣魚網(wǎng)站檢測(cè)方法及裝置。該釣魚網(wǎng)站檢測(cè)方法包括: 獲取已知釣魚網(wǎng)站的互聯(lián)網(wǎng)協(xié)議IP地址;根據(jù)與所述已知釣魚網(wǎng)站的IP地址相鄰的預(yù)設(shè)范 圍設(shè)定可疑IP域;查詢所述可疑IP域所包括的可疑IP地址所映射的統(tǒng)一資源定位符URL,并 根據(jù)所述U化生成可疑釣魚網(wǎng)站列表;針對(duì)所述可疑釣魚網(wǎng)站列表中的各所述U化進(jìn)行釣魚 網(wǎng)站檢測(cè)。根據(jù)本發(fā)明的釣魚網(wǎng)站檢測(cè)方法及裝置,實(shí)現(xiàn)了從龐大的網(wǎng)站資源中主動(dòng)發(fā)現(xiàn) 未知釣魚網(wǎng)站。
[0004] 中國(guó)專利申請(qǐng)?zhí)朇N201210220826.X,專利名稱"一種釣魚網(wǎng)站查找系統(tǒng)及方法% 公開了一種釣魚網(wǎng)站查找系統(tǒng)及方法,設(shè)及網(wǎng)絡(luò)安全領(lǐng)域。所述系統(tǒng)包括:種子庫(kù)建立單 元,適于將命中已知釣魚網(wǎng)站的個(gè)數(shù)大于預(yù)定闊值的目標(biāo)網(wǎng)頁(yè)的原始鏈接作為種子鏈接放 入種子庫(kù);種子提取器,適于提取出種子庫(kù)中的種子鏈接;種子網(wǎng)頁(yè)分析器,適于根據(jù)提取 出的種子鏈接查找對(duì)應(yīng)的種子網(wǎng)頁(yè),對(duì)種子網(wǎng)頁(yè)進(jìn)行分析,得到種子網(wǎng)頁(yè)中存在的可疑鏈 接;判斷單元,適于查找可疑鏈接對(duì)應(yīng)的可疑網(wǎng)頁(yè),判斷可疑網(wǎng)頁(yè)是否是釣魚網(wǎng)站;輸出接 口,適于在可疑網(wǎng)頁(yè)是釣魚網(wǎng)站時(shí),輸出相應(yīng)的釣魚網(wǎng)站。所述系統(tǒng)及方法,大幅提高了釣 魚網(wǎng)站的查找速度,降低了網(wǎng)民使用互聯(lián)網(wǎng)的安全風(fēng)險(xiǎn)。
[0005] 現(xiàn)有技術(shù)準(zhǔn)確率低,容易發(fā)生誤報(bào)的情況,亟待改進(jìn)。
【發(fā)明內(nèi)容】
[0006] 本發(fā)明的目的在于針對(duì)現(xiàn)有技術(shù)的缺陷和不足,提供一種設(shè)計(jì)合理的基于圖形匹 配的仿冒網(wǎng)站檢測(cè)系統(tǒng)及檢測(cè)方法,解決現(xiàn)有技術(shù)中存在的問(wèn)題,準(zhǔn)確率更高,不容易誤 報(bào)。
[0007] 為實(shí)現(xiàn)上述目的,本發(fā)明采用的技術(shù)方案是:它包含仿冒網(wǎng)站logo圖片識(shí)別系統(tǒng); 所述的仿冒網(wǎng)站logo圖片識(shí)別系統(tǒng)包含仿冒網(wǎng)站域名管理模塊、仿冒網(wǎng)站logo圖片提取模 塊和仿冒網(wǎng)站相似度計(jì)算模塊。
[000引它的操作步驟如下:
[0009] A、使用HTTP協(xié)議或HTWS協(xié)議連接目標(biāo)網(wǎng)站,下載網(wǎng)站首頁(yè);
[0010] B、提取帶有l(wèi)ogo字樣的圖片,如果沒(méi)有則提前右上角的圖片或第一張圖片;
[OOW C、針對(duì)目標(biāo)網(wǎng)站的logo圖片和原始網(wǎng)站的logo圖片分別劃分為若干小塊,一般為 64X64個(gè)小塊,對(duì)每一小塊生成灰度數(shù)組,每一小塊的灰度值在O到255之間,原始網(wǎng)站的每 一小塊灰度值為Sx,y,目標(biāo)網(wǎng)站每一小塊的灰度值為Tx,y;
[0012] D、計(jì)算兩個(gè)圖片的相似度D,計(jì)算方法參照如下公式:
[0013]
[0014] E、相似度的范圍在0到無(wú)窮大之間,根據(jù)測(cè)試結(jié)論,0為完全相同,0~1為十分相 似,IW上可W認(rèn)為是完全不同的圖片,即目標(biāo)網(wǎng)站不是原始網(wǎng)站的仿冒者。
[0015] 采用上述結(jié)構(gòu)后,本發(fā)明有益效果為:
[0016] 1、通過(guò)使用圖形比較的方式可W模擬網(wǎng)站用戶的使用體驗(yàn),通過(guò)識(shí)別logo圖片判 斷是否是仿冒網(wǎng)站,提供了一種新的仿冒網(wǎng)站的識(shí)別方式;
[0017] 2、圖形比較識(shí)別仿冒網(wǎng)站比傳統(tǒng)的文字識(shí)別方式準(zhǔn)確率更高,不容易誤報(bào),某些 仿冒網(wǎng)站可能通過(guò)避免使用特征詞的方式繞過(guò)文字識(shí)別,卻難W繞開logo相似度的問(wèn)題。
【附圖說(shuō)明】
[0018] 為了更清楚地說(shuō)明本發(fā)明實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對(duì)實(shí)施例或現(xiàn) 有技術(shù)描述中所需要使用的附圖作簡(jiǎn)單地介紹,顯而易見地,下面描述中的附圖僅僅是本 發(fā)明的一些實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來(lái)講,在不付出創(chuàng)造性勞動(dòng)性的前提下,還可 W根據(jù)運(yùn)些附圖獲得其他的附圖。
[0019] 圖1是本發(fā)明的結(jié)構(gòu)示意圖。
[0020] 圖2是本發(fā)明的操作流程圖。
[0021] 附圖標(biāo)記說(shuō)明:
[0022] 仿冒網(wǎng)站logo圖片識(shí)別系統(tǒng)1、仿冒網(wǎng)站域名管理模塊2、仿冒網(wǎng)站logo
[0023] 圖片提取模塊3、仿冒網(wǎng)站相似度計(jì)算模塊4。
【具體實(shí)施方式】
[0024] 下面結(jié)合附圖對(duì)本發(fā)明作進(jìn)一步的說(shuō)明。
[0025] 參看如圖1和圖2所示,本【具體實(shí)施方式】采用的技術(shù)方案是:它包含仿冒網(wǎng)站logo 圖片識(shí)別系統(tǒng)1;所述的仿冒網(wǎng)站logo圖片識(shí)別系統(tǒng)1包含仿冒網(wǎng)站域名管理模塊2、仿冒網(wǎng) 站logo圖片提取模塊3和仿冒網(wǎng)站相似度計(jì)算模塊4。
[00%] 它的操作步驟如下:
[0027] A、使用HTTP協(xié)議或HTWS協(xié)議連接目標(biāo)網(wǎng)站,下載網(wǎng)站首頁(yè);
[0028] B、提取帶有l(wèi)ogo字樣的圖片,如果沒(méi)有則提前右上角的圖片或第一張圖片;
[0029] C、針對(duì)目標(biāo)網(wǎng)站的logo圖片和原始網(wǎng)站的logo圖片分別劃分為若干小塊,一般為 64X64個(gè)小塊,對(duì)每一小塊生成灰度數(shù)組,每一小塊的灰度值在0到255之間,原始網(wǎng)站的每 一小塊灰度值為Sx,y,目標(biāo)網(wǎng)站每一小塊的灰度值為Tx,y;
[0030] D、計(jì)算兩個(gè)圖片的相似度D,計(jì)算方法參照如下公式:
[0031]
[0032] E、相似度的范圍在0到無(wú)窮大之間,根據(jù)測(cè)試結(jié)論,0為完全相同,0~I為十分相 似,IW上可W認(rèn)為是完全不同的圖片,即目標(biāo)網(wǎng)站不是原始網(wǎng)站的仿冒者。
[0033] 采用上述結(jié)構(gòu)后,本【具體實(shí)施方式】有益效果為:解決現(xiàn)有技術(shù)中存在的問(wèn)題,準(zhǔn)確 率更高,不容易誤報(bào),通過(guò)識(shí)別logo圖片判斷是否是仿冒網(wǎng)站,提供了一種新的仿冒網(wǎng)站的 識(shí)別方式。
[0034] W上所述,僅用W說(shuō)明本發(fā)明的技術(shù)方案而非限制,本領(lǐng)域普通技術(shù)人員對(duì)本發(fā) 明的技術(shù)方案所做的其它修改或者等同替換,只要不脫離本發(fā)明技術(shù)方案的精神和范圍, 均應(yīng)涵蓋在本發(fā)明的權(quán)利要求范圍當(dāng)中。
【主權(quán)項(xiàng)】
1. 一種基于圖形匹配的仿冒網(wǎng)站檢測(cè)系統(tǒng),其特征在于:它包含仿冒網(wǎng)站logo圖片識(shí) 別系統(tǒng);所述的仿冒網(wǎng)站logo圖片識(shí)別系統(tǒng)包含仿冒網(wǎng)站域名管理模塊、仿冒網(wǎng)站logo圖 片提取模塊和仿冒網(wǎng)站相似度計(jì)算模塊。2. -種基于圖形匹配的仿冒網(wǎng)站檢測(cè)方法,其特征在于:它的操作步驟如下: (A) 、使用HTTP協(xié)議或HTTTS協(xié)議連接目標(biāo)網(wǎng)站,下載網(wǎng)站首頁(yè); (B) 、提取帶有l(wèi)ogo字樣的圖片,如果沒(méi)有則提前右上角的圖片或第一張圖片; (C) 、針對(duì)目標(biāo)網(wǎng)站的logo圖片和原始網(wǎng)站的logo圖片分別劃分為若干小塊,一般為64 X64個(gè)小塊,對(duì)每一小塊生成灰度數(shù)組,每一小塊的灰度值在0到255之間,原始網(wǎng)站的每一 小塊灰度值為Sx,y,目標(biāo)網(wǎng)站每一小塊的灰度值為Tx,y; 化)、計(jì)算兩個(gè)圖片的相似度D,計(jì)算方法參照如下公式:化)、相似度的范圍在0到無(wú)窮大之間,根據(jù)測(cè)試結(jié)論,0為完全相同,0~1為十分相似,1 W上可W認(rèn)為是完全不同的圖片,即目標(biāo)網(wǎng)站不是原始網(wǎng)站的仿冒者。
【文檔編號(hào)】H04L29/06GK105978850SQ201610213651
【公開日】2016年9月28日
【申請(qǐng)日】2016年4月8日
【發(fā)明人】樊凱, 梁志宏, 呂華輝, 關(guān)澤武, 楊航
【申請(qǐng)人】中國(guó)南方電網(wǎng)有限責(zé)任公司