基于圖片匹配檢測(cè)釣魚網(wǎng)頁的方法及裝置制造方法
【專利摘要】本發(fā)明公開了一種基于圖片匹配檢測(cè)釣魚網(wǎng)頁的方法及裝置。其中方法的執(zhí)行基于預(yù)先建立的包含多個(gè)第一圖片和第二圖片的圖片規(guī)則庫;方法包括:對(duì)瀏覽器打開的網(wǎng)頁進(jìn)行截圖,獲取第三圖片;計(jì)算第三圖片與圖片規(guī)則庫中所有第一圖片的相似度;根據(jù)相似度對(duì)圖片規(guī)則庫中的所有第一圖片進(jìn)行排序,按照排序后的順序選取多個(gè)第一圖片,選取的第一圖片的數(shù)量小于圖片規(guī)則庫中第一圖片的總數(shù)量;將第三圖片與選取的第一圖片對(duì)應(yīng)的第二圖片進(jìn)行匹配,若選取的第一圖片對(duì)應(yīng)的第二圖片中的至少一個(gè)與第三圖片匹配,則確定網(wǎng)頁為可疑的釣魚網(wǎng)頁。本發(fā)明中,通過計(jì)算相似度,簡(jiǎn)化了匹配個(gè)數(shù),基于圖片匹配能夠快速并準(zhǔn)確的判斷網(wǎng)頁為可疑的釣魚網(wǎng)頁。
【專利說明】基于圖片匹配檢測(cè)釣魚網(wǎng)頁的方法及裝置
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及互聯(lián)網(wǎng)【技術(shù)領(lǐng)域】,具體涉及一種基于圖片匹配檢測(cè)釣魚網(wǎng)頁的方法及 裝直。
【背景技術(shù)】
[0002] 隨著互聯(lián)網(wǎng)的發(fā)展,基于WEB的應(yīng)用日益普及,人們通過瀏覽器可以查詢銀行賬 戶、網(wǎng)上購物、電子商務(wù)、查詢信息、獲取知識(shí)、進(jìn)行娛樂等,WEB為人們提供了方便和快捷的 交互方式。然而,人們?cè)谏暇W(wǎng)沖浪瀏覽網(wǎng)頁的同時(shí),經(jīng)常會(huì)遭遇到惡意網(wǎng)站的侵襲,導(dǎo)致計(jì) 算機(jī)被病毒、木馬等感染。
[0003] 惡意網(wǎng)站,例如釣魚網(wǎng)站、或者是欺詐,仿冒網(wǎng)站等,主要是通過仿冒真實(shí)網(wǎng)站的 URL地址或是網(wǎng)頁內(nèi)容,偽裝成銀行及電子商務(wù)等類型的網(wǎng)站,或是利用真實(shí)網(wǎng)站服務(wù)器程 序上的漏洞,在該網(wǎng)站的某些網(wǎng)頁中插入危險(xiǎn)的網(wǎng)頁代碼,以此來騙取用戶銀行或信用卡 賬號(hào)、密碼等私人資料。惡意網(wǎng)頁中包含著許多敏感的特征,例如,金融欺詐類的惡意網(wǎng)頁 會(huì)在文字、圖片等方面仿冒官網(wǎng),或是在真實(shí)網(wǎng)頁中插入虛假票務(wù)、虛假中獎(jiǎng)、假冒網(wǎng)銀、虛 假購物等信息,這些特征大多以文本串的形式出現(xiàn)在網(wǎng)頁中。
[0004] 現(xiàn)有的為了防范惡意網(wǎng)站的主要手段是當(dāng)用戶訪問某網(wǎng)站時(shí),客戶端將網(wǎng)站的 URL發(fā)送至服務(wù)器端的黑白名單數(shù)據(jù)庫進(jìn)行查詢,然而由于釣魚網(wǎng)站不斷更新?lián)Q代,這種方 法對(duì)釣魚網(wǎng)站等惡意網(wǎng)站的檢出率不高并具有滯后性?;蛘呤峭ㄟ^基于文本的方法進(jìn)行識(shí) 另IJ,例如通過提取頁面中關(guān)鍵詞,并將關(guān)鍵詞上傳至服務(wù)器,在黑名單數(shù)據(jù)庫中匹配,這種 方法效率比較低下,而且容易受文字順序等因素的影響,誤判率較高。
【發(fā)明內(nèi)容】
[0005] 鑒于上述問題,提出了本發(fā)明以便提供一種克服上述問題或者至少部分地解決上 述問題的基于圖片匹配檢測(cè)釣魚網(wǎng)頁的方法和相應(yīng)的基于圖片匹配檢測(cè)釣魚網(wǎng)頁的裝置。
[0006] 根據(jù)本發(fā)明的一個(gè)方面,提供了一種基于圖片匹配檢測(cè)釣魚網(wǎng)頁的方法,所述方 法的執(zhí)行基于預(yù)先建立的包含多個(gè)第一圖片和第二圖片的圖片規(guī)則庫,所述第一圖片是 已知釣魚網(wǎng)頁的截圖,所述第二圖片是在所述第一圖片中所截取的具有釣魚網(wǎng)頁特征的圖 片;
[0007] 所述方法包括:
[0008] 對(duì)瀏覽器打開的網(wǎng)頁進(jìn)行截圖,獲取第三圖片;
[0009] 計(jì)算所述第三圖片與所述圖片規(guī)則庫中所有第一圖片的相似度;
[0010] 根據(jù)相似度對(duì)圖片規(guī)則庫中的所有第一圖片進(jìn)行排序,按照排序后的順序選取多 個(gè)第一圖片,選取的第一圖片的數(shù)量小于所述圖片規(guī)則庫中第一圖片的總數(shù)量;
[0011] 將所述第三圖片與選取的第一圖片對(duì)應(yīng)的第二圖片進(jìn)行匹配,若選取的第一圖片 對(duì)應(yīng)的第二圖片中的至少一個(gè)與所述第三圖片匹配,則確定所述網(wǎng)頁為可疑的釣魚網(wǎng)頁。
[0012] 根據(jù)本發(fā)明的另一方面,提供了一種基于圖片匹配檢測(cè)釣魚網(wǎng)頁的裝置,包括:
[0013] 圖片規(guī)則庫,所述圖片規(guī)則庫包含多個(gè)第一圖片和第二圖片,所述第一圖片是已 知釣魚網(wǎng)頁的截圖,所述第二圖片是在所述第一圖片中所截取的具有釣魚網(wǎng)頁特征的圖 片;
[0014] 獲取模塊,適于對(duì)瀏覽器打開的網(wǎng)頁進(jìn)行截圖,獲取第三圖片;
[0015] 相似度計(jì)算模塊,適于計(jì)算所述第三圖片與所述圖片規(guī)則庫中所有第一圖片的相 似度;
[0016] 選取模塊,適于根據(jù)相似度對(duì)圖片規(guī)則庫中的所有第一圖片進(jìn)行排序,按照排序 后的順序選取多個(gè)第一圖片,選取的第一圖片的數(shù)量小于所述圖片規(guī)則庫中第一圖片的總 數(shù)量;
[0017] 匹配模塊,適于將所述第三圖片與選取的第一圖片對(duì)應(yīng)的第二圖片進(jìn)行匹配,若 選取的第一圖片對(duì)應(yīng)的第二圖片中的至少一個(gè)與所述第三圖片匹配,則確定所述網(wǎng)頁為可 疑的釣魚網(wǎng)頁。
[0018] 根據(jù)本發(fā)明的提供的方案,對(duì)瀏覽器打開的網(wǎng)頁進(jìn)行截圖,獲取第三圖片;計(jì)算所 述第三圖片與所述圖片規(guī)則庫中所有第一圖片的相似度;根據(jù)相似度對(duì)圖片規(guī)則庫中的所 有第一圖片進(jìn)行排序,按照排序后的順序選取多個(gè)第一圖片,選取的第一圖片的數(shù)量小于 所述圖片規(guī)則庫中第一圖片的總數(shù)量;將所述第三圖片與選取的第一圖片對(duì)應(yīng)的第二圖片 進(jìn)行匹配,若選取的第一圖片對(duì)應(yīng)的第二圖片中的至少一個(gè)與所述第三圖片匹配,則確定 所述網(wǎng)頁為可疑的釣魚網(wǎng)頁。通過對(duì)第一圖片進(jìn)行篩選,減少了后續(xù)匹配過程中將第三圖 片與第二圖片匹配的計(jì)算量,加快了釣魚網(wǎng)頁的檢測(cè)速度,降低了資源占用率;此外,由于 第二圖片具有釣魚網(wǎng)頁特征,因此在圖片規(guī)則庫內(nèi)存在與第三圖片匹配的第二圖片的情況 下,第三圖片也具有釣魚網(wǎng)頁的特征,基于此能夠快速并準(zhǔn)確的判斷網(wǎng)頁為可疑的釣魚網(wǎng) 頁。
[0019] 上述說明僅是本發(fā)明技術(shù)方案的概述,為了能夠更清楚了解本發(fā)明的技術(shù)手段, 而可依照說明書的內(nèi)容予以實(shí)施,并且為了讓本發(fā)明的上述和其它目的、特征和優(yōu)點(diǎn)能夠 更明顯易懂,以下特舉本發(fā)明的【具體實(shí)施方式】。
【專利附圖】
【附圖說明】
[0020] 通過閱讀下文優(yōu)選實(shí)施方式的詳細(xì)描述,各種其他的優(yōu)點(diǎn)和益處對(duì)于本領(lǐng)域普通 技術(shù)人員將變得清楚明了。附圖僅用于示出優(yōu)選實(shí)施方式的目的,而并不認(rèn)為是對(duì)本發(fā)明 的限制。而且在整個(gè)附圖中,用相同的參考符號(hào)表示相同的部件。在附圖中:
[0021] 圖1示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的基于圖片匹配檢測(cè)釣魚網(wǎng)頁的方法的流程 圖;
[0022] 圖2示出了根據(jù)本發(fā)明另一個(gè)實(shí)施例的基于圖片匹配檢測(cè)釣魚網(wǎng)頁的方法的流 程圖;
[0023] 圖3示出了根據(jù)本發(fā)明另一個(gè)實(shí)施例的獲取第三圖片的一種方法的流程圖;
[0024] 圖4示出了根據(jù)本發(fā)明另一個(gè)實(shí)施例的獲取第三圖片的另一種方法的流程圖;
[0025] 圖5示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的基于圖片匹配檢測(cè)釣魚網(wǎng)頁的裝置的結(jié)構(gòu) 框圖;
[0026] 圖6示出了根據(jù)本發(fā)明另一個(gè)實(shí)施例的基于圖片匹配檢測(cè)釣魚網(wǎng)頁的裝置的結(jié) 構(gòu)框圖;
[0027] 圖7示出了根據(jù)本發(fā)明另一個(gè)實(shí)施例的基于圖片匹配檢測(cè)釣魚網(wǎng)頁的裝置的結(jié) 構(gòu)框圖。
【具體實(shí)施方式】
[0028] 下面將參照附圖更詳細(xì)地描述本公開的示例性實(shí)施例。雖然附圖中顯示了本公開 的示例性實(shí)施例,然而應(yīng)當(dāng)理解,可以以各種形式實(shí)現(xiàn)本公開而不應(yīng)被這里闡述的實(shí)施例 所限制。相反,提供這些實(shí)施例是為了能夠更透徹地理解本公開,并且能夠?qū)⒈竟_的范圍 完整的傳達(dá)給本領(lǐng)域的技術(shù)人員。
[0029] 本發(fā)明的執(zhí)行基于預(yù)先建立的包含多個(gè)第一圖片和第二圖片的圖片規(guī)則庫,第一 圖片是已知釣魚網(wǎng)頁的截圖,第二圖片是在第一圖片中所截取的具有釣魚網(wǎng)頁特征的圖 片。
[0030] 建立圖片規(guī)則庫的方法是多種多樣的,本發(fā)明主要介紹兩種建立圖片規(guī)則庫的方 法,但建立圖片規(guī)則庫的方法并不僅限于此,本領(lǐng)域技術(shù)人員可以根據(jù)實(shí)際需要選用合適 的方法建立圖片規(guī)則庫。
[0031] 具體地,針對(duì)兩種建立圖片規(guī)則庫的方法進(jìn)行詳細(xì)描述:
[0032] 方法一:
[0033] 對(duì)多個(gè)已知釣魚網(wǎng)頁進(jìn)行截圖,獲取第一圖片,從每個(gè)第一圖片中截取具有釣魚 網(wǎng)頁特征的至少一個(gè)第二圖片,并將第二圖片添加到圖片規(guī)則庫中,其中,第二圖片的尺寸 小于或等于第一圖片的尺寸。
[0034] 具體地,規(guī)則添加人員在截圖工具的URL (統(tǒng)一資源定位符)輸入框中輸入已知釣 魚網(wǎng)頁的URL,然后點(diǎn)擊獲取快照按鈕對(duì)多個(gè)已知釣魚網(wǎng)頁進(jìn)行截圖,獲取第一圖片,截圖 完成后,將獲取的第一圖片展示給規(guī)則添加人員,由規(guī)則添加人員利用鼠標(biāo)從獲取的第一 圖片中截取具有釣魚網(wǎng)頁特征的至少一個(gè)第二圖片,并將第二圖片添加到圖片規(guī)則庫中, 其中,第二圖片的尺寸小于或等于第一圖片的尺寸。
[0035] 方法二:
[0036] (1)對(duì)初始獲取的多個(gè)已知釣魚網(wǎng)頁進(jìn)行截圖,獲取第一圖片,從獲取的第一圖片 中截取具有釣魚網(wǎng)頁特征的至少一個(gè)第二圖片,并將第二圖片添加到圖片規(guī)則庫中作為樣 本集。
[0037] 具體地,規(guī)則添加人員在截圖工具的URL輸入框中輸入已知釣魚網(wǎng)頁的URL,然后 點(diǎn)擊獲取快照按鈕對(duì)多個(gè)已知釣魚網(wǎng)頁進(jìn)行截圖,獲取第一圖片,截圖完成后,將獲取的第 一圖片展示給規(guī)則添加人員,由規(guī)則添加人員利用鼠標(biāo)從獲取的第一圖片中截取具有釣魚 網(wǎng)頁特征的至少一個(gè)第二圖片,并將第二圖片添加到圖片規(guī)則庫中作為樣本集,其中,第二 圖片的尺寸小于或等于第一圖片的尺寸。
[0038] (2)對(duì)樣本集包含的第二圖片進(jìn)行分類,對(duì)分類后的樣本集進(jìn)行分類學(xué)習(xí)得到各 個(gè)類別對(duì)應(yīng)的圖片特征庫。
[0039] 具體地,根據(jù)網(wǎng)站類型對(duì)樣本集包含的第二圖片進(jìn)行分類,例如按照仿冒淘寶、仿 冒QQ登錄、仿冒六合彩的分類方法對(duì)樣本集包含的第二圖片進(jìn)行分類,然后利用分類學(xué)習(xí) 算法對(duì)分類后的樣本集進(jìn)行分類學(xué)習(xí)例如學(xué)習(xí)各個(gè)類別對(duì)應(yīng)的圖片的特征,分類學(xué)習(xí)結(jié)束 后得到各個(gè)類別對(duì)應(yīng)的圖片特征庫。
[0040] (3)對(duì)后續(xù)獲取的已知釣魚網(wǎng)頁進(jìn)行截圖,獲取第一圖片,從獲取的第一圖片中截 取具有釣魚網(wǎng)頁特征的至少一個(gè)第四圖片,提取該第四圖片的特征。
[0041] 其中,截取第四圖片的方法與本方法中截取第二圖片的方法類似,在此不再贅述。 在獲得第四圖片之后,利用視覺特征抽取算法抽取第四圖片的特征。
[0042] (4)將第四圖片的特征與各個(gè)類別對(duì)應(yīng)的圖片特征庫進(jìn)行匹配,若第四圖片的特 征與一類別對(duì)應(yīng)的圖片特征庫匹配,則將第四圖片作為第二圖片添加到圖片規(guī)則庫中,并 將第四圖片歸類與所匹配的類別。
[0043] 上述方法一得到的圖片規(guī)則庫包含來自大量已知釣魚網(wǎng)頁的第二圖片,并未對(duì)這 些第二圖片進(jìn)行分類;而上述方法二通過分類學(xué)習(xí)的方法,能夠?qū)碜源罅恳阎烎~網(wǎng)頁 的第二圖片進(jìn)行分類,基于這種做好分類的圖片規(guī)則庫,能夠?qū)ψR(shí)別出的釣魚網(wǎng)頁進(jìn)行精 確分類。
[0044] 基于上述建立的圖片規(guī)則庫,進(jìn)一步介紹檢測(cè)釣魚網(wǎng)頁的具體方法。
[0045] 可選地,本發(fā)明的檢測(cè)釣魚網(wǎng)頁的方法是在后臺(tái)服務(wù)器執(zhí)行的,所建立的圖片規(guī) 則庫可以存儲(chǔ)在后臺(tái)服務(wù)器端。但本發(fā)明并不局限于此,所建立的圖片規(guī)則庫也可存儲(chǔ)在 本地客戶端,即后臺(tái)服務(wù)器將建立的圖片規(guī)則庫同步給本地客戶端,并定時(shí)對(duì)本地客戶端 的圖片規(guī)則庫進(jìn)行更新,由本地客戶端執(zhí)行本發(fā)明的檢測(cè)釣魚網(wǎng)頁的方法。本發(fā)明的檢測(cè) 釣魚網(wǎng)頁的方法優(yōu)選地在后臺(tái)服務(wù)器執(zhí)行。
[0046] 可選地,后臺(tái)服務(wù)器的圖片規(guī)則庫不僅包含第一圖片、第二圖片(例如以二進(jìn)制 數(shù)據(jù)的形式存儲(chǔ)在數(shù)據(jù)庫中),還可包含已知釣魚網(wǎng)頁的URL以及對(duì)網(wǎng)頁的處理規(guī)則等其 他信息。其中,從已知釣魚網(wǎng)頁的截圖獲取的第一圖片是第二圖片的來源,可用于判斷第二 圖片是否有效即第二圖片是否包含足夠的釣魚網(wǎng)頁的特征,在第二圖片不足以用于判斷某 網(wǎng)頁是否為釣魚網(wǎng)頁的情況下,可從保存的第一圖片中重新截取第二圖片。此外,可通過 判斷某網(wǎng)頁的URL是否為圖片規(guī)則庫中的已知釣魚網(wǎng)頁的URL來判斷該網(wǎng)頁是否為釣魚 網(wǎng)頁。對(duì)網(wǎng)頁的處理規(guī)則能夠告知用戶訪問的網(wǎng)頁是否為惡意網(wǎng)頁,并在判定某網(wǎng)頁為釣 魚網(wǎng)頁時(shí)向用戶展示所訪問的網(wǎng)頁的URL提醒用戶,例如通過彈出窗口以該網(wǎng)頁的URL為 XXX,其是危險(xiǎn)網(wǎng)頁的形式來提醒用戶,并將URL發(fā)送至URL處理服務(wù)器。此外還可向用戶 展示網(wǎng)頁的HOST(域名),本發(fā)明對(duì)比不做限制,本領(lǐng)域技術(shù)人員可以根據(jù)實(shí)際需要進(jìn)行設(shè) 置。
[0047] 本發(fā)明實(shí)施例還提供有H0ST\URL處理服務(wù)器:可以存儲(chǔ)通過本發(fā)明所提供的方 法所發(fā)現(xiàn)的釣魚網(wǎng)頁的HOST和URL ;也可以接收惡意網(wǎng)址云引擎的反饋;還可以調(diào)度全網(wǎng) 支持服務(wù)器集群的抓取。
[0048] 圖1示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的基于圖片匹配檢測(cè)釣魚網(wǎng)頁的方法的流程 圖。如圖1所示,該方法包括以下步驟:
[0049] 步驟S100,對(duì)瀏覽器打開的網(wǎng)頁進(jìn)行截圖,獲取第三圖片。
[0050] 瀏覽器打開的網(wǎng)頁指用戶通過客戶端的瀏覽器打開的網(wǎng)頁,其中客戶端可以為計(jì) 算機(jī)、移動(dòng)終端、平板設(shè)備等,本發(fā)明對(duì)此不做限制。若本實(shí)施例的方法在后臺(tái)服務(wù)器側(cè)執(zhí) 行,那么則由服務(wù)器獲取到瀏覽器打開的網(wǎng)頁的URL或MHT文件之后,根據(jù)URL或MHT文件 在服務(wù)器側(cè)顯示對(duì)應(yīng)的網(wǎng)頁并進(jìn)行截圖,獲取第三圖片,其中第三圖片的內(nèi)容與用戶在客 戶端通過瀏覽器打開的網(wǎng)頁的內(nèi)容相同。若本實(shí)施例的方法在本地客戶端側(cè)執(zhí)行,那么由 本地客戶端對(duì)瀏覽器打開的網(wǎng)頁進(jìn)行截圖,獲取第三圖片。
[0051] 步驟S110,計(jì)算第三圖片與圖片規(guī)則庫中所有第一圖片的相似度。
[0052] 相似度用于表示兩個(gè)圖片的相似程度。該步驟通過計(jì)算第三圖片與圖片規(guī)則庫中 所有第一圖片的相似度,可以知道第三圖片與圖片規(guī)則庫中的每個(gè)第一圖片的相似程度, 從而作為后續(xù)選取哪些第一圖片以進(jìn)行匹配的依據(jù)。
[0053] 步驟S120,根據(jù)相似度對(duì)圖片規(guī)則庫中的所有第一圖片進(jìn)行排序,按照排序后的 順序選取多個(gè)第一圖片,選取的第一圖片的數(shù)量小于圖片規(guī)則庫中第一圖片的總數(shù)量。
[0054] 可選地,可根據(jù)相似度由高至低的順序?qū)D片規(guī)則庫中所有第一圖片進(jìn)行排序, 選取一部分與第三圖片相似度很高的第一圖片。
[0055] 步驟S130,將第三圖片與選取的第一圖片對(duì)應(yīng)的第二圖片進(jìn)行匹配,若選取的第 一圖片對(duì)應(yīng)的第二圖片中的至少一個(gè)與第三圖片匹配,則確定網(wǎng)頁為可疑的釣魚網(wǎng)頁。
[0056] 由于圖片規(guī)則庫中所包含的第二圖片是在已知的釣魚網(wǎng)頁的截圖即第一圖片中 截取的具有釣魚網(wǎng)頁特征的圖片,因此將第三圖片與圖片規(guī)則庫所包含的多個(gè)第二圖片進(jìn) 行匹配即是判定第三圖片是否具有釣魚網(wǎng)頁特征,若圖片規(guī)則庫內(nèi)存在與第三圖片匹配的 第二圖片,則表示第三圖片具有釣魚網(wǎng)頁特征,能夠確定網(wǎng)頁為可疑的釣魚網(wǎng)頁。
[0057] 根據(jù)本發(fā)明上述實(shí)施例提供的方法,該方法的執(zhí)行基于預(yù)先建立的包含多個(gè)第一 圖片和第二圖片的圖片規(guī)則庫,第一圖片是已知釣魚網(wǎng)頁的截圖,第二圖片是在第一圖片 中所截取的具有釣魚網(wǎng)頁特征的圖片。通過計(jì)算第三圖片與圖片規(guī)則庫中所有第一圖片的 相似度,根據(jù)相似度對(duì)圖片規(guī)則庫中的所有第一圖片進(jìn)行排序,按照排序后的順序選取多 個(gè)第一圖片,選取的第一圖片的數(shù)量小于圖片規(guī)則庫中第一圖片的總數(shù)量,通過對(duì)第一圖 片進(jìn)行篩選,減少了后續(xù)匹配過程中將第三圖片與第二圖片匹配的計(jì)算量,加快了釣魚網(wǎng) 頁的檢測(cè)速度,降低了資源占用率;此外,由于第二圖片具有釣魚網(wǎng)頁特征,因此在圖片規(guī) 則庫內(nèi)存在與第三圖片匹配的第二圖片的情況下,第三圖片也具有釣魚網(wǎng)頁的特征,基于 此能夠快速并準(zhǔn)確的判斷網(wǎng)頁為可疑的釣魚網(wǎng)頁。
[0058] 圖2示出了根據(jù)本發(fā)明另一個(gè)實(shí)施例的基于圖片匹配檢測(cè)釣魚網(wǎng)頁的方法的流 程圖。如圖2所示,該方法包括以下步驟:
[0059] 步驟S200,對(duì)瀏覽器打開的網(wǎng)頁進(jìn)行截圖,獲取第三圖片。
[0060] 瀏覽器打開的網(wǎng)頁指用戶通過客戶端的瀏覽器打開的網(wǎng)頁。在本實(shí)施例中,以服 務(wù)器側(cè)獲取第三圖片(即本實(shí)施例的方法由服務(wù)器側(cè)執(zhí)行)為例,說明如何獲取第三圖片。
[0061] 在本實(shí)施例中主要通過兩種方法獲取第三圖片,但并不限于此,本領(lǐng)域技術(shù)人員 可以根據(jù)實(shí)際情況選用合適的方法獲取第三圖片。
[0062] 具體地,針對(duì)獲取第三圖片的兩種方法進(jìn)行詳細(xì)描述:
[0063] 圖3示出了根據(jù)本發(fā)明另一個(gè)實(shí)施例的獲取第三圖片的一種方法的流程圖。在本 方法中,執(zhí)行主體是安裝有chrome瀏覽器的服務(wù)器,該服務(wù)器封裝有對(duì)應(yīng)的接口,可選為 阿帕奇接口,這里將封裝有阿帕奇接口的該服務(wù)器稱為阿帕奇服務(wù)器,以阿帕奇服務(wù)器為 例進(jìn)行說明。
[0064] 如圖3所示,該方法包括如下步驟:
[0065] 步驟300,通過服務(wù)器接收用戶訪問的網(wǎng)頁的URL。
[0066] 具體地,可以通過阿帕奇服務(wù)器接收用戶訪問的網(wǎng)頁的URL。阿帕奇服務(wù)器的主要 特征是:可以運(yùn)行在所有計(jì)算機(jī)平臺(tái);支持最新的HTTP 1. 1協(xié)議;簡(jiǎn)單而強(qiáng)有力的基于文 件的配置;支持通用網(wǎng)關(guān)接口 CGI ;支持虛擬主機(jī);支持HTTP認(rèn)證;集成Perl腳本編程語 言;集成的代理服務(wù)器;具有可定制的服務(wù)器日志;支持服務(wù)器端包含命令(SSI);支持安 全Socket層(SSL);用戶會(huì)話過程的跟蹤能力;支持FastCGI ;支持Java Servlets。
[0067] 步驟310,調(diào)用chrome瀏覽器打開URL對(duì)應(yīng)的網(wǎng)頁。
[0068] 在阿帕奇服務(wù)器中安裝有CGI程序,該CGI程序內(nèi)具有第三方工具,第三方工具支 持若干API,通過這些API可將URL嵌入給chrome瀏覽器。具體來說,在通過阿帕奇服務(wù)器 接收到客戶端發(fā)送的用戶訪問的網(wǎng)頁的URL之后,通過阿帕奇服務(wù)器將URL嵌入到CGI程 序,然后通過CGI程序內(nèi)的第三方工具提供的API將URL嵌入到chrome瀏覽器,調(diào)用chrome 瀏覽器并啟用chrome瀏覽器的debug模式,向處于debug模式下的chrome瀏覽器嵌入獲 取URL命令以及截圖命令,chrome瀏覽器在接收到獲取URL的命令之后,打開該URL對(duì)應(yīng) 的網(wǎng)頁。
[0069] 步驟320,執(zhí)行截圖命令,對(duì)URL對(duì)應(yīng)的網(wǎng)頁進(jìn)行截圖,獲取第三圖片。
[0070] 具體地,chrome瀏覽器在接收到截圖命令后,對(duì)URL對(duì)應(yīng)的網(wǎng)頁進(jìn)行截圖,并將截 取的第三圖片保存在阿帕奇服務(wù)器指定的文件夾內(nèi),本發(fā)明實(shí)施例對(duì)應(yīng)的裝置在收到阿帕 奇服務(wù)器發(fā)送的圖片保存地址后從阿帕奇服務(wù)器獲取第三圖片。
[0071] 上述方法由于需要在阿帕奇服務(wù)器處利用chrome瀏覽器再次打開網(wǎng)頁,即阿帕 奇服務(wù)器需要再次訪問網(wǎng)頁服務(wù)器獲取網(wǎng)頁內(nèi)容,因此獲取速度比較慢,但該方法通過獲 取用戶訪問的網(wǎng)頁的URL,并利用chrome瀏覽器打開獲取的URL,服務(wù)器端的chrome瀏覽 器打開的網(wǎng)頁與用戶通過客戶端的瀏覽器打開的網(wǎng)頁相同,可以精確的截圖,具有準(zhǔn)確性 1?的優(yōu)點(diǎn)。
[0072] 圖4示出了根據(jù)本發(fā)明另一個(gè)實(shí)施例的獲取第三圖片的另一種方法的流程圖。在 本方法中,執(zhí)行主體是安裝有IE瀏覽器的服務(wù)器,這里將其稱為IE機(jī)器。
[0073] 如圖4所示,該方法包括如下步驟:
[0074] 步驟400,遠(yuǎn)程調(diào)用IE機(jī)器接收用戶訪問的網(wǎng)頁的MHT文件的地址。
[0075] 具體地,ΜΗΤ是網(wǎng)頁歸檔(英語:MIME HTML或MIME Encapsulation of Aggregate HTML Documents,又稱單一文件網(wǎng)頁或網(wǎng)頁封存盤案)為一多用途互聯(lián)網(wǎng)郵件擴(kuò)展格式,將 一個(gè)多附件網(wǎng)頁(如包含大量圖片、Flash動(dòng)畫、Java小程序的網(wǎng)頁)存儲(chǔ)為單一文件,可 用于發(fā)送HTML電子郵件,此單一文件即稱為一網(wǎng)頁封存盤案。MHT文件保存在服務(wù)器指定 目錄下。IE機(jī)器向服務(wù)器發(fā)送獲取MHT文件的地址的命令,服務(wù)器在收到命令后將MHT文 件的地址發(fā)送給IE機(jī)器。
[0076] 步驟410,通過將MHT文件的地址嵌入到IE瀏覽器,打開MHT文件對(duì)應(yīng)的網(wǎng)頁。
[0077] 具體地,IE機(jī)器將接收的MHT文件的地址嵌入到IE瀏覽器,利用IE瀏覽器打開 MHT文件對(duì)應(yīng)的網(wǎng)頁。
[0078] 步驟420,執(zhí)行截圖命令,對(duì)MHT文件對(duì)應(yīng)的網(wǎng)頁進(jìn)行截圖,獲取第三圖片。
[0079] 上述方法的優(yōu)點(diǎn)是,IE機(jī)器無需再次訪問網(wǎng)站服務(wù)器獲取網(wǎng)頁內(nèi)容,而是通過 MHT文件即可重新打開網(wǎng)頁,因此獲取第三圖片的速度更快,從而使得釣魚網(wǎng)頁檢測(cè)速度更 快。
[0080] 步驟S210,對(duì)圖片規(guī)則庫中的所有第一圖片的特征點(diǎn)進(jìn)行消重處理。
[0081] 由于圖片規(guī)則庫中第一圖片可能會(huì)包含相同部分,例如多個(gè)第一圖片中都包含淘 寶釣魚特征,因此需要對(duì)這些包含相同部分的圖片進(jìn)行消重處理。
[0082] 消重處理是指在統(tǒng)計(jì)圖片規(guī)則庫中的所有第一圖片的特征點(diǎn)時(shí),對(duì)重復(fù)的特征點(diǎn) 進(jìn)行處理,將相同的特征點(diǎn)只計(jì)算一次。舉例說明,圖片A、B、C的特征點(diǎn)個(gè)數(shù)分別為5000、 7000、8000,其中,圖片A、B、C相同的特征點(diǎn)個(gè)數(shù)為2000,在統(tǒng)計(jì)圖片A、B、C的全部特征點(diǎn) 個(gè)數(shù)時(shí),對(duì)圖片A、B、C的特征點(diǎn)進(jìn)行消重處理,即圖片A、B、C相同的特征點(diǎn)個(gè)數(shù)為2000在 統(tǒng)計(jì)時(shí)只計(jì)算一次,得到圖片A、B、C的特征點(diǎn)個(gè)數(shù)為16000。這里的特征點(diǎn)是包含坐標(biāo)信 息及其他屬性信息的點(diǎn)。
[0083] 對(duì)圖片規(guī)則庫中的所有第一圖片的特征點(diǎn)進(jìn)行消重處理可以提高后續(xù)聚類處理 時(shí)的準(zhǔn)確度。
[0084] 步驟S220,對(duì)第三圖片和圖片規(guī)則庫中的所有第一圖片進(jìn)行聚類處理。
[0085] 聚類處理是指從圖片的特征點(diǎn)中選出K個(gè)特征點(diǎn)作為質(zhì)心,然后對(duì)圖片中其他的 特征點(diǎn)進(jìn)行分類,從而將圖片的特征點(diǎn)通過處理分成K組,每組都包含一定數(shù)量的特征點(diǎn), 且每組中的特征點(diǎn)相似性較高,用處理后K組特征點(diǎn)的質(zhì)心表示圖片的原有特征點(diǎn)。舉例 說明,圖片A有8000個(gè)特征點(diǎn),通過聚類處理后,圖片A的特征點(diǎn)個(gè)數(shù)降為1000個(gè)。
[0086] 具體地,對(duì)第三圖片和圖片規(guī)則庫中所有第一圖片的特征點(diǎn)進(jìn)行聚類處理。其中, 本發(fā)明可采用K-means算法對(duì)第三圖片和圖片規(guī)則庫中的所有第一圖片的特征點(diǎn)進(jìn)行聚 類處理,用向量特征表示處理后的特征點(diǎn)。本領(lǐng)域技術(shù)人員還可根據(jù)實(shí)際應(yīng)用的需要采用 其他聚類處理算法對(duì)圖片的特征點(diǎn)進(jìn)行聚類處理,在此不做具體限定。對(duì)第三圖片和圖片 規(guī)則庫中所有第一圖片的特征點(diǎn)進(jìn)行聚類處理,降低了在后續(xù)計(jì)算相似度時(shí)的運(yùn)算量。 [0087] 步驟S230,獲取聚類處理后第三圖片和圖片規(guī)則庫中第一圖片的特征點(diǎn)。
[0088] 由于步驟S220中對(duì)第三圖片和圖片規(guī)則庫中第一圖片的特征點(diǎn)進(jìn)行了聚類處 理,將第三圖片和圖片規(guī)則中第一圖片的特征點(diǎn)分成K組,因此可用K組特征點(diǎn)的質(zhì)心來表 示聚類處理后第三圖片和圖片規(guī)則中第一圖片的特征點(diǎn),這里獲取聚類處理后第三圖片和 圖片規(guī)則庫中第一圖片的特征點(diǎn)即為獲取K組特征點(diǎn)的質(zhì)心。
[0089] 步驟S240,根據(jù)聚類處理后第三圖片和圖片規(guī)則庫中第一圖片的特征點(diǎn)計(jì)算特征 點(diǎn)相似度。
[0090] 由于通過向量來表示第三圖片和圖片規(guī)則庫中第一圖片的特征點(diǎn),因此可以通過 計(jì)算兩個(gè)向量之間的夾角來計(jì)算特征點(diǎn)相似度。本領(lǐng)域技術(shù)人員可以根據(jù)實(shí)際應(yīng)用選擇合 適的計(jì)算方法來計(jì)算第三圖片和圖片規(guī)則庫中第一圖片的特征點(diǎn)相似度,在此不做具體限 定。
[0091] 步驟S250,根據(jù)相似度對(duì)圖片規(guī)則庫中的所有第一圖片進(jìn)行排序,按照排序后的 順序選取多個(gè)第一圖片,選取的第一圖片的數(shù)量小于圖片規(guī)則庫中第一圖片的總數(shù)量。
[0092] 在本實(shí)施例中,主要通過兩種方法選取多個(gè)第一圖片,但并不限于此,本領(lǐng)域技術(shù) 人員可以根據(jù)實(shí)際情況選用合適的方法獲取多個(gè)第一圖片。
[0093] 具體地,針對(duì)獲取第三圖片的兩種方法進(jìn)行詳細(xì)描述:
[0094] 方法一:根據(jù)相似度由高至低的順序?qū)D片規(guī)則庫中的第一圖片進(jìn)行排序,選取 相似度大于第一預(yù)定值的多個(gè)第一圖片。
[0095] 在根據(jù)聚類處理后第三圖片和圖片規(guī)則庫中第一圖片的特征點(diǎn)計(jì)算特征相似度 之后,可以得到一個(gè)相似度值,根據(jù)相似度值由高至低的順序?qū)D片規(guī)則庫中的第一圖片 進(jìn)行排序,選取相似度大于第一預(yù)定值例如〇. 95的第一圖片。
[0096] 方法二:根據(jù)相似度由高至低的順序?qū)D片規(guī)則庫中的第一圖片進(jìn)行排序,選取 數(shù)量為第二預(yù)定值的多個(gè)第一圖片。
[0097] 在根據(jù)聚類處理后第三圖片和圖片規(guī)則庫中第一圖片的特征點(diǎn)計(jì)算特征相似度 之后,可以得到一個(gè)相似度值,根據(jù)相似度值由高至低的順序?qū)D片規(guī)則庫中的第一圖片 進(jìn)行排序,選取數(shù)量為第二預(yù)定值例如3個(gè)的第一圖片。本領(lǐng)域技術(shù)人員根據(jù)實(shí)際需要可 以合理設(shè)置第二預(yù)定值的數(shù)值,在此不做具體限定。
[0098] 通過選取多個(gè)第一圖片,第三圖片不再與圖片規(guī)則庫內(nèi)的所有第二圖片進(jìn)行匹 配,僅需與所選取的多個(gè)第一圖片對(duì)應(yīng)的第二圖片進(jìn)行匹配即可,這樣減少了后續(xù)匹配過 程中將第三圖片與第二圖片匹配的計(jì)算量;而且由于多個(gè)第一圖片是憑借與第三圖片的相 似度來選取的,所篩選的第一圖片與第三圖片的相似度很高,能夠保證后續(xù)匹配的準(zhǔn)確性。 [0099] 步驟S260,分別抽取第三圖片與圖片規(guī)則庫所包含的多個(gè)第一圖片的特征。
[0100] 利用特征抽取算法抽取第三圖片與圖片規(guī)則庫所包含的多個(gè)第一圖片的特征。例 如,利用0RB(0Riented Brief)特征抽取算法對(duì)第三圖片與圖片規(guī)則庫所包含的多個(gè)第一 圖片進(jìn)行0RB特征抽取,并提取出特征數(shù)據(jù),其中,0RB特征提取指的是使用計(jì)算機(jī)抽取圖 像信息,決定每個(gè)圖像的點(diǎn)是否屬于一個(gè)特征點(diǎn),0RB特抽取的結(jié)果是將特征點(diǎn)的特征數(shù)據(jù) 提取出來。
[0101] 步驟S270,判斷第三圖片的特征是否與選取的第一圖片對(duì)應(yīng)的第二圖片的特征進(jìn) 行匹配,若是則執(zhí)行步驟S280 ;若否則方法結(jié)束。
[0102] 由于圖片規(guī)則庫中所包含的第二圖片是在已知的釣魚網(wǎng)頁的截圖中截取的具有 釣魚網(wǎng)頁特征的圖片,因此判斷第三圖片特征是否與圖片規(guī)則庫所包含的任一第二圖片的 特征匹配即是判定第三圖片是否具有釣魚網(wǎng)頁特征。
[0103] 具體地,查找第三圖片的特征與圖片規(guī)則庫所包含的多個(gè)第二圖片的特征匹配的 鄰近特征點(diǎn),判斷鄰近特征點(diǎn)個(gè)數(shù)與第二閾值的關(guān)系,若鄰近特征點(diǎn)個(gè)數(shù)大于第二閾值則 第三圖片的特征與圖片規(guī)則庫所包含的任一第二圖片的特征匹配??蛇x地,將第三圖片的 特征與圖片規(guī)則庫所包含的任一第二圖片的特征用kd-tree數(shù)據(jù)結(jié)構(gòu)表示,利用kd-tree 算法與K最鄰近結(jié)點(diǎn)算法查找第三圖片的特征與圖片規(guī)則庫所包含的多個(gè)第二圖片的特 征匹配的鄰近特征點(diǎn),若鄰近特征點(diǎn)個(gè)數(shù)大于29 (第二閾值)則第三圖片的特征與圖片規(guī) 則庫所包含的任一第二圖片的特征匹配。
[0104] 步驟S280,確定網(wǎng)頁為可疑的釣魚網(wǎng)頁。
[0105] 步驟S290,采用基于URL和/或IP和/或網(wǎng)頁內(nèi)容進(jìn)行識(shí)別的方法對(duì)網(wǎng)頁進(jìn)行識(shí) 另|J,確定網(wǎng)頁是否為釣魚網(wǎng)頁。
[0106] 通過上述步驟S200-步驟S280得到網(wǎng)頁為可疑的釣魚網(wǎng)頁,可將上述方法與基于 URL和/或IP和/或網(wǎng)頁內(nèi)容進(jìn)行識(shí)別的方法結(jié)合起來確定網(wǎng)頁是否為釣魚網(wǎng)頁,從而可 以降低誤判率。
[0107] 具體地,可以通過判斷用戶訪問的網(wǎng)頁的URL是否屬于本地黑/白名單來判定用 戶訪問的網(wǎng)頁是否為釣魚網(wǎng)頁,若用戶訪問的網(wǎng)頁的URL屬于本地黑名單則確定網(wǎng)頁為釣 魚網(wǎng)頁。
[0108] 還可以通過判斷用戶訪問的網(wǎng)頁的URL是否屬于高危域名或高危IP來判定用戶 訪問的網(wǎng)頁是否為釣魚網(wǎng)頁,若用戶訪問的網(wǎng)頁的URL屬于高危域名或高危IP則確定網(wǎng)頁 為釣魚網(wǎng)頁。
[0109] 還可以通過基于網(wǎng)頁內(nèi)容識(shí)別方法進(jìn)行判斷,具體可以采用以下兩種方法:
[0110] 方法一:在訪問網(wǎng)頁加載完成后,提取網(wǎng)頁的多個(gè)內(nèi)容片段,獲取每個(gè)內(nèi)容片段對(duì) 應(yīng)的特征ID,其中內(nèi)容片段與特征ID唯一對(duì)應(yīng);將多個(gè)內(nèi)容片段對(duì)應(yīng)的特征ID與特征庫 中的特征ID進(jìn)行匹配,其中,特征庫由服務(wù)器生成,是大量的釣魚網(wǎng)頁中的惡意內(nèi)容片段 對(duì)應(yīng)的特征ID的集合;若多個(gè)內(nèi)容片段對(duì)應(yīng)的特征ID中具有與特征庫中的特征ID匹配的 至少一個(gè)特征ID,則根據(jù)網(wǎng)頁的信息,計(jì)算網(wǎng)頁的評(píng)估分;根據(jù)網(wǎng)頁的評(píng)估分與設(shè)定閾值 的比較結(jié)果,確定網(wǎng)頁是否為釣魚網(wǎng)頁。
[0111] 方法二:在瀏覽器的網(wǎng)頁事件加載完成后,提取網(wǎng)頁的多個(gè)內(nèi)容片段,獲取每個(gè)內(nèi) 容片段對(duì)應(yīng)的特征ID,其中內(nèi)容片段與特征ID唯一對(duì)應(yīng);將多個(gè)內(nèi)容片段對(duì)應(yīng)的特征ID 與特征庫中的特征ID進(jìn)行匹配,其中,特征庫由服務(wù)器生成,是大量的釣魚網(wǎng)頁中的惡意 內(nèi)容片段對(duì)應(yīng)的特征ID的集合;若多個(gè)內(nèi)容片段對(duì)應(yīng)的特征ID中具有與特征庫中的特征 ID匹配的至少一個(gè)特征ID,則將該匹配的至少一個(gè)特征ID進(jìn)行組合計(jì)算得到至少一個(gè)模 板ID,將至少一個(gè)模板ID與釣魚網(wǎng)頁識(shí)別庫中的模板ID進(jìn)行匹配,其中,模板ID可以是通 過特定的快速哈希算法生成的定長(zhǎng)的二進(jìn)制數(shù)據(jù),例如,通過MD5算法生成的64位的二進(jìn) 制串。與特征ID類似地,不同特征ID按照相同的順序組合,按照相同的算法計(jì)算得到的模 板ID是唯一的并且是不可逆的;若至少一個(gè)模板ID中具有與釣魚網(wǎng)頁識(shí)別庫中的模板ID 匹配的模板ID,則確定網(wǎng)頁為釣魚網(wǎng)頁。
[0112] 根據(jù)本發(fā)明上述實(shí)施例提供的方法,該方法的執(zhí)行基于預(yù)先建立的包含多個(gè)第一 圖片和第二圖片的圖片規(guī)則庫,第一圖片是已知釣魚網(wǎng)頁的截圖,第二圖片是在第一圖片 中所截取的具有釣魚網(wǎng)頁特征的圖片。對(duì)圖片規(guī)則庫中的所有第一圖片的特征點(diǎn)進(jìn)行消重 處理可以提高后續(xù)聚類處理時(shí)的準(zhǔn)確度。對(duì)第三圖片和圖片規(guī)則庫中所有第一圖片的特征 點(diǎn)進(jìn)行聚類處理,降低了在后續(xù)計(jì)算相似度時(shí)的運(yùn)算量。通過計(jì)算第三圖片與圖片規(guī)則庫 中所有第一圖片的相似度,根據(jù)相似度對(duì)圖片規(guī)則庫中的所有第一圖片進(jìn)行排序,按照排 序后的順序選取多個(gè)第一圖片,選取的第一圖片的數(shù)量小于圖片規(guī)則庫中第一圖片的總數(shù) 量,通過對(duì)第一圖片進(jìn)行篩選,減少了后續(xù)匹配過程中將第三圖片與第二圖片匹配的計(jì)算 量,加快了釣魚網(wǎng)頁的檢測(cè)速度,降低了資源占用率;此外,由于第二圖片具有釣魚網(wǎng)頁特 征,因此在圖片規(guī)則庫內(nèi)存在與第三圖片匹配的第二圖片的情況下,第三圖片也具有釣魚 網(wǎng)頁的特征,基于此能夠快速并準(zhǔn)確的判斷網(wǎng)頁為可疑的釣魚網(wǎng)頁。在建立圖片規(guī)則庫時(shí) 對(duì)圖片進(jìn)行了分類,因此當(dāng)某網(wǎng)頁為釣魚網(wǎng)頁時(shí)可以根據(jù)圖片規(guī)則庫中的圖片進(jìn)行自動(dòng)識(shí) 別并將網(wǎng)頁進(jìn)行歸類。結(jié)合圖片特征匹配與URL和/或IP和/或網(wǎng)頁內(nèi)容進(jìn)行識(shí)別的方 法對(duì)網(wǎng)頁進(jìn)行識(shí)別,降低了對(duì)網(wǎng)頁的誤判率。
[0113] 圖5示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的基于圖片匹配檢測(cè)釣魚網(wǎng)頁的裝置的結(jié)構(gòu) 框圖。如圖5所示,該裝置包括:圖片規(guī)則庫500、獲取模塊510、相似度計(jì)算模塊520、選取 模塊530、匹配模塊540。
[0114] 圖片規(guī)則庫500,圖片規(guī)則庫包含多個(gè)第一圖片和第二圖片的圖片規(guī)則庫,第一圖 片是已知釣魚網(wǎng)頁的截圖,第二圖片是在第一圖片中所截取的具有釣魚網(wǎng)頁特征的圖片。
[0115] 獲取模塊510,適于對(duì)瀏覽器打開的網(wǎng)頁進(jìn)行截圖,獲取第三圖片。
[0116] 相似度計(jì)算模塊520,適于計(jì)算第三圖片與圖片規(guī)則庫中所有第一圖片的相似度。
[0117] 相似度用于表示兩個(gè)圖片的相似程度。該步驟通過計(jì)算第三圖片與圖片規(guī)則庫中 所有第一圖片的相似度,可以知道第三圖片與圖片規(guī)則庫中的每個(gè)第一圖片的相似程度, 從而作為后續(xù)選取哪些第一圖片以進(jìn)行匹配的依據(jù)。
[0118] 選取模塊530,適于根據(jù)相似度對(duì)圖片規(guī)則庫中的所有第一圖片進(jìn)行排序,按照排 序后的順序選取多個(gè)第一圖片,選取的第一圖片的數(shù)量小于圖片規(guī)則庫中第一圖片的總數(shù) 量。
[0119] 匹配模塊540,適于將第三圖片與選取的第一圖片對(duì)應(yīng)的第二圖片進(jìn)行匹配,若選 取的第一圖片對(duì)應(yīng)的第二圖片中的至少一個(gè)與第三圖片匹配,則確定網(wǎng)頁為可疑的釣魚網(wǎng) 頁。
[0120] 由于圖片規(guī)則庫中所包含的第二圖片是在已知的釣魚網(wǎng)頁的截圖即第一圖片中 截取的具有釣魚網(wǎng)頁特征的圖片,因此將第三圖片與圖片規(guī)則庫所包含的多個(gè)第二圖片進(jìn) 行匹配即是判定第三圖片是否具有釣魚網(wǎng)頁特征,若圖片規(guī)則庫內(nèi)存在與第三圖片匹配的 第二圖片,則表示第三圖片具有釣魚網(wǎng)頁特征,能夠確定網(wǎng)頁為可疑的釣魚網(wǎng)頁。
[0121] 根據(jù)本發(fā)明上述實(shí)施例提供的裝置,該裝置的執(zhí)行基于預(yù)先建立的包含多個(gè)第一 圖片和第二圖片的圖片規(guī)則庫,第一圖片是已知釣魚網(wǎng)頁的截圖,第二圖片是在第一圖片 中所截取的具有釣魚網(wǎng)頁特征的圖片。通過計(jì)算第三圖片與圖片規(guī)則庫中所有第一圖片的 相似度,根據(jù)相似度對(duì)圖片規(guī)則庫中的所有第一圖片進(jìn)行排序,按照排序后的順序選取多 個(gè)第一圖片,選取的第一圖片的數(shù)量小于圖片規(guī)則庫中第一圖片的總數(shù)量,通過對(duì)第一圖 片進(jìn)行篩選,減少了后續(xù)匹配過程中將第三圖片與第二圖片匹配的計(jì)算量,加快了釣魚網(wǎng) 頁的檢測(cè)速度,降低了資源占用率;此外,由于第二圖片具有釣魚網(wǎng)頁特征,因此在圖片規(guī) 則庫內(nèi)存在與第三圖片匹配的第二圖片的情況下,第三圖片也具有釣魚網(wǎng)頁的特征,基于 此能夠快速并準(zhǔn)確的判斷網(wǎng)頁為可疑的釣魚網(wǎng)頁。
[0122] 圖6示出了根據(jù)本發(fā)明另一個(gè)實(shí)施例的基于圖片匹配檢測(cè)釣魚網(wǎng)頁的裝置的結(jié) 構(gòu)框圖。如圖6所示,該裝置包括:圖片規(guī)則庫600、獲取模塊610、消重處理模塊620、相似 度計(jì)算模塊630、選取模塊640、匹配模塊650。
[0123] 圖片規(guī)則庫600,圖片規(guī)則庫包含多個(gè)第一圖片和第二圖片的圖片規(guī)則庫,第一圖 片是已知釣魚網(wǎng)頁的截圖,第二圖片是在第一圖片中所截取的具有釣魚網(wǎng)頁特征的圖片。
[0124] 獲取模塊610,適于對(duì)瀏覽器打開的網(wǎng)頁進(jìn)行截圖,獲取第三圖片。
[0125] 獲取模塊610包括:接收單元660、調(diào)用單元670、圖片獲取單元680。
[0126] 接收單元660,適于通過服務(wù)器接收用戶訪問的網(wǎng)頁的統(tǒng)一資源定位符。
[0127] 調(diào)用單元670,適于調(diào)用chrome瀏覽器打開統(tǒng)一資源定位符對(duì)應(yīng)的網(wǎng)頁。
[0128] 圖片獲取單元680,適于執(zhí)行截圖命令,對(duì)統(tǒng)一資源定位符對(duì)應(yīng)的網(wǎng)頁進(jìn)行截圖, 獲取第三圖片。
[0129] 消重處理模塊620,適于對(duì)圖片規(guī)則庫中的所有第一圖片的特征點(diǎn)進(jìn)行消重處理。
[0130] 相似度計(jì)算模塊630,適于計(jì)算第三圖片與圖片規(guī)則庫中所有第一圖片的相似度。
[0131] 相似度用于表示兩個(gè)圖片的相似程度。該步驟通過計(jì)算第三圖片與圖片規(guī)則庫中 所有第一圖片的相似度,可以知道第三圖片與圖片規(guī)則庫中的每個(gè)第一圖片的相似程度, 從而作為后續(xù)選取哪些第一圖片以進(jìn)行匹配的依據(jù)。
[0132] 相似度計(jì)算模塊630包括:聚類處理單元690、特征點(diǎn)獲取單元700、相似度計(jì)算單 元 710。
[0133] 聚類處理單元690,適于分別對(duì)第三圖片和圖片規(guī)則庫中的所有第一圖片進(jìn)行聚 類處理。
[0134] 特征點(diǎn)獲取單元700,適于獲取聚類處理后第三圖片和圖片規(guī)則庫中第一圖片的 特征點(diǎn)。
[0135] 相似度計(jì)算單元710,適于根據(jù)聚類處理后第三圖片和圖片規(guī)則庫中第一圖片的 特征點(diǎn)計(jì)算特征點(diǎn)相似度。
[0136] 選取模塊640,適于根據(jù)相似度對(duì)圖片規(guī)則庫中的所有第一圖片進(jìn)行排序,按照排 序后的順序選取多個(gè)第一圖片,選取的第一圖片的數(shù)量小于圖片規(guī)則庫中第一圖片的總數(shù) 量。
[0137] 選取模塊640進(jìn)一步適于:根據(jù)相似度由高至低的順序?qū)D片規(guī)則庫中的第一圖 片進(jìn)行排序,選取相似度大于第一預(yù)定值的多個(gè)第一圖片。
[0138] 選取模塊640進(jìn)一步適于:根據(jù)相似度由高至低的順序?qū)D片規(guī)則庫中的第一圖 片進(jìn)行排序,選取數(shù)量為第二預(yù)定值的多個(gè)第一圖片。
[0139] 匹配模塊650,適于將第三圖片與選取的第一圖片對(duì)應(yīng)的第二圖片進(jìn)行匹配,若選 取的第一圖片對(duì)應(yīng)的第二圖片中的至少一個(gè)與第三圖片匹配,則確定網(wǎng)頁為可疑的釣魚網(wǎng) 頁。
[0140] 匹配模塊650包括:抽取單元720、匹配單元730。
[0141] 抽取單元720,適于分別抽取第三圖片與選取的第一圖片對(duì)應(yīng)的第二圖片的特征。
[0142] 匹配單元730,適于將第三圖片的特征與選取的第一圖片對(duì)應(yīng)的第二圖片的特征 進(jìn)行匹配,若第三圖片的特征與選取的第一圖片對(duì)應(yīng)的第二圖片中的任一第二圖片的特征 匹配,則確定網(wǎng)頁為可疑的釣魚網(wǎng)頁。
[0143] 匹配單元730進(jìn)一步適于:查找第三圖片的特征與選取的第一圖片對(duì)應(yīng)的第二圖 片的特征匹配的鄰近特征點(diǎn),若鄰近特征點(diǎn)個(gè)數(shù)大于第一閾值,則確定網(wǎng)頁為可疑的釣魚 網(wǎng)頁。
[0144] 該裝置還包括:釣魚網(wǎng)頁預(yù)處理模塊740,適于對(duì)多個(gè)已知釣魚網(wǎng)頁進(jìn)行截圖,獲 取第一圖片,從每個(gè)第一圖片中截取具有釣魚網(wǎng)頁特征的至少一個(gè)第二圖片,并將第二圖 片添加到圖片規(guī)則庫中,其中,第二圖片的尺寸小于或等于第一圖片的尺寸。
[0145] 釣魚網(wǎng)頁預(yù)處理模塊740具體適于對(duì)初始獲取的多個(gè)已知釣魚網(wǎng)頁進(jìn)行截圖,獲 取第一圖片,從獲取的第一圖片中截取具有釣魚網(wǎng)頁特征的至少一個(gè)第二圖片,并將第二 圖片添加到圖片規(guī)則庫中作為樣本集;
[0146] 對(duì)樣本集包含的第二圖片進(jìn)行分類,對(duì)分類后的樣本集進(jìn)行分類學(xué)習(xí)得到各個(gè)類 別對(duì)應(yīng)的圖片特征庫;
[0147] 對(duì)后續(xù)獲取的已知釣魚網(wǎng)頁進(jìn)行截圖,獲取第一圖片,從獲取的第一圖片中截取 具有釣魚網(wǎng)頁特征的至少一個(gè)第四圖片,提取該第四圖片的特征;
[0148] 將第四圖片的特征與各個(gè)類別對(duì)應(yīng)的圖片特征庫進(jìn)行匹配,若第四圖片的特征與 一類別對(duì)應(yīng)的圖片特征庫匹配,則將第四圖片作為第二圖片添加到圖片規(guī)則庫中,并將第 四圖片歸類與所匹配的類別。
[0149] 該裝置還包括:識(shí)別模塊750,適于采用基于URL和/或IP和/或網(wǎng)頁內(nèi)容進(jìn)行 識(shí)別的方法對(duì)網(wǎng)頁進(jìn)行識(shí)別,確定網(wǎng)頁是否為釣魚網(wǎng)頁。
[0150] 根據(jù)本發(fā)明上述實(shí)施例提供的裝置,該裝置的執(zhí)行基于預(yù)先建立的包含多個(gè)第一 圖片和第二圖片的圖片規(guī)則庫,第一圖片是已知釣魚網(wǎng)頁的截圖,第二圖片是在第一圖片 中所截取的具有釣魚網(wǎng)頁特征的圖片。對(duì)圖片規(guī)則庫中的所有第一圖片的特征點(diǎn)進(jìn)行消重 處理可以提高后續(xù)聚類處理時(shí)的準(zhǔn)確度。對(duì)第三圖片和圖片規(guī)則庫中所有第一圖片的特征 點(diǎn)進(jìn)行聚類處理,降低了在后續(xù)計(jì)算相似度時(shí)的運(yùn)算量。通過計(jì)算第三圖片與圖片規(guī)則庫 中所有第一圖片的相似度,根據(jù)相似度對(duì)圖片規(guī)則庫中的所有第一圖片進(jìn)行排序,按照排 序后的順序選取多個(gè)第一圖片,選取的第一圖片的數(shù)量小于圖片規(guī)則庫中第一圖片的總數(shù) 量,通過對(duì)第一圖片進(jìn)行篩選,減少了后續(xù)匹配過程中將第三圖片與第二圖片匹配的計(jì)算 量,加快了釣魚網(wǎng)頁的檢測(cè)速度,降低了資源占用率;此外,由于第二圖片具有釣魚網(wǎng)頁特 征,因此在圖片規(guī)則庫內(nèi)存在與第三圖片匹配的第二圖片的情況下,第三圖片也具有釣魚 網(wǎng)頁的特征,基于此能夠快速并準(zhǔn)確的判斷網(wǎng)頁為可疑的釣魚網(wǎng)頁。在建立圖片規(guī)則庫時(shí) 對(duì)圖片進(jìn)行了分類,因此當(dāng)某網(wǎng)頁為釣魚網(wǎng)頁時(shí)可以根據(jù)圖片規(guī)則庫中的圖片進(jìn)行自動(dòng)識(shí) 別并將網(wǎng)頁進(jìn)行歸類。結(jié)合圖片特征匹配與URL和/或IP和/或網(wǎng)頁內(nèi)容進(jìn)行識(shí)別的方 法對(duì)網(wǎng)頁進(jìn)行識(shí)別,降低了對(duì)網(wǎng)頁的誤判率。
[0151] 圖7示出了根據(jù)本發(fā)明另一個(gè)實(shí)施例的基于圖片匹配檢測(cè)釣魚網(wǎng)頁的裝置的結(jié) 構(gòu)框圖。如圖7所示,該裝置包括:圖片規(guī)則庫800、獲取模塊810、消重處理模塊820、相似 度計(jì)算模塊830、選取模塊840、匹配模塊850。
[0152] 圖片規(guī)則庫800,圖片規(guī)則庫包含多個(gè)第一圖片和第二圖片的圖片規(guī)則庫,第一圖 片是已知釣魚網(wǎng)頁的截圖,第二圖片是在第一圖片中所截取的具有釣魚網(wǎng)頁特征的圖片。
[0153] 獲取模塊810,適于對(duì)瀏覽器打開的網(wǎng)頁進(jìn)行截圖,獲取第三圖片。
[0154] 獲取模塊810包括:接收單元860、嵌入單元870、圖片獲取單元880。
[0155] 接收單元860,適于遠(yuǎn)程調(diào)用IE機(jī)器接收用戶訪問的網(wǎng)頁的MHT文件的地址。
[0156] 嵌入單元870,適于執(zhí)行截圖命令,對(duì)所述MHT文件對(duì)應(yīng)的網(wǎng)頁進(jìn)行截圖,獲取第 三圖片。
[0157] 圖片獲取單元880,適于執(zhí)行截圖命令,對(duì)統(tǒng)一資源定位符對(duì)應(yīng)的網(wǎng)頁進(jìn)行截圖, 獲取第三圖片。
[0158] 消重處理模塊820,適于對(duì)圖片規(guī)則庫中的所有第一圖片的特征點(diǎn)進(jìn)行消重處理。
[0159] 相似度計(jì)算模塊830,適于計(jì)算第三圖片與圖片規(guī)則庫中所有第一圖片的相似度。
[0160] 相似度用于表示兩個(gè)圖片的相似程度。該步驟通過計(jì)算第三圖片與圖片規(guī)則庫中 所有第一圖片的相似度,可以知道第三圖片與圖片規(guī)則庫中的每個(gè)第一圖片的相似程度, 從而作為后續(xù)選取哪些第一圖片以進(jìn)行匹配的依據(jù)。
[0161] 相似度計(jì)算模塊830包括:聚類處理單元890、特征點(diǎn)獲取單元900、相似度計(jì)算單 元 910。
[0162] 聚類處理單元890,適于分別對(duì)第三圖片和圖片規(guī)則庫中的所有第一圖片進(jìn)行聚 類處理。
[0163] 特征點(diǎn)獲取單元900,適于獲取聚類處理后第三圖片和圖片規(guī)則庫中第一圖片的 特征點(diǎn)。
[0164] 相似度計(jì)算單元910,適于根據(jù)聚類處理后第三圖片和圖片規(guī)則庫中第一圖片的 特征點(diǎn)計(jì)算特征點(diǎn)相似度。
[0165] 選取模塊840,適于根據(jù)相似度對(duì)圖片規(guī)則庫中的所有第一圖片進(jìn)行排序,按照排 序后的順序選取多個(gè)第一圖片,選取的第一圖片的數(shù)量小于圖片規(guī)則庫中第一圖片的總數(shù) 量。
[0166] 選取模塊840進(jìn)一步適于:根據(jù)相似度由高至低的順序?qū)D片規(guī)則庫中的第一圖 片進(jìn)行排序,選取相似度大于第一預(yù)定值的多個(gè)第一圖片。
[0167] 選取模塊840進(jìn)一步適于:根據(jù)相似度由高至低的順序?qū)D片規(guī)則庫中的第一圖 片進(jìn)行排序,選取數(shù)量第二預(yù)定值的多個(gè)第一圖片。
[0168] 匹配模塊850,適于將第三圖片與選取的第一圖片對(duì)應(yīng)的第二圖片進(jìn)行匹配,若選 取的第一圖片對(duì)應(yīng)的第二圖片中的至少一個(gè)與第三圖片匹配,則確定網(wǎng)頁為可疑的釣魚網(wǎng) 頁。
[0169] 匹配模塊850包括:抽取單元920、匹配單元930。
[0170] 抽取單元920,適于分別抽取第三圖片與選取的第一圖片對(duì)應(yīng)的第二圖片的特征。
[0171] 匹配單元930,適于將第三圖片的特征與選取的第一圖片對(duì)應(yīng)的第二圖片的特征 進(jìn)行匹配,若第三圖片的特征與選取的第一圖片對(duì)應(yīng)的第二圖片中的任一第二圖片的特征 匹配,則確定網(wǎng)頁為可疑的釣魚網(wǎng)頁。
[0172] 匹配單元930進(jìn)一步適于:查找第三圖片的特征與選取的第一圖片對(duì)應(yīng)的第二圖 片的特征匹配的鄰近特征點(diǎn),若鄰近特征點(diǎn)個(gè)數(shù)大于第一閾值,則確定網(wǎng)頁為可疑的釣魚 網(wǎng)頁。
[0173] 該裝置還包括:釣魚網(wǎng)頁預(yù)處理模塊940,適于對(duì)多個(gè)已知釣魚網(wǎng)頁進(jìn)行截圖,獲 取第一圖片,從每個(gè)第一圖片中截取具有釣魚網(wǎng)頁特征的至少一個(gè)第二圖片,并將第二圖 片添加到圖片規(guī)則庫中,其中,第二圖片的尺寸小于或等于第一圖片的尺寸。
[0174] 釣魚網(wǎng)頁預(yù)處理模塊940具體適于對(duì)初始獲取的多個(gè)已知釣魚網(wǎng)頁進(jìn)行截圖,獲 取第一圖片,從獲取的第一圖片中截取具有釣魚網(wǎng)頁特征的至少一個(gè)第二圖片,并將第二 圖片添加到圖片規(guī)則庫中作為樣本集;
[0175] 對(duì)樣本集包含的第二圖片進(jìn)行分類,對(duì)分類后的樣本集進(jìn)行分類學(xué)習(xí)得到各個(gè)類 別對(duì)應(yīng)的圖片特征庫;
[0176] 對(duì)后續(xù)獲取的已知釣魚網(wǎng)頁進(jìn)行截圖,獲取第一圖片,從獲取的第一圖片中截取 具有釣魚網(wǎng)頁特征的至少一個(gè)第四圖片,提取該第四圖片的特征;
[0177] 將第四圖片的特征與各個(gè)類別對(duì)應(yīng)的圖片特征庫進(jìn)行匹配,若第四圖片的特征與 一類別對(duì)應(yīng)的圖片特征庫匹配,則將第四圖片作為第二圖片添加到圖片規(guī)則庫中,并將第 四圖片歸類與所匹配的類別。
[0178] 該裝置還包括:識(shí)別模塊950,適于采用基于URL和/或IP和/或網(wǎng)頁內(nèi)容進(jìn)行 識(shí)別的方法對(duì)網(wǎng)頁進(jìn)行識(shí)別,確定網(wǎng)頁是否為釣魚網(wǎng)頁。
[0179] 根據(jù)本發(fā)明上述實(shí)施例提供的裝置,該裝置的執(zhí)行基于預(yù)先建立的包含多個(gè)第一 圖片和第二圖片的圖片規(guī)則庫,第一圖片是已知釣魚網(wǎng)頁的截圖,第二圖片是在第一圖片 中所截取的具有釣魚網(wǎng)頁特征的圖片。對(duì)圖片規(guī)則庫中的所有第一圖片的特征點(diǎn)進(jìn)行消重 處理可以提高后續(xù)聚類處理時(shí)的準(zhǔn)確度。對(duì)第三圖片和圖片規(guī)則庫中所有第一圖片的特征 點(diǎn)進(jìn)行聚類處理,降低了在后續(xù)計(jì)算相似度時(shí)的運(yùn)算量。通過計(jì)算第三圖片與圖片規(guī)則庫 中所有第一圖片的相似度,根據(jù)相似度對(duì)圖片規(guī)則庫中的所有第一圖片進(jìn)行排序,按照排 序后的順序選取多個(gè)第一圖片,選取的第一圖片的數(shù)量小于圖片規(guī)則庫中第一圖片的總數(shù) 量,通過對(duì)第一圖片進(jìn)行篩選,減少了后續(xù)匹配過程中將第三圖片與第二圖片匹配的計(jì)算 量,加快了釣魚網(wǎng)頁的檢測(cè)速度,降低了資源占用率;此外,由于第二圖片具有釣魚網(wǎng)頁特 征,因此在圖片規(guī)則庫內(nèi)存在與第三圖片匹配的第二圖片的情況下,第三圖片也具有釣魚 網(wǎng)頁的特征,基于此能夠快速并準(zhǔn)確的判斷網(wǎng)頁為可疑的釣魚網(wǎng)頁。在建立圖片規(guī)則庫時(shí) 對(duì)圖片進(jìn)行了分類,因此當(dāng)某網(wǎng)頁為釣魚網(wǎng)頁時(shí)可以根據(jù)圖片規(guī)則庫中的圖片進(jìn)行自動(dòng)識(shí) 別并將網(wǎng)頁進(jìn)行歸類。結(jié)合圖片特征匹配與URL和/或IP和/或網(wǎng)頁內(nèi)容進(jìn)行識(shí)別的方 法對(duì)網(wǎng)頁進(jìn)行識(shí)別,降低了對(duì)網(wǎng)頁的誤判率。
[0180] 在此提供的算法和顯示不與任何特定計(jì)算機(jī)、虛擬系統(tǒng)或者其它設(shè)備固有相關(guān)。 各種通用系統(tǒng)也可以與基于在此的示教一起使用。根據(jù)上面的描述,構(gòu)造這類系統(tǒng)所要求 的結(jié)構(gòu)是顯而易見的。此外,本發(fā)明也不針對(duì)任何特定編程語言。應(yīng)當(dāng)明白,可以利用各種 編程語言實(shí)現(xiàn)在此描述的本發(fā)明的內(nèi)容,并且上面對(duì)特定語言所做的描述是為了披露本發(fā) 明的最佳實(shí)施方式。
[0181] 在此處所提供的說明書中,說明了大量具體細(xì)節(jié)。然而,能夠理解,本發(fā)明的實(shí)施 例可以在沒有這些具體細(xì)節(jié)的情況下實(shí)踐。在一些實(shí)例中,并未詳細(xì)示出公知的方法、結(jié)構(gòu) 和技術(shù),以便不模糊對(duì)本說明書的理解。
[0182] 類似地,應(yīng)當(dāng)理解,為了精簡(jiǎn)本公開并幫助理解各個(gè)發(fā)明方面中的一個(gè)或多個(gè),在 上面對(duì)本發(fā)明的示例性實(shí)施例的描述中,本發(fā)明的各個(gè)特征有時(shí)被一起分組到單個(gè)實(shí)施 例、圖、或者對(duì)其的描述中。然而,并不應(yīng)將該公開的方法解釋成反映如下意圖:即所要求保 護(hù)的本發(fā)明要求比在每個(gè)權(quán)利要求中所明確記載的特征更多的特征。更確切地說,如下面 的權(quán)利要求書所反映的那樣,發(fā)明方面在于少于前面公開的單個(gè)實(shí)施例的所有特征。因此, 遵循【具體實(shí)施方式】的權(quán)利要求書由此明確地并入該【具體實(shí)施方式】,其中每個(gè)權(quán)利要求本身 都作為本發(fā)明的單獨(dú)實(shí)施例。
[0183] 本領(lǐng)域那些技術(shù)人員可以理解,可以對(duì)實(shí)施例中的設(shè)備中的模塊進(jìn)行自適應(yīng)性地 改變并且把它們?cè)O(shè)置在與該實(shí)施例不同的一個(gè)或多個(gè)設(shè)備中??梢园褜?shí)施例中的模塊或單 元或組件組合成一個(gè)模塊或單元或組件,以及此外可以把它們分成多個(gè)子模塊或子單元或 子組件。除了這樣的特征和/或過程或者單元中的至少一些是相互排斥之外,可以采用任 何組合對(duì)本說明書(包括伴隨的權(quán)利要求、摘要和附圖)中公開的所有特征以及如此公開 的任何方法或者設(shè)備的所有過程或單元進(jìn)行組合。除非另外明確陳述,本說明書(包括伴 隨的權(quán)利要求、摘要和附圖)中公開的每個(gè)特征可以由提供相同、等同或相似目的的替代 特征來代替。
[0184] 此外,本領(lǐng)域的技術(shù)人員能夠理解,盡管在此所述的一些實(shí)施例包括其它實(shí)施例 中所包括的某些特征而不是其它特征,但是不同實(shí)施例的特征的組合意味著處于本發(fā)明的 范圍之內(nèi)并且形成不同的實(shí)施例。例如,在下面的權(quán)利要求書中,所要求保護(hù)的實(shí)施例的任 意之一都可以以任意的組合方式來使用。
[0185] 本發(fā)明的各個(gè)部件實(shí)施例可以以硬件實(shí)現(xiàn),或者以在一個(gè)或者多個(gè)處理器上運(yùn)行 的軟件模塊實(shí)現(xiàn),或者以它們的組合實(shí)現(xiàn)。本領(lǐng)域的技術(shù)人員應(yīng)當(dāng)理解,可以在實(shí)踐中使用 微處理器或者數(shù)字信號(hào)處理器(DSP)來實(shí)現(xiàn)根據(jù)本發(fā)明實(shí)施例的基于圖片檢測(cè)釣魚網(wǎng)頁 的設(shè)備中的一些或者全部部件的一些或者全部功能。本發(fā)明還可以實(shí)現(xiàn)為用于執(zhí)行這里 所描述的方法的一部分或者全部的設(shè)備或者裝置程序(例如,計(jì)算機(jī)程序和計(jì)算機(jī)程序產(chǎn) 品)。這樣的實(shí)現(xiàn)本發(fā)明的程序可以存儲(chǔ)在計(jì)算機(jī)可讀介質(zhì)上,或者可以具有一個(gè)或者多個(gè) 信號(hào)的形式。這樣的信號(hào)可以從因特網(wǎng)網(wǎng)站上下載得到,或者在載體信號(hào)上提供,或者以任 何其他形式提供。
[0186] 應(yīng)該注意的是上述實(shí)施例對(duì)本發(fā)明進(jìn)行說明而不是對(duì)本發(fā)明進(jìn)行限制,并且本領(lǐng) 域技術(shù)人員在不脫離所附權(quán)利要求的范圍的情況下可設(shè)計(jì)出替換實(shí)施例。在權(quán)利要求中, 不應(yīng)將位于括號(hào)之間的任何參考符號(hào)構(gòu)造成對(duì)權(quán)利要求的限制。單詞"包含"不排除存在 未列在權(quán)利要求中的元件或步驟。位于元件之前的單詞"一"或"一個(gè)"不排除存在多個(gè)這 樣的元件。本發(fā)明可以借助于包括有若干不同元件的硬件以及借助于適當(dāng)編程的計(jì)算機(jī)來 實(shí)現(xiàn)。在列舉了若干裝置的單元權(quán)利要求中,這些裝置中的若干個(gè)可以是通過同一個(gè)硬件 項(xiàng)來具體體現(xiàn)。單詞第一、第二、以及第三等的使用不表示任何順序??蓪⑦@些單詞解釋為 名稱。
[0187] 本發(fā)明公開了 :A1、一種基于圖片匹配檢測(cè)釣魚網(wǎng)頁的方法,所述方法的執(zhí)行基于 預(yù)先建立的包含多個(gè)第一圖片和第二圖片的圖片規(guī)則庫,所述第一圖片是已知釣魚網(wǎng)頁的 截圖,所述第二圖片是在所述第一圖片中所截取的具有釣魚網(wǎng)頁特征的圖片;
[0188] 所述方法包括:
[0189] 對(duì)瀏覽器打開的網(wǎng)頁進(jìn)行截圖,獲取第三圖片;
[0190] 計(jì)算所述第三圖片與所述圖片規(guī)則庫中所有第一圖片的相似度;
[0191] 根據(jù)相似度對(duì)圖片規(guī)則庫中的所有第一圖片進(jìn)行排序,按照排序后的順序選取多 個(gè)第一圖片,選取的第一圖片的數(shù)量小于所述圖片規(guī)則庫中第一圖片的總數(shù)量;
[0192] 將所述第三圖片與選取的第一圖片對(duì)應(yīng)的第二圖片進(jìn)行匹配,若選取的第一圖片 對(duì)應(yīng)的第二圖片中的至少一個(gè)與所述第三圖片匹配,則確定所述網(wǎng)頁為可疑的釣魚網(wǎng)頁。
[0193] A2、根據(jù)A1所述的方法,所述計(jì)算所述第三圖片與所述圖片規(guī)則庫中所有第一圖 片的相似度進(jìn)一步包括:
[0194] 分別對(duì)所述第三圖片和所述圖片規(guī)則庫中的所有第一圖片進(jìn)行聚類處理,獲取聚 類處理后第三圖片和圖片規(guī)則庫中第一圖片的特征點(diǎn);
[0195] 根據(jù)聚類處理后第三圖片和圖片規(guī)則庫中第一圖片的特征點(diǎn)計(jì)算特征點(diǎn)相似度。
[0196] A3、根據(jù)A1或A2所述的方法,所述根據(jù)相似度對(duì)圖片規(guī)則庫中的所有第一圖片進(jìn) 行排序,按照排序后的順序選取多個(gè)第一圖片,選取的第一圖片的數(shù)量小于所述圖片規(guī)則 庫中第一圖片的總數(shù)量進(jìn)一步包括:
[0197] 根據(jù)相似度由高至低的順序?qū)D片規(guī)則庫中的第一圖片進(jìn)行排序,選取相似度大 于第一預(yù)定值的多個(gè)第一圖片。
[0198] A4、根據(jù)A1或A2所述的方法,所述根據(jù)相似度對(duì)圖片規(guī)則庫中的所有第一圖片進(jìn) 行排序,按照排序后的順序選取多個(gè)第一圖片,選取的第一圖片的數(shù)量小于所述圖片規(guī)則 庫中第一圖片的總數(shù)量進(jìn)一步包括:
[0199] 根據(jù)相似度由高至低的順序?qū)D片規(guī)則庫中的第一圖片進(jìn)行排序,選取數(shù)量為第 二預(yù)定值的多個(gè)第一圖片。
[0200] A5、根據(jù)A2-A4任一項(xiàng)所述的方法,在所述分別對(duì)第三圖片和所述圖片規(guī)則庫中 的所有第一圖片進(jìn)行聚類處理之前還包括:對(duì)所述圖片規(guī)則庫中的所有第一圖片的特征點(diǎn) 進(jìn)行消重處理。
[0201] A6、根據(jù)A1-A5任一項(xiàng)所述的方法,其中,所述對(duì)瀏覽器打開的網(wǎng)頁進(jìn)行截圖,獲 取第三圖片進(jìn)一步包括:
[0202] 通過服務(wù)器接收用戶訪問的網(wǎng)頁的統(tǒng)一資源定位符;
[0203] 調(diào)用chrome瀏覽器打開所述統(tǒng)一資源定位符對(duì)應(yīng)的網(wǎng)頁;
[0204] 執(zhí)行截圖命令,對(duì)所述統(tǒng)一資源定位符對(duì)應(yīng)的網(wǎng)頁進(jìn)行截圖,獲取第三圖片。
[0205] A7、根據(jù)A1-A5任一項(xiàng)所述的方法,其中,所述對(duì)瀏覽器打開的網(wǎng)頁進(jìn)行截圖,獲 取第三圖片進(jìn)一步包括:
[0206] 遠(yuǎn)程調(diào)用IE機(jī)器接收用戶訪問的網(wǎng)頁的MHT文件的地址;
[0207] 通過將MHT文件的地址嵌入到IE瀏覽器,打開MHT文件對(duì)應(yīng)的網(wǎng)頁;
[0208] 執(zhí)行截圖命令,對(duì)所述MHT文件對(duì)應(yīng)的網(wǎng)頁進(jìn)行截圖,獲取第三圖片。
[0209] A8、根據(jù)A1-A7任一項(xiàng)所述的方法,將所述第三圖片與選取的第一圖片對(duì)應(yīng)的第 二圖片進(jìn)行匹配進(jìn)一步包括:
[0210] 分別抽取所述第三圖片與選取的第一圖片對(duì)應(yīng)的第二圖片的特征;
[0211] 將所述第三圖片的特征與選取的第一圖片對(duì)應(yīng)的第二圖片的特征進(jìn)行匹配,若所 述第三圖片的特征與選取的第一圖片對(duì)應(yīng)的第二圖片中的任一第二圖片的特征匹配,則確 定所述網(wǎng)頁為可疑的釣魚網(wǎng)頁。
[0212] A9、根據(jù)A8所述的方法,其中,所述將所述第三圖片的特征與選取的第一圖片對(duì) 應(yīng)的第二圖片的特征進(jìn)行匹配進(jìn)一步包括:
[0213] 查找所述第三圖片的特征與選取的第一圖片對(duì)應(yīng)的第二圖片的特征匹配的鄰近 特征點(diǎn),若所述鄰近特征點(diǎn)個(gè)數(shù)大于第一閾值,則確定所述網(wǎng)頁為可疑的釣魚網(wǎng)頁。
[0214] A10、根據(jù)A1-A9任一項(xiàng)所述的方法,其中,所述圖片規(guī)則庫的建立包括:
[0215] 對(duì)多個(gè)已知釣魚網(wǎng)頁進(jìn)行截圖,獲取第一圖片,從每個(gè)第一圖片中截取具有釣魚 網(wǎng)頁特征的至少一個(gè)第二圖片,并將所述第二圖片添加到圖片規(guī)則庫中,其中,第二圖片的 尺寸小于或等于所述第一圖片的尺寸。
[0216] All、根據(jù)A1-A9任一項(xiàng)所述的方法,其中,所述圖片規(guī)則庫的建立包括:
[0217] 對(duì)初始獲取的多個(gè)已知釣魚網(wǎng)頁進(jìn)行截圖,獲取第一圖片,從獲取的第一圖片中 截取具有釣魚網(wǎng)頁特征的至少一個(gè)第二圖片,并將所述第二圖片添加到圖片規(guī)則庫中作為 樣本集;
[0218] 對(duì)所述樣本集包含的第二圖片進(jìn)行分類,對(duì)分類后的樣本集進(jìn)行分類學(xué)習(xí)得到各 個(gè)類別對(duì)應(yīng)的圖片特征庫;
[0219] 對(duì)后續(xù)獲取的已知釣魚網(wǎng)頁進(jìn)行截圖,獲取第一圖片,從獲取的第一圖片中截取 具有釣魚網(wǎng)頁特征的至少一個(gè)第四圖片,提取該第四圖片的特征;
[0220] 將所述第四圖片的特征與所述各個(gè)類別對(duì)應(yīng)的圖片特征庫進(jìn)行匹配,若所述第四 圖片的特征與一類別對(duì)應(yīng)的圖片特征庫匹配,則將所述第四圖片作為第二圖片添加到圖片 規(guī)則庫中,并將所述第四圖片歸類與所匹配的類別。
[0221] A12、根據(jù)A1-A11任一項(xiàng)所述的方法,在所述確定網(wǎng)頁為可疑的釣魚網(wǎng)頁之后還 包括:
[0222] 采用基于URL和/或IP和/或網(wǎng)頁內(nèi)容進(jìn)行識(shí)別的方法對(duì)所述網(wǎng)頁進(jìn)行識(shí)別,確 定所述網(wǎng)頁是否為釣魚網(wǎng)頁。
[0223] 本發(fā)明還公開了:B13、一種基于圖片匹配檢測(cè)釣魚網(wǎng)頁的裝置,包括:
[0224] 圖片規(guī)則庫,所述圖片規(guī)則庫包含多個(gè)第一圖片和第二圖片,所述第一圖片是已 知釣魚網(wǎng)頁的截圖,所述第二圖片是在所述第一圖片中所截取的具有釣魚網(wǎng)頁特征的圖 片;
[0225] 獲取模塊,適于對(duì)瀏覽器打開的網(wǎng)頁進(jìn)行截圖,獲取第三圖片;
[0226] 相似度計(jì)算模塊,適于計(jì)算所述第三圖片與所述圖片規(guī)則庫中所有第一圖片的相 似度;
[0227] 選取模塊,適于根據(jù)相似度對(duì)圖片規(guī)則庫中的所有第一圖片進(jìn)行排序,按照排序 后的順序選取多個(gè)第一圖片,選取的第一圖片的數(shù)量小于所述圖片規(guī)則庫中第一圖片的總 數(shù)量;
[0228] 匹配模塊,適于將所述第三圖片與選取的第一圖片對(duì)應(yīng)的第二圖片進(jìn)行匹配,若 選取的第一圖片對(duì)應(yīng)的第二圖片中的至少一個(gè)與所述第三圖片匹配,則確定所述網(wǎng)頁為可 疑的釣魚網(wǎng)頁。
[0229] B14、根據(jù)B13所述的裝置,所述相似度計(jì)算模塊進(jìn)一步包括:
[0230] 聚類處理單元,適于分別對(duì)所述第三圖片和所述圖片規(guī)則庫中的所有第一圖片進(jìn) 行聚類處理;
[0231] 特征點(diǎn)獲取單元,適于獲取聚類處理后第三圖片和圖片規(guī)則庫中第一圖片的特征 占.
[0232] 相似度計(jì)算單元,適于根據(jù)聚類處理后第三圖片和圖片規(guī)則庫中第一圖片的特征 點(diǎn)計(jì)算特征點(diǎn)相似度。
[0233] B15、根據(jù)B13或B14所述的裝置,所述選取模塊進(jìn)一步適于:
[0234] 根據(jù)相似度由高至低的順序?qū)D片規(guī)則庫中的第一圖片進(jìn)行排序,選取相似度大 于第一預(yù)定值的多個(gè)第一圖片。
[0235] B16、根據(jù)B13或B14所述的裝置,所述選取模塊進(jìn)一步適于:
[0236] 根據(jù)相似度由高至低的順序?qū)D片規(guī)則庫中的第一圖片進(jìn)行排序,選取數(shù)量為第 二預(yù)定值的多個(gè)第一圖片。
[0237] B17、根據(jù)B14-B16任一項(xiàng)所述的裝置,還包括:消重處理模塊,適于對(duì)所述圖片規(guī) 則庫中的所有第一圖片的特征點(diǎn)進(jìn)行消重處理。
[0238] B18、根據(jù)B13-B17任一項(xiàng)所述的裝置,其中,所述獲取模塊進(jìn)一步包括:
[0239] 接收單元,適于通過服務(wù)器接收用戶訪問的網(wǎng)頁的統(tǒng)一資源定位符;
[0240] 調(diào)用單元,適于調(diào)用chrome瀏覽器打開所述統(tǒng)一資源定位符對(duì)應(yīng)的網(wǎng)頁;
[0241] 圖片獲取單元,適于執(zhí)行截圖命令,對(duì)所述統(tǒng)一資源定位符對(duì)應(yīng)的網(wǎng)頁進(jìn)行截圖, 獲取第三圖片。
[0242] B19、根據(jù)B13-B17任一項(xiàng)所述的裝置,其中,所述獲取模塊進(jìn)一步包括:
[0243] 接收單元,適于遠(yuǎn)程調(diào)用IE機(jī)器接收用戶訪問的網(wǎng)頁的MHT文件的地址;
[0244] 嵌入單元,適于通過將ΜΗΤ文件的地址嵌入到ΙΕ瀏覽器,打開ΜΗΤ文件對(duì)應(yīng)的網(wǎng) 頁;
[0245] 圖片獲取單元,適于執(zhí)行截圖命令,對(duì)所述ΜΗΤ文件對(duì)應(yīng)的網(wǎng)頁進(jìn)行截圖,獲取第 三圖片。
[0246] Β20、根據(jù)Β13-Β19任一項(xiàng)所述的裝置,所述匹配模塊進(jìn)一步包括:
[0247] 抽取單元,適于分別抽取所述第三圖片與選取的第一圖片對(duì)應(yīng)的第二圖片的特 征;
[0248] 匹配單元,適于將所述第三圖片的特征與選取的第一圖片對(duì)應(yīng)的第二圖片的特征 進(jìn)行匹配,若所述第三圖片的特征與選取的第一圖片對(duì)應(yīng)的第二圖片中的任一第二圖片的 特征匹配,則確定所述網(wǎng)頁為可疑的釣魚網(wǎng)頁。
[0249] Β21、根據(jù)Β20所述的裝置,其中,所述匹配單元進(jìn)一步適于:
[0250] 查找所述第三圖片的特征與選取的第一圖片對(duì)應(yīng)的第二圖片的特征匹配的鄰近 特征點(diǎn),若所述鄰近特征點(diǎn)個(gè)數(shù)大于第一閾值,則確定所述網(wǎng)頁為可疑的釣魚網(wǎng)頁。
[0251] Β22、根據(jù)Β13-Β21任一項(xiàng)所述的裝置,其中,還包括:
[0252] 釣魚網(wǎng)頁預(yù)處理模塊,適于對(duì)多個(gè)已知釣魚網(wǎng)頁進(jìn)行截圖,獲取第一圖片,從每個(gè) 第一圖片中截取具有釣魚網(wǎng)頁特征的至少一個(gè)第二圖片,并將所述第二圖片添加到圖片規(guī) 則庫中,其中,第二圖片的尺寸小于或等于所述第一圖片的尺寸。
[0253] Β23、根據(jù)Β13-Β21任一項(xiàng)所述的裝置,其中,還包括釣魚網(wǎng)頁預(yù)處理模塊,具體適 于:
[0254] 對(duì)初始獲取的多個(gè)已知釣魚網(wǎng)頁進(jìn)行截圖,獲取第一圖片,從獲取的第一圖片中 截取具有釣魚網(wǎng)頁特征的至少一個(gè)第二圖片,并將所述第二圖片添加到圖片規(guī)則庫中作為 樣本集;
[0255] 對(duì)所述樣本集包含的第二圖片進(jìn)行分類,對(duì)分類后的樣本集進(jìn)行分類學(xué)習(xí)得到各 個(gè)類別對(duì)應(yīng)的圖片特征庫;
[0256] 對(duì)后續(xù)獲取的已知釣魚網(wǎng)頁進(jìn)行截圖,獲取第一圖片,從獲取的第一圖片中截取 具有釣魚網(wǎng)頁特征的至少一個(gè)第四圖片,提取該第四圖片的特征;
[0257] 將所述第四圖片的特征與所述各個(gè)類別對(duì)應(yīng)的圖片特征庫進(jìn)行匹配,若所述第四 圖片的特征與一類別對(duì)應(yīng)的圖片特征庫匹配,則將所述第四圖片作為第二圖片添加到圖片 規(guī)則庫中,并將所述第四圖片歸類與所匹配的類別。
[0258] Β24、根據(jù)Β13-Β23任一項(xiàng)所述的裝置,還包括:
[0259] 識(shí)別模塊,適于采用基于URL和/或IP和/或網(wǎng)頁內(nèi)容進(jìn)行識(shí)別的方法對(duì)所述網(wǎng) 頁進(jìn)行識(shí)別,確定所述網(wǎng)頁是否為釣魚網(wǎng)頁。
【權(quán)利要求】
1. 一種基于圖片匹配檢測(cè)釣魚網(wǎng)頁的方法,所述方法的執(zhí)行基于預(yù)先建立的包含多個(gè) 第一圖片和第二圖片的圖片規(guī)則庫,所述第一圖片是已知釣魚網(wǎng)頁的截圖,所述第二圖片 是在所述第一圖片中所截取的具有釣魚網(wǎng)頁特征的圖片; 所述方法包括: 對(duì)瀏覽器打開的網(wǎng)頁進(jìn)行截圖,獲取第三圖片; 計(jì)算所述第三圖片與所述圖片規(guī)則庫中所有第一圖片的相似度; 根據(jù)相似度對(duì)圖片規(guī)則庫中的所有第一圖片進(jìn)行排序,按照排序后的順序選取多個(gè)第 一圖片,選取的第一圖片的數(shù)量小于所述圖片規(guī)則庫中第一圖片的總數(shù)量; 將所述第三圖片與選取的第一圖片對(duì)應(yīng)的第二圖片進(jìn)行匹配,若選取的第一圖片對(duì)應(yīng) 的第二圖片中的至少一個(gè)與所述第三圖片匹配,則確定所述網(wǎng)頁為可疑的釣魚網(wǎng)頁。
2. 根據(jù)權(quán)利要求1所述的方法,所述計(jì)算所述第三圖片與所述圖片規(guī)則庫中所有第一 圖片的相似度進(jìn)一步包括: 分別對(duì)所述第三圖片和所述圖片規(guī)則庫中的所有第一圖片進(jìn)行聚類處理,獲取聚類處 理后第三圖片和圖片規(guī)則庫中第一圖片的特征點(diǎn); 根據(jù)聚類處理后第三圖片和圖片規(guī)則庫中第一圖片的特征點(diǎn)計(jì)算特征點(diǎn)相似度。
3. 根據(jù)權(quán)利要求1或2所述的方法,所述根據(jù)相似度對(duì)圖片規(guī)則庫中的所有第一圖片 進(jìn)行排序,按照排序后的順序選取多個(gè)第一圖片,選取的第一圖片的數(shù)量小于所述圖片規(guī) 則庫中第一圖片的總數(shù)量進(jìn)一步包括: 根據(jù)相似度由高至低的順序?qū)D片規(guī)則庫中的第一圖片進(jìn)行排序,選取相似度大于第 一預(yù)定值的多個(gè)第一圖片。
4. 根據(jù)權(quán)利要求1或2所述的方法,所述根據(jù)相似度對(duì)圖片規(guī)則庫中的所有第一圖片 進(jìn)行排序,按照排序后的順序選取多個(gè)第一圖片,選取的第一圖片的數(shù)量小于所述圖片規(guī) 則庫中第一圖片的總數(shù)量進(jìn)一步包括: 根據(jù)相似度由高至低的順序?qū)D片規(guī)則庫中的第一圖片進(jìn)行排序,選取數(shù)量為第二預(yù) 定值的多個(gè)第一圖片。
5. 根據(jù)權(quán)利要求2-4任一項(xiàng)所述的方法,在所述分別對(duì)第三圖片和所述圖片規(guī)則庫中 的所有第一圖片進(jìn)行聚類處理之前還包括:對(duì)所述圖片規(guī)則庫中的所有第一圖片的特征點(diǎn) 進(jìn)行消重處理。
6. 根據(jù)權(quán)利要求1-5任一項(xiàng)所述的方法,其中,所述對(duì)瀏覽器打開的網(wǎng)頁進(jìn)行截圖,獲 取第三圖片進(jìn)一步包括: 通過服務(wù)器接收用戶訪問的網(wǎng)頁的統(tǒng)一資源定位符; 調(diào)用chrome瀏覽器打開所述統(tǒng)一資源定位符對(duì)應(yīng)的網(wǎng)頁; 執(zhí)行截圖命令,對(duì)所述統(tǒng)一資源定位符對(duì)應(yīng)的網(wǎng)頁進(jìn)行截圖,獲取第三圖片。
7. 根據(jù)權(quán)利要求1-5任一項(xiàng)所述的方法,其中,所述對(duì)瀏覽器打開的網(wǎng)頁進(jìn)行截圖,獲 取第三圖片進(jìn)一步包括: 遠(yuǎn)程調(diào)用IE機(jī)器接收用戶訪問的網(wǎng)頁的MHT文件的地址; 通過將MHT文件的地址嵌入到IE瀏覽器,打開MHT文件對(duì)應(yīng)的網(wǎng)頁; 執(zhí)行截圖命令,對(duì)所述MHT文件對(duì)應(yīng)的網(wǎng)頁進(jìn)行截圖,獲取第三圖片。
8. 根據(jù)權(quán)利要求1-7任一項(xiàng)所述的方法,將所述第三圖片與選取的第一圖片對(duì)應(yīng)的第 二圖片進(jìn)行匹配進(jìn)一步包括: 分別抽取所述第三圖片與選取的第一圖片對(duì)應(yīng)的第二圖片的特征; 將所述第三圖片的特征與選取的第一圖片對(duì)應(yīng)的第二圖片的特征進(jìn)行匹配,若所述第 三圖片的特征與選取的第一圖片對(duì)應(yīng)的第二圖片中的任一第二圖片的特征匹配,則確定所 述網(wǎng)頁為可疑的釣魚網(wǎng)頁。
9. 根據(jù)權(quán)利要求8所述的方法,其中,所述將所述第三圖片的特征與選取的第一圖片 對(duì)應(yīng)的第二圖片的特征進(jìn)行匹配進(jìn)一步包括: 查找所述第三圖片的特征與選取的第一圖片對(duì)應(yīng)的第二圖片的特征匹配的鄰近特征 點(diǎn),若所述鄰近特征點(diǎn)個(gè)數(shù)大于第一閾值,則確定所述網(wǎng)頁為可疑的釣魚網(wǎng)頁。
10. -種基于圖片匹配檢測(cè)釣魚網(wǎng)頁的裝置,包括: 圖片規(guī)則庫,所述圖片規(guī)則庫包含多個(gè)第一圖片和第二圖片,所述第一圖片是已知釣 魚網(wǎng)頁的截圖,所述第二圖片是在所述第一圖片中所截取的具有釣魚網(wǎng)頁特征的圖片; 獲取模塊,適于對(duì)瀏覽器打開的網(wǎng)頁進(jìn)行截圖,獲取第三圖片; 相似度計(jì)算模塊,適于計(jì)算所述第三圖片與所述圖片規(guī)則庫中所有第一圖片的相似 度; 選取模塊,適于根據(jù)相似度對(duì)圖片規(guī)則庫中的所有第一圖片進(jìn)行排序,按照排序后的 順序選取多個(gè)第一圖片,選取的第一圖片的數(shù)量小于所述圖片規(guī)則庫中第一圖片的總數(shù) 量; 匹配模塊,適于將所述第三圖片與選取的第一圖片對(duì)應(yīng)的第二圖片進(jìn)行匹配,若選取 的第一圖片對(duì)應(yīng)的第二圖片中的至少一個(gè)與所述第三圖片匹配,則確定所述網(wǎng)頁為可疑的 釣魚網(wǎng)頁。
【文檔編號(hào)】G06F17/30GK104143008SQ201410392300
【公開日】2014年11月12日 申請(qǐng)日期:2014年8月11日 優(yōu)先權(quán)日:2014年8月11日
【發(fā)明者】李曉波, 尹露, 楊晶, 郭峰 申請(qǐng)人:北京奇虎科技有限公司, 奇智軟件(北京)有限公司