一種盜版安卓應(yīng)用甄別方法及盜版安卓應(yīng)用甄別系統(tǒng)的制作方法
【專利摘要】本發(fā)明公開了一種盜版安卓應(yīng)用甄別方法及盜版安卓應(yīng)用甄別系統(tǒng)。所述系統(tǒng)包括用于從安卓應(yīng)用發(fā)布渠道采集安卓應(yīng)用基本信息,下載安卓應(yīng)用安裝包的安卓應(yīng)用渠道監(jiān)測系統(tǒng)、用于對安卓應(yīng)用基本信息及安卓應(yīng)用安裝包進行集中存儲的安卓應(yīng)用數(shù)據(jù)存儲中心、用于基于安卓應(yīng)用數(shù)據(jù)存儲中心的海量安卓應(yīng)用數(shù)據(jù)構(gòu)建包含應(yīng)用名稱、應(yīng)用介紹信息及版本信息的安卓應(yīng)用信息表的安卓應(yīng)用數(shù)據(jù)庫、用于從預(yù)先構(gòu)建的正版安卓應(yīng)用信息表中選擇待監(jiān)測正版安卓應(yīng)用,從安卓應(yīng)用信息表中篩選出與待監(jiān)測正版安卓應(yīng)用相關(guān)聯(lián)的所有疑似安卓應(yīng)用,依照設(shè)定的安卓應(yīng)用版本判定條件對該疑似安卓應(yīng)用中的正版應(yīng)用、舊版應(yīng)用及盜版應(yīng)用進行甄別的安卓應(yīng)用差異化分析系統(tǒng)。
【專利說明】
-種盜版安卓應(yīng)用甄別方法及盜版安卓應(yīng)用甄別系統(tǒng)
技術(shù)領(lǐng)域
[0001] 本發(fā)明設(shè)及安卓應(yīng)用監(jiān)控技術(shù)領(lǐng)域,更具體地說,設(shè)及一種盜版安卓應(yīng)用甄別方 法及盜版安卓應(yīng)用甄別系統(tǒng)。
【背景技術(shù)】
[0002] 目前,盜版安卓應(yīng)用判定方法主要取決于應(yīng)用的名稱、包名、簽名證書,即判定應(yīng) 用名稱是否相似,包名是否相同,簽名證書是否不同。如某款安卓應(yīng)用同時符合上述Ξ個條 件,則判定該款安卓應(yīng)用為盜版應(yīng)用。
[0003] 實際上,一方面,對于同一應(yīng)用的不同版本,可能因為原作者的簽名證書到期換 證,從而造成簽名證書發(fā)生變化,同時因為應(yīng)用發(fā)布渠道不同,可能出現(xiàn)渠道對所發(fā)布的應(yīng) 用重新簽名的情況。
[0004] 另一方面,安卓應(yīng)用基數(shù)龐大(超過100萬款),且處于高速增長狀態(tài),在同一類型 應(yīng)用中出現(xiàn)應(yīng)用名稱相似的情況也是極為普遍,采用現(xiàn)有的盜版安卓應(yīng)用判定方法進行盜 版安卓應(yīng)用的甄別,猶如大海拱針,不僅盜版應(yīng)用判定效率低下,誤判率高,而且,工作人員 的工作負荷極高。
[0005] 再者,不少盜版者并不W替換正版應(yīng)用為目的,故盜版應(yīng)用的包名與正版應(yīng)用的 包名不一致的情況較為普遍?,F(xiàn)有的盜版安卓應(yīng)用判定方法無法甄別該類盜版應(yīng)用。
【發(fā)明內(nèi)容】
[0006] 本發(fā)明要解決的技術(shù)問題在于針對現(xiàn)有技術(shù)的上述缺陷,提供一種盜版安卓應(yīng)用 甄別方法及盜版安卓應(yīng)用甄別系統(tǒng)。
[0007] 本發(fā)明解決其技術(shù)問題所采用的技術(shù)方案是:構(gòu)造一種盜版安卓應(yīng)用甄別方法, 所述方法包括如下步驟:
[0008] S1、采集由各大安卓應(yīng)用渠道網(wǎng)站發(fā)布的安卓應(yīng)用基本信息,根據(jù)安卓應(yīng)用基本 信息中的應(yīng)用下載地址從相關(guān)下載源下載安卓應(yīng)用安裝包,將采集的安卓應(yīng)用基本信息及 下載的安卓應(yīng)用安裝包匯總至安卓應(yīng)用數(shù)據(jù)存儲中屯、;
[0009] S2、基于匯入安卓應(yīng)用數(shù)據(jù)存儲中屯、的海量安卓應(yīng)用數(shù)據(jù)構(gòu)建包含應(yīng)用名稱、應(yīng) 用介紹信息及版本信息的安卓應(yīng)用數(shù)據(jù)庫;
[0010] S3、從正版安卓應(yīng)用表中選擇待監(jiān)測正版安卓應(yīng)用,根據(jù)輸入的篩選條件從安卓 應(yīng)用數(shù)據(jù)庫中篩選出與待監(jiān)測正版安卓應(yīng)用相關(guān)聯(lián)的所有疑似安卓應(yīng)用,并依照設(shè)定的 安卓應(yīng)用版本判定條件對該疑似安卓應(yīng)用中的正版應(yīng)用、舊版應(yīng)用及盜版應(yīng)用逐一進行甄 別。
[0011] 在本發(fā)明上述盜版安卓應(yīng)用甄別方法中,在所述步驟S1之前還包括如下步驟:
[0012] SOI、基于安卓應(yīng)用開發(fā)商提供的正版安卓應(yīng)用構(gòu)建正版安卓應(yīng)用信息表;
[0013] S02、設(shè)定用于甄別正版安卓應(yīng)用的第一判定條件、用于甄別歷史版本安卓應(yīng)用的 第二判定條件及用于甄別盜版安卓應(yīng)用的第Ξ判定條件;其中
[0014] 所述第一判定條件如下:al、應(yīng)用名稱相同;bl、安卓應(yīng)用安裝包的包名相同;cl、 版本信息相同;dl、簽名證書相同;
[0015] 所述第二判定條件如下:a2、應(yīng)用名稱相同;b2、安卓應(yīng)用安裝包的包名相同;c2、 版本信息不同;d2、簽名證書相同;
[0016] 所述第Ξ判定條件如下:a3、應(yīng)用名稱相似;b3、安卓應(yīng)用安裝包的包名相似;d3、 簽名證書不同;e、待監(jiān)測正版安卓應(yīng)用與疑似安卓應(yīng)用的代碼相似度不低于設(shè)定的代碼相 似度闊值;f、待監(jiān)測正版安卓應(yīng)用與疑似安卓應(yīng)用的文本文件相似度不低于設(shè)定的文本文 件相似度闊值;g、待監(jiān)測正版安卓應(yīng)用與疑似安卓應(yīng)用的圖像文件相似度不低于設(shè)定的圖 像文件相似度闊值。
[0017] 在本發(fā)明上述盜版安卓應(yīng)用甄別方法中,所述步驟S3中根據(jù)輸入的篩選條件從 安卓應(yīng)用信息表中篩選出與待監(jiān)測正版安卓應(yīng)用相關(guān)聯(lián)的所有疑似安卓應(yīng)用的步驟包 括:
[0018] 將待監(jiān)測正版安卓應(yīng)用的應(yīng)用名稱、設(shè)定的應(yīng)用監(jiān)測關(guān)鍵字作為檢索條件在安卓 應(yīng)用信息表中檢索與該應(yīng)用名稱相似的安卓應(yīng)用,或者應(yīng)用介紹信息中包含該應(yīng)用名稱和 /或該應(yīng)用監(jiān)測關(guān)鍵字的安卓應(yīng)用,將檢索到的安卓應(yīng)用定義為待監(jiān)測正版安卓應(yīng)用的疑 似安卓應(yīng)用。
[0019] 在本發(fā)明上述盜版安卓應(yīng)用甄別方法中,所述步驟S3中依照設(shè)定的安卓應(yīng)用版 本判定條件對該疑似安卓應(yīng)用中的正版應(yīng)用、舊版應(yīng)用及盜版應(yīng)用逐一進行甄別的步驟包 括:
[0020] 對待監(jiān)測正版安卓應(yīng)用及所有疑似安卓應(yīng)用進行反編譯,分別得到待監(jiān)測正版安 卓應(yīng)用的包名、簽名證書、應(yīng)用名稱、資源文件、配置文件及smali文件,W及各款疑似安卓 應(yīng)用的包名、簽名證書、應(yīng)用名稱、資源文件、配置文件及smali文件;
[0021] 將待監(jiān)測正版安卓應(yīng)用的應(yīng)用名稱、包名、簽名證書、資源文件、配置文件及smali 文件與各款疑似安卓應(yīng)用的應(yīng)用名稱、包名、簽名證書、資源文件、配置文件及smali文件 分別進行比對;
[0022] 如待監(jiān)測正版安卓應(yīng)用的應(yīng)用名稱、包名、版本信息、簽名證書與某一款疑似安卓 應(yīng)用的應(yīng)用名稱、包名、版本信息、簽名證書分別對應(yīng)相同,則判定該款疑似安卓應(yīng)用為待 監(jiān)測正版安卓應(yīng)用的正版;
[0023] 如待監(jiān)測正版安卓應(yīng)用的應(yīng)用名稱、包名、簽名證書與某款疑似安卓應(yīng)用的應(yīng)用 名稱、包名、簽名證書對應(yīng)相同,且待監(jiān)測正版安卓應(yīng)用的版本信息與該款疑似安卓應(yīng)用的 版本信息不同,則判定該款疑似安卓應(yīng)用為該款待監(jiān)測安卓應(yīng)用的歷史版本;
[0024] 如待監(jiān)測正版安卓應(yīng)用的應(yīng)用名稱、包名、簽名證書與某款疑似安卓應(yīng)用的應(yīng)用 名稱、包名、簽名證書各不相同,則對待監(jiān)測正版安卓應(yīng)用及該款疑似安卓應(yīng)用進行相似度 分析,基于應(yīng)用相似度分析結(jié)果并結(jié)合預(yù)設(shè)的盜版安卓應(yīng)用判定條件對該款疑似安卓應(yīng)用 是否屬于盜版應(yīng)用進行綜合研判。
[00巧]在本發(fā)明上述盜版安卓應(yīng)用甄別方法中,安卓應(yīng)用相似度分析包括文本文件相似 度分析、代碼相似度分析及圖像文件相似度分析;
[00%] 所述對待監(jiān)測正版安卓應(yīng)用及該款疑似安卓應(yīng)用進行相似度分析的步驟包括: [0027] 通過第一相似度計算公式計算待監(jiān)測正版安卓應(yīng)用與該款疑似安卓應(yīng)用的每個 文件的相似度及代碼相似度;其中
[002引第一相似度計算公式如下:Xi= (1-J/D)*100% ;
[0029] Xi表示待監(jiān)測正版安卓應(yīng)用的其中一個文件與該款疑似安卓應(yīng)用的對比文件的 相似度;
[0030] i表不安卓應(yīng)用的文件編號順序;
[0031] J表示從源字符串至目標字符串需進行的編輯操作次數(shù);
[0032] D表示文件大??;
[0033] 根據(jù)第一相似度公式計算兩款安卓應(yīng)用的各對文件的相似度值及各對文件的相 似度值的平均值,將所計算的相似度值的平均值作為待監(jiān)測正版安卓應(yīng)用與該款疑似安卓 應(yīng)用的文本文件相似度及代碼相似度。
[0034] 在本發(fā)明上述盜版安卓應(yīng)用甄別方法中,對待監(jiān)測正版安卓應(yīng)用及該款疑似安卓 應(yīng)用進行相似度分析的步驟還包括:
[0035] 通過第二相似度計算公式計算待監(jiān)測正版安卓應(yīng)用與該款疑似安卓應(yīng)用的圖像 文件相似度;其中
[0036] 第二相似度計算公式如下:X2= α-Η〇/10)*100% ;
[0037] Χ2表示待監(jiān)測正版安卓應(yīng)用及該款疑似安卓應(yīng)用之間的圖像相似度;
[0038] Η。表示平均漢明距離值,即待監(jiān)測正版安卓應(yīng)用及該款疑似安卓應(yīng)用的各個圖像 文件的漢明距離值的平均值。
[0039] 在本發(fā)明上述盜版安卓應(yīng)用甄別方法中,平均漢明距離值Η。的計算過程包括如下 步驟:
[0040] 將用于表征待監(jiān)測正版安卓應(yīng)用的第一個圖像文件及該款疑似安卓應(yīng)用的對比 圖像文件的相似度的第一漢明距離值設(shè)為Hi, Η為遞增變量,且Η的值默認為0 ;
[0041] 將待監(jiān)測正版安卓應(yīng)用的第一個圖像文件及疑似安卓應(yīng)用的對比圖像文件分別 縮小至8*8的圖片尺寸,對該縮小尺寸后的第一圖像文件及對比圖像文件分別進行灰化處 理;
[0042] 計算經(jīng)灰化處理的第一個圖像文件的每個像素的灰度及64個像素的灰度平均 值,將第一個圖像文件下的每個像素的灰度與64個像素的灰度平均值一一進行比較,根據(jù) 比較結(jié)果構(gòu)建由數(shù)字0及數(shù)字1組成的8*8形式的第一數(shù)字矩陣;
[0043] 計算該疑似安卓應(yīng)用的對比圖像文件的各個像素的灰度及64個像素的灰度平均 值,將該對比圖像文件下的每個像素的灰度及64個像素的灰度平均值一一進行比較,根據(jù) 比較結(jié)果構(gòu)建由數(shù)字0及數(shù)字1組成的8*8形式的第二數(shù)字矩陣;
[0044] 將第一數(shù)字矩陣與第二數(shù)字矩陣中坐標位置相同的數(shù)字逐一進行比對,判斷該對 數(shù)字是否相同,如不同,則將Hi的值加1 ; W45] 累計Hi的值;
[0046] 重復(fù)上述步驟,依次得到Hi。。。。。。&的值;
[0047] 對Η產(chǎn)Η N的值進行加權(quán)平均,得到Η。; W4引 Η。的計算公式如下:
[0049] 其中,Ν表示待監(jiān)測正版安卓應(yīng)用及疑似安卓應(yīng)用的圖像文件的數(shù)量。
[0050] 本發(fā)明還構(gòu)造一種盜版安卓應(yīng)用甄別系統(tǒng),所述系統(tǒng)包括:
[0051] 安卓應(yīng)用渠道監(jiān)測系統(tǒng),用于從各大安卓應(yīng)用渠道網(wǎng)站采集各款安卓應(yīng)用的基本 信息,根據(jù)安卓應(yīng)用基本信息中的應(yīng)用下載地址從相關(guān)下載源下載安卓應(yīng)用安裝包;
[0052] 安卓應(yīng)用數(shù)據(jù)存儲中屯、,用于對安卓應(yīng)用渠道監(jiān)測系統(tǒng)采集的安卓應(yīng)用基本信息 及下載的安卓應(yīng)用安裝包進行集中存儲;
[0053] 安卓應(yīng)用數(shù)據(jù)庫,包括基于安卓應(yīng)用開發(fā)商提供的正版安卓應(yīng)用所構(gòu)建的正版安 卓應(yīng)用信息表,用于接收來自安卓應(yīng)用數(shù)據(jù)存儲中屯、的海量安卓應(yīng)用數(shù)據(jù),基于海量安卓 應(yīng)用數(shù)據(jù)構(gòu)建包含應(yīng)用名稱、應(yīng)用介紹信息及版本信息的安卓應(yīng)用信息表;
[0054] 安卓應(yīng)用差異化分析系統(tǒng),用于從安卓應(yīng)用數(shù)據(jù)庫的正版安卓應(yīng)用信息表中選擇 待監(jiān)測正版安卓應(yīng)用,根據(jù)輸入的篩選條件從該安卓應(yīng)用信息表中篩選出與待監(jiān)測正版安 卓應(yīng)用相關(guān)聯(lián)的所有疑似安卓應(yīng)用,并依照設(shè)定的安卓應(yīng)用版本判定條件對該疑似安卓應(yīng) 用中的正版應(yīng)用、舊版應(yīng)用及盜版應(yīng)用逐一進行甄別。 陽化5] 在本發(fā)明上述盜版安卓應(yīng)用甄別系統(tǒng)中,所述安卓應(yīng)用渠道監(jiān)測系統(tǒng)包括布設(shè)于 國內(nèi)外不同區(qū)域,采用分布式架構(gòu)設(shè)計,用于從安卓應(yīng)用渠道網(wǎng)站采集安卓應(yīng)用頁面信息 的第一服務(wù)器集群、布設(shè)于國內(nèi)外不同區(qū)域,采用分布式架構(gòu)設(shè)計,用于根據(jù)該第一服務(wù)器 集群爬取到的安卓應(yīng)用下載地址從相應(yīng)下載源下載安卓應(yīng)用安裝包的第二服務(wù)器集群。
[0056] 在本發(fā)明上述盜版安卓應(yīng)用甄別系統(tǒng)中,所述安卓應(yīng)用差異化分析系統(tǒng)包括:
[0057] 選擇模塊,用于從正版安卓應(yīng)用信息表中選擇待監(jiān)測正版安卓應(yīng)用,根據(jù)輸入的 篩選條件從安卓應(yīng)用信息表中篩選出與待監(jiān)測正版安卓應(yīng)用相關(guān)聯(lián)的所有疑似安卓應(yīng) 用;
[0058] 安卓應(yīng)用反編譯模塊,用于對待監(jiān)測正版安卓應(yīng)用安裝包及疑似安卓應(yīng)用安裝包 進行反編譯,分別得到待監(jiān)測正版安卓應(yīng)用的包名、簽名證書、應(yīng)用名稱、資源文件、配置文 件及smali文件,W及疑似安卓應(yīng)用的包名、簽名證書、應(yīng)用名稱、資源文件、配置文件及 small文件;
[0059] 安卓應(yīng)用相似度分析模塊,用于根據(jù)第一相似度計算公式計算待監(jiān)測正版安卓應(yīng) 用與疑似安卓應(yīng)用的每個文件的相似度及代碼相似度,W及用于根據(jù)第二相似度計算公式 計算待監(jiān)測正版安卓應(yīng)用與疑似安卓應(yīng)用的圖像文件相似度;
[0060] 安卓應(yīng)用版本判定模塊,用于參照設(shè)定的正版/歷史版本安卓應(yīng)用判定條件對疑 似安卓應(yīng)用中的正版應(yīng)用、舊版應(yīng)用進行甄別,W及基于安卓應(yīng)用相似度分析模塊提供的 待監(jiān)測正版安卓應(yīng)用與疑似安卓應(yīng)用的文本文件相似度、代碼相似度及圖像文件相似度并 結(jié)合設(shè)定的盜版安卓應(yīng)用判定條件對疑似安卓應(yīng)用中的盜版應(yīng)用進行甄別。
[0061] 實施本發(fā)明盜版安卓應(yīng)用甄別方法及盜版安卓應(yīng)用甄別系統(tǒng),可達到W下有益效 果:
[0062] 1、本發(fā)明盜版安卓應(yīng)用甄別系統(tǒng)可根據(jù)應(yīng)用名稱及應(yīng)用監(jiān)測關(guān)鍵詞查找與待監(jiān) 測正版安卓應(yīng)用相關(guān)聯(lián)的所有疑似安卓應(yīng)用,對待監(jiān)測正版安卓應(yīng)用及其疑似安卓應(yīng)用進 行相似度分析(包括文本文件相似度分析、代碼相似度分析、圖像文件相似度分析),根據(jù) 相似度分析結(jié)果,并結(jié)合設(shè)定的盜版安卓應(yīng)用判定條件對疑似安卓應(yīng)用中的盜版應(yīng)用進行 綜合研判,相比現(xiàn)有的盜版安卓應(yīng)用判定技術(shù)而言,具有盜版應(yīng)用的甄別效率及準確率高, 誤判率極低的突出優(yōu)點。
[0063] 2、在本發(fā)明盜版安卓應(yīng)用甄別系統(tǒng)中,安卓應(yīng)用安全評估系統(tǒng)可對盜版庫中的盜 版應(yīng)用的安全隱患(潛藏于盜版應(yīng)用中的惡意代碼及其惡意行為)進行分析及評估,根據(jù) 評估結(jié)果生成盜版安卓應(yīng)用安全性分析報告,故本系統(tǒng)可羅列盜版安卓應(yīng)用并出具盜版安 卓應(yīng)用安全性分析報告供用戶參考,避免用戶下載盜版安卓應(yīng)用并蒙受損失。
[0064] 3、在本發(fā)明安卓應(yīng)用監(jiān)測報告生成系統(tǒng)中,安卓應(yīng)用差異化分析系統(tǒng)可對待監(jiān)測 正版安卓應(yīng)用的所有疑似安卓應(yīng)用中的正版應(yīng)用、舊版應(yīng)用及盜版應(yīng)用進行快速、有效地 甄別,安卓應(yīng)用監(jiān)測報告生成系統(tǒng)可基于安卓應(yīng)用差異化分析系統(tǒng)的甄別結(jié)果對待監(jiān)測正 版安卓應(yīng)用中的正版應(yīng)用、舊版應(yīng)用、盜版應(yīng)用的總下載量及各自的渠道來源進行統(tǒng)計,出 具待監(jiān)測正版安卓應(yīng)用的下載使用情況監(jiān)測報告,便于正版安卓應(yīng)用開發(fā)商維權(quán)。
【附圖說明】
[0065] 圖1為本發(fā)明的第一個較佳實施例提供的盜版安卓應(yīng)用甄別系統(tǒng)的結(jié)構(gòu)框圖;
[0066] 圖2為圖1所示的盜版安卓應(yīng)用甄別系統(tǒng)下的安卓應(yīng)用渠道監(jiān)測系統(tǒng)的結(jié)構(gòu)框 圖;
[0067] 圖3為圖1所示的盜版安卓應(yīng)用甄別系統(tǒng)下的安卓應(yīng)用差異化分析系統(tǒng)的結(jié)構(gòu)框 圖;
[0068] 圖4為本發(fā)明的第二個較佳實施例提供的盜版安卓應(yīng)用甄別方法的流程圖。
【具體實施方式】
[0069] 為使本發(fā)明實施例的目的、技術(shù)方案和優(yōu)點更加清楚,下面將結(jié)合本發(fā)明實施例 中的附圖,對本發(fā)明實施例中的技術(shù)方案進行清楚、完整地描述。基于本發(fā)明中的實施例, 本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動前提下所獲得的所有其他實施例,都屬于本發(fā) 明保護的范圍。 W70] 實施例一
[0071] 本實施例掲示了一種盜版安卓應(yīng)用甄別系統(tǒng)。
[0072] 如圖1所示,該盜版安卓應(yīng)用甄別系統(tǒng)包括依次連接的安卓應(yīng)用渠道監(jiān)測系統(tǒng) 100、安卓應(yīng)用數(shù)據(jù)存儲中屯、200、安卓應(yīng)用差異化分析系統(tǒng)300、安卓應(yīng)用數(shù)據(jù)庫400、W及 連接安卓應(yīng)用數(shù)據(jù)庫400的安卓應(yīng)用安全評估系統(tǒng)500及安卓應(yīng)用監(jiān)測報告生成系統(tǒng)600。 其中:
[0073] 安卓應(yīng)用渠道監(jiān)測系統(tǒng)100用于采集由各渠道網(wǎng)站(例如包括360在內(nèi)的各大移 動應(yīng)用資源網(wǎng)站)發(fā)布的各款安卓應(yīng)用的基本信息,根據(jù)安卓應(yīng)用基本信息中的應(yīng)用下載 地址從相關(guān)下載源(例如,360移動應(yīng)用商城、小米移動應(yīng)用商城、華為移動應(yīng)用商城)下載 安卓應(yīng)用安裝包。
[0074] 安卓應(yīng)用數(shù)據(jù)存儲中屯、200用于對安卓應(yīng)用渠道監(jiān)測系統(tǒng)100采集的安卓應(yīng)用基 本信息及下載的安卓應(yīng)用安裝包進行集中存儲。
[0075] 安卓應(yīng)用數(shù)據(jù)庫400用于接收來自安卓應(yīng)用數(shù)據(jù)存儲中屯、200的海量安卓應(yīng)用數(shù) 據(jù),基于海量安卓應(yīng)用數(shù)據(jù)構(gòu)建包含應(yīng)用名稱、應(yīng)用介紹信息及版本信息的安卓應(yīng)用信息 表。
[0076] 安卓應(yīng)用安全評估系統(tǒng)500用于對潛藏于盜版應(yīng)用中的惡意代碼及其惡意行為 進行分析及評估,生成盜版安卓應(yīng)用運行安全性評估結(jié)果。
[0077] 安卓應(yīng)用監(jiān)測報告生成系統(tǒng)600用于對待監(jiān)測正版安卓應(yīng)用的所有疑似安卓應(yīng) 用中的正版應(yīng)用、舊版應(yīng)用、盜版應(yīng)用的下載量及其渠道來源進行統(tǒng)計,生成安卓應(yīng)用監(jiān)測 報告。
[0078] 安卓應(yīng)用數(shù)據(jù)庫400還包括基于安卓應(yīng)用開發(fā)商提供的正版安卓應(yīng)用構(gòu)建的正 版安卓應(yīng)用信息表、W及存儲用于甄別正版安卓應(yīng)用、歷史版本安卓應(yīng)用及盜版安卓應(yīng)用 的可調(diào)參數(shù)(即安卓應(yīng)用版本判定條件)的安卓應(yīng)用版本判定參數(shù)表。本發(fā)明安卓應(yīng)用版 本判定參數(shù)表包括用于甄別正版安卓應(yīng)用的第一判定條件、用于甄別歷史版本安卓應(yīng)用的 第二判定條件及用于甄別盜版安卓應(yīng)用的第Ξ判定條件;其中
[0079] 第一判定條件如下:曰1、應(yīng)用名稱相同;bl、安卓應(yīng)用安裝包的包名相同;cl、版本 信息相同;dl、簽名證書相同;
[0080] 第二判定條件如下:a2、應(yīng)用名稱相同;b2、安卓應(yīng)用安裝包的包名相同;c2、版本 信息不同;d2、簽名證書相同;
[0081] 第Ξ判定條件如下:a3、應(yīng)用名稱基本相似;b3、安卓應(yīng)用安裝包的包名相似;d3、 簽名證書不同;e、待監(jiān)測正版安卓應(yīng)用與疑似安卓應(yīng)用的代碼相似度不低于設(shè)定的代碼相 似度闊值(優(yōu)選為85%) ;f、待監(jiān)測正版安卓應(yīng)用與疑似安卓應(yīng)用的文本文件相似度不低 于設(shè)定的文本文件相似度闊值(優(yōu)選為60%) ;g、待監(jiān)測正版安卓應(yīng)用與疑似安卓應(yīng)用的 圖像文件相似度不低于設(shè)定的圖像文件相似度闊值(優(yōu)選為75% )。
[0082] 安卓應(yīng)用差異化分析系統(tǒng)300用于從正版安卓應(yīng)用信息表中選取待監(jiān)測正版安 卓應(yīng)用,根據(jù)輸入的篩選條件從安卓應(yīng)用信息表中篩選出與待監(jiān)測正版安卓應(yīng)用相關(guān)聯(lián)的 所有疑似安卓應(yīng)用,依照設(shè)定的安卓應(yīng)用版本判定條件對該疑似安卓應(yīng)用中的正版應(yīng)用、 舊版應(yīng)用及盜版應(yīng)用進行甄別。
[0083] 如圖2所示,本發(fā)明安卓應(yīng)用渠道監(jiān)測系統(tǒng)100包括若干個布設(shè)于國內(nèi)外不同區(qū) 域,采用分布式架構(gòu)設(shè)計,用于從各大渠道網(wǎng)站采集安卓應(yīng)用基本信息(包括應(yīng)用介紹信 息、應(yīng)用下載地址、開發(fā)商信息、應(yīng)用版本)的第一服務(wù)器集群101、W及布設(shè)于國內(nèi)外不同 區(qū)域,采用分布式架構(gòu)設(shè)計,用于根據(jù)第一服務(wù)器集群101提供的安卓應(yīng)用下載地址從安 卓應(yīng)用下載源下載安卓應(yīng)用安裝包的第二服務(wù)器集群102。第一服務(wù)器集群101及第二服 務(wù)器集群102均包括多臺云服務(wù)器。
[0084] 如圖3所示,本發(fā)明安卓應(yīng)用差異化分析系統(tǒng)300包括依次連接的選擇模塊301、 安卓應(yīng)用反編譯模塊302、安卓應(yīng)用相似度分析模塊303及安卓應(yīng)用版本判定模塊304。
[00化]選擇模塊301用于從正版安卓應(yīng)用信息表中選擇待監(jiān)測正版安卓應(yīng)用,根據(jù)輸入 的篩選條件從安卓應(yīng)用信息表中篩選出與待監(jiān)測正版安卓應(yīng)用相關(guān)聯(lián)的所有疑似安卓應(yīng) 用;
[0086] 安卓應(yīng)用反編譯模塊302用于對待監(jiān)測正版安卓應(yīng)用安裝包及疑似安卓應(yīng)用安 裝包進行反編譯,分別得到待監(jiān)測正版安卓應(yīng)用的包名、簽名證書、應(yīng)用名稱、資源文件、配 置文件及smali文件,W及疑似安卓應(yīng)用的包名、簽名證書、應(yīng)用名稱、資源文件、配置文件 及smali文件。
[0087] 安卓應(yīng)用相似度分析模塊303用于根據(jù)第一相似度計算公式計算待監(jiān)測正版安 卓應(yīng)用與疑似安卓應(yīng)用的每個文件的相似度及代碼相似度,W及用于根據(jù)第二相似度計算 公式計算待監(jiān)測正版安卓應(yīng)用與疑似安卓應(yīng)用的圖像文件相似度。
[0088] 安卓應(yīng)用版本判定模塊304用于參照設(shè)定的正版/歷史版本安卓應(yīng)用判定條件對 疑似安卓應(yīng)用中的正版應(yīng)用、舊版應(yīng)用進行甄別,W及基于待監(jiān)測正版安卓應(yīng)用與疑似安 卓應(yīng)用的文本文件相似度、代碼相似度及圖像文件相似度并結(jié)合設(shè)定的盜版安卓應(yīng)用判定 條件對疑似安卓應(yīng)用中的盜版應(yīng)用進行甄別。
[0089] 在本發(fā)明盜版安卓應(yīng)用甄別系統(tǒng)中:
[0090] 第一相似度計算公式如下:Xi= (1-J/D)*100% ;
[0091] Xi表示待監(jiān)測正版安卓應(yīng)用的其中一個文件與該款疑似安卓應(yīng)用的對比文件的 相似度; 陽092] i表示安卓應(yīng)用的文件編號順序;
[0093] J表示從源字符串至目標字符串需進行的編輯操作次數(shù);
[0094] D表示文件大小。 陽0巧]第二相似度計算公式如下:X2= α-Η〇/ιο)*ιοο% ;
[0096] Χ2表示待監(jiān)測正版安卓應(yīng)用及該款疑似安卓應(yīng)用之間的圖像相似度;
[0097] Η。表示平均漢明距離值,即待監(jiān)測正版安卓應(yīng)用及該款疑似安卓應(yīng)用的各個圖像 文件的漢明距離值的平均值。 陽〇9引實施例二
[0099] 本實施例掲示了一種基于實施例一所述的盜版安卓應(yīng)用甄別系統(tǒng)的盜版安卓應(yīng) 用甄別方法。如圖4所示,該方法的處理流程包括如下步驟:
[0100] 步驟101、本系統(tǒng)操作人員預(yù)先設(shè)置安卓應(yīng)用版本判定條件(包括用于甄別正版 安卓應(yīng)用的第一判定條件、用于甄別歷史版本安卓應(yīng)用的第二判定條件及用于甄別盜版安 卓應(yīng)用的第Ξ判定條件),將安卓應(yīng)用版本判定條件有關(guān)的參數(shù)數(shù)據(jù)存儲于安卓數(shù)據(jù)庫中 的安卓應(yīng)用版本判定參數(shù)表。 陽101] 本系統(tǒng)操作人員基于安卓應(yīng)用開發(fā)商提供的正版安卓應(yīng)用構(gòu)建一個正版安卓應(yīng) 用信息表,將正版安卓應(yīng)用信息表存儲于安卓數(shù)據(jù)庫。 陽102] 步驟102、通過安卓應(yīng)用渠道監(jiān)測系統(tǒng)100從各大渠道網(wǎng)站采集安卓應(yīng)用基本信 息,根據(jù)安卓應(yīng)用基本信息中的應(yīng)用下載地址從相關(guān)安卓應(yīng)用網(wǎng)站下載安卓應(yīng)用安裝包 (An化oid化ckage,ΑΡΚ),將采集的安卓應(yīng)用基本信息及下載的安卓應(yīng)用安裝包匯入安卓 應(yīng)用數(shù)據(jù)存儲中屯、200。 陽103] 步驟103、安卓應(yīng)用差異化分析系統(tǒng)300將來自安卓應(yīng)用數(shù)據(jù)存儲中屯、200的安卓 應(yīng)用數(shù)據(jù)轉(zhuǎn)存于安卓應(yīng)用數(shù)據(jù)庫400。
[0104] 步驟104、安卓應(yīng)用差異化分析系統(tǒng)300的選擇模塊301從正版安卓應(yīng)用信息表 中選擇待監(jiān)測正版應(yīng)用,根據(jù)輸入的篩選條件(包括應(yīng)用名稱、關(guān)鍵詞)從安卓應(yīng)用數(shù)據(jù)庫 400中篩選與待監(jiān)測正版安卓應(yīng)用相關(guān)聯(lián)的所有疑似安卓應(yīng)用(可W是應(yīng)用名稱與篩選條 件中的應(yīng)用名稱相似的安卓應(yīng)用,或者應(yīng)用介紹信息中包含該關(guān)鍵詞的安卓應(yīng)用)。
[01化]步驟105、安卓應(yīng)用反編譯模塊302對待監(jiān)測正版安卓應(yīng)用及其關(guān)聯(lián)的所有疑似 安卓應(yīng)用的安裝包進行反編譯,分別得到待監(jiān)測正版安卓應(yīng)用的包名、簽名證書、應(yīng)用名 稱、資源文件、配置文件及smali文件,W及各款疑似安卓應(yīng)用的包名、簽名證書、應(yīng)用名 稱、資源文件、配置文件及smali文件。 陽106] 步驟106、安卓應(yīng)用版本判定模塊304將待監(jiān)測正版安卓應(yīng)用的應(yīng)用名稱、包名、 簽名證書、資源文件、配置文件及smali文件與各款疑似安卓應(yīng)用的應(yīng)用名稱、包名、簽名 證書、資源文件、配置文件及smali文件分別進行比對。 陽107] 如待監(jiān)測正版安卓應(yīng)用的應(yīng)用名稱、包名、版本信息、簽名證書與某一款疑似安卓 應(yīng)用的應(yīng)用名稱、包名、版本信息、簽名證書分別對應(yīng)相同,則判定該款疑似安卓應(yīng)用為待 監(jiān)測正版安卓應(yīng)用的正版應(yīng)用。
[0108] 如待監(jiān)測正版安卓應(yīng)用的應(yīng)用名稱、包名、簽名證書與某款疑似安卓應(yīng)用的應(yīng)用 名稱、包名、簽名證書對應(yīng)相同,且待監(jiān)測正版安卓應(yīng)用的版本信息與該款疑似安卓應(yīng)用的 版本信息不同,則判定該款疑似安卓應(yīng)用為該款待監(jiān)測安卓應(yīng)用的歷史版本。
[0109] 如待監(jiān)測正版安卓應(yīng)用的應(yīng)用名稱、包名、簽名證書與某款疑似安卓應(yīng)用的應(yīng)用 名稱、包名、簽名證書各不相同,則進入步驟107。
[0110] 步驟107、通過安卓應(yīng)用相似度分析模塊303對待監(jiān)測正版安卓應(yīng)用及該款疑似 安卓應(yīng)用進行相似度分析,基于應(yīng)用相似度分析結(jié)果并結(jié)合設(shè)定的盜版安卓應(yīng)用判定條件 對該款疑似安卓應(yīng)用是否屬于盜版應(yīng)用進行綜合研判,將經(jīng)確認的盜版安卓應(yīng)用納入盜版 庫。
[0111] 步驟107包括W下幾個子步驟:
[0112] 步驟1071、通過第一相似度計算公式計算待監(jiān)測正版安卓應(yīng)用與該款疑似安卓應(yīng) 用的每個文件的相似度;其中
[0113] 第一相似度計算公式如下:Xi= (1-J/D)*100% ;
[0114] Xi表示待監(jiān)測正版安卓應(yīng)用的其中一個文件與該款疑似安卓應(yīng)用的對比文件的 相似度;
[0115] i表示安卓應(yīng)用的文件編號順序;
[0116] J表示從源字符串至目標字符串需進行的編輯操作次數(shù);
[0117] D表示文件大小;
[0118] 步驟1072、根據(jù)第一相似度公式計算兩款安卓應(yīng)用的各對文件的相似度值及各對 文件的相似度值的平均值,將所計算的相似度值的平均值作為待監(jiān)測正版安卓應(yīng)用與該款 疑似安卓應(yīng)用的文本文件相似度及代碼相似度;
[0119] 步驟1073、通過第二相似度計算公式計算待監(jiān)測正版安卓應(yīng)用與該款疑似安卓應(yīng) 用的圖像文件相似度;其中
[0120] 第二相似度計算公式如下:X2= α-Η〇/1〇)*1〇〇% ; 陽121] Χ2表示待監(jiān)測正版安卓應(yīng)用及該款疑似安卓應(yīng)用之間的圖像相似度;
[0122] Η。表示平均漢明距離值,即待監(jiān)測正版安卓應(yīng)用及該款疑似安卓應(yīng)用的各個圖像 文件的漢明距離值的平均值。
[0123] 其中,步驟1073中平均漢明距離值Η。的計算過程包括W下幾個子步驟:
[0124] S10731、將用于表征待監(jiān)測正版安卓應(yīng)用的第一個圖像文件及該款疑似安卓應(yīng)用 的對比圖像文件的相似度的第一漢明距離值設(shè)為Hi, Η為遞增變量,且Η的值默認為0 ;
[01巧]S10732、將待監(jiān)測正版安卓應(yīng)用的第一個圖像文件及疑似安卓應(yīng)用的對比圖像文 件分別縮小至8*8的圖片尺寸,對該縮小尺寸后的第一圖像文件及對比圖像文件分別進行 灰化處理; 陽1%] S10733、計算經(jīng)灰化處理的第一個圖像文件的每個像素的灰度及64個像素的灰 度平均值,將第一個圖像文件下的每個像素的灰度與64個像素的灰度平均值一一進行比 較,根據(jù)比較結(jié)果構(gòu)建由數(shù)字0及數(shù)字1組成的8*8形式的第一數(shù)字矩陣;
[0127] S10734、計算該疑似安卓應(yīng)用的對比圖像文件的各個像素的灰度及64個像素的 灰度平均值,將該對比圖像文件下的每個像素的灰度及64個像素的灰度平均值一一進行 比較,根據(jù)比較結(jié)果構(gòu)建由數(shù)字0及數(shù)字1組成的8*8形式的第二數(shù)字矩陣;
[0128] S10735、將第一數(shù)字矩陣與第二數(shù)字矩陣中坐標位置相同的數(shù)字逐一進行比對, 判斷該對數(shù)字是否相同,如不同,則將Hi的值加1 ; 陽129] 累計Hi的值;
[0130] 重復(fù)上述步驟,依次得到Hi。。。。。。&的值; 陽131] S10736、對Hi至Hw的值進行加權(quán)平均,得到H。; 陽132] H。的計算公式如下:
[0133] 其中,N表示待監(jiān)測正版安卓應(yīng)用及疑似安卓應(yīng)用的圖像文件的數(shù)量。
[0134] 步驟108、安卓應(yīng)用安全評估系統(tǒng)500對盜版庫中的盜版應(yīng)用的安全隱患(潛藏于 盜版應(yīng)用中的惡意代碼及其惡意行為)進行分析及評估,根據(jù)評估結(jié)果生成盜版安卓應(yīng)用 安全性分析報告。安卓應(yīng)用監(jiān)測報告生成系統(tǒng)600對待監(jiān)測正版安卓應(yīng)用的所有疑似安卓 應(yīng)用中的正版應(yīng)用、舊版應(yīng)用、盜版應(yīng)用的下載量及其渠道來源進行統(tǒng)計,生成安卓應(yīng)用監(jiān) 測報告。
[0135] 綜上所述,本發(fā)明盜版安卓應(yīng)用甄別方法及盜版安卓應(yīng)用甄別系統(tǒng)的優(yōu)點體現(xiàn) 于:
[0136] 1、本發(fā)明盜版安卓應(yīng)用甄別系統(tǒng)可根據(jù)應(yīng)用名稱及應(yīng)用監(jiān)測關(guān)鍵詞查找與待監(jiān) 測正版安卓應(yīng)用相關(guān)聯(lián)的所有疑似安卓應(yīng)用,對待監(jiān)測正版安卓應(yīng)用及其疑似安卓應(yīng)用進 行相似度分析(包括文本文件相似度分析、代碼相似度分析、圖像文件相似度分析),根據(jù) 相似度分析結(jié)果,并結(jié)合設(shè)定的盜版安卓應(yīng)用判定條件對疑似安卓應(yīng)用中的盜版應(yīng)用進行 綜合研判,相比現(xiàn)有的盜版安卓應(yīng)用判定技術(shù)而言,具有盜版應(yīng)用的甄別效率及準確率高, 誤判率極低的突出優(yōu)點。
[0137] 2、在本發(fā)明盜版安卓應(yīng)用甄別系統(tǒng)中,安卓應(yīng)用安全評估系統(tǒng)500可對盜版庫中 的盜版應(yīng)用的安全隱患(潛藏于盜版應(yīng)用中的惡意代碼及其惡意行為)進行分析及評估, 根據(jù)評估結(jié)果生成盜版安卓應(yīng)用安全性分析報告,故本系統(tǒng)可羅列盜版安卓應(yīng)用并出具盜 版安卓應(yīng)用安全性分析報告供用戶參考,避免用戶下載盜版安卓應(yīng)用并蒙受損失。
[0138] 3、在本發(fā)明安卓應(yīng)用監(jiān)測報告生成系統(tǒng)600中,安卓應(yīng)用差異化分析系統(tǒng)300可 對待監(jiān)測正版安卓應(yīng)用的所有疑似安卓應(yīng)用中的正版應(yīng)用、舊版應(yīng)用及盜版應(yīng)用進行快 速、有效地甄別,安卓應(yīng)用監(jiān)測報告生成系統(tǒng)600可基于安卓應(yīng)用差異化分析系統(tǒng)300的甄 別結(jié)果對待監(jiān)測正版安卓應(yīng)用中的正版應(yīng)用、舊版應(yīng)用、盜版應(yīng)用的總下載量及各自的渠 道來源進行統(tǒng)計,出具待監(jiān)測正版安卓應(yīng)用的下載使用情況監(jiān)測報告,便于正版安卓應(yīng)用 開發(fā)商維權(quán)。
[0139] 本領(lǐng)域普通技術(shù)人員可W理解實現(xiàn)上述實施例方法中的全部或部分環(huán)節(jié),是可W 通過計算機程序來指令相關(guān)的硬件來完成,所述的程序可存儲于一計算機可讀取存儲介質(zhì) 中,該程序在執(zhí)行時,可包括如上述各方法的實施例的環(huán)節(jié)。其中,所述的存儲介質(zhì)可為磁 碟、光盤、只讀存儲記憶體巧ead化ly Memo巧,ROM)或隨機存儲記憶體(Random Access Memoir, RAM)等。
[0140] 上面結(jié)合附圖對本發(fā)明的實施例進行了描述,但是本發(fā)明并不局限于上述的具體 實施方式,上述的【具體實施方式】僅僅是示意性的,而不是限制性的,本領(lǐng)域的普通技術(shù)人員 在本發(fā)明的啟示下,在不脫離本發(fā)明宗旨和權(quán)利要求所保護的范圍情況下,還可做出很多 形式,運些均屬于本發(fā)明的保護之內(nèi)。
【主權(quán)項】
1. 一種盜版安卓應(yīng)用甄別方法,其特征在于,所述方法包括如下步驟: 51、 采集由各大安卓應(yīng)用渠道網(wǎng)站發(fā)布的安卓應(yīng)用基本信息,根據(jù)安卓應(yīng)用基本信息 中的應(yīng)用下載地址從相關(guān)下載源下載安卓應(yīng)用安裝包,將采集的安卓應(yīng)用基本信息及下載 的安卓應(yīng)用安裝包匯總至安卓應(yīng)用數(shù)據(jù)存儲中屯、; 52、 基于匯入安卓應(yīng)用數(shù)據(jù)存儲中屯、的海量安卓應(yīng)用數(shù)據(jù)構(gòu)建包含應(yīng)用名稱、應(yīng)用介 紹信息及版本信息的安卓應(yīng)用數(shù)據(jù)庫; 53、 從正版安卓應(yīng)用表中選擇待監(jiān)測正版安卓應(yīng)用,根據(jù)輸入的篩選條件從安卓應(yīng)用 數(shù)據(jù)庫中篩選出與待監(jiān)測正版安卓應(yīng)用相關(guān)聯(lián)的所有疑似安卓應(yīng)用,并依照設(shè)定的安卓應(yīng) 用版本判定條件對該疑似安卓應(yīng)用中的正版應(yīng)用、舊版應(yīng)用及盜版應(yīng)用逐一進行甄別。2. 根據(jù)權(quán)利要求1所述的盜版安卓應(yīng)用甄別方法,其特征在于,在所述步驟Sl之前還 包括如下步驟: 501、 基于安卓應(yīng)用開發(fā)商提供的正版安卓應(yīng)用構(gòu)建正版安卓應(yīng)用信息表; 502、 設(shè)定用于甄別正版安卓應(yīng)用的第一判定條件、用于甄別歷史版本安卓應(yīng)用的第二 判定條件及用于甄別盜版安卓應(yīng)用的第=判定條件;其中 所述第一判定條件如下:al、應(yīng)用名稱相同;bl、安卓應(yīng)用安裝包的包名相同;cl、版本 信息相同;dl、簽名證書相同; 所述第二判定條件如下:a2、應(yīng)用名稱相同;b2、安卓應(yīng)用安裝包的包名相同;c2、版本 信息不同;d2、簽名證書相同; 所述第=判定條件如下:曰3、應(yīng)用名稱相似;b3、安卓應(yīng)用安裝包的包名相似;d3、簽名 證書不同;e、待監(jiān)測正版安卓應(yīng)用與疑似安卓應(yīng)用的代碼相似度不低于設(shè)定的代碼相似度 闊值;f、待監(jiān)測正版安卓應(yīng)用與疑似安卓應(yīng)用的文本文件相似度不低于設(shè)定的文本文件相 似度闊值;g、待監(jiān)測正版安卓應(yīng)用與疑似安卓應(yīng)用的圖像文件相似度不低于設(shè)定的圖像文 件相似度闊值。3. 根據(jù)權(quán)利要求2所述的盜版安卓應(yīng)用甄別方法,其特征在于,所述步驟S3中根據(jù)輸 入的篩選條件從安卓應(yīng)用信息表中篩選出與待監(jiān)測正版安卓應(yīng)用相關(guān)聯(lián)的所有疑似安卓 應(yīng)用的步驟包括: 將待監(jiān)測正版安卓應(yīng)用的應(yīng)用名稱、設(shè)定的應(yīng)用監(jiān)測關(guān)鍵字作為檢索條件在安卓應(yīng)用 信息表中檢索與該應(yīng)用名稱相似的安卓應(yīng)用,或者應(yīng)用介紹信息中包含該應(yīng)用名稱和/或 該應(yīng)用監(jiān)測關(guān)鍵字的安卓應(yīng)用,將檢索到的安卓應(yīng)用定義為待監(jiān)測正版安卓應(yīng)用的疑似安 卓應(yīng)用。4. 根據(jù)權(quán)利要求3所述的盜版安卓應(yīng)用甄別方法,其特征在于,所述步驟S3中依照設(shè) 定的安卓應(yīng)用版本判定條件對該疑似安卓應(yīng)用中的正版應(yīng)用、舊版應(yīng)用及盜版應(yīng)用逐一進 行甄別的步驟包括: 對待監(jiān)測正版安卓應(yīng)用及所有疑似安卓應(yīng)用進行反編譯,分別得到待監(jiān)測正版安卓應(yīng) 用的包名、簽名證書、應(yīng)用名稱、資源文件、配置文件及smali文件,W及各款疑似安卓應(yīng)用 的包名、簽名證書、應(yīng)用名稱、資源文件、配置文件及smali文件; 將待監(jiān)測正版安卓應(yīng)用的應(yīng)用名稱、包名、簽名證書、資源文件、配置文件及smali文 件與各款疑似安卓應(yīng)用的應(yīng)用名稱、包名、簽名證書、資源文件、配置文件及smali文件分 別進行比對; 如待監(jiān)測正版安卓應(yīng)用的應(yīng)用名稱、包名、版本信息、簽名證書與某一款疑似安卓應(yīng)用 的應(yīng)用名稱、包名、版本信息、簽名證書分別對應(yīng)相同,則判定該款疑似安卓應(yīng)用為待監(jiān)測 正版安卓應(yīng)用的正版; 如待監(jiān)測正版安卓應(yīng)用的應(yīng)用名稱、包名、簽名證書與某款疑似安卓應(yīng)用的應(yīng)用名稱、 包名、簽名證書對應(yīng)相同,且待監(jiān)測正版安卓應(yīng)用的版本信息與該款疑似安卓應(yīng)用的版本 信息不同,則判定該款疑似安卓應(yīng)用為該款待監(jiān)測安卓應(yīng)用的歷史版本; 如待監(jiān)測正版安卓應(yīng)用的應(yīng)用名稱、包名、簽名證書與某款疑似安卓應(yīng)用的應(yīng)用名稱、 包名、簽名證書各不相同,則對待監(jiān)測正版安卓應(yīng)用及該款疑似安卓應(yīng)用進行相似度分析, 基于應(yīng)用相似度分析結(jié)果并結(jié)合預(yù)設(shè)的盜版安卓應(yīng)用判定條件對該款疑似安卓應(yīng)用是否 屬于盜版應(yīng)用進行綜合研判。5. 根據(jù)權(quán)利要求4所述的盜版安卓應(yīng)用甄別方法,其特征在于,安卓應(yīng)用相似度分析 包括文本文件相似度分析、代碼相似度分析及圖像文件相似度分析; 所述對待監(jiān)測正版安卓應(yīng)用及該款疑似安卓應(yīng)用進行相似度分析的步驟包括: 通過第一相似度計算公式計算待監(jiān)測正版安卓應(yīng)用與該款疑似安卓應(yīng)用的每個文件 的相似度及代碼相似度;其中 第一相似度計算公式如下單二(1-J/D)*100% ; Xi表示待監(jiān)測正版安卓應(yīng)用的其中一個文件與該款疑似安卓應(yīng)用的對比文件的相似 度; i表示安卓應(yīng)用的文件編號順序; J表示從源字符串至目標字符串需進行的編輯操作次數(shù); D表示文件大??; 根據(jù)第一相似度公式計算兩款安卓應(yīng)用的各對文件的相似度值及各對文件的相似度 值的平均值,將所計算的相似度值的平均值作為待監(jiān)測正版安卓應(yīng)用與該款疑似安卓應(yīng)用 的文本文件相似度及代碼相似度。6. 根據(jù)權(quán)利要求5所述的盜版安卓應(yīng)用甄別方法,其特征在于,所述對待監(jiān)測正版安 卓應(yīng)用及該款疑似安卓應(yīng)用進行相似度分析的步驟還包括: 通過第二相似度計算公式計算待監(jiān)測正版安卓應(yīng)用與該款疑似安卓應(yīng)用的圖像文件 相似度;其中 第二相似度計算公式如下:X2= (l-H〇/10)*100% ; X2表示待監(jiān)測正版安卓應(yīng)用及該款疑似安卓應(yīng)用之間的圖像相似度; H。表示平均漢明距離值,即待監(jiān)測正版安卓應(yīng)用及該款疑似安卓應(yīng)用的各個圖像文件 的漢明距離值的平均值。7. 根據(jù)權(quán)利要求6所述的盜版安卓應(yīng)用甄別方法,其特征在于,平均漢明距離值H。的 計算過程包括如下步驟: 將用于表征待監(jiān)測正版安卓應(yīng)用的第一個圖像文件及該款疑似安卓應(yīng)用的對比圖像 文件的相似度的第一漢明距離值設(shè)為Hi, H為遞增變量,且H的值默認為O ; 將待監(jiān)測正版安卓應(yīng)用的第一個圖像文件及疑似安卓應(yīng)用的對比圖像文件分別縮小 至8*8的圖片尺寸,對該縮小尺寸后的第一圖像文件及對比圖像文件分別進行灰化處理; 計算經(jīng)灰化處理的第一個圖像文件的每個像素的灰度及64個像素的灰度平均值,將 第一個圖像文件下的每個像素的灰度與64個像素的灰度平均值一一進行比較,根據(jù)比較 結(jié)果構(gòu)建由數(shù)字O及數(shù)字1組成的8*8形式的第一數(shù)字矩陣; 計算該疑似安卓應(yīng)用的對比圖像文件的各個像素的灰度及64個像素的灰度平均值, 將該對比圖像文件下的每個像素的灰度及64個像素的灰度平均值一一進行比較,根據(jù)比 較結(jié)果構(gòu)建由數(shù)字O及數(shù)字1組成的8*8形式的第二數(shù)字矩陣; 將第一數(shù)字矩陣與第二數(shù)字矩陣中坐標位置相同的數(shù)字逐一進行比對,判斷該對數(shù)字 是否相同,如不同,則將Hi的值加1 ; 累計Hi的值; 重復(fù)上述步驟,依次得到Hi。。。。。。&的值; 對H產(chǎn)H W的值進行加權(quán)平均,得到H。; H。的計算公式如下:其中,N表示待監(jiān)測正版安卓應(yīng)用及疑似安卓應(yīng)用的圖像文件的數(shù)量。8. -種盜版安卓應(yīng)用甄別系統(tǒng),其特征在于,所述系統(tǒng)包括: 安卓應(yīng)用渠道監(jiān)測系統(tǒng),用于從各大安卓應(yīng)用渠道網(wǎng)站采集各款安卓應(yīng)用的基本信 息,根據(jù)安卓應(yīng)用基本信息中的應(yīng)用下載地址從相關(guān)下載源下載安卓應(yīng)用安裝包; 安卓應(yīng)用數(shù)據(jù)存儲中屯、,用于對安卓應(yīng)用渠道監(jiān)測系統(tǒng)采集的安卓應(yīng)用基本信息及下 載的安卓應(yīng)用安裝包進行集中存儲; 安卓應(yīng)用數(shù)據(jù)庫,包括基于安卓應(yīng)用開發(fā)商提供的正版安卓應(yīng)用所構(gòu)建的正版安卓應(yīng) 用信息表,用于接收來自安卓應(yīng)用數(shù)據(jù)存儲中屯、的海量安卓應(yīng)用數(shù)據(jù),基于海量安卓應(yīng)用 數(shù)據(jù)構(gòu)建包含應(yīng)用名稱、應(yīng)用介紹信息及版本信息的安卓應(yīng)用信息表; 安卓應(yīng)用差異化分析系統(tǒng),用于從安卓應(yīng)用數(shù)據(jù)庫的正版安卓應(yīng)用信息表中選擇待監(jiān) 測正版安卓應(yīng)用,根據(jù)輸入的篩選條件從該安卓應(yīng)用信息表中篩選出與待監(jiān)測正版安卓應(yīng) 用相關(guān)聯(lián)的所有疑似安卓應(yīng)用,并依照設(shè)定的安卓應(yīng)用版本判定條件對該疑似安卓應(yīng)用中 的正版應(yīng)用、舊版應(yīng)用及盜版應(yīng)用逐一進行甄別。9. 根據(jù)權(quán)利要求8所述的盜版安卓應(yīng)用甄別系統(tǒng),其特征在于,所述安卓應(yīng)用渠道監(jiān) 測系統(tǒng)包括布設(shè)于國內(nèi)外不同區(qū)域,采用分布式架構(gòu)設(shè)計,用于從安卓應(yīng)用渠道網(wǎng)站采集 安卓應(yīng)用頁面信息的第一服務(wù)器集群、布設(shè)于國內(nèi)外不同區(qū)域,采用分布式架構(gòu)設(shè)計,用于 根據(jù)該第一服務(wù)器集群爬取到的安卓應(yīng)用下載地址從相應(yīng)下載源下載安卓應(yīng)用安裝包的 第二服務(wù)器集群。10. 根據(jù)權(quán)利要求9所述的盜版安卓應(yīng)用甄別系統(tǒng),其特征在于,所述安卓應(yīng)用差異化 分析系統(tǒng)包括: 選擇模塊,用于從正版安卓應(yīng)用信息表中選擇待監(jiān)測正版安卓應(yīng)用,根據(jù)輸入的篩選 條件從安卓應(yīng)用信息表中篩選出與待監(jiān)測正版安卓應(yīng)用相關(guān)聯(lián)的所有疑似安卓應(yīng)用; 安卓應(yīng)用反編譯模塊,用于對待監(jiān)測正版安卓應(yīng)用安裝包及疑似安卓應(yīng)用安裝包進行 反編譯,分別得到待監(jiān)測正版安卓應(yīng)用的包名、簽名證書、應(yīng)用名稱、資源文件、配置文件及 smali文件,W及疑似安卓應(yīng)用的包名、簽名證書、應(yīng)用名稱、資源文件、配置文件及smali 文件; 安卓應(yīng)用相似度分析模塊,用于根據(jù)第一相似度計算公式計算待監(jiān)測正版安卓應(yīng)用與 疑似安卓應(yīng)用的每個文件的相似度及代碼相似度,W及用于根據(jù)第二相似度計算公式計算 待監(jiān)測正版安卓應(yīng)用與疑似安卓應(yīng)用的圖像文件相似度; 安卓應(yīng)用版本判定模塊,用于參照設(shè)定的正版/歷史版本安卓應(yīng)用判定條件對疑似安 卓應(yīng)用中的正版應(yīng)用、舊版應(yīng)用進行甄別,W及基于安卓應(yīng)用相似度分析模塊提供的待監(jiān) 測正版安卓應(yīng)用與疑似安卓應(yīng)用的文本文件相似度、代碼相似度及圖像文件相似度并結(jié)合 設(shè)定的盜版安卓應(yīng)用判定條件對疑似安卓應(yīng)用中的盜版應(yīng)用進行甄別。
【文檔編號】G06F21/12GK105989251SQ201510075472
【公開日】2016年10月5日
【申請日】2015年2月12日
【發(fā)明人】周建寧, 劉志誠, 王巍, 吳卓坤, 霍要峰, 陳文博, 王剛, 勞劍明
【申請人】卓望數(shù)碼技術(shù)(深圳)有限公司