換,并對尺度變換后的所述第一圖片庫和第二圖片庫中每張圖片做離散余弦變換DCT,獲取所述第一圖片庫和第二圖片庫中每張圖片的hash特征值。9.根據(jù)權(quán)利要求7所述的方法,其特征在于,所述根據(jù)第一預(yù)設(shè)規(guī)則,從待檢測視頻中提取多張?zhí)卣鲌D片作為第二圖片庫,包括: 根據(jù)預(yù)設(shè)的時間間隔從待檢測視頻中提取多張?zhí)卣鲌D片作為第二圖片庫。10.根據(jù)權(quán)利要求7所述的方法,其特征在于,確定所述待檢測視頻為盜版視頻后,所述方法還包括: 根據(jù)第二預(yù)設(shè)規(guī)則,從待檢測視頻中提取多張?zhí)卣鲌D片作為第二圖片庫,第一圖片庫為已保存的從正版視頻中提取出的多張?zhí)卣鲌D片;采用局部二值模式LBP算法,分別確定所述第一圖片庫和第二圖片庫中每張圖片上每個像素點的LBP值,并根據(jù)每個像素點的LBP值繪制LBP值直方圖;將所述第一圖片庫中每張圖片和第二圖片庫中每張圖片的LBP值直方圖進行重疊,針對每對圖片確定重疊區(qū)域中像素點的數(shù)量,確定重疊區(qū)域中像素點的數(shù)量的平均值,根據(jù)所述平均值及所述圖片像素點的數(shù)量,獲得所述第一圖片庫和第二圖片庫的相似度;判斷所述相似度是否大于預(yù)設(shè)第三閾值,如果是,確定所述待檢測視頻為盜版視頻。11.根據(jù)權(quán)利要求7所述的方法,其特征在于,所述確定所述待檢測視頻為盜版視頻后,所述方法還包括: 根據(jù)第三預(yù)設(shè)規(guī)則,從待檢測視頻中提取多張?zhí)卣鲌D片作為第二圖片庫,第一圖片庫為已保存的從正版視頻中提取出的多張?zhí)卣鲌D片;采用結(jié)構(gòu)相似性SSIM算法,確定所述第一圖片庫中每張圖片和第二圖片庫中每張圖片之間的每個SSIM值,并根據(jù)所述多個SSIM值,計算所述第一圖片庫和第二圖片庫的相似度;判斷所述相似度是否大于預(yù)設(shè)第四閾值,如果是,確定所述待檢測視頻為盜版視頻。12.根據(jù)權(quán)利要求7所述的方法,其特征在于,所述確定所述待檢測視頻為盜版視頻后,所述方法還包括: 根據(jù)第四預(yù)設(shè)規(guī)則,從待檢測視頻中提取多張?zhí)卣鲌D片作為第二圖片庫,第一圖片庫為已保存的從正版視頻中提取出的多張?zhí)卣鲌D片;采用加速健壯特征SURF算法,確定所述第一圖片庫和第二圖片庫中每張圖片上的多個極值點,針對第一圖片庫中的每張圖片的每個極值點,計算該極值點和第二圖片庫中每張圖片的每個極值點之間的歐式距離,若所述歐式距離的最小值小于預(yù)設(shè)第五閾值,則確定第二圖片庫的圖片中存在與該極值點匹配的極值點,并記錄第一圖片庫中的該極值點;統(tǒng)計記錄的第一圖片庫中的極值點的數(shù)量;判斷所述數(shù)量是否大于預(yù)設(shè)數(shù)量閾值,如果是,則確定所述待檢測視頻為盜版視頻。13.一種相似視頻的檢測裝置,其特征在于,所述裝置包括: 圖片庫獲取模塊,用于根據(jù)第一預(yù)設(shè)規(guī)則,從兩個待檢測視頻中分別提取多張?zhí)卣鲌D片作為第一圖片庫和第二圖片庫; hash特征值確定模塊,用于確定所述第一圖片庫和第二圖片庫中每張圖片的hash特征值; 相似圖片確定模塊,用于根據(jù)所述第一圖片庫和第二圖片庫中每張圖片的hash特征值,確定所述第一圖片庫中每張圖片和第二圖片庫中每張圖片之間的每個漢明距離,針對每個漢明距離,判斷所述漢明距離是否小于預(yù)設(shè)第一閾值,如果是,確定對應(yīng)該漢明距離的所述第一圖片庫和第二圖片庫中的圖片為一組相似圖片; 相似視頻確定模塊,用于統(tǒng)計所述第一圖片庫和第二圖片庫中相似圖片的組數(shù),并判斷所述第一圖片庫和第二圖片庫中相似圖片的組數(shù)與對比數(shù)量總量的比值是否大于預(yù)設(shè)第二閾值,如果是,則確定所述兩個待檢測視頻為相似視頻,其中所述對比數(shù)量總量為所述第一圖片庫中的圖片數(shù)量和第二圖片庫中的圖片數(shù)量的乘積。14.根據(jù)權(quán)利要求13所述的裝置,其特征在于,所述hash特征值確定模塊,具體用于: 將所述第一圖片庫和第二圖片庫中每張圖片,按照預(yù)設(shè)值進行尺度變換,并對尺度變換后的所述第一圖片庫和第二圖片庫中每張圖片做離散余弦變換DCT,獲取所述第一圖片庫和第二圖片庫中每張圖片的hash特征值。15.根據(jù)權(quán)利要求13所述的裝置,其特征在于,所述圖片庫獲取模塊,具體用于: 根據(jù)預(yù)設(shè)的時間間隔從兩個待檢測視頻中分別提取多張?zhí)卣鲌D片作為第一圖片庫和第二圖片庫。16.根據(jù)權(quán)利要求13所述的裝置,其特征在于,所述裝置還包括第一確定模塊,具體用于: 根據(jù)第二預(yù)設(shè)規(guī)則,從兩個待檢測視頻中分別提取多張?zhí)卣鲌D片作為第一圖片庫和第二圖片庫;采用局部二值模式LBP算法,分別確定所述第一圖片庫和第二圖片庫中每張圖片上每個像素點的LBP值,并根據(jù)每個像素點的LBP值繪制LBP值直方圖;將所述第一圖片庫中每張圖片和第二圖片庫中每張圖片的LBP值直方圖進行重疊,針對每對圖片確定重疊區(qū)域中像素點的數(shù)量,確定重疊區(qū)域中像素點的數(shù)量的平均值,根據(jù)所述平均值及所述圖片像素點的數(shù)量,確定所述第一圖片庫和第二圖片庫的相似度;判斷所述相似度是否大于預(yù)設(shè)第三閾值,如果是,確定所述兩個待檢測視頻為相似視頻。17.根據(jù)權(quán)利要求13所述的裝置,其特征在于,所述裝置還包括第二確定模塊,具體用于: 根據(jù)第三預(yù)設(shè)規(guī)則,從兩個待檢測視頻中分別提取多張?zhí)卣鲌D片作為第一圖片庫和第二圖片庫;采用結(jié)構(gòu)相似性SS頂算法,確定所述第一圖片庫中每張圖片和第二圖片庫中中每張圖片之間的每個SSIM值,并根據(jù)所述多個SSIM值,計算所述第一圖片庫和第二圖片庫的相似度;判斷所述相似度是否大于預(yù)設(shè)第四閾值,如果是,確定所述兩個待檢測視頻為相似視頻。18.根據(jù)權(quán)利要求13所述的裝置,其特征在于,所述裝置還包括第三確定模塊,具體用于: 根據(jù)第四預(yù)設(shè)規(guī)則,從兩個待檢測視頻中分別提取多張?zhí)卣鲌D片作為第一圖片庫和第二圖片庫;采用加速健壯特征SURF算法,確定所述第一圖片庫和第二圖片庫中每張圖片上的多個極值點,針對第一圖片庫中的每張圖片的每個極值點,計算該極值點和第二圖片庫每張圖片的每個極值點之間的歐式距離,若所述歐式距離的最小值小于預(yù)設(shè)第五閾值,則確定第二圖片庫的圖片中存在與該極值點匹配的極值點,并記錄第一圖片庫中的該極值點;統(tǒng)計記錄的第一圖片庫中的極值點的數(shù)量;判斷所述數(shù)量是否大于預(yù)設(shè)數(shù)量閾值,如果是,則確定所述兩個待檢測視頻為相似視頻。19.一種盜版視頻的檢測裝置,其特征在于,所述裝置包括: 待檢測視頻獲取模塊,用于獲取待檢測視頻; 圖片庫獲取模塊,用于根據(jù)第一預(yù)設(shè)規(guī)則,從待檢測視頻中提取多張?zhí)卣鲌D片作為第一.圖片庫; hash特征值確定模塊,用于確定所述第一圖片庫和第二圖片庫中每張圖片的hash特征值,其中所述第一圖片庫為從正版視頻中提取出的多張?zhí)卣鲌D片構(gòu)成的; 相似圖片確定模塊,用于根據(jù)所述第一圖片庫和第二圖片庫中每張圖片的hash特征值,確定所述第一圖片庫中每張圖片和第二圖片庫中每張圖片之間的每個漢明距離,針對每個漢明距離,判斷所述漢明距離是否小于預(yù)設(shè)第一閾值,如果是,確定對應(yīng)該漢明距離的所述第一圖片庫和第二圖片庫中的圖片為一組相似圖片; 盜版視頻確定模塊,用于統(tǒng)計所述第一圖片庫和第二圖片庫中相似圖片的組數(shù),并判斷所述第一圖片庫和第二圖片庫中相似圖片的組數(shù)與對比數(shù)量總量的比值是否大于預(yù)設(shè)第二閾值,如果是,則確定所述待檢測視頻為盜版視頻,其中所述對比數(shù)量總量為所述第一圖片庫中的圖片數(shù)量和第二圖片庫中的圖片數(shù)量的乘積。20.根據(jù)權(quán)利要求19所述的裝置,其特征在于,所述hash特征值確定模塊,具體用于: 將所述第一圖片庫和第二圖片庫中每張圖片,按照預(yù)設(shè)值進行尺度變換,并對尺度變換后的所述第一圖片庫和第二圖片庫中每張圖片做離散余弦變換DCT,獲取所述第一圖片庫和第二圖片庫中每張圖片的hash特征值。21.根據(jù)權(quán)利要求19所述的裝置,其特征在于,所述圖片庫獲取模塊,具體用于: 根據(jù)預(yù)設(shè)的時間間隔從待檢測視頻中提取多張?zhí)卣鲌D片作為第二圖片庫。22.根據(jù)權(quán)利要求19所述的裝置,其特征在于,所述裝置還包括第四確定模塊,具體用于: 根據(jù)第二預(yù)設(shè)規(guī)則,從待檢測視頻中提取多張?zhí)卣鲌D片作為第二圖片庫,第一圖片庫為已保存的從正版視頻中提取出的多張?zhí)卣鲌D片;采用局部二值模式LBP算法,分別確定所述第一圖片庫和第二圖片庫中每張圖片上每個像素點的LBP值,并根據(jù)每個像素點的LBP值繪制LBP值直方圖;將所述第一圖片庫中每張圖片和第二圖片庫中每張圖片的LBP值直方圖進行重疊,針對每對圖片確定重疊區(qū)域中像素點的數(shù)量,確定重疊區(qū)域中像素點的數(shù)量的平均值,根據(jù)所述平均值及所述圖片像素點的數(shù)量,獲得所述第一圖片庫和第二圖片庫的相似度;判斷所述相似度是否大于預(yù)設(shè)第三閾值,如果是,確定所述待檢測視頻為盜版視頻。23.根據(jù)權(quán)利要求19所述的裝置,其特征在于,所述裝置還包括第五確定模塊,具體用于: 根據(jù)第三預(yù)設(shè)規(guī)則,從待檢測視頻中提取多張?zhí)卣鲌D片作為第二圖片庫,第一圖片庫為已保存的從正版視頻中提取出的多張?zhí)卣鲌D片;采用結(jié)構(gòu)相似性SSIM算法,確定所述第一圖片庫中每張圖片和第二圖片庫中每張圖片之間的每個SSIM值,并根據(jù)所述多個SSIM值,計算所述第一圖片庫和第二圖片庫的相似度;判斷所述相似度是否大于預(yù)設(shè)第四閾值,如果是,確定所述待檢測視頻為盜版視頻。24.根據(jù)權(quán)利要求19所述的裝置,其特征在于,所述裝置還包括第六確定模塊,具體用于: 根據(jù)第四預(yù)設(shè)規(guī)則,從待檢測視頻中提取多張?zhí)卣鲌D片作為第二圖片庫,第一圖片庫為已保存的從正版視頻中提取出的多張?zhí)卣鲌D片;采用加速健壯特征SURF算法,確定所述第一圖片庫和第二圖片庫中每張圖片上的多個極值點,針對第一圖片庫中的每張圖片的每個極值點,計算該極值點和第二圖片庫中每張圖片的每個極值點之間的歐式距離,若所述歐式距離的最小值小于預(yù)設(shè)第五閾值,則確定第二圖片庫的圖片中存在與該極值點匹配的極值點,并記錄第一圖片庫中的該極值點;統(tǒng)計記錄的第一圖片庫中的極值點的數(shù)量;判斷所述數(shù)量是否大于預(yù)設(shè)數(shù)量閾值,如果是,則確定所述待檢測視頻為盜版視頻。
【專利摘要】本發(fā)明實施例提供了一種相似視頻和盜版視頻的檢測方法及裝置,盜版視頻的檢測方法包括:獲取待檢測視頻;根據(jù)預(yù)設(shè)規(guī)則,從待檢測視頻中提取多張?zhí)卣鲌D片作為第二圖片庫;確定第一圖片庫和第二圖片庫中每張圖片的hash特征值,第一圖片庫為從正版視頻中提取出的多張?zhí)卣鲌D片構(gòu)成的;根據(jù)所述每張圖片的hash特征值確定每兩張圖片之間的漢明距離;確定對應(yīng)小于預(yù)設(shè)第一閾值的漢明距離的圖片為一組相似圖片;當相似圖片的組數(shù)與對比數(shù)量總量的比值大于預(yù)設(shè)第二閾值時,確定待檢測視頻為盜版視頻。所述方法通過對比視頻中的圖片是否相似,并根據(jù)相似圖片在對比圖片總量中的比例來判斷待檢測視頻是否為盜版視頻,大大提高了盜版視頻的檢測效率。
【IPC分類】H04N21/442, H04N21/234, H04N21/44
【公開號】CN105681899
【申請?zhí)枴緾N201511032299
【發(fā)明人】李亞寧
【申請人】北京奇藝世紀科技有限公司
【公開日】2016年6月15日
【申請日】2015年12月31日