国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      利用曲線匹配和信息對(duì)齊的粉碎文件重構(gòu)方法

      文檔序號(hào):8224147閱讀:490來源:國知局
      利用曲線匹配和信息對(duì)齊的粉碎文件重構(gòu)方法
      【技術(shù)領(lǐng)域】
      [0001] 本發(fā)明屬于信息安全領(lǐng)域、信號(hào)與信息處理技術(shù),設(shè)及到粉碎文件重構(gòu)中利用曲 線匹配和信息對(duì)齊進(jìn)行文件碎片重構(gòu)方法。
      【背景技術(shù)】
      [0002] 為防止重要信息外泄,通常采用的方法是使用碎紙機(jī)將文件粉碎,因此司法取證 部口常常需要恢復(fù)毀壞的文件用于案件分析。2011年,美國國防部組織一項(xiàng)名為"DARPA碎 紙機(jī)挑戰(zhàn)"的競(jìng)賽用于鼓勵(lì)粉碎文件重構(gòu)問題的研究,并為第一名提供5萬美元的獎(jiǎng)勵(lì)。此 項(xiàng)競(jìng)賽共包括五個(gè)題目,其難度不斷增加,由200片至6000片彩色掃描文件碎片構(gòu)成,該五 個(gè)題目也成為測(cè)試文件重構(gòu)算法性能的標(biāo)準(zhǔn)測(cè)試集之一。
      [0003] 針對(duì)文件或圖像重構(gòu)類的問題已有較多公開發(fā)表的算法,但對(duì)碎紙機(jī)粉碎的文件 重構(gòu)問題的解決仍然十分困難。首先是文件碎片的尺寸和形狀,碎片尺寸一般在3mmX6mm 左右,碎紙機(jī)使用者希望碎片尺寸足夠小來避免信息泄露的可能。另外,由于碎紙機(jī)的機(jī)械 結(jié)構(gòu)比較固定,文件碎片的形狀十分相近,該對(duì)于使用形狀特征重構(gòu)文件的難度大大增加; 其次,紙張?jiān)诜鬯檫^程中產(chǎn)生形變也增加了重構(gòu)的難度,形變主要存在于碎片的邊緣。由于 粉碎之后還需掃描成數(shù)字圖像,存在的碎片丟失,顏色變化W及碎片重疊等問題均增加了 文件重構(gòu)的難度;第=,在文件恢復(fù)過程中還需要考慮文件碎片的數(shù)量,數(shù)量越大恢復(fù)的難 度越大。盡管在數(shù)字文件恢復(fù)過程中有較多自動(dòng)復(fù)原的算法(如硬盤數(shù)據(jù)的文件恢復(fù)),該 些算法應(yīng)用在文件碎片重構(gòu)中不但耗費(fèi)大量時(shí)間而且運(yùn)算結(jié)果不穩(wěn)定,很難得到正確的文 件圖像,因此在碎片拼接過程中需要更多的人工干預(yù)才能完成。總之,粉碎文件重構(gòu)是一個(gè) 十分復(fù)雜的過程,需要計(jì)算機(jī)的識(shí)別和人工篩選。
      [0004] 近年來也有許多學(xué)者提出了粉碎文件重構(gòu)的算法。P. Butler等人在2012年的 IEEE Symposium on Visual Analytics Science and Technology會(huì)議上發(fā)表的論文"The Deshredder:A Visual Analytic Approach to Reconstructing Shredded Documents"中 使用由距離構(gòu)成的Luma時(shí)間序列來描述碎片的形狀,將碎片進(jìn)行傾斜矯正之后,將Luma序 列中的峰值點(diǎn)作為特征并利用化amfer相似性度量的方法尋找相鄰碎片;A. Deever等人 在 2012 年的 IEEE International Conference on Image Processing 會(huì)議上發(fā)表的論文 "Semi-automatic Assembly of Real Cross-cut 化redded Do州ment"中對(duì)碎片輪廓點(diǎn)進(jìn) 行采樣,并記錄采樣點(diǎn)的空間位置用于描述碎片形狀,利用匹配代價(jià)函數(shù)來描述兩個(gè)形狀 之間的相似性。上述方法中,在碎片拼接時(shí)需要較多人工干預(yù)或者碎片匹配效率都較低。

      【發(fā)明內(nèi)容】

      [0005] 本發(fā)明要解決的技術(shù)問題是針對(duì)現(xiàn)有技術(shù)的不足,發(fā)明一種利用曲線匹配和信息 對(duì)齊的方法進(jìn)行粉碎文件重構(gòu),利用碎片輪廓曲線的相似性尋找正確碎片對(duì),并利用碎片 上文本線、字符、顏色和圖形信息的對(duì)齊排除錯(cuò)誤匹配,完成文件碎片重構(gòu)。本發(fā)明采用曲 線匹配和信息對(duì)齊相結(jié)合的方法對(duì)文件碎片進(jìn)行匹配,該方法對(duì)碎片旋轉(zhuǎn)具有魯椿性,同 時(shí)可容忍一定的邊緣重疊區(qū)域存在,提高了匹配效率。
      [0006] 本發(fā)明采用的技術(shù)方案是利用曲線匹配和信息對(duì)齊的粉碎文件重構(gòu)方法,其特征 是,重構(gòu)方法利用曲線匹配和信息對(duì)齊進(jìn)行文件碎片拼接,提取每個(gè)碎片的輪廓曲線信息, 通過計(jì)算兩曲線間的距離判斷曲線間的相似性,進(jìn)而尋找相鄰碎片;判斷碎片方向,減少不 必要的匹配;在曲線匹配過程中,通過對(duì)碎片文本線、字符、顏色和圖形信息的對(duì)齊來排除 錯(cuò)誤匹配;通過碎片對(duì)的選擇得到正確的碎片對(duì),并通過所選碎片對(duì)的匹配信息完成粉碎 文件重構(gòu);具體步驟如下;
      [0007] 1)掃描粉碎文件及碎片圖像預(yù)處理
      [000引首先,對(duì)粉碎文件進(jìn)行掃描,得到粉碎文件的碎片圖像;然后對(duì)碎片圖像進(jìn)行預(yù)處 理,其過程包括碎片圖像分割,碎片圖像傾斜校正,碎片圖像的文本線、顏色、字符和圖形信 息提取,碎片拐點(diǎn)信息提取,碎片輪廓曲線信息提?。?br>[0009] a)碎片圖像分割
      [0010] 文件碎片是無序擺放,并掃描在同一幅圖像中,需要將碎片圖像逐一分割出來;碎 片圖像分割利用公開的邊緣捜索方法,識(shí)別碎片輪廓曲線像素坐標(biāo)后,逐一遍歷直到對(duì)該 輪廓曲線像素記錄完成一個(gè)閉區(qū)間,即該碎片圖像的輪廓曲線像素被完整地記錄下來,最 后將輪廓內(nèi)碎片像素拷貝來完成碎片圖像分割;
      [0011] b)碎片圖像傾斜校正
      [0012] 若碎片中的文本線有一定的傾斜角度,需要進(jìn)行傾斜校正使文本線達(dá)到水平;傾 斜校正采用投影法,將碎片圖像進(jìn)行順時(shí)針和逆時(shí)針旋轉(zhuǎn)若干角度,并將碎片圖像中的文 本線信息水平投影至和碎片圖像等高的列向量中,列向量中的元素只記錄該行有無直線信 息,找到某一旋轉(zhuǎn)角度,使得列向量中直線信息數(shù)量最小,則該角度為碎片圖像的傾斜角 度,按照上述方法將所有碎片進(jìn)行傾斜校正;
      [0013] C)碎片圖像f目息提取
      [0014] 由于碎片圖像中文本線、字符和顏色區(qū)域有不同的灰度值,可使用不同闊值對(duì)將 碎片圖像二值化然后分別提取其信息;使用Smallest Univalue Segment Assimilating Nucleus算子提取碎片拐點(diǎn),由于碎片形狀接近于矩形,因此每個(gè)碎片可提取四個(gè)拐點(diǎn);拐 點(diǎn)將碎片輪廓分為四條邊,兩個(gè)長(zhǎng)邊用于曲線匹配,兩條短邊用于碎片方向檢測(cè);傾斜校正 過程使得碎片圖像的輪廓曲線像素坐標(biāo)發(fā)生變化,再次利用邊緣捜索算法提取碎片圖像的 輪廓曲線;
      [0015] 2)碎片圖像方向檢測(cè):
      [0016] 利用角度符號(hào)矩陣檢測(cè)碎片方向,計(jì)算碎片短邊的兩端點(diǎn)與短邊上任意一點(diǎn)的角 度符號(hào)并累計(jì)求和,通過闊值將碎片方向分為向上、向下和未知=類;定義點(diǎn)A,C為碎片 一短邊的兩個(gè)拐點(diǎn),點(diǎn)B為碎片短邊上的頂點(diǎn),定義Z ABC為向量BA逆時(shí)針旋轉(zhuǎn)至BC的 角度;通過角度判斷確定碎片方向;Z ABC的角度符號(hào)通過式(1)判斷;當(dāng)Z ABC > 180° 時(shí),SignAngle = 1 ;當(dāng) Z ABC = 180° 時(shí),Si即Angle = 0 ;當(dāng) Z ABC < 180° 時(shí),SignAngle =-1 ;其中:
      [0017]
      【主權(quán)項(xiàng)】
      1. 一種利用曲線匹配和信息對(duì)齊的粉碎文件重構(gòu)方法,其特征是,重構(gòu)方法利用曲線 匹配和信息對(duì)齊進(jìn)行文件碎片拼接,提取每個(gè)碎片的輪廓曲線信息,通過計(jì)算兩曲線間的 距離判斷曲線間的相似性,進(jìn)而尋找相鄰碎片;判斷碎片方向,減少不必要的匹配;在曲線 匹配過程中,通過對(duì)碎片文本線、字符、顏色和圖形信息的對(duì)齊來排除錯(cuò)誤匹配;通過碎片 對(duì)的選擇得到正確的碎片對(duì),并通過所選碎片對(duì)的匹配信息完成粉碎文件重構(gòu);具體
      當(dāng)前第1頁1 2 
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
      1