国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      KD-Tree數(shù)據(jù)結構的雙閾值搜索方法

      文檔序號:6367712閱讀:282來源:國知局
      專利名稱:KD-Tree數(shù)據(jù)結構的雙閾值搜索方法
      技術領域
      本發(fā)明涉及模式識別領域,尤其是一種數(shù)據(jù)結構的搜索方法。
      背景技術
      在模式識別領域,待識別的對象會被提取一個或者多個特征向量,然后再通過分類器進行模式分類。在海量的模式數(shù)據(jù)庫中,如圖像、聲音、視頻的特征向量數(shù)據(jù)庫中,模式的匹配速度是整個系統(tǒng)的性能瓶頸。近年來提出的SIFT、SURF等穩(wěn)定性非常好的圖像特征提取和描述方法,在圖像融合、全景圖像生成、圖像和視頻的超分辨和去噪、圖像和視頻搜索、增強現(xiàn)實、目標識別等多種應用場合中均有采用。特別是在圖像搜索中,海量圖像的產(chǎn)生海量的圖像特征向量(特征 點),所以特征向量的搜索效率直接和圖像的搜索效率相關。設被檢索的庫中有n個特征向量,每個特征向量為k維。對于被搜索圖像中提取的m個特征向量,需要對比和模式庫哪些特征向量相似。兩個特征向量P和q相似是一個模糊的概念,在各個維度均歸一化的情況下,常使用如歐式距離來度量兩個特征向量的相似程度
      dist(j>,q) = ^ Cpi-^i)2(I)
      在模式檢索系統(tǒng)中,我們還需要設置一個閾值來判斷相似或者不相似,設這個閾值為r, dist (p, q) <=rl時認為p和q相似,dist (p, q) >rl時p和q不相似。r的取值在不同的應用系統(tǒng)中,不同的設計者會根據(jù)準確率和速度的需求進行設置。最樸素地,使用順序遍歷式的搜索,將花費0(n)的時間,如圖I中的直線所示。如果采用無閾值完全精確匹配的二分搜索,只花費CKlog2 (n))的時間,如圖I最低的一棵曲線所示,但在模式識別領域要搜索的對象,往往受各種變形和噪聲影響,無法使用無閾值完全精確匹配的二分搜索。針對這種情況,1975年J. L. Bentley在Communications ofthe ACM 發(fā)表了文章 Multidimensional Binary Search Trees Used for AssociativeSearching,提出了被稱為KD-Tree數(shù)據(jù)結構的多維二叉樹,。KD-Tree數(shù)據(jù)結構仍然是一棵二叉樹,這棵二叉樹的每個結點有一個分割維度S,使得這個結點的左子樹中每個結點的s維值都小于這個結點的s維,右子樹中每個結點的s維值都大于這個結點的s維。在KD-Tree數(shù)據(jù)結構樹上定義的搜索操作有三種最近鄰搜索、k近鄰搜索和范圍搜索。本發(fā)明專利針對其中的范圍搜索,即利用類似(I)式定義某種相似性測度,根據(jù)閾值進行排除的搜索,搜索結果為庫中距離目標特征向量的距離小于閾值的所有特征向量。以圖2和圖3中的KD-Tree數(shù)據(jù)結構為例,k=2,n=6,如果要搜索距離p點(6,3)點不超過r=2的所有點,則應該返回(7,2) —個點。按照現(xiàn)有的搜索算法(參考文獻資料和源碼如Intel公司的計算機視覺庫Open CV的最新版本2. 3. I中的kdTree. hpp),其搜索過程是a、以根結點(7,2)為當前結點;
      b、計算和判斷dist( (7,2), (6,3) ) <t,(7,2)加入結果集;
      C、判斷(7,2)的分割維度為X,按X維計算距離7-6=1〈2,則(7,2)的左右子樹均可能存在和(6,3)相似的結點;
      d、(7,2)的左子樹根結點(5,4)以Y為分割維,Y=4比3小1,則同時需用搜索其左右子樹。e、(7,2)的左子樹根結點(9,6)以Y為分割維,Y=6比3大2,則只需用搜索其左子樹; 直至完成,所有6個點均和(6,3)比較過,由此可見,在閾值較大的情況下,KD-Tree數(shù)據(jù)結構的范圍搜索和非KD-Tree數(shù)據(jù)結構的順序遍歷搜索性能接近甚至相當。有次可以看出,在KD-Tree數(shù)據(jù)結構范圍搜索中,閾值越小,越容易過濾掉搜索分支,搜索速度越快,越接近二分搜索;閾值越大,越難過濾分支,搜索速度越慢,越接近順序遍歷,而單純的降低閾值,則模式匹配的抗干擾性又急劇下降。

      發(fā)明內(nèi)容
      本發(fā)明的目的是提供一種KD-Tree數(shù)據(jù)結構的雙閾值搜索方法,它能有效提高KD-Tree數(shù)據(jù)結構的搜索效率,并使模式匹配的抗干擾性沒有很大的下降,以克服現(xiàn)有技術的不足。本發(fā)明是這樣實現(xiàn)的KD_Tree數(shù)據(jù)結構的雙閾值搜索方法,在KD-Tree數(shù)據(jù)結構上進行范圍搜索時,增設一個單維誤差閾值,單維誤差閾值小于整體誤差超過閾值,先利用單維誤差閾值排除整體誤差超過閾值的分支,再通過整體誤差超過閾值來比較兩個特征向量的相似程度,從而提高KD-Tree數(shù)據(jù)結構的搜索效率,并最終提高依賴KD-Tree數(shù)據(jù)結構的模式識別應用的實時性。單維誤差閾值為整體誤差超過閾值的1/4。設本發(fā)明所新增的單維誤差閾值為r2, r2的取值在(0,rl)之間,根據(jù)不同的應用可以靈活選擇,默認可以選擇r2=rl/4 ;如果采用本發(fā)明的方法導致漏檢索過多導致具體應用不能接受,則可以調(diào)大r2 ;如果采用本發(fā)明的方法性能提升以后漏檢索仍然在具體應用可以接受的范圍內(nèi),可以進一步調(diào)低r2提高檢索性能。由于采用上述的技術方案,與現(xiàn)有技術相比,本發(fā)明增設一個單維誤差閾值,在KD-Tree數(shù)據(jù)結構的范圍搜索時,預估一個分支中是否很可能不包含所要范圍的特征向量用單維誤差閾值代替原有的整體誤差閾值的作用,在KD-Tree數(shù)據(jù)結構的范圍搜索時,t匕較兩個特征向量的相似程度仍然用整體誤差閾值,這樣的方式在縮小了搜索過程中分割維閾值的同時,并沒有提高兩個特征向量相似性的要求,即整體誤差閾值沒有變化,模式匹配的抗干擾性并沒有很大的下降。本發(fā)明方法簡單,操作方便,使用效果好。


      附圖I為不同搜索方法的耗時增長趨勢對比示意 附圖2為一組二維特征向量在平面上的分布和KD-Tree數(shù)據(jù)結構分割情況;附圖3為一組二維特征向量的KD-Tree數(shù)據(jù)結構。
      具體實施例方式
      具體實施例方式先規(guī)整化所有特征向量,以便特征向量的各個維度取值的大小有可比性;再按照已有的辦法建立特征向量的KD-Tree數(shù)據(jù)結構;按照已有的單閾值方法設置合適的整體誤差閾值rl,并可適當放大整體誤差閾值rl以提高模式匹配的抗干擾性;再設置一個單維誤差閾值r2,單維誤差閾值r2的取值在(0,rl)之間,根據(jù)不同的應用可以靈活選擇,默認可以選擇r2=rl/4 ;在KD-Tree數(shù)據(jù)結構的范圍搜索時,先利用單維誤差閾值r2預估一個分支中是否很可能不包含所要范圍的特征向量;再利用整體誤差閾值rl比較兩個特征向量的相似程度。以技術背景中最后舉例的數(shù)據(jù)為例,在圖2和圖3搜索的KD-Tree數(shù)據(jù)結構中搜索距離(6,3)不超過2的點,則整體誤差閾值rl仍然為2,單維誤差閾值r2可以取為0. 5 ; 首先,仍然以根結點(7,2)為其實搜索結點;
      其次,計算和判斷dist ( (7,2), (6,3) ) <rl,則(7,2)加入結果集;
      判斷(7,2)的分割維度為X,7-6>l>r2,則不搜索其右子樹,則只搜索其左子樹(5,4); 計算和判斷dist ( (5,4),(6,3) ) > rl,則(5,4)不加入結果集;
      (5,4)分割維度為Y,4-3=l,則不搜索其右子樹,只搜索其左子樹(2,3);
      直至完成,整個搜索過程只比較了(7,2)、(5,4)和(2,3)3個點,比單閾值方法少一半,并且搜索結果和單閾值方法的搜索結果一樣。
      權利要求
      1.一種KD-Tree數(shù)據(jù)結構的雙閾值搜索方法,其特征在于在KD-Tree數(shù)據(jù)結構上進行范圍搜索時,增設一個單維誤差閾值,單維誤差閾值小于整體誤差閾值;先利用單維誤差閾值排除整體誤差超過閾值的分支,再通過整體誤差閾值來比較兩個特征向量的相似程度,從而提高KD-Tree數(shù)據(jù)結構的搜索效率,并最終提高依賴KD-Tree數(shù)據(jù)結構的模式識別應用的實時性。
      2.根據(jù)權利要求I所述的KD-Tree數(shù)據(jù)結構的雙閾值搜索方法,其特征在于單維誤差閾值為整體誤差超過閾值的1/4。
      全文摘要
      本發(fā)明公開了一種KD-Tree數(shù)據(jù)結構的雙閾值搜索方法,在KD-Tree數(shù)據(jù)結構上進行范圍搜索時,增設一個單維誤差閾值,單維誤差閾值小于整體誤差超過閾值,先利用單維誤差閾值排除整體誤差超過閾值的分支,再通過整體誤差超過閾值來比較兩個特征向量的相似程度,從而提高KD-Tree數(shù)據(jù)結構的搜索效率,并最終提高依賴KD-Tree數(shù)據(jù)結構的模式識別應用的實時性。在KD-Tree數(shù)據(jù)結構的范圍搜索時,比較兩個特征向量的相似程度仍然用整體誤差閾值,這樣的方式在縮小了搜索過程中分割維閾值的同時,并沒有提高兩個特征向量相似性的要求,即整體誤差閾值沒有變化,模式匹配的抗干擾性并沒有很大的下降。
      文檔編號G06F17/30GK102737107SQ20121010050
      公開日2012年10月17日 申請日期2012年4月9日 優(yōu)先權日2012年4月9日
      發(fā)明者程欣宇 申請人:程欣宇, 貴州拙人信息技術有限公司
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會獲得點贊!
      1