国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      形狀描述符參數(shù)的高效編碼方法

      文檔序號(hào):6419511閱讀:148來源:國知局
      專利名稱:形狀描述符參數(shù)的高效編碼方法
      技術(shù)領(lǐng)域
      本發(fā)明涉及例如出現(xiàn)在諸如在多媒體數(shù)據(jù)庫中所存儲(chǔ)的圖像之類的靜止或視頻圖像中的目標(biāo)的表示(represention),并且特別地涉及這樣一種表示的編碼。
      在諸如圖像或視頻文庫之類的應(yīng)用中,希望的是對(duì)于出現(xiàn)在靜止或視頻圖像中的目標(biāo)或目標(biāo)各個(gè)部分的輪廓(outline)或形狀具有一種有效表示和存儲(chǔ)?;谛螤畹乃饕蜋z索(retrieval)的一種已知技術(shù)使用曲率縮放空間(CSS)(Curvature Scale Space)表示。CSS表示的細(xì)節(jié)可以在文件“Robust and Efficient Shape Indexingthrough Curvature Scale Space”(通過曲率縮放空間的強(qiáng)大并有效的形狀索引)Proc.British Machine Vision conference,第53-62頁,Edinburgh,UK,1996和“Indexing an Image Database by ShapeContent using Curvature Scale Space”(通過形狀內(nèi)容使用曲率縮放空間來索引一個(gè)圖像數(shù)據(jù)庫)Proc.IEE Colloquium onIntelligent Databases,London 1996中找到,這兩篇文章都是F.Mokhtarian、S.Abbasi和J.Kittler的,將其內(nèi)容引用在此供參考。
      CSS表示使用目標(biāo)輪廓的一個(gè)曲率函數(shù),從該輪廓上的一個(gè)任意點(diǎn)開始。因?yàn)檩喞螤畋皇剐螤钇交囊幌盗惺д嫠葑儯恃芯壳屎瘮?shù)。更明確地,計(jì)算以高斯濾波器系列旋轉(zhuǎn)的曲率函數(shù)的導(dǎo)數(shù)的零交叉。將零交叉被繪制在一個(gè)曲線圖上,通稱為曲率縮放空間,在此X軸是該曲線的標(biāo)準(zhǔn)化弧長(zhǎng),而Y軸是演變參數(shù),更明確地,是所應(yīng)用的濾波器的參數(shù)。曲線圖上的曲線形成輪廓的環(huán)路特性(loopscharacteristic)。目標(biāo)輪廓的每一凸形或凹形部分對(duì)應(yīng)于該CSS圖像中的一個(gè)環(huán)路。CSS圖像中的最突出環(huán)路的峰值坐標(biāo)被用作該輪廓的一個(gè)表示。
      為了搜索與輸入目標(biāo)形狀匹配的存儲(chǔ)在數(shù)據(jù)庫中的圖像中的目標(biāo),計(jì)算出一個(gè)輸入形狀的CSS表示。通過使用匹配算法來比較在各個(gè)CSS圖像中的峰值的位置和高度,確定輸入形狀和存儲(chǔ)形狀之間的相似性。
      在一個(gè)描述符中表示輪廓形狀的特性所需要的比特?cái)?shù)目應(yīng)該盡可能小,以便于進(jìn)行有效存儲(chǔ)和傳輸。
      在隨后的權(quán)利要求中將闡述本發(fā)明的各個(gè)方面。
      本發(fā)明能夠提供一個(gè)非常小型的表示(根據(jù)用于存儲(chǔ)的比特?cái)?shù)目)而在檢索性能中沒有任何顯著的惡化。
      下面將參考附圖描述本發(fā)明的實(shí)施例,其中

      圖1是一個(gè)視頻數(shù)據(jù)庫系統(tǒng)的方框圖;圖2是一個(gè)輪廓的CSS表示;圖3是說明CSS表示的坐標(biāo)值編碼的圖表。
      圖1示出了根據(jù)本發(fā)明實(shí)施例的一個(gè)計(jì)算機(jī)化的視頻數(shù)據(jù)庫系統(tǒng)。該系統(tǒng)包括計(jì)算機(jī)形式的一個(gè)控制單元2、監(jiān)視器形式的一個(gè)顯示單元4、鼠標(biāo)形式的一個(gè)定點(diǎn)(pointing)設(shè)備6、包括存儲(chǔ)的靜止和視頻圖像的一個(gè)圖像數(shù)據(jù)庫8以及一個(gè)描述符數(shù)據(jù)庫10,該描述符數(shù)據(jù)庫10存儲(chǔ)出現(xiàn)在存儲(chǔ)在圖像數(shù)據(jù)庫8中的圖像中的目標(biāo)或目標(biāo)各個(gè)部分的描述符。
      出現(xiàn)在圖像數(shù)據(jù)庫中的圖像中每一感興趣目標(biāo)的形狀描述符被控制單元2導(dǎo)出并且被存儲(chǔ)在描述符數(shù)據(jù)庫10中。控制單元2導(dǎo)出在執(zhí)行如下所述方法的一個(gè)適當(dāng)程序的控制下操作的描述符。
      首先,對(duì)于一個(gè)給定目標(biāo)輪廓,該輪廓的一個(gè)CSS表示被導(dǎo)出。使用在上面提及的文件之一中描述的已知方法來執(zhí)行之。
      更明確地,該輪廓通過一個(gè)表示Ψ={(x(u),y(u),u∈
      }來表示,其中u是一個(gè)標(biāo)準(zhǔn)化弧長(zhǎng)參數(shù),而(x,y)是目標(biāo)輪廓上的點(diǎn)的坐標(biāo)。
      該輪廓通過用Gaussan核心(kernel)g(u,σ)或類似的核心旋轉(zhuǎn)Ψ而被平滑,并且演變曲線的曲率零交叉被檢查作為σ變化。使用曲率的下列表達(dá)式來識(shí)別零交叉。
      k(u,&sigma;)=Xu(u,&sigma;)Yuu(u,&sigma;)-Xuu(u,&sigma;)Yu(u,&sigma;)(Xu(u,&sigma;)2+Yu(u,&sigma;)2)3/2]]>在此X(u,σ)=x(u)*g(u,σ)Y(u,σ)=y(tǒng)(u)*g(u,σ)和
      Xu(u,σ)=x(u)*gu(u,σ)Xuu(u,σ)=x(u)*guu(u,σ)在上面,*表示卷積而下標(biāo)表示導(dǎo)數(shù)。
      曲率零交叉的數(shù)目改變?yōu)棣易兞?,并且?dāng)σ十分高時(shí),Ψ成為沒有零交叉的一個(gè)凸形曲線。
      零交叉(u,σ)被繪制在一曲線圖上,通稱CSS圖像空間。這導(dǎo)致原始輪廓的多個(gè)曲線特性。特性曲線的峰值被識(shí)別并且相應(yīng)的坐標(biāo)被提取和存儲(chǔ)。在一般的術(shù)語中,這給出了一組n個(gè)坐標(biāo)對(duì)[(x1,y1),(x2,y2),…(xn,yn)],其中n是峰值的數(shù)目,而xi是第i個(gè)峰值的弧長(zhǎng)位置,并且yi是峰值高度。
      特性曲線的順序和位置以及它們出現(xiàn)在CSS圖像空間中的相應(yīng)峰值取決于如上所述的曲率函數(shù)的起始點(diǎn)。峰值坐標(biāo)被重新排列,如下所述。
      讓我們假定從中提取參數(shù)的輪廓有n個(gè)峰值,峰值參數(shù)形成一組{(x1,y1),(x2,y2),…(xn,yn)},如圖2所示。然后根據(jù)高度按照遞增或遞減的順序排列這些峰值{(x1,y1),(x2,y2),(xn,yn)}(下標(biāo)表示在排序之后的峰值序號(hào))。讓我們假定按照遞減的順序排列峰值,所以最高峰值是第一個(gè)(x1y1),并且每一后續(xù)峰值低于或等于該組中的其前者(圖3)。
      這些重新排列的峰值坐標(biāo)形成目標(biāo)輪廓的描述符的基礎(chǔ)。諸如環(huán)狀(circularity)C、偏心率(eccentricity)E和緊密度(compactness)D之類的另外的形狀參數(shù)(其中某些從所謂的“原型輪廓形狀(prototype contour shape)”中被提取)還可以被計(jì)算并存儲(chǔ),以便用于如在共同懸而未決的申請(qǐng)no.GB 9916684.5中所述的匹配處理中,該申請(qǐng)的內(nèi)容在此被結(jié)合以便參考。
      接下來,執(zhí)行峰值高度的粗略量化。對(duì)于每個(gè)峰值,執(zhí)行量化的范圍是不同的,并且取決于較高峰值的值(例如,在作為被排列組中的在前者的那些峰值的高度)。
      參見圖3,第一峰值在范圍I1=
      上被量化,在此,Ymax是對(duì)某一類形狀所期待的峰值的最大值。每一剩余峰值被量化到該范圍,這取決于一個(gè)或好幾個(gè)在前峰值的值。例如,峰值y2在間隔I2=
      上被量化,(圖3)峰值y3在間隔
      上被量化,等等。
      在這個(gè)實(shí)施例中,使用7比特把第一峰值量化在間隔
      上并且在適當(dāng)?shù)母鱾€(gè)范圍上把剩余峰值量化到比特3,如上所述。假如第一峰值的高度是893,那么使用3比特在范圍
      上把y2量化,等等。因此,對(duì)于峰值y2到y(tǒng)5,量化間隔被降低,盡管使用較少的比特,但給出更大的精確度。每個(gè)峰值的X坐標(biāo)被量化到在
      間隔上均勻分布的6比特。x值可以是原始X值,例如如圖2所示,或者在沿著x軸偏移一個(gè)數(shù)量之后,以使最高峰值的x值在0處。
      讓我們檢查從本發(fā)明中的獲益。在傳統(tǒng)解決方案中,每一峰值需要兩個(gè)浮點(diǎn)數(shù),每一個(gè)是4字節(jié)。因此,對(duì)于具有9個(gè)峰值的一個(gè)典型形狀,存儲(chǔ)要求是9*2*4=72字節(jié)(576比特)。在應(yīng)用所建議的實(shí)施例之后,第一峰值需要7個(gè)比特,假定x值被作為零來對(duì)待,并且每個(gè)連續(xù)峰值為6+3比特,因此總共為79比特。
      代替一個(gè)范圍
      ,一個(gè)范圍(0,R(yi))可以被使用,在此,R(yi)是在逆量化之后的值yi的重建。
      具有類似效果的另一個(gè)可選擇實(shí)施例通過相應(yīng)的在前峰值的值劃分每一峰值{y2,y3,…,yn}(除最高一個(gè)之外)的高度。在此操作之后,所有yi的范圍是來自組(0,1]。這允許對(duì)于所有的yi使用相當(dāng)粗略的量化。
      在任一示例中,可以通過對(duì)于最高峰值使用7或6比特量化以及對(duì)于所有剩余峰值使用4或3比特量化來獲得優(yōu)良的結(jié)果。也可以使用其它數(shù)目的比特。
      上面的操作還可以在坐標(biāo)值已經(jīng)經(jīng)歷副法線和非線性變換之后被執(zhí)行,正如在共同懸而未決的申請(qǐng)no.GB9915699.4中所述的,該申請(qǐng)的內(nèi)容在此被參考結(jié)合。代替或者和y值一樣,可以沿著如上所述的線路來編碼x坐標(biāo)。
      例如,通過在執(zhí)行匹配之前對(duì)存儲(chǔ)的描述符執(zhí)行逆量化,利用適當(dāng)?shù)男薷?,結(jié)果值可以被存儲(chǔ),例如,以便用于一個(gè)適當(dāng)?shù)钠ヅ涑绦蛑校热缭谖覀兊墓餐瑧叶礇Q的申請(qǐng)GB9915699.4、GB9915698.6和GB9916684.5中所描述的。
      權(quán)利要求
      1.通過處理與圖像相對(duì)應(yīng)的信號(hào)來搜索圖像中的目標(biāo)的一種方法,所述方法包括輸入一個(gè)查詢目標(biāo),導(dǎo)出所述查詢目標(biāo)的表示,將所述查詢表示與圖像中的多個(gè)目標(biāo)表示進(jìn)行比較,和選擇和顯示圖像中其表示指示與所述查詢的相似程度的那些目標(biāo),其特征在于圖像中的目標(biāo)表示是目標(biāo)形狀的曲率縮放空間(CSS)表示的峰值的量化坐標(biāo)值,其中CSS表示的峰值以峰值高度分量值的降序進(jìn)行排列,并且用于峰值高度分量值的量化范圍基于在前的峰值高度值的值。
      2.權(quán)利要求1所述的方法,其中將所述查詢與圖像中目標(biāo)的存儲(chǔ)表示和/或存儲(chǔ)圖像中的目標(biāo)表示進(jìn)行比較。
      3.權(quán)利要求1所述的方法,其中將被比較的查詢目標(biāo)的表示和/或圖像中的目標(biāo)表示是利用包括以下的一種方法導(dǎo)出的導(dǎo)出目標(biāo)形狀的CSS表示,量化CSS表示的峰值的坐標(biāo)值,以導(dǎo)出編碼的形狀表示,以峰值高度分量值的降序排列CSS表示的峰值,其中用于峰值高度分量值的量化范圍基于在前的峰值高度分量值的值。
      4.權(quán)利要求1所述的方法,其中分配給峰值高度分量值的量化表示的比特?cái)?shù)目少于分配給在前的峰值高度分量值的量化表示的比特?cái)?shù)目。
      5.一種設(shè)備,包括控制裝置,適于執(zhí)行權(quán)利要求1-4之一的方法。
      6.權(quán)利要求5所述的設(shè)備,還包括用于存儲(chǔ)圖像和/或圖像表示的存儲(chǔ)裝置。
      全文摘要
      一種通過處理與圖像相對(duì)應(yīng)的信號(hào)來表示出現(xiàn)在靜止或視頻圖像中的目標(biāo)的方法,包括導(dǎo)出多組表示目標(biāo)形狀的坐標(biāo)值并且量化這些坐標(biāo)值,以便導(dǎo)出該形狀的一個(gè)編碼表示,并且還包括在第一量化范圍上量化第一坐標(biāo)值以及在一個(gè)較小范圍上量化較小坐標(biāo)值。
      文檔編號(hào)G06T9/20GK1601561SQ20041006380
      公開日2005年3月30日 申請(qǐng)日期2001年2月27日 優(yōu)先權(quán)日2000年2月29日
      發(fā)明者M·波貝爾 申請(qǐng)人:三菱電機(jī)信息技術(shù)中心歐洲有限公司
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
      1