国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      用形狀描述符匹配圖像的制作方法

      文檔序號(hào):6476047閱讀:196來源:國知局
      專利名稱:用形狀描述符匹配圖像的制作方法
      技術(shù)領(lǐng)域
      4^>開一般地涉及圖#^述符。
      背景技術(shù)
      由于數(shù)碼相機(jī)、圖像編輯軟件以及其他相關(guān)技術(shù)、裝置或兩者的廣泛 使用,使用者不得不管理和操作數(shù)字圖像。數(shù)字圖像裝置、應(yīng)用軟件或二 者的一個(gè)重要方面是為使用者提供有效且高效地管理、檢索、操作和使用 圖像的能力。因此,努力開發(fā)用于從存儲(chǔ)裝置檢索圖像的高效且簡單的方
      法。例如,在圖像處理領(lǐng)域中,運(yùn)動(dòng)圖像專家組(MPEG)已經(jīng)開發(fā)了幾 種類型的圖傳檢索應(yīng)用軟件。
      典型的圖H^r索應(yīng)用軟件可以產(chǎn)生圖像的描述符以索引和檢索圖像。 圖像的形狀在描述圖像的使用中是有用的特征。形狀可以僅以地理形式 (geographical form)描述圖像而不需要包括例如顏色、紋理等圖像的其 他特征。例如,MPEG釆用包括那些公知的如曲率尺度空間(CSS)描述 符和角徑向變換(art)描述符的一些描述符。
      CSS描述符基于關(guān)于圖像的一條或多條輪廓線的信息而提取圖像的 特征。另一方面,art描述符不直接使用關(guān)于一條或多條輪廓線的信息 而是利用關(guān)于圖像的區(qū)域特定信息,例如隨著圖像中像素的位置的變化而 變化的像素值的角分量和徑向分量。art因此可以更一般地應(yīng)用到各種 圖像而不論該圖像中輪廓線的數(shù)量如何。
      然而,傳統(tǒng)的art描述符具有局限性。例如,對(duì)于具有相對(duì)筒單的 特征的圖像,例如具有一條輪廓線的圖像,art描述符可能無法獲得描 述圖像形狀所期望的精確度等級(jí)。這是因?yàn)?,為了獲得精確的art描述 符,需要提取關(guān)于圖像的多個(gè)方面的信息。此外,art描述符依賴于相 對(duì)復(fù)雜的數(shù)值算法,該數(shù)值算法需要大量的計(jì)算資源。因此,需要增強(qiáng) art描述符的精確度從而使圖像可以更有效和高效的方式被描述、索引 和檢索,同時(shí)還降低描述符相關(guān)的算法的復(fù)雜度。


      圖l示出了才艮據(jù)一個(gè)實(shí)施例的圖傳驗(yàn)索系統(tǒng)的示意性框圖2是根據(jù)一個(gè)實(shí)施例的圖^^r索系統(tǒng)的圖像匹配裝置的示意性框
      圖3是示出了根據(jù)一個(gè)實(shí)施例的距離變換(DT)的應(yīng)用的示意圖4是示出了根據(jù)一個(gè)實(shí)施例用以將二進(jìn)制圖像轉(zhuǎn)換為中間圖像的 距離變換的應(yīng)用的示意圖5示出了說明根據(jù)一個(gè)實(shí)施例的DT的結(jié)果的示例性圖4象;
      圖6示出了用在一個(gè)實(shí)施例中的ART的基本功能的示例;
      圖7是說明了根據(jù)一個(gè)實(shí)施例用以產(chǎn)生描述符的方法的流程圖8是說明了根據(jù)一個(gè)實(shí)施例用以使用描述符檢索圖像的方法的流 程圖9是比較地說明了由牛眼性能(Bull's Eye Performance, BEP)測(cè) 量的、在根據(jù)依據(jù)4^>開的設(shè)備和方法的一個(gè)實(shí)施例的GART(支變角徑 向變換)描述符和傳統(tǒng)的ART描述符之間的數(shù)據(jù)庫搜索性能的圖表。

      發(fā)明內(nèi)容
      在一個(gè)實(shí)施例中,使用距離變換(DT)單元以生成中間圖像,該中 間圖像提供針對(duì)輸入的查詢圖像的附加特征(例如,描述符參數(shù))的。 DT單元可以將輸入的查詢圖像變換為具有多種基于圖像中的像素的位置 的像素值的中間圖像。在中間圖像中生成的多種像素值被用作附加的圖像 屬性或描述符參數(shù),該附加的圖像屬性或描述符M可以用于更有效和高 效地生成用于查詢圖像的圖傳^述符。圖傳濕述符生成設(shè)備可以在中間圖 像上應(yīng)用ART描述符生成算法,由此生成輸入的查詢圖像的描述符。
      在另一個(gè)實(shí)施例中,圖像檢索系統(tǒng)包括圖像錄入單元、描述符確定單 元、圖像比較單元和檢索單元。該圖像錄入單元被配置為接收作為輸入的 圖像。該描述符確定單元用于接收?qǐng)D像并使用DT單元將圖像變換為中間 圖像以生成圖像的描述符。圖像比較單元被配置為將圖像與存儲(chǔ)在數(shù)據(jù)庫 中的一個(gè)或多個(gè)圖像進(jìn)行比較,例如,通過比較查詢圖像的描述符與存儲(chǔ) 在數(shù)據(jù)庫中的圖像的描述符。最后,檢索單元被配置為檢索一個(gè)或多個(gè)候選圖像,該候選圖像基于描述符的比較而與輸入的圖像緊密匹配或相類 似。
      本發(fā)明內(nèi)^^皮提供為以筒化的形式引入一系列概念,這些概念將在以 下詳細(xì)的說明書中進(jìn)一步說明。本發(fā)明內(nèi)容不旨在確定要求保護(hù)的主題的 關(guān)鍵特征或本質(zhì)特征,也不旨在用于限制要求保護(hù)的主題的范圍。
      具體實(shí)施例方式
      容易理解的是,如此處在附圖中一般性描述和說明的,;^/>開的組件 可以以多種不同的配置進(jìn)行布置和設(shè)計(jì)。因此,以下對(duì)如附圖中所示的根 據(jù)4^〉開的設(shè)備和方法的實(shí)施例的更詳細(xì)的說明,如所聲明的,其目的不 在于限制本公開要求保護(hù)的范圍,而僅是代表根據(jù)本公開當(dāng)前設(shè)想的實(shí)施
      例的特定示例。當(dāng)前所述的實(shí)施例可以通過參考附圖加以理解,其中相似 的部件通篇由相似的標(biāo)記來表示。
      參考圖1,示出了圖^^r索系統(tǒng)100的一個(gè)實(shí)施例。圖^Wr索系統(tǒng)100 可以包括控制器110、圖像錄入單元120、圖像匹配單元140、作為存儲(chǔ) 裝置的數(shù)據(jù)庫(DB; 160)以及顯示器180。每個(gè)組件110、 120、 140、 160和180可以基于期望的實(shí)現(xiàn)而被提供為單個(gè)單元或裝置,或被提供為 一個(gè)或多個(gè)單元或裝置。例如,圖像匹配單元140和DB160可以與圖像 錄入單元120實(shí)現(xiàn)為單個(gè)集成設(shè)備??商鎿Q地,圖像匹配單元140和DB 160可以相對(duì)于圖像錄入單元120獨(dú)立地并且遠(yuǎn)程地實(shí)現(xiàn)。
      實(shí)踐中,用戶可以選擇圖像以使用圖像錄入單元120輸入到圖#^索 系統(tǒng)IOO。圖像錄入單元120可以包括多種類型的輸入裝置,所述輸入裝 置包括但不限于小鍵盤、鍵盤、鼠標(biāo)、觸摸板、觸摸屏、定點(diǎn)設(shè)備、軌跡 球、光筆、操縱桿、語音識(shí)別裝置、觸針裝置、眼睛和頭部移動(dòng)跟蹤器、 數(shù)字化寫字板、條形碼閱讀器等,各個(gè)裝置均可以向用戶提供接口以錄入 期望的查詢圖像。然后,圖像錄入單元120可以將錄入的圖像傳送到由控 制器110配置或編程的圖像匹配單元140。
      在所選擇的、圖像匹配單元140安裝在與圖像錄入單元120分離的遠(yuǎn) 程裝置或服務(wù)器上的實(shí)施例中,輸入的圖像可以從圖像錄入單元120經(jīng)由 有線或無線通信協(xié)議而發(fā)送到圖像匹配單元140。例如,通信協(xié)議(有線 或無線)可以通過釆用例如串行端口、并行端口、 PS/2端口、通用串行 總線(USB)鏈路、火線(firewire)或IEEE 1394鏈路的數(shù)字接口協(xié)議實(shí)現(xiàn),或通過使用例如紅外接口、藍(lán)牙、紫蜂(ZigBee)、高清晰度多媒 體接口 (HDMI)、高帶寬數(shù)字內(nèi)容發(fā)射(HDCP)、無線保真(Wi-Fi) 等無線接口連接實(shí)現(xiàn)??商鎿Q地,圖像可以通過移動(dòng)通信系統(tǒng)M送到圖 像匹配單元140,所述移動(dòng)通信系統(tǒng)例如為全球移動(dòng)通信系統(tǒng)(GSM)、 全球定位系統(tǒng)(GPS)、數(shù)字移動(dòng)多媒體(DMB)、碼分多址(CDMA)、 高速下行鏈#入(HSDPA )、 Wi-Bro無線寬帶等。
      圖像匹配單元140可以接收?qǐng)D像(例如查詢圖像)并確定所接收的圖 像是否包括用于識(shí)別或匹配圖像的描述符。如果圖像匹配單元140未能檢 測(cè)到描述符,則圖像匹配單元140可以通過將描述符生成算法應(yīng)用到查詢 圖像來開始獲取用于查詢圖像的描述符的處理。圖像匹配單元140將查詢 圖泉的描述符與存儲(chǔ)在DB 160中的候選圖像的描述符進(jìn)行比較以選擇至 少一個(gè)匹配的圖像。所匹配的圖傳被傳送到顯示器180,以例如用于用戶 的參考。
      圖2示出圖像匹配單元140的一個(gè)實(shí)施例。在一些實(shí)施例中,圖像匹 配單元140可以包括描述符生成單元280和相似性比較單元260。如圖2 所示,描述符生成單元280可以包括距離變換單元(DT單元)220和角 徑向變換單元(ART單元)240。圖像匹配單元140從圖像錄入單元120 接收查詢圖像210并且執(zhí)行處理以使查詢圖像210與存儲(chǔ)在DB 160中的 候選圖4I^目匹配。例如,圖像匹配單元140可以通過將查詢圖像210的描 述符與候選圖像的描述符進(jìn)行比較而使查詢圖像210與候選圖^^目匹配。 圖像匹配單元140將匹配的圖像270傳送到顯示器180。
      在所選擇的實(shí)施例中,當(dāng)描述符生成單元280接收到查詢圖像210 時(shí),描述符生成單元280中的DT單元220將查詢圖像210變換為中間圖 像并且將該中間圖像傳送到ART單元240。例如,DT單元220可以將輸 入的查詢圖像修改為形狀對(duì)應(yīng)于該輸入圖像的形狀的二進(jìn)制圖像并且將 該二進(jìn)制圖像變換為中間圖像,該中間圖像具有取決于相對(duì)二進(jìn)制圖像的 邊界的像素位置的各種像素值。ART單元240可以對(duì)中間圖像執(zhí)行ART 描述符生成算法,由此生成輸入的查詢圖像210的描述符以最終與存儲(chǔ)在 數(shù)據(jù)庫中的圖傳湘比較和匹配。ART單元240可以使用中間圖像的寬范 圍的像素值作為附加特征或參數(shù)以生成用于原始輸入圖像(即查詢圖像 210)的描述符。ART單元240將描述符和查詢圖像210傳送到相似性比 較單元260。相似性比較單元260于是可以通過將查詢圖像210的描述符 與存儲(chǔ)在DB 160中的圖像的描述符進(jìn)行比較而從DB 160搜索和檢索最類似于查詢圖像210的候選圖像。候選圖像的描述符可以與候選圖像一起 事先存儲(chǔ)在DB 160中??商鎿Q地,圖像匹配單元140可以隨M選擇候 選圖像中的一個(gè)或使用附著到存儲(chǔ)在DB 160中的候選圖像的序列號(hào)選擇 候選圖像中的一個(gè)。圖像匹配單元140應(yīng)用與用于生成查詢圖像210的描 述符相同的處理來生成候選圖像的描述符。這樣,圖像匹配單元140可以 在查詢圖像與候選圖像進(jìn)行比較時(shí)(或大約此時(shí))獲得候選圖像的描述符。 在任一種情況下,相似性比較單元260均可以在對(duì)查詢圖像210的描述符 與候選圖像的描述符比較之后檢索最緊密匹配或類似于查詢圖像210的 候選圖像。
      在相似性比較單元260比較了查詢圖像210的圖像描述符和存儲(chǔ)在 DB 160中的圖像描述符的全部或一些后,相似性比較單元260從DB 160 檢索與查詢圖像210最類似的至少一個(gè)圖像(即匹配的圖像270)并且將 檢索到的一個(gè)或多個(gè)圖像輸出到顯示器180。作為示例,相似性比較單元 260可以確定輸入的查詢圖像210的描述符和候選圖像的描述符之間的距 離以確定具有最短距離的匹配的圖像270。相似性比較單元260可以將輸 入的查詢圖像210與用于描述該輸入圖像210的描述符一起存儲(chǔ)在DB 160中。相似性比較單元260將所匹配的圖4象傳送到顯示器180。
      在一些實(shí)施例中,描述符生成單元280可以最初從圖像錄入單元120 通過包括直接連接或通信協(xié)議等多種方法來接收查詢圖像210。然后描述 符生成單元280中的DT單元220可以將查詢圖像210變換為中間圖像以 向原始查詢圖像210提供除從原始查詢圖 <象210的 一個(gè)或多個(gè)邊界或輪廓 線中直接提取的參數(shù)或特征以外的更多的參數(shù)或特征。例如,描述符生成 單元280將查詢圖像210變換為二進(jìn)制圖像。DT單元210可以將二進(jìn)制 圖像變換為具有灰階的中間圖像。換句話說,DT單元210將原始查詢圖 像210變換為具有取決于距二進(jìn)制圖像的輪廓線的距離而漸變的邊界。 DT單元220可以將輸入的查詢圖像210變換為中間圖像,該中間圖像具 有取決于像素位置(或基于像素距外邊界或輪廓線的距離)的^JL像素值 (從純白到純黑)。這樣,DT單元220可以對(duì)查詢圖像210的^lt或特 征提供附加W:或特征以生成中間圖像,例如灰階圖像。雖然為便于說明 將中間圖像描述為灰階圖像,但中間圖像可以包括具有對(duì)查詢圖像210 的附加特征的任意變換后的圖像,例如具有漸變邊界的圖像、增加顏色的 圖像和增加亮度的圖像,只要這些特征(例如灰階、顏色、亮度等)隨圖 像中的像素的位置而變化。例如,不同的深淺、亮度或顏色強(qiáng)度可以取決 于距圖像邊界的距離而被分配^r個(gè)像素值。一旦如上所述產(chǎn)生中間圖像,則該中間圖傳Jl傳送到ART單元240, 該ART單元240在中間圖像上執(zhí)行算法,由此生成用于中間圖像的ART 描述符。這種ART描述符可以被稱作用于描述查詢圖像210的GART(灰 度角徑向變換)描述符。GART描述符和原始查詢圖像210被轉(zhuǎn)發(fā)到相似 性比較單元260。相似性比較單元260將查詢圖〗象210的GART描述符與 存儲(chǔ)在DB160中的一個(gè)或多個(gè)候選圖像的一個(gè)或多個(gè)描述符相比較。相 似性比較單元260由此可以確定存儲(chǔ)在DB 160中的可能最佳(或最緊密) 匹配查詢圖像210的一個(gè)或多個(gè)候選圖4象。例如,相似性比較單元260 可以確定查詢圖像210的描述符和候選圖像的描述符之間的距離以確定 具有它們之間的最短距離差的匹配的圖像270。相似性比較單元260通過 各種方法將匹配的圖1象270 (即被確定為最類似于或相對(duì)最接近于查詢圖 像210的一個(gè)或多個(gè)候選圖像)傳送到顯示器180,所述多種方法包括直 接連接或由控制器110編程或配置的通信協(xié)議。
      在所選擇的實(shí)施例中,顯示器180被安裝在與圖像匹配單元140分離 的遠(yuǎn)程裝置上。所匹配的圖像或幾個(gè)最佳候選圖像可以通過有線或無線通 信協(xié)議的方式被發(fā)送到顯示器180。在可替換的實(shí)施例中,圖像錄入單元 120和顯示器180可以在例如蜂窩電話、PDA、無線終端等具有通信能力 的單個(gè)裝置中實(shí)現(xiàn)。
      參照?qǐng)D3,說明了由DT單元220使用的距離變換(DT)的概念或應(yīng) 用。圖3示出了輸入的查詢圖像210的二進(jìn)制圖像(在左側(cè))和執(zhí)行DT 應(yīng)用后的中間圖像(在右側(cè))。如圖3所示,查詢圖像210可以表示為二 進(jìn)制形式,其中查詢圖像210中的形狀的邊界像素M示為"0"〗象素值 而其余像素M示為"1"像素值。在所選擇的實(shí)施例中,DT單元220 可以以二進(jìn)制查詢圖像210中的各個(gè)像素具有對(duì)應(yīng)于二進(jìn)制圖像的邊界 與該像素之間的距離的值的方式將二進(jìn)制形式的查詢圖像210變換為灰 度圖像(即中間圖像)。DT單元220可以輸出如圖3中的右側(cè)所示的灰 階圖像?;译A圖像的像素值對(duì)應(yīng)于距圖像中的形狀邊界的距離,從而^J 巨 形狀中心最近的4象素具有最大的4象素值(在此示例中為"3")。這樣,原 始的二進(jìn)制查詢圖像可以被變換為具有取決于像素與邊界的距離而修改 的像素值的灰階圖像。
      圖4示出了說明應(yīng)用距離變換(DT)將二進(jìn)制圖像轉(zhuǎn)換為中間圖像 (例如灰階圖像)的另一個(gè)示例。左側(cè)表示的二進(jìn)制圖像在沿圖像的邊界 的像素處具有第一像素值"A"并且在其余像素處具有第二像素值"B"。DT單元220可以基于邊界和各個(gè)對(duì)應(yīng)像素的位置之間的距離而變換各個(gè) 像素值,因此DT后的中間圖像(在右側(cè))在直接鄰近邊界的像素處具有 第一像素值"A"而在不直接鄰近邊界的其余像素處具有多種其他像素值。 例如,二進(jìn)制圖像可以被變換為中間圖像以具有隨像素的位置而變化的像 素值,從而使應(yīng)用DT后的圖像中的像素在對(duì)角上鄰近邊界的像素(這些 像素僅其頂部(vertex)鄰近邊界)處具有第二值"B",在位于直接鄰近 具有值"A"的像素的像素處具有第三像素值"C",并且在位于直接鄰近 具有值"C"的像素的像素處具有第四像素值"D"。這樣,應(yīng)用DT后的 圖像(中間圖像)可以具有從"A" - "D"范圍內(nèi)的附加像素值并且各 種像素值可以表示像素的位置,從而使圖像的幾何分量,例如像素的角和 徑向分量,可以具有更高的分辨率以便由此更精確地描述圖像。
      參照?qǐng)D5,根據(jù)4^>開的一個(gè)實(shí)施例說明了應(yīng)用DT后的結(jié)果。圖5 示出了具有對(duì)二進(jìn)制查詢圖像中的各個(gè)形狀應(yīng)用DT前(左)和應(yīng)用DT 后(右)的形狀的圖像。如圖5所示,應(yīng)用DT后的圖像(右側(cè)所示的中 間圖像)的圖像中形狀的邊界具有平滑的漸變,這可以為查詢圖^4I:供附 加的幾何分量。這樣,中間圖像可以具有比查詢圖像或多種類型的圖像更 寬范圍的像素值。這種寬范圍的像素值可以提供附加參數(shù)或?qū)傩砸员愀?確地描述查詢圖像。因此,應(yīng)用DT后的圖像可以在各個(gè)像素值處具有附 加級(jí)別的參數(shù)或?qū)傩?,從而自?yīng)用DT后的圖像獲得的ART描述符可以 更精確地描述原始圖像。在一些實(shí)施例中,左側(cè)的圖像的形狀表示為黑色 和白色,并且能夠從圖像的像素所提取的信息可以基于黑和白之間的顏色 改變表示形狀的邊界存在的位置。從圖5右側(cè)的應(yīng)用DT后的圖像可見, 圖像的邊界被分級(jí),由此提供了關(guān)于圖像的附加信息,例如輪廓線、中軸 線、基干(skeleton)等。例如,由于當(dāng)像素的位置距查詢圖像的邊界更 遠(yuǎn)時(shí),應(yīng)用DT后的圖像具有更大的像素值,因此具有最大值的像素可以 對(duì)應(yīng)于圖像的中軸線。這樣,描述符生成單元280可以更準(zhǔn)確地表征圖像, 因此圖傳驗(yàn)索系統(tǒng)100可以通過使用更精確的描述符來更精確地檢索圖 像。
      在特定的實(shí)施例中,ART單元240執(zhí)行算法以產(chǎn)生用于應(yīng)用DT后 的圖像的ART描述符,由此獲得用于查詢圖像210的GART描述符。例 如,ART單元240可以通過使用極坐標(biāo)()而將灰階圖像表示為 /(p,0)。通過使用ARTM函數(shù)F^(a60,灰階圖像的特征系數(shù)F皿可 以在極坐標(biāo)系統(tǒng)中按如下所定義的來表示<formula>formula see original document page 13</formula>其中ART基礎(chǔ)函數(shù)r,(yo,60可以如下計(jì)算
      并且ART基礎(chǔ)函數(shù)K, (p,。中的每個(gè)元素被計(jì)算或定義為
      2冗 [2cos(那)
      其中n表示一個(gè)角度級(jí)別,并且m表示一個(gè)半徑級(jí)別。
      例如,如圖6所示,在11 = 0,1,2;并且m-O,l,...,ll的情況下,可以產(chǎn)生 總共36個(gè)基礎(chǔ)函數(shù)。通過使用基礎(chǔ)函數(shù),在以上等式(l)中對(duì)于m和n (n = 0,1,2;并且m = O,l,...,ll)獲得的特征系數(shù)的振幅ai被收集以形成如 下的第j個(gè)圖像的GART描述符!■=1
      相似性比較單元260可以選擇與查詢圖像具有最小距離(例如,距離向量
      的長度)的候選圖像作為匹配的圖像??商鎿Q地,相似性比較單元260
      可以選擇具有小于閾值距離的距離的候選圖像并且確定所選擇的圖像中
      的全部或部分作為匹配的圖像。相似性比較單元260可以將任何匹配的圖
      l象發(fā)送到顯示器270以允許用戶看到。
      參照?qǐng)D7并同時(shí)參考圖1,說明了根據(jù)4^>開的一個(gè)實(shí)施例的用于生 成圖像的GART描述符的方法。在步驟710,用戶可以通過使用圖像錄入 單元120初始輸入圖像到圖像檢索系統(tǒng)100。用戶可以使用多種輸入裝置, 例如鍵區(qū)、鍵盤、鼠標(biāo)等來將所期望的圖像錄入到圖傳檢索系統(tǒng)100中。 可選地,用戶可以將所期望的圖像發(fā)送到遠(yuǎn)程系統(tǒng)以檢索存儲(chǔ)在遠(yuǎn)程系統(tǒng) 的數(shù)據(jù)庫中的一個(gè)或多個(gè)圖像。在此情況下,所期望的圖像可以被錄入便 攜裝置中,例如蜂窩電話、PDA等,并且然后使用無線或有線通信協(xié)議 發(fā)送到圖^^r索系統(tǒng)200。
      圖像錄入單元120可以將查詢圖像210發(fā)送到圖像匹配單元140。在 步驟720, DT單元220 (可以在圖4象匹配單元140中實(shí)現(xiàn))可以在查詢 圖像210上執(zhí)行距離變換(DT)以產(chǎn)生中間圖像。例如,當(dāng)查詢圖像是 二進(jìn)制圖像時(shí),DT單元210可以將該二進(jìn)制圖像變換為灰階圖像。DT 單元220可以通過使用硬件實(shí)現(xiàn)、軟件實(shí)現(xiàn)或兩者的組合而采用任意適合 的方法而來執(zhí)行DT。在步驟730, ART單元240接收應(yīng)用DT后的圖像 并在應(yīng)用DT后的圖像(例如灰階圖像)上執(zhí)行ART描述符生成算法。
      在步驟740, ART單元240可以獲得應(yīng)用DT后的圖像的ART描述 符,由此獲得用于查詢圖像的GART描述符。在所選擇的實(shí)施例中,ART 單元240可以通過使用極坐標(biāo)系統(tǒng)來表示應(yīng)用DT后的圖像。ART單元 240可以在應(yīng)用DT后的圖像的極坐標(biāo)表示上執(zhí)行數(shù)值操作。例如,如以 上等式(1)所給出的,ART單元240可以將應(yīng)用DT后的圖像的極坐標(biāo) 表示乘以基礎(chǔ)函數(shù)中的一個(gè)以獲得乘法函數(shù)并且然后對(duì)該乘法函數(shù)積分
      以計(jì)算GART系數(shù)中的一個(gè)。對(duì)不同的^J函數(shù)中的每一個(gè)執(zhí)行這種操 作以獲得一個(gè)或多個(gè)GART系數(shù)。在操作750中,ART單元240基于所 述系數(shù)確定用于查詢圖像210的描述符。換句話說,ART單元240可以
      14收集GART系數(shù)以形成由以上等式(2)所給出的用于查詢圖像210的向 量形式的GART描述符。
      參照?qǐng)D8,說明了根據(jù)>$^>開的一個(gè)實(shí)施例的用于使用GART描述 符檢索圖像的方法。最初,在步驟810,用戶可以錄入查詢圖像210到圖 像檢索系統(tǒng)100的圖像錄入單元120。圖像錄入單元120通過包括例如直 接連接或通信協(xié)議的多種方式將查詢圖像發(fā)送到圖像匹配單元140。在步 驟820,圖像匹配單元140中的描述符生成單元280確定查詢圖像210的 描述符。DT單元220執(zhí)行查詢圖像210的DT變換以生成中間圖像。例 如,當(dāng)查詢圖像是二進(jìn)制圖像時(shí),DT單元210可以將該二進(jìn)制圖像變換 為灰階圖像(例如,圖5所示)。ART單元240用灰階圖像執(zhí)行ART描 述符生成算法以生成用于查詢圖像210的GART描述符。
      在步驟830,相似性比較單元260然后可以將查詢圖像210的GART 描述符與存儲(chǔ)在DB160中的候選圖像的描述符進(jìn)行比較。這種操作可以 通過測(cè)量查詢圖像210的GART描述符和候選圖像的GART描述符之間 的距離來完成。例如,為了測(cè)量該距離,如以上等式(3)所示,相似性 比較單元260計(jì)算兩個(gè)GART描述符的向量表示之間的歐幾里得 (Euclidian)距離。這種處理可以持續(xù)直至相似性比較單元260在候選圖 像中找到最接近的匹配(即產(chǎn)生足夠小距離的圖像)。在步驟840,用戶 然后可以基于操作830中提供的結(jié)果而檢索最接近的匹配的圖像270。該 圖像可以被傳送到圖傳檢索系統(tǒng)100的顯示器180以允許用戶在視覺上識(shí) 別圖像270并釆取進(jìn)一步的后續(xù)動(dòng)作。
      在某個(gè)實(shí)施例中,顯示器180可以在便攜裝置(例如蜂窩電話或PDA) 中實(shí)現(xiàn)。在這種實(shí)施例中,圖像匹配單元140可以通過例如藍(lán)牙、紫蜂、 GSM、 CDMA等通信協(xié)議將匹配的圖像270發(fā)送到例如個(gè)人計(jì)算機(jī)、膝 上型計(jì)算機(jī)或蜂窩電話的便攜裝置。為了估計(jì)GART描述符的數(shù)據(jù)庫搜 索性能,使用由MPEG-7當(dāng)前使用的數(shù)據(jù)庫進(jìn)行數(shù)據(jù)庫搜索測(cè)試。所使 用的數(shù)據(jù)庫包括1300個(gè)圖像,該1300個(gè)圖像被分類為4層、包括8個(gè)頂 級(jí)類別和102個(gè)低級(jí)別或"葉子"類別的分級(jí)結(jié)構(gòu)。MPEG-7所4吏用的牛 眼性能(BEP)被應(yīng)用作為性能估計(jì)測(cè)量。較高的BEP分?jǐn)?shù)意味著較高 效的性能。
      圖9比較用于26個(gè)圖像的一個(gè)實(shí)施例中的GART描述符和傳統(tǒng)的 ART描述符之間的搜索性能。如圖8明確顯示,由BEP測(cè)量的GART 描述符的性能優(yōu)于傳統(tǒng)的ART描述符(在該特定示例中在相似性上超過約為3% )。
      鑒于^L/^開,本領(lǐng)域技術(shù)人員將理解此處所述的系統(tǒng)、設(shè)備和方法可 以在硬件、軟件、固件、中間件或其組合中實(shí)現(xiàn)并且在系統(tǒng)、子系統(tǒng)、組 件或其子組件中使用。例如,以軟件實(shí)現(xiàn)的方法可以包括計(jì)算機(jī)編碼以執(zhí) 行所述方法的操作。這種計(jì)算機(jī)編碼可以存儲(chǔ)在機(jī)器可讀介質(zhì)中,例如處 理器可讀介質(zhì)或計(jì)算機(jī)程序產(chǎn)品,或者通過傳輸介質(zhì)或通信鏈路作為包含 在載波中的計(jì)算機(jī)數(shù)據(jù)信號(hào)或由栽波調(diào)制的信號(hào)而發(fā)送。機(jī)器可讀介質(zhì)或 處理器可讀介質(zhì)可以包括能夠存儲(chǔ)或傳輸具有可讀形式并可由機(jī)器(例如 通過處理器、計(jì)算機(jī)等)執(zhí)行的信息的任意介質(zhì)。
      本公開可以在不背離其基本特點(diǎn)或本質(zhì)特征的情況下以其他具體形 式來實(shí)現(xiàn)。因此,所描述的實(shí)施例在各個(gè)方面僅^L視為示例性的,而不具 有限制性。因此,本公開的范圍由所附權(quán)利要求指出而不是由之前的說明 書指出。在權(quán)利要求的等價(jià)的意義和范圍內(nèi)的全部改變均包含在所述權(quán)利 要求的范圍內(nèi)。
      權(quán)利要求
      1.一種圖像檢索系統(tǒng),包括圖像錄入單元,所述圖像錄入單元被配置為接收作為輸入的圖像;描述符確定單元,所述描述符確定單元被配置為將所述圖像變換為中間圖像以生成所述圖像的描述符;圖像比較單元,所述圖像比較單元被配置為通過比較所述圖像的描述符與一個(gè)或多個(gè)候選圖像的描述符而將所述圖像與所述一個(gè)或多個(gè)候選圖像進(jìn)行比較;以及檢索單元,所述檢索單元被配置為基于所述圖像與所述一個(gè)或多個(gè)候選圖像的描述符的比較而檢索類似于所述圖像的所述一個(gè)或多個(gè)候選圖像中的至少一個(gè)。
      2. 根據(jù)權(quán)利要求l所述的圖#^索系統(tǒng),其中所述描述符確定單元 包括第一變換單元和第二變換單元。
      3. 根據(jù)權(quán)利要求l所述的圖^^r索系統(tǒng),還包括顯示器,所述顯示 器被配置為顯示類似于輸入圖像的所述一個(gè)或多個(gè)候選圖像中的所述至 少一個(gè)。
      4. 根據(jù)權(quán)利要求l所述的圖^^r索系統(tǒng),還包括數(shù)據(jù)庫,所述數(shù)據(jù) 庫用于存儲(chǔ)所述多個(gè)候選圖像。
      5. 根據(jù)權(quán)利要求l所述的圖^^r索系統(tǒng),其中所述圖像比較單元被 配置為測(cè)量所述圖像的描述符和所述候選圖像的描述符之間的距離以將 所述圖像與所述多個(gè)候選圖像進(jìn)行比較。
      6. 根據(jù)權(quán)利要求5所述的圖#^索系統(tǒng),其中所述檢索單元被配置 為檢索具有到所述圖像的最短距離的所述一個(gè)或多個(gè)候選圖像中的至少 一個(gè)。
      7. 根據(jù)權(quán)利要求2所述的圖像檢索系統(tǒng),其中所述第一變換單元對(duì) 所述圖4象執(zhí)行距離變換(DT )。
      8. 根據(jù)權(quán)利要求7所述的圖#^索系統(tǒng),其中所述第一變換單元被 配置為生成所述圖像的附加特征。
      9. 根據(jù)權(quán)利要求8所述的圖#^索系統(tǒng),其中所述圖像的附加特征 包括所述圖〗象的形狀的輪廓線、中間線和基干中的至少一個(gè)。
      10. 根據(jù)權(quán)利要求2所述的圖#^索系統(tǒng),其中所述笫二變換單元被 配置為對(duì)由所述第 一 變換單元處理后的圖像執(zhí)行角徑向變換(ART )。
      11. 一種用于生成與圖^N目關(guān)聯(lián)的描述符的設(shè)備,所述設(shè)備包括輸入單元,所述輸入單元被配置為輸入圖像;第一變換單元,所述笫一變換單元被配置為將所述圖4象變換為中間圖 像;以及第二變換單元,所述第二變換單元被配置為對(duì)所述中間圖像進(jìn)行操作 以生成所述圖像的描述符。
      12. 根據(jù)權(quán)利要求11所述的設(shè)備,其中所述中間圖像是灰階圖像。
      13. 根據(jù)權(quán)利要求11所述的設(shè)備,其中所述第一變換單元被配置為 對(duì)所述圖像執(zhí)行距離變換(DT )。
      14. 根據(jù)權(quán)利要求13所述的設(shè)備,其中所述第一變換單元被配置為 生成所述圖像的附加特征。
      15. 根據(jù)權(quán)利要求14所述的設(shè)備,其中所述圖像的附加特征包括所 述圖像的形狀的輪廓線、中軸線和基干中的至少一個(gè)。
      16. 根據(jù)權(quán)利要求11所述的設(shè)備,其中所述第二變換單元被配置為 對(duì)由所述第一變換單元處理后的圖像執(zhí)行角徑向變換(ART)。
      17. 根據(jù)權(quán)利要求11所述的設(shè)備,其中所述第二變換單元被配置為 將所述中間圖像變換為表示所述中間圖像的特征的一個(gè)或多個(gè)系數(shù)。
      18. 根據(jù)權(quán)利要求17所述的設(shè)備,其中所述第二變換單元被配置為 收集所述一個(gè)或多個(gè)系數(shù)以生成所述圖像的描述符。
      19. 根據(jù)權(quán)利要求11所述的設(shè)備,其中所述設(shè)備是便攜裝置。
      20. —種圖像匹配設(shè)備,包括變換單元,所述變換單元被配置為將圖像變換為中間圖像;描述符生成單元,所述描述符生成單元被配置為從所述中間圖像生成 所述圖像的描述符;以及匹配單元,所述匹配單元被配置為將所述圖像的描述符與一個(gè)或多個(gè) 候選圖像的描述符進(jìn)行比較。
      21. 根據(jù)權(quán)利要求20所述的圖像匹配設(shè)備,還包括存儲(chǔ)裝置,所述存儲(chǔ)裝置被配置為存儲(chǔ)所述一個(gè)或多個(gè)候選圖像。
      22. 根據(jù)權(quán)利要求20所述的圖像匹配設(shè)備,其中所述匹配單元進(jìn)一 步被配置為測(cè)量所述圖像的描述符和所述一個(gè)或多個(gè)候選圖像的描述符 之間的多巨離。
      23. 根據(jù)權(quán)利要求20所述的圖像匹配設(shè)備,其中所述變換單元被配 置為對(duì)所述圖像執(zhí)行距離變換(DT)以生成所述中間圖《象。
      24. 根據(jù)權(quán)利要求20所述的圖像匹配設(shè)備,其中所述描述符生成單 元被配置為對(duì)由所述變換單元處理后的圖像執(zhí)行角徑向變換(ART )。
      25. —種用于生成圖像的描述符的方法,所述方法包括 接收作為輸入的圖像; 將所述圖像變換為中間圖像;以及基于所述中間圖像生成所述圖像的描述符。
      26. 根據(jù)權(quán)利要求25所述的方法,其中變換所述圖像包括對(duì)該圖像 執(zhí)4亍多巨離變換(DT)。
      27. 根據(jù)權(quán)利要求25所述的方法,其中生成所述描述符包括執(zhí)行角 徑向變換(ART)。
      28. —種圖像檢索方法,包括 將圖像變換為中間圖像;基于所述中間圖像的特征生成所述圖像的描述符;通過比較所述圖像的描述符與候選圖像的描述符而將所述圖像與一 個(gè)或多個(gè)候選圖像進(jìn)行比較;以及基于所述描述符的比較而檢索類似于所述圖像的所述一個(gè)或多個(gè)候 選圖像中的至少一個(gè)。
      29. 根據(jù)權(quán)利要求28所述的圖像檢索系統(tǒng),其中比較所述圖像包括 測(cè)量所述圖像的描述符和所述候選圖像的描述符之間的距離以將所述圖 像與所述多個(gè)候選圖像進(jìn)行比較。
      30. 根據(jù)權(quán)利要求29所述的圖#^索系統(tǒng),其中檢索一個(gè)或多個(gè)候 選圖像包括檢索具有到所述圖像的最短距離的所述候選圖像中的至少一 個(gè)。
      31. —種存儲(chǔ)指令的計(jì)算機(jī)可讀介質(zhì),當(dāng)由計(jì)算機(jī)執(zhí)行所述指令時(shí), 使得計(jì)算機(jī)執(zhí)行用于生成圖像的描述符的方法,所述方法包括將圖像變換為中間圖〗象;以及基于所述中間圖像生成所述圖像的描述符。
      32. —種存儲(chǔ)指令的計(jì)算機(jī)可讀介質(zhì),當(dāng)由計(jì)算機(jī)執(zhí)行所述指令時(shí), 使得計(jì)算機(jī)執(zhí)行用于檢索圖像的方法,所述方法包括將圖像變換為中間圖像;基于所述中間圖像的特征生成所述圖像的描述符;通過比較所述圖像的描述符與候選圖像的描述符而將所述圖像與多 個(gè)候選圖像進(jìn)行比較;以及基于所述描述符的比較而檢索類似于所述圖像的一個(gè)或多個(gè)候選圖像。
      33. —種包括指令的計(jì)算機(jī)程序,當(dāng)由計(jì)算機(jī)執(zhí)行所述計(jì)算M序時(shí), 使得計(jì)算機(jī)執(zhí)行用于生成圖像的描述符的方法,所述方法包括接收輸入圖像;將所述圖像變換為中間圖像;以及 基于所述中間圖像生成所述圖像的描述符。
      34. —種包括指令的計(jì)算機(jī)程序,當(dāng)由計(jì)算機(jī)執(zhí)行所述計(jì)算積艱序時(shí), 使得計(jì)算機(jī)執(zhí)行用于檢索圖像的方法,所述方法包括將輸入圖像變換為中間圖像;基于所述中間圖像的特征生成所述圖像的描述符;通過比較所述圖像的描述符與候選圖像的描述符而將所述圖像與多 個(gè)候選圖像進(jìn)行比較;以及基于所述描述符的比較而檢索類似于所述圖像的一個(gè)或多個(gè)候選圖像。
      全文摘要
      一種圖像檢索系統(tǒng),包括圖像錄入單元,該圖像錄入單元被配置為輸入圖像。描述符確定單元接收?qǐng)D像并將該圖像變換為中間圖像以生成該圖像的描述符,例如,使用距離變換(DT)應(yīng)用。圖像比較單元通過比較該圖像的描述符與多個(gè)候選圖像的描述符而將該圖像與多個(gè)候選圖像進(jìn)行比較。最后,檢索單元基于其描述符的比較而檢索類似于輸入圖像的一個(gè)或多個(gè)候選圖像。
      文檔編號(hào)G06F17/30GK101669117SQ200880000306
      公開日2010年3月10日 申請(qǐng)日期2008年5月9日 優(yōu)先權(quán)日2008年5月9日
      發(fā)明者尹逸東 申請(qǐng)人:韓國外國語大學(xué)校研究產(chǎn)學(xué)協(xié)力團(tuán)
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
      1