專利名稱:制作標(biāo)準(zhǔn)化圖象模板的方法和設(shè)備的制作方法
請(qǐng)參考縮微膠片附錄。該附錄構(gòu)成本說明書的一部份,它包括一張帶有82幀的縮微膠片。
本申請(qǐng)相關(guān)以下以容美國申請(qǐng)序列號(hào)08/145,051,申請(qǐng)日為1993年10月29日,申請(qǐng)人是Ray、Ellson和Gandhi,發(fā)明名稱為“在事項(xiàng)磁卡上進(jìn)行圖象壓縮、存貯和檢索的方法和裝置”,其柯達(dá)案卷目錄為68,290。
美國申請(qǐng)序列號(hào)08/145,284,申請(qǐng)日為1993年10月29日,申請(qǐng)人是Ray和Ellson,發(fā)明名稱為“標(biāo)準(zhǔn)化圖象庫的壓縮方法”,其柯達(dá)案卷目錄為68,291。
美國申請(qǐng)序列號(hào)08/144,753,申請(qǐng)日為1993年10月29日,申請(qǐng)人是Ray和Ellson,發(fā)明名稱為“用保留值數(shù)據(jù)編碼的方法和裝置”,其柯達(dá)案卷目錄為68,362。
柯達(dá)案卷目錄71,250,與本申請(qǐng)同一日期提交,申請(qǐng)人是Ray、Ellson和Elbaz,發(fā)明名稱為“對(duì)標(biāo)準(zhǔn)化肖像圖像進(jìn)行壓縮和還原的方法”。
上述參考申請(qǐng)的教導(dǎo)被允許以參考編入進(jìn)去,仿佛在此陳列全文。
本發(fā)明關(guān)系到數(shù)字圖像處理領(lǐng)域,更詳細(xì)地說,關(guān)系到一種方法及其相關(guān)裝置,用于制作數(shù)字式標(biāo)準(zhǔn)化圖像特征模板,以減少適當(dāng)?shù)乇硎疽粋€(gè)圖象所需要的位數(shù)。
本發(fā)明的背景這一專利文獻(xiàn)的縮微膠片附錄中所公開的內(nèi)容包含對(duì)材料作出版權(quán)保護(hù)的要求,版權(quán)所有人不反對(duì)對(duì)任一專利文獻(xiàn)或?qū)@_內(nèi)容的影印復(fù)制,因?yàn)槠涑霈F(xiàn)在美國專利商標(biāo)局的專利文稿或記錄上,但保留所有其它權(quán)利。
考慮一個(gè)具有類似圖象內(nèi)容的圖象庫,如一丟失小孩的肖像的集合。在這些圖象的集合中,由于臉部具有共同的特征,因此,基于象素位置,存在很大程度上的圖象與圖象之間的相關(guān)性。這個(gè)在不同圖象上的相關(guān)性,恰像在一給定的圖象中的空間相關(guān)性,能夠被開發(fā)利用以改進(jìn)壓縮。
基于在圖象中所處位置,對(duì)某些圖象庫的研究會(huì)得出圖象保真度的有關(guān)重要性的知識(shí)。如果這些圖像是用來識(shí)別丟失的兒童的,那么臉部區(qū)域的圖象保真度就比頭發(fā)或肩膀的保真度重要得多,而相比于背部而言,則頭發(fā)或肩膀的保真度又要重要一些。在對(duì)于應(yīng)用而言視覺圖象保真度不太重要的地方,圖象可以壓縮得更過分一些。
在許多應(yīng)用中,保持原始圖象的取向和量化遠(yuǎn)不如保持圖象中所包含的視覺信息重要。特別是對(duì)于丟失兒童案中的圖象而言,如果從原始圖象或從經(jīng)過處理以便于壓縮的圖象可以同樣便利地確認(rèn)肖像中的兒童的特征,那么將處理過的圖象放入庫中不會(huì)帶來損失。采用這一原理,通過將原始圖象制成標(biāo)準(zhǔn)化的格式,可建立已處理圖象庫。對(duì)丟失的兒童的肖像而言,這可能包括對(duì)每個(gè)小孩的頭部定位,使其眼睛保持水平,以及相對(duì)于圖象邊界使頭部居中。一旦這樣標(biāo)準(zhǔn)化的圖象被建立起來,就可以很好地進(jìn)行壓縮,因?yàn)槲覀冎?,該?biāo)準(zhǔn)化帶來了圖象與圖象之間的關(guān)聯(lián)性。
一種壓縮方法中稱為向量量化(Vector Quantization-VQ)的技術(shù)在找出一個(gè)圖象的各部份之間的關(guān)聯(lián)時(shí)很有用。采用向量量化VQ壓縮很適合于固定速率、有損耗、高比例壓縮應(yīng)用(見IEEE ASSP雜志,1984年4月第1卷,第4-29頁,R.M.Gray的“向量量化”)。這一方法將圖象分為一小片一小片的“圖象塊”。這些塊隨后與在通常稱之為代碼簿(codebook)的預(yù)定的圖象塊集合中的其它圖象塊匹配。該匹配算法通常是最小平方誤差(minimum-squared-error-MSE)。由于圖象塊集合是預(yù)定的,集合的表項(xiàng)之一可以用一個(gè)簡單的索引引用,由此,一個(gè)多象素塊可以通過一個(gè)單一號(hào)碼來引用。采用這樣一種方法,可以對(duì)一個(gè)圖象的位數(shù)作合理預(yù)算。當(dāng)給每個(gè)圖象塊分配大量的位時(shí),代碼簿的尺寸會(huì)增大。與此類似,如果對(duì)圖象分配大量的位時(shí),圖象塊的數(shù)目可以增大(從而每塊的尺寸減小)。
通過首先構(gòu)成稱之為訓(xùn)練圖象集的代表圖象集來確定代碼簿。接著,將圖象分為圖象塊,并將這些圖象塊作為高維向量空間中的向量來考慮,即,對(duì)于一個(gè)8×8的圖象塊,空間有64維。圖象塊是從位于訓(xùn)練圖象集的每個(gè)圖象中的預(yù)定區(qū)域中選出的。一旦從訓(xùn)練集中確定了所有的向量,那么找到群集,并將代表元分配給每個(gè)群集。對(duì)群集的選擇要使得一個(gè)訓(xùn)練集的元素與該元素被分配給該群集的代表之間的總體組合距離最小化。選擇技術(shù)是Linde-Buzo-Gray(LBG)算法(參看IEEE Transactions OnCommunications,1980年1月,第COM-28卷,第1冊(cè),第84-95頁,Y.Linde等人的“向量量化器設(shè)計(jì)算法”)。群集數(shù)是由為描述圖象塊作預(yù)算的位數(shù)來確定的。假定n位,代碼簿可以包含多至2n群集代表或代碼向量。
上述參考專利申請(qǐng),即由Ray、Ellson和Gandhi提交的美國申請(qǐng)序列號(hào)08/145,051和由Ray和Ellson提交的美國申請(qǐng)序列號(hào)08/145,284,都描述了一個(gè)系統(tǒng),該系統(tǒng)利用圖象庫中標(biāo)準(zhǔn)化特征的優(yōu)點(diǎn),能夠達(dá)到高壓縮比率,而圖象質(zhì)量損失很小。這一壓縮方法利用標(biāo)準(zhǔn)化所產(chǎn)生的固有的圖象與圖象之間的關(guān)聯(lián)性的優(yōu)點(diǎn)來改進(jìn)可預(yù)測性,從而,通過對(duì)標(biāo)準(zhǔn)化圖象所作的訓(xùn)練以及構(gòu)成包括8×8象素代碼向量的復(fù)式代碼簿,來改進(jìn)可壓縮性。
這些應(yīng)用描述了在圖象庫中提取圖象的共同特征并以此作為圖象標(biāo)準(zhǔn)化的基礎(chǔ)的一個(gè)過程。一旦圖象被制成標(biāo)準(zhǔn)化庫圖象,就可以對(duì)其進(jìn)行壓縮,并在其后還原成原始庫圖象的有損代表。
作為被上述參考專利申請(qǐng)所描述的現(xiàn)有技術(shù)綜述起來包括標(biāo)準(zhǔn)化選擇最重要的圖象特征。
對(duì)庫中的一個(gè)代表圖象集合進(jìn)行處理,以增強(qiáng)選定的特征。
將選定的特征放在代表圖象中。
確定圖象特征定位的約束條件。
對(duì)圖象進(jìn)行處理,以滿足圖象特征定位約束條件。
根據(jù)所存在的特征或者所需要的圖象質(zhì)量的水平,分配圖象的區(qū)域。
對(duì)每個(gè)子區(qū)域,確定圖象與圖象之間的關(guān)聯(lián)性。
將基于分區(qū)子區(qū)域的每一子分區(qū)的圖象信息的存儲(chǔ)容量分配給圖象塊和代碼簿大小。
制作代碼簿,以利用關(guān)聯(lián)性的優(yōu)點(diǎn)。
對(duì)圖象進(jìn)行處理,以增強(qiáng)特征。
將選定的特征放在圖象中。
通過對(duì)圖象的處理將圖象進(jìn)行標(biāo)準(zhǔn)化處理以滿足圖象特征定位約束條件。
根據(jù)子區(qū)域及其圖象塊來劃分圖象。
對(duì)每個(gè)區(qū)域,確定最近似圖象內(nèi)容的代碼簿的表目。
對(duì)每個(gè)圖象塊存貯代碼簿值序列,因?yàn)檫@就是壓縮的圖象。
還原從代碼簿值序列中選取代碼簿值。
根據(jù)代碼簿值序列中相應(yīng)的子區(qū)域位置來確定代碼簿。
從上面確定的代碼簿中根據(jù)代碼簿值抽取一個(gè)圖象塊。
將圖象塊復(fù)制到子區(qū)域中適當(dāng)?shù)膱D象塊位置。
持續(xù)插入圖象塊,直到在整個(gè)圖象中所有圖象塊位置都被填上。
為了對(duì)一單磁道事務(wù)磁卡(magnetic transactioncard)用符合國際標(biāo)準(zhǔn)的方式來存貯一個(gè)壓縮的面部圖象,可用的數(shù)據(jù)容量低于500比特(見ISO7811/2)。
當(dāng)目標(biāo)位數(shù)非常小時(shí),如臉部圖象存貯在500位之下的情況下,上面描述的壓縮/還原過程不能提供用于某些驗(yàn)證和辯認(rèn)應(yīng)用中的質(zhì)量保持一致的臉部圖象。對(duì)于要求更高的驗(yàn)證系統(tǒng)而言,還需要額外的技術(shù)來進(jìn)一步改進(jìn)壓縮圖象的質(zhì)量。這種改進(jìn)的機(jī)會(huì)在圖象標(biāo)準(zhǔn)化、特定的代碼簿制作和圖象塊對(duì)稱性中都存在。
即使對(duì)圖象中臉的定位和定向的標(biāo)準(zhǔn)化,肖像的明暗情況也可能是高度不對(duì)稱的,這就導(dǎo)致了一個(gè)人的面部肖像的左右側(cè)亮度不平衡。這時(shí)所需要的是一種為平衡一個(gè)人的臉部肖像的亮度的方法,以便取得較高的面部圖象肖像標(biāo)準(zhǔn)化,并且提高人的面部圖象的自然對(duì)稱性。
隨著圖象特征的亮度和定位兩者的標(biāo)準(zhǔn)化,所以研制代碼簿來更好地在圖象中特定的位置表示期望的圖象內(nèi)容。Sexton的美國專利5,086,480專門介紹代碼簿方法,其發(fā)明名稱為“視頻圖象處理”,該專利介紹了兩個(gè)代碼簿的應(yīng)用。這一壓縮方法通過對(duì)兩個(gè)代碼簿的窮盡搜索,從兩個(gè)代碼簿中找到最佳的代碼向量,然后對(duì)從中找到最佳匹配的代碼簿設(shè)置標(biāo)志。最終結(jié)果是一個(gè)包含具有可能不同代碼向量數(shù)的兩個(gè)代碼簿的“超級(jí)代碼簿”,其中標(biāo)志指示被選定的代碼簿。代碼簿選擇不是出自對(duì)圖象的一個(gè)區(qū)域的內(nèi)容的事先了解,Sexton計(jì)算了對(duì)每個(gè)圖象中的每個(gè)代碼向量采用哪個(gè)代碼簿。要進(jìn)行較大的壓縮,機(jī)會(huì)之一是消除存貯代碼簿標(biāo)志的需求。
應(yīng)該注意到,Sexton的方法要求兩個(gè)代碼簿中的所有代碼向量具有相同的維數(shù)。另外,上面引用的Ray的現(xiàn)有技術(shù)將圖象劃分為相等大小的圖象塊。
改進(jìn)壓縮肖像的質(zhì)量的另一個(gè)途徑是采用面部圖象的相關(guān)性,在面部圖象中臉的左右側(cè)近似鏡象對(duì)稱。通常,在近前方透視肖像中,在靠近中線的面部部位之間存在很大程度的相關(guān)性。特別是用于反映眼睛上下的面部部份的圖象塊顯示很高程度的對(duì)稱相關(guān)性。然而,當(dāng)從稍微不同的角度觀察時(shí),沿著面部的中線,由于鼻子外觀的變化,對(duì)稱的程度下降。所需要的是一種方法,該方法通過利用面部中線周圍區(qū)域中人臉的自然對(duì)稱,在不對(duì)鼻子強(qiáng)加有害的對(duì)稱限制的情況下,進(jìn)一步減少存貯一個(gè)壓縮肖像圖象所需要的位數(shù)。
圖象的某些部位對(duì)個(gè)人識(shí)別時(shí)沒有任何顯著的價(jià)值。例如,在識(shí)別過程中,肩部區(qū)域的作用極小,此外,這一區(qū)域常常穿著衣服,這對(duì)同一個(gè)人來說變化也是極大的。由于這樣的區(qū)域幾乎沒什么價(jià)值,因此編碼圖象時(shí)對(duì)其分配的位數(shù)也應(yīng)該減少。在本發(fā)明中,某些這種區(qū)域即使分配一些位,也是很少的,其圖象數(shù)據(jù)是從鄰近塊的圖象數(shù)據(jù)中合成出來的。這樣就使得更多的位被分配去編碼更重要的區(qū)域。
本發(fā)明技術(shù)便利對(duì)圖象特征模板的制作,該模板在相同特征圖象的壓縮和還原中特別有用。更詳細(xì)地說,該特征模板能夠壓縮和還原具有一致的相同圖象特征集合的大量圖象,這些特征能夠被對(duì)準(zhǔn)和定標(biāo),從而把這些特性定位在非常相關(guān)的區(qū)域中。
本發(fā)明的特征模板包括若干模板元,每個(gè)元代表物體的一個(gè)特征;以及代表每個(gè)模板元的屬性的數(shù)據(jù)。
構(gòu)成特征模板的最佳方法包括以下步驟建立特征模板的維數(shù),以適應(yīng)標(biāo)準(zhǔn)化的圖象;將所述特征模板劃分為若干特征類型,以適應(yīng)標(biāo)準(zhǔn)化圖象中的相同特征;對(duì)每個(gè)特征類型分配至少一個(gè)模板元;記錄所有被分配的模板元在所述特征模板的維數(shù)中的位置,以便利對(duì)這樣制作的特征模板的重新構(gòu)造。
從上面所作的描述可以看出,本發(fā)明的一個(gè)主要目的是提供一個(gè)特征模板,該模板可用于一個(gè)系統(tǒng)中以降低相關(guān)的圖象集合的數(shù)據(jù)存貯需要。
根據(jù)下面結(jié)合附圖所作的進(jìn)一步描述,可更清楚地了解本發(fā)明的上述目的及其它目的。在附圖中,相同的字符代表相同的部分,這些附圖構(gòu)成本發(fā)明的一部分。
圖1A、1B和1C示出了正面頭像,該頭像被分別斜置、旋轉(zhuǎn)并平移到一個(gè)標(biāo)準(zhǔn)位置,以及調(diào)整為標(biāo)準(zhǔn)尺寸;圖2以流程圖形式示出了對(duì)圖象進(jìn)行標(biāo)準(zhǔn)化的方法;圖3A示出了構(gòu)成一個(gè)模板的模板元的位置和大小。
圖3B用陰影區(qū)域示出了具有左右翻轉(zhuǎn)特性的模板的模板元的位置和大小;圖3C用陰影區(qū)域示出了具有上下翻轉(zhuǎn)特征的模板的模板元的位置和大?。粓D3D用陰影區(qū)域示出了被連接起來模板的模板元的位置和大??;圖4以表的形式示出了肖像特征、它們的相關(guān)的標(biāo)簽及其特性;圖5A和5B示出了為圖3A-3D所示的模板中的元素所記錄的模板元數(shù)據(jù);圖6示出了與用于本發(fā)明的特定實(shí)施例中的每個(gè)特征類型A-M相關(guān)的貼片(tiles)的一個(gè)集合;圖7示出了一個(gè)壓縮圖象的用數(shù)字標(biāo)記和用標(biāo)簽標(biāo)記的貼片;圖8示出了從特征類型貼片集合中抽取的貼片,陰影較淡處的貼片至少有一個(gè)翻轉(zhuǎn)特性;圖9示出了執(zhí)行所有翻轉(zhuǎn)特性后的貼片;
圖10示出了最終的圖象;圖11示出了執(zhí)行本發(fā)明方法的最佳的裝置結(jié)構(gòu)。
圖1A代表正面臉部肖像的一個(gè)圖象。在這個(gè)例子中,該臉對(duì)于圖象的中心被傾斜和平移。根據(jù)圖象的來源,也可以會(huì)遇到在圖象的邊界之內(nèi)進(jìn)行臉部定位和定尺寸的其它變化。為了取得本發(fā)明的最大效果,臉的大小、位置和方向都被標(biāo)準(zhǔn)化。為了對(duì)圖象進(jìn)行操作,圖象被安排成數(shù)字格式,通常作為一個(gè)象素值的矩陣。圖象的數(shù)字格式(象素值)是通過掃描原始圖象,將原始圖象轉(zhuǎn)換為數(shù)字化的電信號(hào)值而導(dǎo)出的。該數(shù)字圖象格式隨后被用來在顯示器上重現(xiàn)顯示圖象,以便將標(biāo)準(zhǔn)化過程應(yīng)用到顯示圖象以及構(gòu)成顯示圖象的象素值上,從而構(gòu)成一個(gè)標(biāo)準(zhǔn)化的幾何圖象。圖象被標(biāo)準(zhǔn)化,以提供能與模板相關(guān)的模板元相匹配的質(zhì)量(本說明書后面將作詳細(xì)描述)。該過程始于圖1A,首先于圖象中確定臉部左右眼的中心。在圖1B中,采用眾所周知的圖象處理操作,根據(jù)需要,將圖1A的臉部圖象進(jìn)行旋轉(zhuǎn)和平移,以便將左右眼的中心沿預(yù)定的水平軸定位,并且該圖象繞一個(gè)中心縱軸均勻分布,從而形成代表一個(gè)部份標(biāo)準(zhǔn)化幾何圖象的臉部圖象的新的數(shù)字化圖象。圖1C示出了通過將圖象定標(biāo)為標(biāo)準(zhǔn)尺寸從而構(gòu)成一個(gè)標(biāo)準(zhǔn)化幾何臉部圖象的按一定尺寸制作的圖1B的臉部圖象。
現(xiàn)在參看圖2,構(gòu)成標(biāo)準(zhǔn)化幾何圖象的方法在從標(biāo)明“選擇一個(gè)圖象”的方框開始的流程圖框中作了說明。該選擇過程以用本發(fā)明模板被處理過的人的正面頭象的可用性為基礎(chǔ)。在選擇過程中所包含的是產(chǎn)生可用圖象的數(shù)字矩陣表示。該數(shù)字矩陣接著被裝入一個(gè)系統(tǒng)中(示于圖11),用來給操作人員顯示。如前所述,操作人員確定左右眼,并且對(duì)圖象進(jìn)行所需要的旋轉(zhuǎn)、平移和重定比例,以構(gòu)成標(biāo)準(zhǔn)化的幾何圖象。
更詳細(xì)地說,就圖1C的標(biāo)準(zhǔn)圖象和圖2的流程圖而言,在本發(fā)明的這個(gè)實(shí)施例中,圖象標(biāo)準(zhǔn)如下設(shè)置圖象大小,寬度為56個(gè)象素,高度為64個(gè)象素,眼睛中心位于離圖象上邊界28個(gè)象素處以及縱向中心線兩側(cè)8個(gè)象素處。確定左眼和右眼的中心是將初始圖象顯示給操作人員,由他采用諸如鼠標(biāo)、圖形輸入板、光筆或者觸摸感測屏之類的定位設(shè)備來指定中心位置。另一種方法是采用特征搜索程序來自動(dòng)進(jìn)行處理。操作人員確定眼睛的位置,處理器通過在操作人員確定的位置周圍較小的區(qū)域采用眼睛尋找搜索方法,來微調(diào)該位置。標(biāo)準(zhǔn)化的下一步是改變圖象,使眼睛的位置被標(biāo)準(zhǔn)地確定在預(yù)定的位置。一般來說,這包括圖象平移、定比例和旋轉(zhuǎn)的標(biāo)準(zhǔn)圖象處理操作。
當(dāng)圖象的大小和眼睛的位置被調(diào)節(jié)后,將標(biāo)準(zhǔn)化幾何圖象存貯起來,并進(jìn)行亮度標(biāo)準(zhǔn)化程序,該程序通過以偶數(shù)40-52標(biāo)明的流程框所表示。采用三維標(biāo)度對(duì)數(shù)字化圖象亮度的變化進(jìn)行標(biāo)準(zhǔn)化處理;大代表光的水平/方向,中代表從側(cè)光對(duì)不對(duì)稱陰影進(jìn)行校正,小代表減少來自眼鏡、珠寶和皮膚的特殊強(qiáng)光。這些程序改變了數(shù)字化圖象中的平均亮度水平。某些在判別一個(gè)個(gè)體時(shí)很有用的特征在灰度范圍肖像中趨向于減弱。因此,為了增強(qiáng)這些特性,被稱作對(duì)比度的亮度水平的變化也被作了調(diào)整。
由方框50所表示的功能運(yùn)行將臉部平均亮度,即鼻子周圍部份的平均亮度,改變?yōu)橐粋€(gè)預(yù)定值。在這個(gè)最佳實(shí)施例中,淺膚色的人的預(yù)定值為165,中等膚色為155,深膚色為135。由方框50所構(gòu)成的標(biāo)準(zhǔn)化數(shù)字圖象現(xiàn)在由相應(yīng)于功能方框52存貯的一個(gè)可存貯象素值矩陣所表示。
圖3A示出了將同圖2的標(biāo)準(zhǔn)化圖象一起使用的模板30的設(shè)計(jì)。該模板30被分為標(biāo)上A至M的64個(gè)模板元。這些元素根據(jù)人臉的13個(gè)相應(yīng)特征排列,例如,模板元A相應(yīng)于頭頂?shù)念^發(fā)特征,模板元G對(duì)應(yīng)于眼睛。帶有相同標(biāo)號(hào)的模板元共同代表一個(gè)特征。圖4、5A和5B的表對(duì)其余的模板元作了進(jìn)一步的描述。雖然本發(fā)明的最佳實(shí)施例有64個(gè)模板元和13個(gè)特征實(shí)現(xiàn),但應(yīng)該理解,這些數(shù)字可以根據(jù)情況加以改變,而不對(duì)本發(fā)明的方法加以約束。還應(yīng)該注意的是,模板的某些區(qū)域沒有被分配任何元素?;趶拇a簿對(duì)信息的檢索,這些沒被分配的區(qū)域?qū)⒉粫?huì)有圖象內(nèi)容。對(duì)這些區(qū)域分配圖象內(nèi)容的方法將以后面要描述的鄰接區(qū)域的分配為基礎(chǔ)。該模板的大小與寬為56個(gè)象素、高為64個(gè)象素的標(biāo)準(zhǔn)化圖象的尺寸相匹配。該模板元的大小以其要表示的臉部特征的大小為基礎(chǔ)。例如,G是一個(gè)標(biāo)準(zhǔn)化圖象中一只眼睛的相對(duì)尺寸,分配給G的兩個(gè)元素都放置在一個(gè)標(biāo)準(zhǔn)圖象中眼睛所處的位置。
在圖3B中,陰影模板元代表具有左右翻轉(zhuǎn)特性的元素,后面對(duì)此將作詳細(xì)描述。
在圖3C中,陰影模板元代表具有上下翻轉(zhuǎn)特性的元素,后面對(duì)此將作詳細(xì)描述。
模板元的另一特性是連接。圖3D用陰影區(qū)域代表了作為連接部份的模板元的位置。在這個(gè)特殊的實(shí)施例中存在7個(gè)元素連接對(duì)。在每對(duì)陰影模板元之間的連接是水平的,例如,位于中心左邊的G連接到位于中心右邊的G。雖然作為最佳實(shí)施例示出了7個(gè)連接對(duì),但在大于2個(gè)元素的組中以及在任何具有相同標(biāo)號(hào)的元素集合之間也可以出現(xiàn)連接。
模板30事實(shí)上是一數(shù)據(jù)記錄序列,在最佳實(shí)施例中,每個(gè)記錄描述了每個(gè)模板元的位置、大小、標(biāo)號(hào)、左右特性、上下特性以及連接。在需要時(shí),可以產(chǎn)生帶有其它和/或額外因素的數(shù)據(jù)記錄。
模板30記錄模板元的分布和大小。對(duì)每個(gè)模板元指定了一個(gè)代碼簿和在圖象中的空間位置。(注意模板的某些部位沒有模板元,這些區(qū)域?qū)⒃诤竺嬖敿?xì)描述。)圖3A所示的模板包括構(gòu)成矩形象素區(qū)域的64個(gè)模板元。這些模板元被分配給13個(gè)不同代碼簿(標(biāo)號(hào)為A-M)的其中一個(gè)。這些代碼簿是4×16或8×8或8×5或4×10或4×6或8×4象素的均勻尺寸做成的代碼向量集合。構(gòu)成代碼簿的代碼向量是從圖象特征庫中導(dǎo)出的。
參看圖4,標(biāo)號(hào)A至M代表人臉的特征類型。與標(biāo)號(hào)行中的每個(gè)標(biāo)號(hào)A-M相關(guān)的人的特征表示在標(biāo)號(hào)行下面一行。圖4的其余部份提供關(guān)于每個(gè)相關(guān)標(biāo)號(hào)的模板元的寬度與高度信息以及每個(gè)特征出現(xiàn)的次數(shù)和單一出現(xiàn)次數(shù)。單一出現(xiàn)次數(shù)代表被連接起來的獨(dú)立模板元的數(shù)目(連接元素僅僅被看作是一次單一出現(xiàn))。
圖5A和5B示出了模板元數(shù)據(jù)記錄。這些數(shù)據(jù)記錄表示每個(gè)模板元的屬性,即對(duì)于左上方坐標(biāo)系統(tǒng)象素坐標(biāo)包括數(shù)據(jù)記錄信息域、寬度、高度、左右翻轉(zhuǎn)特性,上下翻轉(zhuǎn)特性、連接組的記錄以及特征類型。如果連接組的記錄是-1,那么就沒有出現(xiàn)連接。連接組的其它值標(biāo)識(shí)該組的模板元。例如,圖3D的上方兩個(gè)模板元D被連在一起,因此在圖5A和5B的表的連接組列中被給定相同的連接組號(hào)O。
下面的討論將參考圖4、5A、5B和圖6進(jìn)行。圖4中所述的特征類型在圖6中作為貼片的集合示出。例如,在特征類型G-眼睛特征-的集合中的貼片1是表示為一個(gè)象素陣列的眼睛的圖形。對(duì)特征G而言,此集合中的其它貼片2至2n是眼睛的其它圖形。在最佳實(shí)施例中,對(duì)每個(gè)特征類型,每個(gè)集合中的貼片數(shù)目是2n,n為正整數(shù)。應(yīng)該注意的是,集合中的貼片在表示圖象特征時(shí)直觀上看具有相似的特性。不同特征類型的貼片在相比較時(shí),看起來常常是不相似的。
圖7示出了將模板元分配給貼片的一個(gè)圖象。圖7的每個(gè)模板元有一個(gè)相關(guān)的號(hào)碼,這個(gè)號(hào)碼相應(yīng)于代表模板元的特征類型的貼片。例如,模板元60代表特征類型A,并且在圖6中頭發(fā)特征類型貼片A的集合中有號(hào)碼為46的相關(guān)貼片。與此類似,對(duì)于眼睛特征類型的模板元62被編號(hào)為123,它對(duì)應(yīng)于圖6中標(biāo)號(hào)為G的眼睛特征類型集合中號(hào)碼為123的貼片。注意,在相同連接組中的模板元(例如眼睛特征類型模板元62和64)具有相同的貼片號(hào)碼。為了便于識(shí)別連接元件,它們?cè)趫D7中打印為黑體號(hào)碼。
圖7中分配給每個(gè)模板元的貼片號(hào)被用于從標(biāo)號(hào)相同的貼片特征類型集合中檢索相同號(hào)碼的貼片。檢索的貼片與包含該貼含片號(hào)碼的模板元的位置相同。貼片的配置結(jié)果產(chǎn)生了圖8的鑲嵌圖案。
接下來,將選定的貼片翻轉(zhuǎn)(flip)。圖3B和3C分別指出了具有左右和上下翻轉(zhuǎn)特性的模板元。具有這些翻轉(zhuǎn)特性的模板元在圖5A和5B中的表中也由真/假標(biāo)志所指示。圖8中要被翻轉(zhuǎn)的這些貼片用通過代表象素的方盒的斜線所識(shí)別。圖9表示翻轉(zhuǎn)特性對(duì)圖8中貼片的應(yīng)用,其中圖8中相應(yīng)于圖3B中陰影模板元的所有貼片被左右翻轉(zhuǎn),而圖8中相應(yīng)于圖3C中陰影模板元的所有貼片被上下翻轉(zhuǎn)。值得注意的是,在貼片從圖8轉(zhuǎn)換為圖9的貼片方位時(shí),某些模板元同時(shí)進(jìn)行兩種翻轉(zhuǎn),并且翻轉(zhuǎn)在相關(guān)的元素內(nèi)發(fā)生。
接下來的步驟是基于圖9的定向貼片鑲嵌圖案,采用圖象處理操作,制作最終圖象。圖9的鑲嵌圖案,由于由貼片構(gòu)造的結(jié)果,可能具有某些看起來不好的現(xiàn)象,通過某些圖象處理算法的結(jié)合,可以消除這些現(xiàn)象。在本最佳實(shí)施例中,采用眾所周知的圖象處理操作的結(jié)合,其中包括平滑地經(jīng)過貼片邊界、增強(qiáng)對(duì)比度、采用線性插值充填丟失的圖象區(qū)域以及增加具有三維依賴關(guān)系的隨機(jī)干擾。為了描述平滑操作,假設(shè)具有三個(gè)連續(xù)象素P1、P2和P3的情況,其中P1和P2在一個(gè)貼片中,P3在一個(gè)相鄰貼片中。象素P2被(P1+2*P2+P3)/4的結(jié)果所替換。對(duì)比度增強(qiáng)是通過確定鑲嵌圖案的最小象素值min和最大象素值max來獲得的。根據(jù)式子Pnew=255×(Pcur-min)/(max-min)鑲嵌圖案的每個(gè)象素值Pcur被Pnew所替換。
不與任何模板元對(duì)應(yīng)的特征模板的區(qū)域采用線性插值充填。對(duì)每個(gè)區(qū)域來說,采用已知的邊界象素值來計(jì)算出一個(gè)平均象素值。將與已知邊界相對(duì)的未知角落設(shè)置為這個(gè)平均值。其余未被分配的內(nèi)部象素采用線性插值來計(jì)算。在本發(fā)明的最佳實(shí)施例中,共有4個(gè)這種未被分配的區(qū)域,每個(gè)位于特征模板的角落。
將要增加的三維隨機(jī)干擾由下式確定n(i,j)=v*sqrt((i-28)**2+(j-32)**2)*rand
其中,v是干擾大小i是受影響的象素的列j是受影響的象素的行rand是一個(gè)在范圍(-1至1)之間的偽隨機(jī)浮點(diǎn)數(shù)。值n(i,j)在位置(i,j)被加到象素中。如果所得到的象素值大于255,那么設(shè)定為255,如果小于零,則設(shè)定為0。圖10示出經(jīng)過這些操作處理后的一個(gè)圖象。應(yīng)該理解的是,在其它情況下可以采用其它圖象處理操作,本最佳實(shí)施例不應(yīng)該視為限制。
圖11示出了可以實(shí)施本發(fā)明方法的設(shè)備100。設(shè)備100包括用于將非數(shù)字圖象,如照片80,或負(fù)片圖象82,轉(zhuǎn)換為圖象的數(shù)字表示的裝置102。通常轉(zhuǎn)換是在掃描器104中進(jìn)行的,該掃描器輸出以模擬形式表示象素值的信號(hào),然后采用模-數(shù)轉(zhuǎn)換器106將模擬象素值轉(zhuǎn)換為代表掃描圖象的數(shù)字值。其它數(shù)字圖象源可以直接輸入到工作站200。在本發(fā)明的最佳設(shè)備實(shí)施例中,工作站200是一臺(tái)SUNSPARC 10,運(yùn)行UNIX操作系統(tǒng),并且采用標(biāo)準(zhǔn)C程序設(shè)計(jì)語言編程。本發(fā)明的程序部分在附件A和B中完整地給出。數(shù)字圖象的顯示是在軟件、鍵盤204和鼠標(biāo)206控制下,通過顯示器202操作的。數(shù)字圖象也可以通過CD輸入機(jī)208或其它類似裝置輸入系統(tǒng)。由本發(fā)明方法和設(shè)備產(chǎn)生的模板可以卸載到一臺(tái)CD記錄器210上以便存貯在CD上,由打印機(jī)212作硬拷貝打印以記錄在存貯卡(諸如事務(wù)卡),或者由調(diào)制解調(diào)器214和傳輸線傳輸以作進(jìn)一步處理或在遠(yuǎn)程單元存貯。
本發(fā)明的其它用處包括肖像之外的圖象的壓縮。還可以表示其它特征類型,例如,與銀行支票相關(guān)的特征,如銀行和帳號(hào),以及簽名、美元數(shù)額、地址等等。與人臉一樣,對(duì)每張支票而言,這些特征通常處于同一位置。
雖然本發(fā)明主要考慮的是最佳實(shí)施例的情況,但很顯然,在不脫離本發(fā)明基本精神的前提下,可作許多改進(jìn)。因此在權(quán)利要求書中將包括在本發(fā)明范圍之內(nèi)的所有改進(jìn)。
部件目錄30 模板40-52 流程方框(雙號(hào))60 特征類型A的模板元62 眼睛特征類型的第一模板元64 眼睛特征類型的第二模板元80 照片82 負(fù)片圖象100設(shè)備102圖象數(shù)字化裝置104掃描器106模-數(shù)信號(hào)轉(zhuǎn)換裝置200工作站202顯示器204鍵盤206鼠標(biāo)208CD輸入器210CD錄器212打印機(jī)214調(diào)制解調(diào)器A-M代碼簿
權(quán)利要求
1.一種特征模板,包括若干模板元,每個(gè)模板元代表物體的一個(gè)特征;代表每個(gè)模板元屬性的數(shù)據(jù)。
2.根據(jù)權(quán)利要求1所述的特征模板,其特征在于多個(gè)模板元共享代表物體的一個(gè)特征。
3.根據(jù)權(quán)利要求1所述的特征模板,其特征在于代表每個(gè)模板元屬性的數(shù)據(jù)包括指示一個(gè)模板元與另一模板元連接關(guān)系的數(shù)據(jù)。
4.一種特征模板,包括以代碼形式表示物體特征的區(qū)域;代表每個(gè)模板元相對(duì)于具有相同特征類型的其它模板元的取向的代碼位。
5.構(gòu)成特征模板的一種方法,包括以下步驟建立特征模板的維數(shù),以適應(yīng)標(biāo)準(zhǔn)化圖象;將所述特征模板劃分為若干特征類型,以適應(yīng)標(biāo)準(zhǔn)化圖象中的相同特征;對(duì)每個(gè)特征類型至少分配一個(gè)模板元;記錄所有被分配的模板元在所述特征模板維數(shù)中的位置,以便利重建如此構(gòu)成的特征模板。
6.根據(jù)權(quán)利要求5所述的構(gòu)成圖象的特征模板的方法,其特征在于標(biāo)準(zhǔn)化的圖象是由以下步驟形成的獲取數(shù)字形式的圖象;將獲取的圖象中的特征調(diào)整并定標(biāo)到預(yù)先確定的參數(shù)。
7.根據(jù)權(quán)利要求5所述的方法,進(jìn)一步包括以下步驟 使縱向?qū)ΨQ特性至少相關(guān)于一個(gè)模板元。
8.根據(jù)權(quán)利要求5所述的方法,進(jìn)一步包括以下步驟使水平對(duì)稱特性至少相關(guān)于一個(gè)模板元。
9.根據(jù)權(quán)利要求5所述的方法,其特征在于每個(gè)模板元代表標(biāo)準(zhǔn)化圖象中一個(gè)物體的一個(gè)特征,從而從該特征模板可以構(gòu)成標(biāo)準(zhǔn)化圖象的一個(gè)表示。
10.用于數(shù)字信號(hào)處理系統(tǒng)中的存貯媒體,在其上記錄了由權(quán)利要求1的方法所構(gòu)成的特征模板,以便利制成用于顯示的圖象。
全文摘要
本技術(shù)便利圖象特征模板的構(gòu)成,該特征模板在相同特征圖象的壓縮和還原中特別有用。詳細(xì)地說,該特征模板能夠?qū)哂幸恢碌南嗤瑘D象特征集合的大量圖象進(jìn)行壓縮和還原,這些特征能夠被調(diào)整并定標(biāo)到相互關(guān)聯(lián)的區(qū)域。該特征模板包括若干模板元,每個(gè)模板元代表圖象的一個(gè)特別特征,還包括代表每個(gè)模板元屬性的數(shù)據(jù)。
文檔編號(hào)H04N1/41GK1150283SQ9512112
公開日1997年5月21日 申請(qǐng)日期1995年12月21日 優(yōu)先權(quán)日1994年12月21日
發(fā)明者L·A·雷, R·N·艾爾森, M·艾爾巴茲 申請(qǐng)人:伊斯曼柯達(dá)公司