利用正向和反向深度預(yù)測(cè)進(jìn)行圖像的深度提取的系統(tǒng)和方法

文檔序號(hào)：6479809閱讀：1165來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>計(jì)算;推算;計(jì)數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

專利名稱：利用正向和反向深度預(yù)測(cè)進(jìn)行圖像的深度提取的系統(tǒng)和方法
技術(shù)領(lǐng)域：
本公開一般地涉及計(jì)算機(jī)圖形處理和顯示系統(tǒng)，并更具體地涉及一種利用正向和反向深度預(yù)測(cè)進(jìn)行圖像的深度提取的系統(tǒng)和方法。
背景技術(shù)：
立體成像是在視覺上組合一個(gè)場景的從稍微不同的視點(diǎn)取得的至少兩個(gè)圖像以便產(chǎn)生三維(“3D”)深度的錯(cuò)覺的處理。該技術(shù)依賴于如下事實(shí)人眼間隔一定距離，并且因此沒有觀看完全相同的場景。通過為每只眼睛提供來自不同觀察點(diǎn)(perspective)的圖像，欺騙觀看者的眼睛感覺到深度。典型地，在提供兩個(gè)有區(qū)別的觀察點(diǎn)的情況下，分別將組成圖像稱為“左側(cè)”和“右側(cè)”圖像，也分別將其已知為基準(zhǔn)圖像和補(bǔ)充圖像。然而，本領(lǐng)域技術(shù)人員將認(rèn)識(shí)到，可以組合多于兩個(gè)視點(diǎn)來形成立體圖像。在3D后期制作、視覺效果(VFX)工作流程和3D顯示應(yīng)用中，一項(xiàng)重要的處理是從由左眼視像和右眼視像組成的立體圖像中推斷深度圖。例如，最近商業(yè)化的自動(dòng) 立體3D顯示器要求圖像加深度圖(image-plus-d印th-map)輸入格式，使得該顯示器可以生成不同的3D視圖來支持多個(gè)視角。根據(jù)立體圖像對(duì)推斷深度圖的處理在計(jì)算機(jī)視覺研究的領(lǐng)域中被稱為立體匹配，因?yàn)槭褂孟袼鼗驂K匹配以發(fā)現(xiàn)左眼和右眼視像中的對(duì)應(yīng)點(diǎn)。新近，推斷深度圖的處理在3D顯示團(tuán)體中也通常被已知為深度提取。根據(jù)各圖像中與場景中的相同點(diǎn)對(duì)應(yīng)的兩個(gè) 像素之間的相對(duì)距離推斷深度值。在眾多計(jì)算機(jī)視覺應(yīng)用(諸如，例如用于計(jì)算機(jī)輔助繪圖(CAD)的快速對(duì)象建模和原型成型、用于人機(jī)交互(HCI)的對(duì)象分割和檢測(cè)、視頻壓縮和視覺監(jiān)控(visual surveillance))中廣泛使用數(shù)字圖像的立體匹配，以便提供三維(3D)深度信息。立體匹配從場景中位于不同位置和朝向的兩個(gè)或多個(gè)相機(jī)獲得場景的圖像。在大約相同的時(shí)間從每個(gè)相機(jī)獲得這些數(shù)字圖像，并且對(duì)應(yīng)于空間中的3D點(diǎn)匹配每個(gè)圖像中的點(diǎn)。通常，通過搜索一部分圖像和使用約束(諸如核線約束)來匹配來自不同圖像的點(diǎn)，以便使一個(gè)圖像中的點(diǎn)與另一圖像中的點(diǎn)相關(guān)聯(lián)。關(guān)于深度圖提取已經(jīng)進(jìn)行了實(shí)質(zhì)性的工作。關(guān)于深度提取的大部分工作集中在單個(gè)立體圖像對(duì)上而不是在視頻上。然而，視頻取代圖像成為消費(fèi)電子界的主導(dǎo)媒體。對(duì)于視頻而言，采用立體圖像對(duì)的序列而不是單個(gè)圖像對(duì)。在常規(guī)技術(shù)中，向每個(gè)幀對(duì)應(yīng)用靜止深度提取算法。在大多數(shù)情形下，輸出深度圖的質(zhì)量對(duì)于3D回放是足夠的。然而，對(duì)于具有大量紋理的幀而言，可以看見時(shí)間性的(temporal)抖動(dòng)偽像，這是因?yàn)樯疃葓D在時(shí)間方向上(即，在圖像對(duì)序列的時(shí)間段中)未精確地對(duì)齊。因此，存在對(duì)于使深度圖提取處理沿時(shí)間方向穩(wěn)定以減少時(shí)間性的抖動(dòng)偽像的技術(shù)的需求。

發(fā)明內(nèi)容
根據(jù)本公開的一方面，提供了一種利用正向和反向深度預(yù)測(cè)進(jìn)行圖像的時(shí)空深度提取的系統(tǒng)和方法。本公開的系統(tǒng)和方法提供了獲取多個(gè)幀、基于多個(gè)幀中的前一幀的深度圖來生成多個(gè)幀中的當(dāng)前幀的第一深度圖，基于多個(gè)幀中的后一幀的深度圖來生成多個(gè) 幀中的當(dāng)前幀的第二深度圖，以及處理第一深度圖和第二深度圖以產(chǎn)生當(dāng)前幀的第三深度圖。

將對(duì)本公開的這些以及其他方面、特征和優(yōu)點(diǎn)進(jìn)行描述，或者根據(jù)要連同附圖一起閱讀的優(yōu)選實(shí)施例的以下詳細(xì)描述，本公開的這些以及其他方面、特征和優(yōu)點(diǎn)將變得清林疋。在附圖中，貫穿各視圖，相同的參考標(biāo)記表示類似的元件圖1是根據(jù)本公開的一方面的將至少兩個(gè)圖像進(jìn)行立體匹配的系統(tǒng)的示例性圖示；圖2是根據(jù)本公開的一方面的將至少兩個(gè)圖像進(jìn)行立體匹配的示例性方法的流程圖；圖3圖示在對(duì)場景中感興趣的點(diǎn)拍攝的兩個(gè)圖像之間的核線(印ipolarline)幾何關(guān)系；圖4圖示在視差和深度之間的關(guān)系；圖5是根據(jù)本公開的一方面的用于估計(jì)至少兩個(gè)圖像的視差的示例性方法的流程圖；圖6是根據(jù)本公開的一方面的時(shí)空深度提取的示例性方法的流程圖；圖7圖示用于增強(qiáng)立體圖像的連續(xù)幀序列的深度圖的正向和反向預(yù)測(cè)處理；以及圖8是根據(jù)本公開的一方面的生成深度圖的示例性方法的流程圖。應(yīng)理解，(各)附圖用于例示本公開的構(gòu)思的目的并且不一定是用于例示本公開的唯一可能的配置。
具體實(shí)施例方式應(yīng)理解可以以各種形式的硬件、軟件或其組合來實(shí)施附圖中所示的元件。優(yōu)選地，在一個(gè)或多個(gè)被適當(dāng)編程的通用設(shè)備上以硬件和軟件的組合來實(shí)施這些元件，所述通用設(shè)備可以包括處理器、存儲(chǔ)器以及輸入/輸出接口。本描述例示了本公開的原理。因此本領(lǐng)域技術(shù)人員應(yīng)理解將能夠設(shè)計(jì)出雖然未在此被明確描述或示出、但是體現(xiàn)本公開的原理并且被包括在本公開的精神和范圍內(nèi)的各種布置。在此所敘述的所有示例和條件性語言意在教導(dǎo)性的目的，以幫助讀者理解本公開的原理和由發(fā)明人為促進(jìn)本領(lǐng)域技術(shù)而貢獻(xiàn)的構(gòu)思，并且要被解釋為不限于這種具體敘述的示例和條件。另外，在此敘述的本公開的原理、方面、以及實(shí)施例的所有陳述、以及本公開的具體示例，意在包含本公開的結(jié)構(gòu)的和功能的兩者的等效物。此外，這種等效物意在包括當(dāng)前已知的等效物以及將來開發(fā)的等效物這兩者，即，所開發(fā)的無論結(jié)構(gòu)如何、執(zhí)行相同功能的任何元件。因此，例如，本領(lǐng)域技術(shù)人員應(yīng)理解在此呈現(xiàn)的框圖表示體現(xiàn)本公開的原理的例示性的電路的概念性視圖。類似地，應(yīng)理解任何流程圖示、流程圖、狀態(tài)轉(zhuǎn)換圖、偽代碼等等表示實(shí)質(zhì)上可以在計(jì)算機(jī)可讀介質(zhì)中表示的、并因此通過計(jì)算機(jī)或處理器執(zhí)行的各種處理，無論這種計(jì)算機(jī)或處理器是否被明確示出?？梢允褂脤Ｓ糜布约巴ㄟ^與適合的軟件相關(guān)聯(lián)而能夠執(zhí)行軟件的硬件來提供附圖中所示的各種元件的功能。當(dāng)由處理器提供時(shí)，可以由單個(gè)專用處理器、單個(gè)共享處理器、或其中一些可以被共享的多個(gè)獨(dú)立處理器提供所述功能。另外，術(shù)語“處理器”或“控制器”的明確使用不應(yīng)被解釋為排他性地指代能夠執(zhí)行軟件的硬件，其可以隱含地包括、而不限于數(shù)字信號(hào)處理器(“DSP”)硬件、用于存儲(chǔ)軟件的只讀存儲(chǔ)器(“ROM”)、隨機(jī)存取存儲(chǔ) 器(“RAM”)、以及非易失性存儲(chǔ)裝置。還可以包括其它的常規(guī)的和/或定制的硬件。類似地，附圖中所示的任何開關(guān)只是概念性的。可以通過程序邏輯的操作、通過專用邏輯、通過程序控制和專用邏輯的交互作用、或甚至手動(dòng)地執(zhí)行它們的功能，如從上下文中具體理解的，具體技術(shù)可由實(shí)施者選擇。在其權(quán)利要求中，被表達(dá)為用于執(zhí)行所指定的功能的部件的任何元件意在包含執(zhí) 行該功能的任何方式，所述任何方式例如包括a)執(zhí)行該功能的電路元件的組合或b)與用于執(zhí)行軟件的適當(dāng)?shù)碾娐方M合以執(zhí)行該功能的任何形式的軟件(因此包括固件、微代碼等)。由這樣的權(quán)利要求所限定的本公開在于以下事實(shí)以權(quán)利要求所請(qǐng)求保護(hù)的方式將所敘述的各種部件所提供的功能組合并放在一起。因此，可以提供這些功能的任何部件被認(rèn)為等效于與在此所示出的那些部件。立體匹配是用于從立體圖像(例如，左眼視像和右眼視像)推斷深度圖的標(biāo)準(zhǔn)方法。在常規(guī)的自動(dòng)立體顯示器上進(jìn)行的3D回放已經(jīng)表明深度圖的平滑度顯著影響作為結(jié)果的3D回放的外觀。不平滑的深度圖經(jīng)常導(dǎo)致3D回放中的之字形邊緣，這在視覺上比具有不太準(zhǔn)確的深度值的平滑的深度圖的回放更糟糕。因此，對(duì)于3D顯示和回放應(yīng) 用而言，深度圖的平滑度比深度準(zhǔn)確度更重要。此外，基于全局優(yōu)化的方法對(duì)于3D顯示應(yīng) 用中的深度估計(jì)而言是必須的。本公開提出了一種結(jié)合時(shí)間信息以提高深度圖的平滑度的深度提取技術(shù)。眾多立體技術(shù)優(yōu)化了以下成本函數(shù)(cost function)，該成本函數(shù)用于強(qiáng)制空間相干性以及與數(shù)據(jù)的一致性。針對(duì)圖像序列，時(shí)間分量對(duì)于提高所提取的深度圖的準(zhǔn) 確度是重要的。提供了一種利用正向和反向深度預(yù)測(cè)進(jìn)行圖像的時(shí)空深度提取的系統(tǒng)和方法。本公開的系統(tǒng)和方法提供了一種結(jié)合時(shí)間信息以提高深度圖的平滑度的深度提取技術(shù)。本公開的技術(shù)結(jié)合正向和反向通道(pass)，其中使用圖像序列的當(dāng)前幀的前一幀的深度圖來初始化當(dāng)前幀處的深度提取，這使得計(jì)算更快并且更準(zhǔn)確。然后可以利用深度圖或視差圖與立體圖像對(duì)一起進(jìn)行3D回放。本公開的技術(shù)在解決由深度圖的不穩(wěn)定造成的、2D+深度顯示中3D回放的時(shí)間性抖動(dòng)偽像的問題時(shí)是有效的?，F(xiàn)在參照附圖，圖1示出了根據(jù)本公開的實(shí)施例的示例性系統(tǒng)組件。可以提供掃描設(shè)備103用于將膠片印片(film print) 104(例如相機(jī)原始的膠片底片)掃描為數(shù)字格式 (例如，Cineon-格式或者運(yùn)動(dòng)畫面和電視工程師協(xié)會(huì)(“SMPTE”)數(shù)字畫面交換(“DPX”)文件)。掃描設(shè)備103可以包括例如電視電影裝置(telecine)或者將根據(jù)膠片生成視頻輸出的任何設(shè)備(諸如例如具有視頻輸出的Arri LocPro )?？商鎿Q地，可以直接使用來自后期制作處理或者數(shù)字電影的文件106 (例如，已經(jīng)是計(jì)算機(jī)可讀形式的文件)。計(jì)算機(jī)可讀文件的潛在來源是AVID 編輯器、DPX文件、D5磁帶等。所掃描的膠片印片被輸入給后期處理設(shè)備102(例如，計(jì)算機(jī))。該計(jì)算機(jī)在各種已知的計(jì)算機(jī)平臺(tái)中的任一種上實(shí)現(xiàn)，所述計(jì)算機(jī)平臺(tái)具有諸如以下硬件一個(gè)或多個(gè) 中央處理單元(CPU)、諸如隨機(jī)存取存儲(chǔ)器(RAM)和/或只讀存儲(chǔ)器(ROM)之類的存儲(chǔ)器 110，以及諸如鍵盤、光標(biāo)控制設(shè)備(例如，鼠標(biāo)或操縱桿)和顯示設(shè)備之類的(多個(gè))輸入/輸出(I/O)用戶接口。該計(jì)算機(jī)平臺(tái)還包括操作系統(tǒng)和微指令代碼。在此描述的各種處理和功能可以是經(jīng)由操作系統(tǒng)執(zhí)行的微指令代碼的一部分或者軟件應(yīng)用程序的一部分(或者是其組合)。在一個(gè)實(shí)施例中，軟件應(yīng)用程序有形地體現(xiàn)在程序存儲(chǔ)設(shè)備中，其可以被上載到諸如后期處理設(shè)備102之類的任何合適的機(jī)器并且由該機(jī)器執(zhí)行。另外，可以通過諸如并行端口、串行端口或者通用串行總線(USB)之類的各種接口和總線結(jié)構(gòu)將各種其他外圍設(shè)備連接到該計(jì)算機(jī)平臺(tái)。其他外圍設(shè)備可以包括附加的存儲(chǔ)設(shè)備1 和印片機(jī) (printer) 128?？梢圆捎糜∑瑱C(jī)128來印制膠片的修改版本126，例如膠片的立體版本，其中可以使用作為以下描述的技術(shù)的結(jié)果的3D建模的對(duì)象來更改或者取代一個(gè)場景或多個(gè) 場景?？商鎿Q的，可以將已經(jīng)是計(jì)算機(jī)可讀形式的文件/膠片印片106(例如數(shù)字電影，其例如可以存儲(chǔ)在外部硬盤驅(qū)動(dòng)器124中)直接輸入到計(jì)算機(jī)102中。注意，在此使用的用語“膠片”可以指膠片印片或者數(shù)字電影。軟件程序包括在存儲(chǔ)器110中存儲(chǔ)的立體匹配模塊114，其用于將第一圖像中的至少一個(gè)點(diǎn)與第二圖像中的至少一個(gè)對(duì)應(yīng)點(diǎn)進(jìn)行匹配。該立體匹配模塊114還包括圖像偏轉(zhuǎn)器(image warper) 116，其被配置為調(diào)整立體圖像對(duì)的核線使得核線精確地成為圖像的水平掃描線。該立體匹配模塊114還包括視差(disparity)估計(jì)器118，其被配置為估計(jì)第一圖像中的至少一個(gè)點(diǎn)與第二圖像中的至少一個(gè)對(duì)應(yīng)點(diǎn)的視差，并且根據(jù)所估計(jì)的視差對(duì)于第一圖像中的至少一個(gè)點(diǎn)中的每一個(gè)點(diǎn)與第二圖像中的至少一個(gè)對(duì)應(yīng)點(diǎn)來生成視差圖。該視差估計(jì)器118包括像素匹配成本函數(shù)132，被配置為對(duì)第一圖像和第二圖像中的像素進(jìn)行匹配；平滑度成本函數(shù)134，向視差估計(jì)應(yīng)用平滑度約束；以及時(shí)間成本函數(shù)136，被配置為使所生成的視差圖的序列在時(shí)間上對(duì)齊。視差估計(jì)器118還包括置信傳播算法或置信傳播函數(shù)138，用于使所估算的視差最小化；以及動(dòng)態(tài)編程算法或動(dòng)態(tài)編程函數(shù)140，利用被應(yīng)用到第一圖像和第二圖像的確定性匹配函數(shù)的結(jié)果來初始化置信傳播函數(shù)138以加速置信傳播函數(shù)138。立體匹配模塊114還包括深度圖生成器120，用于通過對(duì)視差圖的視差值進(jìn)行反轉(zhuǎn)(invert)而將視差圖轉(zhuǎn)換為深度圖。圖2是根據(jù)本公開的一方面的對(duì)至少兩個(gè)二維OD)圖像進(jìn)行立體匹配的示例性方法的流程圖。初始地，后期處理設(shè)備102獲取至少兩個(gè)二維QD)圖像，例如，具有左眼視圖和右眼視圖的立體圖像對(duì)(步驟20 。后期處理設(shè)備102可以通過獲得計(jì)算機(jī)可讀格式的數(shù)字母版圖像(master image)文件而獲取至少兩個(gè)2D圖像?？梢酝ㄟ^利用數(shù)字相機(jī)來捕捉移動(dòng)圖像的時(shí)間序列而獲取數(shù)字視頻文件?？商鎿Q的，可以通過常規(guī)的膠片類型的相機(jī)來攝制視頻序列。在該情境下，經(jīng)由掃描設(shè)備103掃描該膠片。應(yīng)理解，無論膠片是被掃描還是已經(jīng)是數(shù)字格式，膠片的數(shù)字文件都將包括關(guān)于各個(gè)幀的位置的指示或信息(例如幀號(hào)、自膠片的起始起的時(shí)間等)。可以通過具有相同設(shè)置的兩個(gè)相機(jī)來攝制立體圖像。對(duì)相機(jī)進(jìn)行標(biāo)定以使其具有相同焦距、焦點(diǎn)高度和平行焦平面；或者，必須基于已知的相機(jī)參數(shù)對(duì)圖像進(jìn)行偏轉(zhuǎn)使得仿佛它們是被具有平行焦平面的相機(jī)所拍攝的(步驟204)。該偏轉(zhuǎn)處理包括相機(jī)標(biāo)定 (calibration)(步驟206)和相機(jī)調(diào)校(rectification)(步驟208)。標(biāo)定和調(diào)校處理調(diào) 整立體圖像的核線使得核線精確地成為圖像的水平掃描線。參照?qǐng)D3，Ol和Ok表示兩個(gè)相機(jī)的焦點(diǎn)，P表示兩個(gè)相機(jī)感興趣的點(diǎn)，而&和Pk表示點(diǎn)P被投影到成像平面的何處。每個(gè)焦平面上的交叉點(diǎn)被稱作核點(diǎn)(印ipole)(由&和&表示)。右核線(例如，ER-PR)是連接聚焦中心和左側(cè)圖像上的點(diǎn)的射線(ray)在右側(cè)圖像上的投影，因此左側(cè)圖像上的像素在右側(cè)圖像上的對(duì)應(yīng)點(diǎn)應(yīng)位于右側(cè)圖像上的核線上，同樣的情況適用于左側(cè)核線，例如 El-Plo由于對(duì)應(yīng)點(diǎn)發(fā)現(xiàn)沿著核線進(jìn)行，調(diào)校處理將對(duì)應(yīng)搜索簡化為僅僅沿掃描線搜索，這極大地減少了計(jì)算成本。對(duì)應(yīng)點(diǎn)是圖像中與同一場景點(diǎn)對(duì)應(yīng)的像素。接著，在步驟210，對(duì)場景中的每個(gè)點(diǎn)估計(jì)視差圖。一旦發(fā)現(xiàn)對(duì)應(yīng)點(diǎn)，則計(jì)算每個(gè)場景點(diǎn)的視差作為左眼圖像和右眼圖像中匹配點(diǎn)的相對(duì)距離。例如，參照?qǐng)D4，如果左眼圖像 402中的點(diǎn)的水平坐標(biāo)為X，而其在右眼圖像404中的對(duì)應(yīng)點(diǎn)的水平坐標(biāo)為χ’，則視差d = χ' -χ 然后，在步驟212，使用以下公式ζ = Bf/d將場景點(diǎn)406的視差值d轉(zhuǎn)換為深度值 ζ (從場景點(diǎn)406 (也被稱為收斂點(diǎn))到相機(jī)408,410的距離)，其中B是兩個(gè)相機(jī)408,410 之間的距離(也被稱作基線)，而f是相機(jī)的焦距，在圖4中示出對(duì)此的證明。參照?qǐng)D5，提供了根據(jù)本公開的如上面步驟210所標(biāo)識(shí)的用于估計(jì)視差圖的方法。初始地，獲取立體圖像對(duì)(步驟50幻。計(jì)算視差成本函數(shù)，包括計(jì)算像素成本函數(shù)(步驟 504)、計(jì)算平滑度成本函數(shù)(步驟506)和計(jì)算時(shí)間成本函數(shù)(步驟508)。執(zhí)行低成本的立體匹配優(yōu)化(例如，動(dòng)態(tài)編程)來得到立體匹配兩個(gè)圖像的初始的確定性的結(jié)果(步驟 510)。然后將該低成本優(yōu)化的結(jié)果用于初始化置信傳播函數(shù)以加速用于使序列的第一幀的視差成本函數(shù)最小化的置信傳播函數(shù)(512)。然后將使用預(yù)測(cè)深度圖來初始化用于該序列的后一幀的置信傳播函數(shù)。現(xiàn)在將詳細(xì)地描述圖5中所示的視差估計(jì)及其公式表示。視差估計(jì)是上述的工作流程中重要的步驟。該問題包括使得左眼圖像和右眼圖像中的像素進(jìn)行匹配，即發(fā)現(xiàn)右側(cè) 圖像和左側(cè)圖像中對(duì)應(yīng)于同一場景點(diǎn)的像素。通過考慮視差圖是平滑的，可以如下對(duì)立體匹配的問題在數(shù)學(xué)上進(jìn)行公式表示C(d(·)) = Cp(d(.)) + ACs(d(.)) (1)其中d(.)是視差域(disparity f ield), d (χ, y)給出左眼圖像中具有坐標(biāo)(x，y) 的點(diǎn)的視差值，C是總的成本函數(shù)，Cp是像素匹配成本函數(shù)，而Cs是平滑度成本函數(shù)。平滑度成本函數(shù)是用于強(qiáng)制視差圖的平滑度的函數(shù)。在優(yōu)化處理期間，對(duì)所有的視差域使得上述成本函數(shù)最小化。對(duì)于局部優(yōu)化，丟棄平滑度項(xiàng)Cs ；因此，在該優(yōu)化處理期間不考慮平滑度。除此之外，可以將Cp建模為像素亮度(intensity)的均方差
權(quán)利要求
1.一種對(duì)至少兩個(gè)圖像進(jìn)行匹配的方法，該方法包括獲取(802)多個(gè)幀；基于所述多個(gè)幀中的前一幀的深度圖來生成(806)所述多個(gè)幀中的當(dāng)前幀的第一深度圖；基于所述多個(gè)幀中的后一幀的深度圖來生成(808)所述多個(gè)幀中的當(dāng)前幀的第二深度圖；以及處理(810)所述第一深度圖和所述第二深度圖以產(chǎn)生所述當(dāng)前幀的第三深度圖。
2.根據(jù)權(quán)利要求1所述的方法，其中所述第一深度圖包含基于所述前一幀的深度圖的誤差，而所述第二深度圖包含用于減少該誤差的校正。
3.根據(jù)權(quán)利要求1所述的方法，其中所述多個(gè)幀中的每個(gè)幀包括第一圖像和第二圖像。
4.根據(jù)權(quán)利要求3所述的方法，其中生成第一和第二深度圖的步驟還包括以下步驟估計(jì)第一圖像中的至少一個(gè)點(diǎn)與第二圖像中的至少一個(gè)對(duì)應(yīng)點(diǎn)的視差；基于所估計(jì)的視差生成視差圖；以及將所估計(jì)的視差圖轉(zhuǎn)換為深度圖。
5.根據(jù)權(quán)利要求4所述的方法，其中估計(jì)視差的步驟包括計(jì)算像素匹配成本函數(shù) (504)。
6.根據(jù)權(quán)利要求4所述的方法，其中估計(jì)視差的步驟包括計(jì)算平滑度成本函數(shù)(506)。
7.根據(jù)權(quán)利要求4所述的方法，其中估計(jì)視差的步驟包括計(jì)算時(shí)間成本函數(shù)(508)。
8.根據(jù)權(quán)利要求4所述的方法，其中估計(jì)視差的步驟包括執(zhí)行低成本優(yōu)化函數(shù)(510)。
9.根據(jù)權(quán)利要求8所述的方法，其中估計(jì)視差的步驟包括基于低成本優(yōu)化函數(shù)(510) 的結(jié)果來計(jì)算置信傳播函數(shù)(512)。
10.根據(jù)權(quán)利要求3所述的方法，其中第一圖像是立體對(duì)的左眼視圖，第二圖像是立體對(duì)的右眼視圖。
11.一種對(duì)至少兩個(gè)圖像進(jìn)行匹配的系統(tǒng)，該系統(tǒng)包括用于獲取(802)多個(gè)幀的部件；用于基于所述多個(gè)幀中的前一幀的深度圖來生成(806)所述多個(gè)幀中的當(dāng)前幀的第一深度圖的部件；用于基于所述多個(gè)幀中的后一幀的深度圖來生成(808)所述多個(gè)幀中的當(dāng)前幀的第二深度圖的部件；以及用于處理(810)所述第一深度圖和所述第二深度圖以產(chǎn)生所述當(dāng)前幀的第三深度圖的部件。
12.根據(jù)權(quán)利要求11所述的系統(tǒng)，其中所述第一深度圖包含基于所述前一幀的深度圖的誤差，而所述第二深度圖包含用于減少該誤差的校正。
13.根據(jù)權(quán)利要求11所述的系統(tǒng)，其中所述多個(gè)幀中的每個(gè)幀包括第一圖像和第二圖像。
14.根據(jù)權(quán)利要求13所述的系統(tǒng)，其中用于生成第一和第二深度圖的部件還包括用于估計(jì)第一圖像中的至少一個(gè)點(diǎn)與第二圖像中的至少一個(gè)對(duì)應(yīng)點(diǎn)的視差的部件；用于基于所估計(jì)的視差生成視差圖的部件；以及用于將所估計(jì)的視差圖轉(zhuǎn)換為深度圖的部件。
15.根據(jù)權(quán)利要求14所述的系統(tǒng)，其中用于估計(jì)視差的部件包括用于計(jì)算像素匹配成本函數(shù)(504)的部件。
16.根據(jù)權(quán)利要求14所述的系統(tǒng)，其中用于估計(jì)視差的部件包括用于計(jì)算平滑度成本函數(shù)(506)的部件。
17.根據(jù)權(quán)利要求14所述的系統(tǒng)，其中用于估計(jì)視差的部件包括計(jì)算時(shí)間成本函數(shù) (508)。
18.根據(jù)權(quán)利要求14所述的系統(tǒng)，其中用于估計(jì)視差的部件包括用于執(zhí)行低成本優(yōu)化函數(shù)(510)的部件。
19.根據(jù)權(quán)利要求18所述的系統(tǒng)，其中用于估計(jì)視差的部件包括用于基于執(zhí)行低成本優(yōu)化函數(shù)(510)的部件的輸出來計(jì)算置信傳播函數(shù)(512)的部件。
20.根據(jù)權(quán)利要求13所述的系統(tǒng)，其中第一圖像是立體對(duì)的左眼視圖，第二圖像是立體對(duì)的右眼視圖。
全文摘要
提供了一種利用正向和反向深度預(yù)測(cè)進(jìn)行圖像的時(shí)空深度提取的系統(tǒng)和方法。本公開的系統(tǒng)和方法提供了獲取(802)多個(gè)幀、基于多個(gè)幀中的前一幀的深度圖來生成(806)多個(gè)幀中的當(dāng)前幀的第一深度圖，基于多個(gè)幀中的后一幀的深度圖來生成(808)多個(gè)幀中的當(dāng)前幀的第二深度圖，以及處理(810)第一深度圖和第二深度圖以產(chǎn)生當(dāng)前幀的第三深度圖。
文檔編號(hào)G06T7/00GK102047288SQ200880129526
公開日2011年5月4日申請(qǐng)日期2008年5月28日優(yōu)先權(quán)日2008年5月28日
發(fā)明者伊扎特·伊扎特, 尹永實(shí), 張冬青申請(qǐng)人:湯姆森特許公司

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請(qǐng)專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：張冬青;伊扎特.伊扎特;尹永實(shí)
技術(shù)所有人：湯姆森特許公司
我是此專利的發(fā)明人

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請(qǐng)點(diǎn)此查看客服電話進(jìn)行咨詢。
1、李老師：1.計(jì)算力學(xué) 2.無損檢測(cè)
2、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制
3、袁老師：1.計(jì)算機(jī)視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計(jì)算機(jī)網(wǎng)絡(luò)安全 2.計(jì)算機(jī)仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢(shì)感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

圖像深度信息提取相關(guān)技術(shù)

深度圖像特征提取相關(guān)技術(shù)

圖像反向相關(guān)技術(shù)

正向套利和反向套利相關(guān)技術(shù)

正向代理和反向代理相關(guān)技術(shù)

国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

利用正向和反向深度預(yù)測(cè)進(jìn)行圖像的深度提取的系統(tǒng)和方法