一種基于融合深度線索的全自動(dòng)二維轉(zhuǎn)三維方法和裝置制造方法

文檔序號(hào)：7807834閱讀：229來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專利>電子通信裝置的制造及其應(yīng)用技術(shù)

一種基于融合深度線索的全自動(dòng)二維轉(zhuǎn)三維方法和裝置制造方法
【專利摘要】本發(fā)明針對(duì)當(dāng)前全自動(dòng)2D轉(zhuǎn)3D系統(tǒng)提取深度信息不準(zhǔn)確，立體感受不舒適等缺點(diǎn)，提出了一種融合運(yùn)動(dòng)視差和色彩兩種深度線索的全自動(dòng)2D到3D的轉(zhuǎn)換方法和裝置。本發(fā)明將運(yùn)動(dòng)視差和色彩兩種深度線索以適當(dāng)?shù)姆绞饺诤掀饋?lái)作為提取深度信息的依據(jù)，充分利用了兩種深度線索的優(yōu)勢(shì)，使提取的深度圖適用于更多的場(chǎng)景條件，更加準(zhǔn)確。用戶通過(guò)簡(jiǎn)單的參數(shù)設(shè)置就對(duì)二維的圖片序列或者視頻進(jìn)行深度圖的提取，并能夠合成三維立體視頻，在三維視頻生成領(lǐng)域有著實(shí)際的應(yīng)用價(jià)值。
【專利說(shuō)明】一種基于融合深度線索的全自動(dòng)二維轉(zhuǎn)三維方法和裝置

【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及一種二維到三維視頻的全自動(dòng)轉(zhuǎn)換技術(shù)，屬于圖像、多媒體信號(hào)處理

【技術(shù)領(lǐng)域】。

【背景技術(shù)】
[0002] 隨著3D顯示技術(shù)的發(fā)展與3D顯示設(shè)備的普及，3D視頻內(nèi)容短缺的問(wèn)題凸現(xiàn)出來(lái)。使用現(xiàn)有的3D拍攝系統(tǒng)拍攝3D內(nèi)容由于需要消耗大量的人力物力而無(wú)法快速普及。近些年來(lái)，2D轉(zhuǎn)3D技術(shù)逐漸興起并成為研究熱點(diǎn)，通過(guò)將現(xiàn)有的海量2D視頻內(nèi)容轉(zhuǎn)換為3D內(nèi) 容，能夠有效地解決3D視頻內(nèi)容短缺的問(wèn)題，并且能夠促進(jìn)3D技術(shù)的進(jìn)一步發(fā)展。
[0003] 現(xiàn)有的2D轉(zhuǎn)3D技術(shù)按照人工參與程度分為以下三個(gè)種類：人工、半自動(dòng)和全自動(dòng)。人工的方法是對(duì)圖像上不同的區(qū)域或者物體選擇不同的深度值來(lái)對(duì)像素進(jìn)行水平偏移，但是這需要耗費(fèi)大量的人力和物力。半自動(dòng)的2D轉(zhuǎn)3D需要少量的人工手動(dòng)修正。盡管這種方法和手動(dòng)方法相比已經(jīng)減少了人力的耗費(fèi)，但是仍舊需要大量的人工工作。要將大量的2D視頻以最經(jīng)濟(jì)的方式轉(zhuǎn)換為3D視頻，全自動(dòng)的方法無(wú)疑是最受好評(píng)的方法。
[0004] 最常用的全自動(dòng)的2D到3D視頻轉(zhuǎn)換的框架基本上包括兩部分：深度信息的提取和根據(jù)已估計(jì)的深度信息和已知的視覺(jué)條件合成立體視圖。人通過(guò)左右眼的視差分辨出事物的遠(yuǎn)近，從而產(chǎn)生立體感覺(jué)，事物的遠(yuǎn)近程度用深度信息來(lái)表示。在3D圖像處理領(lǐng)域，深度信息用灰度值來(lái)表示，整幅圖像的深度信息組成了一幅灰度圖，也就是深度圖。在人類視覺(jué)系統(tǒng)中，感知深度信息的線索很多，被稱之為深度線索。除了雙眼感知到的深度線索，從單眼也能夠感知到深度，這類線索被稱為單眼深度線索。在將二維圖像轉(zhuǎn)換為三維圖像的過(guò)程中，提取深度線索的依據(jù)常常是單眼深度線索。最重要的單眼深度線索有運(yùn)動(dòng)視差、圖形線索（紋理，亮度等）、幾何模型等。
[0005] 運(yùn)動(dòng)視差這種深度線索是一種多幀的深度線索，利用了攝像機(jī)與場(chǎng)景的相對(duì)運(yùn)動(dòng) 關(guān)系。當(dāng)攝像機(jī)移動(dòng)時(shí)，前后連續(xù)幀場(chǎng)景中物體運(yùn)動(dòng)幅度越大，則離攝像機(jī)越近，反之則越遠(yuǎn)。跟蹤場(chǎng)景的運(yùn)動(dòng)需要利用運(yùn)動(dòng)估計(jì)的方法，通過(guò)運(yùn)動(dòng)估計(jì)來(lái)獲得物體的運(yùn)動(dòng)幅度。運(yùn) 動(dòng)估計(jì)的方法有很多種類，根據(jù)估計(jì)的精度不同可以分為基于塊、基于像素和基于亞像素的運(yùn)動(dòng)估計(jì)，其中基于像素的運(yùn)動(dòng)估計(jì)能夠利用較低的運(yùn)動(dòng)復(fù)雜度獲得精度相對(duì)較高的運(yùn) 動(dòng)向量。
[0006] 利用色彩線索能夠估計(jì)邊緣和顏色域的深度信息。二維圖像物體的邊緣往往也是深度圖像物體的邊緣；從顏色域上考慮，在自然場(chǎng)景中，高亮度的物體給人的感覺(jué)比低亮度的物體給人的感覺(jué)更近一些，紅色等暖色給人的感覺(jué)要比藍(lán)色等冷色給人的感覺(jué)近一些。因此，色彩線索也能作為深度提取的重要依據(jù)。YCbCr彩色空間廣泛應(yīng)用于數(shù)字視頻，亮度信息用分量Y表示，彩色信息用兩個(gè)色差分量Cb和Cr來(lái)存儲(chǔ)，其中Cr指的紅色色度分量。在應(yīng)用上很廣泛，JPEG、MPEG、DVD、攝影機(jī)、數(shù)字電視等皆采此一格式。
[0007] 現(xiàn)有的全自動(dòng)2D轉(zhuǎn)3D的方法大多利用單個(gè)深度線索提取深度，無(wú)法獲得準(zhǔn)確的深度信息，導(dǎo)致最終無(wú)法獲得舒適的立體視覺(jué)效果。運(yùn)動(dòng)視差雖然被稱為最可靠的深度線索，但是無(wú)法用來(lái)估計(jì)靜止物體的深度。利用幾何透視來(lái)分配深度，幾何模型往往不具有普適性，無(wú)法匹配所有幾何場(chǎng)景。而色彩線索往往由經(jīng)驗(yàn)得出，對(duì)場(chǎng)景的要求更高，準(zhǔn)確性無(wú) 法保證?，F(xiàn)有的很多由2D轉(zhuǎn)3D獲得的3D視頻內(nèi)容很多都是由簡(jiǎn)單的全自動(dòng)的轉(zhuǎn)換方法獲得的"偽"3D內(nèi)容，以此達(dá)到快速提高市場(chǎng)占有率的作用，雖然能夠讓消費(fèi)者獲得立體視覺(jué)體驗(yàn)，卻無(wú)法提供舒適的視覺(jué)效果。然而，如果將多種深度線索以適當(dāng)?shù)姆绞饺诤蟻?lái)獲取深度圖，就能利用多種深度線索的優(yōu)勢(shì)來(lái)獲得更準(zhǔn)確的深度信息，從而合成質(zhì)量更高的三維視圖。

【發(fā)明內(nèi)容】

[0008] 本發(fā)明針對(duì)當(dāng)前全自動(dòng)2D轉(zhuǎn)3D系統(tǒng)提取深度信息不準(zhǔn)確，立體感受不舒適等缺點(diǎn)，提出了一種融合運(yùn)動(dòng)視差和Cr色度分量?jī)煞N深度線索的全自動(dòng)2D到3D的轉(zhuǎn)換方法和裝置。本發(fā)明將運(yùn)動(dòng)視差和Cr色度分量?jī)煞N深度線索以適當(dāng)?shù)姆绞饺诤掀饋?lái)作為提取深度信息的依據(jù)，充分利用了兩種深度線索的優(yōu)勢(shì)，使提取的深度圖適用于更多的場(chǎng)景條件，更加準(zhǔn)確。用戶利用本裝置根據(jù)對(duì)視頻場(chǎng)景的主觀感受進(jìn)行簡(jiǎn)單的參數(shù)設(shè)置就可以對(duì)二維的圖片序列或者視頻進(jìn)行深度圖的提取，并能夠合成三維立體視頻。
[0009] 本發(fā)明采用的技術(shù)方案為：
[0010] 一種基于融合深度線索的全自動(dòng)2D轉(zhuǎn)3D方法，根據(jù)運(yùn)動(dòng)視差和Cr色度分量?jī)煞N 深度線索的適當(dāng)組合提取深度圖，然后利用基于深度圖的渲染（DIBR)技術(shù)合成立體視圖，其特征在于：利用光流的方法計(jì)算運(yùn)動(dòng)向量，將運(yùn)動(dòng)向量量化為深度值；同時(shí)利用原始二維圖像的Cr色度分量提取深度信息；最后將兩種深度值根據(jù)人工設(shè)置的權(quán)重進(jìn)行加權(quán)，從而獲得融合的深度圖。具體步驟如下：
[0011] (1)利用光流的方法進(jìn)行運(yùn)動(dòng)估計(jì)：利用光流的方法對(duì)圖片序列或者視頻的當(dāng)前幀和之后一幀進(jìn)行運(yùn)動(dòng)估計(jì)，為了提高計(jì)算速度，在運(yùn)動(dòng)估計(jì)之前對(duì)圖像進(jìn)行下采樣；
[0012] (2)將根據(jù)運(yùn)動(dòng)估計(jì)獲得的深度圖與Cr色差分量表示的深度圖進(jìn)行融合：根據(jù)運(yùn) 動(dòng)向量坐標(biāo)值計(jì)算前后兩幀對(duì)應(yīng)運(yùn)動(dòng)匹配點(diǎn)間的歐式距離，并根據(jù)映射函數(shù)量化為最大為 255的深度值，然后，提取當(dāng)前幀圖像的Cr色度分量的值作為根據(jù)Cr色度分量提取的深度值，最后，將運(yùn)動(dòng)向量量化后的深度值和根據(jù)Cr色度分量提取的深度值按照人工設(shè)定的權(quán) 重進(jìn)行加權(quán)，獲得最終的融合深度圖；
[0013] (3)立體視圖合成：根據(jù)人工設(shè)置的最大視差，利用深度圖和原始二維視圖，通過(guò) 基于深度圖的渲染技術(shù)合成左右眼視圖。
[0014] 本發(fā)明的基于融合深度線索的全自動(dòng)二維轉(zhuǎn)三維裝置，包括如下組成模塊：
[0015] (1)輸入模塊：該模塊可以將二維圖片序列和二維視頻作為視頻源導(dǎo)入，輸入模塊能夠自動(dòng)識(shí)別視頻格式和總幀數(shù)，并且能夠?qū)?D轉(zhuǎn)3D進(jìn)行參數(shù)設(shè)置；
[0016] (2)深度提取模塊：該模塊可以人工設(shè)定光流方法的搜索范圍和深度圖加權(quán)系數(shù)，根據(jù)運(yùn)動(dòng)視差和色差分量?jī)煞N深度線索提取深度信息，進(jìn)行加權(quán)獲得融合的深度圖，并且能獲得深度視頻；
[0017] (3)立體視圖合成模塊：該模塊可以人工設(shè)定最大視差范圍，利用DIBR的方法合成二維圖像的左右眼視圖，使用3D顯示設(shè)備或者利用軟件合成紅藍(lán)視圖，以供在二維顯示設(shè)備上進(jìn)行觀看。
[0018] 本發(fā)明將運(yùn)動(dòng)視差和Cr色度分量?jī)煞N深度線索以適當(dāng)?shù)姆绞饺诤掀饋?lái)作為提取深度信息的依據(jù)，充分利用了運(yùn)動(dòng)視差這種深度線索提取運(yùn)動(dòng)場(chǎng)景深度信息和Cr色度分量這種色彩深度線索提取靜止場(chǎng)景深度信息的優(yōu)勢(shì)，使提取的深度圖適用于更多的場(chǎng)景條件，更加準(zhǔn)確。用戶通過(guò)本發(fā)明裝置能夠方便地進(jìn)行參數(shù)設(shè)置，對(duì)二維的圖片序列或者視頻進(jìn)行基于這兩種深度線索的深度圖的提取，并能夠根據(jù)設(shè)置的最大視差合成三維立體視頻，在三維視頻生成領(lǐng)域有著實(shí)際的應(yīng)用價(jià)值。

【專利附圖】

【附圖說(shuō)明】
[0019] 圖1是本發(fā)明的方法框圖；
[0020] 圖2是本發(fā)明的軟件開發(fā)界面，正在進(jìn)行的操作為深度圖的提取；
[0021] 圖3是本發(fā)明針對(duì)選取的單幀測(cè)試圖片獲得的實(shí)驗(yàn)結(jié)果，左邊圖片為選取的測(cè)試圖片的原始圖像，右邊圖像為本發(fā)明產(chǎn)生的深度圖。

【具體實(shí)施方式】
[0022] 本發(fā)明提出的全自動(dòng)的二維轉(zhuǎn)三維方法具體流程如圖1所示，首先利用光流的方法對(duì)第η和n+1幀進(jìn)行運(yùn)動(dòng)估計(jì)，對(duì)得出的運(yùn)動(dòng)向量計(jì)算歐式距離獲得基于運(yùn)動(dòng)視差的深度圖。同時(shí)對(duì)第η幀圖像提取Cr色度分量，獲得基于色差的深度圖。然后，對(duì)兩個(gè)深度圖根據(jù)設(shè)定權(quán)重進(jìn)行融合，獲得融合的深度圖。最后利用第η幀的二維原始圖像和深度圖根據(jù)DIBR技術(shù)進(jìn)行立體合成，最終獲得左右眼立體視圖。
[0023] 本發(fā)明采用的深度提取方法是融合運(yùn)動(dòng)視差和色度分量的深度提取方法，為了提高計(jì)算速度，在處理之前對(duì)圖像進(jìn)行四分之一下采樣，提取出的深度圖再進(jìn)行上采樣恢復(fù) 為原有分辨率。具體算法實(shí)現(xiàn)過(guò)程如下：
[0024] (1)利用光流的方法計(jì)算第η幀和第n+1幀的運(yùn)動(dòng)向量，根據(jù)獲得的運(yùn)動(dòng)向量計(jì) 算歐式距離。歐式距離越大，說(shuō)明物體運(yùn)動(dòng)幅度越大，離攝像機(jī)也越近，以此為依據(jù)能夠估計(jì)出場(chǎng)景中運(yùn)動(dòng)物體的深度。根據(jù)公式將計(jì)算出的歐氏距離量化成為〇?255之間的深度值。公式如下：
[0025]

【權(quán)利要求】
1. 一種基于融合深度線索的全自動(dòng)2D轉(zhuǎn)3D方法，根據(jù)運(yùn)動(dòng)視差和Cr色度分量?jī)煞N 深度線索的適當(dāng)組合提取深度圖，然后利用基于深度圖的渲染技術(shù)合成立體視圖，其特征在于：利用光流的方法計(jì)算運(yùn)動(dòng)向量，將運(yùn)動(dòng)向量量化為深度值；同時(shí)利用原始二維圖像的Cr色度分量提取深度信息；最后將兩種深度值根據(jù)人工設(shè)置的權(quán)重進(jìn)行加權(quán)，從而獲得融合的深度圖，具體步驟如下： (1) 利用光流的方法進(jìn)行運(yùn)動(dòng)估計(jì)：利用光流的方法對(duì)圖片序列或者視頻的當(dāng)前幀和之后一幀進(jìn)行運(yùn)動(dòng)估計(jì)，為了提高計(jì)算速度，在運(yùn)動(dòng)估計(jì)之前對(duì)圖像進(jìn)行下采樣； (2) 將根據(jù)運(yùn)動(dòng)估計(jì)獲得的深度圖與Cr色差分量表示的深度圖進(jìn)行融合：根據(jù)運(yùn)動(dòng)向量坐標(biāo)值計(jì)算前后兩幀對(duì)應(yīng)運(yùn)動(dòng)匹配點(diǎn)間的歐式距離，并根據(jù)映射函數(shù)量化為最大為255 的深度值，然后，提取當(dāng)前幀圖像的Cr色度分量的值作為根據(jù)Cr色度分量提取的深度值，最后，將運(yùn)動(dòng)向量量化后的深度值和根據(jù)Cr色度分量提取的深度值按照人工設(shè)定的權(quán)重進(jìn)行加權(quán)，獲得最終的融合深度圖； (3) 立體視圖合成：根據(jù)人工設(shè)置的最大視差，利用深度圖和原始二維視圖，通過(guò)基于深度圖的渲染技術(shù)合成左右眼視圖。
2. -種基于融合深度線索的全自動(dòng)2D轉(zhuǎn)3D裝置，包括如下組成模塊： (1) 輸入模塊：該模塊可以將二維圖片序列和二維視頻作為視頻源導(dǎo)入，輸入模塊能夠自動(dòng)識(shí)別視頻格式和總幀數(shù)，并且能夠?qū)?D轉(zhuǎn)3D進(jìn)行參數(shù)設(shè)置； (2) 深度提取模塊：該模塊可以人工設(shè)定光流方法的搜索范圍和深度圖加權(quán)系數(shù)，根據(jù)運(yùn)動(dòng)視差和色差分量?jī)煞N深度線索提取深度信息，進(jìn)行加權(quán)獲得融合的深度圖，并且能獲得深度視頻； (3) 立體視圖合成模塊：該模塊可以人工設(shè)定最大視差范圍，利用基于深度圖的渲染技術(shù)合成二維圖像的左右眼視圖，使用3D顯示設(shè)備或者利用軟件合成紅藍(lán)視圖，以供在二維顯示設(shè)備上進(jìn)行觀看。
3. 據(jù)權(quán)利要求2所述的一種基于融合深度線索的全自動(dòng)2D轉(zhuǎn)3D裝置，其特征在于：具有暫停、保存和導(dǎo)入功能，當(dāng)轉(zhuǎn)換過(guò)程較長(zhǎng)時(shí)，可以對(duì)轉(zhuǎn)換過(guò)程進(jìn)行暫停和保存，等下次可以對(duì)未完成的轉(zhuǎn)換任務(wù)的參數(shù)文件進(jìn)行導(dǎo)入并繼續(xù)任務(wù)。
【文檔編號(hào)】H04N15/00GK104052990SQ201410308547
【公開日】2014年9月17日申請(qǐng)日期:2014年6月30日優(yōu)先權(quán)日:2014年6月30日
【發(fā)明者】劉琚, 曹廣昊申請(qǐng)人:山東大學(xué)

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請(qǐng)專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：劉琚;曹廣昊
技術(shù)所有人：山東大學(xué)
我是此專利的發(fā)明人

上一篇：駐極體靜電揚(yáng)聲器的制造方法
上一篇：一種全雙工通信系統(tǒng)的快速定時(shí)同步方法

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請(qǐng)點(diǎn)此查看客服電話進(jìn)行咨詢。
1、王老師：1.數(shù)字信號(hào)處理 2.傳感器技術(shù)及應(yīng)用 3.機(jī)電一體化產(chǎn)品開發(fā) 4.機(jī)械工程測(cè)試技術(shù) 5.逆向工程技術(shù)研究
2、王老師：1.機(jī)器人 2.嵌入式控制系統(tǒng)開發(fā)
3、孫老師：1.振動(dòng)信號(hào)時(shí)頻分析理論與測(cè)試系統(tǒng)設(shè)計(jì) 2.汽車檢測(cè)系統(tǒng)設(shè)計(jì) 3.汽車電子控制系統(tǒng)設(shè)計(jì)
4、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制
5、袁老師：1.計(jì)算機(jī)視覺(jué) 2.無(wú)線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問(wèn)留言已有0條留言

還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

產(chǎn)生深度知覺(jué)的線索有相關(guān)技術(shù)

深度知覺(jué)的線索相關(guān)技術(shù)

深度線索相關(guān)技術(shù)

国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

一種基于融合深度線索的全自動(dòng)二維轉(zhuǎn)三維方法和裝置制造方法