一種基于深度學(xué)習(xí)的被動(dòng)式非視域成像方法及裝置

文檔序號(hào)：40390568發(fā)布日期：2024-12-20 12:13閱讀：5來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專(zhuān)利>電子通信裝置的制造及其應(yīng)用技術(shù)

本發(fā)明屬于光學(xué)非視域成像，特別提出一種基于深度學(xué)習(xí)的被動(dòng)式非視域成像方法及裝置。

背景技術(shù)：

1、非視域成像技術(shù)可對(duì)直線視場(chǎng)之外的區(qū)域進(jìn)行光學(xué)探測(cè)及成像，該技術(shù)通過(guò)利用場(chǎng)景中的中繼反射面獲取信息，經(jīng)由特定算法求解，實(shí)現(xiàn)繞過(guò)障礙成像。這一技術(shù)將光學(xué)成像范圍由全視場(chǎng)擴(kuò)展為超視場(chǎng)，在導(dǎo)航及自動(dòng)駕駛、災(zāi)難救援、內(nèi)窺醫(yī)療診斷等領(lǐng)域具有巨大應(yīng)用潛力。

2、非視域成像技術(shù)按照是否使用主動(dòng)光源對(duì)隱藏場(chǎng)景進(jìn)行可控制的照明分為主動(dòng)式與被動(dòng)式兩個(gè)類(lèi)別。其中主動(dòng)式方法具有硬件設(shè)備成本高、系統(tǒng)搭建復(fù)雜、成像采集時(shí)間長(zhǎng)、風(fēng)險(xiǎn)性高、隱蔽性差等缺點(diǎn)；被動(dòng)式方法可以有效規(guī)避上述缺點(diǎn)，但由于探測(cè)階段獲取信息較少，使得成像計(jì)算過(guò)程具有較強(qiáng)的不適定性，導(dǎo)致成像質(zhì)量和泛化性較差，對(duì)于成像場(chǎng)景往往存在特殊要求或限制。

技術(shù)實(shí)現(xiàn)思路

1、本發(fā)明的目的是為克服已有技術(shù)的不足之處，提出一種基于深度學(xué)習(xí)的被動(dòng)式非視域成像方法及裝置。本發(fā)明利用深度學(xué)習(xí)實(shí)現(xiàn)被動(dòng)式非視域成像，對(duì)于成像場(chǎng)景無(wú)任何特殊限制，并可提高成像距離，從而大幅提升被動(dòng)式非視域成像的泛用性。

2、本發(fā)明第一方面實(shí)施例提出一種基于深度學(xué)習(xí)的被動(dòng)式非視域成像方法，包括：

3、在被動(dòng)式非視域成像場(chǎng)景中，利用相機(jī)采集由自發(fā)光物體投射的投影圖像在中介墻面上產(chǎn)生的散射圖像；

4、將所述散射圖像輸入預(yù)設(shè)的成像神經(jīng)網(wǎng)絡(luò)，所述成像神經(jīng)網(wǎng)絡(luò)輸出所述投影圖像的成像結(jié)果；其中，所述成像神經(jīng)網(wǎng)絡(luò)由一對(duì)具有對(duì)稱(chēng)結(jié)構(gòu)的編碼器和解碼器組成；所述編碼器由依次連接的9層下采樣單元組成，所述解碼器由依次連接的9層上采樣單元組成。

5、在本發(fā)明的一個(gè)具體實(shí)施例中，所述投影圖像為像素?cái)?shù)小于等于所述自發(fā)光物體最大像素?cái)?shù)的正方形二值圖像。

6、在本發(fā)明的一個(gè)具體實(shí)施例中，在所述將所述散射圖像輸入預(yù)設(shè)的成像神經(jīng)網(wǎng)絡(luò)之前，所述方法還包括：

7、將所述散射圖像采樣為所述成像神經(jīng)網(wǎng)絡(luò)設(shè)定的輸入尺寸。

8、在本發(fā)明的一個(gè)具體實(shí)施例中，所述編碼器的每層下采樣單元中包含用于實(shí)現(xiàn)下采樣的二維卷積層、用于控制模型內(nèi)部參數(shù)穩(wěn)定的批量歸一化層和用于引入非線性的激活函數(shù)；所述解碼器的每層上采樣單元中包含用于實(shí)現(xiàn)上采樣的二維反卷積層、用于控制模型內(nèi)部參數(shù)穩(wěn)定的批量歸一化層、用于增強(qiáng)特征融合的跳躍連接和用于引入非線性的激活函數(shù)。

9、在本發(fā)明的一個(gè)具體實(shí)施例中，還包括：

10、所述成像神經(jīng)網(wǎng)絡(luò)初始輸入大小為512×512的散射圖像，經(jīng)過(guò)第一下采樣單元后輸出大小為256×256、特征數(shù)為4的圖像進(jìn)入第二下采樣單元；經(jīng)過(guò)第二下采樣單元后輸出大小為128×128、特征數(shù)為4的圖像進(jìn)入第三下采樣單元；經(jīng)過(guò)第三下采樣單元后輸出大小為64×64、特征數(shù)為8的圖像進(jìn)入第四下采樣單元；經(jīng)過(guò)第四下采樣單元后輸出大小為32×32、特征數(shù)為16的圖像進(jìn)入第五下采樣單元；經(jīng)過(guò)第五下采樣單元后輸出大小為16×16、特征數(shù)為32的圖像進(jìn)入第六下采樣單元；經(jīng)過(guò)第六下采樣單元后輸出大小為8×8、特征數(shù)為32的圖像進(jìn)入第七下采樣單元；經(jīng)過(guò)第七下采樣單元后輸出大小為4×4、特征數(shù)為32的圖像進(jìn)入第八下采樣單元；經(jīng)過(guò)第八下采樣單元后輸出大小為2×2、特征數(shù)為32的圖像進(jìn)入第九下采樣單元；經(jīng)過(guò)第九下采樣單元后輸出大小為1×1、特征數(shù)為32的圖像進(jìn)入第一上采樣單元；經(jīng)過(guò)第一上采樣單元后輸出大小為2×2、特征數(shù)為32的圖像，該圖像與第八下采樣單元輸出的圖像跳躍連接，沿特征維度拼接成大小為2×2、特征數(shù)為64的圖像進(jìn)入第二上采樣單元；經(jīng)過(guò)第二上采樣單元后輸出大小為4×4、特征數(shù)為32的圖像，該圖像與第七下采樣單元輸出圖像跳躍連接，沿特征維度拼接成大小為4×4、特征數(shù)為64的圖像進(jìn)入第三上采樣單元；經(jīng)過(guò)第三上采樣單元后輸出大小為8×8、特征數(shù)為32的圖像，該圖像與第六下采樣單元輸出圖像跳躍連接，沿特征維度拼接成大小為8×8、特征數(shù)為64的圖像進(jìn)入第四上采樣單元；經(jīng)過(guò)第四上采樣單元后輸出大小為16×16、特征數(shù)為32的圖像，該圖像與第五下采樣單元輸出圖像跳躍連接，沿特征維度拼接成大小為16×16、特征數(shù)為64的圖像進(jìn)入第五上采樣單元；經(jīng)過(guò)第五上采樣單元后輸出大小為32×32、特征數(shù)為16的圖像，該圖像與第四下采樣單元輸出圖像跳躍連接，沿特征維度拼接成大小為32×32、特征數(shù)為32的圖像進(jìn)入第六上采樣單元；經(jīng)過(guò)第六上采樣單元后輸出大小為64×64、特征數(shù)為8的圖像，該圖像與第三下采樣單元輸出圖像跳躍連接，沿特征維度拼接成大小為64×64、特征數(shù)為16的圖像進(jìn)入第七上采樣單元；經(jīng)過(guò)第七上采樣單元后輸出大小為128×128、特征數(shù)為4的圖像，該圖像與第二下采樣單元輸出圖像跳躍連接，沿特征維度拼接成大小為128×128、特征數(shù)為8的圖像進(jìn)入第八上采樣單元；經(jīng)過(guò)第八上采樣單元后輸出大小為256×256、特征數(shù)為4的圖像，該圖像與第一下采樣單元輸出圖像跳躍連接，沿特征維度拼接成大小為256×256、特征數(shù)為8的圖像進(jìn)入第九上采樣單元；經(jīng)過(guò)第九上采樣單元后輸出大小為512×512、特征數(shù)為4的圖像進(jìn)入所述成像神經(jīng)網(wǎng)絡(luò)的讀出層；所述讀出層輸出大小為512×512、特征數(shù)為1的圖像，即為最終的成像結(jié)果。

11、在本發(fā)明的一個(gè)具體實(shí)施例中，還包括：

12、每層下采樣單元中均包含卷積核大小為4×4、滑動(dòng)步長(zhǎng)為2的卷積層和leakyrelu激活函數(shù)；其中，所述第二下采樣單元至所述第八下采樣單元中還包含批量歸一化層；

13、每層上采樣單元中均包含卷積核大小為4×4、滑動(dòng)步長(zhǎng)為2的反卷積層、批量歸一化層、relu激活函數(shù)；其中，所述第一上采樣單元至所述第三上采樣單元中還使用概率為0.5的dropout；

14、所述讀出層中包含卷積核大小為1×1的卷積層和sigmoid函數(shù)。

15、在本發(fā)明的一個(gè)具體實(shí)施例中，在所述將所述散射圖像輸入預(yù)設(shè)的成像神經(jīng)網(wǎng)絡(luò)之前，所述方法還包括：

16、訓(xùn)練所述成像神經(jīng)網(wǎng)絡(luò)；

17、所述訓(xùn)練所述成像神經(jīng)網(wǎng)絡(luò)包括：

18、1)在所述被動(dòng)式非視域成像場(chǎng)景中，利用所述自發(fā)光物體投影多張真值圖像，通過(guò)所述相機(jī)獲取每張真值圖像在所述中介墻面上生成的散射圖像；其中，所述多張真值圖像具有相同特征；

19、2)將每張真值圖像與對(duì)應(yīng)散射圖像采樣為所述成像神經(jīng)網(wǎng)絡(luò)設(shè)定的尺寸以組成一個(gè)訓(xùn)練樣本，其中該訓(xùn)練樣本的輸入為尺寸調(diào)整后的散射圖像，真值標(biāo)簽為對(duì)應(yīng)的尺寸調(diào)整后的真值圖像；所有訓(xùn)練樣本組成訓(xùn)練集；

20、3)構(gòu)建所述成像神經(jīng)網(wǎng)絡(luò)；

21、4)利用步驟2)得到的訓(xùn)練集訓(xùn)練所述成像神經(jīng)網(wǎng)絡(luò)，得到訓(xùn)練完畢的所述成像神經(jīng)網(wǎng)絡(luò)。

22、本發(fā)明第二方面實(shí)施例提出一種基于深度學(xué)習(xí)的被動(dòng)式非視域成像裝置，包括：

23、散射圖像采集模塊，用于在被動(dòng)式非視域成像場(chǎng)景中，利用相機(jī)采集由自發(fā)光物體投射的投影圖像在中介墻面上產(chǎn)生的散射圖像；

24、成像模塊，用于將所述散射圖像輸入預(yù)設(shè)的成像神經(jīng)網(wǎng)絡(luò)，所述成像神經(jīng)網(wǎng)絡(luò)輸出所述投影圖像的成像結(jié)果；其中，所述成像神經(jīng)網(wǎng)絡(luò)由一對(duì)具有對(duì)稱(chēng)結(jié)構(gòu)的編碼器和解碼器組成；所述編碼器由依次連接的9層下采樣單元組成，所述解碼器由依次連接的9層上采樣單元組成。

25、本發(fā)明第三方面實(shí)施例提出一種電子設(shè)備，包括：

26、至少一個(gè)處理器；以及，與所述至少一個(gè)處理器通信連接的存儲(chǔ)器；

27、其中，所述存儲(chǔ)器存儲(chǔ)有可被所述至少一個(gè)處理器執(zhí)行的指令，所述指令被設(shè)置為用于執(zhí)行上述一種基于深度學(xué)習(xí)的被動(dòng)式非視域成像方法。

28、本發(fā)明第四方面實(shí)施例提出一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)，所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)存儲(chǔ)計(jì)算機(jī)指令，所述計(jì)算機(jī)指令用于使所述計(jì)算機(jī)執(zhí)行上述一種基于深度學(xué)習(xí)的被動(dòng)式非視域成像方法。

29、本發(fā)明的特點(diǎn)及有益效果：

30、本發(fā)明對(duì)于非視域成像任務(wù)中不可抵達(dá)的隱藏空間(自隱蔽目標(biāo)至中繼墻面)無(wú)任何特殊限制，僅使用數(shù)據(jù)驅(qū)動(dòng)方法降低問(wèn)題不適定性，大幅提升被動(dòng)非視域成像的實(shí)用性和泛用性。此外，本發(fā)明中將相機(jī)至中繼墻面的距離由傳統(tǒng)方法的1-2m提升至10m，進(jìn)一步拓展了非視域成像的應(yīng)用場(chǎng)景。在高精度時(shí)序控制下，本發(fā)明可實(shí)現(xiàn)高速自動(dòng)化數(shù)據(jù)采集，極大地方便了獲取神經(jīng)網(wǎng)絡(luò)訓(xùn)練所需的大量實(shí)驗(yàn)數(shù)據(jù)；同時(shí)在網(wǎng)絡(luò)訓(xùn)練完成后，能夠以相同速度實(shí)現(xiàn)實(shí)時(shí)高速成像，且成像效果優(yōu)異。

31、本發(fā)明主要優(yōu)勢(shì)如下：

32、傳統(tǒng)被動(dòng)式非視域成像方法在隱藏目標(biāo)和中介墻面間引入遮擋物，從而降低成像問(wèn)題的病態(tài)程度。然而，高質(zhì)量成像要求遮擋盡量復(fù)雜，而高泛化性要求遮擋盡量簡(jiǎn)單、任意，甚至無(wú)遮擋，兩者間存在難以避免的權(quán)衡。相反，本發(fā)明采用深度學(xué)習(xí)方法可有效規(guī)避這一問(wèn)題。

33、使用深度學(xué)習(xí)的成像方法對(duì)非視域區(qū)域無(wú)任何附加限制，對(duì)于屏幕(隱藏目標(biāo))的擺放距離、角度，傳輸過(guò)程中是否存在遮擋、散射，固定的背景光是否均勻，觀測(cè)中繼墻面是否平整等條件均無(wú)特定要求。本發(fā)明能夠充分提取和利用這些隱式環(huán)境信息，甚至環(huán)境越是復(fù)雜，可利用的信息就越多，問(wèn)題的病態(tài)程度也越小，越有利于成像。由于非視域探測(cè)實(shí)際應(yīng)用時(shí)中繼墻面后隱藏區(qū)域往往是未知或難以進(jìn)入的，限制該區(qū)域滿足特定要求并不合理，本發(fā)明不對(duì)其進(jìn)行限制更符合現(xiàn)實(shí)場(chǎng)景，能夠有效提升該技術(shù)的應(yīng)用范圍和實(shí)用價(jià)值；

34、本發(fā)明采用端到端的神經(jīng)網(wǎng)絡(luò)中包含了額外場(chǎng)景先驗(yàn)信息，且無(wú)需對(duì)這些信息進(jìn)行顯式求解和表達(dá)，可以在不具體掌握先驗(yàn)的情況下直接利用先驗(yàn)效果，相比于傳統(tǒng)方法更加直接高效，且能夠避免近似建模產(chǎn)生的誤差。

完整全部詳細(xì)技術(shù)資料下載

當(dāng)前第1頁(yè)1 2

該技術(shù)已申請(qǐng)專(zhuān)利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：付星,王祎,柳強(qiáng),肖樂(lè)平
技術(shù)所有人：清華大學(xué)
我是此專(zhuān)利的發(fā)明人

上一篇：微導(dǎo)絲的制作方法
上一篇：一種鋁型材生產(chǎn)用翻面裝置的制作方法

該領(lǐng)域下的技術(shù)專(zhuān)家
如您需求助技術(shù)專(zhuān)家，請(qǐng)點(diǎn)此查看客服電話進(jìn)行咨詢。
1、王老師：1.數(shù)字信號(hào)處理 2.傳感器技術(shù)及應(yīng)用 3.機(jī)電一體化產(chǎn)品開(kāi)發(fā) 4.機(jī)械工程測(cè)試技術(shù) 5.逆向工程技術(shù)研究
2、王老師：1.機(jī)器人 2.嵌入式控制系統(tǒng)開(kāi)發(fā)
3、孫老師：1.振動(dòng)信號(hào)時(shí)頻分析理論與測(cè)試系統(tǒng)設(shè)計(jì) 2.汽車(chē)檢測(cè)系統(tǒng)設(shè)計(jì) 3.汽車(chē)電子控制系統(tǒng)設(shè)計(jì)
4、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制
5、袁老師：1.計(jì)算機(jī)視覺(jué) 2.無(wú)線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專(zhuān)家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問(wèn)留言已有0條留言

還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

一種基于深度學(xué)習(xí)的被動(dòng)式非視域成像方法及裝置