本技術(shù)涉及圖像檢測,特別是涉及一種行駛區(qū)域的檢測方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)。
背景技術(shù):
1、隨著深度學(xué)習(xí)模型的普及,已出現(xiàn)越來越多的模型用于可行駛區(qū)域的檢測。例如,fcn(fully?convolutional?network,全卷積網(wǎng)絡(luò))、segnet(segmentation?network,分割網(wǎng)絡(luò))、u-net(u型網(wǎng)絡(luò))以及deeplabv3(deeplab?version?3,深度實(shí)驗(yàn)室第三代模型)等。然而,現(xiàn)模型均對(duì)駕駛環(huán)境(例如,氣候環(huán)境、光照條件、道路條件等)有著較高要求。各模型輸出的準(zhǔn)確性容易因駕駛環(huán)境變化而出現(xiàn)明顯下降。
2、以前述所列模型中性能最優(yōu)的deeplabv3為例,在檢測可行駛區(qū)域時(shí),因其不能及時(shí)地識(shí)別出光照條件、氣候條件的變化,所以當(dāng)光照條件、和/或氣候條件出現(xiàn)變化時(shí),deeplabv3因魯棒性不足而出現(xiàn)檢測準(zhǔn)確度不足的問題。
技術(shù)實(shí)現(xiàn)思路
1、基于此,有必要針對(duì)上述技術(shù)問題,提供一種能夠行駛區(qū)域的檢測方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì),以提升行駛區(qū)域的檢測準(zhǔn)確度。
2、第一方面、本技術(shù)實(shí)施例提供一種行駛區(qū)域的檢測方法,包括:
3、獲取待檢測圖像,并將所述待檢測圖像輸入目標(biāo)模型;其中,所述目標(biāo)模型包括編碼器和解碼器;
4、在所述編碼器中,基于第一特征圖,生成第二特征圖,并利用注意力模型處理所述第二特征圖,得到第三特征圖;其中,所述第一特征圖通過所述編碼器中的卷積神經(jīng)網(wǎng)絡(luò)處理所述待檢測圖像得到,所述第二特征圖中像素點(diǎn)的感受野不都相同,所述注意力模型包括通道注意力模型和空間注意力模型;
5、將所述第一特征圖和所述第三特征圖輸入所述解碼器,得到所述待檢測圖像中的行駛區(qū)域。
6、在其中一個(gè)實(shí)施例中,所述注意力模型中,所述通道注意力模型和所述空間注意力模型順序連接;
7、則所述利用注意力模型處理所述第二特征圖,得到第三特征圖,包括:
8、通過所述通道注意力模型處理所述第二特征圖,生成通道注意力系數(shù),并基于所述通道注意力系數(shù)和所述第二特征圖,生成第四特征圖;
9、通過所述空間注意力模型處理所述第四特征圖,生成空間注意力系數(shù),并基于所述空間注意力系數(shù)和所述第二特征圖,生成所述第三特征圖。
10、在其中一個(gè)實(shí)施例中,所述通過所述通道注意力模型處理所述第二特征圖,生成通道注意力系數(shù),包括:
11、在所述通道注意力模型中,通過第一卷積處理和第一reshape函數(shù)對(duì)所述第二特征圖進(jìn)行降維處理,得到第一子特征圖,以及,
12、通過第二卷積處理和第二reshape函數(shù)對(duì)所述第二特征圖進(jìn)行特征壓縮,得到第二子特征圖;其中,所述降維處理指示對(duì)所述第二特征圖的通道特征進(jìn)行壓縮,特征壓縮指示對(duì)所述第二特征圖的高度特征和寬度特征進(jìn)行壓縮;
13、對(duì)所述第二子特征圖進(jìn)行歸一化處理,并將歸一化處理所得的第三子特征圖與第一子特征圖進(jìn)行乘積操作,得到第四子特征圖;其中,所述第四子特征圖指示所述第二特征圖中通道的注意力分布;
14、基于所述注意力分布,確定通道注意力系數(shù)。
15、在其中一個(gè)實(shí)施例中,所述通過所述空間注意力模型處理所述第四特征圖,生成空間注意力系數(shù),包括:
16、在所述空間注意力模型中,通過第四卷積處理、池化處理和第三reshape函數(shù)處理所述第四特征圖,得到第五子特征圖,以及通過所述第四卷積處理和第四reshape函數(shù)所述第四特征圖,得到第六子特征圖;
17、對(duì)所述第五子特征圖進(jìn)行歸一化處理,并與第六子特征圖進(jìn)行乘積操作,并通過第五reshape函數(shù)以及歸一化處理,得到所述空間注意力系數(shù)。
18、在其中一個(gè)實(shí)施例中,所述在所述編碼器中,基于第一特征圖,生成第二特征圖,包括:
19、通過所述編碼器中的所述卷積神經(jīng)網(wǎng)絡(luò)處理所述待檢測圖像,得到所述第一特征圖;其中,所述編碼器中所述卷積神經(jīng)網(wǎng)絡(luò)與擴(kuò)張空間金字塔池化aspp相接;
20、通過所述aspp處理所述第一特征圖,得到所述第二特征圖。
21、在其中一個(gè)實(shí)施例中,所述目標(biāo)模型通過以下方式訓(xùn)練得到:
22、基于與所述目標(biāo)模型對(duì)應(yīng)的待訓(xùn)練模型,構(gòu)造對(duì)抗網(wǎng)絡(luò),并獲取訓(xùn)練圖像集;其中,所述對(duì)抗網(wǎng)絡(luò)由鑒別器、以及含所述待訓(xùn)練模型的生成器構(gòu)成,所述訓(xùn)練圖像集包括訓(xùn)練圖像、以及與所述訓(xùn)練圖像對(duì)應(yīng)的預(yù)設(shè)標(biāo)簽,所述預(yù)設(shè)標(biāo)簽指示所述訓(xùn)練圖像中的行駛區(qū)域的區(qū)域信息;
23、在所述對(duì)抗網(wǎng)絡(luò)中,通過所述生成器處理所述訓(xùn)練圖像,得到對(duì)應(yīng)于所述訓(xùn)練圖像中所述行駛區(qū)域的模型標(biāo)簽,通過所述鑒別器處理所述模型標(biāo)簽和預(yù)設(shè)標(biāo)簽;
24、基于所述對(duì)抗網(wǎng)絡(luò)的目標(biāo)函數(shù)優(yōu)化所述對(duì)抗網(wǎng)絡(luò)的參數(shù),直到所述生成器的第一參數(shù)變化值小于第一預(yù)設(shè)變化閾值,且所述鑒別器的第二參數(shù)變化值小于第二預(yù)設(shè)變化閾值,得到目標(biāo)對(duì)抗網(wǎng)絡(luò);則所述目標(biāo)對(duì)抗網(wǎng)絡(luò)中的生成器為所述目標(biāo)模型。
25、在其中一個(gè)實(shí)施例中,所述將所述第一特征圖和所述第三特征圖輸入所述解碼器,得到所述待檢測圖像中的行駛區(qū)域,包括:
26、在所述解碼器中,對(duì)所述第一特征圖和所述第三特征圖進(jìn)行特征融合,得到融合特征圖;
27、對(duì)所述融合特征圖進(jìn)行上采樣,得到預(yù)設(shè)分辨率的第五特征圖;
28、對(duì)所述第五特征圖中的像素點(diǎn)進(jìn)行二分類,得到所述行駛區(qū)域。
29、第二方面、本技術(shù)實(shí)施例提供一種行駛區(qū)域的檢測裝置,所述裝置包括:
30、圖像模塊,用于獲取待檢測圖像,并將所述待檢測圖像輸入目標(biāo)模型;其中,所述目標(biāo)模型包括編碼器和解碼器;
31、特征模塊,用于在所述編碼器中,基于第一特征圖,生成第二特征圖,并利用注意力模型處理所述第二特征圖,得到第三特征圖;其中,所述第一特征圖通過所述編碼器中的卷積神經(jīng)網(wǎng)絡(luò)處理所述待檢測圖像得到,所述第二特征圖中像素點(diǎn)的感受野不都相同,所述注意力模型包括通道注意力模型和空間注意力模型;
32、區(qū)域模塊,用于將所述第一特征圖和所述第三特征圖輸入所述解碼器,得到所述待檢測圖像中的行駛區(qū)域。
33、在其中一個(gè)實(shí)施例中,所述注意力模型中,所述通道注意力模型和所述空間注意力模型順序連接;則所述特征模塊具體用于通過所述通道注意力模型處理所述第二特征圖,生成通道注意力系數(shù),并基于所述通道注意力系數(shù)和所述第二特征圖,生成第四特征圖;通過所述空間注意力模型處理所述第四特征圖,生成空間注意力系數(shù),并基于所述空間注意力系數(shù)和所述第二特征圖,生成所述第三特征圖。
34、在其中一個(gè)實(shí)施例中,所述特征模塊具體用于在所述通道注意力模型中,通過第一卷積處理和第一reshape函數(shù)對(duì)所述第二特征圖進(jìn)行降維處理,得到第一子特征圖,以及,通過第二卷積處理和第二reshape函數(shù)對(duì)所述第二特征圖進(jìn)行特征壓縮,得到第二子特征圖;其中,所述降維處理指示對(duì)所述第二特征圖的通道特征進(jìn)行壓縮,特征壓縮指示對(duì)所述第二特征圖的高度特征和寬度特征進(jìn)行壓縮;對(duì)所述第二子特征圖進(jìn)行歸一化處理,并將歸一化處理所得的第三子特征圖與第一子特征圖進(jìn)行乘積操作,得到第四子特征圖;其中,所述第四子特征圖指示所述第二特征圖中通道的注意力分布;基于所述注意力分布,確定所述通道注意力系數(shù)。
35、在其中一個(gè)實(shí)施例中,所述特征模塊還用于在所述空間注意力模型中,通過第四卷積處理、池化處理和第三reshape函數(shù)處理所述第四特征圖,得到第五子特征圖,以及通過所述第四卷積處理和第四reshape函數(shù)處理所述第四特征圖,得到第六子特征圖;對(duì)所述第五子特征圖進(jìn)行歸一化處理,并與第六子特征圖進(jìn)行乘積操作,并通過第五reshape函數(shù)以及歸一化處理,得到所述空間注意力系數(shù)。
36、在其中一個(gè)實(shí)施例中,所述特征模塊還用于通過所述編碼器中的所述卷積神經(jīng)網(wǎng)絡(luò)處理所述待檢測圖像,得到所述第一特征圖;其中,所述編碼器中所述卷積神經(jīng)網(wǎng)絡(luò)與擴(kuò)張空間金字塔池化aspp相接;通過所述aspp處理所述第一特征圖,得到所述第二特征圖。
37、在其中一個(gè)實(shí)施例中,所述裝置還包括訓(xùn)練模塊,所述訓(xùn)練模塊具體用于基于與所述目標(biāo)模型對(duì)應(yīng)的待訓(xùn)練模型,構(gòu)造對(duì)抗網(wǎng)絡(luò),并獲取訓(xùn)練圖像集;其中,所述對(duì)抗網(wǎng)絡(luò)由鑒別器、以及含所述待訓(xùn)練模型的生成器構(gòu)成,所述訓(xùn)練圖像集包括訓(xùn)練圖像、以及與所述訓(xùn)練圖像對(duì)應(yīng)的預(yù)設(shè)標(biāo)簽,所述預(yù)設(shè)標(biāo)簽指示所述訓(xùn)練圖像中的行駛區(qū)域的區(qū)域信息;在所述對(duì)抗網(wǎng)絡(luò)中,通過所述生成器處理所述訓(xùn)練圖像,得到對(duì)應(yīng)于所述訓(xùn)練圖像中所述行駛區(qū)域的模型標(biāo)簽,通過所述鑒別器處理所述模型標(biāo)簽和預(yù)設(shè)標(biāo)簽;基于所述對(duì)抗網(wǎng)絡(luò)的目標(biāo)函數(shù)優(yōu)化所述對(duì)抗網(wǎng)絡(luò)的參數(shù),直到所述生成器的第一參數(shù)變化值小于第一預(yù)設(shè)變化閾值,且所述鑒別器的第二參數(shù)變化值小于第二預(yù)設(shè)變化閾值,得到目標(biāo)對(duì)抗網(wǎng)絡(luò);則所述目標(biāo)對(duì)抗網(wǎng)絡(luò)中的生成器為所述目標(biāo)模型。
38、在其中一個(gè)實(shí)施例中,所述區(qū)域模塊具體用于在所述解碼器中,對(duì)所述第一特征圖和所述第三特征圖進(jìn)行特征融合,得到融合特征圖;對(duì)所述融合特征圖進(jìn)行上采樣,得到預(yù)設(shè)分辨率的第五特征圖;對(duì)所述第五特征圖中的像素點(diǎn)進(jìn)行二分類,得到所述行駛區(qū)域。
39、第三方面、本技術(shù)實(shí)施例提供一種計(jì)算機(jī)設(shè)備,包括存儲(chǔ)器、處理器及存儲(chǔ)在存儲(chǔ)器上并可在處理器上運(yùn)行的計(jì)算機(jī)程序,其特征在于,所述處理器執(zhí)行所述計(jì)算機(jī)程序時(shí)實(shí)現(xiàn)第一方面及任一種可能的實(shí)施方式所述方法的步驟。
40、第四方面、本技術(shù)實(shí)施例提供一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序,其特征在于,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)第一方面及任一種可能的實(shí)施方式所述的方法的步驟。
41、上述行駛區(qū)域的檢測方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì),通過將待檢測圖像輸入目標(biāo)模型中,利用編碼器中的注意力模型對(duì)多尺度特征圖(即第二特征圖)從通道維度、空間維度進(jìn)行特征增強(qiáng),以在解碼器中將底層輸出特征圖(第一特征圖)和經(jīng)過注意力模型特征增強(qiáng)所得的第三特征圖進(jìn)行特征融合。由于第三特征圖中與行駛區(qū)域無關(guān)的通道特征、空間特征被有效抑制,且與行駛區(qū)域相關(guān)的通道特征和空間特征得到明顯增強(qiáng),所以可促使解碼器能夠準(zhǔn)確地對(duì)融合所得融合特征圖進(jìn)行分類,準(zhǔn)確識(shí)別出屬于行駛區(qū)域的像素點(diǎn),從而有效提升了檢測出的行駛區(qū)域的準(zhǔn)確度。