本發(fā)明屬于基于計(jì)算機(jī)視覺(jué)的無(wú)人機(jī)圖像識(shí)別分割,尤其涉及一種無(wú)人機(jī)場(chǎng)景用偽裝物目標(biāo)檢測(cè)模型及檢測(cè)方法。
背景技術(shù):
1、在無(wú)人機(jī)技術(shù)不斷發(fā)展的今天,無(wú)人機(jī)在軍事、農(nóng)業(yè)、環(huán)境監(jiān)測(cè)等領(lǐng)域的應(yīng)用越來(lái)越廣泛。然而,在復(fù)雜環(huán)境中,識(shí)別和定位偽裝目標(biāo)仍然是一項(xiàng)艱巨的任務(wù)。偽裝目標(biāo)的邊界通常模糊不清,這一特性使得在復(fù)雜場(chǎng)景中準(zhǔn)確識(shí)別融入其中的偽裝對(duì)象變得相當(dāng)具有挑戰(zhàn)性。因此,需要克服模糊不清的邊界,確保對(duì)偽裝對(duì)象的精準(zhǔn)定位,尤其是在多變的環(huán)境中。
2、隨著計(jì)算機(jī)視覺(jué)的快速發(fā)展,在偽裝目標(biāo)檢測(cè)方法方面取得了顯著進(jìn)展。目前,這些方法可以廣泛分為三類主要類型。第一類涉及對(duì)網(wǎng)絡(luò)模塊或架構(gòu)進(jìn)行細(xì)致設(shè)計(jì),以深入挖掘偽裝目標(biāo)的可辨識(shí)特征。第二類采用多任務(wù)聯(lián)合學(xué)習(xí)方法,從多個(gè)維度提取特征,包括圖像深度、頻域和偽裝目標(biāo)邊界。第三類采用仿生學(xué)方法,模擬捕食過(guò)程中的機(jī)制,以提高偽裝目標(biāo)檢測(cè)的性能。
3、盡管這些方法取得了相當(dāng)?shù)某删?,但一個(gè)艱巨的挑戰(zhàn)仍然存在:偽裝目標(biāo)的邊界通常天生模糊不清,使得在復(fù)雜場(chǎng)景中準(zhǔn)確識(shí)別融入其中的偽裝對(duì)象變得困難。此外,值得注意的是,盡管引入了邊界線索,但由于像bgnet類的模型對(duì)邊緣背景復(fù)雜性的考慮不足,未能有效過(guò)濾掉無(wú)關(guān)信息,導(dǎo)致在處理與邊界相關(guān)的細(xì)節(jié)時(shí)性能不佳。
技術(shù)實(shí)現(xiàn)思路
1、針對(duì)上述問(wèn)題,本發(fā)明了提出了一種創(chuàng)新性的門控邊界感知網(wǎng)絡(luò)gbnet,旨在解決偽裝目標(biāo)檢測(cè)領(lǐng)域面臨的各種挑戰(zhàn)。具體而言,gbnet引入了一種新穎的邊界增強(qiáng)模塊,通過(guò)門控卷積塊有選擇地過(guò)濾掉多余的背景信息,為準(zhǔn)確生成邊界提供了有效的引導(dǎo)。同時(shí),還設(shè)計(jì)了一種新穎的邊界感知解碼器,通過(guò)注入邊界增強(qiáng)特征,進(jìn)一步豐富了解碼器的表征能力。
2、本發(fā)明第一方面提出了一種無(wú)人機(jī)場(chǎng)景用偽裝物目標(biāo)檢測(cè)模型,其特征在于:對(duì)于給定輸入圖像h*w*c,其空間分辨率為h*w,具有c個(gè)通道,每個(gè)像素被賦予一個(gè)類別標(biāo)簽,其中0代表背景,1代表偽裝對(duì)象;所述偽裝物目標(biāo)檢測(cè)模型旨在預(yù)測(cè)逐像素的標(biāo)簽映射,并包括依次連接的主干網(wǎng)絡(luò)、邊界增強(qiáng)模塊bem和邊界感知解碼器;
3、所述主干網(wǎng)絡(luò),采用金字塔視覺(jué)變換器作為編碼器,用于提取不同階段的特征,并送到所述邊界增強(qiáng)模塊;
4、所述邊界增強(qiáng)模塊利用門控卷積模塊gcb生成高質(zhì)量的邊界線索,并將其整合到邊界感知解碼器中,從而豐富解碼器特征的表示能力;
5、所述邊界感知解碼器包含邊界注入模塊bib和上下文融合模塊cab;所述邊界注入模塊集成邊界信息以增強(qiáng)目標(biāo)特征的表示,所述上下融合模塊則進(jìn)行全面細(xì)粒度的特征捕捉,然后得到最終的輸出。
6、優(yōu)選的,所述主干網(wǎng)絡(luò)用于提取四個(gè)階段的特征,生成不同級(jí)別的特征,表示為:
7、
8、其中表示來(lái)自主干網(wǎng)絡(luò)第層提取的特征信息, f表示的集合。
9、優(yōu)選的,所述邊界增強(qiáng)模塊將特征表示通過(guò)通道縮減模塊傳遞,每個(gè)模塊包括三個(gè)3x3的卷積層,以提取多層次的邊界特征;通道大小設(shè)置為?64,表示為:
10、
11、其中,表示第層的邊界特征,表示邊界特征的集合;
12、隨后,將 , ,上采樣到的大小,用于后續(xù)的拼接操作;然后,將相鄰的特征,組合在一起并饋送到門控卷積模塊,以全面地采樣邊界信息;然后,重復(fù)相同的操作,連接通過(guò)門控卷積模塊獲得的特征,得到;最后,將 ,相加,在進(jìn)行1x1卷積后,得到一個(gè)通道大小為1的掩碼,表示邊界,形式化為:
13、。
14、優(yōu)選的,所述門控卷積模塊gcb具體為:
15、首先沿著第一維度連接來(lái)自的低級(jí)別向量張量和高級(jí)別向量張量,形成臨時(shí)特征,隨后,對(duì)臨時(shí)特征進(jìn)行全局平均池化,得到全局聚合的特征;在此之后,通過(guò)兩個(gè)1x1的卷積層進(jìn)行特征轉(zhuǎn)換;隨后,由sigmoid函數(shù)生成的權(quán)重構(gòu)成一個(gè)門控機(jī)制;最后,將生成的注意力權(quán)重與原始的相乘,將結(jié)果加上,并通過(guò)一個(gè)1x1的卷積層,得到最終加權(quán)特征。
16、優(yōu)選的,所述邊界注入模塊bib具體為:
17、所述邊界注入模塊bib接受邊界增強(qiáng)特征和來(lái)自主干網(wǎng)絡(luò)的相應(yīng)特征兩個(gè)輸入;在第一個(gè)bib之后,剩余的輸入來(lái)自前一個(gè)bib的輸出,由于前一個(gè)已經(jīng)包含了邊界信息,隨后的輸入具有相同的特性;然后,在這兩個(gè)輸入上執(zhí)行逐元素乘法,然后進(jìn)行跳躍連接操作進(jìn)行相加;隨后應(yīng)用3x3卷積,得到帶有邊界信息注釋的特征圖;
18、隨后,特征圖經(jīng)過(guò)三次1x1卷積,旨在減小通道維度以減輕計(jì)算負(fù)擔(dān),并分為三個(gè)分支,分別是 ,和;對(duì)于分支,經(jīng)過(guò)1x1卷積,然后是?3x3卷積,最后將結(jié)果添加到原始特征上,得到;
19、對(duì)于分支,該過(guò)特征圖進(jìn)行平均池化,然后進(jìn)行一維卷積進(jìn)行全局上下文融合,隨后,應(yīng)用sigmoid激活函數(shù)生成一個(gè)權(quán)重掩碼,然后使用此掩碼自適應(yīng)調(diào)整分支和的特征圖,強(qiáng)調(diào)偽裝對(duì)象檢測(cè)上下文中不同尺度的信息,得到的自適應(yīng)特征圖記為;
20、對(duì)于分支,特征直接與從分支獲得的注意力權(quán)重相乘,得到;
21、最后,和進(jìn)行連接,隨后進(jìn)行3x3卷積操作,得到融合的輸出特征。
22、優(yōu)選的,所述上下文融合模塊cab具體為:
23、cab從相鄰區(qū)域聚合信息,以處理先前獲得的融合的輸出特征;低級(jí)別特征和高級(jí)別特征經(jīng)歷一系列卷積和池化操作,分別獲取局部和全局信息,隨后,通過(guò)引入sigmoid激活函數(shù),左右通道的輸出進(jìn)行動(dòng)態(tài)交互,sigmoid激活函數(shù)生成的權(quán)重范圍在0到1之間,用于調(diào)整低級(jí)別和高級(jí)別特征的貢獻(xiàn);最終,通過(guò)卷積和批歸一化,調(diào)整后的特征被整合,產(chǎn)生更具表現(xiàn)力和針對(duì)性的表示。
24、本發(fā)明第二方面提供了一種無(wú)人機(jī)場(chǎng)景用偽裝物目標(biāo)檢測(cè)方法,包括以下過(guò)程:
25、通過(guò)無(wú)人機(jī)拍攝獲取圖像;
26、將圖像輸入如第一方面所述的無(wú)人機(jī)場(chǎng)景用偽裝物目標(biāo)檢測(cè)模型中進(jìn)行目標(biāo)檢測(cè);
27、輸出分割處理后的目標(biāo)圖像。
28、本發(fā)明第三方面提供了一種無(wú)人機(jī)場(chǎng)景用偽裝物目標(biāo)檢測(cè)設(shè)備,所述設(shè)備包括至少一個(gè)處理器和至少一個(gè)存儲(chǔ)器,所述處理器和存儲(chǔ)器相耦合;所述存儲(chǔ)器中存儲(chǔ)有如第一方面所述的無(wú)人機(jī)場(chǎng)景用偽裝物目標(biāo)檢測(cè)模型的計(jì)算機(jī)執(zhí)行程序;所述處理器執(zhí)行存儲(chǔ)器中存儲(chǔ)的計(jì)算機(jī)執(zhí)行程序時(shí),使處理器執(zhí)行一種無(wú)人機(jī)場(chǎng)景用偽裝物目標(biāo)檢測(cè)方法。
29、本發(fā)明第四方面提供了一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)中存儲(chǔ)有如第一方面所述的無(wú)人機(jī)場(chǎng)景用偽裝物目標(biāo)檢測(cè)模型的計(jì)算機(jī)程序或指令,所述程序或指令被處理器執(zhí)行時(shí),使處理器執(zhí)行一種無(wú)人機(jī)場(chǎng)景用偽裝物目標(biāo)檢測(cè)方法。
30、與現(xiàn)有技術(shù)相比,本發(fā)明具有如下有益效果:
31、本發(fā)明的技術(shù)方案在無(wú)人機(jī)復(fù)雜場(chǎng)景下偽裝目標(biāo)的分割領(lǐng)域具有顯著的益處和效果,傳統(tǒng)上,無(wú)人機(jī)偽裝物目標(biāo)與背景相似度高,難以精確分割,而本發(fā)明的模型則突破了這一難題。本發(fā)明創(chuàng)新在于提高了分割準(zhǔn)確率,能夠更精細(xì)地區(qū)分相似度較大的物體,確保目標(biāo)邊界與背景之間的清晰分隔。這不僅有助于提升目標(biāo)檢測(cè)的精度,還能有效應(yīng)對(duì)復(fù)雜場(chǎng)景中的挑戰(zhàn),如光照變化和視角扭曲。
32、在gbnet的設(shè)計(jì)中,邊界增強(qiáng)模塊的引入旨在針對(duì)偽裝目標(biāo)模糊邊界的問(wèn)題,通過(guò)門控卷積塊巧妙地實(shí)現(xiàn)對(duì)多余背景信息的有選擇性過(guò)濾。這不僅有助于提高網(wǎng)絡(luò)對(duì)偽裝目標(biāo)邊界的敏感性,同時(shí)有效減少了環(huán)境噪聲的影響,從而提升了整體性能。
33、邊界感知解碼器的設(shè)計(jì)則進(jìn)一步強(qiáng)調(diào)了邊界特征在識(shí)別偽裝目標(biāo)過(guò)程中的關(guān)鍵作用。通過(guò)巧妙注入邊界增強(qiáng)特征,加強(qiáng)了解碼器對(duì)復(fù)雜場(chǎng)景中偽裝目標(biāo)邊界的理解能力,從而更準(zhǔn)確地完成目標(biāo)的分割任務(wù)。