本發(fā)明屬于計算機(jī)視覺和深度學(xué)習(xí)領(lǐng)域,涉及一種保留細(xì)粒度信息的水下小目標(biāo)檢測系統(tǒng)。
背景技術(shù):
1、水下圖像與自然場景拍攝的圖像不僅在外觀上存在很大差異,如水霧效應(yīng)、低能見度和色彩失真等問題,導(dǎo)致水下目標(biāo)特征信息難以充分地利用,而且水下環(huán)境中往往會存在目標(biāo)小且分布密集導(dǎo)致重疊遮擋等問題,erep-yolov8水下目標(biāo)檢測方法通過引入gam注意力機(jī)制、高效廣義特征金字塔和坐標(biāo)感知頭來提升網(wǎng)絡(luò)的特征提取能力以及對目標(biāo)的定位能力,可以在一定程度上減少環(huán)境對檢測的干擾。但該網(wǎng)絡(luò)沒有解決水下場景中小目標(biāo)檢測存在問題。水下圖像中的弱小目標(biāo)通常具有低對比度、相互遮擋、分布密集以及多樣化的特征等問題,因此現(xiàn)有的目標(biāo)檢測方法在這種場景下的檢測精度并不理想。
技術(shù)實現(xiàn)思路
1、本發(fā)明的目的在于提出一種保留細(xì)粒度信息的水下小目標(biāo)檢測系統(tǒng),能夠更有效地處理水下小目標(biāo)檢測中的挑戰(zhàn),提高水下小目標(biāo)檢測的精度和效率。
2、實現(xiàn)本發(fā)明目的的技術(shù)解決方案為:
3、一種保留細(xì)粒度信息的水下小目標(biāo)檢測系統(tǒng),基于yolov8,其特征在于,包括:
4、細(xì)粒度下采樣模塊,該模塊通過通道間的線性組合,并使用spd-conv層進(jìn)行下采樣,獲取一系列的子特征圖;
5、c2f_scconv模塊,該模塊引入到y(tǒng)olov8的骨干網(wǎng)絡(luò),即將空間通道重構(gòu)卷積scconv融入到c2f模塊中的bottleneck瓶頸模塊中,代替bottleneck瓶頸模塊中的第二個cbs模塊,通過瓶頸模塊的堆疊提取子特征圖的有效信息;
6、反卷積通道特征融合模塊,設(shè)在yolov8骨干和頸部之間,基于子特征圖的有效信息,將子特征圖進(jìn)行加強(qiáng)融合。
7、進(jìn)一步地,所述細(xì)粒度下采樣模塊包括級聯(lián)的cbs模塊、spd層和無步長卷積層,cbs模塊包括級聯(lián)的無步長卷積層、bn層和silu激活函數(shù)。
8、進(jìn)一步地,所述細(xì)粒度下采樣模塊的下采樣過程為:假設(shè)輸入特征圖尺寸為s×s×c1,先經(jīng)過cbs模塊提取特征圖的特征信息,輸出的中間特征圖尺寸為s×s×c1;之后再經(jīng)過spd層,對于大小為s×s×c1地中間特征圖x,對其進(jìn)行切割,劃分出一系列的子特征圖,最后再經(jīng)過一個無步長卷積層,使得特征圖的維度由s/scale×s/scale×scale2c1變?yōu)閟/scale×s/scale×c2,其中c2<scale2c1,scale為下采樣倍率。
9、進(jìn)一步地,所述spd層劃分出一系列的子特征圖為:
10、fx,y=x[x:s:scale,y:s:scale]
11、其中,fx,y表示中間特征圖x的子圖,0≤x,y≤,x、y是行列經(jīng)過下采樣之后的行列,子圖fx,y由能夠被i+x和j+y整除的所有條目x(i+j)構(gòu)成,i、j分別表示特征圖x的行索引和列索引。
12、進(jìn)一步地,所述空間通道重構(gòu)卷積包括空間重構(gòu)單元和通道重構(gòu)單元,以順序方式將空間重構(gòu)單元和通道重構(gòu)單元結(jié)合在一起,對于每個輸入特征x首先通過空間重構(gòu)單元運(yùn)算獲得空間提煉特征xω,然后利用通道重構(gòu)單元獲得通道提煉特征y,之后再將每個通道提煉特征y以及初始輸入特征x進(jìn)行相加,獲得融合特征。
13、進(jìn)一步地,所述空間重構(gòu)單元的輸出特征為:
14、
15、其中,μ和σ是x的平均偏差和標(biāo)準(zhǔn)偏差,ε是設(shè)置的穩(wěn)定數(shù),γ和β是可訓(xùn)練的參數(shù)。
16、進(jìn)一步地,所述通道重構(gòu)單元采用拆分-變換-融合策略,具體包括:輸入特征x分別乘以信息權(quán)重w1和非信息權(quán)重w2得到信息量大的特征和信息量小的將特征分為特征和特征分為特征和特征之后將特征和特征相加得到特征xω1,特征和特征相加得到特征xω2,然后連接交叉重構(gòu)的特征xω1和xω2得到空間提煉特征xω,將xω通過1×1卷積進(jìn)行通道壓縮得到上部特征xup和下部特征xlow,上部特征xup分別經(jīng)過k×k卷積和1×1pwc后相加,得到代表性特征圖y1,將下部特征xlow和xlow經(jīng)過1×1pwc運(yùn)算后的生成特征串聯(lián),得到代表性特征圖y2,使用通道軟注意力機(jī)制生成特征重要性向量β1和β2,通過β1y1+β2y2得到空間通道提煉特征y。
17、進(jìn)一步地,所述反卷積通道特征融合模塊包括卷積層、反卷積層和連接層,具體包括:yolov8骨干網(wǎng)絡(luò)中最后一個特征層f1經(jīng)過卷積層得到特征f2,之后經(jīng)過核反卷積層得到特征f3,最后將特征f2和特征f3通過連接層連接得到加強(qiáng)特征output。
18、進(jìn)一步地,所述卷積層為其中h和w為特征圖的高度和寬度,k表示卷積層大小,g表示組數(shù)。
19、進(jìn)一步地,所述反卷積層為k表示反卷積層大小,i、j表示像素坐標(biāo),g=1,2,...,g。
20、與現(xiàn)有目標(biāo)檢測模型相比,本發(fā)明的優(yōu)點(diǎn)和有益效果:
21、(1)本發(fā)明的細(xì)粒度下采樣模塊通過通道間的線性組合保留更多的細(xì)節(jié)信息,并可以靈活地調(diào)整通道數(shù)目以控制模型的復(fù)雜度和避免過擬合,并使用spd-conv層進(jìn)行下采樣,并通過無步長卷積層減少通道維數(shù)以減少計算量;
22、(2)本發(fā)明將空間通道重構(gòu)卷積(spatial?and?channel?reconstructionconvolution,scconv)融入c2f模塊,開發(fā)了c2f_scconv模塊,通過瓶頸模塊的堆疊以充分抑制特征提取過程中的特征冗余,獲得具有更多有效信息的特征;
23、(3)本發(fā)明通過反卷積通道特征融合模塊更加充分地利用骨干網(wǎng)絡(luò)中高層通道的豐富特征信息,減少了路徑聚合網(wǎng)絡(luò)初始階段的信息損失,可以更加充分地利用語義信息,從而獲得高分辨率和強(qiáng)語義特征,更快更好地檢測到小目標(biāo);
24、(4)本發(fā)明能夠更有效地處理水下小目標(biāo)檢測中的挑戰(zhàn),提高檢測精度,減少特征冗余和計算量,從而滿足實際應(yīng)用的需求。
1.一種保留細(xì)粒度信息的水下小目標(biāo)檢測系統(tǒng),基于yolov8,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的一種保留細(xì)粒度信息的水下小目標(biāo)檢測系統(tǒng),其特征在于,所述細(xì)粒度下采樣模塊包括級聯(lián)的cbs模塊、spd層和無步長卷積層,cbs模塊包括級聯(lián)的無步長卷積層、bn層和silu激活函數(shù)。
3.根據(jù)權(quán)利要求2所述的一種保留細(xì)粒度信息的水下小目標(biāo)檢測系統(tǒng),其特征在于,所述細(xì)粒度下采樣模塊的下采樣過程為:假設(shè)輸入特征圖尺寸為s×s×c1,先經(jīng)過cbs模塊提取特征圖的特征信息,輸出的中間特征圖尺寸為s×s×c1;之后再經(jīng)過spd層,對于大小為s×s×c1地中間特征圖x,對其進(jìn)行切割,劃分出一系列的子特征圖,最后再經(jīng)過一個無步長卷積層,使得特征圖的維度由s/ccale×s/ccale×ccale2c1變?yōu)閟/scale×s/ccale×c2,其中c2<scale2c1,scale為下采樣倍率。
4.根據(jù)權(quán)利要求3所述的一種保留細(xì)粒度信息的水下小目標(biāo)檢測系統(tǒng),其特征在于,所述spd層劃分出一系列的子特征圖為:
5.根據(jù)權(quán)利要求1所述的一種保留細(xì)粒度信息的水下小目標(biāo)檢測系統(tǒng),其特征在于,所述空間通道重構(gòu)卷積包括空間重構(gòu)單元和通道重構(gòu)單元,以順序方式將空間重構(gòu)單元和通道重構(gòu)單元結(jié)合在一起,對于每個輸入特征x首先通過空間重構(gòu)單元運(yùn)算獲得空間提煉特征xω,然后利用通道重構(gòu)單元獲得通道提煉特征y,之后再將每個通道提煉特征y以及初始輸入特征x進(jìn)行相加,獲得融合特征。
6.根據(jù)權(quán)利要求5所述的一種保留細(xì)粒度信息的水下小目標(biāo)檢測系統(tǒng),其特征在于,所述空間重構(gòu)單元的輸出特征為:
7.根據(jù)權(quán)利要求5所述的一種保留細(xì)粒度信息的水下小目標(biāo)檢測系統(tǒng),其特征在于,所述通道重構(gòu)單元采用拆分-變換-融合策略,具體包括:輸入特征x分別乘以信息權(quán)重w1和非信息權(quán)重w2得到信息量大的特征和信息量小的將特征分為特征和特征分為特征和特征之后將特征和特征相加得到特征xω1,特征和特征相加得到特征xω2,然后連接交叉重構(gòu)的特征xω1和xω2得到空間提煉特征xω,將xω通過1×1卷積進(jìn)行通道壓縮得到上部特征xup和下部特征xlow,上部特征xup分別經(jīng)過k×k卷積和1×1pwc后相加,得到代表性特征圖y1,將下部特征xlow和xlow經(jīng)過1×1pwc運(yùn)算后的生成特征串聯(lián),得到代表性特征圖y2,使用通道軟注意力機(jī)制生成特征重要性向量β1和β2,通過β1y1+β2y2得到空間通道提煉特征y。
8.根據(jù)權(quán)利要求1所述的一種保留細(xì)粒度信息的水下小目標(biāo)檢測系統(tǒng),其特征在于,所述反卷積通道特征融合模塊包括卷積層、反卷積層和連接層,具體包括:yolov8骨干網(wǎng)絡(luò)中最后一個特征層f1經(jīng)過卷積層得到特征f2,之后經(jīng)過核反卷積層得到特征f3,最后將特征f2和特征f3通過連接層連接得到加強(qiáng)特征output。
9.根據(jù)權(quán)利要求8所述的一種保留細(xì)粒度信息的水下小目標(biāo)檢測系統(tǒng),其特征在于,所述卷積層為其中h和w為特征圖的高度和寬度,k表示卷積層大小,g表示組數(shù)。
10.根據(jù)權(quán)利要求8所述的一種保留細(xì)粒度信息的水下小目標(biāo)檢測系統(tǒng),其特征在于,所述反卷積層為k表示反卷積層大小,i、j表示像素坐標(biāo),g=1,2,...,g。