本技術涉及計算機,尤其涉及城市道路場景的目標檢測,具體涉及一種目標檢測方法、裝置、車輛及存儲介質(zhì)。
背景技術:
1、隨著機動車數(shù)量的不斷增長,道路交通事故不斷發(fā)生,道路交通狀況日趨嚴重。因此,在車輛上搭建高級駕駛輔助系統(tǒng)(advanced?driving?assistance?system,adas),對于保障駕駛員的安全十分重要。adas中尤其重要的是環(huán)境感知模塊,通過搭載的道路場景目標檢測算法對傳感器所獲取的周圍環(huán)境圖片進行檢測與分析,是adas進行決策的先決條件。同時由于道路場景中環(huán)境復雜、目標的尺度大小不一致等問題。目標檢測算法需要實時準確地獲取道路場景中目標的類別及尺寸信息,以便車輛可以識別到周圍環(huán)境中的行人和車輛等,避免交通事故的發(fā)生。
2、相關技術中,將注意力機制引入卷積神經(jīng)網(wǎng)絡中,并收集待檢測圖片,對圖片進行標注生成目標訓練集,將目標訓練集輸入卷積神經(jīng)網(wǎng)絡中進行訓練,從而將待檢測圖片輸入到訓練好的卷積神經(jīng)網(wǎng)絡中進行檢測,得出檢測結(jié)果。該方法是將注意力機制引入卷積神經(jīng)網(wǎng)絡中,調(diào)整卷積神經(jīng)網(wǎng)絡所提取的特征圖中通道的權重,以提高目標檢測精度,但該方法的注意力機制僅涉及到對通道的注意力,對于待檢測圖像中的遮擋目標和較小的目標的檢測效果較差。因此,如何提高待檢測圖像中的遮擋目標和較小的目標的檢測精度是目前亟待解決的技術問題。
技術實現(xiàn)思路
1、本技術提供一種目標檢測方法、裝置、車輛及存儲介質(zhì),以至少解決相關技術中待檢測圖像中的遮擋目標和較小的目標的檢測效果較差的技術問題。本技術的技術方案如下:
2、根據(jù)本技術涉及的第一方面,提供一種目標檢測方法,該方法包括:獲取待檢測的目標圖像;目標圖像包括多個待檢測的目標對象;將目標圖像輸入目標檢測模型,得到目標圖像的檢測結(jié)果;目標檢測模型包括通道融合空間注意力機制的特征融合網(wǎng)絡;檢測結(jié)果包括多個邊界框和多個標簽;邊界框用于標記多個目標對象在目標圖像中的位置;標簽用于表征邊界框的多個目標對象的類別。
3、根據(jù)上述技術手段,目標檢測模型可以通過通道融合空間注意力機制的特征融合網(wǎng)絡,整合目標圖像中來自不同層級的多尺度特征,并強化不同特征之間的互補性,從而提升待目標圖像融合后的特征的表達能力,增強了復雜道路場景中的密集區(qū)域的目標對象及遠距離小尺度的目標對象的特征信息,提高了目標檢測模型對于密集區(qū)域的目標對象及遠距離小尺度的目標對象的檢測精度。
4、在一種可能的實施方式中,上述方法還包括:獲取訓練數(shù)據(jù)集;訓練數(shù)據(jù)集包括多個訓練圖像和多個訓練圖像的類別;基于多個訓練圖像的類別,將訓練數(shù)據(jù)集進行重新劃分,得到多個訓練數(shù)據(jù)集;基于多個訓練數(shù)據(jù)集和目標檢測模型的損失,對目標檢測模型進行訓練。
5、根據(jù)上述技術手段,可以基于分類后的多個訓練數(shù)據(jù)集和目標檢測模型的損失對目標檢測模型進行訓練,使得目標檢測模型可以學習不同類別的訓練圖像的特征,使得目標檢測模型可以更精準地識別目標圖像中的多個目標對象,并且提高了目標檢測模型對于新數(shù)據(jù)的泛化能力。
6、在另一種可能的實施方式中,目標檢測模型基于yolo目標檢測模型構建;yolo目標檢測模型包括:特征提取網(wǎng)絡、通道融合空間注意力機制的特征融合網(wǎng)絡和檢測頭;將目標圖像輸入目標檢測模型,得到目標圖像的檢測結(jié)果,包括:基于特征提取網(wǎng)絡,提取目標圖像在不同尺度的特征圖;基于通道融合空間注意力機制的特征融合網(wǎng)絡,將目標圖像在不同尺度的特征圖進行融合,得到目標特征圖;基于檢測頭擴展目標特征圖的通道數(shù),確定目標圖像中多個目標對象的邊界框位置和類別;基于目標圖像中多個目標對象的邊界框位置和類別,確定目標圖像的檢測結(jié)果。
7、根據(jù)上述技術手段,通過特征提取網(wǎng)絡,目標檢測模型可以捕捉目標圖像在不同尺度上的特征,以便檢測目標圖像中的不同大小的目標對象。通道融合空間注意力機制的特征融合網(wǎng)絡使得目標檢測模型可以集中于目標圖像中最重要的區(qū)域,提高對小尺寸的目標對象或密集區(qū)域的目標對象的檢測性能,增強了復雜場景中目標檢測模型對目標對象的識別能力,從而提高了目標檢測模型的檢測精度。
8、在又一種可能的實施方式中,特征提取網(wǎng)絡包括第一跨階段局部結(jié)構和第二跨階段局部結(jié)構;基于特征提取網(wǎng)絡,提取目標圖像在不同尺度的特征圖,包括:基于第一跨階段局部結(jié)構,提取目標圖像的高級語義特征;基于第二跨階段局部結(jié)構,提取目標圖像的低級視覺特征;將高級語義特征和低級視覺特征進行拼接,得到目標圖像在不同尺度的特征圖。
9、根據(jù)上述技術手段,目標圖像的高級語義特征包含目標圖像中的多個目標對象的類別相關信息,目標圖像的低級視覺特征中包含了目標圖像中的多個目標對象的邊緣和紋理等細節(jié)信息,結(jié)合目標圖像的高級語義特征和低級視覺特征,目標檢測模型可以捕捉目標圖像從細節(jié)到全局的多尺度特征,提升了檢測目標圖像中的不同尺寸的目標對象的檢測精度。
10、在又一種可能的實施方式中,基于通道融合空間注意力機制的特征融合網(wǎng)絡,將目標圖像在不同尺度的特征圖進行融合,得到目標特征圖,包括:將目標圖像在不同尺度的特征圖進行融合,得到聚合特征圖;基于通道融合空間注意力機制的特征融合網(wǎng)絡,確定聚合特征圖的通道注意力權重和空間注意力權重;基于通道注意力權重和空間注意力權重,得到目標特征圖。
11、根據(jù)上述技術手段,通道融合空間注意力機制的特征融合網(wǎng)絡可以通過注意力機制加權的方式對目標圖像的不同尺度的特征圖進行特征融合,更有效地整合來自不同尺度的特征信息,并集中于目標圖像中的關鍵區(qū)域,忽略目標圖像中的不重要的通道和空間區(qū)域,避免冗余信息的干擾,提高對目標對象的檢測精度。
12、在又一種可能的實施方式中,確定聚合特征圖的通道注意力權重,包括:確定聚合特征圖的平均池化要素和最大池化要素;基于平均池化要素和最大池化要素,通過共享網(wǎng)絡,確定通道注意力圖;共享網(wǎng)絡包括自適應卷積核大小的一維卷積;基于通道注意力圖,采用激活函數(shù),生成通道注意力權重。
13、根據(jù)上述技術手段,通過平均池化和最大池化可以分別捕捉到特征圖中的全局平均信息和最顯著的特征點,有助于整合目標圖像的多尺度信息,并且通過池化操作,可以降低特征的空間維度,保留重要的特征信息,降低計算的復雜度。另外,共享網(wǎng)絡的自適應卷積核大小允許特征融合網(wǎng)絡根據(jù)輸入的特征圖的內(nèi)容動態(tài)調(diào)整卷積核,提高目標檢測模型對不同特征的適應性。在目標圖像中存在遮擋或重疊目標對象的情況下,可以通過通道注意力權重提升目標檢測模型對目標對象的定位和分類的精度。
14、在又一種可能的實施方式中,確定聚合特征圖的空間注意力權重,包括:將通道注意力權重與聚合特征圖相乘,得到加權后的聚合特征圖;按照加權后的聚合特征圖的高度和寬度對加權后的聚合特征圖進行全局自適應均值池化,得到寬度特征圖和高度特征圖;將寬度特征圖和高度特征圖進行拼接和降維處理,得到空間特征圖;基于空間特征圖,采用激活函數(shù),生成空間注意力權重;空間注意力權重包括高度注意力權重和寬度注意力權重。
15、根據(jù)上述技術手段,通過高度注意力權重和寬度注意力權重,目標檢測模型可以整合目標圖像的水平和垂直方向上的特征信息,關注目標圖像中的關鍵空間區(qū)域,有助于目標檢測模型更準確地確定目標對象的邊界框,提高目標對象特別是小尺寸的目標對象或部分遮擋的目標對象的空間定位精度。另外,通過全局池化和降維處理,目標檢測模型可以將高維空間特征壓縮成低維,減少計算量并突出重要特征。
16、根據(jù)本技術提供的第二方面,提供一種目標檢測裝置,該裝置包括:獲取模塊和處理模塊。獲取模塊用于,獲取待檢測的目標圖像;目標圖像包括多個待檢測的目標對象;處理模塊用于,將目標圖像輸入目標檢測模型,得到目標圖像的檢測結(jié)果;目標檢測模型包括通道融合空間注意力機制的特征融合網(wǎng)絡;檢測結(jié)果包括多個邊界框和多個標簽;邊界框用于標記多個目標對象在目標圖像中的位置;標簽用于表征邊界框的多個目標對象的類別。
17、在一種可能的實施方式中,上述裝置還包括:劃分模塊和訓練模塊。獲取模塊,還用于獲取訓練數(shù)據(jù)集;訓練數(shù)據(jù)集包括多個訓練圖像和多個訓練圖像的類別;劃分模塊,用于基于多個訓練圖像的類別,將訓練數(shù)據(jù)集進行重新劃分,得到多個訓練數(shù)據(jù)集;訓練模塊,用于基于多個訓練數(shù)據(jù)集和目標檢測模型的損失,對目標檢測模型進行訓練。
18、在另一種可能的實施方式中,目標檢測模型基于yolo目標檢測模型構建;yolo目標檢測模型包括:特征提取網(wǎng)絡、通道融合空間注意力機制的特征融合網(wǎng)絡和檢測頭;處理模塊,具體用于基于特征提取網(wǎng)絡,提取目標圖像在不同尺度的特征圖;基于通道融合空間注意力機制的特征融合網(wǎng)絡,將目標圖像在不同尺度的特征圖進行融合,得到目標特征圖;基于檢測頭擴展目標特征圖的通道數(shù),確定目標圖像中多個目標對象的邊界框位置和類別;基于目標圖像中多個目標對象的邊界框位置和類別,確定目標圖像的檢測結(jié)果。
19、在又一種可能的實施方式中,特征提取網(wǎng)絡包括第一跨階段局部結(jié)構和第二跨階段局部結(jié)構;處理模塊,具體用于基于第一跨階段局部結(jié)構,提取目標圖像的高級語義特征;基于第二跨階段局部結(jié)構,提取目標圖像的低級視覺特征;將高級語義特征和低級視覺特征進行拼接,得到目標圖像在不同尺度的特征圖。
20、在又一種可能的實施方式中,處理模塊,具體用于將目標圖像在不同尺度的特征圖進行融合,得到聚合特征圖;基于通道融合空間注意力機制的特征融合網(wǎng)絡,確定聚合特征圖的通道注意力權重和空間注意力權重;基于通道注意力權重和空間注意力權重,得到目標特征圖。
21、在又一種可能的實施方式中,處理模塊,具體用于確定聚合特征圖的平均池化要素和最大池化要素;基于平均池化要素和最大池化要素,通過共享網(wǎng)絡,確定通道注意力圖;共享網(wǎng)絡包括自適應卷積核大小的一維卷積;基于通道注意力圖,采用激活函數(shù),生成通道注意力權重。
22、在又一種可能的實施方式中,處理模塊,具體用于將通道注意力權重與聚合特征圖相乘,得到加權后的聚合特征圖;按照加權后的聚合特征圖的高度和寬度對加權后的聚合特征圖進行全局自適應均值池化,得到寬度特征圖和高度特征圖;將寬度特征圖和高度特征圖進行拼接和降維處理,得到空間特征圖;基于空間特征圖,采用激活函數(shù),生成空間注意力權重;空間注意力權重包括高度注意力權重和寬度注意力權重。
23、根據(jù)本技術提供的第三方面,提供一種車輛,包括:處理器;用于存儲處理器可執(zhí)行指令的存儲器;其中,處理器被配置為執(zhí)行指令,以實現(xiàn)上述第一方面及其任一種可能的實施方式的方法。
24、根據(jù)本技術提供的第四方面,提供一種計算機可讀存儲介質(zhì),當計算機可讀存儲介質(zhì)中的指令由車輛的處理器執(zhí)行時,使得車輛能夠執(zhí)行上述第一方面中及其任一種可能的實施方式的方法。
25、根據(jù)本技術提供的第五方面,提供一種計算機程序產(chǎn)品,計算機程序產(chǎn)品包括計算機指令,當計算機指令在車輛上運行時,使得車輛執(zhí)行上述第一方面及其任一種可能的實施方式的方法。
26、由此,本技術的上述技術特征具有以下有益效果:
27、(1)目標檢測模型可以通過通道融合空間注意力機制的特征融合網(wǎng)絡,整合目標圖像中來自不同層級的多尺度特征,并強化不同特征之間的互補性,從而提升待目標圖像融合后的特征的表達能力,增強了復雜道路場景中的密集區(qū)域的目標對象及遠距離小尺度的目標對象的特征信息,提高了目標檢測模型對于密集區(qū)域的目標對象及遠距離小尺度的目標對象的檢測精度。
28、(2)可以基于分類后的多個訓練數(shù)據(jù)集和目標檢測模型的損失對目標檢測模型進行訓練,使得目標檢測模型可以學習不同類別的訓練圖像的特征,使得目標檢測模型可以更精準地識別目標圖像中的多個目標對象,并且提高了目標檢測模型對于新數(shù)據(jù)的泛化能力。
29、(3)通過特征提取網(wǎng)絡,目標檢測模型可以捕捉目標圖像在不同尺度上的特征,以便檢測目標圖像中的不同大小的目標對象。通道融合空間注意力機制的特征融合網(wǎng)絡使得目標檢測模型可以集中于目標圖像中最重要的區(qū)域,提高對小尺寸的目標對象或密集區(qū)域的目標對象的檢測性能,增強了復雜場景中目標檢測模型對目標對象的識別能力,從而提高了目標檢測模型的檢測精度。
30、(4)目標圖像的高級語義特征包含目標圖像中的多個目標對象的類別相關信息,目標圖像的低級視覺特征中包含了目標圖像中的多個目標對象的邊緣和紋理等細節(jié)信息,結(jié)合目標圖像的高級語義特征和低級視覺特征,目標檢測模型可以捕捉目標圖像從細節(jié)到全局的多尺度特征,提升了檢測目標圖像中的不同尺寸的目標對象的檢測精度。
31、(5)通道融合空間注意力機制的特征融合網(wǎng)絡可以通過注意力機制加權的方式對目標圖像的不同尺度的特征圖進行特征融合,更有效地整合來自不同尺度的特征信息,并集中于目標圖像中的關鍵區(qū)域,忽略目標圖像中的不重要的通道和空間區(qū)域,避免冗余信息的干擾,提高對目標對象的檢測精度。
32、(6)通過平均池化和最大池化可以分別捕捉到特征圖中的全局平均信息和最顯著的特征點,有助于整合目標圖像的多尺度信息,并且通過池化操作,可以降低特征的空間維度,保留重要的特征信息,降低計算的復雜度。另外,共享網(wǎng)絡的自適應卷積核大小允許特征融合網(wǎng)絡根據(jù)輸入的特征圖的內(nèi)容動態(tài)調(diào)整卷積核,提高目標檢測模型對不同特征的適應性。在目標圖像中存在遮擋或重疊目標對象的情況下,可以通過通道注意力權重提升目標檢測模型對目標對象的定位和分類的精度。
33、(7)通過高度注意力權重和寬度注意力權重,目標檢測模型可以整合目標圖像的水平和垂直方向上的特征信息,關注目標圖像中的關鍵空間區(qū)域,有助于目標檢測模型更準確地確定目標對象的邊界框,提高目標對象特別是小尺寸的目標對象或部分遮擋的目標對象的空間定位精度。另外,通過全局池化和降維處理,目標檢測模型可以將高維空間特征壓縮成低維,減少計算量并突出重要特征。
34、需要說明的是,第二方面至第五方面中的任一種實現(xiàn)方式所帶來的技術效果可參見第一方面中對應實現(xiàn)方式所帶來的技術效果,此處不再贅述。
35、應當理解的是,以上的一般描述和后文的細節(jié)描述僅是示例性和解釋性的,并不能限制本技術。