本發(fā)明屬于模式識別,具體涉及一種基于擴散模型的遙感目標檢測方法。
背景技術:
::1、近年來,隨著深度學習模型的大量探究,計算機視覺任務取得了重大進展。其中,擴散模型已成為一類功能強大且用途廣泛的生成模型,在各種計算機視覺任務中取得了顯著的成功。擴散模型受到擴散的物理過程的啟發(fā),為建模復雜數據的分布和生成高保真圖像提供了一個強大的框架。擴散模型通過一系列可逆步驟逐步將簡單的噪聲分布轉換為目標數據分布。這種迭代去噪過程通常由神經網絡引導,使擴散模型能夠生成高度詳細和連貫的圖像。擴散模型在計算機視覺中的應用涵蓋了廣泛的任務,包括圖像生成、圖像修復、超分辨率等。它們的多功能性和穩(wěn)健性使它們適合解決標準和具有挑戰(zhàn)性的視覺問題,為圖像處理和合成的新創(chuàng)新和改進鋪平了道路。隨著研究界繼續(xù)探索和完善這些模型,基于擴散的方法將在計算機視覺的未來發(fā)揮關鍵作用,為創(chuàng)建、分析和理解視覺數據提供新的工具和方法。2、遙感目標檢測是計算機視覺領域中一個發(fā)展迅速的領域,其重點是從空中圖像中識別和定位物體,這些圖像通常由無人機、衛(wèi)星或其他機載平臺捕獲。這項技術因其在城市規(guī)劃、農業(yè)、環(huán)境監(jiān)測、災害管理和防御等各個領域的廣泛應用而備受關注。遙感圖片提供的獨特視角允許對大型復雜景觀進行全面分析,而這通常是地面方法無法實現的。然而,與傳統(tǒng)的物體檢測任務相比,遙感目標檢測面臨著獨特的挑戰(zhàn)。圖像捕獲的高空會導致物體尺度、遮擋和背景環(huán)境的變化,所有這些都使檢測過程變得復雜。遙感目標檢測利用先進的深度學習模型,特別是卷積神經網絡(cnn)及其擴展,來應對這些挑戰(zhàn)。這些模型擅長直接從原始像素數據中學習分層特征,從而使它們能夠穩(wěn)健地檢測不同尺度和方向上的物體。多尺度特征聚合、錨框細化和區(qū)域提議網絡等技術經過專門定制,以提高物體檢測器在航拍圖像中的性能。然而,對于擴散模型在遙感目標檢測任務中的探究有限。技術實現思路1、針對現有技術中的上述不足,本發(fā)明提供的一種基于擴散模型的遙感目標檢測方法,解決了現有技術中遙感圖像數據檢測過程中訓練資源較為復雜的問題。2、為了達到上述發(fā)明目的,本發(fā)明采用的技術方案為:一種基于擴散模型的遙感目標檢測方法,包括如下步驟:3、s1、獲取遙感圖像訓練數據;4、s2、使用遙感圖像訓練數據對神經網絡進行訓練,得到遙感目標檢測模型;5、遙感目標檢測模型包括視覺特征提取模塊、多尺度特征提取模塊和實例級別目標檢測模塊;6、視覺特征提取模塊為預訓練的基礎擴散模型,用于提取遙感圖像訓練數據的圖像特征,得到遙感圖像訓練數據的初始特征圖;7、多尺度特征提取模塊用于對初始特征圖進行特征提取,得到多級特征圖;8、實例級別目標檢測模塊用于對多級特征圖進行目標檢測,并輸出檢測結果;9、s3、將目標遙感圖像數據輸入遙感目標檢測模型,通過遙感目標檢測模型輸出目標遙感圖像的檢測結果。10、上述方案的有益效果是:11、(1)本發(fā)明可以在目標遙感圖像數據檢測的過程中,固定基礎模型vae?encoder的訓練參數,僅訓練輕量級的多尺度特征提取模塊及實例級別目標檢測模塊的參數,從而減少了訓練資源需求,縮短了學習進化時間,提高了模型的適應性和可擴展性。12、(2)本發(fā)明在目標遙感圖像數據檢測的過程中,可以利用基礎模型的先驗知識進行預測,提高了檢測的準確性和效率。13、進一步地,步驟s2中,預訓練的基礎擴散模型包括特征編碼器和unet網絡;14、其中,特征編碼器用于提取遙感圖像訓練數據的圖像特征;15、unet網絡用于對遙感圖像訓練數據的圖像特征進行進一步編碼,得到初始特征圖。16、進一步地,步驟s2中,多級特征圖的維度相同。17、上述進一步方案的有益效果是:本發(fā)明利用預訓練的基礎擴散模型stable-diffusion,在視覺特征提取過程中,凍結了原有圖像編碼器的全部參數,并在訓練過程中通過隨機裁剪等數據增強操作,可以提升模型的泛化能力。18、進一步地,步驟s2中,實例級別目標檢測模塊包括9層堆疊的子模塊,子模塊包括交叉注意力cross-attention、自注意力self-attention和前饋神經網絡ffn。19、進一步地,交叉注意力cross-attention用于學習遙感圖像訓練數據的類別;20、自注意力self-attention用于學習遙感圖像訓練數據中的預測框;21、前饋神經網絡ffn用于學習遙感圖像訓練數據中的預測掩碼。22、進一步地,步驟s2中,遙感目標檢測模型的損失函數為:23、24、其中,表示分類損失,表示預測概率,表示實例類別,表示檢測框損失,表示預測框,表示真實框,表示掩膜損失,表示預測掩膜,表示實例掩膜。25、進一步地,預訓練的基礎擴散模型為stable-diffusion,并且預訓練的基礎擴散模型的特征編碼器的參數保持不變。26、上述進一步方案的有益效果是:提高了遙感圖像目標檢測的效率和準確性,同時通過優(yōu)化模型結構和損失函數設計,使得整個系統(tǒng)更加穩(wěn)健和適應性更強,為解決復雜的實際應用場景提供了強有力的工具和方法。技術特征:1.一種基于擴散模型的遙感目標檢測方法,其特征在于,所述方法包括:2.根據權利要求1所述的方法,其特征在于,所述步驟s2中,所述預訓練的基礎擴散模型包括特征編碼器和unet網絡;3.根據權利要求1所述的方法,其特征在于,所述步驟s2中,所述多級特征圖的維度相同,所述多級特征圖的維度為所述多級特征圖中表示像素的向量的維度。4.根據權利要求1所述的方法,其特征在于,所述步驟s2中,所述實例級別目標檢測模塊包括9層堆疊的子模塊,所述子模塊包括交叉注意力cross-attention、自注意力self-attention和前饋神經網絡ffn。5.根據權利要求4所述的方法,其特征在于,所述交叉注意力cross-attention用于學習所述遙感圖像訓練數據的類別;6.根據權利要求1所述的方法,其特征在于,所述步驟s2中,所述遙感目標檢測模型的損失函數為:7.根據權利要求2所述的方法,其特征在于,所述預訓練的基礎擴散模型為stable-diffusion,并且所述預訓練的基礎擴散模型的特征編碼器的參數保持不變。技術總結本發(fā)明屬于模式識別
技術領域:
:,具體公開了一種基于擴散模型的遙感目標檢測方法,包括如下步驟:獲取遙感圖像訓練數據;使用遙感圖像訓練數據對神經網絡進行訓練,得到遙感目標檢測模型;遙感目標檢測模型包括視覺特征提取模塊、多尺度特征提取模塊和實例級別目標檢測模塊;視覺特征提取模塊為預訓練的基礎擴散模型;多尺度特征提取模塊用于對初始特征圖進行特征提取,得到多級特征圖;將目標遙感圖像數據輸入遙感目標檢測模型,通過遙感目標檢測模型輸出目標遙感圖像的檢測結果。本發(fā)明可以減少訓練資源需求,縮短學習進化時間,提高模型的適應性和可擴展性。解決了現有技術中遙感圖像數據檢測過程中訓練資源較為復雜的問題。技術研發(fā)人員:張艷寧,王笑鳴,王鵬,張世周,席慶彪,田雪濤受保護的技術使用者:西北工業(yè)大學技術研發(fā)日:技術公布日:2024/12/19