本發(fā)明屬于目標檢測,尤其涉及一種基于深度學習的藥品包裝精確監(jiān)測方法。
背景技術:
1、藥品包裝形態(tài)各異,有藥瓶、藥袋、藥盒等五花八門的形狀,它們的幾何特征、表征信息有很大差別,傳統(tǒng)的工業(yè)相機檢測方法使用圖像處理技術,包括圖像二值化、閾值分割和形態(tài)學分割等步驟,來獲取圖像的檢測結果。這些技術依賴于人工經(jīng)驗進行設計,只能適用于特定情況,泛化能力差,難以在實際的復雜應用場景下快速準確地檢測各種藥品包裝,導致需要花費額外人力物力處理無法檢測的包裝,無法實現(xiàn)全自動化檢測的需求。
技術實現(xiàn)思路
1、鑒于目前人工檢測藥品包裝存在的上述不足,本發(fā)明提供一種基于深度學習的藥品包裝精確檢測方法,通過拓展數(shù)據(jù)樣本的多樣性、加入注意力機制使得模型具有較強的學習泛化能力,提高模型的檢測精度。
2、為達到上述目的,本發(fā)明的實施例采用如下技術方案:
3、一種基于yolov8網(wǎng)絡的矢量藥品包裝檢測方法,所述的基于yolov8網(wǎng)絡的矢量藥品包裝檢測方法,具體方法包括:
4、對獲得的樣本圖像作數(shù)據(jù)增強得到增強圖像;
5、基于yolov8網(wǎng)絡搭建具有注意力機制的網(wǎng)絡模型;
6、基于增強圖像對網(wǎng)絡模型進行訓練得到檢測模型;
7、將目標圖像輸入檢測模型得到檢測結果。
8、依照本發(fā)明的一個方面,所述的對獲得的樣本圖像作數(shù)據(jù)增強得到增強圖像,具體包括:對樣本圖像進行hsv顏色增強、隨機旋轉增強、隨機仿射增強、隨機馬賽克增強操作,得到多樣的增強圖像。
9、依照本發(fā)明的一個方面,所述的基于yolov8網(wǎng)絡搭建具有注意力機制的網(wǎng)絡模型,包括backbone結構模塊、neck結構模塊、head結構模塊,將各模塊依次連接成可訓練的網(wǎng)絡模型。
10、依照本發(fā)明的一個方面,所述的backbone結構包含c2f模塊,所述的c2f模塊包括三個輸出通道,與neck結構相連;在所述的c2f模塊中的concate層之前添加通道注意力層和空間注意力層。
11、依照本發(fā)明的一個方面,所述的neck結構包括三個輸入通道,通道之間的特征融合采用wconcate加權特征拼接方式。
12、依照本發(fā)明的一個方面,所述的wconcate加權特征拼接方式采用如下公式實現(xiàn):
13、fwc=w{c(f1,f2)},其中,f1,f2是來自上層進入concate模塊的特征圖,fwc是經(jīng)過增強后的特征圖,c為concate模塊的等價函數(shù),為自學習產(chǎn)生的加權函數(shù)。
14、依照本發(fā)明的一個方面,所述的head結構包含2個輸出通道:分類輸出通道和檢測輸出通道;所述分類輸出通道,輸出目標物體的類別;所述檢測輸出通道,輸出目標物體的邊界框,所述邊界框具有方向性。
15、依照本發(fā)明的一個方面,基于增強圖像對網(wǎng)絡模型進行訓練得到檢測模型,具體包括用增強圖像作為網(wǎng)絡模型的輸入,通過損失函數(shù)評價網(wǎng)絡模型的預測能力,通過迭代多次后,直至損失函數(shù)不再下降,模型達到最優(yōu),并保存該最優(yōu)檢測模型。
16、依照本發(fā)明的一個方面,所述的將目標圖像輸入檢測模型得到檢測結果,具體為目標圖像輸入到上述得到的最優(yōu)檢測模型后,執(zhí)行檢測任務,得到目標圖像的檢測結果,即目標藥品的分類和目標藥品的檢測框。
17、一種基于yolov8網(wǎng)絡的矢量藥品包裝檢測系統(tǒng),所述的基于yolov8網(wǎng)絡的矢量藥品包裝檢測系統(tǒng)包括:
18、圖像數(shù)據(jù)處理模塊,用于藥品包裝圖像數(shù)據(jù)增強得到增強圖像;
19、構建模型模塊,用于搭建具有注意力機制的網(wǎng)絡模型;
20、訓練模塊,用于增強圖像對網(wǎng)絡模型訓練得到檢測模型;
21、測試模塊,用于將測試圖像輸入到檢測模型中,輸出模型的檢測結果。
22、本發(fā)明實施的優(yōu)點:(1)采用多種圖像增強技術,對訓練數(shù)據(jù)進行增強,從而提高算法的泛化性和圖像的易讀性;(2)通過網(wǎng)絡模型中解耦檢測頭,將分類與回歸卷積層獨立優(yōu)化,可以更準確檢測任意角度的物體;(3)通過在模型c2f單元中,加入注意力處理機制,進一步提高檢測的準確性。
1.一種基于yolov8網(wǎng)絡的矢量藥品包裝檢測方法,所述的基于yolov8網(wǎng)絡的矢量藥品包裝檢測方法,具體步驟包括:
2.根據(jù)權利要求1所述的基于yolov8網(wǎng)絡的矢量藥品包裝檢測方法,其特征在于,所述的獲得藥品包裝樣本圖像并作數(shù)據(jù)增強得到增強圖像,具體包括:獲取藥品包裝樣本圖像并對圖像數(shù)據(jù)進行hsv顏色增強、隨機旋轉增強、隨機仿射增強、隨機馬賽克增強操作,得到多樣的增強圖像。
3.根據(jù)權利要求1所述的基于yolov8網(wǎng)絡的矢量藥品包裝檢測方法,其特征在于,所述的基于yolov8網(wǎng)絡搭建具有注意力機制的網(wǎng)絡模型,包括backbone結構模塊、neck結構模塊、head結構模塊,將各模塊依次連接成可訓練的網(wǎng)絡模型。
4.根據(jù)權利要求3所述的基于yolov8網(wǎng)絡的矢量藥品包裝檢測方法,其特征在于,所述的backbone結構包含c2f模塊,所述的c2f模塊包括三個輸出通道,與neck結構相連;在所述的c2f模塊中的concate層之前添加通道注意力層和空間注意力層。
5.根據(jù)權利要求3所述的基于yolov8網(wǎng)絡的矢量藥品包裝檢測方法,其特征在于,所述的neck結構包括三個輸入通道,三個通道之間的特征融合采用wconcate加權特征拼接方式。
6.根據(jù)權利要求5所述的基于yolov8網(wǎng)絡的矢量藥品包裝檢測方法,其特征在于,所述的wconcate加權特征拼接方式采用如下公式實現(xiàn):
7.根據(jù)權利要求根據(jù)權利要求3所述的基于yolov8網(wǎng)絡的矢量藥品包裝檢測方法,其特征在于,所述的head結構包含2個輸出通道:分類輸出通道和檢測輸出通道;所述分類輸出通道,輸出目標物體的類別;所述檢測輸出通道,輸出目標物體的邊界框,所述邊界框具有方向性。
8.根據(jù)權利要求1至7中任一所述的基于yolov8網(wǎng)絡的矢量藥品包裝檢測方法,其特征在于,基于增強圖像對網(wǎng)絡模型進行訓練得到檢測模型,具體包括用增強圖像作為網(wǎng)絡模型的輸入,通過損失函數(shù)評價網(wǎng)絡模型的預測能力,通過迭代多次后,直至損失函數(shù)不再下降,模型達到最優(yōu),并保存該最優(yōu)檢測模型。
9.根據(jù)權利要求8所述的基于yolov8網(wǎng)絡的矢量藥品包裝檢測方法,其特征在于,所述的將目標圖像輸入最優(yōu)檢測模型得到檢測結果,具體為目標圖像輸入到上述得到的最優(yōu)檢測模型后,執(zhí)行檢測任務,得到目標圖像的檢測結果,即目標藥品的分類和目標藥品的檢測框。
10.一種基于yolov8網(wǎng)絡的矢量藥品包裝檢測系統(tǒng),所述的基于yolov8網(wǎng)絡的矢量藥品包裝檢測系統(tǒng)包括: