本發(fā)明涉及一種卷煙品牌識別方法、裝置、存儲介質(zhì)及設備,屬于目標檢測。
背景技術:
1、煙草行業(yè)的眾多工作中,需要對卷煙品牌進行識別分析煙草行業(yè)中的傳統(tǒng)的卷煙品牌識別方法為人工識別,但是各類卷煙品牌的外殼圖案和文字標識存在較大差異以及存在各種復雜環(huán)境場景,對卷煙品牌工作造成一系列挑戰(zhàn)導致一系列問題的出現(xiàn),包括識別準確性、識別效率、人工成本等。這些因素導致煙草信息處理過程中的效率降低,影響煙草行業(yè)的運轉(zhuǎn)效率和成本。因此,需要研究并設計高效的卷煙品牌識別模型,以優(yōu)化煙草行業(yè)信息處理的準確性和效率,為煙草行業(yè)的各項工作提供便捷。
2、目標檢測是計算機視覺領域的一項重要技術,旨在識別圖像或視頻中的特定目標并確定其位置。盡管現(xiàn)有技術如yolov8已經(jīng)在目標檢測性能方面取得了顯著進展,但在一些特定應用場景中仍存在一定的局限性。例如,在卷煙品牌識別的復雜場景下,由于目標小、光照變化、遮擋和背景干擾等因素,現(xiàn)有模型的識別準確率和魯棒性仍然不足,導致卷煙品牌識別準確性較低。
技術實現(xiàn)思路
1、本發(fā)明的目的在于提供一種卷煙品牌識別方法、裝置、存儲介質(zhì)及設備,解決現(xiàn)有技術中存在的卷煙品牌識別準確性較低的問題。
2、為實現(xiàn)以上目的,本發(fā)明是采用下述技術方案實現(xiàn)的:
3、第一方面,本發(fā)明提供了一種卷煙品牌識別方法,包括:
4、獲取卷煙圖像;
5、將所述卷煙圖像輸入到訓練好的改進yolov8模型中,得到卷煙品牌識別結(jié)果;
6、其中,所述改進yolov8模型是在yolov8模型的基礎上改進得到的,改進包括:在檢測頭中添加小目標檢測層,改進c2f模塊和bottleneck模塊,在backbone網(wǎng)絡中添加dwr模塊、sir模塊和dwrseg網(wǎng)絡,在neck模塊中添加cbam模塊、通道注意力模塊和空間注意力模塊。
7、進一步的,所述在檢測頭中添加小目標檢測層包括:將所述小目標檢測層添加在檢測頭中特征金字塔的輸出層和檢測層之間。
8、進一步的,所述改進c2f模塊和bottleneck模塊,包括:
9、增加c2f模塊中的卷積核大小和數(shù)量;
10、增加bottleneck模塊中跳躍連接層和深度卷積層的數(shù)量。
11、進一步的,所述在backbone網(wǎng)絡中添加dwr模塊、sir模塊和dwrseg網(wǎng)絡,包括:
12、將所述dwr模塊添加在backbone網(wǎng)絡的中間層,設置在所述bottleneck模塊的中間層中兩個標準卷積層之間;
13、將所述sir模塊添加在backbone網(wǎng)絡的最后一層與neck模塊的第一層之間;
14、將所述dwrseg網(wǎng)絡添加在backbone網(wǎng)絡的輸出層和neck模塊的輸入層之間。
15、進一步的,所述在neck模塊中添加cbam模塊、通道注意力模塊和空間注意力模塊,包括:
16、將所述cbam模塊添加到neck模塊中,使所述cbam模塊和neck模塊串聯(lián)工作;
17、將所述通道注意力模塊添加在cbam模塊和空間注意力模塊之間;
18、將所述空間注意力模塊添加在通道注意力模塊和neck模塊的輸出層之間。
19、進一步的,所述改進yolov8模型在訓練過程采用的損失函數(shù)為mpdiou。
20、進一步的,所述改進yolov8模型在訓練過程采用的訓練數(shù)據(jù)是經(jīng)過數(shù)據(jù)增強和預處理的卷煙圖像;
21、所述數(shù)據(jù)增強包括:對卷煙圖像進行翻轉(zhuǎn)、旋轉(zhuǎn)、裁剪和縮放;
22、所述預處理包括:將卷煙圖像的像素值進行歸一化。
23、第二方面,本發(fā)明提供了一種卷煙品牌識別裝置,包括:
24、卷煙圖像獲取模塊,被配置為:獲取卷煙圖像;
25、卷煙品牌識別模塊,被配置為:將所述卷煙圖像輸入到訓練好的改進yolov8模型中,得到卷煙品牌識別結(jié)果;
26、其中,所述改進yolov8模型是在yolov8模型的基礎上改進得到的,改進包括:在檢測頭中添加小目標檢測層,改進c2f模塊和bottleneck模塊,在backbone網(wǎng)絡中添加dwr模塊、sir模塊和dwrseg網(wǎng)絡,在neck模塊中添加cbam模塊、通道注意力模塊和空間注意力模塊。
27、第三方面,本發(fā)明提供了一種計算機可讀存儲介質(zhì),其上存儲有計算機程序/指令,該計算機程序/指令被處理器執(zhí)行時,實現(xiàn)第一方面中任一項所述的卷煙品牌識別方法的步驟。
28、第四方面,本發(fā)明提供了一種計算機設備,包括:
29、存儲器,用于存儲計算機程序/指令;
30、處理器,用于執(zhí)行所述計算機程序/指令以實現(xiàn)第一方面中任一項所述的卷煙品牌識別方法的步驟。
31、與現(xiàn)有技術相比,本發(fā)明所達到的有益效果是:
32、本發(fā)明提供的一種卷煙品牌識別方法、裝置、存儲介質(zhì)及設備,通過對yolov8模型的改進實現(xiàn)對卷煙品牌識別準確性的提升,即通過添加小目標檢測層以更好地檢測卷煙等小目標,通過改進c2f模塊和bottleneck模塊分別提高特征提取的能力和特征融合的效果,通過引入dwr模塊用于更靈活地處理變形目標,通過引入sir模塊用于處理不同尺度的目標,通過引入dwrseg網(wǎng)絡用于更精細地分割特征圖,通過引入cbam模塊增強特征圖的表達能力,提升特征圖的權重分布精度,通過引入通道注意力模塊增強每個通道的特征表達,通過引入空間注意力模塊用于從空間角度提取關鍵信息,通過以上對模型的改進,綜合提高卷煙品牌識別的準確性。
1.一種卷煙品牌識別方法,其特征在于,包括:
2.根據(jù)權利要求1所述的卷煙品牌識別方法,其特征在于,所述在檢測頭中添加小目標檢測層包括:將所述小目標檢測層添加在檢測頭中特征金字塔的輸出層和檢測層之間。
3.根據(jù)權利要求1所述的卷煙品牌識別方法,其特征在于,所述改進c2f模塊和bottleneck模塊,包括:
4.根據(jù)權利要求1所述的卷煙品牌識別方法,其特征在于,所述在backbone網(wǎng)絡中添加dwr模塊、sir模塊和dwrseg網(wǎng)絡,包括:
5.根據(jù)權利要求1所述的卷煙品牌識別方法,其特征在于,所述在neck模塊中添加cbam模塊、通道注意力模塊和空間注意力模塊,包括:
6.根據(jù)權利要求1所述的卷煙品牌識別方法,其特征在于,所述改進yolov8模型在訓練過程采用的損失函數(shù)為mpdiou。
7.根據(jù)權利要求1所述的卷煙品牌識別方法,其特征在于,所述改進yolov8模型在訓練過程采用的訓練數(shù)據(jù)是經(jīng)過數(shù)據(jù)增強和預處理的卷煙圖像;
8.一種卷煙品牌識別裝置,其特征在于,包括:
9.一種計算機可讀存儲介質(zhì),其上存儲有計算機程序/指令,其特征在于,該計算機程序/指令被處理器執(zhí)行時,實現(xiàn)權利要求1至7中任一項所述的卷煙品牌識別方法的步驟。
10.一種計算機設備,其特征在于,包括: