本發(fā)明涉及視覺檢測,具體涉及一種袋裝物體的ai視覺檢測方法。
背景技術(shù):
1、在現(xiàn)代商業(yè)環(huán)境的快速發(fā)展過程中,ai識別設(shè)備正逐漸滲透到各個行業(yè)領(lǐng)域,特別是在零售和供應(yīng)鏈管理方面展現(xiàn)出了巨大的潛力與應(yīng)用價值。超市作為日常消費的重要場所,其運營效率和顧客體驗的提升成為了行業(yè)關(guān)注的焦點。其中,智能秤作為超市自助結(jié)賬系統(tǒng)的重要組成部分,通過集成先進的ai識別技術(shù),實現(xiàn)了對商品的快速、準確識別,并自動打印價格標簽,極大地提升了結(jié)賬速度和準確性。
2、智能秤的核心技術(shù)在于其內(nèi)置的ai識別系統(tǒng),該系統(tǒng)依托于高精度的攝像頭和強大的圖像處理能力。當(dāng)顧客將商品放置在秤盤上時,攝像頭會迅速捕捉商品的圖像,并通過復(fù)雜的圖像處理算法對圖像進行深度分析。這一過程涉及對物品各個角度的拍照,以確保捕獲到最全面、最準確的商品信息。隨后,系統(tǒng)會對圖像進行特征點提取,這些特征點包括商品的形狀、顏色、紋理等關(guān)鍵信息,它們共同構(gòu)成了識別商品身份的重要依據(jù)。
3、在提取了足夠的特征點后,系統(tǒng)會將這些特征點信息整合并生成一個向量庫,該向量庫實際上是一個包含了各類商品特征信息的數(shù)據(jù)庫。當(dāng)新商品需要被識別時,系統(tǒng)會將其圖像轉(zhuǎn)化為特征向量,并與向量庫中的特征向量進行匹配,通過比對相似度來確定商品的種類和價格。
4、然而,盡管這一技術(shù)在實際應(yīng)用中取得了顯著成效,但仍存在不容忽視的問題。特別是當(dāng)商品被套袋包裝后,其外觀特征和顏色分布會發(fā)生顯著變化,這對ai識別系統(tǒng)提出了巨大的挑戰(zhàn)。由于套袋物品的圖像特征與未套袋時存在顯著差異,現(xiàn)有的ai識別算法往往難以準確識別套袋物品,導(dǎo)致在實際應(yīng)用中需要進行兩次獨立的訓(xùn)練過程:一次是針對未套袋物品的識別訓(xùn)練,另一次則是針對套袋物品的識別訓(xùn)練。這種雙重訓(xùn)練模式不僅耗時長、成本高,而且增加了系統(tǒng)的復(fù)雜性和維護難度。
5、因此,針對套袋物品無法準確識別的問題,亟需一種更為高效、準確的ai視覺檢測方法。通過改進圖像處理技術(shù)、優(yōu)化特征提取算法以及引入先進的深度學(xué)習(xí)模型等手段,有望實現(xiàn)對套袋物品的一次性訓(xùn)練識別,從而大大提高智能秤的識別效率和準確性,為超市等商業(yè)場景提供更加便捷、高效的自動化服務(wù)。
技術(shù)實現(xiàn)思路
1、為解決背景技術(shù)中存在的問題,本發(fā)明提供一種袋裝物體的ai視覺檢測方法,其包括如下的步驟:
2、s1、圖像獲取與轉(zhuǎn)換:
3、s11、獲取待檢測袋裝物體的第一圖像;
4、s12、將所述第一圖像從rgb色彩空間轉(zhuǎn)換到hsv色彩空間;
5、s13、獲取不含物體僅包含袋裝材料的第二圖像,并將所述第二圖像從rgb色彩空間轉(zhuǎn)換到hsv色彩空間;
6、s2、顏色剝離:
7、s21、對所述第一圖像和第二圖像在hsv色彩空間中的對應(yīng)像素值進行減法運算,生成顏色剝離后的圖像,得到第三圖像;
8、s22、將所述第三圖像從hsv色彩空間轉(zhuǎn)換回rgb色彩空間;
9、s3、袋子形狀處理:
10、s31、對顏色剝離后的圖像進行灰度值處理,通過計算灰度圖像中各個區(qū)域的中心點距離,識別并刪除距離最遠的不連續(xù)區(qū)域;
11、s32、深度篩選并刪除其余不連續(xù)區(qū)域,最終保留并提取出物體的最大連續(xù)區(qū)域,形成去掉袋子外形影響的物體圖像;
12、s4、圖像檢測:
13、對步驟s32得到的無袋物體圖像進行特征提取圖像的特征信息,并在全連接層輸出最終的圖像特征,利用這些特征信息進行物體的識別,得出物體的名稱。
14、優(yōu)選的方案中,步驟s4中,利用卷積神經(jīng)網(wǎng)絡(luò)cnn模型對無袋物體圖像進行圖像處理,卷積神經(jīng)網(wǎng)絡(luò)cnn模型中,經(jīng)過卷積層、激活函數(shù)、池化層的交替處理,提取圖像的特征信息。
15、優(yōu)選的方案中,卷積神經(jīng)網(wǎng)絡(luò)cnn模型包括:
16、輸入層,接收預(yù)處理后的物體圖像的輸入層;
17、卷積層1-卷積層3,每一層通過卷積操作提取圖像的不同層次的特征;
18、激活函數(shù)1-激活函數(shù)3,位于每卷積層之后,用于引入非線性因素,提高模型的表達能力;
19、池化層1-池化層3,通過池化操作減少參數(shù)數(shù)量和計算量,防止過擬合;
20、全連接層,將卷積層和池化層學(xué)到的特征進行非線性組合,以輸出最終的圖像特征。
21、優(yōu)選的方案中,步驟s4中的處理過程如下:
22、s41、輸入層接收預(yù)處理后的物體圖像;預(yù)處理后的圖像被傳遞到cnn的輸入層,準備進行進一步的處理;
23、s42、每一層卷積層通過卷積操作提取圖像的不同層次的特征;卷積操作通過卷積核在圖像上滑動,對每個局部區(qū)域進行加權(quán)求和;
24、卷積層1應(yīng)用多個不同的卷積核,在輸入圖像上進行卷積操作,提取出圖像的邊緣、紋理淺層特征,生成的特征圖作為下一層的輸入;卷積層2進一步對前一層的特征圖進行卷積操作,提取出深層特征;卷積層3繼續(xù)深入提取進行物體的識別和分類的圖像高級特征;
25、s43、激活函數(shù)1至激活函數(shù)3位于每卷積層之后,引入非線性因素,處理復(fù)雜的非線性關(guān)系,通過對卷積層的輸出應(yīng)用激活函數(shù),生成新的激活值,并作為下一層的輸入;
26、s44、通過池化層1至池化層3采用最大池化或平均池化方式,池化層1對卷積層1的輸出進行池化操作,減少數(shù)據(jù)維度,提取重要特征;池化層2對前一層的輸出繼續(xù)進行池化操作,進一步減少數(shù)據(jù)維度;池化層3為最終池化層,保留關(guān)鍵信息,同時減少計算量,提高模型的泛化能力;
27、s45、全連接層將卷積層和池化層學(xué)到的特征進行非線性組合,以輸出最終的圖像特征或分類結(jié)果;全連接層中的每個神經(jīng)元都與前一層的所有神經(jīng)元相連;全連接層將最后一層池化層的輸出展平,轉(zhuǎn)化為一維向量;將該向量輸入到全連接層中,通過加權(quán)求和和激活函數(shù)操作,得到最終的輸出結(jié)果;對于圖像識別任務(wù),輸出對各個類別的預(yù)測概率;對于特征提取任務(wù),輸出為提取到的圖像特征向量。
28、優(yōu)選的方案中,步驟s32中,采用膨脹和雕刻圖像處理技術(shù)進行處理。
29、優(yōu)選的方案中,步驟s32的具體過程包括:
30、s321、針對擴展圖像中前景物體的亮色區(qū)域采用膨脹處理操作,在處理過程中,將每個像素點的亮度值擴展至其周圍鄰域,如果鄰域中存在足夠亮的像素,則將該像素點視為前景的一部分;
31、s322、采用雕刻處理操作,縮小圖像中的亮色區(qū)域;去除邊緣的像素點,減少圖像中的噪聲和小的獨立區(qū)域;
32、s323、交替使用膨脹和雕刻進行形態(tài)學(xué)開運算,進一步去除由袋子褶皺、光線不均因素造成的不連續(xù)區(qū)域;
33、s324、篩選并刪除不連續(xù)區(qū)域,在形態(tài)學(xué)處理之后,對于仍然存在一些小的、不連續(xù)的區(qū)域,通過計算每個連續(xù)區(qū)域的面積、形狀、位置特征,篩選出不符合條件的小區(qū)域;刪除這些小區(qū)域,只保留最大的連續(xù)區(qū)域,即物體的主體部分;
34、s325、刪除了所有不連續(xù)區(qū)域后,剩下的就是物體的最大連續(xù)區(qū)域;將這個區(qū)域提取出來,作為最終的圖像處理結(jié)果。
35、優(yōu)選的方案中,s321的具體操作過程為:
36、s3211、選擇一個小的矩形或圓形結(jié)構(gòu)元素,用于定義膨脹操作的鄰域范圍;
37、s3212、將結(jié)構(gòu)元素在原圖像上滑動,對于每個位置,計算結(jié)構(gòu)元素覆蓋區(qū)域內(nèi)像素的最大值;
38、s3213、將這個最大值賦給結(jié)構(gòu)元素中心對應(yīng)的像素點;
39、s3214、膨脹處理后,物體的邊緣被向外擴展,小的孔洞和不連續(xù)區(qū)域被填充。
40、優(yōu)選的方案中,s322的具體操作過程為:
41、s3221、使用結(jié)構(gòu)元素在原圖像上滑動;
42、s3222、對于每個位置,計算結(jié)構(gòu)元素覆蓋區(qū)域內(nèi)像素的最小值;
43、s3223、將這個最小值賦給結(jié)構(gòu)元素中心對應(yīng)的像素點;
44、s3224、雕刻操作后,物體的邊緣被向內(nèi)收縮,一些小的突出部分和不重要的細節(jié)被去除。
45、本發(fā)明所達到的有益效果為:
46、第一、本發(fā)明通過顏色剝離和袋子形狀處理的處理步驟,使僅需對未套袋物品進行一次訓(xùn)練,就能準確識別出套袋和未套袋的同一物品,極大地減少了訓(xùn)練時間和成本,提高了智能秤等設(shè)備的使用效率和用戶體驗。
47、第二、本發(fā)明利用hsv色彩空間進行顏色剝離,有效去除了袋子顏色對物體識別的影響。通過灰度值處理、膨脹和雕刻等形態(tài)學(xué)操作,進一步去除了袋子褶皺、光線不均等因素造成的不連續(xù)區(qū)域,保留了物體的主要特征。這些預(yù)處理步驟顯著提升了圖像質(zhì)量,為后續(xù)的ai識別提供了更加清晰、準確的圖像數(shù)據(jù)。
48、第三、本發(fā)明采用卷積神經(jīng)網(wǎng)絡(luò)cnn模型的多層卷積層、激活函數(shù)和池化層的交替處理,提取了圖像的不同層次特征,并通過全連接層進行非線性組合,輸出了最終的圖像特征,不僅提高了模型的表達能力,還通過池化等操作減少了參數(shù)數(shù)量和計算量,防止了過擬合,確保了模型的高效性和準確性。
49、第四、本發(fā)明通過交替使用膨脹和雕刻進行形態(tài)學(xué)開運算,進一步去除了圖像中的噪聲和小的獨立區(qū)域。同時,通過計算每個連續(xù)區(qū)域的特征并篩選刪除不符合條件的小區(qū)域,最終保留了物體的最大連續(xù)區(qū)域。這一步驟有效提升了圖像識別的準確性和穩(wěn)定性。
50、第五、本發(fā)明采用了高效的圖像預(yù)處理技術(shù)和優(yōu)化的cnn模型,整個視覺檢測過程的時間大大縮短,算力使用效率也顯著提高,即使面對不同形狀、顏色、材質(zhì)的袋子以及復(fù)雜的環(huán)境光照條件,也能保持較高的識別穩(wěn)定性和準確性。本發(fā)明不僅降低了設(shè)備的使用成本,還提升了整體系統(tǒng)的響應(yīng)速度和穩(wěn)定性,顯著提高了對袋裝物體的識別準確率,增強了模型的泛化能力。