本發(fā)明涉及圖像識(shí)別,特別是涉及一種基于ai圖像識(shí)別技術(shù)檢測(cè)重復(fù)或相似照片的方法。
背景技術(shù):
1、隨著數(shù)字技術(shù)的推廣應(yīng)用,越來(lái)越多的企業(yè)將數(shù)字化工具作為終端市場(chǎng)的管理抓手。在這種大背景下,必然產(chǎn)生大量的照片數(shù)據(jù),照片數(shù)據(jù)占用了大量存儲(chǔ)空間。為了識(shí)別這些重復(fù)或者相似的照片數(shù)據(jù),就需要檢查所有現(xiàn)有照片數(shù)據(jù),人工識(shí)別圖像中的特征從而判斷重復(fù)或相似照片從而進(jìn)行處理,處理速度與效率低下,對(duì)企業(yè)來(lái)說(shuō),如何保障處理照片數(shù)據(jù)的準(zhǔn)確性、真實(shí)性,是每一個(gè)企業(yè)管理數(shù)據(jù)資產(chǎn)未來(lái)要面臨的巨大挑戰(zhàn)。
技術(shù)實(shí)現(xiàn)思路
1、鑒于此,本發(fā)明為了解決技術(shù)背景中存在的問(wèn)題,提出了可以快速處理大量的圖像數(shù)據(jù),通過(guò)在短時(shí)間內(nèi)分析和提取出關(guān)鍵信息,從而越來(lái)越準(zhǔn)確的判斷照片之間的重復(fù)或相似度,大大提高了照片數(shù)據(jù)處理速度和效率的一種基于ai圖像識(shí)別技術(shù)檢測(cè)重復(fù)或相似照片的方法,具體技術(shù)方案如下:
2、一種基于ai圖像識(shí)別技術(shù)檢測(cè)重復(fù)或相似照片的方法,包括以下步驟:
3、步驟一,圖像預(yù)處理:對(duì)輸入的照片進(jìn)行預(yù)處理,包括圖像去噪、尺寸調(diào)整、顏色空間轉(zhuǎn)換等;
4、步驟二:圖像特征提?。和ㄟ^(guò)深度學(xué)習(xí)模型的結(jié)構(gòu)和參數(shù),進(jìn)一步提升特征提取的準(zhǔn)確性和效率,利用深度學(xué)習(xí)算法對(duì)預(yù)處理后的照片進(jìn)行特征提?。?/p>
5、步驟三:圖像相似度計(jì)算:結(jié)合多種特征信息后進(jìn)行計(jì)算能夠更好地識(shí)別照片之間的細(xì)微差別,同時(shí),通過(guò)設(shè)定恰當(dāng)?shù)拈撝?,可以判斷兩張照片是否重?fù)或相似;
6、本步驟使用卷積神經(jīng)網(wǎng)絡(luò)(cnn)深度學(xué)習(xí)模型進(jìn)行特征提取,然后通過(guò)歐氏距離計(jì)算提取的特征之間的相似度,即對(duì)于二維空間中的點(diǎn)a(x1,y1)和點(diǎn)b(x2,y2),它們之間的歐氏距離公式為:
7、[d(a,b)=\sqrt{(x?2-x1)^2+(y_2.y_1)^2}]
8、對(duì)于n維空間中的點(diǎn)a(x1,x2...,xn)和點(diǎn)b(y1,y2..yn),歐氏距離的一般公式為:
9、[d(a,b)=\sqrt{(x?2-x?1)^2+(x?3.x2)^2+\cdots+(x_n-x_{n-1})^2}]
10、或者更一般地,用向量的形式表示:
11、[d(a,b)=\sqrt{\sum{i=1}^{n}(a?i-b?i)^2};
12、其中,(ai)和(bi)分別是點(diǎn)a和點(diǎn)b的第i個(gè)坐標(biāo)分量,圖像轉(zhuǎn)換為特征向量,計(jì)算這些特征向量之間的相似度。
13、步驟四:結(jié)果輸出與展示:通過(guò)前端\ui\ux設(shè)計(jì)實(shí)現(xiàn),將識(shí)別結(jié)果以可視化的方式直觀展示給用戶,包括相似度得分、重復(fù)照片列表等信息。
14、進(jìn)一步的,所述步驟一圖像預(yù)處理包括去噪、尺寸調(diào)整以及顏色空間轉(zhuǎn)換,所述去噪去除圖像中的噪聲等雜質(zhì),提高圖像質(zhì)量,通過(guò)平均或中值濾波等方法手段減少圖像的細(xì)節(jié)和灰度變化,使圖像更平滑。
15、進(jìn)一步的,所述尺寸調(diào)整將圖像調(diào)整到統(tǒng)一的大小,具體方法:
16、首先,通過(guò)指定新的寬度和高度,或者通過(guò)指定縮放比例來(lái)調(diào)整圖像大??;其次,使用卷積核的步進(jìn)(stride),通過(guò)調(diào)整卷積操作的步長(zhǎng),可以在卷積神經(jīng)網(wǎng)絡(luò)中實(shí)現(xiàn)特征圖的下采樣或上采樣。再次,通過(guò)池化操作,最大池化或平均池化來(lái)減小特征圖的大小。
17、進(jìn)一步的,所述顏色空間轉(zhuǎn)換將圖像從一個(gè)顏色空間轉(zhuǎn)換到另一個(gè)顏色空間,以便更好地提取特征或進(jìn)行特定的圖像處理任務(wù)。rgb是最常用的顏色空間,適用于大多數(shù)彩色顯示設(shè)備;hsv(色調(diào)、飽和度和亮度),更符合人類對(duì)顏色的感知,常用于顏色識(shí)別和圖像分割;yuv將亮度(y)和色度(uv)分開(kāi)表示的顏色空間,常用于視頻編碼和傳輸。核心方法,使用opencv的cvtcolor()函數(shù)該函數(shù)允許將圖像從一種顏色空間轉(zhuǎn)換為另一種顏色空間。
18、進(jìn)一步的,所述特征提取包括圖像的紋理、顏色等信息,用于描述照片的內(nèi)容和屬性。
19、采用上述技術(shù)方案,具有如下有益效果:
20、本發(fā)明能夠快速識(shí)別出系統(tǒng)中相同或不同場(chǎng)景下存在的重復(fù)照片,還原業(yè)務(wù)的真實(shí)性,結(jié)合多種技術(shù),通過(guò)不同維度的篩選條件鎖定數(shù)據(jù)范圍,觸發(fā)識(shí)別后,aip接口調(diào)取模型算法,經(jīng)過(guò)計(jì)算分析,最終輸出相似度結(jié)果,大大提升了重復(fù)照片的識(shí)別效率。
21、本發(fā)明能夠快速處理大量的圖像數(shù)據(jù),通過(guò)高級(jí)算法和強(qiáng)大的計(jì)算能力,在短時(shí)間內(nèi)分析和提取出關(guān)鍵信息,大大提高了處理速度和效率,節(jié)省了用戶的時(shí)間,幫助企業(yè)降本增效;
22、隨著深度學(xué)習(xí)和訓(xùn)練的持續(xù)推進(jìn),ai算法能夠精確識(shí)別圖像中的特征和模式,從而越來(lái)越準(zhǔn)確的判斷照片之間的重復(fù)或相似度,這種準(zhǔn)確性在處理大量照片時(shí)尤為重要,能有效避免漏檢或誤檢的情況;
23、自動(dòng)分類和標(biāo)記相似或重復(fù)照片,圖像處理過(guò)程更加智能化,減少人工干預(yù),進(jìn)一步降低了人力成本,提高處理的真實(shí)性,幫助企業(yè)節(jié)省數(shù)據(jù)存儲(chǔ)的投入,通過(guò)檢測(cè)并刪除重復(fù)或相似的照片,用戶可以釋放大量的存儲(chǔ)空間,使得云服務(wù)或設(shè)備投入更少,存儲(chǔ)利用率更高。
1.一種基于ai圖像識(shí)別技術(shù)檢測(cè)重復(fù)或相似照片的方法,其特征在于,包括以下步驟:
2.根據(jù)權(quán)利要求1所述的一種基于ai圖像識(shí)別技術(shù)檢測(cè)重復(fù)或相似照片的方法,其特征在于,所述步驟一圖像預(yù)處理包括去噪、尺寸調(diào)整以及顏色空間轉(zhuǎn)換,所述去噪去除圖像中的噪聲等雜質(zhì),提高圖像質(zhì)量,通過(guò)平均或中值濾波等方法手段減少圖像的細(xì)節(jié)和灰度變化,使圖像更平滑。
3.根據(jù)權(quán)利要求2所述的一種基于ai圖像識(shí)別技術(shù)檢測(cè)重復(fù)或相似照片的方法,其特征在于,所述尺寸調(diào)整將圖像調(diào)整到統(tǒng)一的大小,具體方法:
4.根據(jù)權(quán)利要求2所述的一種基于ai圖像識(shí)別技術(shù)檢測(cè)重復(fù)或相似照片的方法,其特征在于,所述顏色空間轉(zhuǎn)換將圖像從一個(gè)顏色空間轉(zhuǎn)換到另一個(gè)顏色空間,以便更好地提取特征或進(jìn)行特定的圖像處理任務(wù)。rgb是最常用的顏色空間,適用于大多數(shù)彩色顯示設(shè)備;hsv,更符合人類對(duì)顏色的感知,常用于顏色識(shí)別和圖像分割;yuv將亮度(y)和色度(uv)分開(kāi)表示的顏色空間,常用于視頻編碼和傳輸,使用opencv的cvtcolor()函數(shù)該函數(shù)允許將圖像從一種顏色空間轉(zhuǎn)換為另一種顏色空間。
5.根據(jù)權(quán)利要求1所述的一種基于ai圖像識(shí)別技術(shù)檢測(cè)重復(fù)或相似照片的方法,其特征在于,所述特征提取包括圖像的紋理、顏色等信息,用于描述照片的內(nèi)容和屬性。