一種自動(dòng)的圖片訓(xùn)練樣本提取方法及系統(tǒng)的制作方法

文檔序號(hào)：9432678閱讀：995來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專利>計(jì)算;推算;計(jì)數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

一種自動(dòng)的圖片訓(xùn)練樣本提取方法及系統(tǒng)的制作方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明屬于圖像處理領(lǐng)域，具體設(shè)及一種自動(dòng)的圖片訓(xùn)練樣本提取方法及系統(tǒng)。
【背景技術(shù)】
[0002] 傳統(tǒng)的手工勞動(dòng)的方式在標(biāo)簽圖像方面對(duì)于大型數(shù)據(jù)集，百萬(wàn)的圖像集合加上圖片，需要一個(gè)團(tuán)隊(duì)的人，花費(fèi)幾周時(shí)間手動(dòng)標(biāo)簽運(yùn)些圖像中的每一個(gè)。
[0003] 在機(jī)器學(xué)習(xí)領(lǐng)域，人們普遍認(rèn)為提高模型預(yù)測(cè)精度的最有效的方法是提供更多準(zhǔn)確的，W及標(biāo)簽好的樣品來(lái)進(jìn)行模型訓(xùn)練。例如，一個(gè)用更多精確樣品訓(xùn)練出來(lái)的模型通常比具有較少樣品訓(xùn)練出來(lái)的模型更精確。該理論同樣的也適用于計(jì)算機(jī)視覺(jué)，更具體地說(shuō)，適用于作為機(jī)器學(xué)習(xí)分支的自動(dòng)圖像標(biāo)注。自動(dòng)圖像標(biāo)注是用已經(jīng)訓(xùn)練的模型，自動(dòng)檢測(cè)圖形的目標(biāo)或場(chǎng)景的方法。
[0004] 一般來(lái)講，用來(lái)做圖像識(shí)別模型訓(xùn)練樣本是由人標(biāo)記；例如，含有狗的圖像被貼上"狗"標(biāo)簽。然而，盡管標(biāo)記圖像的任務(wù)并不具有挑戰(zhàn)性，但是卻需要大量人力并且費(fèi)時(shí)。基于圖像認(rèn)知的深度學(xué)習(xí)的最近發(fā)展，需要數(shù)W百萬(wàn)計(jì)的照片培訓(xùn)具有可接受的精度自動(dòng)標(biāo)注系統(tǒng)。人工標(biāo)記如此大量圖像需要的時(shí)間和成本通常被描述為實(shí)現(xiàn)最先進(jìn)的自動(dòng)圖像標(biāo)注系統(tǒng)的瓶頸。
[0005] 電腦感知圖像與人類不同。對(duì)于電腦，一個(gè)圖像只是1和0的集合。為了從圖像中提取有用的信息，我們需要告訴計(jì)算機(jī)如何W-種有意義的、可重復(fù)的方式識(shí)別圖像并從圖像中提取內(nèi)容。運(yùn)個(gè)重要的過(guò)程被稱為圖像特征提取。我們的方法是使用特定的預(yù) 先確定的"規(guī)則"作為數(shù)字特征向量來(lái)表示圖像。特征提取傳統(tǒng)"規(guī)則"是顏色、邊緣和梯度。然而，深度學(xué)習(xí)的最新發(fā)展，如卷積神經(jīng)網(wǎng)絡(luò)（CNN)，與傳統(tǒng)方法相比，深度學(xué)習(xí)功能更強(qiáng)大、更具描述性。
[0006] 為了解決大量圖像集合"維數(shù)的巧咒"（化rseofDimensionality),我們借鑒了近似近鄰捜索領(lǐng)域方面的觀點(diǎn)。據(jù)證實(shí)，在很多案例中，近似近鄰方法在精確度方面跟蠻力方法基本一樣，但在速度上是蠻力方法的多倍。有鑒于此，利用局部敏感哈希算法（Locally SensitiveHashForest)能夠減少高維圖像數(shù)據(jù)維數(shù)。

【發(fā)明內(nèi)容】

[0007] 為了解決上述問(wèn)題，本發(fā)明一種自動(dòng)的圖片訓(xùn)練樣本提取方法及系統(tǒng)。本發(fā)明針對(duì)在大量的無(wú)標(biāo)記的圖像用來(lái)找到訓(xùn)練的圖像，本發(fā)明提出的方法能夠自動(dòng)檢索任何圖像集合中所需標(biāo)記的圖像，且檢索速度快、成本效益高。
[0008] 為達(dá)到上述目的，本發(fā)明采用的技術(shù)方案是：一種自動(dòng)的圖片訓(xùn)練樣本提取方法，包括W下幾個(gè)步驟： (1) 解析圖像集合中所有圖像內(nèi)容，得到圖像集合的所有圖像特征； (2) 儲(chǔ)存所述圖像特征，建立圖像知識(shí)庫(kù)； (3) 解析由客戶端給出的目標(biāo)圖像的內(nèi)容，得到目標(biāo)圖像特征； (4) 根據(jù)所述目標(biāo)圖像特征，在圖像知識(shí)庫(kù)中尋找相似圖像； (5) 返回相似圖像至用戶數(shù)據(jù)庫(kù)。
[0009] 其中，基于圖像視覺(jué)特征利用深度學(xué)習(xí)方法提取圖像特征。深度學(xué)習(xí)方法提取圖像特征W實(shí)現(xiàn)所提取圖像特征的可靠性和準(zhǔn)確度。
[0010] 進(jìn)一步的是，所述深度學(xué)習(xí)方法提取圖像特征，具體為，對(duì)于圖像集合中的每一個(gè) 圖像，提取1000個(gè)特征，并且每個(gè)特征代表一個(gè)圖像的特定方面。其中，無(wú)論圖像的大小或內(nèi)容，一個(gè)固定大小1000個(gè)數(shù)字永遠(yuǎn)用來(lái)表示圖像，W減少運(yùn)算量，提高運(yùn)算速率。
[0011] 進(jìn)一步的是，所述1000個(gè)特征的范圍為0到1。
[0012] 進(jìn)一步的是，所述步驟（2)中圖像特征的存儲(chǔ)，是通過(guò)局部敏感哈希算法，將同類型的圖像放入圖像知識(shí)庫(kù)中同一個(gè)儲(chǔ)存單元，運(yùn)意味運(yùn)只有屬于同一儲(chǔ)存單元的圖像才會(huì) 被檢查，W取代集合中的所有項(xiàng)目，W便快速訪問(wèn)和比較，提高查詢效率，利用局部敏感哈希算法來(lái)減少高維圖像數(shù)據(jù)維數(shù)，建立占用空間小的特征知識(shí)庫(kù)。
[0013] 進(jìn)一步的是，使用局部敏感哈希算法，存儲(chǔ)每個(gè)圖像1000個(gè)數(shù)字特征向量。
[0014] 進(jìn)一步的是，所述步驟（3 )具體為，根據(jù)視覺(jué)特征，解析所提供的目標(biāo)圖像內(nèi)容，使用深度學(xué)習(xí)方法提取圖像特征，同圖像集合中圖像特征提取方法相同。
[0015] 進(jìn)一步的是，所述步驟（4)具體為，利用余弦相似度算法尋找出相似圖像，余弦相似度的值越大意味著兩個(gè)圖像越視覺(jué)相似，為0時(shí)，表示運(yùn)兩個(gè)圖像完全不相關(guān)。
[0016] 另一方面，本發(fā)明還提供了一種自動(dòng)的圖片訓(xùn)練樣本提取的系統(tǒng)，包括：圖像集合解析模塊：解析圖像集合所有圖像內(nèi)容，得到圖像集合的所有圖像特征；圖像知識(shí)庫(kù)：用來(lái)存儲(chǔ)所述的圖像集合的圖像特征，建立圖像知識(shí)庫(kù)；目標(biāo)圖像解析模塊：用于接收客戶端給出的目標(biāo)圖像，并解析目標(biāo)圖像，得到目標(biāo)圖像特征；圖像查詢模塊：根據(jù)目標(biāo)圖像特征，在圖像知識(shí)庫(kù)中尋找相似圖像；圖像輸出模塊：將相似圖像返回客戶端；其中，圖像集合解析模塊輸入端口連接外部客戶端，圖像集合解析模塊輸出端口連接圖像知識(shí)庫(kù)輸入端口；目標(biāo)圖像解析模塊輸入端口連接外部客戶端；目標(biāo)圖像解析模塊輸出端口連接至圖像查詢模塊輸入端口；圖像查詢模塊輸入端口還連接有圖像知識(shí)庫(kù)的輸出端口，圖像查詢模塊輸出端口與圖像輸出模塊輸入端口相連接，圖像輸出模塊輸出端口與外部客戶端相連。
[0017] 采用本技術(shù)方案的有益效果：本發(fā)明所提出的一種自動(dòng)的圖片訓(xùn)練樣本提取方法及系統(tǒng)，能夠自動(dòng)檢索任何圖像集合中所需標(biāo)記的圖像；在處理大量圖像時(shí)，工作效率更高，運(yùn)為確定訓(xùn)練圖像提供了一個(gè)快速、高效的方式，W識(shí)別任何圖像類別的訓(xùn)練圖像，本方法基于已經(jīng)提供的圖像的視覺(jué)相似性，只要幾分鐘就可W將圖像依次排列；基于與提供的圖像視覺(jué)特征，本發(fā)明的方法可W快速找到觀察者不容易觀察到的圖像，并且運(yùn)些圖像并不必然屬于同一類別，但視覺(jué)上非常相似，靈活性較高。
【附圖說(shuō)明】
[0018] 圖1為本發(fā)明的方法流程圖；圖2為本發(fā)明的實(shí)施例中單個(gè)圖像特征提取的示意圖；圖3為本發(fā)明的實(shí)施例中多個(gè)圖像特征提取的示意圖；圖4為本發(fā)明的實(shí)施例中LSHF方法的示意圖；圖5為本發(fā)明的實(shí)施例中相似圖片特征提取的示意圖圖；圖6為本發(fā)明所述方法借助的系統(tǒng)結(jié)構(gòu)簡(jiǎn)圖。
【具體實(shí)施方式】
[0019] 為了使本發(fā)明的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚，下面結(jié)合附圖對(duì)本發(fā)明作進(jìn)一步闡述。
[0020] 參見(jiàn)圖1所示，一種自動(dòng)的圖片訓(xùn)練樣本提取方法，包括W下幾個(gè)步驟： (1)解析圖像集合中所有圖像內(nèi)容，得到圖像集合的所有圖像特征。
[0021] 具體為，對(duì)于圖像集合中的每個(gè)圖像，基于圖像視覺(jué)特征，解析運(yùn)些圖像，提取圖像特征。
[0022] 實(shí)施例中，如圖2所示，使用特定的預(yù)先確定的"規(guī)則"作為數(shù)字特征向量來(lái)表示圖像，數(shù)學(xué)上可W表示為： r= {>"K,，Kj，…，K。} 上述公式中，w表示圖像，Vi表示描述圖像的特征。
[

完整全部詳細(xì)技術(shù)資料下載

當(dāng)前第1頁(yè)1 2

該技術(shù)已申請(qǐng)專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：張一文;
技術(shù)所有人：成都品果科技有限公司;
我是此專利的發(fā)明人

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請(qǐng)點(diǎn)此查看客服電話進(jìn)行咨詢。
1、李老師：1.計(jì)算力學(xué) 2.無(wú)損檢測(cè)
2、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制
3、袁老師：1.計(jì)算機(jī)視覺(jué) 2.無(wú)線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計(jì)算機(jī)網(wǎng)絡(luò)安全 2.計(jì)算機(jī)仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢(shì)感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問(wèn)留言已有0條留言

還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

提取筆錄格式樣本相關(guān)技術(shù)

bp神經(jīng)網(wǎng)絡(luò)訓(xùn)練樣本相關(guān)技術(shù)

訓(xùn)練樣本和測(cè)試樣本相關(guān)技術(shù)

人臉識(shí)別訓(xùn)練樣本相關(guān)技術(shù)

訓(xùn)練樣本相關(guān)技術(shù)

国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

一種自動(dòng)的圖片訓(xùn)練樣本提取方法及系統(tǒng)的制作方法