一種通過碎片交互訓(xùn)練機(jī)器學(xué)習(xí)圖像識別算法模型的方法
【專利摘要】本發(fā)明提供一種通過碎片交互訓(xùn)練機(jī)器學(xué)習(xí)圖像識別算法模型的方法,其步驟如下:設(shè)置n張已知的圖片,對每一張已知圖片都對其進(jìn)行文字匹配,以組成一組,同時每組與需要進(jìn)行識別的圖片進(jìn)行隨機(jī)分組;識圖、選圖;將結(jié)果識別結(jié)果反饋到圖像識別的機(jī)器學(xué)習(xí)算法中,對比算法的輸出結(jié)果,如果算法的輸出結(jié)果與通過評測系統(tǒng)獲得的確認(rèn)結(jié)果一致,則認(rèn)為算法正確一次;當(dāng)算法獲得的正確次數(shù)達(dá)到預(yù)定要求時,則認(rèn)為算法模型已經(jīng)訓(xùn)練完成。利用碎片交互,增加了訓(xùn)練機(jī)器學(xué)習(xí)算法的樣本,可以快速對機(jī)器學(xué)習(xí)圖像識別算法進(jìn)行參數(shù)調(diào)整;可以保證算法的精確性和穩(wěn)定性;本算法訓(xùn)練方式將大量的碎片交互利用了起來,減少了用戶的交互浪費(fèi)。
【專利說明】
一種通過碎片交互訓(xùn)練機(jī)器學(xué)習(xí)圖像識別算法模型的方法
技術(shù)領(lǐng)域
[0001]本發(fā)明涉及計(jì)算機(jī)領(lǐng)域,尤其涉及一種通過碎片交互訓(xùn)練機(jī)器學(xué)習(xí)圖像識別算法模型的方法。
【背景技術(shù)】
[0002]當(dāng)下手機(jī)、平板、PC游戲非常流行,每天通過游戲可以產(chǎn)生大量的交互樣本,這些樣本可以用來訓(xùn)練圖像識別的機(jī)器學(xué)習(xí)算法,以修正模型的參數(shù)。
【發(fā)明內(nèi)容】
[0003]為了解決現(xiàn)有技術(shù)中問題,本發(fā)明提供了一種通過碎片交互訓(xùn)練機(jī)器學(xué)習(xí)圖像識別算法模型的方法,其步驟如下:
第一步:設(shè)置η張已知的圖片,對每一張已知圖片都對其進(jìn)行文字匹配,以組成一組,同時每組與需要進(jìn)行識別的圖片進(jìn)行隨機(jī)分組;
第二步:識圖、選圖,每一個用戶需要選出兩張和文字對應(yīng)的圖片,首先,將分配好的已知圖片和對應(yīng)的匹配文字分開,已知圖片隨機(jī)混入未知圖片中,用戶必須將標(biāo)題文字對應(yīng)的已知匹配圖片識別出來,系統(tǒng)才將本次識別結(jié)果視為有效,那么評測系統(tǒng)將另一張用戶選擇出來的圖片視為和已知圖片內(nèi)容一致;由于未知圖片中可能存在與文字完全不匹配的情況,所以如果未知圖片中沒有與文字匹配的,所以需要設(shè)置零匹配機(jī)制,即初步認(rèn)為這組未知圖片中沒有任何圖片與已知圖片一致,此處的零匹配機(jī)制需要先將已知圖片與已知文字匹配,用戶再選擇無匹配結(jié)果,才進(jìn)入零匹配機(jī)制;
在第二步中,對未知圖片形成了一個分類操作,如果用戶將已知的圖片和已知的文字匹配成功;則認(rèn)為此時用戶進(jìn)行了認(rèn)真的操作,用戶第二張選出的圖片則和已知文字匹配;經(jīng)過第一步和第二步的操作,系統(tǒng)對未知圖片進(jìn)行了分類,同時將產(chǎn)生兩個結(jié)果:(I)從未知圖片庫中找到一張與已知圖片一類的圖片;(2)所有的圖片都和已知的圖片都不屬于同一類;
第三步:當(dāng)通過評測系統(tǒng)(如游戲)確定了某張未知圖片的內(nèi)容時,將結(jié)果識別結(jié)果反饋到圖像識別的機(jī)器學(xué)習(xí)算法中,對比算法的輸出結(jié)果,如果算法的輸出結(jié)果與通過評測系統(tǒng)獲得的確認(rèn)結(jié)果一致,則認(rèn)為算法正確一次;否則,提示認(rèn)為算法的輸出結(jié)果不準(zhǔn)確,調(diào)整參數(shù)繼續(xù)訓(xùn)練;當(dāng)算法獲得的正確次數(shù)達(dá)到預(yù)定要求時,則認(rèn)為算法模型已經(jīng)訓(xùn)練完成。
[0004]作為本發(fā)明的進(jìn)一步改進(jìn),第一步中,一組分配至少5張需要識別的圖片。
[0005]作為本發(fā)明的進(jìn)一步改進(jìn),第一步中,一組分配至少9張需要識別的圖片。
[0006]作為本發(fā)明的進(jìn)一步改進(jìn),所述η取值大于5000。
[0007]作為本發(fā)明的進(jìn)一步改進(jìn),所述η取值大于10000。
[0008]作為本發(fā)明的進(jìn)一步改進(jìn),對于同一張圖片,設(shè)置2/3確認(rèn)機(jī)制,即一種照片被確定為某個內(nèi)容時,需要經(jīng)過3個人中至少2個人確認(rèn)為某內(nèi)容時。
[0009]作為本發(fā)明的進(jìn)一步改進(jìn),對于同一張圖片,設(shè)置3/5確認(rèn)機(jī)制,即一種照片被確定為某個內(nèi)容時,需要經(jīng)過5個人中至少3個人確認(rèn)為某內(nèi)容時。
[0010]作為本發(fā)明的進(jìn)一步改進(jìn),對于同一張圖片,設(shè)置4/7確認(rèn)機(jī)制,即一種照片被確定為某個內(nèi)容時,需要經(jīng)過7個人中至少4個人確認(rèn)為某內(nèi)容時。
[0011 ]作為本發(fā)明的進(jìn)一步改進(jìn),當(dāng)算法獲得的正確率為99%時,則認(rèn)為算法模型已經(jīng)訓(xùn)練完成。
[0012]作為本發(fā)明的進(jìn)一步改進(jìn),當(dāng)算法獲得的正確率為99.99%時,則認(rèn)為算法模型已經(jīng)訓(xùn)練完成。
[0013]本發(fā)明的有益效果是:
采用本申請的算法思路,可以讓具有識字、識圖能力的小孩或者家長參與到游戲中,在游戲中既增加了孩子的識字能力,綜合了趣味性和科學(xué)訓(xùn)練一體圖像識別算法。
[0014]利用碎片交互,增加了訓(xùn)練機(jī)器學(xué)習(xí)算法的樣本,可以快速對機(jī)器學(xué)習(xí)圖像識別算法進(jìn)行參數(shù)調(diào)整;可以保證算法的精確性和穩(wěn)定性;本算法訓(xùn)練方式將大量的碎片交互利用了起來,減少了用戶的交互浪費(fèi)。本算法的實(shí)現(xiàn)方式非常簡單,提供了未來游戲設(shè)計(jì)者在游戲進(jìn)行初步設(shè)計(jì)時的新思路。
【具體實(shí)施方式】
[0015]下面對本發(fā)明做進(jìn)一步說明。
[0016]一種通過碎片交互訓(xùn)練機(jī)器學(xué)習(xí)圖像識別算法模型的方法,其步驟如下:
第一步:需要設(shè)置n(n—般大于10000張)張已知的圖片,對每一張已知圖片都對其進(jìn)行文字匹配(如一張已知內(nèi)容為桌子的圖片和文字“桌子”進(jìn)行匹配),以組成一組,同時每組與需要進(jìn)行分辨的圖片進(jìn)行隨機(jī)分組,一般一組分配9張或者更多需要識別的圖片;
第二步:游戲玩家識圖、選圖。游戲規(guī)則:每一個用戶需要選出兩張和文字對應(yīng)的圖片。首先,將分配好的已知圖片和對應(yīng)的匹配文字分開,已知圖片隨機(jī)混入未知圖片中,游戲玩家必須將標(biāo)題文字對應(yīng)的已知匹配圖片識別出來,系統(tǒng)才將本次游戲結(jié)果視為有效,那么評測系統(tǒng)也會將另一張用戶選擇出來的圖片視為和已知圖片內(nèi)容一致(如果游戲提示要求用戶選出為“桌子”的圖片,同時用戶也將已知的內(nèi)容為桌子選了出來,那么,我們也認(rèn)為圖片內(nèi)容未知的另一張圖片的內(nèi)容也為桌子);由于未知圖片中可能存在與文字完全不匹配的情況,所以如果未知圖片中沒有與文字匹配的,所以需要設(shè)置零匹配機(jī)制,即初步認(rèn)為這組未知圖片中沒有任何圖片與已知圖片一致。此處的零匹配機(jī)制需要先將已知圖片與已知文字匹配,游戲玩家再選擇無匹配結(jié)果,才進(jìn)入零匹配機(jī)制。
[0017]在第二步中,對未知圖片形成了一個分類操作。如果游戲玩家將已知的圖片和已知的文字匹配成功;我們則認(rèn)為此時游戲玩家進(jìn)行了認(rèn)真的操作,用戶第二張選出的圖片則和已知文字匹配。
[0018]經(jīng)過第一步和第二步的操作,我們對未知圖片進(jìn)行了分類,同時將產(chǎn)生兩個結(jié)果:
(I)從未知圖片庫中找到一張與已知圖片一類的圖片;(2)所有的圖片都和已知的圖片都不屬于同一類。
[0019]校正機(jī)制:一般情況下,用戶或多或少有誤操作,所以,對于同一張圖片,我們設(shè)置2/3確認(rèn)機(jī)制。即一種照片被確定為某個內(nèi)容時,需要經(jīng)過3個人中至少2個人確認(rèn)為某內(nèi)容時。
[0020]當(dāng)通過游戲確定了某張未知圖片的內(nèi)容時,將結(jié)果識別結(jié)果反饋到圖像識別的機(jī)器學(xué)習(xí)算法中,對比算法的輸出結(jié)果。如果算法的輸出結(jié)果與通過評測系統(tǒng)獲得的確認(rèn)結(jié)果一致,則認(rèn)為算法正確一次;否則,提示認(rèn)為算法的輸出結(jié)果不準(zhǔn)確,調(diào)整參數(shù)繼續(xù)訓(xùn)練。[0021 ]當(dāng)算法獲得的正確次數(shù)為率為99.99%( 10000次測試中,僅出現(xiàn)一次失誤)時,則認(rèn)為算法模型已經(jīng)訓(xùn)練完成。
[0022]以上內(nèi)容是結(jié)合具體的優(yōu)選實(shí)施方式對本發(fā)明所作的進(jìn)一步詳細(xì)說明,不能認(rèn)定本發(fā)明的具體實(shí)施只局限于這些說明。對于本發(fā)明所屬技術(shù)領(lǐng)域的普通技術(shù)人員來說,在不脫離本發(fā)明構(gòu)思的前提下,還可以做出若干簡單推演或替換,都應(yīng)當(dāng)視為屬于本發(fā)明的保護(hù)范圍。
【主權(quán)項(xiàng)】
1.一種通過碎片交互訓(xùn)練機(jī)器學(xué)習(xí)圖像識別算法模型的方法,其特征在于:其步驟如下: 第一步:設(shè)置η張已知的圖片,對每一張已知圖片都對其進(jìn)行文字匹配,以組成一組,同時每組與需要進(jìn)行識別的圖片進(jìn)行隨機(jī)分組; 第二步:識圖、選圖,每一個用戶需要選出兩張和文字對應(yīng)的圖片,首先,將分配好的已知圖片和對應(yīng)的匹配文字分開,已知圖片隨機(jī)混入未知圖片中,用戶必須將標(biāo)題文字對應(yīng)的已知匹配圖片識別出來,系統(tǒng)才將本次識別結(jié)果視為有效,那么評測系統(tǒng)將另一張用戶選擇出來的圖片視為和已知圖片內(nèi)容一致;由于未知圖片中可能存在與文字完全不匹配的情況,所以如果未知圖片中沒有與文字匹配的,所以需要設(shè)置零匹配機(jī)制,即初步認(rèn)為這組未知圖片中沒有任何圖片與已知圖片一致,此處的零匹配機(jī)制需要先將已知圖片與已知文字匹配,用戶再選擇無匹配結(jié)果,才進(jìn)入零匹配機(jī)制; 在第二步中,對未知圖片形成了一個分類操作,如果用戶將已知的圖片和已知的文字匹配成功;則認(rèn)為此時用戶進(jìn)行了認(rèn)真的操作,用戶第二張選出的圖片則和已知文字匹配; 經(jīng)過第一步和第二步的操作,系統(tǒng)對未知圖片進(jìn)行了分類,同時將產(chǎn)生兩個結(jié)果:(I)從未知圖片庫中找到一張與已知圖片一類的圖片;(2)所有的圖片都和已知的圖片都不屬于同一類; 第三步:當(dāng)通過評測系統(tǒng)(比如游戲)確定了某張未知圖片的內(nèi)容時,將結(jié)果識別結(jié)果反饋到圖像識別的機(jī)器學(xué)習(xí)算法中,對比算法的輸出結(jié)果,如果算法的輸出結(jié)果與通過游戲獲得的確認(rèn)結(jié)果一致,則認(rèn)為算法正確一次;否則,提示認(rèn)為算法的輸出結(jié)果不準(zhǔn)確,調(diào)整參數(shù)繼續(xù)訓(xùn)練;當(dāng)算法獲得的正確次數(shù)達(dá)到預(yù)定要求時,則認(rèn)為算法模型已經(jīng)訓(xùn)練完成。2.根據(jù)權(quán)利要求1所述的一種通過碎片交互訓(xùn)練機(jī)器學(xué)習(xí)圖像識別算法模型的方法,其特征在于:第一步中,一組分配至少5張需要識別的圖片。3.根據(jù)權(quán)利要求2所述的一種通過碎片交互訓(xùn)練機(jī)器學(xué)習(xí)圖像識別算法模型的方法,其特征在于:第一步中,一組分配至少9張需要識別的圖片。4.根據(jù)權(quán)利要求1所述的一種通過碎片交互訓(xùn)練機(jī)器學(xué)習(xí)圖像識別算法模型的方法,其特征在于:所述η取值大于5000。5.根據(jù)權(quán)利要求4所述的一種通過碎片交互訓(xùn)練機(jī)器學(xué)習(xí)圖像識別算法模型的方法,其特征在于:所述η取值大于10000。6.根據(jù)權(quán)利要求1所述的一種通過碎片交互訓(xùn)練機(jī)器學(xué)習(xí)圖像識別算法模型的方法,其特征在于:對于同一張圖片,設(shè)置2/3確認(rèn)機(jī)制,即一種照片被確定為某個內(nèi)容時,需要經(jīng)過3個人中至少2個人確認(rèn)為某內(nèi)容時。7.根據(jù)權(quán)利要求1所述的一種通過碎片交互訓(xùn)練機(jī)器學(xué)習(xí)圖像識別算法模型的方法,其特征在于:對于同一張圖片,設(shè)置3/5確認(rèn)機(jī)制,即一種照片被確定為某個內(nèi)容時,需要經(jīng)過5個人中至少3個人確認(rèn)為某內(nèi)容時。8.根據(jù)權(quán)利要求1所述的一種通過碎片交互訓(xùn)練機(jī)器學(xué)習(xí)圖像識別算法模型的方法,其特征在于:對于同一張圖片,設(shè)置4/7確認(rèn)機(jī)制,即一種照片被確定為某個內(nèi)容時,需要經(jīng)過7個人中至少4個人確認(rèn)為某內(nèi)容時。9.根據(jù)權(quán)利要求1所述的一種通過碎片交互訓(xùn)練機(jī)器學(xué)習(xí)圖像識別算法模型的方法,其特征在于:當(dāng)算法獲得的正確率為99%時,則認(rèn)為算法模型已經(jīng)訓(xùn)練完成。10.根據(jù)權(quán)利要求9所述的一種通過碎片交互訓(xùn)練機(jī)器學(xué)習(xí)圖像識別算法模型的方法,其特征在于:當(dāng)算法獲得的正確率為99.99%時,則認(rèn)為算法模型已經(jīng)訓(xùn)練完成。
【文檔編號】G06K9/62GK106067040SQ201610381675
【公開日】2016年11月2日
【申請日】2016年6月1日 公開號201610381675.4, CN 106067040 A, CN 106067040A, CN 201610381675, CN-A-106067040, CN106067040 A, CN106067040A, CN201610381675, CN201610381675.4
【發(fā)明人】龔莉杰, 程忠光, 張猛
【申請人】深圳市寒武紀(jì)智能科技有限公司