本發(fā)明屬于計算機視覺,具體涉及一種基于偽標(biāo)簽松弛對比損失的含噪聲腸道超聲圖像分類方法和系統(tǒng)。
背景技術(shù):
1、深度神經(jīng)網(wǎng)絡(luò)(deep?neural?networks,dnn)在計算機視覺領(lǐng)域受到廣泛應(yīng)用,但是dnn的訓(xùn)練需要大量含有準(zhǔn)確標(biāo)簽的圖像的支持,而這類圖像的標(biāo)注需要借助領(lǐng)域?qū)<业慕?jīng)驗進行。
2、在超聲腸道圖像數(shù)據(jù)集收集過程中,雖然各類醫(yī)院診所積累了大量的腸道圖像數(shù)據(jù),但是由于缺少標(biāo)注專家,這類樣本往往具有不準(zhǔn)確的標(biāo)簽(噪聲標(biāo)簽),而噪聲標(biāo)簽樣本易使dnn過擬合,導(dǎo)致dnn判別性能和泛化性能的降低。
技術(shù)實現(xiàn)思路
1、本發(fā)明的目的在于克服現(xiàn)有技術(shù)中的不足,提供一種基于偽標(biāo)簽松弛對比損失的含噪聲腸道超聲圖像分類方法和系統(tǒng),能夠利用偽標(biāo)簽松弛對比損失來提高dnn模型面對含噪聲標(biāo)簽的腸道超聲圖像集時的測試性能和魯棒性能,從而節(jié)約專家標(biāo)注成本。
2、本發(fā)明提供了如下的技術(shù)方案:
3、第一方面,提供一種基于偽標(biāo)簽松弛對比損失的含噪聲腸道超聲圖像分類方法,包括以下步驟:
4、s1:基于原始含噪聲腸道超聲圖像數(shù)據(jù)集,對兩個dnn模型進行溫和訓(xùn)練;
5、s2:分別利用每個dnn模型,對原始含噪聲腸道超聲圖像數(shù)據(jù)集進行劃分,以獲取與當(dāng)前dnn模型對應(yīng)的有標(biāo)簽集合和無標(biāo)簽集合;
6、s3:使用半監(jiān)督學(xué)習(xí)和偽標(biāo)簽松弛對比學(xué)習(xí)的方式,分別對兩個dnn模型進行魯棒訓(xùn)練,以更新兩個dnn模型;在對第一個dnn模型進行魯棒訓(xùn)練時,基于第二個dnn模型劃分的有標(biāo)簽集合和無標(biāo)簽集合,在對第二個dnn模型進行魯棒訓(xùn)練時,基于第一個dnn模型劃分的有標(biāo)簽集合和無標(biāo)簽集合;
7、s4:重復(fù)執(zhí)行步驟s2-s3,直至達到預(yù)設(shè)的訓(xùn)練總輪次,并輸出最終的dnn模型,以利用最終的dnn模型進行含噪聲腸道超聲圖像的分類。
8、可選地,步驟s3中,使用半監(jiān)督學(xué)習(xí)和偽標(biāo)簽松弛對比學(xué)習(xí)的方式,對當(dāng)前的dnn模型進行魯棒訓(xùn)練,以更新當(dāng)前dnn模型,包括:
9、基于有標(biāo)簽集合和無標(biāo)簽集合,計算所有樣本的ssl損失;
10、使用映射頭,將提取的高維特征映射到低維空間,形成低維特征;
11、基于映射后的低維特征,對于有標(biāo)簽集合和無標(biāo)簽集合中的所有樣本,計算松弛對比損失;
12、結(jié)合所有樣本的ssl損失和松弛對比損失,計算總損失,并根據(jù)總損失進行反向傳播和模型參數(shù)更新,以更新當(dāng)前dnn模型。
13、可選地,所述基于映射后的低維特征,對于有標(biāo)簽集合和無標(biāo)簽集合中的所有樣本,計算松弛對比損失時,需要構(gòu)建負樣本集合;
14、所述構(gòu)建負樣本集合包括:
15、對于樣本xi,假設(shè)其預(yù)測結(jié)果向量;
16、根據(jù)樣本xi的預(yù)測結(jié)果向量,找出預(yù)測結(jié)果中概率最大的前k個分量所對應(yīng)的索引
17、將所有觀測標(biāo)簽不等于給定標(biāo)簽且預(yù)測結(jié)果中概率最大的前k個分量所對應(yīng)的索引和樣本xi對應(yīng)索引沒有交集的樣本的集合,作為負樣本集合;
18、所述負樣本集合ni的公式為:
19、
20、其中,為預(yù)測結(jié)果中概率最大的前k個分量中樣本xj所對應(yīng)的索引,為樣本xi對應(yīng)的索引;
21、所述松弛對比損失lplr為:
22、
23、其中,為原始含噪聲腸道超聲圖像數(shù)據(jù)集的數(shù)量,是樣本xi經(jīng)過變換增強后,被映射頭映射后的低維特征,為經(jīng)過另一種增強后的低維特征,τ為預(yù)設(shè)的銳化參數(shù),為負樣本集合的低維特征集合。
24、可選地,所述ssl損失lssl為:
25、
26、其中,為通過編號為m的dnn模型劃分的有標(biāo)簽集合,為使用編號為m的dnn模型劃分的無標(biāo)簽集合,ll為基于有標(biāo)簽集合的分類損失,lul為基于無標(biāo)簽集合的分類損失,lreg為正則損失,λu為預(yù)設(shè)的權(quán)重系數(shù)。
27、可選地,步驟s1中,使用交叉損失函數(shù),對兩個dnn模型進行溫和訓(xùn)練;所述兩個dnn模型的結(jié)構(gòu)一致且初始化參數(shù)不一致;
28、所述交叉損失函數(shù)lce為:
29、
30、其中,pm(xi)為編號為m的dnn模型基于超聲圖像xi的輸出值,xi為第i個超聲圖像,m取值為1或者2,n為原始含噪聲腸道超聲圖像數(shù)據(jù)集中樣本個數(shù),yi為超聲圖像xi的觀測標(biāo)簽。
31、可選地,步驟s2中,所述對原始含噪聲腸道超聲圖像數(shù)據(jù)集進行劃分,以獲取與當(dāng)前dnn模型對應(yīng)的有標(biāo)簽集合和無標(biāo)簽集合,包括:
32、計算原始含噪聲腸道超聲圖像數(shù)據(jù)集中所有樣本在當(dāng)前dnn模型下的jsd損失值;
33、根據(jù)每個樣本的類別,將jsd損失值劃分為c個子集,并將每個子集中的jsd損失值以升序的方式進行排序;
34、計算每個子集中需要挑選出的樣本數(shù)量r;
35、對所有子集均進行樣本的劃分,以獲取與當(dāng)前dnn模型對應(yīng)的有標(biāo)簽集合和無標(biāo)簽集合;
36、對當(dāng)前子集進行樣本劃分包括:判斷當(dāng)前子集的樣本數(shù)量是否大于需要挑選出的樣本數(shù)量r,若是,則將當(dāng)前子集的前r個樣本放入有標(biāo)簽集合,其余部分放入無標(biāo)簽集合;否則,則將當(dāng)前子集的所有樣本放入有標(biāo)簽集合。
37、可選地,所述計算原始含噪聲腸道超聲圖像數(shù)據(jù)集中所有樣本在當(dāng)前dnn模型下的jsd損失值的公式為:
38、
39、其中,dim為第i個樣本在編號為m的dnn模型下的jsd損失值,為腸道超聲圖像xi的觀測標(biāo)簽,pm(xi)編號為m的dnn模型基于超聲圖像xi的輸出值;jsd(·)為jensen–shannon?divergence函數(shù);
40、所述計算每個子集中需要挑選出的樣本數(shù)量r的公式為:
41、
42、其中,r為需要挑選出的樣本數(shù)量,r為原始含噪聲腸道超聲圖像數(shù)據(jù)集的噪聲比例,c為jsd損失值劃分的子集數(shù)量,n為原始含噪聲腸道超聲圖像數(shù)據(jù)集的樣本數(shù)量。
43、第二方面,提供一種基于偽標(biāo)簽松弛對比損失的含噪聲腸道超聲圖像分類系統(tǒng),包括:
44、溫和訓(xùn)練模塊,用于基于原始含噪聲腸道超聲圖像數(shù)據(jù)集,對兩個dnn模型進行溫和訓(xùn)練;
45、集合劃分模塊,用于分別利用每個dnn模型,對原始含噪聲腸道超聲圖像數(shù)據(jù)集進行劃分,以獲取與當(dāng)前dnn模型對應(yīng)的有標(biāo)簽集合和無標(biāo)簽集合;
46、魯棒訓(xùn)練模塊,用于使用半監(jiān)督學(xué)習(xí)和偽標(biāo)簽松弛對比學(xué)習(xí)的方式,分別對兩個dnn模型進行魯棒訓(xùn)練,以更新兩個dnn模型;在對第一個dnn模型進行魯棒訓(xùn)練時,基于第二個dnn模型劃分的有標(biāo)簽集合和無標(biāo)簽集合,在對第二個dnn模型進行魯棒訓(xùn)練時,基于第一個dnn模型劃分的有標(biāo)簽集合和無標(biāo)簽集合;
47、重復(fù)執(zhí)行模塊,用于反饋至集合劃分模塊和魯棒訓(xùn)練模塊,直至達到預(yù)設(shè)的訓(xùn)練總輪次,并輸出最終的dnn模型,以利用最終的dnn模型進行含噪聲腸道超聲圖像的分類。
48、第三方面,提供一種計算機設(shè)備,包括處理器和存儲器;其中,處理器執(zhí)行存儲器中保存的計算機程序時實現(xiàn)第一方面任一項所述的基于偽標(biāo)簽松弛對比損失的含噪聲腸道超聲圖像分類方法的步驟。
49、第四方面,提供一種計算機可讀存儲介質(zhì),用于存儲計算機程序;計算機程序被處理器執(zhí)行時實現(xiàn)第一方面任一項所述的基于偽標(biāo)簽松弛對比損失的含噪聲腸道超聲圖像分類方法的步驟。
50、與現(xiàn)有技術(shù)相比,本發(fā)明的有益效果是:
51、(1)本發(fā)明提出一種基于偽標(biāo)簽松弛對比損失的含噪聲腸道超聲圖像分類方法和系統(tǒng),能夠利用偽標(biāo)簽松弛對比損失來提高dnn模型面對含噪聲標(biāo)簽的腸道超聲圖像集時的測試性能和魯棒性能,從而節(jié)約專家進行含噪聲腸道超聲圖像分類的成本。
52、(2)本發(fā)明將均衡選擇策略和偽標(biāo)簽松弛對比損失結(jié)合,從而進一步地提高了dnn模型面對含噪聲標(biāo)簽的腸道超聲圖像集時的測試性能和魯棒性能。