本發(fā)明涉及計(jì)算機(jī),尤其涉及一種基于并行是非分類的多類別圖像分類方法及裝置。
背景技術(shù):
1、圖像分類任務(wù)發(fā)展的早期階段,涌現(xiàn)了一系列傳統(tǒng)機(jī)器學(xué)習(xí)圖像分類方法,k-近鄰算法、svm、決策樹等,該類方法統(tǒng)稱為傳統(tǒng)機(jī)器學(xué)習(xí)圖像分類方法。以svm為例,svm的全稱是支持向量機(jī),是一種常見的監(jiān)督學(xué)習(xí)算法,旨在將輸入數(shù)據(jù)分成不同的類別,其基本思想是通過尋找一個(gè)能夠?qū)⒉煌悇e的數(shù)據(jù)分隔開的超平面來進(jìn)行分類。svm算法最早由vapnik等人在1995年提出,并在之后的幾十年中得到了廣泛應(yīng)用。該svm具有以下優(yōu)點(diǎn):在處理高維數(shù)據(jù)時(shí)表現(xiàn)優(yōu)異,適合處理圖像數(shù)據(jù)等復(fù)雜數(shù)據(jù);能夠處理非線性數(shù)據(jù),并且不容易陷入局部最優(yōu)解;以及具有較好的泛化能力,對于小樣本數(shù)據(jù)集也能夠表現(xiàn)出較好的分類效果。但是svm在處理大規(guī)模數(shù)據(jù)集時(shí)計(jì)算復(fù)雜度比較高,訓(xùn)練時(shí)間比較長,并且對于參數(shù)的選擇較為敏感,需要進(jìn)行多次調(diào)參;此外,一般來說svm只能處理二分類問題,對于總類別數(shù)為多個(gè)的問題不太適用;并且在處理圖像、視頻等非線性數(shù)據(jù)時(shí)需要對核函數(shù)進(jìn)行多次嘗試,選擇不當(dāng)會(huì)影響分類效果。
2、與svm類似的,早期的傳統(tǒng)機(jī)器學(xué)習(xí)圖像分類方法均存在著無法完成圖像的多分類任務(wù)的技術(shù)問題,基于此,krizhevsky等人在2012年研究了一種alexnet模型。alexnet模型在ilsvrc?2012競賽中折桂,分類準(zhǔn)確率達(dá)到了80%以上,極大地促進(jìn)了圖像分類任務(wù)的發(fā)展;在此基礎(chǔ)上,又相繼涌現(xiàn)了vgg、googlenet、resnet等一系列圖像分類模型。這類模型的結(jié)構(gòu)一般都是由卷積層、池化層、全連接層堆疊而成,輔以dropout、batchnormalization、殘差連接等技術(shù);由于網(wǎng)絡(luò)結(jié)構(gòu)的相似性,將該類模型統(tǒng)稱為基于深度學(xué)習(xí)的圖像分類模型。
3、現(xiàn)有的基于深度學(xué)習(xí)的圖像分類模型雖然在多分類任務(wù)上表現(xiàn)出了良好的效果,在各個(gè)應(yīng)用場景下被廣泛使用,但是基于深度學(xué)習(xí)的圖像分類模型通常將多分類任務(wù)集中在一個(gè)網(wǎng)絡(luò)模型上,網(wǎng)絡(luò)中的每一類別與其它所有類別交叉連接在一起,該類模型具有較為復(fù)雜的網(wǎng)絡(luò)結(jié)構(gòu)(參考圖1),這對模型性能和用戶算力提出一定的要求。具體的,一方面,現(xiàn)有的基于深度學(xué)習(xí)的圖像分類模型為了提高分類精度,往往會(huì)采用堆疊網(wǎng)絡(luò)層數(shù)的手段,這就導(dǎo)致了模型的層數(shù)越來越深,參數(shù)量越來越大,訓(xùn)練難度也隨之增長,不僅普通用戶和中小企業(yè)的算力難以支撐如此巨大的模型,還使得分類效率不佳;另一方面,這類圖像分類模型大多將多分類任務(wù)集中在一個(gè)交叉關(guān)聯(lián)的網(wǎng)絡(luò)上,這不僅對網(wǎng)絡(luò)模型提出了很高的要求,還使得模型不具備很好的擴(kuò)展性,一旦多分類任務(wù)中的某個(gè)圖像類別發(fā)生更替或新增圖像類別,那么該模型就需要重新訓(xùn)練,耗費(fèi)人力物力,造成資源的浪費(fèi)。
4、綜上所述,現(xiàn)有的基于深度學(xué)習(xí)的圖像分類模型雖然可完成圖像的多分類任務(wù),但是存在著多類別圖像分類效率低以及資源浪費(fèi)的問題;因此,如何提高多類別圖像分類的效率以及減少資源的浪費(fèi)是亟待解決的技術(shù)問題。
技術(shù)實(shí)現(xiàn)思路
1、鑒于此,本發(fā)明實(shí)施例提供了一種基于并行是非分類的多類別圖像分類方法和裝置,以消除或改善現(xiàn)有技術(shù)中存在的一個(gè)或更多個(gè)缺陷。
2、本發(fā)明的一個(gè)方面提供了一種基于并行是非分類的多類別圖像分類方法,該方法包括以下步驟:
3、獲取待分類圖像;
4、將所述待分類圖像同時(shí)并行輸入至多個(gè)訓(xùn)練好的是非分類模型中,得到各所述是非分類模型輸出的各是非分類結(jié)果;其中,多個(gè)所述是非分類模型對應(yīng)的分類類別均不同;
5、基于各所述是非分類模型輸出的各是非分類結(jié)果確定所述待分類圖像的最終圖像分類結(jié)果。
6、在本發(fā)明的一些實(shí)施例中,基于各所述是非分類模型輸出的各是非分類結(jié)果確定所述待分類圖像的最終圖像分類結(jié)果,包括:
7、基于各所述是非分類模型輸出的各是非分類結(jié)果確定所述待分類圖像相對于各是非分類模型對應(yīng)類別的各代表值;
8、基于各所述代表值確定最優(yōu)代表值;
9、將所述最優(yōu)代表值對應(yīng)的是非分類模型的類別作為所述待分類圖像的最終圖像分類結(jié)果。
10、在本發(fā)明的一些實(shí)施例中,基于各所述代表值確定最優(yōu)代表值,包括:
11、將多個(gè)所述代表值中的最大值或最小值作為最優(yōu)代表值;或,
12、將多個(gè)所述代表值中的大于預(yù)設(shè)閾值或小于預(yù)設(shè)閾值的代表值作為最優(yōu)代表值。
13、在本發(fā)明的一些實(shí)施例中,所述方法還包括:
14、構(gòu)建多個(gè)初始是非分類模型和各所述初始是非分類模型的樣本數(shù)據(jù)集;
15、基于各所述初始是非分類模型的樣本數(shù)據(jù)集分別對各所述初始是非分類模型進(jìn)行預(yù)訓(xùn)練得到訓(xùn)練好的各是非分類模型。
16、在本發(fā)明的一些實(shí)施例中,所述樣本數(shù)據(jù)集中的樣本數(shù)據(jù)包括是非分類模型對應(yīng)類別的第一樣本數(shù)據(jù)和除所述非分類模型對應(yīng)類別之外的其他類別的第二樣本數(shù)據(jù);和/或,
17、所述樣本數(shù)據(jù)集為數(shù)據(jù)增強(qiáng)后的樣本數(shù)據(jù)集。
18、在本發(fā)明的一些實(shí)施例中,所述第一樣本數(shù)據(jù)和第二樣本數(shù)據(jù)的數(shù)量比為1:1;和/或,
19、所述是非分類模型為卷積神經(jīng)網(wǎng)絡(luò)模型、支持向量機(jī)模型、編碼解碼器模型、視覺變換器模型、變分自解碼器模型、擴(kuò)散模型或生成對抗網(wǎng)絡(luò)模型。
20、在本發(fā)明的一些實(shí)施例中,
21、在得到各所述是非分類模型輸出的各是非分類結(jié)果之前,所述方法還包括:將各所述是非分類模型對應(yīng)的是非分類任務(wù)發(fā)送至線程池;為各所述是非分類任務(wù)分配一個(gè)活躍線程以使多個(gè)所述是非分類任務(wù)同步執(zhí)行;和/或,
22、所述多類別圖像分類方法包括:獲取待擴(kuò)展圖像類別,確定與所述待擴(kuò)展圖像類別對應(yīng)的待擴(kuò)展是非分類模型參數(shù),基于所述待擴(kuò)展是非分類模型參數(shù)以及所述多個(gè)訓(xùn)練好的是非分類模型得到擴(kuò)展后的多個(gè)是非分類模型。
23、相應(yīng)的,本發(fā)明還公開了一種基于并行是非分類的多類別圖像分類系統(tǒng),包括處理器、存儲(chǔ)器及存儲(chǔ)在存儲(chǔ)器上的計(jì)算機(jī)程序,所述處理器用于執(zhí)行所述計(jì)算機(jī)程序,當(dāng)所述計(jì)算機(jī)程序被執(zhí)行時(shí)該系統(tǒng)實(shí)現(xiàn)如上任一實(shí)施例所述方法的步驟。
24、根據(jù)本發(fā)明的另一方面,還公開了一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序,該計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如上任一實(shí)施例所述方法的步驟。
25、根據(jù)本發(fā)明的再一方面,還提供了一種計(jì)算機(jī)程序產(chǎn)品,包括計(jì)算機(jī)程序,該計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如上任一實(shí)施例所述方法的步驟。
26、本發(fā)明的基于并行是非分類的多類別圖像分類方法及裝置,在進(jìn)行圖像分類時(shí),基于多個(gè)類別不同的是非分類模型同時(shí)并行對待分類圖像進(jìn)行是非分類,并根據(jù)多個(gè)是非分類模型輸出的多個(gè)是非分類結(jié)果確定待分類圖像的最終圖像分類結(jié)果。該方法將多分類任務(wù)分解為多個(gè)并行的單是非分類任務(wù),大大降低了網(wǎng)絡(luò)的深度、減少了網(wǎng)絡(luò)參數(shù)、降低了訓(xùn)練難度,從而提高了多類別圖像分類的效率,減少了資源的浪費(fèi)。
27、另外,該多類別圖像分類方法及裝置,可靈活的將多個(gè)不同類別的是非分類模型進(jìn)行分解、組合和擴(kuò)展,從而提高了模型的可擴(kuò)展性,從而極大地提高了多類別圖像分類的靈活性和可擴(kuò)展性。
28、本發(fā)明的附加優(yōu)點(diǎn)、目的,以及特征將在下面的描述中將部分地加以闡述,且將對于本領(lǐng)域普通技術(shù)人員在研究下文后部分地變得明顯,或者可以根據(jù)本發(fā)明的實(shí)踐而獲知。本發(fā)明的目的和其它優(yōu)點(diǎn)可以通過在說明書以及附圖中具體指出的結(jié)構(gòu)實(shí)現(xiàn)到并獲得。
29、本領(lǐng)域技術(shù)人員將會(huì)理解的是,能夠用本發(fā)明實(shí)現(xiàn)的目的和優(yōu)點(diǎn)不限于以上具體所述,并且根據(jù)以下詳細(xì)說明將更清楚地理解本發(fā)明能夠?qū)崿F(xiàn)的上述和其他目的。