本申請(qǐng)涉及數(shù)據(jù)分類,具體涉及一種分類模型的訓(xùn)練方法、數(shù)據(jù)標(biāo)注方法及裝置。
背景技術(shù):
1、數(shù)據(jù)分類分級(jí)的術(shù)語(yǔ)和概念較為復(fù)雜,需要深入的專業(yè)知識(shí)和數(shù)據(jù)分類分級(jí)專業(yè)知識(shí)才能正確理解,通常使用神經(jīng)網(wǎng)絡(luò)來(lái)進(jìn)行分級(jí)分類,若模型分類的準(zhǔn)確率較低,會(huì)導(dǎo)致數(shù)據(jù)分類準(zhǔn)確度較低。
技術(shù)實(shí)現(xiàn)思路
1、本申請(qǐng)實(shí)施例提供一種分類模型的訓(xùn)練方法、數(shù)據(jù)標(biāo)注方法及裝置,可以提高數(shù)據(jù)分類的準(zhǔn)確度。
2、第一方面,本申請(qǐng)?zhí)峁┑姆诸惸P偷挠?xùn)練方法,包括:
3、基于初始分類模型,對(duì)第一待標(biāo)注文本數(shù)據(jù)進(jìn)行分類,得到所述第一待標(biāo)注文本數(shù)據(jù)的第一分類結(jié)果;
4、在所述第一分類結(jié)果不滿足預(yù)設(shè)條件的情況下,擴(kuò)充所述第一待標(biāo)注文本數(shù)據(jù)的屬性特征,得到第二待標(biāo)注文本數(shù)據(jù);
5、基于所述初始分類模型,對(duì)所述第二待標(biāo)注文本數(shù)據(jù)進(jìn)行分類,得到所述第二待標(biāo)注文本數(shù)據(jù)的第二分類結(jié)果;
6、在所述第二分類結(jié)果滿足所述預(yù)設(shè)條件的情況下,將所述第二分類結(jié)果確定為所述第一待標(biāo)注文本數(shù)據(jù)的目標(biāo)分類標(biāo)簽;
7、基于所述第一待標(biāo)注文本數(shù)據(jù)及其目標(biāo)分類標(biāo)簽,更新所述初始分類模型,得到目標(biāo)分類模型。
8、第二方面,本申請(qǐng)?zhí)峁┑臄?shù)據(jù)標(biāo)注方法,包括:
9、確定第四待標(biāo)注文本數(shù)據(jù);
10、基于目標(biāo)分類模型,對(duì)所述第四待標(biāo)注文本數(shù)據(jù)進(jìn)行分類,得到所述第四待標(biāo)注文本數(shù)據(jù)的第四分類結(jié)果,其中,所述目標(biāo)分類模型為第一方面任意一項(xiàng)所述的分類模型的訓(xùn)練方法得到的目標(biāo)分類模型;
11、基于所述第四分類結(jié)果,確定所述第四待標(biāo)注文本數(shù)據(jù)的分類標(biāo)簽,并基于所述分類標(biāo)簽對(duì)所述第四待標(biāo)注文本數(shù)據(jù)進(jìn)行標(biāo)注。
12、第三方面,本申請(qǐng)?zhí)峁┑姆诸惸P偷挠?xùn)練裝置,包括:
13、第一分類模塊,用于基于初始分類模型,對(duì)第一待標(biāo)注文本數(shù)據(jù)進(jìn)行分類,得到所述第一待標(biāo)注文本數(shù)據(jù)的第一分類結(jié)果;
14、擴(kuò)充模塊,用于在所述第一分類結(jié)果不滿足預(yù)設(shè)條件的情況下,擴(kuò)充所述第一待標(biāo)注文本數(shù)據(jù)的屬性特征,得到第二待標(biāo)注文本數(shù)據(jù);
15、第二分類模塊,用于基于所述初始分類模型,對(duì)所述第二待標(biāo)注文本數(shù)據(jù)進(jìn)行分類,得到所述第二待標(biāo)注文本數(shù)據(jù)的第二分類結(jié)果;
16、確定模塊,用于在所述第二分類結(jié)果滿足所述預(yù)設(shè)條件的情況下,將所述第二分類結(jié)果確定為所述第一待標(biāo)注文本數(shù)據(jù)的目標(biāo)分類標(biāo)簽;
17、更新模塊,用于基于所述第一待標(biāo)注文本數(shù)據(jù)及其目標(biāo)分類標(biāo)簽,更新所述初始分類模型,得到目標(biāo)分類模型。
18、第四方面,本申請(qǐng)?zhí)峁┑臄?shù)據(jù)標(biāo)注裝置,包括:
19、確定模塊,用于確定第四待標(biāo)注文本數(shù)據(jù);
20、分類模塊,用于基于目標(biāo)分類模型,對(duì)所述第四待標(biāo)注文本數(shù)據(jù)進(jìn)行分類,得到所述第四待標(biāo)注文本數(shù)據(jù)的第四分類結(jié)果;
21、標(biāo)注模塊,用于基于所述第四分類結(jié)果,確定所述第四待標(biāo)注文本數(shù)據(jù)的分類標(biāo)簽,并基于所述分類標(biāo)簽對(duì)所述第四待標(biāo)注文本數(shù)據(jù)進(jìn)行標(biāo)注。
22、第五方面,本申請(qǐng)?zhí)峁┑碾娮釉O(shè)備,包括存儲(chǔ)器和處理器,存儲(chǔ)器存儲(chǔ)有計(jì)算機(jī)程序,處理器用于運(yùn)行存儲(chǔ)器內(nèi)的計(jì)算機(jī)程序,實(shí)現(xiàn)本申請(qǐng)所提供的分類模型的訓(xùn)練方法中的步驟或者數(shù)據(jù)標(biāo)注方法中的步驟。
23、第六方面,本申請(qǐng)?zhí)峁┑挠?jì)算機(jī)可讀存儲(chǔ)介質(zhì),存儲(chǔ)有多條指令,該指令適于處理器進(jìn)行加載,實(shí)現(xiàn)本申請(qǐng)所提供的分類模型的訓(xùn)練方法中的步驟或者數(shù)據(jù)標(biāo)注方法中的步驟。
24、第七方面,本申請(qǐng)?zhí)峁┑挠?jì)算機(jī)程序產(chǎn)品,包括計(jì)算機(jī)程序或指令,該計(jì)算機(jī)程序或指令被處理器執(zhí)行時(shí)實(shí)現(xiàn)本申請(qǐng)所提供的分類模型的訓(xùn)練方法中的步驟或者數(shù)據(jù)標(biāo)注方法中的步驟。
25、本申請(qǐng)中,相較于相關(guān)技術(shù),基于初始分類模型,對(duì)第一待標(biāo)注文本數(shù)據(jù)進(jìn)行分類,得到第一待標(biāo)注文本數(shù)據(jù)的第一分類結(jié)果;在第一分類結(jié)果不滿足預(yù)設(shè)條件的情況下,擴(kuò)充第一待標(biāo)注文本數(shù)據(jù)的屬性特征,得到第二待標(biāo)注文本數(shù)據(jù);基于初始分類模型,對(duì)第二待標(biāo)注文本數(shù)據(jù)進(jìn)行分類,得到第二待標(biāo)注文本數(shù)據(jù)的第二分類結(jié)果;在第二分類結(jié)果滿足預(yù)設(shè)條件的情況下,將第二分類結(jié)果確定為第一待標(biāo)注文本數(shù)據(jù)的目標(biāo)分類標(biāo)簽;基于第一待標(biāo)注文本數(shù)據(jù)及其目標(biāo)分類標(biāo)簽,更新初始分類模型,得到目標(biāo)分類模型。本申請(qǐng)?jiān)谠诘谝淮龢?biāo)注數(shù)據(jù)的分類結(jié)果不滿足預(yù)設(shè)條件的基礎(chǔ)上,采用擴(kuò)充第一待標(biāo)注數(shù)據(jù)的屬性特征的方式,得到具有豐富特征的第二待標(biāo)注數(shù)據(jù),然后繼續(xù)對(duì)第二待標(biāo)注數(shù)據(jù)進(jìn)行分類,使分類結(jié)果能夠滿足預(yù)設(shè)條件,將第二待標(biāo)注數(shù)據(jù)的分類結(jié)果作為第一待標(biāo)注數(shù)據(jù)的分類標(biāo)簽更新初始分類模型,得到目標(biāo)分類模型,由于第二待標(biāo)注數(shù)據(jù)具有更豐富的特征,將第二待標(biāo)注數(shù)據(jù)的分類結(jié)果作為第一待標(biāo)注數(shù)據(jù)的分類標(biāo)簽更新初始分類模型,能夠提高分類模型的數(shù)據(jù)分類準(zhǔn)確性。
1.一種分類模型的訓(xùn)練方法,其特征在于,所述方法包括:
2.根據(jù)權(quán)利要求1所述的分類模型的訓(xùn)練方法,其特征在于,所述擴(kuò)充所述第一待標(biāo)注文本數(shù)據(jù)的屬性特征,得到第二待標(biāo)注文本數(shù)據(jù),包括:
3.根據(jù)權(quán)利要求2所述的分類模型的訓(xùn)練方法,其特征在于,所述獲取第一目標(biāo)數(shù)量的屬性特征,包括:
4.根據(jù)權(quán)利要求1所述的數(shù)據(jù)分類方法,其特征在于,所述預(yù)設(shè)條件為m個(gè)分類標(biāo)簽的概率的最大值和次大值之間差值大于預(yù)設(shè)值,所述方法還包括:
5.根據(jù)權(quán)利要求1所述的分類模型的訓(xùn)練方法,其特征在于,所述初始分類模型通過(guò)如下步驟訓(xùn)練得到:
6.根據(jù)權(quán)利要求5所述的分類模型的訓(xùn)練方法,其特征在于,所述方法還包括:
7.一種數(shù)據(jù)標(biāo)注方法,其特征在于,包括:
8.一種分類模型的訓(xùn)練裝置,其特征在于,所述分類模型的訓(xùn)練裝置包括:
9.一種數(shù)據(jù)標(biāo)注裝置,其特征在于,所述數(shù)據(jù)標(biāo)注裝置包括:
10.一種電子設(shè)備,其特征在于,包括存儲(chǔ)器和處理器,所述存儲(chǔ)器存儲(chǔ)有計(jì)算機(jī)程序,所述處理器用于運(yùn)行所述存儲(chǔ)器內(nèi)的計(jì)算機(jī)程序,以執(zhí)行權(quán)利要求1至6任一項(xiàng)所述的分類模型的訓(xùn)練方法中的步驟或者權(quán)利要求7所述的數(shù)據(jù)標(biāo)注方法中的步驟。
11.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其特征在于,所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)存儲(chǔ)有多條指令,所述指令適于處理器進(jìn)行加載,以執(zhí)行權(quán)利要求1至6任一項(xiàng)所述的分類模型的訓(xùn)練方法中的步驟或者權(quán)利要求7所述的數(shù)據(jù)標(biāo)注方法中的步驟。
12.一種計(jì)算機(jī)程序產(chǎn)品,包括計(jì)算機(jī)程序或指令,其特征在于,該計(jì)算機(jī)程序或指令被處理器執(zhí)行時(shí)實(shí)現(xiàn)權(quán)利要求1至6任一項(xiàng)所述的分類模型的訓(xùn)練方法中的步驟或者權(quán)利要求7所述的數(shù)據(jù)標(biāo)注方法中的步驟。