1.用于多任務(wù)大語言模型的數(shù)據(jù)整理方法,其特征在于,該方法包括以下步驟:
2.如權(quán)利要求1所述的用于多任務(wù)大語言模型的數(shù)據(jù)整理方法,其特征在于,所述每個(gè)樣本中各名詞的類別表達(dá)向量的確定方法為:
3.如權(quán)利要求1所述的用于多任務(wù)大語言模型的數(shù)據(jù)整理方法,其特征在于,所述每個(gè)名詞的類別特征相似度的確定方法為:
4.如權(quán)利要求2所述的用于多任務(wù)大語言模型的數(shù)據(jù)整理方法,其特征在于,所述每個(gè)樣本中各名詞在不同數(shù)據(jù)標(biāo)簽類別下的特征權(quán)重以及特征權(quán)重向量的確定方法為:
5.如權(quán)利要求4所述的用于多任務(wù)大語言模型的數(shù)據(jù)整理方法,其特征在于,所述每個(gè)樣本內(nèi)各名詞的任務(wù)數(shù)據(jù)可信度的確定方法為:
6.如權(quán)利要求4所述的用于多任務(wù)大語言模型的數(shù)據(jù)整理方法,其特征在于,所述每個(gè)樣本內(nèi)各名詞在各數(shù)據(jù)標(biāo)簽類別下的特征權(quán)重的表達(dá)式為:式中,wi,j(a)表示第i個(gè)樣本內(nèi)第j個(gè)名詞在第a種數(shù)據(jù)標(biāo)簽類別下的特征權(quán)重;表示第i個(gè)樣本內(nèi)第j個(gè)名詞的所有相同名詞中第x個(gè)相同名詞的任務(wù)數(shù)據(jù)可信度;表示第i個(gè)樣本內(nèi)第j個(gè)名詞的所有相同名詞中第x個(gè)相同名詞在第a種數(shù)據(jù)標(biāo)簽類別下的綜合類別強(qiáng)度;x表示第i個(gè)樣本內(nèi)第j個(gè)名詞的數(shù)量。
7.如權(quán)利要求1所述的用于多任務(wù)大語言模型的數(shù)據(jù)整理方法,其特征在于,所述每個(gè)樣本中每個(gè)名詞的重要性指數(shù)為每個(gè)樣本內(nèi)各名詞在所有數(shù)據(jù)標(biāo)簽類別下特征權(quán)重的和值及對(duì)應(yīng)名詞的詞頻-逆文文件頻率相乘結(jié)果的歸一化值。
8.如權(quán)利要求1所述的用于多任務(wù)大語言模型的數(shù)據(jù)整理方法,其特征在于,所述提取每個(gè)樣本中的關(guān)鍵詞的過程為:
9.如權(quán)利要求1所述的用于多任務(wù)大語言模型的數(shù)據(jù)整理方法,其特征在于,所述基于權(quán)重參數(shù)微調(diào)特定訓(xùn)練集訓(xùn)練的多任務(wù)大語言模型,包括:
10.用于多任務(wù)大語言模型的數(shù)據(jù)整理系統(tǒng),包括內(nèi)存、處理器以及存儲(chǔ)在所述內(nèi)存中并在所述處理器上運(yùn)行的計(jì)算機(jī)程序,其特征在于,所述處理器執(zhí)行所述計(jì)算機(jī)程序時(shí)實(shí)現(xiàn)如權(quán)利要求1-9任意一項(xiàng)所述用于多任務(wù)大語言模型的數(shù)據(jù)整理方法的步驟。