技術(shù)特征:1.基于遷移學(xué)習(xí)的跨領(lǐng)域多模態(tài)工業(yè)數(shù)據(jù)抽取與融合方法,其特征在于,所述方法包括如下步驟:
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述基于所述關(guān)鍵信息生成標(biāo)準(zhǔn)數(shù)據(jù)包括以下步驟:
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,計(jì)算所述特征相似度包括以下步驟:
4.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述構(gòu)建數(shù)據(jù)抽取模型包括:
5.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述構(gòu)建多模態(tài)融合模型包括以下步驟:
6.根據(jù)權(quán)利要求5所述的方法,其特征在于,生成所述融合數(shù)據(jù)包括以下步驟:
7.根據(jù)權(quán)利要求1所述的方法,其特征在于,基于預(yù)訓(xùn)練的transformer模型作為遷移學(xué)習(xí)的起點(diǎn),將所述訓(xùn)練集輸入所述transformer模型中,訓(xùn)練生成適配的神經(jīng)網(wǎng)絡(luò)模型,將所述神經(jīng)網(wǎng)絡(luò)模型設(shè)定為所述數(shù)據(jù)遷移模型。
8.根據(jù)權(quán)利要求7所述的方法,其特征在于,所述生成數(shù)據(jù)標(biāo)簽包括以下步驟:
技術(shù)總結(jié)本發(fā)明公開(kāi)了基于遷移學(xué)習(xí)的跨領(lǐng)域多模態(tài)工業(yè)數(shù)據(jù)抽取與融合方法,屬于數(shù)據(jù)處理技術(shù)領(lǐng)域,包括:獲取數(shù)據(jù)集的特征集,抽取關(guān)鍵信息,基于關(guān)鍵信息生成標(biāo)準(zhǔn)數(shù)據(jù);基于訓(xùn)練集構(gòu)建數(shù)據(jù)遷移模型,數(shù)據(jù)遷移模型基于目標(biāo)標(biāo)簽將源數(shù)據(jù)庫(kù)對(duì)應(yīng)的標(biāo)準(zhǔn)數(shù)據(jù)遷移至目標(biāo)數(shù)據(jù)庫(kù),生成遷移數(shù)據(jù);生成數(shù)據(jù)遷移模型的第一準(zhǔn)確率,基于第一準(zhǔn)確率校正剩余數(shù)據(jù)集中標(biāo)準(zhǔn)數(shù)據(jù)對(duì)應(yīng)的關(guān)鍵信息,生成數(shù)據(jù)標(biāo)簽;構(gòu)建多模態(tài)融合模型,將目標(biāo)數(shù)據(jù)庫(kù)中對(duì)應(yīng)的標(biāo)準(zhǔn)數(shù)據(jù)與遷移數(shù)據(jù)融合生成融合數(shù)據(jù),重復(fù)執(zhí)行此步驟,至所有數(shù)據(jù)集對(duì)應(yīng)的標(biāo)準(zhǔn)數(shù)據(jù)均融合至目標(biāo)數(shù)據(jù)庫(kù)中,生成多領(lǐng)域的融合數(shù)據(jù)集。通過(guò)本發(fā)明可以提高數(shù)據(jù)遷移的準(zhǔn)確性和數(shù)據(jù)融合的完整性。
技術(shù)研發(fā)人員:黃志川,方國(guó)鑫,尹鐘萱,張宇,湯非易
受保護(hù)的技術(shù)使用者:廣東恒電信息科技股份有限公司
技術(shù)研發(fā)日:技術(shù)公布日:2024/10/10