技術(shù)特征:1.一種基于深度遷移強(qiáng)化學(xué)習(xí)的知識(shí)推理方法,其特征在于,包括以下步驟:
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,步驟1包括:
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,步驟2包括:
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,步驟2-3包括如下步驟:
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,步驟3中所述的目標(biāo)任務(wù)微調(diào)訓(xùn)練,具體包括:
6.根據(jù)權(quán)利要求5所述的方法,其特征在于,步驟3-3包括:
7.根據(jù)權(quán)利要求6所述的方法,其特征在于,步驟4中所述的模型算法評(píng)價(jià)標(biāo)準(zhǔn)構(gòu)建,具體包括:
8.根據(jù)權(quán)利要求7所述的方法,其特征在于,步驟5包括:
9.根據(jù)權(quán)利要求8所述的方法,其特征在于,步驟5-2包括:
10.一種基于深度遷移強(qiáng)化學(xué)習(xí)的新藥用途的預(yù)測(cè)方法,基于權(quán)利要求1~9任一項(xiàng)所述的方法實(shí)現(xiàn),其特征在于,包括:設(shè)定需要在一個(gè)包含藥物、疾病、基因和癥狀實(shí)體的知識(shí)圖譜中,推理出新藥物與其潛在治療疾病之間的關(guān)系;
技術(shù)總結(jié)本發(fā)明提供了一種基于深度遷移強(qiáng)化學(xué)習(xí)的知識(shí)推理方法,本發(fā)明的具體實(shí)現(xiàn)過程主要包括兩個(gè)關(guān)鍵階段:(1)第一階段側(cè)重于通過有效性導(dǎo)向的預(yù)訓(xùn)練加強(qiáng)智能體的單步?jīng)Q策能力,有助于智能體學(xué)習(xí)挑選出有效的步驟,以增進(jìn)智能體在探索路徑時(shí)的效率與準(zhǔn)確度;(2)第二階段側(cè)重于在特定任務(wù)上進(jìn)行深入的多步推理訓(xùn)練,旨在提升智能體在特定推理任務(wù)中進(jìn)行多步路徑探索的能力,使智能體掌握在知識(shí)圖譜中執(zhí)行復(fù)雜推理的技巧,以便解決更加復(fù)雜的問題。本發(fā)明可有效解決在推理前期智能體由于選擇無效動(dòng)作而導(dǎo)致路徑挖掘成功率大幅下降的問題,事實(shí)預(yù)測(cè)實(shí)驗(yàn)和鏈接預(yù)測(cè)實(shí)驗(yàn)等多維數(shù)據(jù)結(jié)果表明本發(fā)明可顯著提高路徑搜索的成功率,在主要推理任務(wù)中的表現(xiàn)均優(yōu)于同類方法。
技術(shù)研發(fā)人員:王文鑫,楚威,王凱,王靜,鄭少秋,馮建航,李智,黃晨曦,莊奕捷
受保護(hù)的技術(shù)使用者:中國電子科技集團(tuán)公司第二十八研究所
技術(shù)研發(fā)日:技術(shù)公布日:2024/10/10