一種基于深度遷移強(qiáng)化學(xué)習(xí)的知識(shí)推理方法與流程

文檔序號(hào)：39615821發(fā)布日期：2024-10-11 13:27閱讀：來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>計(jì)算;推算;計(jì)數(shù)設(shè)備的制造及其應(yīng)用技術(shù)>一種基于深度遷移強(qiáng)化學(xué)習(xí)的知識(shí)推理方法與流程

技術(shù)特征：

1.一種基于深度遷移強(qiáng)化學(xué)習(xí)的知識(shí)推理方法，其特征在于，包括以下步驟：

2.根據(jù)權(quán)利要求1所述的方法，其特征在于，步驟1包括：

3.根據(jù)權(quán)利要求2所述的方法，其特征在于，步驟2包括：

4.根據(jù)權(quán)利要求3所述的方法，其特征在于，步驟2-3包括如下步驟：

5.根據(jù)權(quán)利要求4所述的方法，其特征在于，步驟3中所述的目標(biāo)任務(wù)微調(diào)訓(xùn)練，具體包括：

6.根據(jù)權(quán)利要求5所述的方法，其特征在于，步驟3-3包括：

7.根據(jù)權(quán)利要求6所述的方法，其特征在于，步驟4中所述的模型算法評(píng)價(jià)標(biāo)準(zhǔn)構(gòu)建，具體包括：

8.根據(jù)權(quán)利要求7所述的方法，其特征在于，步驟5包括：

9.根據(jù)權(quán)利要求8所述的方法，其特征在于，步驟5-2包括：

10.一種基于深度遷移強(qiáng)化學(xué)習(xí)的新藥用途的預(yù)測(cè)方法，基于權(quán)利要求1～9任一項(xiàng)所述的方法實(shí)現(xiàn)，其特征在于，包括：設(shè)定需要在一個(gè)包含藥物、疾病、基因和癥狀實(shí)體的知識(shí)圖譜中，推理出新藥物與其潛在治療疾病之間的關(guān)系；

技術(shù)總結(jié)
本發(fā)明提供了一種基于深度遷移強(qiáng)化學(xué)習(xí)的知識(shí)推理方法，本發(fā)明的具體實(shí)現(xiàn)過程主要包括兩個(gè)關(guān)鍵階段：(1)第一階段側(cè)重于通過有效性導(dǎo)向的預(yù)訓(xùn)練加強(qiáng)智能體的單步?jīng)Q策能力，有助于智能體學(xué)習(xí)挑選出有效的步驟，以增進(jìn)智能體在探索路徑時(shí)的效率與準(zhǔn)確度；(2)第二階段側(cè)重于在特定任務(wù)上進(jìn)行深入的多步推理訓(xùn)練，旨在提升智能體在特定推理任務(wù)中進(jìn)行多步路徑探索的能力，使智能體掌握在知識(shí)圖譜中執(zhí)行復(fù)雜推理的技巧，以便解決更加復(fù)雜的問題。本發(fā)明可有效解決在推理前期智能體由于選擇無效動(dòng)作而導(dǎo)致路徑挖掘成功率大幅下降的問題，事實(shí)預(yù)測(cè)實(shí)驗(yàn)和鏈接預(yù)測(cè)實(shí)驗(yàn)等多維數(shù)據(jù)結(jié)果表明本發(fā)明可顯著提高路徑搜索的成功率，在主要推理任務(wù)中的表現(xiàn)均優(yōu)于同類方法。

技術(shù)研發(fā)人員：王文鑫,楚威,王凱,王靜,鄭少秋,馮建航,李智,黃晨曦,莊奕捷
受保護(hù)的技術(shù)使用者：中國電子科技集團(tuán)公司第二十八研究所
技術(shù)研發(fā)日：
技術(shù)公布日：2024/10/10

完整全部詳細(xì)技術(shù)資料下載

當(dāng)前第2頁1 2

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

一種基于深度遷移強(qiáng)化學(xué)習(xí)的知識(shí)推理方法與流程