国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      一種基于深度遷移強(qiáng)化學(xué)習(xí)的知識(shí)推理方法與流程

      文檔序號(hào):39615821發(fā)布日期:2024-10-11 13:27閱讀:來源:國知局

      技術(shù)特征:

      1.一種基于深度遷移強(qiáng)化學(xué)習(xí)的知識(shí)推理方法,其特征在于,包括以下步驟:

      2.根據(jù)權(quán)利要求1所述的方法,其特征在于,步驟1包括:

      3.根據(jù)權(quán)利要求2所述的方法,其特征在于,步驟2包括:

      4.根據(jù)權(quán)利要求3所述的方法,其特征在于,步驟2-3包括如下步驟:

      5.根據(jù)權(quán)利要求4所述的方法,其特征在于,步驟3中所述的目標(biāo)任務(wù)微調(diào)訓(xùn)練,具體包括:

      6.根據(jù)權(quán)利要求5所述的方法,其特征在于,步驟3-3包括:

      7.根據(jù)權(quán)利要求6所述的方法,其特征在于,步驟4中所述的模型算法評(píng)價(jià)標(biāo)準(zhǔn)構(gòu)建,具體包括:

      8.根據(jù)權(quán)利要求7所述的方法,其特征在于,步驟5包括:

      9.根據(jù)權(quán)利要求8所述的方法,其特征在于,步驟5-2包括:

      10.一種基于深度遷移強(qiáng)化學(xué)習(xí)的新藥用途的預(yù)測(cè)方法,基于權(quán)利要求1~9任一項(xiàng)所述的方法實(shí)現(xiàn),其特征在于,包括:設(shè)定需要在一個(gè)包含藥物、疾病、基因和癥狀實(shí)體的知識(shí)圖譜中,推理出新藥物與其潛在治療疾病之間的關(guān)系;


      技術(shù)總結(jié)
      本發(fā)明提供了一種基于深度遷移強(qiáng)化學(xué)習(xí)的知識(shí)推理方法,本發(fā)明的具體實(shí)現(xiàn)過程主要包括兩個(gè)關(guān)鍵階段:(1)第一階段側(cè)重于通過有效性導(dǎo)向的預(yù)訓(xùn)練加強(qiáng)智能體的單步?jīng)Q策能力,有助于智能體學(xué)習(xí)挑選出有效的步驟,以增進(jìn)智能體在探索路徑時(shí)的效率與準(zhǔn)確度;(2)第二階段側(cè)重于在特定任務(wù)上進(jìn)行深入的多步推理訓(xùn)練,旨在提升智能體在特定推理任務(wù)中進(jìn)行多步路徑探索的能力,使智能體掌握在知識(shí)圖譜中執(zhí)行復(fù)雜推理的技巧,以便解決更加復(fù)雜的問題。本發(fā)明可有效解決在推理前期智能體由于選擇無效動(dòng)作而導(dǎo)致路徑挖掘成功率大幅下降的問題,事實(shí)預(yù)測(cè)實(shí)驗(yàn)和鏈接預(yù)測(cè)實(shí)驗(yàn)等多維數(shù)據(jù)結(jié)果表明本發(fā)明可顯著提高路徑搜索的成功率,在主要推理任務(wù)中的表現(xiàn)均優(yōu)于同類方法。

      技術(shù)研發(fā)人員:王文鑫,楚威,王凱,王靜,鄭少秋,馮建航,李智,黃晨曦,莊奕捷
      受保護(hù)的技術(shù)使用者:中國電子科技集團(tuán)公司第二十八研究所
      技術(shù)研發(fā)日:
      技術(shù)公布日:2024/10/10
      當(dāng)前第2頁1 2 
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
      1