国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      一種基于強化學習的隧道伺服支撐體系與自適應控制方法

      文檔序號:39346201發(fā)布日期:2024-09-10 12:10閱讀:來源:國知局

      技術特征:

      1.一種基于強化學習的隧道伺服支撐體系與自適應控制方法,其特征在于:包括如下的步驟:

      2.根據(jù)權利要求1所述的基于強化學習的隧道伺服支撐體系與自適應控制方法,其特征在于:所述步驟s1包括如下具體步驟:

      3.根據(jù)權利要求1所述的基于強化學習的隧道伺服支撐體系與自適應控制方法,其特征在于:所述步驟s3包括如下具體步驟:

      4.根據(jù)權利要求1所述的基于強化學習的隧道伺服支撐體系與自適應控制方法,其特征在于:所述步驟s4包括如下具體步驟:

      5.根據(jù)權利要求1所述的基于強化學習的隧道伺服支撐體系與自適應控制方法,其特征在于:所述伺服參數(shù)的強化學習模型包括強化學習策略網絡、伺服支撐動態(tài)模型、伺服支撐評價網絡和強化學習價值網絡;所述強化學習策略網絡根據(jù)當前環(huán)境狀態(tài)的輸入,策略網絡輸出一個動作作為伺服參數(shù),這個動作被應用到伺服支撐動態(tài)模型中;所述伺服支撐動態(tài)模型是模擬伺服支撐體系的動態(tài)特性,預測在不同動作下的狀態(tài)轉移情況,根據(jù)當前的伺服參數(shù)更新位移狀態(tài);所述伺服支撐評價網絡是評估當前狀態(tài)下伺服支撐體系的表現(xiàn),輸出作為獎勵信號,用來指導價值網絡的學習過程;所述強化學習價值網絡是評估在當前狀態(tài)下選擇某個動作的長期回報,輸出幫助策略網絡更好地選擇動作,長期獲得更高的獎勵。

      6.根據(jù)權利要求1所述的基于強化學習的隧道伺服支撐體系與自適應控制方法,其特征在于:所述步驟s5包括如下具體步驟:

      7.一種計算機系統(tǒng),包括存儲器、處理器及存儲在存儲器上的計算機程序,其特征在于:所述處理器執(zhí)行所述計算機程序以實現(xiàn)權利要求1所述方法的步驟。

      8.一種計算機可讀存儲介質,其上存儲有計算機程序,其特征在于:該計算機程序被處理器執(zhí)行時實現(xiàn)權利要求1所述方法的步驟。

      9.一種計算機程序產品,包括計算機程序,其特征在于:該計算機程序被處理器執(zhí)行時實現(xiàn)權利要求1所述方法的步驟。


      技術總結
      本發(fā)明公開一種基于強化學習的隧道伺服支撐體系與自適應控制方法,融合裝配式桁架結構與伺服支撐體系,采用強化學習方法,通過將支撐體系變形計受力狀態(tài)數(shù)據(jù)實時反饋給強化學習網絡模型,學習出最優(yōu)的控制策略,實現(xiàn)對支撐體系的智能化控制。本發(fā)明的優(yōu)點是利用強化學習算法,通過對隧道結構和環(huán)境進行實時感知和學習,實現(xiàn)對隧道伺服系統(tǒng)的自適應控制,提高穩(wěn)定性和控制精度。

      技術研發(fā)人員:周彪,王文琦,謝雄耀
      受保護的技術使用者:同濟大學
      技術研發(fā)日:
      技術公布日:2024/9/9
      當前第2頁1 2 
      網友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會獲得點贊!
      1