一種基于強化學習的隧道伺服支撐體系與自適應控制方法

文檔序號：39346201發(fā)布日期：2024-09-10 12:10閱讀：來源：國知局

技術特征：

1.一種基于強化學習的隧道伺服支撐體系與自適應控制方法，其特征在于：包括如下的步驟：

2.根據(jù)權利要求1所述的基于強化學習的隧道伺服支撐體系與自適應控制方法，其特征在于：所述步驟s1包括如下具體步驟：

3.根據(jù)權利要求1所述的基于強化學習的隧道伺服支撐體系與自適應控制方法，其特征在于：所述步驟s3包括如下具體步驟：

4.根據(jù)權利要求1所述的基于強化學習的隧道伺服支撐體系與自適應控制方法，其特征在于：所述步驟s4包括如下具體步驟：

5.根據(jù)權利要求1所述的基于強化學習的隧道伺服支撐體系與自適應控制方法，其特征在于：所述伺服參數(shù)的強化學習模型包括強化學習策略網絡、伺服支撐動態(tài)模型、伺服支撐評價網絡和強化學習價值網絡；所述強化學習策略網絡根據(jù)當前環(huán)境狀態(tài)的輸入，策略網絡輸出一個動作作為伺服參數(shù)，這個動作被應用到伺服支撐動態(tài)模型中；所述伺服支撐動態(tài)模型是模擬伺服支撐體系的動態(tài)特性，預測在不同動作下的狀態(tài)轉移情況，根據(jù)當前的伺服參數(shù)更新位移狀態(tài)；所述伺服支撐評價網絡是評估當前狀態(tài)下伺服支撐體系的表現(xiàn)，輸出作為獎勵信號，用來指導價值網絡的學習過程；所述強化學習價值網絡是評估在當前狀態(tài)下選擇某個動作的長期回報，輸出幫助策略網絡更好地選擇動作，長期獲得更高的獎勵。

6.根據(jù)權利要求1所述的基于強化學習的隧道伺服支撐體系與自適應控制方法，其特征在于：所述步驟s5包括如下具體步驟：

7.一種計算機系統(tǒng)，包括存儲器、處理器及存儲在存儲器上的計算機程序，其特征在于：所述處理器執(zhí)行所述計算機程序以實現(xiàn)權利要求1所述方法的步驟。

8.一種計算機可讀存儲介質，其上存儲有計算機程序，其特征在于：該計算機程序被處理器執(zhí)行時實現(xiàn)權利要求1所述方法的步驟。

9.一種計算機程序產品，包括計算機程序，其特征在于：該計算機程序被處理器執(zhí)行時實現(xiàn)權利要求1所述方法的步驟。

技術總結
本發(fā)明公開一種基于強化學習的隧道伺服支撐體系與自適應控制方法，融合裝配式桁架結構與伺服支撐體系，采用強化學習方法，通過將支撐體系變形計受力狀態(tài)數(shù)據(jù)實時反饋給強化學習網絡模型，學習出最優(yōu)的控制策略，實現(xiàn)對支撐體系的智能化控制。本發(fā)明的優(yōu)點是利用強化學習算法，通過對隧道結構和環(huán)境進行實時感知和學習，實現(xiàn)對隧道伺服系統(tǒng)的自適應控制，提高穩(wěn)定性和控制精度。

技術研發(fā)人員：周彪,王文琦,謝雄耀
受保護的技術使用者：同濟大學
技術研發(fā)日：
技術公布日：2024/9/9

完整全部詳細技術資料下載

當前第2頁1 2

相關技術

網友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

一種基于強化學習的隧道伺服支撐體系與自適應控制方法