国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      一種基于深度強(qiáng)化學(xué)習(xí)的信號(hào)燈智能控制方法與流程

      文檔序號(hào):40278643發(fā)布日期:2024-12-11 13:14閱讀:來源:國知局

      技術(shù)特征:

      1.一種基于深度強(qiáng)化學(xué)習(xí)的信號(hào)燈智能控制方法,其特征在于:包括以下步驟:

      2.根據(jù)權(quán)利要求1所述的基于深度強(qiáng)化學(xué)習(xí)的信號(hào)燈智能控制方法,其特征在于:所述步驟s3中,算法流程如下:

      3.根據(jù)權(quán)利要求1所述的基于深度強(qiáng)化學(xué)習(xí)的信號(hào)燈智能控制方法,其特征在于:所述步驟s4中,模型訓(xùn)練過程如下:

      4.根據(jù)權(quán)利要求3所述的基于深度強(qiáng)化學(xué)習(xí)的信號(hào)燈智能控制方法,其特征在于:所述步驟s4中,模型驗(yàn)證過程與模型訓(xùn)練過程的區(qū)別僅在于,在驗(yàn)證過程中不再更新行動(dòng)者actor網(wǎng)絡(luò)和策略網(wǎng)絡(luò)。

      5.一種基于深度強(qiáng)化學(xué)習(xí)的信號(hào)燈智能控制系統(tǒng),其特征在于:包括:

      6.根據(jù)權(quán)利要求5所述的基于深度強(qiáng)化學(xué)習(xí)的信號(hào)燈智能控制系統(tǒng),其特征在于:所述算法流程定義模塊負(fù)責(zé)執(zhí)行的算法流程如下:

      7.根據(jù)權(quán)利要求5所述的基于深度強(qiáng)化學(xué)習(xí)的信號(hào)燈智能控制系統(tǒng),其特征在于:所述模型訓(xùn)練與驗(yàn)證模塊中,模型訓(xùn)練過程如下:

      8.根據(jù)權(quán)利要求7所述的基于深度強(qiáng)化學(xué)習(xí)的信號(hào)燈智能控制系統(tǒng),其特征在于:所述模型訓(xùn)練與驗(yàn)證模塊中,模型驗(yàn)證過程與模型訓(xùn)練過程的區(qū)別僅在于,在驗(yàn)證過程中不再更新行動(dòng)者actor網(wǎng)絡(luò)和策略網(wǎng)絡(luò)。

      9.一種基于深度強(qiáng)化學(xué)習(xí)的信號(hào)燈智能控制設(shè)備,其特征在于:包括存儲(chǔ)器和處理器;所述存儲(chǔ)器用于存儲(chǔ)計(jì)算機(jī)程序,所述處理器用于執(zhí)行所述計(jì)算機(jī)程序時(shí)實(shí)現(xiàn)如權(quán)利要求1至4任意一項(xiàng)所述的方法。

      10.一種可讀存儲(chǔ)介質(zhì),其特征在于:所述可讀存儲(chǔ)介質(zhì)上存儲(chǔ)有計(jì)算機(jī)程序,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如權(quán)利要求1至4任意一項(xiàng)所述的方法。


      技術(shù)總結(jié)
      本發(fā)明特別涉及一種基于深度強(qiáng)化學(xué)習(xí)的信號(hào)燈智能控制方法。該基于深度強(qiáng)化學(xué)習(xí)的信號(hào)燈智能控制方法,基于SUMO仿真軟件和python構(gòu)建仿真平臺(tái),在SUMO仿真軟件中搭建路網(wǎng);基于柔性動(dòng)作?評(píng)價(jià)算法SAC設(shè)計(jì)入匝道車輛的控制策略模型;定義算法流程,對(duì)目標(biāo)網(wǎng)絡(luò)進(jìn)行更新,以確保訓(xùn)練的穩(wěn)定;進(jìn)行模型訓(xùn)練,并通過車輛仿真技術(shù)驗(yàn)證模型的有效性;最后實(shí)時(shí)獲取道路車輛信息,利用經(jīng)過訓(xùn)練與驗(yàn)證的模型實(shí)現(xiàn)對(duì)信號(hào)燈的實(shí)時(shí)控制。該基于深度強(qiáng)化學(xué)習(xí)的信號(hào)燈智能控制方法,不僅能夠控制信號(hào)燈相位,還可以根據(jù)各個(gè)道路的車流密度動(dòng)態(tài)調(diào)整信號(hào)燈相位,進(jìn)而平衡了各個(gè)方向車輛的等待時(shí)間,提高了路口的通行效率。

      技術(shù)研發(fā)人員:韋凱,朱勇,張東海,張衡,李兆凱
      受保護(hù)的技術(shù)使用者:浪潮云信息技術(shù)股份公司
      技術(shù)研發(fā)日:
      技術(shù)公布日:2024/12/10
      當(dāng)前第2頁1 2 
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
      1