国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      基于任務(wù)的異構(gòu)CPU-GPU片上網(wǎng)絡(luò)路由方法、裝置、系統(tǒng)及介質(zhì)與流程

      文檔序號:39621706發(fā)布日期:2024-10-11 13:41閱讀:14來源:國知局
      基于任務(wù)的異構(gòu)CPU-GPU片上網(wǎng)絡(luò)路由方法、裝置、系統(tǒng)及介質(zhì)與流程

      本技術(shù)涉及芯片設(shè)計(jì),例如一種基于任務(wù)的異構(gòu)cpu-gpu片上網(wǎng)絡(luò)路由方法、裝置、系統(tǒng)及介質(zhì)。


      背景技術(shù):

      1、目前,隨著生產(chǎn)生活中各類任務(wù)的計(jì)算需求不斷增加,異構(gòu)多核芯片應(yīng)運(yùn)而生,以解決傳統(tǒng)同構(gòu)多核cpu算力不足的問題。其中cpu-gpu的異構(gòu)組合最為常見,cpu和gpu通過共享末級緩存(llc)、內(nèi)存控制器(mc)及其他片上資源以減少通信開銷,提高系統(tǒng)性能。

      2、然而,資源共享勢必帶來資源競爭問題,gpu的多線程結(jié)構(gòu)對延遲不敏感,而其高吞吐量會顯著加劇資源共享帶來的問題。在此背景下,使用片上網(wǎng)絡(luò)(noc)連接各個模塊,分離網(wǎng)絡(luò)中的不同流量成為實(shí)現(xiàn)共享資源的合理分配的重要解決方案。

      3、cpu-gpu?llc/mc共包含四種節(jié)點(diǎn):cpu、gpu、llc及mc。基于布局位置的不同衍生出了多種拓?fù)淠P?,圖1展示了本技術(shù)針對的中心布局模式,該模式下相同類型節(jié)點(diǎn)分布相對集聚。該模型著重考慮了cpu和gpu的內(nèi)存訪問任務(wù),llc和mc分布在拓?fù)渲行膮^(qū)域,被cpu和gpu包圍起來。mc被llc包圍,只與llc通信以減少跳數(shù),該設(shè)計(jì)方案可以最小化cpu和gpu頻繁訪問llc時的路由跳數(shù)。但該布局方式會導(dǎo)致部分路徑面臨巨大的數(shù)據(jù)運(yùn)載壓力,即產(chǎn)生擁塞路徑,即圖中加粗標(biāo)記的數(shù)據(jù)路徑。此外,llc和mc頻繁通信會導(dǎo)致中心部分出現(xiàn)信息熱點(diǎn)區(qū)域,即圖中虛線框出的部分,熱點(diǎn)部分更易出現(xiàn)信息阻塞等問題。在熱點(diǎn)區(qū)域中,各個llc以及各個mc之間沒有直接通信,因此圖中熱點(diǎn)區(qū)域中豎直路徑上的流量會小于水平路徑上的流量。此外,在外圍的cpu和gpu部分,其環(huán)路上的流量也相對較小。


      技術(shù)實(shí)現(xiàn)思路

      1、為了對披露的實(shí)施例的一些方面有基本的理解,下面給出了簡單的概括。所述概括不是泛泛評述,也不是要確定關(guān)鍵/重要組成元素或描繪這些實(shí)施例的保護(hù)范圍,而是作為后面的詳細(xì)說明的序言。

      2、本公開實(shí)施例提供了一種基于任務(wù)的異構(gòu)cpu-gpu片上網(wǎng)絡(luò)路由方法、裝置、系統(tǒng)及介質(zhì),以解決現(xiàn)有cpu-gpu異構(gòu)片上網(wǎng)絡(luò)架構(gòu)中心布局模式中的阻塞問題。

      3、在一些實(shí)施例中,所述方法包括:

      4、s01)、設(shè)定路由方法的路徑選擇規(guī)則,路徑選擇規(guī)則的優(yōu)先級從a至d逐級遞減:

      5、a.執(zhí)行任務(wù)路由跳數(shù)盡可能少;

      6、b.分配到的高流量路徑盡可能少;

      7、c.盡快離開熱點(diǎn)區(qū)域;

      8、d.網(wǎng)絡(luò)內(nèi)工作負(fù)載盡可能平衡;

      9、s02)、執(zhí)行緩存訪問請求任務(wù)時,即由cpu/gpu訪問llc時,依據(jù)規(guī)則b,采用xy路由方法,優(yōu)先經(jīng)過外圍環(huán)路路徑和熱點(diǎn)區(qū)域豎直路徑;

      10、s03)、執(zhí)行cpu請求回復(fù)任務(wù)時,即由llc回復(fù)cpu時,依據(jù)規(guī)則b,采用yx路由方法,優(yōu)先通過豎直路徑離開熱點(diǎn)區(qū)域;

      11、s04)、執(zhí)行g(shù)pu請求回復(fù)任務(wù)時,即由llc回復(fù)gpu時,依據(jù)規(guī)則d,采用xy路由方法,盡快離開熱點(diǎn)區(qū)域進(jìn)入低流量壓力的環(huán)路區(qū)域。

      12、進(jìn)一步的,設(shè)src為源節(jié)點(diǎn),dst為目的節(jié)點(diǎn),src.x、dst.x分別為源節(jié)點(diǎn)、目的節(jié)點(diǎn)的水平坐標(biāo),src.y、dst.y分別為源節(jié)點(diǎn)、目的節(jié)點(diǎn)的豎直坐標(biāo),xy路由方法為:先比較src.x與dst.x的值,如果src.x>dst.x,則向左直行路由,反之向右直行,直至src.x=dst.x,隨后判斷src.y與dst.y的關(guān)系,如果src.y>dst.y,則向下直行路由,反之則向上直行,直至抵達(dá)目的節(jié)點(diǎn)。

      13、進(jìn)一步的,設(shè)src為源節(jié)點(diǎn),dst為目的節(jié)點(diǎn),src.x、dst.x分別為源節(jié)點(diǎn)、目的節(jié)點(diǎn)的水平坐標(biāo),src.y、dst.y分別為源節(jié)點(diǎn)、目的節(jié)點(diǎn)的豎直坐標(biāo),yx路由方法為:先比較src.y與dst.y的值,如果src.y>dst.y,則向下直行路由,反之向上直行,直至src.y=dst.y,隨后判斷src.x與dst.x的關(guān)系,如果src.x>dst.x,則向左直行路由,反之則向右直行,直至抵達(dá)目的節(jié)點(diǎn)。

      14、進(jìn)一步的,本方法在每個路由器輸入端口設(shè)有兩個虛擬通道vc1和vc2,虛擬通道vc1用于通過所有基于任務(wù)的xy路由路徑,虛擬通道vc2用于通過所有基于任務(wù)的yx路由路徑,路由器輸出端口設(shè)有交叉開關(guān),每個路由器輸入端口的虛擬通道連接至交叉開關(guān),由交叉開關(guān)產(chǎn)生避免死鎖的輸出。

      15、進(jìn)一步的,路由器輸出端還設(shè)有路由計(jì)算模塊、虛擬通道仲裁器和交叉開關(guān)仲裁器,路由計(jì)算模塊調(diào)度數(shù)據(jù)輸出端口的選擇,即確認(rèn)用于輸出數(shù)據(jù)的端口,虛擬通道仲裁器決定離開虛擬通道傳遞到交叉開關(guān)的虛擬通道數(shù)據(jù),交叉開關(guān)仲裁器管理交叉開關(guān)輸入和輸出的匹配;交叉開關(guān)產(chǎn)生的不同輸出具有不同的物理數(shù)據(jù)鏈路。

      16、在一些實(shí)施例中,所述裝置包括:路由路徑選擇規(guī)則確定模塊,用于確定如下四條路徑選擇規(guī)則,并且路徑選擇規(guī)則的優(yōu)先級從a至d逐級遞減:

      17、a.執(zhí)行任務(wù)路由跳數(shù)盡可能少;

      18、b.分配到的高流量路徑盡可能少;

      19、c.盡快離開熱點(diǎn)區(qū)域;

      20、d.網(wǎng)絡(luò)內(nèi)工作負(fù)載盡可能平衡;

      21、緩存訪問請求任務(wù)路由路徑確定模塊,執(zhí)行緩存訪問請求任務(wù)時,即由cpu/gpu訪問llc時,依據(jù)規(guī)則b,采用xy路由方法,優(yōu)先經(jīng)過外圍環(huán)路路徑和熱點(diǎn)區(qū)域豎直路徑;

      22、cpu請求回復(fù)任務(wù)路由路徑確定模塊,執(zhí)行cpu請求回復(fù)任務(wù)時,即由llc回復(fù)cpu時,依據(jù)規(guī)則b,采用yx路由方法;

      23、gpu請求回復(fù)任務(wù)路由路徑確定模塊,執(zhí)行g(shù)pu請求回復(fù)任務(wù)時,即由llc回復(fù)gpu時,依據(jù)規(guī)則d,采用xy路由方法。

      24、進(jìn)一步的,在每個路由器輸入端口設(shè)有兩個虛擬通道vc1和vc2,虛擬通道vc1用于通過所有基于任務(wù)的xy路由路徑,虛擬通道vc2用于通過所有基于任務(wù)的yx路由路徑,路由器輸出端口設(shè)有交叉開關(guān),每個路由器輸入端口的虛擬通道末端連接至交叉開關(guān),由交叉開關(guān)產(chǎn)生避免死鎖的輸出。

      25、進(jìn)一步的,路由器輸出端還設(shè)有路由計(jì)算模塊、虛擬通道仲裁器和交叉開關(guān)仲裁器,路由計(jì)算模塊調(diào)度數(shù)據(jù)輸出端口的選擇,即確認(rèn)用于輸出數(shù)據(jù)的端口,虛擬通道仲裁器決定離開虛擬通道傳遞到交叉開關(guān)的虛擬通道數(shù)據(jù),交叉開關(guān)仲裁器管理交叉開關(guān)輸入和輸出的匹配。

      26、在一些實(shí)施例中,所述系統(tǒng)包括:處理器和存儲有程序指令的存儲器,所述處理器被配置為在運(yùn)行所述程序指令時,執(zhí)行如上所述的基于任務(wù)的異構(gòu)cpu-gpu片上網(wǎng)絡(luò)路由方法。

      27、在一些實(shí)施例中,所述存儲介質(zhì)存儲有程序指令,所述程序指令在運(yùn)行時,執(zhí)行如上所述的基于任務(wù)的異構(gòu)cpu-gpu片上網(wǎng)絡(luò)路由方法。

      28、本發(fā)明的有益效果:本方案針對異構(gòu)片上網(wǎng)絡(luò),中心布局的llc/mc拓?fù)淠P痛嬖诘臄?shù)據(jù)熱點(diǎn)和網(wǎng)絡(luò)擁塞問題提出了解決方案。與傳統(tǒng)路由算法相比,本方案的算法有著更低的網(wǎng)絡(luò)延遲,更高的整體性能。同時基于任務(wù)的虛擬通道可以避免死鎖問題的出現(xiàn),進(jìn)一步提高了網(wǎng)絡(luò)表現(xiàn)。

      29、以上的總體描述和下文中的描述僅是示例性和解釋性的,不用于限制本技術(shù)。

      當(dāng)前第1頁1 2 
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
      1