一種基于人工神經網絡的亂序處理器穩(wěn)態(tài)下平均吞吐率的預測方法
【技術領域】
[0001] 本發(fā)明設及一種基于人工神經網絡的亂序處理器穩(wěn)態(tài)下平均吞吐率的預測方法, 屬于軟硬件協(xié)同設計技術。
【背景技術】
[0002] 基于硬件行為建模的娃前架構評估及設計空間探索可提供忍片設計指導意見,降 低忍片設計迭代周期。在特定處理器和指定程序運行的情況下,亂序處理器穩(wěn)態(tài)下的平均 吞吐率表征了沒有缺失事件發(fā)生的情況下,處理器性能的極限,同時也在一定程度上反映 了應用程序的設計與硬件是否適配。同時,亂序處理器穩(wěn)態(tài)下的平均吞吐率有助于后續(xù)的 亂序處理器整體性能的分析建模。
[0003] 目前對亂序處理器穩(wěn)態(tài)下平均吞吐率的認識經歷過兩個階段,第一個階段是直接 將前端指令發(fā)射級的寬度作為亂序處理器穩(wěn)態(tài)下的平均吞吐率,該方法假設:當亂序處理 器沒有缺失事件發(fā)生時,處理器每個時鐘內能夠處理與前端指令發(fā)射級寬度等量的指令。 運種方法忽略了對指令依賴、功能單元數量和種類、指令延遲、串行指令分布等因素的考 慮,是一種很粗粒度的假設;第二個階段認為亂序處理器穩(wěn)態(tài)下平均吞吐率與前端指令發(fā) 射級寬度、關鍵路徑長度、功能單元數目和種類相關,并認為平均吞吐率只受限于影響最大 的一個因素。該方法相比于第一種方法,考慮了更多影響平均吞吐率的因素,但局限于單一 的影響因素,沒有能夠考慮到各個要素之間的禪合關系。
[0004] 亂序處理器穩(wěn)態(tài)下的平均吞吐率是指在沒有缺失事件發(fā)生的情況下,平均每個時 鐘發(fā)射的指令數目。在指令并行度高且處理器后端功能單元充足的條件下,穩(wěn)態(tài)下平均吞 吐率等于前端指令發(fā)射級的寬度D,該參數也是理想狀態(tài)下的平均吞吐率。但當指令間存在 較強的依賴關系時,比如,后一條指令的執(zhí)行所需要的數據由前一條指令的執(zhí)行結果提供, 則平均每個時鐘能夠發(fā)射的指令數目減少,且隨著依賴鏈越長,越多,穩(wěn)態(tài)下平均吞吐率就 會越低。當處理器后端功能單元數目及種類不充足時,即使指令流本身有較高的并行度,硬 件單元受限于數目、種類W及執(zhí)行延遲的影響,也無法保證最高的平均吞吐率D。另外值得 注意的是,安卓系統(tǒng)中引入的串行指令058、018、158,也限制了穩(wěn)態(tài)下平均吞吐率,串行指 令要求在該指令之前的指令或者數據訪問必須全部完成,才能繼續(xù)執(zhí)行后續(xù)的指令,那么 即使在指令流本身并行度高且處理器后端功能單元充足的條件下,串行指令的分布也很大 程度上影響了穩(wěn)態(tài)下平均吞吐率。
[0005] 最后值得注意的是,穩(wěn)態(tài)下平均吞吐率的大小與各個影響因素之間并不是簡單的 單一作用關系,即各個因素之間的禪合效應也在影響著穩(wěn)態(tài)下平均吞吐率的大小,運無疑 加大了機理角度分析的難度。同時由于全仿真時間開銷過大,所W本發(fā)明針對上述問題提 出了一種基于人工神經網絡的亂序處理器穩(wěn)態(tài)下平均吞吐率的預測方法,用于快速準確地 預測穩(wěn)態(tài)下平均吞吐率
【發(fā)明內容】
[0006] 發(fā)明目的:為了克服現有技術中存在的不足,本發(fā)明提供一種基于人工神經網絡 的亂序處理器穩(wěn)態(tài)下平均吞吐率的預測方法,能夠根據微架構無關參數快速準確地預測亂 序處理器穩(wěn)態(tài)下平均吞吐率,且預測方法精度高、速度快。
[0007] 技術方案:為實現上述目的,本發(fā)明采用的技術方案為:
[0008] 一種基于人工神經網絡的亂序處理器穩(wěn)態(tài)下平均吞吐率的預測方法,包括如下步 驟:
[0009] (1)將指令集模擬器仿真時線程號切換的時間點作為片段分割的間斷點,從而將 整個目標程序劃分為若干片段,對所有片段按線程號進行劃分并排序,統(tǒng)計每個片段包含 的時鐘數,刪除時鐘數小于闊值(比如1000)的片段;
[0010] (2)對目標線程中保留下來的片段,利用指令集模擬器獲取每個片段的相關微架 構無關參數,所述微架構無關參數包括動態(tài)指令流混合比(浮點、定點、SIMD、Load/Store指 令的數目等)、關鍵路徑長度(針對處理器后端設計的不同,統(tǒng)計相應的關鍵路徑長度分布, 本專利統(tǒng)計關鍵路徑長度為1到40的數目分布)、串行化指令、前端發(fā)射指令速率(針對處理 器前端設計的不同,統(tǒng)計相應的發(fā)射指令數目分布,本專利統(tǒng)計發(fā)射指令數目為0到4的數 目分布)和目標線程的運行總時間;
[0011] (3)首先,考慮BP神經網絡對輸入數據的要求(動態(tài)指令流混合比、關鍵路徑長度 分布、串行化指令),對每個片段的相關微架構無關參數進行預處理,形成對應片段的相關 微架構無關參數向量;然后,通過主成分分析(PCA)對每個相關微架構無關參數向量進行降 維、去噪處理,形成對應片段的Mica化化數據集(微結構無關數據集)。
[0012] (4)對目標線程中保留下來的片段,首先,通過S0M(SelfO;rganizi^Fea1:ureMaps, 自組織映射網絡)將所有Mica化ta數據集分成N個大類(比如200個大類);然后,通過k-均值 聚類化means聚類)算法將第η個大類分成Μη個小類(一般每個小類的數目是大類里面片斷 數目的15% ),1含η含Ν;選取每個小類中離中屯、點距離最近的點作為該小類的特征點;步驟 (3)和步驟(4)的處理,使得在保留原始數據主要信息的前提下減少了 ΒΡ神經網絡模型訓練 的輸入數據并降低了 ΒΡ神經網絡模型訓練所需的時間;
[0013] (5)對目標線程中保留下來的片段,將所有特征點作為ΒΡ神經網絡的輸入,Β巧申經 網絡的輸出為目標線程的穩(wěn)態(tài)平均吞吐率,對ΒΡ神經網絡的輸入和輸出進行擬合,通過調 節(jié)ΒΡ神經網絡的迭代次數和訓練精度,訓練得到目標線程的ΒΡ神經網絡模型;
[0014] (6)ΒΡ神經網絡模型訓練完成后,通過指令集模擬器獲得其他待預測線程的微架 構無關參數信息,導入到訓練好的ΒΡ神經網絡模型中,即可快速準確地預測實際穩(wěn)態(tài)平均 吞吐率值;其他待預測線程包括目標程序中的線程,或者其他應用程序中的線程。
[0015] 具體的,所述步驟(5)中,Β巧巾經網絡有Ξ個隱含層,第一隱含層采用30個神經元, 第二隱含層采用15個神經元,第Ξ隱含層采用15個神經元;輸入層和第一隱含層之間、第一 隱含層和第二隱含層之間采用logsig傳遞函數,第二隱含層和第Ξ隱含層之間、第Ξ隱含 層和輸出層之間采用purelin傳遞函數,各層結點之間的權重值均使用trainscg(量化共輛 梯度法)進行調節(jié),訓練方法采用LM化e venbergMarquard)算法。
[0016] 有益效果:與現有的穩(wěn)態(tài)平均吞吐率的預測方法相比,本發(fā)明提供的基于人工神 經網絡的亂序處理器穩(wěn)態(tài)下平均吞吐率的預測方法,覆蓋了影響穩(wěn)態(tài)平均吞吐率的多個微 架構無關參數,其中包括:動態(tài)指令混合比,關鍵路徑長度分布,串行指令分布;此外,本發(fā) 明采用神經網絡對穩(wěn)態(tài)平均吞吐率進行預測,能夠充分地考慮到微架構無關參數之間的禪 合性,并且通過訓練好的模型能夠準確快速地預測到穩(wěn)態(tài)平均吞吐率的值。
【附圖說明】
[0017]圖巧采用本發(fā)明訓練Ann模型的具體流程圖;
[0018] 圖2為神經網絡模型訓練、測試的輸入與目標輸出框圖;
[0019] 圖3為神經網絡層級圖。
【具體實施方式】
[0020] 下面結合附圖對本發(fā)明作更進一步的說明。
[0021] -種基于人工神經網絡的亂序處理器穩(wěn)態(tài)下平均吞吐率的預測方法,包括如下步 驟: