国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      一種監(jiān)控計算應用軟件運行效率的系統(tǒng)、裝置及方法

      文檔序號:7794644閱讀:174來源:國知局
      一種監(jiān)控計算應用軟件運行效率的系統(tǒng)、裝置及方法
      【專利摘要】本發(fā)明提供了一種監(jiān)控計算應用軟件運行效率的系統(tǒng)、裝置及方法,其中系統(tǒng)包括:超級計算機平臺在為計算應用程序運行裝置提供計算資源的同時,為監(jiān)控裝置提供實現監(jiān)控計算應用程序運行裝置效率的硬件資源;計算應用程序運行裝置在超級計算機平臺將相應的計算應用程序運行在主節(jié)點和從節(jié)點上;監(jiān)控裝置在超級計算機平臺的主節(jié)點和從節(jié)點上啟動各自的監(jiān)控器;根據從所有節(jié)點提取的物理參數和主節(jié)點發(fā)送的所有節(jié)點有效的監(jiān)控數據運算計算應用程序運行裝置的運行效率。本發(fā)明能夠確定計算應用程序的擴展性等,為實現應用性能最大化提供足夠數據指標依據。
      【專利說明】一種監(jiān)控計算應用軟件運行效率的系統(tǒng)、裝置及方法
      【技術領域】
      [0001]本發(fā)明涉及超級計算機及其運行的高性能計算應用軟件技術,尤其涉及監(jiān)控大型計算應用軟件運行效率的系統(tǒng)、裝置及方法。
      【背景技術】
      [0002]隨著人類社會的不斷進步,科學技術的發(fā)展,人們不但對自然界的認識越來越廣泛,而且對未知世界探索的需求也越來越迫切。這就使得人類掌握信息數據的量急劇性的增長;而與此同時,這些海量的信息數據都需要及時進行分析和處理。例如,一個大型天文射電望遠鏡陣列一秒鐘就能產生100GB以上的宇宙微波數據,這些數據都需要及時進行分析。再如,在粒子物理研究領域,一臺大型強子對撞機一次對撞的數據也是以TB為單位來計量的。此外,像人類基因組工程、石油勘探、天氣預報等領域也對計算能力提出了越來越高的要求。在這種技術發(fā)展的大背景下數值計算已然成為除實驗、理論分析之外的第三種極其重要的科學探索手段。正是基于這一現實,促使當今世界各科技強國都在不遺余力的大力發(fā)展超級計算機。如,在2013年6月發(fā)布的世界T0P500中,排名第一的中國“天河2號(Milky Way-2)超級計算機”就已經達到了 54.9PFlops的峰值速度。與此同時,新的百億億次超級計算機也已經在研究和規(guī)劃之中了??偟膩碚f,基本上每十年,超級計算機的速度就提升三個量級(1000倍),因此建造超級計算機的能力已經成為一個國家科技水平和綜合國力的有力體現。
      [0003]雖然超級計算機驚人的發(fā)展速度十分令人欣慰,但遺憾的是與之相配套的大型軟件技術卻裹足不前,這已經嚴重的制約了超級計算機應用能力的發(fā)揮?,F在絕大多數的應用軟件所基于的基本原理和數學算法,還是上世紀50?60年代提出和發(fā)展起來的,這些算法與當時的大型計算機是完全匹配和適應的,以串行或少量進程間并行為主。但經過50多年的發(fā)展,現在的超級計算機體系結構已經發(fā)生了翻天覆地的變化,動輒擁有幾十萬乃至上百萬的CPU核,而且還有相當一部分超級計算機是使用混合異構(CPU+GPU/MIC等)的體系架構,這就使得早期的物理模型和數學算法力不從心而無法勝任。這就是現在絕大多數運行在超級計算機上的應用軟件效率低下、可擴展性差的主要原因。
      [0004]要克服目前存在的技術難題,一方面,需大力研究和發(fā)展新的與現今超級計算機體系結構相匹配的物理模型和數學算法,這是突破現有技術瓶頸的終極手段,但這畢竟是一項極其困難的課題,無法在短時間內見到成效并實現大規(guī)模應用。另一方面,需著手研究目前所繼承下來的、海量的應用軟件,了解它們在現有高性能計算平臺上的運行效率特征,找出它們的性能瓶頸,最大限度的在現有平臺上發(fā)揮這些應用程序的潛在的性能;此外亦為應用程序性能的改進和瓶頸的突破提供有力的依據。因此,如何監(jiān)控大型應用軟件的運行效率,從而使得大型應用軟件合理、科學、快速以及高效地運行在超級計算機上,是亟待解決的課題。

      【發(fā)明內容】
      [0005]本發(fā)明所要解決的技術問題是提供一種監(jiān)控計算應用軟件運行效率的系統(tǒng)、裝置及方法,能夠使得計算應用軟件運行在合適的硬件平臺而提高運行效率。
      [0006]為了解決上述技術問題,本發(fā)明提供了一種監(jiān)控計算應用軟件運行效率的系統(tǒng),包括超級計算機平臺及其上的計算應用程序運行裝置和監(jiān)控裝置,其中:
      [0007]超級計算機平臺,用于在為計算應用程序運行裝置提供計算資源的同時,為監(jiān)控裝置提供實現監(jiān)控計算應用程序運行裝置效率的硬件資源;
      [0008]計算應用程序運行裝置,用于在超級計算機平臺將相應的計算應用程序運行在主節(jié)點和從節(jié)點上;
      [0009]監(jiān)控裝置,用于在超級計算機平臺的主節(jié)點和從節(jié)點上啟動各自的監(jiān)控器;根據從所有節(jié)點提取的物理參數和主節(jié)點發(fā)送的所有節(jié)點有效的監(jiān)控數據運算計算應用程序運行裝置的運行效率。
      [0010]進一步地,監(jiān)控裝置包括依次連接的監(jiān)控器啟閉模塊、節(jié)點監(jiān)控器模組、軟件運行效率計算模塊以及節(jié)點參數提取模塊,其中:
      [0011]監(jiān)控器啟閉模塊,用于根據超級計算機平臺的節(jié)點數分別將節(jié)點監(jiān)控器模組中的主節(jié)點監(jiān)控器和多個從節(jié)點監(jiān)控器啟動在超級計算機平臺運行計算應用程序的主節(jié)點、從節(jié)點上;
      [0012]節(jié)點監(jiān)控器模組,用于通過多個從節(jié)點監(jiān)控器發(fā)送所處從節(jié)點運行計算應用程序的監(jiān)控數據,由主節(jié)點監(jiān)控器接收所有從節(jié)點有效的監(jiān)控數據以及隨同所處主節(jié)點運行計算應用程序的監(jiān)控數據一起傳輸給軟件運行效率計算模塊;監(jiān)控數據包括浮點運算速度、有效使用指令數以及有效時鐘周期數;
      [0013]節(jié)點參數提取模塊`,用于提取超級計算機平臺運行計算應用程序的主節(jié)點、從節(jié)點的物理參數,包括CPU默認的時鐘頻率、所使用的指令集信息以及節(jié)點內CPU物理核心數;將提取的各節(jié)點的物理參數傳輸給軟件運行效率計算模塊;
      [0014]軟件運行效率計算模塊,用于根據各節(jié)點的物理參數計算各節(jié)點理論浮點運算速度和理論執(zhí)行指令時的最小時鐘周期數,并根據各個運行計算應用程序的節(jié)點的監(jiān)控數據計算出實測的浮點運算速度和實測的執(zhí)行指令時的最小時鐘周期數;根據計算結果運算出計算應用程序運行裝置運行所有計算應用程序的總體效率。
      [0015]進一步地,
      [0016]軟件運行效率計算模塊根據計算結果按如下公式運算出計算應用程序運行裝置運行所有計算應用程序的總體效率:
      [0017]
      【權利要求】
      1.一種監(jiān)控計算應用軟件運行效率的系統(tǒng),包括超級計算機平臺及其上的計算應用程序運行裝置,其特征在于,還包括超級計算機平臺上的監(jiān)控裝置,其中: 超級計算機平臺,用于在為計算應用程序運行裝置提供計算資源的同時,為監(jiān)控裝置提供實現監(jiān)控計算應用程序運行裝置效率的硬件資源; 計算應用程序運行裝置,用于在超級計算機平臺將相應的計算應用程序運行在主節(jié)點和從節(jié)點上; 監(jiān)控裝置,用于在超級計算機平臺的主節(jié)點和從節(jié)點上啟動各自的監(jiān)控器;根據從所有節(jié)點提取的物理參數和所述主節(jié)點發(fā)送的所有節(jié)點有效的監(jiān)控數據運算計算應用程序運行裝置的運行效率。
      2.按照權利要求1所述的系統(tǒng),其特征在于,所述監(jiān)控裝置包括依次連接的監(jiān)控器啟閉模塊、節(jié)點監(jiān)控器模組、軟件運行效率計算模塊以及節(jié)點參數提取模塊,其中: 監(jiān)控器啟閉模塊,用于根據超級計算機平臺的節(jié)點數分別將節(jié)點監(jiān)控器模組中的主節(jié)點監(jiān)控器和多個從節(jié)點監(jiān)控器啟動在超級計算機平臺運行計算應用程序的主節(jié)點、從節(jié)點上; 節(jié)點監(jiān)控器模組,用于通過多個從節(jié)點監(jiān)控器發(fā)送所處從節(jié)點運行計算應用程序的監(jiān)控數據,由主節(jié)點監(jiān)控器接收所有從節(jié)點有效的監(jiān)控數據以及隨同所處主節(jié)點運行計算應用程序的監(jiān)控數據一起傳輸給軟件運行效率計算模塊;監(jiān)控數據包括浮點運算速度、有效使用指令數以及有效時鐘周期數; 節(jié)點參數提取模塊,用于提取超級計算機平臺所述運行計算應用程序的主節(jié)點、從節(jié)點的物理參數,包括CPU默認的時鐘頻率、所使用的指令集信息以及節(jié)點內CPU物理核心數;將提取的各節(jié)點的物理參數傳輸給軟件運行效率計算模塊; 軟件運行效率計算模塊,用于根據所述各節(jié)點的物理參數計算各節(jié)點理論浮點運算速度和理論執(zhí)行指令時的最小時鐘周期數,并根據各個運行計算應用程序的節(jié)點的監(jiān)控數據計算出實測的浮點運算速度和實測的執(zhí)行指令時的最小時鐘周期數;根據計算結果運算出計算應用程序運行裝置運行所有計算應用程序的總體效率。
      3.按照權利要求2所述的系統(tǒng),其特征在于, 所述軟件運行效率計算模塊根據計算結果按如下公式運算出計算應用程序運行裝置運行所有計算應用程序的總體效率:
      4.按照權利要去3所述的系統(tǒng),其特征在于, 所述軟件運行效率計算模塊在完成所述所有計算應用程序的總體效率的運算后,報告運算結果,并向所述監(jiān)控器啟閉模塊輸出監(jiān)控器關閉指令; 所述監(jiān)控器啟閉模塊根據輸入的所述監(jiān)控器關閉指令關閉所有監(jiān)控器。
      5.一種用在權利要求1所述的系統(tǒng)中的計算應用程序運行裝置,其特征在于,包括依次連接的監(jiān)控器啟閉模塊、節(jié)點監(jiān)控器模組、軟件運行效率計算模塊以及節(jié)點參數提取模塊,其中: 監(jiān)控器啟閉模塊,用于根據超級計算機平臺的節(jié)點數分別將節(jié)點監(jiān)控器模組中的主節(jié)點監(jiān)控器和多個從節(jié)點監(jiān)控器啟動在超級計算機平臺運行計算應用程序的主節(jié)點、從節(jié)點上; 節(jié)點監(jiān)控器模組,用于通過多個從節(jié)點監(jiān)控器發(fā)送所處從節(jié)點運行計算應用程序的監(jiān)控數據,由主節(jié)點監(jiān)控器接收所有從節(jié)點有效的監(jiān)控數據以及隨同所處主節(jié)點運行計算應用程序的監(jiān)控數據一起傳輸給軟件運行效率計算模塊;監(jiān)控數據包括浮點運算速度、有效使用指令數以及有效時鐘周期數; 節(jié)點參數提取模塊,用于提取超級計算機平臺所述運行計算應用程序的主節(jié)點、從節(jié)點的物理參數,包括CPU默認的時鐘頻率、所使用的指令集信息以及節(jié)點內CPU物理核心數;將提取的各節(jié)點的物理參數傳輸給軟件運行效率計算模塊; 軟件運行效率計算模塊,用于根據所述各節(jié)點的物理參數計算各節(jié)點理論浮點運算速度和理論執(zhí)行指令時的最小時鐘周期數,并根據各個運行計算應用程序的節(jié)點的監(jiān)控數據計算出實測的浮點運算速度和實測的執(zhí)行指令時的最小時鐘周期數;根據計算結果運算出計算應用程序運行裝置運行所有計算應用程序的總體效率。
      6.按照權利要求5所述的裝置,其特征在于,所述軟件運行效率計算模塊根據計算結果按如下公式運算出計算應用程序運行裝置運行所有計算應用程序的總體效率:

      7.按照權利要求6所述的裝置,其特征在于, 所述軟件運行效率計算模塊在完成所述所有計算應用程序的總體效率的運算后,報告運算結果,并向所述監(jiān)控器啟閉模塊輸出監(jiān)控器關閉指令; 所述監(jiān)控器啟閉模塊根據輸入的所述監(jiān)控器關閉指令關閉所有監(jiān)控器。
      8.—種監(jiān)控計算應用軟件運行效率的方法,涉及超級計算機平臺上的監(jiān)控裝置,該方法包括: 確定計算應用軟件和監(jiān)控裝置運行的超級計算機平臺,部署軟件環(huán)境; 在確定的超級計算機平臺上將相應的監(jiān)控器啟動在運行計算應用程序的主、從節(jié)點上;根據從所有節(jié)點提取的物理參數和主節(jié)點發(fā)送的所有節(jié)點有效的監(jiān)控數據運算計算應用程序運行裝置的運行效率。
      9.按照權利要求8所述的方法,其特征在于,根據從所有節(jié)點提取的物理參數和主節(jié)點發(fā)送的所有節(jié)點有效的監(jiān)控數據運算計算應用程序運行裝置的運行效率,具體包括: 根據從各節(jié)點提取的物理參數計算各節(jié)點理論浮點運算速度和理論執(zhí)行指令時的最小時鐘周期數; 根據各個運行計算應用程序的節(jié)點的監(jiān)控數據計算出實測的浮點運算速度和實測的執(zhí)行指令時的最小時鐘周期數;所述監(jiān)控數據包括浮點運算速度、有效使用指令數以及有效時鐘周期數; 根據計算結果按如下公式運算出計算應用程序運行裝置運行所有計算應用程序的總體效率:
      10.按照權利要求9所述的方法,其特征在于,還包括: 在完成所有計算應用程序的總體效率的所述運算后,報告運算結果,并關閉所有監(jiān)控器。
      【文檔編號】H04L12/26GK103716210SQ201410007120
      【公開日】2014年4月9日 申請日期:2014年1月7日 優(yōu)先權日:2014年1月7日
      【發(fā)明者】劉羽, 金蓮, 呂文靜, 于濤 申請人:浪潮(北京)電子信息產業(yè)有限公司
      網友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會獲得點贊!
      1