国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      AI算力中心構建方法與流程

      文檔序號:40453994發(fā)布日期:2024-12-27 09:19閱讀:6來源:國知局
      AI算力中心構建方法與流程

      本發(fā)明涉及一種構建方法,更具體的說是涉及一種ai算力中心構建方法。


      背景技術:

      1、人工智能算力中心平臺建設為基于公司自用及業(yè)務鏈上下游企業(yè)租用,滿足3d數字資產創(chuàng)制的算力需求所建設的小型化人工智能算力中心。其建設內容包括人工智能算力平臺和ai技術服務平臺,其中人工智能算力平臺主要是購置并安裝服務器等硬件,為整個項目提供基礎的算力;ai技術服務平臺則主要是集成并開發(fā)適配于3d數字資產創(chuàng)制的的軟件,并通過調用人工智能算力平臺硬件的算力,向客戶提供服務。算力平臺和技術服務平臺為互補關系,共同構成人工智能算力中心。

      2、目前現有的ai算力中心的構建主要包括硬件平臺的建設和軟件平臺的建設,硬件平臺的建設無需多說,只需要將所需要的硬件進行連接,然后接通電源即可,核心在于軟件平臺的構建,通過構建的軟件平臺來分配算力中心的算力,以此更好的給企業(yè)服務,然而目前并沒有較為合適的軟件平臺的構建方法,以準確快速的實現ai算力中心構建。


      技術實現思路

      1、針對現有技術存在的不足,本發(fā)明的目的在于提供一種能夠準確快速的實現ai算力中心構建的ai算力中心構建方法。

      2、為實現上述目的,本發(fā)明提供了如下技術方案:一種ai算力中心構建方法,其特征在于:包括如下步驟:

      3、步驟一,構建ai算力使能子系統,用于面向ai計算集群子系統和使能硬件設備以及開發(fā)者,用于ai算法模型的開發(fā)、訓練;

      4、步驟二,構建ai大模型,用于供用戶做ai模型訓練任務;

      5、步驟三,構建運營系統,通過該運營系統聚合ai算力子系統、ai算力使能子系統、ai算力服務平臺、ai集群網絡與安全子系統、基礎平臺服務、安全防護服務和ai集群軟件服務,形成面向客戶的入口門戶。

      6、作為本發(fā)明的進一步改進,所述步驟一中構建的ai算力使能子系統包括:異構計算架構軟件,用于支撐開發(fā)者自定義算子開發(fā);

      7、ai框架軟件,用于提供給步驟二構建ai大模型。

      8、作為本發(fā)明的進一步改進,所述異構計算架構軟件包括:

      9、統一編程接口昇騰計算語言庫,用于提供統一、規(guī)范化的接口部件,包括device管理、context管理、stream管理、內存管理、模型加載與執(zhí)行、算子加載與執(zhí)行、媒體數據處理、graph管理這些api庫,為用戶提供使能各部件能力的編程接口,供用戶開發(fā)深度神經網絡應用;

      10、圖優(yōu)化和編譯模塊,用于對不同的前端提供統一的ir接口對接,支持tensorflow/caffe/mindspore表達的計算圖的解析/優(yōu)化/編譯,提供對后端計算引擎最優(yōu)化部署能力,充分發(fā)揮設備性能;

      11、計算執(zhí)行引擎,用于負責神經網絡各種類型算子的調度和執(zhí)行、內存等資源以及通信管理等,輸出計算結果;

      12、算子編譯模塊和算子庫,用于提供ascend算子開發(fā)和編譯能力,使能芯片能力;計算庫,用于提供神經網絡、基礎線性代數、集合通信、媒體數據預處理等計算庫,支持用戶使用、構建ai模型;

      13、計算調優(yōu)引擎,包含兩個插件,autotune插件,用于支持單算子以及整圖兩種調優(yōu)模式,可以根據模型、數據特征,自動化生成知識庫,并應用到實際部署過程以獲取高性能;模型壓縮插件,以框架插件形式提供模型量化、稀疏能力,支持calibration、retrain,實現模型的小型化。

      14、作為本發(fā)明的進一步改進,所述圖優(yōu)化和編譯模塊包括:

      15、ge模塊,該ge模塊作為圖編譯和運行的控制中心,提供圖運行環(huán)境管理、圖執(zhí)行引擎管理、算子庫管理、子圖優(yōu)化管理、圖操作管理和圖執(zhí)行控制;

      16、fe模塊,該fe模塊用于管理算子的融合規(guī)則、依據融合規(guī)則對irgraph進行匹配和算子融合操作、對系統支持的算子進行管理和維護算子列表、支持自定義算子;

      17、aicpue模塊,該aicpue模塊用于負責aicpu算子信息管理;

      18、hccl模塊,該hccl模塊用于負責hccl的算子信息管理,用于提供hccl實現參與并行計算的所有worker的梯度聚合功能,為ascend多機多卡訓練提供數據并行方案。

      19、作為本發(fā)明的進一步改進,所述計算庫包括:

      20、神經網絡庫,用于作為昇騰神經網絡加速庫,內置豐富算子,支撐神經網絡訓練和推理加速;

      21、基礎線性代數集,用以規(guī)范發(fā)布基礎線性代數操作的數值庫;

      22、集合通信庫,用于存儲hccl算子信息以負責hccl算子信息管理;

      23、媒體數據預處理模塊,用于實現視頻解碼、視頻編碼、jpeg解碼、jpeg編碼、png解碼、vpc,編解碼庫通過硬件加速進行圖像預處理,降低對cpu的使用,提升圖像預處理并行處理能力。

      24、作為本發(fā)明的進一步改進,所述步驟二構建的ai大模型包括:

      25、模型層,為用戶提供開箱即用的功能,該層包含預置的模型和開發(fā)套件以及圖神經網絡、深度概率編程、科學計算庫這些熱點研究領域拓展庫;

      26、表達層,為用戶提供ai模型開發(fā)、訓練、推理的接口,支持用戶用原生python語法開發(fā)和調試神經網絡,同時該層在生產和部署階段提供全場景統一的c++/python接口;

      27、編譯優(yōu)化層,該編譯優(yōu)化層作為ai框架的核心,以全場景統一中間表達為媒介,將前端表達編譯成執(zhí)行效率更高的底層語言,同時進行全局性能優(yōu)化,包括自動微分、代數化簡這些硬件無關優(yōu)化,以及圖算融合、算子生成這些硬件相關優(yōu)化;

      28、運行層,該運行層按照編譯優(yōu)化層編譯優(yōu)化的結果對接并調用底層硬件算子,同時通過“端-邊云”統一的運行時架構,支持包括聯邦學習在內的“端-邊-云”ai協同。

      29、作為本發(fā)明的進一步改進,所述編譯優(yōu)化層還包括有自動混合并行優(yōu)化步驟,具體包括數據并行、自動并行和異構并行,并行具體步驟如下:

      30、步驟1,每次開始進行并行訓練前,通過調用mindspore.communication.init接口初始化通信資源,并自動創(chuàng)建全局通信組world_comm_group;

      31、步驟2,將數據集在樣本維度拆分并下發(fā)到不同的卡上;

      32、步驟3,進行網絡構圖,其中該網絡構圖的書寫方式與單機網絡相同;

      33、步驟4,進行梯度計算,并在梯度計算以后插入分布式算子實現各卡間的梯度聚合操作;

      34、步驟5,以步驟4計算獲得的相同的梯度值一起進入參數更新步驟。

      35、作為本發(fā)明的進一步改進,所述步驟4中插入了分布式算子之后,以分布式算子為單位對張量進行切分建模,表示一個算子的輸入輸出張量如何分布到集群各個卡上,獲得張量排布模型。

      36、作為本發(fā)明的進一步改進,所述步驟4中每個算子都具有切分策略,所述切分策略由兩個元祖構成,分別表示input和weight的切分形式,其中元組中的元素與張量維度一一對應,2^n為切分份數,

      37、1表示不切,當用戶想表示一個數據并行切分策略時,即input的batch維度切分,其他維度不切,可以表達為strategy=((2^n,1,1),(1,1,1));當表示一個模型并行切分策略時,即weight的非batch維度切分,以channel維度切分為例,其他維度不切,可以表達為strategy=((1,1,1),(1,1,2^n));當表示一個混合并行切分策略時,其中一種切分策strategy=((2^n,1,1),(1,1,2^n))。

      38、作為本發(fā)明的進一步改進,所述步驟三中構建運營系統的具體步驟如下:

      39、步驟三一,部署算力模塊,在計算服務器上的云主機部署ai集群軟件服務的核心組件及其依賴服務;

      40、步驟三二,建立安全建設模塊,該安全建設模塊內存有項目經理、各職能部門及施工班組負責人信息,并在項目經理信息打上第一責任人標簽,各職能部門及施工班組負責人信息打上分級負責標簽,以供用戶查詢。

      41、本發(fā)明的有益效果,通過步驟一至步驟三的作用,便可有效的構建出ai算力中心,該ai算力中心滿足如下需求:

      42、算法訓練平臺:算法平臺可以異構兼容,即在不同的硬件、操作系統、網絡環(huán)境下都能正常運行。在通用算力cpu方面,可兼容x86/arm不同架構的cpu服務器;在算力方面,除了英偉達系列gpu外,可以同時兼容華為昇騰系列npu訓練芯片ascend910、fpga芯片等接入管理,方便企業(yè)用戶在構建異構算力集群時,底層算力芯片可進行多樣性選擇。

      43、算法推理平臺:算法推理平臺可以對推理服務器進行集群管理,算法統一下發(fā)與調用,也可以兼容國產與英偉達不同芯片體系,使集群的算力調度和使用可以達到一個立項的狀態(tài),在客戶調用算法時,可以做到完整高效。

      44、算法倉庫平臺:基于訓練平臺開發(fā)出來的算法,通過該平臺對外開放至市場端,客戶可以根據自己的需求使用saas化的算法服務,對外使用服務時,可以通過推理平臺來提供算力的調度和支持,算法倉庫可以根據客戶的需求,不斷地增加和調整,算法增加和調整都需要訓練算力的支持。

      45、數據自助建模軟件:采用可視化編程軟件,達到低代碼甚至無代碼開發(fā)的水平,可以根據客戶或者自己收集的數據,進行自助建模,無監(jiān)督學習等功能。

      當前第1頁1 2 
      網友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會獲得點贊!
      1