本發(fā)明涉及算力調(diào)度,尤其是涉及一種算力調(diào)度方法及裝置。
背景技術(shù):
1、智能算力平臺(tái)作為推動(dòng)我國乃至全球數(shù)字化與智能化轉(zhuǎn)型的核心驅(qū)動(dòng)力,其構(gòu)建與普及無疑為經(jīng)濟(jì)社會(huì)的發(fā)展奠定了堅(jiān)實(shí)的基礎(chǔ)。然而,在享受其帶來的前所未有的計(jì)算能力與效率提升的同時(shí),我們也必須正視其快速發(fā)展過程中所暴露出的多維度問題與嚴(yán)峻挑戰(zhàn)。以下從算力資源、能耗、技術(shù)復(fù)雜度、生態(tài)系統(tǒng)、數(shù)據(jù)安全與隱私等方面進(jìn)行詳細(xì)分析。
2、隨著大數(shù)據(jù)、人工智能(ai)、物聯(lián)網(wǎng)(iot)等技術(shù)的快速發(fā)展,全球?qū)λ懔Y源的需求持續(xù)激增。這種需求不僅體現(xiàn)在數(shù)量上,也體現(xiàn)在對(duì)高性能計(jì)算和智能化處理的要求上。然而,現(xiàn)有的算力供給并未能完全滿足快速增長的需求,導(dǎo)致算力資源供不應(yīng)求。
3、大規(guī)模ai模型的訓(xùn)練和推理需要強(qiáng)大的算力支持。比如,深度學(xué)習(xí)領(lǐng)域中的模型訓(xùn)練任務(wù)通常需要處理龐大的數(shù)據(jù)集,并需要進(jìn)行反復(fù)計(jì)算。這些任務(wù)對(duì)計(jì)算設(shè)備的性能要求非常高,尤其是gpu、tpu等專用芯片。隨著算法復(fù)雜度的增加,尤其是在多模態(tài)和生成式模型(如gpt-4、dall-e等)的發(fā)展下,對(duì)算力的需求已呈指數(shù)級(jí)增長。盡管中國通過“東數(shù)西算”工程等政策手段優(yōu)化算力資源的區(qū)域配置,但仍然難以完全解決全國范圍內(nèi)的算力短缺問題。
4、算力資源的分布不均是一個(gè)亟待解決的問題。盡管中國在東部地區(qū)建設(shè)了多個(gè)高性能數(shù)據(jù)中心,但這些中心面臨巨大的算力需求壓力。而西部地區(qū)由于資源豐富且氣候條件適宜,更適合建設(shè)大型數(shù)據(jù)中心和智算中心,但其算力的利用率尚未得到充分發(fā)揮。
技術(shù)實(shí)現(xiàn)思路
1、有鑒于此,本發(fā)明的目的在于提供一種算力調(diào)度方法及裝置,可以對(duì)算力進(jìn)行更有效的調(diào)度,提升算力的利用率。
2、為了實(shí)現(xiàn)上述目的,本發(fā)明實(shí)施例采用的技術(shù)方案如下:
3、第一方面,本發(fā)明實(shí)施例提供了一種算力調(diào)度方法,應(yīng)用于算力調(diào)度平臺(tái),算力調(diào)度平臺(tái)用于對(duì)算力供應(yīng)側(cè)的算力資源進(jìn)行調(diào)度,以便為算力需求側(cè)提供算力服務(wù),該方法包括:接收來自算力需求側(cè)的算力調(diào)度請(qǐng)求,算力調(diào)度請(qǐng)求包括算力資源的需求量以及業(yè)務(wù)應(yīng)用的標(biāo)識(shí)以及業(yè)務(wù)類型標(biāo)識(shí);基于預(yù)先確定的匹配規(guī)則,在備選的調(diào)度算法中確定與算力調(diào)度請(qǐng)求匹配的目標(biāo)調(diào)度算法,備選的調(diào)度算法包括下述算法中的一種或多種:用戶體驗(yàn)優(yōu)先調(diào)度算法、資源利用率優(yōu)先調(diào)度算法、距離優(yōu)先調(diào)度算法;基于預(yù)先確定的匹配規(guī)則,在備選的調(diào)度算法中確定與算力調(diào)度請(qǐng)求匹配的目標(biāo)調(diào)度算法包括:基于歷史的流量負(fù)載變化,進(jìn)行多模型自適應(yīng)的流量預(yù)測(cè),得到當(dāng)前時(shí)刻的流量預(yù)測(cè)結(jié)果;基于當(dāng)前時(shí)刻的流量預(yù)測(cè)結(jié)果,以及匹配規(guī)則,在備選的調(diào)度算法中確定與算力調(diào)度請(qǐng)求匹配的目標(biāo)調(diào)度算法;基于目標(biāo)調(diào)度算法以及算力調(diào)度請(qǐng)求對(duì)算力供應(yīng)側(cè)的算力資源進(jìn)行調(diào)度。
4、在一些可能的實(shí)現(xiàn)中,用戶體驗(yàn)優(yōu)先調(diào)度算法應(yīng)用于對(duì)響應(yīng)時(shí)間和服務(wù)質(zhì)量要求較高的場(chǎng)景;用戶體驗(yàn)優(yōu)先調(diào)度算法基于如下公式確定:
5、
6、其中,priority(ri)表示請(qǐng)求ri的優(yōu)先級(jí),t(ri)為請(qǐng)求ri的響應(yīng)時(shí)間;響應(yīng)時(shí)間越短,優(yōu)先級(jí)越高,從而保證關(guān)鍵任務(wù)得到快速響應(yīng);
7、資源利用率優(yōu)先調(diào)度算法以最大化資源的使用效率為目標(biāo),適用于需要均衡系統(tǒng)資源分配的場(chǎng)景;資源利用率優(yōu)先調(diào)度算法的公式為:
8、
9、其中,u(nj)為節(jié)點(diǎn)nj的資源利用率,c(nj)為當(dāng)前節(jié)點(diǎn)的已分配資源量,t(nj)為節(jié)點(diǎn)總資源容量;將優(yōu)先選擇u(nj)最小的節(jié)點(diǎn)進(jìn)行任務(wù)調(diào)度,從而實(shí)現(xiàn)資源利用最大化;
10、距離優(yōu)先調(diào)度算法基于請(qǐng)求任務(wù)和資源節(jié)點(diǎn)的物理或網(wǎng)絡(luò)距離進(jìn)行調(diào)度,該算法適用于分布式網(wǎng)絡(luò)環(huán)境,能夠有效降低延遲,提升服務(wù)響應(yīng)速度;距離優(yōu)先調(diào)度算法的公式為:
11、
12、其中,d(ri,nj)表示請(qǐng)求ri與節(jié)點(diǎn)nj之間的距離,距離越小,優(yōu)先級(jí)越高,確保任務(wù)被分配給最近的可用節(jié)點(diǎn)。
13、在一些可能的實(shí)現(xiàn)中,基于歷史的流量負(fù)載變化,進(jìn)行多模型自適應(yīng)的流量預(yù)測(cè),得到當(dāng)前時(shí)刻的流量預(yù)測(cè)結(jié)果,包括:
14、基于預(yù)先訓(xùn)練的預(yù)測(cè)模型,根據(jù)歷史的流量負(fù)載變化,進(jìn)行多模型自適應(yīng)的流量預(yù)測(cè),得到當(dāng)前時(shí)刻的流量預(yù)測(cè)結(jié)果;
15、其中,預(yù)測(cè)模型包括嵌入層、分解模塊和時(shí)序依賴發(fā)現(xiàn)模塊;分解模塊包含季節(jié)趨勢(shì)分解模塊和頻率分解模塊;時(shí)序依賴發(fā)現(xiàn)模塊包括頻率自適應(yīng)注意力和對(duì)齊頻率注意力;編碼器由頻率分解模塊和faa組成;輸入的時(shí)間序列首先通過頻率分解模塊被分解為高頻和低頻分量;在數(shù)據(jù)進(jìn)入解碼器之前,會(huì)經(jīng)過季節(jié)趨勢(shì)分解,以提取趨勢(shì)和季節(jié)性部分;趨勢(shì)和季節(jié)性部分的后一半作為輸入模型,提供最近的歷史信息;解碼器結(jié)合了faa、頻率分解模塊和afa;這些組件提取低頻分量并將其與趨勢(shì)部分結(jié)合,去除低頻分量影響的高頻分量與編碼器中對(duì)齊的高頻分量一起輸入afa模塊,捕捉時(shí)序依賴,預(yù)測(cè)模型的最終輸出是低頻分量和高頻分量的疊加。
16、在一些可能的實(shí)現(xiàn)中,當(dāng)前時(shí)刻的流量預(yù)測(cè)結(jié)果包括當(dāng)前時(shí)刻的多種預(yù)測(cè)窗口的預(yù)測(cè)結(jié)果。
17、在一些可能的實(shí)現(xiàn)中,歷史的流量負(fù)載變化包括業(yè)務(wù)應(yīng)用的標(biāo)識(shí)以及業(yè)務(wù)類型標(biāo)識(shí)對(duì)應(yīng)的歷史的流量負(fù)載變化、以及系統(tǒng)內(nèi)全量的歷史的流量負(fù)載變化。
18、在一些可能的實(shí)現(xiàn)中,算力資源包括系統(tǒng)內(nèi)資源和系統(tǒng)外資源,系統(tǒng)外資源包括第三方云計(jì)算資源,當(dāng)系統(tǒng)內(nèi)資源無法滿足需求時(shí),調(diào)用外部的系統(tǒng)外資源來補(bǔ)充算力。
19、第二方面,提供了一種算力調(diào)度裝置。應(yīng)用于算力調(diào)度平臺(tái),算力調(diào)度平臺(tái)用于對(duì)算力供應(yīng)側(cè)的算力資源進(jìn)行調(diào)度,以便為算力需求側(cè)提供算力服務(wù),裝置包括:
20、接收模塊,用于接收來自算力需求側(cè)的算力調(diào)度請(qǐng)求,算力調(diào)度請(qǐng)求包括算力資源的需求量以及業(yè)務(wù)應(yīng)用的標(biāo)識(shí)以及業(yè)務(wù)類型標(biāo)識(shí);
21、匹配模塊,用于基于預(yù)先確定的匹配規(guī)則,在備選的調(diào)度算法中確定與算力調(diào)度請(qǐng)求匹配的目標(biāo)調(diào)度算法,備選的調(diào)度算法包括下述算法中的一種或多種:用戶體驗(yàn)優(yōu)先調(diào)度算法、資源利用率優(yōu)先調(diào)度算法、距離優(yōu)先調(diào)度算法;匹配模塊具體用于:基于歷史的流量負(fù)載變化,進(jìn)行多模型自適應(yīng)的流量預(yù)測(cè),得到當(dāng)前時(shí)刻的流量預(yù)測(cè)結(jié)果;基于當(dāng)前時(shí)刻的流量預(yù)測(cè)結(jié)果,以及匹配規(guī)則,在備選的調(diào)度算法中確定與算力調(diào)度請(qǐng)求匹配的目標(biāo)調(diào)度算法;
22、調(diào)度模塊,用于基于目標(biāo)調(diào)度算法以及算力調(diào)度請(qǐng)求對(duì)算力供應(yīng)側(cè)的算力資源進(jìn)行調(diào)度。
23、第三方面,本發(fā)明實(shí)施例提供了一種電子設(shè)備,包括處理器和存儲(chǔ)器,存儲(chǔ)器存儲(chǔ)有能夠被處理器執(zhí)行的計(jì)算機(jī)可執(zhí)行指令,處理器執(zhí)行計(jì)算機(jī)可執(zhí)行指令以實(shí)現(xiàn)上述第一方面提供的任一項(xiàng)的方法的步驟。
24、第四方面,本發(fā)明實(shí)施例提供了一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)上存儲(chǔ)有計(jì)算機(jī)程序,計(jì)算機(jī)程序被處理器運(yùn)行時(shí)執(zhí)行上述第一方面提供的任一項(xiàng)的方法的步驟。
25、本發(fā)明實(shí)施例帶來了以下有益效果:
26、本發(fā)明實(shí)施例提供的上述算力調(diào)度方法及裝置,通過接收來自算力需求側(cè)的算力調(diào)度請(qǐng)求,基于預(yù)先確定的匹配規(guī)則,在備選的調(diào)度算法中確定與算力調(diào)度請(qǐng)求匹配的目標(biāo)調(diào)度算法,基于目標(biāo)調(diào)度算法以及算力調(diào)度請(qǐng)求對(duì)算力供應(yīng)側(cè)的算力資源進(jìn)行調(diào)度。以此可以對(duì)算力進(jìn)行更有效的調(diào)度,提升算力的利用率。
27、本發(fā)明的其他特征和優(yōu)點(diǎn)將在隨后的說明書中闡述,并且,部分地從說明書中變得顯而易見,或者通過實(shí)施本發(fā)明而了解。本發(fā)明的目的和其他優(yōu)點(diǎn)在說明書、權(quán)利要求書以及附圖中所特別指出的結(jié)構(gòu)來實(shí)現(xiàn)和獲得。
28、為使本發(fā)明的上述目的、特征和優(yōu)點(diǎn)能更明顯易懂,下文特舉較佳實(shí)施例,并配合所附附圖,作詳細(xì)說明如下。