一種基于可擴展和高性能計算的分布式管理架構(gòu)及方法與流程

文檔序號：12553913閱讀：630來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>電子通信裝置的制造及其應(yīng)用技術(shù)

本發(fā)明涉及一種基于可擴展和高性能計算的分布式管理架構(gòu)及方法。

背景技術(shù)：

目前，業(yè)界對于高性能計算系統(tǒng)大都是采用基于集中式管理架構(gòu)，即將所有的高性能計算卡集中在一起進(jìn)行運算管理，這種架構(gòu)存在很多問題。

資源不能快速部署，進(jìn)而不能靈活提高其運算的能力。

資源利用率不高，當(dāng)分布式計算機不在工作時，大量空閑計算資源未被利用。

傳統(tǒng)架構(gòu)其高昂的硬件成本也限定了其擴展能力。

針對目前主流的集中式管理架構(gòu)，顯然不能滿足其未來更大數(shù)據(jù)的計算要求。

本發(fā)明的目的在于提供一種基于可擴展、高性能計算的分布式管理架構(gòu),有效解決了其存在的問題。

技術(shù)實現(xiàn)要素：

本發(fā)明目的是針對現(xiàn)有技術(shù)存在的缺陷提供一種基于可擴展和高性能計算的分布式管理架構(gòu)及方法。

本發(fā)明為實現(xiàn)上述目的，采用如下技術(shù)方案：一種基于可擴展和高性能計算的分布式管理架構(gòu)，其主要由集成管理系統(tǒng)、集中式管理系統(tǒng)和分布式管理系統(tǒng)構(gòu)成，所述集成管理系統(tǒng)與所述集中式管理系統(tǒng)通過局域網(wǎng)網(wǎng)絡(luò)連接，所述集成管理系統(tǒng)與所述分布式管理系統(tǒng)通過局域網(wǎng)網(wǎng)絡(luò)連接；其中，所述集中式管理系統(tǒng)主要由多個設(shè)置有高性能的科學(xué)計算卡的服務(wù)器構(gòu)成，由服務(wù)器集中管理所有的科學(xué)計算卡，并統(tǒng)一運算；所述分布式管理系統(tǒng)由多個設(shè)置有高性能的科學(xué)計算卡的普通計算機構(gòu)成，通過服務(wù)器集中管理所有的科學(xué)計算卡，并統(tǒng)一運算。

進(jìn)一步的，所述集成管理系統(tǒng)、集中式管理系統(tǒng)和分布式管理系統(tǒng)中均設(shè)置有cpu處理器單元、存儲單元、電源單元和網(wǎng)絡(luò)通信單元。

進(jìn)一步的，所述科學(xué)計算卡為GPU高性能計算卡和/或FPGA高性能計算卡和/或混合架構(gòu)高性能計算卡。

進(jìn)一步的，所述科學(xué)計算卡包括六個子系統(tǒng)，分別為外接口通信系統(tǒng)、擬態(tài)計算系統(tǒng)、擬態(tài)管理系統(tǒng)、存儲管理系統(tǒng)、供電系統(tǒng)和散熱系統(tǒng)；所述外接口通信系統(tǒng)與所述擬態(tài)計算系統(tǒng)通訊連接，所述擬態(tài)計算系統(tǒng)與所述擬態(tài)管理系統(tǒng)通訊連接，所述擬態(tài)管理系統(tǒng)與所述存儲管理系統(tǒng)通訊連接；其中，所述外接口通信系統(tǒng)用于將外接口及時序轉(zhuǎn)化為通用的局部總線接口及時序；所述擬態(tài)計算系統(tǒng)將需要運算的數(shù)據(jù)通過相對應(yīng)的算法轉(zhuǎn)化為數(shù)據(jù)結(jié)果，并進(jìn)行處理；所述擬態(tài)管理系統(tǒng)有多片功能完全相同的計算節(jié)點；所述存儲管理系統(tǒng)采用多片計算資源及高性能存儲器，每片計算節(jié)點連接多片IO獨立的存儲芯片，芯片中可存放海量數(shù)據(jù)；所述供電系統(tǒng)對科學(xué)計算卡上所有子系統(tǒng)進(jìn)行供電；所述散熱系統(tǒng)對科學(xué)計算卡上所有子系統(tǒng)進(jìn)行散熱，減少熱量，防止板卡過熱導(dǎo)致科學(xué)計算卡功能異常。

進(jìn)一步的，所述外接口通信系統(tǒng)連接計算機的PCI-e插槽、RJ45網(wǎng)口、PCI插槽、ATCA、RS232或RS485串口總線。

一種基于可擴展和高性能計算的分布式管理方法，包括如下步驟：

步驟一、得到用戶下發(fā)的任務(wù)；

步驟二、通過主控器對并發(fā)業(yè)務(wù)進(jìn)行性能評估、功能評估和優(yōu)先級評估；

步驟三、經(jīng)步驟二評估后即生成優(yōu)化資源配置，將任務(wù)拆分以達(dá)到各節(jié)點負(fù)載均衡；

步驟四、服務(wù)系統(tǒng)通過網(wǎng)絡(luò)通信接口下發(fā)到相應(yīng)的分布運算節(jié)點進(jìn)行處理。

本發(fā)明的有益效果：

1)、相較于安裝難度較大的專用服務(wù)器，本發(fā)明分布式管理架構(gòu)，各節(jié)點就是日常使用的普通電腦，無需專業(yè)人員，可實現(xiàn)靈活部署。

2)、對比成本動輒幾十萬的專用服務(wù)器，本發(fā)明分布式管理架構(gòu)成本更低，且在更低成本的條件下運算能力優(yōu)于專用服務(wù)器。

3)、專用服務(wù)器超過10臺以上，考慮到性能和散熱，需要配置專業(yè)制冷設(shè)備，無形中增加了成本，本發(fā)明分布式架構(gòu)則無需考慮散熱問題。

4)、本發(fā)明分布式運維及管理方式更為簡單，單個運算節(jié)點的宕機不會造成整個系統(tǒng)的癱瘓，有效規(guī)避了單點失效問題，通過負(fù)載均衡以保證整個系統(tǒng)的穩(wěn)定性。

5)本發(fā)明分布式管理對單個運算節(jié)點的硬件要求很低，可以有效利用各種空閑的資源，大大提高了普通電腦的利用率。

附圖說明

圖1為本發(fā)明的系統(tǒng)整體結(jié)構(gòu)示意圖。

圖2為本發(fā)明的系統(tǒng)具體結(jié)構(gòu)示意圖。

圖3為本發(fā)明的系統(tǒng)架構(gòu)原理圖。

圖4為本發(fā)明的系統(tǒng)中科學(xué)計算卡結(jié)構(gòu)示意圖。

圖5為本發(fā)明的系統(tǒng)中管理端程序單元結(jié)構(gòu)圖。

圖6為本發(fā)明的系統(tǒng)中為設(shè)備節(jié)點程序結(jié)構(gòu)圖。

具體實施方式

圖1至圖2所示，涉及一種基于可擴展和高性能計算的分布式管理架構(gòu)，其主要由集成管理系統(tǒng)、集中式管理系統(tǒng)和分布式管理系統(tǒng)構(gòu)成，所述集成管理系統(tǒng)與所述集中式管理系統(tǒng)通過局域網(wǎng)網(wǎng)絡(luò)連接，所述集成管理系統(tǒng)與所述分布式管理系統(tǒng)通過局域網(wǎng)網(wǎng)絡(luò)連接；其中，所述集中式管理系統(tǒng)主要由多個設(shè)置有高性能的科學(xué)計算卡的服務(wù)器構(gòu)成，由服務(wù)器集中管理所有的科學(xué)計算卡，并統(tǒng)一運算；所述分布式管理系統(tǒng)由多個設(shè)置有高性能的科學(xué)計算卡的普通計算機構(gòu)成，通過服務(wù)器集中管理所有的科學(xué)計算卡，并統(tǒng)一運算。

工作原理:集成式管理系統(tǒng)在接收了用戶提交的任務(wù)之后，根據(jù)各個節(jié)點的科學(xué)計算資源，將任務(wù)分配到集中式管理系統(tǒng)和分布式管理系統(tǒng)中的運算節(jié)點上進(jìn)行運算；對于集中式管理系統(tǒng)，集成管理系統(tǒng)按照算法特征分析算法，找到最匹配最合適的科學(xué)計算資源，直接分配到指定的設(shè)備上進(jìn)行運算；對于分布式管理系統(tǒng)，集成管理系統(tǒng)將原始任務(wù)分為多個子任務(wù)，系統(tǒng)中每個分布式運算節(jié)點通過網(wǎng)絡(luò)與管理系統(tǒng)相互通信，集成管理系統(tǒng)通過每個分布式運算節(jié)點反饋的任務(wù)狀態(tài)來協(xié)調(diào)整個系統(tǒng)以達(dá)到最高的效率；最后某個節(jié)點得到結(jié)果反饋給集成管理系統(tǒng)，得到結(jié)果。

圖3中集成管理系統(tǒng)主要由cpu處理器單元，存儲單元，電源單元，和網(wǎng)絡(luò)通信單元構(gòu)成，系統(tǒng)通過管理端程序?qū)λ惴üπП群湍苄П冗M(jìn)行分析，得到任務(wù)分片規(guī)則，通過網(wǎng)絡(luò)通信單元下發(fā)任務(wù)到交換機上，交換機發(fā)送任務(wù)到指定的設(shè)備節(jié)點。

集中式管理系統(tǒng)中設(shè)置有集中式管理架構(gòu)設(shè)備節(jié)點，分布式管理系統(tǒng)中設(shè)置有分布式管理架構(gòu)設(shè)備節(jié)點，上述設(shè)備節(jié)點中均設(shè)置有cpu處理器單元，存儲單元，電源單元，網(wǎng)絡(luò)通信單元和科學(xué)計算卡。設(shè)備節(jié)點中的網(wǎng)絡(luò)單元和交換機連接，得到分配得到的任務(wù)。設(shè)備節(jié)點中的cpu處理器單元和科學(xué)計算單元混合異構(gòu)實現(xiàn)科學(xué)高性能運算。設(shè)備節(jié)點中的科學(xué)計算卡分為fpga科學(xué)計算卡和/或gpu科學(xué)計算卡和/或dsp科學(xué)計算卡。

圖4為科學(xué)計算卡的具體結(jié)構(gòu)示意圖。具體的，所述科學(xué)計算卡包括六個子系統(tǒng)，分別為外接口通信系統(tǒng)、擬態(tài)計算系統(tǒng)、擬態(tài)管理系統(tǒng)、存儲管理系統(tǒng)、供電系統(tǒng)和散熱系統(tǒng)；所述外接口通信系統(tǒng)與所述擬態(tài)計算系統(tǒng)通訊連接，所述擬態(tài)計算系統(tǒng)與所述擬態(tài)管理系統(tǒng)通訊連接，所述擬態(tài)管理系統(tǒng)與所述存儲管理系統(tǒng)通訊連接；其中，所述外接口通信系統(tǒng)用于將外接口及時序轉(zhuǎn)化為通用的局部總線接口及時序；所述擬態(tài)計算系統(tǒng)將需要運算的數(shù)據(jù)通過相對應(yīng)的算法轉(zhuǎn)化為數(shù)據(jù)結(jié)果，并進(jìn)行處理；所述擬態(tài)管理系統(tǒng)有多片功能完全相同的計算節(jié)點；所述存儲管理系統(tǒng)采用多片計算資源及高性能存儲器，每片計算節(jié)點連接多片IO獨立的存儲芯片，芯片中可存放海量數(shù)據(jù)；所述供電系統(tǒng)對科學(xué)計算卡上所有子系統(tǒng)進(jìn)行供電；所述散熱系統(tǒng)對科學(xué)計算卡上所有子系統(tǒng)進(jìn)行散熱，減少熱量，防止板卡過熱導(dǎo)致科學(xué)計算卡功能異常。

其中，所述外接口通信系統(tǒng)連接計算機的PCI-e插槽、RJ45網(wǎng)口、PCI插槽、ATCA、RS232或RS485等串口總線。

本發(fā)明系統(tǒng)的科學(xué)計算卡具有高度安全性能、可靈活性的、可執(zhí)行高密度運算且高效。作為基于服務(wù)器的數(shù)據(jù)處理設(shè)備，該科學(xué)計算卡可以實現(xiàn)數(shù)據(jù)的海量數(shù)據(jù)處理。強大的計算節(jié)點處理性能，可以實現(xiàn)億門級的硬件加速，方便用戶進(jìn)行復(fù)雜的邏輯處理與算法運算。

并發(fā)業(yè)務(wù)中的圖像、計算和通信業(yè)務(wù)經(jīng)過后臺下載放入上控點，上控點中的業(yè)務(wù)由主控器和執(zhí)行通過通訊總線(PCIE/PCI)將并發(fā)業(yè)務(wù)分配到相應(yīng)合適的擬態(tài)計算板卡進(jìn)行處理。

該科學(xué)計算卡的計算節(jié)點資源種類包括(1)CPU、(2)嵌入式CPU、(3)DSP、(4)GPU、(5)嵌入式GPU、(6)FPGA、(7)CPLD和(8)ASCI chip，并支持行業(yè)標(biāo)準(zhǔn)的外圍設(shè)備、連接器以及豐富的接口，滿足需要海量計算和通信的需求。

圖5所示為集成管理系統(tǒng)中管理端程序單元結(jié)構(gòu)圖。其中，管理端服務(wù)器根據(jù)業(yè)務(wù)特點的不同從硬件和軟件層面自動或半自動的配置成高性效比模式。

具體的，本發(fā)明的分布式管理方法的流程如下：

步驟一、得到用戶下發(fā)的任務(wù)；

步驟二、通過主控器對并發(fā)業(yè)務(wù)進(jìn)行性能評估、功能評估和優(yōu)先級評估；

步驟三、經(jīng)步驟二評估后即生成優(yōu)化資源配置，將任務(wù)拆分以達(dá)到各節(jié)點負(fù)載均衡；

步驟四、服務(wù)系統(tǒng)通過網(wǎng)絡(luò)通信接口下發(fā)到相應(yīng)的分布運算節(jié)點進(jìn)行處理。

具體的，所述的優(yōu)化資源配置為通過能效比和供銷比最佳來自動選擇設(shè)備資源數(shù)據(jù)運算；

圖6為設(shè)備節(jié)點程序結(jié)構(gòu)圖。

實例1：任務(wù)一的算法2個基礎(chǔ)算核組成，分別為sha1算核和aes128算核。

步驟1：用戶上傳任務(wù)到管理端，管理端分析任務(wù)一，通過計算各運算節(jié)點的運算資源，得到在節(jié)點一運行總?cè)蝿?wù)的30％，節(jié)點二運行總?cè)蝿?wù)的70％的情況下，可以達(dá)到負(fù)載均衡。

步驟2：通過任務(wù)下發(fā)單元，將任務(wù)的30％通過網(wǎng)絡(luò)端口下發(fā)到運算節(jié)點一，將任務(wù)的70％通過網(wǎng)絡(luò)端口下發(fā)到運算節(jié)點二。

步驟3：設(shè)備節(jié)點接收到數(shù)據(jù)后，將任務(wù)交由科學(xué)計算卡運算?？茖W(xué)計算卡得到運算結(jié)果，將結(jié)果通過網(wǎng)絡(luò)數(shù)據(jù)端口上傳到管理端。

步驟4：管理端得到各設(shè)備節(jié)點上報的數(shù)據(jù)，得到任務(wù)一的數(shù)據(jù)結(jié)果。

實例2：任務(wù)二的算法由3個基礎(chǔ)算核組成，分別為des算核，md4算核和sha1算核。

步驟1：用戶上傳任務(wù)到管理端，管理端分析任務(wù)二，通過計算各運算節(jié)點的運算資源，得到在節(jié)點一運行總?cè)蝿?wù)的30％，節(jié)點二運行總?cè)蝿?wù)的30％的情況下，節(jié)點三運行總?cè)蝿?wù)的40％的情況下，可以達(dá)到負(fù)載均衡。

步驟2：通過任務(wù)下發(fā)單元，將總?cè)蝿?wù)的30％通過網(wǎng)絡(luò)端口下發(fā)到運算節(jié)點一，將總?cè)蝿?wù)的30％通過網(wǎng)絡(luò)端口下發(fā)到運算節(jié)點二，將總?cè)蝿?wù)的40％通過網(wǎng)絡(luò)端口下發(fā)到運算節(jié)點三，。

步驟3：設(shè)備節(jié)點接收到數(shù)據(jù)后，將任務(wù)交由科學(xué)計算卡運算。科學(xué)計算卡得到運算結(jié)果，將結(jié)果通過網(wǎng)絡(luò)數(shù)據(jù)端口上傳到管理端。

步驟4：管理端得到各設(shè)備節(jié)點上報的數(shù)據(jù)，得到任務(wù)三的數(shù)據(jù)結(jié)果。

以上所述僅為本發(fā)明的較佳實施例，并不用以限制本發(fā)明，凡在本發(fā)明的精神和原則之內(nèi)，所作的任何修改、等同替換、改進(jìn)等，均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。

完整全部詳細(xì)技術(shù)資料下載

當(dāng)前第1頁1 2 3

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：張濤;鄧佳偉;
技術(shù)所有人：無錫十月中宸科技有限公司;
我是此專利的發(fā)明人

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請點此查看客服電話進(jìn)行咨詢。
1、王老師：1.數(shù)字信號處理 2.傳感器技術(shù)及應(yīng)用 3.機電一體化產(chǎn)品開發(fā) 4.機械工程測試技術(shù) 5.逆向工程技術(shù)研究
2、王老師：1.機器人 2.嵌入式控制系統(tǒng)開發(fā)
3、孫老師：1.振動信號時頻分析理論與測試系統(tǒng)設(shè)計 2.汽車檢測系統(tǒng)設(shè)計 3.汽車電子控制系統(tǒng)設(shè)計
4、畢老師：機構(gòu)動力學(xué)與控制
5、袁老師：1.計算機視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
如您是高校老師，可以點此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

高性能分布式架構(gòu)相關(guān)技術(shù)

高性能分布式架構(gòu)設(shè)計相關(guān)技術(shù)

hpc高性能計算相關(guān)技術(shù)

高性能計算相關(guān)技術(shù)

高性能計算集群相關(guān)技術(shù)

高性能計算工作站相關(guān)技術(shù)

国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

一種基于可擴展和高性能計算的分布式管理架構(gòu)及方法與流程