本發(fā)明涉及通信,尤其是一種通感算一體化場(chǎng)景下的資源自適應(yīng)聯(lián)合管控方法,以及一種通感算一體化場(chǎng)景下的資源自適應(yīng)聯(lián)合管控系統(tǒng)。
背景技術(shù):
1、隨著b5g/6g通信技術(shù)的發(fā)展,感知通信計(jì)算一體化技術(shù)因具備通信與智能融合、感知與通信融合的能力,被廣泛應(yīng)用于人工智能、感知、計(jì)算等服務(wù)場(chǎng)景,以實(shí)現(xiàn)人、機(jī)、物的泛在智能連接,賦能新應(yīng)用的新型數(shù)字信息基礎(chǔ)設(shè)施,受到了業(yè)內(nèi)學(xué)者的廣泛關(guān)注。
2、通信感知計(jì)算一體化系統(tǒng)通過感知服務(wù)對(duì)物理世界進(jìn)行采樣,通過通信服務(wù)為物理世界提供連接,通過計(jì)算服務(wù)對(duì)網(wǎng)絡(luò)進(jìn)行優(yōu)化并對(duì)感知數(shù)據(jù)進(jìn)行處理。通信、感知和計(jì)算融合一體可以實(shí)現(xiàn)多維感知、協(xié)作通信、智能計(jì)算功能的深度融合和互惠增強(qiáng),從而開啟物理世界與數(shù)字世界融合的通道,提供定位、測(cè)距、成像等多元化能力,極大滿足超高分辨率和精度的應(yīng)用需求,如包括產(chǎn)業(yè)升級(jí)領(lǐng)域中的位置感知、無人監(jiān)控、環(huán)境重構(gòu)等,社會(huì)治理領(lǐng)域的環(huán)境監(jiān)測(cè)、危險(xiǎn)物品探測(cè)等,智慧生活領(lǐng)域的手勢(shì)和動(dòng)作識(shí)別、安防監(jiān)控、行為監(jiān)測(cè)、健康監(jiān)測(cè)等。
3、現(xiàn)有的通信感知計(jì)算一體化場(chǎng)景下,多維資源乃至多系統(tǒng)資源聯(lián)合調(diào)度的資源優(yōu)化相關(guān)研究,僅聚焦于通信、計(jì)算或通信-計(jì)算資源的優(yōu)化,網(wǎng)絡(luò)數(shù)據(jù)的感知、通信、計(jì)算獨(dú)立分治,難以滿足海量感知信息的實(shí)時(shí)交互與分析需求。因此,亟需探索面向感知數(shù)據(jù)高效交付與分析的通信-感知-計(jì)算一體化資源聯(lián)合調(diào)度架構(gòu)。
4、考慮到差異化的任務(wù)響應(yīng)需求以及快衰落造成的無線信道波動(dòng)影響,所構(gòu)造的資源聯(lián)合調(diào)度架構(gòu)需要能夠從大時(shí)間尺度上保證感知數(shù)據(jù)交付與處理的穩(wěn)定性,避免傳統(tǒng)瞬時(shí)優(yōu)化理論框架所導(dǎo)致的隊(duì)列數(shù)據(jù)積壓、時(shí)延抖動(dòng)惡化等問題,實(shí)現(xiàn)多發(fā)性體驗(yàn)時(shí)延、有效信息量的穩(wěn)定性與最優(yōu)性均衡,有效的解決現(xiàn)有通信感知計(jì)算一體化場(chǎng)景下資源分配延時(shí)過高的問題。而目前未見能夠很好解決上述問題的手段。
技術(shù)實(shí)現(xiàn)思路
1、本發(fā)明的發(fā)明目的在于:針對(duì)上述存在的問題,提供一種通感算一體化場(chǎng)景下的資源自適應(yīng)聯(lián)合管控方法和系統(tǒng),用以低系統(tǒng)開銷實(shí)現(xiàn)多發(fā)性時(shí)延、有效信息量的穩(wěn)定性與最優(yōu)性均衡,從而兼顧設(shè)備響應(yīng)速度與決策質(zhì)量。
2、本發(fā)明采用的技術(shù)方案如下:
3、一種通感算一體化場(chǎng)景下的資源自適應(yīng)聯(lián)合管控方法,其包括:
4、s1、通信感知計(jì)算一體化的場(chǎng)景下,各感知節(jié)點(diǎn)獲取實(shí)時(shí)的網(wǎng)絡(luò)狀態(tài)參量,該網(wǎng)絡(luò)狀態(tài)參量包括信道狀態(tài)參量和網(wǎng)絡(luò)資管參量;獲取各感知節(jié)點(diǎn)所關(guān)心的目標(biāo)狀態(tài)和感知數(shù)據(jù);基于獲取的網(wǎng)絡(luò)狀態(tài)參量,網(wǎng)絡(luò)中央控制節(jié)點(diǎn)構(gòu)建網(wǎng)絡(luò)資管長(zhǎng)期優(yōu)化模型;
5、s2、網(wǎng)絡(luò)中央控制節(jié)點(diǎn)采用李雅普諾夫方法,將所述網(wǎng)絡(luò)資管長(zhǎng)期優(yōu)化模型轉(zhuǎn)換為時(shí)間離散的資源優(yōu)化模型,并按時(shí)間次序?qū)①Y源優(yōu)化模型劃分至初始階段、迭代階段、結(jié)束階段;網(wǎng)絡(luò)中央控制節(jié)點(diǎn)按時(shí)隙查詢所屬階段,求解該階段所對(duì)應(yīng)的資源優(yōu)化模型得到該階段的資源優(yōu)化策略,并將資源優(yōu)化決策下發(fā)至相對(duì)應(yīng)的感知節(jié)點(diǎn);
6、s3、各感知節(jié)點(diǎn)按照資源優(yōu)化決策進(jìn)行資源調(diào)度,對(duì)目標(biāo)狀態(tài)和感知數(shù)據(jù)進(jìn)行匯聚與分析。
7、進(jìn)一步的,各感知節(jié)點(diǎn)采用導(dǎo)頻輔助的信道估計(jì)方法,將發(fā)送信號(hào)拆解為兩部分:導(dǎo)頻和數(shù)據(jù),并基于導(dǎo)頻信息的接收情況完成信道估計(jì),得到信道狀態(tài)參量。
8、進(jìn)一步的,所述網(wǎng)絡(luò)資管參量包括:
9、每個(gè)接入點(diǎn)n在短包通信時(shí)可調(diào)用的時(shí)頻資源量上限lsmax,以及在長(zhǎng)包通信時(shí)可調(diào)用的時(shí)頻資源量上限llmax;每個(gè)接入點(diǎn)n關(guān)聯(lián)的服務(wù)器可調(diào)用的總計(jì)算資源量感知節(jié)點(diǎn)在初始階段、迭代階段、結(jié)束階段的最大體驗(yàn)時(shí)延上限以及強(qiáng)化學(xué)習(xí)隊(duì)列時(shí)延、模型訓(xùn)練隊(duì)列時(shí)延以及傳感數(shù)據(jù)下沉隊(duì)列排隊(duì)時(shí)延門限迭代階段結(jié)束時(shí)感知節(jié)點(diǎn)和服務(wù)器的神經(jīng)網(wǎng)絡(luò)模型精度損失門限e。
10、進(jìn)一步的,網(wǎng)絡(luò)中央控制節(jié)點(diǎn)構(gòu)建的網(wǎng)絡(luò)資管長(zhǎng)期優(yōu)化模型為:
11、
12、s.t.對(duì)于有:
13、c1:網(wǎng)絡(luò)時(shí)頻資源受限
14、c2:服務(wù)器cpu資源受限
15、c3:各階段各感知節(jié)點(diǎn)的平均體驗(yàn)時(shí)延限制:
16、
17、c4:迭代階段各隊(duì)列的平均時(shí)延限制:
18、
19、
20、c5:迭代階段結(jié)束時(shí)模型精度損失限制:
21、其中,n∈n表示接入點(diǎn)集合n中的任意接入點(diǎn)n,u∈u表示感知節(jié)點(diǎn)集合u中的任意感知節(jié)點(diǎn)u,感知節(jié)點(diǎn)集合u中感知節(jié)點(diǎn)的數(shù)量表示為|u|,接入點(diǎn)n覆蓋范圍內(nèi)的感知節(jié)點(diǎn)集合為un,有un∈nun=u;t表示時(shí)間步,t=0表示初始階段,t=1,2,3,…,t表示迭代階段,t=t+1表示結(jié)束階段,t表示迭代周期數(shù)量;iinit、iite、iend分別表示初始階段、迭代階段以及結(jié)束階段感知節(jié)點(diǎn)u所能獲得的有效信息量;e表示求數(shù)學(xué)期望;au,n∈{1,0}為感知節(jié)點(diǎn)u的接入情況,1表示允許接入,0表示未允許接入;分別為感知節(jié)點(diǎn)u在短包通信和長(zhǎng)包通信過程中所占用的時(shí)頻資源量;表示每個(gè)接入點(diǎn)n的總時(shí)頻資源量;hu,n(t)表示感知節(jié)點(diǎn)u對(duì)接入點(diǎn)n關(guān)聯(lián)的服務(wù)器在t時(shí)刻可調(diào)用的cpu計(jì)算資源量;tinit、tend分別表示初始階段、迭代階段以及結(jié)束階段的體驗(yàn)時(shí)延;接入點(diǎn)n集成的服務(wù)器為其服務(wù)范圍內(nèi)的感知節(jié)點(diǎn)u各配備三個(gè)隊(duì)列:為傳感數(shù)據(jù)下沉隊(duì)列,為強(qiáng)化學(xué)習(xí)隊(duì)列,模型訓(xùn)練隊(duì)列,且時(shí)刻t下三個(gè)隊(duì)列的數(shù)據(jù)離開量分別為各個(gè)感知節(jié)點(diǎn)u配備兩個(gè)隊(duì)列:強(qiáng)化學(xué)習(xí)隊(duì)列和模型訓(xùn)練隊(duì)列時(shí)刻t兩個(gè)隊(duì)列的數(shù)據(jù)離開量分別為xu為感知節(jié)點(diǎn)u對(duì)于傳感數(shù)據(jù)的拆分情況,du(t)為感知節(jié)點(diǎn)u從感知網(wǎng)絡(luò)中調(diào)用的相關(guān)聯(lián)數(shù)據(jù)尺寸,xudu和(1-xu)du分別為本地分析和服務(wù)器協(xié)助分析的傳感數(shù)據(jù)量;vu表示網(wǎng)絡(luò)資管長(zhǎng)期優(yōu)化模型中主評(píng)價(jià)網(wǎng)絡(luò)的模型參數(shù),l(vu)表示主評(píng)價(jià)網(wǎng)絡(luò)的損失函數(shù),tdt表示迭代結(jié)束時(shí)刻t主評(píng)價(jià)網(wǎng)絡(luò)所采樣元組的時(shí)序差分誤差;du(t)表示時(shí)刻t下感知節(jié)點(diǎn)u感知的數(shù)據(jù)尺寸。
22、進(jìn)一步的,網(wǎng)絡(luò)中央控制節(jié)點(diǎn)將所述網(wǎng)絡(luò)資管長(zhǎng)期優(yōu)化模型所轉(zhuǎn)換的時(shí)間離散的資源優(yōu)化模型為:
23、
24、s.t.對(duì)于有:
25、c1:網(wǎng)絡(luò)時(shí)頻資源受限
26、c2:服務(wù)器cpu資源受限
27、c3:各階段各感知節(jié)點(diǎn)的平均體驗(yàn)時(shí)延限制:
28、
29、c4:迭代階段結(jié)束時(shí)模型精度損失限制:
30、其中:vite(t)為隊(duì)列更新的輔助參量,
31、依次為隊(duì)列的虛擬隊(duì)列;qv(t)表示qv(t)中定義的每一項(xiàng),和分別為服務(wù)器的傳感數(shù)據(jù)下沉隊(duì)列強(qiáng)化學(xué)習(xí)隊(duì)列模型訓(xùn)練隊(duì)列以及感知節(jié)點(diǎn)的強(qiáng)化學(xué)習(xí)隊(duì)列和模型訓(xùn)練隊(duì)列中所涉及的各參量的輸入量和輸出量;ξ為常數(shù)且ξ>0;表示感知節(jié)點(diǎn)獲得的平均信息量。
32、進(jìn)一步的,傳感數(shù)據(jù)下沉隊(duì)列強(qiáng)化學(xué)習(xí)隊(duì)列模型訓(xùn)練隊(duì)列強(qiáng)化學(xué)習(xí)隊(duì)列和模型訓(xùn)練隊(duì)列的更新方法為:
33、
34、
35、隊(duì)列的更新方法為:
36、
37、進(jìn)一步的,網(wǎng)絡(luò)中央控制節(jié)點(diǎn)按時(shí)間次序?qū)①Y源優(yōu)化模型劃分至初始階段、迭代階段、結(jié)束階段,包括:
38、網(wǎng)絡(luò)中央控制節(jié)點(diǎn)劃分的初始階段的資源優(yōu)化模型為:
39、
40、s.t.對(duì)于有:
41、c1:網(wǎng)絡(luò)時(shí)頻資源受限
42、c2:服務(wù)器cpu資源受限
43、c3:初始階段平均體驗(yàn)時(shí)延限制:
44、網(wǎng)絡(luò)中央控制節(jié)點(diǎn)劃分的迭代階段的資源優(yōu)化模型為:
45、
46、s.t.對(duì)于有:
47、c1:網(wǎng)絡(luò)時(shí)頻資源受限
48、c2:服務(wù)器cpu資源受限
49、c3:迭代階段各時(shí)隙平均體驗(yàn)時(shí)延限制:
50、網(wǎng)絡(luò)中央控制節(jié)點(diǎn)劃分的結(jié)束階段的資源優(yōu)化模型為:
51、
52、s.t.對(duì)于有:
53、c1:網(wǎng)絡(luò)時(shí)頻資源受限
54、c2:服務(wù)器cpu資源受限
55、c3:結(jié)束階段平均體驗(yàn)時(shí)延限制
56、c4:迭代階段結(jié)束時(shí)模型精度損失限制
57、進(jìn)一步的,感知節(jié)點(diǎn)在按照資源優(yōu)化決策進(jìn)行資源調(diào)度后,對(duì)目標(biāo)狀態(tài)和感知數(shù)據(jù)進(jìn)行匯聚與分析的結(jié)果為:
58、
59、其中,和為感知節(jié)點(diǎn)u的本地處理結(jié)果和關(guān)聯(lián)服務(wù)器的處理結(jié)果。
60、本發(fā)明還提供了一種通感算一體化場(chǎng)景下的資源自適應(yīng)聯(lián)合管控系統(tǒng),該系統(tǒng)執(zhí)行上述的方法。
61、綜上所述,由于采用了上述技術(shù)方案,本發(fā)明的有益效果是:
62、本發(fā)明利用多維資源自適應(yīng)聯(lián)合管控方法實(shí)現(xiàn)在智能化的網(wǎng)絡(luò)中的設(shè)備和節(jié)點(diǎn)的雙端性能優(yōu)化,同時(shí)解決資源自適應(yīng)調(diào)度效率問題來兼顧感知節(jié)點(diǎn)的資源決策響應(yīng)速度與質(zhì)量,具體創(chuàng)新點(diǎn)包含以下兩方面:1)多維資源自適應(yīng)聯(lián)合管控問題,即在通信感知一體化的場(chǎng)景下,以最優(yōu)化感知節(jié)點(diǎn)的長(zhǎng)期平均有效信息量為目標(biāo),在感知節(jié)點(diǎn)的各個(gè)工作階段的有效時(shí)延等主要約束限制下,實(shí)現(xiàn)多維資源自適應(yīng)聯(lián)合管控與模型訓(xùn)練方法,時(shí)延穩(wěn)定性-信息量最優(yōu)化的均衡設(shè)計(jì),同時(shí)實(shí)現(xiàn)較低延時(shí)以及解決海量數(shù)據(jù)接入的數(shù)據(jù)積壓?jiǎn)栴}。2)資源自適應(yīng)調(diào)度效率問題,由于在解決問題1)時(shí),構(gòu)造的優(yōu)化方案將迭代階段的資源管控建模為長(zhǎng)期平均優(yōu)化問題,計(jì)算機(jī)求解復(fù)雜度很高,會(huì)消耗過多的算力資源。因此,本發(fā)明引入李雅普諾夫優(yōu)化方法,將設(shè)計(jì)的網(wǎng)絡(luò)資管長(zhǎng)期優(yōu)化模型轉(zhuǎn)換為時(shí)間離散的資源優(yōu)化模型,從而降低模型解算的復(fù)雜度,減輕系統(tǒng)的資源開銷。