本發(fā)明涉及人工智能領(lǐng)域,具體來(lái)說(shuō)涉及機(jī)器學(xué)習(xí),更具體地說(shuō),涉及一種用于聯(lián)邦學(xué)習(xí)的系統(tǒng)。
背景技術(shù):
1、近年來(lái),人工智能技術(shù)突飛猛進(jìn),尤其是以chatgpt為代表的大模型、多模態(tài)模型的快速發(fā)展,不僅對(duì)算力提出了更高的要求,同時(shí)也對(duì)數(shù)據(jù)規(guī)模和質(zhì)量提出了更嚴(yán)格的標(biāo)準(zhǔn)。但因?yàn)閿?shù)據(jù)安全、隱私、監(jiān)管或者公司戰(zhàn)略發(fā)展等因素,海量、優(yōu)質(zhì)的數(shù)據(jù)分散在各單位、公司內(nèi)部,無(wú)法直接共享共用。
2、在此背景下,出現(xiàn)了以聯(lián)邦學(xué)習(xí)為訓(xùn)練機(jī)制的機(jī)器學(xué)習(xí)框架,如聯(lián)邦學(xué)習(xí)框架fate(federated?ai?technology?enabler)、flower等,都是目前業(yè)內(nèi)比較流行、成熟的聯(lián)邦學(xué)習(xí)框架。在訓(xùn)練過(guò)程中,聯(lián)邦學(xué)習(xí)機(jī)制通過(guò)數(shù)據(jù)不動(dòng)模型動(dòng),通過(guò)各個(gè)聯(lián)邦方之間共享模型參數(shù)或梯度的方式,最終實(shí)現(xiàn)數(shù)據(jù)可用不可見(jiàn),極大地緩解了數(shù)據(jù)隱私、數(shù)據(jù)安全保護(hù)等問(wèn)題。
3、聯(lián)邦學(xué)習(xí)機(jī)制雖然在理論上保證了模型訓(xùn)練過(guò)程中數(shù)據(jù)的安全性、隱私性,但并未考慮如何保證各聯(lián)邦方安全互信、保證各個(gè)聯(lián)邦方應(yīng)用服務(wù)的安全性等方面的問(wèn)題。同時(shí),比起傳統(tǒng)機(jī)器學(xué)習(xí)模型,聯(lián)邦學(xué)習(xí)的分布式特性使其面臨更為復(fù)雜、嚴(yán)峻的安全威脅。但現(xiàn)有的解決方案中,各個(gè)聯(lián)邦框架仍然采用傳統(tǒng)的基于邊界的安全模型,雖然邊界外設(shè)備訪問(wèn)數(shù)據(jù)受限,但邊界內(nèi)設(shè)備通過(guò)安全檢查后被認(rèn)為是可信性的,可信的邊界內(nèi)設(shè)備可進(jìn)行開放的訪問(wèn),實(shí)際訪問(wèn)的數(shù)據(jù)難以管控,數(shù)據(jù)安全無(wú)法得到充分保證。
4、需要說(shuō)明的是:本背景技術(shù)僅用于介紹本發(fā)明的相關(guān)信息,以便于幫助理解本發(fā)明的技術(shù)方案,但并不意味著相關(guān)信息必然是現(xiàn)有技術(shù)。相關(guān)信息與本發(fā)明方案一同提交和公開,在沒(méi)有證據(jù)表明相關(guān)信息已在本發(fā)明的申請(qǐng)日以前公開的情況下,相關(guān)信息不應(yīng)被視為現(xiàn)有技術(shù)。
技術(shù)實(shí)現(xiàn)思路
1、因此,本發(fā)明的目的在于克服上述現(xiàn)有技術(shù)的缺陷,提供一種用于聯(lián)邦學(xué)習(xí)的系統(tǒng)。
2、本發(fā)明的目的是通過(guò)以下技術(shù)方案實(shí)現(xiàn)的:
3、在本發(fā)明的一些實(shí)施例中,提供一種用于聯(lián)邦學(xué)習(xí)的系統(tǒng),包括:中心端管理模塊,用于部署在中心端計(jì)算設(shè)備上,其被配置為:執(zhí)行聯(lián)邦任務(wù)相關(guān)的一個(gè)或者多個(gè)指令,根據(jù)預(yù)設(shè)的聯(lián)邦學(xué)習(xí)框架進(jìn)行聯(lián)邦任務(wù)的調(diào)度和對(duì)應(yīng)模型的參數(shù)聚合,其中,根據(jù)單個(gè)聯(lián)邦任務(wù)的粒度和授權(quán),分別賦予每個(gè)聯(lián)邦任務(wù)訪問(wèn)對(duì)應(yīng)聯(lián)邦方計(jì)算設(shè)備上至少部分隱私數(shù)據(jù)資源的權(quán)限,并在聯(lián)邦任務(wù)結(jié)束后即時(shí)撤銷對(duì)應(yīng)的權(quán)限;零信任代理模塊,用于部署在參與聯(lián)邦任務(wù)的聯(lián)邦方計(jì)算設(shè)備上,其能執(zhí)行聯(lián)邦任務(wù)相關(guān)的一個(gè)或者多個(gè)指令,以根據(jù)中心端模塊賦予聯(lián)邦任務(wù)的權(quán)限,受控地訪問(wèn)本地存儲(chǔ)的對(duì)應(yīng)隱私數(shù)據(jù)資源,根據(jù)預(yù)設(shè)的聯(lián)邦學(xué)習(xí)框架完成對(duì)應(yīng)模型的訓(xùn)練和推理過(guò)程。
4、可選的,所述中心端管理模塊包括:零信任認(rèn)證組件,被配置為提供零信任認(rèn)證機(jī)制,以賦予聯(lián)邦任務(wù)相關(guān)的多種資源對(duì)應(yīng)的身份標(biāo)識(shí)以用于身份確認(rèn);零信任授權(quán)組件,被配置為提供零信任授權(quán)機(jī)制,以對(duì)訪問(wèn)資源的行為進(jìn)行授權(quán);零信任網(wǎng)關(guān)組件,被配置為向聯(lián)邦方計(jì)算設(shè)備提供調(diào)度聯(lián)邦學(xué)習(xí)的服務(wù),作為中心端計(jì)算設(shè)備和聯(lián)邦方計(jì)算設(shè)備間的交互端口,為任意聯(lián)邦方計(jì)算設(shè)備發(fā)起的每個(gè)聯(lián)邦任務(wù)執(zhí)行請(qǐng)求所能訪問(wèn)的資源進(jìn)行零信任授權(quán)和認(rèn)證。
5、可選的,所述中心端管理模塊,還被配置為:對(duì)不同類型的隱私數(shù)據(jù)資源進(jìn)行分級(jí)管控,將屬于不同級(jí)別的隱私數(shù)據(jù)資源使用不同的訪問(wèn)控制措施。
6、可選的,隱私數(shù)據(jù)資源的類型包括:靜態(tài)的數(shù)據(jù)集、算法、模型、聯(lián)邦任務(wù)和元信息資源,以及動(dòng)態(tài)的聯(lián)邦任務(wù)執(zhí)行請(qǐng)求,其中,所述模型是所述算法經(jīng)過(guò)所述數(shù)據(jù)集訓(xùn)練得到的產(chǎn)物,元信息資源包括用于描述數(shù)據(jù)集、算法、模型和/或聯(lián)邦任務(wù)的信息,其中:數(shù)據(jù)集和模型為一級(jí)隱私數(shù)據(jù)資源,算法、聯(lián)邦任務(wù)和聯(lián)邦任務(wù)執(zhí)行請(qǐng)求為二級(jí)隱私數(shù)據(jù)資源,元信息資源為三級(jí)隱私數(shù)據(jù)資源,從三級(jí)隱私數(shù)據(jù)資源至一級(jí)隱私數(shù)據(jù)資源對(duì)應(yīng)的訪問(wèn)控制措施的嚴(yán)格程度逐漸增加。
7、可選的,所述中心端管理模塊被配置為:在收到聯(lián)邦任務(wù)執(zhí)行請(qǐng)求后,根據(jù)預(yù)設(shè)的聯(lián)邦準(zhǔn)入控制策略,獲取需要參與聯(lián)邦任務(wù)的各個(gè)聯(lián)邦方計(jì)算設(shè)備執(zhí)行聯(lián)邦任務(wù)的能力與各個(gè)隱私數(shù)據(jù)資源所有者的審批狀態(tài);僅在所述各個(gè)聯(lián)邦方計(jì)算設(shè)備具備執(zhí)行聯(lián)邦任務(wù)的能力,并且,所述各個(gè)隱私數(shù)據(jù)資源所有者的審批狀態(tài)均為同意參與聯(lián)邦任務(wù)之時(shí),即時(shí)授予訪問(wèn)對(duì)應(yīng)隱私數(shù)據(jù)資源的權(quán)限。
8、可選的,所述中心端管理模塊被配置為:通過(guò)所述零信任代理模塊獲取各聯(lián)邦方計(jì)算設(shè)備上數(shù)據(jù)集的元信息資源;根據(jù)數(shù)據(jù)集的元信息資源和用戶發(fā)送的聯(lián)邦配置文件,驅(qū)動(dòng)相關(guān)聯(lián)邦方計(jì)算設(shè)備根據(jù)聯(lián)邦學(xué)習(xí)框架共同執(zhí)行聯(lián)邦任務(wù)。
9、可選的,聯(lián)邦方用戶通過(guò)聯(lián)邦方計(jì)算設(shè)備創(chuàng)建、訪問(wèn)隱私數(shù)據(jù)資源、發(fā)起聯(lián)邦任務(wù)執(zhí)行請(qǐng)求時(shí),均需要通過(guò)零信任網(wǎng)關(guān)組件與零信任認(rèn)證組件和零信任授權(quán)組件進(jìn)行通信,進(jìn)行資源的認(rèn)證和授權(quán)。
10、可選的,零信任認(rèn)證組件被配置為:通過(guò)短生命周期的x.509證書提供主體的身份標(biāo)識(shí),x.509證書中可包含資源的類型、資源uri、該主體所屬的角色和聯(lián)邦方信息,其中,主體為計(jì)算設(shè)備或者各個(gè)隱私數(shù)據(jù)資源。
11、可選的,零信任授權(quán)組件被配置為:針對(duì)靜態(tài)隱私數(shù)據(jù)資源,使用基于角色的訪問(wèn)控制,以確定角色能訪問(wèn)的靜態(tài)隱私數(shù)據(jù)資源;針對(duì)動(dòng)態(tài)隱私數(shù)據(jù)資源,使用基于角色的訪問(wèn)控制和聯(lián)邦任務(wù)執(zhí)行請(qǐng)求進(jìn)行資源的即時(shí)授權(quán)和用后撤權(quán)。
12、可選的,所述聯(lián)邦準(zhǔn)入控制策略包括:參與聯(lián)邦任務(wù)的各個(gè)聯(lián)邦方應(yīng)保證所提供的數(shù)據(jù)集的數(shù)據(jù)組織格式和數(shù)據(jù)類型一致、使用的聯(lián)邦算法一致、數(shù)據(jù)質(zhì)量符合要求和網(wǎng)絡(luò)質(zhì)量符合要求或者其組合。
1.一種用于聯(lián)邦學(xué)習(xí)的系統(tǒng),包括:
2.根據(jù)權(quán)利要求1所述的系統(tǒng),其特征在于,所述中心端管理模塊包括:
3.根據(jù)權(quán)利要求2所述的系統(tǒng),其特征在于,所述中心端管理模塊,還被配置為:對(duì)不同類型的隱私數(shù)據(jù)資源進(jìn)行分級(jí)管控,將屬于不同級(jí)別的隱私數(shù)據(jù)資源使用不同的訪問(wèn)控制措施。
4.根據(jù)權(quán)利要求3所述的系統(tǒng),其特征在于,隱私數(shù)據(jù)資源的類型包括:靜態(tài)的數(shù)據(jù)集、算法、模型、聯(lián)邦任務(wù)和元信息資源,以及動(dòng)態(tài)的聯(lián)邦任務(wù)執(zhí)行請(qǐng)求,其中,所述模型是所述算法經(jīng)過(guò)所述數(shù)據(jù)集訓(xùn)練得到的產(chǎn)物,元信息資源包括用于描述數(shù)據(jù)集、算法、模型和/或聯(lián)邦任務(wù)的信息,其中:
5.根據(jù)權(quán)利要求2所述的系統(tǒng),其特征在于,所述中心端管理模塊被配置為:
6.根據(jù)權(quán)利要求2所述的系統(tǒng),其特征在于,所述中心端管理模塊被配置為:
7.根據(jù)權(quán)利要求2所述的系統(tǒng),其特征在于,聯(lián)邦方用戶通過(guò)聯(lián)邦方計(jì)算設(shè)備創(chuàng)建、訪問(wèn)隱私數(shù)據(jù)資源、發(fā)起聯(lián)邦任務(wù)執(zhí)行請(qǐng)求時(shí),均需要通過(guò)零信任網(wǎng)關(guān)組件與零信任認(rèn)證組件和零信任授權(quán)組件進(jìn)行通信,進(jìn)行資源的認(rèn)證和授權(quán)。
8.根據(jù)權(quán)利要求7所述的系統(tǒng),其特征在于,零信任認(rèn)證組件被配置為:通過(guò)短生命周期的x.509證書提供主體的身份標(biāo)識(shí),x.509證書中可包含資源的類型、資源uri、該主體所屬的角色和聯(lián)邦方信息,其中,主體為計(jì)算設(shè)備或者各個(gè)隱私數(shù)據(jù)資源。
9.根據(jù)權(quán)利要求7所述的系統(tǒng),其特征在于,零信任授權(quán)組件被配置為:
10.根據(jù)權(quán)利要求7所述的系統(tǒng),其特征在于,所述聯(lián)邦準(zhǔn)入控制策略包括: