背景技術(shù):
1、機(jī)器學(xué)習(xí)(ml)模型通常使用大型數(shù)據(jù)集進(jìn)行訓(xùn)練,以基于數(shù)據(jù)調(diào)整機(jī)器學(xué)習(xí)模型的權(quán)重、偏差和/或其他參數(shù)。數(shù)據(jù)可以跨多個(gè)基于云的儲(chǔ)存系統(tǒng)存儲(chǔ)、存儲(chǔ)在各個(gè)數(shù)據(jù)中心處本地、或其組合。在理想情況下,所有相關(guān)數(shù)據(jù)都將被收集在中心位置處,并且使用該數(shù)據(jù)訓(xùn)練模型。然而,出于法律和邏輯原因,這通常是不切實(shí)際的或不可能的。將需要在中心位置中收集的海量數(shù)據(jù)可能嚴(yán)重影響在中心位置中收集所有該數(shù)據(jù)的網(wǎng)絡(luò)和儲(chǔ)存資源。此外,數(shù)據(jù)保護(hù)和隱私法可能對(duì)包括某些國(guó)家、州或省份或其他已經(jīng)施行此類法律的地區(qū)的居民的個(gè)人身份信息的數(shù)據(jù)的使用和儲(chǔ)存提出嚴(yán)格保密要求。公司或其他實(shí)體可能在對(duì)數(shù)據(jù)保護(hù)和隱私施行了此類限制的多個(gè)地區(qū)中開(kāi)展業(yè)務(wù)。因此,包含此類個(gè)人身份信息的數(shù)據(jù)不能被合法地移動(dòng)到這些司法管轄區(qū)之外的中央存儲(chǔ)庫(kù)。因此,需要提供用于促進(jìn)訓(xùn)練ml模型的解決方案的改進(jìn)的系統(tǒng)和方法,其中訓(xùn)練數(shù)據(jù)被分布在多個(gè)位置之中。
技術(shù)實(shí)現(xiàn)思路
1、根據(jù)本公開(kāi)的示例數(shù)據(jù)處理系統(tǒng)可以包括處理器和存儲(chǔ)可執(zhí)行指令的機(jī)器可讀介質(zhì)。指令在執(zhí)行時(shí)使得處理器執(zhí)行操作,這些操作包括:在第一倉(cāng)庫(kù)中接收配置參數(shù)以用于使用存儲(chǔ)在多個(gè)第二倉(cāng)庫(kù)中的數(shù)據(jù)執(zhí)行機(jī)器學(xué)習(xí)模型的聯(lián)邦訓(xùn)練;基于配置參數(shù)生成聯(lián)邦學(xué)習(xí)流水線以用于自動(dòng)執(zhí)行與機(jī)器學(xué)習(xí)模型的聯(lián)邦學(xué)習(xí)相關(guān)聯(lián)的多個(gè)任務(wù),包括自動(dòng)生成用于執(zhí)行多個(gè)任務(wù)的代碼、腳本或兩者以用于在多個(gè)第二倉(cāng)庫(kù)中的每個(gè)相應(yīng)倉(cāng)庫(kù)中使用存儲(chǔ)在相應(yīng)倉(cāng)庫(kù)中的數(shù)據(jù)訓(xùn)練機(jī)器學(xué)習(xí)模型的本地實(shí)例,以及用于向第一倉(cāng)庫(kù)提供與機(jī)器學(xué)習(xí)模型的本地實(shí)例相關(guān)聯(lián)的相應(yīng)可學(xué)習(xí)參數(shù)信息,同時(shí)確保與用于訓(xùn)練機(jī)器學(xué)習(xí)模型的本地實(shí)例的數(shù)據(jù)相關(guān)聯(lián)的數(shù)據(jù)保護(hù)和隱私要求被滿足;使得多個(gè)第二倉(cāng)庫(kù)中的每個(gè)相應(yīng)倉(cāng)庫(kù)根據(jù)聯(lián)邦學(xué)習(xí)流水線訓(xùn)練機(jī)器學(xué)習(xí)模型的本地實(shí)例;在第一倉(cāng)庫(kù)處獲得與多個(gè)第二倉(cāng)庫(kù)中的每個(gè)第二倉(cāng)庫(kù)的機(jī)器學(xué)習(xí)模型的本地實(shí)例相關(guān)聯(lián)的可學(xué)習(xí)參數(shù)信息;以及聚合從多個(gè)第二倉(cāng)庫(kù)獲得的可學(xué)習(xí)參數(shù)信息以獲得已經(jīng)根據(jù)可學(xué)習(xí)參數(shù)信息已微調(diào)的機(jī)器學(xué)習(xí)模型的主實(shí)例。
2、在數(shù)據(jù)處理系統(tǒng)中實(shí)現(xiàn)的用于執(zhí)行機(jī)器學(xué)習(xí)模型的聯(lián)邦學(xué)習(xí)的示例方法包括:在第一倉(cāng)庫(kù)中接收配置參數(shù)以用于使用存儲(chǔ)在多個(gè)第二倉(cāng)庫(kù)中的數(shù)據(jù)執(zhí)行機(jī)器學(xué)習(xí)模型的聯(lián)邦訓(xùn)練;基于配置參數(shù)生成聯(lián)邦學(xué)習(xí)流水線以用于自動(dòng)執(zhí)行與機(jī)器學(xué)習(xí)模型的聯(lián)邦學(xué)習(xí)相關(guān)聯(lián)的多個(gè)任務(wù),包括自動(dòng)生成用于執(zhí)行多個(gè)任務(wù)的代碼、腳本或兩者以用于在多個(gè)第二倉(cāng)庫(kù)中的每個(gè)相應(yīng)倉(cāng)庫(kù)中使用存儲(chǔ)在相應(yīng)倉(cāng)庫(kù)中的數(shù)據(jù)訓(xùn)練機(jī)器學(xué)習(xí)模型的本地實(shí)例,以及用于向第一倉(cāng)庫(kù)提供與機(jī)器學(xué)習(xí)模型的本地實(shí)例相關(guān)聯(lián)的相應(yīng)可學(xué)習(xí)參數(shù)信息,同時(shí)確保與用于訓(xùn)練機(jī)器學(xué)習(xí)模型的本地實(shí)例的數(shù)據(jù)相關(guān)聯(lián)的數(shù)據(jù)保護(hù)和隱私要求被滿足;使得多個(gè)第二倉(cāng)庫(kù)中的每個(gè)相應(yīng)倉(cāng)庫(kù)根據(jù)聯(lián)邦學(xué)習(xí)流水線訓(xùn)練機(jī)器學(xué)習(xí)模型的本地實(shí)例;在第一倉(cāng)庫(kù)處獲得與多個(gè)第二倉(cāng)庫(kù)中的每個(gè)第二倉(cāng)庫(kù)的機(jī)器學(xué)習(xí)模型的本地實(shí)例相關(guān)聯(lián)的可學(xué)習(xí)參數(shù)信息;以及聚合從多個(gè)第二倉(cāng)庫(kù)獲得的可學(xué)習(xí)參數(shù)信息以獲得已經(jīng)根據(jù)可學(xué)習(xí)參數(shù)信息已微調(diào)的機(jī)器學(xué)習(xí)模型的主實(shí)例。
3、其上存儲(chǔ)指令的示例機(jī)器可讀介質(zhì)。指令在執(zhí)行時(shí)使得可編程設(shè)備的處理器執(zhí)行以下操作:在第一倉(cāng)庫(kù)中接收配置參數(shù)以用于使用存儲(chǔ)在多個(gè)第二倉(cāng)庫(kù)中的數(shù)據(jù)執(zhí)行機(jī)器學(xué)習(xí)模型的聯(lián)邦訓(xùn)練;基于配置參數(shù)生成聯(lián)邦學(xué)習(xí)流水線以用于自動(dòng)執(zhí)行與機(jī)器學(xué)習(xí)模型的聯(lián)邦學(xué)習(xí)相關(guān)聯(lián)的多個(gè)任務(wù),包括自動(dòng)生成用于執(zhí)行多個(gè)任務(wù)的代碼、腳本或兩者以用于在多個(gè)第二倉(cāng)庫(kù)中的每個(gè)相應(yīng)倉(cāng)庫(kù)中使用存儲(chǔ)在相應(yīng)倉(cāng)庫(kù)中的數(shù)據(jù)訓(xùn)練機(jī)器學(xué)習(xí)模型的本地實(shí)例,以及用于向第一倉(cāng)庫(kù)提供與機(jī)器學(xué)習(xí)模型的本地實(shí)例相關(guān)聯(lián)的相應(yīng)可學(xué)習(xí)參數(shù)信息提供給第一倉(cāng)庫(kù),同時(shí)確保與用于訓(xùn)練機(jī)器學(xué)習(xí)模型的本地實(shí)例的數(shù)據(jù)相關(guān)聯(lián)的數(shù)據(jù)保護(hù)和隱私要求被滿足;使得多個(gè)第二倉(cāng)庫(kù)中的每個(gè)相應(yīng)倉(cāng)庫(kù)根據(jù)聯(lián)邦學(xué)習(xí)流水線訓(xùn)練機(jī)器學(xué)習(xí)模型的本地實(shí)例;在第一倉(cāng)庫(kù)處獲得與多個(gè)第二倉(cāng)庫(kù)中的每個(gè)第二倉(cāng)庫(kù)的機(jī)器學(xué)習(xí)模型的本地實(shí)例相關(guān)聯(lián)的可學(xué)習(xí)參數(shù)信息;以及聚合從多個(gè)第二倉(cāng)庫(kù)獲得的可學(xué)習(xí)參數(shù)信息以獲得已經(jīng)根據(jù)可學(xué)習(xí)參數(shù)信息已微調(diào)的機(jī)器學(xué)習(xí)模型的主實(shí)例。
4、提供本
技術(shù)實(shí)現(xiàn)要素:
從而以簡(jiǎn)化形式介紹下文在具體實(shí)施方式中進(jìn)一步描述的一系列概念。本發(fā)明內(nèi)容不旨在標(biāo)識(shí)所要求保護(hù)的主題的關(guān)鍵特征或基本特征,其也不旨在用于限制所要求保護(hù)的主題的范圍。此外,所要求保護(hù)的主題不限于解決本公開(kāi)的任何部分中指出的任何或所有缺點(diǎn)的實(shí)現(xiàn)。
1.一種數(shù)據(jù)處理系統(tǒng),包括:
2.根據(jù)權(quán)利要求1所述的數(shù)據(jù)處理系統(tǒng),其中使得所述多個(gè)第二倉(cāng)庫(kù)中的每個(gè)相應(yīng)倉(cāng)庫(kù)根據(jù)所述聯(lián)邦學(xué)習(xí)流水線訓(xùn)練所述機(jī)器學(xué)習(xí)模型的所述本地實(shí)例以執(zhí)行以下操作:
3.根據(jù)權(quán)利要求2所述的數(shù)據(jù)處理系統(tǒng),其中所述機(jī)器可讀介質(zhì)包括被配置為使得所述處理器執(zhí)行以下操作的指令:
4.根據(jù)權(quán)利要求3所述的數(shù)據(jù)處理系統(tǒng),其中所述機(jī)器可讀介質(zhì)包括被配置為使得所述處理器執(zhí)行以下操作的指令:
5.根據(jù)權(quán)利要求3所述的數(shù)據(jù)處理系統(tǒng),其中所述機(jī)器可讀介質(zhì)包括被配置為使得所述處理器執(zhí)行以下操作的指令:
6.根據(jù)權(quán)利要求1所述的數(shù)據(jù)處理系統(tǒng),其中生成所述聯(lián)邦學(xué)習(xí)流水線還包括以下操作:
7.根據(jù)權(quán)利要求1所述的數(shù)據(jù)處理系統(tǒng),其中生成所述聯(lián)邦學(xué)習(xí)流水線還包括以下操作:
8.根據(jù)權(quán)利要求7所述的數(shù)據(jù)處理系統(tǒng),其中確定與所述多個(gè)第二倉(cāng)庫(kù)中的每個(gè)第二倉(cāng)庫(kù)相關(guān)聯(lián)的所述策略是否允許所述第一倉(cāng)庫(kù)在所述多個(gè)第二倉(cāng)庫(kù)上啟動(dòng)作業(yè)還包括:
9.根據(jù)權(quán)利要求7所述的數(shù)據(jù)處理系統(tǒng),其中生成所述聯(lián)邦學(xué)習(xí)流水線還包括以下操作:
10.一種在數(shù)據(jù)處理系統(tǒng)中被實(shí)現(xiàn)的用于執(zhí)行機(jī)器學(xué)習(xí)模型的聯(lián)邦學(xué)習(xí)的方法,所述方法包括:
11.根據(jù)權(quán)利要求10所述的方法,其中使得所述多個(gè)第二倉(cāng)庫(kù)中的每個(gè)相應(yīng)倉(cāng)庫(kù)根據(jù)所述聯(lián)邦學(xué)習(xí)流水線訓(xùn)練所述機(jī)器學(xué)習(xí)模型的所述本地實(shí)例以執(zhí)行以下操作:
12.根據(jù)權(quán)利要求11所述的方法,其中所述機(jī)器可讀介質(zhì)包括被配置為使得所述處理器執(zhí)行以下操作的指令:
13.根據(jù)權(quán)利要求12所述的方法,其中所述機(jī)器可讀介質(zhì)包括被配置為使得所述處理器執(zhí)行以下操作的指令:
14.根據(jù)權(quán)利要求12所述的方法,還包括:
15.根據(jù)權(quán)利要求10所述的方法,其中生成所述聯(lián)邦學(xué)習(xí)流水線還包括以下操作: