本發(fā)明涉及數(shù)據(jù)處理,具體涉及基于多方安全計(jì)算的數(shù)據(jù)分析方法及裝置。
背景技術(shù):
1、多方安全計(jì)算(multi-party?computation,?mpc)是一種計(jì)算方式,它允許兩個(gè)或多個(gè)密友合作計(jì)算一個(gè)函數(shù)的值,同時(shí)又能保證各方的輸入和計(jì)算結(jié)果得到保密。常見的mpc協(xié)議的工作原理是:通過隨機(jī)化、加密和掩碼技術(shù)將計(jì)算任務(wù)分解為多個(gè)簡(jiǎn)單的算數(shù)和邏輯運(yùn)算,然后參與各方交替進(jìn)行計(jì)算并將結(jié)果共享,從而實(shí)現(xiàn)函數(shù)計(jì)算而不外泄輸入信息。
2、目前的數(shù)據(jù)分析方法(特別是圖像數(shù)據(jù)的分析方法),不夠安全、智能化程度不高、效率較低。
技術(shù)實(shí)現(xiàn)思路
1、本發(fā)明正是基于上述問題,提出了一種基于多方安全計(jì)算的數(shù)據(jù)分析方法及裝置,通過本發(fā)明方案利用多方安全計(jì)算思想可以實(shí)現(xiàn)多方圖像數(shù)據(jù)深度開發(fā),同時(shí)兼顧數(shù)據(jù)隱私保護(hù),解決實(shí)踐中難題,取得很好的技術(shù)效果。
2、有鑒于此,本發(fā)明的一方面提出了一種基于多方安全計(jì)算的數(shù)據(jù)分析方法,包括:
3、不同數(shù)據(jù)持有單位利用區(qū)塊鏈技術(shù)共享存儲(chǔ)本單位已進(jìn)行隱私處理的圖像數(shù)據(jù)及元數(shù)據(jù);
4、確定圖像內(nèi)容識(shí)別或分析任務(wù)計(jì)算模型;
5、根據(jù)計(jì)算模型,利用多方安全計(jì)算協(xié)議在加密域下對(duì)存儲(chǔ)在區(qū)塊鏈中的圖像數(shù)據(jù)進(jìn)行聯(lián)合深度學(xué)習(xí),訓(xùn)練出內(nèi)容識(shí)別模型;
6、使用訓(xùn)練出的模型及多方安全計(jì)算協(xié)議對(duì)新的圖像數(shù)據(jù)進(jìn)行內(nèi)容識(shí)別預(yù)測(cè)計(jì)算;
7、對(duì)圖像數(shù)據(jù)中提取的特征數(shù)據(jù)根據(jù)分析任務(wù)需求,進(jìn)行相關(guān)計(jì)算分析;
8、每個(gè)參與實(shí)體根據(jù)被分配的多方安全計(jì)算子任務(wù)進(jìn)行計(jì)算;
9、完成計(jì)算后,參與實(shí)體之間通過公開驗(yàn)證方式對(duì)比計(jì)算結(jié)果;
10、輸出經(jīng)過隱私處理的圖像分析計(jì)算結(jié)果。
11、可選地,所述不同數(shù)據(jù)持有單位利用區(qū)塊鏈技術(shù)共享存儲(chǔ)本單位已進(jìn)行隱私處理的圖像數(shù)據(jù)及元數(shù)據(jù)的步驟,包括:
12、每個(gè)數(shù)據(jù)持有單位對(duì)自身持有的圖像數(shù)據(jù)和元數(shù)據(jù)進(jìn)行隱私加密處理;
13、將經(jīng)過隱私處理后的圖像數(shù)據(jù)和元數(shù)據(jù)打包成區(qū)塊,利用數(shù)據(jù)持有單位的公私密鑰對(duì)進(jìn)行數(shù)字簽名;
14、數(shù)據(jù)持有單位將該區(qū)塊廣播到區(qū)塊鏈網(wǎng)絡(luò)中,其他參與節(jié)點(diǎn)通過解密和簽名驗(yàn)證來驗(yàn)證數(shù)據(jù)塊的完整性和來源;
15、成功驗(yàn)證后的區(qū)塊將被添加到區(qū)塊鏈上進(jìn)行存儲(chǔ),建立分布式賬本形式的數(shù)據(jù)庫。
16、可選地,所述確定圖像內(nèi)容識(shí)別或分析任務(wù)計(jì)算模型的步驟,包括:
17、數(shù)據(jù)持有單位根據(jù)任務(wù)需要,選擇合適的深度學(xué)習(xí)模型架構(gòu);
18、將模型結(jié)構(gòu)分解為可以并行計(jì)算的基本操作單元;
19、利用同態(tài)加密或mpc技術(shù),對(duì)模型中的參數(shù)進(jìn)行隱私處理編碼;
20、使用mpc協(xié)議在加密域內(nèi)實(shí)現(xiàn)基本單元的計(jì)算;
21、各參與單位根據(jù)持有的模型部分進(jìn)行分布式訓(xùn)練,迭代更新參數(shù)達(dá)成共識(shí);
22、通過公開驗(yàn)證方式獲得網(wǎng)絡(luò)結(jié)構(gòu)及參數(shù),作為圖像分析任務(wù)的計(jì)算依據(jù)。
23、可選地,所述根據(jù)計(jì)算模型,利用多方安全計(jì)算協(xié)議在加密域下對(duì)存儲(chǔ)在區(qū)塊鏈中的圖像數(shù)據(jù)進(jìn)行聯(lián)合深度學(xué)習(xí),訓(xùn)練出內(nèi)容識(shí)別模型的步驟,包括:
24、每個(gè)數(shù)據(jù)持有單位取出自身已加密圖像數(shù)據(jù)的一部分作為訓(xùn)練子集;
25、使用mpc協(xié)議,將神經(jīng)網(wǎng)絡(luò)模型中的權(quán)重參數(shù)、偏置進(jìn)行加密分布式表示;
26、每個(gè)參與單位計(jì)算自身數(shù)據(jù)對(duì)應(yīng)的前向傳播結(jié)果及梯度信息;
27、利用安全聚合算法,在mpc環(huán)境下聚合各參與單位的損失函數(shù)梯度;
28、根據(jù)聚合結(jié)果,每個(gè)參與單位通過mpc協(xié)議更新本地持有的模型分部;
29、重復(fù)執(zhí)行前向后向傳播計(jì)算,每輪梯度下降更新參數(shù)求解;
30、經(jīng)多輪迭代訓(xùn)練后獲得聯(lián)合學(xué)習(xí)的最終加密模型。
31、可選地,所述使用訓(xùn)練出的模型及多方安全計(jì)算協(xié)議對(duì)新的圖像數(shù)據(jù)進(jìn)行內(nèi)容識(shí)別預(yù)測(cè)計(jì)算的步驟,包括:
32、數(shù)據(jù)持有單位將新的待預(yù)測(cè)圖片進(jìn)行加密編碼,生成密文圖片;
33、按照mpc協(xié)議,各參與單位使用本地分布式保存的模型參數(shù),進(jìn)行前向傳播計(jì)算;
34、每個(gè)參與單位將自身歸一化后的數(shù)據(jù)進(jìn)行加密匯報(bào),其他參與單位進(jìn)行安全匯聚;
35、得到匯聚后各層特征圖的加密表達(dá),進(jìn)行后續(xù)層的前向計(jì)算;
36、執(zhí)行完整個(gè)神經(jīng)網(wǎng)絡(luò)后,可獲得預(yù)測(cè)類的加密概率分布;
37、各參與單位通過公開驗(yàn)證算法,確認(rèn)最終預(yù)測(cè)結(jié)果。
38、可選地,所述對(duì)圖像數(shù)據(jù)中提取的特征數(shù)據(jù)根據(jù)分析任務(wù)需求,進(jìn)行相關(guān)計(jì)算分析的步驟,包括:
39、將圖像特征向量轉(zhuǎn)換為同態(tài)加密域進(jìn)行表示;
40、對(duì)特征進(jìn)行加密統(tǒng)計(jì)分析;
41、利用安全比較協(xié)議實(shí)現(xiàn)特征加密值的排序;
42、使用安全聚合協(xié)議計(jì)算特征集合的相關(guān)性分析結(jié)果;
43、通過mpc協(xié)議支持圖像元數(shù)據(jù)的統(tǒng)計(jì)分析計(jì)算。
44、可選地,所述每個(gè)參與實(shí)體根據(jù)被分配的多方安全計(jì)算子任務(wù)進(jìn)行計(jì)算的步驟,包括:
45、將全局計(jì)算模型分解為多個(gè)基本運(yùn)算單元;
46、根據(jù)各參與實(shí)體的計(jì)算能力,進(jìn)行任務(wù)劃分和調(diào)度優(yōu)化;
47、按照mpc協(xié)議,將每個(gè)基本運(yùn)算單元編碼為子任務(wù)分發(fā)給對(duì)應(yīng)的各個(gè)參與實(shí)體;
48、每個(gè)參與實(shí)體根據(jù)運(yùn)算單元類型完成對(duì)應(yīng)的安全計(jì)算程序,實(shí)現(xiàn)單元內(nèi)的基礎(chǔ)操作;
49、將處理結(jié)果進(jìn)行加密匯報(bào)給任務(wù)協(xié)調(diào)者;
50、重復(fù)執(zhí)行,直至所有單元任務(wù)完成。
51、可選地,所述完成計(jì)算后,參與實(shí)體之間通過公開驗(yàn)證方式對(duì)比計(jì)算結(jié)果的步驟,包括:
52、每個(gè)參與實(shí)體使用自身持有的明文測(cè)試數(shù)據(jù),獨(dú)立計(jì)算測(cè)試指標(biāo);
53、將計(jì)算結(jié)果進(jìn)行加密,并與隨機(jī)數(shù)字簽名一起發(fā)布;
54、其他參與實(shí)體驗(yàn)證簽名后,通過mpc協(xié)議對(duì)比加密指標(biāo),判斷是否一致;
55、對(duì)可線性加密的指標(biāo),直接在加密域內(nèi)完成驗(yàn)證;
56、對(duì)非線性指標(biāo),證明計(jì)算過程和結(jié)果的正確性。
57、可選地,所述輸出經(jīng)過隱私處理的圖像分析計(jì)算結(jié)果的步驟,包括:
58、將所述計(jì)算結(jié)果進(jìn)行安全機(jī)制編碼;
59、對(duì)編碼后的結(jié)果應(yīng)用隨機(jī)噪聲擾動(dòng)、組合成密文這些隱私技術(shù);
60、采取部分展示方式展示統(tǒng)計(jì)分布;
61、在網(wǎng)絡(luò)上傳輸編碼后的結(jié)果時(shí)利用傳輸加密手段提供防篡改保護(hù);
62、對(duì)編碼后的結(jié)果配置有效期控制,過期后自動(dòng)刪除減少外泄風(fēng)險(xiǎn);
63、提供用戶自主篩選結(jié)果粒度的接口以平衡效果和隱私需求。
64、本發(fā)明的另一方面提供一種基于多方安全計(jì)算的數(shù)據(jù)分析裝置,包括:控制模塊、確定模塊、訓(xùn)練模塊、預(yù)測(cè)模塊和處理模塊;
65、所述控制模塊,用于控制不同數(shù)據(jù)持有單位利用區(qū)塊鏈技術(shù)共享存儲(chǔ)本單位已進(jìn)行隱私處理的圖像數(shù)據(jù)及元數(shù)據(jù);
66、所述確定模塊,用于確定圖像內(nèi)容識(shí)別或分析任務(wù)計(jì)算模型;
67、所述訓(xùn)練模塊,用于根據(jù)計(jì)算模型,利用多方安全計(jì)算協(xié)議在加密域下對(duì)存儲(chǔ)在區(qū)塊鏈中的圖像數(shù)據(jù)進(jìn)行聯(lián)合深度學(xué)習(xí),訓(xùn)練出內(nèi)容識(shí)別模型;
68、所述預(yù)測(cè)模塊,用于使用訓(xùn)練出的模型及多方安全計(jì)算協(xié)議對(duì)新的圖像數(shù)據(jù)進(jìn)行內(nèi)容識(shí)別預(yù)測(cè)計(jì)算;
69、所述處理模塊用于:
70、對(duì)圖像數(shù)據(jù)中提取的特征數(shù)據(jù)根據(jù)分析任務(wù)需求,進(jìn)行相關(guān)計(jì)算分析;
71、每個(gè)參與實(shí)體根據(jù)被分配的多方安全計(jì)算子任務(wù)進(jìn)行計(jì)算;
72、完成計(jì)算后,參與實(shí)體之間通過公開驗(yàn)證方式對(duì)比計(jì)算結(jié)果;
73、輸出經(jīng)過隱私處理的圖像分析計(jì)算結(jié)果。。
74、采用本發(fā)明的技術(shù)方案,基于多方安全計(jì)算的數(shù)據(jù)分析方法包括:不同數(shù)據(jù)持有單位利用區(qū)塊鏈技術(shù)共享存儲(chǔ)本單位已進(jìn)行隱私處理的圖像數(shù)據(jù)及元數(shù)據(jù);確定圖像內(nèi)容識(shí)別或分析任務(wù)計(jì)算模型;根據(jù)計(jì)算模型,利用多方安全計(jì)算協(xié)議在加密域下對(duì)存儲(chǔ)在區(qū)塊鏈中的圖像數(shù)據(jù)進(jìn)行聯(lián)合深度學(xué)習(xí),訓(xùn)練出內(nèi)容識(shí)別模型;使用訓(xùn)練出的模型及多方安全計(jì)算協(xié)議對(duì)新的圖像數(shù)據(jù)進(jìn)行內(nèi)容識(shí)別預(yù)測(cè)計(jì)算;對(duì)圖像數(shù)據(jù)中提取的特征數(shù)據(jù)根據(jù)分析任務(wù)需求,進(jìn)行相關(guān)計(jì)算分析;每個(gè)參與實(shí)體根據(jù)被分配的多方安全計(jì)算子任務(wù)進(jìn)行計(jì)算;完成計(jì)算后,參與實(shí)體之間通過公開驗(yàn)證方式對(duì)比計(jì)算結(jié)果;輸出經(jīng)過隱私處理的圖像分析計(jì)算結(jié)果。通過本發(fā)明方案,可以在保護(hù)所有參與實(shí)體數(shù)據(jù)隱私的前提下,實(shí)現(xiàn)不同來源多方圖像數(shù)據(jù)的深度學(xué)習(xí)和計(jì)算任務(wù);可以充分利用分布式計(jì)算資源,提高數(shù)據(jù)分析效率;可以實(shí)現(xiàn)隱私規(guī)則下的各種多方圖像計(jì)算任務(wù);可以通過公開驗(yàn)證實(shí)現(xiàn)計(jì)算結(jié)果的可信與透明??傊摲椒ɡ枚喾桨踩?jì)算思想可以實(shí)現(xiàn)多方圖像數(shù)據(jù)深度開發(fā),同時(shí)兼顧數(shù)據(jù)隱私保護(hù),解決實(shí)踐中難題,取得很好的技術(shù)效果。