本發(fā)明屬于車輛自動駕駛,尤其涉及一種基于聯(lián)邦學(xué)習(xí)的自動駕駛隱私數(shù)據(jù)保護方法及裝置。
背景技術(shù):
1、現(xiàn)階段國內(nèi)外人工智能的重心仍在于利用以人工智能為代表的新一代信息技術(shù)解決各領(lǐng)域功能、應(yīng)用、服務(wù)的數(shù)字化和智能化,還未充分考慮隱私數(shù)據(jù)安全利用與共享。為解決數(shù)據(jù)孤島問題,同時保護數(shù)據(jù)隱私,研究者提出了聯(lián)邦學(xué)習(xí)。聯(lián)邦學(xué)習(xí)允許多個參與者在不共享數(shù)據(jù)的情況下構(gòu)建一個通用的、健壯的機器學(xué)習(xí)模型,從而解決數(shù)據(jù)被集中所帶來的隱私泄露問題,已成為目前應(yīng)用最廣泛的隱私數(shù)據(jù)保護方案。
2、現(xiàn)有的聯(lián)邦學(xué)習(xí)研究大多采用單密鑰同態(tài)加密方案,即各客戶端共享同一密鑰對,當(dāng)某一客戶端主動截取其它客戶端發(fā)送的加密數(shù)據(jù)時,可直接利用自身密鑰解密,導(dǎo)致被截獲客戶端的模型及本地隱私數(shù)據(jù)泄露。當(dāng)前也有少部分基于多密鑰的聯(lián)邦學(xué)習(xí)方案,但仍然存在密文結(jié)構(gòu)復(fù)雜導(dǎo)致密文規(guī)模隨參與方數(shù)量增多呈指數(shù)級增長,且參與方數(shù)量需要提前設(shè)定,無法滿足靈活的多跳需求的問題。
技術(shù)實現(xiàn)思路
1、針對現(xiàn)有技術(shù)存在的上述問題,本發(fā)明實施例提供了一種基于聯(lián)邦學(xué)習(xí)的自動駕駛隱私數(shù)據(jù)保護方法及裝置,該方法在聯(lián)邦加密模型創(chuàng)建中能夠?qū)Χ嗉臆嚻蟮碾[私數(shù)據(jù)庫實現(xiàn)可用不可見,由此在保證各參與車企在不共享隱私數(shù)據(jù)庫的前提下進行聯(lián)邦建模,既解決了聯(lián)邦建模過程中數(shù)據(jù)孤島問題又完成了隱私保護,提高了機器學(xué)習(xí)效率。
2、根據(jù)本發(fā)明實施例第一方面,提供一種基于聯(lián)邦學(xué)習(xí)的自動駕駛隱私數(shù)據(jù)保護方法,其特征在于,包括應(yīng)用于協(xié)作方的第一設(shè)備和至少兩個第二設(shè)備,每個所述第二設(shè)備應(yīng)用于一個目標(biāo)車企;所述第一設(shè)備和所述第二設(shè)備通信連接;所述方法應(yīng)用于第一設(shè)備;包括:針對至少兩個目標(biāo)車企中任一目標(biāo)車企:將所述目標(biāo)車企對應(yīng)的自動駕駛數(shù)據(jù)庫以及車企預(yù)訓(xùn)練模型的模型參數(shù)共同作為所述目標(biāo)車企對應(yīng)的隱私數(shù)據(jù)庫;其中,所述車企預(yù)訓(xùn)練模型用于指示與所述目標(biāo)車企對應(yīng)的第二設(shè)備基于所述自動駕駛數(shù)據(jù)庫進行機器學(xué)習(xí)和/或深度學(xué)習(xí)而生成的模型;所述自動駕駛數(shù)據(jù)庫至少包括:車企名稱、用戶id,以及自動駕駛相關(guān)機構(gòu)法規(guī);對所述至少兩個隱私數(shù)據(jù)庫進行聯(lián)邦共創(chuàng)加密處理,生成加密樣本數(shù)據(jù)庫;其中,所述加密樣本數(shù)據(jù)庫包括至少兩個加密樣本;每個所述隱私數(shù)據(jù)庫對應(yīng)一個所述加密樣本;基于所述加密樣本數(shù)據(jù)庫對協(xié)作方預(yù)訓(xùn)練模型進行聯(lián)邦學(xué)習(xí),生成聯(lián)邦加密模型。
3、可選的,所述對所述至少兩個隱私數(shù)據(jù)庫進行聯(lián)邦共創(chuàng)加密處理,生成加密樣本數(shù)據(jù)庫;包括:針對至少兩個隱私數(shù)據(jù)庫中任一隱私數(shù)據(jù)庫:對所述隱私數(shù)據(jù)庫進行向量轉(zhuǎn)換處理,生成轉(zhuǎn)化后向量;對所述轉(zhuǎn)換后向量進行中心化處理,輸出中心化向量;將該中心化向量和剩下每個所述隱私數(shù)據(jù)庫的轉(zhuǎn)化后向量共同組成所述隱私數(shù)據(jù)庫對應(yīng)的候選樣本數(shù)據(jù)組;將至少兩個所述候選樣本數(shù)據(jù)組進行加權(quán)處理,生成準樣本數(shù)據(jù)組;其中,所述準樣本數(shù)據(jù)組包括每個目標(biāo)車企的自動駕駛數(shù)據(jù)庫所對應(yīng)的數(shù)據(jù)庫向量以及車企預(yù)訓(xùn)練模型所對應(yīng)的模型參數(shù)向量;從所述準樣本數(shù)據(jù)組中獲取每個目標(biāo)車企對應(yīng)的模型參數(shù)向量,并對所有目標(biāo)車企的模型參數(shù)向量計算平均值,得到模型總參數(shù);基于所述模型總參數(shù)以及每個所述目標(biāo)車企對應(yīng)的數(shù)據(jù)庫向量,生成加密樣本數(shù)據(jù)庫。
4、可選的,當(dāng)所述至少兩個所述候選樣本數(shù)據(jù)組包括第一目標(biāo)車企對應(yīng)的第一候選樣本數(shù)據(jù)組、第二目標(biāo)車企對應(yīng)的第二候選樣本數(shù)據(jù)組,以及第三目標(biāo)車企對應(yīng)的第三候選樣本數(shù)據(jù)組時;所述第一候選樣本數(shù)據(jù)組包括第一中心化向量、第二轉(zhuǎn)化后向量,以及第三轉(zhuǎn)化后向量;所述第二候選樣本數(shù)據(jù)組包括第一轉(zhuǎn)換后向量、第二中心化向量,以及第三轉(zhuǎn)換后向量;所述第三候選樣本數(shù)據(jù)組包括第一轉(zhuǎn)換后向量、第二轉(zhuǎn)換后向量,以及第三中心化向量;
5、所述將至少兩個所述候選樣本數(shù)據(jù)組進行加權(quán)處理,生成準樣本數(shù)據(jù)組;包括:基于注意力機制或者預(yù)設(shè)規(guī)則,確定所述第一候選樣本數(shù)據(jù)組對應(yīng)的第一權(quán)重、所述第二候選樣本數(shù)據(jù)組對應(yīng)的第二權(quán)重,以及所述第三候選樣本數(shù)據(jù)組對應(yīng)的第三權(quán)重;將所述第一候選樣本數(shù)據(jù)組中第一中心化向量施加第一權(quán)重、所述第二候選樣本數(shù)據(jù)組中第一轉(zhuǎn)換后向量施加第二權(quán)重,以及所述第三候選樣本數(shù)據(jù)組中第一轉(zhuǎn)換后向量施加第三權(quán)重,并進行加和處理,輸出第一目標(biāo)車企對應(yīng)的第一數(shù)據(jù)庫向量以及第一模型參數(shù)向量;將所述第二候選樣本數(shù)據(jù)組中第二中心化向量施加第二權(quán)重、所述第一候選樣本數(shù)據(jù)組中第二轉(zhuǎn)換后向量施加第一權(quán)重,以及所述第三候選樣本數(shù)據(jù)組中第二轉(zhuǎn)換后向量施加第三權(quán)重,并進行加和處理,輸出第二目標(biāo)車企對應(yīng)的第二數(shù)據(jù)庫向量以及第二模型參數(shù)向量;將所述第三候選樣本數(shù)據(jù)組中第三中心化向量施加第三權(quán)重、所述第一候選樣本數(shù)據(jù)組中第三轉(zhuǎn)換后向量施加第一權(quán)重,以及所述第二候選樣本數(shù)據(jù)組中第三轉(zhuǎn)換后向量施加第二權(quán)重,并進行加和處理,輸出第三目標(biāo)車企對應(yīng)的第三數(shù)據(jù)庫向量以及第三模型參數(shù)向量;將所述第一目標(biāo)車企對應(yīng)的第一數(shù)據(jù)庫向量以及第一模型參數(shù)向量、所述第二目標(biāo)車企對應(yīng)的第二數(shù)據(jù)庫向量以及第二模型參數(shù)向量,以及所述第三目標(biāo)車企對應(yīng)的第三數(shù)據(jù)庫向量以及第三模型參數(shù)向量,確定為準樣本數(shù)據(jù)組。
6、可選的,在對所述隱私數(shù)據(jù)庫進行向量轉(zhuǎn)換處理之前,還包括:對所述隱私數(shù)據(jù)庫進行同態(tài)加密處理,輸出同態(tài)加密數(shù)據(jù);對所述同態(tài)加密數(shù)據(jù)進行多方計算,輸出多方計算后的隱私數(shù)據(jù)庫。
7、可選的,基于所述聯(lián)邦加密模型對所述第二設(shè)備發(fā)送的隱私數(shù)據(jù)庫進行加密處理,輸出加密數(shù)據(jù);基于若干個所述加密數(shù)據(jù),生成加密數(shù)據(jù)庫。
8、可選的,所述的方法還包括:接收請求車企的第二設(shè)備發(fā)送的數(shù)據(jù)請求;根據(jù)所述數(shù)據(jù)請求,確定被請求車企;將所述數(shù)據(jù)請求發(fā)送至所述被請求車企對應(yīng)的第二設(shè)備;在接收到所述被請求車企發(fā)送的同意共享指令時,從所述加密數(shù)據(jù)庫中選取與所述數(shù)據(jù)請求對應(yīng)的加密數(shù)據(jù);將所述加密數(shù)據(jù)發(fā)送至所述請求車企對應(yīng)的第二設(shè)備。
9、根據(jù)本發(fā)明實施例第二方面,提供一種基于聯(lián)邦學(xué)習(xí)的自動駕駛隱私數(shù)據(jù)保護方法,應(yīng)用于目標(biāo)車企的第二設(shè)備;包括:對所述目標(biāo)車企對應(yīng)的自動駕駛數(shù)據(jù)庫進行合規(guī)化數(shù)據(jù)處理,輸出合規(guī)的聯(lián)邦數(shù)據(jù);對所述合規(guī)的聯(lián)邦數(shù)據(jù)進行機器學(xué)習(xí)和/或深度學(xué)習(xí),生成車企預(yù)訓(xùn)練模型;將所述車企預(yù)訓(xùn)練模型對應(yīng)的模型參數(shù)以及所述自動駕駛數(shù)據(jù)庫發(fā)送至所述第一設(shè)備。
10、可選的,所述方法還包括:接收所述第一設(shè)備發(fā)送的加密數(shù)據(jù);基于所述加密數(shù)據(jù)對所述車企預(yù)訓(xùn)練模型進行模型優(yōu)化,生成車企準模型。
11、可選的,所述對所述目標(biāo)車企對應(yīng)的自動駕駛數(shù)據(jù)庫進行合規(guī)化數(shù)據(jù)處理,輸出合規(guī)的聯(lián)邦數(shù)據(jù);包括:基于目標(biāo)車企簽署各方本地數(shù)據(jù)規(guī)范化合規(guī)協(xié)議對所述目標(biāo)車企對應(yīng)的自動駕駛數(shù)據(jù)庫進行多方數(shù)據(jù)規(guī)范處理,輸出規(guī)范化數(shù)據(jù)庫;對所述規(guī)范化數(shù)據(jù)庫進行本地預(yù)處理,輸出預(yù)處理數(shù)據(jù);對預(yù)處理數(shù)據(jù)進行聯(lián)邦視圖規(guī)范化合規(guī)處理,輸出合規(guī)的聯(lián)邦數(shù)據(jù)。
12、根據(jù)本發(fā)明實施例第三方面,還提供一種基于聯(lián)邦學(xué)習(xí)的自動駕駛隱私數(shù)據(jù)保護裝置,包括應(yīng)用于協(xié)作方的第一設(shè)備和至少兩個第二設(shè)備,每個所述第二設(shè)備應(yīng)用于一個目標(biāo)車企;所述第一設(shè)備和所述第二設(shè)備通信連接;所述裝置應(yīng)用于第一設(shè)備;包括:第一確定模塊,用于針對至少兩個目標(biāo)車企中任一目標(biāo)車企:將所述目標(biāo)車企對應(yīng)的自動駕駛數(shù)據(jù)庫以及車企預(yù)訓(xùn)練模型的模型參數(shù)共同作為所述目標(biāo)車企對應(yīng)的隱私數(shù)據(jù)庫;其中,所述車企預(yù)訓(xùn)練模型用于指示與所述目標(biāo)車企對應(yīng)的第二設(shè)備基于所述自動駕駛數(shù)據(jù)庫進行機器學(xué)習(xí)和/或深度學(xué)習(xí)而生成的模型;所述自動駕駛數(shù)據(jù)庫至少包括:車企名稱、用戶id,以及自動駕駛相關(guān)機構(gòu)法規(guī);加密處理模塊,用于對至少兩個目標(biāo)車企對應(yīng)的隱私數(shù)據(jù)庫進行聯(lián)邦共創(chuàng)加密處理,生成加密樣本數(shù)據(jù)庫;模型生成模塊,用于基于所述加密樣本數(shù)據(jù)庫對協(xié)作方預(yù)訓(xùn)練模型進行聯(lián)邦學(xué)習(xí),生成聯(lián)邦加密模型。
13、根據(jù)本發(fā)明實施例第四方面,一種基于聯(lián)邦學(xué)習(xí)的自動駕駛隱私數(shù)據(jù)保護裝置,應(yīng)用于目標(biāo)車企的第二設(shè)備;包括:合規(guī)化數(shù)據(jù)模塊,用于對所述目標(biāo)車企對應(yīng)的自動駕駛數(shù)據(jù)庫進行合規(guī)化數(shù)據(jù)處理,輸出合規(guī)的聯(lián)邦數(shù)據(jù);預(yù)訓(xùn)練模塊,用于對所述合規(guī)的聯(lián)邦數(shù)據(jù)進行機器學(xué)習(xí)和/或深度學(xué)習(xí),生成車企預(yù)訓(xùn)練模型;發(fā)送模塊,用于將所述車企預(yù)訓(xùn)練模型對應(yīng)的模型參數(shù)以及所述自動駕駛數(shù)據(jù)庫發(fā)送至所述第一設(shè)備。
14、根據(jù)本發(fā)明實施例第五方面,還提供一種電子設(shè)備,包括:處理器;用于存儲所述處理器可執(zhí)行指令的存儲器;所述處理器,用于從所述存儲器中讀取所述可執(zhí)行指令,并執(zhí)行所述指令以實現(xiàn)如第一方面或第二方面所述的方法。
15、根據(jù)本發(fā)明實施例第六方面,還提供一種計算機可讀介質(zhì),其上存儲有計算機程序,所述程序被處理器執(zhí)行時實現(xiàn)如第一方面或第二方面所述的方法。
16、本發(fā)明實施例提供一種基于聯(lián)邦學(xué)習(xí)的自動駕駛隱私數(shù)據(jù)保護方法,包括應(yīng)用于協(xié)作方的第一設(shè)備和至少兩個第二設(shè)備,每個所述第二設(shè)備應(yīng)用于一個目標(biāo)車企;所述第一設(shè)備和所述第二設(shè)備通信連接;所述方法應(yīng)用于第一設(shè)備;包括:針對至少兩個目標(biāo)車企中任一目標(biāo)車企:將所述目標(biāo)車企對應(yīng)的自動駕駛數(shù)據(jù)庫以及車企預(yù)訓(xùn)練模型的模型參數(shù)共同作為所述目標(biāo)車企對應(yīng)的隱私數(shù)據(jù)庫;其中,所述車企預(yù)訓(xùn)練模型用于指示與所述目標(biāo)車企對應(yīng)的第二設(shè)備基于所述自動駕駛數(shù)據(jù)庫進行機器學(xué)習(xí)和/或深度學(xué)習(xí)而生成的模型;所述自動駕駛數(shù)據(jù)庫至少包括:車企名稱、用戶id,以及自動駕駛相關(guān)機構(gòu)法規(guī);對所述至少兩個隱私數(shù)據(jù)庫進行聯(lián)邦共創(chuàng)加密處理,生成加密樣本數(shù)據(jù)庫;其中,所述加密樣本數(shù)據(jù)庫包括至少兩個加密樣本;每個所述隱私數(shù)據(jù)庫對應(yīng)一個所述加密樣本;基于所述加密樣本數(shù)據(jù)庫對協(xié)作方預(yù)訓(xùn)練模型進行聯(lián)邦學(xué)習(xí),生成聯(lián)邦加密模型。本實施例采用聯(lián)邦共創(chuàng)加密處理技術(shù)對多個目標(biāo)車企自動駕駛過程中所生成的隱私數(shù)據(jù)庫進行加密處理,并基于加密處理所生成的加密樣本數(shù)據(jù)庫進行聯(lián)邦學(xué)習(xí),由此在保證各參與車企在不共享隱私數(shù)據(jù)庫的前提下進行聯(lián)邦建模,既解決了數(shù)據(jù)孤島問題又完成了隱私保護,提高了機器學(xué)習(xí)效率。