本技術(shù)涉及但不限于計算機,尤其涉及一種模型保護方法及模型方設備、數(shù)據(jù)推理方法及設備。
背景技術(shù):
1、人工智能計算機(artificial?intelligence?personal?computer,aipc)是一種集成了ai技術(shù)的個人計算機。通過集成中央處理器(central?processing?unit,cpu)、圖形處理器(graphics?processing?unit,gpu)及神經(jīng)網(wǎng)絡處理器(neural?processing?unit,npu)等硬件,aipc可以搭載多種ai模型(例如,大語言系列模型(large?language?modelmeta?ai,llama)、轉(zhuǎn)換器(transformer)模型、文生圖模型,等等)來滿足用戶的多種ai需求。
2、但是,aipc從模型方服務器或平臺下載ai模型的軟件包并安裝ai模型之后,運行在aipc上的ai模型可能遭受到逆向工程、未授權(quán)訪問等非法操作,導致ai模型的模型參數(shù)泄漏,而模型參數(shù)泄漏則進一步導致模型方知識產(chǎn)權(quán)被濫用、商業(yè)機密泄漏或數(shù)據(jù)濫用。因此,如何實現(xiàn)對ai模型的模型參數(shù)保護,對于防止知識產(chǎn)權(quán)濫用、確保數(shù)據(jù)隱私安全和維護系統(tǒng)安全至關(guān)重要。
技術(shù)實現(xiàn)思路
1、有鑒于此,本技術(shù)至少提供一種模型保護方法及模型方設備、數(shù)據(jù)推理方法及設備。
2、本技術(shù)的技術(shù)方案是這樣實現(xiàn)的:
3、一方面,本技術(shù)提供一種數(shù)據(jù)處理方法,所述方法包括:
4、確定第一模型中的至少一個目標模型參數(shù);
5、基于所述至少一個目標模型參數(shù)及第一矩陣集合,確定每一所述目標模型參數(shù)對應的置換矩陣;所述第一矩陣集合包括至少一個第一矩陣;不同的第一矩陣具有不同的矩陣元素或矩陣維度;所述置換矩陣的矩陣維度與所述目標模型參數(shù)的參數(shù)矩陣的矩陣維度具有對應關(guān)系;
6、利用所述置換矩陣置換所述第一模型中對應的目標模型參數(shù)的參數(shù)矩陣,得到第二模型;
7、發(fā)送所述第二模型。
8、在一些實施例中,所述基于所述至少一個目標模型參數(shù)及第一矩陣集合,確定每一所述目標模型參數(shù)對應的置換矩陣,包括:
9、基于所述至少一個目標模型參數(shù),確定目標生成策略;
10、基于所述目標生成策略,從所述第一矩陣集合中確定每一所述目標模型參數(shù)對應的至少一個第一目標矩陣;
11、基于所述至少一個第一目標矩陣,生成每一所述目標模型參數(shù)對應的置換矩陣。
12、在一些實施例中,所述基于所述至少一個目標模型參數(shù),確定目標生成策略,包括以下至少之一:
13、基于所述至少一個目標模型參數(shù)的數(shù)量,確定每一所述目標模型參數(shù)對應的目標生成策略;
14、基于所述目標模型參數(shù)的參數(shù)矩陣的矩陣維度,確定每一所述目標模型參數(shù)對應的目標生成策略;
15、基于每一所述目標模型參數(shù)對應的網(wǎng)絡層的類型,確定每一所述目標模型參數(shù)對應的目標生成策略。
16、在一些實施例中,所述目標生成策略包括第一生成策略和第二生成策略中的一個;所述第一生成策略表征基于最小計算量從所述第一矩陣集合中確定至少一個第一目標矩陣;所述第二生成策略表征基于選取最大數(shù)量的第一目標矩陣從所述第一矩陣集合中確定多個第一目標矩陣;
17、所述基于所述至少一個目標模型參數(shù),確定目標生成策略,包括以下至少之一:
18、在所述至少一個目標模型參數(shù)的數(shù)量大于數(shù)量閾值的情況下,將所述第一生成策略確定為所述目標生成策略;在所述至少一個目標模型參數(shù)的數(shù)量不大于數(shù)量閾值的情況下,將所述第二生成策略確定為所述目標生成策略;
19、在每一所述目標模型參數(shù)的參數(shù)矩陣對應的矩陣維度大于維度閾值的情況下,將所述第一生成策略確定為所述目標生成策略;在所述至少一個目標模型參數(shù)的參數(shù)矩陣對應的矩陣維度大不于維度閾值的情況下,將所述第二生成策略確定為所述目標生成策略;
20、針對每一所述目標模型參數(shù),在所述目標模型參數(shù)對應的網(wǎng)絡層的類型為指定類型的情況下,將所述第二生成策略確定為所述目標生成策略;在所述目標模型參數(shù)對應的網(wǎng)絡層的類型不是指定類型的情況下,將所述第一生成策略確定為所述目標生成策略。
21、在一些實施例中,所述確定第一模型中的至少一個目標模型參數(shù),包括:
22、確定所述第一模型中的至少一個目標網(wǎng)絡層;
23、針對每一所述目標網(wǎng)絡層,確定所述目標網(wǎng)絡層中的至少一個目標模型參數(shù);其中,每一所述目標模型參數(shù)表征通過模型訓練確定的模型參數(shù)。
24、在一些實施例中,所述第一模型包括轉(zhuǎn)換器模型;所述至少一個目標網(wǎng)絡層至少包括輸入數(shù)據(jù)編碼層、多個注意力層、多個全連接層、多個歸一化層和分類器層;
25、所述針對每一目標網(wǎng)絡層,確定所述目標網(wǎng)絡層中的至少一個目標模型參數(shù),包括:
26、從所述第一模型的輸入數(shù)據(jù)編碼層、每一注意力層、每一全連接層、每一歸一化層和分類器層對應的計算公式包含的至少一個模型參數(shù)中確定至少一個第一目標模型參數(shù)。
27、在一些實施例中,所述第一模型包括大語言模型;所述目標網(wǎng)絡層至少包括輸入數(shù)據(jù)編碼層、多個歸一化層、多個注意力層、多個全連接層和分類器層;
28、所述針對每一目標網(wǎng)絡層,確定所述目標網(wǎng)絡層中的至少一個目標模型參數(shù),包括:
29、從所述輸入數(shù)據(jù)編碼層、每一所述歸一化層、每一所述全連接層和所述分類器層對應的計算公式包含的至少一個模型參數(shù)中確定至少一個第二目標模型參數(shù);
30、從每一所述注意力層對應的計算公式包含的至少一個模型參數(shù)中確定至少一個第三目標模型參數(shù);其中,在所述第三目標模型參數(shù)包括所述注意力層對應的計算公式中的用于計算查詢向量和鍵向量的模型參數(shù)的情況下,所述第三目標模型參數(shù)不作為被乘數(shù)執(zhí)行所述置換處理。
31、另一方,本技術(shù)提供一種數(shù)據(jù)推理方法,應用于數(shù)據(jù)推理設備,包括:
32、接收第二模型;其中,所述第二模型是利用置換矩陣置換第一模型中對應的目標模型參數(shù)的參數(shù)矩陣得到的;所述置換矩陣是基于第一模型中的至少一個目標模型參數(shù)及第一矩陣集合確定的;所述第一矩陣集合包括至少一個第一矩陣;不同的第一矩陣具有不同的矩陣元素或矩陣維度;所述置換矩陣的矩陣維度與所述目標模型參數(shù)的參數(shù)矩陣的矩陣維度具有對應關(guān)系;
33、響應于輸入數(shù)據(jù),利用所述第二模型執(zhí)行數(shù)據(jù)推理,以得到所述輸入數(shù)據(jù)對應的推理結(jié)果。
34、另一方面,本技術(shù)提供一種模型方設備,包括第一處理器和第一通信接口;
35、所述第一處理器,用于確定第一模型中的至少一個目標模型參數(shù);基于所述至少一個目標模型參數(shù)及第一矩陣集合,確定每一所述目標模型參數(shù)對應的置換矩陣;所述第一矩陣集合包括至少一個第一矩陣;不同的第一矩陣具有不同的矩陣元素或矩陣維度;所述置換矩陣的矩陣維度與所述目標模型參數(shù)的參數(shù)矩陣的矩陣維度具有對應關(guān)系;利用所述置換矩陣置換所述第一模型中對應的目標模型參數(shù)的參數(shù)矩陣,得到第二模型;
36、所述第一通信接口,用于發(fā)送所述第二模型。
37、另一方面,本技術(shù)提供一種數(shù)據(jù)推理設備,包括第二處理器和第二通信接口;
38、所述第二通信接口,用于接收第二模型;其中,所述第二模型是利用置換矩陣置換第一模型中對應的目標模型參數(shù)的參數(shù)矩陣得到的;所述置換矩陣是基于第一模型中的至少一個目標模型參數(shù)及第一矩陣集合確定的;所述第一矩陣集合包括至少一個第一矩陣;不同的第一矩陣具有不同的矩陣元素或矩陣維度;所述置換矩陣的矩陣維度與所述目標模型參數(shù)的參數(shù)矩陣的矩陣維度具有對應關(guān)系;
39、所述第二處理器,用于響應于輸入數(shù)據(jù),利用所述第二模型執(zhí)行數(shù)據(jù)推理,以得到所述輸入數(shù)據(jù)對應的推理結(jié)果。
40、應當理解的是,以上的一般描述和后文的細節(jié)描述僅是示例性和解釋性的,而非限制本公開的技術(shù)方案。