本發(fā)明涉及數據處理,尤其涉及一種基于人工智能的數據安全處理方法。
背景技術:
1、在數據處理與安全保護的交叉領域,特別是針對敏感信息的編碼策略,傳統(tǒng)方法多依賴于靜態(tài)的編碼框架與規(guī)則,例如基礎的替換密碼、哈希運算及標準化編碼算法。然而,這些傳統(tǒng)手段在應對當前復雜的數據解析與破解技術時,展現出了一定的局限性,這一局限性主要源于其固有的靜態(tài)特性。具體而言,通過分析編碼文本的模式與統(tǒng)計特性,攻擊者可能揭示出原始數據的蛛絲馬跡,從而加劇了數據泄露的風險。傳統(tǒng)編碼方式未能充分考量數據隨時間而變化的動態(tài)性。在實際場景中,敏感數據往往處于不斷變動之中,而靜態(tài)編碼規(guī)則難以適應這種變化,導致編碼的安全防護能力隨時間推移而減弱。更為嚴重的是,對于那些長期保持穩(wěn)定的字符串內容,傳統(tǒng)編碼方法往往無法有效掩蓋其統(tǒng)計規(guī)律性,使得這些字符串易于被識別并追溯至其原始意義,進一步加劇了數據隱私泄露的風險。
2、如中國專利公告號cn116933297?b公開了一種金融敏感風險數據安全保護方法,所述方法包括:采集得到敏感風險數據序列,根據敏感風險數據序列得到特征字符串,獲取各特征字符串的所有后綴字符,確定所述后綴字符的出現可能性,進而得到各特征字符串的長字符串;根據各特征字符串的長字符串完成各特征字符串處的字典更新,完成對敏感風險數據序列的加密得到密文數據。進而隱藏敏感風險數據序列中統(tǒng)計信息,提高加密安全性。
3、對比文件中特征字符串中的后綴字符,攻擊者可能會通過分析后綴字符發(fā)現其中的模式,從而增加破解的風險,對比文件中靜態(tài)編碼規(guī)則因其固定不變的結構,易成為破解者分析的目標。
技術實現思路
1、本技術提供一種基于人工智能的數據安全處理方法,通過采用了等長編碼和補償編碼,使得原始字符串的統(tǒng)計特征被隱匿,增加了破解的難度,補償編碼的隨機填充進一步提高了編碼的復雜性和不可預測性。
2、本技術提供了一種基于人工智能的數據安全處理方法,包括:
3、s101,采集敏感數據序列,將采集到的敏感數據序列拆分成若干個可行性字符串;
4、s102,根據得到的可行性字符串生成特征字符串,獲取各特征字符串的后綴字符,計算各特征字符串的各后綴字符的出現可能性;
5、s103,根據出現可能性得到各特征字符串的長字符串;
6、s104,選擇字符集和編碼長度,對編碼結構進行定義;
7、s105,根據步驟s104中選定的字符集,生成補償編碼,將生成的補償編碼存儲到補償編碼庫中;
8、s106,基于得到的長字符串,根據編碼規(guī)則生成等長編碼,若生成的等長編碼中有多余位置,從補償編碼庫中選擇補償編碼進行填充;在等長編碼的隨機位置處插入字符;
9、s107,將生成的長字符串及其對應的等長編碼存儲在字典中,根據字典對敏感風險數據序列進行加密和解密。
10、優(yōu)選地,所述將敏感數據序列拆分成若干個可行性字符串,預設滑窗,所述滑窗為具有固定長度的窗口,將預設滑窗的左側與敏感數據序列的第一個字符對齊,以一個字符為滑動步長,將預設滑窗從左向右滑動,直到滑窗的右側與敏感數據序列的最后一個字符對齊,記錄預設滑窗每次滑動時在敏感數據序列上對應的子序列。
11、優(yōu)選地,將可行性字符串出現頻數大于預設頻數閾值的字符串作為固定字符串,計算固定字符串相鄰位置之間的間隔,生成一個包含所有間隔的列表,計算所有間隔的均值和標準差,周期分布程度=。
12、優(yōu)選地,等長編碼的隨機位置處插入字符的具體步驟為:
13、s201,基于步驟s106中生成的等長編碼,使用隨機數生成器選擇若干個隨機位置;
14、s202,根據選擇的隨機位置,從補償編碼庫中選取補償編碼,將選取補償編碼插入到等長編碼的隨機位置中;
15、s203,對生成的等長編碼進行驗證,將編碼及其對應的字符串、分配時間和有效期限記錄在數據庫中;
16、s204,根據字典和等長編碼還原出原始的字符串。
17、優(yōu)選地,所述字典為一個預先定義好的映射表,字典存儲等長編碼與原始字符串之間的對應關系,每個等長編碼在字典中都有一個唯一的鍵,與之對應的值則是原始的字符串,將獲取的等長編碼對應的鍵輸入到字典中,在字典中進行查找,字典查找到與鍵相對應的原始的字符串。
18、優(yōu)選地,所述字典為一個一段時間內根據字符串內容的變化而被動更新的數據庫,插接字符指在原始編碼中插入的額外字符,對插接字符進行轉換的步驟為:
19、s301,設置一個魔方,所述魔方至少具有26個面,每個面包含一個小塊,代表一個英文字母或符號,創(chuàng)建字符表;
20、s302,基于隨機算法生成打亂路徑,根據打亂路徑上字符在主面上的位置,確定每個字符從主面到調節(jié)面的單次移動路徑;
21、s303,根據單次移動路徑和字符表中的預設方向,將字符轉換為新的字符;
22、s304,將轉換后的字符插入到等長編碼中,形成組合編碼;
23、s305,使用相同的魔方和字符表,根據接收到的打亂路徑,逆向應用轉換規(guī)則,將組合編碼還原為原始編碼。
24、優(yōu)選地,所述預設方向為比較路徑中的第一個坐標和第二個坐標。
25、優(yōu)選地,在原始編碼和補償編碼中增加一種動態(tài)編碼。
26、優(yōu)選地,增加動態(tài)編碼的步驟:
27、s401,根據打亂路徑的哈希值,判斷使用原始編碼還是補償編碼;
28、s402,若步驟s401中選擇的是補償編碼,根據打亂路徑和轉換規(guī)則,將原始編碼中的字符轉換為補償編碼;若步驟s401中選擇的是原始編碼,根據打亂路徑和轉換規(guī)則,將補償編碼中的字符轉換為原始編碼;
29、s403,根據選擇好的編碼與其余部分組合成最終的組合編碼;
30、s404,用相同的魔方結構、字符表和轉換規(guī)則,根據接收到的打亂路徑和編碼類型選擇,逆向應用轉換規(guī)則,如果使用了補償編碼,將組合編碼還原為原始編碼;如果使用了原始編碼,將組合編碼還原為補償編碼。
31、優(yōu)選地,所述打亂路徑為每次轉換前魔方隨機打亂的狀態(tài),每個打亂狀態(tài)對應一個唯一的路徑,用于確定字符的轉換結果。
32、本技術中提供的一個或多個技術方案,至少具有如下技術效果或優(yōu)點:采用了等長編碼和補償編碼,使得原始字符串的統(tǒng)計特征被隱匿,增加了破解的難度,補償編碼的隨機填充進一步提高了編碼的復雜性和不可預測性;
33、通過隨機位置的生成,使得補償編碼的分布變得難以預測,即使攻擊者知道編碼的存在和可能的作用,他們也難以準確定位這些編碼,從而增加了數據保護和安全傳輸的難度,隨機位置選擇和補償編碼插入相結合,可以顯著提高數據編碼的安全性,在數據傳輸中,該機制能夠有效抵抗數據篡改和中間人攻擊;
34、通過插接額外字符,并應用基于魔方狀態(tài)和字符表的轉換規(guī)則,原始編碼的復雜性顯著增加,這使得編碼更難以被破解或預測,每次轉換前,魔方都會隨機打亂到一個新的狀態(tài),確保每次編碼都是唯一的,這消除了統(tǒng)計規(guī)律,使得編碼更難以被分析或模式識別。