本申請(qǐng)涉及人工智能,特別是涉及多源特征融合方法及裝置。
背景技術(shù):
1、在超參空間的構(gòu)建過程中,不同來源的數(shù)據(jù)具有不同維度的屬性和特征。在進(jìn)行多維大數(shù)據(jù)分析和超參數(shù)空間挖掘之前,必須首先對(duì)來源不同的多源數(shù)據(jù)進(jìn)行融合。對(duì)于多來源的數(shù)據(jù)進(jìn)行融合,可以提供更全面、準(zhǔn)確和可靠的信息,從而支持更深入的多維度數(shù)據(jù)分析、決策和行動(dòng)。
2、目前對(duì)于多源參數(shù)融合通常采用手動(dòng)方法,人工選擇原文件,從文件中選擇特征進(jìn)行復(fù)制,選擇目標(biāo)文件,然后進(jìn)行對(duì)應(yīng)特征的粘貼。該方法需要人工進(jìn)行操作,在處理超參空間中的大量數(shù)據(jù)時(shí),消耗時(shí)間較多,且容易出現(xiàn)錯(cuò)誤。
技術(shù)實(shí)現(xiàn)思路
1、本申請(qǐng)?zhí)峁┝艘环N多源特征融合方法,可以實(shí)現(xiàn)多源數(shù)據(jù)的自動(dòng)化融合,提升了數(shù)據(jù)處理的準(zhǔn)確率和效率。
2、本申請(qǐng)?zhí)峁┝巳缦路桨福?/p>
3、根據(jù)第一方面,提供了一種多源特征融合方法,所述方法基于軟件平臺(tái)實(shí)現(xiàn),所述軟件平臺(tái)包括交互界面,其特征在于,所述方法包括:加載包含待融合特征數(shù)據(jù)的n個(gè)待融合文件,在交互界面的第一區(qū)域展示所述n個(gè)待融合文件的內(nèi)容,所述n大于1,所述n個(gè)待融合文件來源不同;讀取所述n個(gè)待融合文件中的所述待融合特征數(shù)據(jù),從待融合特征數(shù)據(jù)中篩選目標(biāo)特征;根據(jù)所述目標(biāo)特征對(duì)n個(gè)待融合文件進(jìn)行融合得到融合結(jié)果,在所述交互界面的第二區(qū)域展示所述融合結(jié)果。
4、根據(jù)本申請(qǐng)實(shí)施例中一可實(shí)現(xiàn)的方式,所述來源包括:通過遠(yuǎn)程監(jiān)測(cè)設(shè)備獲取的數(shù)據(jù)、通過地面監(jiān)測(cè)設(shè)備獲得的數(shù)據(jù)、所述遠(yuǎn)程監(jiān)測(cè)設(shè)備和所述地面監(jiān)測(cè)設(shè)備的參數(shù)數(shù)據(jù)中的任意組合。
5、根據(jù)本申請(qǐng)實(shí)施例中一可實(shí)現(xiàn)的方式,所述加載包含待融合特征數(shù)據(jù)的n個(gè)待融合文件包括:響應(yīng)于所述交互界面上的第一組件被觸發(fā)的事件,加載用戶輸入的n個(gè)待融合文件;對(duì)加載的所述待融合文件中的待融合特征數(shù)據(jù)進(jìn)行缺失值補(bǔ)充和標(biāo)準(zhǔn)化處理;其中,所述缺失值補(bǔ)充采用線性均值插值法;所述標(biāo)準(zhǔn)化處理采用標(biāo)準(zhǔn)正態(tài)標(biāo)準(zhǔn)化法。
6、根據(jù)本申請(qǐng)實(shí)施例中一可實(shí)現(xiàn)的方式,所述讀取所述n個(gè)待融合文件中的所述待融合特征數(shù)據(jù),從待融合特征數(shù)據(jù)中篩選目標(biāo)特征包括:響應(yīng)于所述交互界面上的第二組件被觸發(fā)的事件,讀取出所述待融合文件中包含的待融合特征;基于預(yù)設(shè)的篩選規(guī)則,從所述待融合特征中選擇目標(biāo)特征,或者,在所述交互界面的第三區(qū)域展示所述待融合特征,獲取用戶在所述第三區(qū)域中選擇的特征作為所述目標(biāo)特征。
7、根據(jù)本申請(qǐng)實(shí)施例中一可實(shí)現(xiàn)的方式,所述方法還包括:獲取用戶在所述第三區(qū)域中輸入的所述目標(biāo)特征的取值范圍,從所述n個(gè)待融合文件中所述目標(biāo)特征的數(shù)據(jù)中過濾掉取值不在所述取值范圍內(nèi)的數(shù)據(jù)。
8、根據(jù)本申請(qǐng)實(shí)施例中一可實(shí)現(xiàn)的方式,所述根據(jù)所述目標(biāo)特征對(duì)n個(gè)待融合文件進(jìn)行融合包括:響應(yīng)于所述交互界面上的第三組件被觸發(fā)的事件,將所述n個(gè)待融合文件中包含所述目標(biāo)特征的內(nèi)容融合為同一個(gè)文件,所述同一個(gè)文件為所述融合結(jié)果。
9、根據(jù)本申請(qǐng)實(shí)施例中一可實(shí)現(xiàn)的方式,所述將所述n個(gè)待融合文件中包含所述目標(biāo)特征的內(nèi)容融合為同一個(gè)文件包括:利用合并merge函數(shù)對(duì)a文件和b文件的數(shù)據(jù)進(jìn)行合并,利用連接concat函數(shù)對(duì)所述合并處理的結(jié)果進(jìn)行堆疊處理,得到c文件;其中,當(dāng)n等于2時(shí),所述a文件為n個(gè)待融合文件中的第一個(gè)文件,所述b文件為n個(gè)待融合文件中的第二個(gè)文件,所述c文件為所述融合結(jié)果;當(dāng)n大于2時(shí),將所述n個(gè)待融合文件中的第一個(gè)文件作為所述a文件,第二個(gè)文件作為所述b文件;利用所述merge函數(shù)對(duì)所述a文件和所述b文件的數(shù)據(jù)進(jìn)行合并,利用所述concat函數(shù)對(duì)所述合并處理的結(jié)果進(jìn)行堆疊處理,得到所述c文件;將所述a文件更新為當(dāng)前得到的所述c文件,所述b文件更新為所述n個(gè)待融合文件中下一個(gè)未融合的文件,繼續(xù)轉(zhuǎn)至執(zhí)行利用所述merge函數(shù)對(duì)所述a文件和所述b文件的數(shù)據(jù)進(jìn)行合并的步驟,直到所有待融合文件融合為同一個(gè)所述c文件。
10、根據(jù)本申請(qǐng)實(shí)施例中一可實(shí)現(xiàn)的方式,所述利用合并merge函數(shù)對(duì)a文件和b文件的數(shù)據(jù)進(jìn)行合并包括:從所述merge函數(shù)可使用的合并方式中選擇合并方式,依據(jù)選擇的所述合并方式對(duì)a文件和b文件的數(shù)據(jù)進(jìn)行合并;其中,所述merge函數(shù)可使用的合并方式包括inner方式、left方式、right方式和outer方式;所述inner方式為根據(jù)所述a文件和所述b文件的目標(biāo)特征的交集對(duì)所述a文件和所述b文件進(jìn)行融合;所述left方式為根據(jù)所述a文件中的目標(biāo)特征對(duì)所述a文件和所述b文件進(jìn)行融合;所述right方式為根據(jù)所述b文件中的目標(biāo)特征對(duì)所述a文件和所述b文件進(jìn)行融合;所述outer方式為根據(jù)所述a文件和所述b文件的目標(biāo)特征的并集對(duì)所述a文件和所述b文件進(jìn)行融合。
11、根據(jù)第二方面,提供了一種多源特征融合裝置,其特征在于,所述裝置包括:文件加載模塊,用于加載包含待融合特征數(shù)據(jù)的n個(gè)待融合文件,所述n大于1,所述n個(gè)待融合文件來源不同;特征篩選模塊,用于讀取所述n個(gè)待融合文件中的所述待融合特征數(shù)據(jù),從待融合特征數(shù)據(jù)中篩選目標(biāo)特征;數(shù)據(jù)融合模塊,用于根據(jù)所述目標(biāo)特征對(duì)n個(gè)待融合文件進(jìn)行融合,得到融合結(jié)果;界面展示模塊,用于在界面的第一區(qū)域展示所述n個(gè)待融合文件的內(nèi)容以及在所述界面的第二區(qū)域展示所述融合結(jié)果。
12、根據(jù)第三方面,提供了一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序,該程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)上述第一方面中任一項(xiàng)所述的方法的步驟。
13、根據(jù)第四方面,提供了一種電子設(shè)備,包括:
14、一個(gè)或多個(gè)處理器;以及
15、與所述一個(gè)或多個(gè)處理器關(guān)聯(lián)的存儲(chǔ)器,所述存儲(chǔ)器用于存儲(chǔ)程序指令,所述程序指令在被所述一個(gè)或多個(gè)處理器讀取執(zhí)行時(shí),執(zhí)行上述第一方面中任一項(xiàng)所述的方法的步驟。
16、根據(jù)本申請(qǐng)?zhí)峁┑木唧w實(shí)施例,本申請(qǐng)公開了以下技術(shù)效果:
17、1)本申請(qǐng)?zhí)峁┑亩嘣刺卣魅诤戏椒?,可以自?dòng)對(duì)文件進(jìn)行加載并執(zhí)行特征篩選、特征融合等操作。實(shí)現(xiàn)了多源數(shù)據(jù)的自動(dòng)化融合,節(jié)約了人力成本,降低了可能出現(xiàn)的人為失誤,提高了特征融合的準(zhǔn)確度和效率。
18、2)本申請(qǐng)對(duì)待融合文件中的待融合特征數(shù)據(jù)進(jìn)行缺失值補(bǔ)充和標(biāo)準(zhǔn)化處理,一方面,提升了特征融合的準(zhǔn)確率,另一方面,通過缺失值補(bǔ)充降低數(shù)據(jù)確實(shí)對(duì)下游任務(wù)(例如數(shù)據(jù)挖掘和分析)的影響,通過數(shù)據(jù)標(biāo)準(zhǔn)化處理提高下游任務(wù)的性能和算法穩(wěn)定性。
19、3)本申請(qǐng)對(duì)待融合特征進(jìn)行篩選,選擇出所需融合的目標(biāo)特征,并且可以針對(duì)目標(biāo)特征選擇數(shù)據(jù)的取值范圍,使特征融合更有針對(duì)性,用戶可以根據(jù)實(shí)際需求自主進(jìn)行目標(biāo)特征的選擇,進(jìn)一步提升了特征融合的效率和準(zhǔn)確率。
20、4)本申請(qǐng)可針對(duì)待融合文件中目標(biāo)特征的交集、并集或針對(duì)某一個(gè)待融合文件的目標(biāo)特征對(duì)文件進(jìn)行融合,提升了特征融合的靈活性。
21、當(dāng)然,實(shí)施本申請(qǐng)的任一產(chǎn)品并不一定需要同時(shí)達(dá)到以上所述的所有優(yōu)點(diǎn)。
1.一種多源特征融合方法,所述方法基于軟件平臺(tái)實(shí)現(xiàn),所述軟件平臺(tái)包括交互界面,其特征在于,所述方法包括:
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述來源包括:通過遠(yuǎn)程監(jiān)測(cè)設(shè)備獲取的數(shù)據(jù)、通過地面監(jiān)測(cè)設(shè)備獲得的數(shù)據(jù)、所述遠(yuǎn)程監(jiān)測(cè)設(shè)備和所述地面監(jiān)測(cè)設(shè)備的參數(shù)數(shù)據(jù)中的任意組合。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述加載包含待融合特征數(shù)據(jù)的n個(gè)待融合文件包括:
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述讀取所述n個(gè)待融合文件中的所述待融合特征數(shù)據(jù),從待融合特征數(shù)據(jù)中篩選目標(biāo)特征包括:
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述方法還包括:
6.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述根據(jù)所述目標(biāo)特征對(duì)n個(gè)待融合文件進(jìn)行融合包括:響應(yīng)于所述交互界面上的第三組件被觸發(fā)的事件,將所述n個(gè)待融合文件中包含所述目標(biāo)特征的內(nèi)容融合為同一個(gè)文件,所述同一個(gè)文件為所述融合結(jié)果。
7.根據(jù)權(quán)利要求6所述的方法,其特征在于,所述將所述n個(gè)待融合文件中包含所述目標(biāo)特征的內(nèi)容融合為同一個(gè)文件包括:
8.根據(jù)權(quán)利要求7所述的方法,所述利用合并merge函數(shù)對(duì)a文件和b文件的數(shù)據(jù)進(jìn)行合并包括:
9.一種多源特征融合裝置,其特征在于,所述裝置包括:
10.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序,其特征在于,該程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)權(quán)利要求1至8中任一項(xiàng)所述的方法的步驟。
11.一種電子設(shè)備,其特征在于,包括: