本發(fā)明創(chuàng)造屬于訓練樣本規(guī)約的,具體涉及了一種樣本的加速規(guī)約方法、裝置、介質(zhì)、設備和程序。
背景技術(shù):
1、樣本規(guī)約(也被稱為樣本約簡或樣本選擇)方法[6]是統(tǒng)計機器學習中的杰出數(shù)據(jù)預處理范式。它能從有標記訓練集中移除冗余樣本和噪聲,從而形成約簡子集。然后,樣本規(guī)約方法能用約簡子集去改進分類統(tǒng)計算法的計算效率和預測精度。
2、經(jīng)過數(shù)十年的研究,學者們提出了大量的樣本規(guī)約方法。并且,一些綜述性研究把現(xiàn)有的樣本規(guī)約方法大致地分為傳統(tǒng)樣本規(guī)約方法和基于進化算法的樣本規(guī)約方法?,F(xiàn)有的基于進化算法的樣本規(guī)約方法依賴于太多參數(shù),導致表現(xiàn)不穩(wěn)定和應用困難,且還存在有搜索效率低下、耗時長的問題。
技術(shù)實現(xiàn)思路
1、針對上述技術(shù)問題,本發(fā)明創(chuàng)造提出了一種樣本的加速規(guī)約方法、裝置、介質(zhì)、設備和程序。本申請通過一種樣本的加速規(guī)約方法,包括:獲取目標樣本數(shù)據(jù)集中各個樣本在粒子群優(yōu)化算法的當前迭代中各個粒子的當前最優(yōu)位置。根據(jù)各個粒子的所述當前最優(yōu)位置確定各個粒子的維度信息。根據(jù)各個粒子的所述維度信息確定所述樣本在下一次迭代時的目標維度集,根據(jù)所述目標維度集執(zhí)行下一次的迭代。實現(xiàn)了對樣本的加速規(guī)約,提高了搜索效率,降低了規(guī)約耗時。
2、為解決上述技術(shù)問題,本發(fā)明提供的技術(shù)方案包括五個方面。
3、第一方面,本申請?zhí)峁┝艘环N樣本的加速規(guī)約方法,包括:獲取目標樣本數(shù)據(jù)集中各個樣本在粒子群優(yōu)化算法的當前迭代中各個粒子的當前最優(yōu)位置。根據(jù)各個粒子的所述當前最優(yōu)位置確定各個粒子的維度信息。根據(jù)各個粒子的所述維度信息確定所述樣本在下一次迭代時的目標維度集,根據(jù)所述目標維度集執(zhí)行下一次的迭代。
4、在一些實施例中,所述根據(jù)各個粒子的所述維度信息確定所述樣本在下一次迭代時的目標維度集,包括:根據(jù)各個粒子的所述維度信息確定各個維度的粒子分布數(shù)量。根據(jù)所述粒子分布數(shù)量確定所述樣本在下一次迭代時的目標維度集。
5、在一些實施例中,所述根據(jù)所述粒子分布數(shù)量確定所述樣本在下一次迭代時的目標維度集,包括:從當前迭代的當前維度集中獲取所述粒子分布數(shù)量為0的目標維度。從所述當前維度集中刪除所述目標維度,得到所述樣本在下一次迭代時的目標維度集。
6、在一些實施例中,所述根據(jù)所述粒子分布數(shù)量確定所述樣本在下一次迭代時的目標維度集,還包括:從當前迭代的當前維度集中獲取所述粒子分布數(shù)量為粒子群數(shù)量的目標維度;從所述當前維度集中刪除所述目標維度,得到所述樣本在下一次迭代時的目標維度集;并將所述目標維度對應的樣本確定為規(guī)約子集的子集樣本。
7、在一些實施例中,所述方法還包括:獲取最大迭代次數(shù)和所述當前迭代次數(shù)。當所述當前迭代次數(shù)大于或等于所述最大迭代次數(shù)時,停止迭代,輸出粒子群中最優(yōu)粒子的最優(yōu)位置。根據(jù)所述最優(yōu)位置確定規(guī)約子集的子集樣本。
8、在一些實施例中,所述獲取目標樣本數(shù)據(jù)集中各個樣本在粒子群優(yōu)化算法的當前迭代中各個粒子的當前最優(yōu)位置,包括:獲取各個樣本上一次迭代確定的目標維度集、各個粒子的當前最優(yōu)位置和適應度值。根據(jù)所述目標維度集、各個粒子的所述當前最優(yōu)位置和所述適應度值確定在各個粒子在當前迭代中的當前最優(yōu)位置。
9、第二方面,本申請?zhí)岢隽艘环N樣本的加速規(guī)約裝置,包括:第一獲取模塊,用于獲取目標樣本數(shù)據(jù)集中各個樣本在粒子群優(yōu)化算法的當前迭代中各個粒子的當前最優(yōu)位置。第一確定模塊,用于根據(jù)各個粒子的所述當前最優(yōu)位置確定各個粒子的維度信息。第一執(zhí)行模塊,用于根據(jù)各個粒子的所述維度信息確定所述樣本在下一次迭代時的目標維度集,根據(jù)所述目標維度集執(zhí)行下一次的迭代。
10、第三方面,本申請?zhí)岢隽艘环N計算機設備,包括存儲器、處理器及存儲在存儲器上的計算機程序,所述處理器執(zhí)行所述計算機程序以實現(xiàn)第一方面中任一項所述方法的步驟。
11、第四方面,本申請?zhí)岢隽艘环N計算機可讀存儲介質(zhì),其上存儲有計算機程序,該計算機程序被處理器執(zhí)行時實現(xiàn)第一方面中任一項所述方法的步驟。
12、第五方面,本申請?zhí)岢隽艘环N計算機程序產(chǎn)品,包括計算機程序/指令,該計算機程序被處理器執(zhí)行時實現(xiàn)第一方面中任一項所述方法的步驟。
13、本發(fā)明創(chuàng)造的有益效果:本申請通過一種樣本的加速規(guī)約方法,包括:獲取目標樣本數(shù)據(jù)集中各個樣本在粒子群優(yōu)化算法的當前迭代中各個粒子的當前最優(yōu)位置。根據(jù)各個粒子的所述當前最優(yōu)位置確定各個粒子的維度信息。根據(jù)各個粒子的所述維度信息確定所述樣本在下一次迭代時的目標維度集,根據(jù)所述目標維度集執(zhí)行下一次的迭代。實現(xiàn)了對樣本的加速規(guī)約,提高了搜索效率,降低了規(guī)約耗時。
1.一種樣本的加速規(guī)約方法,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述根據(jù)各個粒子的所述維度信息確定所述樣本在下一次迭代時的目標維度集,包括:
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述根據(jù)所述粒子分布數(shù)量確定所述樣本在下一次迭代時的目標維度集,包括:
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述根據(jù)所述粒子分布數(shù)量確定所述樣本在下一次迭代時的目標維度集,還包括:
5.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述方法還包括:
6.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述獲取目標樣本數(shù)據(jù)集中各個樣本在粒子群優(yōu)化算法的當前迭代中各個粒子的當前最優(yōu)位置,包括:
7.一種樣本的加速規(guī)約裝置,其特征在于,包括:
8.一種計算機設備,包括存儲器、處理器及存儲在存儲器上的計算機程序,其特征在于,所述處理器執(zhí)行所述計算機程序以實現(xiàn)權(quán)利要求1至6中任一項所述方法的步驟。
9.一種計算機可讀存儲介質(zhì),其上存儲有計算機程序,其特征在于,該計算機程序被處理器執(zhí)行時實現(xiàn)權(quán)利要求1至6中任一項所述方法的步驟。
10.一種計算機程序產(chǎn)品,包括計算機程序/指令,其特征在于,該計算機程序被處理器執(zhí)行時實現(xiàn)權(quán)利要求1至6中任一項所述方法的步驟。