本發(fā)明涉及的是一種機器學習方法,具體地說是一種調(diào)整限制性玻爾茲曼機隱含節(jié)點數(shù)目的方法。
背景技術(shù):
限制玻爾茲曼機被廣泛應用在傳統(tǒng)的機器學習以及深度學習領(lǐng)域。限制玻爾茲曼機的架構(gòu)直接決定了學習成果的好壞。如何能構(gòu)架更優(yōu)秀的使限制玻爾茲曼機,是人工智能領(lǐng)域的難點與熱點問題。而限制玻爾茲曼機的隱層節(jié)點數(shù)目是非常重要的參數(shù),它直接決定了限制玻爾茲曼機的架構(gòu);同時,也對學習成果的好壞起到重要影響。但就當前而言,隱層節(jié)點數(shù)目還停留在依靠經(jīng)驗,嘗試等方法設定其數(shù)目,過程繁瑣且效果一般。
技術(shù)實現(xiàn)要素:
本發(fā)明的目的在于提供一種能提高限制性玻爾茲曼機的訓練效率,改善學習準確率的自動調(diào)整限制性玻爾茲曼機隱含節(jié)點數(shù)目的方法。
本發(fā)明的目的是這樣實現(xiàn)的:
步驟一,整理訓練數(shù)據(jù);
步驟二,設定初始層節(jié)點數(shù)的數(shù)目;
步驟三,估計現(xiàn)有訓練數(shù)據(jù)的信息熵;
步驟四,依據(jù)所估計的信息熵對下一層的隱節(jié)點數(shù)進行估計;
步驟五,更新訓練數(shù)據(jù);
步驟六,再次計算更新之后的訓練數(shù)據(jù)的信息熵,用以調(diào)整下一隱層節(jié)點數(shù),直到所有隱層節(jié)點調(diào)整完畢。
本發(fā)明還可以包括:
1、所述整理訓練數(shù)據(jù)的具體過程為:
將所有不同種類的訓練數(shù)據(jù)整理成為一個矩陣,矩陣的長度為所有類別的訓練數(shù)據(jù)的數(shù)量,矩陣的高度為特征的數(shù)量。
2、設定初始層節(jié)點數(shù)的數(shù)目的方法為:
初始層節(jié)點數(shù)目等于訓練數(shù)據(jù)所組成的矩陣的高度。
3、估計現(xiàn)有訓練數(shù)據(jù)的信息熵的具體過程為:
其中,c是總的分類數(shù),x為訓練數(shù)據(jù)矩陣,ck是第k個分類,c是分類的數(shù)量,h(·)表示熵,n是總的訓練數(shù)據(jù)的數(shù)量,xj是第j個訓練數(shù)據(jù)向量,p(ck)=nk/n,nk表示第ck類的訓練數(shù)據(jù)的總數(shù)量,
其中,δ為互相關(guān)矩陣,h為窗長度,定義為h=1/log2(n),n為采樣點數(shù)。
4、所述依據(jù)所估計的信息熵對下一層的隱節(jié)點數(shù)進行估計的具體過程為:
其中,nnow為待估計的隱層節(jié)點數(shù),npre為上一層的隱層節(jié)點數(shù)或者初始層的節(jié)點數(shù)。
本發(fā)明采用求取信息熵以及互熵的方法,能依靠訓練數(shù)據(jù)自動的求取最優(yōu)的限制玻爾茲曼機的隱層節(jié)點數(shù)目,對提高學習效率,改善學習成果有顯著的作用。
步驟六訓練完畢的限制性玻爾茲曼機示意圖如圖2所示。其中,左側(cè)顯示未調(diào)整的限制玻爾茲曼機,右側(cè)顯示采用本方法調(diào)整之后的限制玻爾茲曼機。
本發(fā)明開創(chuàng)了一種自動調(diào)整限制性玻爾茲曼機隱含節(jié)點數(shù)目的方法,填補了這一領(lǐng)域的空白。大大提高了限制性玻爾茲曼機的訓練效率,并且改善了學習準確率。
附圖說明
圖1為本發(fā)明的總體流程圖。
圖2為自動調(diào)整之后的限制性玻爾茲曼機隱層節(jié)點示意圖。
具體實施方式
下面結(jié)合附圖舉例對本發(fā)明作進一步描述。以下實施例僅用于更加清楚地說明本發(fā)明的技術(shù)方案,而不能以此來限制本發(fā)明的保護范圍。
結(jié)合圖1,本發(fā)明的自動調(diào)整限制性玻爾茲曼機隱含節(jié)點數(shù)目的方法包括以下步驟:
步驟一,整理訓練數(shù)據(jù)。將所有不同種類的訓練數(shù)據(jù)整理成為一個矩陣,矩陣的長度為所有類別的訓練數(shù)據(jù)的數(shù)量,矩陣的高度為特征的數(shù)量。
步驟二,設定初始層節(jié)點數(shù)的數(shù)目。初始層節(jié)點數(shù)目等于訓練數(shù)據(jù)所組成的矩陣的高度。
步驟三,估計現(xiàn)有訓練數(shù)據(jù)的信息熵。具體過程如下:
其中,ck是第k個分類,c是分類的數(shù)量,h(·)表示熵。n是總的訓練數(shù)據(jù)的數(shù)量。xj是第j個訓練數(shù)據(jù)向量。p(ck)=nk/n,nk表示第ck類的訓練數(shù)據(jù)的總數(shù)量。
其中,δ為互相關(guān)矩陣,h為窗長度,定義為h=1/log2(n),n為采樣點數(shù)。
步驟四,依據(jù)所求的信息熵對下一層的隱節(jié)點數(shù)進行估計。具體過程如下:
其中,nnow為待估計的隱層節(jié)點數(shù),npre為上一層的隱層節(jié)點數(shù)或者初始層的節(jié)點數(shù)。
步驟五,更新訓練數(shù)據(jù)。
步驟六,再次計算更新之后的訓練數(shù)據(jù)的信息熵,用以調(diào)整下一隱層節(jié)點數(shù),直到所有隱層節(jié)點調(diào)整完畢。
步驟六訓練完畢的限制性玻爾茲曼機示意圖如圖2所示。其中,左側(cè)顯示未調(diào)整的限制玻爾茲曼機,右側(cè)顯示采用本方法調(diào)整之后的限制玻爾茲曼機。
綜上所述,本發(fā)明開創(chuàng)了一種自動調(diào)整限制性玻爾茲曼機隱含節(jié)點數(shù)目的方法,填補了這一領(lǐng)域的空白。大大提高了限制性玻爾茲曼機的訓練效率,并且改善了學習準確率。
以上所述僅是本發(fā)明的優(yōu)選實施方式,應當指出,對于本技術(shù)領(lǐng)域的普通技術(shù)人員來說,在不脫離本發(fā)明技術(shù)原理的前提下,還可以做出若干改進和變形,這些改進和變形也應視為本發(fā)明的保護范圍。