本發(fā)明涉及一種置信度計(jì)算方法,特別是涉及一種基于狄利克雷特分布的置信度計(jì)算方法。
背景技術(shù):
傳統(tǒng)的回歸置信度計(jì)算方法,不能處理高維和線性不可分的情況下的置信度計(jì)算問題。隨著特征的數(shù)量增加的,傳統(tǒng)的置信度計(jì)算方法難以針對每個(gè)特征概率進(jìn)行缺失補(bǔ)全、偏差修正等處理,容易造成計(jì)算結(jié)果的偏差。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明所要解決的技術(shù)問題是提供一種基于狄利克雷特分布的置信度計(jì)算方法,其能夠解決高維、線性不可分情況下的分界面預(yù)測問題,優(yōu)化缺失、強(qiáng)關(guān)聯(lián)、互斥情況下的特征概率。
本發(fā)明是通過下述技術(shù)方案來解決上述技術(shù)問題的:一種基于狄利克雷特分布的置信度計(jì)算方法,其包括以下步驟:
步驟一,隱含狄利克雷特分布參數(shù)估計(jì)訓(xùn)練;
步驟二,輸入特征數(shù)據(jù)、特征處理;
步驟三,參數(shù)和權(quán)重歸一化、置信度計(jì)算;
步驟四,利用置信度計(jì)算和排序。
優(yōu)選地,所述步驟一包括以下步驟:
步驟十,輸入訓(xùn)練樣本數(shù)據(jù);
步驟十一,隱含狄利克雷特分布參數(shù)估計(jì)訓(xùn)練;
步驟十二,輸出模型的參數(shù)估計(jì)到基于狄利克雷特分布的置信度計(jì)算的模型參數(shù)中。
優(yōu)選地,所述步驟二包括以下步驟:
步驟二十,輸入預(yù)測數(shù)據(jù);
步驟二十一,根據(jù)特征概率的特性,做補(bǔ)全、修正處理;
步驟二十二,輸出處理后的概率到預(yù)測排序中,進(jìn)行置信度計(jì)算。
優(yōu)選地,所述步驟三包括以下步驟:
步驟三十,輸入預(yù)測數(shù)據(jù)的特征概率;
步驟三十一,置信度計(jì)算;
步驟三十二,置信度歸一化;
步驟三十三,根據(jù)歸一化后的置信度預(yù)測和排序。
優(yōu)選地,所述步驟四包括以下步驟:
步驟四十,類別輸出模塊,用于輸出所分析得到對象的類別;
步驟四十一,排序輸出模塊,用于輸出作案率較高的對象排序。
本發(fā)明的積極進(jìn)步效果在于:本發(fā)明能夠采用隱含規(guī)律的置信度計(jì)算,克服了回歸等置信度計(jì)算方法在高維、線性不可分情況下的分界面預(yù)測問題;對不同類型的特征采取不同的處理方法,其中對缺失特征進(jìn)行先驗(yàn)概率補(bǔ)全,對強(qiáng)關(guān)聯(lián)、互斥特征進(jìn)行概率縮放,避免了特征缺失、強(qiáng)關(guān)聯(lián)、互斥帶來的概率干擾,減少預(yù)測、排序偏差。
附圖說明
圖1為本發(fā)明的流程圖。
具體實(shí)施方式
下面結(jié)合附圖給出本發(fā)明較佳實(shí)施例,以詳細(xì)說明本發(fā)明的技術(shù)方案。
如圖1所示,本發(fā)明基于狄利克雷特分布的置信度計(jì)算方法包括以下步驟:
步驟一,隱含狄利克雷特分布參數(shù)估計(jì)訓(xùn)練,用于獲取樣本數(shù)據(jù)并進(jìn)行隱含狄利克雷特分布訓(xùn)練,得到模型的參數(shù)估計(jì);
步驟二,輸入特征數(shù)據(jù)、特征處理,用于計(jì)算預(yù)測數(shù)據(jù)概率,并針對特征概率進(jìn)行修正;
步驟三,參數(shù)和權(quán)重歸一化、置信度計(jì)算,用于對預(yù)測數(shù)據(jù)進(jìn)行復(fù)雜的算法運(yùn)算計(jì)算置信度、做歸一化處理;
步驟四,利用置信度計(jì)算和排序。
所述步驟一包括以下步驟:
步驟十,輸入訓(xùn)練樣本數(shù)據(jù);
步驟十一,隱含狄利克雷特分布參數(shù)估計(jì)訓(xùn)練;
步驟十二,輸出模型的參數(shù)估計(jì)到基于狄利克雷特分布的置信度計(jì)算的模型參數(shù)中。
所述步驟二包括以下步驟:
步驟二十,輸入預(yù)測數(shù)據(jù);
步驟二十一,根據(jù)特征概率的特性,做補(bǔ)全、修正處理;
步驟二十二,輸出處理后的概率到預(yù)測排序中,進(jìn)行置信度計(jì)算。
所述步驟三包括以下步驟:
步驟三十,輸入預(yù)測數(shù)據(jù)的特征概率;
步驟三十一,置信度計(jì)算;
步驟三十二,置信度歸一化;
步驟三十三,根據(jù)歸一化后的置信度預(yù)測和排序。
所述步驟四包括以下步驟:
步驟四十,類別輸出模塊,用于輸出所分析得到對象的類別;
步驟四十一,排序輸出模塊,用于輸出作案率較高的對象排序。
以上所述的具體實(shí)施例,對本發(fā)明的解決的技術(shù)問題、技術(shù)方案和有益效果進(jìn)行了進(jìn)一步詳細(xì)說明,所應(yīng)理解的是,以上所述僅為本發(fā)明的具體實(shí)施例而已,并不用于限制本發(fā)明,凡在本發(fā)明的精神和原則之內(nèi),所做的任何修改、等同替換、改進(jìn)等,均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。