技術特征:
技術總結
本發(fā)明是一種基于深度剪枝策略的關聯(lián)規(guī)則挖掘方法,用于對大數(shù)據(jù)集進行關聯(lián)規(guī)則挖掘。本方法借鑒了基于壓縮矩陣的Apriori算法的思想,對1?頻繁項集并不按照支持度計數(shù)進行排序,而是直接按照值大小對布爾矩陣內(nèi)的向量進行排序,以確定之后的頻繁項集連接的相對順序;對k?頻繁項集根據(jù)事務長度進行壓縮,刪掉長度小于k的事務;根據(jù)項跟位置關系對k?頻繁項集進行剪枝,對于首項為I的k?頻繁項集的前k?1項,位置在i的項出現(xiàn)的次數(shù)必須大于等于k?i。本發(fā)明相對于MTCA算法,處理時間要短很多,并且在支持度較低的情況下比Apriori標準方法節(jié)約大量的時間,從大數(shù)據(jù)集獲取關聯(lián)規(guī)則的效率更高。
技術研發(fā)人員:李蕾;陳道新;李琪;吳亞彬
受保護的技術使用者:北京郵電大學;首都信息發(fā)展股份有限公司
技術研發(fā)日:2017.03.21
技術公布日:2017.07.28