1.一種基于復(fù)雜生物網(wǎng)絡(luò)集的頻繁模式挖掘基因功能的預(yù)測方法,其特征在于,所述預(yù)測方法包括:
第一步、尋找頻繁稠密點(diǎn)集無貢獻(xiàn)的不相關(guān)的邊:
步驟S11、獲取多個(gè)基因表達(dá)數(shù)據(jù)轉(zhuǎn)換成生物網(wǎng)絡(luò)后形成的初始圖集D={Gi=(V,Ei)}(1≤i≤m),并確定最小稠密度閾值δ、最小頻繁支持度閾值k和用戶自定義參數(shù)f,p,q分別對應(yīng)的數(shù)值;其中,所述初始圖集由多個(gè)均具有相同點(diǎn)集的子圖Gi形成,且不同子圖Gi之間至少存在一條相異的邊;
步驟S12:確定每一個(gè)子圖Gi的每條邊,在所述初始圖集中出現(xiàn)的次數(shù)均大于最小頻繁支持度閾值k和圖集大小m的乘積的最小正整數(shù)值;
步驟S13、刪除所述初始圖集中每一個(gè)子圖Gi中均滿足稠密度系數(shù)EDe<δ/f的邊;
步驟S14、構(gòu)建出與所述初始圖集中每一個(gè)子圖Gi具有相同點(diǎn)集的摘要圖,且所述初始圖集對應(yīng)的摘要圖中每條邊均需滿足稠密度系數(shù)
步驟S15、對所述初始圖集對應(yīng)的摘要圖中每條邊均做邊聚類系數(shù),刪除所述初始圖集對應(yīng)的摘要圖中邊聚類系數(shù)ECe<q的邊并更新;
步驟S16、將所述更新后的初始圖集對應(yīng)的摘要圖與所述每一個(gè)子圖Gi的邊進(jìn)行一一對比,刪除每一個(gè)子圖Gi中不存在于所述更新后的初始圖集對應(yīng)的摘要圖中的邊并更新;
步驟S17、重復(fù)步驟S13至步驟S16,直到所述更新后的初始圖集對應(yīng)的摘要圖中的邊不在發(fā)生變化為止;
第二步、確定候選網(wǎng)絡(luò)子集:
步驟S21、給所述邊不在發(fā)生變化的摘要圖中每條邊的邊向量均賦予一個(gè)權(quán)值,并確定所述賦值的每條邊對應(yīng)邊支持向量的漢明值,且進(jìn)一步將漢明值滿足篩選條件的邊向量并到集合A中,將漢明值不滿足篩選條件的邊向量并到集合B中;
步驟S22、分別對所述集合A和所述集合B中的邊向量進(jìn)行歸并,把重復(fù)的邊向量刪除,僅保留一個(gè)并更新邊向量對應(yīng)的權(quán)值;
步驟S23、設(shè)置種子向量,并根據(jù)所述設(shè)置的種子向量,調(diào)整集合A和集合B中的邊向量;其中,所述種子向量為權(quán)重最大的邊;
步驟S24、按照最大邊向量相似度的準(zhǔn)則,把所述調(diào)整后的集合B中的邊向量均映射到所述調(diào)整后的集合A中,并待映射結(jié)束后,將所述完成映射后的集合A中的邊向量進(jìn)行聚類運(yùn)算,形成聚類中心集合;
步驟S25:刪除聚類中心集合中,1的個(gè)數(shù)出現(xiàn)的頻率小于k與圖集大小乘積的下取整數(shù)的聚類中心;
第三步、獲取摘要圖集:
步驟S31、根據(jù)所述形成的聚類中心集合,在所述初始圖集D={Gi=(V,Ei)}(1≤i≤m)中,提取分別與所述聚類中心集合中每一向量相一致的子圖,形成多個(gè)新圖集;
步驟S32、根據(jù)所述確定的最小稠密度閾值δ、最小頻繁支持度閾值k和用戶自定義參數(shù)f,p,q分別對應(yīng)的數(shù)值,刪除所述每一新圖集中均滿足稠密度系數(shù)EDe<δ/f的邊;
步驟S33、分別構(gòu)建出與所述每一新圖集中具有相同點(diǎn)集的摘要圖,且所述每一新圖集的摘要圖中每條邊均需滿足稠密度系數(shù)
步驟S34、對所述每一新圖集的摘要圖中每條邊均做邊聚類系數(shù),刪除所述每一新圖集的摘要圖中邊聚類系數(shù)ECe<q的邊并更新;
步驟S35、將所述更新后的每一新圖集的摘要圖分別與對應(yīng)的新圖集的邊進(jìn)行一一對比,刪除每一新圖集中不存在于其相對應(yīng)的摘要圖中的邊并更新;
步驟S36、重復(fù)步驟S32至步驟S35,直到所述更新后的每一新圖集的摘要圖中的邊不在發(fā)生變化為止,得到摘要圖集;
第四步、查找稠密子圖,并確定頻繁稠密點(diǎn)集:
步驟S41、在所述得到的摘要圖集中,根據(jù)所述更新后的初始圖集對應(yīng)的摘要圖,查找與所述更新后的初始圖集對應(yīng)的摘要圖中邊集相一致的稠密子圖,并根據(jù)所述查找到的稠密子圖,確定頻繁稠密點(diǎn)集,且進(jìn)一步將所述確定的頻繁稠密點(diǎn)集進(jìn)行歸并后,作為共表達(dá)的基因團(tuán)輸出。
2.如權(quán)利要求1所述的預(yù)測方法,其特征在于,所述用戶自定義參數(shù)f取值范圍為[4,10];參數(shù)p取值范圍為[0.1,0.2];參數(shù)q取值為0.334。