一種前列腺腫瘤的類型預(yù)測方法和系統(tǒng)的制作方法
【技術(shù)領(lǐng)域】
[0001] 本申請涉及基因技術(shù)領(lǐng)域,更具體地說,涉及一種前列腺腫瘤的類型預(yù)測方法和 系統(tǒng)。
【背景技術(shù)】
[0002] 前列腺腫瘤包括前列腺上皮來源或間葉來源的腫瘤,大部分為惡性腫瘤,包括前 列腺腫瘤、前列腺肉瘤等。前列腺腫瘤患者主要是老年男性。但隨著20世紀90年代中期 大量開展血清前列腺特異抗原(PSA)的檢測以來,越來越早的前列腺腫瘤被發(fā)現(xiàn),此時往 往不伴有任何癥狀。前列腺肉瘤好發(fā)于年輕人,發(fā)病率不高,以排尿困難為首發(fā)癥狀,此病 惡性程度極高,疾病發(fā)展極快,預(yù)后極差。
[0003] 隨著人工智能在醫(yī)院領(lǐng)域的應(yīng)用,越來越多的機器學(xué)習(xí)方法被用于進行智能診 斷。目前在對健康人群進行前列腺腫瘤篩選時,一般采用DNA微陣列技術(shù)來獲取基因表達 數(shù)據(jù),通過對基因表達數(shù)據(jù)的分析計算能夠得到作為對前列腺腫瘤進行類型預(yù)測的參考因 素,由于得到的基因表達數(shù)據(jù)的數(shù)據(jù)量非常龐大,因此如何從龐大的基因表達數(shù)據(jù)中得到 類型預(yù)測結(jié)果是較為困難的問題。當然,一般的醫(yī)務(wù)人員根據(jù)該類型預(yù)測結(jié)果還是無法最 終確定受檢者是否罹患腫瘤,但是通過該結(jié)果的傾向性指導(dǎo)可以促使醫(yī)務(wù)人員通過病理診 斷方法對受檢者做進一步診斷,以確定是否患有前列腺腫瘤。
【發(fā)明內(nèi)容】
[0004] 有鑒于此,本申請?zhí)峁┮环N前列腺腫瘤的類型預(yù)測方法和系統(tǒng),用于對受檢者的 基因標定數(shù)據(jù)進行處理,并得到類型預(yù)測結(jié)果。
[0005] 為了實現(xiàn)上述目的,現(xiàn)提出的方案如下:
[0006] -種前列腺腫瘤的類型預(yù)測方法,包括步驟:
[0007] 獲取包含受檢者的基因表達數(shù)據(jù)的待測樣本;
[0008] 對所述待測樣本進行歸一化,構(gòu)造歸一化后的新待測樣本;
[0009] 利用預(yù)設(shè)的投影變換矩陣將所述新待測樣本映射到低維特征空間中,得到映射后 的投影測試樣本;
[0010] 從所述投影變換矩陣的訓(xùn)練樣本集中找到與所述投影測試樣本距離最近的樣 本;
[0011] 將所述樣本的類型賦予所述投影測試樣本,完成類型預(yù)測。
[0012] 可選的,所述投影變換矩陣通過下面步驟獲取:
[0013] 獲取基因表達訓(xùn)練數(shù)據(jù);
[0014] 從所述基因表達訓(xùn)練數(shù)據(jù)中隨機抽取部分特征數(shù)據(jù),得到訓(xùn)練數(shù)據(jù)集;
[0015] 將所述訓(xùn)練數(shù)據(jù)集映射到相對低維的低維特征空間;
[0016] 將所述低維度特征空間中的訓(xùn)練數(shù)據(jù)集構(gòu)建為類內(nèi)相似矩陣和類間相似矩陣;
[0017] 對與所述類內(nèi)相似矩陣的關(guān)聯(lián)的類內(nèi)局部散度矩陣和與所述類間相似矩陣相關(guān) 聯(lián)的類間局部散度矩陣進行廣義特征分解,得到所述投影變換矩陣。
[0018] 可選的,所述得到訓(xùn)練數(shù)據(jù)集過程中需要對所述部分特征數(shù)據(jù)進行歸一化處理, 從而得到所述訓(xùn)練數(shù)據(jù)集。
[0019] 可選的,所述類內(nèi)相似矩陣和所述類間相似矩陣通過預(yù)先定義的余弦去中心相似 性函數(shù)獲得。
[0020] -種前列腺腫瘤的類型預(yù)測系統(tǒng),包括:
[0021] 待測樣本獲取模塊,用于獲取包含受檢者的基因表達數(shù)據(jù)的待測樣本;
[0022] 歸一化模塊,用于對所述待測樣本進行歸一化,構(gòu)造歸一化后的新待測樣本;
[0023] 學(xué)習(xí)模塊,用于利用預(yù)設(shè)的投影變換矩陣將所述新待測樣本映射到低維特征空間 中,得到映射后的投影測試樣本;
[0024] 查找模塊,用于從所述投影變換矩陣的訓(xùn)練樣本集中找到與所述投影測試樣本距 離最近的樣本;
[0025] 預(yù)測模塊,用于將所述樣本的類型賦予所述投影測試樣本,完成類型預(yù)測。
[0026] 可選的,所述待測樣本獲取模塊包括DNA微陣列芯片。
[0027] 可選的,所述學(xué)習(xí)模塊包括:
[0028] 訓(xùn)練數(shù)據(jù)獲取單元,用于獲取基因表達訓(xùn)練數(shù)據(jù);
[0029] 隨機抽取單元,用于從所述基因表達訓(xùn)練數(shù)據(jù)中隨機抽取部分特征數(shù)據(jù),得到訓(xùn) 練數(shù)據(jù)集;
[0030] 映射單元,用于將所述訓(xùn)練數(shù)據(jù)集映射到相對低維的低維特征空間;
[0031] 相似矩陣構(gòu)建單元,用于將所述低維度特征空間中的訓(xùn)練數(shù)據(jù)集構(gòu)建為類內(nèi)相似 矩陣和類間相似矩陣;
[0032] 投影變換矩陣構(gòu)建單元,用于對與所述類內(nèi)相似矩陣的關(guān)聯(lián)的類內(nèi)局部散度矩陣 和與所述類間相似矩陣相關(guān)聯(lián)的類間局部散度矩陣進行廣義特征分解,得到所述投影變換 矩陣。
[0033] 可選的,所述隨機抽取單元包括:
[0034] 歸一化子單元,用于通過對所述部分特征數(shù)據(jù)進行歸一化處理得到所述訓(xùn)練數(shù)據(jù) 集。
[0035] 可選的,所述相似矩陣構(gòu)建單元還包括:
[0036] 函數(shù)構(gòu)建子單元,用于通過構(gòu)建所述余弦去中心相似性函數(shù)獲得所述類內(nèi)相似矩 陣和所述類間相似矩陣。
[0037] 從上述的技術(shù)方案可以看出,本申請公開了一種前列腺腫瘤的類型預(yù)測方法和系 統(tǒng),該方法和系統(tǒng)首先獲取包含受檢者的基因表達數(shù)據(jù)的待測樣本;對待測樣本進行歸一 化,構(gòu)造歸一化后的新待測樣本;利用預(yù)設(shè)的投影變換矩陣將新待測樣本映射到低維特征 空間中,得到映射后的投影測試樣本;從投影變換矩陣的訓(xùn)練樣本集中找到與投影測試樣 本距離最近的樣本;將樣本的類型賦予投影測試樣本,從而完成對前列腺腫瘤的類型預(yù)測 并得到類型預(yù)測結(jié)果。
【附圖說明】
[0038] 為了更清楚地說明本申請實施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對實施例或現(xiàn) 有技術(shù)描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本 申請的一些實施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以 根據(jù)這些附圖獲得其他的附圖。
[0039] 圖1為本申請實施例提供的一種前列腺腫瘤的類型預(yù)測方法的流程圖;
[0040] 圖2為本申請?zhí)峁┑念A(yù)測率隨維數(shù)的變化曲線圖;
[0041] 圖3為本申請?zhí)峁┑牧硪活A(yù)測率隨維數(shù)的變化曲線圖;
[0042] 圖4為本申請?zhí)峁┑耐队白儞Q矩陣的獲取步驟的流程圖;
[0043] 圖5為本申請另一實施例提供的一種前列腺腫瘤的類型預(yù)測系統(tǒng)的結(jié)構(gòu)圖。
【具體實施方式】
[0044] 下面將結(jié)合本申請實施例中的附圖,對本申請實施例中的技術(shù)方案進行清楚、完 整地描述,顯然,所描述的實施例僅僅是本申請一部分實施例,而不是全部的實施例?;?本申請中的實施例,本領(lǐng)域普通技術(shù)人員在沒有作出創(chuàng)造性勞動前提下所獲得的所有其他 實施例,都屬于本申請保護的范圍。
[0045] 實施例一
[0046] 圖1為本申請實施例提供的一種前列腺腫瘤的類型預(yù)測方法的流程圖。
[0047] 如圖1所示,本實施例提供的前列腺腫瘤的類型預(yù)測方法包括如下步驟:
[0048] SlOl :獲取包含受檢者的基因表達數(shù)據(jù)的待測樣本。
[0049] 將該待測樣本記錄為X e Rd。
[0050] S102 :根據(jù)待測樣本得到新待測樣本。
[0051] 根據(jù)保留的特征位置集I和訓(xùn)練樣本集的歸一化方式,利用待測樣本X e妒構(gòu)造 一個新待測樣本X' eRd。
[0052] S103 :利用投影變換矩陣得到投影測試樣本。
[0053] 利用預(yù)設(shè)的投影變換矩陣P把新待測樣本映射到低維特征空間中,得到投影后的 測試樣本z = PTX' e R%為記錄方便,將其記為投影測試樣本。
[0054]