過程,諸如細(xì)胞凋亡、細(xì)胞周期、抑制腫瘤/進(jìn) 展、DNA修復(fù)、分化。最后,選擇被發(fā)現(xiàn)在細(xì)胞系實(shí)驗(yàn)中具有高差異表達(dá)的靶基因,其與已知 的低PI 3K/高FOXO活性相比具有已知的高P13K/低FOXO活性。本文中,第三個列表中包括在 經(jīng)多個樣品平均的FOXO轉(zhuǎn)錄的"開"和"關(guān)"狀態(tài)之間具有2^ 5的最小表達(dá)差異(本文中:關(guān)于 探針組水平)的靶基因。第三個標(biāo)準(zhǔn)專門目的在于選擇最具判別性的靶基因?;谟镁哂幸?知高PI3K/低FOXO活性的多個樣品和具有已知低PI3K/高FOXO活性的多個樣品的細(xì)胞系實(shí) 驗(yàn)中的表達(dá)水平,計(jì)算優(yōu)勢比(odds ratio,OR)。本文中,在測量中使用中值作為截止值和 代表不確定性的軟邊界計(jì)算每種探針的優(yōu)勢比。根據(jù)"軟"優(yōu)勢比將來自證據(jù)組織的列表和 基于數(shù)據(jù)庫的列表的靶基因進(jìn)行排序,且對于靶基因的第三個列表選擇排序最高(OR > 2) 和排序最低(OR〈 1/2, 即,陰性調(diào)節(jié)的靶基因)。
[0082]考慮基因的功能、"開(on)"相比于"關(guān)(off)"信號傳導(dǎo)的差異表達(dá)和更高的優(yōu)勢 比,發(fā)現(xiàn)靶基因組(表3中顯示),所述靶基因組被認(rèn)為在測定PI3K信號傳導(dǎo)途徑的活性中更 有證明性。靶基因的此類列表也可以被稱為"祀基因的短列表"。因此,根據(jù)本發(fā)明特別優(yōu)選 表3中報(bào)道的靶基因。盡管如此,鑒于用獲取技術(shù)諸如微陣列可以獲得大量組基因的表達(dá)水 平的相對容易,考慮利用表3的靶基因的一些或全部,并且任選額外使用表1和表2的剩余靶 基因的一個、兩個、一些或全部。
[0083] 表3:基于靶基因的證據(jù)組織的列表和靶基因的基于數(shù)據(jù)庫的列表的PI3K細(xì)胞信 號傳導(dǎo)途徑的靶基因的短列表。
[0084]實(shí)施例3:訓(xùn)練和使用數(shù)學(xué)模型
數(shù)學(xué)模型可用于推斷細(xì)胞信號傳導(dǎo)途徑(本文中,醫(yī)學(xué)主體的組織和/或細(xì)胞和/或體 液中的PI3K細(xì)胞信號傳導(dǎo)途徑)的活性之前,必須適當(dāng)訓(xùn)練該模型。
[0085]如果所述數(shù)學(xué)模型是概率模型,例如,貝葉斯網(wǎng)絡(luò)模型,其至少部分基于將F0X0 TF元件和醫(yī)學(xué)主體的組織和/或細(xì)胞和/或體液的提取樣品中測量的PI3K細(xì)胞信號傳導(dǎo)途 徑的一種或多種靶基因的表達(dá)水平關(guān)聯(lián)的條件概率,所述訓(xùn)練可優(yōu)選如公開的國際專利申 請W0 2013/011479 A2 ("Assessment of cellular signaling pathway activity using probabilistic modeling of target gene expression")中詳細(xì)描述進(jìn)行。
[0086] 如果所述數(shù)學(xué)模型至少部分基于醫(yī)學(xué)主體的組織和/或細(xì)胞和/或體液的提取樣 品中測量的PI3K細(xì)胞信號傳導(dǎo)途徑的一種或多種靶基因的表達(dá)水平的一種或多種線性組 合,所述訓(xùn)練可優(yōu)選如公開的國際專利申請W0 2014/102668 A2 ("Assessment of cellular signaling pathway activity using linear combination(s) of target gene expressions")中詳細(xì)描述進(jìn)行。
[0087] a)示例性貝葉斯網(wǎng)絡(luò)模型 本文中,如圖1中所示的示例性貝葉斯網(wǎng)絡(luò)模型首先用于以簡單的方式對PI3K細(xì)胞信 號傳導(dǎo)途徑的轉(zhuǎn)錄程序建模。所述模型由三種類型的節(jié)點(diǎn)組成:(a)第一層1中的轉(zhuǎn)錄因子 (丁卩)元件;(13)第二層2和第三層3中的靶基因了61、了62、了611;((3)與靶基因的表達(dá)水平連接 的測量節(jié)點(diǎn)。這些可以是微陣列探針組?31&、?5113、?31^32 &、?311&、?31113,如本文優(yōu)選使 用,但也可以是其它基因表達(dá)測量,諸如RNAseq或RT-qPCR。
[0088] 數(shù)學(xué)模型(本文中,示例性貝葉斯網(wǎng)絡(luò)模型)的合適實(shí)施基于微陣列數(shù)據(jù)。該模型 描述(i)靶基因的表達(dá)水平如何取決于TF元件的活化,和(ii)探針組強(qiáng)度進(jìn)而如何取決于 相應(yīng)靶基因的表達(dá)水平。對于后者,探針組強(qiáng)度可以取自fRMA加工前的Affymetrix HG-U133Plus2.0 微陣列,這廣泛可得自 Gene Expression Omnibus (GEO, www.ncbi.nlm.nih.gov/geo)和ArrayExpress (www. ebi.ac.uk/arrayexpress)。
[0089] 由于示例性貝葉斯網(wǎng)絡(luò)模型是細(xì)胞信號傳導(dǎo)途徑(本文中,PI3K細(xì)胞信號傳導(dǎo)途 徑)的生物學(xué)的簡化,且由于生物學(xué)測量通常有噪音,選擇概率方法,即,以概率術(shù)語描述 (i)TF元件和靶基因和(ii)靶基因和它們各自的探針組之間的關(guān)系。此外,假設(shè)驅(qū)動腫瘤生 長的致癌細(xì)胞信號傳導(dǎo)途徑的活性沒有瞬時和動態(tài)改變,但長期或甚至不可逆改變。因此, 開發(fā)示例性貝葉斯網(wǎng)絡(luò)模型用于解釋靜態(tài)細(xì)胞狀態(tài)。由于該原因,沒有將復(fù)雜動態(tài)細(xì)胞信 號傳導(dǎo)途徑特征并入模型。
[0090] 一旦建立和校準(zhǔn)示例性貝葉斯網(wǎng)絡(luò)模型(參見下文),該模型可以通過輸入探針組 測量值作為第三層3中的觀察值且在模型中回推對于TF元件必須"存在"何種概率而用于新 樣品的微陣列數(shù)據(jù)上。此處,"存在"被認(rèn)為是TF元件結(jié)合至DNA且控制細(xì)胞信號傳導(dǎo)途徑的 靶基因的轉(zhuǎn)錄的現(xiàn)象,且"不存在"被認(rèn)為是TF元件不控制轉(zhuǎn)錄的情況。該后者可能性因此 是可用于指示細(xì)胞信號傳導(dǎo)途徑(本文中,PI3K細(xì)胞信號傳導(dǎo)途徑)的活性的初始讀出值, 其接下來可以通過取有活性相比于無活性的概率的比率而轉(zhuǎn)化為細(xì)胞信號傳導(dǎo)途徑有活 性的幾率(即,如果p是細(xì)胞信號傳導(dǎo)途徑有活性的預(yù)測概率,幾率以p/(l-p)給出)。
[0091] 在示例性貝葉斯網(wǎng)絡(luò)模型中,已經(jīng)使概率關(guān)系為定量的,以允許定量概率推理。為 了改善組織類型間的概況行為,已經(jīng)小心精選描述(i)TF元件和靶基因之間的概率關(guān)系的 參數(shù)。如果TF元件為"不存在",最可能靶基因是"下",因此對此選擇0.95的概率,并且對為 "上"的靶基因選擇0.05的概率。后者(非零)概率解釋靶基因受其它因子調(diào)節(jié)或意外地觀察 為"上"(例如由于測量噪音)的(罕見)概率。如果TF元件"存在",則靶基因以0.70的概率被 認(rèn)為"上",并且靶基因以〇. 30的概率被認(rèn)為"下"。以這種方式選擇后者值,因?yàn)榭梢源嬖诩?使TF元件存在靶基因也并未高度表達(dá)(例如因?yàn)榛騿幼訁^(qū)被甲基化)的幾種原因。在靶 基因并未由TF元件上調(diào)但卻下調(diào)的情況下,以相似的方式選擇概率,但反映存在TF元件的 情況下的下調(diào)。已經(jīng)對實(shí)驗(yàn)數(shù)據(jù)校準(zhǔn)描述(ii)靶基因和它們各自的探針組之間的關(guān)系的參 數(shù)。對于后者,在本實(shí)施例中,使用來自具有定義的活性和無活性的途徑設(shè)置的細(xì)胞系實(shí)驗(yàn) 的微陣列數(shù)據(jù),但這也可以使用已知的細(xì)胞信號傳導(dǎo)途徑活性狀態(tài)的患者樣品來進(jìn)行。 [0092]本文中,關(guān)于具有F0X0構(gòu)建體的穩(wěn)定轉(zhuǎn)染的HUVEC細(xì)胞系的表達(dá)的公開可得的數(shù) 據(jù)用作實(shí)例,所述F0X0構(gòu)建體在用40HT (得自Gene Expression Omnibus的GSE16573)刺激 之后可誘導(dǎo)。用40HT刺激12小時的具有可誘導(dǎo)的F0X0構(gòu)建體的細(xì)胞系被認(rèn)為是F0X0活性樣 品(η = 3),而消極F0X0樣品是具有所述構(gòu)建體且無40HT刺激的細(xì)胞系(η = 3)。
[0093]圖2顯示基于(A.) ΡΙ3Κ細(xì)胞信號傳導(dǎo)途徑的靶基因的證據(jù)組織的列表(參見表 1)、(B.) PI3K細(xì)胞信號傳導(dǎo)途徑的靶基因的基于數(shù)據(jù)庫的列表(參見表2)和(C.) PI3K細(xì) 胞信號傳導(dǎo)途徑的靶基因的短列表(參見表3)的示例性貝葉斯網(wǎng)絡(luò)模型的訓(xùn)練結(jié)果。在該 圖中,縱軸表明FOXO TF元件是"存在"或"不存在"的可能性,其對應(yīng)于PI3K細(xì)胞信號傳導(dǎo)途 徑為無活性或有活性,其中橫軸以上的值對應(yīng)于FOXO TF元件更可能"存在" /有活性,且橫 軸以下的值表明FOXO TF元件"不存在"/無活性的可能性大于其"存在"/有活性的可能性。 [0094]涵蓋沒有用他莫昔芬刺激且因此F0X0無活性的細(xì)胞系的三個樣品的第三組3被指 定為消極F0X0標(biāo)記,而涵蓋用40HT刺激、因此F0X0無活性的樣品的第四組4被指定為活性標(biāo) 記。在相同數(shù)據(jù)集中,第一、第二和第五組1、2、5被正確地預(yù)測具有消極PI3K細(xì)胞信號傳導(dǎo) 途徑。最后一組6由用預(yù)期針對40HT刺激不敏感的F0X0的突變變體轉(zhuǎn)染的細(xì)胞系組成。然 而,在第二模型(B.)和第三模型(C.)中發(fā)現(xiàn)一些活性?;赑I3K細(xì)胞信號傳導(dǎo)途徑的靶基 因的證據(jù)組織的列表的模型正確地預(yù)測PI3K細(xì)胞信號傳導(dǎo)途徑在最后一組6中是消極的, 而其它兩個列表以相對低的概率預(yù)測其有活性。(圖注:1 -用空載體感染的原代HUVEC;2 -用空載體+用〇冊刺激1211的原代!11^^(:;3-用?(^0^3上1?載體感染的原代!11^^(:;4-用 ?0父0.43上1?載體+用0!11'刺激1211的原代!1爪^(: ;5-用?(《0.43上1?.!12121?載體感染的原代 !1爪^(:,6-用?(^0.43上1?.!12121?載體+用0!11'刺激1211的原代!1爪^〇。
[0095]在下文中,圖3至6中顯示示例性貝葉斯網(wǎng)絡(luò)模型的測試結(jié)果。
[0096]圖3顯示基于GSE17907的乳腺(癌癥)樣品的PI3K細(xì)胞信號傳導(dǎo)途徑的靶基因的短 列表(參見表3)的示例性貝葉斯網(wǎng)絡(luò)模型的測試結(jié)果。在該圖中,縱軸表明F0X0 TF元件是 "存在"或"不存在"的可能性,其對應(yīng)于PI3K細(xì)胞信號傳導(dǎo)途徑為無活性或有活性,其中橫 軸以上的值對應(yīng)于F0X0 TF元件更可能"存在"/有活性,且橫軸以下的值表明F0X0 TF元件 "不存在"/無活性的可能性大于其"存在"/有活性的可能性。該模型正確地預(yù)測正常乳腺樣 品(第5組)中的活性F0X0 TF元件,如從文獻(xiàn)已知。預(yù)測具有消極F0X0 TF元件的大多數(shù)樣品 發(fā)現(xiàn)于ERBB2/HER2亞組(第3組),這不是出乎意料的,因?yàn)榫幋aHER2的ERBB2基因的過度擴(kuò) 增與PI3K細(xì)胞信號傳導(dǎo)途徑的活性在科學(xué)上關(guān)聯(lián),因此,F(xiàn)0X0易位出核,導(dǎo)致F0X0-調(diào)節(jié)的 轉(zhuǎn)錄的抑制。具有分子亞型基礎(chǔ)的乳腺癌樣品(第2組),如預(yù)期,預(yù)測具有無活性的F0X0 TF 元件,因?yàn)橐阎兹橄侔┩ǔH狈ER2表達(dá),因此不可能具有活性的PI3K細(xì)胞信號傳導(dǎo) 途徑。(圖注:1 -未知的,2 -基底,3 - ERBB2/HER2,4 -管腔A,5 -正常乳腺,6 -正常類似 物)。
[0097]圖4顯示基于作為GSE8671數(shù)據(jù)集公開的許多健康結(jié)腸樣品(第1組)和腺瘤性息肉 (第2組)的PI3K細(xì)胞信號傳導(dǎo)途徑的靶基因的短列表(參見表3)的示例性貝葉斯網(wǎng)絡(luò)模型 的測試結(jié)果。在該圖中,縱軸表明F0X0 TF元件是"存在"或"不存在"的可能性,其對應(yīng)于 PI3K細(xì)胞信號傳導(dǎo)途徑為無活性或有活性,其中橫軸以上的值對應(yīng)于F0X0 TF元件更可能 "存在"/有活性,且橫軸以下的值表明F0X0 TF元件"不存在"/無活性的可能性大于其"存 在"/有活性的可能性。該模型正確地預(yù)測正常樣品(第1組沖的活性PI3K細(xì)胞信號傳導(dǎo)途 徑,其中預(yù)期所述PI3K細(xì)胞信號傳導(dǎo)途徑正常工作。關(guān)于腺瘤性息肉(第2組),從文獻(xiàn)已知 它們由于其中的突變而表達(dá)PI3K細(xì)胞信號傳導(dǎo)途徑的增加活性。Philips和同事已經(jīng)顯示, 在他們的研究中,多達(dá)86%的結(jié)腸直腸腫瘤具有PI3K細(xì)胞信號傳導(dǎo)途徑的增加活性(Wayne A. Philips,等人,"Increased levels of phosphatidylinositol 3-kinase activity in colorectal tumors",Cancer, Vol. 83,No. 1,July 1998,第41 至47頁)。除了三 個以外的所有腺瘤樣品被該模型預(yù)測為是FOXO消極的,因此,是PI3K活性的,這很好地與文 獻(xiàn)中發(fā)現(xiàn)的數(shù)量相關(guān)。(圖注:1 -正常,2 -腺瘤)。
當(dāng)前第4頁
1 
2 
3 
4 
5 
6