P1、SESN1、SLC5A3、SMAD4 和TLE4。
[0021 ]還特別優(yōu)選一種方法,其中 所述PI3K細胞信號傳導途徑的靶基因組還包括選自以下的至少一種靶基因:ATG14、 BIRC5、IGFBP1、KLF2、KLF4、MY0D1、PDK4、RAG1、RAG2、SESN1、SIRT1、STK11 和TXNIP。
[0022] 如果所述靶基因組還包括選自前述段落中指定的組群的至少一種靶基因和選自 前述段落之前段落中指定的組群的至少一種靶基因兩者,上述關(guān)于兩個組群提到的靶基因 IGFBP1和SESN1可以僅包含于所述組群之一中。
[0023]待根據(jù)本發(fā)明使用的樣品可以是,例如,從癌癥病灶、或從懷疑為癌癥的病灶、或 從轉(zhuǎn)移性腫瘤、或從存在被癌細胞污染的體液的體腔(例如,胸腔或腹腔或膀胱腔)、或從含 有癌細胞的其它體液等等、優(yōu)選經(jīng)由活檢程序或其它樣品提取程序獲得的樣品。提取樣品 的細胞還可以是來自血液系統(tǒng)惡性腫瘤(諸如白血病或淋巴瘤)的腫瘤細胞。在一些情況 下,細胞樣品還可以是循環(huán)腫瘤細胞,即已進入血流且可以使用合適的分離技術(shù)(例如血漿 分離置換法或常規(guī)靜脈采血)提取的腫瘤細胞。除了血液,提取樣品的體液可以是尿、胃腸 內(nèi)容物或滲出物。如本文所使用,術(shù)語"提取樣品"還涵蓋這樣的情況,其中主體的組織和/ 或細胞和/或體液已取自主體并且例如已經(jīng)置于顯微鏡載片上,并且其中為了執(zhí)行請求保 護的方法,例如借助于激光捕獲顯微切割(LCM)或通過從載玻片上刮取目的細胞或通過熒 光活化的細胞分選技術(shù)來提取該樣品的一部分。
[0024] 根據(jù)另一個公開的方面,裝置包含經(jīng)配置以執(zhí)行根據(jù)如本文所述的本發(fā)明的方法 的數(shù)字處理器。
[0025] 根據(jù)另一個公開的方面,非臨時性存儲介質(zhì)存儲可由數(shù)字處理設(shè)備執(zhí)行以執(zhí)行根 據(jù)如本文所述的本發(fā)明的方法的指令。所述非臨時性存儲介質(zhì)可以是計算機可讀取的存儲 介質(zhì),諸如硬盤驅(qū)動器或其它磁性存儲介質(zhì)、光盤或其它光存儲介質(zhì)、隨機存取存儲器 (RAM)、只讀存儲器(ROM)、閃速存儲器、或其它電子存儲介質(zhì)、網(wǎng)絡(luò)服務(wù)器等等。數(shù)字處理設(shè) 備可以是手提式設(shè)備(例如,個人數(shù)據(jù)助手或智能電話)、筆記本計算機、臺式計算機、平板 計算機或設(shè)備、遙控網(wǎng)絡(luò)服務(wù)器等等。
[0026] 根據(jù)另一個公開的方面,計算機程序包含用于引起數(shù)字處理設(shè)備執(zhí)行根據(jù)如本文 所述的本發(fā)明的方法的程序代碼裝置。數(shù)字處理設(shè)備可以是手提式設(shè)備(例如,個人數(shù)據(jù)助 手或智能電話)、筆記本計算機、臺式計算機、平板計算機或設(shè)備、遙控網(wǎng)絡(luò)服務(wù)器等等。
[0027] 如本文所述的本發(fā)明還可以例如有利地與以下關(guān)聯(lián)使用: 基于醫(yī)學主體的組織和/或細胞和/或體液中的PI3K細胞信號傳導途徑的推斷活性診 斷; 基于醫(yī)學主體的組織和/或細胞和/或體液中的PI3K細胞信號傳導途徑的推斷活性預(yù) 后; 基于醫(yī)學主體的組織和/或細胞和/或體液中的PI3K細胞信號傳導途徑的推斷活性的 藥物處方; -基于醫(yī)學主體的組織和/或細胞和/或體液中的PI3K細胞信號傳導途徑的推斷活性 預(yù)測藥效; 基于醫(yī)學主體的組織和/或細胞和/或體液中的PI3K細胞信號傳導途徑的推斷活性預(yù) 測副作用; 藥效的監(jiān)測; 藥物開發(fā); 測定開發(fā); 途徑研究; 癌分期; 基于醫(yī)學主體的組織和/或細胞和/或體液中的PI3K細胞信號傳導途徑的推斷活性在 臨床試驗中登記醫(yī)學主體; 待進行的后續(xù)測試的選擇;和 伴隨診斷測試的選擇。
[0028]在閱讀和理解所附的附圖、以下描述和具體在閱讀本文以下提供的更詳盡的實施 例之后,進一步的優(yōu)點對于本領(lǐng)域技術(shù)人員而言將是顯而易見的。
[0029 ]應(yīng)當理解,權(quán)利要求1的方法、權(quán)利要求13的裝置、權(quán)利要求15的非臨時性存儲介 質(zhì)和權(quán)利要求15的計算機程序具有類似和/或相同的優(yōu)選實施方案,具體而言,如從屬權(quán)利 要求中所定義。
[0030] 應(yīng)當理解,本發(fā)明的優(yōu)選實施方案還可以是從屬權(quán)利要求或上述實施方案與相應(yīng) 的獨立權(quán)利要求的任何組合。
[0031] 本發(fā)明的這些和其它方面從下文描述的實施方案將是顯而易見的,且參考下文描 述的實施方案進行闡明。
[0032] 附圖簡述 圖1示意性和示例性顯示用于對PI3K細胞信號傳導途徑的轉(zhuǎn)錄程序建模的數(shù)學模型, 本文中,貝葉斯網(wǎng)絡(luò)模型。
[0033]圖2顯示基于(A.) PI3K細胞信號傳導途徑的靶基因的證據(jù)組織的列表(參見表 1)、(B.) PI3K細胞信號傳導途徑的靶基因的基于數(shù)據(jù)庫的列表(參見表2)和(C.) PI3K細 胞信號傳導途徑的靶基因的短列表(參見表3)的示例性貝葉斯網(wǎng)絡(luò)模型的訓練結(jié)果。
[0034]圖3顯示基于GSE17907的乳腺(癌癥)樣品的PI3K細胞信號傳導途徑的靶基因的短 列表(參見表3)的示例性貝葉斯網(wǎng)絡(luò)模型的測試結(jié)果。
[0035]圖4顯示基于作為GSE8671數(shù)據(jù)集公開的許多健康結(jié)腸樣品(第1組)和腺瘤性息肉 (第2組)的PI3K細胞信號傳導途徑的靶基因的短列表(參見表3)的示例性貝葉斯網(wǎng)絡(luò)模型 的測試結(jié)果。
[0036]圖5顯示基于GSE20916的結(jié)腸(癌癥)樣品的PI3K細胞信號傳導途徑的靶基因的短 列表(參見表3)的示例性貝葉斯網(wǎng)絡(luò)模型的測試結(jié)果。
[0037]圖6顯示基于GSE17951數(shù)據(jù)集中公開的前列腺(癌癥)細胞的PI3K細胞信號傳導途 徑的靶基因的短列表(參見表3)的示例性貝葉斯網(wǎng)絡(luò)模型的測試結(jié)果。
[0038] 圖7說明Kaplan-Meier圖中描述的ER+乳腺癌患者(GSE6532 & GSE9195)的預(yù)后。 [0039]圖8顯示基于PI3K細胞信號傳導途徑的靶基因的短列表(參見表3)的示例性線性 模型的訓練結(jié)果。
[0040]圖9顯示基于GSE17907的乳腺(癌癥)樣品的PI3K細胞信號傳導途徑的靶基因的短 列表(參見表3)的示例性線性模型的測試結(jié)果。
[0041 ]圖10顯示基于GSE17951的前列腺(癌癥)樣品的PI3K細胞信號傳導途徑的靶基因 的短列表(參見表3)的示例性線性模型的測試結(jié)果。
[0042]實施方案的詳述 以下實施例僅僅說明具體優(yōu)選的方法和與其相關(guān)的所選方面。其中提供的教導可用于 構(gòu)建幾種測試和/或試劑盒,例如用于檢測、預(yù)測和/或診斷一種或多種細胞信號傳導途徑 的異常活性。此外,使用如本文所述的方法之后,可以有利地指導藥物處方,可以進行藥物 預(yù)測和藥效(和/或副作用)的監(jiān)測,可以預(yù)測和監(jiān)測藥物抗性,例如選擇后續(xù)待進行的測試 (如伴隨診斷測試)。以下實施例不應(yīng)解釋為限制本發(fā)明的范圍。
[0043]實施例1:數(shù)學模型構(gòu)建 如公開的國際專利申請W0 2013/011479 A2 ("Assessment of cellular signaling pathway activity using probabilistic modeling of target gene expression")中所 詳述,通過構(gòu)建概率模型,例如,貝葉斯網(wǎng)絡(luò)模型,且引入細胞信號傳導途徑(本文中,PI3K 細胞信號傳導途徑)的一種或多種靶基因的表達水平和轉(zhuǎn)錄因子(TF)元件(本文中,F(xiàn)0X0 TF元件,控制細胞信號傳導途徑的一種或多種靶基因的轉(zhuǎn)錄的TF元件)的水平之間的條件 概率關(guān)系,此模型可以用于以高精確度測定細胞信號傳導途徑的活性。此外,通過調(diào)節(jié)條件 概率和/或向模型中添加新的節(jié)點來代表額外的信息源,可以容易地升級概率模型來并入 通過后期臨床研究獲得的額外知識。以這種方式,可以適當?shù)厣壐怕誓P蛠戆ㄗ罱?醫(yī)學知識。
[0044]在公開的國際專利申請W0 2014/102668 A2 ( "Assessment of ce 1 lular signaling pathway activity using linear combination(s) of target gene expressions")中所詳述的另一個容易理解和解釋的方法中,細胞信號傳導途徑(本文中, PI3K細胞信號傳導途徑)的活性可以通過構(gòu)建和評估線性或(假-)線性模型來測定,所述模 型引入細胞信號傳導途徑的一種或多種靶基因的表達水平和轉(zhuǎn)錄因子(TF)元件(本文中, F0X0 TF元件,控制細胞信號傳導途徑的一種或多種靶基因的轉(zhuǎn)錄的TF元件)的水平之間的 關(guān)系,所述模型至少部分基于一種或多種靶基因的表達水平的一種或多種線性組合。
[0045]在兩種方法中,一種或多種靶基因的表達水平可以優(yōu)選是mRNA水平的測量,其可 以是例如使用與靶基因的mRNA序列相關(guān)的探針的(RT)-PCR和微陣列技術(shù)以及RNA測序的結(jié) 果。在另一個實施方案中,一種或多種靶基因的表達水平可以通過蛋白水平,例如由靶基因 編碼的蛋白的濃度進行測量。
[0046]上述表達水平可以任選以可能適合或不適合更好應(yīng)用的許多方式進行轉(zhuǎn)換。例 如,表達水平的四種不同轉(zhuǎn)化,例如,基于微陣列的mRNA水平,可以是: -"連續(xù)數(shù)據(jù)",即如使用眾所周知的算法諸如MAS5.0和fRMA在微陣列預(yù)處理之后獲得 的表達水平, -"z得分",即連續(xù)表達水平這樣換算,使得跨越所有樣品的平均值為〇并且標準偏差 為1, -"離散的",即高于特定閾值的每一個表達設(shè)為1,并且低于特定閾值的每一個表達設(shè) 為〇(例如探針組的閾值可以選擇為在許多陽性臨床樣品和相同數(shù)目的陰性臨床樣品的組 中的其值的中值), -"模糊的",即使用下述形式的S型函數(shù),將連續(xù)表達水平轉(zhuǎn)換為0和1之間的值:1/(1+ exp( (thr-expr)/se)),其中expr是連續(xù)表達水平,thr是如先前提及的閾值,并且se是影響 〇和1之間的差異的軟化參數(shù)。
[0047] 可以構(gòu)建的最簡單的線性模型之一是在第一層中具有代表轉(zhuǎn)錄因子(TF)元件(本 文中,F(xiàn)0X0 TF元件)的節(jié)點和在第二層中具有代表靶基因表達強度水平的直接測量(例如, 通過例如在微陣列或(q)PCR實驗中,與特定靶基因特別高度關(guān)聯(lián)的一個探針組)的加權(quán)節(jié) 點的模型。權(quán)重可以基于來自訓練數(shù)據(jù)集的計算或基于專業(yè)知識。在其中每種靶基因可能 測量多重表達水平的情況下(例如在微陣列實驗的情況下,其中一種靶基因可以用多重探 針組進行測量),使用僅一種表達水平/靶基因的該方法是特別簡單的。選擇用于特定靶基 因的一種表達水平的一種特定方法是使用來自探針組的表達水平,所述探針組能夠最佳分 開訓練數(shù)據(jù)集的活性和消極樣品。測定該探針組的一種方法是執(zhí)行統(tǒng)計檢驗,例如t檢驗, 并且選擇具有最低P值的探針組。具有最低P值的探針的訓練數(shù)據(jù)集的表達水平通過限定具 有(已知)活性和消極樣品的表達水平重疊的可能性最小概率的探針。另一種選擇方法是基 于優(yōu)勢比(odds-ratios)。在此類模型中,對于一種或多種革E1基因各自提供一種或多種表達 水平,并且一種或多種線性組合包含對于一種或多種靶基因各自包括加權(quán)項的線性組合, 每個加權(quán)項基于對于相應(yīng)的靶基因提供的一種或多種表達水平的僅一種表達水平。如果如 上所述每種靶基因選擇僅一種表達水平,則該模型可以被稱為"最具判別性的探針組"模 型。
[0048] 作為"最具判別性的探針組"模型的替代物,在其中每種靶基因可能測量多重表達 水平的情況下,能夠利用每種靶基因提供的所有表達水平。在此類模型中,對于一種或多種 靶基因各自提供一種或多種表達水平,并且其中一種或多種線性組合包含對于一種或多種 靶基因提供的一種或多種表達水平的所有表達水平的線性組合。換言之,對于一種或多種 靶基因各自,對于相應(yīng)的靶基因提供的一種或多種表達水平各自可以在線性組合中通過其 自身(個別)權(quán)重進行加權(quán)。該變體可以被稱為"所有探針組"模型。它具有相對簡單同時利 用所有提供的表達水平的優(yōu)點。
[0049]如上所述的兩個模型的共同之處在于它們可以視為"單層"模型,其中TF元件的水 平基于表達水平的線