專利名稱::有關(guān)乳癌分類的材料和方法有關(guān)乳癌分類的材料和方法發(fā)明領(lǐng)域本發(fā)明涉及有關(guān)乳癌分類的材料和方法。具體而言,本發(fā)明涉及乳癌預(yù)后的確定。
背景技術(shù):
:人們對(duì)基因表達(dá)數(shù)據(jù)在生物學(xué)分類中的用途存在濃厚興趣,特別是腫瘤學(xué)和醫(yī)學(xué)領(lǐng)域。這種方法的一個(gè)令人興奮的方面是它確定癌的臨床相關(guān)亞型的能力,而這些亞型先前逃過了更傳統(tǒng)的光學(xué)顯微鏡術(shù)方法。盡管具有這種潛力,然而在基因表達(dá)數(shù)據(jù)用于臨床診斷成為現(xiàn)實(shí)之前,還必需解決許多問題。例如,需要提供這樣的算法,它既能進(jìn)行正確的分類,又能精確的確定預(yù)測(cè)的置信度。如果分類影響后續(xù)治療過程的話,那么這將是特別重要的---旦獲得了這些信息,主治醫(yī)師就能夠權(quán)衡預(yù)測(cè)的置信度與特定干預(yù)的潛在發(fā)病率,從而做出明智的臨床選擇。諾丁漢預(yù)后指數(shù)(NottinghamPrognosticIndex,NPI)是以腫瘤大小、組織學(xué)等級(jí)和淋巴結(jié)狀態(tài)為基礎(chǔ)的一種分類系統(tǒng),在歐洲和英國(guó)廣泛用于判定乳瘤的預(yù)后(1-5)。盡管具有這種效用,然而公認(rèn)常規(guī)組織病理學(xué)參數(shù)諸如腫瘤等級(jí)和細(xì)胞形態(tài)的使用還與某些限制有關(guān)。這些變量中的許多(例如等級(jí))受到觀察員間顯著變化性的影響,甚至在嘗試標(biāo)準(zhǔn)化之后(6)。NPI等級(jí)由2至8。當(dāng)在一段連續(xù)范圍的數(shù)值上給測(cè)量的參數(shù)評(píng)分時(shí)(7),諸如NPI,常常難以規(guī)定恰當(dāng)?shù)慕刂裹c(diǎn)(cut-offpoint)。因此,該指數(shù)依賴一系列主觀標(biāo)準(zhǔn),可能導(dǎo)致在判定預(yù)后時(shí)觀察員間的差異。NPI是一個(gè)數(shù)值范圍;具有比另一患者低的NPI值的患者通常具有比其它患者好的預(yù)后。預(yù)后通常使用諸如下面的因素來確定,即特定不必相同)。因此,一般而言,患者的前景隨NPI值的升高而降低。確定患者的預(yù)后是為患者決定治療的類型和程度時(shí)的一項(xiàng)重要因素。因?yàn)閷淼闹委煶绦蚩赡芘c預(yù)后有關(guān),所以判定預(yù)后的精確度至關(guān)重要。例如,van'tVeer等(10)鑒定了包含70種基因的預(yù)后表達(dá)特征(prognosisexpressionsignature,PES),用于預(yù)測(cè)乳瘤的無病存活(DiseaseFreeSurvival,DFS)狀態(tài)。發(fā)明概迷本發(fā)明人研究了一組乳瘤的表達(dá)數(shù)據(jù),但是最初未能鑒定出其表達(dá)與NPI相關(guān)的一組基因。發(fā)明人假設(shè)基因表達(dá)在各種亞型之間可能存在顯著差異("亞型間差異,,),從而可能掩蓋了更加微妙的亞型內(nèi)變異型式("亞型內(nèi)差異,,)。有人提出乳癌中顯著比例的內(nèi)在基因表達(dá)變異可能導(dǎo)致了屬于不同"分子亞型"的不同腫瘤,諸如ER+和ER-(其中ER指雌激素受體)(8-9,14)。使用無監(jiān)督聚類技術(shù)(unsupervisedclusteringtechniques)將數(shù)據(jù)集分成各個(gè)分子亞類(ER+、ER-、ERBB2+)。將每個(gè)分子亞型視為獨(dú)立的數(shù)據(jù)集。獨(dú)立分析每個(gè)亞型內(nèi)的腫瘤以鑒定其表達(dá)水平與NPI有關(guān)的一組基因。臨床醫(yī)師一般將NPI等級(jí)分成三類"好的"預(yù)后,"中等,,預(yù)后,和"差的,,預(yù)后。界定各個(gè)類型的數(shù)值隨臨床醫(yī)師而變化。典型的一套分界點(diǎn)是好的預(yù)后NPI〈3.4;中等預(yù)后3.化NPI《5.4;而差的預(yù)后NPI>5.4。本領(lǐng)域技術(shù)人員將認(rèn)識(shí)到這些分界點(diǎn)可以變化。本發(fā)明人鑒定出一組62種基因,它們?cè)诓煌A(yù)后的腫瘤中差異表達(dá),例如在高NPI(即差的預(yù)后)和低NPI(即好的預(yù)后)的腫瘤之間差異表達(dá)。盡管這組基因是在將樣品根據(jù)它們的NPI進(jìn)行分類后鑒定的,然而還發(fā)現(xiàn)根據(jù)這些基因的表達(dá)水平將腫瘤樣品分類與預(yù)后的其它度量(例如無病存活)有關(guān)。因此,這些基因在胂瘤樣品中的表達(dá)水平對(duì)于獲取該樣品的患者的預(yù)后和治療具有重要的醫(yī)學(xué)意義。具體而言,它們可用于將腫瘤樣品分類,作為患者預(yù)后的一項(xiàng)指標(biāo)。將NPI等級(jí)的數(shù)值范圍3.8-4.6用作"好的"和"差的,,預(yù)后之間的截止點(diǎn),并且使用每個(gè)截止值鑒定了同一組62種差異表達(dá)的基因。這指示,雖然NPI覆蓋連續(xù)的數(shù)值范圍2-8,但是這組62種基因的表達(dá)水平能夠?qū)⒛[瘤樣品歸入獨(dú)立的類別。由此,可以將根據(jù)組織病理學(xué)參數(shù)具有連續(xù)NPI值的樣品在分子水平分成獨(dú)立的類別。此外,使用(i)本發(fā)明的方法和(ii)臨床技術(shù)(通常是組織病理學(xué)技術(shù))判定的乳瘤患者預(yù)后的比較指示,根據(jù)患者的資料,諸如DFS和Kaplan-Meier存活曲線,本發(fā)明的方法可提供比組織病理學(xué)技術(shù)更加精確的預(yù)后。這62種基因示于表S6。下面的描述將使用術(shù)語"表達(dá)鐠",它指一組基因在樣品中的表達(dá)水平。除非另有要求,該組基因?qū)鞸6中所示的一些或所有62種基因。本文鑒定的62種基因與van'tVeer等(10)鑒定的基因只有一種基因重疊(DC13或Hs.6879)。PES是231種Rosetta基因(10)的擴(kuò)充基因組(geneset)中的前70種基因(在顯示不同無病存活率的組之間展示最顯著差異表達(dá)的基因)。表S6的62種基因和231種RosetU基因之間有8種基因是共有的,它們列于表S13。表S6中有兩種基因在低NPI腫瘤中高度表達(dá)("陰性基因"),而60種基因在高NPI腫瘤中高度表達(dá)("陽性基因")。因此,最一般的說,本發(fā)明提供了用于獲得一組差異表達(dá)基因的方法。本發(fā)明還提供了用于乳瘤樣品分類和/或判定預(yù)后的方法和測(cè)定法。本發(fā)明鑒定了一組基因并提供了這些基因中的一些或全部在乳瘤樣品中的表達(dá)水平用于對(duì)獲取該乳瘤的患者確定預(yù)后的用途。在笫一個(gè)方面,本發(fā)明提供了用于確定乳癌患者預(yù)后的方法,其包括根據(jù)一組基因(下文稱為"預(yù)后組")在患者乳瘤中的表達(dá)水平來確定所述惠者的預(yù)后,其中預(yù)后組包含表S6的多種基因。本發(fā)明還提供了預(yù)后組在確定乳癌患者預(yù)后中的用途。優(yōu)選的是,本發(fā)明提供了表達(dá)鐠在確定乳瘤患者預(yù)后中的用途,所述表達(dá)謙體現(xiàn)了預(yù)后組基因在肺瘤中的表達(dá)水平。"預(yù)后"意指其最一般的意義,而且可以是定量的或定性的。它可以概括的表述,諸如"好的"或"差的"預(yù)后,和/或表述為可能的臨床后果,諸如無病存活(DFS)的持續(xù)時(shí)間、在確定時(shí)間內(nèi)存活的可能性、和/或在確定時(shí)間內(nèi)遠(yuǎn)程轉(zhuǎn)移的概率。預(yù)后的定量度量通常是概率性的。另外/或者,尤其是在向醫(yī)學(xué)從業(yè)人員表述預(yù)后時(shí)或在醫(yī)學(xué)從業(yè)人員之間表述預(yù)后時(shí),預(yù)后可以表述成預(yù)后的另一項(xiàng)指標(biāo),諸如NPI等級(jí)。一般而言,具有"好的預(yù)后"腫瘤的患者很可能將用常規(guī)治療方法進(jìn)行治療。具有"差的預(yù)后"腫瘤的患者可能用另外的或更具攻擊性的方法進(jìn)行治療。"差的預(yù)后"患者通常不必等到常規(guī)治療方法失敗后再換成更具攻擊性的方法。另外,對(duì)疾病可能的臨床病程的了解容許患者為未來制定現(xiàn)實(shí)的計(jì)劃,這在癌癥治療中是一個(gè)重要的社會(huì)'l"生方面。為了避免疑惑,術(shù)語"確定"無需意味著絕對(duì)確定的預(yù)后。而是說,預(yù)后組在腫瘤中的表達(dá)水平通常指示患者可能的預(yù)后。表達(dá)水平通常以數(shù)值表述。因此,表達(dá)鐠通常包括一組數(shù)值,每個(gè)數(shù)值代表預(yù)后組中一種基因的表達(dá)水平。依照本發(fā)明第一個(gè)方面的方法可包括步驟提供代表預(yù)后組基因在腫瘤中的表達(dá)水平的表達(dá)語,并根據(jù)表達(dá)鐠確定患者的預(yù)后。提供表達(dá)謙的步驟可包括由預(yù)先存在的數(shù)據(jù)集提取關(guān)于預(yù)后組基因表達(dá)水平的信息,所述數(shù)據(jù)集還可以包含其它表達(dá)水平(例如代表其它基因在腫瘤中的表達(dá)水平的數(shù)據(jù))。或者,它可以包括通過實(shí)驗(yàn)確定表達(dá)水平。確定步驟可包括步驟(a)由患者獲得乳瘤樣品;(b)測(cè)量預(yù)后組基因在樣品中的表達(dá)水平?;虮磉_(dá)水平的測(cè)量,特別是它在表達(dá)i普中的表示,可以是絕對(duì)的,或者是相對(duì)于某些其它因素,諸如但不限于另一種基因的表達(dá),或是一組基因(優(yōu)選預(yù)后組以外的基因,但是可能包括預(yù)后組的基因)在樣品中或一組樣品間的表達(dá)水平的平均值、中值或模式。例如,可以作為多種基因在樣品中的平均表達(dá)的倍數(shù)或分?jǐn)?shù)來測(cè)量或表述基因的表達(dá)。優(yōu)選的是,將表達(dá)在表達(dá)鐠中表述成正數(shù)或負(fù)數(shù),指示表達(dá)相對(duì)于平均值的升高或降低。在一個(gè)非優(yōu)選實(shí)施方案中,將一組數(shù)值形式的表達(dá)譜信息轉(zhuǎn)換成預(yù)后組基因的排序表,其中將基因按照表達(dá)水平的順序排序,然后將各種基因的排序作為分析參數(shù)(代替基因的表達(dá)值)。優(yōu)選的是,步驟(b)包括使由樣品獲得的所述表達(dá)產(chǎn)物接觸能夠與表達(dá)產(chǎn)物相結(jié)合的多種結(jié)合成員,其指示預(yù)后組基因表達(dá),其中這種結(jié)合可以被測(cè)量。一般而言,該結(jié)合成員不僅能夠檢測(cè)表達(dá)產(chǎn)物的存在與否,而且能夠檢測(cè)其相對(duì)豐度(即可利用產(chǎn)物的量)??梢允褂媚軌蚺c預(yù)后組表達(dá)產(chǎn)物(例如mRNA、相應(yīng)的cDNA或cRNA或表達(dá)的多肽)相結(jié)合的結(jié)合成員來確定表達(dá)鐠。通過標(biāo)記表達(dá)產(chǎn)物或結(jié)合成員,有可能確定表達(dá)產(chǎn)物的相對(duì)數(shù)量或比例,并確定預(yù)后組的表達(dá)譜。該結(jié)合成員可以是互補(bǔ)核酸序列或特異抗體。確定預(yù)后的步驟可通過將所測(cè)試表達(dá)譜與其它先前獲得的與已知預(yù)后有關(guān)的鐠和/或先前確定的特定預(yù)后的特征性"標(biāo)準(zhǔn)"譜進(jìn)行比較來進(jìn)行。特定預(yù)后的標(biāo)準(zhǔn)諳可由該預(yù)后的多個(gè)腫瘤的表達(dá)譜生成。比較將通常使用或借助計(jì)算機(jī)來進(jìn)行。優(yōu)選的是,將表達(dá)譜與不同的已知預(yù)后的已知或標(biāo)準(zhǔn)譜(優(yōu)選標(biāo)準(zhǔn)譜)進(jìn)行比較。對(duì)患者確定的預(yù)后即所測(cè)試表達(dá)譜與之最相似的已知或標(biāo)準(zhǔn)譜的預(yù)后。優(yōu)選的是,與歸入兩種不同預(yù)后(例如"好的"和"差的")或是高和低NPI(優(yōu)選截止點(diǎn)為3.8-4.6)的已知或標(biāo)準(zhǔn)語(優(yōu)選標(biāo)準(zhǔn)i普)進(jìn)行比較。已知或標(biāo)準(zhǔn)謙通常是由已知預(yù)后的樣品生成的,這可以是通過任何方便的方法確定的-或是由患者移除樣品后的實(shí)際臨床結(jié)果,或是其它預(yù)后技術(shù),例如組織病理學(xué)技術(shù),例如使用NPI等級(jí)。比較可能牽涉通過統(tǒng)計(jì)技術(shù)評(píng)估預(yù)后的置信度水平。標(biāo)準(zhǔn)鐠常常是對(duì)于產(chǎn)生它的特定材料和方法(例如微陣列)特異的。如果采用新的材料和/或方法(例如新型微陣列),那么優(yōu)選使用預(yù)后組再次獲得已知預(yù)后的標(biāo)準(zhǔn)鐠。依照本發(fā)明第一個(gè)方面的方法可能包括將乳瘤樣品分類,例如分為高NPI或低NPI,或是分為好的或差的預(yù)后。如上所述,確定預(yù)后的步驟可通過將所測(cè)試乳瘤樣品的表達(dá)語與先前獲得的i普和/或先前確定的特定預(yù)后(例如"好的"和/或"差的"預(yù)后和/或至少一個(gè)NPI值和/或至少一個(gè)NPI值范圍)的特征性"標(biāo)準(zhǔn)"語進(jìn)行比較來進(jìn)行。先前獲得的鐠可以保存為i普的數(shù)據(jù)庫。優(yōu)選的是,數(shù)據(jù)庫包含特定預(yù)后的特征性基因表達(dá)譜。優(yōu)選由與本發(fā)明第一個(gè)方面的預(yù)后組相同的預(yù)后組(表S6的基因子集)或是與第一個(gè)方面的預(yù)后組充分重疊的預(yù)后組(可能是來自上文的不同子集)的表達(dá)水平來生成基因表達(dá)譜,從而提供表達(dá)水平比較的統(tǒng)計(jì)學(xué)顯著基礎(chǔ)。可以將計(jì)算機(jī)編程,使之報(bào)告所測(cè)試諉與標(biāo)準(zhǔn)i普之間的統(tǒng)計(jì)學(xué)相似性,從而可確定預(yù)后。有利的是,基因表達(dá)譜在確定預(yù)后中的使用可能降低或可能甚至消除用于對(duì)腫瘤樣品確定預(yù)后的臨床程序的主觀性。由于該方法要求在分子水平評(píng)估表達(dá)產(chǎn)物,優(yōu)選定量地,該方法提供了更加客觀因而可能更加可靠的確定預(yù)后的方法。如上所述,預(yù)后組能夠?qū)⑷榱鰳悠贩殖瑟?dú)立的類別,從而降低或甚至消除臨床預(yù)后確定中的主觀分析。此外,可以對(duì)預(yù)測(cè)確定置信度,從而可以根據(jù)預(yù)后的"強(qiáng)度"對(duì)患者的治療做出明智的臨床選擇。預(yù)后組的表達(dá)語在相似預(yù)后的獨(dú)立樣品之間可能略有不同。然而,發(fā)明人認(rèn)識(shí)到,構(gòu)成預(yù)后組的特定基因的表達(dá)鐠在聯(lián)合使用時(shí)提供了腫瘤樣品中的表達(dá)模式(表達(dá)語),它是對(duì)于腫瘤的預(yù)后而言是特征性的。發(fā)明人發(fā)現(xiàn),預(yù)后組能夠?qū)⒛[瘤樣品辨別為高NPI和低NPI類別。高NPI意指優(yōu)選至少3.4、優(yōu)選至少3.5、更優(yōu)選至少3.6、更優(yōu)選至少3.7、更優(yōu)選至少3.8、更優(yōu)選至少3.9、最優(yōu)選至少4.0。高NPI可能是至少4.1、至少4.2、至少4.3、至少4.4、至少4.5、或至少4.6。高和低NPI之間的優(yōu)選截止值是3.8-4.6。在歷史上,"好的,,、"中等"和"差的"NPI類別是使用大量臨床研究確定的,其中屬于這些不同組的患者的總體存活具有統(tǒng)計(jì)學(xué)顯著差異。例如,具有好的預(yù)后的患者可能具有約83%的十年存活率,具有"中等"預(yù)后的患者可能具有約52%的十年存活率,而具有"差的"預(yù)后的患者可能具有約13%的十年存活率(4)。具體而言,預(yù)后組似乎與雌激素受體陽性腫瘤(ER+)的肺瘤預(yù)后(由NPI反映)具有最強(qiáng)烈的關(guān)聯(lián)。將乳瘤分為雌激素受體陽性(ER+)和陰性(ER-)亞型是乳癌治療中的一項(xiàng)重要鑒別項(xiàng)目。ER-腫瘤通常比它們的ER+對(duì)應(yīng)物在臨床上更具攻擊性,而ER+腫瘤常規(guī)使用抗激素療法進(jìn)行治療,諸如三苯氧胺(21)??梢允褂媒M織學(xué)技術(shù)(例如使用對(duì)受體特異的抗體)或使用基因表達(dá)技術(shù)將乳瘤分為ER+或ER-。目前,常規(guī)使用ER抗體通過免疫組化(IHC)或免疫印跡來確定腫瘤的ER狀態(tài)。本發(fā)明的第一個(gè)方面優(yōu)選包括測(cè)定腫瘤樣品的ER狀態(tài)的步驟??梢允褂没虮磉_(dá)分析或組織病理學(xué)技術(shù)來確定ER狀態(tài)。優(yōu)選的是,本發(fā)明的第一個(gè)方面還包括確定腫瘤樣品的ER狀態(tài)的開始步驟,而且只在狀態(tài)是ER+時(shí)繼續(xù)進(jìn)行。優(yōu)選的是,如我們共同懸而未決的申請(qǐng)PCT/GB03/000755中所述使用基因表達(dá)描繪(profiling)來確定乳瘤樣品的ER狀態(tài)。基因表達(dá)描繪能夠以高置信度將乳瘤分為ER+或ER-。然而,還存在不能以顯著統(tǒng)計(jì)學(xué)確定性分為ER+或ER-的第三類腫瘤("低置信度,,腫瘤)。ERBB2+的上調(diào)常常與低置信度腫瘤有關(guān)。優(yōu)選的是,只對(duì)以高置信度鑒定為ER+的腫瘤(優(yōu)選才艮據(jù)PCT/GB03/000755的方法的測(cè)定以量級(jí)大于0.4的預(yù)測(cè)強(qiáng)度分類為ER+),使用依照本發(fā)明第一個(gè)方面的方法進(jìn)行評(píng)估。對(duì)乳瘤樣品確定預(yù)后的步驟可包括使用統(tǒng)計(jì)學(xué)和/或概率技術(shù),諸如加權(quán)表決(WeightedVoting,WV)(13),即一種監(jiān)督學(xué)習(xí)技術(shù)。在WV中,可以進(jìn)行二元分類。即該技術(shù)可用于將樣品確定為兩種類型之一。將預(yù)后組中每種基因在乳瘤樣品中的表達(dá)水平與該基因在不同類型間的平均表達(dá)水平平均值進(jìn)行比較。例如,可由具有確定的預(yù)后的表達(dá)譜(例如"已知,,預(yù)后的表達(dá)譜的數(shù)據(jù)庫)計(jì)算該平均值。將表達(dá)水平和類型間平均基因表達(dá)之間的差異加權(quán),并對(duì)應(yīng)該基因?qū)υ擃愋偷?選票"和該基因?qū)ζ渌愋偷南嗟鹊穸ǖ耐镀?。?duì)于特定腫瘤,將所有基因?qū)γ恳活惖耐镀?肯定的和否定的)加到一起,產(chǎn)生每一類的總數(shù)。將腫瘤確定為具有最高(肯定的)總數(shù)的類型。然后可以將獲勝類型的勝利幅度表述成預(yù)測(cè)強(qiáng)度。表達(dá)水平的差異是使用包括兩種類型中每一個(gè)的基因表達(dá)水平的平均值和標(biāo)準(zhǔn)偏差在內(nèi)的公式加權(quán)的。一般而言,每一種類型的平均值和標(biāo)準(zhǔn)偏差是由具有或代表特定預(yù)后(例如高NPI和低NPI)的表達(dá)譜計(jì)算的。另外/或者,確定預(yù)后的步驟可以包括使用分級(jí)聚類(hierarchicalclustering),特別是在與確定與樣品表達(dá)傳進(jìn)行比較的具有"已知"預(yù)后的表達(dá)譜或標(biāo)準(zhǔn)譜使用不同的材料和/或方法來確定腫瘤樣品中的表達(dá)水平的時(shí)候。可以使用已經(jīng)建立的排除一項(xiàng)交叉驗(yàn)證(LOOCV)(leave-one-outcrossvalidation)檢驗(yàn)法(見實(shí)施例)來驗(yàn)證確定的預(yù)后。步驟(c)可使用計(jì)算機(jī)來進(jìn)行。在分級(jí)聚類中,每個(gè)表達(dá)i瞽可以表示由n個(gè)基因組成的矢量(vector),其中(gl,g2...gn)代表基因的表達(dá)水平。然后,將每個(gè)矢量與分析中的每一個(gè)其它譜的矢量進(jìn)行比較,并將兩個(gè)彼此具有最高關(guān)聯(lián)的矢量配成對(duì),直至盡可能多的將分析中的語配成對(duì)。本領(lǐng)域知道許多方法可以計(jì)算關(guān)聯(lián)度,諸如Pearson的相關(guān)系數(shù)(22)。在下一步中,由每一對(duì)衍生一個(gè)合成矢量(在平均連接聚類(average-1inkageclustering)中,這通常是兩個(gè)謙的平均值),然后重復(fù)配對(duì)過程。繼續(xù),直至將所有矢量配成對(duì),聚集成代表所有譜的"樹"。這個(gè)過程就是"分級(jí)",因?yàn)槭怯傻撞?各個(gè)i瞽)開始并向上升。在本發(fā)明中,優(yōu)選由各個(gè)語建成兩個(gè)合成矢量,每個(gè)矢量代表一種類型(即好的和差的預(yù)后)。對(duì)于未知類型的一個(gè)新樣品,將樣品與標(biāo)準(zhǔn)譜/樣品進(jìn)行聚類(clustered)。根據(jù)樣品在反復(fù)配對(duì)結(jié)束時(shí)所屬的簇/矢量來確定"未知"樣品的類型。具有"已知"或確定預(yù)后的表達(dá)譜指已經(jīng)確定或獲得了預(yù)后的表達(dá)譜。預(yù)后可以是由基因表達(dá)數(shù)據(jù)計(jì)算得到的;由對(duì)來源樣品執(zhí)行的臨床技術(shù)(例如組織病理學(xué)技術(shù))獲得的;或者通過回顧獲取該表達(dá)譜的患者的實(shí)際疾病進(jìn)展/結(jié)果而確定的。第三個(gè)選項(xiàng)是最優(yōu)選的,因?yàn)榭梢杂苫颊叩尼t(yī)學(xué)記錄根據(jù)后續(xù)結(jié)果(為了在獲得樣品時(shí)及時(shí))確定精確的預(yù)后。在這種回顧判定中,后見之明的使用提供了精確性。本發(fā)明的方法可用于評(píng)估治療乳癌患者的功效??梢栽谥委熐盎蛑委熢缙诖_定患者的預(yù)后,并與治療后(或治療晚期)對(duì)患者確定的預(yù)后進(jìn)行比較。優(yōu)選使用依照本發(fā)明的方法來確定治療前后的預(yù)后。如果治療包括幾個(gè)階段,那么可以在每個(gè)階段后確定表達(dá)譜,從而將治療的進(jìn)展制圖。在治療后預(yù)后的改善指示治療是成功的或至少部分成功的。治療可以是化療。本發(fā)明的方法可包括比較預(yù)后組在治療前后在乳瘤樣品中的表達(dá)水平以檢測(cè)表達(dá)譜的變化,它是預(yù)后改善或惡化的指示。該方法可包括檢測(cè)表S6中指出是"上調(diào)的"預(yù)后組基因的下調(diào)和/或表S6中指出是"下調(diào)的"預(yù)后組基因的上調(diào)。所述基因與標(biāo)準(zhǔn)值(例如一批不同預(yù)后樣品間的平均表達(dá)水平)相比和/或與先前值(例如"差的"預(yù)后的指示性或特征性標(biāo)準(zhǔn)譜)相比可能是下調(diào)的/上調(diào)的。"上調(diào)的"基因的下調(diào)和/或"下調(diào)的"基因的上調(diào)指示好的或中等預(yù)后。調(diào)控的變化程度可能指示治療的功效。發(fā)明人發(fā)現(xiàn),朝著預(yù)后好的腫瘤表達(dá)謙變化指示治療是成功的。具有這種表達(dá)鐠變化的腫瘤具有最好的預(yù)后(例如最好的存活率、最好的無病存活率)??梢詫⒅委熐昂箅A段腫瘤的表達(dá)鐠與已知預(yù)后的標(biāo)準(zhǔn)譜進(jìn)行比較。因此,該方法可包括將乳瘤的表達(dá)譜確定為好的或差的預(yù)后類型(或者高或低NPI類型),將在治療晚期由所述腫瘤確定的第二個(gè)表達(dá)譜確定為好的或差的預(yù)后類型(或者高的或低的NPI類型),并檢測(cè)類型的變化,其中由差的預(yù)后變成好的預(yù)后(或者由高NPI變成低NPI)指示治療是有效的。另外/或者,確定好的或差的預(yù)后類型(或者高或低NPI類型)的統(tǒng)計(jì)學(xué)置信度水平變化可能指示治療的功效。確定為差的預(yù)后類型的置信度降低可能說明治療是成功的或至少部分成功的。評(píng)估治療功效的方法可以包括測(cè)定腫瘤ER狀態(tài)的步驟。然而,評(píng)估功效的所述方法對(duì)于評(píng)估ER+、ER-和ERBB2+腫瘤的治療功效是有效的,即不管腫瘤的ER狀態(tài)。表達(dá)譜代表了一組基因在腫瘤中的表達(dá)水平。每個(gè)表達(dá)譜的基因不必是相同的,但是每個(gè)表達(dá)譜的基因之間應(yīng)當(dāng)充分重疊,從而能夠比較表達(dá)譜并將其分組。出于檢測(cè)目的,可以使用本領(lǐng)域已知的標(biāo)準(zhǔn)方法標(biāo)記結(jié)合成員?;蛘撸梢栽谟伤鶞y(cè)試樣品分離表達(dá)產(chǎn)物后將其標(biāo)記。優(yōu)選的檢測(cè)手段是使用可以由光度計(jì)檢測(cè)的熒光標(biāo)記物。另外的檢測(cè)手段包括電信號(hào)。例如,Motorola(Pasadena,California)的e傳感器系統(tǒng)具有兩個(gè)探針,一個(gè)是自由漂浮的"捕獲探針",另一個(gè)是附著在固體表面上的"信號(hào)探針",所述固體表面又為電極表面。兩個(gè)探針都作為表達(dá)產(chǎn)物的結(jié)合成員。當(dāng)發(fā)生結(jié)合時(shí),兩個(gè)探針彼此靠攏,產(chǎn)生可以檢測(cè)的電信號(hào)。然而,最近出現(xiàn)了利用"無標(biāo)記物"技術(shù)來進(jìn)行定量的許多新技術(shù),例i口由Xagros(MountainView,California)開發(fā)的4支術(shù)。引物和/或擴(kuò)增的核酸可以不含任何標(biāo)記物??梢酝ㄟ^測(cè)量由兩種引物錨如上所述,結(jié)合成員可以是用于在PCR(例如多重PCR)中特異擴(kuò)增基因鑒別物的表達(dá)產(chǎn)物數(shù)目的寡核苷酸引物。然后可以在凝膠上分析產(chǎn)物。然而,優(yōu)選的是,結(jié)合成員是固定在固體支持物上的單一核酸探針或抗體。然后可以讓表達(dá)產(chǎn)物經(jīng)過固體支持物,使得它們與結(jié)合成員相接觸。固體支持物可以是玻璃表面,例如顯微鏡栽玻片;珠(Lynx);或光纖。在珠的情況中,可以將每種結(jié)合成員固定在各個(gè)珠上,然后讓它們?cè)谌芤褐薪佑|表達(dá)產(chǎn)物。本領(lǐng)域存在多種方法可用于確定特定的基因組(geneset)的表達(dá)譜,這些方法都可應(yīng)用于本發(fā)明。例如,基于珠的方法(Lynx)或分子條形碼(Surromed)就是已知的技術(shù)。在這些情況中,將每種結(jié)合成員附著在單個(gè)可讀且自由漂浮的珠或"條形碼"上,以易于與表達(dá)產(chǎn)物的接觸。結(jié)合成員與表達(dá)產(chǎn)物(靶)的結(jié)合是在溶液中完成的,然后讓打上標(biāo)簽的珠或條形碼經(jīng)過某種裝置(例如流式細(xì)胞儀)并讀數(shù)。確定表達(dá)鐠的另一種已知方法是由Illumina(SanDiego,California)開發(fā)的儀器,即光纖。在這種情況中,將每種結(jié)合成員附著在光纖纜末端的特定"地址,,上。表達(dá)產(chǎn)物與結(jié)合成員的結(jié)合可以誘導(dǎo)熒光變化,它可以通過光纖纜另一端的裝置讀出。本發(fā)明人成功的使用了包含固定在固體支持物上的多種核酸序列的核酸微陣列。通過讓代表所表達(dá)基因的核酸序列(例如cDM)經(jīng)過微陣列,它們能夠產(chǎn)生來自具有特定預(yù)后的腫瘤樣品(具體而言就是具有好的預(yù)后的腫瘤樣品或具有差的預(yù)后的腫瘤樣品或者是具有高NPI的腫瘤樣品或具有低NPI的腫瘤樣品)的表達(dá)產(chǎn)物的特征性結(jié)合i瞽。在第二個(gè)方面,本發(fā)明提供了用于確定乳瘤樣品預(yù)后的裝置,優(yōu)選微陣列,該裝置包含附著了多種結(jié)合成員的固體支持物,每種結(jié)合成員能夠與預(yù)后組基因的表達(dá)產(chǎn)物特異結(jié)合。優(yōu)選的是,附著在固體支持物上的結(jié)合成員能夠與表S6中所示的至少5種基因,更優(yōu)選至少IO種基因或至少15種基因,且最優(yōu)選至少20種或30種基因的表達(dá)產(chǎn)物特異且獨(dú)立結(jié)合。附著在固體支持物上的結(jié)合成員可能能夠與表S6中所示的20-30種基因的表達(dá)產(chǎn)物特異結(jié)合。在一個(gè)實(shí)施方案中,將能夠與表S6中所示的所有基因的表達(dá)產(chǎn)物特異且獨(dú)立結(jié)合的結(jié)合成員附著在固體支持物上。支持物上可以只附的結(jié)合成;。土口該裝置優(yōu)選包含能夠與預(yù)后組的表達(dá)產(chǎn)物或其多種基因特異結(jié)合的結(jié)合成員,而且可以包含能夠與U133A微陣列上體現(xiàn)的不完整基因子集的表達(dá)產(chǎn)物特異結(jié)合的結(jié)合成員(盡管它還可能包含U133A微陣列上未體現(xiàn)的其它基因的結(jié)合成員)。認(rèn)為U133A微陣列體現(xiàn)了約14397種不同基因。因此,該裝置優(yōu)選包含不超過U133A微陣列上14396種基因的結(jié)合成員。該裝置可包含能夠與U133A微陣列上不超過9(r/?;虻谋磉_(dá)產(chǎn)物特異結(jié)合的結(jié)合成員。該裝置可包含能夠與U133A微陣列上不超過80%、或70%、或50%、或40%、或30%、或20%、或10%、或5%基因的表達(dá)產(chǎn)物特異結(jié)合的結(jié)合成員。另外/或者,固體支持物可以容納不超過14000種、或不超過IOOOO種、或不超過5000種、或不超過3000種、或不超過1000種、或不超過500種、或不超過400種、或不超過300種、或不超過200種、或不超過IOO種、或不超過90種、或不超過80種、或不超過70種、或不超過60種、或不超過50種、或不超過40種、或不超過30種、或不超過20種、或不超過10種或不超過5種不同基因的結(jié)合成員。優(yōu)選的是,結(jié)合成員是核酸序列,且裝置是核酸微陣列。表S6的基因列出了它們對(duì)應(yīng)于Unigene數(shù)據(jù)庫Build160的Unigene編號(hào)。因此,可以由NationalInstituteofHealth(訓(xùn))(http://www.ncbi.nlm.nih.gov/entrez/query.fcgidb=unigene)的Unigene數(shù)據(jù)庫檢索每種基因的序列。另外,對(duì)于所有基因,Affymetrix(SantaClara,California)(www.affymetrix.com)提供了在用于固體支持物時(shí)能夠檢測(cè)基因表達(dá)的探針組的實(shí)例,包括探針的序列(即寡核苷酸序列形式的結(jié)合成員)。關(guān)于探針的詳情可以由Affymetrix網(wǎng)站的U133A部分使用靶基因的UnigeneID獲取。將來如果在表中所列的一個(gè)UnigeneID以新ID出現(xiàn)、分裂成兩個(gè)或多個(gè)ID(例如在數(shù)據(jù)庫的新build中)、或完全刪除,那么本發(fā)明人預(yù)期的基因序列可以通過訪問Unigene的Build160來檢索。通常,將高密度核酸序列(通常是cDNA或寡核苷酸)固定在固體支持物上很小的離散區(qū)域或點(diǎn)上。固體支持物常常是用某種基質(zhì)包被的顯微鏡載玻片或?yàn)V膜(即芯片)。通常通過機(jī)械自動(dòng)化系統(tǒng)將核酸序列投遞(或印制)到經(jīng)過包被的固體支持物上,然后固定在支持物上。在一個(gè)優(yōu)選的實(shí)施方案中,將由樣品產(chǎn)生的表達(dá)產(chǎn)物進(jìn)行標(biāo)記,通常使用熒光標(biāo)記物,然后與固定好的核酸序列接觸。雜交后,使用檢測(cè)儀檢測(cè)熒光標(biāo)記物,諸如高清晰度激光掃描儀。在另一種方法中,可以用非熒光標(biāo)記物給表達(dá)產(chǎn)物打上標(biāo)簽,例如生物素。雜交后,用與第一種非熒光標(biāo)記物結(jié)合/鍵合的熒光染料給微陣列"染色",例如熒光標(biāo)記的與生物素結(jié)合的鏈霉親和素。然而,如上所述,表達(dá)產(chǎn)物可以不進(jìn)4亍標(biāo)記。通過用數(shù)字成像軟件分析每個(gè)離散點(diǎn)發(fā)出的信號(hào)得到指示基因表達(dá)模式的結(jié)合譜(表達(dá)模式或譜)。然后,可以將實(shí)驗(yàn)樣品的基因表達(dá)模式與標(biāo)準(zhǔn)譜(即具有例如已知的好的或差的預(yù)后或者已知的NPI值或已知的NPI值范圍的組織樣品的表達(dá)譜)進(jìn)行比較從而進(jìn)行差異分析。所述的標(biāo)準(zhǔn)可以是來自先前判定為特定預(yù)后(例如"差的"或"好的"預(yù)后)和/或特定NPI范圍(諸如高和/或低NPI)特征性的和/或一個(gè)或多個(gè)NPI值或一個(gè)或多個(gè)數(shù)值范圍特征性的一個(gè)或多個(gè)表達(dá)鐠。該標(biāo)準(zhǔn)可以是來自先前判定為特定NPI值或數(shù)值范圍(或是其它預(yù)后等級(jí)的限定值)特征性的一個(gè)或多個(gè)表達(dá)譜。該標(biāo)準(zhǔn)可以包括正常樣品的特征性表達(dá)鐠。這些/這個(gè)標(biāo)準(zhǔn)表達(dá)謙可以以可獲取的方式保存在數(shù)據(jù)載體上作為數(shù)據(jù)庫的一部分。大多數(shù)微陣列利用一種或兩種熒光團(tuán)。對(duì)于雙色陣列,最常用的熒光團(tuán)是Cy3(綠色通道激發(fā))和Cy5(紅色通道激發(fā))。微陣列圖像分析的目的是提取每種表達(dá)產(chǎn)物的雜交信號(hào)。對(duì)于單色陣列,對(duì)指定的靶(基本上是與單一樣品雜交的陣列)測(cè)量絕對(duì)強(qiáng)度作為信號(hào)。對(duì)于雙色陣列,測(cè)量具有不同熒光標(biāo)記物的兩份表達(dá)產(chǎn)物(例如樣品和對(duì)照,對(duì)照在其它方面也稱為參照)的比率作為信號(hào)。依照本發(fā)明的裝置優(yōu)選包含多個(gè)離散點(diǎn),每個(gè)點(diǎn)含有一種或多種寡核苷酸且每個(gè)點(diǎn)代表選自表S6的基因的表達(dá)產(chǎn)物的不同結(jié)合成員。在一個(gè)實(shí)施方案中,微陣列將包含針對(duì)表S6中提供的每一種基因的點(diǎn)。每個(gè)點(diǎn)將包含多個(gè)相同寡核苷酸,每個(gè)都能夠與它所代表的表S6基因的表達(dá)產(chǎn)物(例如mRM或cDNA)結(jié)合。每一種基因優(yōu)選由多種不同的寡核苷酸來體現(xiàn),優(yōu)選針對(duì)基因的AffymetrixU133A探針組。在本發(fā)明的第三個(gè)方面,提供了用于對(duì)乳癌患者確定預(yù)后的試劑盒,其包含能夠與預(yù)后組基因的表達(dá)產(chǎn)物特異結(jié)合的多種結(jié)合成員和檢測(cè)劑。該試劑盒可以包含數(shù)據(jù)分析工具,優(yōu)選計(jì)算機(jī)程序的形式。數(shù)據(jù)分析工具優(yōu)選包含適于區(qū)別不同預(yù)后腫瘤的表達(dá)謙的算法。優(yōu)選的是,該算法適于區(qū)別"好的"預(yù)后和"差的"預(yù)后,最優(yōu)選適于區(qū)別高NPI和低NPI腫瘤。該算法優(yōu)選是上文描述的加權(quán)表決算法。在一個(gè)實(shí)施方案中,該試劑盒包含本發(fā)明第二個(gè)方面的裝置。該試劑盒可以包含具有已知預(yù)后的乳瘤樣品的表達(dá)譜(如上所述)和/或特定預(yù)后的特征性基因表達(dá)譜(如上所述),優(yōu)選保存在數(shù)據(jù)載體或其它存儲(chǔ)裝置上。所述譜可以是已經(jīng)進(jìn)行了統(tǒng)計(jì)學(xué)分析或分組的,例如計(jì)算了平均表達(dá)水平平均值和/或基因權(quán)重。優(yōu)選的是,將試劑盒中的一種或多種結(jié)合成員(抗體結(jié)合結(jié)構(gòu)域或核酸序列,例如寡核苷酸)固定在一種或多種固體支持物上,例如用于微陣列或光纖測(cè)定法的單一支持物,或諸如珠等多個(gè)支持物。檢測(cè)手段優(yōu)選用于標(biāo)記所測(cè)試樣品的表達(dá)產(chǎn)物的標(biāo)記物(放射性或染料,例如熒光)。試劑盒還可以包含用于檢測(cè)和分析所測(cè)試表達(dá)產(chǎn)物的結(jié)合譜的試劑?;蛘撸Y(jié)合成員可以是能夠與表S6中所示的基因的表達(dá)產(chǎn)物相結(jié)合并因此能在PCR中擴(kuò)增它們的核苷酸引物。引物還可以包含檢測(cè)手段,即可用于鑒定擴(kuò)增序列及其相對(duì)于其它擴(kuò)增序列的豐度的標(biāo)記物。乳瘤樣品可以通過切除的乳房活組織檢查物或細(xì)針吸取物來獲得。通過由許多腫瘤樣品生成預(yù)后組的許多表達(dá)譜,其中每個(gè)樣品都具有確定的預(yù)后,且優(yōu)選根據(jù)預(yù)后等級(jí),有可能為好的和差的預(yù)后生成謙庫。表達(dá)鐠的數(shù)目越多,生成可以在預(yù)后測(cè)定中用作標(biāo)準(zhǔn)的可靠特征性表達(dá)鐠標(biāo)準(zhǔn)(即包括統(tǒng)計(jì)變差)越容易。由此,標(biāo)準(zhǔn)鐠可以是由多種個(gè)體表達(dá)鐠且在統(tǒng)計(jì)變差內(nèi)設(shè)計(jì)出來的以代表例如"好的"或"差的,,預(yù)后或者高NPI或低NPI的鐠。在第四個(gè)方面,提供了用于為乳瘤樣品生成核酸表達(dá)譜的方法,包括步驟(a)由所述乳瘤樣品分離表達(dá)產(chǎn)物;(b)鑒定預(yù)后組基因的表達(dá)水平;并(c)為所述乳瘤樣品由表達(dá)水平生成表達(dá)譜??梢詫⒃摫磉_(dá)譜加入基因表達(dá)譜數(shù)據(jù)庫。該方法還可以包括將該表達(dá)譜與另一個(gè)表達(dá)譜(或多個(gè)另一個(gè)表達(dá)譜)進(jìn)行比較的步驟。該另一個(gè)(或多個(gè))表達(dá)譜可以是使用實(shí)質(zhì)相同的預(yù)后組由另一個(gè)(或多個(gè))乳瘤樣品生成的,其中已經(jīng)確定了該另一個(gè)(或多個(gè))樣品的預(yù)后。該另一個(gè)(或多個(gè))表達(dá)譜可以是特定預(yù)后的特征性標(biāo)準(zhǔn)譜,例如"好的,,預(yù)后或"差的,,預(yù)后,或者高NPI或低NPI,或者至少一個(gè)特定NPI值或至少一個(gè)NPI數(shù)值范圍。優(yōu)選的是,預(yù)后采取預(yù)后度量(prognosticmeasure)的形式,優(yōu)選臨床可接受的預(yù)后分類系統(tǒng),諸如NPI。同樣,預(yù)后可以是由基因表達(dá)數(shù)據(jù)預(yù)測(cè)的,由臨床技術(shù)(諸如組織病理學(xué)技術(shù))產(chǎn)生的,或根據(jù)提供樣品的患者的疾病結(jié)果對(duì)第二個(gè)表達(dá)謙回顧性確定的,由所述樣品產(chǎn)生所述第二個(gè)表達(dá)譜。憑借預(yù)后組的知識(shí),有可能設(shè)計(jì)出用于測(cè)定基因在特定測(cè)試樣品中的表達(dá)模式或譜的許多方法。例如,可以使用標(biāo)準(zhǔn)分子生物學(xué)技術(shù)由樣品分離表達(dá)的核酸(RNA、mRNA)。然后,可以在PCR中使用對(duì)表員的表達(dá)核酸序列。如果分離的表達(dá)核酸是fliRNA,那么可以使用標(biāo)準(zhǔn)方法將它轉(zhuǎn)變成cDNA從而用于PCR反應(yīng)。引物可以方便的將標(biāo)記物導(dǎo)入擴(kuò)增的核酸,從而可以對(duì)它進(jìn)行鑒定。理想的是,標(biāo)記物能夠指示擴(kuò)增事件后存在的核酸序列的相對(duì)數(shù)量或比例,它反映了原始測(cè)試樣品中存在的相對(duì)數(shù)量或比例。例如,如果標(biāo)記物是熒光或放射性的,那么信號(hào)強(qiáng)度將指示表達(dá)序列的相對(duì)數(shù)量/比例或甚至絕對(duì)數(shù)量。每一種基因鑒別物的表達(dá)產(chǎn)物的相對(duì)數(shù)量或比例將構(gòu)成測(cè)試樣品的獨(dú)特表達(dá)語。依照本發(fā)明第四個(gè)方面的方法可以包括步驟(a)由第一個(gè)乳瘤樣品分離表達(dá)產(chǎn)物,使所述表達(dá)產(chǎn)物接觸能夠與預(yù)后組的表達(dá)產(chǎn)物特異且獨(dú)立結(jié)合的多種結(jié)合成員,并由預(yù)后組在腫瘤樣品中的表達(dá)水平生成第一個(gè)表達(dá)傳;(b)由預(yù)后已知的第二個(gè)乳瘤樣品分離表達(dá)產(chǎn)物(正如上文定義的),使所述表達(dá)產(chǎn)物接觸能夠與步驟(a)的預(yù)后組的表達(dá)產(chǎn)物特異且獨(dú)立結(jié)合的多種結(jié)合成員,從而生成相當(dāng)?shù)牡诙€(gè)乳瘤樣表達(dá)譜;(c)將第一個(gè)和第二個(gè)表達(dá)譜進(jìn)行比較,以確定第一個(gè)乳瘤。樣品的預(yù)后在本發(fā)明的第五個(gè)方面,提供了包含多個(gè)乳瘤樣品基因表達(dá)譜的表達(dá)譜數(shù)據(jù)庫,其中基因表達(dá)譜來自預(yù)后組基因的表達(dá)水平,該數(shù)據(jù)庫以可獲取的方式保存在數(shù)據(jù)載體上。該數(shù)據(jù)庫優(yōu)選是通過依照本發(fā)明第四個(gè)方面的方法生成的。所逸表達(dá)鐠優(yōu)選是核酸表達(dá)謙。核酸表達(dá)譜的確定可以計(jì)算機(jī)化,而且可以在先前設(shè)定的某些參數(shù)內(nèi)進(jìn)行,以避免假陽性和假陰性。數(shù)據(jù)庫可以包含特定預(yù)后的特征性表達(dá)鐠,諸如好的或差的預(yù)后,或者特定預(yù)后值,優(yōu)選NPI值(例如高NPI、低NPI、或特定定性數(shù)值或數(shù)值范圍)的特征性表達(dá)鐠??梢愿鶕?jù)來源腫瘤的ER狀態(tài)(即ER+或ER-)將表達(dá)譜分類。然后可以加工并分析數(shù)據(jù)庫,使之最終包含(i)對(duì)應(yīng)于數(shù)據(jù)庫中每個(gè)表達(dá)語的數(shù)值數(shù)據(jù);(U)作為特定預(yù)后確定(例如好的或差的預(yù)后,或者數(shù)值或數(shù)值范圍,優(yōu)選NPI)的規(guī)范謙的"標(biāo)準(zhǔn)"i瞽;和(iii)代表各個(gè)譜相對(duì)于"標(biāo)準(zhǔn)"語的觀測(cè)統(tǒng)計(jì)變差的數(shù)據(jù)。然后,計(jì)算機(jī)可能能夠提供具有特定預(yù)后的乳瘤樣品的特征性表達(dá)諳標(biāo)準(zhǔn),例如好的預(yù)后和/或差的預(yù)后和/或高NPI和/或低NPI。如上所述,確定的表達(dá)傳然后可用于確定乳房組織樣品的預(yù)后,優(yōu)選使用區(qū)別算法,最優(yōu)選上文所述加權(quán)表決算法。所測(cè)試基因表達(dá)水平的數(shù)目越多,表達(dá)語的分類越可靠。已知的微陣列和基因芯片技術(shù)容許采用大量的結(jié)合成員。因此,更優(yōu)選的方法將是使用代表表S6中所有基因的結(jié)合成員。然而,技術(shù)人員將領(lǐng)會(huì),可以省略這些基因中的一定比例,而仍然以可靠且統(tǒng)計(jì)上精確的方式執(zhí)行該方法。因、所有或基本上所有陽性基因和/或所有陰性基因或由其組成。預(yù)后組基因的內(nèi)容和數(shù)目可以在本發(fā)明的各個(gè)方面之間獨(dú)立變化。預(yù)后組可以包含表S6的至少5、10、20、30、40、50、60種或所有基因。優(yōu)選的是,所述預(yù)后組包含表S6的約60種、或約50種、或約40種、或約30種、或約20種、或約10種、或約5種陽性基因或由其組成。表S6的陽性基因優(yōu)選選自表S6中陽性基因表的上部,優(yōu)選上半部,因?yàn)樗龌蚴前凑诊@著性排序的。預(yù)后組可以包含表S6中兩種陰性基因中的一種或兩種,或者可以由二者組成??梢赃x擇基因的數(shù)目和基因以提供預(yù)后組,其至少能夠區(qū)別具有好的預(yù)后的腫瘤和具有差的預(yù)后的腫瘤(或者具有高NPI的腫瘤和具有低NPI的腫瘤)。預(yù)后組可以包含不超過60種表S6的基因。預(yù)后組可以包含不超過50種表S6的基因。預(yù)后組可以包含不超過40種表S6的基因。預(yù)后組可以包含不超過30種表S6的基因。預(yù)后組可以包含不超過20種表S6的基因。預(yù)后組可以包含不超過10種表S6的基因。預(yù)后組可以包含不超過5種表S6的基因。預(yù)后組可以包含表S6的5-60種基因或基本上由其組成。預(yù)后組可以包含表S6的10-40種基因或基本上由其組成。預(yù)后組可以包含表S6的IO-30種基因或基本上由其組成。預(yù)后組可以包含表S6的10-20種、或20-30種或優(yōu)選30-40種基因或基本上由其組成。預(yù)后組(優(yōu)選約10種或約20種或約30種基因)可以選自表S6的前約40種、或前約30種、或前約20種基因。約10種基因可以選自表S6的前約15種基因。該約10種基因可以是表S6的前10種基因。預(yù)后組可以包含選自表S6的前約40種、或前約30種、或前約20種、或前約10種陽性基因的約40種、或約30種、或約20種或約10種基因以及任選的表S6的兩種陰性基因中的一種或兩種或基本上由其組成。預(yù)后組可以包含選自表S6的前約30種或前約40種陽性基因的約30種基因以及任選的表S6的兩種陰性基因中的一種或兩種或由其組成。優(yōu)選如上所述限制預(yù)后組中與U133A微陣列之間共有的基因數(shù)目。術(shù)語"約"優(yōu)選意味著所述基因數(shù)目加上或減去如下二者中的較大者所述基因數(shù)目的10%或一種基因。提供預(yù)后組容許定制診斷工具(例如核酸微陣列)并用于腫瘤的預(yù)測(cè)、診斷和分型。另外,這些診斷工具可以與計(jì)算機(jī)聯(lián)合使用,所述計(jì)算機(jī)被編程來確定使用診斷工具(例如微陣列)得到的表達(dá)譜并如上所述將它與預(yù)后"已知"的"標(biāo)準(zhǔn)"表達(dá)譜或表達(dá)譜數(shù)據(jù)庫進(jìn)行比較。從而計(jì)算機(jī)不僅為用戶提供了可用于診斷患者腫瘤的存在或類型的信息,同時(shí)計(jì)算機(jī)還獲得了另一個(gè)表達(dá)譜,由此確定"標(biāo)準(zhǔn)"表達(dá)譜,從而能夠更新其自身數(shù)據(jù)庫。由此,本發(fā)明首次容許制作包含與預(yù)后組對(duì)應(yīng)的探針的專用芯片(微陣列)。陣列的實(shí)際物理結(jié)構(gòu)可以變化,從附著在二維固體基質(zhì)上的寡核苷酸探針至自由漂浮的用獨(dú)特標(biāo)記物(例如"條形碼")個(gè)自"打上標(biāo)簽"的探針。查詢預(yù)后已知的表達(dá)語的數(shù)據(jù)庫可以以直接或間接的方式進(jìn)行。"直接"方式指將患者的表達(dá)谞與數(shù)據(jù)庫中的其它各個(gè)表達(dá)諳直接進(jìn)行比較,以確定哪個(gè)語(及由此哪種預(yù)后)給出最佳匹配?;蛘撸梢愿?間接"的進(jìn)行查詢,例如,可以將患者的表達(dá)鐠僅僅與數(shù)據(jù)庫中特定預(yù)后確定(例如"差的")或預(yù)后值或數(shù)值范圍(優(yōu)選NPI,例如高NPI)的"標(biāo)準(zhǔn)"譜進(jìn)行比較。間接法的優(yōu)勢(shì)在于"標(biāo)準(zhǔn)"語(因?yàn)樗鼈兇砹嗽S多個(gè)別諳的集合)的數(shù)據(jù)強(qiáng)度低得多,而且可以保存在較為便宜的數(shù)據(jù)載體或其它存儲(chǔ)裝置(例如計(jì)算機(jī)系統(tǒng))上,而它可能構(gòu)成依照本發(fā)明的試劑盒的一部分(即與微陣列相關(guān))。在直接法中,有可能的是數(shù)據(jù)載體的規(guī)模將大得多(例如計(jì)算機(jī)服務(wù)器),因?yàn)閷⒁4婧芏鄠€(gè)別語。通過將患者的表達(dá)譜與標(biāo)準(zhǔn)譜(間接法)和預(yù)先測(cè)定的群體統(tǒng)計(jì)變異進(jìn)行比較,還將可能給出有關(guān)患者的表達(dá)i普與上文所述"標(biāo)準(zhǔn)"規(guī)范譜是多么緊密匹配的"置信度數(shù)值(confidencevalue)"。該數(shù)值將為臨床醫(yī)師提供關(guān)于預(yù)后可信度和例如是否應(yīng)當(dāng)重復(fù)分析的有價(jià)值信息。如上所述還可能將患者的表達(dá)鐠保存在數(shù)據(jù)庫中,而且它們可以在任何時(shí)間用于更新數(shù)據(jù)庫。在第六個(gè)方面,本發(fā)明提供了用于鑒定在一組腫瘤中差異表達(dá)的一組基因的方法,其包括由這組多個(gè)腫瘤提供表達(dá)譜,將該譜根據(jù)腫瘤的分子亞型分類,并在亞型內(nèi)分析表達(dá)譜以鑒定出在該亞型內(nèi)差異表達(dá)的該組基因。該方法與van'tVeer等(10)的方法不同在于van'tVeer等方法中散發(fā)淋巴結(jié)陰性乳瘤的初步選擇涉及通過臨床評(píng)估的分型,而非分子水平的分型。當(dāng)然,本發(fā)明的這個(gè)方面和下述方面與上述方面密切相關(guān)。因此,文中另有明確要求。在本發(fā)明笫六個(gè)、第七個(gè)、和第八個(gè)方面的內(nèi)容中,術(shù)語"表達(dá)語"不限于預(yù)后組的基因。而它一般指基因在所迷組的胂瘤中的表達(dá)水平,包括(但不必只是)在分子亞型內(nèi)差異表達(dá)的基因的表達(dá)水平。由本發(fā)明第六個(gè)方面產(chǎn)生的差異表達(dá)組基因(下文稱為"區(qū)別組")可能對(duì)于所述組的腫瘤的特定表型或基因型是指示性的或特征性的。該方法優(yōu)選包括將區(qū)別組的差異表達(dá)與特定表型和/或基因型關(guān)聯(lián)起來的步驟。可以確定區(qū)別組在許多不同的但表型和/或基因型已知的樣品中的表達(dá)譜,以建立區(qū)別組的特定基因表達(dá)語與特定表型和/或基因型之間的關(guān)聯(lián)。差異表達(dá)對(duì)于作為肺瘤患者的治療或診斷的一部分的腫瘤的臨床參數(shù)或確定的醫(yī)學(xué)類型(例如預(yù)后的度量,諸如NPI值或NPI類型)可能是特征性的。區(qū)別組的差異表達(dá)可能容許將腫瘤樣品確定為至少兩種不同基因型或表型類別中的一種。本發(fā)明第六個(gè)方面的方法還可以包括確定來自患者的腫瘤樣品的類型的步驟,其中區(qū)別組基因的差異表達(dá)對(duì)于該類型是特征性的,所述步驟包括提供區(qū)別組在樣品中的表達(dá)水平,并根據(jù)該表達(dá)水平確定腫瘤類型。確定類型的步驟可以包括使用統(tǒng)計(jì)技術(shù),諸如但不限于加權(quán)表決(WeightedVoting)、支持矢量系統(tǒng)(SupportVectorMachines)、或分級(jí)聚類(HierarchicalClustering),正如上文所述。優(yōu)選的是,該方法包括使用亞型特異的區(qū)別組來鑒定腫瘤樣品的分子亞型的步驟。另外/或者,本發(fā)明第六個(gè)方面的方法可以包括確定區(qū)別組在腫瘤樣品中的表達(dá)水平,由該表達(dá)水平確定表達(dá)語,并將語加入數(shù)據(jù)庫的步驟。優(yōu)選的是,還鑒定了腫瘤樣品的分子亞型,并優(yōu)選加入數(shù)據(jù)庫。特定類型特征性的標(biāo)準(zhǔn)譜可以是來自已知類型的至少兩個(gè)表達(dá)譜,其中所述表達(dá)譜來自區(qū)別組的基因。該標(biāo)準(zhǔn)語優(yōu)選是對(duì)類型和分子亞型特異的。另外/或者,將已知類型(以及任選亞型)的表達(dá)傳加入數(shù)據(jù)庫。另外/或者,第六個(gè)方面的方法還可以包括在治療過程中檢查胂瘤類型變化的步驟。在一個(gè)實(shí)施方案中,提供了治療不同階段(例如治療開始時(shí)和治療結(jié)束時(shí))的表達(dá)鐠,并進(jìn)行比較以測(cè)定類型的變化,其中表達(dá)譜來自區(qū)別組基因的表達(dá)水平。優(yōu)選將該表達(dá)傳與標(biāo)準(zhǔn)和/或已知譜進(jìn)行比較以確定類型。根據(jù)分子亞型的分類優(yōu)選是使用諸如組織病理學(xué)(例如免疫學(xué))技術(shù)或直接測(cè)量腫瘤樣品中的基因表達(dá)產(chǎn)物水平的基因表達(dá)技術(shù)等技術(shù)進(jìn)行的。最優(yōu)選基因表達(dá)技術(shù)。然而,也可以采用能夠精確區(qū)別分子亞型的臨床技術(shù)。腫瘤優(yōu)選是乳瘤,且分子亞型優(yōu)選對(duì)應(yīng)于腫瘤的ER(雌激素受體)狀態(tài)(例如ER+)。然而,該方法可以應(yīng)用于其它腫瘤組(例如肺部腫瘤、卵巢腫瘤和淋巴瘤)和/或其它分子亞型(例如彌漫性大型B細(xì)胞淋巴瘤中的生發(fā)中樞樣和活化B細(xì)胞樣)。優(yōu)選的是,為了確定差異表達(dá)基因而對(duì)表達(dá)鐠類型的分析包括微陣列顯著性分析(significantanalysisofmicroarrays,SAM)(12),它鑒定其表達(dá)水平在所比較樣品之間顯著變化的基因。優(yōu)選的是,該分析涉及統(tǒng)計(jì)分析,例如使用加權(quán)表決、支持矢量系統(tǒng)和/或分級(jí)聚類(見下文關(guān)于這些技術(shù)的解釋)。在本發(fā)明的第七個(gè)方面,提供了通過本發(fā)明的第六個(gè)方面產(chǎn)生的一組基因。在本發(fā)明的第八個(gè)方面,提供了區(qū)別組在確定腫瘤樣品為特定類型中的用途。下面將參照附圖例示本發(fā)明的各個(gè)方面和實(shí)施方案。其它方面和實(shí)施方案對(duì)于本領(lǐng)域技術(shù)人員將是顯而易見的。將本文中提到的所有文件收入本文作為參考。圖l顯示了散發(fā)性乳瘤根據(jù)總體表達(dá)譜的聚類。a)使用展示最高基因表達(dá)差異的前376種基因?qū)?8個(gè)乳瘤的無監(jiān)督分級(jí)聚類;b)使用376種基因組(geneset)的主成分分析(Principalcomponentanalysis,PCA)。觀察到與a)相似的分子分組;c)使用SAM-409基因組(geneset)的樣品分級(jí)聚類,SAM-409基因組由在腫瘤亞型之間受到顯著調(diào)控的基因組成。在SAM-409基因組中大約三分之二的基因在ER+腫瘤中顯示表達(dá)升高。圖2顯示了與NPI相關(guān)的表達(dá)特征(NPI-ES)的鑒定a)使用移動(dòng)NPI閾值確定差異表達(dá)基因。在每個(gè)閾值(x軸)鑒定了顯示顯著差異表達(dá)的基因(y軸)。使用閾值4,給出了最高數(shù)目的差異調(diào)控基因;b)使用NPI-ES的ER+樣品的分級(jí)聚類。紅條指示低NPI的樣品(<4),藍(lán)條指示高NPI的樣品;c)使用NPI-ES的ER+腫瘤樣品的分類和預(yù)測(cè)置信度。將樣品根據(jù)它們的NPI值(X軸)分類。使用加權(quán)表決將樣品分類,并根據(jù)Golub等(13)計(jì)算每個(gè)樣品的預(yù)測(cè)強(qiáng)度(Y軸)。認(rèn)為預(yù)測(cè)強(qiáng)度〈0.3的樣品分類是"不確定的"或"低置信度的"(灰色區(qū)域)。圖3顯示了比較不同分類方案對(duì)ER+肺瘤的預(yù)后強(qiáng)度的KM存活分析。綠線代表(a)低NPI、(b)低NPIES表達(dá)水平、或(c)低"預(yù)后,,特征(PES)表達(dá)水平,而粉紅線代表高水平。(a)49個(gè)RosettaER+肺瘤,通過經(jīng)典NPI分成"好的,,預(yù)后(NPI<3.4)(35個(gè)腫瘤)和"中等"預(yù)后(NPI〉3.4)(14個(gè)腫瘤)組的;(b)相同的49個(gè)RosettaER+腫瘤,通過NPI-ES分成表達(dá)高(24個(gè)胂瘤)和低(25個(gè)腫瘤)水平NPI-ES的組;(c)相同的49個(gè)RosettaER+腫瘤,通過70種基因"預(yù)后,,特征分成"好的預(yù)后"組(27個(gè)腫瘤)和"差的預(yù)后"組(22個(gè)腫瘤);(d)46個(gè)StanfordER+腫瘤,通過NPI-ES分成表達(dá)高(13個(gè)腫瘤)和低(33個(gè)腫瘤)水平NPI-ES的組。圖S3顯示了基于所有腫瘤且不管亞型使用44種基因組對(duì)肺瘸沖早品的分類和預(yù)測(cè)置信度。圖S8顯示了Rosetta數(shù)據(jù)集的基因表達(dá)數(shù)據(jù)的分級(jí)聚類。頂部)展示腫瘤間相似性的樹形圖。彩色編碼條指示相應(yīng)基因特征的亞型。左邊)276種基因的完整簇,含3個(gè)不同的基因簇。注意,有些ERBB2腫瘤表現(xiàn)與ER+腫瘤分離(紅條),但是在嚴(yán)格檢查ERBB2+相關(guān)基因(密集圖的放大)的表達(dá)后鑒定為£1^82+。這是因?yàn)?1086"&微陣列具有的811+亞型相關(guān)基因的數(shù)目比ERBB2亞型多得多。圖S9顯示了RosettaER+樣品(49)才艮據(jù)NPI-ES表達(dá)水平的的分級(jí)聚類(在Rosetta的62種基因的數(shù)據(jù)中找到46個(gè)匹配)。彩色條的定義見圖2b。圖S10顯示了Stanford乳瘤的分級(jí)聚類。頂部)展示腫瘤間相似性的樹形圖。彩色編碼條指示相應(yīng)基因特征的亞型。左邊)136種基因的完整簇,含3個(gè)不同的基因簇。圖Sll顯示了使用NPI-ES的Stanford46個(gè)ER+樣品的分級(jí)聚類(62種基因中有31個(gè)匹配)。彩色條的定義見圖2b。圖S12顯示了ER-和ERBB2+分子亞型中NPI-ES表達(dá)與NPI狀態(tài)的關(guān)系。ER-和ERBB2腫瘤的NPI狀態(tài)通常高于ER+肺瘤。與ER+腫瘤的情況不同,我們未能對(duì)ER-和ERBB2+亞型鑒定出在高和低NPI腫瘤中受到差異調(diào)控的SAM基因。還有,NPI-ES似乎與NPI值也沒有關(guān)聯(lián),而NPI值與其它分子亞型是相關(guān)的。圖S13顯示了阿霉素治療(Perou等,2000)"之前,,和"之后"14周獲得的20對(duì)樣品。在20個(gè)"治療前"樣品中,10個(gè)樣品展示高水平的NPI-ES表達(dá)(H),IO個(gè)展示低水平的表達(dá)(L)。在前10個(gè)樣品中,6個(gè)在化療后維持高水平的表達(dá)(H->H,以紅色描繪),4個(gè)在治療后展示低水平的表達(dá)(H-〉L,以黃色描繪)。圖S14顯示了使用貢獻(xiàn)圖S13中20個(gè)樣品的患者制作的Kaplan-Meier無復(fù)發(fā)存活分析曲線。材料和方法乳房組織和臨床信息人乳房組織是在由NCCRepository和道德委員會(huì)得到相應(yīng)的批準(zhǔn)后由NCC組織庫獲得的。腫瘤狀態(tài)的組織學(xué)信息和雌激素受體(ER)和ERBB2免疫組化狀態(tài)是由新加坡綜合醫(yī)院病理科提供的(見臨床信息的補(bǔ)充信息)。樣品含有至少50%的腫瘤含量。如下計(jì)算NPI狀態(tài)腫瘤大小(cm)*0.2+級(jí)別+淋巴結(jié)點(diǎn)數(shù)(陰性淋巴結(jié)-l點(diǎn);l-3個(gè)陽性淋巴結(jié)=2點(diǎn);4個(gè)或更多陽性淋巴結(jié)=3點(diǎn))。因?yàn)镾tanford數(shù)據(jù)集中的腫瘤大小是使用CAT系統(tǒng)定義的,所以我們給每個(gè)CAT級(jí)別指派了一個(gè)近似值(即<formula>formulaseeoriginaldocumentpage29</formula>)。樣品制備和微陣列雜交使用Trizol試劑由組織提取RM,并且為了使用U133A基因芯片進(jìn)行Affymetrix基因芯片雜交依照制造商的指示進(jìn)行加工。數(shù)據(jù)加工和分析使用GenedataRefiner對(duì)原始的芯片掃描結(jié)果進(jìn)行質(zhì)量控制,并通過清除其表達(dá)在所有樣品中不存在的基因(即"A"call)進(jìn)行過濾。將表達(dá)值進(jìn)行l(wèi)og2轉(zhuǎn)化,并通過將每個(gè)樣品的所有剩余基因進(jìn)行中值集中(mediancentering)而進(jìn)行標(biāo)準(zhǔn)化。數(shù)據(jù)分析是使用GenedataExpressionist或常規(guī)電子數(shù)據(jù)表應(yīng)用軟件進(jìn)行的。無監(jiān)督數(shù)據(jù)集(圖1,a-b)包含在所有精確測(cè)量的樣品間顯示〉1.5的標(biāo)準(zhǔn)偏差(SD)的基因。用于基因選擇的變異濾器(variationfilter)的微弱變異也產(chǎn)生非常相似的結(jié)果(P.Tan,未發(fā)表的數(shù)據(jù))。清除分析中用于相同基因的探針副本,保留每種基因一種探針。使用CLUSTER進(jìn)行平均連鎖分級(jí)聚類(average-linkagehierarchicalclustering),并使用TREEVIEW顯示。執(zhí)行微陣列顯著性分析(SAM)(12)以鑒定受到差異調(diào)控的基因。圖lc的"假發(fā)現(xiàn)率"是O.1%,圖2的是15%。如Golub等(13)所述計(jì)算加權(quán)表決(WV)、排除一項(xiàng)檢查驗(yàn)證(L00CV)測(cè)定法和預(yù)測(cè)強(qiáng)度(PS)(補(bǔ)充信息)。使用SPSS生成Kaplan-Meier存活曲線,并使用對(duì)數(shù)-排序(log-rank)測(cè)試計(jì)算存活曲線差異的統(tǒng)計(jì)學(xué)顯著性。通過卡方分析(chi-squareanalysis)測(cè)定基因表達(dá)與臨床變量之間的統(tǒng)計(jì)學(xué)相關(guān)性。加權(quán)表決(WV)和排除一項(xiàng)交叉驗(yàn)證(L00CV)測(cè)定法的描述^農(nóng)^t^(^〃;加權(quán)表決算法采用信噪比(S2N)度量來進(jìn)行二元分類。給屬于預(yù)測(cè)物組的每種基因分派"選票",表述為待分類樣品中的基因表達(dá)水平與平均類型平均表達(dá)水平之間的加權(quán)差異。權(quán)重是使用如下相關(guān)度量確定的P(g,C)-------(n和cy表示基因在兩種類型的每一種中的表達(dá)水平的平均值和標(biāo)準(zhǔn)偏差)。確定特定類型的最終表決是通過將類型區(qū)別中所使用的每種基因的所有加權(quán)選票求和而計(jì)算出來的。"預(yù)測(cè)強(qiáng)度"(PS)定義為V勝—V敗PS=---------,v勝+v敗其中V勝和V敗分別指獲勝或失敗類型的總票數(shù)。PS反映了獲勝的相對(duì)幅度,從而定量反映了預(yù)測(cè)的確定性。橫/^一資it義發(fā)證"MCT入'我們使用標(biāo)準(zhǔn)的排除一項(xiàng)交叉驗(yàn)證(L00CV)方法來評(píng)估練習(xí)組(trainingset)的分類精確度。在L00CV中,首先將練習(xí)組的一個(gè)樣品"排除在外",并對(duì)剩余樣品進(jìn)行分類操作(例如基因選擇和分類練習(xí))。然后使用經(jīng)過訓(xùn)練的(trained)算法將"排除"的樣品分類,并對(duì)練習(xí)組的所有樣品重復(fù)這個(gè)過程。結(jié)果和討論使用無監(jiān)督聚類定義乳癌的分子亞型有人提出乳癌中顯著比例的內(nèi)在基因表達(dá)變異可能促成了屬于不同"分子亞型"的不同腫瘤(例如ER+和ER-腫瘤)(8-9,14)。在不管亞型處理腫瘤的最初分析中,我們未能信服的鑒定出與NPI有關(guān)的表達(dá)特征。我們假設(shè)這可能是因?yàn)閬喰烷g基因表達(dá)的顯著差異(亞型間差異)可能掩蓋了更加微妙的亞型內(nèi)變異(亞型內(nèi)差異)。為了繞開這個(gè)問題,我們執(zhí)行了這樣一種方法學(xué),其中作為獨(dú)立的數(shù)據(jù)集對(duì)待每種分子亞型。簡(jiǎn)而言之,首先使用多個(gè)無監(jiān)督聚類技術(shù)廣泛的將一組乳瘤表達(dá)鐠根據(jù)它們各自的"分子亞型"類別分開。然后,獨(dú)立分析每個(gè)亞型內(nèi)的腫瘤以確定可能與NPI或其組成元素有關(guān)的表達(dá)特征。我們使用AffymetrixUl33A基因芯片對(duì)來自我們當(dāng)?shù)刂饕袊?guó)患者群的98個(gè)散發(fā)乳瘤生成了表達(dá)譜。將數(shù)據(jù)標(biāo)準(zhǔn)化和預(yù)加工后,我們使用標(biāo)準(zhǔn)偏差濾器(filter)鑒定出在腫瘤系列間顯示高度基因表達(dá)變異的367種基因組,并使用該基因組通過無監(jiān)督分級(jí)聚類將肺瘤表達(dá)譜根據(jù)它們的總體相似性分組。乳瘤自我分成三個(gè)主要的亞組,分別稱為ER+、£11-和£1(882+(圖la)。這種分開型式通過主成分分析(PCA)得到了確認(rèn),PCA是一種獨(dú)立的分析技術(shù)(圖lb),它給出了高度相似的結(jié)果。為了有力的鑒定這些分組,我們使用SAM(12)來鑒定在亞型間差異表達(dá)的基因。在FDR("假發(fā)現(xiàn)率,,)為0.1%時(shí),我們鑒定出以亞型特異方式受到顯著調(diào)控的409種基因(圖lc)。表S5列出了通過SAM鑒定為在每種分子亞型(ER+、ER-、ERBB2+)中顯著調(diào)控的前50種基因?;虬凑账鼈兊腟2N相關(guān)比排序,這反映了在不同組間觀察到的表達(dá)擾動(dòng)的程度。這些基因與其它研究(8-ll)報(bào)告的相似列表之間具有很好的重疊。409種基因組中的大約69%在ER+亞組中顯示表達(dá)升高,包括雌激素受體基因ESR1和受雌激素調(diào)控的基因,諸如LIV1、TFF1和MYB(補(bǔ)充信息)。與其它研究一致的是,在這種亞型中也觀察到GATA3、HNF3a、膜聯(lián)蛋白A9和XBP1的高表達(dá)水平(8-9,11)。ER-亞組與基底乳房上皮標(biāo)志物(角蛋白5和17)、基底膜蛋白ladinin1、絲氨酸蛋白酶KLK5(已經(jīng)將其與差的疾病預(yù)后聯(lián)系起來(15))、和絲氨酸蛋白酶抑制物maspin(先前報(bào)告以ER相反方式表達(dá)的三苯氧胺可謙導(dǎo)的一種基因(16))的高表達(dá)有關(guān)。最后,ERBB2+亞型與ERBB2受體和與17q基因座物理連鎖的其它基因諸如GRB7和PMNT(14)的高表達(dá)水平有關(guān),說明存在DNA擴(kuò)增。然而,大多數(shù)在ERBB2+亞型中特異顯示表達(dá)升高的基團(tuán)未能限制于17q基因座,而是發(fā)現(xiàn)遍布基因組,諸如S100鈣結(jié)合家族的成員(S100A8、A9)??傊?,我們的結(jié)果驗(yàn)證和確認(rèn)了先前關(guān)于大多數(shù)乳瘤確實(shí)可以根據(jù)它們的總體基因表達(dá)譜細(xì)分成不同分子亞型的報(bào)告。ER+腫瘤中與NPI有關(guān)的預(yù)后組的鑒定我們把焦點(diǎn)集中在屬于ER+分子亞型的34個(gè)腫瘤,并試圖在該亞型內(nèi)鑒定出其表達(dá)可能與NPI狀態(tài)有關(guān)的基因。經(jīng)典的是,通常將乳癌患者根據(jù)NPI分成3個(gè)主要的組"好的"預(yù)后(NPI<3.4),"中等"預(yù)后(NPI3.4-5.4),和"差的"預(yù)后(NPD5.4)(2)??赡芊从沉瞬煌u(píng)分病理學(xué)家間可變性的影響,其它研究提出了定義這些組的截止值的略微不同數(shù)值(17)。為了在確定適當(dāng)?shù)腘PI截止值時(shí)避免任何潛在偏差,我們進(jìn)行了移動(dòng)閾值分析,其中將ER+腫瘤根據(jù)NPI閾值分成一系列二元組,而NPI閾值由2.3穩(wěn)步升高至7.8。在每個(gè)閾值,鑒定在兩個(gè)組之間顯示顯著表達(dá)變異的基因。我們發(fā)現(xiàn),使用NPI截止值3.8-4.6得到了62種差異表達(dá)基因的基因組(圖2a),其中大多數(shù)在高肝1的£11+樣品中顯示升高的表達(dá)(圖2b)。我們將這62個(gè)成員的基因組稱為"NPI表達(dá)特征,,或NPI-ES,并顯示于表S6。屬于NPI表達(dá)特征的基因與牽涉瘤發(fā)生的廣泛細(xì)胞功能有關(guān),包括DNA復(fù)制和細(xì)胞分裂(APRT、MCM4、KNSL1、CDC2)、細(xì)胞信號(hào)(趨化因子配體l、Met、ShC)、凋亡(生存蛋白(survivin)、CD27結(jié)合蛋白)、和細(xì)胞粘附(復(fù)盤,大同系物7、tetraspanl)。在個(gè)別NPI成分(腫瘤大小、腫瘤等級(jí)、淋巴結(jié)狀態(tài))中,腫瘤等級(jí)似乎代表了NPI-ES的分子組成的主要貢獻(xiàn)者(補(bǔ)充信息)。腫瘤通過NPI-ES的分類限定了兩個(gè)獨(dú)立(discrete)的分子組有人提出分子謙用于腫瘤分類的一項(xiàng)優(yōu)勢(shì)是將分類的置信度水平在數(shù)學(xué)上量化的能力(11),這在分類影響后續(xù)治療過程的情況中特別重要。在這種情況中,主治醫(yī)師就能夠針對(duì)特定干預(yù)的潛在發(fā)病率權(quán)衡預(yù)測(cè)的置信度。注意,雖然在我們的數(shù)據(jù)集中ER+樣品與連續(xù)的經(jīng)典NPI數(shù)值范圍(2-8)有關(guān),但是使用NPI-£3進(jìn)行的聚類分析似乎將£1(+腫瘤分成兩個(gè)獨(dú)立的組(圖2b),這提出了根據(jù)組織病理學(xué)參數(shù)顯示連續(xù)數(shù)值的樣品可能在分子水平分成獨(dú)立類別的可能性。為了更好的確定NPI-ES信服的區(qū)別顯兩種類型的能力,我們使用加權(quán)表決(13),即一種監(jiān)督學(xué)習(xí)算法來鑒別展示高和低表達(dá)的NPI-ES的腫瘤,并使用已經(jīng)建立的排除一項(xiàng)交叉驗(yàn)證(L00CV)測(cè)定法測(cè)試練習(xí)后的算法的分類精確度。除了分類精確度以外,還如Golub等(13)所述計(jì)算了定量度量(預(yù)測(cè)強(qiáng)度,PS)以提供預(yù)測(cè)置信度的評(píng)估(圖2c)。WV分析揭示了NPI-ES給出的L00CV分類精確度是91。/。,有3個(gè)錯(cuò)誤分類。在錯(cuò)誤分類的這3個(gè)樣品中,2個(gè)與低預(yù)測(cè)強(qiáng)度(PS<0.3)有關(guān),從而代表"低置信度"或"不確定"分類。事實(shí)上,在與"高置信度,,(PS>0.3)分類有關(guān)的29個(gè)(總數(shù)"個(gè))ER+腫瘤中,只有一個(gè)樣品是錯(cuò)誤分類的。這些結(jié)果說明NPI-ES可用于將我們數(shù)據(jù)集中大多數(shù)ER+腫瘤以高置信度分成獨(dú)立的組。使用所有腫瘤不管亞型產(chǎn)生NPI表達(dá)特征我們使用兩步法限定了NPI-ES。首先,使用無監(jiān)督聚類將腫瘤依照它們各自的"分子亞型,,(即ER+、ER-、ERBB2+)聚簇。對(duì)每個(gè)亞型內(nèi)的肺瘤分析可能與NPI有關(guān)的表達(dá)特征。在這里,我們顯示了進(jìn)行第一步(定義截然不同的分子亞型)在鑒定NPI-ES中是重要的。不管分子亞型我們收集了由所有79個(gè)腫瘤組成的數(shù)據(jù)集,并如上所述進(jìn)行移動(dòng)NPI閾值分析以定義"恰當(dāng)"的NPI閾值(見圖2a)。我們發(fā)現(xiàn)使用NPI閾值4得到了總共44種差異表達(dá)的基因。在這44種基因組中,16種(35%)也屬于NPI-ES(它們衍生自ER+樣品)。我們使用加權(quán)表決(WV)和排除一項(xiàng)交叉驗(yàn)證(L00CV)測(cè)定法評(píng)估了這44種基因組信服的將腫瘤樣品分為獨(dú)立組的能力。由圖S3可以看出,低置信度(PS〈0.3,紅色區(qū)域)樣品的數(shù)目以及錯(cuò)誤分類率(對(duì)于44種基因組是9%)與圖2c相比都顯著升高。這一結(jié)果指示基于所有79個(gè)腫瘤,該44種基因組在預(yù)測(cè)腫瘤NPI狀態(tài)時(shí)不如NPI-ES對(duì)ER+腫瘤有效。在圖S3,將樣品根據(jù)它們的NPI值(X軸)分類。使用加權(quán)表決進(jìn)行樣品分類,并根據(jù)Golub等(13)計(jì)算每個(gè)樣品的預(yù)測(cè)強(qiáng)度(Y軸)。認(rèn)為預(yù)測(cè)強(qiáng)度〈0.3的樣品分類是"不確定的"或"低置信度的"(灰色區(qū)域)。與圖2c相比觀察到了更大數(shù)目的"不確定"(低PS)樣品和錯(cuò)誤分類。不管亞型由所有腫瘤衍生的44種基因組不如NPI-ES在對(duì)獨(dú)立數(shù)據(jù)集預(yù)測(cè)NPI狀態(tài)時(shí)有效。使用Rosetta數(shù)據(jù)集作為盲測(cè)集,我們對(duì)在Rosetta數(shù)據(jù)集中的49個(gè)ER+腫瘤運(yùn)用44基因組,并使用Student'st檢驗(yàn)來確定表達(dá)高水平的44種基因組和具有高NPI的ER+腫瘤之間的關(guān)聯(lián)顯著性。我們對(duì)44種基因組得到的p值是0.29,其顯著性比NPI-ES的p值O.0004低得多。有趣的是,盡管衍生自對(duì)ER+腫瘤的分析,NPI-ES要優(yōu)于44種基因組,甚至在應(yīng)用于Rosetta數(shù)據(jù)集中的所有78個(gè)腫瘤時(shí)。為了證明這一點(diǎn),將78個(gè)Rosetta腫瘤分成NPK3.4(好的預(yù)后)和NPI〉3.4(中等預(yù)后)的兩組。然后使用加權(quán)表決將Rosetta腫瘤根據(jù)NPI-ES或44種基因組分類。由表S3可以看出,NPI-ES給出的分類精確度是80。/。,與之相比44種基因組給出的分類精確度是70%。與組織學(xué)等級(jí)(1和2對(duì)3)有關(guān)的基因因?yàn)榻?jīng)典的NPI是由腫瘤等級(jí)、腫瘤大小、和淋巴結(jié)狀態(tài)衍生的復(fù)合度量,所以我們定義了這些元素中每一個(gè)對(duì)NPI-ES分子組成的貢獻(xiàn)。在使用SAM鑒定與三個(gè)組織病理學(xué)變量有關(guān)的基因時(shí),我們未能信服的鑒定出其表達(dá)與腫瘤大小或淋巴結(jié)狀態(tài)顯著相關(guān)的基因。相反,在組織學(xué)等級(jí)的情況中,發(fā)現(xiàn)大量的基因在1或2級(jí)與3級(jí)腫瘤之間差異表達(dá),而且這個(gè)等級(jí)相關(guān)基因組中的基因與NPI-ES充分重疊(66。/。)(表S6)。這些結(jié)杲說明顯示不同組織學(xué)等級(jí)的腫瘤可能在生物學(xué)上是不同的,而且腫瘤等級(jí)是NPI表達(dá)特征的關(guān)鍵貢獻(xiàn)者,而其余兩個(gè)參數(shù)(腫瘤大小和淋巴結(jié)狀態(tài))給出相對(duì)較低的貢獻(xiàn)。NPI-ES在多個(gè)獨(dú)立乳癌表達(dá)數(shù)據(jù)集間的應(yīng)用為了測(cè)試NPI-ES在一系列盲"測(cè)試組"中預(yù)測(cè)NPI狀態(tài)和疾病預(yù)后二者的能力,我們使用公眾可獲得的兩個(gè)獨(dú)立乳癌數(shù)據(jù)集。第一個(gè)數(shù)據(jù)集(稱為Stanford數(shù)據(jù)集)由使用基于寡核苷酸的微陣列描繪(profiled)的78個(gè)淋巴結(jié)陰性乳瘤組成,而且還包含每位患者的"無病存活"(DFS)持續(xù)時(shí)間(由最初診斷出腫瘤至出現(xiàn)新的遠(yuǎn)程轉(zhuǎn)移的時(shí)間)(10)。重要的是,先前的幾項(xiàng)研究顯示NPI甚至在淋巴結(jié)陰性乳癌中也是預(yù)后值(18,19)。第二個(gè)數(shù)據(jù)集由使用cDNA微陣列描繪(profiled)的78個(gè)乳癌組成,還包含總體患者存活信息(稱為Stanford數(shù)據(jù)集)(14)。獲得了這些數(shù)據(jù)集容許我們獨(dú)立測(cè)試NPI-ES的預(yù)測(cè)能力,因?yàn)镽osetta和Stanford數(shù)據(jù)集在多個(gè)方面與我們的數(shù)據(jù)集有所不同,包括I)患者群;II)樣品操作方案;III)評(píng)分的病理學(xué)家;和IV)陣列技術(shù)和探針組的選擇(Rosetta和Stanford數(shù)據(jù)集中是雙色,而我們的數(shù)據(jù)集中是單色)。^"〃3#乙痛炎拔桌,在通過SAM分析鑒定出的限定ER+、ER-、和ERBB2+亞型的409種基因中,276種基因(67。/。)也存在于Rosetta微陣列中。我們將此基因組應(yīng)用于78個(gè)Rosetta腫瘤譜,并鑒定出屬于£11+分子亞型的"個(gè)腫瘤,確定了在屬于NPIES的62種基因中有46種也存在于Rosetta微陣列中。因?yàn)镽osetta數(shù)據(jù)集是以與我們不同的陣列技術(shù)為基礎(chǔ)的,所以不可能直接將訓(xùn)練后的以我們的數(shù)據(jù)集開發(fā)的加權(quán)表決模型直接用于將Rosetta腫瘤分類。然而,依照Ramaswamy等(20)中描述的用于比較不同陣列技術(shù)間基因組的策略,我們使用重疊NPI-ES集的46種基因通過分級(jí)聚類將49個(gè)ER+Rosetta腫瘤分組。聚類分析將49個(gè)£11+Rosetta腫瘤分成2組,分別由24個(gè)和25個(gè)顯示"高"和"低"表達(dá)水平的NPI-ES的腫瘤組成(見圖S9)。我們比較了這兩個(gè)亞組中的腫瘤以確定它們是否與它們的NPI值差異有關(guān)。使用兩種不同的統(tǒng)計(jì)方法,或是將腫瘤NPI值看作一個(gè)連續(xù)梯度(Student'st檢驗(yàn))或是將其看作兩個(gè)獨(dú)立的組(卡方分析,使用經(jīng)典的NPI截止值3.4),與表達(dá)低水平NPI-ES的腫瘤相比,顯示高表達(dá)NPI-ES的腫瘤一致展示顯著更高的NPI值(連續(xù)分析的p—.0004,二元分析的P-O.0087)(表la)。這項(xiàng)分析指示甚至在通過不同陣列技術(shù)產(chǎn)生的獨(dú)立數(shù)據(jù)集中,NPI-ES的表達(dá)在ER+腫瘤中與經(jīng)典NPI狀態(tài)顯著相關(guān)。為了比較NPI-ES和經(jīng)典NPI分段系統(tǒng)的預(yù)后能力,進(jìn)行了優(yōu)勢(shì)比(odds-ratio)計(jì)算(表lb)。與表達(dá)低水平NPI-ES的ER+腫瘤相比,具有表達(dá)高水平NPI-ES的ER+腫瘤的患者在五年內(nèi)遠(yuǎn)程轉(zhuǎn)移的優(yōu)勢(shì)比是10.3(95%CI2.4-44.0,p<0.001)。比較而言,與NPI指數(shù)〈3.4("好的"預(yù)后)的ER+腫瘤相比,具有經(jīng)典NPI指數(shù)〉3.4("中等"預(yù)后)的ER+肺瘤的患者具有較低的遠(yuǎn)程轉(zhuǎn)移優(yōu)勢(shì)比6.1(95%CI1.6_23.4,p=0.06)。我們還使用Kaplan-Meier存活分析比較了NPI-ES和NPI的預(yù)后性能(圖3)。與其它研究一致,與具有較高NPI(>3.O的患者相比,具有低NPI(〈3.4)腫瘤的患者展示更好的DFS(p-0.007,圖3a)。在通過NPI-ES將相同群體分組時(shí),與具有低水平表達(dá)NPI-ES的腫瘤的患者相比,具有顯示高表達(dá)NPI-ES的腫瘤的患者顯示更好的無復(fù)發(fā)存活(p=0.0007)??傊?,這些數(shù)據(jù)說明對(duì)于ER+腫瘤而言,NPI表達(dá)特征的預(yù)后能力可能優(yōu)于經(jīng)典NPI分段系統(tǒng)。5Yai7/orcT炎^桌;使用相似方法以Stanford數(shù)據(jù)集測(cè)試NPI-ES(見圖SIO)。在用于限定ER+、ER-、和ERBB2+亞型的SAM-409基因組中,136種基因存在于Stanford微陣列上(http:〃genome-www5.Stanford.edu/MicroArray/SMD/),而且使用這些基因?qū)tanford腫瘤聚類,鑒定出屬于ER+分子亞型的46個(gè)腫瘤(由棄掉正常樣腫瘤亞組的6個(gè)腫瘤后的72個(gè)腫瘤,所述亞組可能是由于存在污染性非惡性組織)。然后使用NPI-ES(在Stanford微陣列上31個(gè)匹配)將這46個(gè)腫瘤聚類(見圖S11)成"高NPI-ES"(13個(gè)胂瘤)和"低NPI-ES"組(33個(gè)腫瘤)。Student'st檢驗(yàn)再次揭示了高和低表達(dá)NPI-ES亞組與經(jīng)典NPI狀態(tài)之間的顯著關(guān)聯(lián)(P=0.001)(表la)。另外,KM存活分析也證明了具有低NPI-ES表達(dá)腫瘤的患者相對(duì)于具有高NPI-ES表達(dá)腫瘤的患者的顯著(p=0.0493)總體存活優(yōu)勢(shì)(圖3d)。有趣的是,表達(dá)高水平NPI-ES的ER+腫瘤與Sorlie等(14)中鑒定的"LuminalC"分子亞型之間似乎存在強(qiáng)大相關(guān)性,盡管屬于NPI-ES的62種基因都沒有報(bào)告在后者中表達(dá)。有趣的是,Sorlie等(14)先前報(bào)告了根據(jù)500種基因的"內(nèi)在,,集鑒定"LuminalC"亞型。"LuminalC,,肺瘤與表達(dá)高水平NPI-ES的腫瘤之間似乎存在強(qiáng)大重疊(96%),盡管如上所述沒有在此"內(nèi)在"集中發(fā)現(xiàn)屬于NPI-ES的所有62種基因。這列于Sll。NPI-ES的預(yù)后能力與先前描迷的關(guān)于乳癌"預(yù)后特征"相當(dāng)在VanVeer等(10)的相同研究中,作者還鑒定了預(yù)測(cè)乳瘤DFS狀態(tài)的70種基因的"預(yù)后,,表達(dá)特征(PES)。有趣的是,屬于NPI-ES和PES的基因存在極小重疊,在兩組基因間只發(fā)現(xiàn)一種共有基因。為了比較NPI-ES和PES對(duì)RosettaER+腫瘤的預(yù)后性能,我們使用KM存活分析來比較通過NPI-ES(圖3b)或PES(圖3c)分類的患者的DFS。在PES(p=0.0001)中觀察到比NPI-ES(p=0.0007)略好的性能。然而,與PES有關(guān)的稍微的改善并未出乎意料,因?yàn)镻ES的鑒定是直接以這些相同腫瘤的表達(dá)謙和臨床信息為基礎(chǔ)的。因此,Rosetta腫瘤對(duì)PES而言不是"盲"的,而在NPI-ES的情況中,Rosetta腫瘤代表了完全獨(dú)立的測(cè)試組。事實(shí)上,在將PES和NPI-ES應(yīng)用于StanfordER+腫瘤時(shí),兩種分子特征對(duì)5年內(nèi)復(fù)發(fā)給出了高度相似的優(yōu)勢(shì)比(PES的3.9對(duì)NPI-ES的4.17)(表lc)。由此,這些結(jié)果說明NPI-ES和PES的預(yù)后能力比較相當(dāng)。NPI-ES分子特征的表達(dá)預(yù)測(cè)化療響應(yīng)在這些分析中,我們檢驗(yàn)了化療前后成對(duì)乳瘤樣品的NPI-ES分子特征的表達(dá),并將這種特征的表達(dá)與最終的臨床響應(yīng)聯(lián)系起來。采用的是公眾可獲得的乳癌數(shù)據(jù)集("Stanford"),由阿霉素治療"之前"和"之后"14周獲得的20對(duì)樣品組成(8)。在NPI-ES的62種基因中,31種基因也存在于Stanford微陣列上,并且檢驗(yàn)了這31種基因組在成對(duì)樣品中的表達(dá)。在20個(gè)"治療前"樣品中,10個(gè)樣品顯示高水平的NPI-ES表達(dá)(H),IO個(gè)顯示低水平的表達(dá)(L)。如圖S13所示,在前10個(gè)樣品中,6個(gè)在化療后維持高水平的表達(dá)(H-〉H,以紅色描繪),4個(gè)在治療后展示低水平的表達(dá)(H-〉L,以黃色描繪)。然后將每個(gè)組的死亡數(shù)目(5年后)列表,正如表S12所示。然后進(jìn)行了Kaplan-Meier無復(fù)發(fā)存活分析,并顯示于圖S14。我們發(fā)現(xiàn),與其它組相比,"H->L"腫瘤具有最好的存活結(jié)果(p=0.022),而"H->H"肺瘤具有較差的預(yù)后。這個(gè)結(jié)果說明NPI-ES在高表達(dá)NPI-ES腫瘤中的下調(diào)可以看作是化療響應(yīng)的標(biāo)志??傊?,我們鑒定出62種基因的表達(dá)特征,可以潛在發(fā)揮NPI分子替代品的功能。通過顯示NPI-ES能夠?qū)τ刹煌行纳傻膬蓚€(gè)獨(dú)立腫瘤組預(yù)測(cè)NPI狀態(tài)和疾病預(yù)后,得到了它的可靠性的置信度。由這項(xiàng)研究顯現(xiàn)的一個(gè)有趣的概念是,在組織病理學(xué)水平顯示表觀連續(xù)變量的樣品卻可能可以在分子水平分成獨(dú)立類別。這可能解決了癌癥組織病理學(xué)中的一個(gè)主要挑戰(zhàn),即當(dāng)評(píng)估的參數(shù)具有連續(xù)特性時(shí)難以限定臨床上恰當(dāng)?shù)慕刂怪?。我們承認(rèn)在充分評(píng)估NPI-ES的臨床效用前還有較多工作需要做。首先,NPI-ES的預(yù)測(cè)能力顯然需要對(duì)更大的腫瘤組進(jìn)行檢驗(yàn)。其次,盡管我們已經(jīng)證明了NPI-ES在ER+分子亞型中的適用性,然而NPI-ES的表達(dá)與其它分子亞型(ER-、ERBB2+)有關(guān)的NPI值似乎沒有同樣的相關(guān)性(補(bǔ)充信息)。樣品數(shù)據(jù)表S14顯示了不同NPI值樣品間預(yù)后組(或NPI-ES)基因的表達(dá)數(shù)據(jù)。該數(shù)據(jù)對(duì)于AffymetrixUl33A基因芯片是特異的,而且已經(jīng)進(jìn)行了數(shù)據(jù)預(yù)加工。預(yù)后組的基因表達(dá)語可以作為練習(xí)數(shù)據(jù)用于構(gòu)建預(yù)測(cè)模型(例如WV和SVM),然后可以確定未知腫瘤的NPI類型。數(shù)據(jù)以制表符為界,而且具有如下格式列第1列預(yù)后組基因的探針I(yè)D第2列基因名稱第3列和其它列基因表達(dá)數(shù)據(jù)行第1行樣品Id(35份樣品)第2行NPI指數(shù)第3行和其它行基因表達(dá)數(shù)據(jù)基因表達(dá)數(shù)據(jù)是如"樣品制備和微陣列雜交,,和"數(shù)據(jù)預(yù)加工"(見材料和方法部分)中所述產(chǎn)生的。具體而言,使用用于測(cè)量微陣列的儀器(通常是微陣列掃描儀,例如Affymetrix)計(jì)算原始基因表達(dá)數(shù)據(jù)數(shù)值。表S15顯示了每種類型的每種預(yù)后組基因在進(jìn)行加權(quán)表決算法時(shí)所使用的平均值(ja)和標(biāo)準(zhǔn)偏差((J)參數(shù)。給予一組預(yù)后組中基因的表達(dá)水平,這些數(shù)據(jù)可用于確定未知乳瘤樣品的預(yù)后。該數(shù)據(jù)對(duì)于加權(quán)表決技術(shù)特異,這種技術(shù)應(yīng)用于來自AffymetrixU133A基因芯片的表達(dá)數(shù)據(jù)。參考文獻(xiàn)1.Elston,C.W.andI.0.Ellis.Pathologicalprognosticfactorsinbreastcancer:I.Thevalueofhistologicalgradeinbreast.cancer-Experiencefromalargestudywithlong-termfollow-up-Histopathology19,403-410,1991-2.Galea,M.H.,R.W.Blarney,C.W.Elston,andI.O.Ellis.TheMottinghamPrognosticIndexinprimarybreastcancer.BreastCancerResTreat.22,207-219,1992.3..Ellis,I.O.,.M.Galea,N.Broughton,A.Lockei:,R.W.Blarney,andC.W.Elston.Pathologicalprognosticfactorsinbreastcancer.II.Histologicaltype.Relationshipwithsurvivalinalargestudywithlong-termfollow-up.Histopathology479-489,1992.4.Balslev,I.,K.Axelsson,K.Zedeler,B.B.Ramussen,B.Cars仁ensen,andH.T.Mouridsen.TheNottinghamPrognosticIndexappliedto9,419patientsfromthestudiesoftheDanishBreastCancerCooperativeGroup(DBCG).BreastCancerRes.Treat.32,281-290,1994.5.Sauerbrei,W.,K.Hubner,C.Schmoor,andM.Schumacher.Validationofexistinganddevelopmentofnewprognosticclassificationschemesinnodenegativebreastcancer.BreastCancerRes.Treat.42,149-163,1997.G,Gilchrist,K.W.,L.Kalish,V.E.Gould,S.Hirschl,J.E.Imbriglia,W.M.Levy,A.S.Patchefsky,D.W.Penner,J.Pickren,J.A.Roth,ande.al.InterobserverreproducibilityofhistopathologicalfeaturesinstageIIbreastcancer.AnECOGstudy.BreastCancerRes.Treat-5,3-10,198S.7.Buettner,P.,C.Garbe,andGuggenmoos-Holzmann.Problemsindefiningcutoffpointsofcontinuousprognosticfactors:Exampleoftumourthicknessinprimarycutaneousmelanoma.JClin.Epidemiology50,1201-1210,1997.8.Perou,C.M.,T.Sorlie,M.B.Eisen,v.d.R.M.,S.S.Jeffrey,C.A.Rees,J.R.Pollack,D.T.Ross,H.Johnsen,L.A.Akslen,O.Fluge,A.Pergamenschikov,C.Williams,S.X.Zhu,P.E.Lonning,A.L.Borresen-Dale,P.Q-Brown,andD.Botstein.MolecularPortraitsofHumanBreastTumours.Nature406,747-752,2000.9.Gruvberger,S.,M.Ringner,Y.Chen,S.Panavally,L.H.Saal,A.Borg,M.Ferno,C.Peterson,andP.Meltzer.EstrogenReceptorStatusinBreastCancerisAssociatedwithRemarkablyDistinctGeneExpressionPatterns.CancerResearch61,5979-5984,2001.10.van'tVeer,L.J.,H.Dai,M.J.vandeVijver,Y.D.He,A.A.M.Hart,M.Mao,H.L.Peterse,K.vanderKooy,M-J.Mar.ton,A.T.Witteveen,G.J.Schreiber,R.M.Kerkhoven,C.Roberts,P.S.Liinsley,R.Bernards,andS.H.Friend.Geneexpressionprofilingpredictsclinicaloutcomeofbreastcancer.Nature415,530-536,2002.11.West,M.,C.Blanchette,H.Dressman,E.Huang,S-Ishida,R.Spang,H..Zuzan,J.A.J.Olson,J.R.Marks,andJ.R.Nevins.Predictingtheclinicalstatusofhumanbreastcancerbyusinggeneexpressionprofiles.ProcNatlAcadSci98,11462-11467,2001.12.Tusher,V.G.,R.Tibshirani,andG.Chu.Significanceanalysisofmicroarraysappliedtotheionizingradiationresponse.ProcNatlAcadSci98,5116-5121,2001.13.Golub,T.R.,D.K.Slonim,P.Tamayo,C.Huard,J.P.Gaasenbeek,H.Coller,M.L.Loh,J.R.Downling,M.A.Caligiuri,C.D.Bloornfield,andE.S.MolecularClassificationofCancer:ClassDiscoveryandClassPredictionbyGeneExpressionMonitoring.Science286,531-537,r999.14.Sorlie,T.,C.M.Perou,R.Tibshirani,T.Aas,S.Geisler,H.Johnsen,T.Hastie,M.B.Eisen,.M.vandeRijn,S.S.Jeffrey,T.Thorsen,H.Quist,J.C.Matese,P.O.Brown,D.Botsteiri,P.E.Lonning,andA.Borresen-Dale.GeneExpressionPatternsofBreastCaxcinotnasDistinguishTumourSubclasseswithClinicalImplications.Proc.Natl.Acad.Sci.98,10879-10874,2001.15.Yousef,G.M.,A.Scorilas,L.G.Kyxiakopoulou,L..Rendl,M.Diamandis,R.Ponzone,N.Biglia,M.Giai,R.,Roagna,P.Sismondi,andE.P.Diamandis.Humankallikreingene5(KliK5).expressionbyquantitativePCR:anindependentindicatorofpoorprognosisinbrreastcancer.ClinChem48,1241-12S0,2002.16.Martin,K.J.,B.M.Kritzman,L.M.Price,B.Koh,C.P-Kwan,X.Zhang,A.Mackay,M.J.O'Hare,C.Kaelin,G.L.Mutter,A.B.Pardee,andR.Sager.Linkinggeneexpressionpatteirristotherapeuticgroupsinbreast,cancer.CancerRes.,60,2232-223B,2000.17.Sundquist,M.,S.Thorstenson,L.Brudin,andB.■Nordenskjold.ApplyingtheNottinghamPrognosticIndextoaSwedishbreastcancerpopulation.BreastCancerResTreat53,1-8,1999.18.Barbareschi,M.,O.Caffo,S.Veronese,R.D.Leek,P.Fina,S.Fox,M.Bonzanini,S.Girlando,L-Morelli,C.Eccher,F.Pezzella,C.Doglioni,P-DallaPalma,andA.Harris.Bcl、2andp53expressioninnode-negativebreastcarcinoma:astudywithlong-termfollow-up.Hum.Pathol.27,1149-1155,1996.19.Frkovic-Grazio,S.andM.Bracko.LongtermprognosticvalueofNottinghamhistologicalgradeanditscomponentsinearly(pTINOMO)breastcarcinoma.JClinPathol55,88-92,2002.20.Raoiaswamy,S.,K.N.Ross,E.S.Lander,andT.R.Golub.Amolecularsignatureofmetastasisinprimarysolidtumours.NatGenet33,49-54,2003.21.Travassoli,#.A.andSchnittS.J.(1992)Pathologyof.theBreastIia.(Elsevier)22.EisenMB,SpelltnanPT,BrownPO,BotsteinD.(1998)Clusteranalysisanddisplayofgenome-wideexpressionpatterns.ProcNatlAcadSciUSA.95(25),"863-14868.表la)<table>tableseeoriginaldocumentpage44</column></row><table>*括號(hào)中的數(shù)值代表樣品數(shù)目。表lb)根據(jù)經(jīng)典NPI分段和NPI-ES表達(dá)得出的RosettaER+腫瘤五年內(nèi)遠(yuǎn)程轉(zhuǎn)移作為首次事件的優(yōu)勢(shì)比(oddsratio)<table>tableseeoriginaldocumentpage44</column></row><table>*優(yōu)勢(shì)比是使用標(biāo)準(zhǔn)2x2表計(jì)算的。CI代表"置信區(qū)間"。表lc)才艮據(jù)PES表達(dá)和NPI-ES表達(dá)得出的StanfordER+胂瘸五年內(nèi)復(fù)發(fā)作為首次事件的優(yōu)勢(shì)比。有一個(gè)樣品沒有復(fù)發(fā)信息,因而排除在分析之外(剩下45個(gè)ER+腫瘤)。<table>tableseeoriginaldocumentpage45</column></row><table>表S1:乳瘤的組織病理學(xué)年齡大小等級(jí)結(jié)NPIERPR亞型LVIDCIS(mm)ER+200022052609802786440200059757402000609627020020071582820020160861202000787576020008185210200200513850200200567120980197553098026160159803915620200076839402000779485599012354552000422516320006837235200077551252000804394098034652209803836430990082493498017775269801786932980403733098043473309900756625990113709099010750409802084225980220403798022133659903753815ER_9801934925980216654598025646369802854940980338553098035358459804116930980441663099017455452000320672020005004475334個(gè)中的30個(gè)320個(gè)中的14個(gè)212個(gè)中的0個(gè)217個(gè)中的17個(gè)316個(gè)中的0個(gè)310個(gè)中的0個(gè)39個(gè)中的0個(gè)211個(gè)中的0個(gè)325個(gè)中的1個(gè)117個(gè)中的2個(gè)34個(gè)中的2個(gè)29個(gè)中的0個(gè)27個(gè)中的0個(gè)317個(gè)中的0個(gè)314個(gè)中的0個(gè)311個(gè)中的7個(gè)37個(gè)中的3個(gè)217個(gè)中的0個(gè)212個(gè)中的0個(gè)321個(gè)中的5個(gè)34個(gè)中的0個(gè)216個(gè)中的0個(gè)216個(gè)中的3個(gè)213個(gè)中的6個(gè)315個(gè)中的2個(gè)39個(gè)中的0個(gè)316個(gè)中的0個(gè)321個(gè)中的5個(gè)315個(gè)中的11個(gè)118個(gè)中的1個(gè)320個(gè)中的5個(gè)25個(gè)中的0個(gè)313個(gè)中的1個(gè)110個(gè)中的0個(gè)323個(gè)中的3個(gè)220個(gè)中的5個(gè)312個(gè)中的1個(gè)37個(gè)中的1個(gè)37個(gè)中的0個(gè)325個(gè)中的0個(gè)29個(gè)中的0個(gè)314個(gè)中的4個(gè)224個(gè)中的3個(gè)321個(gè)中的20個(gè)36個(gè)中的6個(gè)7.2陽性陰性6.8陽性陰性3.8陽性陰性6.4陽性陽性4.56陽性陽性6.4陽性陽性5.2陽性陽性3.2陽性陰性6陽性陽性3.4陽性陰性5.6陽性陽性3.3陽性陰性3.4陽性陽性4.8陽性陽性5.1陽性陰性7.1陽性陽性6.26陽性陽性3.7陽性陽性3.5陽性陰性6.8陽性陽性4.4陽性陽性3.6陽性陽性4.68陽性陽性5.52陽性陽性5.74陽性陰性4.6陽性陽性4.6陽性陽性6.5陽性陽性7.8陽性陽性3.8陽性陰性6.5陽性陽性3.74陽性陽性6.3陽性陽性2.3陽性陰性5.5陰性陰性5.9陰性陰性5.72陰性陰性5.8陰性陰性4.6陰性陰性4.9陰性陰性3.6陰性陰性6.6陰性陰性5.9陰性陰性6.4陰性陰性7.5陰性陰性5^i無無無無l無i.^.i無.^無無^i.^^.^.i^無.^^.^無ll無l無r能6;c.ft"是是可是否否是否否否是否否否否否否否否是可否否是否可否是否是否是否否極無無極無無無無極無無否否否是否否否是是是是的混葉移管h管管管小管管管管管管管管管管管管管管管管管管管管管管管5管管管管管管管管管轉(zhuǎn)管管管管*這個(gè)表包含這項(xiàng)研究中所使用的98個(gè)腫瘤中79個(gè)的臨床信息。其余19個(gè)腫瘤的臨床信息是不完整的,沒有包含在這個(gè)表中。只將具有完整臨床信息的79個(gè)腫瘤用于隨后NPI-ES分析。<table>tableseeoriginaldocumentpage47</column></row><table>表S3,NPI-ES給出的分類精確度是80。/。,與之相比,44種基因組給出的分類精確度是70%。表S3:NPI-ES或44種基因組對(duì)78個(gè)RoseUa胂瘤的分類精確度NPI分類(<3.4或>3.4)錯(cuò)誤分類的數(shù)目(精確度)44種基因23(70%)NPI-ES15(80%)表S5:在ER+、ER-和ERBB2+分子亞型中受到顯著調(diào)控的前50種基因的列表此表代表了通過SAM鑒定的在各個(gè)分子亞型(ER+、ER-、ERBBH)中受到顯著調(diào)控的前50種基因?;蛞运鼈兊腟M相關(guān)比排序,這反映了在不同組中觀察到的表達(dá)擾動(dòng)的程度。這些基因與其它研究(8-11)報(bào)告的類似列表之間存在較好的重疊(正文)。_基因描述Unigene染色體ER+分子亞型雌激素受體1GATA結(jié)合蛋白3膜聯(lián)蛋白A9K1AA0882蛋白碳酸Sf酶XII細(xì)胞色素P450,亞家族IIB(苯巴比妥可誘導(dǎo)的)肽6動(dòng)力蛋白、軸絲(axonemal)、光中間多肽lHs.1657Hs.169946Hs.279928Hs細(xì)19Hs.5338Hs.1360多Hs.406050Hs.82222seraa結(jié)構(gòu)域,,免疫球蛋白結(jié)構(gòu)域(Ig),短基本結(jié)構(gòu)域,Hs.155956分泌的,(semaphorin)3BN-乙?;D(zhuǎn)移酶l(芳基胺N-乙?;D(zhuǎn)移酶)絲氨酸(或半胱氨酸)蛋白酶抑制物,進(jìn)化枝A(ct-lChr:6q25.1Chr:10p15Chr:1q21Chr:4q31.1Chr:15q22Chr:19q13.2Chr:1p35.1Chr:3p21.3Chr:8p23.卜p21抗蛋白酶、抗胰蛋白酶),成員5細(xì)胞色素c氧化酶亞基Vlc人類mRNA;cDMDKFZp564F053DKFZp564F053),mRNA序列LIV-1蛋白,受雌激素調(diào)控的(來自克Hs.76353Hs.351875Hs:71968Hs.79136Crir:14q32.1Chr:8q22-q23Chr:18q12.1肌釣蛋白Tl,骨骼的,緩慢的Hs.73980Chr:19ql3:4假定蛋白FU20151HS.279916Chr:15q21.3calsyntenin2Hs.12079Chr:3q23-q24B細(xì)胞CLL/淋巴瘤2Hs.79241Chr:18q21.3醋酸胍N-甲基轉(zhuǎn)移酶Hs.8"31Chr:19p13.3微管相關(guān)蛋白THs.101174Chr:17q21.1假定蛋白FU12910Hs.15929C"r:6q25.1含WW結(jié)構(gòu)域蛋白1Hs.355977Chr:8q21UDP-葡萄糖神經(jīng)酰胺葡萄糖基轉(zhuǎn)移酶Hs.432605Chr:9q31G醒l蛋白Hs.193914Chr:2p25.1R腿Hs,241471Chr:14q32.32人胰島素樣生長(zhǎng)因子1受體mRNA,3'序列'mRM序歹ilHs.405998---白介素6信號(hào)轉(zhuǎn)導(dǎo)物(gpl30,制瘤素M受體)Hs,82065LAG1長(zhǎng)壽確保同系物2(釀酒酵母)Hs,285976cadherin,EGFLAGseven—passG型受體2(火烈鳥同Hs.57652系物,果蠅)配對(duì)堿性氨基酸切除系統(tǒng)4G蛋白信號(hào)調(diào)控物11UDP-葡萄糖神經(jīng)酰胺葡萄糖基轉(zhuǎn)移酶NPD009蛋白v-myb成髓細(xì)胞病病毒癌基因同系物(禽類)白介素6信號(hào)轉(zhuǎn)導(dǎo)物(gpl30,制瘤素M受體)復(fù)盤,大(果蠅)同系物5人類mRNA;cDNADKFZp434E082(來自克DKFZp434E082),mRNA序列細(xì)胞色素P450,亞家族IIB(笨巴比妥可誘導(dǎo)的),肽7HSPC009蛋白KIAA1025蛋白蛋白質(zhì)酪氨酸磷酸酶IVA型,成員2CGI-49蛋白染色體20開放讀碼框35佛波醇-12-肉豆蔻酸-13-乙酸酯誘導(dǎo)的蛋白質(zhì)1KIAA0876蛋白假定蛋白FLJ20152假定蛋白FLJ22318三葉因子1(在乳癌中表達(dá)的雌激素可誘導(dǎo)的序列)Hs.350470Hs.170414Hs.65756Hs.432605Hs.283675Hs.1334Hs.82065Hs.170290隆Hs.432587多Hs.330780Hs.16059Hs.4084Hs.82911Hs.238126Hs.256086Hs.96Hs.301011Hs.82273Hs.22753Chr:5q"Chr:1q21.2Cl、r:1p21Chr:15q26Chr:16p13.3Chr:9q31Chr:16p13.2Chr:6q22-q23Chr:5q"Chr:10q23Chr:19q13.2Chr:17q21Chr:12q24.22Chr:1p35Chr:1q44Chr:20q13.11Chr:18q21.31Chr:19p13.3Chr:5p15.1Chr:5q35.3Chr:21q22.3聚合酶(DNA指導(dǎo)的)假定脯氨酸4-羥化酶GDNF家族受體a1S4Hs.82520Chr:11q13Hs.348198Chr:3p21.31Hs.105445Chr:10q26ERBB2+分子亞型氯化物通道,4丐激活的,家族成員2v-erb-b2成紅細(xì)胞白血病病毒癌基因同系物2,細(xì)胞/神經(jīng)膠質(zhì)瘤衍生的癌基因同系物(禽類)生長(zhǎng)因子受體結(jié)合蛋白7雙特異性磷酸酶6含START結(jié)構(gòu)域3瞬時(shí)受體潛在陽離子通道,亞家族V,成員6S10(H丐結(jié)合蛋白A8(calgranulinA)蛋白質(zhì)磷酸酶l,調(diào)控(抑制物)亞基1A成纖維細(xì)胞生長(zhǎng)因子受體4SRY(性別決定區(qū)Y)盒11未知蛋白(人類),mRNA序列split的transducin才羊增強(qiáng)子1(E(spl)同系物假定基因MGC9753促分裂原激活的蛋白激酶激酶5KIAA1102蛋白脂肪酸羥化酶轉(zhuǎn)錄因子AP-2P(激活增強(qiáng)子結(jié)合蛋白)Hs.2"551Chr:1p31-p22成神經(jīng)Chr:17q11.2.Hs.323910q12Hs.86859Chr:17q21.1Hs.180383Chr:12q22-q23Hs.77628Chr:17q"-q12Hs.302740Chr:7q33-q34Hs.100000Chr:1q21Hs.76780Chr:12q13.13Hs.165950Chr:5q35.1-qterHs.32964Chr:2p25Hs.106642—'果錄)Hs.28935Chr:9q21.32Hs.91668Chr:17q21.1Hs.151988Chr:6q22.33Hs.202949Chr:4p13Hs.249163Chr:16q23Hs.33102Chr:6p12S100鉤結(jié)合蛋白A9(calgranulinB)脂肪酸-輔酶A連接酶,長(zhǎng)鏈2假定蛋白FLJ22671犬尿氨酸3-單加氧酶(犬尿氨酸3-羥化酶)KUA0644基因產(chǎn)物天冬氨酸P-羥化酶電子轉(zhuǎn)移黃素蛋白,cc多肽(戊二酸尿II)分泌性白細(xì)胞蛋白酶抑制物(抗白細(xì)胞蛋白酶)異檸檬酸脫氫酶l(NADP+),可溶的苯乙醇胺N-甲基轉(zhuǎn)移酶假定蛋白FLJ14146巖藻糖轉(zhuǎn)移酶3(半乳糖苷3(4)-L-巖藻糖轉(zhuǎn)移酶,Lewis血型的)Hs.112405Hs.154的0Hs.193745Hs.107318Hs.21572Hs.283664Hs.169919Hs.251754Hs.11223Hs.1892Hs.103395包含Hs.169238Chr:1q21Chr:4q34-q35Chr:2q37.3Chr:1q42-q44Chr:7p15.1Chr:8q12.1Chr:15q23-q25Chr:20q12Chr:2q33.3Chr:17q21-q22Chr:1q42.11Chr:19p13.3角蛋白,毛發(fā),堿性,1Hs.32952Chr:12q13含PDZ結(jié)構(gòu)域2Hs.173035Chn5p13.3精氨基琥珀酸合成酶Hs.160786Chr:9q34.1特異顆粒蛋白(28kDa)Hs.54431Chr:6p12.3人類cDNA:FLJ21521fis,克隆COL05880,mRNA序列Hs.306777犬尿氨酸酶(L-犬尿氨酸水解酶)Hs.169139Chr:2q22.1假定蛋白FLJ20539Hs.118552Chr:11q12.1脯氨酸脫氫酶(氧化酶)1Hs.343874Chr:22q11.21v-myc髄細(xì)胞瘤病病毒相關(guān)癌基因,由成神經(jīng)細(xì)胞瘤衍生的(禽類)Hs.25960Chr:2p24.1整合素,P6Hs.57664Ghr:2q24.2假定蛋白MGC3077Hs.433404Chr:7p15-p14未偶聯(lián)蛋白2(線粒體,質(zhì)子栽體)Hs.80658Chr:11q13肌球蛋白XHs.61638Chr:5p15.1-p14.3角蛋白7Hs.23881Chr:12q12-q21類固醇硫酸酯酶(微粒體),芳基硫酸酯酶c,同工酶SHs.79876Chr:Xp22.32含形成素同系物2結(jié)構(gòu)域1Hs,95231Chr:16q22ATP結(jié)合盒,亞家族C(CFTR/MRP),成員3Hs.90786Chr:.17q22軟骨素P1,4N-乙酰半乳糖胺轉(zhuǎn)移酶Hs.11260Chr:8p21.3KIAA0485蛋白Hs.89121…ki:aken樣Hs.301947Chr:22q13膠原,XIII型,cc1Hs.211933Chr:10q22ER-分子亞型Hs.432448Clir:17q12-q21角蛋白16(病灶非表皮松懈性掌跖角化病)Hs.70725Chr:5q33-q34Y-氨基丁酸(GABA)A受體,ttTO腦Hs細(xì)OChr:Xq26.3角蛋白6BHs.432677Chr:12q12-q13絲氨酸(或半胱氨酸)蛋白酶抑制物,進(jìn)化枝B(卵清蛋—白),成員5Hs.55279Chr:18q21.3角蛋白5(單純性大皰性表皮松懈,Dowling-Meara/Kobner/Weber-Cockayne型)Hs.433845Chr:12q12-q13SRY(性別決定區(qū)Y)盒10Hs.44317Chr:22q13.1Chr:19q13.32.黑素瘤抑制活性Hs.279651q13.33基質(zhì)金屬蛋白酶7(matrilysin,子宮)Hs.2256Chr:11q2仁q22分泌的巻曲相關(guān)蛋白lHs.7306Chr:8p12-p11.1B細(xì)胞CLL/淋巴瘤11A(鋅指蛋白)Hs.130881Chr:2p15人類cDNAFU11796Hs,克隆HEMBA1006158,與人類Hs,284186-"轉(zhuǎn)錄因子叉頭樣7(FKHL7)基因高度相似,mRM序列Hs.162211Chr:Xq23-q24溶質(zhì)栽體家族6(神經(jīng)遞質(zhì)轉(zhuǎn)運(yùn)蛋白),成員14Hs,10587Chr:15q26,3d,slinHs.271977Chr:2q13-q21engrailed同系物1Chr:11p15.5-核糖體蛋白,大P2含三元基序29鈣調(diào)蛋白樣皮膚蛋白質(zhì)desmocolli'n2■ropporin,rhophiUti相關(guān)蛋白晶體蛋白,cxB含三元基序2表皮生長(zhǎng)因子受體(成紅細(xì)胞性白血病病毒(v-erb-b)癌基因同系物,禽類)富含亮氨酸酸性核蛋白樣鉀通道,亞家族K,成員5激肽釋放酶5前膠原C-內(nèi)肽酶增強(qiáng)子2假定蛋白(人類),mRNA序列只含LIM結(jié)構(gòu)域4角蛋白17Hs.153179p15.4Hs.82237Chr:"q22-q23Hs.180142Chr:10p15.1Hs.239727Chr:18q12.1Hs.194093Chr:3q21,1Chr:11q22.3-Hs.391270q23.1Hs.12372Chr:4q31.23Hs.77432Chr:7p12Hs.71331Chr:1q21.2Hs.127007Chr:6p21Chr:19q13.3-q13.4Chr:3q21-q24Hs.50915Hs.8944Hs.66762Hs.3844Hs.2785Hs.1925Chr:1p22.3Chr:17q12-q21Chr:18q12.1-q12.2Hs.367762Chr:12q12-q13Chr一12p-12,1..pi1.2Chr:13q21.32desmoglein3(尋常天皰疳抗原)角蛋白6A唾液酸轉(zhuǎn)移酶8A(a-N-乙?;窠?jīng)氨酸cx-2,8-唾液酸Hs.82527轉(zhuǎn)移酶,GD3合酶)"Hs.84728Kruppel樣因子5(腸)p鳥嘌呤核苷酸交換因子(GEF)4Hs.6066激肽釋放酶6(謂rosin,酶)Hs.79361前列腺素-內(nèi)過氧化物合酶2(前列腺素G/H合酶和環(huán)加氧酶)Hs.196384Chr:1q25.2-q25.3染色體20開放讀碼框42Hs.180479Chr:20p12.3糖蛋白M6BHs.5422Chr:Xp22.2尿苷磷酸化酶Hs.77573Chr:7Chr:2q22Chr:19q13.3ladi由1Hs.18141pl;U',omorphic腺瘤基因樣1Hs.75825ddsmocollin3Hs.41690人類cDNAFLJ30869fis,克隆FEBRA2004224,mRNA序列Hs.349611HRAS樣抑制物HS.36761富含半胱氨酸和甘氨酸的蛋白質(zhì)2Hs.10526癢病響應(yīng)蛋白lHs.7122淀粉狀蛋白P(A4)前體蛋白結(jié)合家族A,成員2(xil樣)Hs.26468Chr:15q11-q12jdYky同系物樣(小鼠)Hs.105940Chr:11q21轉(zhuǎn)化生長(zhǎng)因子,aHs,170009Chr:2p13Chr:1q25.1-q32.2Chr:6q24-q25Ghr:18q12.1Chr:3q29Chr:12q21.1Chr:4q31-q32表S6:屬于NPI-ES的基因(62種基因)DC13蛋白是能夠在Rosetta70種基因"預(yù)后"特征(PES,見正文)中匹配的唯——種NPI-ES基因,之外AffymetrixU133A芯片中存在42種?;蛎枋鯱nigene生物學(xué)過程(GO)陽性基因(60種)(在高NPI腫瘤中高表達(dá))腺嘌呤磷酸核糖基轉(zhuǎn)移酶Hs.28914MCM4微型染色體維持缺陷4(釀酒酵母)Hs.154443核酸外切酶1Hs.47504金屬硫蛋白1H樣蛋白(人類),mRNAHs.367850序列人類,克隆雇GE:5270727,m飄,mRNAHs.319215序列DC13蛋白Hs.6879HSPC037蛋白Hs.433180H2A組蛋白家族,成員ZHs.119192復(fù)盤,大同系物7(果蠅)Hs.77695RNA解旋酶相關(guān)蛋白(人類),mRNA序Hs.381097列驅(qū)動(dòng)蛋白樣lHs.8878染色體20開放讀碼框1KIAA0095基因產(chǎn)物解旋酶,淋巴樣特異的同源框HB9Hs.9329Hs.155314Hs.203963Hs.370359116〃核苷代謝〃延伸由電子注釋推斷;Pribosyltran;5e-446260〃DM復(fù)制〃預(yù)測(cè)的/計(jì)算的6310〃DNA重組//實(shí)驗(yàn)證據(jù)〃/6281〃DM修復(fù)〃實(shí)驗(yàn)證據(jù)〃/6298〃錯(cuò)配修復(fù)〃預(yù)測(cè)的/計(jì)算的7267〃細(xì)胞-細(xì)胞信號(hào)〃延伸未知;GKAP;2.le-057067〃有絲分裂〃實(shí)驗(yàn)證據(jù)〃/7052〃有絲分裂紡錘體裝配〃實(shí)驗(yàn)證據(jù)7067//有絲分裂〃預(yù)測(cè)的/計(jì)算的〃/8283〃細(xì)胞增殖〃預(yù)測(cè)的/計(jì)算的6959〃體液免疫應(yīng)答〃實(shí)驗(yàn)證據(jù)〃6357〃來自染色體X(唯一的)9879表達(dá)序列上的Hs.18212DM區(qū)段MAD2有絲分裂停滯缺陷樣1(酵母)Hs.79078真核翻譯起始因子4E結(jié)合蛋白1組織蛋白酶CH2B組蛋白家族,成員J蛋白酶體(prosome,macropain)亞基,P型,8(大的多功能蛋白酶7)假定蛋白FLJ20105染色體10開放讀碼框3未鑒定的骨髄蛋白BM039可能是小鼠富含基因簇的直向同源物,C8基因細(xì)胞分裂周期2,Gl至S和G2至MHs.433317Hs.10029Hs.249216Hs.180062Hs.89306Hs.14559Hs.283532Hs.30114Hs.334562金屬硫蛋白2Ageminin,DNA復(fù)制抑制物Hs.118786Hs.234896低密度脂蛋白受體相關(guān)蛋白8,栽脂蛋Hs.54481白e受體PolII啟動(dòng)子的轉(zhuǎn)錄的調(diào)控〃預(yù)測(cè)的/計(jì)算的〃/7345〃胚胎發(fā)生和形態(tài)發(fā)生〃實(shí)驗(yàn)證據(jù)7067〃有絲分裂〃預(yù)測(cè)的/計(jì)算的〃/7093〃有絲分裂檢查點(diǎn)〃實(shí)驗(yàn)證據(jù)6445〃翻譯調(diào)控〃預(yù)測(cè)的/計(jì)算的6508〃蛋白水解和肽水解〃沒有記錄〃/6955//免疫應(yīng)答//實(shí)驗(yàn)證據(jù)6508〃蛋白水解和肽水解〃沒有記錄74〃細(xì)胞周期的調(diào)控〃沒有記錄〃/7089〃有絲分裂細(xì)胞周期的起始控制點(diǎn)〃沒有記錄6878〃銅內(nèi)環(huán)境平衡〃預(yù)測(cè)的/計(jì)算的7050〃細(xì)胞周期停滯//預(yù)測(cè)的/計(jì)算的〃/8156〃腿復(fù)制的負(fù)調(diào)控〃預(yù)測(cè)的/計(jì)算的7165〃信號(hào)轉(zhuǎn)導(dǎo)〃預(yù)測(cè)的/計(jì)算的〃/6629〃脂質(zhì)代謝〃預(yù)測(cè)的/計(jì)算的血液學(xué)和神經(jīng)學(xué)表達(dá)的1Hl組蛋白家族,成員2Hs.109706Hs.7644nudix(二磷酸核苷相連部分X)型基序1金屬硫蛋白IXH2B組蛋白家族,成員TtetraspanlHs.388Hs.374950Hs.247817Hs.38972金屬硫蛋白1HH3組蛋白家族,成員K核糖核苷酸還原酶M2多肽桿狀病毒含IAP重復(fù)5(生存蛋白)Hs.2667Hs.70937Hs.75319Hs.1578只含F(xiàn)盒蛋白5絲氨酸(或半胱氨酸)蛋白酶抑制物,進(jìn)化枝A(oc-l抗蛋白酶、抗胰蛋白酶),成員1溶酶體相關(guān)蛋白跨膜4P趨化因子(C-X3-C基序)配體1Hs.272027Hs.296398Hs.804206979//對(duì)氧4匕壓力響應(yīng)〃預(yù)測(cè)的/計(jì)算的〃/6281〃DNA修復(fù)〃沒有記錄8283//細(xì)胞增殖〃未記錄〃/8583〃神秘的細(xì)胞命運(yùn)分化(SensuDrosophila)//預(yù)效寸的/計(jì)算的〃/7155〃細(xì)胞粘附〃未記錄〃/6928〃細(xì)胞運(yùn)動(dòng)性/未記錄CD27結(jié)合(Siva)蛋白Hs.11205886〃有絲分裂細(xì)胞周期的G2/M轉(zhuǎn)換//實(shí)驗(yàn)證據(jù)〃/7048〃瘤發(fā)生〃預(yù)測(cè)的/計(jì)算的〃/6916〃抗凋亡〃實(shí)驗(yàn)證據(jù)6508//蛋白水解和肽水解〃預(yù)測(cè)的/計(jì)算的Hs.297681———7165//信號(hào)轉(zhuǎn)導(dǎo)〃實(shí)驗(yàn)證據(jù)〃/6954〃炎癥應(yīng)答〃沒有記錄/〃6935〃趨化性〃實(shí)驗(yàn)證據(jù)〃6955〃免疫應(yīng)答〃沒有記錄〃/7155〃細(xì)胞粘附〃實(shí)驗(yàn)證據(jù)〃/7267〃細(xì)胞-細(xì)胞信號(hào)〃實(shí)驗(yàn)證據(jù)8624〃通過胞外信號(hào)誘導(dǎo)凋亡〃預(yù)測(cè)的/計(jì)算的LNG蛋白小鼠乳瘤病毒受體同系物1叉頭盒M1Hs.278338Hs.18686Hs.239met原癌基因(肝細(xì)胞生長(zhǎng)因子受體)Hs.316752butyrophilin,亞家族3,成員A2Hs.87497SBB126蛋白Hs.26481有可能是小鼠SheSH2結(jié)構(gòu)域結(jié)合蛋白Hs.1232531的直向同源物H3組蛋白家族,成員BHs.143042三葉因子3(腸)Hs.82961免疫球蛋白A基因座Hs.405944DNA復(fù)制因子Hs.122908人類cDNAFLJ30781fis,克隆Hs.301663FEBRA2000874,mRNA序列趨化因子(C-C基序)配體l8(肺部和Hs.16530受激活調(diào)控的)〃/6952〃防御應(yīng)答〃預(yù)測(cè)的/計(jì)算的7186〃G蛋白偶聯(lián)受體蛋白信號(hào)途徑〃預(yù)測(cè)的/計(jì)算的6366〃自PolII啟動(dòng)子的轉(zhuǎn)錄〃實(shí)驗(yàn)證據(jù)/〃6979〃對(duì)氧化壓力的應(yīng)答〃實(shí)驗(yàn)證據(jù)7048〃瘤發(fā)生〃實(shí)驗(yàn)證據(jù)〃/8283〃細(xì)胞增殖//預(yù)測(cè)的/計(jì)算的/〃7165〃信號(hào)轉(zhuǎn)導(dǎo)〃預(yù)測(cè)的/計(jì)算的6952〃防御應(yīng)答〃預(yù)測(cè)的/計(jì)算的〃/7586〃消化〃預(yù)測(cè)的/計(jì)算的7165〃信號(hào)轉(zhuǎn)導(dǎo)〃實(shí)驗(yàn)證據(jù)〃/7154〃細(xì)胞通訊〃預(yù)測(cè)的/計(jì)算的〃/6935〃趨化性〃實(shí)驗(yàn)證據(jù)/〃6955〃免疫應(yīng)答〃預(yù)測(cè)的/計(jì)算的〃/6960〃抗微生物體液應(yīng)答(sensuInvertebrata)〃預(yù)測(cè)的/計(jì)算的〃/9607〃響應(yīng)生物刺激〃預(yù)測(cè)的/計(jì)算的〃/7267〃細(xì)胞-細(xì)胞信號(hào)〃實(shí)驗(yàn)證據(jù)免疫球蛋白K恒定區(qū)Ty4同系物1的抑制物(釀酒酵母)Hs.Hs.40656579058父系表達(dá)的106355〃轉(zhuǎn)錄的調(diào)控,DNA依賴性〃預(yù)測(cè)的/計(jì)算的〃/6357//自FolII啟動(dòng)子的轉(zhuǎn)錄的調(diào)控〃預(yù)測(cè)的/計(jì)算的〃/6338〃染色質(zhì)模建〃預(yù)測(cè)的/計(jì)算的Hs.137476—-陰性基因(2種)(在低NPI腫瘤中高表達(dá))BTG家族,成員2Hs.754628285〃細(xì)胞增殖的負(fù)調(diào)控〃預(yù)測(cè)的/計(jì)算的〃/6281〃DM修復(fù)〃預(yù)測(cè)的/計(jì)算的/〃6976〃DNA損傷應(yīng)答,p53激活〃預(yù)測(cè)的/計(jì)算的細(xì)胞色素P450,亞家族IVF,多肽8Hs.2685546118〃電子運(yùn)輸〃延伸未知;p450;1.9e-142〃/6m〃前列腺素代謝〃預(yù)測(cè)的/計(jì)算的表S7:進(jìn)行SAM以鑒定與等級(jí)顯著相關(guān)的68種基因(FDR為14%,變化^2倍)。在這些基因中45種(66%)也屬于NPI分類物,在NPI-ES列中標(biāo)以"是"。_基因名稱NPI-ES在3級(jí)腫瘤中上調(diào)的基因RAD51相互作用蛋白DC13蛋白HSPC037蛋白同源框HB9細(xì)胞周期蛋白B2胞質(zhì)分裂的蛋白調(diào)控物1有可能是小鼠富含基因簇1的直向同源物,C8基因驅(qū)動(dòng)蛋白樣1H2A組蛋白家族,成員ZDM復(fù)制因子MCM4微型染色體維持缺陷4(釀酒酵母)復(fù)盤,大同系物7(果蠅)ZW10相互作用物MAD2有絲分裂停滯缺陷樣1(酵母)金屬硫蛋白1H樣蛋白(人類),mRM序列染色體10開放讀碼框3核糖核苷酸還原酶M2多肽細(xì)胞分裂周期2,G1至S和G2至M叉頭盒M1未鑒定的骨髄蛋白BM039解旋酶,淋巴特異的RNA解旋酶相關(guān)細(xì)胞(人類),mRM序列金屬硫蛋白IX人類,克隆IMAGE:5270727,mRNA,mRNA序列金屬硫蛋白2A金屬硫蛋白1HKIAA0095基因產(chǎn)物桿狀病毒含IAP重復(fù)5(生存蛋白)geminin,DM復(fù)制抑制物zeste同系物2的增強(qiáng)子(果蠅)組織蛋白酶Cnudix(二磷酸核普相連部分X)型基序1假定蛋白FU10719趨化因子(C-X3-C基序)配體1tetraspan1促凋亡caspase銜接物蛋白免疫球蛋白人基因座是是是是是是是是是是是是是是是是是是是是是是是是是是是是H2B組蛋白家族,成員J三葉因子3(腸)CD27結(jié)合(Siva)蛋白拓樸異構(gòu)酶(DNA)1Iccl70kDa免疫球蛋白A連接區(qū)3真核翻譯起始因子4E結(jié)合蛋白1H3組蛋白家族,成員K趨化因子(C-C基序)配體18(肺部和激活調(diào)控的)溶酶體相關(guān)蛋白跨膜4P小鼠乳瘤病毒受體同系物1LGN蛋白免疫球蛋白k恒定區(qū)羧肽酶Bl(組織)met原癌基因(肝細(xì)胞生長(zhǎng)因子受體)H2B組蛋白家族,成員TRAB38,成員RAS癌基因家族Hl組蛋白家族,成員2來自EUROIMAGE2021883的假定蛋白載脂蛋白BmRNA編輯酶,催化多肽樣3BH3組蛋白家族,成員B免疫球蛋白重鏈恒定區(qū)Y3(G3m標(biāo)志物)與bK246H3.1相似(免疫球蛋白入樣多肽1,前B細(xì)胞特異的)免疫球蛋白A輕鏈(人類),mRNA序列免疫球蛋白k輕鏈可變區(qū)(人類),mRNA序列絲氨酸(或半胱氨酸)蛋白酶抑制物,進(jìn)化枝A(cc-l抗蛋白酶、抗胰蛋白酶),成員1蛋白脂蛋白1(Pelizaeus-Merzbacher病,痙攣性截癱2,不復(fù)雜的)鈉通道,非電壓門控l,P(Liddle綜合征)H4組蛋白家族,成員Hsyndecan2(硫酸類肝素l,細(xì)胞表面相關(guān)的,纖維聚糖)neuropilin(NRP)和tolloid(TIX)樣2在3級(jí)腫瘤中下調(diào)的基因假定蛋白FLJ22418是是是是是是是是是是是是是是是表S11:LuminalA和LuminalC腫瘤與高和低NPI-ES表達(dá)的相關(guān)性(Luminal腫瘤是根據(jù)Sorlie等(2001)的結(jié)果鑒定的)<table>tableseeoriginaldocumentpage61</column></row><table>表S12:然后將每個(gè)組的死亡數(shù)目(5年后)列表如下:<table>tableseeoriginaldocumentpage61</column></row><table>*AWD:有病存活表S13:預(yù)后組與Rosetta231種基因之間重疊的基因<table>tableseeoriginaldocumentpage61</column></row><table>圖S14:預(yù)后組(或NPI-ES)基因在不同NPI值樣品間的表達(dá)數(shù)據(jù)UID8980197980403NPI5.65.14.S5.5200853—at0.397S—-1.025-0.72131.3950.3702-0.10241.68420123S一s一at—:0-3218-0.27781.7470.88670.S4721.158201483—S—at1.818—"5".92570.40990.7S8S21-S-1.6841.39670.01991201487—at3—0.9838-1.244-0.87041.502-0.65521.012201890—at0.8083—0.7456名稱20002209802782000S9720P0S092002007120O201S0200G78720020051200200SS98026198039120007S8200077999012320004222OO0S83200077520008049803469900829801779801789804349900759901139901079802089802209802219903757.26.83.86.44.56S.45.23.2S3.33.44.87.16.2S3.73.5S.84.4-3.64.685.525.746.57.83.83.74S.32.3149"H2A組蛋白家族,成員Z"0.-0.5183-0.14541.481-0.780.75020.49S90.5195-0.319"BTG家族,成員2"0.9-0.48932.1261.9550.1703-0.0S2970.52630.2780.1387-O..097490丄5S同系物1的抑制物(釀酒酵母)0.2263-0.1740.603-0.80210.4711-1.372-0.8661;0.48931.347-0.3128'0.1454■.102O.ilSS0.788S-O'.006272.0.8116..328組織蛋白酶C-0.77590.28442.8S4-1.2011.2850.43090.9151-0.S7S3-1.6241.4S核糖核香酸還原酶M2多肽0.81511.052-0'.5101-0.09044-0..138-0.7108-0.2718'0JS46-0.92241.085-0'.292-0.01074-0.73991.291.105-0.0023540.503200.28031.0.44341,0,0.0.0.0.-0.2888-0.1469.0.9016-0.2015.9142,573355S0978867431867031034-0.2923-0.13290.33890.6147-0.07260.7774-0.45710.25529803833.44.61.2740.93510.27170.52440.34731.4820.66192.9041.105-0.26430.86'S-0.08741.187-0.7083-0.6520.447S-0.3910.92.86-0.274-1.447-1.158-0.6880.9706''0.38130.15770.621200480031548.7轉(zhuǎn)溢*被57/71到<table>tableseeoriginaldocumentpage63</column></row><table><formula>formulaseeoriginaldocumentpage64</formula><table>tableseeoriginaldocumentpage65</column></row><table>-3.SS90.3421.331.492-3.3S1■-0..ISSS0.0934-l.0520.56834.2S9-0.43441-0.7721.8440.7642-0.7S781.3440.8970.S398-2."9.-0.78381.8141.4Sl0.0.57181-51100.40532.27S0.94340.5052-1.327209114—attetraspan10.8555-O:.07S84-2.8880.7271.2870.6181-0.448-0.4048-0.054171.S870.3291-0.4002-0.43012.4941.8252.191.30S-l.0280.923-0.1.-1.031.3441.1580.93833.609-0.40170.'3422-0.61320.|72480.58052.243-1.668209398—at"H1組蛋白家族,成員2"0.65751.078-l.2112027-2.6683.0.775一-0.028422.1470,88040.3597-1.194-0-71883.0473.'613-0.5534-0.2921-O.71S314590.11812.-1.0251.1941.3321.659-0.S7191.7290.18070.58(31.7173.;7170.90741.7420.58492'098063t"H2B組蛋白家族,成員T"0.044951.14S-1.8950.590S1.6851.-0.007^870.059951.352.b85-0.46761.172-0.5088-1.8771.592-0.9202-1.274-0.35331.3340,18051.-1-0490*S90S0.37211.173-0.00397S0.04341-0.433S0.0039750.43991.9550.20450.4444-0.08685209832s—atDNA復(fù)制因子-O:.20930.43S8-0.6791-3.9061.280.0.-2.259_-0.7840.785-0-3879-0.2S830.7921.16S0.87990,!9S3-0.43510.27431.2481.03-0.5027-l0.5995-0.50541.063-0.00959S-0.244-0.3794-0.17920.;2804-1.287-0.2545-0.2157209924at趨化因子(C-C基序)配體18(肺部和激活調(diào)控的)0.48一-2.039-0.S577-3.44S-0.2178-0.84631.;3S9-l.2330.7177-O.5422-l.2560.8261-o30.86210.746-0.072440.17750.7399-0.003248'-3.22685530.7689-0.29680.6344-l.8330.8S85_2-3.9670.8904-1.524-0.7571-0.87S7210052_s—at染色體20開放讀碼框10.034230.72860.488S-0.35750.7S62_"5".7948-1.8941.S71-1.204-0.178S-0.3447-0.03SS0.713S0.:97"1.2821.064-l.092-o.12381.5480.3170.244.4"1.214200480031548.7勢(shì)溢1被61/713<table>tableseeoriginaldocumentpage67</column></row><table>21218S—x一at—:1.558-0.6833-0.213-1.320.42450.2713212484—at—1.07S-3.237-1.78S940.7631-2.427-0.22571..212613_at0.S323一-3.472-0.948-2.IS-1.8S90.4147213245_0.29314-0.2282.159金屬硫蛋白2A-0.8231-1.3S9-0.4286.0.81SS0.5282-0.84570.080541.222-1.085-0.3S12-0.3473小鼠乳瘤病毒受體同系物11.051-0.5181-0.22260.05274-2.9790.42430.17131.8350.2063-1.209"butyrophilin,亞家族3,-2.94-0.9575-2.136-3.444-0.538S-0.051450.81420.037351.204-0.349S0.1074-0.1S931.70S0.;78460.011851.|064成員A2"'0.:9747-O'.5544-1.298-2.0720.18730.5453-0.4493.160.17710.2709-0:.44450.1SS1-0i.l097-0.090171.095at"人類cDNAFLJ30781fis,克隆FEBRA2000874,mRNA序歹'J-0.2SS4-0.09124-0.01804-0.01S140.38651.S772.261-0.01159-0.78411.316-0.02205腺噪呤磷酸核糖轉(zhuǎn)移酶-0.S7290.98850.2662-0.3091-0.72730.040121.1210.3821-0.369S"H3組蛋白家族,成員B"1.9641.030.69221.271-0.1162l-.411-0.9481.5850.251同源框HB90.3303-3.8710.93361.5531.153.1.157213832—s—a仁0.4337—5-"280.1435-0.8SS490.59741.0281.872214472—at0.3387—0.12350.2118-3.12831.020.07530.02653214S14_at""2.021-0.2894-1.3610.:342-0.2670.80981.251-0.4576-0:.3823-2.6362.8400.02776-4.35-0.58990.52610.07240.9796-l.030.063180.4488-0.85110.74380.6982-1.544'0.1S3S-0.08S3S0-37550.37710.2132-0.051720.3185-0.415S-0.1155-1.284-2.6270.0.S024-3.738-2.642-O.81630.31272.640.8580.37010.7799-3.750.443S0.6362-0.9459-1-996-2.477-1.9150.4707-0-38S2-0.0220.3308'-0.9S250.3044'5630.17SS1357-0.31871.2380.42540-5S0S-0.9554-1.1770-0S1830.3379-0.3901.7190-02252*535-1.0570-174S1-372-0.958S-0.2;S890.01S1-0.41390.12322.512.872.0950.8&44-0.1420.'0085030.27570.05505-2.6SS-2.756-0..26230,4,0,2.761-3.05<formula>formulaseeoriginaldocumentpage69</formula><table>tableseeoriginaldocumentpage70</column></row><table><table>tableseeoriginaldocumentpage71</column></row><table><table>tableseeoriginaldocumentpage72</column></row><table><table>tableseeoriginaldocumentpage73</column></row><table><table>tableseeoriginaldocumentpage74</column></row><table>表L1:預(yù)后組基因ID的查閱表NPI-ES<table>tableseeoriginaldocumentpage75</column></row><table>218447_atNM—020188.1Hs.68792化542一atNM—018131.1Hs.14559218875—s一a幽一012177.1Hs.272027219061_s—atNM—006014.1Hs.18212219493—atNM—024745.1Hs.123253219555—s一a圓一018455.1Hs.283532219650—atNM—017669.1Hs.89306220085—atNM—018063.1Hs.203963220238—s_atNM—018846.1Hs.26481221436一s一a畫一031299.1Hs.30114221521一s一atBC003186.1Hs.433180221539—atAB044548.1—Hs.433317222037—atA舊59865Hs.319215201236—s_atNM—006763.1Hs.75462210576—atAF133298.1Hs-26855權(quán)利要求1.用于確定乳癌患者預(yù)后的方法,其包括根據(jù)預(yù)后組基因在所述患者乳瘤中的表達(dá)水平來確定患者的預(yù)后,其中所述預(yù)后組包含表S6的至少5種基因。2.依照權(quán)利要求1的方法,其中該預(yù)后組包含表S6的至少10、20、30、40、50、60種或所有基因。3.依照權(quán)利要求1或2的方法,還包括確定肺瘤樣品的雌激素受體(ER)狀態(tài)的步驟。4.依照權(quán)利要求3的方法,還包括確定肺瘤樣品的ErbB2狀態(tài)。5.依照權(quán)利要求1-4任一項(xiàng)的方法,包括步驟(a)由患者獲得乳瘤樣品;并(b)測(cè)量預(yù)后組基因在樣品中的表達(dá)水平。6.依照權(quán)利要求5的方法,其中步驟(b)包括使由樣品獲得的所述表達(dá)產(chǎn)物接觸能夠與表達(dá)產(chǎn)物結(jié)合的多種結(jié)合成員,其指示預(yù)后組基因表達(dá),其中可以測(cè)量這種結(jié)合。7.依照權(quán)利要求6的方法,其中結(jié)合成員是互補(bǔ)核酸序列或特異抗體。8.依照權(quán)利要求l-7任一項(xiàng)的方法,包括將乳瘤樣品分類為高NPI或低NPI或者預(yù)后好或預(yù)后差。9.依照權(quán)利要求l-8任一項(xiàng)的方法,其中確定預(yù)后的步驟是通過將所測(cè)試乳瘤樣品的表達(dá)語與先前獲得的譜和/或先前確定的特定預(yù)后特征性標(biāo)準(zhǔn)鐠進(jìn)行比較而進(jìn)行的。10.依照權(quán)利要求9的方法,其中將先前獲得的鐠保存為語的數(shù)據(jù)庫。11.依照權(quán)利要求1-10任一項(xiàng)的方法,還包括比較預(yù)后組在治療前后在乳瘤樣品中的表達(dá)水平以檢測(cè)表達(dá)譜的變化,其是預(yù)后改善或惡化的指示。12.用于確定乳瘤樣品預(yù)后的裝置,其包含附著了多種結(jié)合成員的固體支持物,每種結(jié)合成員能夠與預(yù)后組基因之一的表達(dá)產(chǎn)物特異且獨(dú)立結(jié)合,其中預(yù)后組包含表S6的至少5種基因。13.依照權(quán)利要求12的裝置,其中預(yù)后組包含表S6的至少5、10、20、30、40、50、60種或所有基因。14.依照權(quán)利要求12或13的裝置,其中固體支持物上只附著了能夠與表S6中所示的基因的表達(dá)產(chǎn)物特異且獨(dú)立結(jié)合的結(jié)合成員。15.依照權(quán)利要求12-14任一項(xiàng)的裝置,包括核酸微陣列,其中結(jié)合成員是核酸序列。16.用于確定乳癌患者預(yù)后的試劑盒,其包含能夠與預(yù)后組基因的表達(dá)產(chǎn)物特異結(jié)合的結(jié)合成員和檢測(cè)試劑,其中預(yù)后組包含表S6的至少5種基因。17.依照權(quán)利要求16的試劑盒,其中預(yù)后組包含表S6的至少10、20、30、40、50、60種或所有基因。18.依照權(quán)利要求16或17的試劑盒,還包含數(shù)據(jù)分析工具,其中數(shù)據(jù)分析工具是計(jì)算機(jī)程序。19.依照權(quán)利要求18的試劑盒,其中數(shù)據(jù)分析工具包括適于區(qū)別不同預(yù)后的腫瘤的表達(dá)i瞽的算法。20.依照權(quán)利要求16-19任一項(xiàng)的試劑盒,包含來自具有已知預(yù)后的乳瘤樣品的表達(dá)鐠和/或特定預(yù)后特征性的表達(dá)譜。21.依照權(quán)利要求16-20任一項(xiàng)的試劑盒,包含依照權(quán)利要求12-15任一項(xiàng)的裝置。22.依照權(quán)利要求16-20任一項(xiàng)的試劑盒,包含能夠與預(yù)后組基因的表達(dá)產(chǎn)物結(jié)合從而能夠在PCR中擴(kuò)增它們的核苷酸引物。23.為乳瘤樣品生成核酸表達(dá)譜的方法,包括步驟(a)由所述乳瘤樣品分離表達(dá)產(chǎn)物;(b)鑒定預(yù)后組基因的表達(dá)水平,其中預(yù)后組基因包含表S6的至少5種基因;并(C)由表達(dá)水平生成所述乳瘤樣品的表達(dá)譜。24.依照權(quán)利要求23的方法,其中預(yù)后組包含表S6的至少10、20、30、40、50、60種或所有基因。25.依照權(quán)利要求23或24的方法,包括將表達(dá)譜加入基因表達(dá)鐠數(shù)據(jù)庫。26.依照權(quán)利要求23-25任一項(xiàng)的方法,還包括將表達(dá)語與特定預(yù)后特征性的第二表達(dá)語或多個(gè)第二表達(dá)語進(jìn)行比較。27.依照權(quán)利要求26的方法,包括步驟(a)由第一乳瘤樣品分離表達(dá)產(chǎn)物,使所述表達(dá)產(chǎn)物接觸能夠與預(yù)后組的表達(dá)產(chǎn)物特異且獨(dú)立結(jié)合的多種結(jié)合成員,并由預(yù)后組在腫瘤樣品中的表達(dá)水平生成第一表達(dá)譜;(b)由已知預(yù)后的第二乳瘤樣品分離表達(dá)產(chǎn)物,使所述表達(dá)產(chǎn)物接觸能夠與步驟(a)的預(yù)后組的表達(dá)產(chǎn)物特異且獨(dú)立結(jié)合的多種結(jié)合成員,以生成相當(dāng)?shù)牡诙榱鰳悠繁磉_(dá)鐠;(c)將第一和第二表達(dá)譜進(jìn)行比較以確定第一乳瘤樣品的預(yù)后。28.包含多個(gè)乳瘤樣品基因表達(dá)譜的表達(dá)譜數(shù)據(jù)庫,其中基因表達(dá)譜衍生自預(yù)后組基因的表達(dá)水平,其中預(yù)后組基因包含表S6的至少5種基因,所述數(shù)據(jù)庫以可獲取的方式保存在數(shù)據(jù)載體上。29.依照權(quán)利要求28的表達(dá)譜數(shù)據(jù)庫,其中預(yù)后組包含表S6的至少IO、20、30、40、50、60種或所有基因。30.依照權(quán)利要求28或29的表達(dá)語數(shù)據(jù)庫,其中表達(dá)譜是核酸表達(dá)譜。31.依照權(quán)利要求28-30任一項(xiàng)的表達(dá)譜數(shù)據(jù)庫,其中表達(dá)譜按照來源腫瘤的ER狀態(tài)分類。32.用于鑒定在一組腫瘤中差異表達(dá)的一組基因的方法,其包括提供該組的多個(gè)肺瘤的每一個(gè)的表達(dá)譜,將譜根據(jù)腫瘤的分子亞型分類,并在亞型內(nèi)分析表達(dá)譜以鑒定區(qū)別組基因,其中區(qū)別組的基因在該亞型內(nèi)差異表達(dá)。33.依照權(quán)利要求32的方法,還包括步驟確定患者的腫瘤樣品的類型,其中區(qū)別組基因的差異表達(dá)是該類型特征性的,該步驟包括提供區(qū)別組在樣品中的表達(dá)水平,并根據(jù)該表達(dá)水平確定腫瘤類型。34.依照權(quán)利要求32或33的方法,包括步驟測(cè)定區(qū)別組基因在腫瘤樣品中的表達(dá)水平,由表達(dá)水平確定表達(dá)i普,并將諳加入數(shù)據(jù)庫。35.依照權(quán)利要求32-34任一項(xiàng)的方法,其中還鑒定了腫瘤樣品的分子亞型并將其加入數(shù)據(jù)庫。36.依照權(quán)利要求32-35任一項(xiàng)的方法,包括提供腫瘤在不同治療階段的表達(dá)i普,并比較所述表達(dá)鐠以確定預(yù)后類型的變化,其中表達(dá)i普產(chǎn)生自區(qū)別組基因的表達(dá)水平。37.依照權(quán)利要求32-36任一項(xiàng)的方法,其中腫瘤是乳瘤且分子亞型對(duì)應(yīng)于腫瘤的ER狀態(tài)。全文摘要發(fā)明人著手鑒定一組基因,它們可以用作與諾丁漢預(yù)后指數(shù)(NottinghamPrognosticIndex,NPI)相關(guān)的乳瘤預(yù)后標(biāo)志。最初,他們未能鑒定出其表達(dá)與NPI相關(guān)的單組基因。但是,在將數(shù)據(jù)集分割成分子亞類(雌激素受體陽性、雌激素受體陰性和ErbB2陽性)后,他們鑒定出在不同預(yù)后的腫瘤中差異表達(dá)的一組62種基因。提供了用于判定預(yù)后的方法和裝置。還提供了用于確定腫瘤對(duì)化療的響應(yīng)的方法,包括比較預(yù)測(cè)基因組在治療前后的表達(dá)水平。文檔編號(hào)G01N33/574GK101194166SQ200480031548公開日2008年6月4日申請(qǐng)日期2004年10月1日優(yōu)先權(quán)日2003年10月3日發(fā)明者K·余,P·譚申請(qǐng)人:Ncc技術(shù)投資私人有限公司