專利名稱:用于腫瘤樣本起源組織分類的基因表達(dá)簽名的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及癌癥分類及其組織起源確定的方法。具體來(lái)說(shuō),本發(fā)明涉及與特定癌癥相關(guān)的微RNA(microRNA),以及與microRNA有關(guān)或由其衍生的各種核酸分子。
背景技術(shù):
微RNA(miRs,miRNAs)是一類新發(fā)現(xiàn)的非編碼、調(diào)控型RNA基因1A其與腫瘤發(fā)生相關(guān)4且表現(xiàn)出顯著的組織特異性5_7。它們已作為高度組織特異性的生物標(biāo)志物,并推測(cè)在編碼分化發(fā)育的決定中起著很重要的作用2’5’6。許多研究結(jié)果都顯示了微RNA與特定惡性腫瘤的關(guān)聯(lián)4。微RNA在組織中、儲(chǔ)存的冷凍樣本或福爾馬林固定樣本、石蠟包埋(FFPF) 樣本和血清中也都是穩(wěn)定的。在美國(guó),每年有成千上萬(wàn)的患者被診斷為已經(jīng)轉(zhuǎn)移的癌癥,卻不能清楚的確定原發(fā)部位。腫瘤學(xué)家和病理學(xué)家在試圖確定轉(zhuǎn)移患者的原發(fā)灶(primary origin)時(shí),經(jīng)常面臨診斷困境。由于需要根據(jù)原發(fā)灶來(lái)治療轉(zhuǎn)移,所以精確確定原發(fā)灶對(duì)決定適合的治療至
關(guān)重要。一旦發(fā)現(xiàn)轉(zhuǎn)移腫瘤,患者可能經(jīng)歷一系列昂貴,費(fèi)時(shí)且低效的測(cè)試,包括患者的身體檢查,活檢病理組織學(xué)分析,如胸部X光片,CT和PET掃描的成像方法,以確定轉(zhuǎn)移的原發(fā)灶。原發(fā)灶不明轉(zhuǎn)移癌(CUP)占所有新的癌癥病例的3-5%,是組非常具有侵略性的預(yù)后性很低的疾病1(1。CUP的概念來(lái)自于確定癌癥起源的現(xiàn)有方法的局限,盡管通常采用復(fù)雜和昂貴的方法,適合這類患者的治療卻明顯被耽誤。由于缺少基于CUP的證據(jù)“,最新的研究顯示臨床管理具有高度可變性。對(duì)很多操作步驟進(jìn)行了評(píng)估12,但是成效甚微13。因此,確定腫瘤起源組織成為一項(xiàng)重要的臨床分子診斷應(yīng)用9。腫瘤起源組織14_17的分子分類研究一般使用分類算法,而沒(méi)有利用特定領(lǐng)域的知識(shí)組織被視為先驗(yàn)等值(priori equivalents),忽視了在胚胎發(fā)育中具有共同發(fā)育起源的組織類型之間的潛在的相似性。值得注意的是謝登和同事W的研究,該研究基于病理分類樹。這些研究使用機(jī)器學(xué)習(xí)方法,平均生物特征(例如,mRNA表達(dá)水平)的影響,這是更適合自動(dòng)化處理的方法,但不使用或生成機(jī)理的見解。已提出各種標(biāo)志物以標(biāo)示特定類型的癌癥和腫瘤組織的起源,然而,腫瘤標(biāo)志物的診斷準(zhǔn)確性,至今尚未被確定,因此需要一個(gè)更有效率的診斷和分類特定類型癌癥的有效方法。
發(fā)明內(nèi)容
本發(fā)明提供了用于特定癌癥和腫瘤起源組織的確定、分類和診斷的特定核酸序列?;谏飳W(xué)樣本中的大量的核酸序列,該核酸序列也可作為受試者預(yù)后評(píng)估和確定合適治療的預(yù)后標(biāo)志物。本發(fā)明進(jìn)一步提供了精確地確定腫瘤組織起源的方法。本發(fā)明部分基于用于腫瘤分類的、基于microRNA的分類器(classifier)的發(fā)展。 測(cè)量了來(lái)自26個(gè)不同的腫瘤類(包括原發(fā)腫瘤和轉(zhuǎn)移腫瘤),對(duì)應(yīng)于18個(gè)不同的組織和器官的903個(gè)石蠟包埋樣本的microRNA的表達(dá)水平。樣本的microRNA微陣列以及qRT-PCR 數(shù)據(jù)用于構(gòu)建所述分類器,基于48個(gè)組織特異性的microRNA,每個(gè)與特定的差異診斷作用相關(guān)聯(lián)。獨(dú)立的確定腫瘤起源組織的盲測(cè)的總靈敏度為84%,特異性為97%。高可信度的預(yù)測(cè)達(dá)到90 %的敏感性和99 %的特異性。研究結(jié)果表明了 microRNA的效用,該microRNA作為轉(zhuǎn)移腫瘤的起源組織的新的生物標(biāo)志物。所述分類器具有廣泛的生物學(xué)以及診斷應(yīng)用。根據(jù)第一方面,本發(fā)明提供了一種確定生物樣本起源組織的方法,該方法包括從受試者中獲得生物樣本;確定針對(duì)預(yù)定的一系列microRNA的單獨(dú)核酸的表達(dá)圖譜;和通過(guò)分類器對(duì)所述樣本的起源組織進(jìn)行分類。根據(jù)一種實(shí)施方式,所述分類器是決策樹模型 (decision tree model)0根據(jù)另一個(gè)方面,本發(fā)明提供了一種生物樣本起源組織的分類方法,該方法包括 從受試者中獲得生物樣本;確定所述樣本中選擇由SEQ ID NOS :1-49組成的組的核酸序列的表達(dá)圖譜,或與所述核酸序列具有至少約80%同一性的序列的表達(dá)圖譜;使用分類器算法比較所述表達(dá)圖譜與參考表達(dá)圖譜;通過(guò)所述核酸序列中任意的一種或組合的表達(dá)來(lái)確定所述樣本的起源組織。根據(jù)一種實(shí)施方式,所述分類器算法是決策樹分類器,邏輯回歸分類器,線性回歸分類器,最近鄰分類器(包括K近鄰),神經(jīng)網(wǎng)絡(luò)分類器,高斯混合模型(GMM)分類器和支持向量機(jī)(SVM)分類器,最近重心(nearest centroid)分類器,隨機(jī)森林分類器或這些分類器的任何boosting算法或拔靴集成法(bagging)。根據(jù)某些實(shí)施方式,所述組織選自由肝,肺,膀胱,前列腺,乳腺,結(jié)腸,卵巢,睪丸, 胃,甲狀腺,胰腺,腦,頭頸部,腎臟,黑色素細(xì)胞,胸腺,膽道和食管組成的組。根據(jù)一些實(shí)施方式,所述生物樣本為癌樣本。根據(jù)另一個(gè)方面,本發(fā)明提供一種癌癥的分類方法,該方法包括從受試者中獲得生物樣本,測(cè)量所述樣本中選自由SEQ ID NOS :1-49組成的組中核酸序列的相對(duì)豐度,或與所述核酸序列具有至少約80%同一性的序列的相對(duì)豐度;使用分類器算法比較得到的測(cè)量值與表征所述核酸序列豐度的參考值;根據(jù)所述核酸序列的豐度對(duì)所述樣本進(jìn)行分類。
根據(jù)一些實(shí)施方式,所述參考值是預(yù)先確定的閾值。根據(jù)一種實(shí)施方式,所述樣本從患有轉(zhuǎn)移癌的受試者中獲得。根據(jù)另一種實(shí)施方式,所述樣本從患有原發(fā)灶不明癌(CUP)的受試者中獲得。根據(jù)再一種實(shí)施方式,所述樣本從患有原發(fā)癌的受試者中獲得。根據(jù)再另一種實(shí)施方式,所述樣本為未確定起源的腫瘤、轉(zhuǎn)移腫瘤或原發(fā)腫瘤。根據(jù)某些實(shí)施方式,所述癌癥選自由肝癌,膽道癌,肺癌,膀胱癌,前列腺癌,乳腺癌,結(jié)腸癌,卵巢癌,睪丸癌,胃癌,甲狀腺癌,胰臟癌,腦癌,頭頸癌,腎癌,黑色素瘤,胸腺癌和食管癌組成的組。根據(jù)一些實(shí)施方式,所述肺癌選自由肺類癌、肺小細(xì)胞癌、肺腺癌、肺鱗癌組成的組。根據(jù)一些實(shí)施方式,所述腦癌選自由腦星形膠質(zhì)細(xì)胞瘤和腦少突膠質(zhì)細(xì)胞瘤組成的組。根據(jù)一些實(shí)施方式,所述甲狀腺癌選自由甲狀腺濾泡癌、甲狀腺乳頭狀癌和甲狀腺髓樣癌組成的組。根據(jù)一些實(shí)施方式,所述卵巢癌選自由卵巢子宮內(nèi)膜樣癌和卵巢漿液性癌組成的組。根據(jù)一些實(shí)施方式,所述睪丸癌選自由睪丸非精原細(xì)胞瘤和睪丸精原細(xì)胞瘤組成的組。根據(jù)一些實(shí)施方式,所述食管癌選自由食管腺癌和食管鱗狀細(xì)胞癌組成的組。根據(jù)一些實(shí)施方式,所述頭頸癌選自由喉癌、咽癌和鼻癌組成的組。根據(jù)一些實(shí)施方式,所述膽道癌選自由膽道癌和膽囊癌組成的組。根據(jù)其他的實(shí)施方式,所述生物樣本選自由體液,細(xì)胞株,組織樣本,活檢樣本,穿刺活檢樣本,手術(shù)切除的樣本,組織取樣過(guò)程獲得的樣本組成的組。根據(jù)一些實(shí)施方式,所述生物樣本為細(xì)針穿刺(FNA)樣本。根據(jù)一些實(shí)施方式,所述組織為新鮮的組織、冷凍的組織、固定的組織、石蠟包埋的組織或福爾馬林固定石蠟包埋(FFPE)的組織。本發(fā)明的分類方法包括使用至少一種分類器算法,所述分類器算法選自由決策樹分類器,邏輯回歸分類器,線性回歸分類器,最近鄰分類器(包括K近鄰),神經(jīng)網(wǎng)絡(luò)分類器, 高斯混合模型(GMM)分類器和支持向量機(jī)(SVM)分類器,最近重心分類器,隨機(jī)森林分類器組成的組,或這些分類器的任何boosting算法或拔靴集成法(bagging)。所述分類器可使用決策樹結(jié)構(gòu)(包括二叉樹)或投票(包括加權(quán)投票)方案以比較一種或多種分類器算法的分類,以便得出統(tǒng)一或符合多數(shù)的決策。本發(fā)明進(jìn)一步提供了一種對(duì)肝起源的癌癥進(jìn)行分類的方法,該方法包括,測(cè)量來(lái)自受試者的樣本中選自由SEQ ID N0S:6,9,25J6組成的組的核酸序列的相對(duì)豐度,或與所述核酸序列具有至少約80%同一性的序列的相對(duì)豐度;其中,所述核酸序列的豐度表明肝起源的癌癥。本發(fā)明還提供一種對(duì)睪丸起源的癌癥進(jìn)行分類的方法,該方法包括,測(cè)量來(lái)自受試者的樣本中選自由SEQ ID NOS :6,26,41組成的組的核酸序列的相對(duì)豐度,或與所述核酸序列具有至少約80%同一性的序列的相對(duì)豐度;其中,所述核酸序列的豐度表明睪丸起源
的癌癥。本發(fā)明還提供一種對(duì)睪丸精原細(xì)胞瘤起源的癌癥進(jìn)行分類的方法,該方法包括, 測(cè)量來(lái)自受試者的樣本中選自由SEQ ID NOS :6,沈,31,41,45,48組成的組的核酸序列的相對(duì)豐度,或與所述核酸序列具有至少約80%同一性的序列的相對(duì)豐度;其中,所述核酸序列的豐度表明睪丸精原細(xì)胞瘤起源的癌癥。本發(fā)明還提供一種對(duì)黑色素瘤起源的癌癥進(jìn)行分類的方法,該方法包括,測(cè)量來(lái)自受試者的樣本中選自由SEQ ID NOS :6,15,17,沈,41,46組成的組的核酸序列的相對(duì)豐度,或與所述核酸序列具有至少約80%同一性的序列的相對(duì)豐度;其中,所述核酸序列的豐度表明黑色素瘤起源的癌癥。本發(fā)明還提供一種對(duì)腎起源的癌癥進(jìn)行分類的方法,該方法包括,測(cè)量來(lái)自受試者的樣本中選自由SEQ ID NOS :6,7,15,17,26,41,46,47組成的組的核酸序列的相對(duì)豐度, 或與所述核酸序列具有至少約80%同一性的序列的相對(duì)豐度;其中,所述核酸序列的豐度表明腎起源的癌癥。本發(fā)明還提供一種對(duì)腦起源的癌癥進(jìn)行分類的方法,該方法包括,測(cè)量來(lái)自受試者的樣本中選自由SEQ ID NOS :6,7,15,17,26,41,46,47組成的組的核酸序列的相對(duì)豐度, 或與所述核酸序列具有至少約80%同一性的序列的相對(duì)豐度;其中,所述核酸序列的豐度表明腦起源的癌癥。本發(fā)明還提供一種對(duì)腦星形膠質(zhì)細(xì)胞瘤起源的癌癥進(jìn)行分類的方法,該方法包括,測(cè)量來(lái)自受試者的樣本中選自由SEQ ID NOS :6,7,10,15,17,26,41,46,47組成的組的核酸序列的相對(duì)豐度,或與所述核酸序列具有至少約80%同一性的序列的相對(duì)豐度;其中,所述核酸序列的豐度表明腦星形膠質(zhì)細(xì)胞瘤起源的癌癥。本發(fā)明還提供一種對(duì)腦少突膠質(zhì)細(xì)胞瘤起源的癌癥進(jìn)行分類的方法,該方法包括,測(cè)量來(lái)自受試者的樣本中選自由SEQ ID NOS :6,7,10,15,17,26,41,46,47組成的組的核酸序列的相對(duì)豐度,或與所述核酸序列具有至少約80%同一性的序列的相對(duì)豐度;其中,所述核酸序列的豐度表明腦少突膠質(zhì)細(xì)胞瘤起源的癌癥。本發(fā)明還提供一種對(duì)甲狀腺髓樣起源的癌癥進(jìn)行分類的方法,該方法包括,測(cè)量來(lái)自受試者的樣本中選自由SEQ ID NOS :6,17-19,24,沈,32,41,42組成的組的核酸序列的相對(duì)豐度,或與所述核酸序列具有至少約80%同一性的序列的相對(duì)豐度;其中,所述核酸序列的豐度表明甲狀腺髓質(zhì)起源的癌癥。本發(fā)明還提供一種對(duì)肺類癌起源的癌癥進(jìn)行分類的方法,該方法包括,測(cè)量來(lái)自受試者的樣本中選自由SEQ ID NOS :3,6,17-19,M,26,32,36,41,42組成的組的核酸序列的相對(duì)豐度,或與所述核酸序列具有至少約80%同一性的序列的相對(duì)豐度;其中,所述核酸序列的豐度表明肺類癌起源的癌癥。本發(fā)明還提供一種對(duì)肺小細(xì)胞癌起源的癌癥進(jìn)行分類的方法,該方法包括,測(cè)量來(lái)自受試者的樣本中選自由SEQ ID NOS :3,6,17-19,24,26,32,36,41,42組成的組的核酸序列的相對(duì)豐度,或與所述核酸序列具有至少約80%同一性的序列的相對(duì)豐度;其中,所述核酸序列的豐度表明肺小細(xì)胞癌起源的癌癥。本發(fā)明還提供一種對(duì)結(jié)腸起源的癌癥進(jìn)行分類的方法,該方法包括,測(cè)量來(lái)自受試者的樣本中選自由 SEQ ID NOS :1,3,4,6,17-19,21,26,29,34,37,41,42,48 組成的組的核酸序列的相對(duì)豐度,或與所述核酸序列具有至少約80%同一性的序列的相對(duì)豐度;其中,所述核酸序列的豐度表明結(jié)腸起源的癌癥。本發(fā)明還提供一種對(duì)胃起源的癌癥進(jìn)行分類的方法,該方法包括,測(cè)量來(lái)自受試者的樣本中選自由 SEQ ID NOS :1,3,4,6,17-19,21,26,29,34,37,41,42,48 組成的組的核酸序列的相對(duì)豐度,或與所述核酸序列具有至少約80%同一性的序列的相對(duì)豐度;其中, 所述核酸序列的豐度表明胃起源的癌癥。本發(fā)明還提供一種對(duì)胰腺起源的癌癥進(jìn)行分類的方法,該方法包括,測(cè)量來(lái)自受試者的樣本中選自由SEQ ID NOS :1,3,6,17-19,21,26,28,29,33,37,41,42組成的組的核酸序列的相對(duì)豐度,或與所述核酸序列具有至少約80%同一性的序列的相對(duì)豐度;其中, 所述核酸序列的豐度表明了胰腺起源的癌癥。本發(fā)明還提供一種對(duì)膽道起源的癌癥進(jìn)行分類的方法,該方法包括,測(cè)量來(lái)自受試者的樣本中選自由 SEQ ID NOS :1,3,6,9,17-19,21,25,26,28,29,33,37,41,42 組成的組的核酸序列的相對(duì)豐度,或與所述核酸序列具有至少約80%同一性的序列的相對(duì)豐度;其中,所述核酸序列的豐度表明膽道起源的癌癥。本發(fā)明還提供一種對(duì)前列腺起源的癌癥進(jìn)行分類的方法,該方法包括,測(cè)量來(lái)自受試者的樣本中選自由SEQ ID NOS 3,6,17-21,沈,41,42組成的組的核酸序列的相對(duì)豐度,或與所述核酸序列具有至少約80%同一性的序列的相對(duì)豐度;其中,所述核酸序列的豐度表明前列腺起源的癌癥。本發(fā)明還提供一種對(duì)卵巢起源的癌癥進(jìn)行分類的方法,該方法包括,測(cè)量來(lái)自受試者的樣本中選自由SEQ ID NOS 3,5,6,11,17-21,26,30,41,42組成的組的核酸序列的相對(duì)豐度,或與所述核酸序列具有至少約80%同一性的序列的相對(duì)豐度;其中,所述核酸序列的豐度表明卵巢起源的癌癥。本發(fā)明還提供一種對(duì)卵巢子宮內(nèi)膜樣起源的癌癥進(jìn)行分類的方法,該方法包括, 測(cè)量來(lái)自受試者的樣本中選自由SEQ ID NOS :2,3,5,6,11,17-22,26,30,41,42組成的組的核酸序列的相對(duì)豐度,或與所述核酸序列具有至少約80%同一性的序列的相對(duì)豐度;其中,所述核酸序列的豐度表明卵巢子宮內(nèi)膜樣起源的癌癥。本發(fā)明還提供一種對(duì)卵巢漿液性起源的癌癥進(jìn)行分類的方法,該方法包括,測(cè)量來(lái)自受試者的樣本中選自由SEQ ID NOS :2,3,5,6,11,17-22,26,30,41,42組成的組的核酸序列的相對(duì)豐度,或與所述核酸序列具有至少約80%同一性的序列的相對(duì)豐度;其中,所述核酸序列的豐度表明卵巢漿液性起源的癌癥。本發(fā)明還提供一種對(duì)乳腺起源的癌癥進(jìn)行分類的方法,該方法包括,測(cè)量來(lái)自受試者的樣本中選自由SEQ ID NOS :3,5,6,11,17-22,26,30,39,41,42組成的組的核酸序列的相對(duì)豐度,或與所述核酸序列具有至少約80%同一性的序列的相對(duì)豐度;其中,所述核酸序列的豐度表明乳腺起源的癌癥。本發(fā)明還提供一種對(duì)肺腺癌起源的癌癥進(jìn)行分類的方法,該方法包括,測(cè)量來(lái)自受試者的樣本中選自由 SEQ ID NOS :3,5,6,8,11,16-22,26,27,30,37,39,41,42 組成的組的核酸序列的相對(duì)豐度,或與所述核酸序列具有至少約80%同一性的序列的相對(duì)豐度;其中,所述核酸序列的豐度表明肺腺癌起源的癌癥。本發(fā)明還提供一種對(duì)乳頭狀甲狀腺起源的癌癥進(jìn)行分類的方法,該方法包括,測(cè)量來(lái)自受試者的樣本中選自由 SEQ ID NOS :3,5,6,8,11,16-22, 26, 27, 29, 30, 37-39,41,42 組成的組的核酸序列的相對(duì)豐度,或與所述核酸序列具有至少約80%同一性的序列的相對(duì)豐度;其中,所述核酸序列的豐度表明乳頭狀甲狀腺起源的癌癥。本發(fā)明還提供一種對(duì)濾泡甲狀腺起源的癌癥進(jìn)行分類的方法,該方法包括,測(cè)量來(lái)自受試者的樣本中選自由 SEQ ID NOS =3,5,6,8,11,16-22,26,27,29,30, 37-39,41,42 組成的組的核酸序列的相對(duì)豐度,或與所述核酸序列具有至少約80%同一性的序列的相對(duì)豐度;其中,所述核酸序列的豐度表明濾泡甲狀腺起源的癌癥。
本發(fā)明還提供一種對(duì)胸腺起源的癌癥進(jìn)行分類的方法,該方法包括,測(cè)量來(lái)自受試者的樣本中選自由 SEQ ID NOS :3,5,6,11,16-22,26,27,29,30,35,39,41,42 組成的組的核酸序列的相對(duì)豐度,或與所述核酸序列具有至少約80%同一性的序列的相對(duì)豐度;其中,所述核酸序列的豐度表明胸腺起源的癌癥。本發(fā)明還提供一種對(duì)膀胱起源的癌癥進(jìn)行分類的方法,該方法包括,測(cè)量來(lái)自受試者的樣本中選自由 SEQ ID NOS :3-6,11,16-22,26,27,29,30,35,39,41,42,44 組成的組的核酸序列的相對(duì)豐度,或與所述核酸序列具有至少約80%同一性的序列的相對(duì)豐度;其中,所述核酸序列的豐度表明膀胱起源的癌癥。本發(fā)明還提供一種對(duì)肺鱗狀起源的癌癥進(jìn)行分類的方法,該方法包括,測(cè)量來(lái)自受試者的樣本中選自由 SEQ ID NOS :3-6,11,16-23,洸,27,四,30,32,35,39,41,42,44 組成的組的核酸序列的相對(duì)豐度,或與所述核酸序列具有至少約80%同一性的序列的相對(duì)豐度;其中,所述核酸序列的豐度表明肺鱗狀起源的癌癥。本發(fā)明還提供一種對(duì)頭頸起源的癌癥進(jìn)行分類的方法,該方法包括,測(cè)量來(lái)自受試者的樣本中選自由 SEQ ID NOS 3-6,11,14,16-23,26,27,29,30,32,35,37,39,41,42, 44,45組成的組的核酸序列的相對(duì)豐度,或與所述核酸序列具有至少約80%同一性的序列的相對(duì)豐度;其中,所述核酸序列的豐度表明頭頸起源的癌癥。本發(fā)明還提供一種對(duì)食管起源的癌癥進(jìn)行分類的方法,該方法包括,測(cè)量來(lái)自受試者的樣本中選自由 SEQ ID NOS 3-6,11,14,16-23,26,27,29,30,32,35,37,39,41,42, 44,45組成的組的核酸序列的相對(duì)豐度,或與所述核酸序列具有至少約80%同一性的序列的相對(duì)豐度;其中,所述核酸序列的豐度表明食管起源的癌癥。根據(jù)一些實(shí)施方式,所述核酸序列的表達(dá)圖譜或相對(duì)豐度通過(guò)選自由核酸雜交和核酸擴(kuò)增組成的組中的方法確定。根據(jù)一些實(shí)施方式,所述核酸雜交使用固相核酸生物芯片(biochip)陣列或原位雜交進(jìn)行。根據(jù)一些實(shí)施方式,所述核酸擴(kuò)增方法為實(shí)時(shí)PCR。所述實(shí)時(shí)PCR方法可包括正向引物和反向引物。根據(jù)一些實(shí)施方式,所述正向引物包括選自由SEQ ID NOS :50-98和150 組成的組中的序列。根據(jù)一些實(shí)施方式,所述反向引物包括SEQ ID N0:288。根據(jù)另外的實(shí)施方式,所述實(shí)時(shí)PCR方法還包括探針。根據(jù)一些實(shí)施方式,所述探針包括選自由與選自SEQ ID NOS 1-49中的序列互補(bǔ)的序列所組成的組中的序列;或這些序列的片段和與它們具有至少約80%同一性的序列。根據(jù)另外的實(shí)施方式,所述探針包括選自由SEQ ID NOS =99-149和151組成的組中的序列。根據(jù)另一個(gè)方面,本發(fā)明提供用于癌癥分類的試劑盒,該試劑盒含有探針,該探針含有由與選自SEQ ID NOS 1-49的序列互補(bǔ)的序列組成的組中的序列;它們的片段和與它們具有至少約80%同一性的序列。根據(jù)另外的實(shí)施方式,所述探針含有選自由SEQ ID NOS :99-149和151組成的組中的序列。根據(jù)某些實(shí)施方式,所述癌癥選自由肝癌,膽道癌,肺癌,膀胱癌,前列腺癌,乳腺癌,結(jié)腸癌,卵巢癌,睪丸癌,胃癌,甲狀腺癌,胰臟癌,腦癌,頭頸癌,腎癌,黑色素瘤,胸腺癌和食管癌組成的組。本發(fā)明的這些和其他實(shí)施方式將會(huì)通過(guò)以下的圖,描述和權(quán)利要求書進(jìn)一步明確。
圖IA-圖IC示出了二元決策樹分類器的結(jié)構(gòu),有沈個(gè)節(jié)點(diǎn)(編號(hào)見表3)和27 個(gè)葉。每個(gè)節(jié)點(diǎn)是兩套樣本的二元決策,所述兩套樣品位于該節(jié)點(diǎn)的左側(cè)和右側(cè)。一系列的二元決策,從節(jié)點(diǎn)l(n0de#l)開始向下,導(dǎo)出一種可能的腫瘤類型,為所述樹的“葉”。樣本在節(jié)點(diǎn)1被分類到左分支,繼續(xù)到節(jié)點(diǎn)2,否則到節(jié)點(diǎn)3。樣本到達(dá)節(jié)點(diǎn)2,在節(jié)點(diǎn)2進(jìn)一步分類到左分支,被指定為“肝”類,或者在節(jié)點(diǎn)2進(jìn)入右分支,被指定為“膽道癌”類。在連續(xù)性的節(jié)點(diǎn),利用微RNA表達(dá)水平做出決策,直到到達(dá)終點(diǎn)(end-point)(所述樹的“葉”),則表明了這個(gè)樣本的預(yù)測(cè)類。在具體的所述樹結(jié)構(gòu)中,訓(xùn)練集(training set)數(shù)據(jù)中觀察到的性質(zhì)還要結(jié)合臨床病理學(xué)的考慮。開發(fā)不同的分類器,如針對(duì)男性和女性案例或針對(duì)不同的腫瘤位點(diǎn),會(huì)影響利用測(cè)量數(shù)據(jù)的效率并需要龐大數(shù)量的樣本。作為替代的,考慮幾種特殊案例作為例外對(duì)于來(lái)自女性患者的樣本,睪丸或前列腺起源會(huì)從KNN數(shù)據(jù)庫(kù)中排除,決策樹中,在節(jié)點(diǎn)3和節(jié)點(diǎn) 16會(huì)自動(dòng)選擇右分支。對(duì)于來(lái)自男性患者的樣本,排除卵巢起源,在節(jié)點(diǎn)17選擇右分支。 對(duì)于已經(jīng)確定惡性轉(zhuǎn)移到肝的樣本,肝起源(來(lái)自肝臟內(nèi)的肝細(xì)胞癌和膽道癌)被排除,在節(jié)點(diǎn)1選擇右分支。對(duì)于已經(jīng)確定為腦轉(zhuǎn)移癌的樣本,排除腦起源,在節(jié)點(diǎn)7選擇右分支。 在不損害完整性或需要重新訓(xùn)練分類器時(shí),可向分類決策中引入額外的信息。圖2示出了在決策樹節(jié)點(diǎn)#1的二元決策。當(dāng)訓(xùn)練針對(duì)給定節(jié)點(diǎn)的決策算法時(shí),僅有來(lái)自該節(jié)點(diǎn)可能的輸出(“葉”)的類中的樣本被用于訓(xùn)練。利用線性分類器(斜線)的 hsa-miR-200c (SEQ ID NO :26)和hsa-miR-122 (SEQ IDNO 6)(有一個(gè)異常值)的表達(dá)水平, 起源于節(jié)點(diǎn)1的左分支的組織的腫瘤,包括“肝”類和“膽道”類(肝-膽道,菱形)很容易和非肝非膽道起源的腫瘤(節(jié)點(diǎn)2的右分支,灰色方塊)區(qū)分開來(lái)。圖3示出了決策樹節(jié)點(diǎn)5的二元決策。利用has-miR_200c (SEQ ID NO :26)和 has-miR-148b (SEQ ID NO 17)的表達(dá)水平,很容易將上皮起源的腫瘤(節(jié)點(diǎn)5的左分支, 菱形標(biāo)識(shí))和非上皮起源的腫瘤(節(jié)點(diǎn)5的右分支,方塊標(biāo)識(shí))區(qū)分開來(lái)?;疑珔^(qū)域(高水平的haS-miR-200c)表示被分類為上皮(在該節(jié)點(diǎn)的左分支)的區(qū)域。圖4示出了決策樹節(jié)點(diǎn)7的二元決策。利用has-miR_124(SEQ ID NO :7)和 has-miR-9*(SEQ ID NO :47)的表達(dá)水平,很容易將腦起源的腫瘤(菱形)和腎起源的腫瘤 (方塊)區(qū)分開來(lái)。圖5示出了決策樹節(jié)點(diǎn)10的二元決策。利用has-miR_200a(SEQ ID NO :24)和 has-miR-222 (SEQ ID NO 32)的表達(dá)水平,很容易將肺起源的神經(jīng)內(nèi)分泌腫瘤(菱形)和甲狀腺髓樣起源的腫瘤(方型)區(qū)分開來(lái)。圖6示出了決策樹節(jié)點(diǎn)12的二元決策。利用has-miR_106a(SEQ ID NO 3)和 has-miR-192(SEQ ID NO :21)的表達(dá)水平,很容易將胃腸道起源的腫瘤(節(jié)點(diǎn)12的左分支, 菱形標(biāo)識(shí))與非消化系統(tǒng)起源的腫瘤(節(jié)點(diǎn)12的右分支,方塊標(biāo)識(shí))區(qū)分開來(lái)。圖7示出了決策樹節(jié)點(diǎn)16的二元決策。利用has-miR_185(SEQ ID NO :20)和 has-miR-375 (SEQ ID NO 42)的表達(dá)水平,很容易將前列腺起源的腫瘤(節(jié)點(diǎn)16的左分支, 菱形標(biāo)識(shí))和其他起源的腫瘤(節(jié)點(diǎn)16的右分支,方塊標(biāo)識(shí))區(qū)分開來(lái)。
圖8A-圖8B示出了分類實(shí)例。圖8A顯示比較has_miR-200c (SEQ ID NO :26)和 has-miR-122(SEQ ID NO 6)的測(cè)量水平(歸一化的Ct,與log(豐度)成反比)用于所有的訓(xùn)練集樣本,表明節(jié)點(diǎn)1的左分支和右分支(分別為圓圈和星形)。一個(gè)從大腦切下的轉(zhuǎn)移腫瘤(方塊),來(lái)自于患有肺部并發(fā)腫瘤的患者,因此起初被診斷為肺癌。然而,這個(gè)樣本表現(xiàn)出非典型的has-miR-122的高表達(dá),這是個(gè)很強(qiáng)的肝癌標(biāo)志物,故而被微RNA分類器分類為可能起源于肝。圖8B顯示通過(guò)免疫組織化學(xué)法重新檢查這個(gè)腦轉(zhuǎn)移腫瘤(在不知道微RNA診斷結(jié)果前提下),發(fā)現(xiàn)該腫瘤實(shí)際上為肺特異性標(biāo)識(shí)物陰性該樣品對(duì)于CK7和 TTFl,以及CK20、CEA、CA125、s_100、甲狀腺球蛋白、嗜鉻粒蛋白、突觸素、CD56、GFAP、降鈣素和垂體前葉激素組化染色均為陰性,而用CAM5. 5’和AE1/AE3染色則為陽(yáng)性。這染色模式與肝細(xì)胞癌吻合,進(jìn)一步促使HEPAl和甲胎蛋白染色。用這兩種染色腫瘤也是陽(yáng)性,與診斷為肝細(xì)胞癌一致(圖8B)。H&E染色(上圖)顯示轉(zhuǎn)移是由具有豐富的嗜酸性粒細(xì)胞細(xì)胞質(zhì)和圓形至橢圓形核的一片細(xì)胞組成。在許多用于評(píng)估腫瘤起源的免疫染色中,HEPA-I 表現(xiàn)強(qiáng)且特異性的免疫陽(yáng)性(下圖)。
具體實(shí)施例方式確定腫瘤的起源組織對(duì)其管理是至關(guān)重要的。本發(fā)明部分基于特異性核酸序列的發(fā)現(xiàn),所述核酸序列能用于確定腫瘤的起源組織。本發(fā)明提供一種敏感、特異和精確的方法,該方法可以用來(lái)區(qū)分不同的組織和腫瘤起源。發(fā)展了新的基于微RNA的分類器,令人驚訝的是,該分類器僅用少量的48個(gè)微RNA標(biāo)志物就可以確定腫瘤的起源組織。該分類器利用特殊的算法,清晰地解釋了特異性標(biāo)志物。高可信度的預(yù)測(cè)達(dá)到90%的靈敏度和99%的特異性。根據(jù)本發(fā)明,所述分類樹中的每個(gè)節(jié)點(diǎn)可作為獨(dú)立的差異診斷工具,比如,可以用于確定不同類型的肺癌。使用少量的標(biāo)識(shí)物的實(shí)施展示了微RNA作為組織特異性癌癥標(biāo)志物的效用,提供了促進(jìn)CUP診斷,更具體的確定轉(zhuǎn)移癌的起源的有效手段。區(qū)分不同腫瘤起源的可能性促進(jìn)了為患者提供最佳最妥的治療。本發(fā)明提供了診斷試驗(yàn)和方法,通過(guò)比較本發(fā)明的特異性microRNA分子的水平, 既可定性也可定量地對(duì)癌癥進(jìn)行檢測(cè)、診斷、監(jiān)測(cè)、分期和預(yù)測(cè)。所述水平優(yōu)選在活體樣本、 腫瘤樣本、細(xì)針穿刺(FNA)、細(xì)胞、組織和/或體液中的至少一種中測(cè)得。本發(fā)明提供一種方法,該方法通過(guò)分析活檢樣本、腫瘤樣本、細(xì)胞、組織或體液中的所述微RNA的水平,來(lái)診斷特定癌癥的存在與否。本發(fā)明中,測(cè)定活檢樣本、腫瘤樣本、細(xì)胞、組織或體液中所述微RNA的水平,特別適用于區(qū)分不同的癌癥。本發(fā)明的所有方法可選的還包括測(cè)量其他癌癥標(biāo)志物的水平。除所述的微RNA分子外,可用于本發(fā)明的其他癌癥標(biāo)志物依賴于被檢測(cè)的癌癥,且這些其他癌癥標(biāo)志物均為本領(lǐng)域技術(shù)人員公知??捎糜跍y(cè)定來(lái)自患者的樣本中的基因(例如本發(fā)明的所述核酸序列)表達(dá)水平的試驗(yàn)技術(shù)為本領(lǐng)域技術(shù)人員公知。這樣的試驗(yàn)方法包括并不限于逆轉(zhuǎn)錄PCR(RT-PCR)JS 酸微陣列,生物芯片分析,免疫組化試驗(yàn),原位雜交試驗(yàn),競(jìng)爭(zhēng)結(jié)合試驗(yàn),Northern blot分析和酶聯(lián)免疫試驗(yàn)(ELISA)。
根據(jù)一種實(shí)施方式,試驗(yàn)基于從FFPE轉(zhuǎn)移腫瘤組織中提取的RNA中48種微RNA 的表達(dá)水平。該測(cè)試使用定量實(shí)時(shí)逆轉(zhuǎn)錄聚合酶鏈?zhǔn)椒磻?yīng)(qRT-PCR)。RNA首先多聚腺嘌呤化,然后用通用多聚T適配子進(jìn)行反轉(zhuǎn)錄生成cDNA。該cDNA用特異性正向引物和通用的反向引物(和多聚T適配子5’末端序列互補(bǔ)),用特異性MGB探針檢測(cè)(見表1中的特異性序列)。通過(guò)表達(dá)水平以推斷樣本起源的分析技術(shù)包括但不局限于決策樹分類器,邏輯回歸分類器,線性回歸分類器,近鄰分類器(包括K近鄰),神經(jīng)網(wǎng)絡(luò)分類器和近重心分類表達(dá)水平根據(jù)預(yù)先定義的二元決策樹(使用訓(xùn)練集定義)做出二元決策(在每個(gè)相關(guān)節(jié)點(diǎn))。在每一個(gè)節(jié)點(diǎn),將一個(gè)或多個(gè)微RNA的表達(dá)進(jìn)行結(jié)合,公式為P = exp(b0+b I*mirl+b2*mir2+b3*mir3. · ·),其中,b0、bl、b2....的數(shù)值和微RNA都是預(yù)先測(cè)定的(用訓(xùn)練集)。得到的P將和閾值水平PTH(也是用訓(xùn)練集測(cè)定)進(jìn)行比較,根據(jù)這個(gè)節(jié)點(diǎn)的P 值是大于PTH還是小于PTH來(lái)決定分類繼續(xù)往左分支進(jìn)行還是往右分支進(jìn)行。這樣繼續(xù)下去,直到到達(dá)樹的終點(diǎn)(“葉”)。訓(xùn)練樹的算法是指要測(cè)定該樹的結(jié)構(gòu)(節(jié)點(diǎn)是什么和節(jié)點(diǎn)兩側(cè)是什么),在每個(gè)節(jié)點(diǎn)處使用時(shí)1^和130、131、132...及PTH的值。這些要由機(jī)器學(xué)習(xí)和診斷算法的專家通過(guò)結(jié)合機(jī)器學(xué)習(xí),優(yōu)化算法,試驗(yàn)和誤差來(lái)測(cè)定。在本發(fā)明一些實(shí)施方式中,相關(guān)性和/或分層集群可以用來(lái)評(píng)估特定樣本和不同癌癥樣本之間本發(fā)明的核酸序列表達(dá)水平的相似度。對(duì)任意一個(gè)或多個(gè)核酸序列的表達(dá)水平的閾值可設(shè)置用于指定樣本或癌癥樣本為兩組中的一組。或者,在優(yōu)選實(shí)施方式中,本發(fā)明的一個(gè)或多個(gè)核酸序列的表達(dá)水平通過(guò)例如邏輯回歸法組合以定義度量,然后與以前測(cè)量的樣本或與閾值進(jìn)行比較。指定的該閾值作為參數(shù)處理,其可用于定量被指定為每類的樣品的可信度。該指定的閾值的靈敏度和特異性還可以根據(jù)臨床的需要做調(diào)整。相對(duì)于參考數(shù)據(jù)的關(guān)聯(lián)值產(chǎn)生的連續(xù)的得分可被度量以提供關(guān)于樣本屬于特定類癌癥起源或種類的可能性的診斷信息。在多變量分析中,該微RNA簽名提供了高水平的預(yù)后信息。在另一優(yōu)選實(shí)施方式中,通過(guò)與訓(xùn)練集樣本進(jìn)行比較,所述核酸的表達(dá)水平用于對(duì)測(cè)試樣本進(jìn)行分類。在該實(shí)施方式中,測(cè)試樣本依次與每一個(gè)訓(xùn)練集樣本比較。每次這樣的兩兩比較都通過(guò)比較測(cè)試樣本和特定訓(xùn)練樣本中一個(gè)或多個(gè)核酸的表達(dá)水平來(lái)進(jìn)行。 每次這樣的兩兩比較都產(chǎn)生針對(duì)多種核酸的綜合度量(combined metric),其可由不同的數(shù)值方法進(jìn)行計(jì)算,如相關(guān)度、余弦、歐氏距離、均方距離、或任何本領(lǐng)域技術(shù)人員公知的其他方法。根據(jù)該度量,可對(duì)訓(xùn)練樣本排列,確認(rèn)獲得最高度量值的樣本(或最低值,根據(jù)度量的類型),表明這些就是與測(cè)試樣本最相近的樣本。通過(guò)選擇參數(shù)K,得到包括K訓(xùn)練樣本在內(nèi)的與測(cè)試樣本最接近的列表。然后,許多不同的方法都可以用于從該列表中驗(yàn)證預(yù)測(cè)的測(cè)試樣本類。在一種優(yōu)選實(shí)施方式中,測(cè)試樣本被預(yù)測(cè)與K最相似的訓(xùn)練樣本的列表所表現(xiàn)出的最高數(shù)值同屬一類(這個(gè)方法被稱為K近鄰法)。其他的實(shí)施方式可提供預(yù)測(cè)的列表,包括所有或部分該列表中表現(xiàn)出的類,這些類顯示出多于給定的次數(shù)或其他投票方案的最小值,這些類被歸類為一組。定義應(yīng)理解,本文中使用的術(shù)語(yǔ)僅為描述特定實(shí)施方式之用,并非意為受到限制。必須指出的是,用于本說(shuō)明書和隨附的權(quán)利要求數(shù)中的單數(shù)形式“a,” “an”和“the”除非另行標(biāo)明否則包括復(fù)數(shù)的所指對(duì)象。對(duì)于本文的數(shù)字范圍列舉,每個(gè)具有同樣精確度的中間數(shù)值都是明確被包括的。 例如,對(duì)于6-9的范圍,除6和9以外,數(shù)值7和8也是明確被包括的,以及對(duì)于6. 0-7. 0,數(shù)值 6. 0,6. 1,6. 2,6. 3,6. 4,6. 5,6. 6,6. 7,6. 8,6. 9,7. 0 是明確被包括的。約如本文所用的,“約”指+/_10%。附著的如本文所用的,“附著的”或“固定的”,涉及探針和固相支持物,意思是該探針和該固相支持物之間的結(jié)合在結(jié)合、洗滌、分析和去除條件下都足夠穩(wěn)定。所述結(jié)合可以是共價(jià)或非共價(jià)的。共價(jià)鍵可以在所述探針和所述固相支持物間直接形成,也可通過(guò)交聯(lián)劑、或在探針和固相支持物上或者在兩個(gè)分子上引入特異性活性基團(tuán)來(lái)形成。非共價(jià)結(jié)合可以為一個(gè)或多個(gè)靜電、親水性和疏水性相互作用。包括在非共價(jià)結(jié)合中的是在固相支持物上共價(jià)附著分子,如鏈霉親和素,然后生物素標(biāo)記的探針可以通過(guò)非共價(jià)鍵與鏈霉親和素結(jié)合。固相化也可涉及共價(jià)與非共價(jià)相互作用的組合。基線如本文所用的,“基線(base 1 ine) ”是指PCR的初始循環(huán),其中,熒光信號(hào)的變化不大。生物樣本如本文所用的,“生物樣本”意味著包括核酸的生物組織或液體的樣本。這些樣本包括但不僅限于,從受試者中分離的組織或液體。生物樣本也可包括組織的切片,如活檢和尸檢樣本,F(xiàn)FPE樣本,為組織學(xué)目的采取的冰凍切片,血液,血液組分,血漿,血清,痰,糞便, 眼淚,粘液,毛發(fā),皮膚,尿液,滲出液,腹水,羊水,唾液,腦脊液,宮頸分泌物,陰道分泌物, 子宮內(nèi)膜分泌物,胃腸道的分泌物,支氣管分泌物,細(xì)胞株,組織樣本,或乳房分泌物。生物樣本可由細(xì)針穿刺(FNA)提供。生物樣本可以是從受試者身上分離的細(xì)胞,但也可以使用以前分離的細(xì)胞(例如,在其他時(shí)間和/或用于其他目的,從其他人中分離的)完成,或用本文描述的體內(nèi)方法完成。也可使用存檔組織,如有治療或結(jié)果歷史的樣本。生物樣本還包括來(lái)自動(dòng)物或人體組織的植入物和原生和/或轉(zhuǎn)化的細(xì)胞培養(yǎng)物。癌癥術(shù)語(yǔ)“癌癥”是指包括所有類型的癌細(xì)胞的生長(zhǎng)或致癌過(guò)程,轉(zhuǎn)移組織或惡變的細(xì)胞,組織或器官,無(wú)論侵襲的病理組織學(xué)類型或階段。癌癥的例子包括,但不僅限于,實(shí)體瘤和白血病,包括APUD瘤(apudoma),迷芽瘤,鰓原瘤,惡性類癌綜合征,類癌心臟病,癌 (例如,沃克,基底細(xì)胞,鱗狀細(xì)胞基底細(xì)胞(basosquamous),布朗-皮爾斯,導(dǎo)管,埃利希腹水瘤,非小細(xì)胞肺癌(如肺鱗癌,肺腺癌和肺未分化大細(xì)胞癌),燕麥細(xì)胞,乳頭狀,細(xì)支氣管,支氣管,鱗狀上皮細(xì)胞,移行細(xì)胞),組織細(xì)胞紊亂,白血病(如B細(xì)胞,混合細(xì)胞,空細(xì)胞,T細(xì)胞,慢性T細(xì)胞,HTLV-II相關(guān),急性淋巴細(xì)胞,慢性淋巴細(xì)胞,肥大細(xì)胞和骨髓), 惡性組織細(xì)胞增生癥,霍奇金病,小免疫增生,非霍奇金淋巴瘤,漿細(xì)胞瘤,網(wǎng)狀內(nèi)皮組織增殖,黑色素瘤,軟骨母細(xì)胞瘤,軟骨瘤,軟骨肉瘤,纖維瘤,纖維肉瘤,巨細(xì)胞瘤,組織細(xì)胞瘤, 脂肪瘤,脂肪肉瘤,間皮瘤,粘液瘤,粘液肉瘤,骨瘤,骨肉瘤,尤文肉瘤,滑膜瘤,腺纖維瘤,腺淋巴瘤,癌肉瘤,脊索瘤,顱咽管瘤,無(wú)性細(xì)胞瘤,錯(cuò)構(gòu)瘤,間葉瘤,中腎瘤,肌肉瘤,成釉細(xì)胞瘤,牙骨質(zhì)瘤,牙瘤,畸胎瘤,胸腺瘤,滋養(yǎng)細(xì)胞腫瘤,腺癌,腺瘤,膽道癌,膽脂瘤,圓柱瘤, 囊腺癌,囊腺瘤,顆粒細(xì)胞瘤,兩性母細(xì)胞瘤,肝細(xì)胞瘤,汗腺腺瘤,胰島細(xì)胞瘤,睪丸間質(zhì)細(xì)胞瘤,乳頭狀瘤,塞特利氏細(xì)胞瘤,卵泡膜細(xì)胞瘤,平滑肌瘤,平滑肌肉瘤,成肌細(xì)胞瘤,肌肉瘤,橫紋肌瘤,橫紋肌肉瘤,室管膜瘤,神經(jīng)節(jié)細(xì)胞瘤,神經(jīng)膠質(zhì)瘤,髓母細(xì)胞瘤,腦膜瘤,神經(jīng)鞘瘤,神經(jīng)母細(xì)胞瘤,神經(jīng)上皮瘤,神經(jīng)纖維瘤,神經(jīng)瘤,副神經(jīng)節(jié)瘤,非嗜鉻副神經(jīng)節(jié)瘤, 血管角化瘤,與嗜酸性粒細(xì)胞浸潤(rùn)的血管淋巴增生,硬化性血管瘤,多發(fā)性血管瘤,血管球瘤,血管內(nèi)皮細(xì)胞瘤,血管瘤,血管外皮細(xì)胞瘤,血管肉瘤,淋巴管瘤,淋巴管肌瘤,淋巴管肉瘤,松果體瘤,癌肉瘤,軟骨肉瘤,囊性肉瘤,葉狀瘤,纖維肉瘤,血管肉瘤,平滑肌肉瘤,白色肉瘤,脂肪肉瘤,淋巴管肉瘤,肌肉瘤,粘液肉瘤,卵巢癌,橫紋肌肉瘤,肉瘤(例如,尤文,實(shí)驗(yàn),卡波西和肥大細(xì)胞),神經(jīng)纖維瘤病,宮頸非典型增生,和在其他條件下變成永生的或轉(zhuǎn)移的細(xì)胞。分類術(shù)語(yǔ)分類是指過(guò)程或算法,其中,根據(jù)項(xiàng)目?jī)?nèi)在特有的一種或多種性質(zhì)(所指如特點(diǎn),變量,特性,特征等等)的量化信息以及根據(jù)統(tǒng)計(jì)學(xué)模型和/或事先標(biāo)記該項(xiàng)目的訓(xùn)練集,將該項(xiàng)目劃分在組或類中?!胺诸悩洹本褪菍⒎诸惖淖兞縿澐值筋惖臎Q策樹?;パa(bǔ)本文所用的“互補(bǔ)”或“互補(bǔ)的”是指核酸分子中核苷或核苷類似物之間的核酸形成Watson-Crick(例如,A-T/U和C-G)或Hoogsteen堿基配對(duì)。完全互補(bǔ)或完全互補(bǔ)的指核酸分子中的核苷或核苷類似物的堿基對(duì)100%配對(duì)。在一些實(shí)施方式中,所述互補(bǔ)序列是反向的(5’ -3’)。CtCt信號(hào)代表PCR的第一循環(huán),其中,擴(kuò)增跨越熒光閾值(循環(huán)閾值)。因此,Ct值低代表微RNA豐度高或表達(dá)水平高。在一些實(shí)施方式中,所述PCR的Ct信號(hào)要?dú)w一化,這樣歸一化后的Ct值與表達(dá)水平成反比。在另外一些實(shí)施方式中,所述PCR的Ct信號(hào)可歸一化,然后反轉(zhuǎn),這樣反轉(zhuǎn)歸一化后的低Ct值代表微RNA的豐度低和表達(dá)水平低。數(shù)據(jù)處理程序如本文所用的,“數(shù)據(jù)處理程序”是指能利用軟件,確定所測(cè)數(shù)據(jù)的生物學(xué)意義的處理(即,試驗(yàn)或分析的最終結(jié)果)。比如基于采集的數(shù)據(jù),對(duì)數(shù)據(jù)的處理程序可以幫助確定起源組織。在本文的系統(tǒng)和方法中,所述數(shù)據(jù)處理程序還可以控制基于預(yù)定結(jié)果的數(shù)據(jù)采集程序。所述數(shù)據(jù)處理程序和數(shù)據(jù)采集程序能整合一起提供操作獲取數(shù)據(jù)的反饋,從而提供基于試驗(yàn)的判讀方法。數(shù)據(jù)集如本文所用的,術(shù)語(yǔ)數(shù)據(jù)集是指從分析中得到的數(shù)值。這些與分析相關(guān)的數(shù)值可被評(píng)估,例如峰高和曲線下面積。數(shù)據(jù)結(jié)構(gòu)如本文所用的,術(shù)語(yǔ)“數(shù)據(jù)結(jié)構(gòu),,指結(jié)合兩個(gè)或多個(gè)數(shù)據(jù)集的組合,在一個(gè)或多個(gè)數(shù)據(jù)集上應(yīng)用一種或多種數(shù)學(xué)運(yùn)算模式,以獲得一個(gè)或多個(gè)新的數(shù)據(jù)集,或操作兩個(gè)或多個(gè)數(shù)據(jù)集成為表格,來(lái)以新的方式提供可視化數(shù)據(jù)演示。分層集群就是操作兩個(gè)或多個(gè)數(shù)據(jù)集制得的數(shù)據(jù)結(jié)構(gòu)的例子。檢測(cè)“檢測(cè)”是指檢測(cè)樣本中的組分的存在。檢測(cè)也意味著檢測(cè)組分的不存在。檢測(cè)還意味著定量或定性地確定組分的水平。差異表達(dá)“差異表達(dá)”指在細(xì)胞和組織中,時(shí)間和/或空間上,基因表達(dá)的定性或定量的差異。因此,差異表達(dá)的基因可以定性的改變表達(dá)模式,包括激活或滅活,如正常組織相對(duì)于疾病組織。相對(duì)于其他的階段,基因可能在特定的階段被開啟或關(guān)閉,因此,這可用來(lái)比較兩個(gè)或多個(gè)階段。定量調(diào)控的基因會(huì)在某階段或細(xì)胞類型中展示出表達(dá)圖譜,可通過(guò)標(biāo)準(zhǔn)技術(shù)測(cè)出。有些基因可在一個(gè)階段或一種類型的細(xì)胞中表達(dá),而不會(huì)在兩者中都有。另外, 表達(dá)的差異可被量化,例如,如果表達(dá)被上調(diào)調(diào)節(jié),其結(jié)果是轉(zhuǎn)錄子量的增加,而下調(diào)的結(jié)果是轉(zhuǎn)錄子量的減少。表達(dá)水平的差異只要大到可以用標(biāo)準(zhǔn)的鑒定方法定量即可,比如表達(dá)陣列,定量逆轉(zhuǎn)錄PCR,northern blot分析,實(shí)時(shí)PCR,原位雜交和RNA酶保護(hù)試驗(yàn)。表達(dá)圖譜術(shù)語(yǔ)“表達(dá)圖譜”被廣泛使用包括基因組表達(dá)圖譜,例如,微RNA表達(dá)圖譜。圖譜可用任何能決定核酸序列水平的合適的方法生成,例如微RNA的定量雜交,微RNA標(biāo)記,微 RNA擴(kuò)增,cDNA等等。定量PCR,定量ELISA等都可用于分析兩組樣本中基因表達(dá)的差異。 受試者或患者的腫瘤樣本,例如,細(xì)胞或其收集物,例如組織,都可被試驗(yàn)。樣本可用任何本領(lǐng)域已知的方法進(jìn)行采集。感興趣的核酸序列是指被證實(shí)能夠預(yù)測(cè)的核酸序列,包括上述提供的核酸序列,表達(dá)圖譜可包括5,10,20,25,50,100或更多的核酸序列的表達(dá)數(shù)據(jù)。根據(jù)一些實(shí)施方式,術(shù)語(yǔ)“表達(dá)圖譜”是指測(cè)量核酸序列在所檢樣本中的相對(duì)豐度。表達(dá)率如本文所用的,“表達(dá)率”,是指通過(guò)檢測(cè)生物樣本中相關(guān)核酸的相對(duì)表達(dá)水平而決定出兩個(gè)或多個(gè)核酸的相對(duì)表達(dá)水平。FDR當(dāng)執(zhí)行多個(gè)統(tǒng)計(jì)測(cè)試時(shí),例如在多個(gè)數(shù)據(jù)特征上比較兩組之間的信號(hào),因組間的隨機(jī)差異可能達(dá)到被認(rèn)為具有統(tǒng)計(jì)學(xué)意義,會(huì)導(dǎo)致獲得假陽(yáng)性結(jié)果的可能性增加。為了限制這些假發(fā)現(xiàn)的比率,統(tǒng)計(jì)學(xué)意義僅被定義為數(shù)據(jù)特征的差別達(dá)到低于閾值的P-值(根據(jù)兩邊t-test),其依賴于實(shí)施測(cè)試的次數(shù)和在這些測(cè)試中得到的P-值的分布。片段本文所用的“片段”是指核酸的非全長(zhǎng)的部分,因此,片段本身也是核酸?;蛉绫疚乃玫模盎颉?,可以是天然的(例如基因組基因)或是合成的基因,其包括轉(zhuǎn)錄和/或翻譯調(diào)節(jié)序列和/或編碼區(qū)和/或非翻譯序列(例如,內(nèi)含子,5’-和3’-非翻譯序列)。所述基因編碼區(qū)可以是編碼氨基酸或功能RNA (比如tRNA、rRNA、催化RNA、 siRNA、miRNA或反義RNA)的核苷酸序列。基因也可以是mRNA或cDNA相應(yīng)的編碼區(qū)(比如,外延子和miRNA)可選擇性地含有與其連接的5’ -或3’ -非翻譯序列?;蛞部梢允求w外得到的擴(kuò)增的核酸分子,包括所有或部分編碼區(qū)和/或與其連接的5’ -或3’ -非翻譯序列。槽溝結(jié)合物/小溝結(jié)合物(MGB)“槽溝結(jié)合物”和/或“小溝結(jié)合物”,可交替使用,是指典型的能以序列特異性方式契合進(jìn)雙鏈DNA小溝的小分子。小溝結(jié)合物可以是長(zhǎng)的平面分子,可以采取類新月的形狀來(lái)緊貼契合進(jìn)雙螺旋的小溝,經(jīng)常取代水。小溝結(jié)合物分子通常含有由具有扭轉(zhuǎn)自由度的鍵連接的多個(gè)芳香環(huán),如呋喃,苯或吡咯環(huán)。小溝結(jié)合物可以是抗生素,如紡錘菌素,遠(yuǎn)霉素,重氮氨苯脒乙酰甘氨酸鹽,噴他脒和其他芳香聯(lián)脒,Hoechst 33258,SN 6999, 金霉類抗腫瘤藥物,如色霉素和光神霉素,CC-1065, DPI3(dihydrocyclopyrroloindole trip印tide),1,2-二氫-(3H)-吡咯并[3,2_e]吲哚_7_羧酸(CDPI3),及相關(guān)化合物和類似物,包括那些在《化學(xué)和生物學(xué)中的核酸》(第二版,布萊克本和步態(tài)編,牛津大學(xué)出版社, 1996年)和PCT
發(fā)明者N·羅森菲爾德, R·阿哈龍, S·羅森瓦爾德 申請(qǐng)人:姜橋