專利名稱:頭頸鱗癌分子分類診斷用小型化寡核苷酸芯片的制作方法
技術領域:
本發(fā)明涉及一種頭頸鱗癌分子分類診斷用小型化寡核苷酸芯片,以及一種頭頸鱗癌分子分類診斷方法。
背景技術:
頭頸鱗癌是一類多基因,多步驟性發(fā)生的疾病。由于該部位癌腫多位于或臨近重要的組織器官(如顱腦、上呼吸道、咀嚼、語言、聽覺、視覺及重要的神經(jīng)血管),因而手術切除安全范圍受到嚴重的制約,并且治療后患者多存在明顯的功能障礙和容貌的破壞。二十世紀末,口腔頜面部癌腫患者5年生存率達到60%左右,但晚期患者5年生存率僅為20-40%。這與腫瘤的異質性與生物學行為密切相關。早期診斷對提高頭頸鱗癌患者的生存率具有重要意義。而臨床上通用的組織病理分級系統(tǒng),主要依靠腫瘤的形態(tài)學特點進行腫瘤分型,其結果既不能準確地反映腫瘤的生物學特性和臨床特征,又無法對腫瘤進行早期正確的診斷。因此癌癥相關表達基因的鑒定對疾病的早期診斷十分重要。隨著人類基因組測序計劃的完成和高通量微陣列技術的發(fā)展,基因表達譜國外已經(jīng)用于鑒定某些腫瘤中特異性表達的基因(如惡性淋巴瘤),以此對腫瘤進行早期的分子分類診斷。這一技術成功的一個重要前提是芯片所設定的特異性基因群以及芯片對被測組織表達基因測試的敏感程度,對于多基因性疾病區(qū)分背景和那些低豐度的重要功能基因,它們十分重要。但目前市場已有的成品化寡核苷酸芯片,由于造價昂貴,檢測方法復雜,最重要的一點是缺乏組織特異性,限制了其進入臨床使用的可能。因此,市場上迫切需要有組織特異性的、小型化、專業(yè)化的寡核苷酸芯片。
由于生物芯片技術是一個新興起的領域,如何對生物芯片技術所獲取的數(shù)據(jù)進行分析,還缺乏有效和統(tǒng)一的方法。目前有大量的計算方法和統(tǒng)計學方法可對微陣列檢測結果進行分析,但這些方法都有自身的優(yōu)點和缺點。由這些方法獲得的微陣列結果的可靠性常常受到懷疑,除用傳統(tǒng)的分子生物學手段證實微陣列的結果外,有效而可靠的統(tǒng)計學方法也是生物芯片領域中的一個噬待解決的問題。
發(fā)明內容
本發(fā)明的目的在于提供一種頭頸鱗癌分子分類診斷用小型寡核苷酸芯片,其對頭頸鱗癌分子分類診斷的正確性好、敏感程度高。
本發(fā)明的再一目的,提供一種頭頸鱗癌分子分類方法,及其用途。
本發(fā)明一種頭頸鱗癌分子分類診斷用小型化寡核苷酸芯片,由與頭頸鱗癌顯著相關的一些基因序列構成相應的寡核苷酸探針,制備成小型化診斷用芯片,其特點是,所述探針為下列寡核苷酸序列,共代表39條基因,包括EMP1、CEACAM5、NA、ZNF185、ACPP、COL1A2、HPGD、TGM3、ITGA6、NMU、OPN、SCEL、COL1A1、COL4A2、KRT13、PPL、PP11、CYP3A5、PLAU、IL1RN、PITX1、MAL、BLNK、FN1、COL5A2、MMP1、MFAP2、SERPINH2、COL4A1、KRT4、LAGY、C5ORF13、FAPA、SPINK5、KIAA0790、DUSP5、PTHLH、GPX3、CEACAM1。
利用上述芯片的頭頸鱗癌分子分類方法建立頭頸鱗癌分子分類標準;綜合采用以下統(tǒng)計學方法和計算機算法獲得,包括傳統(tǒng)的統(tǒng)計學方法(t-test,Wilcoxon rank-sum test和配對t-test)、芯片顯著性分析(SAM)、Genespring軟件的分類預測方法,以及一種綜合分級系統(tǒng)(COM),包括minimal distance to ideal ranking(MDIR)和Weightedpunishment on overlap(WEPO);同時檢測標本中小型化寡核苷酸芯片上的39條探針的表達情況,并與頭頸鱗癌分子分類標準進行比較。
利用本發(fā)明芯片和上述頭頸鱗癌分子分類方法可用于頭頸鱗癌分子分類診斷方法,具體步驟包括,(1)標本收集收集病人的可疑癌變組織組織塊僅需約1cm3大小,放入液氮中保存;(2)RNA提取組織勻漿后加入預冷的Trizol,隨后采用氯仿抽提,異丙醇沉淀,并將沉淀溶解于不含RNAse的水中,純化,其特征在于RNA終濃度1μg/μl;(3)RNA標記和芯片雜交,純化后的RNA反轉錄合成cDNA的第一鏈,隨后采用poly(A+)合成cDNA雙鏈,雙鏈內同時引入了T7 RNA聚合酶的位點并采用體外轉錄反應(IVT),獲得生物素標記的cRNA探針;將15μg cRNA堿水解成35-200bp的片斷,隨后取10μg片斷化后的cRNA探針與權利要求1所述寡核苷酸芯片進行雜交、掃描、分析;其特征在于僅需要10μgRNA樣本。(4)不同芯片上各探針的信號值經(jīng)RMA均一化處理后,進行分子分類診斷的分析。
本發(fā)明的優(yōu)越性在于本發(fā)明頭頸鱗癌分子分類診斷用小型化寡核苷酸芯片對頭頸鱗癌密切相關基因表達情況的測試敏感度高,對多基因表達模式的算法可靠。結合頭頸鱗癌分子分類診斷標準,可以對頭頸鱗癌進行準確的早期分子分類診斷。
具體實施例方式
本發(fā)明所指的一種頭頸鱗癌分子分類診斷用小型化寡核苷酸芯片,由與頭頸鱗癌顯著相關的一些基因序列構成相應的寡核苷酸探針,制備成小型化診斷用芯片,其特征在于,所述探針為下列寡核苷酸序列,共代表39條基因,包括EMP1、CEACAM5、NA、ZNF185、ACPP、COL1A2、HPGD、TGM3、ITGA6、NMU、OPN、SCEL、COL1A1、COL4A2、KRT13、PPL、PP11、CYP3A5、PLAU、IL1RN、PITX1、MAL、BLNK、FN1、COL5A2、MMP1、MFAP2、SERPINH2、COL4A1、KRT4、LAGY、C5ORF13、FAPA、SPINK5、KIAA0790、DUSP5、PTHLH、GPX3、CEACAM1。
本發(fā)明所指的頭頸鱗癌分子分類方法,涉及建立頭頸鱗癌分子分類標準;綜合采用以下統(tǒng)計學方法和計算機算法獲得,包括傳統(tǒng)的統(tǒng)計學方法(t-test,Wilcoxon rank-sum test和配對t-test)、芯片顯著性分析(SAM)、Genespring軟件的分類預測方法,以及一種綜合分級系統(tǒng)(COM),包括minimal distance to ideal ranking(MDIR)和Weightedpunishment on overlap(WEPO);同時檢測標本中小型化寡核苷酸芯片上的39條探針的表達情況,并與頭頸鱗癌分子分類標準進行比較。
本發(fā)明所指的頭頸鱗癌分子分類診斷方法,可用多種統(tǒng)計學方法和計算機算法來分析頭頸鱗癌細胞相關的基因表達譜。如在用AffymetrixHG-U95Av2型基因芯片檢查了22對(44例)配對的頭頸鱗癌組織和正常上皮組織基因表達譜后,采用RMA(Robust Multi-chip Analysis)算法對各張芯片的數(shù)據(jù)結果進行均一化。隨后采用3種分析方法進行分析,包括傳統(tǒng)的統(tǒng)計學方法(t-test,Wilcoxon rank-sum test和配對t-test)、芯片顯著性分析(SAM)、Genespring軟件的分類預測方法、以及一種綜合分級系統(tǒng)(COM)、包括minimal distance to ideal ranking(MDIR)和Weighted punishment overlap(WEPO)。采用以上統(tǒng)計學方法和計算機算法,挑選出與頭頸鱗癌顯著相關的一些基因,合成相應的寡核苷酸探針,并制備小型的診斷化芯片,用于臨床標本的分子分類診斷。綜合使用上述各種統(tǒng)計學方法可以利用各種不同統(tǒng)計學方法和算法的優(yōu)點,以選擇那些只在腫瘤組織中顯著異常表達的基因。隨后,通過聚類分析和對靶探針分析、實時定量PCR對這些基因表達譜進行驗證。最終選擇了39條探針,而且發(fā)現(xiàn)通過檢測這39條探針的表達譜可正確區(qū)分頭頸鱗癌組織和正常組織。
本發(fā)明用于頭頸鱗癌分子分類診斷方法,具體步驟包括,(1)標本收集收集病人的可疑癌變組織組織塊僅需約1cm3大小,放入液氮中保存;(2)RNA提取組織勻漿后加入預冷的Trizol,隨后采用氯仿抽提,異丙醇沉淀,并將沉淀溶解于不含RNAse的水中,純化,其特征在于RNA終濃度1μg/μl;(3)RNA標記和芯片雜交,純化后的RNA反轉錄合成cDNA的第一鏈,隨后采用poly(A+)合成cDNA雙鏈,雙鏈內同時引入了T7 RNA聚合酶的位點并采用體外轉錄反應(IVT),獲得生物素標記的cRNA探針;將15μg cRNA堿水解成35-200bp的片斷,隨后取10μg片斷化后的cRNA探針與權利要求1所述寡核苷酸芯片進行雜交、掃描、分析;其特征在于僅需要10μgRNA樣本。(4)不同芯片上各探針的信號值經(jīng)RMA均一化處理后,進行分子分類診斷的分析。
針對材料和方法有下述步驟(1)組織收集22位患者,經(jīng)病理學診斷確診為鱗狀細胞癌,同時收集同一病人的腫瘤組織和配對的正常組織。組織塊切成約1cm3大小,切取標本后立即放入液氮中,隨后轉移至-80℃儲存。正常組織切取部位是腫瘤對側的正常粘膜。那些復發(fā)的患者或是接受過放療、化療的患者不納入實驗。腫瘤組織來源自頭頸部不同部位,包括不同的病理階段。
(2)RNA提取總RNA的提取是使用Trizol(Invitrogen)。標本勻漿后加入預冷的Trizol,隨后采用氯仿抽提,異丙醇沉淀,并將沉淀溶解于不含RNAse的水中。采用Rneasy的柱子進一步純化RNA。調整RNA至終濃度1μg/μl。每組組織使用的RNA起始量一致。
(3)RNA標記和芯片雜交純化后的RNA反轉錄合成cDNA的第一鏈,隨后采用poly(A+)合成cDNA雙鏈。雙鏈內同時引入了T7 RNA聚合酶的位點并采用體外轉錄反應(IVT),獲得生物素標記的cRNA探針。將15μg cRNA堿水解成35-200bp的片斷。隨后取10μg片斷化后的cRNA探針與HG-U95Av2的Genechip進行雜交、掃描、分析。掃描結果依次用MAS 5.0軟件,從原始的.DAT文件到.CEL文件,然后進一步采用RMA算法對不同芯片的檢測信號進行均一化處理。
(4)微陣列的結果統(tǒng)計分析方法和計算機分析不同芯片上各探針的信號值經(jīng)RMA均一化處理后,進行如下分析步驟1采用7種統(tǒng)計方法處理均一化的數(shù)據(jù)(a)t-test參數(shù)分析,方差不齊;(Parametric,variance not assumedequal)(b)Wilcoxon rank-sum testNon-parametric;(非參數(shù)分析)上述兩種檢驗方法是采用Gene spring軟件進行,用Benjamini和Hochberg校對(correction)來減低假陽性率。
(c)配對t-test(d)SAM(1.10)采用Stanford univ.提供得的軟件。
(e)預測用基因的挑選“class prediction”,是Genespring軟件中攜帶的一個功能。
(f)MDIR(g)WEPO步驟2將步驟1中的各種分析方法所獲得的結果分成3組,(A),(B),(C)三組(A)組包括步驟1(a),(b),(c)中按3種傳統(tǒng)的統(tǒng)計學方法挑選到的基因的交集。
(B)組包括步驟1(d),(e)中SAM和Class prediction所獲得的基因的交集。
(C)組COM framework的分級目錄(ranking list form COM framework)構成,稱為M,它由步驟1中(f)和(g)中MDIR所獲得的M1基因群和WEPO獲得的M2基因群共同組成。
COM Framework可以用于分析多探針表達情況。COM ranking list合并了MDIR和WEPO所獲得的M1和M2的ranking list,對每條探針取其rankings的平均值。M=COM(M1,M2)代表了M1和M2的聯(lián)合。
步驟3對步驟2中獲得的差異表達基因(A),(B),(C)求取交集,得到一群新的基因,理論上認為該群基因與頭頸鱗癌的關系最為密切,用其對頭頸鱗癌進行分子分類診斷最為可靠。
實時定量PCR參考NCBI網(wǎng)站上提供的探針序列,采用LC Probe Design軟件設計PCR用引物。所用引物序列如下EMP1(probe 37762_at)上游5’TGGGGAGTTGTTATGCC下游5’-GCACTAAGACAGCCTTCTCEACAM1(probe 36082)上游5’GAGGGAGGATGCTGGGACGTATT下游5’TGGGGAGGCTGAAGTTGGTTGTMMP1(probe 38428_at)上游5’NCACATGGTGTGAGTCC下游5’TGGCCTATAGAATCCATAAGCPLAU(probe 37310_at)上游5’ACTAACGACTTCAGGGC
下游5’AGTGAGGATTGGATGAACT實時定量PCR在Roche的LightCycler(LC)進行。采用RNAAmplification Kit SYBR Green I Kit。實驗按試劑盒提供方法進行。結果用LightCycler軟件分析。
挑選差異表達基因群步驟1每種分析方法的結果采用傳統(tǒng)的統(tǒng)計學分析方法(a,b,c),經(jīng)RMA算法處理過的信號值(所有的12626條探針)再經(jīng)Gene Spring和Gene Traffic提供的過濾功能對其進行初步過濾。
1.在所有44例樣品中,絕對信號值低于50者被過濾掉后,剩余探針10929條2.信號強度比值(腫瘤/正常)范圍(在所有44例標本中最大-最小)<2者被過濾掉后,剩余探針9802條。
聯(lián)合以上兩項過濾原則,最后選擇了9281條基因。采用Genespring軟件中的Benjamini and Hochberg correction以降低試驗中的假陽性率。隨后采用t-test和Wilcoxon rank-sum test處理數(shù)據(jù)。經(jīng)過參數(shù),方差不齊t-test,最終選擇到502條探針,其p<0.05。采用非參數(shù)Wilcoxin test,在p<0.01時,選擇到469條探針。在p<0.0001時,配對t-test選擇到464條探針。
微陣列顯著性分析(significant analysis of microarrays,SAM)這種方法被用來發(fā)現(xiàn)那些過表達或不表達的重要探針。使用如下參數(shù)response type=paired data;number of permutation-100 interpretation engine-k-nearest neighbors.在delta value=1.50940,fold change=2,false positive=0.52927時獲得182條探針。
“Predict Parameter Values”被用來選擇能預測腫瘤和正常標本的探針。試驗中使用所有的44(22×2)樣品作為訓練組,來進行自身預測。在使用所有未經(jīng)過濾的12626條探針進行預測時,當neighbor=10,cutoffP值=0.4,使用88-93條探針可獲得最佳效果在所有的44例樣品中,41例樣品能夠正確預測,3例樣品不能預測(沒有預測錯誤者);因此選擇了93條探針。
使用Ranking list的結果M=COM(M1,M2),M1和M2分別得自MDIR和WEPO。
步驟2各種分析方法的綜合結果7種統(tǒng)計結果按所用的統(tǒng)計學方法分成3組A 三種傳統(tǒng)的統(tǒng)計學方法(a,b,c)交集獲得246條探針。
B SAM法和Predictor genes算法(d,e)的交集獲得55條探針C 合并兩種分級算法(f,g)中顯著性最高的探針選擇到200探針。
步驟3最后選擇基因對步驟2中獲得的3群基因進一步分析,求取交集,最后得到42條基因探針。
對選擇到的基因進行驗證聚類分析對所有探針進行Unsupervised hierarchical clustering,發(fā)現(xiàn)對腫瘤和正常組織聚類結果并不理想。然而,用步驟3得到的42條基因可以清楚的區(qū)分腫瘤組織和正常組織。一些正常組織與腫瘤組織的聚類距離很近,可能是因為這些臨床上和組織病理上認為是“正?!钡慕M織可能已經(jīng)有了一些遺傳學上的變化,正在成為第二個原發(fā)癌,這一點在頭頸癌中已有報道。
同一基因的多探針檢測點分析在選擇到差異表達的42條探針中,27條基因在芯片上只有1個探針,其余15個探針對每條基因而言在芯片上有多個探針。其中3條基因對應的2個探針均被選擇到,因此,共計42條探針對應39條基因。
被重復選擇到的基因是1.ACPP2.SPP13.COL1A2在U95A芯片上,ACPP和SPP1基因只對應了2條探針。對這2條基因,他們所對應的2條探針均被各種統(tǒng)計學方法選擇到了。對其它的多探針基因,并不是所有的相關探針都被上述步驟3所選擇到。分析結果發(fā)現(xiàn),沒有選擇到的這些探針的變化趨勢和選擇到的探針是相同的。由此表明,我們在步驟3中的選擇方法是很嚴謹?shù)?。因為,一些差異表達基因如果差異的倍數(shù)不夠2倍,可能就不會被上述統(tǒng)計學方法所獲得。而且試驗中合成反義cRNA是從3’末端開始的,因此,5’末端一些片斷會丟失,導致一些探針檢測信號出現(xiàn)假陰性。
實時定量PCR為證實上述統(tǒng)計學方法和算法所獲得的基因芯片結果的可靠性,我們隨機在基因上調組和基因下調組中選擇了4條基因用實時定量PCR進行驗證。選擇基因如下MMP1,PLAU,EMP1,CEACM1。
PCR所用的引物是根據(jù)NCBI所提供的基因序列設計的。PCR的條件和產(chǎn)物的大小都經(jīng)過驗證。所獲得的PCR產(chǎn)物經(jīng)回收,測序。檢測了7對樣品,其中3對是做過芯片檢測的樣品,另外4對是新收集的樣品。結果發(fā)現(xiàn),一致性良好。
頭頸部惡性腫瘤如上唇癌,口腔癌,鼻咽口咽癌的病理類型一般都是屬于鱗癌。在發(fā)展中國家,約占了惡性腫瘤的第6位,全球發(fā)病率約為5000,000。這些腫瘤患者通常生存率較低,復發(fā)率較高,這很大程度上是由于晚期診斷引起。因此早期診斷對這些病人來說是提高其生存率和生存質量的重要方法。
頭頸鱗癌有明顯的地理學分布特點。大約3%發(fā)生在美國,50%發(fā)生在東南亞地區(qū)。這可能是由于不同的環(huán)境致癌因素引起的,如煙草,酒精,檳榔等。但是不同地區(qū)發(fā)病的頭頸鱗癌的生物學行為和對治療的反應卻基本相同。全世界范圍內頭頸鱗癌患者的總體生存率約為50%左右。頭頸鱗癌是一類多基因,多步驟性的疾病。因此癌癥相關表達基因的鑒定對早期診斷疾病十分重要。而傳統(tǒng)的方法分析組織中基因的表達情況卻十分麻煩,無法用于臨床。高通量微陣列技術的發(fā)現(xiàn)使快速全面分析基因表達譜成為可能。加上人類基因組測序計劃的完成,進一步為鑒定頭頸部正常上皮細胞惡變成鱗癌細胞的可能分子機制奠定了基礎,由此,也為對頭頸鱗癌進行分子分類診斷提供了可能。但全基因測試也存在嚴重缺點,一方面成本過高,無法廣泛用于臨床;另一方面,過多無關的基因檢測信號對重要功能基因的信號造成影響,甚至掩蓋有用的一些信息。因此如何使目前所有的全基因組掃描芯片真正做到小型化、特性化和專用化,一直以來是研究者們極為關心的課題。
很多研究者試圖利用高通量的方法檢測頭頸癌相關基因的表達譜。但是,這些研究往往用了很少的正常和腫瘤配對組織或細胞系。而且,如何從基因芯片所提供的大量表達譜信息中獲得重要的基因也是目前面臨的一大困難。采用單一的倍數(shù)改變或是利用信號值直接進行聚類分析,不能滿足研究者試圖對多樣品多基因進行比較的要求。因此,這引起了長期對芯片分析結果缺乏一致性。本發(fā)明提供了一種有效的多基因表達譜關鍵信息甄別和分析的方法。
目前使用的微陣列分析方法的優(yōu)點和缺點使用的參數(shù)檢驗如t-test等是根據(jù)正常和腫瘤組織中差異表達基因的平均值(配對t檢驗)或是平均值的差異進行分析。非參數(shù)統(tǒng)計方法,如Wilcoxin rank sum test(相當于Mann-Whitney test)是根據(jù)兩組數(shù)據(jù)ranksums的差異進行分析的。如果檢測樣本的變異系數(shù)符合正態(tài)分布,則參數(shù)分析的方法比較合適,但是,在多數(shù)情況下,檢測樣本都不符合正態(tài)分布。另一方面,如果這兩組數(shù)據(jù)的Rank sums能夠真實地反映樣品的特性、疾病的類型、生物學特性以及生理學特征化,非參數(shù)分析將是一個十分有利的工具。但是,rank sums的差異所代表的涵義卻很難評估,因為生物學體系本身十分復雜。SAM(significant analysis of microarrays)是一種常用于微陣列數(shù)據(jù)分析的有力工具。它采用一種稱為Balancedpermutations方法來測量預期基因表達和觀察到的變異之間的關系。SAM結合了參數(shù)統(tǒng)計和非參數(shù)統(tǒng)計方法的一些優(yōu)點,不需要假設樣品的表達成正態(tài)分布。該方法通過一種散點圖(SAM)分析觀測到的相對差異和與其真實差異間的關系,以鑒定那些可能重要的一些基因表達的改變。只要數(shù)據(jù)成balanced permutations,該統(tǒng)計學方法就很適合。因此所預期的相對差異,可以真實地反映標本的生理學特性和進行診斷。Class prediction是一種使用K-nearest neighbor為分類方法的輔助學習軟件,適合于尋找那些能夠區(qū)別正常標本和腫瘤標本的基因。但是這種方法受到所設模型參數(shù)和所測試樣品的較大限制。
MDIR和WEPO是一種分級評價系統(tǒng),能夠給每一條探針一個指定的分數(shù)。這兩種方法能夠根據(jù)每條探針所得分數(shù)對樣品分類。在求取樣品的評分總數(shù)時,不是使用常用的Wilcoxon分級評價方法來計算p值,而是通過計算評分標準和理想評分標準之間的距離來尋找差異表達的基因。MDIR(minimal distance to ideal ranking)通過計算最小相鄰交換距離,而WEPO(Weighted punishment on overlap)則求取任何相鄰樣品均一化Z值差異總和。MDIR和WEPO這兩種方法和非參數(shù)統(tǒng)計方法有同樣的缺點。
COM框架聯(lián)合使用MDIR和WEPO這兩種方法,以增加其適用性能。該方法的效果取決于選擇合適的分析方法如分級,計分,加權等方法的總和。
聚類分析在處理微陣列的數(shù)據(jù)時,特別是根據(jù)相似性和差異(指距離)對樣品進行分類時特別有用。但是,我們也充分認識到它是一種無管理性的非常主觀的統(tǒng)計方法。而且,它也不能提供基因表達差異方面的統(tǒng)計學信息。多種不同的方法可以測量這種距離,從而導致聚類結果的差異。因此,我們沒有使用這種圖像聚類的方法來鑒定差異表達的基因。本發(fā)明中,對我們的標本聚類(hierachical,比值采用Log2,在Genetraffic中進行),使用所有的探針或是過濾后的探針,來證實所選擇的探針是否能夠很好地將腫瘤標本和正常標本分成兩類。結果發(fā)現(xiàn)在使用選擇后的探針進行聚類時,腫瘤組織和正常標本聚類的結果十分清晰。
RT-PCR的結果與對樣品的微陣列檢測的結果完全一致。因此這一結果不僅證實了芯片結果的可靠性,而且表明我們選擇的探針的可用性。
42條探針中除去重復的探針,最后對應了39條基因。這39條基因可以被分成4組,其中一半以上已被證實與腫瘤發(fā)生有關。包括一些腫瘤相關基因或是在腫瘤發(fā)生中起作用的癌基因。
腫瘤相關抗原(TAA)類包括5條基因。他們與腫瘤發(fā)生有重要關系。Osteopontin,它的探針有2次入選,有文獻報道它可作為頭頸鱗癌預后相關的血清標志。CEACAM1和CEACAM5是CEA(癌胚抗原家族)和分子黏附相關家族中的成員。CEACAM1目前被研究得較為清楚,在前列腺癌,乳腺癌,結腸癌中是一種抑癌基因,在503位點上絲氨酸變成丙氨酸后,會導致其抑制生長功能的喪失。LAGY,在肺癌中顯著下調,因此被稱為是肺癌相關基因Y。EMP1是一種腫瘤膜蛋白,和腫瘤生長相關蛋白。在乳腺癌細胞系中發(fā)現(xiàn)它是一種腫瘤快速生長的標志物,與腫瘤細胞轉移相關。該基因的表達水平和腫瘤浸潤轉移的關系已引起重視。
在酶類,12條基因中的9條與腫瘤發(fā)生的關系已經(jīng)被證實。ACPP,也是兩條探針入選,是前列腺癌預后的一種血清標記物。蛋白裂解酶在降解細胞外基質中有重要作用,可加速腫瘤的浸潤和轉移。MMP1,PLAU和絲氨酸蛋白酶是蛋白裂解的主要酶類。MMP1也稱為膠原酶I,在惡性腫瘤中表達持續(xù)升高。PLAU在多種惡性腫瘤中屬于獨立判斷預后的一項指標。PP11(絲氨酸蛋白酶),SERPINH2和SPINK5(都是絲氨酸蛋白酶的抑制劑)被發(fā)現(xiàn)與腫瘤發(fā)生有關,或參與了腫瘤的浸潤。FAFP是絲氨酸蛋白酶的一個高度保守區(qū),它的表達常常與人惡性黑色素瘤和癌細胞浸潤生長有關。GPX3的高表達在卵巢癌中有過報道。TGM3參與組裝角細胞層(CE)的結構蛋白,這是復層鱗狀上皮終末分化的一個重要結構。這可能也解釋了它在鱗癌中低表達的原因。
在結構相關類基因中,11條基因中的5條已知與腫瘤相關。FN,隨著年齡增加在胞漿內和組織內表達增加,被推測與腫瘤生長有關。而且它的蛋白裂解產(chǎn)物被發(fā)現(xiàn)有潛在致癌性。SCEL是CE的一種前體。PPL是CE的另外一種成份,可與TGM交聯(lián)。CRK4和CRK13是細胞移動因子,在分化好的上皮細胞中出現(xiàn),因此在鱗癌中表達降低。
在這種分析方法中發(fā)現(xiàn)的一些其它基因也有報道直接或間接的參與了腫瘤的發(fā)生。C5ORF13,又稱為P311,在惡性膠質細胞瘤中有過表達。體外實驗證實了P311在惡性膠質細胞瘤中的作用。PTHLH基因的一個位點被認為與肺癌發(fā)病相關。而且,同一位點異常與腫瘤的預后密切相關。PTHLH也被認為與惡性腫瘤中內分泌性高血鈣有關。IL1RA被認為參與不同實體腫瘤的發(fā)生。PITX1,是一種轉錄因子,被報道在垂體腺瘤中表達下降。
經(jīng)過上述各種統(tǒng)計學方法和不同的算法,最后獲得了39條探針,并且一系列分析證實了這39條探針的可靠性。而且試驗發(fā)現(xiàn),利用這群探針可正確區(qū)分腫瘤和正常組織,也就是說可以作為頭頸部鱗癌分子分類診斷標準。
本發(fā)明方法的優(yōu)點采用頭頸鱗癌分子分類專用的小型診斷芯片替代傳統(tǒng)的高通量大芯片,顯著降低了成本,簡化了操作過程。該專用芯片的獲取系使用多種統(tǒng)計分析標準,多種統(tǒng)計學方法相結合A和B基因群的交集和COM框架(C基因群)。通過綜合使用這些方法,保留不同統(tǒng)計方法敏感性高的優(yōu)點(參數(shù)/非參數(shù)/混合參數(shù),差異平均值/平均值的差異),同時克服了不同統(tǒng)計學方法所帶來的假陽性率困擾。
針對39條基因分別設計的探針序列如下EMP1
tggaaaaactgtaccaacattagctgcagtgacagcctgtcatatgccagtgaagatgccctcaagacagtgcaggccttcatgattctctctatcatcttctgtgtcattgccctcctggtcttcgtgttccagctcttcaccatggagaagggaaaccggttcttcctctcaggggccaccacactggtgtgctggctgtgcattcttgtgggggtgtccatctacactagtcattatgcgaatcgtgatggaacgcagtatcaccacggctattcctacatcctgggctggatctgcttctgcttcagcttcatcatcggcgttctctatctggtcctgagaaagaaataaggccggacgagttcatggggatctggggggtggggaggaggaagccgttgaatctgggagggaagtggaggttgctgtacaggaaaaaccgagataggggaggggggagggggaagcaaaggggggaggtcaaatcccaaaccattactgaggggattctctactgccaagcccctgccctggggagaaagtagttggctagtactttgatgctcccttgatCEACAM5acagaaaagactctgaccagagatcgagaccatcctagccaacatcgtgaaaccccatctctactaaaaatacaaaaatgagctgggcttggtggcgcgcacctgtagtcccagttactcgggaggctgaggcaggagaatcgcttgaacccgggaggtggagattgcagtgagcccagatcgcaccactgcactccagtctggcaacagagcaagactccatctcaaaaagaaaagaaaagaagactctgacctgtactcttgaatacaagtttctgataccactgcactgtctgagaatttccaaaactttaatgaactaactgacagcttcatgaaactgtccaccaagatcaagcagagaaaataattaatttcatgggactaaatgaactaatgaggattgctgattctttaaatgtcttgtttcccagatttcaggaaactttttttcttttaagctatccactcttacagcaatttgataaaatatacttttgtgaacaaaaattgagacatttacattttctccctatgtggtcgctccagaNAatggccgcggcggctggcggacggctccggcaggagaagtaccggctcgtggtggtcggcgggggcggcgtgggcaagtcggcgctcaccatccagttcatccagtcctattttgtaacggattatgatccaaccattgaagattcttacacaaagcagtgtgtgatagatgacagagcagcccggctagatattttggatacagcaggacaagaagagtttggagccatgagagaacagtatatgaggactggcgaaggcttcctgttggtcttttcagtcacagatagaggcagttttgaagaaatctataactttcaaagacagattctcagagtaaaggatcgtgatgagttcccaatgattttaattggtaataaagcagatctggatcatcaaagacaggtaacacaggaagaaggacaacagttagcacggcagcttaaggtaacatacatggaggcatcagcaaagattaggatgaatgtagatcaagctttccatgaacttgtccgggttatcaggaaatttcaagagcaggaatgtcctccttcaccagaaccaacacggaaagaaaaagacaagaaaggctgccattgt
gtcattttctagZNF185tctccagtttctgagccctatgcacannnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnatcagagaggaacatnccatnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnantnccaactgctctncctnagctgtannnccccaacatcagacttggcacgtggtggacactaacacacaggcactcaatgaatgagtgaaggaaataaaagtcaccccgttggtgagaggtgctatccctgagtctcagtgcaggaccagtggatgaaaggcaaggtaaagaggcccaagataggctggcttcccccgttcaaggtatagtctgcctttaagggagttttagaaccaacatgcaagacattgaaagaaatcttgcaagagccattattgacttagatccaaaacagcctctctcatgtctaaaaaggcacagaatttACPPccaagttcaaaacttattggaatgttgagagtgtggttacgaaatacgttaggaggacaaaaggaatgtgtaagtcnttnnnnnnnnnnnnnnncagaaaacctaagcaaactnnnnnnnnnnnnnnnnnnnnnccactctgcaagaagaaatcatgatatagctttgccatgtggcagatctacatgtctagagaacactgtgctctattaccattatggataaagatgagatggtttctagagatggtttctactggctgccagaatctagagcaaagccatccccgctcctggttggtcacagaatgannnnnnnnnnnnnnnnnnnnnnnnnnnntttgtgttatttccctcccaagtaaatgtttgtccttgggtccattttctatgcttgtaactgtcttctagcagtgagccaaatCOL1A2cataaacatttgcaccacttgtggcttttgaatatcttccacagagggaagtttaaHPGDgactcatcctgtctgctaactccagacctcccagcttgaagccaaatctttccatgtgagattgatatggatttcctagaagtactggaatgttgtcatatcttgccctattttaattctgctatagaaaacaattgccttcacttttaaggagtaatttgaatattaataactctggtctagattttcatataatgtattaaagacaaagtagtgaacatcaatgaacatctgatagagataaactgtaatcaggcataagcttgtttgtatgttctggcagtgactaatcagtaaatg
atgtcggtttgcccagtatcacttatcttctgtatttttcctctgtcgtgtaaatagtataaccttttcatttatggacaattttttggactagtagccttcaTGM3gtggcctcccgtacaaacttggacaacacggagcagggagagctnnnnnnnnnnnnnnncccccgcccatgctgtccggcctgggaaaccctctccatctcccaaggctgccagacatggactccgggctccagcacatccccctctcctctcccccaggttggggctgggtccaccctgtccntatgacttgantcacttttncacattnccntggccgnttctccccagagctgccntgctctngtgagccccacagccctngctcantnncntcacgcccttcaatgctgcaggatggactggcccctgacccagggactctccaaacgggatacaggagagaagctggtctagactgtttgctgatccccaacctgcacggggcattcctgcttctctctcaITGA6agtgactgtgtttccctcaaagactgtagctcagtattcgggagtaccttggtggatcatcctagtggcNMUgcctgaacaacagctacagttgtggaatgagatagatgatacttgttncgtcttttctgnnnnnnnnnnnnnnnnnncnggcatccaacgcactggaggagctttgctttatgattatgggaatgnnnnnnnnnnnnnnnnnnnaagatgaaaaagataatactaaaaggttcttatttcattattcgaagacacagaagttgggcaagtcaaatgttgtgtcgtcagttgtgcatccgttgctgcagctcgttcctcacctgcatgagagaagaatgaagagattcagagtggacgaagaattccaaagtccctttgcaagtcaaagtcgaggatattttttattcaggccacggaatggaagaaggtcagcagggttcatttaaaatggatgccagctaattttccacagagcaatgctatggaatacaaaatgtactgacattttgttttcttctgaaaaaaatccttgctaaatgtactctgttgaaaatccctgtgttgtcaatgttctcagtOPNattagatagtgcatcttctgaggtcaattaaaaggagaaaaaatacaatttctcactttgcatttagtcaaaagaaaaaatgctttatagcaaaatgaaagagaacatgaaatgcttctttctcagtttattggttgaatgtgtatctatttgagtctggaaataactaatgtgtttgataattagtttagtttgtggcttcatggaaactccctgtaaactaaaagcttcagggttatg
tctSCELgacaatacactgtgaaccttgctactctaaaattatggcaaagtggattccataactctggcacaaggaaatcaagatgaaaagcactcattaaggaattaaagttacaagttttatcttaataatatgtaatctagaaaagctttcacattgaagatcaactcttgtacaaaattaacaattctgttattgcataagtaatctaattgtcttcaataaggtcacacanataaaaagagccatctggtctctggctagagttagcaataaaaagttcaaatggttccnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnntccatccctgctccgtatgttggctgtgagtggtggtttccatttaaaccaagtttctcatttcttcacctttttttctctaagaatttggattcgtagacattgacatcccgaagaactgtcaaggaagcaagatatgctttcttcatctgcaaaagaaatactaacaacaattttcttatacagtttggcagCOL1A1tcaaggtattgctggacagcgtggtgtggtcggcctgcctggtcagagaggagagagaggcttccctggtcttcctggcccctctggtgaacctggcaaacaaggtccctctggagcaagtggtgaacgtggtccccccggtcccatgggcccccctggattggctggaccccctggtgaatctggacgtgagggggctcctgctgccgaaggttcccctggacgagacggttctcctggcgccaagggtgaccgtggtgagaccggccccgctggaccccctggtgctctggtgctctggtgcccctggccccgttggccctgctggcaagagtggtgatcgtggtgagactggtcctgctggtcccgccggtcctgtcggccctgttggcgcccgtggccccgccggaccccaaggcccccgtggtgacaagggtgagacaggcgaacagggcgacagaggcataaagggtcaccgtggcttctcCOL4A2acagacgagacaacagcacacaggcagccagccgtnggccagaggntcgaggggnnctcaggggcntcaggcnacccgtnccccacacganngggccccgtngggtgggcctnggccctngctttnctacngnccaatgttatgnccagctnccatgttctncccaaataccngttgnatgtgaattattttaaaggcaaaacngtgctctttannttttanaaaacactgataatcacactgcggtaggtcattcttttgccacatccctatagaccactgggtttggcaaaactcaggcagaagtggagaccnttctagacatcantgtcagccttgctacttgaaggtacaccccatagggtcggaggtgctgtcccccctgccccacnttgtccctgagatttaacccctccactgctgggggtgagctgtactcttctgactgc
KRT13gggactcatcagcagcatcgaggcccagctgagcgagctccgcagtgagatggagtgccagaaccaagagtacaagatgctgctggacatcaagacacgtctggannnnnnnnnnnnnnnnnnnnnnngcctgctcgagggccaggacgccaagatgantgnnttnccntncnnnnnnnnnnnnnnnnnnnnccgtagcacctctgttaccacgacttctagtgcctctgttaccaccacctctaatgcctctggtcgccgcacttctgatgtccgtaggcctnnnnnnnnnnnnnnntcccctccctctgtcttcagcacccagaggaggagagagccggcagttccctgcaggagagaggaggggctgctggacccaaggctcagtccctctgctctcaggaccccctgtcctgactctctcctgatggtgggccctctgtgctcttctcttcnngtcggatctctctcctctctgacctggatacgctttggtttctcaacttctPPLggacaagccaaccacagcagccaagcccactccttgcagcatgggtactggtggcacancnnnnnnnnnnnnnnnnccnnnnannnnnnngnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnaaanccaactttccatccgagaagcctcctcagtagttactctgctcatgagacagatctgggctccaagccaggaaaggtgaacagaaaccacaagtgtccagccctcggtgctggagtggacgttaattgtcagccaccagactgtcccggcacctacagagaatgtttcacagttctggcattnnnnnnnnnnnnnnnnnnnnnnnnnnnntgttagccttagtttcagtgctttacaagtctcgcttattatctcattggtatttaggtatacaaaacannnnnnnnnnnnnnnnnnnnnncgccaatatctgggtctctgtatctcatgtagaaPP11gggagaactccaatgctgaatggagaagggtaataggttggtngcagtgaatgggctgggggtggggtgnccttctccaggcctgagtgtttttgtgtccagctcagtatctgcaacaagaagtttcccacttgtggatgtttagtgcagccacagacttgtattttgatccccaattttttttnngaaagagttctcctcataggaggatgattcagcatcagaagaagaaggaacccatagcttggtgtcattaacataattattttaagccttatccagcagccataatttgaataactctacgagaccagagagactgtagttccctattttaacctcaattatgcatttgtccccnaaccccactgagaactaaatgctgtaccacagagccgggtgtgaactatggtttCYP3A5
gaaacactcagattattcccagttgctattagacttgagaggacttgcaagaaagatgttgaaatcaatggggtattcattcccaaagggtcaatggtggtgattccaacttatgctcttcaccatgacccaaagtactggacagagcctgaggagttccgccctgaaaggttcagtaagaagaaggacagcatagatccttacatatacacaccctttggaactggacccagaaactgcattggcatgaggtttgctctcatgaacatgaaacttgctctaatcagagtccttcagaacttctccttcaaaccttgtaaagaaacacagatccccttgaaatnnnnnnnnnnnnnnnnnnnnnnnnnnnnaaaacccattgttctaaaggtggattcaagagatggaaccctaagtggagaatgagttattctaagganttctactttggtcttcaagaaagctPLAUtcttgagggagcttagccaatgtgggagcagcggtttggggagcagagacactaacgacttcagggcagggctctgatattccatgaatgtatcaggnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnagtgtgagtaagagctggtgtcttgattgttaagtctaaatatttccttaaactgtgtggactgtgatgccacacagagtggtctttctggagaggttataggtcactcctggggcctcttgggtcccccacgtgacagtgcctgggaatgtattattctgcagcatgacctgtgaccagcactgtctcagtttcactttcacatagatgtccctttcttggccagttatcccttccttttagcctagttcatccaatcctcactggIL1RNtgtgatgtcccaacttgtaaaaattaaaagttatggtactatgttagccccataatttttnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnctcctctgtccaggcactgctgcccagcctccaagctccatctccactccagattttttacagctgcctgcagtactttacctcctatcagaagtttctcagctcccaaggctctgagcaaatgtggctcctgggggttctttcttccatgaaagatngctgtgcctctgcctgtctcccccaccgggctgggagctntgcagagcaggaaacatgactcgtatatgtctcaggtccctgcagggccaagcacctagcctcgctcttggcaggtactcagcgaatgaatgctgtatatgttgggtgcaaagttccctaPITX1tggacttgcctaggatttcccgaccccgtacaaaccaagttgccctctccgagctaggcccggccgagagcgccttanctcgagtcggatccgtgttggggcgggcgttgggtttggggggacggntgcccccnagcccnangantcnggnacntangtngnanncgnacacggncccggcgcgcctggtagagcctcgctggccccgcgccccggagccctatattaaggccacggagc
gacagcgggcagtgcgggcctggcgggaggtgggggaggtccatctcagaacaccccagccttgagcttagctgcaggcccaggccctntgctctgctcccgggctaggaggtggccctctgtntgggcgaacagccccctcctcaccgcccgccgtgcaagagtcgagccggcagagcaaggggcgcggccccagggccctgcgcccactttgcacacccgctctccggcccgcgcccctgtttacagcgtccctgtgtatgttggactgactgtaataaatctgtctatatcgacttgtccatgMALactctgctctacgtggtccatgcggtgttctctttaatcannnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnngccgccccactttccggcataactttttagaaaacagaaatgncccttgatggtggaaaaaagaaaacaaccancccccccactgncccaaaaaaaaaagccctgccctgttgctcgtgggtgctgtgtttactctcccgtgtgccttcgcgtccgggttgggagcttgctgtgtctaacctccaactgctgtgctgtctgctagggtcacctcctgtttgtgaaaggggaccttcttgttcgggggtgggaagtggcgaccgtgacctgagaaggaaagaaagatcctctgctgacccctggagcagctctcgagaactacctgttggtattgtccacaanntctcccgagcgccccatcttgtgccatgttttaagtcttcatggatgttctgcatgtcatggggactaaaactcacccaacagatctttccagaggtccatggtgBLNKtcggaaaagctctggccatgattccaaacaaccatatacactagttgtattctttaataagcgagtatataatattcctgtgcgatttattgaagcaacaaancaatatgccttnggcagaaagaaaaatggtgaagagtacnnnnnnnnnnnnnnnnnnnnnnnnnnnnatcatcaacatagtcctttggttcttattgacagtcagaataacacaaaagattccaccagactgaagtatgcagttaaagtttcataaagggggaaaaaaaagatcaataccattgcttcagacactttcccaaagtttctccttttgagaaaaagtcccaaaacttcatattttggattatgaatcatccagtaataaaatggaagatggagtcagctattgaagtggtcatccatttctttttaagaagctcatgtggacttgttctattgcctgacctgatgaactgttaFN1ctaaactggagtgatgttagcagacccagcttagagttcttctttctttcttaagccctttgctnnnnnnnnnnnnnnnnnnnnnnnnnnnnactcacagcttctccaagcatcaccctgggagtttcctgagggttttctcataaatgagggctgcacattgcctgttctgcttcgaag
tattcaataccgctcagtattttaaatgaagtgattctaagatttggtttgggatcaataggaaagcatatgcagccaaccaagatgcaaatgttttgaaatgatatgaccaaaattttaagtaggaaagtcacccaaacacttctgctttcacnnnnnnnnnnnnnnnnnnatactgtaggaacaagcatgatcttgttactnnnnnnnnnnnnnnnnnnnnngtactcactttttccaaatgatcctagtaattgcctagaaatatctttctcttacctgttatttatcaatttttcccagtatttttatacggaaaaaattgtattgaaaacacttagtatgcagttgataagaggaatttggtataattatggtgggtgattattttttatactgtatgtgccaaagctttCOL5A2taagatgaccaatgacaatgaccacctttgcagaaagtaaactgattgaataaataaatctccgttttcttcaatttatttcagtgtaatgaaaaagttgcttagtatttatgaggaaattcttcttcctggcaggtagcttaaagagtggggtatatagagccacaacacatgtttattttgcttggctgcagttgaaaaatagaaattagtgcccttttgtgacctctcattccaagattgtcaattaaaaatgagtttaaaatgtttaacttgtgatcgagacctacatgcaMMP1caaatttgatcctaaaacgaagagaattttgactctccagaaagctaatagctggttcaactgcaggaaaaattgaacattactaatttgaatggaaaancacatggtgtgagtccnaangnaggtgttttcctnnnnnnnnnnnnnnnnnnnnnnnnnnnttttaacctctagagtcactgatacacagaatataatcttatttatacctcagtttgcatatttttttactatttagaatgtagccctttttgtactgatataatttagttccacaaatggtgggtacaaaaagtcaagtttgtggcttatggattcatataggccagagttgcaaagatcttttcnagagtatgcaactctgacgttgatcccagagagcagcttcagtgacaaacatatcctttcaagacagaaagagacaggagacatgagtctttgccggaggaaaagcagctcaagaacacatgtgcagtcactggtgtcaccctgMFAP2aacgaggtctgcttctacagcctccgccgnnnnnnnnnnnnnnncaaggagatctgtgttcgtacagtgtgtgcccangaggagctcctccgagctgacctctgtcgggacaagttctccaaatgtggcgtgatggccagcagcggcctgtgccaatccgtggcggcctcctgtgccaggagctgtgggagctgctagggtggtgctggcatcctgagtcctggccctcctgggatctngggccctcgggccctgcctgacctggtgcttttttccccatccccatgttccttttattctgtaaaaagttagtggactgcagccctgggggttgcaggctgcggtgcctcaggcccctcc
ttcagcctgtggccacctctggggcacnattgggggctccccactgcccagtctgcccctcgggttgggggagtatcccaggcctctctgtgggacnctgggnccntgacgggccttctcagcccgttttgaggacagacagtcccccgaggtagggctacatccccccaccccagctggtctgcttggatttcctacaSERPINH2cctgggccatagtcattctgcctgccctgaaagtcccagatcaagcctgcctcnaatcnagtattcatatttatagccaggtaccttctcacctgtgagannccaaattgagctaggggggtcagccagccctcttctgacactaaaacacctcagctgcctccccagctctatcccaacctctcccaactataaaactaggtgctgcagccCOL4A1gaatgacttgacttcaaaagcaacaaccttaaaggccgtcatttcattagtattcctcattctgcatcctggcttgaaaaacagctctgttgaatcacagtatcagtattttcacacgtaagcacattcgggccatttccgtggtttctcatgagctgtgttcacagacctcagcagggcatcgcatggaccgcaggagggcagattcggaccactaggcctgaaatgacatttcactaaaagtctccaaaacatttctaagannnnnnnnnnnnnnnatgtaatttctttaaatgtgtatttcttaagaattcaaatttgtaataaaactatttgtataaaaannaagcttttattaatttgttgctagtattgccacagacgcattaaaagaaacttactgcacaagctgctaatKRT4gcagttcccgcagcaagatcatctctaccaccaccctgaacaagagacgatagaggagacgaggtccctgcagctcactgtgtccagctgggcccagcactggtgtctctgtgcttccttcacttcacctccatcctctgtctctggggctcatcttactagtatcccctccactatcccatgggctctctctgccccaggatgatcttctgtgctgggacagggactctgcctcttggagtttggtagctacttcttgatttgggcctggtgacccacctggaatgggaaggatgtcagctgacctctcacctcccatgggcagagaagaaaatgaccaggagtgtcatctccagaattattggggtcacatatgtcccttcccagtccaatgccatctcccactagatcctgtattatccatctacatcagaaccaaactccttctccaacacccggcagcacttggccctgcaagcttaggatgagaaccacttagtgtcccattctactcctctcattccctcttatccatctgcaggtgaat
LAGYggcttcactggaaaaatggtgtggctagcatttccctttgagtcatgatgacagatggtgtgaaaaccatctaagtttgcttttgaccatcacctcccagtagcaatttgctttcataatccatttagcaatccaggcctctgttgaaaagataatatgagggagaagggaacacatttccttctgaacttacttccctaagtcactttccttatgtatcatctaatacaatgatggttgagtgaaaatacagaaggggtgtttgagtattcagatttcataaaacacttccttggaatatagctgcattaacttggaaagaagcctgttgggccagaagacagaaactccaactggcaaaaaagcaagcatctaagaaaaaaaaccaccaaagttcttgaatttactatatttaaatgcattggttaagtttattttgctaaataaagttgaactgcttttttgtctctaC5ORF13agccagtctgaaagcccaccttaatttttatataactgtctttagctcttcttttgacagggcaggccttgttctnnnnnnnnnnnnnnnnngactgttaaacaccgatgacgcatgcactgcacttcttcgttttcttcttnnnnnnnnnnnnnnnnnnnnttcttgtgcattactcctctccctccttcgttagaataggtatatcagctgtgtaaatagagcaagaaaacagtattctgcatctgtggcatttatgtagagttgcaagttgtnnnnnnnnnnnnnnnnnnnnnntgtaacagtgtgatctttactgatgcactcatgacaagtacccaatgtattttagctattttagtagtatttgttcaataaatacgcaagctgFAPAttcctaaagcagtgtttctctttgtcagactaaaancgatgcagatgcaagcctgtatcagaatctgaaaaccttatataaacccctcagacagtntgcttattttattttttatgttgtaaaatgctagtataaacaaacaaattaatgttgttctaaaggctgttaaaaaaaagatgaggactcagaagttcaagctaaatattgtttacattttctggtactctgtgaaagaagagaaaagggagtcatgcattttgctttggacacagtgttttatcacctgttcSPINK5caaatacacacatccgcagtacagggaagtgtgaggagagcagcaccccnggaaccaccgcagccagcatgcccccgtctgacgaatgacaggaagattgttgaaagccatgagggaaaaaataaaccccagttctgaatcacctaccttcaccatctgtatatacaaagaattcttcggagcttgtcttatttgctatagaaaacaatacagagcttttgggaatggactcactgattttcagtcttttccatctctttcctcctagactctgtgatctgagggtataaagacatctccaccaagtctgagccctcaaaatgtcctgattacaatgctgtctgtccaactgcctgttca
ataaaagtaaactcagcagnnnnnnnnnnnngggatttctttgtcactatctggataatagKIAA0790aagtgccttctctgtctcacacttgnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnatctgcagccagactnnnnnnnnnnnnnnnnnnnnnnnnnnccatgtagccaggcccggaatgggcctctctggacaagagccaccctttcactgtgcatatgatgntgatgcaattccnccatcatctctggacnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnngcacaggactgaggatcctctcctccagaaaagcccccgaggaaataaattagtgcggttctctttgacctccaaagacaagacaagcacttatttttattttcagaagacaaaagaaccnnnnnnnnnnnnnnntgcgaatgctctatctccagtctgtctctgtgtactggtagaggctgggaggagtaggnnnnnnnnnnnnnnnnnnnnnnnnnnnnncttgctcttctgtctgtcatcttgcaggatncccgagggccagatgggcttagctaggccaaagtaacagactcaagagttattgtacattactgaccacgcDUSP5ttcactgaccttggactttggcatgattcttagtcatacttgaacttgtctcattccacctcttctcagagcaactcttcctttgggaaaagagttcttcagatcatagaccaaaaaagtcataccttcgaggtggtagcagtagattccaggaggagagggtacttgctaggtatcctgggtcagtggcggtgcaaactggtttcctcagctgcctgtccttctgtgtgcttatgtctcttgtgacaattgttttcctccctgcccctggaggttgtcttcaactgtggacttctgggatttgcagattttgcaacgtggtacPTHLHgtaaatgtatcttggtgctgctgaatttctatattttttgtaacataatgcactttagatatacatatcaagtatgttgataaatgacacaatgaagtgtctctattttgtggttgattttaatgaatgcctaaatataattatccaaattgattttcctttgtgcatgtaaaaatGPX3tgtcctacctatgtgtctttctgggaatgtgtaccatctgtgtgcctgcagctgtgtagtgctggacagtgacaaccctttctctccagttctccactccaatgataatagttcactatcacctaaacccaaaggaaaaaccagctctaggtccaattgttctgctctaactgatacctc
aaccttggggccagcatctcccactgcctccaaatattagtaactatgactgacgtccccagaagtttctgggtctaccacactccccaaccccccactcctacttcctgaagggccctcccaaggctacatccccaccccacagttctccctgagagagatcaacctccctagatcaaccaaggcagatgtgacaagcaagggccacggaccccataggcagCEACAM1ctatcactcatgctggtggcattgtttacagctagaaagctgcactggtgctaatgccccttgggaaatggggctgtgaggaggaggattataacttaggcctagcctcttttaacagcctctgaaatttatcttttcttctatggggcttataaatgtatcttataataaaaagsaaggacaggaggaagacaggcaaatgtacttctcacccagtcttctacacagatggaatctctttggggctaagagaaaggttttattctatattgcttgatctcatgttaggcctaagaggctttctccaggaggattagcttggagttctctatactcaggtacctctttcagggttttctaaccctgacacggactgtgcatactttccctcatccatgctgtgctgtgttatttaatttttcctggctaagatcatgtctgaattatgtatga
權利要求
1,一種頭頸鱗癌分子分類診斷用小型化寡核苷酸芯片,由與頭頸鱗癌顯著相關的一些基因序列構成相應的寡核苷酸探針,制備成小型化診斷用芯片,其特征在于,所述探針為下列寡核苷酸序列,共代表39條基因,包括EMP1、CEACAM5、NA、ZNF185、ACPP、COL1A2、HPGD、TGM3、ITGA6、NMU、OPN、SCEL、COL1A1、COL4A2、KRT13、PPL、PP11、CYP3A5、PLAU、IL1RN、PITX1、MAI、BLNK、FN1、COL5A2、MMP1、MFAP2、SERPINH2、COLAA1、KRT4、LAGY、C5ORF13、FAPA、SPINK5、KIAA0790、DUSP5、PTHLH、GPX3、CEACAM1。
2,一種利用權利要求1芯片的頭頸鱗癌分子分類方法,特征在于,建立頭頸鱗癌分子分類標準;綜合采用以下統(tǒng)計學方法和計算機算法,包括傳統(tǒng)的統(tǒng)計學方法(t-test,Wilcoxon rank-sum test和配對t-test)、芯片顯著性分析(SAM)、Genespring軟件的分類預測方法,以及一種綜合分級系統(tǒng)(COM),包括minimal distance to ideal ranking(MDIR)和Weighted punishment on overlap(WEPO);檢測標本中小型化寡核苷酸芯片上的39條探針的表達情況,并與頭頸鱗癌分子分類標準進行比較。
3,根據(jù)權利要求2所述的頭頸鱗癌分子分類方法用于頭頸鱗癌分子分類診斷方法,具體步驟包括,(1)標本收集收集病人的可疑癌變組織塊,放入液氮中保存;(2)RNA提取組織勻漿后加入預冷的Trizol,隨后采用氯仿抽提,異丙醇沉淀,并將沉淀溶解于不含RNAse的水中,純化,至RNA終濃度1μg/μl;(3)RNA標記和芯片雜交,純化后的RNA反轉錄合成cDNA的第一鏈,隨后采用poly(A+)合成cDNA雙鏈,雙鏈內同時引入了T7 RNA聚合酶的位點并采用體外轉錄反應(IVT),獲得生物素標記得cRNA探針;將15μg cRNA堿水解成35-200bp的片斷,隨后取10μg片斷化后的cRNA探針與所述的寡核苷酸芯片進行雜交、掃描、分析;(4)不同芯片上各探針的信號值經(jīng)RMA均一化處理后,進行分子分類診斷的分析。
全文摘要
本發(fā)明涉及一種頭頸鱗癌分子分類診斷用小型化寡核苷酸芯片,以及一種頭頸鱗癌分子分類診斷方法。一種頭頸鱗癌分子分類診斷用小型化寡核苷酸芯片,由與頭頸鱗癌顯著相關的一些基因序列構成相應的寡核苷酸探針,制備成小型化診斷用芯片,所述探針為下列寡核苷酸序列,共代表39條基因。本發(fā)明采用頭頸鱗癌分子分類專用的小型診斷芯片替代傳統(tǒng)的高通量大芯片,顯著降低了成本,簡化了操作過程。該專用芯片的獲取系使用多種統(tǒng)計分析標準,多種統(tǒng)計學方法相結合A和B基因群的交集和COM框架(C基因群)。通過綜合使用這些方法,保留不同統(tǒng)計方法敏感性高的優(yōu)點(參數(shù)/非參數(shù)/混合參數(shù),差異平均值/平均值的差異),同時克服了不同統(tǒng)計學方法所帶來的假陽性率困擾。
文檔編號C12Q1/68GK1544652SQ20031010815
公開日2004年11月10日 申請日期2003年10月27日 優(yōu)先權日2003年10月27日
發(fā)明者陳萬濤, 張萍, 張志愿, 邱蔚六, 張陳平, 竺涵光, 孫堅, 李江 申請人:上海第二醫(yī)科大學附屬第九人民醫(yī)院