本發(fā)明涉及生物技術領域中單核苷酸多態(tài)性rs76418789在篩查麻風患者中的應用。
背景技術:
麻風,又名Hansen’s病,是一種由麻風分枝桿菌(M.Leprae)引起的傳染性疾病,主要侵犯皮膚和周圍神經(jīng)。2014年,全球有213,889例新發(fā)病例。盡管目前存在有效的治療方法,但在一些國家,特別是發(fā)展中國家,麻風仍是致畸和導致一些社會問題的主要原因。為了解麻風易感性的遺傳學基礎,麻風的全基因組關聯(lián)分析(GWAS)定位了17個常見變異位點,揭示了固有免疫與適應性免疫在麻風發(fā)病中的作用。然而,這些常見的風險變異位點大部分位于非編碼區(qū),僅能夠部分解釋麻風的發(fā)病風險。目前,還沒有對蛋白編碼區(qū)域的變異,特別是低頻變異和罕見變異,進行系統(tǒng)研究。而這些變異已證實與一些疾病的遺傳易感性相關。
技術實現(xiàn)要素:
本發(fā)明所要解決的技術問題是如何篩查麻風患者與檢測麻風易感性。
為解決上述技術問題,本發(fā)明首先提供了下述任一用途:
A1)檢測人基因組中rs76418789的多態(tài)性(即等位基因)或基因型的物質(zhì)在制備篩查麻風患者產(chǎn)品中的應用;
A2)檢測人基因組中rs76418789的多態(tài)性(即等位基因)或基因型的物質(zhì)在制備檢測麻風易感性產(chǎn)品中的應用;
A3)檢測人基因組中rs76418789的多態(tài)性(即等位基因)或基因型的物質(zhì)在制備檢測與麻風相關的單核苷酸多態(tài)性的產(chǎn)品中的應用;
A4)檢測人基因組中rs76418789的多態(tài)性(即等位基因)或基因型的物質(zhì)在制備鑒定或輔助鑒定與麻風相關的單核苷酸多態(tài)性的產(chǎn)品中的應用;
B1)人基因組中rs76418789的多態(tài)性(即等位基因)或基因型在制備篩查麻風患者產(chǎn)品中的應用;
B2)人基因組中rs76418789的多態(tài)性(即等位基因)或基因型在制備檢測麻風易感性產(chǎn)品中的應用;
B3)檢測人基因組中rs76418789的多態(tài)性(即等位基因)或基因型的物質(zhì)在篩查麻風患者中的應用;
B4)檢測人基因組中rs76418789的多態(tài)性(即等位基因)或基因型的物質(zhì)在檢測麻風易感性中的應用;
B5)檢測人基因組中rs76418789的多態(tài)性(即等位基因)或基因型的物質(zhì)在檢測與麻風相關的單核苷酸多態(tài)性的中的應用;
B6)檢測人基因組中rs76418789的多態(tài)性(即等位基因)或基因型的物質(zhì)在鑒定或輔助鑒定與麻風相關的單核苷酸多態(tài)性的中的應用;
B7)人基因組中rs76418789的多態(tài)性(即等位基因)或基因型在篩查麻風患者中的應用;
B8)人基因組中rs76418789的多態(tài)性(即等位基因)或基因型在檢測麻風易感性中的應用。
rs76418789是人染色體1p31.3上的一個二等位多態(tài)性的SNP位點,屬于低頻變異(MAF=4.32%),位于IL23R基因的外顯子中,該變異是轉(zhuǎn)換(A/G,在其互補鏈上則為T/C)。所述rs76418789基因型是AA、AG或GG。所述AA是rs76418789位點為A的純合型,所述GG是rs76418789位點為G的純合型,所述AG是rs76418789位點為A和G的雜合型。所述檢測人基因組中rs76418789的多態(tài)性(即等位基因)或基因型具體可為檢測rs76418789的核苷酸種類。
上述用途中,所述檢測人基因組中rs76418789的多態(tài)性或基因型的物質(zhì)可為擴增包括rs76418789在內(nèi)的基因組DNA片段的PCR引物和/或單堿基延伸引物。所述產(chǎn)品可包括所述PCR引物和/或所述單堿基延伸引物。
上述用途中,所述AA和所述AG基因型的個體在麻風患者群體中的比例分別高于對應的基因型在正常人群體中的比例。
上述用途中,所述麻風具體可為中國人群麻風。
為解決上述技術問題,本發(fā)明還提供了含有檢測人基因組中rs76418789的多態(tài)性或基因型的物質(zhì)的產(chǎn)品。
本發(fā)明所提供的含有檢測人基因組中rs76418789的多態(tài)性或基因型的物質(zhì)的產(chǎn)品,為a)-d)中的任一種產(chǎn)品:
a)檢測與麻風相關的單核苷酸多態(tài)性(即等位基因)或基因型的產(chǎn)品;
b)鑒定或輔助鑒定與麻風相關的單核苷酸多態(tài)性(即等位基因)或基因型的產(chǎn)品;
c)篩查麻風患者產(chǎn)品;
d)檢測麻風易感性產(chǎn)品。
上述產(chǎn)品中,所述檢測人基因組中rs76418789的多態(tài)性或基因型的物質(zhì)可為擴增包括rs76418789在內(nèi)的基因組DNA片段的PCR引物和/或單堿基延伸引物。
上述產(chǎn)品中,所述麻風具體可為中國人群麻風。
為解決上述技術問題,本發(fā)明還提供了下述M1)或M2)的方法:
M1)篩查麻風患者的方法,包括:檢測待測對象基因組中rs76418789位點的基因型,如rs76418789位點的基因型為AA基因型,所述待測對象為或候選為麻風患者;如rs76418789位點的基因型為AG基因型,所述待測對象為或候選為麻風患者;如rs76418789位點的基因型為GG基因型,所述待測對象為或候選為非麻風患者;
M2)檢測麻風易感性的方法,包括:檢測待測對象基因組中rs76418789位點的基因型,如rs76418789位點的基因型為AA基因型,所述待測對象易感或候選易感麻風;如rs76418789位點的基因型為AG基因型,所述待測對象易感或候選易感麻風;如rs76418789位點的基因型為GG基因型,所述待測對象不易感或候選不易感麻風。
上述方法中,所述麻風具體可為中國人群麻風。
上述方法中,檢測待測對象基因組中rs76418789位點的基因型可采用所述檢測rs76418789的多態(tài)性或基因型的物質(zhì)進行。
實驗證明,rs76418789的風險等位基因為A,該等位基因在麻風患者群體中的比例比該等位基因在正常健康人群中的比例高41.20%。rs76418789的P值是1.03×10-10,且rs76418789的相對危險度是1.36,說明rs76418789是與麻風相關的單核苷酸多態(tài)性。rs76418789的三個基因型中,AA基因型的個體和AG基因型的個體在麻風患者群體中的比例分別高于對應的基因型的個體在正常人群體中的比例,GG基因型的個體在麻風患者群體中的比例低于該基因型的個體在正常人群體中的比例。
本發(fā)明在實際應用中,可將檢測rs76418789的多態(tài)性(即等位基因)或基因型的物質(zhì)與其它物質(zhì)(如檢測其它的與麻風相關的單核苷酸多態(tài)性或基因型的物質(zhì))聯(lián)合在一起制備篩查麻風患者的產(chǎn)品。
其中,檢測人基因組中rs76418789的多態(tài)性或基因型的物質(zhì)可為通過下述至少一種方法確定rs76418789的多態(tài)性或基因型所需的試劑和/或儀器:DNA測序、限制性酶切片段長度多態(tài)性、單鏈構(gòu)象多態(tài)性、變性高效液相色譜、SNP芯片、TaqMan探針技術和Sequenom MassArray技術。其中,利用Sequenom MassArray技術確定rs76418789的多態(tài)性或基因型所需的試劑和/或儀器包括PCR引物對、基于單堿基延伸反應的延伸引物、磷酸酶、樹脂、芯片、MALDI-TOF(matrix-assisted laser desorption/ionization–time of fligh,基質(zhì)輔助激光解吸附電離飛行時間質(zhì)譜)和/或Sequenom MassArray技術所需要的其他試劑和儀器;利用TaqMan探針技術確定rs76418789的多態(tài)性或基因型所需的試劑和/或儀器包括TaqMan探針、PCR引物對、定量PCR儀、進行基因分型的模塊和/或TaqMan探針技術所需要的其他試劑;SNP芯片包括基于核酸雜交反應的芯片、基于單堿基延伸反應的芯片、基于等位基因特異性引物延伸反應的芯片、基于“一步法”反應的芯片、基于引物連接反應的芯片、基于限制性內(nèi)切酶反應的芯片、基于蛋白DNA結(jié)合反應的芯片和/或基于熒光分子DNA結(jié)合反應的芯片。在本發(fā)明的一個實施例中,利用的是Illumina公司的Infinium Human Exome BeadChip芯片。
所述產(chǎn)品可為試劑或試劑盒,還可為由試劑或試劑盒和儀器組成的系統(tǒng),如由引物和DNA測序儀組成的系統(tǒng),由PCR試劑和DNA測序試劑和DNA測序儀組成的系統(tǒng),由TaqMan探針、PCR引物對、定量PCR儀和進行基因分型的模塊以及TaqMan探針技術所需要的其他試劑組成的系統(tǒng),由探針、PCR引物對以及連接酶檢測反應(LDR)所需要的其他試劑和儀器組成的系統(tǒng),由PCR引物對、單堿基延伸引物、芯片、PCR儀、進行基因分型的模塊和/或Sequenom MassArray技術所需要的其他試劑和儀器組成的系統(tǒng)。
采用PCR引物擴增包括rs76418789在內(nèi)的基因組DNA片段,以得到的PCR擴增產(chǎn)物為模板,采用單堿基延伸引物進行單堿基延伸反應,對得到的延伸產(chǎn)物的序列進行檢測,確定rs76418789的多態(tài)性(即等位基因)和基因型。所述PCR引物在序列上沒有特殊要求,只要能擴增出包括rs76418789在內(nèi)的基因組DNA片段即可。所述延伸引物根據(jù)人基因組中rs76418789上游(不包括該SNP位點)設計,所述延伸引物的最后1位核苷酸對應于人基因組中rs76418789的前1位核苷酸。所述延伸引物也可根據(jù)人基因組中rs76418789下游(不包括該SNP位點)設計,所述延伸引物的第1位核苷酸對應于人基因組中rs76418789的后1位核苷酸。
本發(fā)明中,所述PCR引物可由rs76418789-F和rs76418789-R組成;
所述rs76418789-F是如下a1)至a4)中的任一種單鏈DNA:
a1)序列表中序列7所示的單鏈DNA;
a2)在a1)的5′端和/或3′端添加一個或幾個核苷酸得到的單鏈DNA;
a3)與a1)或a2)限定的單鏈DNA具有85%以上的同一性的單鏈DNA;
a4)在嚴格條件下與a1)或a2)限定的單鏈DNA雜交的單鏈DNA;
所述rs76418789-R是如下b1)至b4)中的任一種單鏈DNA:
b1)序列表中序列8所示的單鏈DNA;
b2)在b1)的5′端和/或3′端添加一個或幾個核苷酸得到的單鏈DNA;
b3)與b1)或b2)限定的單鏈DNA具有85%以上的同一性的單鏈DNA;
b4)在嚴格條件下與b1)或b2)限定的單鏈DNA雜交的單鏈DNA。
所述單堿基延伸引物(rs76418789-E)可為如下c1)至c4)中的任一種單鏈DNA:
c1)序列表中序列9所示的單鏈DNA;
c2)在c1)的5′端和/或3′端添加一個或幾個核苷酸得到的單鏈DNA;
c3)與c1)或c2)限定的單鏈DNA具有85%以上的同一性的單鏈DNA;
c4)在嚴格條件下與c1)或c2)限定的單鏈DNA雜交的單鏈DNA。
a2)所述在a1)的5′端和/或3′端添加一個或幾個核苷酸得到的單鏈DNA為在序列7所示的單鏈DNA的5′端和/或3′端添加一至十個核苷酸得到的單鏈DNA。b2)所述在b1)的5′端和/或3′端添加一個或幾個核苷酸得到的單鏈DNA為在序列8所示的單鏈DNA的5′端和/或3′端添加一至十個核苷酸得到的單鏈DNA。c2)所述在c1)的5′端和/或3′端添加一個或幾個核苷酸得到的單鏈DNA為在序列9所示的單鏈DNA的5′端和/或3′端添加一至十個核苷酸得到的單鏈DNA。
這里使用的術語“同一性”指與天然核酸序列的序列相似性?!巴恍浴卑ㄅc本發(fā)明的序列7、序列8或序列9所示的核苷酸序列具有85%或更高,或90%或更高,或95%或更高同一性的核苷酸序列。同一性可以用肉眼或計算機軟件進行評價。使用計算機軟件,兩個或多個序列之間的同一性可以用百分比(%)表示,其可以用來評價相關序列之間的同一性。
所述嚴格條件是在2×SSC,0.1%SDS的溶液中,在68℃下雜交并洗膜2次,每次5min,又于0.5×SSC,0.1%SDS的溶液中,在68℃下雜交并洗膜2次,每次15min;或,0.1×SSPE(或0.1×SSC)、0.1%SDS的溶液中,65℃條件下雜交并洗膜。
上述85%以上同一性,可為85%、90%或95%以上的同一性。
在本發(fā)明的實施例中,rs76418789應用SEQUENOM基因分型平臺即分子量陣列技術,SequenomSNP檢測過程結(jié)合多重PCR技術、MassARRAY iPLEX單堿基延伸技術,和基質(zhì)輔助激光解吸附電離飛行時間質(zhì)譜分析質(zhì)譜技術(matrix-assisted laser desorption/ionization–time of flight,MALDI-TOF)進行分型檢測。將包含SNP位點區(qū)域的DNA模板通過PCR技術擴增,再使用特異的延伸引物與PCR產(chǎn)物進行單堿基延伸反應。由于多態(tài)性位點堿基不同,延伸產(chǎn)物不同的末端堿基將導致延伸后的產(chǎn)物分子量的差異,因此由SNP多態(tài)性引起的堿基差異通過分子量的差異而體現(xiàn),通過基質(zhì)輔助激光解吸附電離飛行時間質(zhì)譜分析質(zhì)譜技術,檢測延伸產(chǎn)物分子量的大小,應用專用的分析軟件,通過判斷分子量的差異而進行SNP分型檢測。
本發(fā)明在一個來自中國人群的樣本(7048例麻風患者和14398例健康者)中發(fā)現(xiàn)rs76418789是與麻風相關的單核苷酸多態(tài)性??蓪z測rs76418789的多態(tài)性(即等位基因)或基因型的物質(zhì)與其它物質(zhì)(如檢測其它的與麻風相關的單核苷酸多態(tài)性(即等位基因)或基因型的物質(zhì))聯(lián)合在一起制備篩查麻風患者的產(chǎn)品。
附圖說明
圖1為應用固定效果模型對所有樣本(7,048例病例和14,398例健康對照)進行meta分析的結(jié)果。
具體實施方式
下面結(jié)合具體實施方式對本發(fā)明進行進一步的詳細描述,給出的實施例僅為了闡明本發(fā)明,而不是為了限制本發(fā)明的范圍。
下述實施例中的實驗方法,如無特殊說明,均為常規(guī)方法。
下述實施例中所用的材料、試劑等,如無特殊說明,均可從商業(yè)途徑得到。
實施例1、rs145562243、rs149308743、rs76418789、rs146466242、rs55882956、rs780668和rs181206是與麻風相關的單核苷酸多態(tài)性
方法:發(fā)明人通過三個階段對中國人群中的7,048例麻風患者及14,398例正常對照進行蛋白編碼區(qū)域的全基因組關聯(lián)分析研究。首先,通過外顯子芯片對1,648例麻風患者和2,318例正常對照的40,491個編碼區(qū)域的SNP位點(MAF>0.1%)進行分析(第一階段)。然后在中國北方人群(3,169例麻風患者和9,814例正常對照)中對34個候選SNP位點進行驗證(第二階段)。最后在另外選取的中國南方人群(2,231例麻風患者和2,266例正常對照)以及第一、二階段的所有樣本中對8個候選位點進行驗證(第三階段)。
研究對象
外顯子芯片發(fā)現(xiàn)階段(第一階段)的研究對象為中國北方地區(qū)的1,670例麻風患者和2,321例正常對照。驗證階段(第二階段)將39個變異位點在中國北方地區(qū)的另外的3,169例麻風患者和9,814例正常對照中進行驗證。最終對篩選出的8個變異位點的重復驗證階段(第三階段)選擇的研究對象為中國南方地區(qū)的三個獨立樣本以及第一、二階段的所有樣本:(1)四川省906例麻風患者和878例正常對照;(2)云南省829例麻風患者和589例正常對照;(3)貴州省496例麻風患者和799例正常對照。麻風患者和正常對照均為中國漢族人群,并且在地域上是相匹配的。研究對象的臨床信息見表1。
表1、研究對象信息
其中,麻風患者的診斷標準是符合下述4條中的2條或2條以上,或符合第3條者確立診斷:1、皮損伴有感覺障礙及閉汗,或有麻木區(qū);2、周圍神經(jīng)受累,表現(xiàn)為神經(jīng)干粗大伴相應功能障礙;3、皮損組織切片或組織液涂片查到麻風桿菌;4、病理可見特征性改變。
正常對照(正常健康人)的診斷標準:無麻風史且無麻風的家族史(包括麻風患者的一級、二級和三級親屬);無其他傳染病病史;無其他自身免疫性疾病病史、系統(tǒng)性疾病病史及家族史。
本研究已通過山東省醫(yī)學科學院、山東省皮膚病性病防治研究所倫理審查委員會批準。
分型與質(zhì)控
選用Illumina公司的Infinium Human Exome BeadChip芯片對1,670例麻風患者及2,321例正常對照進行分型,芯片上共有對1,998例中國人樣本進行全外顯子組測序鑒定出的27,089個(在>1例樣本中存在)非同義編碼區(qū)域變異。排除非編碼區(qū)變異和MAF<0.1%的變異,對40,491個編碼區(qū)域變異進行關聯(lián)分析。在驗證階段和重復驗證階段,選用Sequenom MassARRAY system(Agena Bioscience),QuantStudioTM 12K Flex Real-Time PCR(Applied Biosystems)和7900HT Fasr Real-Time PCR System(Applied Biosystems)進行分型研究。質(zhì)控過濾標準如下:排除不確定群體的變異、檢出率<90%且不符合Hardy-Weinberg平衡定律(P<1×10-3)、樣本檢出率<95%的情況。
統(tǒng)計學分析
在第一階段,通過GMMAT-v0.7進行表型和單個變異基因型之間的關聯(lián)性分析。在第二、三階段,通過PLINK中的線性回歸模型對MAF>1%的SNPs進行關聯(lián)性分析,利用PLINK中Fisher's確切概率法對MAF<1%的SNPs進行關聯(lián)分析。利用固定效果模型(通過META-v7.0軟件對MAF>1%的SNPs采用逆方差法,對MAF<1%的SNPs采用z-統(tǒng)計量組合方法進行分析)。對發(fā)現(xiàn)階段、驗證階段、重復驗證階段三部分結(jié)合起來的數(shù)據(jù)進行meta分析。同時符合p<1.23×10-6(0.05/40,491)的變異為有統(tǒng)計學意義的外顯子組的變異。對于第二和第三階段的關聯(lián)分析,p<0.05并且和發(fā)現(xiàn)階段具有相同效應的變異為具有統(tǒng)計學意義的位點。利用Cochran’s Q檢驗對獨立樣本的異質(zhì)性進行分析,p<0.05認為具有統(tǒng)計學意義。
外顯子組發(fā)現(xiàn)階段分析
對1,670例麻風患者和2,321例正常對照的273,028個變異位點進行分型。通過主成分分析確定所有樣本均為中國血統(tǒng),并且發(fā)現(xiàn)在麻風患者和正常對照中具有較好的基因型的匹配。經(jīng)過一系列樣本和變異位點的過濾,共發(fā)現(xiàn)40,491個MAF>0.1%的編碼區(qū)變異位點(38,068個非同義突變和2,423個同義突變),后將其在1,648例麻風患者和2,318例健康對照中進行分析。
全外顯子分析發(fā)現(xiàn)在MHC區(qū)域內(nèi)有較強的關聯(lián)性。去除MHC區(qū)域內(nèi)的所有變異位點后,剩余SNP位點的Q-Q圖符合零分布,表明將人群混雜因素導致的外顯子關聯(lián)分析結(jié)果的可能性降到最低(lambda value=0.99)。同時,對不同MAF閾值(MAF>0.5%,MAF>1%和MAF>5%)的SNP位點進行Q-Q圖的分析,與上述結(jié)果一致。
通過研究發(fā)現(xiàn),五個提示有關聯(lián)性(P<1.0×10-3)的編碼區(qū)域的變異位點(四個常見變異和一個低頻變異)也包括在之前報道的GWAS發(fā)現(xiàn)的位點內(nèi)。四個常見變異位點與之前報道的SNP位點有較強的連鎖不平衡,僅有低頻變異(IL-23R基因rs76418789)為獨立的。另外,Q-Q圖(去除MHC區(qū)域內(nèi)SNP位點)尾端分布與標準零分布的Q-Q圖存在偏差,表明存在新的關聯(lián)位點,有38個新的編碼區(qū)域內(nèi)的變異位點被發(fā)現(xiàn)具有關聯(lián)性(P<1.0×10-3)。
為進一步研究低頻變異和罕見變異的作用,通過SKAT-O和berden-test的方法對排除MHC區(qū)域內(nèi)的變異位點及已知位點中的5個編碼區(qū)域的變異位點和38個新的編碼區(qū)域內(nèi)的變異位點(P<1.0×10-3)后的SNP位點進行分析。兩種方法均證明基因關聯(lián)性并非偶然。
驗證階段分析
在中國北方區(qū)域內(nèi)的3,169例麻風患者和9,814例健康對照中對38個新發(fā)現(xiàn)的編碼區(qū)域的變異位點及之前GWAS發(fā)現(xiàn)的一個低頻編碼區(qū)域的變異位點進行分型。有34個變異位點可成功分型,其中15個位點在發(fā)現(xiàn)階段和驗證階段是一致的(在驗證階段,P<0.05,OR值的效應與發(fā)現(xiàn)階段一致),6個位點在發(fā)現(xiàn)階段和驗證階段均具有外顯子組分析的統(tǒng)計學意義(P<1.23×10-6)且沒有遺傳異質(zhì)性,這6個位點分別為:NCKIPSD基因rs145562243(P=1.44×10-8,OR=4.35),CARD9基因rs149308743(P=4.99×10-10,OR=4.75),IL23R基因rs76418789(P=6.28×10-9,OR=1.37),F(xiàn)LG基因rs146466242(P=1.44×10-10,OR=1.45),SLC29A3基因rs780668(P=2.89×10-7,OR=1.14)和IL27基因rs181206(P=5.92×10-7,OR=0.83)(表3)。
另外,兩個編碼區(qū)域的變異位點:TYK2基因rs55882956(P=2.75×10-5,OR=1.29)和USP49基因rs75746803(P=3.45×10-6,OR=1.28)在發(fā)現(xiàn)階段和驗證階段與麻風均具有一致性和關聯(lián)性,但僅剛剛達到外顯子組分析的統(tǒng)計學意義(P<5.0×10-5)(表3)。
其中,對rs145562243、rs149308743、rs76418789、rs146466242、rs55882956、rs780668和rs181206分型采用Sequenom MassARRAY system(Agena Bioscience),QuantStudioTM 12K Flex Real-Time PCR(Applied Biosystems)和7900HT Fasr Real-Time PCR System(Applied Biosystems)進行,具體方法如下:
1.rs181206、rs780668、rs76418789、rs149308743、rs145562243和rs55882956的分型
rs181206、rs780668、rs76418789、rs149308743、rs145562243和rs55882956這6個SNP應用SEQUENOM基因分型平臺即分子量陣列技術,SequenomSNP檢測過程結(jié)合多重PCR技術、MassARRAY iPLEX單堿基延伸技術,和基質(zhì)輔助激光解吸附電離飛行時間質(zhì)譜分析質(zhì)譜技術(matrix-assisted laser desorption/ionization–time of flight,MALDI-TOF)進行分型檢測。將包含SNP位點區(qū)域的DNA模板通過PCR技術擴增,再使用特異的延伸引物與PCR產(chǎn)物(表2)進行單堿基延伸反應。由于多態(tài)性位點堿基不同,延伸產(chǎn)物不同的末端堿基將導致延伸后的產(chǎn)物分子量的差異,因此由SNP多態(tài)性引起的堿基差異通過分子量的差異而體現(xiàn),通過基質(zhì)輔助激光解吸附電離飛行時間質(zhì)譜分析質(zhì)譜技術,檢測延伸產(chǎn)物分子量的大小,應用專用的分析軟件,通過判斷分子量的差異而進行SNP分型檢測。
表2、6個SNP分型引物
操作步驟如下:
6個SNP采用Sequenom MassArray(SanDiego,USA)平臺驗證,每個樣本約用到15ngDNA。首先提取外周血的基因組DNA,標準化后,樣本DNA經(jīng)多重PCR反應擴增包括SNP位點在內(nèi)的基因組DNA片段,擴增產(chǎn)物進行SNP位點特異性單一鏈的延伸,延伸產(chǎn)物脫鹽并轉(zhuǎn)移到384孔的芯片上。質(zhì)譜儀(MALDI-TOFMS)進行等位基因的檢測,采用Sequenom MassARRAY分型軟件對檢測結(jié)果進行分析。
1.1、全血標本采集
在知情同意,并簽署書面同意書的情況下采集研究對象外周靜脈血5ml,放置于EDTANa2抗凝管中,置-80℃冰柜儲存?zhèn)溆谩?/p>
1.2、DNA濃度標準化包括如下步驟:
1)利用NanoDrop-1000濃度測試儀準確測定每一份需要標準化的樣本DNA濃度和OD比值(A260/A280、A260/A230)。
2)建立電子表格,排定每個樣本孔需要加入的DNA編號。
進行Sequenom MassArray分型的樣本,在每96孔板上留有空白對照和重復樣本對照。
3)按照電子表格的順序,加入已測定濃度的DNA。
對于進行Sequenom MassArray分型的樣本要求實驗濃度為12-30ng/μl,一般以18ng/μl為佳。并且A260/A280比值介于1.5-2.0之間、A260/230介于1.5-2.3,如DNA濃度高于18ng/μl則加入適量FG3,將濃度標化至18ng/μl;如DNA濃度低于12ng/μl,則重新從血液提取合格的DNA。濃度在12-18ng/μl間直接加入。
離心后貼上粘性錫箔紙,并用標記筆標上樣本板標號、樣本類型、來源地等信息。
4)在平板離心機上,3000g離心3分鐘,存放于-20℃?zhèn)溆谩?/p>
1.3、利用各SNP的正向引物和反向引物進行多重PCR
1.4、SNP位點特異性單一鏈的延伸反應
其中,延伸引物根據(jù)人基因組中SNP位點上游(不包括該SNP位點)設計,所述延伸引物的最后1位核苷酸對應于人基因組中該SNP位點的前1位核苷酸。
1.5、數(shù)據(jù)質(zhì)量控制
1)對分型的SNP進行call rate計算,去除call rate<95%的SNP或等位基因頻率<0.01的SNPs;
2)對SNP進行遺傳平衡檢驗,去除偏離遺傳平衡定律的SNP(對照樣本中Hardy-Weinberg平衡檢驗的P≦0.001)。
3)在Sequenom MassArray系統(tǒng)中查看SNP的分型聚類圖,去除聚類圖分堆不清的SNP。
4)樣本質(zhì)控:直接去除分型失敗的樣本。
將通過質(zhì)控的樣本和SNP進行統(tǒng)計分析。
1.6、數(shù)據(jù)統(tǒng)計分析
利用Plink 1.07軟件對分型成功并通過質(zhì)控的SNP在病例組和對照組做基因表型相關性分析,用Cochran-Armitage trend檢驗每個樣本的基因型和表型的關聯(lián)性,然后用Cochran-Mantel-Haenszel綜合分析所有樣本的基因型和表型的相關性。用Q檢驗來評價個體間的異質(zhì)性,本次實驗中,以p<0.05作為檢驗水準。多重logistic回歸分析用于檢測區(qū)域內(nèi)的信號的獨立性。檢驗水準α以0.05除以通過質(zhì)量控制的SNP數(shù)目為檢驗水準。Q檢驗用于評估遺傳異質(zhì)性的顯著性,對SNP校正檢測后P值小于0.05者視為有顯著遺傳異質(zhì)性。
2.rs146466242的分型
rs146466242應用7900HT/Taqman基因分型系統(tǒng)進行SNP分型。
引物及探針序列為:
正向引物rs146466242-F:CCACATAAACCTGGGTCCTTATTAA(序列19)
反向引物rs146466242-R:GGAAAGATCTGATATCTGTAAAGCAAGTG(序列20)
探針1rs146466242-P1:CTTGGATGATCTTTAC(序列21),5′端由報告熒光染料FAM標記,3′端由淬滅熒光染料NFQ標記
探針2rs146466242-P2:CTTGGATGATCTTAAC(序列22),5′端由報告熒光染料VIC標記,3′端由淬滅熒光染料NFQ標記
操作步驟如下:
分別抽取每個對象的外周靜脈血5ml,提取基因組DNA,分別基因組DNA(DNA濃度均在50-100ng/微升之間)。
實時熒光定量PCR反應的反應體系為:基因組DNA 1μL、2×TaqMan GT master mix(Life technology公司)2.5μL、20×TaqMan探針混合物0.65μL、去離子水0.85μL。將上述反應體系加入96孔PCR板中,采用ABI 7900實時熒光定量PCR儀(Applied Biosystems公司)進行反應。反應條件為:95℃變性30秒,60℃退火1分鐘,40個循環(huán)。
上述反應體系中,20×TaqMan探針混合物包括擴增包括rs146466242在內(nèi)的基因組DNA片段的PCR引物對和成套探針,其中PCR引物對由上述正向引物和反向引物組成,成套探針由探針1和探針2組成。
反應結(jié)束后,采用7900System SDS software進行基因型分型,確定各研究對象rs146466242位點的基因型。
重復驗證分析
為了進一步驗證8個非同義變異位點(6個外顯子組分析具有統(tǒng)計學意義的位點和2個提示可能相關的位點)是否具有關聯(lián)性,又在中國南方區(qū)域選取三個獨立樣本共2,231例麻風患者和2,266例正常對照。然后對所有樣本(7,048例病例和14,398例健康對照)進行分型,其中,對rs145562243、rs149308743、rs76418789、rs146466242、rs55882956、rs780668和rs181206分型采用的具體方法同驗證階段。
然后應用固定效果模型對所有樣本(7,048例病例和14,398例健康對照)進行meta分析。7個編碼突變顯示了三個階段中的一致性關聯(lián),無異質(zhì)性證據(jù),并且在所有樣本中有外顯子的顯著性差異(P<0.05/40,491=1.23×10-6):兩個罕見突變,位于3p21.31的NCKIPSD基因rs145562243(MAF=0.4%,P=1.71×10-9,OR=4.35)和位于9q34.3的CARD9基因rs149308743(MAF=0.5%,P=2.09×10-8,OR=4.75);三個低頻變異,位于1p31.3的IL23R基因rs76418789(MAF=4.32%,P=1.03×10-10,OR=1.36),位于1q21.3的FLG基因rs146466242(MAF=3.54%,P=3.39×10-12,OR=1.45)和位于19p13.2的TYK2基因rs55882956(MAF=3.63%,P=1.04×10-6,OR=1.30);兩個常見變異,位于10q22.1的SLC29A3基因rs780668(MAF=42%,P=2.17×10-9,OR=1.14)和位于16p11.2的IL27基因rs181206(MAF=15%,P=1.08×10-7,OR=0.83)。雖然在所有獨立性樣本分析中,位于6p21.1的USP49基因rs75746803顯示出一致性,但該位點低于外顯子顯著性水平(MAF=4.8%,P=3.57×10-6,OR=1.25)(表3和圖1)。
7個SNP在7048例麻風患者和14398例正常對照中的基因型頻率如表4和表5所示。結(jié)果表明:rs145562243的三個基因型中,TC基因型的個體在麻風患者群體中的比例高于對應的基因型的個體在正常人群體中的比例,CC基因型的個體在麻風患者群體中的比例低于該基因型的個體在正常人群體中的比例;
rs149308743的三個基因型中,TC基因型的個體在麻風患者群體中的比例高于對應的基因型的個體在正常人群體中的比例,CC基因型的個體在麻風患者群體中的比例低于該基因型的個體在正常人群體中的比例;
rs76418789的三個基因型中,AA基因型的個體和AG基因型的個體在麻風患者群體中的比例分別高于對應的基因型的個體在正常人群體中的比例,GG基因型的個體在麻風患者群體中的比例低于該基因型的個體在正常人群體中的比例;
rs146466242的三個基因型中,AA基因型的個體和AT基因型的個體在麻風患者群體中的比例分別高于對應的基因型的個體在正常人群體中的比例,TT基因型的個體在麻風患者群體中的比例低于該基因型的個體在正常人群體中的比例;
rs55882956的三個基因型中,AA基因型的個體和AG基因型的個體在麻風患者群體中的比例分別高于對應的基因型的個體在正常人群體中的比例,GG基因型的個體在麻風患者群體中的比例低于該基因型的個體在正常人群體中的比例;
rs780668的三個基因型中,TT基因型的個體和TC基因型的個體在麻風患者群體中的比例分別高于對應的基因型的個體在正常人群體中的比例,CC基因型的個體在麻風患者群體中的比例低于該基因型的個體在正常人群體中的比例;
rs181206的三個基因型中,AA基因型的個體在麻風患者群體中的比例高于對應的基因型的個體在正常人群體中的比例,GG基因型和AG基因型的個體在麻風患者群體中的比例分別低于對應基因型的個體在正常人群體中的比例。
表4、SNP在麻風患者和正常群體中的基因型個體數(shù)
表5、SNP在麻風患者和正常群體中的基因型頻率
表6、SNP在麻風患者群體中的等位基因頻率(%)和與對照相比的變化量
注表4和表5中,rs145562243的基因型中,A1*A1表示CC,A1*A2表示TC,A2*A2表示TT;
rs149308743的基因型中,A1*A1表示CC,A1*A2表示TC,A2*A2表示TT;
rs76418789的基因型中,A1*A1表示AA,A1*A2表示AG,A2*A2表示GG;
rs146466242的基因型中,A1*A1表示AA,A1*A2表示AT,A2*A2表示TT;
rs55882956的基因型中,A1*A1表示AA,A1*A2表示AG,A2*A2表示GG;
rs780668的基因型中,A1*A1表示TT,A1*A2表示TC,A2*A2表示CC;
rs181206的基因型中,A1*A1表示GG,A1*A2表示AG,A2*A2表示AA。
利用二分類的logistic回歸模型(log-additive模型)計算麻風患者群體和正常人群體中基因頻率差異性P值,確定SNP有無顯著性意義,其中基因型采用可加模型進行統(tǒng)計。結(jié)果發(fā)現(xiàn),rs145562243、rs149308743、rs76418789、rs146466242、rs55882956、rs780668和rs181206的各等位基因的基因頻率在正常人群體和麻風患者群體中均有顯著性差異。
由表6可知,rs145562243的風險等位基因為T,該等位基因在麻風患者中的基因頻率為0.0039,在正常對照中的基因頻率為0.0004,與正常對照相比,該等位基因在麻風患者中增加了875.00%;rs149308743的風險等位基因為T,該等位基因在麻風患者中的基因頻率為0.0055,在正常對照中的基因頻率為0.0006,與正常對照相比,該等位基因在麻風患者中增加了816.67%;rs76418789的風險等位基因為A,該等位基因在麻風患者中的基因頻率為0.0610,在正常對照中的基因頻率為0.0432,與正常對照相比,該等位基因在麻風患者中增加了41.20%;rs146466242的風險等位基因為A,該等位基因在麻風患者中的基因頻率為0.0558,在正常對照中的基因頻率為0.0354,與正常對照相比,該等位基因在麻風患者中增加了57.63%;rs55882956的風險等位基因為A,該等位基因在麻風患者中的基因頻率為0.0529,在正常對照中的基因頻率為0.0363,與正常對照相比,該等位基因在麻風患者中增加了45.73%;rs780668的風險等位基因為T,該等位基因在麻風患者中的基因頻率為0.4648,在正常對照中的基因頻率為0.4213,與正常對照相比,該等位基因在麻風患者中增加了10.33%;rs181206的風險等位基因為A,該等位基因在麻風患者中的基因頻率為0.8829,在正常對照中的基因頻率為0.8503,與正常對照相比,該等位基因在麻風患者中增加了3.83%。
實驗結(jié)果表明,rs145562243、rs149308743、rs76418789、rs146466242、rs55882956、rs780668和rs181206的多態(tài)性或基因型或等位基因頻率可用于麻風患者的篩查。
另外,通過對樣本中年齡和性別信息進行聯(lián)合檢驗,分析了年齡和性別比例的影響。兩個常見突變和三個低頻突變SNPs中的(年齡和性別)未調(diào)整和調(diào)整的ORs非常相似(表7),揭示了這些SNPs的關聯(lián)性分析中,性別和年齡有較小的作用。
表7、性別和年齡對兩個常見突變和三個低頻突變SNP影響的分析結(jié)果
次等位基因/主等位基因;
OR,OR根據(jù)次等為基因計算;
(f)指固定效應模型.
<110> 山東省皮膚病性病防治研究所
<160> 22
<170> PatentIn version 3.5
<210> 1
<211> 30
<212> DNA
<213> 人工序列
<220>
<223>
<400> 1
acgttggatg accactccca gaggccatca 30
<210> 2
<211> 29
<212> DNA
<213> 人工序列
<220>
<223>
<400> 2
acgttggatg ttcccagatc ccaccacag 29
<210> 3
<211> 17
<212> DNA
<213> 人工序列
<220>
<223>
<400> 3
ttcaccacag cctcgcc 17
<210> 4
<211> 30
<212> DNA
<213> 人工序列
<220>
<223>
<400> 4
acgttggatg cctgcggtag ttctcaaaac 30
<210> 5
<211> 29
<212> DNA
<213> 人工序列
<220>
<223>
<400> 5
acgttggatg ttcccccttc tccaggacg 29
<210> 6
<211> 20
<212> DNA
<213> 人工序列
<220>
<223>
<400> 6
gctcaaaact ctctttgagg 20
<210> 7
<211> 30
<212> DNA
<213> 人工序列
<220>
<223>
<400> 7
acgttggatg tcaggcaaca tgacttgcac 30
<210> 8
<211> 30
<212> DNA
<213> 人工序列
<220>
<223>
<400> 8
acgttggatg gaggaagtga cctacctctt 30
<210> 9
<211> 18
<212> DNA
<213> 人工序列
<220>
<223>
<400> 9
ctatgtaggt gagcttcc 18
<210> 10
<211> 30
<212> DNA
<213> 人工序列
<220>
<223>
<400> 10
acgttggatg atcttccaag ccatgggcac 30
<210> 11
<211> 30
<212> DNA
<213> 人工序列
<220>
<223>
<400> 11
acgttggatg tggtgacaga gtacgtggag 30
<210> 12
<211> 20
<212> DNA
<213> 人工序列
<220>
<223>
<400> 12
atgtttggct gcggagggag 20
<210> 13
<211> 30
<212> DNA
<213> 人工序列
<220>
<223>
<400> 13
acgttggatg gccatcttca tggtgataac 30
<210> 14
<211> 30
<212> DNA
<213> 人工序列
<220>
<223>
<400> 14
acgttggatg tgaggatcac catgcagaca 30
<210> 15
<211> 16
<212> DNA
<213> 人工序列
<220>
<223>
<400> 15
gtgaaggtgg acactt 16
<210> 16
<211> 28
<212> DNA
<213> 人工序列
<220>
<223>
<400> 16
acgttggatg ccctgggtcc ccagccct 28
<210> 17
<211> 30
<212> DNA
<213> 人工序列
<220>
<223>
<400> 17
acgttggatg gagcgtctct gcttcatctc 30
<210> 18
<211> 15
<212> DNA
<213> 人工序列
<220>
<223>
<400> 18
agcccttcca tgccc 15
<210> 19
<211> 25
<212> DNA
<213> 人工序列
<220>
<223>
<400> 19
ccacataaac ctgggtcctt attaa 25
<210> 20
<211> 29
<212> DNA
<213> 人工序列
<220>
<223>
<400> 20
ggaaagatct gatatctgta aagcaagtg 29
<210> 21
<211> 16
<212> DNA
<213> 人工序列
<220>
<223>
<400> 21
cttggatgat ctttac 16
<210> 22
<211> 16
<212> DNA
<213> 人工序列
<220>
<223>
<400> 22
cttggatgat cttaac 16