本發(fā)明涉及核酸檢測領(lǐng)域,涉及利用cas蛋白進(jìn)行核酸檢測的方法,具體涉及基于crispr技術(shù)對幽門螺旋桿菌檢測的方法、系統(tǒng)和試劑盒。
背景技術(shù):
1、幽門螺旋桿菌(helicobaeter?pylori,hp)于1983年首次被發(fā)現(xiàn)以來,是目前所知能夠在人胃中生存的唯一微生物種類,據(jù)統(tǒng)計,全世界人群中幽門螺旋桿菌的感染率達(dá)50%,我國的感染率高達(dá)60%-90%,幽門螺旋桿菌感染可導(dǎo)致慢性胃炎、胃潰瘍、胃癌和和胃淋巴瘤等消化道疾病,而且隨著時間的遷移,幽門螺旋桿菌的根除難度逐年增加,治療失敗的例數(shù)也越來越多。
2、mira擴增(multienzyme?isothermal?rapid?amplification,多酶恒溫快速擴增技術(shù)),是一種恒溫核酸快速擴增技術(shù),依靠多種功能蛋白(解旋酶、重組酶、單鏈結(jié)合蛋白、dna聚合酶等)協(xié)同作用,在常溫下實現(xiàn)核酸快速擴增。相較于傳統(tǒng)pcr需要1.5-2個小時的反應(yīng)時間,mira擴增技術(shù)只需要5-20分鐘就能出結(jié)果,實現(xiàn)真正意義上的“快檢”,無需反復(fù)的升溫降溫操作;針對不同種類的核酸,均可在固定恒溫下完成快速擴增,具有快速、簡單、準(zhǔn)確的優(yōu)點。
3、crispr/cas?type?v系統(tǒng)是一類新發(fā)現(xiàn)的crispr系統(tǒng),它具有5’-ttn的基序,對靶標(biāo)序列進(jìn)行粘性末端切割,例如cpf1,c2c1,casx,casy。然而目前存在的不同的crispr/cas各有不同的優(yōu)點和缺陷。例如cas9,c2c1和casx均需要兩條rna進(jìn)行指導(dǎo)rna,而cpf1只需要一條指導(dǎo)rna而且可以用來進(jìn)行多重基因編輯。casx具有980個氨基酸的大小,而常見的cas9,c2c1,casy和cpf1通常大小在1300個氨基酸左右。此外,cas9,cpf1,casx,casy的pam序列都比較復(fù)雜多樣,而c2c1識別嚴(yán)謹(jǐn)?shù)?’-ttn,因此它的靶標(biāo)位點比其他系統(tǒng)容易被預(yù)測從而降低了潛在的脫靶效應(yīng)。
4、cas12i-sf01也屬于v型crispr/cas系統(tǒng),本發(fā)明提供了一種利用cas12i-sf01蛋白檢測幽門螺旋桿菌的方法,基于mira-crispr一步法恒溫擴增技術(shù),尤其是基于cas12i-sf01對于幽門螺旋桿菌的高效檢測活性,提供一種快速簡便、特異性高、檢測靈敏度高的檢測方法。
技術(shù)實現(xiàn)思路
1、本發(fā)明提供了一種基于mira-crispr一步法恒溫擴增技術(shù)進(jìn)行幽門螺旋桿菌檢測的方法、系統(tǒng)和試劑盒。
2、一方面,本發(fā)明提供了一種檢測待測樣品中幽門螺旋桿菌的方法,所述方法包括下步驟:
3、s1、從待測樣本中獲得待測核酸;
4、所述待測核酸由擴增獲得,所述擴增為恒溫擴增,所述恒溫擴增為mira擴增;優(yōu)選的,所述mira擴增引物包括一組mira引物;更優(yōu)選的,所述mira擴增引物的核苷酸序列如seq?id?no.12-seq?id?no.13所示;
5、s2、將步驟s1獲得的擴增產(chǎn)物與v型cas蛋白、grna和單鏈核酸檢測器接觸,檢測由cas蛋白切割單鏈核酸檢測器產(chǎn)生的可檢測信號,從而檢測幽門螺旋桿菌,所述grna包括與v型cas蛋白結(jié)合的區(qū)域和與靶核酸雜交的導(dǎo)向序列,所述靶核酸為來源于幽門螺旋桿菌的核酸;
6、所述grna中與靶核酸雜交的導(dǎo)向序列選自下組任意一種或其組合:
7、(1)所述與靶核酸雜交的導(dǎo)向序列含有20-30個堿基,并且與seq?id?no.1所示的序列或其反向互補序列雜交,并且所述導(dǎo)向序列包含seq?id?no.16-18任一所示的序列;
8、(2)所述與靶核酸雜交的導(dǎo)向序列包含seq?id?no.16-18任一所示的序列,并且在seq?id?no.16-18任一所示的序列的3’端還包括1-10個堿基,并且,所述與靶核酸雜交的導(dǎo)向序列與seq?id?no.1所示的序列或其反向互補序列雜交;
9、(3)所述與靶核酸雜交的導(dǎo)向序列與seq?id?no.16-18任一所示的序列相比,在seq?id?no.16-18任一所示的序列的3’端連續(xù)缺失1-5個堿基;
10、(4)所述與靶核酸雜交的導(dǎo)向序列如seq?id?no.16-18任一所示。
11、在一個實施方式中,所述親本cas蛋白的氨基酸序列與seq?id?no.2相比具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.1%、至少99.2%、至少99.3%、至少99.4%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、或至少99.9%的序列同一性。
12、在一個實施方式中,所述親本cas蛋白的氨基酸序列如seq?id?no.2所示。
13、在一個實施方式中,所述靶核酸來源于動物樣本。
14、所述cas蛋白的生物學(xué)功能包括但不限于,與指導(dǎo)rna結(jié)合的活性、核酸內(nèi)切酶活性、在指導(dǎo)rna引導(dǎo)下與靶序列特定位點結(jié)合并切割的活性,包括但不限于cis切割活性和trans切割活性。
15、在一個實施方式中,所述grna包括第一區(qū)段和第二區(qū)段;所述第一區(qū)段又稱為“骨架區(qū)”、“蛋白質(zhì)結(jié)合區(qū)段”、“蛋白質(zhì)結(jié)合序列”、或者“同向重復(fù)(direct?repeat)序列”;所述第二區(qū)段又稱為“靶向核酸的靶向序列”或者“靶向核酸的靶向區(qū)段”,或者“靶向靶序列的引導(dǎo)序列”。
16、在一個實施方式中,所述grna自5’端至3’端依次包括與cas蛋白結(jié)合的區(qū)域和與靶核酸雜交的導(dǎo)向序列。
17、在一個實施方式中,所述與靶核酸雜交的導(dǎo)向序列含有20-30個堿基,并且與seqid?no.1所示的序列或其反向序列雜交,并且所述導(dǎo)向序列包含seq?id?no.16-18任一所示的序列;優(yōu)選的,所述導(dǎo)向序列包含seq?id?no.16-18任一所示的序列;更優(yōu)選的,所述導(dǎo)向序列包含seq?id?no.16-18任一所示的序列。
18、在優(yōu)選的實施方式中,所述與靶核酸雜交的導(dǎo)向序列含有20-30個堿基,例如,20、21、22、23、24、25、26、27、28、29或30個堿基。
19、在一個實施方式中,所述與靶核酸雜交的導(dǎo)向序列包含seq?id?no.16-18任一所示的序列,并且在seq?id?no.16-18任一所示的序列的3’端還包括1-10個堿基(優(yōu)選,1、2、3、4、5、6、7、8、9個堿基),并且,所述與靶核酸雜交的導(dǎo)向序列與seq?id?no.1所示的序列或其反向互補序列雜交。
20、所述與seq?id?no.1所示的序列或其反向互補序列雜交,是指上述導(dǎo)向序列與seqid?no.1所示的序列或seq?id?no.1所示的序列的反向互補序列的連續(xù)的一段可以連續(xù)的互補配對。比如,所述與靶核酸雜交的導(dǎo)向序列含有30個堿基,則,導(dǎo)向序列的30個堿基需要與seq?id?no.1序列或其互補序列的連續(xù)30個堿基互補配對。
21、在一個實施方式中,所述與靶核酸雜交的導(dǎo)向序列與seq?id?no.16-18任一所示的序列相比,在seq?id?no.16-18任一所示的序列的3’端連續(xù)缺失1-5個堿基(例如,1、2、3、4、5個堿基)。
22、在更優(yōu)選的實施方式中,所述與靶核酸雜交的導(dǎo)向序列如seq?id?no.16-18任一所示。
23、在一個實施方式中,所述grna與cas蛋白結(jié)合的區(qū)域的序列為uaauacgacucacuauagggagagaaugugugcauagucacac(seq?id?no.3)所示。
24、進(jìn)一步的,所述方法還包括從待測樣品中獲得待測核酸的步驟;優(yōu)選的,采用擴增的方法從待測樣品中獲得待測核酸。
25、本發(fā)明中,所述待測核酸可以是雙鏈核酸,也可以是單鏈核酸。
26、在一個實施方式中,所述靶核酸為擴增產(chǎn)物,所述擴增選自pcr、基于核酸測序的擴增(nasba)、重組酶聚合酶擴增(rpa)、多酶恒溫快速擴增技術(shù)(mira)、環(huán)介導(dǎo)的等溫擴增(lamp)、鏈置換擴增(sda)、解旋酶依賴性擴增(hda)、或切口酶擴增反應(yīng)(near)、多重置換擴增(mda)、滾環(huán)擴增(rca)、連接酶鏈反應(yīng)(lcr)、或衍生物擴增方法(ram)中的一種或任意幾種;優(yōu)選的,采用多酶恒溫快速擴增技術(shù)(mira)擴增。
27、在一個實施方式中,所述樣品為來源于動物樣品。
28、在一個實施方式中,所述樣品可以為細(xì)胞培養(yǎng)物、血液、分泌物、排泄物(糞、尿)、組織液、淋巴液、內(nèi)臟、胎兒、動物組織、淋巴結(jié)、脾臟、肝臟、腸等。
29、在其他的實施方式中,所述樣品還可以來源于養(yǎng)殖場的環(huán)境樣品,例如,空氣、水體、土壤、接觸病源的污染物、養(yǎng)殖場的設(shè)備、帶病毒的媒介昆蟲等。
30、在一個實施方式中,所述步驟s1和s2可以在同一個反應(yīng)體系中,也可以在不同的體系,在優(yōu)選的實施方式中,s1和s2在同一個反應(yīng)體系中。
31、在一個實施方式中,所述s1和s2在同一個反應(yīng)體系,所述體系的緩沖液為t7buffer。
32、在一個實施方式中,所述s1和s2在同一個反應(yīng)體系,所述體系的組分含有瓊脂糖;優(yōu)選的,所述瓊脂糖的濃度為0.5%-2.5%,例如,1%、1.5%或2%;更優(yōu)選的,所述瓊脂糖濃度為1%。
33、另一方面,本發(fā)明還提供了一種用于檢測或診斷動物是否感染幽門螺旋桿菌的系統(tǒng)、組合物或試劑盒,所述系統(tǒng)、組合物或試劑盒包括上述mira擴增引物、cas蛋白、grna和單鏈核酸檢測器。
34、在一個實施方式中,所述系統(tǒng)、組合物或試劑盒還包括緩沖液;優(yōu)選的,所述緩沖液為t7?buffer。
35、在一個實施方式中,上述t7?buffer的組分包括tris-oac(tris-醋酸,三羥甲基氨基甲烷醋酸鹽)、mgoac(醋酸鎂)、bsa(牛血清白蛋白)和水。
36、在一個實施方式中,所述t7?buffer中tris-oac的濃度為200mm-500mm,優(yōu)選,400mm;所述mgoac的濃度為200mm-500mm,優(yōu)選,300mm;所述bsa的濃度為500ug/ml-1500ug/ml,優(yōu)選,1200ug/ml。
37、另一方面,本發(fā)明還提供了上述用于檢測或診斷幽門螺旋桿菌的系統(tǒng)或組合物制備用于診斷或檢測幽門螺旋桿菌的試劑或試劑盒中的用途。
38、進(jìn)一步的,所述cas蛋白選自以下i-iii任意一組:
39、i、由seq?id?no.2所示氨基酸序列;
40、ii、與i所述的cas突變蛋白相比,具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%的序列同一性的cas突變蛋白;
41、iii、與i所述的cas突變蛋白相比,具有一個或多個氨基酸的置換、缺失或添加的序列;所述一個或多個氨基酸包括1個,2個,3個,4個,5個,6個,7個,8個,9個或10個氨基酸的置換、缺失或添加。
42、在一個實施方式中,所述cas蛋白突變體包括氨基酸取代、缺失或替換,且所述突變體至少保留其trans切割活性。優(yōu)選地,所述突變體具有cis和trans切割活性。
43、本發(fā)明中,所述單鏈核酸檢測器包括單鏈dna、單鏈rna或者單鏈dna-rna雜交體。在其他的實施方式中,所述單鏈核酸檢測器包括單鏈dna、單鏈rna或者單鏈dna-rna雜交體的任意兩種或三種的混合物,例如,單鏈dna和單鏈rna的組合物、單鏈dna和單鏈dna-rna雜交體的組合物、單鏈rna和單鏈dna-rna的組合物。在其他的實施方式中,所述單鏈核酸檢測器還包括對堿基的修飾。
44、在優(yōu)選的實施方式中,所述單鏈核酸檢測器為單鏈寡核酸檢測器。
45、所述單鏈核酸檢測器不與所述grna雜交。
46、本發(fā)明中,所述可檢測信號通過以下方式實現(xiàn):基于視覺的檢測,基于傳感器的檢測,顏色檢測,基于金納米顆粒的檢測,熒光偏振,熒光信號,膠體相變/分散,電化學(xué)檢測和基于半導(dǎo)體的檢測。
47、在一些實施方式中,本發(fā)明的方法還包括測量crispr/cas效應(yīng)蛋白(cas蛋白)產(chǎn)生的可檢測信號的步驟。所述cas蛋白識別所述靶核酸或與所述靶核酸雜交之后可以激發(fā)任意單鏈核酸的切割活性,從而切割所述單鏈核酸檢測器進(jìn)而產(chǎn)生可檢測信號。
48、本發(fā)明中,所述可檢測信號可以是當(dāng)切割單鏈核酸檢測器時產(chǎn)生的任何信號。例如,基于金納米顆粒的檢測,熒光偏振,熒光信號,膠體相變/分散,電化學(xué)檢測,基于半導(dǎo)體的傳感。所述可檢測信號可通過任何合適的方式讀出,包括但不限于:可檢測的熒光信號的測量,凝膠電泳檢測(通過檢測凝膠上的條帶的變化),基于視覺或傳感器的顏色的存在或不存在的檢測、或者顏色存在的差異(例如,基于金納米顆粒)以及電信號的差異。
49、在優(yōu)選的實施方式中,所述可檢測信號通過以下方式實現(xiàn):所述單鏈核酸檢測器的5’端和3’端分別設(shè)置不同的報告基團,當(dāng)所述單鏈核酸檢測器被切割后,可以表現(xiàn)出可檢測的報告信號;例如,單鏈核酸檢測器的兩端分別設(shè)置熒光基團和淬滅基團,當(dāng)所述單鏈核酸檢測器被切割后,可以表現(xiàn)出可檢測的熒光信號。
50、在一個實施方式中,所述熒光基團選自fam、fitc、vic、joe、tet、cy3、cy5、rox、texas?red或lc?red460中的一種或任意幾種;所述淬滅基團選自bhq1、bhq2、bhq3、dabcy1或tamra中的一種或任意幾種。
51、在其他的實施方式中,所述可檢測信號還可以通過以下方式實現(xiàn):所述單鏈核酸檢測器的5’端和3’端分別設(shè)置不同的標(biāo)記分子,通過膠體金檢測的方式檢測反應(yīng)信號。
52、在一些實施方式中,所述可檢測信號的測量可以是定量的,在其他的實施方式中,所述可檢測信號的測量可以是定性的。
53、優(yōu)選的,所述單鏈核酸檢測器在被所述cas蛋白切割之前產(chǎn)生第一可檢測信號,并且在被切割之后產(chǎn)生不同于第一可檢測信號的第二可檢測信號。
54、在其他的實施方式中,單鏈核酸檢測器包括一個或多個的修飾,例如堿基修飾,骨架修飾,糖修飾等,以向核酸提供新的或增強的特征(例如改進(jìn)的穩(wěn)定性)。合適修飾的例子包括修飾的核酸骨架和非天然核苷間連接,具有修飾主鏈的核酸包括那些在主鏈中保留磷原子的核酸和那些在主鏈中不具有磷原子的核酸。合適的其中含有磷原子的修飾的寡核苷酸骨架包括硫代磷酸酯,手性硫代磷酸酯,二硫代磷酸酯,磷酸三酯,氨基烷基磷酸三酯,甲基和其它烷基膦酸酯。在一些實施方式中,單鏈核酸檢測器包含一個或多個硫代磷酸酯和/或雜原子核苷鍵。在其他的實施方式中,所述單鏈核酸檢測器可以是核酸模擬物;在某些實施方式中,所述核酸模擬物為肽核酸(pna),另一類核酸模擬物是基于具有連接到嗎啉環(huán)上的雜環(huán)堿基的連接嗎啉基單元(嗎啉基核酸),其他的核酸模擬物還包括環(huán)己烯基核酸(cena),還包括核糖或者脫氧核糖鏈。
55、在一個實施方式中,所述單鏈核酸檢測器具有2-300個核苷酸,優(yōu)選,3-200個核苷酸,優(yōu)選,3-100個核苷酸,優(yōu)選,具有3-30個核苷酸,優(yōu)選,4-20個核苷酸,更優(yōu)選,5-15個核苷酸。
56、術(shù)語“雜交”或“互補的”或“基本上互補的”是指核酸(例如rna、dna)包含使其能夠非共價結(jié)合的核苷酸序列,即以序列特異性,反平行的方式(即核酸特異性結(jié)合互補核酸)與另一核酸形成堿基對和/或g/u堿基對,“退火”或“雜交”。雜交需要兩個核酸含有互補序列,盡管堿基之間可能存在錯配。兩個核酸之間雜交的合適條件取決于核酸的長度和互補程度,這是本領(lǐng)域公知的變量。典型地,可雜交核酸的長度為8個核苷酸或更多(例如,10個核苷酸或更多,12個核苷酸或更多,15個核苷酸或更多,20個核苷酸或更多,22個核苷酸或更多,25個核苷酸或更多,或30個核苷酸或更多)。
57、應(yīng)當(dāng)理解,多核苷酸的序列不需要與其靶核酸的序列100%互補以特異性雜交。多核苷酸可包含60%或更高,65%或更高,70%或更高,75%或更高,80%或更高,85%或更高,90%或更高,95%或更高,98%或更高,99%或更高,99.5%或更高,或與其雜交的靶核酸序列中的靶區(qū)域的序列互補性為100%。
58、一般定義:
59、除非另有定義,否則本文所用的技術(shù)和科學(xué)術(shù)語具有與所屬領(lǐng)域的普通技術(shù)人員之一通常理解的相同的含義。
60、術(shù)語“氨基酸”是指含有氨基的羧酸。生物體內(nèi)的各種蛋白質(zhì)是由20種基本氨基酸構(gòu)成的。
61、術(shù)語“多核苷酸”、“核苷酸序列”、“核酸序列”、“核酸分子”和“核酸”可以互換使用,包括dna、rna或者其雜交體,可以是雙鏈或單鏈的。
62、術(shù)語“寡核苷酸”是指含有3-100個核苷酸的序列,優(yōu)選,具有3-30個核苷酸,優(yōu)選,4-20個核苷酸,更優(yōu)選,5-15個核苷酸。
63、術(shù)語“同源性”或“同一性”用于指兩個多肽之間或兩個核酸之間序列的匹配情況。當(dāng)兩個進(jìn)行比較的序列中的某個位置都被相同的堿基或氨基酸單體亞單元占據(jù)時(例如,兩個dna分子的每一個中的某個位置都被腺嘌呤占據(jù),或兩個多肽的每一個中的某個位置都被賴氨酸占據(jù)),那么各分子在該位置上是同一的。兩個序列之間。通常,在將兩個序列比對以產(chǎn)生最大同一性時進(jìn)行比較。這樣的比對可通過使用,例如,氨基酸序列的同一性可以通過常規(guī)方法,參考例如smith?and?waterman,1981,adv.appl.math.2:482pearson&lipman,1988,proc.natl.acad.sci.usa85:2444,thompsonetal.,1994,nucleic?acidsres22:467380等的教導(dǎo),通過計算機化運行運算法則(wisconsin?genetics軟件包中的gap,bestfit,fasta,和tfasta,genetics?computer?group)來確定。也可使用可從美國國立生物技術(shù)信息中心(ncbi?www.ncbi.nlm.nih.gov/)獲得的blast運算法則,使用默認(rèn)參數(shù)確定。
64、如本文所用,所述“crispr”是指成簇、規(guī)律間隔的短回文重復(fù)序列(clusteredregularly?interspaced?short?palindromic?repeats),其來自微生物的免疫系統(tǒng)。
65、如本文所用,“生物素(biotin)”也稱維生素h,是一種分子量為244da的小分子維生素?!坝H和素(avidin)”,又稱抗生物素,是一種堿性糖蛋白,具有4個同生物素親和例極高的結(jié)合位點,常用親和素有鏈霉親合素。生物素與親和素的極強親和力可用于在檢測體系中放大或增強檢測信號。如生物素很易與蛋白質(zhì)(如抗體等)以共價鍵結(jié)合,而結(jié)合了酶的親和素分子與結(jié)合有特異性抗體的生物素分子產(chǎn)生反應(yīng),既起到了多級放大作用,又由于酶在遇到相應(yīng)底物時的催化作用而呈色,達(dá)到檢測未知抗原(或抗體)分子的目的。
66、靶核酸
67、如本文所用,所述“靶核酸”是指從生物樣品(待測樣品)中提取的多核苷酸分子。所述生物樣品是從任何生物體獲得、排泄或分泌的任何固體或流體樣品,包括但不限于單細(xì)胞生物,例如細(xì)菌、酵母、原生動物和變形蟲等,多細(xì)胞生物(例如植物或動物,包括來自健康或表面健康的人類受試者或受待診斷或調(diào)查的病癥或疾病影響的人類患者的樣品,例如病原微生物例如病原細(xì)菌或病毒的感染)。例如,生物樣品可以是從例如血液、血漿、血清、尿液、糞便、痰液、粘液、淋巴液、滑液、膽汁、腹水、胸腔積液、血清腫、唾液、腦脊液、水性或玻璃體液、或任何身體分泌物、滲出液、滲出液(例如,從膿腫或任何其他感染或炎癥部位獲得的液體)中獲得的生物液體或從關(guān)節(jié)(例如,正常關(guān)節(jié)或受疾病影響的關(guān)節(jié),例如類風(fēng)濕性關(guān)節(jié)炎、骨關(guān)節(jié)炎、痛風(fēng)或膿毒性關(guān)節(jié)炎)獲得的液體,或皮膚或粘膜表面的拭子。樣品也可以是從任何器官或組織獲得的樣品(包括活組織檢查或尸體解剖標(biāo)本,例如腫瘤活檢)或者可以包含細(xì)胞(原代細(xì)胞或培養(yǎng)的細(xì)胞)或由任何細(xì)胞、組織或器官調(diào)理的培養(yǎng)基。示例性的樣品包括但不限于,細(xì)胞、細(xì)胞裂解物、血涂片、細(xì)胞離心制劑、細(xì)胞學(xué)涂片、體液(例如血液、血漿、血清、唾液、痰、尿、支氣管肺泡灌洗、精液等)、組織活檢(例如腫瘤活組織檢查)、細(xì)針抽吸物和/或組織切片(例如低溫恒溫器組織切片和/或石蠟包埋的組織切片)。
68、本發(fā)明中,所述的靶核酸還包括通過逆轉(zhuǎn)錄rna形成的dna分子,進(jìn)一步地,所述的靶核酸可以采用本領(lǐng)域公知的技術(shù)對其進(jìn)行擴增,所述的擴增技術(shù)可以是基于多酶恒溫快速擴增技術(shù)(mira)。
69、進(jìn)一步的,本發(fā)明所述的檢測方法包括一步法對待測樣本進(jìn)行mira擴增與crispr檢測。
70、cas蛋白
71、本文所述“cas蛋白”是指crispr-associated蛋白,優(yōu)選來自v型crispr/cas蛋白,其一旦與待檢測特征序列(靶序列)結(jié)合(即形成cas蛋白-grna-靶序列的三元復(fù)合物),就可以誘發(fā)其trans活性,即隨機切割非靶向單鏈核苷酸(即本文所述單鏈核酸檢測器,優(yōu)選單鏈dna(ssdna)、單鏈dna-rna雜交體、單鏈rna)。當(dāng)cas蛋白與特征序列結(jié)合后,其切割或不切割特征序列,均可以誘發(fā)其trans活性;優(yōu)選地,其通過切割特征序列誘發(fā)其trans活性;更優(yōu)選地,其通過切割單鏈特征序列誘發(fā)其trans活性。
72、本發(fā)明所述的cas蛋白為至少具有trans切割活性的蛋白,優(yōu)選地,所述的cas蛋白為具有cis和trans切割活性的蛋白。所述的cis活性是指cas蛋白可在grna的作用下識別pam位點并特異性切割靶序列的活性;但在靶序列為單鏈核酸時,pam位點并不是必需的。
73、在實施方式中,本文所稱的cas蛋白,也涵蓋cas的功能變體或其同源物或直系同源物。如本文所用的蛋白的“功能變體”是指至少部分保留該蛋白的活性的這樣的蛋白的變體。功能變體可以包括突變體(其可以是插入、缺失或替換突變體),包括多晶型物等。功能變體中還包括這樣的蛋白與另一種通常不相關(guān)的核酸、蛋白質(zhì)、多肽或肽的融合產(chǎn)物。功能變體可以是天然存在的或可以是人造的。有利的實施方式可以涉及工程化或非天然存在的v型dna靶向效應(yīng)蛋白。
74、在一個實施方式中,編碼cas蛋白的一種或多種核酸分子或其直系同源物或同源物可以被密碼子優(yōu)化用于在真核細(xì)胞中表達(dá)。真核生物可如本文所述。一種或多種核酸分子可以是工程化的或非天然存在的。
75、在一個實施方式中,cas12蛋白或其直系同源物或同源物可以包含一個或多個突變(并且因此編碼其的核酸分子可以具有一個或多個突變。突變可以是人工引入的突變并且可以包括但不限于催化結(jié)構(gòu)域中的一個或多個突變。
76、在一個實施方式中,cas蛋白可以來自:纖毛菌屬、李斯特菌屬、棒狀桿菌屬、薩特氏菌屬、軍團菌屬、密螺旋體屬、產(chǎn)線菌屬、真細(xì)菌屬、鏈球菌屬、乳酸菌屬、支原體屬、擬桿菌屬、flaviivola、黃桿菌屬、固氮螺菌屬、sphaerochaeta、葡糖醋桿菌屬、奈瑟氏菌屬、羅氏菌屬、parvibaculum、葡萄球菌屬、nitratifractor、支原體屬、彎曲桿菌屬和毛螺菌屬。
77、所述的cas蛋白可以通過重組表達(dá)載體技術(shù)獲得,即將編碼該蛋白的核酸分子構(gòu)建到合適的載體上,再轉(zhuǎn)化到宿主細(xì)胞中,使得所述的編碼核酸分子在細(xì)胞中表達(dá),從而獲得相應(yīng)的蛋白。所述的蛋白可以被細(xì)胞分泌出來,或者破解細(xì)胞通過常規(guī)的提取技術(shù)獲得該蛋白。所述的編碼核酸分子可以整合至宿主細(xì)胞的基因組中進(jìn)行表達(dá),也可以不整合到宿主細(xì)胞中進(jìn)行表達(dá)。所述的載體還進(jìn)一步包括有利于序列整合,或進(jìn)行自我復(fù)制的調(diào)節(jié)元件。所述的載體可以是例如質(zhì)粒、病毒、粘粒、噬菌體等類型,它們是本領(lǐng)域技術(shù)人員所熟知的,優(yōu)選地,本發(fā)明中的表達(dá)載體是質(zhì)粒。所述的載體進(jìn)一步包括一種或多種調(diào)控元件,選自啟動子、增強子、翻譯起始的核糖體結(jié)合位點、終止子、多聚腺苷酸序列、篩選標(biāo)記基因。
78、宿主細(xì)胞可以是原核細(xì)胞,如大腸桿菌,鏈霉菌屬、農(nóng)桿菌:或是低等真核細(xì)胞,如酵母細(xì)胞;或是高等真核細(xì)胞,如植物細(xì)胞。本領(lǐng)域一般技術(shù)人員都清楚如何選擇適當(dāng)?shù)妮d體和宿主細(xì)胞。
79、grna
80、如本文所用,所述的“grna”又稱為guide?rna或?qū)騬na,并且具有本領(lǐng)域技術(shù)人員通常理解的含義。一般而言,導(dǎo)向rna可以包含同向(direct)重復(fù)序列和導(dǎo)向序列(guidesequence),或者基本上由或由同向重復(fù)序列和導(dǎo)向序列(在內(nèi)源性crispr系統(tǒng)背景下也稱為間隔序列(spacer))組成。grna在不同的crispr系統(tǒng)中,依據(jù)其所依賴的cas蛋白的不同,可以包括crrna和tracrrna,也可以只含有crrna。crrna和tracrrna可以經(jīng)過人工改造融合形成single?guide?rna(sgrna)。在某些情況下,導(dǎo)向序列是與靶序列(本發(fā)明中所述特征序列)具有足夠互補性從而與所述靶序列雜交并引導(dǎo)crispr/cas復(fù)合物與所述靶序列的特異性結(jié)合的任何多核苷酸序列,通常具有12-25nt的序列長度。所述的同向重復(fù)序列可折疊形成特定結(jié)構(gòu)(如莖環(huán)結(jié)構(gòu))供cas蛋白識別,以形成復(fù)合物。所述的導(dǎo)向序列不需要與特征序列(靶序列)100%互補。所述的導(dǎo)向序列不與單鏈核酸檢測器互補。
81、在某些實施方案中,當(dāng)最佳比對時,導(dǎo)向序列與其相應(yīng)靶序列之間的互補程度(匹配度)為至少50%、至少60%、至少70%、至少80%、至少90%、至少95%、或至少99%。確定最佳比對在本領(lǐng)域的普通技術(shù)人員的能力范圍內(nèi)。例如,存在公開和可商購的比對算法和程序,諸如但不限于clustalw、matlab中的史密斯-沃特曼算法(smith-waterman)、bowtie、geneious、biopython以及seqman。
82、本發(fā)明所述的grna可以是天然的,也可以是經(jīng)過人工改造或設(shè)計合成的。
83、單鏈核酸檢測器
84、本發(fā)明所述的單鏈核酸檢測器是指含有2-200個核苷酸的序列,優(yōu)選,具有2-150個核苷酸,優(yōu)選,3-100個核苷酸,優(yōu)選,3-30個核苷酸,優(yōu)選,4-20個核苷酸,更優(yōu)選,5-15個核苷酸。優(yōu)選為單鏈dna分子、單鏈rna分子或單鏈dna-rna雜交體。
85、本發(fā)明的單鏈核酸檢測器的兩端包括不同的報告基團或標(biāo)記分子,當(dāng)其處于初始狀態(tài)(即未被切割狀態(tài)時)不呈現(xiàn)報告信號,當(dāng)該單鏈核酸檢測器被切割后,呈現(xiàn)出可檢測的信號,即切割后與切割前表現(xiàn)出可檢測的區(qū)別。在本發(fā)明中,如果能夠檢測出可檢測的區(qū)別,則反映靶核酸中含有待檢測的特征序列;或者,如果無法檢檢測出所述的可檢測的區(qū)別,則反映靶核酸中不含有待檢測的特征序列。
86、在一個實施方式中,所述的報告基團或標(biāo)記分子包括熒光基團和淬滅基團,所述熒光基團選自fam、hex、fitc、vic、joe、tet、cy3、cy5、rox、texas?red或lc?red460中的一種或任意幾種;所述淬滅基團選自bhq1、bhq2、bhq3、dabcy1或tamra中的一種或任意幾種。
87、在一個實施方式中,所述的單鏈核酸檢測器具有連接至5’端第一分子(如fam或fitc)和連接至3’端的第二分子(如生物素)。所述的含有單鏈核酸檢測器的反應(yīng)體系與流動條配合用以檢測特征序列(優(yōu)選,膠體金檢測方式)。所述的流動條被設(shè)計為具有兩條捕獲線,在樣品接觸端(膠體金)設(shè)有結(jié)合第一分子的抗體(即第一分子抗體),在第一線(control?line)處含有結(jié)合第一分子抗體的抗體,在第二線(test?line)處含有與第二分子結(jié)合的第二分子的抗體(即第二分子抗體,如親和素)。當(dāng)反應(yīng)沿著條帶流動時,第一分子抗體與第一分子結(jié)合攜帶切割或未切割的寡核苷酸至捕獲線,切割的報告子將在第一個捕獲線處結(jié)合第一分子抗體的抗體,而未切割的報告子將在第二捕獲線處結(jié)合第二分子抗體。報告基團在各條線的結(jié)合將導(dǎo)致強讀出/信號(例如顏色)。隨著更多的報告子被切割,更多的信號將在第一捕獲線處累積,并且在第二線處將出現(xiàn)更少的信號。在某些方面,本發(fā)明涉及如本文所述的流動條用于檢測核酸的用途。在某些方面,本發(fā)明涉及用本文定義的流動條檢測核酸的方法,例如(側(cè))流測試或(側(cè))流免疫色譜測定。在某些方面,所述單鏈核酸檢測器中的分子可相互替換,或改變分子的位置,只要其報告原理與本發(fā)明相同或相近,所改進(jìn)的方式也均包含在本發(fā)明中。
88、本發(fā)明所述的檢測方法,可用于靶核酸的定量檢測。所述的定量檢測指標(biāo)可以根據(jù)報告基團的信號強弱進(jìn)行定量,如根據(jù)熒光基團的發(fā)光強度,或根據(jù)顯色條帶的寬度等。
89、序列信息
90、本發(fā)明涉及的部分序列信息提供如下:
91、
92、
93、