專利名稱:對大腸桿菌o88的o-抗原特異的核苷酸的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及大腸桿菌O88(Escherichia coli O88)中控制O-抗原合成的基因簇的核苷酸全序列,特別是涉及大腸桿菌O88中控制O-抗原合成的基因簇中的寡核苷酸,可利用這些對O-抗原特異的寡核苷酸快速、準(zhǔn)確地檢測人體及環(huán)境中的大腸桿菌O88并鑒定這些致病菌中的O-抗原。
背景技術(shù):
大腸桿菌O88是致病菌,它屬于ETEC(enterotoxigenic Escherichiacoli),即產(chǎn)腸毒素的大腸桿菌,在蘇格蘭它曾引起兒童痢疾[E Begaud,DMondet et al(1993)“Molecular characterization of enterotoxigenicEscherichia coli(ETEC)isolated in New Caledonia(value of potentialprotective antigens in oral vaccine candidates)”Res Microbiol,November 1,1993;144(9)721-8];此外,從牛和食物中也分離到大腸桿菌O88[PM Molina et al(1993)“Survival in acidic and alcoholic mediumof Shiga toxin-producing Escherichia coli O157H7 and non-O157H7isolated in Argentina.)”BMC Microbiol,Aug 2003;3(1)17]。因此對大腸桿菌O88的檢測是重要的,需要一個可以快速、準(zhǔn)確地檢測大腸桿菌O88的方法。
位于大腸桿菌表面的脂多糖是大腸桿菌致病的誘因,而O-抗原是脂多糖最外層結(jié)構(gòu),是免疫系統(tǒng)識別的目標(biāo)和噬菌體吸附的位點。O-抗原的缺失會造成許多病原體的血清敏感,或者嚴(yán)重削弱病原體的毒力[Frank etal(1987)“The function of antibody and complement in the lysis ofbacteria”.Rev Infect Dis 1771750-1753.Pluschke G et al“Role of thecapsule and the O-antigen in resistance of O18K1 Escherichia coli tocomplement-mediated king”.J Bacteriol 42907-913]。大腸桿菌是一個種,種內(nèi)的菌株一般通過O-抗原和H-抗原(有時通過K-抗原)來鑒定。其中O-抗原具有高度多樣性,大腸桿菌有166種不同的O-抗原,O-抗原的變化可能是大腸桿菌的起源和維持其多樣性的主要原因[Reeves,P.R(1992)“Variation in antigens,niche specific selection and bacterialpopulations”.FEMS Microbiol.Lett,100509-516]。
O-抗原是革蘭氏陰性細(xì)菌脂多糖中的O特異性多糖成分,它由許多重復(fù)的寡糖單位組成。O-抗原的合成過程研究得較清楚先由糖基轉(zhuǎn)移酶將核苷二磷酸單糖轉(zhuǎn)移到一個固定在細(xì)胞內(nèi)膜的脂分子上,然后在內(nèi)膜的內(nèi)側(cè)合成寡糖單位,O-抗原的寡糖單位再通過o-抗原轉(zhuǎn)運酶被轉(zhuǎn)移到內(nèi)膜外側(cè),而后通過聚合酶聚合成多糖,再被連接到一個糖脂分子上形成脂多糖分子[Whitfield,C.(1995)“Biosynthesis of lipopolysaccharide Oantigens”.Trends in Microbiology.3178-185;Schnaitman,C.A.andJ.D.Klena.(1993)“Genetics of lipopolysaccharide biosynthesis inentericbacteria”.Microbiological Reviews,57(3)655-682]。編碼負(fù)責(zé)O-抗原合成的所有酶分子的基因一般在染色體上相鄰排列,形成一個基因簇[Reeves,P.R.,et al.(1996)“Bacterial polysaccharide synthes is and genenomenclature”Trends in Microbiology,4495-503]。在大腸桿菌、志賀氏菌和沙門氏菌中,O-抗原基因簇位于galF和gnd基因之間[Lei Wang.et al(2001)“Sequence analysis of four Shigella boydii O-antigen lociimplicationfor Escherichia coli and Shigella relationships”.Infection andImmunity,116923-6930;Lei Wang and Peter Reeves(2000)“The Escherichiacoli O111 and Salmonella enterica O35 gene clustersgene clusters encodingthe same colitose-containing O antigen are highly conserved”.Journal ofBacteriology.1825256-5261]。O-抗原基因簇含有三類基因糖合成路徑基因,糖基轉(zhuǎn)移酶基因,寡糖單位處理基因,其中糖合成路徑基因編碼的酶合成O-抗原所需的核苷二磷酸單糖;糖基轉(zhuǎn)移酶基因編碼的酶將核苷二磷酸單糖及其它分子轉(zhuǎn)到單糖上從而使單糖聚合成寡糖單位;寡糖單位處理基因包括o-抗原轉(zhuǎn)運酶基因和聚合酶基因,它們將寡糖單位轉(zhuǎn)移到細(xì)菌內(nèi)膜外側(cè),再聚合成多糖。糖基轉(zhuǎn)移酶基因和寡糖單位處理基因只存在于攜帶這些基因的基因簇里。O-抗原中單糖的不同,單糖間聯(lián)結(jié)鍵的不同和寡糖單位之間聯(lián)結(jié)鍵的不同構(gòu)成了O-抗原的多樣性,而單糖的組成、單糖間的聯(lián)結(jié)鍵及寡糖單位之間的聯(lián)結(jié)鍵是由O-抗原基因簇中的基因控制著,所以O(shè)-抗原基因簇決定了O-抗原的合成,也決定了O-抗原的多樣性。
因為O-抗原是極強(qiáng)的抗原,是大腸桿菌重要的致病因素之一,同時它又具有極強(qiáng)的多樣性,這啟示我們能研究一種快速、準(zhǔn)確地檢測大腸桿菌及其O-抗原的特異性好、靈敏度高的方法。以表面多糖為目標(biāo)的血清學(xué)免疫反應(yīng)自上世紀(jì)30年代以來一直被用于對細(xì)菌的分型和鑒定,是鑒定致病菌的唯一的手段。這種診斷方法需要大量的抗血清,而抗血清一般種類不全,數(shù)量不足,大量的抗血清在制備和儲存中也存在一些困難。另一方面此法耗時長、靈敏度低、漏檢率高、準(zhǔn)確性差,所以,現(xiàn)在普遍認(rèn)為這種傳統(tǒng)的血清學(xué)檢測方法將為現(xiàn)代分子生物學(xué)方法取代。1993年,Luk,J.M.C et.al用沙門氏菌(S.enterica)O-抗原基因簇的特異核苷酸序列通過PCR方法鑒定了沙門氏菌的O-抗原[Luk,J.M.C.et.al.(1993)“Selective amplification ofabequose and paratose synthase genes(rfb)by polymerase chain reactionfor identification of S.enterica major serogroups(A,B,C2,andD)”,J.Clin.Microbiol.312118-2123]。Luk,et.al的方法是將相應(yīng)于沙門氏菌血清型E1,D1,A,B和C2的O-抗原內(nèi)的CDP-阿比可糖和CDP-泰威糖的合成基因的核苷酸序列排列后得到對不同血清型的沙門氏菌特異的寡核苷酸。1996年,Paton,A.W et.al用對E.coli O111的O-抗原特異的源于wbdI基因的寡核苷酸鑒定了一株產(chǎn)毒素的E.coli O111的血清型[“Molecularmicrobiological investigation of an outbreak of Hemolytic-UremicSyndrome caused by dry fermented sausage contaminated with Shiga-liketoxin producing Escherichia coli”.J.Clin.Microbiol.341622-1627],但是后來的研究表明Paton,A.W et.al的用源于wbdI基因的寡核苷酸鑒定E.coli O111的血清型的方法有假陽性結(jié)果出現(xiàn)。Bastin D.A.and Reeves,P.R.認(rèn)為,這是由于wbdI基因是一個推測的糖合成路徑基因[Bastin D.A.andReeves,P.R.(1995)“Sequence and analysis of the O antigen gene(rfb)cluster of Escherichia coli O111”.Gene 16417-23],而在其它細(xì)菌的O-抗原的結(jié)構(gòu)中也可能有這個糖,所以糖合成路徑基因?qū)τ贠-抗原并不是高度特異的。大腸桿菌O88的O-抗原的結(jié)構(gòu)已知,如下所示。它是由4個糖組成的重復(fù)單位,其中,L6dTal是一個罕見的單糖[A Gamianet al(1994)“Structure of the Escherichia coli O24 and O88 O-specificsialic-acid- containing polysaccharides and linkage of thesestructures to the core region in lipopolysaccharides”.EuropeanJournal of Biochemistry,Vol 225,1211-1220].
→4)αDMan(1→3)α|DMan(1→βDGlcNAc(1→αL6dTal(1→3)發(fā)明內(nèi)容本發(fā)明的目的是提供了一種對大腸桿菌O88的O-抗原特異的核苷酸。它是大腸桿菌O88的O-抗原基因簇中的核苷酸,是源于o-抗原轉(zhuǎn)運酶基因、聚合酶基因及糖基轉(zhuǎn)移酶基因的特異的核苷酸。
本發(fā)明的一個目的是提供了大腸桿菌O88的O-抗原基因簇的全長核苷酸序列。
本發(fā)明的次一目的是提供了構(gòu)成大腸桿菌O88的O-抗原基因簇的基因轉(zhuǎn)運酶基因即wzx基因或與wzx有相似功能的基因;聚合酶基因即wzy基因或與wzy有相似功能的基因;糖基轉(zhuǎn)移酶基因,包括orf8、orf10、orf11基因;糖合成路徑基因,包括rmlB、rmlA、rmlC、tll、manB、manC、orf2、orf3基因。它們在O-抗原基因簇中的起始位置和終止位置及核苷酸序列都列在表4中。
本發(fā)明的又一目的是提供了寡核苷酸,它們分別源于大腸桿菌O88的O-抗原基因簇中編碼轉(zhuǎn)運酶的基因,包括wzx基因或與wzx有相似功能的基因;源于編碼聚合酶的基因,包括wzy基因或與wzy有相似功能的基因;源于編碼糖基轉(zhuǎn)移酶的基因,包括orf8、orf10、orf11基因。它們是上述基因內(nèi)的寡核苷酸,長度在10-20nt;它們對大腸桿菌O88的O-抗原是特異的;尤其是表1中列出的源于編碼轉(zhuǎn)運酶的基因和聚合酶的基因的寡核苷酸,它們對大腸桿菌O88的O-抗原是高度特異的,而且這些寡核苷酸還可重新組合,組合后的寡核苷酸對大腸桿菌O88的O-抗原也是高度特異的。
本發(fā)明的另一目的是提供的上述寡核苷酸可作為引物用于核酸擴(kuò)增反應(yīng),或者作為探針用于雜交反應(yīng),或者用于制造基因芯片或微陣列,從而通過這些方法來檢測和鑒定大腸桿菌O88的O-抗原及檢測和鑒定大腸桿菌O88。
本發(fā)明的再一目的是提供了分離大腸桿菌O88的O-抗原基因簇的全序列的方法。按照本方法操作可以獲得其他細(xì)菌的O-抗原基因簇的全序列,也可以獲得編碼其他多糖抗原的細(xì)菌的基因簇的全序列。
本發(fā)明的目的是由以下技術(shù)方案實現(xiàn)的。
本發(fā)明對大腸桿菌O88的O-抗原特異的核苷酸,其特征在于,其是如SEQID NO1所示的分離的核苷酸,全長16800個堿基;或者具有一個或多個插入、缺失或取代的堿基,同時保持所述分離的核苷酸功能的SEQ ID NO1核苷酸。
前述的對大腸桿菌O88的O-抗原特異的核苷酸,其特征在于,其由13個基因組成,其由命名為orf1、orf2、rmlB、rmlC、rmlA、tll、wzx、orf8、wzy、orf10、orf11、manC、manB的13個基因組成,都位于galF基因和gnd基因之間。
前述的對大腸桿菌O88的O-抗原特異的核苷酸,其特征在于,所述基因中具有高度特異性的基因包括轉(zhuǎn)運酶基因,包括wzx基因或與wzx有相似功能的基因;聚合酶基因,包括wzy基因或與wzy有相似功能的基因;糖基轉(zhuǎn)移酶基因,包括orf8、orf10、orf11基因。其中所述的轉(zhuǎn)運酶基因是SEQ IDNO1中的6892至8349堿基的核苷酸;所述的聚合酶基因是SEQ ID NO1中的9278至10552堿基的核苷酸;所述的orf8基因是SEQ ID NO1中的8368至9264堿基的核苷酸;orf10基因是SEQ ID NO1中的10549至11604堿基的核苷酸;orf11基因是SEQ ID NO1中的11605至12714堿基的核苷酸。
前述的對大腸桿菌O88的O-抗原特異的核苷酸,其特征在于,其還包括源于所述的wzx基因或wzy基因或糖基轉(zhuǎn)移酶基因的寡核苷酸;以及它們的混合或它們的重組。
前述的對大腸桿菌O88的O-抗原高度特異的核苷酸,其特征在于,所述的源于wzx基因的寡核苷酸對是SEQ ID NO1中的7772至7789堿基的核苷酸和8440至8457堿基的核苷酸,SEQ ID NO1中的7819至7836堿基的核苷酸和8228至8245堿基的核苷酸;所述的源于wzy基因的寡核苷酸對是SEQ ID NO1中的10165至10182堿基的核苷酸和10467至10484堿基的核苷酸,SEQ ID NO1中的9753至9770堿基的核苷酸和10149至10166堿基的核苷酸。
前述的對大腸桿菌O88的O-抗原特異的核苷酸在檢測表達(dá)O-抗原的細(xì)菌、在診斷中鑒定細(xì)菌的O-抗原和細(xì)菌的其它多糖抗原的應(yīng)用。
前述的對大腸桿菌O88的O-抗原特異的核苷酸的重組分子,而且通過插入表達(dá)可提供表達(dá)大腸桿菌O88的O-抗原,并成為細(xì)菌疫苗。
前述的對大腸桿菌O88的O-抗原特異的核苷酸的應(yīng)用,其特征在于它作為引物用于PCR、作為探針用于雜交反應(yīng)與熒光檢測、或者用于制造基因芯片或微陣列,可用這些方法檢測人體和環(huán)境中的細(xì)菌。
前述的對大腸桿菌O88的O-抗原特異的核苷酸的分離方法,其特征在于,包括下述步驟(1)基因組的提取在LB培養(yǎng)基中培養(yǎng)大腸桿菌O88,離心收集細(xì)胞;得到的基因組DNA通過瓊脂糖凝膠電泳檢測;(2)通過PCR擴(kuò)增大腸桿菌O88中的O-抗原基因簇以大腸桿菌O88的基因組為模板通過Long PCR擴(kuò)增其O-抗原基因簇;將得到PCR產(chǎn)物,用瓊脂糖凝膠電泳檢測PCR產(chǎn)物的大小及其特異性;合并該long PCR產(chǎn)物,并用DNA純化試劑盒純化PCR產(chǎn)物;(3)構(gòu)建O-抗原基因簇文庫用被修改的Novagen DNaseI shot gun法構(gòu)建O-抗原基因簇文庫;(4)對文庫中的克隆測序從文庫中挑選插入片段在1000bp以上克隆用實驗室常用的DNA自動測序儀對克隆中的插入片段單向進(jìn)行測序,使序列達(dá)到80%的覆蓋率,從而獲得O-抗原基因簇的所有序列;(5)核苷酸序列的拼接及分析用生物信息學(xué)軟件拼接和編輯所有的序列,從而得到大腸桿菌O88的O-抗原基因簇的核苷酸全長序列;(6)特異基因篩選針對大腸桿菌O88的O-抗原基因簇中wzx和wzy基因設(shè)計引物;在每個基因內(nèi)各設(shè)計兩對引物,每對引物分布在相應(yīng)基因內(nèi)不同地方以確保其特異性;用這些引物以166種血清型的大腸桿菌和43株志賀氏菌基因組為模板進(jìn)行PCR,確定wzx、wzy基因?qū)Υ竽c桿菌O88及其O-抗原都是高度特異的;(7)引物靈敏度的檢測培養(yǎng)大腸桿菌O88,細(xì)菌記數(shù)后分別將5×103,5×102,5×101,5個和0個活菌,加入到一定量的某種待檢測物中,混入細(xì)菌的待檢測物作為檢測用樣品,將樣品加入LB培養(yǎng)基,取一些與樣品混過的LB培養(yǎng)基過濾,將過濾液進(jìn)行培養(yǎng);從培養(yǎng)好的菌液中取數(shù)ml處理后做為PCR模板;用寡核苷酸進(jìn)行PCR反應(yīng),檢測其對大腸桿菌O88的靈敏度。
前述的對大腸桿菌O88的O-抗原特異的核苷酸的分離方法,其特征在于,包括下述步驟(1)基因組的提取在5mL的LB培養(yǎng)基中37℃過夜培養(yǎng)大腸桿菌O88,離心收集細(xì)胞。用500ul 50mM Tris-HCl(pH8.0)和10ul 0.4M EDTA重懸細(xì)胞,37℃溫育20分鐘,然后加入10ul 10mg/ml的溶菌酶繼續(xù)保溫20分鐘。之后加入3ul 20mg/ml的蛋白酶K、15ul 10%SDS,50℃溫育2小時,再加入3ul 10mg/ml的RNase,65℃溫育30分鐘。加等體積酚抽提混合物,取上清液再用等體積的酚∶氯仿∶異戊醇(25∶24∶1)混合溶液抽提兩次,取上清液,再用等體積的乙醚抽提以除去殘余的酚,上清液用2倍體積乙醇沉淀DNA,用玻璃絲卷出DNA并用70%乙醇洗DNA,最后將DNA重懸于30ul TE中,基因組DNA通過0.4%的瓊脂糖凝膠電泳檢測;(2)通過PCR擴(kuò)增大腸桿菌O88中的O-抗原基因簇以大腸桿菌O88的基因組為模板通過Long PCR擴(kuò)增其O-抗原基因簇;首先根據(jù)經(jīng)常發(fā)現(xiàn)于O-抗原基因簇上游的galF基因設(shè)計上游引物(5’-ATT GTG GCT GCA GGG ATC AAAGAA ATC-3’),再根據(jù)O-抗原基因簇下游的gnd基因設(shè)計下游引物(5’-TAG TCGCGC TGN GCC TGG ATT AAG TTC GC-3’)。用Boehringer Mannheim公司的ExpandLong Template PCR方法擴(kuò)增O-抗原基因簇,PCR反應(yīng)程序如下在94℃預(yù)變性2分鐘,然后94℃變性10秒,60℃退火30秒,68℃延伸15分鐘,這樣進(jìn)行30個循環(huán);最后,在68℃繼續(xù)延伸7分鐘,得到PCR產(chǎn)物,用0.8%的瓊脂糖凝膠電泳檢測PCR產(chǎn)物的大小及其特異性;合并6管long PCR產(chǎn)物,并用Promega公司的Wizard PCR Preps純化試劑盒純化PCR產(chǎn)物;(3)構(gòu)建O-抗原基因簇文庫用被修改的Novagen DNaseI shot gun法構(gòu)建O-抗原基因簇文庫。反應(yīng)體系是300ng PCR純化產(chǎn)物,0.9ul 0.1M MnCl2,1ul 1∶2000稀釋的1mg/ml的DNaseI,反應(yīng)在室溫中進(jìn)行;酶切10分鐘使DNA片段大小集中在1kb-3kb之間,而后加入2ul 0.1M EDTA終止反應(yīng);合并4管同樣的反應(yīng)體系,用等體積的酚抽提一次,用等體積的酚∶氯仿∶異戊醇(25∶24∶1)混合溶液抽提一次,再用等體積的乙醚抽提一次后,用2.5倍體積的無水乙醇沉淀DNA,并用70%乙醇洗沉淀,最后重懸于18ul水中;隨后在此混合物中加入2.5ul dNTP(1mMdCTP,1mMdGTP,1mMdTTP,10mMdATP),1.25ul 100mM DTT和5單位的T4DNA聚合酶,11℃反應(yīng)30分鐘,將酶切產(chǎn)物補(bǔ)成平端,75℃終止反應(yīng)后,加入5單位的Tth DNA聚合酶及其相應(yīng)的緩沖液并將體系擴(kuò)大為80ul,70℃反應(yīng)20分鐘,使DNA的3′端加dA尾,此混合物經(jīng)等體積氯仿∶異戊醇(24∶1)混合溶液抽提和等體積乙醚抽提后與Promega公司的3×10-3的pGEM-T-Easy載體于16℃連接24小時,總體積為90ul,其中有9ul的10×buffer和25單位的T4DNA連接酶;最后用1/10體積的3M NaAc(pH5.2)和2倍體積的無水乙醇沉淀連接混合物,再用70%乙醇洗沉淀,干燥后溶于30ul水中得到連接產(chǎn)物。用Bio-Rad公司的電轉(zhuǎn)化感受態(tài)細(xì)胞的制備方法制備感受態(tài)大腸桿菌DH5α細(xì)胞,取2-3ul連接產(chǎn)物與50ul感受態(tài)大腸桿菌DH5α混合后,轉(zhuǎn)到Bio-Rad公司的0.2cm的電擊杯中電擊,電壓為2.5千伏,時間為5.0毫秒-6.0毫秒,電擊后立即在杯中加入1ml的SOC培養(yǎng)基使菌復(fù)蘇,然后將菌涂在含有氨芐青霉素、X-Gal和IPTG的LB固體培養(yǎng)基上37℃過夜培養(yǎng),次日得到藍(lán)白菌落,將得到的白色菌落即白色克隆轉(zhuǎn)到含有氨芐青霉素的LB固體培養(yǎng)基上培養(yǎng),同時從每個克隆中提取質(zhì)粒并用EcoRI酶切鑒定其中的插入片段的大小,得到的白色克隆群構(gòu)成了大腸桿菌O88的O-抗原基因簇文庫;(4)對文庫中的克隆測序從文庫中挑選插入片段在1000bp以上的100個克隆由上海生物工程有限公司用ABI377型DNA自動測序儀對克隆中的插入片段單向進(jìn)行測序,使序列達(dá)到80%的覆蓋率,再通過將相聯(lián)系的序列進(jìn)行反向測序及測通得到剩余20%的序列,從而獲得O-抗原基因簇的所有序列;(5)核苷酸序列的拼接及分析用英國劍橋MRC(Medical ResearchCouncil)分子生物學(xué)實驗室出版的Staden package軟件包的Pregap4和Gap4軟件拼接和編輯所有的序列,從而得到大腸桿菌O88的O-抗原基因簇的核苷酸全長序列,序列的質(zhì)量主要由兩個方面來保證1)對大腸桿菌O88的基因組作6個Long PCR反應(yīng),然后混合這些產(chǎn)物以產(chǎn)生文庫。2)對每個堿基,保證3個以上高質(zhì)量的覆蓋率;在得到大腸桿菌O88的O-抗原基因簇的核苷酸序列后,用美國國家生物技術(shù)信息學(xué)中心(The National Center forBiotechnology Information,NCBI)的orffinder發(fā)現(xiàn)基因,找到13個開放的閱讀框,用blast系列軟件與GenBank中的基因比較以發(fā)現(xiàn)這些開放的閱讀框的功能并確定它們是什么基因,再用英國sanger中心的Artemis軟件完成基因注釋,用Clustral W軟件做DNA和蛋白質(zhì)序列間的精確比對,最后得到大腸桿菌O88的O-抗原基因簇的結(jié)構(gòu);(6)特異基因的篩選針對大腸桿菌O88的O-抗原基因簇中的wzx、wzy基因設(shè)計引物;在每個基因內(nèi)各設(shè)計了兩對引物,每對引物分布在相應(yīng)基因內(nèi)的不同地方以確保其特異性;用這些引物以166種血清型的大腸桿菌和43株志賀氏菌的基因組為模板進(jìn)行PCR,所有引物都在大腸桿菌O88中得到陽性結(jié)果,在其他組中都沒有擴(kuò)增到任何大小正確的帶,也就是說,在大多數(shù)組中沒有得到任何PCR產(chǎn)物帶,雖然在少數(shù)組中得到PCR產(chǎn)物帶,但其大小不符合預(yù)期大小,所以wzx、wzy基因?qū)Υ竽c桿菌O88及其O-抗原都是高度特異的。
(7)引物靈敏度的檢測購買市場上的生豬肉餡,攪拌均勻,分成20g一份,存在-40℃冰箱中備用。將10μl大腸桿菌O88的凍存菌液接種到有20ml LB培養(yǎng)基的三角瓶中,于37℃,200轉(zhuǎn)/分,培養(yǎng)12小時至飽和,取少量培養(yǎng)好的菌液作106和107倍的稀釋,其余的菌液放于4℃的冰箱中備用,取50μl稀釋菌液涂布LB瓊脂平板,37度,培養(yǎng)12h,對所涂平板計數(shù),計算原液中活菌濃度。在5份生豬肉餡中分別摻入5×103,5×102,5×101,5個和0個活菌,攪拌均勻,加入200ml LB培養(yǎng)基,經(jīng)6層紗布過濾,過濾液于37℃,200轉(zhuǎn)/分,培養(yǎng)12h。從培養(yǎng)好的菌液中取3ml菌液于6,000g離心5分鐘,去上清,加100μl MQ超純水吹開沉淀并混勻,放入100度沸水中煮15分鐘,裂解液于12,000g離心8分鐘,取1μ上清做為PCR模板。用4對寡核苷酸對,SEQ ID NO1中的7772至7789堿基的核苷酸和7819至7836堿基的核苷酸,SEQ ID NO1中的10165至10182堿基的核苷酸和9753至9770堿基的核苷酸,SEQ ID NO1中的10467至10182堿基的核苷酸和10467至10484堿基的核苷酸,SEQ ID NO1中的9753至9770堿基的核苷酸和10149至10166堿基的核苷酸,進(jìn)行PCR反應(yīng),PCR反應(yīng)體系如下MQ15.7μl,Mg2+2.5μl,Buffer2.5μl,dNTP1μl,Taq酶0.3μl,P11μl,P21μl,模板DNA1μl。PCR反應(yīng)條件為95℃5′,95℃30″,56℃45″,72℃1′,72℃5′,共30個循環(huán)。反應(yīng)結(jié)束后,取10μl反應(yīng)產(chǎn)物電泳,若有與預(yù)期大小相符的擴(kuò)增帶,則結(jié)果為陽性,若沒有,則結(jié)果為陰性。參入了5×103,5×102,5×101,和5個活菌的每份豬肉餡均在4對引物的PCR反應(yīng)中得到陽性結(jié)果。參入0個活菌的豬肉餡在4對引物的PCR反應(yīng)中得到陰性結(jié)果。說明使用上述方法時,這4對引物對豬肉餡中的大腸桿菌O88的檢測靈敏度均為0.25個菌/g。
也就是,本發(fā)明的第一個方面,提供了大腸桿菌O88的O-抗原基因簇的全長核苷酸序列,它的全序列如SEQ ID NO1所示,全長16800個堿基;或具有一個或多個插入、缺失或取代的堿基,同時保持所述分離的核苷酸功能的SEQ ID NO1的核苷酸。通過本發(fā)明的方法得到了大腸桿菌O88的O-抗原基因簇的結(jié)構(gòu),如表3所述,它的13個基因都位于galF基因和gnd基因之間。
本發(fā)明的第二個方面,提供了大腸桿菌O88的O-抗原基因簇中的基因,即轉(zhuǎn)運酶基因(wzx基因或與wzx有相似功能的基因);聚合酶基因(wzy基因或與wzy有相似功能的基因);糖基轉(zhuǎn)移酶基因,包括orf8、orf10、orf11基因;細(xì)菌多糖抗原中特殊的糖合成路徑基因,包括rmlB、rmlA、rmlC、tll、manB、manC、orf2、orf3基因。它們在O-抗原基因簇中的起始位置和終止位置及核苷酸序列都列在表4中。本發(fā)明尤其涉及到o-抗原轉(zhuǎn)運酶基因和聚合酶基因,因為糖合成路徑基因即合成核苷二磷酸單糖的基因現(xiàn)在被預(yù)示對較多胞外多糖是常見的、共同的,對細(xì)菌的O-抗原并不是特異的,而本發(fā)明涉及到的o-抗原轉(zhuǎn)運酶基因、聚合酶基因和糖基轉(zhuǎn)移酶基因?qū)Υ竽c桿菌O88的O-抗原是特異的。
本發(fā)明的第三個方面,提供了源于大腸桿菌O88的O-抗原基因簇中的wzy基因或與wzy有相似功能的基因和wzx基因或與wzx有相似功能的基因的寡核苷酸和糖基轉(zhuǎn)移酶基因包括orf8、orf10、orf11基因的寡核苷酸,它們是這些基因中的任何一段寡核苷酸。但是,優(yōu)先被用的是列于表1中源于大腸桿菌O88的O-抗原基因簇中的wzy基因或與wzy有相似功能的基因、wzx基因或與wzx有相似功能的基因的寡核苷酸對。在表1中也列出了這些寡核苷酸對在O-抗原基因簇中的位置及以這些寡核苷酸對為引物所做的PCR反應(yīng)的產(chǎn)物的大小,這些PCR反應(yīng)可用表中的退火溫度進(jìn)行。這些引物只在以大腸桿菌O88為模板進(jìn)行的PCR擴(kuò)增中得到預(yù)期大小的產(chǎn)物,而在以表2所列的其它菌為模板進(jìn)行的PCR擴(kuò)增中都未得到預(yù)期大小的產(chǎn)物。更詳細(xì)地說,以這些寡核苷酸對為引物所做的PCR反應(yīng)在大多數(shù)細(xì)菌中均未得到任何產(chǎn)物,所以,可以確定這些引物即表1所列的寡核苷酸對大腸桿菌O88及它們的O-抗原是高度特異的。
所述的對大腸桿菌O88的O-抗原特異的核苷酸的分離和鑒定方法包括下述步驟1)基因組的提?。?)PCR擴(kuò)增大腸桿菌O88中的O-抗原基因簇;3)O-抗原基因簇文庫的構(gòu)建;4)對文庫中的克隆測序;5)核苷酸序列的拼接及分析,最終獲得O-抗原基因簇的結(jié)構(gòu);6)特異基因的篩選;7)引物靈敏度的檢測。
本發(fā)明的其他方面由于本文的技術(shù)的公開,對本領(lǐng)域的技術(shù)人員而言是顯而易見的。
如本發(fā)明所述,“寡核苷酸”主要是指來源于O-抗原基因簇中的編碼轉(zhuǎn)運酶的基因、編碼聚合酶的基因和編碼糖基轉(zhuǎn)移酶基因內(nèi)的一段核苷酸分子,它們在長度上可改變,一般在10到20個核苷酸范圍內(nèi)改變。尤其是源于wzx基因(核苷酸位置是從SEQ ID NO1的6892至8349),wzy基因(核苷酸位置是從SEQ ID NO1的9278至10552堿基)內(nèi)的寡核苷酸對大腸桿菌O88都是高度特異的。
此外,有時兩個遺傳相似的編碼不同O-抗原的基因簇通過基因重組或突變產(chǎn)生新的O-抗原,從而產(chǎn)生新的細(xì)菌類型,新的突變株。在這種環(huán)境中,需要篩選出多對寡核苷酸同重組基因雜交以提高檢測的特異性。因此,本發(fā)明提供了一整套多對寡核苷酸的混合物,它們源于轉(zhuǎn)運酶基因,包括wzx基因或與wzx有相似功能的基因;源于聚合酶基因,包括wzy基因或與wzy有相似功能的基因;源于糖基轉(zhuǎn)移酶基因,包括orf8、orf10、orf11基因。這些基因的混合物對一個特殊的細(xì)菌多糖抗原來說是特異的,從而使這套寡核苷酸對這個細(xì)菌的多糖抗原是特異的。更具體地說,這些寡核苷酸的混合物是源于轉(zhuǎn)運酶基因、源于聚合酶基因和源于糖基轉(zhuǎn)移酶基因中的寡核苷酸的組合。
在另一方面,本發(fā)明涉及寡核苷酸的鑒定,它們可以用于檢測表達(dá)O-抗原的細(xì)菌和在診斷中鑒定細(xì)菌的O-抗原。
本發(fā)明涉及到一種檢測食品中的一個或多個細(xì)菌多糖抗原的方法,這些抗原可以使樣品能與以下至少一個基因的寡核苷酸特異性雜交,這些基因是(i)編碼轉(zhuǎn)運酶基因,包括wzx基因或與wzx有相似功能的基因(ii)編碼聚合酶的基因,包括wzy基因或與wzy有相似功能的基因。(iii)編碼糖基轉(zhuǎn)移酶基因,包括orf8、orf10、orf11基因。在條件許可的情況下至少一個寡核苷酸能與至少一個表達(dá)特殊的O-抗原的細(xì)菌的一個以上的那樣的基因特異性雜交,這些細(xì)菌是大腸桿菌O88??捎肞CR方法檢測,更可以將本發(fā)明方法中的核苷酸標(biāo)記后作為探針通過雜交反應(yīng)如southern-blot或熒光檢測,或者通過基因芯片或微陣列檢測樣品中的抗原及細(xì)菌。
本發(fā)明者考慮到以下情況當(dāng)單個的特異的寡核苷酸檢測無效時,寡核苷酸的混合物能與靶區(qū)域特異性雜交以檢測樣品。因此本發(fā)明提供了一套寡核苷酸用于本發(fā)明所述的檢測方法。這里所說的寡核苷酸是指源于編碼轉(zhuǎn)運酶基因包括wzx基因或與wzx有相似功能的基因、編碼聚合酶的基因包括wzy基因或與wzy有相似功能的基因的寡核苷酸和編碼糖基轉(zhuǎn)移酶基因包括orf8、orf10、orf11基因的寡核苷酸。這套寡核苷酸對一個特殊的細(xì)菌的O-抗原來說是特異的,這一特殊的細(xì)菌O-抗原是由大腸桿菌O88表達(dá)的。
另一方面,本發(fā)明涉及到一種檢測排泄物中的一個或多個細(xì)菌多糖抗原的方法,這些抗原可以使樣品能與以下至少一個基因的寡核苷酸特異性雜交,這些基因是(i)編碼轉(zhuǎn)運酶的基因,包括wzx基因或與wzx有相似功能的基因(ii)編碼聚合酶的基因,包括wzy基因或與wzy有相似功能的基因(iii)編碼糖基轉(zhuǎn)移酶基因,包括orf8、orf10、orf11基因。在條件許可的情況下至少一個寡核苷酸能與至少一個表達(dá)特殊的O-抗原的細(xì)菌的一個以上的那樣的基因特異性雜交。這些細(xì)菌是大腸桿菌O88??捎帽景l(fā)明中的寡核苷酸作引物通過PCR的方法檢測樣品,也可將本發(fā)明中的寡核苷酸分子標(biāo)記后作為探針通過雜交反應(yīng)如southern-blot或熒光檢測,或者通過基因芯片或微陣列檢測樣品中的抗原及細(xì)菌。
一般一對寡核苷酸可能與同樣的基因雜交也可與不同的基因雜交,但它們中必須有一個寡核苷酸能特異性雜交到特殊抗原型的特異序列上,另一個寡核苷酸可雜交于非特異性區(qū)域。因此,當(dāng)特殊的多糖抗原基因簇中的寡核苷酸被重新組合時,至少能選出一對寡核苷酸與多糖抗原基因簇中特異基因混合物雜交,或者選出多對寡核苷酸與特異基因的混合物雜交。甚至即使當(dāng)一個特殊的基因簇中所有基因都獨一無二時,此方法也能應(yīng)用于識別此基因簇內(nèi)的基因混合物的核苷酸分子。因此本發(fā)明提供了一整套用于檢測本發(fā)明方法的多對寡核苷酸,在這里多對寡核苷酸是源于編碼轉(zhuǎn)運酶的基因包括wzx基因或與wzx有相似功能的基因;源于編碼聚合酶的基因包括wzy基因或與wzy有相似功能的基因;源于編碼糖基轉(zhuǎn)移酶的基因包括orf8、orf10、orf11基因。這套寡核苷酸對一個特殊的細(xì)菌多糖來說是特異的,這套寡核苷酸可能是糖合成中必須基因的核苷酸。
另一方面,本發(fā)明也涉及到一種檢測源于病人的樣品中的一個或多個細(xì)菌多糖抗原的方法。樣品中的一個或多個細(xì)菌多糖抗原可以使樣品能與以下至少一個基因中的一對寡核苷酸中的一個特異性雜交,這些基因是(i)編碼轉(zhuǎn)運酶的基因,包括wzx基因或與wzx有相似功能的基因(ii)編碼聚合酶的基因,包括wzy基因或與wzy有相似功能的基因(iii)編碼糖基轉(zhuǎn)移酶基因,包括orf8、orf10、orf11基因。在條件許可的情況下至少一個寡核苷酸能與樣品中的至少一個表達(dá)特殊的O-抗原的細(xì)菌的一個以上的那樣的基因特異性雜交,這些細(xì)菌是大腸桿菌O88??捎帽景l(fā)明中的寡核苷酸作引物通過PCR的方法檢測樣品,也可將本發(fā)明中的寡核苷酸標(biāo)記后作為探針通過雜交反應(yīng),或者通過基因芯片或微陣列檢測樣品中的抗原及細(xì)菌。
更詳細(xì)地說,以上描述的方法可以理解為當(dāng)寡核苷酸對被使用時,其中的一個寡核苷酸分子能雜交到一個并不是來源于wzx基因或與wzx有相似功能的基因及wzy基因或與wzy有相似功能的基因和糖基轉(zhuǎn)移酶基因包括orf8、orf10、orf11基因的序列上。此外,當(dāng)兩個寡核苷酸都能雜交上時,它們可能雜交于同一基因也可能雜交到不同基因上。也即,當(dāng)交叉反應(yīng)出現(xiàn)問題時,可選擇寡核苷酸的混合物來檢測混合的基因以提供檢測的特異性。
本發(fā)明者相信本發(fā)明不必限于以上所提的核苷酸序列編碼的特定的O-抗原,而且廣泛應(yīng)用于檢測所有表達(dá)O-抗原和鑒定O-抗原的細(xì)菌。由于O-抗原合成和其他多糖抗原(如細(xì)菌胞外抗原)合成之間的相似性,本發(fā)明的方法和分子也應(yīng)用于這些其他的多糖抗原。
本發(fā)明首次公開了大腸桿菌O88的O-抗原基因簇的全長序列,而且可從這個未被克隆的全長基因簇的序列中產(chǎn)生重組分子,通過插入表達(dá)可產(chǎn)生表達(dá)大腸桿菌O88的O-抗原,并成為有用的疫苗。
具體實施例方式下面結(jié)合具體實施例,進(jìn)一步闡述本發(fā)明。應(yīng)理解這些實施例僅用于說明本發(fā)明而不用于限制本發(fā)明的范圍。下列實施例中未注明具體條件的實驗方法,通常按照常規(guī)條件如Sambrook等人,分子克隆實驗室手冊(NewYorkCold Spring Harbor Laboratory Press,1989)中所述的條件。
實施例1基因組的提取。
在5mL的LB培養(yǎng)基中37℃過夜培養(yǎng)大腸桿菌O88,離心收集細(xì)胞。用500ul50mM Tris-HCl(pH8.0)和10ul 0.4M EDTA重懸細(xì)胞,37℃溫育20分鐘,然后加入10ul 10mg/ml的溶菌酶繼續(xù)保溫20分鐘。之后加入3ul 20mg/ml的蛋白酶K、15ul 10%SDS,50℃溫育2小時,再加入3ul 10mg/ml的RNase,65℃溫育30分鐘。加等體積酚抽提混合物,取上清液,再用等體積的酚∶氯仿∶異戊醇(25∶24∶1)溶液抽提兩次,取上清液,再用等體積的乙醚抽提以除去殘余的酚。上清液用2倍體積乙醇沉淀DNA,用玻璃絲卷出DNA并用70%乙醇洗DNA,最后將DNA重懸于30ul TE中。基因組DNA通過0.4%的瓊脂糖凝膠電泳檢測。
實施例2通過PCR擴(kuò)增大腸桿菌O88中的O-抗原基因簇以大腸桿菌O88的基因組為模板通過Long PCR擴(kuò)增其O-抗原基因簇。首先根據(jù)經(jīng)常發(fā)現(xiàn)于O-抗原基因簇上游的galF基因設(shè)計上游引物(5’-ATTGTG GCT GCA GGG ATC AAA GAA ATC-3’),再根據(jù)O-抗原基因簇下游的gnd基因設(shè)計下游引物(5’-TAG TCG CGC TGN GCC TGG ATT AAG TTC GC-3’)。用Boehringer Mannheim公司的Expand Long Template PCR方法擴(kuò)增O-抗原基因簇,PCR反應(yīng)程序如下在94℃預(yù)變性2分鐘;然后94℃變性10秒,61℃退火30秒,68℃延伸15分鐘,這樣進(jìn)行30個循環(huán);最后,在68℃繼續(xù)延伸7分鐘,得到PCR產(chǎn)物,用0.8%的瓊脂糖凝膠電泳檢測PCR產(chǎn)物的大小及其特異性。合并6管long PCR產(chǎn)物,并用Promega公司的Wizard PCR Preps純化試劑盒純化PCR產(chǎn)物。
實施例3構(gòu)建O-抗原基因簇文庫。
首先是連接產(chǎn)物的獲得用被修改的Novagen DNaseI shot gun法構(gòu)建O-抗原基因簇文庫。反應(yīng)體系是300ng PCR純化產(chǎn)物,0.9ul 0.1M MnCl2,1ul 1∶2000稀釋的1mg/ml的DNaseI,反應(yīng)在室溫中進(jìn)行。酶切10分鐘使DNA片段大小集中在1kb-3kb之間,而后加入2ul 0.1M EDTA終止反應(yīng)。合并4管同樣的反應(yīng)體系,用等體積的酚抽提一次,用等體積的酚∶氯仿∶異戊醇(25∶24∶1)混合溶液抽提一次,再用等體積的乙醚抽提一次后,用2.5倍體積的無水乙醇沉淀DNA,并用70%乙醇洗沉淀,最后重懸于18ul水中。隨后在此混合物中加入2.5ul dNTP(1mMdCTP,1mMdGTP,1mMdTTP,10mMdATP),1.25ul 100mM DTT和5單位的T4DNA聚合酶,11℃反應(yīng)30分鐘,將酶切產(chǎn)物補(bǔ)成平端,75℃終止反應(yīng)后,加入5單位的Tth DNA聚合酶及其相應(yīng)的緩沖液并將體系擴(kuò)大為80ul,70℃反應(yīng)20分鐘,使DNA的3′端加dA尾。此混合物經(jīng)等體積氯仿∶異戊醇(24∶1)混合溶液抽提和等體積乙醚抽提后與Promega公司的3×10-3的pGEM-T-Easy載體于16℃連接24小時,總體積為90ul。其中有9ul的10×buffer和25單位的T4DNA連接酶。最后用1/10體積的3M NaAc(pH5.2)和2倍體積的無水乙醇沉淀連接混合物,再用70%乙醇洗沉淀,干燥后溶于30ul水中得到連接產(chǎn)物。
其次是感受態(tài)細(xì)胞的制備參照Bio-Rad公司提供的方法制備感受態(tài)細(xì)胞大腸桿菌DH5α。取一環(huán)大腸桿菌DH5α單菌落于5ml的LB培養(yǎng)基中,180rpm培養(yǎng)10小時后,取2ml培養(yǎng)物轉(zhuǎn)接到200ml的LB培養(yǎng)基中,37℃250rpm劇烈振蕩培養(yǎng)到OD600 0.5左右,然后冰浴冷卻20分鐘,于4℃4000rpm離心15分鐘。傾盡上清液,用冷的冰預(yù)冷的去離子滅菌水200ml吹散菌體,于4℃ 4000rpm離心15分鐘。再用冷的冰預(yù)冷的去離子滅菌水100ml吹散菌體,于4℃4000rpm離心15分鐘。用冷的冰預(yù)冷的10%的甘油懸浮細(xì)胞,4℃6000rpm離心10分鐘,棄上清液,最后沉淀用1ml冰預(yù)冷的10%的甘油懸浮細(xì)胞,即為感受態(tài)細(xì)胞。將制得的感受態(tài)細(xì)胞分裝為50ul一管,-70℃保存。
最后是電轉(zhuǎn)化感受態(tài)細(xì)胞取2-3ul連接產(chǎn)物與50ul感受態(tài)大腸桿菌DH5α混合后,轉(zhuǎn)到Bio-Rad公司的0.2cm的電擊杯中電擊,電壓為2.5千伏,時間為5.0毫秒-6.0毫秒。電擊后立即在杯中加入1ml的SOC培養(yǎng)基使菌復(fù)蘇。然后立即將菌涂在含有氨芐青霉素、X-Gal和IPTG的LB固體培養(yǎng)基上37℃倒置過夜培養(yǎng),次日得到藍(lán)白菌落。將得到的白色菌落即白色克隆轉(zhuǎn)到含有氨芐青霉素的LB固體培養(yǎng)基上培養(yǎng),同時從每個克隆中提取質(zhì)粒并用EcoRI酶切鑒定其中的插入片段的大小,得到白色克隆群構(gòu)成了大腸桿菌O88的O-抗原基因簇文庫。
實施例4對文庫中的克隆測序。
從文庫中挑選插入片段在1000bp以上的100個克隆由上海生物工程有限公司用ABI377型DNA自動測序儀對克隆中的插入片段單向進(jìn)行測序,使序列達(dá)到80%的覆蓋率。剩余20%的序列再通過反向測序及將有些序列測通得到,最后獲得O-抗原基因簇的所有序列。
實施例5核苷酸序列的拼接及分析。
用英國劍橋MRC(Medical Research Council)分子生物學(xué)實驗室出版的Staden package軟件包的Pregap4和Gap4軟件拼接和編輯所有的序列,從而得到大腸桿菌O88的O-抗原基因簇的核苷酸全長序列(見序列列表)。序列的質(zhì)量主要由兩個方面來保證1)對大腸桿菌O88的基因組作6個Long PCR反應(yīng),然后混合這些產(chǎn)物以產(chǎn)生文庫。2)對每個堿基,保證3個以上高質(zhì)量的覆蓋率。在得到大腸桿菌O88的O-抗原基因簇的核苷酸序列后,用美國國家生物技術(shù)信息學(xué)中心(The National Center for BiotechnologyInformation,NCBI)的orffinder發(fā)現(xiàn)基因,找到13個開放的閱讀框,用blast系列軟件與GenBank中的基因比較以發(fā)現(xiàn)這些開放的閱讀框的功能并確定它們是什么基因,再用英國sanger中心的Artemis軟件完成基因注釋,用Clustral W軟件做DNA和蛋白質(zhì)序列間的精確比對,最后得到大腸桿菌O88的O-抗原基因簇的結(jié)構(gòu),如表3所示。
通過檢索和比較,在orf1的上游發(fā)現(xiàn)一段序列與Escherichia coli的轉(zhuǎn)座酶在378個氨基酸中有98%的相同性,98%的相似性;這個轉(zhuǎn)座酶是一個H repeat,所以在orf1的上游的這段序列也是一個H repeat。orf1編碼的蛋白與Aeromonas hydrophila的O-acetyl transferase在182個氨基酸中有52%的相同性,74%的相似性,表明orf1也編碼O-acetyl transferase,暫命名為orf1。Orf2與Aeromonas hydrophila的acetyl transferase在194個氨基酸中有57%的相同性,74%的相似性,表明orf2也編碼acetyltransferase,暫命名為orf2。Orf3編碼的蛋白與Shigella boydii的dTDP-D-葡萄糖-4,6-脫氫酶在357個氨基酸中有80%的相同性,88%的相似性。dTDP-D-葡萄糖-4,6-脫氫酶由rmlB基因編碼,高度的相同性表明orf3也是rmlB基因,命名為rmlB。Orf4編碼的蛋白與Escherichia coli K12的葡萄糖-1-磷酸胸苷轉(zhuǎn)移酶在291個氨基酸中有82%的相同性,91%的相似性。葡萄糖-1-磷酸胸苷轉(zhuǎn)移酶由rmlA基因編碼,高度的相同性表明orf4也是rmlA基因,命名為rmlA。Orf5編碼的蛋白與Aeromonas hydrophila的dTDP-6-脫氧-D-葡萄糖3,5-變位酶在183個氨基酸中有70%的相同性,85%的相似性。dTDP-D-葡萄糖4,6-脫氫酶由rmlC基因編碼,高度的相同性表明orf5也是rmlC基因,命名為rmlC。Orf6編碼的蛋白與Aeromonas hydrophila的dTDP-glucose-4,6-dehydratase在245個氨基酸中有54%的相同性,75%的相似性,在245個氨基酸中有54%的相同性,75%的相似性,而且,通過對Pfam蛋白基序數(shù)據(jù)庫的搜索,發(fā)現(xiàn)orf6編碼的蛋白與NAD依賴的脫氫酶和變位酶家族的保守的基序PF01370的E value為2.5×e-7,這個酶是由tll基因編碼,而且,通過對Pfam蛋白基序數(shù)據(jù)庫的搜索,發(fā)現(xiàn)orf6編碼的蛋白與NAD依賴的脫氫酶和變位酶家族的保守的基序PF01370的E value為2.5×e-7,在大腸桿菌O88的O-抗原中有一個非常罕見的糖L6dTal,它的合成途徑已經(jīng)被發(fā)現(xiàn),L6dTal是由rmlB、rmlC、rmlA和tll四個基因編碼的蛋白合成,tll編碼一個氧化還原酶dTDP-6-deoxy-L-taloseNADP 4-oxidoreductase,我們推測orf6也編碼dTDP-6-deoxy-L-taloseNADP 4-oxidoreductase以合成大腸桿菌O88的O-抗原中的L6dTal,因此將orf6命名為tll。blast比較表明orf7與Aeromonas hydrophila的O-抗原轉(zhuǎn)運酶Wzx在486個氨基酸的序列中有40%的相同性,63%的相似性。并且通過Eisenberg等人的算法發(fā)現(xiàn)orf7有14個潛在的穿膜區(qū),而且分布均勻,這是Wzx的典型特征,所以可以確定orf7是wzx基因,命名為wzx。Orf8編碼的蛋白與Aeromonashydrophila的鼠李糖的糖基轉(zhuǎn)移酶在486個氨基酸中有40%的相同性,63%的相似性,通過對Pfam蛋白基序數(shù)據(jù)庫的搜索,發(fā)現(xiàn)orf8與糖基轉(zhuǎn)移酶家族1的PF00534的E value為2.3×e-17,因此推測orf8也是一個糖基轉(zhuǎn)移酶,因為L6dTal和鼠李糖的合成過程很相似,所以推測orf8編碼的蛋白是一個L6dTal的轉(zhuǎn)移酶,將orf8基因暫命名為orf8。Orf9與Salmonellaenterica的O-抗原聚合酶在385個氨基酸的序列中有22%的相同性,45%的相似性。并且通過Eisenberg等人的算法[Eisenberg,D,Schwarz,E.et al(1984).Analysis of membrane and surfaceprotein sequences with the hydrophobic moment plot.J.Mol.Biol.179125-142]發(fā)現(xiàn)orf9有10個潛在的穿膜區(qū),它與許多Wzy蛋白有相似的二級結(jié)構(gòu),有一個大的loop,具有典型的O-抗原聚合酶的特征,所以確定orf9是wzy基因,命名為wzy。Orf10與Pseudomonas syringae pv的糖基轉(zhuǎn)移酶在342個氨基酸中有35%的相同性,56%的相似性,通過對Pfam蛋白基序數(shù)據(jù)庫的搜索,發(fā)現(xiàn)orf10與脂多糖的轉(zhuǎn)移酶PF00534的E value為2.9×e-29,因此推測orf10也是一個糖基轉(zhuǎn)移酶,暫命名為orf10。Orf11與Bacteroides thetaiotaomicron的糖基轉(zhuǎn)移酶在369個氨基酸中有47%的相同性,69%的相似性,通過對Pfam蛋白基序數(shù)據(jù)庫的搜索,發(fā)現(xiàn)orf11與糖基轉(zhuǎn)移酶家族保守基序PF00535的E value為4.2×e-39,因此推測orf11也是一個糖基轉(zhuǎn)移酶基因,暫命名為orf11。Orf12編碼的蛋白與Escherichiacoli K12的manC基因編碼的mannose-1-phosphate guanyltransferase在471個氨基酸中有79%的相同性,88%的相似性,高度的相同性表明orf12也是一個manC基因,因此將orf12命名為manC。Orf13編碼的蛋白與Escherichia coli的manB基因編碼的phosphomannomutase在456個氨基酸中有95%的相同性,97%的相似性,高度的相同性表明orf13也是一個manB基因,因此將orf13命名為manB。
實施例6特異基因的篩選針對大腸桿菌O88的O-抗原基因簇中的wzx、wzy基因設(shè)計引物,這些基因在核苷酸序列中的位置見表1。
在表1中列出了大腸桿菌O88的O抗原基因簇的轉(zhuǎn)運酶基因、聚合酶基因及它們的相應(yīng)的功能和大小。在每個基因內(nèi),我們各設(shè)計了兩對引物,每對引物分布在相應(yīng)基因內(nèi)的不同地方以確保其特異性。在表中還列出了每個引物在SEQ ID NO1中的位置和大小。以每對引物用表中所列的相應(yīng)的退火溫度以表2中的所有菌的基因組為模板進(jìn)行PCR,得到了相應(yīng)的PCR產(chǎn)物,其大小也列于表中。
mdh(malate dehydrogenase)基因是存在于所有的大腸桿菌的基因組中且高度保守的一個基因,所以我們根據(jù)mdh基因設(shè)計了引物(5′-TTC ATC CTA AACTCC TTA TT-3′)和(5′-TAA TCG CAG GGG AAA GCA GG-3′),然后從166種血清型的大腸桿菌中提取基因組,方法如前所述。用這對引物從166種血清型的大腸桿菌的基因組中PCR以鑒定大腸桿菌并檢測其基因組的質(zhì)量。
表2是用于篩選特異基因的166種血清型的大腸桿菌和43株志賀氏菌及它們的來源,為了檢測的方便,我們將它們每12-19個菌分為一組,總共13組。它們的來源都列于表中。
在第5組中含有大腸桿菌O88的基因組DNA作為陽性對照。第13組中是不含有大腸桿菌O88的基因組DNA,作為陰性對照。以每組菌做模板,用表1中的每對引物按如下條件做PCR在95℃預(yù)變性2分鐘后,95℃變性15秒,退火溫度因引物的不同而不同(參照表1),退火時間是50秒,72℃延伸2分鐘,這樣進(jìn)行30個循環(huán)。最后在72℃繼續(xù)延伸10分鐘,反應(yīng)體系是25ul。反應(yīng)完畢后,取10ulPCR產(chǎn)物通過0.8%瓊脂糖凝膠電泳檢測擴(kuò)增出的片段。
對于wzx、wzy基因,每個基因都有兩對引物被檢測,每對引物除了在第5組中做PCR后得到了預(yù)期大小的正確的一條帶外,在其他組中都沒有擴(kuò)增到任何大小正確的帶。所以wzx、wzy基因?qū)Υ竽c桿菌O88及其O-抗原都是高度特異的。
最后,通過PCR從大腸桿菌O88中篩選到對大腸桿菌O88的O-抗原高度特異的基因wzx、wzy基因。而這些基因內(nèi)的任何一段10-20nt的寡核苷酸對大腸桿菌O88的O-抗原是特異的,尤其是上述每個基因中的引物即寡核苷酸對經(jīng)PCR檢測后證實對大腸桿菌O88是高度特異的。所有的這些寡核苷酸都可用于快速準(zhǔn)確地檢測人體和環(huán)境中的大腸桿菌O88,并能鑒定它們的O-抗原。
實施例7引物靈敏度的檢測。
購買市場上的生豬肉餡,攪拌均勻,分成20g一份,存在-40℃冰箱中備用。將10μl大腸桿菌O88的凍存菌液接種到有20ml LB培養(yǎng)基的三角瓶中,于37℃,200轉(zhuǎn)/分,培養(yǎng)12小時至飽和,取少量培養(yǎng)好的菌液作106和107倍的稀釋,其余的菌液放于4℃的冰箱中備用,取50μl稀釋菌液涂布LB瓊脂平板,37度,培養(yǎng)12h,對所涂平板計數(shù),計算原液中活菌濃度。在5份生豬肉餡中分別摻入5×103,5×102,5×101,5個和0個活菌,攪拌均勻,加入200ml LB培養(yǎng)基,經(jīng)6層紗布過濾,過濾液于37℃,200轉(zhuǎn)/分,培養(yǎng)12h。從培養(yǎng)好的菌液中取3ml菌液于6,000g離心5分鐘,去上清,加100μl MQ超純水吹開沉淀并混勻,放入100度沸水中煮15分鐘,裂解液于12,000g離心8分鐘,取1μ上清做為PCR模板。用4對寡核苷酸對,SEQ IDNO1中的7772至7789堿基的核苷酸和7819至7836堿基的核苷酸,SEQ IDNO1中的10165至10182堿基的核苷酸和9753至9770堿基的核苷酸,SEQ IDNO1中的10467至10182堿基的核苷酸和10467至10484堿基的核苷酸,SEQID NO1中的9753至9770堿基的核苷酸和10149至10166堿基的核苷酸,進(jìn)行PCR反應(yīng),PCR反應(yīng)體系如下MQ15.7μl,Mg2+2.5μl,Buffer2.5μl,dNTP1μl,Taq酶0.3μl,P11μl,P21μl,模板DNA1μl。PCR反應(yīng)條件為95℃5′,95℃30″,56℃45″,72℃1′,72℃5′,共30個循環(huán)。反應(yīng)結(jié)束后,取10μl反應(yīng)產(chǎn)物電泳,若有與預(yù)期大小相符的擴(kuò)增帶,則結(jié)果為陽性,若沒有,則結(jié)果為陰性。參入了5×103,5×102,5×101,和5個活菌的每份豬肉餡均在4對引物的PCR反應(yīng)中得到陽性結(jié)果。參入0個活菌的豬肉餡在4對引物的PCR反應(yīng)中得到陰性結(jié)果。說明使用上述方法時,這4對引物對豬肉餡中的大腸桿菌O88的檢測靈敏度均為0.25個菌/g。
表3是大腸桿菌O88的O-抗原基因簇的結(jié)構(gòu)表,在表中列出了大腸桿菌O88的O-抗原基因簇的結(jié)構(gòu),共由13個基因組成,每個基因用方框表示,并在方框內(nèi)寫入基因的名稱。在O-抗原基因簇的兩端是galF基因和gnd基因,它們不屬于O-抗原基因簇,我們只是用它們的一段序列設(shè)計引物來擴(kuò)增O-抗原基因簇的全長序列。
表4是大腸桿菌O88的O-抗原基因簇中的基因的位置表,在表中列出了大腸桿菌O88的O-抗原基因簇中的所有開放閱讀框在全序列中的準(zhǔn)確位置,在每個開放閱讀框的起始密碼子和終止密碼子的下面劃線。在細(xì)菌中開放閱讀框的起始密碼子有兩個ATG和GTG。
序列列表SEQ ID NO1(SEQUENCE LISTING)<110>天津生物芯片技術(shù)有限責(zé)任公司<120>對大腸桿菌O88的O-抗原特異的核苷酸<160>1<170>PatentIn version 3.1<210>1<211>16800<212>DNA<213>Escherichia coli<400>1ctccatttta tgtgcacgac ctgctattgg tgacaatcca tttgtcgtgg tgctgccaga 60cgttgtgata gatgacgcca gcgccgaccc gctgcgctac aaccttgctg ccatgattgc120gcgcttcaac gaaacgggcc gcagccaggt gctggcaaaa cgtatggcgg gcgatctctc180tgaatactcc gtcattcaga ccaaagagcc gctggaccgt gaaggcaaag tcagccgcat240tgttgaattt atcgaaaaac cggatcagcc gcagacgctg gactcagaca tcatggccgt300tggtcgctat atgctttcag cagatatttg gccggaactt gaacgcactc agcctggtgc360atggggacgt attcagctga ctgatgccat cgctgaactg gcgaaaaaac agtccgttga420tgccatgctg atgacaggtg acagctacga ctgcggtaaa aaaatgggtt atatgcaggc480gtttgtgaag tatggactac gcaacctcaa agaaggggcg aagttccgta aagggattga540gaagctgtta agcgaataat gaaaatctga ccggatgtaa cggttgataa gaaaattata600acggcagtga agattcgtgg cgaaagtaat ttgttgcgaa tattcctgcc gttgttttat660ataaacaatc aggataacaa cgagttagca ataggatttt agtcaaagtt ttccaggatt720ttccttgttt ccagagcgga ttggtaagac aattagcgtt tgaatttttc gggtttagcg780cgagtgggta acgctcgtca catcgtaggc atgcatgcag tgctctggta gctgtaaagc840caggggcggt agcgtgtcta ggggaaggtc atcgcgtgcg ttaagcacaa aaagaaaaaa900tgaacgtttg catgtaataa gcataagttt gtgaatagat cagggaaaga tcatcagaag960ttcacttttt gtactaaata attcgcattt tatgtttaaa aattgagata ttccttatta 1020cctaaagctg ttttttattg cttatacatg atcaaatact ccttacataa ttaaggagaa 1080caaaatggaa cttaaaaagt tgatggaaca tatttctatt atccccgatt acagacaagc 1140ctggaaagtg gaacataaat tatcggatat tctactgttg actatttgcg ccgttatttc 1200tggtgcagaa ggttgggaag atatagagga ttttggggaa acacatctcg attttttgaa 1260gcaatatggt gattttgaaa atggtattcc tgttcacgat accattgcca gagttgtatc 1320ctgtatcagt cctgcaaaat ttcacgagtg ctttattaac tggatgcgtg actgccattc 1380ttcagatgat aaagacttca ttgcaattga tggaaaaacg ctccgacact cttattacaa 1440gagtcgccgc aggggagcga ttcatgtcat tagtgcgttc tcaacaatgc acagtctggt 1500catcggacag atcaagacgg atgagaaatc taatgagatt acagctatcc cagaacttct 1560taacatgctg gatattaaag gaaaaatcat cacaactgat gcgatgggtt gccagaaaga 1620tattgcagag aagatacaaa aacagggagg tgattattta ttcgcggtaa aaggaaacca 1680ggggcggcta aataaagcct ttgaggaaaa atttccgctg aaagaattaa ataatccaga 1740gcatgacagt tacgcaatta gtgaaaagcg tcacggcaga gaagaaatcc gtct tcatat 1800tgtttgcgat gtccctgatg aacttattga tttcacgttt gaatggaaag ggctgaagaa 1860attatgcgtg gcagtctcct ttcggtccat aatagcagaa caaaagaaag agccagaaat 1920
gacggtcaga tactatatca gttccgctga tttaaccgca gagaagttcg ccacagcaat 1980ccgaaaccac tggcacgtgg agaataagct gcactggcgt ctggacgtgg taatgaatga 2040agacgactgc aaaataagaa gaggaaatgc agcagaatta ttttcaggga tacggcacat 2100tgctattaat attttgacga atgataaggt attcaaggca gggttaagac gtaagatgcg 2160aaaagcagcc atggacagaa actatctggc gtcagtcctt gcggggagcg ggctttcgta 2220atcttgcctt aagtagcgta gatttttcca aatcacattg atattacaaa gagtcggtga 2280cgatatgaag caagctttgt cgagaatgaa aataaaattg ttatcatatt tttataaaag 2340aaaaaatcgg tctacacaat tcggtcgcta cactgtttta ttctgtcgtg caaatataac 2400taattctata gtaggtgatt atacgtattt cgcaggcacc gcctccgtta ataattgtga 2460aattggtaaa tcttgttcta ttgcagaagg cgttaaaata ggccttggaa aacacccagt 2520tgattttctt tcaacacatc cggtatttta ctcggaaaat acctgcttcc cttatagatt 2580gaaaaattat agagttaatg aaaaagtgat tgaatcaatc accgaatcag agagagtcat 2640cataggcaat gatgtttgga ttggcgtaaa tgccatcgta atggatggtg tgacaattgg 2700tgatggagca gttattggag ctggggcggt tgttaccaaa gatgttcaac cttatactat 2760cgtaggtggt gttcctgcga gagtcattag gaccagacaa aatataaatt gttcttggtg 2820ggaatttgat gtagataccc ttgtagattt ttcctcaaat tttaaaaaga ggttgtaatg 2880tacgagttaa tgttgaaggt caaacgtaaa atagctactc ttctttcttc atttatattt 2940cgcgtttcat ttaaaaattt cggaacaaaa agtagtattt ttaaacctga tatattacaa 3000ggggtgaaat atatagaagt tggcgataga gtattaattc aaccgggatt atgggcttta 3060gcattgaaaa ttgataacaa tgaaccgatc ctgaatatag gaaataacgt ttatattggt 3120cgcttcttac atattgtaag tgtgcgccgt gtagttatcg aaaaggatgt tctcatcgcc 3180gataaggtat atatatcaga caaccttcat gagtataaag atattcatat tccagtaagc 3240cagcagcctg ttgtattcaa aggtgatgtg gttattaagg aaggcgtctg gataggggaa 3300aatgtttcca tcattggtgc ttgcattggc agaaatagtg tggtagcggc aaactttgta 3360gtgacgaagg atatacctga ttattctgtt tgtgcaggtg tacctgcaaa agttatcaaa 3420aaatactgtt tcgaacgaaa tgaatggata agtgtttctt aatgtatacc atttttactt 3480atttgagata aaaaatgaaa atattagtta ctggtggtgc cgggttcatc ggttcggcat 3540taacgcgata cattattaac tcaaccaatg actctgttgt gaatgttgat aagttaacct 3600acgcaggtaa tcttcattct ttaaaggaca ttgataattg cgatcgttat gtttttgttc 3660atgctgatat ttgcgatgcg aaagcattag acgcaatctt atcaacacat aaacctgatg 3720cagtaatgca tttggcagca gaaagtcatg ttgaccgttc aatcaccggc cctgctgcgt 3780ttattgaaac gaatattgtt ggaacatacg ttttgcttga agcagccaga aaatactggc 3840aaaccctaga gggggaaaag aaacagggat tccgtttcca tcacatttct actgatgaag 3900tatatggtga tctccctcat ccggatgact gggataataa aaatagtcca ccactgttta 3960ctgagaatac cgcatatgct cctagcagtc catactctgc ctctaaagca tcaagcgatc 4020atttggttcg cgcgtggcat cgtacttata atctcccaac tattgtgact aactgttcaa 4080acaattatgg tccttaccat ttcccagaaa agttaattcc gctggtgatc cttaatgcgt 4140tgcaagacaa atctttgcca atttatggca aaggcgatca aatccgtgat tggttatacg 4200ttgaggatca tgctcgcgca ctctataccg ttatcacgaa aggtatcgta ggtgaaactt 4260acaatatcgg cggttataat gagaaaaaga atattgaagt ggtagagact atttgcgata 4320tccttgacga aataaagccg aaaaatacct cgtatcgcga acaaatcatt tatgttgccg 4380atcgcccagg tcacgatcgc cgctatgcca ttgatgccag taaaatcact ctggacctcg 4440gttggaaacc tcaagagacc tttgaatctg gtattaagaa aactattcat tggtatcttg 4500ataaccagga gtgggtccag aatgttatga gcggtgccta tcaggactgg attaacaaaa 4560attacgggca actttaatct tttcaactct gtcataagaa gcattgaaca tgtcaaaaag 4620aaaaggaatt attttagccg gtggttcggg tactcgcctt taccccgtga cgatggcggt 4680tagtaaacag ctgctgccaa tctatgataa accgatgatt tattatccat taagcacgtt 4740gatgcttgcg ggtattcggg atattctcat cattagcaca cctcaggata cccctcgctt 4800tgagcaatta cttggtaacg gtgaaaaatg ggggctgaac atcgaatata aagtccagga 4860aagtcctgat ggtcttgccc aggcatttat aattggtgaa gaatttatcg gtaacgattc 4920ttgtgcttta gtcctcggcg acaatgtttt ctatggtcac gatttgccaa aagaacttga 4980aatagcaatg aatcaggaaa aaggtgctac ggtctttgcc taccatgtta aagaccctga 5040acgctatggt gtggtagatt tcgatgagaa tggcaaagcg ctttctttag aagagaaacc 5100gctgaaacca aaaagtaatt atgctgtgac tgggctctat ttttatgata acgaggtcat 5160tgagatggct aaacaactga aaccgtcagc tcgcggtgaa ttagaaatca ctgatattaa 5220tcgcctctac ctggaaaaaa actcgctctc agttgctatt atgggccgtg gctatgcctg 5280gcttgataca ggtacgcatg agagtcttat tgaggcgggt aactttattc agacgatcga 5340atcacgtcaa ggactcaaag tttcttgccc ggaagagatt gctctccgta aaggtttcat 5400tgataagaaa cagcttgcaa aattagccaa agaactcaat aaaaatgatt acggtaaata 5460
tttgcagcat ttagccaaag attaaaaatt aacattaatt agttaacaca tatgaaaatt 5520atagaaactc ctttgaaaga tgctgttatt atcgagccta aaatttttgg tgacgaacga 5580ggctattttt ttgaagtcta tcagaaaaaa cgttatcagg aattgggatt cgctctggaa 5640tttgtacagg ataatcgttc caaatcgact aaaaatgtcc tgcgagggct tcattttcag 5700aaaacaaagc ctcagggaaa actagtttca gtaacccagg gggctgtttt tgatgttgcc 5760gttgatctcc gtccagagtc actgacattt ggtcagcatc attcagttat tctatccgaa 5820gaaaattttc ttcagtttta tattcctcca ggtttcgctc atggtttctg cgtattaagt 5880gacactgcta gtttccagta caaatgcact gattattatg atccaaccga tgaaagcggt 5940cttatctgga acgatcccga tctgggcata gaatggcctg tttctcatcc tgtagtttct 6000gctaaagatt gttttttacc ttcactagca agtatcaaag aacagattct taaaggctgg 6060aaaaatgtct aagtatacaa ttattggcgg taacggtttt attggttccc atatcgttac 6120attgctaaaa gaacaagggc ataatgtcgt tgttcccgat cgtaatagct gcaattccct 6180aaatggtgag ttaggtaaaa ttatttattg tgctggtaat ggtgattgtg cggaaagcta 6240tttctctgtg ctggaagcaa atacagtttt gttggcaaag ttactgaaga atgcacagtt 6300tgaaaagctg gtatatattt cctcaactcg agtttatatg aaccaccata gcgcaaatga 6360aactgatgat ctgctagtaa cagcgggtga taacaggaag ctttttaacc tgaccaaact 6420ggtggctgag gagctgtgta ttaagagcga acgtgatgtt actgtggttc gaccaagcaa 6480tgtctatggt ttagctctta atagtaaatt atttcttccg tctattatcc gtcatgccat 6540taacaatggt gaaatcaaca tgtttgttgc acctgaatat gctaaggact atgtttcagt 6600caatgatgtt gctaaagcat gtgtgtggct agctgaaaaa caaaacacca acaaagaaat 6660atataatgtc gcatctggat ttaacgtaac agctaaacaa atcactgatg tcatcgaaaa 6720agaaacggct tgtaaggtaa actggcatga tggtaatttc cctcgtgaag agtttcctgt 6780tactaacata aataaattaa ctaatgagat tccggattat aaaccacaac atgtgcttga 6840tgatttgaaa atgatgatag ctagttataa agaagaactg gcgagataaa tatgagtggt 6900tttaagcggt tacttaaaaa ctctttgtct aatataataa atggattttc aaatgtaatt 6960cttggaatag tgatctctcc agttttactg cataatcttt caaaggtaga tttttctatt 7020tggtccctta caattcaggt tggggttttg atcggtattt ttggcattgg tcttcaggtt 7080acagtagggc gttttgtcgc ccttcattta aataatcaac agaaacttca aaagacaatg 7140catcagtcat tgttttttgt gttactgctc agtttggtat gtatgggggg aatattcttt 7200ttagcaaaat tctttttctc atttttccct gaagtatcag aaaccagtac taatgctaag 7260cacattctta tattaattgg tggttcattt gttattaata atatgttctc tcccttcgtt 7320ggctatttta ctggtattga gcgtaatgat ataacagctg gcataaatat attgtttaaa 7380gtaattctgg gtacgtcgat tctgttgctt gtccaccatg gtcttgaagt tattgcatgg 7440atttattttg caataaacac ttttaatcaa cttgcttttt atattttata taaattaaaa 7500aacagaactc aaaaaataaa gttatcacta gataaaaatt tatttcgaac tatagttgtc 7560ttttttagcg gactcttggt atggaatatt gcccagttct taatttctgg tataggcacc 7620tttatcgtcg gtaaatattc atttcaggag ctcgctggtt ttgccgtatt aatgacactt 7680gttaatgctg gtgtgggaat tttgggagca atgatcaatc ctataattca acctatgata 7740aggatgcaca atctggagaa taaccatcat gttgaacttc tggtcaacaa actgatcttc 7800attttctcaa tgattgcctt tattggtgtt tttattgcct ggtttgcctc tgtatatatt 7860cttggcgtct ggttgggata tcagcaagca acaaacctgc acattatgtt ttctttgctg 7920cttactgctt atcttattag aatgattgca gcgccctatg ggcttatgtt agtcgcttat 7980ggcaaacaat tgtcaatcgc ttggcttccg gtgctcgaag gggtattgaa ctttgcgtta 8040tcgattttct ttgtgcgtat atatggtgcc attggaattg cctactcgac gtttatttca 8100ggcgtattaa tcatggctgt ttacgcttgc aagtatcagg ctgaagctga gtataagtcg 8160aaactgatat ttacctcgtt tctgataata cctatgatga tagccatttg cctgatcagt 8220ttggtgatga ctcagtcgga aatcatccat tgtgttattt atggcatcca ggtggctttt 8280ataatagtat ttattatctt cttaataaaa caagtaaaaa gcatcaagaa tctgttaaat 8340caatactaat attgctatgg tgaaagtgtg aaaaaagttg gactcgttac tgttttgttc 8400aattctccag gtgtgcttcc tgaattttat tcgagtgttg aaaaacaaaa ttatcagaac 8460aagcatcttt atattgtaga taacagcact aatcaggatt cttttaactt aacgcaagaa 8520attctcttag gaacagacat aaagtatacc tatattaata atgaaggaaa taatgttggg 8580gttgcacatg ccaataacca aggcattgaa caagctttaa aagatgggtg cgagtatata 8640ttgctcacta ataatgatct gttttttcaa caggaagata ctatcagcaa aatgattagt 8700gttgctgagg gacgacaatg taaaattgtt tcacctgtca tattaagtta tccagaaaaa 8760aaagtttggt atgcaggtgc attttttaat aagaaagaag ctacggcacc tcatattttt 8820gaaggagtca actacaatga tatttgcgct catattccaa aagagtgcga ttacgcacca 8880acatgttttt tacttgtcca tgcttcggtg tttaccacta taggtatgat ggattctcgt 8940tactttgctt attacgacga tactgatttt ctctatcgtg caaacatagc cggcactcgg 9000
gtaacaatta ttaatgaacc tctagtgttt cataaagtta gtacttctac cggaggaggg 9060ttaagtgtat tcggcgcata ttatttaacg aggaaccgta tatttttcgc cagaaaaaat 9120attgaaacac cttattgtat tattagtatt ttctttacca ttgcgacccg tttggtttat 9180cctcttttcc acaaaacacc gtataaagta tacaaggctt ttgttaaagg aattatcgac 9240ggcctaatgt taaaaaataa ataactaagg ggttaaggtg aacgagattt ccagtagcac 9300acttgtcaat aactataatt tatcgacaac ttttattgtc aagtcacttg ttggattgtt 9360attaattaat tctcttttta gtggtgttga cttttatcag attggtttga tgaaaggcct 9420ttccagtatt gctgattttg gcctgaagat tatccttgtg ttcgtattgc tcgtgctttt 9480caagattcgc agttttaact tggtaaagat attctttttt gcttttatgc ttctcatcgg 9540tgctgcgctt ggagcattct atcatggtgc tgaatatgat aaaacttttg cgcttttact 9600aaatatgata ttatggtttg ttatattcag ttatgctaaa gaacttgaac ataactttga 9660tatatatcgt tttagtgtaa aaatatcaag tttatttctt ggtatcacgt tgatacttta 9720catcatggca aagtttggtt ttcatgttaa agtattaggt ggagcttggt tatatgatga 9780gaattttcgc tttgcaggta ctttctctga gccaagttta aatggctatt attatggttt 9840aatgttcttg atggtcatgc tgtctaatca aaagtacaga ctaattttgg cgtttgtgtt 9900tgctattact acctatattt caggtgcgaa attttcattc ctaataatac cagtgctcct 9960tgggctggtt tatttcttca aggtgaaagg cttttataat tatacatacc agctcattcc 10020gttatctttt attgttcttt ttgttagtct tgcgttcatc tactatgacc tttttgcact 10080gattgcagct catttgtcaa attctgaaac aatgacttat gttactcgtc ttgggttccc 10140aattgtcagc atctggcatc ttagtgatta tccattagga agtggagtat atggctttaa 10200gagcacgcta tcacctttta tacagaacta ctgtcaggct ctttctggtc tggacgtaaa 10260ttgtaacgag atgaggtcct atatatcctc ggatgatccc agtgcatatg aaagtttcgc 10320gcctaaagat gttttaagtt tcattatatt aagttttggg cttccgggct tgcttgtgtt 10380tgtcctgagt atatccttat tatcagctag acttaaggaa aataagaatt actttatcat 10440tctaatgtat attgtcgcat caatgctctt tacattacct tttagattta ttctttttta 10500ttctttcttc atgtttcagt gttatattta cagaatgccg agtaataaat gatctatatt 10560aatgcaagat tcttgactca gcgtaaaacc ggtgtgcagc aatatgcatt agttttatgc 10620cgggaactcg ttaaacacat tcctgatatc tgttttttga caccgaaaac tgatctcatt 10680gatgagaatt ggcgggacga gtttaatatc cttcaaatag gaaatcgtaa tggacatttt 10740tgggaacaaa tcgaactccc tcgttatcta agaagcgttg gtaatccgtt gctgctctgt 10800tttactggct tatcacctgc tttttataaa aattgttact ttactatcca tgatatgtca 10860ttgtacgcac atcccaagtg gttccgtttg ttatatcgtg cagtatacaa ggttaactat 10920gctattcagg caagattcgc tagaggtatc ttcacggtta gtgatttttc gaaatcagag 10980atagagaaat atctggcggt agactctgac aagatcactg tattacgaaa ttcagtagac 11040acatctatta atatcaagaa taatattgaa aataaagcgg ttaggcgtaa agagatttta 11100ttggttggta cctcagaacc tagaaaaaat atagagttta ttattaattc ttttttaaat 11160tcgcaaatca aaggttataa gctcatcgtt gttggagggt taggagctgc tttctcaaag 11220gtgacttttt ctcagcatga gaacattata ttctgtggct atctatcaga cgatgactta 11280gagttaaagt atagacaagc ttcagttttt gtctatcctt cactgtatga aggtttcggc 11340cttcctccac ttgaagcgat gcaacgtggc tgtcccgtaa tggcttctga ccgcgcaagc 11400atccctgaag tttgtggtga tgctgcttac tatttcaatc cagaggactc atcagatttt 11460agtagtaagt tacgtgagct gatcgaaaat tatgatgagc tcagccctgt attgatttgc 11520aatggatatc gtagactgga acaatttgac gtacgggatg ttgcatcgaa acttatggat 11580gtcatctctc aaaggaatat ttgaatgaag gttttacaat ttagtaaatt ttatcctcca 11640gtacacgggg gaattgagca ggttgcattt gatattagcg aaggaattac aaaaagtaat 11700ggtcagcctg ttgacgttct ctgtgttgat cctattgggg aaagaaaaga cgacggaaag 11760tttcgttata aggtttaccg ccagaaattg tttgcacagc ttttctcgac accgctatct 11820ttctccttga ttttacgctg gagagcgatc agaaataact atgatgttat tcacgttcat 11880cttccaaatc caatggctgt gttggcgctt tttttatttc caccaaaagg aaaaatagtt 11940ctccactggc acagcgatat tgttaagcaa aaaaaactat tattgctttt tgcgccgttg 12000caaaaatgga ttttagataa atgtacctgt attatagtta caagtcctgt ttatgggcag 12060tcttctccaa ctttgcaacc ttatcaggat aaaattgttt gtattcctat tggagttgat 12120actcatgtta tgccgctaaa tgatgagctt gaaaaaagta taaaaaaacg ctatcaaaat 12180aaaaagatag ttttttctct tgggcgtctt gtttattaca aaggtatgga atatctgatt 12240gatgctgcga aggagcttcc tccggattac attgttctta ttggtggaac aggcccacta 12300attgacacat taaagcaaaa ggttgctaat gatggattgt cagataaagt cgttcttctt 12360ggtagcatca attattcgga tttagcatcc tattacaaat catgcgacgt tttttgtttg 12420ccatctattc atgaatctga agcatttggt gtagtccagt tagaggctat gagtttctcc 12480agaccgcttg tgtcgacaaa tattccccga agtggcgtgg cttgggttaa tcagcataac 12540
gagactggta ttgttgttga gcctaatgat gccaaagcac ttgctaaagg tatagtttct 12600gttgttcaaa acagtgcaac gtttagtaaa ggcgctaagg ccagatttga taccatgttt 12660actaaagaat tgatggttaa aaatataatt aatttatatt catctttaaa gtgagtgcaa 12720ttatgccatt atttcctgtt gttatggtcg gaggctctgc tagtcgttta tggccgcttt 12780ctcgtgttct ctatccaaga caatttcttt gtctggaagg tgaactgact atgttacaag 12840cgacaataca ccgactgcag ggcatcgtgt gtgaaagtcc tgtcgttatt tgtaatgaac 12900agcaccgctt tattgttgct gagcaacttc gccagatgaa taaactcacc gagaatatta 12960tcctcgaacc gattggtcgt aatactgctc cggcgatagc gttggctgca ctagccgcaa 13020ctcgtgccca gcccgaaggt aaggcgctca tgctggttct tgccgccgac cacgtcataa 13080aaaatgaaga agcattccgt gattccgttc gtaaggcgct tccttatgct gaaaatggaa 13140agcttgtgac atttggtata gtcccgaata aagcagagac tggctatggt tacattcgcc 13200gcggtgtgcc gtgcgatggt gttgaacatg cagatgcatt cgacgtcgcg caattcgttg 13260agaaacctaa tcttgaaacg gctgaagcct acgtttcctg cggtgaatac tactggaata 13320gtgggatgtt cctgttccgc gccgatcgct atcttgagga actaaaaaaa taccgcccgg 13380atattcttga agcatgcgaa aaggcaatga gtgctgttga gcctgacctt aattttattc 13440gcgttgatga agatgctttc agggcttgtc ctgatgagtc agttgactat gctgtgatgg 13500agcagacttc cgatgctgtt gttgtgccaa tggatgcggg ctggagtgat gtcggttcct 13560ggtcttcgct atgggatatt agccataaga cgccagaggg taatgtcgtc acaggtgatg 13620tattatcctg caataccaaa aacagcttcc tgtattctga atcagggctt ttgactacag 13680ttggcgtgaa agatttggtt gttgtgcaga ctaaggatgc tgtattgatt gccaatcgta 13740acgccgttca ggatgtgaag aaaatagtcg aatcgataaa agctaacggg cgccacgaac 13800atcatactca tcgcgaagtt tgtcgtccct ggggtaaata tgactcgatt gataccggga 13860gccgttatca ggttaagcga ttgacggtaa aaccaggtga aagtatctca cttcagatgc 13920atcaccatcg tgctgagcat tggattgtcg tcgcaggagc tgcacaagta acaattaacg 13980aacaaactaa actcctcggt gaaaacgagt ctatctatat tcctgttggg tcaacacact 14040gtctggaaaa tcctggaaag atccctttaa aactgattga gattcgctca ggttcttatc 14100tgggagagga tgatattgtt cgtctgacaa agaagcgtta caaaatagat gactaataaa 14160tgaaaaaatt aacctgcttt aaagcctacg atattcgcgg gaaattaggc gaagaactga 14220atgaagatat tgcctggcgc attggtcgcg cctatggcga atttctcaaa ccgaaaacca 14280ttgtgttagg cggtgacgtc cgcctcacca gcgaaacctt aaaactggcg ctggcgaaag 14340gtttacagga tgcgggcgtc gatgtgctgg atatcggtat gtccggcacc gaagagatct 14400atttcgccac gttccatctc ggcgtggatg gcggcattga agttaccgcc agccataacc 14460cgatggatta taacggcatg aaactggtgc gcgaaggggc tcgcccgatc agcggtgata 14520ccggactgcg cgatgtccag cgcctggctg aagccagcga ctttcctccc gtcgatgaaa 14580ccaaacgcgg tcgctatcag caaatcaacc tgcgtgacgc ttacgttgat cacctgttcg 14640gttatatcaa tgtcaaaaac ctcacgccgc tcaagctggt gatcaactcc gggaacggcg 14700cagcgggtcc ggtagttgac gccatcgaag cccgctttaa agccctcggc gcaccagtgg 14760aattgatcaa agtgcacaac acgccggacg gtaatttccc caacggtatt cctaacccgc 14820tactgccaga atgccgcgac gacacccgca atgcggtcat caaacacggc gcggatatgg 14880gcattgcctt tgatggcgat tttgaccgct gcttcctgtt tgacgaaaaa gggcagttta 14940tcgaaggcta ctacattgtc ggcctgctgg cagaagcgtt cctcgaaaaa aatcccggcg 15000cgaagatcat ccacgatccg cgtctctcct ggaacaccgt tgatgtggtg acggccacag 15060gtggcacccc ggtaatgtcg aaaaccggac acgcctttat taaagaacgt atgcgcaagg 15120aagacgccat ctacggtggc gaaatgagcg cccaccatta cttccgtgat ttcgcttact 15180gcgacagcgg catgatcccg tggctgctgg tagccgaact ggtgtgtctg aaaggaaaaa 15240cgctgggcga acttgtgcgt gaccggatgg caacttttcc agcaagtggg gaaattaata 15300gcacgttgga agatccatta tgtgctatcg cacgggttga aagttattat gcaaataagg 15360caattgagat cgatcgtaca gatggtataa gtatgacttt taatggatgg cgctttaacc 15420tacgttcttc taacaccgaa ccggtggtgc ggttgaatgt tgaatcgcgc ggtgatgtgc 15480cgctgatgga agaaaagaca aaacttatcc ttgcgttatt gaacaagtaa ttcagtaatt 15540tcatataaat aagttttaaa agacggaaaa gatgagatat tcagtgtggt atagcaaagg 15600taatgctatt caccatctct atgagtgagt taacatctat accacattta agccgcacac 15660tcggcggtga ccacccctga caggagtaaa caatgtcaag gcaacagatc ggcgtcgtcg 15720gtatggcagt gatggggcgc aaccttgcgc tcaacatcga aagccgtggc tataccgtct 15780ctattttcaa ccgttcccgt gaaaagacgg aagaagtgat tgccgaaaat ccaggcaaga 15840aactggttcc ttactatacg gtgaaagagt ttgttgaatc tctggaaacg cctcgtcgca 15900tcctgttaat ggtgaaagca ggtgctggca cggatgctgc tattgattcc ctcaagccat 15960acctcgataa aggtgacatc atcattgatg gtggtaatac cttcttccag gacaccattc 16020gccgtaaccg tgagctttct gccgaaggct ttaacttcat cggtaccggt gtttccggtg 16080
gtgaagaggg cgcgctgaaa ggtccttcca tcatgcctgg tgggcagaaa gaagcctatg 16140aactggttgc accaatcctg accaaaatcg ctgcagtagc tgaagacggg gagccatgcg 16200ttacctatat tggtgccgat ggtgcaggtc actatgtgaa gatggttcac aacggtattg 16260aatacggcga tatgcagctg attgctgaag cctattctct gcttaaaggt ggcctgaatc 16320tctctaacga agaactggca cagaccttta ccgagtggaa taacggtgaa ctgagcagct 16380acctgatcga catcaccaaa gatatcttca ccaaaaaaga tgaagacggt aactacctgg 16440ttgatgtgat tctggatgaa gcagcaaaca aaggtaccgg taaatggacc agccagagcg 16500cgctggatct cggcgaacca ctgtcgctga ttaccgagtc tgtgtttgct cgttatattt 16560cttctctgaa agatcagcgc cttgccgcgt ctaaagttct ctctggcccg caagctcagc 16620cagcaggcga caaggctgag tttatcgaga aagttcgtcg tgcgctgtat ctgggcaaaa 16680tcgtttctta cgctcagggc ttctctcagc tgcgtgctgc gtctgaagag tacaactggg 16740atctgaacta cggcgaaatc gcgaagattt tccgtgctgg ctgcatcatc cgtgcgcagt 16800表1 大腸桿菌O88的O抗原基因簇中wzx基因、wzy基因及其中的引物及PCR數(shù)據(jù)產(chǎn)生正PCR的基 基因的 正向引物位置 反向引物位置PCR產(chǎn)物 確大小退火溫功能因 堿基位置 長度 電泳帶度的組數(shù)(℃)wzx O-抗原 6892-8349 7772-7789 8440-8457 686bp0 58轉(zhuǎn)運酶7819-7836 8228-8245 427bp0 60wzy O-抗原 9278-10552 10165-1018210467-10484 320bp0 61聚合酶9753-9770 10149-10166 414bp0 62表2 166種血清型的大腸桿菌和43株志賀氏菌及它們的來源組號 該組中含有的菌株 來源1、野生型大腸桿菌 O1,O2,O5,O7,O8,O9,O12,O13,O14,O15,O16,O17,O18,IMVSaO19ab,O20,O21,O22,O23,O242、野生型大腸桿菌 O4,O10,O25,O26,O27,O28,O29,O30,O32,O33,O34,O35,IMVSaO36,O37,O38,O40,O41,O42,O433、野生型大腸桿菌 O6,O44,O45,O46,O48,O49,O50,O51,O52,O54,O55,O56,IMVSaO57,O58,O60,O61,O62,O534、野生型大腸桿菌 O63,O65,O66,O69,O70,O71,O74,O75,O76,O77,O78,IMVSaO79,O80,O81,O82,O83,O685、野生型大腸桿菌 O84,O85,O86,O87,O88,O89,O90,O91,O92,O98,O99,IMVSaO101,O102,O103,O104,O105,O106,O97,6、野生型大腸桿菌 O107,O108,O109,O110,O111,O112ab,O112ac,O113, IMVSaO115,O116,O118,O120,O123,O125,O126,O128,O1177、野生型大腸桿菌 O129,O130,O131,O132,O133,O134,O135,O88,O137, IMVSaO138,O139,O141,O142,O143,O144,O145,O1408、野生型大腸桿菌 O146,O147,O148,O150,O152,O154,O156,O157,O158, IMVSaO159,O160,O161,O163,O164,O165,O166,O153 b9、野生型大腸桿菌 O168,O169,O170,O171,O172,O173, c痢疾志賀氏菌D1,D2,D3,D4,D5,D6,D7,D8,D9,D10,D11,D12,D13 d10、鮑氏志賀氏菌 B1,B2,B3,B4,B6,B7,B8,B9,B10,B11,B12,B13,B14,B15, dB16,B17,B1811、福氏志賀氏菌 F1a,F(xiàn)1b,F(xiàn)2a,F(xiàn)2b,F(xiàn)3,F(xiàn)4a,F(xiàn)4b,F(xiàn)5(v4),F(xiàn)5(v7),F(xiàn)6, dDS,DR
12、野生型大腸桿菌 O3,O11,O39,O59,O64,O73,O96,O95,O100,O114,O151,O155,IMVSaO124,O167,O162,O121,O127,O149,O11913、野生型大腸桿菌 去除大腸桿菌O88的第5組菌為了檢測的方便,每12-19個菌分為一組,總共12組,第13組作為陰性對照a.Institude of Medical and Veterinary Science,Anelaide,Australiab.Statens Serum Institut,Copenhagen,Denmarkc.O172和O173來自于Statens Serum Institut,Copenhagen,Denmark,其余來自于IMVSd.中國預(yù)防醫(yī)學(xué)科學(xué)院流行病學(xué)研究所表3是大腸桿菌O88的O-抗原基因簇的結(jié)構(gòu)表 galF H repeatorf1orf2 rmlBrmlArmlC tll orf7 orf8 orf9 orf10 orf11manC manB gnd1kb表4是大腸桿菌O88的O-抗原基因簇中的基因的位置表CTCCATTTTA TGTGCACGAC CTGCTATTGG TGACAATCCA TTTGTCGTGG TGCTGCCAGA 60CGTTGTGATA GATGACGCCA GCGCCGACCC GCTGCGCTAC AACCTTGCTG CCATGATTGC 120GCGCTTCAAC GAAACGGGCC GCAGCCAGGT GCTGGCAAAA CGTATGGCGG GCGATCTCTC 180TGAATACTCC GTCATTCAGA CCAAAGAGCC GCTGGACCGT GAAGGCAAAG TCAGCCGCAT 240TGTTGAATTT ATCGAAAAAC CGGATCAGCC GCAGACGCTG GACTCAGACA TCATGGCCGT 300TGGTCGCTAT ATGCTTTCAG CAGATATTTG GCCGGAACTT GAACGCACTC AGCCTGGTGC 360ATGGGGACGT ATTCAGCTGA CTGATGCCAT CGCTGAACTG GCGAAAAAAC AGTCCGTTGA 420TGCCATGCTG ATGACAGGTG ACAGCTACGA CTGCGGTAAA AAAATGGGTT ATATGCAGGC 480GTTTGTGAAG TATGGACTAC GCAACCTCAA AGAAGGGGCG AAGTTCCGTA AAGGGATTGA 540GAAGCTGTTA AGCGAATAAT GAAAATCTGA CCGGATGTAA CGGTTGATAA GAAAATTATA 600ACGGCAGTGA AGATTCGTGG CGAAAGTAAT TTGTTGCGAA TATTCCTGCC GTTGTTTTAT 660ATAAACAATC AGGATAACAA CGAGTTAGCA ATAGGATTTT AGTCAAAGTT TTCCAGGATT 720TTCCTTGTTT CCAGAGCGGA TTGGTAAGAC AATTAGCGTT TGAATTTTTC GGGTTTAGCG 780CGAGTGGGTA ACGCTCGTCA CATCGTAGGC ATGCATGCAG TGCTCTGGTA GCTGTAAAGC 840CAGGGGCGGT AGCGTGTCTA GGGGAAGGTC ATCGCGTGCG TTAAGCACAA AAAGAAAAAA 900TGAACGTTTG CATGTAATAA GCATAAGTTT GTGAATAGAT CAGGGAAAGA TCATCAGAAG 960TTCACTTTTT GTACTAAATA ATTCGCATTT TATGTTTAAA AATTGAGATA TTCCTTATTA1020CCTAAAGCTG TTTTTTATTG CTTATACATG ATCAAATACT CCTTACATAA TTAAGGAGAA1080CAAAATGGAA CTTAAAAAGT TGATGGAACA TATTTCTATT ATCCCCGATT ACAGACAAGC1140CTGGAAAGTG GAACATAAAT TATCGGATAT TCTACTGTTG ACTATTTGCG CCGTTATTTC1200TGGTGCAGAA GGTTGGGAAG ATATAGAGGA TTTTGGGGAA ACACATCTCG ATTTTTTGAA1260GCAATATGGT GATTTTGAAA ATGGTATTCC TGTTCACGAT ACCATTGCCA GAGTTGTATC1320CTGTATCAGT CCTGCAAAAT TTCACGAGTG CTTTATTAAC TGGATGCGTG ACTGCCATTC1380TTCAGATGAT AAAGACTTCA TTGCAATTGA TGGAAAAACG CTCCGACACT CTTATTACAA1440GAGTCGCCGC AGGGGAGCGA TTCATGTCAT TAGTGCGTTC TCAACAATGC ACAGTCTGGT1500CATCGGACAG ATCAAGACGG ATGAGAAATC TAATGAGATT ACAGCTATCC CAGAACTTCT1560TAACATGCTG GATATTAAAG GAAAAATCAT CACAACTGAT GCGATGGGTT GCCAGAAAGA1620TATTGCAGAG AAGATACAAA AACAGGGAGG TGATTATTTA TTCGCGGTAA AAGGAAACCA1680GGGGCGGCTA AATAAAGCCT TTGAGGAAAA ATTTCCGCTG AAAGAATTAA ATAATCCAGA1740GCATGACAGT TACGCAATTA GTGAAAAGCG TCACGGCAGA GAAGAAATCC GTCTTCATAT1800
TGTTTGCGAT GTCCCTGATG AACTTATTGA TTTCACGTTT GAATGGAAAG GGCTGAAGAA1860ATTATGCGTG GCAGTCTCCT TTCGGTCCAT AATAGCAGAA CAAAAGAAAG AGCCAGAAAT1920GACGGTCAGA TACTATATCA GTTCCGCTGA TTTAACCGCA GAGAAGTTCG CCACAGCAAT1980CCGAAACCAC TGGCACGTGG AGAATAAGCT GCACTGGCGT CTGGACGTGG TAATGAATGA2040AGACGACTGC AAAATAAGAA GAGGAAATGC AGCAGAATTA TTTTCAGGGA TACGGCACAT2100TGCTATTAAT ATTTTGACGA ATGATAAGGT ATTCAAGGCA GGGTTAAGAC GTAAGATGCG2160AAAAGCAGCC ATGGACAGAA ACTATCTGGC GTCAGTCCTT GCGGGGAGCG GGCTTTCGTA2220ATCTTGCCTT AAGTAGCGTA GATTTTTCCA AATCACATTG ATATTACAAA GAGTCGGTGA2280Orf1的起始CGATATGAAG CAAGCTTTGT CGAGAATGAA AATAAAATTG TTATCATATT TTTATAAAAG 2340AAAAAATCGG TCTACACAAT TCGGTCGCTA CACTGTTTTA TTCTGTCGTG CAAATATAAC2400TAATTCTATA GTAGGTGATT ATACGTATTT CGCAGGCACC GCCTCCGTTA ATAATTGTGA2460AATTGGTAAA TCTTGTTCTA TTGCAGAAGG CGTTAAAATA GGCCTTGGAA AACACCCAGT2520TGATTTTCTT TCAACACATC CGGTATTTTA CTCGGAAAAT ACCTGCTTCC CTTATAGATT2580GAAAAATTAT AGAGTTAATG AAAAAGTGAT TGAATCAATC ACCGAATCAG AGAGAGTCAT2640CATAGGCAAT GATGTTTGGA TTGGCGTAAA TGCCATCGTA ATGGATGGTG TGACAATTGG2700TGATGGAGCA GTTATTGGAG CTGGGGCGGT TGTTACCAAA GATGTTCAAC CTTATACTAT2760CGTAGGTGGT GTTCCTGCGA GAGTCATTAG GACCAGACAA AATATAAATT GTTCTTGGTG2820Orf1的終止Orf2的起始GGAATTTGAT GTAGATACCC TTGTAGATTT TTCCTCAAAT TTTAAAAAGA GGTTGTAATG2880TACGAGTTAA TGTTGAAGGT CAAACGTAAA ATAGCTACTC TTCTTTCTTC ATTTATATTT2940CGCGTTTCAT TTAAAAATTT CGGAACAAAA AGTAGTATTT TTAAACCTGA TATATTACAA3000GGGGTGAAAT ATATAGAAGT TGGCGATAGA GTATTAATTC AACCGGGATT ATGGGCTTTA3060GCATTGAAAA TTGATAACAA TGAACCGATC CTGAATATAG GAAATAACGT TTATATTGGT3120CGCTTCTTAC ATATTGTAAG TGTGCGCCGT GTAGTTATCG AAAAGGATGT TCTCATCGCC3180GATAAGGTAT ATATATCAGA CAACCTTCAT GAGTATAAAG ATATTCATAT TCCAGTAAGC3240CAGCAGCCTG TTGTATTCAA AGGTGATGTG GTTATTAAGG AAGGCGTCTG GATAGGGGAA3300AATGTTTCCA TCATTGGTGC TTGCATTGGC AGAAATAGTG TGGTAGCGGC AAACTTTGTA3360GTGACGAAGG ATATACCTGA TTATTCTGTT TGTGCAGGTG TACCTGCAAA AGTTATCAAA3420Orf2的終止AAATACTGTT TCGAACGAAA TGAATGGATA AGTGTTTCTT AATGTATACC ATTTTTACTT 3480Orf3的起始ATTTGAGATA AAAAATGAAA ATATTAGTTA CTGGTGGTGC CGGGTTCATC GGTTCGGCAT 3540TAACGCGATA CATTATTAAC TCAACCAATG ACTCTGTTGT GAATGTTGAT AAGTTAACCT3600ACGCAGGTAA TCTTCATTCT TTAAAGGACA TTGATAATTG CGATCGTTAT GTTTTTGTTC3660ATGCTGATAT TTGCGATGCG AAAGCATTAG ACGCAATCTT ATCAACACAT AAACCTGATG3720CAGTAATGCA TTTGGCAGCA GAAAGTCATG TTGACCGTTC AATCACCGGC CCTGCTGCGT3780TTATTGAAAC GAATATTGTT GGAACATACG TTTTGCTTGA AGCAGCCAGA AAATACTGGC3840AAACCCTAGA GGGGGAAAAG AAACAGGGAT TCCGTTTCCA TCACATTTCT ACTGATGAAG3900TATATGGTGA TCTCCCTCAT CCGGATGACT GGGATAATAA AAATAGTCCA CCACTGTTTA3960CTGAGAATAC CGCATATGCT CCTAGCAGTC CATACTCTGC CTCTAAAGCA TCAAGCGATC4020ATTTGGTTCG CGCGTGGCAT CGTACTTATA ATCTCCCAAC TATTGTGACT AACTGTTCAA4080ACAATTATGG TCCTTACCAT TTCCCAGAAA AGTTAATTCC GCTGGTGATC CTTAATGCGT4140TGCAAGACAA ATCTTTGCCA ATTTATGGCA AAGGCGATCA AATCCGTGAT TGGTTATACG4200TTGAGGATCA TGCTCGCGCA CTCTATACCG TTATCACGAA AGGTATCGTA GGTGAAACTT4260ACAATATCGG CGGTTATAAT GAGAAAAAGA ATATTGAAGT GGTAGAGACT ATTTGCGATA4320TCCTTGACGA AATAAAGCCG AAAAATACCT CGTATCGCGA ACAAATCATT TATGTTGCCG4380ATCGCCCAGG TCACGATCGC CGCTATGCCA TTGATGCCAG TAAAATCACT CTGGACCTCG4440GTTGGAAACC TCAAGAGACC TTTGAATCTG GTATTAAGAA AACTATTCAT TGGTATCTTG4500ATAACCAGGA GTGGGTCCAG AATGTTATGA GCGGTGCCTA TCAGGACTGG ATTAACAAAA4560Orf3的終止 Orf4的起始ATTACGGGCA ACTTTAATCT TTTCAACTCT GTCATAAGAA GCATTGAACA TGTCAAAAAG4620AAAAGGAATT ATTTTAGCCG GTGGTTCGGG TACTCGCCTT TACCCCGTGA CGATGGCGGT4680TAGTAAACAG CTGCTGCCAA TCTATGATAA ACCGATGATT TATTATCCAT TAAGCACGTT4740GATGCTTGCG GGTATTCGGG ATATTCTCAT CATTAGCACA CCTCAGGATA CCCCTCGCTT4800TGAGCAATTA CTTGGTAACG GTGAAAAATG GGGGCTGAAC ATCGAATATA AAGTCCAGGA4860AAGTCCTGAT GGTCTTGCCC AGGCATTTAT AATTGGTGAA GAATTTATCG GTAACGATTC4920TTGTGCTTTA GTCCTCGGCG ACAATGTTTT CTATGGTCAC GATTTGCCAA AAGAACTTGA4980AATAGCAATG AATCAGGAAA AAGGTGCTAC GGTCTTTGCC TACCATGTTA AAGACCCTGA5040
ACGCTATGGT GTGGTAGATT TCGATGAGAA TGGCAAAGCG CTTTCTTTAG AAGAGAAACC5100GCTGAAACCA AAAAGTAATT ATGCTGTGAC TGGGCTCTAT TTTTATGATA ACGAGGTCAT5160TGAGATGGCT AAACAACTGA AACCGTCAGC TCGCGGTGAA TTAGAAATCA CTGATATTAA5220TCGCCTCTAC CTGGAAAAAA ACTCGCTCTC AGTTGCTATT ATGGGCCGTG GCTATGCCTG5280GCTTGATACA GGTACGCATG AGAGTCTTAT TGAGGCGGGT AACTTTATTC AGACGATCGA5340ATCACGTCAA GGACTCAAAG TTTCTTGCCC GGAAGAGATT GCTCTCCGTA AAGGTTTCAT5400TGATAAGAAA CAGCTTGCAA AATTAGCCAA AGAACTCAAT AAAAATGATT ACGGTAAATA5460Orf4的終止 Orf5的起始TTTGCAGCAT TTAGCCAAAG ATTAAAAATT AACATTAATT AGTTAACACA TATGAAAATT5520ATAGAAACTC CTTTGAAAGA TGCTGTTATT ATCGAGCCTA AAATTTTTGG TGACGAACGA5580GGCTATTTTT TTGAAGTCTA TCAGAAAAAA CGTTATCAGG AATTGGGATT CGCTCTGGAA5640TTTGTACAGG ATAATCGTTC CAAATCGACT AAAAATGTCC TGCGAGGGCT TCATTTTCAG5700AAAACAAAGC CTCAGGGAAA ACTAGTTTCA GTAACCCAGG GGGCTGTTTT TGATGTTGCC5760GTTGATCTCC GTCCAGAGTC ACTGACATTT GGTCAGCATC ATTCAGTTAT TCTATCCGAA5820GAAAATTTTC TTCAGTTTTA TATTCCTCCA GGTTTCGCTC ATGGTTTCTG CGTATTAAGT5880GACACTGCTA GTTTCCAGTA CAAATGCACT GATTATTATG ATCCAACCGA TGAAAGCGGT5940CTTATCTGGA ACGATCCCGA TCTGGGCATA GAATGGCCTG TTTCTCATCC TGTAGTTTCT6000GCTAAAGATT GTTTTTTACC TTCACTAGCA AGTATCAAAG AACAGATTCT TAAAGGCTGG6060Orf6的起始Orf5的終止AAAAATGTCT AAGTATACAA TTATTGGCGG TAACGGTTTT ATTGGTTCCC ATATCGTTAC6120ATTGCTAAAA GAACAAGGGC ATAATGTCGT TGTTCCCGAT CGTAATAGCT GCAATTCCCT6180AAATGGTGAG TTAGGTAAAA TTATTTATTG TGCTGGTAAT GGTGATTGTG CGGAAAGCTA6240TTTCTCTGTG CTGGAAGCAA ATACAGTTTT GTTGGCAAAG TTACTGAAGA ATGCACAGTT6300TGAAAAGCTG GTATATATTT CCTCAACTCG AGTTTATATG AACCACCATA GCGCAAATGA6360AACTGATGAT CTGCTAGTAA CAGCGGGTGA TAACAGGAAG CTTTTTAACC TGACCAAACT6420GGTGGCTGAG GAGCTGTGTA TTAAGAGCGA ACGTGATGTT ACTGTGGTTC GACCAAGCAA6480TGTCTATGGT TTAGCTCTTA ATAGTAAATT ATTTCTTCCG TCTATTATCC GTCATGCCAT6540TAACAATGGT GAAATCAACA TGTTTGTTGC ACCTGAATAT GCTAAGGACT ATGTTTCAGT6600CAATGATGTT GCTAAAGCAT GTGTGTGGCT AGCTGAAAAA CAAAACACCA ACAAAGAAAT6660ATATAATGTC GCATCTGGAT TTAACGTAAC AGCTAAACAA ATCACTGATG TCATCGAAAA6720AGAAACGGCT TGTAAGGTAA ACTGGCATGA TGGTAATTTC CCTCGTGAAG AGTTTCCTGT6780TACTAACATA AATAAATTAA CTAATGAGAT TCCGGATTAT AAACCACAAC ATGTGCTTGA6840Orf6的終止Orf7的起始TGATTTGAAA ATGATGATAG CTAGTTATAA AGAAGAACTG GCGAGATAAA TATGAGTGGT6900TTTAAGCGGT TACTTAAAAA CTCTTTGTCT AATATAATAA ATGGATTTTC AAATGTAATT6960CTTGGAATAG TGATCTCTCC AGTTTTACTG CATAATCTTT CAAAGGTAGA TTTTTCTATT7020TGGTCCCTTA CAATTCAGGT TGGGGTTTTG ATCGGTATTT TTGGCATTGG TCTTCAGGTT7080ACAGTAGGGC GTTTTGTCGC CCTTCATTTA AATAATCAAC AGAAACTTCA AAAGACAATG7140CATCAGTCAT TGTTTTTTGT GTTACTGCTC AGTTTGGTAT GTATGGGGGG AATATTCTTT7200TTAGCAAAAT TCTTTTTCTC ATTTTTCCCT GAAGTATCAG AAACCAGTAC TAATGCTAAG7260CACATTCTTA TATTAATTGG TGGTTCATTT GTTATTAATA ATATGTTCTC TCCCTTCGTT7320GGCTATTTTA CTGGTATTGA GCGTAATGAT ATAACAGCTG GCATAAATAT ATTGTTTAAA7380GTAATTCTGG GTACGTCGAT TCTGTTGCTT GTCCACCATG GTCTTGAAGT TATTGCATGG7440ATTTATTTTG CAATAAACAC TTTTAATCAA CTTGCTTTTT ATATTTTATA TAAATTAAAA7500AACAGAACTC AAAAAATAAA GTTATCACTA GATAAAAATT TATTTCGAAC TATAGTTGTC7560TTTTTTAGCG GACTCTTGGT ATGGAATATT GCCCAGTTCT TAATTTCTGG TATAGGCACC7620TTTATCGTCG GTAAATATTC ATTTCAGGAG CTCGCTGGTT TTGCCGTATT AATGACACTT7680GTTAATGCTG GTGTGGGAAT TTTGGGAGCA ATGATCAATC CTATAATTCA ACCTATGATA7740AGGATGCACA ATCTGGAGAA TAACCATCAT GTTGAACTTC TGGTCAACAA ACTGATCTTC7800ATTTTCTCAA TGATTGCCTT TATTGGTGTT TTTATTGCCT GGTTTGCCTC TGTATATATT7860CTTGGCGTCT GGTTGGGATA TCAGCAAGCA ACAAACCTGC ACATTATGTT TTCTTTGCTG7920CTTACTGCTT ATCTTATTAG AATGATTGCA GCGCCCTATG GGCTTATGTT AGTCGCTTAT7980GGCAAACAAT TGTCAATCGC TTGGCTTCCG GTGCTCGAAG GGGTATTGAA CTTTGCGTTA8040TCGATTTTCT TTGTGCGTAT ATATGGTGCC ATTGGAATTG CCTACTCGAC GTTTATTTCA8100GGCGTATTAA TCATGGCTGT TTACGCTTGC AAGTATCAGG CTGAAGCTGA GTATAAGTCG8160AAACTGATAT TTACCTCGTT TCTGATAATA CCTATGATGA TAGCCATTTG CCTGATCAGT8220TTGGTGATGA CTCAGTCGGA AATCATCCAT TGTGTTATTT ATGGCATCCA GGTGGCTTTT8280ATAATAGTAT TTATTATCTT CTTAATAAAA CAAGTAAAAA GCATCAAGAA TCTGTTAAAT8340Orf7的終止 Orf8的起始
CAATACTAAT ATTGCTATGG TGAAAGTGTG AAAAAAGTTG GACTCGTTAC TGTTTTGTTC8400AATTCTCCAG GTGTGCTTCC TGAATTTTAT TCGAGTGTTG AAAAACAAAA TTATCAGAAC8460AAGCATCTTT ATATTGTAGA TAACAGCACT AATCAGGATT CTTTTAACTT AACGCAAGAA8520ATTCTCTTAG GAACAGACAT AAAGTATACC TATATTAATA ATGAAGGAAA TAATGTTGGG8580GTTGCACATG CCAATAACCA AGGCATTGAA CAAGCTTTAA AAGATGGGTG CGAGTATATA8640TTGCTCACTA ATAATGATCT GTTTTTTCAA CAGGAAGATA CTATCAGCAA AATGATTAGT8700GTTGCTGAGG GACGACAATG TAAAATTGTT TCACCTGTCA TATTAAGTTA TCCAGAAAAA8760AAAGTTTGGT ATGCAGGTGC ATTTTTTAAT AAGAAAGAAG CTACGGCACC TCATATTTTT8820GAAGGAGTCA ACTACAATGA TATTTGCGCT CATATTCCAA AAGAGTGCGA TTACGCACCA8880ACATGTTTTT TACTTGTCCA TGCTTCGGTG TTTACCACTA TAGGTATGAT GGATTCTCGT8940TACTTTGCTT ATTACGACGA TACTGATTTT CTCTATCGTG CAAACATAGC CGGCACTCGG9000GTAACAATTA TTAATGAACC TCTAGTGTTT CATAAAGTTA GTACTTCTAC CGGAGGAGGG9060TTAAGTGTAT TCGGCGCATA TTATTTAACG AGGAACCGTA TATTTTTCGC CAGAAAAAAT9120ATTGAAACAC CTTATTGTAT TATTAGTATT TTCTTTACCA TTGCGACCCG TTTGGTTTAT9180CCTCTTTTCC ACAAAACACC GTATAAAGTA TACAAGGCTT TTGTTAAAGG AATTATCGAC9240Orf8的終止Orf9的起始GGCCTAATGT TAAAAAATAA ATAACTAAGG GGTTAAGGTGAACGAGATTT CCAGTAGCAC9300ACTTGTCAAT AACTATAATT TATCGACAAC TTTTATTGTC AAGTCACTTG TTGGATTGTT9360ATTAATTAAT TCTCTTTTTA GTGGTGTTGA CTTTTATCAG ATTGGTTTGA TGAAAGGCCT9420TTCCAGTATT GCTGATTTTG GCCTGAAGAT TATCCTTGTG TTCGTATTGC TCGTGCTTTT9480CAAGATTCGC AGTTTTAACT TGGTAAAGAT ATTCTTTTTT GCTTTTATGC TTCTCATCGG9540TGCTGCGCTT GGAGCATTCT ATCATGGTGC TGAATATGAT AAAACTTTTG CGCTTTTACT9600AAATATGATA TTATGGTTTG TTATATTCAG TTATGCTAAA GAACTTGAAC ATAACTTTGA9660TATATATCGT TTTAGTGTAA AAATATCAAG TTTATTTCTT GGTATCACGT TGATACTTTA9720CATCATGGCA AAGTTTGGTT TTCATGTTAA AGTATTAGGT GGAGCTTGGT TATATGATGA9780GAATTTTCGC TTTGCAGGTA CTTTCTCTGA GCCAAGTTTA AATGGCTATT ATTATGGTTT9840AATGTTCTTG ATGGTCATGC TGTCTAATCA AAAGTACAGA CTAATTTTGG CGTTTGTGTT9900TGCTATTACT ACCTATATTT CAGGTGCGAA ATTTTCATTC CTAATAATAC CAGTGCTCCT9960TGGGCTGGTT TATTTCTTCA AGGTGAAAGG CTTTTATAAT TATACATACC AGCTCATTCC 10020GTTATCTTTT ATTGTTCTTT TTGTTAGTCT TGCGTTCATC TACTATGACC TTTTTGCACT 10080GATTGCAGCT CATTTGTCAA ATTCTGAAAC AATGACTTAT GTTACTCGTC TTGGGTTCCC 10140AATTGTCAGC ATCTGGCATC TTAGTGATTA TCCATTAGGA AGTGGAGTAT ATGGCTTTAA 10200GAGCACGCTA TCACCTTTTA TACAGAACTA CTGTCAGGCT CTTTCTGGTC TGGACGTAAA 10260TTGTAACGAG ATGAGGTCCT ATATATCCTC GGATGATCCC AGTGCATATG AAAGTTTCGC 10320GCCTAAAGAT GTTTTAAGTT TCATTATATT AAGTTTTGGG CTTCCGGGCT TGCTTGTGTT 10380TGTCCTGAGT ATATCCTTAT TATCAGCTAG ACTTAAGGAA AATAAGAATT ACTTTATCAT 10440TCTAATGTAT ATTGTCGCAT CAATGCTCTT TACATTACCT TTTAGATTTA TTCTTTTTTA 10500Orf10的起始Orf9的終止TTCTTTCTTC ATGTTTCAGT GTTATATTTA CAGAATGCCG AGTAATAAAT GATCTATATT 10560AATGCAAGAT TCTTGACTCA GCGTAAAACC GGTGTGCAGC AATATGCATT AGTTTTATGC 10620CGGGAACTCG TTAAACACAT TCCTGATATC TGTTTTTTGA CACCGAAAAC TGATCTCATT 10680GATGAGAATT GGCGGGACGA GTTTAATATC CTTCAAATAG GAAATCGTAA TGGACATTTT 10740TGGGAACAAA TCGAACTCCC TCGTTATCTA AGAAGCGTTG GTAATCCGTT GCTGCTCTGT 10800TTTACTGGCT TATCACCTGC TTTTTATAAA AATTGTTACT TTACTATCCA TGATATGTCA 10860TTGTACGCAC ATCCCAAGTG GTTCCGTTTG TTATATCGTG CAGTATACAA GGTTAACTAT 10920GCTATTCAGG CAAGATTCGC TAGAGGTATC TTCACGGTTA GTGATTTTTC GAAATCAGAG 10980ATAGAGAAAT ATCTGGCGGT AGACTCTGAC AAGATCACTG TATTACGAAA TTCAGTAGAC 11040ACATCTATTA ATATCAAGAA TAATATTGAA AATAAAGCGG TTAGGCGTAA AGAGATTTTA 11100TTGGTTGGTA CCTCAGAACC TAGAAAAAAT ATAGAGTTTA TTATTAATTC TTTTTTAAAT 11160TCGCAAATCA AAGGTTATAA GCTCATCGTT GTTGGAGGGT TAGGAGCTGC TTTCTCAAAG 11220GTGACTTTTT CTCAGCATGA GAACATTATA TTCTGTGGCT ATCTATCAGA CGATGACTTA 11280GAGTTAAAGT ATAGACAAGC TTCAGTTTTT GTCTATCCTT CACTGTATGA AGGTTTCGGC 11340CTTCCTCCAC TTGAAGCGAT GCAACGTGGC TGTCCCGTAA TGGCTTCTGA CCGCGCAAGC 11400ATCCCTGAAG TTTGTGGTGA TGCTGCTTAC TATTTCAATC CAGAGGACTC ATCAGATTTT 11460AGTAGTAAGT TACGTGAGCT GATCGAAAAT TATGATGAGC TCAGCCCTGT ATTGATTTGC 11520AATGGATATC GTAGACTGGA ACAATTTGAC GTACGGGATG TTGCATCGAA ACTTATGGAT 11580Orf10的終止Orf11的起始GTCATCTCTC AAAGGAATAT TTGAATGAAG GTTTTACAAT TTAGTAAATT TTATCCTCCA 11640GTACACGGGG GAATTGAGCA GGTTGCATTT GATATTAGCG AAGGAATTAC AAAAAGTAAT 11700
GGTCAGCCTG TTGACGTTCT CTGTGTTGAT CCTATTGGGG AAAGAAAAGA CGACGGAAAG11760TTTCGTTATA AGGTTTACCG CCAGAAATTG TTTGCACAGC TTTTCTCGAC ACCGCTATCT11820TTCTCCTTGA TTTTACGCTG GAGAGCGATC AGAAATAACT ATGATGTTAT TCACGTTCAT11880CTTCCAAATC CAATGGCTGT GTTGGCGCTT TTTTTATTTC CACCAAAAGG AAAAATAGTT11940CTCCACTGGC ACAGCGATAT TGTTAAGCAA AAAAAACTAT TATTGCTTTT TGCGCCGTTG12000CAAAAATGGA TTTTAGATAA ATGTACCTGT ATTATAGTTA CAAGTCCTGT TTATGGGCAG12060TCTTCTCCAA CTTTGCAACC TTATCAGGAT AAAATTGTTT GTATTCCTAT TGGAGTTGAT12120ACTCATGTTA TGCCGCTAAA TGATGAGCTT GAAAAAAGTA TAAAAAAACG CTATCAAAAT12180AAAAAGATAG TTTTTTCTCT TGGGCGTCTT GTTTATTACA AAGGTATGGA ATATCTGATT12240GATGCTGCGA AGGAGCTTCC TCCGGATTAC ATTGTTCTTA TTGGTGGAAC AGGCCCACTA12300ATTGACACAT TAAAGCAAAA GGTTGCTAAT GATGGATTGT CAGATAAAGT CGTTCTTCTT12360GGTAGCATCA ATTATTCGGA TTTAGCATCC TATTACAAAT CATGCGACGT TTTTTGTTTG12420CCATCTATTC ATGAATCTGA AGCATTTGGT GTAGTCCAGT TAGAGGCTAT GAGTTTCTCC12480AGACCGCTTG TGTCGACAAA TATTCCCCGA AGTGGCGTGG CTTGGGTTAA TCAGCATAAC12540GAGACTGGTA TTGTTGTTGA GCCTAATGAT GCCAAAGCAC TTGCTAAAGG TATAGTTTCT12600GTTGTTCAAA ACAGTGCAAC GTTTAGTAAA GGCGCTAAGG CCAGATTTGA TACCATGTTT12660Orf11的終止ACTAAAGAAT TGATGGTTAA AAATATAATT AATTTATATT CATCTTTAAA GTGAGTGCAA 12720Orf12的起始TTATGCCATT ATTTCCTGTT GTTATGGTCG GAGGCTCTGC TAGTCGTTTA TGGCCGCTTT 12780CTCGTGTTCT CTATCCAAGA CAATTTCTTT GTCTGGAAGG TGAACTGACT ATGTTACAAG12840CGACAATACA CCGACTGCAG GGCATCGTGT GTGAAAGTCC TGTCGTTATT TGTAATGAAC12900AGCACCGCTT TATTGTTGCT GAGCAACTTC GCCAGATGAA TAAACTCACC GAGAATATTA12960TCCTCGAACC GATTGGTCGT AATACTGCTC CGGCGATAGC GTTGGCTGCA CTAGCCGCAA13020CTCGTGCCCA GCCCGAAGGT AAGGCGCTCA TGCTGGTTCT TGCCGCCGAC CACGTCATAA13080AAAATGAAGA AGCATTCCGT GATTCCGTTC GTAAGGCGCT TCCTTATGCT GAAAATGGAA13140AGCTTGTGAC ATTTGGTATA GTCCCGAATA AAGCAGAGAC TGGCTATGGT TACATTCGCC13200GCGGTGTGCC GTGCGATGGT GTTGAACATG CAGATGCATT CGACGTCGCG CAATTCGTTG13260AGAAACCTAA TCTTGAAACG GCTGAAGCCT ACGTTTCCTG CGGTGAATAC TACTGGAATA13320GTGGGATGTT CCTGTTCCGC GCCGATCGCT ATCTTGAGGA ACTAAAAAAA TACCGCCCGG13380ATATTCTTGA AGCATGCGAA AAGGCAATGA GTGCTGTTGA GCCTGACCTT AATTTTATTC13440GCGTTGATGA AGATGCTTTC AGGGCTTGTC CTGATGAGTC AGTTGACTAT GCTGTGATGG13500AGCAGACTTC CGATGCTGTT GTTGTGCCAA TGGATGCGGG CTGGAGTGAT GTCGGTTCCT13560GGTCTTCGCT ATGGGATATT AGCCATAAGA CGCCAGAGGG TAATGTCGTC ACAGGTGATG13620TATTATCCTG CAATACCAAA AACAGCTTCC TGTATTCTGA ATCAGGGCTT TTGACTACAG13680TTGGCGTGAA AGATTTGGTT GTTGTGCAGA CTAAGGATGC TGTATTGATT GCCAATCGTA13740ACGCCGTTCA GGATGTGAAG AAAATAGTCG AATCGATAAA AGCTAACGGG CGCCACGAAC13800ATCATACTCA TCGCGAAGTT TGTCGTCCCT GGGGTAAATA TGACTCGATT GATACCGGGA13860GCCGTTATCA GGTTAAGCGA TTGACGGTAA AACCAGGTGA AAGTATCTCA CTTCAGATGC13920ATCACCATCG TGCTGAGCAT TGGATTGTCG TCGCAGGAGC TGCACAAGTA ACAATTAACG13980AACAAACTAA ACTCCTCGGT GAAAACGAGT CTATCTATAT TCCTGTTGGG TCAACACACT14040GTCTGGAAAA TCCTGGAAAG ATCCCTTTAA AACTGATTGA GATTCGCTCA GGTTCTTATC14100Orf12的終止TGGGAGAGGA TGATATTGTT CGTCTGACAA AGAAGCGTTA CAAAATAGAT GACTAATAAA14160Orf13的起始TGAAAAAATT AACCTGCTTT AAAGCCTACG ATATTCGCGG GAAATTAGGC GAAGAACTGA 14220ATGAAGATAT TGCCTGGCGC ATTGGTCGCG CCTATGGCGA ATTTCTCAAA CCGAAAACCA14280TTGTGTTAGG CGGTGACGTC CGCCTCACCA GCGAAACCTT AAA CTGGCG CTGGCGAAAG14340GTTTACAGGA TGCGGGCGTC GATGTGCTGG ATATCGGTAT GTCCGGCACC GAAGAGATCT14400ATTTCGCCAC GTTCCATCTC GGCGTGGATG GCGGCATTGA AGTTACCGCC AGCCATAACC14460CGATGGATTA TAACGGCATG AAACTGGTGC GCGAAGGGGC TCGCCCGATC AGCGGTGATA14520CCGGACTGCG CGATGTCCAG CGCCTGGCTG AAGCCAGCGA CTTTCCTCCC GTCGATGAAA14580CCAAACGCGG TCGCTATCAG CAAATCAACC TGCGTGACGC TTACGTTGAT CACCTGTTCG14640GTTATATCAA TGTCAAAAAC CTCACGCCGC TCAAGCTGGT GATCAACTCC GGGAACGGCG14700CAGCGGGTCC GGTAGTTGAC GCCATCGAAG CCCGCTTTAA AGCCCTCGGC GCACCAGTGG14760AATTGATCAA AGTGCACAAC ACGCCGGACG GTAATTTCCC CAACGGTATT CCTAACCCGC14820TACTGCCAGA ATGCCGCGAC GACACCCGCA ATGCGGTCAT CAAACACGGC GCGGATATGG14880GCATTGCCTT TGATGGCGAT TTTGACCGCT GCTTCCTGTT TGACGAAAAA GGGCAGTTTA14940TCGAAGGCTA CTACATTGTC GGCCTGCTGG CAGAAGCGTT CCTCGAAAAA AATCCCGGCG15000
CGAAGATCAT CCACGATCCG CGTCTCTCCT GGAACACCGT TGATGTGGTG ACGGCCACAG15060GTGGCACCCC GGTAATGTCG AAAACCGGAC ACGCCTTTAT TAAAGAACGT ATGCGCAAGG15120AAGACGCCAT CTACGGTGGC GAAATGAGCG CCCACCATTA CTTCCGTGAT TTCGCTTACT15180GCGACAGCGG CATGATCCCG TGGCTGCTGG TAGCCGAACT GGTGTGTCTG AAAGGAAAAA15240CGCTGGGCGA ACTTGTGCGT GACCGGATGG CAACTTTTCC AGCAAGTGGG GAAATTAATA15300GCACGTTGGA AGATCCATTA TGTGCTATCG CACGGGTTGA AAGTTATTAT GCAAATAAGG15360CAATTGAGAT CGATCGTACA GATGGTATAA GTATGACTTT TAATGGATGG CGCTTTAACC15420TACGTTCTTC TAACACCGAA CCGGTGGTGC GGTTGAATGT TGAATCGCGC GGTGATGTGC15480Orf13的終止CGCTGATGGA AGAAAAGACA AAACTTATCC TTGCGTTATT GAACAAGTAATTCAGTAATT 15540TCATATAAAT AAGTTTTAAA AGACGGAAAA GATGAGATAT TCAGTGTGGT ATAGCAAAGG15600TAATGCTATT CACCATCTCT ATGAGTGAGT TAACATCTAT ACCACATTTA AGCCGCACAC15660TCGGCGGTGA CCACCCCTGA CAGGAGTAAA CAATGTCAAG GCAACAGATC GGCGTCGTCG15720GTATGGCAGT GATGGGGCGC AACCTTGCGC TCAACATCGA AAGCCGTGGC TATACCGTCT15780CTATTTTCAA CCGTTCCCGT GAAAAGACGG AAGAAGTGAT TGCCGAAAAT CCAGGCAAGA15840AACTGGTTCC TTACTATACG GTGAAAGAGT TTGTTGAATC TCTGGAAACG CCTCGTCGCA15900TCCTGTTAAT GGTGAAAGCA GGTGCTGGCA CGGATGCTGC TATTGATTCC CTCAAGCCAT15960ACCTCGATAA AGGTGACATC ATCATTGATG GTGGTAATAC CTTCTTCCAG GACACCATTC16020GCCGTAACCG TGAGCTTTCT GCCGAAGGCT TTAACTTCAT CGGTACCGGT GTTTCCGGTG16080GTGAAGAGGG CGCGCTGAAA GGTCCTTCCA TCATGCCTGG TGGGCAGAAA GAAGCCTATG16140AACTGGTTGC ACCAATCCTG ACCAAAATCG CTGCAGTAGC TGAAGACGGG GAGCCATGCG16200TTACCTATAT TGGTGCCGAT GGTGCAGGTC ACTATGTGAA GATGGTTCAC AACGGTATTG16260AATACGGCGA TATGCAGCTG ATTGCTGAAG CCTATTCTCT GCTTAAAGGT GGCCTGAATC16320TCTCTAACGA AGAACTGGCA CAGACCTTTA CCGAGTGGAA TAACGGTGAA CTGAGCAGCT16380ACCTGATCGA CATCACCAAA GATATCTTCA CCAAAAAAGA TGAAGACGGT AACTACCTGG16440TTGATGTGAT TCTGGATGAA GCAGCAAACA AAGGTACCGG TAAATGGACC AGCCAGAGCG16500CGCTGGATCT CGGCGAACCA CTGTCGCTGA TTACCGAGTC TGTGTTTGCT CGTTATATTT16560CTTCTCTGAA AGATCAGCGC CTTGCCGCGT CTAAAGTTCT CTCTGGCCCG CAAGCTCAGC16620CAGCAGGCGA CAAGGCTGAG TTTATCGAGA AAGTTCGTCG TGCGCTGTAT CTGGGCAAAA16680TCGTTTCTTA CGCTCAGGGC TTCTCTCAGC TGCGTGCTGC GTCTGAAGAG TACAACTGGG16740ATCTGAACTA CGGCGAAATC GCGAAGATTT TCCGTGCTGG CTGCATCATC CGTGCGCAGT16800以上僅是本發(fā)明較佳實施例,并非對本發(fā)明作任何限制,凡依本發(fā)明技術(shù)實質(zhì)對以上實施例作修改、等同變化與修飾,均屬本發(fā)明技術(shù)方案的范圍內(nèi)。
權(quán)利要求
1.一種對大腸桿菌O88的O-抗原特異的核苷酸,其特征在于,其是如SEQ ID NO1所示的分離的核苷酸,全長16800個堿基;或者具有一個或多個插入、缺失或取代的堿基,同時保持所述分離的核苷酸功能的SEQ ID NO1的核苷酸。
2.按照權(quán)利要求1所述的對大腸桿菌O88的O-抗原特異的核苷酸,其特征在于,其由命名為orf1、orf2、rmlB、rmlC、rmlA、tll、wzx、orf8、wzy、orf10、orf11、manC、manB的13個基因組成,都位于galF基因和gnd基因之間。
3.按照權(quán)利要求2所述的對大腸桿菌O88的O-抗原特異的核苷酸,其特征在于,所述具有高度特異性的基因包括轉(zhuǎn)運酶基因,包括wzx基因或與wzx有相似功能的基因;聚合酶基因,包括wzy基因或與wzy有相似功能的基因;糖基轉(zhuǎn)移酶基因,包括orf8、orf10、orf11基因;其中所述的轉(zhuǎn)運酶基因是SEQ ID NO1中的6892至8349堿基的核苷酸;所述的聚合酶基因是SEQ ID NO1中的9278至10552堿基的核苷酸;所述的orf8基因是SEQID NO1中的8368至9264堿基的核苷酸;orf10基因是SEQ ID NO1中的10549至11604堿基的核苷酸;orf11基因是SEQ ID NO1中的11605至12714堿基的核苷酸。
4.按照權(quán)利要求1或2所述的對大腸桿菌O88的O-抗原特異的核苷酸,其特征在于,其還包括源于所述的wzx基因或wzy基因中的寡核苷酸或糖基轉(zhuǎn)移酶基因,以及它們的混合或它們的重組。
5.按照權(quán)利要求4所述的對大腸桿菌O88的O-抗原高度特異的核苷酸,其特征在于,所述的源于wzx基因的寡核苷酸對是SEQ ID NO1中的7772至7789堿基的核苷酸和8440至8457堿基的核苷酸,SEQ ID NOI中的7819至7836堿基的核苷酸和8228至8245堿基的核苷酸;所述的源于wzy基因的寡核苷酸對是SEQ ID NO1中的10165至10182堿基的核苷酸和10467至10484堿基的核苷酸,SEQ ID NO1中的9753至9770堿基的核苷酸和10149至10166堿基的核苷酸。
6.權(quán)利要求1所述的對大腸桿菌O88的O-抗原特異的核苷酸在檢測表達(dá)O-抗原的細(xì)菌、在診斷中鑒定細(xì)菌的O-抗原和細(xì)菌的其它多糖抗原的應(yīng)用。
7.權(quán)利要求1所述的對大腸桿菌O88的O-抗原特異的核苷酸的重組分子,在通過插入表達(dá)而提供表達(dá)大腸桿菌O88的O-抗原,以及制備細(xì)菌疫苗中的應(yīng)用。
8.權(quán)利要求1所述的對大腸桿菌O88的O-抗原特異的核苷酸的應(yīng)用,其特征在于,它作為引物用于PCR、作為探針用于雜交反應(yīng)與熒光檢測、或者用于制造基因芯片或微陣列,檢測細(xì)菌。
9.權(quán)利要求1所述的對大腸桿菌O88的O-抗原特異的核苷酸的分離方法,其特征在于,包括下述步驟(1)基因組的提取在LB培養(yǎng)基中培養(yǎng)大腸桿菌O88,離心收集細(xì)胞;得到的基因組DNA通過瓊脂糖凝膠電泳檢測;(2)通過PCR擴(kuò)增大腸桿菌O88中的O-抗原基因簇以大腸桿菌O88的基因組為模板通過Long PCR擴(kuò)增其O-抗原基因簇;將得到PCR產(chǎn)物,用瓊脂糖凝膠電泳檢測PCR產(chǎn)物的大小及其特異性;合并該long PCR產(chǎn)物,并用DNA純化試劑盒純化PCR產(chǎn)物;(3)構(gòu)建O-抗原基因簇文庫用被修改的Novagen DNaseI shot gun法構(gòu)建O-抗原基因簇文庫;(4)對文庫中的克隆測序從文庫中挑選插入片段在1000bp以上克隆用實驗室常用的DNA自動測序儀對克隆中的插入片段單向進(jìn)行測序,使序列達(dá)到80%的覆蓋率,從而獲得O-抗原基因簇的所有序列;(5)核苷酸序列的拼接及分析用生物信息學(xué)軟件拼接和編輯所有的序列,從而得到大腸桿菌O88的O-抗原基因簇的核苷酸全長序列;(6)特異基因篩選針對大腸桿菌O88的O-抗原基因簇中wzx和wzy基因設(shè)計引物;在每個基因內(nèi)各設(shè)計兩對引物,每對引物分布在相應(yīng)基因內(nèi)不同地方以確保其特異性;用這些引物以166種血清型的大腸桿菌和43株志賀氏菌基因組為模板進(jìn)行PCR,確定wzx、wzy基因?qū)Υ竽c桿菌O88及其O-抗原都是高度特異的;(7)引物靈敏度的檢測培養(yǎng)大腸桿菌O88,細(xì)菌記數(shù)后分別將5×103,5×102,5×101,5個和0個活菌,加入到一定量的某種待檢測物中,混入細(xì)菌的待檢測物作為檢測用樣品,將樣品加入LB培養(yǎng)基,取一些與樣品混過的LB培養(yǎng)基過濾,將過濾液進(jìn)行培養(yǎng);從培養(yǎng)好的菌液中取數(shù)ml處理后做為PCR模板;用寡核苷酸進(jìn)行PCR反應(yīng),檢測其對大腸桿菌O88的靈敏度。
10.權(quán)利要求1所述的對大腸桿菌O88的O-抗原特異的核苷酸的分離方法,其特征在于,包括下述步驟(1)基因組的提取在5mL的LB培養(yǎng)基中37℃過夜培養(yǎng)大腸桿菌O88,離心收集細(xì)胞。用500ul 50mM Tris-HCl(pH8.0)和10ul 0.4M EDTA重懸細(xì)胞,37℃溫育20分鐘,然后加入10ul 10mg/ml的溶菌酶繼續(xù)保溫20分鐘。之后加入3ul 20mg/ml的蛋白酶K、15ul 10%SDS,50℃溫育2小時,再加入3ul 10mg/ml的RNase,65℃溫育30分鐘。加等體積酚抽提混合物,取上清液,再用等體積的酚∶氯仿∶異戊醇(25∶24∶1)的溶液抽提兩次,取上清液再用等體積的乙醚抽提以除去殘余的酚,上清液用2倍體積乙醇沉淀DNA,用玻璃絲卷出DNA并用70%乙醇洗DNA,最后將DNA重懸于30ul TE中,基因組DNA通過0.4%的瓊脂糖凝膠電泳檢測;(2)通過PCR擴(kuò)增大腸桿菌O88中的O-抗原基因簇以大腸桿菌O88的基因組為模板通過Long PCR擴(kuò)增其O-抗原基因簇;首先根據(jù)經(jīng)常發(fā)現(xiàn)于O-抗原基因簇上游的galF基因設(shè)計上游引物(5’-ATT GTG GCT GCA GGG ATC AAAGAA ATC-3’),再根據(jù)O-抗原基因簇下游的gnd基因設(shè)計下游引物(5’-TAG TCGCGC TGN GCC TGG ATT AAG TTC GC-3’)。用Boehringer Mannheim公司的ExpandLong Template PCR方法擴(kuò)增O-抗原基因簇,PCR反應(yīng)程序如下在94℃預(yù)變性2分鐘,然后94℃變性10秒,60℃退火30秒,68℃延伸15分鐘,這樣進(jìn)行30個循環(huán);最后,在68℃繼續(xù)延伸7分鐘,得到PCR產(chǎn)物,用0.8%的瓊脂糖凝膠電泳檢測PCR產(chǎn)物的大小及其特異性;合并6管long PCR產(chǎn)物,并用Promega公司的Wizard PCR Preps純化試劑盒純化PCR產(chǎn)物;(3)構(gòu)建O-抗原基因簇文庫用被修改的Novagen DNaseI shot gun法構(gòu)建O-抗原基因簇文庫;反應(yīng)體系是300ng PCR純化產(chǎn)物,0.9ul 0.1MMnCl2,1ul 1∶2000稀釋的1mg/ml的DNaseI,反應(yīng)在室溫中進(jìn)行;酶切10分鐘使DNA片段大小集中在1kb-3kb之間,而后加入2ul 0.1M EDTA終止反應(yīng);合并4管同樣的反應(yīng)體系,用等體積的酚抽提一次,用等體積的酚∶氯仿∶異戊醇(2 5∶24∶1)溶液抽提一次,再用等體積的乙醚抽提一次后,用2.5倍體積的無水乙醇沉淀DNA,并用70%乙醇洗沉淀,最后重懸于18ul水中;隨后在此混合物中加入2.5ul dNTP(1mMdCTP,1mMdGTP,1mMdTTP,10mMdATP),1.25ul 100mM DTT和5單位的T4DNA聚合酶,11℃反應(yīng)30分鐘,將酶切產(chǎn)物補(bǔ)成平端,75℃終止反應(yīng)后,加入5單位的Tth DNA聚合酶及其相應(yīng)的緩沖液并將體系擴(kuò)大為80ul,70℃反應(yīng)20分鐘,使DNA的3′端加dA尾。此混合物經(jīng)等體積氯仿∶異戊醇(24∶1)溶液抽提和等體積乙醚抽提后與Promega公司的3×10-3的pGEM-T-Easy載體于16℃連接24小時,總體積為90ul,其中有9ul的10×buffer和25單位的T4DNA連接酶;最后用1/10體積的3M NaAc(pH5.2)和2倍體積的無水乙醇沉淀連接混合物,再用70%乙醇洗沉淀,干燥后溶于30ul水中得到連接產(chǎn)物;用Bio-Rad公司的電轉(zhuǎn)化感受態(tài)細(xì)胞的制備方法制備感受態(tài)大腸桿菌DH5α細(xì)胞,取2-3ul連接產(chǎn)物與50ul感受態(tài)大腸桿菌DH5α混合后,轉(zhuǎn)到Bio-Rad公司的0.2cm的電擊杯中電擊,電壓為2.5千伏,時間為5.0毫秒-6.0毫秒,電擊后立即在杯中加入1ml的SOC培養(yǎng)基使菌復(fù)蘇,然后將菌涂在含有氨芐青霉素、X-Gal和IPTG的LB固體培養(yǎng)基上37℃過夜培養(yǎng),次日得到藍(lán)白菌落,將得到的白色菌落即白色克隆轉(zhuǎn)到含有氨芐青霉素的LB固體培養(yǎng)基上培養(yǎng),同時從每個克隆中提取質(zhì)粒并用EcoRI酶切鑒定其中的插入片段的大小,得到的白色克隆群構(gòu)成了大腸桿菌O88的O-抗原基因簇文庫;(4)對文庫中的克隆測序從文庫中挑選插入片段在1000bp以上的100個克隆由上海生物工程有限公司用ABI377型DNA自動測序儀對克隆中的插入片段單向進(jìn)行測序,使序列達(dá)到80%的覆蓋率,再通過將相聯(lián)系的序列進(jìn)行反向測序及測通得到剩余20%的序列,從而獲得O-抗原基因簇的所有序列。(5)核苷酸序列的拼接及分析用英國劍橋MRC(Medical ResearchCouncil)分子生物學(xué)實驗室出版的Staden package軟件包的Pregap4和Gap4軟件拼接和編輯所有的序列,從而得到大腸桿菌O88的O-抗原基因簇的核苷酸全長序列,序列的質(zhì)量主要由兩個方面來保證1)對大腸桿菌O88的基因組作6個Long PCR反應(yīng),然后混合這些產(chǎn)物以產(chǎn)生文庫。2)對每個堿基,保證3個以上高質(zhì)量的覆蓋率;在得到大腸桿菌O88的O-抗原基因簇的核苷酸序列后,用美國國家生物技術(shù)信息學(xué)中心(The National Center forBiotechnology Information,NCBI)的orffinder發(fā)現(xiàn)基因,找到13個開放的閱讀框,用blast系列軟件與GenBank中的基因比較以發(fā)現(xiàn)這些開放的閱讀框的功能并確定它們是什么基因,再用英國sanger中心的Artemis軟件完成基因注釋,用Clustral W軟件做DNA和蛋白質(zhì)序列間的精確比對,最后得到大腸桿菌O88的O-抗原基因簇的結(jié)構(gòu);(6)特異基因篩選針對大腸桿菌O88的O-抗原基因簇中wzx和wzy基因設(shè)計引物;在每個基因內(nèi)各設(shè)計兩對引物,每對引物分布在相應(yīng)基因內(nèi)不同地方以確保其特異性;用這些引物以166種血清型的大腸桿菌和43株志賀氏菌基因組為模板進(jìn)行PCR,所有引物在大腸桿菌O88中得到陽性結(jié)果,在其他組中沒有擴(kuò)增到任何大小正確的帶,也就是,在大多數(shù)組中沒有得到任何PCR產(chǎn)物帶,雖在少數(shù)組中得到PCR產(chǎn)物帶,但其大小不符合預(yù)期大小,所以wzx、wzy基因?qū)Υ竽c桿菌O88及其O-抗原都是高度特異的。(7)引物靈敏度的檢測將大腸桿菌O88的凍存菌液接種到有LB培養(yǎng)基的三角瓶中,30℃-40℃培養(yǎng),180至250轉(zhuǎn)/分,培養(yǎng)數(shù)小時至飽和,取培養(yǎng)好的菌液稀釋,取稀釋菌液涂布LB瓊脂平板,30℃至40℃,培養(yǎng)數(shù)小時計數(shù),計算原液中活菌濃度;在5份重量均為20g的生豬肉餡中分別摻入5×103,5×102,5×101,5個和0個活菌,攪拌均勻,加入LB培養(yǎng)基,過濾,過濾液于30℃-40℃培養(yǎng),180至250轉(zhuǎn)/分,培養(yǎng)數(shù)小時;從培養(yǎng)好的菌液中取數(shù)ml于6,000g離心數(shù)分鐘,去上清,加MQ超純水吹開沉淀并混勻,放入100℃沸水中煮數(shù)分鐘,裂解液于12,000g離心數(shù)分鐘,取上清做為PCR模板;用寡核苷酸進(jìn)行PCR反應(yīng),檢測其對大腸桿菌O88的靈敏度。
全文摘要
本發(fā)明提供一種對大腸桿菌O88(Escherichia coliO88)的O-抗原特異的核苷酸,它是大腸桿菌O88中控制O-抗原合成的基因簇的核苷酸全序列,如SEQ ID NO1所示的分離的核苷酸,全長16800個堿基;或者具有一個或多個插入、缺失或取代的堿基,同時保持所述分離的核苷酸功能的SEQ ID NO1的核苷酸;還包括源于大腸桿菌O88的O-抗原基因簇中的寡糖單位處理基因(包括wzx基因或與wzx有相似功能的基因、wzy基因或與wzy有相似功能的基因)的寡核苷酸;本發(fā)明通過PCR證實寡核苷酸對大腸桿菌O88的O-抗原都有高度的特異性;本發(fā)明還公開了用本發(fā)明的寡核苷酸檢測和鑒定人體及環(huán)境中的大腸桿菌O88的方法。
文檔編號C07H21/00GK1563049SQ20041001903
公開日2005年1月12日 申請日期2004年4月19日 優(yōu)先權(quán)日2004年4月19日
發(fā)明者王磊, 楊靜華, 馮露 申請人:天津生物芯片技術(shù)有限責(zé)任公司