基于高通量测序的病原体筛查与确认

基于高通量测序的病原体筛查与确认

ID:77684435

大小:4.24 MB

页数:66页

时间:2024-02-04

上传者:笑似︶ㄣ無奈
基于高通量测序的病原体筛查与确认_第1页
基于高通量测序的病原体筛查与确认_第2页
基于高通量测序的病原体筛查与确认_第3页
基于高通量测序的病原体筛查与确认_第4页
基于高通量测序的病原体筛查与确认_第5页
基于高通量测序的病原体筛查与确认_第6页
基于高通量测序的病原体筛查与确认_第7页
基于高通量测序的病原体筛查与确认_第8页
基于高通量测序的病原体筛查与确认_第9页
基于高通量测序的病原体筛查与确认_第10页
资源描述:

《基于高通量测序的病原体筛查与确认》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

?密级公开分类号.保密期限IJDC_—占-?、犧:苗'.:-...V:.-..八為.:馨,方5T-*:門V'.二-人、古_J:■<V一卢..、.J山:硕±学位论文胃爾——W杂羣:-.■y气r,1’..:-芯声一.?产;产為—.、或声'某于高通量测序的病原体締赛与确认;题目:vV?,束:;-,为.I义丽作者姓名、..?..::?兰.A-:兰1;.i'’指导教师*童贻刚研究员/■培养单位军專睽学科学院微牛物流斤病研究所-:__、L-V-'t,;..-一^軍專预防医学争巫名称..=20166月8日._1;论文提交日期!年___一1—:。7>学位授予单位中国人民解放军军事医学科学院'巧燕萍研巧矣笞辩委見会主席员也-—-二'。--V系—接/古卢'主.;-:,片-直一,-■V*r*云■'--{'古造,:并.’'式'、^-:.:.皆心V么..:;':I:芒,'’::'-戶為V:■中国人民解放军军事医学科学院制、m:'.-‘切^t苗.和:.巧寶‘':;'^.:V■、冻:;爷巧H吉.'-、较i.7.心冷?乂.i遵炒.-、―、i立一 目录目录缩略词表........................................................................................................................1摘要................................................................................................................................3Abstract..........................................................................................................................6前言................................................................................................................................91.研究背景..........................................................................................................92.高通量测序概述及应用..................................................................................92.1罕见病的基因组测序...............................................................................92.2癌症基因组测序.....................................................................................102.3高通量测序在新病原体发现方面的应用.............................................113.目前高通量测序技术的局限性....................................................................124.高通量测序技术的未来................................................................................125.立题依据........................................................................................................136.本文研究内容................................................................................................13第一章未知病毒感染的高通量筛查与确认............................................................151.材料与方法....................................................................................................161.1实验材料.................................................................................................161.2组织切片的制备和观察.........................................................................161.3样本制备.................................................................................................171.4病毒总核酸提取.....................................................................................171.5DNA测序文库构建及测序....................................................................171.6生物信息学分析.....................................................................................191.7病毒的细胞培养.....................................................................................191.8病毒纯培养物基因组的提取.................................................................191.9实时定量PCR检测...............................................................................202.实验结果........................................................................................................202.1病毒基因组质控结果.............................................................................202.2Bioanalyzer2100鉴定结果....................................................................202.3测序结果概述.........................................................................................212.4病毒基因组拼接和分析.........................................................................212.5实时定量PCR检测结果.......................................................................252.6病理组织检查.........................................................................................27 目录3.讨论................................................................................................................284.结论................................................................................................................28第二章未知细菌感染的高通量测序筛查与确认....................................................291.材料和方法....................................................................................................291.1实验材料.................................................................................................291.2组织切片的制备和观察.........................................................................301.3样本前期制备.........................................................................................311.4微生物的核酸提取.................................................................................311.5RNA测序文库构建及测序....................................................................331.616SrDNAV1-V2区扩增.......................................................................341.7组织的宏基因组测序.............................................................................341.8细菌纯培养及鉴定.................................................................................351.9细菌的全基因组测序.............................................................................351.10动物实验...............................................................................................372.实验结果........................................................................................................372.1病理学检查.............................................................................................372.2微生物核酸质检.....................................................................................382.3RNA-seq..................................................................................................382.416SrDNA的V1-V2高变区扩增..........................................................402.5宏基因组测序.........................................................................................402.6细菌纯培养及鉴定.................................................................................432.7全基因组测序.........................................................................................452.8动物实验.................................................................................................513.讨论................................................................................................................524.结论................................................................................................................53全文总结......................................................................................................................54参考文献......................................................................................................................55发表论文......................................................................................................................61个人简介......................................................................................................................62致谢..............................................................................................................................63 缩略词表缩略词表缩写英文中文BHIBrainHeartInfusion脑心浸液BLASTBasicLocalAlignmentSearchTool序列相似性比较工具bpbasepair碱基对CDSCodingSequence编码序列contigContiguoussequence叠连群CPECytopathicEffect细胞病变效应CTCyclethreshold循环阈值DNADeoxyribonucleicAcid脱氧核糖核酸hhour小时HIVHumanImmunodeficiencyVirus人类免疫缺陷病毒HTSHigh-throughputSequencing高通量测序IndelsInsertion-deletions插入和缺失minminute分MPSSMassivelyparallelsignaturesequencing大规模平行测序NCBINationalCenterforBiotechnologyInformation美国国家生物技术信息中心NGSNext-generationSequencing下一代测序技术ntnucleotide核苷酸OTUOperationaltaxonomicunit操作分类单元PCRPolymeraseChainReaction聚合酶链式反应qPCRquantitativePCR定量PCRRASTRapidAnnotationusingSubsystemTechnology子系统技术快速注释RNARibonucleicAcid核糖核酸1 缩略词表rpmrevolutionsperminute每分钟转数ssecond秒SARSSevereacuterespiratorysyndrome重症急性呼吸综合征病毒SNPSingleNucleotidePolymorphisms单核苷酸突变位点SPFSpecificpathogenfree无特定病原体动物级SVSimianVaricella猴水痘SVVSimianVaricellaVirus猴疱疹病毒VZVVaricella-ZosterVirus水痘带状疱疹病毒WGSWholeGenomeSequencing全基因组测序WHOWorldHealthOrganization世界卫生组织XIAPX-linedinhibitorofapoptosisX连锁凋亡抑制蛋白2 摘要基于高通量测序的病原体筛查与确认摘要新发突发传染病是全世界面临的一个重要威胁,诸如气候变暖、人口增长、抗生素滥用、经济全球化、世界都市化、自然生态环境改变、人和野生动物接触频繁、跨国旅行人口数量激增及速度加快等因素,都极大增加了新发传染病发生和传播的可能性。据世界卫生组织(WorldHealthOrganization,WHO)的统计,自1973年以来,人类已发现至少48种新的病原体,例如人类免疫缺陷病毒(HumanImmunodeficiencyVirus,HIV)、重症急性呼吸综合征病毒(Severeacuterespiratorysyndrome,SARS)、埃博拉病毒、马尔堡病毒、禽流感病毒和猪流感病毒等。新型传染病正以平均每年新增一种的速度发生,并跨越国境在全球范围传播。因此对新发、突发传染病病原体进行快速筛查和确认,在最短的时间内获得病原体信息,是有效控制疫情和应对突发生物危害事件的基础。传统的病原体鉴定技术在病原体感染检测方面已日趋乏力。随着聚合酶链式反应(PolymeraseChainReaction,PCR)技术的出现,临床上基于核酸检测的病原体鉴定技术已经显著提高了检测成功率。最常见的基于PCR技术的检测方法需要病原体的基因组序列信息。然而,并不是在所有情况下病原体基因组序列信息都是已知的。针对先前并无相关报道,也未曾在人类中发现过的新型病原体,缺少相关的基因组序列信息,这限制了对该病原体导致疫情的检测。在实际情况中,在疾病诊断时,未知病原体感染占据很高的比例。近年来,越来越多对人类健康有重大意义的新型病原体,通过高通量测序技术得以发现,而传统的生物技术手段却未曾发现它们的存在,这提示高通量测序技术在病原微生物发现方面是一种新颖、有效的手段。高通量测序技术的发展使得对复杂微生物标本的研究成为可能,为洞察包括海洋、土壤以及人体等在内的不同来源样本的微生物群落多样性提供全新的视野。这些研究方法包括两种手段,一种是基于16SrDNA基因测序方法以确定系统发育关系;更多的是另一种方法,基于大规模Shotgun测序方法,研究样本中物种组成以及基因多态性。16SrDNA分子中,不仅含有高度和中度保守的序列区域,又含有高度变化的序列区域,而且其片段长度约1540bp,既便于分析,又含有足够多的信息,因此16SrDNA基因测序可用于复杂标本中细菌亲缘关系的研究。而全基因组测序,则可针对遗传进化特征、个体基因差异、致病机理、耐药机制及其传播规律进行研究。新一代高通量技术所需要的测序时间大大缩短,同时成本也越来越低,跨越了传统生物学研究方法所不能逾越的鸿沟,为比较基因组学、流行病学和微生物演化研究掀开崭新一页。3 摘要近些年,人兽共患病发病人数一直居于传染病人数的前列,SARS、狂犬病、禽流感等人兽共患病,对人类健康和公共卫生安全造成巨大的威胁。由猴疱疹病毒(SimianVaricellaVirus,SVV)引起的猴水痘(SimianVaricella,SV)疾病,在临床上与人类水痘带状疱疹病毒(Varicella-ZosterVirus,VZV)感染有相似的症状,已有研究证实SVV和VZV之间具有抗原相关性,因此对SVV进行深入研究是十分必要的。2014年某动物中心饲养的非洲绿猴发生未知疫情,导致多只绿猴死亡。本研究采用高通量测序探究该疫情的致死因素。本实验取死亡绿猴的肝、肺组织样品,提取病毒总DNA,基于病毒宏基因组学技术,使用IonTorrentPGM平台进行高通量测序,并借助生物信息学方法分析测序数据中的病毒组,寻找绿猴死亡可能的致死因素;根据高通量测序筛查结果设计引物,对样本进行qPCR定量检测,进一步确认组织样品中病毒的存在。对死亡绿猴的组织样品测序共产生原始测序数据共674Mb,读序(reads)数达到4.76M条,通过序列拼接,获得了该病毒长约124kb的全基因组序列。序列比对发现,测序数据中有大量的序列与猴水痘带状疱疹病毒具有高度的同源性,与目前已知的猴疱疹病毒9型的同源性达到98%以上。根据测序结果设计猴疱疹病毒特异性引物,采用qPCR对标本和病毒纯培养物进行定量检测,肝脏、肺脏和病毒培养物的CT值分别为23、20和16,可见两组织中均存在大量病毒,肺组织中的猴疱疹病毒滴度较肝组织高。本研究采用高通量测序作为传染病疫情的快速筛查技术,确认此次绿猴死亡的致死病原体为猴水痘带状疱疹病毒。新发传染病中,除由病毒引发的传染病,还有一类为细菌引起的感染。由于细菌与病毒结构不同,因而标本采取的处理方式也不同。某实验动物中心在一次动物实验中,发现一例食蟹猴非正常死亡,死亡原因未知,本研究采用高通量测序技术对未知致死病原体进行检测。本实验直接对病变脑组织样品进行细菌核酸提取和16SrDNA的V1-V2区扩增,通过宏基因组学测序及生物信息学分析,在不依赖培养手段的情况下,短时间内获取病变脑组织的菌群构成。然后,对脑组织匀浆物进行分离培养,分离得到的2株细菌经16SrDNA一代测序进行种属鉴定,随后完成Shotgun测序和Mate-Pair大片段库测序。在获得全基因组后,利用RAST进行基因组注释,分析基因组上可能存在的毒力基因和耐药基因,最后通过动物实验验证2株细菌的毒力。宏基因组测序结合组织病理学的检查结果,提示导致食蟹猴死亡可能是由于致病细菌的感染作用。分离培养得到的2株细菌经一代测序鉴定为巨型球菌和巴黎链球菌,进行基因组Shotgun测序,巴黎链球菌测序数据经过拼接获得27个contigs,与参考序列Streptococcuslutetiensis033(GenBank:CP003025.1)同源性达98%;巨型球菌测序数据拼接后得到28个contigs,与参考序列Macrococcuscaseolyticus(GenBank:AP009484.1)比对,发4 摘要现其同源性仅为74%,认为分离培养的巨型球菌为一个新种。对巨型球菌基因组进行Mate-Pair测序,获得基因组全序,全长为2391704bp,借助RAST注释,得到其基因组中含有2430个CDS,73个RNA,并发现了其中疑似的ClpP、ClpX、ResD等9个毒力基因,以及抗四环素、氨基糖苷类、氟喹诺酮、利福平等6个耐药基因。最后通过细菌的BALB/c小鼠颅内注射,与大肠工程菌对照组相比,巨型球菌和巴黎链球菌均存在较高致病性,可致小鼠死亡。上述研究结果显示,巨型球菌和巴黎链球菌的混合感染可能与食蟹猴的死亡相关,但具体的疾病发生过程以及致死机制的阐明仍需要后续的深入研究。关键词:病原体筛查与确认宏基因组测序全基因组测序基因组学5 AbstractScreeningandvalidationofunknownpathogenswithhigh-throughputsequencingAbstractBackgroundandObjectivesEmerginginfectiousdiseaseoutbreaksposeimportantglobalthreats.Infectionratesareincreasedbymanyfactors,includingglobalwarming,populationincreases,antibioticoveruse,economicintegration,rapidurbanization,ecologicalenvironmentalchanges,frequentcontactbetweenhumansandwildlife,andhightransnationaltourismrates.AccordingtoaWorldHealthOrganizationreport,atleast48newpathogenshavebeenfoundsince1973,includingsomeimportantviruses,suchasHumanimmunodeficiencyvirus,SARSvirus,Ebolavirus,Marburgvirus,andavianandswineinfluenzaviruses.Newdiseasesareappearingatanunprecedentedrate(oneperyearonaverage)andspreadingacrosstheworld.Therefore,thepromptscreeningforandidentificationofemerginginfectiouspathogensandtherapidacquisitionoftheirgenomicdatahavesignificantimplicationsforepidemicandbiohazardcontrol.Traditionalpathogenidentificationtechniqueshavebecomeincreasinglyinadequate.WiththeemergenceofPCRtechnologies,pathogenidentificationbasedonnucleicaciddetectionhassignificantlyimprovedtheclinicalsuccessrate.ThemostcommonlyuseddetectionmethodbasedonPCRrequiresgenomesequenceinformationforeachpathogen.However,insomecases,thegenomicsequenceofthepathogenisunavailable.Fornew,previouslyunreportedtypesofhumanpathogens,thelackofgenomicsequencedatalimitsthedetectionofthepathogencausinganoutbreak.Intheclinicalcontext,infectionswithunknownpathogensaccountforahighproportionofdiseasediagnoses.Inrecentyears,increasinglymoreresearchershaveidentifiednewpathogenswithimportantsignificanceforhumanhealthusinghigh-throughputsequencing(HTS),eventhoughthesepathogenshavenotbeendetectablewithtraditionalbiotechnologicalmethods.ThissuggeststhatHTStechnologyhasgreatutilityintheidentificationofpathogenicmicroorganisms.ThedevelopmentofHTShasmadeitpossibletostudycomplexmicrobialspecimensandtodeterminethevarioussourcesfromamongdiversemicrobialcommunities,includingthoseintheocean,soil,andthehumanbody,thusprovidingnewperspectives.Thesestudiesuseboth16SrDNAgenesequencingtodeterminethephylogeneticrelationshipsandmorecomprehensiveshotgunsequencingtopredictdetailedspeciesandgenecompositions.The16SrDNAmoleculecontainsnotonlyhighlyconservedregions,butalsomoderatelyconservedandhighlyvariableregions,soitissuitableforstudyingtherelationshipofbacteriaincomplexsamples.Despitethemoderatesizeofthe16S6 AbstractrDNAmolecule(itssequencelengthisabout1540bp),itcontainssufficientinformationforthistypeofresearch.Whole-genomesequencingcanalsofacilitatethestudyofgeneticdiversity,thegeneticlawsofevolution,pathogenesis,andthepropagationofresistancegenes.Thenew-generationHTStechnologyrequiresfarlessperformancetimethantheearliertechnology,andthecostissteadilydeclining.Itcircumventsthelimitationsoftraditionalbiologicalresearchmethodsandhasgreatlyadvancedresearchincomparativegenomics,epidemiology,andmicrobialevolution.MethodsandResultsInrecentyears,thenumberofzoonoseshasincreased,andinfectiousdiseasessuchasSARS,rabies,andavianinfluenzaposeahugethreattopublichealthandhumanhealthsecurity.Simianvaricella(SV)diseasecausedbysimianvaricellavirus(SVV)issimilarinitsclinicalpresentationtohumanvaricella–zostervirus(VZV)infection,andanantigeniccorrelationbetweenSVVandVZVhasbeendemonstrated.Therefore,anin-depthstudyofthezoonoticpotentialofSVVisrequired.In2014,anoutbreakofanunknowndiseaseinananimalbreedingcentercausedthedeathofmanyAfricangreenmonkeys.WeusedHTStoexplorethecauseofdeathinthisoutbreak.Liverandlungtissuesamplesweretakenfromthedeadgreenmonkeys,totalviralDNAwasextracted,HTSwasperformedusingtheLifeIonTorrentPersonalGenomeMachine(PGM)platformbasedonaviralmetagenomictechnique,andthesequencedatawereanalyzedwithbioinformatictoolstoidentifythevirusinvolved.BasedontheHTSresults,quantitativePCR(qPCR)primersweredesignedforthequantitativedetectionofthevirus,andtoconfirmthepresenceofthevirusinthetissuesamples.Intotal,674Mbofrawsequencedatawasgeneratedfromthegreenmonkeytissuesamples,with4.76millionreads.Thewholegenomesequenceofthevirus(approximately124kb)wasobtainedwithsequencesplicing.Sequencealignmentsshowedthatalargenumberofsequencessharedahighdegreeofhomologywiththemonkeyvaricella–zostervirusidentified,whichwasmorethan98%identicaltoaknownvirusdesignatedCercopithecineherepesvirus9.Basedonoursequencingresults,herpes-virus-specificprimersweredesigned,andtheviruswasquantitativelydetectedwithqPCRinbothtissuesamplesandpureviralcultures.Thecyclethresholdvaluesfortheliver,lung,andviralculturewere23,20,and16,respectively.Theseindicatethatlargeamountsoftheviruswerepresentinthetwoorgansofliverandlung,andthatthemonkeyherpesvirustiterswerehigherinthelungtissuesthaninthelivertissues.ThisstudyusedHTSasarapidscreeningtechniquetoidentifyaninfectiousdiseaseandconfirmedthatthelethalpathogenresponsibleforthegreenmonkeydeathswassimianvaricellavirus.Emerginginfectiousdiseasescanbecausedbyeithervirusesorbacteria,andthestructuraldifferencesoftheseagentsdemandthatdifferentproceduresbefollowed.Acynomolgusmonkeywasfounddeadatanexperimentalanimalcenterandthe7 Abstractcauseofdeathwasunknown.ThefatalpathogenswereidentifiedwithHTStechnology.Inthisexperiment,bacterialDNAwasextracteddirectlyfromtissuesamplesofthebrainlesions,andtheV1–V2hypervariableregionsof16SrDNAwasamplified.Metagenomicsequencingandabioinformaticanalysisrapidlyidentifiedthemicroflorainthebrainlesionswithouttheneedforculture.Inordertoidentifythepossiblepathogens,thebraintissuehomogenatewasthencultured.Twobacteria,whichwerethenidentifiedasStreptococcuslutetiensisandMacrococcussp.,wereseparatedfromtheculturedbraintissuehomogenate.Shotgunsequencingandsequencingalarge-fragmentmate-pairlibrarywereusedtoanalyzetheseparatedbacteria.ThewholegenomeswereannotatedwiththeRASTprogram,andthepossibleresistanceandvirulencegenespresentinthegenomeswereanalyzed.Finally,thevirulenceofthetwobacterialstrainswasconfirmedinanimals.Thecombinationofmetagenomicsequencingandahistopathologicalexaminationsuggestedthatthedeathofthecynomolgusmonkeywascausedbyapathogenicbacterialinfection.AftershotgungenomicsequencingforStreptococcuslutetiensisandMacrococcussp.,27contigsfromtheS.lutetiensissequencedatashowed98%homologybetweenoursequenceandthereferencesequenceS.lutetiensis033(GenBank:CP003025.1).The28contigsfromtheMacrococcussp.sequencedatashowedonly74%homologybetweenoursequenceandthereferencesequenceM.caseolyticus(GenBank:AP009484.1).Therefore,theisolatedMacrococcusmaybeanovelspecies.Mate-pairsequencingwasperformedtodeterminethewholegenomesequenceofMacrococcussp.(2391704bp).RASTannotationshowedthatthegenomecontains2430codingsequences,73transcribedRNAs,ninevirulencegenes,includingClpP,ClpX,andResD,andsixresistancegenestotetracycline,aminoglycoside,fluoroquinolone,rifampicin,andsoon.WhenweinjectedBALB/cmiceintracraniallywiththebacteria,usinganengineeredstrainofEscherichiacoliasthecontrol,theresultssuggestedthattheS.lutetiensisandMacrococcussp.strainswererelativelyhighlypathogenic,andcausedthedeathofthemice.TheseresultssuggestthatamixedinfectionofS.lutetiensisandMacrococcussp.causedthedeathofthecynomolgusmonkey.However,furtherresearchisrequiredtoclarifythespecificdiseasemechanism.Keywords:Screeningandvalidationofpathogens,Metagenomesequencing,Whole-genomesequencing,Genomics8 正文前言1.研究背景新发传染病由于没有可供参考的序列,现有检测手段无法施展,如依赖抗原的免疫学方法和基因序列的PCR方法等;对其致病机理缺乏了解而无法开展有针对性的干预治疗;此外人体免疫系统对新型病原体缺乏相应的防御力,使得新发传染病易造成严重的公共卫生问题和重大的社会影响。有些新发传染病可能造成大范围的人员死伤,在人群中引起恐慌,影响社会稳定,制约经济发展。在环境变化、抗生素滥用和免疫压力下,一些原本销声匿迹或得到控制的传染病因病原体基因变异而导致其致病性、致病机理、耐药性、传播方式发生改变,在面对这些原本熟悉病原体突然发生致病性改变的状况,人类由于反应滞后而遭受其极大的危害。利用新技术和新方法,加强新发突发传染病的鉴定、检测和致病机制的研究对于国家安全和社会民生均具有重要意义。2.高通量测序概述及应用第一代测序技术诞生的标志是,1977年FrederickSanger发明的双脱氧链末端终止法(Sanger测序法)以及MaxamGilbert发明的化学降解法。在此后几十年时间里,测序技术经历了飞跃式的发展,如今高通量测序技术(high-throughputsequencing,HTS)发展迅猛,已将基因组学的研究带入了一个崭新的阶段。高通量测序可对数百万个DNA分子进行同时测序,并可细致深入的对一个物种的基因组和转录组进行全貌分析,因此也称为下一代测序技术(Nextgenerationsequencing,NGS)[1]、深度测序(Deepsequencing)[2]或大规模平行测序(Massivelyparallelsignaturesequencing,MPSS)[3]。自2005年Roche公司推出第一台454高通量测序仪后,市场上的高通量测序平台主要被三大主流平台占据,分别是:Roche公司的GSFLX系统,Illumina公司的GenomeAnalyze系统和ABI公司的SOLiD系统。与传统的Sanger测序技术相比,下一代测序技术最大的创新是将片段化的DNA连上接头后固定于基质上,之后用多种方法在同一平面进行大规模平行PCR,再用荧光标记的成像检测技术获得测序数据,经生物信息学分析得到完整的DNA序列信息。通量高是HTS技术最大的特征,其一次能完成几百万条甚至更多DNA片段的序列测序,可快捷易行地完成一个物种的基因组深度测序或转录组测序,为人类了解世界带来里程碑意义的突破。2.1罕见病的基因组测序针对基因组、外显子、转录组的测序发展已经深刻影响了我们对人类疾病的9 正文遗传学理解,尤其是对一些罕见的门德尔遗传病和癌症而言。根据人类孟德尔遗传学数据库在线统计,有超过7800种门德尔遗传病,然后目前只发现了不到一半的疾病的致病基因。通过对患者以及其家庭成员的测序,其在致病等位基因方面的鉴定能力,在不同遗传性疾病的早期外显子研究中得以证实[4,5]。在少数病例中,对病人样本的测序表明特定的临床干预措施极大地改善了病人的预后。在之前的一个病例中,针对一例患有炎症性肠病的儿童进行了外显子组测序,进而发现了在X连锁凋亡抑制蛋白(X-linedinhibitorofapoptosis,XIAP)上的一处突变,XIAP是一种重要的炎性调节因子。基于孩子的症状严重程度以及分子诊断结果,对病人进行了骨髓移植,随后显著地缓解了病人的症状[6]。虽然高通量测序技术在致病基因的发现方面具有巨大的力量,然而到目前为止外显子组测序大概只在25%的病例中发现相关的基因缺陷[7]。2.2癌症基因组测序癌症是高通量测序技术得以应用并取得成果的另一重要领域。癌症基因图谱(TheCancerGenomeAtlas,TCGA)和国际癌症基因组协会(InternationalCancerGenomeConsortium,ICGC)针对数千对肿瘤与正常个体进行了基因组和外显子组测序。这些研究描述了超过20种肿瘤的基因突变情况,表明肿瘤在基因突变类型和突变数量上有显著多样性[8]。通过这些全球范围性的研究,对于癌症驱动基因的检测所必须的背景突变率的发展日趋完善。例如,在预测一个基因的突变率是否超过预期时,复制时机和基因表达量被发现是两个重要的因变量。利用这些背景模型,TCGA-led项目发现了若干新型癌症驱动基因,新型癌症中已知的驱动基因以及常见的破坏通路[8]。此外,对癌症的全基因组测序(WholeGenomeSequencing,WGS)也已经发现了一些高频,非编码的突变,例如在TERT启动子上的活化突变[9]。随着高通量测序技术在范围和灵敏度上的发展,人们可以在全球范围内针对肿瘤的异质性,克隆进化以及耐药性机制等方面进行深入的研究和描述。采用单细胞测序技术,通过对原发性乳腺癌细胞的畸变拷贝数进行追踪,Navin及他的同事证明了拷贝数重组的爆发会导致持久克隆扩张[10]。相比之下,点突变随时间的积累则缓慢得多,引起更广泛的克隆多样性,进而确保肿瘤能够对不同的选择压力产生适应[11]。除了用于对克隆多样性的研究,在比较原发肿瘤和复发病灶,描述化疗的效果以及耐药性产生的分子机制等方面,高通量测序技术也有广泛应用[12,13]。总结起来,这些“癌症分子肖像”构成了诊断和治疗癌症的全新模式的基础。10 正文2.3高通量测序在新病原体发现方面的应用包括临床标本在内,在针对各种样本的的病原体检测方面,高通量测序正成为一种极具吸引力的新方法。理想状况下,NGS在微生物诊断方面的应用应当在痕量微量条件下,完成对临床样本中遗传物质的扩增和分析,而不需要针对目的序列去设计特定的引物。由于在微生物核酸的随机/无偏差的扩增中不可避免得会带来宿主核酸的扩增,导致对微生物核酸的检测难度无异于大海捞针。事实上,为了对微生物核酸进行富集同时减少宿主核酸的含量,尽管已经有不同的策略出现,宿主背景核酸的水平依然限制着NGS在病原体发现方面的灵敏度[14]。此外,高通量测序平台的选择也是至关重要的,测序读长和单次运行所产生的序列数目是选择测序平台时应考虑的关键因素[15]。考虑到这些方面后,利用高通量测序在针对未知病原体特别是病毒的核酸发现方面,已被证明具有巨大的潜力[14]。在ClinicalInfectiousDiseases的两篇不同的文章中,Brown等人[16]和Naccache等人[17]利用无偏差的高通量测序方法,解决了两例由于未知病因感染脑炎的免疫功能低下病人的诊断难题,一例为一名18个月大的男孩,另一例为一名42岁的男子。在上述两个病例中,作为致命性脑炎的潜在病原体,一种新型的星状病毒—HAstV-VA1/HMO-C-UK1,通过高通量RNA测序技术(RNA-seq,IlluminaMiseq测序平台)得以被鉴定出。星状病毒是一类无包膜的单链RNA病毒,通常与人类肠胃炎有关,只是在最近的报道中被认为其可能是是导致脑炎的病原体。在一起病例中,病人体内检测到了HAstv-SG,属于VA/HMO分支的一种星状病毒[18]。另一起病例中,通过反转录PCR(RT-PCR)技术[19],在脑组织中,4型人星状病毒被检测出。上述两起病例中,病人的免疫系统均严重受损。许多研究,包括上述ClinicalInfectiousDiseases中的两篇报道表明,至少在免疫功能低下的病人中,导致脑炎的病原体范围应当包括星状病毒。2013年Eveline等人[20]在MBio杂志上报道了一个利用高通量测序发现新型致病微生物的案例。研究者对感染者的假复层支气管上皮细胞进行培养,随后用Illumina’sHiSeq2500system进行RNA-seq检测,检出了新型人类冠状病毒-EMC(hCoV-EMC)。研究还表明EMC在人呼吸道上皮细胞进行复制,I型和III型干扰素治疗可以有效降低冠状病毒,这为病毒感染的治疗提供了可能的途径。Brown等人和Eveline等人的成果进一步证明了无偏差高通量测序技术从来自于未知病因病人的临床样本中发现新型病毒这一应用的巨大潜力。然而,在高通量测序可以于临床实验室达到充分利用水平之前,仍有许多挑战需要我们去面对和战胜。11 正文3.目前高通量测序技术的局限性值得注意的是,虽然今天的技术允许从科研和临床应用方面开展全民水平的测序,然而一些关键性的局限仍然存在。从技术角度来看,针对基因组的测序精度和覆盖度尚存技术性难题,特别是在GC富集区域和一些长的同聚体延伸区域[21]。此外,目前大多数测序平台产生的测序读长较短,这严重限制了我们对一些大的重复序列,许多插入缺失标记等区域的精确研究能力[22]。因此需要确定一个基因组研究的金标准,来规范数据处理、变量调用等过程[23]。鉴于不同测序平台的技术限制和测序偏差,完成精准的基因组测序需要与其他技术相结合。除了全基因组测序以外,全转录组、个体等位基因以及拼接亚型等工作都受限于目前测序平台的读长较短。随着测序通量和测序读长的进一步发展,例如PacificBiosciences和OxfordNanopore等第三代测序技术的出现和改进,测序读长的延伸,以及对短片段拼接效果的完善,相信未来一定可以克服上述限制[24]。现有的高通量测序技术在科研和临床领域的应用日益广泛,存在的局限性也将会促进新型测序平台的技术创新[25]。4.高通量测序技术的未来迄今为止,临床高通量测序技术主要用于对基因组的目标区域的研究以及在样本中病原体的检测。例如,利用产妇血中的游离DNA进行无创性染色体异常检测的产前筛查,已经在临床上得以应用。同样,临床上针对基因突变所开展的目标性测序,被用来指导癌症的诊断和治疗。在临床上,高通量测序还被用于监控病原体爆发,例如耐甲氧西林金黄色葡萄球菌的感染[26]。高通量测序在这些领域中的应用还会不断拓展,但是建立在常规临床应用基础上的完整个性化医疗需要更为全面的技术,例如目前尚面对一些重大挑战的全基因组测序技术。为了使大规模基因组学完美整合到临床上,我们需要从成本和时间尺度上,完成对测序数据储存和分析过程中的优化。然而更重要的是,我们必须从生物学和临床的角度对未知意义的变异有更深入的理解。这类变异在个体基因组测序中最常见,包括一些会影响编码序列的已知致病基因上的变异,同时也包括了一些之前被认为和疾病无关的基因上的变异或是在基因组调控区域上的变异。个体基因组测序和大规模基因组测序项目(例如ENCODE和GTEX)所获得的数据将会有助于对这些突变的解释和更完整的参考数据库的产生。诸如个人基因组项目和一体化的个体组学分析(integrativePersonalOmicsProling,iPOP)之类的开放存取项目,也会为我们提供有价值的用于阐述基因型和表型相关性的综合性信息资源[27,28]。随着开放数据的共享,针对新型变异的高通量生化测定结合详细的医疗记录,将会最大程度地促进我们对个体基因组的认知,对人类健康和疾病有更好的12 正文理解。5.立题依据新技术的出现将为传染病的检测手段和致病机理研究带来革命性的变化。高通量测序能一次并行对10亿条DNA分子进行序列测定且不依赖已知序列,可从上千万个基因背景中鉴定出病原体基因片段。因通量高、所用时间短并且不依赖已知序列,高通量测序技术已经被广泛使用于生物医学研究。利用宏基因组测序,一次可以测出10亿条序列,每条序列长度超过100bp,足以作为一个微生物存在的可靠依据,而且碱基序列信息不像杂交信号或其他显色反应信息,不存在假阳性和假阴性问题。利用这些极高的通量和明确的序列信息,加上合理的生物信息学分析,可以极其灵敏而又十分准确地判断病原体的种类和数量。与任何一个新技术相似,高通量测序应用于传染病的防控还有很多具体问题需要解决,如何从高通量测序所产生的海量信息中发现未知病原体,寻找与毒力、耐药性和传播方式改变相关的基因是难点所在。生物信息学作为一门新兴的交叉学科,在生物医学研究中发挥着不可替代的作用。基于二代测序技术产生的海量数据只有通过生物信息学分析和大型服务器的高速运算才能快速准确地得出结果,及时追寻病原体的踪迹,同时利用生物信息学手段可以将海量测序数据进行加工整理,还原出病原体的全部遗传信息,并且利用这些全基因组信息,经过进一步的生物信息学分析,可以准确了解病原体的来源和进化规律,发现其毒力和致病因子、耐药基因,从而把握病原体致病机制和耐药机制,为预防和控制病原体致病和扩散提供理论依据。6.本文研究内容本研究借助IonTorrentPGM和IlluminaMiseq二代测序平台,以高通量测序为线索,直接从未进行微生物纯培养的标本中进行高通量测序,测序得到的数据进行病原体筛查,再通过分子生物学、微生物学、动物实验等技术方法,进一步验证筛查结果,从而确保结果的可靠性。对未知病毒的筛查,我们以非洲绿猴为例,通过高通量测序和生物信息学分析,直接从死亡绿猴的肝肺组织中筛查到猴疱疹病毒,并对此株疱疹病毒的基因组进行组装拼接和注释,并对此病毒进行遗传进化分析,最后用实时定量PCR对筛查结果进行验证。对于未知致病菌的筛查,我们以食蟹猴为例,利用宏基因组测序对死亡食蟹猴的脑组织进行感染菌的分析,并对其中的巨型球菌和巴黎链球菌进行Shotgun测序和Mate-Pair大片段库测序,分析2株菌的比较基因组、毒力基因、耐药基因,最后用动物实验验证2株细菌的毒力。本研究采用两个代表性的未知感染病例(细菌和病毒),显示高通量测序可13 正文以作为一种有效的未知感染疫情或其它未知感染性疾病的快速筛查技术,高通量、快速搜寻潜在病原体的痕迹。在此基础上,通过对筛查到的微生物进行全基因组序列测定,了解病原体的遗传和进化规律,探索病原体的致病和耐药特征。进一步采用实验手段,分离培养病原体,通过动物实验验证病原体的致病能力,从而确认病原体为致病因素。14 正文第一章未知病毒感染的高通量筛查与确认新发突发传染病是人类社会公共卫生体系当前面对的严重挑战。近年来,人兽共患病发病人数一直居于传染病人数的前列,SARS、狂犬病、禽流感等病毒性人兽共患病,对人类健康和公共卫生安全造成巨大的威胁。一旦传染病爆发,首先要解决病原体是什么,为什么能致病,特别是针对新发、未知病原体,快速确定病原对于制定防控措施具有重要意义。猴疱疹病毒SVV属于嗜神经疱疹病毒的亚科,作为带状疱疹病毒的一员,由SVV引起的疾病,在临床上与人类水痘带状疱疹病毒VZV感染具有相似的症状。这个病毒导致了1967年的一次长尾猴的水痘样疫情的爆发,然后将其分离鉴定为疱疹病毒[29]。猴疱疹病毒是一种天然存在的疱疹病毒,由SVV引起的猴水痘SV疫情常在非人灵长类动物中被报道,包括长尾猴、赤猴和食蟹猴等[30]。猴感染后以发热和脸上、躯干及四肢泛发性水危斑疹为特征,并可能进一步发展成肺炎和肝炎。在致死病例的尸检中,检出多处组织器官具有特征性的多灶性坏死和出血斑[31]。这些急性症状恢复之后,SVV可在存活的猴子神经节建立潜伏感染,激活后可引起继发感染[32]。与VZV相似,SVV的基因组由共价连接的长片段(L)和短片段(S)组成,每个片段有一个独特的序列,包括片段内和末端反向重复序列。SVV基因组的大小也与VZV相似,编码的71个独特的ORF中有68(约占96%)个与VZV相应基因有高度的同源性[33,34]。目前,SVV和VZV之间除了遗传特性和临床表现有相似性,暂时还没有直接的证据表明SVV能引起人类感染的病例。但SVV和VZV可以通过气溶胶从呼吸道传播,有研究表明,在印度恒河猴的支气管内接种SVV,可再现急性VZV感染人类的特点[35]。大量研究已经证实SVV和VZV之间抗原相关性,因此暴露于SVV的特殊人群须要注意生物安全[36],因此对SVV进行深入研究是十分有必要的。2014年10月,北京某实验动物中心从国外引进一批非洲绿猴,十几天后,在绿猴的腹部、四肢、眼角和腹股沟等处出现红色瘀斑,于是将这些猴子隔离至一个单独的房间。尽管营养良好,24h后这些猴子表现出体温升高,食欲下降和精神抑郁,5天后,所有猴子均死亡。在本研究中,我们使用DNA测序的方法筛查绿猴的致死病原体。我们从绿猴的组织样本中发现了大量的SVV基因组序列,并获得了SVV的全基因组,最后通过病毒的细胞培养和实时定量PCR的方法证实了病毒的存在。该病毒的DNA序列为进一步研究病毒致病的分子基础和抗病毒疗法的发展提供了依据。这些信息为控制非人灵长类动物的猴水痘流行病提供了重要的理论支撑。15 正文1.材料与方法1.1实验材料1.1.1动物组织解剖死亡绿猴,记录大体病变,采集适当大小的肝脏和肺脏组织,保存于10%的甲醛固定液,用于后期对病理组织切片进行检查,另外的肝、肺组织样品取出后放在无菌容器内,置于冰上保存,随即运输至实验室进行下一步操作。1.1.2主要仪器高通量测序仪IonTorrentPGM购自美国LifeTechnologies公司;病理切片所需手动切片机、自动烘片机、恒温展片机购自德国Leica公司;组织研磨匀浆仪TissueLyserII购自德国Qiagen公司;文库片段大小及分布鉴定Agilent2100Bioanalyzer购自美国AgilentTechnologies公司;荧光定量PCR仪LightCycler2.0购自瑞士Roche公司。1.1.3试剂及耗材10%甲醛溶液、70%乙醇、80%乙醇、85%乙醇、95%乙醇、无水乙醇、二甲苯I、二甲苯II、石蜡油、1%盐酸酒精、苏木素染液、1%伊红染液、中性树胶等购自国药集团化学试剂有限公司;0.22μmPVDFfilters购自美国Millipore公司;HighPureViralRNAKit购自瑞士Roche公司;NEBNext®FastDNAFragmentation&LibraryPrepSetforIonTorrent™购自美国NewEnglandBiolabs公司;Agencourt®AMPure®XPReagent购自美国BeckmanCoulter公司;HighSensitivityDNAAnalysisKits购自美国AgilentTechnologies公司;QIAamp®ViralRNAMiniKit购自于德国Qiagen公司;IonOneTouch400TemplateKitv2DL、IonPGM™Sequencing400Kit购自美国LifeTechnologies公司;DMEM培养基、MaximaSYBRGreen/ROXqPCRMasterMix(2×)购自美国ThermoFisherScientific公司。1.2组织切片的制备和观察使用10%福尔马林溶液固定24h后,按常规方法制作石蜡包埋切片,切片厚度约为5µm。切片采用HE染色,制作好的切片用OLYMPUSU-SRG数码显微镜观察并采图。16 正文1.3样本制备从绿猴的肝脏、肺脏组织各切取约0.3g于2mL离心管,加1mLPBS缓冲液及1粒钢珠,置于组织研磨匀浆仪30Hz匀浆5min,然后16000×g离心5min取上清,再用0.22μmPVDF离心过滤管过滤上清液,收集得到的过滤液用于病毒总核酸提取。1.4病毒总核酸提取按照RocheHighPureViralRNAKit说明书提取肝肺组织中的病毒总核酸,具体步骤如下:1)两样品分别取200µL的匀浆上清,加入400µLBindingBuffer和4µLCarrierRNA,混匀后于室温下孵育10min保证充分裂解;2)将混合液加至离心过滤管中,8000×g离心15s,弃收集管并换新收集管;3)向过滤管加入500µLInhibitorRemovalBuffer,8000×g离心1min,弃收集管并换新收集管;4)向过滤管加450µLWashBuffer,8000×g离心1min,弃收集管并换新收集管;重复上述步骤一次,最大转速离心10s以彻底去除残留的WashBuffer;5)将过滤管置于一个新的1.5ml离心管中,向过滤管加入20µL无核酸酶水,8000×g离心1min洗脱病毒核酸。1.5DNA测序文库构建及测序1.5.1基因组Shotgun文库构建使用NEBNext®FastDNAFragmentation&LibraryPrepSetforIonTorrent™试剂盒对病毒基因组DNA构建Shotgu测序文库,具体步骤为:取100ngDNA,首先用NEBNextDNAFragmentationMasterMix酶,同时进行酶切法打断DNA和末端补平,反应条件为25℃20minutes,70℃10minutes;第二步向末端补平的PCR管中添加接头NEBNextDNALibraryAdaptorsforIonTorrent,使用的连接酶为T4DNALigase,反应条件为25℃15minutes,65℃5minutes;用®®TMAgencourtAMPureXPReagent进行DNA纯化后,再用E-GelSIzeSlectAgaroseGel选取400-500bp片段,之后用NEBNextHigh-Fidelity2×PCRMasterMix进行PCR扩增,扩增条件为:98℃30s;98℃10s、58℃30s、72℃30s,10个循环;72℃5min;扩增后再次使用AMPureXPBeads进行DNA纯化,纯化后的PCR产物用Qubit2.0进行准确的浓度定量;最后使用Bioanalyzer2100及HighSensitivityDNAAnalysisKits鉴定构建文库的片段大小分布及质量。17 正文1.5.2OneTouch油包水PCR根据样本浓度,稀释为工作浓度,按设计的比例完成OneTouchEmulsionPCR。油包水PCR使用的试剂为IonOneTouch400TemplateKitv2DL,具体步骤如下:取25pMDNA文库,加入500µLIonPGM™TemplateOT2400ReagentMix,285µLIonPGM™TemplateOT2400PCRReagentB,50µLIonPGM™TemplateOT2400EnzymeMix,40µLIonPGM™TemplateOT2400ReagentX,100µLIonPGM™TemplateOT2400IonSphere™Particles,混匀后加入IonOneTouch™ReactionTube-ReactionFilter中,分两次加入1.5mLReactionOil,安装ReactionFilter,运行IonOneTouch™DLConfiguration进行ISPs富集,收集ISPs,并用IonSphereQualityControlKit评估其活性。1.5.3OneTouchES富集样品首先用10µL10%Tween®20inNuclease-freeWater、865µLNuclease-freeWater、125µL1MNaOH配置1mL的Melt-offSolution;其次用MyOneTMbeadsWashSolution清洗MyOneTMstreptavidinC1magneticbeads;然后将八连排strip放置于ES上,放置方向为左方右圆,如图1.1所示:图1.1八连排管的放置方向Figure1.1Theplacementdirectiontothe8-wellstrip8个孔加样顺序见表1.1:表1.1八连排管的加样顺序Table1.1Theorderofthesamplein8-wellstrip12345678TMWashWashWashMelt-offISPsMyOneSolutionSolutionSolutionBlankSolutionBlank100ul130ul300ul300ul300ul300ul最后在TipLoader处放入PCR收集管,在TipArm处安装新枪头,运行ES。1.5.4PGM上机测序18 正文TMTM清洗IonPGMSystem后,使用IonPGMSequencing400Kit上机测序,将富集的ISPs加载至Ion318chip芯片,运行PGM测序仪850个循环反应,收集测序数据。1.6生物信息学分析1.6.1病毒鉴定测序得到的序列与本地nt库进行BLAST2.2.30+比对,本地数据库的病毒基因组参考序列均来自NCBI。比对结果经过分析处理,减少假阳性和重复的结果。在结果中显示的所有病毒,要使用此病毒的序列与NCBI网站(http://blast.ncbi.nlm.nih.gov)上的nt库重新进行BLAST以证实鉴定结果。1.6.2基因组的拼接和分析使用Bowtie2软件,对原始测序数据进行质控,滤除宿主序列、错误序列、过短序列及低质量序列,剩余的序列使用RocheNewblerv2.9软件进行拼接,并根据参考序列使用Mauve2.3软件进行基因组的排列。拼接完成的基因组使用RapidAnnotationusingSubsystemTechnology(RAST)v2.0(http://rast.nmpdr.org/)进行基因组注释。利用在线比较基因组学工具CGViewServer绘制基因组分析图。多序列比对和系统发育树的构建由MEGAv6.0软件完成。1.7病毒的细胞培养用因感染这次疫情而致病死亡的绿猴身上分离得到的病毒来感染Vero细胞(非洲绿猴肾上皮细胞),培养条件为:37℃,5%CO2,使用DMEM培养基(Dulbecco’smodifiedEagle’smedium),另外补充添加2%FBS、青霉素[5000U/ml]和链霉素[5000U/ml]。当观察到完全的细胞病变效应(Cytopathiceffect,CPE)后,收集培养上清液,并储存于-70℃直至使用。1.8病毒纯培养物基因组的提取按照QIAamp®ViralRNAMiniKit说明书提取细胞培养上清中的病毒基因组,具体步骤如下:1)裂解:首先用0.22μmPVDF离心过滤管过滤细胞培养上清液,然后取140µL的过滤液于一新的1.5mLEP管,加入560µLBufferAVL(含有carrierRNA),涡旋混匀后于常温下放置10min以保证裂解效率;2)过柱吸附:接着向EP管中加560µL无水乙醇(96%-100%),涡旋混匀后将混合液加至离心过滤管中,8000rpm离心1min,弃过滤液并换新的2mL收集管;重复上述步骤至所有的裂解液都过柱;3)纯化:向过滤管加入500µLBufferAW1*,8000rpm离心1min,弃收19 正文集管并换新收集管;向过滤管加500µLBufferAW2*,13000rpm离心3min,弃收集管并换新收集管;全速离心30s以彻底去除残留的WashBuffer;4)洗脱:将过滤管置于一个新的1.5mL离心管中,加入40µL无核酸酶水,室温放置1min后,8000rpm离心1min洗脱病毒基因组。1.9实时定量PCR检测为了进一步确认组织样品中病毒的存在,以及对组织中的病毒和细胞培养的病毒进行定量,我们根据高通量测序拼接得到的基因组,挑选SVV基因组上高度保守的衣壳蛋白基因设计qPCR引物,正向引物为5’-CGCTGCATACAAGCATGACC-3’,反向引物为5’-GTGGGGTACGGAAGGAGTTG-3’。反应体系为:2µLDNA模板,正向反向特异性引物各25pmol,10µL2×MaximaSYBRGreen,最后用Nuclease-FreeWater补至总体系20µL。反应条件为:首先50℃孵育5min,然后进行PCR反应95℃预变性2min;95℃变性30s,60℃退火30s,72℃延伸30s,40个循环;PCR步骤结束后,增加一步熔解曲线分析,即从65℃到95℃以0.1℃/s的增量读取荧光值,为了减少引物二聚体的干扰,荧光值在95℃步骤结束后进行测定。为保证检测的准确性,每个样本做3个平行实验,且增加一组用Nuclease-FreeWater代替DNA模板做阴性对照。2.实验结果2.1病毒基因组质控结果使用RocheHighPureViralRNAKit及QIAamp®ViralRNAMiniKit两个试剂盒提取的病毒基因组DNAOD260/OD280均高于1.9,提示DNA未被蛋白质、酚等污染;OD260/OD230均高于2.0,提示DNA未被碳水化合物(糖类)、盐类或有机溶剂等污染;上述两个比值均处于正常范围内,说明提取的DNA较纯。使用Qubit2.0检测DNA浓度,两试剂盒提取的DNA浓度分别为12.9ng/µL、16.4ng/µL,满足构建文库的需求,可进行下步操作。2.2Bioanalyzer2100鉴定结果将准备好的DNA文库稀释到约200ng/µL,取1µL加载到高灵敏2100芯片中,使用Bioanalyzer2100对文库进行片段大小及分布的鉴定,结果如图1.2所示,文库稀释30倍后片段大小为467bp,浓度为258.95pg/µL,符合测序要求。20 正文图1.2文库稀释30倍鉴定结果Fig1.2Sizedistributionsandyieldsoflibrary2.3测序结果概述本次样本检测共构建1个ShotgunDNA测序文库,共生成186Mb的测序原始数据,其中≥Q20数据量为153Mb,序列条数为0.86M,序列平均长度为217bp,上述结果可以进行后续的数据分析。2.4病毒基因组拼接和分析过滤后的reads首先被拼接成33个大于500bp的contigs,且所有的contigs均可比对至参考基因组序列Cercopithecineherepesvirus9(Acc.No.AF275348.3),使用Mauve2.3软件对基因组进行排列比对的结果如图1.3所示。图1.3病毒与参考序列的同源比对结果Fig1.3Homologousalignmentresultsoftheviruswiththereferencegenome21 正文该病毒的全基因组长度为124024bp,GC%含量为40.4%,见图1.4,最外第一、二圈蓝色分别为基因组正向和逆向编码的CDS,第3圈(黑色)表示GC含量,第4、5圈(绿色与紫色)表示GCskew,两种颜色基本均等,认为该病毒在复制上基本无偏好性。该基因组与参考序列有98%的同源性,但与其它基因组并没有较高的同源性,这表明该SVV病毒与Cercopithecineherepesvirus9同属一个种,与参考序列相比,SVV在40-50kb间有一段Indels。图1.4SVV基因组基本情况分析Fig1.4CircularrepresentationoftheSVVgenome该病毒有88个基因,用RASTv2.0进行基因组注释,大多数基因被注释为假想蛋白,注释结果见表1.2。其中一个预测蛋白被称为糖蛋白B,它存在于大多数疱疹病毒,并作为重要的抗原。系统发育树是根据新发现的病毒和其他能够感染人类和其他物种的代表性疱疹病毒的蛋白质序列而构建,见图1.5。新发现的病毒可与人疱疹病毒3(Humanherepesvirus3)聚类到一支,但是有较长的进化距离。表1.2新发现的SVV基因组注释Table1.2GenomeannotationtableofSVVstartstopstrandaaLengthfunction7601293+178hypotheticalprotein22 正文24431535-303hypotheticalprotein30472931-39hypotheticalprotein32193335+39hypotheticalprotein36053378-76hypotheticalprotein44703919-184hypotheticalprotein45024633+44hypotheticalprotein46334782+50hypotheticalprotein62044753-484hypotheticalprotein72796314-322hypotheticalprotein106497335-1105hypotheticalprotein1061511289+225hypotheticalprotein1269511484-404hypotheticalprotein1300813913+302hypotheticalprotein1414015360+407hypotheticalprotein1537415493+40hypotheticalprotein1567517603+643hypotheticalprotein1775817600-53hypotheticalprotein1774919713+655hypotheticalproteinThymidylatesynthase1984520726+294(EC2.1.1.45)2233520809-509hypotheticalprotein2363622488-383hypotheticalprotein2359923715+39hypotheticalprotein2498723830-386hypotheticalprotein2519025059-44hypotheticalprotein2521326628+472hypotheticalproteinRibonucleotidereductase2763526676-320ofclassIa(aerobic),betasubunit(EC1.17.4.1)Ribonucleotidereductase2996527614-784ofclassIa(aerobic),alphasubunit(EC1.17.4.1)3004330162+40hypotheticalprotein3156230159-468hypotheticalprotein3173734862+1042hypotheticalprotein3500842915+2636hypotheticalprotein4297843127+50hypotheticalprotein4383443148-229hypotheticalprotein4451543916-200hypotheticalprotein4472444599-42hypotheticalprotein4518744840-116hypotheticalprotein4521946934+572hypotheticalproteinArchaealDNA5123547717-1173polymeraseI(EC2.7.7.7)23 正文5142155005+1195hypotheticalprotein5509257374+761hypotheticalprotein5757859983+802hypotheticalprotein6237660610-589hypotheticalprotein6417362407-589hypotheticalprotein6495664210-249hypotheticalprotein6498265995+338hypotheticalprotein6617068728+853hypotheticalprotein7038068779-534hypotheticalprotein7067171330+220hypotheticalprotein7145975697+1413hypotheticalprotein7579276739+316hypotheticalprotein7793876787-384hypotheticalprotein7800380039+679hypotheticalprotein8018981265+359hypotheticalprotein8239081323-356hypotheticalprotein8245183101+217hypotheticalprotein8325184477+409hypotheticalprotein8444185970+510hypotheticalprotein8597086218+83hypotheticalprotein8762586303-441hypotheticalprotein8763490084+817hypotheticalprotein9004292498+819hypotheticalprotein9335292567-262hypotheticalprotein9557993372-736hypotheticalprotein9568398223+847hypotheticalprotein9829598858+188hypotheticalprotein9906798888-60hypotheticalprotein9971499103-204hypotheticalproteinUracil-DNAglycosylase,10057399728-282family1101034100534-167hypotheticalprotein102142102264+41hypotheticalprotein103687102242-482hypotheticalprotein103752103922+57hypotheticalprotein103994104161+56hypotheticalprotein104489104136-118hypotheticalprotein108121104600-1174hypotheticalprotein108078108407+110hypotheticalprotein109753110622+290hypotheticalprotein110700111353+218hypotheticalprotein111885111655-77hypotheticalproteinSerine/threonineprotein112181113362+394kinase24 正文113644114654+337hypotheticalprotein114874116691+606hypotheticalprotein117438116785-218hypotheticalprotein118385117516-290hypotheticalprotein120050119721-110hypotheticalprotein120007123528+1174hypotheticalprotein123639123992+118hypotheticalprotein图1.5SVV系统发育树Fig1.5ThephylogeneticreconstructionofSVV2.5实时定量PCR检测结果使用SYBRGreen染料法对肝脏、肺脏及病毒纯培养物进行荧光定量PCR(quantitativePCR,qPCR)检测,其中病毒培养物中SVV的DNA投入量已换算成与肺脏中SVV的DNA投入量一致,得到的CT值(Cyclethreshold)可直接进行比较,具体检测结果见图1.6及图1.7。图1.6中,黑线代表肺组织,绿线代表肝组织,而蓝线代表阴性对照,结果显示,肝脏、肺脏的CT值分别是23、20,这不仅证实了样本的前期处理较好,可以从组织中高效提取病毒核酸,而且证明该SVV病毒在样本中确实存在。所述病毒效价较高。图1.7中黑线代表肺组织,红线代表病毒培养物,紫线表示阴性对照,结果显示,肺脏及病毒培养物的CT值分别为20、16,这提示SVV的细胞培养成功,病毒含量增加。25 正文图1.6肝肺组织中SVV实时定量PCR检测Fig1.6QuantitativePCRdetectionofSVVinliverandlung图1.7肺组织及病毒纯培养物中SVV实时定量PCR检测Fig1.7QuantitativePCRdetectionofSVVinlungandviruscultures26 正文2.6病理组织检查病理组织检查结果见图1.8和图1.9。组织检查显示,肝组织发生了严重的片状肝细胞坏死,肺部表现为炎症细胞浸润和肺实质水肿,局部出血,细胞肿胀变圆,肺泡腔结构消失,充满了巨大的水肿液和纤维状蛋白质。图1.8肝组织病理切片(200×)Fig1.8Livertissuepathologicalsection图1.9肺组织病理切片(200×)Fig1.9Lungtissuepathologicalsection27 正文3.讨论VZV是水痘和带状疱疹的病原体。最初VZV感染被认为是通过呼吸道飞沫或脱落的水痘病灶吸入,亦或与患者的水泡液直接接触而发生[37]。SVV,作为VZV的同源物,概括了人类急性和潜伏性感染VZV的标志。SVV可以在自然界中非人灵长类动物的宿主进行研究[38,39],并已被用于研究与免疫抑制相关联的激活[40],因此SVV的研究对人类水痘的感染有重要意义。近年来发展迅速的二代测序技术,为我们探究未知病原体的检测带来了革命性的新思路。宏基因组测序是一种不依赖培养,可对环境样本中的总体微生物的核酸进行测序的方法,能够在复杂样本中鉴定病原体构成[41],从而避免了在培养过程中因污染所带来的偏差。典型的例子是在脑炎的诊断中,即时是经过PCR技术的广泛筛查后,仍有高达60%-75%的病例是由以往未曾出现过的病原体导致的[42-44]。造成这个情况的因素有很多,以脑炎为例,病原体或许是一种此前被认为与脑炎无关的微生物,甚至是完全未知的微生物。在这些案例中,需要一种随机的,不依赖序列信息即所谓的通用的“放大策略”,以完成对新型病原体基因组的分析,进而发现新型病原体[45]。基于病毒宏基因组的技术,本研究中在IonTorrentPGM二代测序平台上,借助高通量DNA测序技术来检测绿猴组织样品中病原体,并使用生物信息学分析了测序数据的病毒组学,包括基因组的注释、遗传进化分析等。病毒宏基因组学作为一种非培养的检测手段,已被广泛应用到临床医学中。宏基因组学在各种类型的样品中鉴定新病毒的成功,为公众健康和预防传染病开辟了新的领域。4.结论本实验测序共产生674Mb总原始测序数据,reads数为4.76M条,经序列拼接,我们得到了约124kb的病毒全基因组序列。通过序列比对,猴水痘带状疱疹病毒与GenBank上现存的Cercopithecineherepesvirus9具有超过98%的同源性。引物根据高通量测序拼接的基因组设计,然后用qPCR定量检测组织样品和病毒纯培养物的病毒含量,肝脏、肺脏和病毒培养物的CT值分别为23、20和16,这些数据表示SVV确实存在于两个组织中,且病毒培养物的病毒含量升高。结合临床症状及病理学检查,此次疫情与之前报道的SVV在恒河猴体内的免疫反应相似[46],其结果暗示SVV病毒感染和死亡之间的关系,由上述所有数据和结果推断,造成此次非洲绿猴死亡的病原体是猴水痘带状疱疹病毒。28 正文第二章未知细菌感染的高通量测序筛查与确认新发传染病中,一类为病毒引发的传染病,还有一类为细菌引起的感染。由细菌感染引起的细菌性腹泻、人感染猪链球菌病等传染病的发病率近年来呈现抬头趋势,而耐药菌的出现更是增加了感染性疾病治愈的难度,已成为全球性的卫生健康问题,甚至可能引起严重的社会问题。细菌和病毒结构上存在显著的差异,病毒没有细胞结构,而细菌由细胞壁、细胞膜、核质体、细胞质等结构构成,因而实验过程中处理不同类型的标本也应采取不同的方法。常规的病原微生物检测手段主要是培养和分离方法,只能针对已知的病原微生物进行检测。然而实际上,有99%的细菌微生物在现有条件下是无法进行培养分离的[47]。这就需要我们开拓一种全新的方法针对新发的各类动物感染进行快速有效的诊断和预防。某实验动物中心在动物实验时,发现一例食蟹猴非正常死亡,死亡原因未知,怀疑微生物感染,本研究采取高通量测序技术对未知病原体进行检测。食蟹猴,又称长尾猕猴,其基因组与人类基因组高度相似,常在医学等科研领域作实验用,但其资源稀缺因此十分珍贵[48]。在本次研究中,我们收集了死亡食蟹猴的大脑、小脑组织,首先使用转录组测序技术(RNA-seq)尝试寻找脑组织中的病毒,测序数据与病毒库比对后,未发现可靠的致病病毒。随后利用16SrDNA测序技术分析组织中的细菌菌群结构,比较了不同组织间菌落多样性的差异,以期能为我们发现导致食蟹猴死亡的因素提供线索。最后通过脑组织中细菌的纯培养,筛选出2株可能的致病菌,并对其进行全基因组测序,分析基因组中可能存在的毒力基因和耐药基因,最后用动物实验验证2株细菌的毒力。1.材料和方法1.1实验材料1.1.1样品采集及处理样品为某动物中心死亡食蟹猴,解剖后记录大体病变,采集适当大小的大脑和小脑组织,保存于10%福尔马林固定24h后进行病理组织切片检查,另外的脑组织样品取出后于碎冰中保存运输,运至实验室进行下一步处理。1.1.2主要仪器病理切片所需手动切片机、自动烘片机、恒温展片机购自德国Leica公司;观察及采图用数码显微镜OLYMPUSU-SRG购自日本OLYMPUS公司;组织匀浆仪TissueLyserII购自德国Qiagen公司;29 正文分光光度计NanoDrop2000购自美国ThermoScientific公司;文库片段质量鉴定Agilent2100Bioanalyzer购自美国AgilentTechnologies公司;高通量测序仪IonTorrentPGM购自美国LifeTechnologies公司;高通量测序仪MiSeq购自美国Illumina公司;1.1.3试剂及耗材甲醛、各梯度浓度酒精、二甲苯、石蜡油、盐酸酒精、苏木素染液、伊红染液、中性树胶等购自国药集团化学试剂有限公司;RocheHighPureViralRNAKit、RocheHighPCRTemplatePreparationKit购自瑞士Roche公司;MicrobiomeDNAEnrichmentKit、FastDNA(Fragmentation&)LibraryPrepSetforIonTorrent™购自美国NewEnglandBiolabs公司;LifeIonTotalRNA-SeqKitv2、IonOneTouch™200/400TemplateKitv2DL、IonPGM™Sequencing200/400Kitv2、Ion318chip购自美国LifeTechnologies公司;AMPureXPbeads购自美国BeckmanCoulter公司;DNAHighSensitivityDNAKit购自美国AgilentTechnologies公司;QubitdsDNAHSAssayKit、DynabeadsMyOneStreptavidinC1Magnetic、ChargeSwitch®gDNAMiniTissueKit购自美国Invitrogen公司;Nextera®MatePairSamplePreparationKit、MiSeqReagentKitv2购自美国Illumina公司;2×EasyTaq®PCRSuperMix、DNAMarker购自北京全式金生物技术有限公司;QIAquickGelExtractionKit购自德国Qiagen公司;细菌16SrDNAV1-V2高变区PCR引物27F:5’-AGRGTTYGATYMTGGCTCAG-3’,338R:5’-TGCTGCCTCCCGTAGGAGT-3’;细菌16SrDNA全长PCR通用引物27F:5’-AGAGTTTGATCMTGGCTCAG-3’,1492R:5’-TACGGYTACCTTGTTACGACTT-3’[49],上述引物由北京诺赛基因合成。1.2组织切片的制备和观察用10%甲醛溶液固定组织24h后,按照常规方法制作石蜡包埋切片,切片厚度约5µm。切片采用HE染色,最后用OLYMPUSU-SRG数码显微镜观察并采图。30 正文1.3样本前期制备从食蟹猴大脑、小脑组织各切取约0.1g分别置于2mL离心管,加入1mLPBS缓冲液及1粒钢珠,置于组织匀浆仪30Hz匀浆3min,16000×g离心5min,取上清经0.22μmPVDF离心过滤管过滤,得到的过滤液用于病毒核酸的提取;取沉淀用200µLPBS缓冲液重悬,用于细菌总核酸提取。1.4微生物的核酸提取1.4.1病毒总核酸提取用RocheHighPureViralRNAKit,按照说明书提取脑组织中的病毒总核酸:两样品分别取200µL过滤后的匀浆上清,先加入BindingBuffer和CarrierRNA裂解病毒,然后加入InhibitorRemovalBuffer除去可能干扰下游实验的抑制剂以确保提取的特异性、敏感性和可重复性,再用WashBuffer洗去盐、蛋白质和其他细胞污染物等杂质,最后用20µL无核酸酶水洗脱病毒核酸。提取的病毒核酸用Qubit2.0分别检测DNA和RNA的浓度,再用NanoDrop2000检测核酸的纯度。1.4.2细菌总核酸提取按照RocheHighPCRTemplatePreparationKit说明书提取脑组织中的细菌总核酸,并对部分步骤进行改进:1)向两样品的沉淀悬浊液中分别加10µL溶菌酶(50mg/ml)及20µL溶葡酶(2mg/mL),混匀后于37℃孵育30min;2)加入200µLBindingBuffer,80µL蛋白酶K,迅速混匀后于70℃孵育15min;3)加100µL异丙醇并充分混匀,将混合液加至过滤管中,8000×g离心1min,弃收集管并换新收集管;4)向过滤管加500µLInhibitorRemovalBuffer,8000×g离心1min,弃滤液换新收集管;向过滤管加500µLWashBuffer,8000×g离心1min,弃滤液换新收集管;重复上述步骤一次,最大转速离心10s以彻底除去残留乙醇;5)将过滤管置于一个新的1.5ml离心管中,加50µL70℃预热的无核酸酶水,8000×g离心1min洗脱DNA。6)提取的细菌核酸用Qubit2.0检测DNA浓度,再用NanoDrop2000检测核酸纯度。1.4.3细菌核酸的富集31 正文用NEBNext®MicrobiomeDNAEnrichmentKit从污染宿主的DNA中富集微生物DNA,操作流程如图2.1所示:1)第一步准备MBD2-Fc-boundmagnrticbeads:首先取1partBind/washBuffer(5×)加4parts无核酶水,配置好的1×Bind/washBuffer放于冰上。然后每管加16µLMBD2-Fcprotein及160µLProteinAMagneticBeads,用枪吹打数次混匀后,将Bead-protein混合物置于totatingmixer混合10min。微离小管,在magneticrack放2-5min至液体澄清,小心弃上清,加1mL1×Bind/washBuffer清洗beads,用枪吹打数次混匀后,将beads置于totatingmixer混合3min。微离小管,在magneticrack放2-5min至液体澄清,小心弃上清,重复清洗beads一次。将小管从rack上取下,加160µL1×Bind/washBuffer重悬beads,枪吹打数次混匀。2)第二步捕捉宿主的甲基化DNA:加1µgDNA至含160µLMBD2-Fc-boundmagnrticbeads的管内。根据DNA样品投入的体积,按比例加5×Bind/washBuffer,至终浓度为1×。室温下于totatingmixer孵育15min。3)第三步收集富集的微生物DNA:孵育过DNA和MBD2-Fc-boundmagnrticbeads后,微离小管,在magneticrack放置5min至液体澄清。用枪小心取出上清,置于一新的1.5mL离心管,此上清包含目标微生物DNA。样品可冻存于-20℃或直接进行纯化。4)第四步纯化样品:在样品中加1.8×体积的AgencourtAMPureXPbeads,用枪吹打混匀,在室温下孵育5min。秒离离心管,在magneticrack放置5min至液体澄清。吸弃上清,离心管留在磁力架上,加400µL新配的80%乙醇。离心管留在磁力架上时,旋转90°,当beads收集到离心管对侧后,再旋转90°,并重复上述步骤一次再旋转离心两次。待液体澄清后,吸弃上清,用80%乙醇重新清洗一遍beads。微离离心管,放回磁力架,用移液器移除残留的乙醇,离心管留在磁力架上,打开管盖,室温下干燥5min至乙醇全部挥发。用50µL0.1×TEBuffer重悬beads。微离离心管,放回磁力架,收集的上清即为富集的样品,可用于NGS文库构建。32 正文图2.1NEBNext微生物DNA富集试剂盒操作流程Fig2.1TheworkflowofNEBNextMicrobiomeDNAEnrichmentKit1.5RNA测序文库构建及测序1.5.1RNA文库构建取1.4.1提取的病毒核酸,使用LifeIonTotalRNA-SeqKitv2构建RNA测序文库,具体步骤为:1)打断RNA:首先投入10µL病毒RNA,用1μLRNaseIII酶切法随机打断RNA,反应条件为37℃孵育3min。2)杂交反应:用5μLNucleicAcidBindingBeads及90μLBindingSolutionConcentrate纯化片段化的RNA后,加2μLIonAdaptorMixv2和3μLHybridizationSolution,65℃10min,30℃5min,随即加入8μLHybridizationreaction和2μLLigationEnzymeMix,30℃孵育1h为RNA片段连接测序接头和杂交反应。3)反转录:加8μLIonRTPrimerv2和4μL10×SuperScript®IIIEnzymeMix进行反转录,反应条件为42℃30min。4)PCR扩增:用5μLbeads和120μLBindingSolutionConcentrate纯化cDNA后,加入45μLPlatinum®PCRSuperMixHighFidelity进行PCR扩增,扩增条件:94℃2min;94℃30s、50℃30s、68℃30s,2个循环;94℃30s、62℃30s、68℃30s,14个循环;68℃5min。5)文库质检:扩增产物用5μLbeads纯化后,文库浓度使用Qubit2.0进行准确定量,最后使用Bioanalyzer2100评估构建的文库质量及片段大小。33 正文1.5.2EmulsionPCR使用IonOneTouch™200TemplateKitv2DL进行模版的制备,具体步骤:取25pM文库,向其中加入500µLIonOneTouch™2×ReagentMix,100µLIonOneTouch™EnzymeMix,280µLNuclease-FreeWater,最后加入100µL彻底涡旋混匀的IonOneTouch™200IonSphere™Particles。将混合物加入反应管中,分两次共补充1.5mLReactionOil,将反应管安装到IonOneTouch™DLConfiguration上进行ISPs富集,反应结束后使用IonSphereQualityControlKit测评ISPs活性。1.5.3上机测序OneTouch结束后,在IonOneTouch™ES上完成ISPs富集。得到的样品使用IonPGM™Sequencing200Kitv2进行测序,将富集的ISPs加载到Ion318chip,运行PGM测序仪500个循环反应。1.5.4生物信息学筛查病原体测序序列与本地nt库进行BLAST2.2.30+比对,本地数据库的病毒基因组参考序列均来自NCBI。比对结果显示出的所有病毒,还要使用此病毒序列与NCBI网站(http://blast.ncbi.nlm.nih.gov)上的nt库重新BLAST,以证实鉴定结果。1.616SrDNAV1-V2区扩增采用细菌16SrDNAV1-V2区引物27F/338R,对已富集的细菌基因组DNA进行PCR扩增。扩增体系:25µL2×EasyTaq®PCRSuperMix,1µLDNA模板,上下游引物各1µL,无核酸酶水补至50µL。PCR扩增条件为:94℃5min;94℃30s、55℃30s、72℃1.5min,35个循环;72℃7min。用1%琼脂糖凝胶电泳鉴定扩增效果,并使用QIAquickGelExtractionKit回收纯化目的条带。1.7组织的宏基因组测序1.7.1DNA文库构建扩增后的产物使用NEBNext®FastDNALibraryPrepSetforIonTorrent™构建测序文库,具体步骤:取150ng扩增并纯化的微生物DNA,直接用NEBNextEndRepairEnzymeMix进行末端补平,然后添加NEBNextDNALibraryAdaptorsforIonTorrent测序接头,再用E-GelSizeSelect选取400-500bp片段,之后进行PCR扩增,扩增条件:98℃30s;98℃10s、58℃30s、72℃30s,10个循环;72℃5min。测序文库的浓度使用Qubit2.0进行准确定量,最后使用Bioanalyzer2100评估文库的片段大小及分布。34 正文1.7.2IonOneTouch及ES使用IonOneTouch400TemplateKitv2DL完成模版制备,在IonOneTouch™DLConfiguration上进行ISPs富集,OneTouch结束后用IonSphereQualityControlKit评估ISPs活性,并在IonOneTouch™ES上完成ISPs富集。1.7.3IonTorrentPGM上机测序使用IonPGMSequencing400Kit进行测序,将富集的ISPs加载到Ion318chip,运行PGM测序仪反应850个循环。1.7.4宏基因组的生物信息学分析使用NGSQCToolkitv2.3.3[50]软件去除低质量及低复杂度序列,过滤后的序列再使用QIIMEversion1.2.0软件[51],将相似度大于0.97的序列归为1个操作分类单元(operationaltaxonomicunit,OTU),BLAST算法比对GreengenesreferenceOTUdatabase进行OTU的注释[52],完成物种组成和在界、门、纲、目、科、属、种水平的分类分析。1.8细菌纯培养及鉴定1.8.1细菌纯培养取1.3步用PBS缓冲液重悬的沉淀物,两组织各吸取100µL均匀涂布于哥伦比亚血琼脂平板,37℃恒温箱培养48h。每份样本选取30个单菌落,采取平板连续划线法,经培养后,在平板表面得到分散的单菌落,即细菌的纯培养物。1.8.2细菌鉴定参照Invitrogen™ChargeSwitch®gDNAMiniTissueKit说明书进行细菌基因组提取,再利用一代测序的方法测定细菌16SrDNA序列,完成对分离细菌的种属鉴定。采用细菌16SrDNA全长通用引物27F/1492R,对细菌基因组DNA进行PCR扩增。扩增体系:2×EasyTaq®PCRSuperMix25µL,DNA模板1µL,上下游引物各1µL,无核酸酶水补至50µL。PCR扩增条件为:94℃5min;94℃30s、55℃30s、72℃1.5min,35个循环;72℃7min。1.9细菌的全基因组测序1.9.1基因组Shotgun测序Shotgun测序文库构建与测序方法与第一章1.5方法一致,文库制备使用NEBNext®FastDNAFragmentation&LibraryPrepSetforIonTorrent™试剂盒,测序使用IonPGM™System。35 正文1.9.2Mate-pair文库构建使用IlluminaNextera®MatePairSamplePreparationKit试剂盒,采取Gel-Free方法进行Mate-pair文库制备,具体步骤如下:1)投入4µg细菌基因组DNA,加4µLMatePairTagmentEnzyme随机打断DNA片段;2)第二步加2.5µLStrandDisplacementEnzymeMix完成链置换反应;3)第三步用40µLAMPureXPBeads纯化上步DNA后,加7µLCircularizationLigase进行环化反应,再用9µLExonuclease消化未完成环化的线性DNA;4)第四步使用Bioruptor®UCD-200超声仪打断环化DNA,再用20µLDynabeadsM-280StreptavidinMagneticBeads吸附用生物素标记的DNA片段;5)第五步加40µLEndRepairMix对超声打断的DNA进行末端修复,再用12.5µLA-TailingMix为DNA片段加A尾;6)第六步用2.5µLLigationMix和1µLDNAAdapterIndex添加测序接头序号;7)第七步使用25µLPCRMasterMix进行PCR扩增反应,引物为5µLPCRPrimerCocktail,扩增条件:98℃30s;98℃10s、60℃30s、72℃30s,15cycles;72℃5min,纯化后的PCR产物即为构建完成的Mate-pair文库。8)文库的浓度使用Qubit2.0进行精准定量,最后用Bioanalyzer2100评估文库的片段大小及质量。1.9.3Illumina上机测序使用MiSeqReagentKitv2试剂盒,在IlluminaMiseq平台完成测序反应,测序片段长度为2×250bp,运行时间约40h。1.9.4全基因组拼接及分析测序后使用Newblerv2.9组装软件对巨型球菌和巴黎链球菌测序数据进行组装,使用Newbler的referenceassembly功能,借助参考序列填补gap,得到细菌基因组全序。用RASTv2.0(rast.nmpdr.org)对全基因组进行注释,利用DNAPlotter1.11软件,绘制细菌全基因组图谱。提取注释中的CDS序列,用BLAST与本地毒力基因库、耐药基因库进行比对,发现可能存在的毒力、耐药基因。36 正文1.10动物实验使用BHI培养液培养纯培养的细菌,37℃220rpm摇菌约5h,菌液稀释-1-510-10五个梯度,分别取100µL稀释液涂BHI平板,每个梯度做3个重复,采用平板菌落计数法制作菌体计数的标准曲线;再采用比浊计数法测定细菌的数量,紫外分光光度计测菌液OD值,用标准曲线计算出对应的菌数。6取100µL菌液(细菌个数为2.6×10个),5000rpm离心2min,弃去上清,-15-2用20µLPBS重悬,并梯度稀释10(细菌个数为2.6×10个)及10(细菌个4数为2.6×10个)倍,进行小鼠颅内注射。取非致病的大肠工程菌做阴性对照。小鼠选用无特定病原体动物级(specificpathogenfree,SPF)BALB/c小鼠,雌性,2周龄,体重约15g左右,随机分成3组,每组3只,注射后24小时,统计小鼠的死亡情况。2.实验结果2.1病理学检查2.1.1临床症状与大体病变病猴精神沉郁、呆立、轻微嗜睡,偶见抽搐等神经症状;剖检可见,脑组织脑膜血管增粗,多处淤血,脑皮质肿胀,脑沟变浅,脑回表面湿润,其余脏器无明显异常。2.1.2组织病理学观察组织病理学观察表明,大脑皮质小胶质细胞增生并可见噬神经现象(图2.2A白色箭头所指),个别神经元胞体空泡变性(图2.2A黑色箭头所指);小脑浦肯野细胞胞体空泡化(图2.2B白色箭头所指),颗粒细胞减少(图2.2B黑色箭头所指)。AB图2.2死亡食蟹猴脑组织的病理组织学检查(A和B,200×)Fig2.2Histopathologicalexaminationofdeadcynomolgusmonkey’sbrain(AandB,200×)37 正文2.2微生物核酸质检2.2.1病毒总核酸使用RocheHighPureViralRNAKit试剂盒提取的病毒基因组RNAOD260/OD280为2.0,提示RNA未被蛋白质或酚等污染,OD260/OD230也高于2.0,提示RNA未被碳水化合物、盐类或有机溶剂等污染,上述两个比值均处于正常范围内,说明提取的RNA较纯。使用Qubit2.0检测RNA浓度,大脑、小脑的RNA浓度分别为12.8ng/µL、116ng/µL,满足构建RNA文库的需求。2.2.2细菌总核酸提取细菌总核酸后,再用NEBNext®MicrobiomeDNAEnrichmentKit富集微生物DNA,检测DNAOD260/OD280为1.9,提示DNA未被蛋白质或酚等影响,OD260/OD230高于2.0,证明DNA未被一些碳氢化合物、盐类或有机溶剂等污染,两个比值均处于正常范围内,认为制备的DNA较纯。使用Qubit2.0检测DNA浓度,大脑、小脑的DNA浓度分别为9.26ng/µL、4.04ng/µL,满足构建DNA文库的需求。2.3RNA-seq2.3.1RNA文库质检将制备好的RNA文库稀释至约200ng/µL,取1µL加载到高灵敏2100芯片,使用Bioanalyzer2100对文库进行片段大小及浓度的鉴定。RNA文库理想平均片段大小为100bp-300bp,结果如图2.3、图2.4所示,大脑组织RNA文库稀释20倍后片段长度为97bp-248bp,浓度为221.77pg/µL;小脑组织RNA文库稀释30倍后片段长度为178bp-249bp,浓度为119.59pg/µL,满足测序要求。38 正文图2.3大脑组织RNA文库稀释20倍鉴定结果Fig2.3SizedistributionsandyieldsofcerebrumRNAlibrary图2.4小脑组织RNA文库稀释20倍鉴定结果Fig2.4SizedistributionsandyieldsofcerebellumRNAlibrary39 正文2.3.2测序结果及生物信息学分析本次样本检测共构建2个测序文库,共生成476Mb的测序原始数据,≥Q20数据量为413Mb,大脑、小脑产生的序列条数分别为1967099条和947112条,序列平均长度约165bp,可以进行后续的数据分析。测序得到的原始数据首先使用Bowtie2软件过滤宿主序列,然后与本地nt库进行BLAST2.2.30+比对筛查样本中的未知病原体,未找到可靠的致病病毒,但发现一株微球菌属细菌,这提示我们此食蟹猴可能由细菌感染而死亡。2.416SrDNA的V1-V2高变区扩增大脑、小脑组织样品V1-V2高变区得到较好的扩增,见图2.5,扩增条带单一,片段大小集中在310bp范围,与预期的目的条带大小一致;PBS阴性对照孔未出条带,可见扩增过程中无其他杂菌污染,可进行后续实验。图2.5样品16SrDNA的V1-V2高变区扩增电泳结果Fig2.5AmplificationofV1-V2hypervariableregioninbrainsamplesbyPCR2.5宏基因组测序2.5.1DNA文库质量评估鉴定文库的片段分布,理想平均片段应满足下列要求:长度为400bp-500bp,小于350bp的小片段占比小于10%,Agilent2100电泳结果峰形相对集中。如图2.6所示,文库片段大小为432bp,稀释50倍后浓度为164.24pg/µL,可以进行下步测序。40 正文图2.6DNA文库2100电泳鉴定图Fig2.6ThesizedistributionofDNAlibrary2.5.2测序结果概述本次测序构建1个测序文库,共生成238Mb的测序原始数据,≥Q20数据量为192Mb,大脑、小脑产生的序列条数分别为234253条和161061条,序列平均长度约250bp,可以进行后续的数据分析。2.5.3物种丰度分析基于2份样品的OTU结果,计算丰富度指数(Chao、Ace)、覆盖率指数(goods_coverage)和多样性指数(Simpson、Shannon),评估每个个体和总文库的多样性,详见表2.1:表2.1样品Alpha多样性指数Table2.1AlphadiversityindexofeachsampleSampleACEchao1goods_coverageshannonsimpson大脑7836.233427338.4383900.9645536097.7864641740.905778121小脑8856.994598732.6639680.9604289738.7142785460.99448720141 正文2.5.4样品细菌群落结构分析在门(Phylum)水平上,检出的细菌分为18个门,经过统计,主要分布于6个门,见图2.7,分别是厚壁菌门(Firmicutes)、拟杆菌门(Bacteroidetes)、变形菌门(Proteobacteria)、螺旋体门(Spirochaetes)、黏胶球形菌门(Lentisphaerae)和放线菌门(Actinobacteria)。在大脑和小脑组织中,各门类的细菌分布虽有差异,但均集中于厚壁菌门、拟杆菌门和变形菌门,这三种菌的总含量分别占大脑、小脑检出菌相对含量的78.1%和82.4%。图2.7样品在门水平的细菌组成Fig2.7Bacteriastructuresofsamplesinphylumlevel同时在科(Family)水平上统计了两组样本的菌群构成状况,如图2.8所示,含量排前十位的科包括以下:拟杆菌门下的普雷沃氏菌科(Prevotellaceae)、准普雷沃菌科(Paraprevotellaceae),变形菌门下的鞘氨醇单胞菌科(Sphingomonadaceae)、假交替单胞菌科(Pseudoalteromonadaceae),厚壁菌门下的链球菌科(Streptococcaceae)、瘤胃菌科(Ruminococcaceae)、乳杆菌科(Lactobacillaceae),螺旋体门下的螺旋体科(Spirochaetaceae),梭杆菌门下的梭杆菌科(Fusobacteriaceae)、放线菌门下的棒状杆菌科(Corynebacteriaceae)等。42 正文图2.8样品在科水平的细菌组成Fig2.8Bacterialcompositionofsamplesinfamilylevel在属(Genus)水平下,进一步统计了两组样本中均出现的菌属及含量,其中普雷沃菌属(Prevotella)平均含量达10.2%,密螺旋体属(Treponema)平均含量达3.8%,交替假单胞菌属(Pseudoalteromonas)平均含量为3.1%,链球菌(Streptococcus)平均含量为1.3%,梭杆菌属(Fusobacterium)平均含量为1.2%。宏基因组测序结果显示,病变脑组织中含有多种细菌,这些细菌可能与食蟹猴的脑组织感染有关。2.6细菌纯培养及鉴定组织均浆沉淀物涂布哥伦比亚血琼脂平板,37℃恒温培养结果如图2.9,A图为大脑组织细菌培养物,B图为小脑组织细菌培养物。经平板连续划线法,得到细菌纯培养后,用16SrDNA一代测序的方法对30个细菌单克隆进行种属鉴定,得到的双向测序数据用CLCGenomicWorkbench3.6.1软件拼接,获得完整的16SrDNA全长序列。用此序列在NCBI上进行BLASTN,比对结果发现,得到的细菌中数量最多的,一株为菌落较大、圆形、微黄色、边缘整齐的细菌,该细菌为巨型球菌(Macrococcussp.),与比对得分最高的一株菌Macrococcussp.AMGM1参考序列的identify为99%,如图2.10所示。另一株为菌落小、白色、圆形、边缘整齐的巴黎链球菌(Streptococcuslutetiensis),与比对得分最高的Streptococcuslutetiensisy10参考序列的identify为99%,如图2.11所示。43 正文AB图2.9脑组织在血平板上的细菌培养结果Fig2.9Bacterialcultureofbraintissueonbloodagarplate图2.10巨型球菌BLAST分析示意图Figure2.10TheBLASTanalysisofMacrococcussp.44 正文图2.11巴黎链球菌BLAST分析示意图Figure2.11TheBLASTanalysisofStreptococcuslutetiensis2.7全基因组测序2.7.1全基因组shotgun测序巴黎链球菌测序共得到2146372条reads,平均读长282bp,见图2.12。使用Newblerv2.9组装软件初步组装(参数默认)得到189个contigs,其中最长contig为76kb,平均覆盖深度26倍。以报道序列株Streptococcuslutetiensis033(GenBank:CP003025.1)作为参考,使用Newbler的referenceassembly功能,和本地脚本田补gap,最终得到27个长contigs。巴黎链球菌基因组与参考基因组同源性达98%,使用Mauve2.3软件对基因组进行排列比对的结果如图2.13所示:45 正文图2.12巴黎链球菌测序读长分布Fig2.12SequencingreadlengthhistogramofStreptococcuslutetiensis图2.13巴黎链球菌与参考序列的比较基因组分析Fig2.13ComparitivegenomeanalysisofStreptococcuslutetiensisandReferencesequence巨型球菌测序共得到1852989条reads,平均读长276bp,见图2.14。使用Newblerv2.9组装软件初步组装(参数默认)得到156个contigs,其中最长contig为117kb,平均覆盖深度24倍。以报道序列株Macrococcuscaseolyticus(GenBank:AP009484.1)作为参考,使用Newbler的referenceassembly功能,和本地脚本补gap,最终得到28个长contigs。GenBank上仅报道了一株巨型球菌的全基因组,即MacrococcuscaseolyticusJCSC5402,分离得到的巨型球菌基因组与GenBank上现存的参考基因组同源性仅为74%,同源性非常低,可以认为此巨型球菌为一个新种,因此考虑对此株细菌进行Mate-Pair测序,以获得完整的全基因组。使用Mauve2.3软件对基因组进行排列比对的结果如图2.15所示:46 正文图2.14巨型球菌测序读长分布Fig2.14SequencingreadlengthhistogramofMacrococcussp.图2.15巨型球菌与参考序列的比较基因组分析Fig2.15ComparitivegenomeanalysisofMacrococcussp.andReferencesequence2.7.2巨型球菌Mate-Pair测序鉴定文库的片段大小,Mate-Pair文库理想的片段长度位于500bp-800bp,Agilent2100电泳结果峰形相对集中。如图2.16所示,制备的文库实际片段大小分布在550bp-1000bp,稀释90倍后浓度为90.81pg/µL,可以进行下步测序。47 正文图2.16Mate-Pair文库2100电泳鉴定图Fig2.16ThesizedistributionofMate-PairlibraryIllumina测序结果经Newblerv2.9拼接组装,用RASTv2.0对全基因组进行注释,得到全基因组gbk格式的基因组序列,图2.17为巨型球菌基因组注释得到的子系统分布结果。利用DNAPlotter1.11软件,绘制出图2.18的巨型球菌全基因组环状示意图,分析结果显示,该基因组长度为2391704bp,最外第一、二圈紫色和蓝色分别为基因组正向和逆向编码的CDS,第三圈红色为tRNA,第四圈灰色为rRNA。GC含量为34.1%,基因组中含有2430个CDS,73个RNA,其中有10个tRNA、5个rRNA。48 正文图2.17巨型球菌RAST注释结果分布图Fig2.17SubsystemsdistributionofMacrococcussp.basedongenomeannotationsusingRASTserver图2.18巨型球菌全基因组图谱Fig2.18Macrococcussp.wholegenomemap2.7.3毒力、耐药基因分析用RASTv2.0(rast.nmpdr.org)对两株菌的全基因组进行注释,提取其中的49 正文编码序列(CodingSequence,CDS),用BLASTX与本地毒力基因库、耐药基因库进行比对,发现其中可能存在的9个毒力和6个耐药基因,再用BLASTP将毒力、耐药基因的蛋白序列与NCBI上的蛋白质库进行比对,得到表2.2和表2.3。目前细菌致病机制的研究主要集中在鉴定细菌的毒力因子,即筛选细菌感染宿主时,能够特异性表达的毒力基因,再探讨此基因与毒力蛋白之间的关系,以此来确定细菌毒力因子。表2.2列出的毒力因子,例如ATP-dependentClpproteaseproteolyticsubunit(ClpP)[53],此蛋白与线粒体基质和线粒体内膜相关联,临床表现为ClpP、ClpX、mtRNA和炎症因子的积累,炎症组织遭到破坏。细菌的耐药性可能由基因突变导致单一耐药性,或质粒赋予的多重耐药性。尝试分析基因组上整合的耐药基因,表2.3显示巨型球菌基因组中含抗四环素、氨基糖苷类、氟喹诺酮、利福平、摩雪霉素等多耐药位点相关的耐药基因。表2.2巨型球菌中可能的毒力基因Table2.2PutativevirulentgenesofMacrococcussp.VirulencegeneVirulencefactorStartEndQuerylenTotalscoreIdentATP-dependentClpproteaseproteolyticClpP16697016752455436698%subunitATP-dependentClpproteaseClpX446270447526125673988%ATP-bindingsubunitResDDNA-bindingresponseregulator63455763526470744289%TnpATransposase768471769790132090899%Carbamoyl-phosphatesynthaselargecarB106612710693003173200492%chainPhosphoenolpyruvate-proteinPtsP114496411466731709103087%phosphotransferaseClpBClpBprotein124758112501632582147884%RadADNArepairprotein21829572184318136189794%CapsularpolysaccharidesynthesisCap5F22876372288743110651868%enzyme50 正文表2.3巨型球菌中可能的耐药基因Table2.3DrugresistancegenesofMacrococcussp.DrugresistancegeneDrugresistance-proteinQuerystartQueryendQuerylenSegscoreIdenpercentAntimicrobialResistancetetS1192619263557100%TetracyclineAminoglycosideaadE7084286493589%6-adenylyltransferasegyrAfluoroquinoloneresistant6524432664109675%rpoBFifampinresistant134593543303883%ElfamycinresistanttufA111791188142188%elongationfactorvanRGVanRG27931467562.197%2.8动物实验制作菌体计数的标准曲线后,采用比浊计数法测定细菌的数量,紫外分光光度计测菌液OD值,利用标准曲线计算出对应的菌数,菌落计数情况见表2.4。表2.4菌落计数结果Table2.4CountingofbacteriacolonyOD值CFU7巨型球菌0.82.6×107巴黎链球菌0.65.0×10BALB/c小鼠颅内注射后24h,统计小鼠的死亡情况,见表2.5。由表中数65据可见,注射细菌总量2.6×10和2.6×10个时,巨型球菌组和巴黎链球菌组的小4鼠全部死亡;注射细菌总量2.6×10个时,巨型球菌组死亡1只,巴黎链球菌组死亡2只;大肠工程菌组所有小鼠均未死亡。表2.5小鼠死亡情况统计Table2.5StatisticsondeathofBALB/cwithintracranialinjection654101010巨型球菌死亡3只死亡3只死亡1只巴黎链球菌死亡3只死亡3只死亡2只大肠工程菌未死亡未死亡未死亡51 正文3.讨论疾病的发生转归与菌群结构的变化具有密切关系。目前已经有大量研究用于描述健康人群中的微生物多样性(人类微生物组计划),这些研究发现了人体内共生微生物在个体间的差别,提出了“个体微生物组”这一新概念。特定部位中的微生物多样性,或者说是微生物的数量与分布丰度与人类的一些疾病的发生相关。例如,微生物多样性的上升与细菌性阴道炎的发生相关[54],另一方面,肥胖以及炎症性肠病患者有肠道菌群多样性下降的表现[55,56]。虽然在小鼠实验中的移植研究[57]已经证明了肠道微生物、能量代谢和肥胖之间的直接关联,但是这种因果关系在大多数人类疾病中的作用尚未被证实。为进一步探讨微生物、宿主和环境之间的相互作用,需要基于健康状态以及其他整合研究以获得更深入的微生物动力学特征。探究不同环境中(如空气,土壤,组织)菌群的构成与多样性,有助于为我们发现疾病发生发展的真面目,寻找真正的致病原因,做出正确的防治措施。随着二代测序技术的成熟和普及,人们可以不经过培养手段直接对样品进行宏基因组测序,一次获得几十万甚至几百万条DNA序列信息,对丰度极低的菌群也能进行分辨,使得短时间获取微生物群落变化成为可能。宏基因组学的研究主要有16SrDNA测序[58]和全基因组测序两种[59]。在宏基因组学测序中,16SrDNA测序是一种发展较为成熟的方法。16SrDNA由高度保守的序列和相对高变的序列相隔组成,保守区为细菌所共有,可变区在不同细菌之间存在不同程度的差异,具有属或种的特异性,主要用于样本中菌群结构和物种多样性的分析[60]。由于二代测序技术读长较短,一般在16SrDNA中选取某一段或几段高变区,利用通用引物扩增后进行测序和后续的分析[61,62]。本研究宏基因组测序结果表明,食蟹猴大脑和小脑病变组织中含有大量的细菌,主要集中在变形菌门、厚壁菌门和拟杆菌门水平上,并进一步统计了属水平上可能导致食蟹猴脑组织感染的细菌,如普雷沃氏菌属[63],该属种内的细菌可引发脓肿和软组织感染;链球菌属[64],该菌可引起人体各种化脓性炎症、脑膜炎等;螺旋体属[65],该菌属可造成肝脏和脑组织损伤;梭杆菌属[66],某些梭杆菌可导致脑脓肿等多组织感染。结合组织病理学的检查结果,食蟹猴的大脑皮质的小胶质细胞增生伴噬神经现象,小脑浦肯野细胞空泡化,提示脑组织发生了严重的感染。这些内容提示导致食蟹猴死亡可能是由于致病微生物的感染作用。全基因组测序对全面了解一个物种的遗传进化、基因组特征和调控机制等有非常重要的意义。例如重组在沙眼衣原体的基因组中广泛存在,全基因组测序是了解其演变、多样性和流行病学的必要手段。临床拭子中沙眼衣原体DNA的水52 正文平通常非常低,并有大量微生物和人类DNA的污染。2013年Seth-Smith等人[67]结合IMS和MDA方法进行全基因组扩增,并通过Illumina高通量测序,首次直接从临床样品获得细菌全基因组序列,研究者认为该方法可以用于从非培养样本中测得基因组数据。本研究对从脑组织中分离培养的两株细菌进行Shotgun测序和Mate-Pair测序,获得其全基因组序列,并筛选了基因组上可能存在的毒力、耐药基因,最后用动物实验验证了二者的毒力。4.结论本次研究所使用的样本来自死亡食蟹猴的病变脑组织,由于未知的感染导致其死亡。因此需要借助快速有效的检测手段,帮助找寻食蟹猴的死因。直接对病变脑组织样品进行细菌核酸提取和16SrDNA的V1-V2区扩增宏基因组学测序及生物信息学分析,在不依赖培养手段的情况下,短时间内获取了病变脑组织的菌群构成。研究表明,食蟹猴大脑和小脑病变组织中存在细菌,在属水平上可能导致食蟹猴脑组织感染的细菌,有普雷沃氏菌属、链球菌属、螺旋体属、梭杆菌属等,结合组织病理学的检查结果,提示导致食蟹猴死亡可能是由于致病细菌的感染作用。然后,对脑组织匀浆物分离培养得到的巨型球菌和巴黎链球菌进行Shotgun全基因组测序,其中巴黎链球菌测序数据经过拼接获得27个contigs,与参考序列Streptococcuslutetiensis033(GenBank:CP003025.1)同源性达98%;巨型球菌测序数据拼接后得到28个contigs,与参考序列Macrococcuscaseolyticus(GenBank:AP009484.1)比对,发现其同源性仅为74%,认为此巨型球菌为一个新种,于是对其基因组进行Mate-Pair测序,获得基因组全序,全长为2391704bp,借助RAST注释发现了其中疑似的ClpP、ClpX、ResD等9个毒力基因,以及抗四环素、氨基糖苷类、氟喹诺酮、利福平等6个耐药基因。最后通过动物实验证明了2株菌潜在的致病性,进行小鼠颅内注射均可导致小鼠死亡。以上研究结果可能均与食蟹猴的死亡相关,但具体的疾病发生过程以及致死机制的阐明仍需要后续的深入研究。53 全文总结全文总结本研究利用二代测序技术和生物信息学分析手段,基于宏基因组和全基因组分析开展病原体的检测和未知病原体鉴定研究,具有传统方法不可比拟的通量高且不依赖已知序列的优势,为未知病原体的鉴定提供新思路和新方法。利用深度测序数据结合生物信息学分析,鉴定重要病原体的基因组特征和变异,从而了解这些病原体的变异、进化、致病性、耐药性等,发现病原菌的毒力基因、耐药耐药基因,为临床筛查和确认未知病原体提供具有实际意义的理论依据。本课题的主要研究成果如下:1、建立病毒性、细菌性未知感染的高通量测序筛查方法,并通过筛查结果指导分离培养及病原体确认。2、对未知病毒的筛查,以非洲绿猴为例,直接从死亡绿猴的肝肺组织中筛查到猴疱疹病毒,得到此株疱疹病毒的124kb的全基因组,并对此病毒进行注释和遗传进化分析,最后用实时定量PCR对筛查结果进行验证,确认此次绿猴死亡的致死病原体为猴水痘带状疱疹病毒。3、对于未知致病菌的筛查,以食蟹猴为例,利用宏基因组测序直接对死亡食蟹猴的脑组织进行感染菌的分析,并对其中的巴黎链球菌和巨型球菌进行Shotgun测序和Mate-Pair大片段库测序,分析2株菌的比较基因组、毒力基因、耐药基因,最后用动物实验验证2株细菌均有致死性。4、对食蟹猴的脑组织细菌进行分离培养,发现一个巨型球菌的新种,此细菌基因组与GenBank上现存的参考基因组同源性仅为74%。54 参考文献参考文献1.SchusterSC:Next-generationsequencingtransformstoday’sbiology.Nature2007,200(8):16-18.2.SultanM,SchulzMH,RichardH,MagenA,KlingenhoffA,ScherfM,SeifertM,BorodinaT,SoldatovA,ParkhomchukD:Aglobalviewofgeneactivityandalternativesplicingbydeepsequencingofthehumantranscriptome.Science2008,321(5891):956-960.3.BrennerS,JohnsonM,BridghamJ,GoldaG,LloydDH,JohnsonD,LuoS,McCurdyS,FoyM,EwanM:Geneexpressionanalysisbymassivelyparallelsignaturesequencing(MPSS)onmicrobeadarrays.Naturebiotechnology2000,18(6):630-634.4.BilgüvarK,ÖztürkAK,LouviA,KwanKY,ChoiM,TatlıB,YalnızoğluD,TüysüzB,ÇağlayanAO,GökbenS:Whole-exomesequencingidentifiesrecessiveWDR62mutationsinseverebrainmalformations.Nature2010,467(7312):207-210.5.NgSB,BighamAW,BuckinghamKJ,HannibalMC,McMillinMJ,GildersleeveHI,BeckAE,TaborHK,CooperGM,MeffordHC:ExomesequencingidentifiesMLL2mutationsasacauseofKabukisyndrome.Naturegenetics2010,42(9):790-793.6.WortheyEA,MayerAN,SyversonGD,HelblingD,BonacciBB,DeckerB,SerpeJM,DasuT,TschannenMR,VeithRL:Makingadefinitivediagnosis:successfulclinicalapplicationofwholeexomesequencinginachildwithintractableinflammatoryboweldisease.GeneticsinMedicine2011,13(3):255-262.7.YangY,MuznyDM,ReidJG,BainbridgeMN,WillisA,WardPA,BraxtonA,BeutenJ,XiaF,NiuZ:Clinicalwhole-exomesequencingforthediagnosisofmendeliandisorders.NewEnglandJournalofMedicine2013,369(16):1502-1511.8.LawrenceMS,StojanovP,MermelCH,RobinsonJT,GarrawayLA,GolubTR,MeyersonM,GabrielSB,LanderES,GetzG:Discoveryandsaturationanalysisofcancergenesacross21tumourtypes.Nature2014,505(7484):495-501.9.HuangFW,HodisE,XuMJ,KryukovGV,ChinL,GarrawayLA:HighlyrecurrentTERTpromotermutationsinhumanmelanoma.Science2013,339(6122):957-959.10.NavinN,KendallJ,TrogeJ,AndrewsP,RodgersL,McIndooJ,CookK,StepanskyA,LevyD,EspositoD:Tumourevolutioninferredbysingle-cellsequencing.Nature2011,472(7341):90-94.11.WangY,WatersJ,LeungML,UnruhA,RohW,ShiX,ChenK,ScheetP,VattathilS,LiangH:Clonalevolutioninbreastcancerrevealedbysinglenucleusgenomesequencing.Nature2014,512(7513):155-160.12.DingL,LeyTJ,LarsonDE,MillerCA,KoboldtDC,WelchJS,RitcheyJK,YoungMA,LamprechtT,McLellanMD:Clonalevolutioninrelapsedacutemyeloidleukaemiarevealedbywhole-genomesequencing.Nature2012,481(7382):506-510.55 参考文献13.VanAllenEM,WagleN,SuckerA,TreacyDJ,JohannessenCM,GoetzEM,PlaceCS,Taylor-WeinerA,WhittakerS,KryukovGV:ThegeneticlandscapeofclinicalresistancetoRAFinhibitioninmetastaticmelanoma.Cancerdiscovery2014,4(1):94-109.14.ChiuCY:Viralpathogendiscovery.Currentopinioninmicrobiology2013,16(4):468-478.15.ChevalJ,SauvageV,FrangeulL,DacheuxL,GuigonG,DumeyN,ParienteK,RousseauxC,DorangeF,BerthetN:Evaluationofhigh-throughputsequencingforidentifyingknownandunknownvirusesinbiologicalsamples.Journalofclinicalmicrobiology2011,49(9):3268-3275.16.BrownJR,MorfopoulouS,HubbJ,EmmettWA,IpW,ShahD,BrooksT,PaineSM,AndersonG,VirasamiA:AstrovirusVA1/HMO-C:anincreasinglyrecognizedneurotropicpathogeninimmunocompromisedpatients.ClinicalInfectiousDiseases2015,60(6):881-888.17.NaccacheSN,PeggsKS,MattesFM,PhadkeR,GarsonJA,GrantP,SamayoaE,FedermanS,MillerS,LunnMP:Diagnosisofneuroinvasiveastrovirusinfectioninanimmunocompromisedadultwithencephalitisbyunbiasednext-generationsequencing.ClinicalInfectiousDiseases2015,60(6):919-923.18.QuanP-L,WagnerTA,BrieseT,TorgersonTR,HornigM,TashmukhamedovaA,FirthC,PalaciosGF,Baisre-deLeonA,PaddockCD:AstrovirusencephalitisinboywithX-linkedagammaglobulinemia.Emerginginfectiousdiseases2010,17(6):918-925.19.WunderliW,MeerbachA,GuengoerT,BergerC,GreinerO,CaduffR,TrkolaA,BossartW,GerlachD,SchiblerM:Astrovirusinfectioninhospitalizedinfantswithseverecombinedimmunodeficiencyafterallogeneichematopoieticstemcelltransplantation.PloSone2011,6(11):e27483.20.EvelineK,JónsdóttirHR,DoreenM,HammingOJ,RuneH,ReguloR,RobertG,FouchierRAM,ChristianD,MüllerMA:EfficientreplicationofthenovelhumanbetacoronavirusEMConprimaryhumanepitheliumhighlightsitszoonoticpotential.Mbio2013,4(1):169-172.21.SnyderM,DuJ,GersteinM:Personalgenomesequencing:currentapproachesandchallenges.Genes&development2010,24(5):423-431.22.ZookJM,SalitM:Genomesinabottle:creatingstandardreferencematerialsforgenomicvariation-why,whatandhow?Genomebiology2011,12:1-27.23.BrownsteinCA,BeggsAH,HomerN,MerrimanB,TimothyWY,FlanneryKC,DeCheneET,TowneMC,SavageSK,PriceEN:Aninternationalefforttowardsdevelopingstandardsforbestpracticesinanalysis,interpretationandreportingofclinicalgenomesequencingresultsintheCLARITYChallenge.Genomebiology2014,15(3):1-18.24.TilgnerH,JahanbaniF,BlauwkampT,MoshrefiA,JaegerE,ChenF,HarelI,BustamanteCD,RasmussenM,SnyderMP:Comprehensivetranscriptomeanalysisusingsynthetic56 参考文献long-readsequencingrevealsmolecularco-associationofdistantsplicingevents.Naturebiotechnology2015,33(7):736-742.25.SchadtEE,TurnerS,KasarskisA:Awindowintothird-generationsequencing.Humanmoleculargenetics2010:ddq416.26.KöserCU,HoldenMT,EllingtonMJ,CartwrightEJ,BrownNM,Ogilvy-StuartAL,HsuLY,ChewapreechaC,CroucherNJ,HarrisSR:Rapidwhole-genomesequencingforinvestigationofaneonatalMRSAoutbreak.NewEnglandJournalofMedicine2012,366(24):2267-2275.27.ChenR,MiasGI,Li-Pook-ThanJ,JiangL,LamHY,ChenR,MiriamiE,KarczewskiKJ,HariharanM,DeweyFE:Personalomicsprofilingrevealsdynamicmolecularandmedicalphenotypes.Cell2012,148(6):1293-1307.28.ChurchGM:Thepersonalgenomeproject.MolecularSystemsBiology2005,1(1).29.ClarksonM,ThorpeE,McCarthyK:Avirusdiseaseofcaptivevervetmonkeys(Cercopithecusaethiops)causedbyanewherpesvirus.ArchivfürdiegesamteVirusforschung1967,22(1-2):219-234.30.ArvinA,Campadelli-FiumeG,MocarskiE,MoorePS,RoizmanB,WhitleyR,YamanishiK:Humanherpesviruses:biology,therapy,andimmunoprophylaxis:CambridgeUniversityPress;2007.31.GrayWL:Pathogenesisofsimianvaricellavirus.Journalofmedicalvirology2003,70(S1):S4-S8.32.GrayWL:Simianvaricella:amodelforhumanvaricella‐zostervirusinfections.Reviewsinmedicalvirology2004,14(6):363-381.33.GrayWL,StarnesB,WhiteMW,MahalingamR:TheDNAsequenceofthesimianvaricellavirusgenome.Virology2001,284(1):123-130.34.MahalingamR,GrayWL:Thesimianvaricellavirusgenomecontainsaninvertible665basepairterminalelementthatisabsentinthevaricellazostervirusgenome.Virology2007,366(2):387-393.35.MeyerC,EngelmannF,ArnoldN,KrahDL,terMeulenJ,HaberthurK,DewaneJ,MessaoudiI:Abortiveintrabronchialinfectionofrhesusmacaqueswithvaricella-zostervirusprovidespartialprotectionagainstsimianvaricellaviruschallenge.Journalofvirology2015,89(3):1781-1793.36.GrayWL:SimianvaricellainOldWorldmonkeys.Comparativemedicine2008,58(1):22-30.37.ArvinA,GildenD:Varicella-ZosterVirusIn:KnipeDM,HowleyPM,editors.FieldsVirology.In.:Philadelphia(Pennsylvania):LippincottWilliams&Wilkins;2013.38.MahalingamR,MessaoudiI,GildenD:Simianvaricellaviruspathogenesis.In:Varicella-zosterVirus.Springer;2010:309-321.57 参考文献39.OuwendijkWJ,AbendrothA,Traina-DorgeV,GetuS,SteainM,WellishM,AndewegAC,OsterhausAD,GildenD,VerjansGM:T-cellinfiltrationcorrelateswithCXCL10expressioningangliaofcynomolgusmacaqueswithreactivatedsimianvaricellavirus.Journalofvirology2013,87(5):2979-2982.40.LunguO,PanagiotidisCA,AnnunziatoPW,GershonAA,SilversteinSJ:Aberrantintracellularlocalizationofvaricella-zostervirusregulatoryproteinsduringlatency.ProceedingsoftheNationalAcademyofSciences1998,95(12):7080-7085.41.EhrlichSD:Metagenomicsoftheintestinalmicrobiota:potentialapplications.Gastroenterologiecliniqueetbiologique2010,34:S23-S28.42.BlochKC,GlaserC:Diagnosticapproachesforpatientswithsuspectedencephalitis.Currentinfectiousdiseasereports2007,9(4):315-322.43.GelfandJM,GenrichG,GreenAJ,TihanT,CreeBA:Encephalitisofunclearorigindiagnosedbybrainbiopsy:adiagnosticchallenge.JAMAneurology2015,72(1):66-72.44.GlaserC,HonarmandS,AndersonL,SchnurrD,ForghaniB,CossenC,SchusterF,ChristieL,TureenJ:Beyondviruses:clinicalprofilesandetiologiesassociatedwithencephalitis.ClinicalInfectiousDiseases2006,43(12):1565-1577.45.AllanderT,EmersonSU,EngleRE,PurcellRH,BukhJ:AvirusdiscoverymethodincorporatingDNasetreatmentanditsapplicationtotheidentificationoftwobovineparvovirusspecies.ProceedingsoftheNationalAcademyofSciences2001,98(20):11609-11614.46.HaberthurK,MeyerC,ArnoldN,EngelmannF,JeskeDR,MessaoudiI:Intrabronchialinfectionofrhesusmacaqueswithsimianvaricellavirusresultsinarobustimmuneresponseinthelungs.Journalofvirology2014,88(21):12777-12792.47.KellenbergerE:Exploringtheunknown.EMBOreports2001,2(1):5-7.48.NorgrenJrRB:Creationofnon-humanprimateneurogeneticdiseasemodelsbygenetargetingandnucleartransfer.ReprodBiolEndocrinol2004,2(1):40.49.YongW,Pei-YuanQ:Conservativefragmentsinbacterial16SrRNAgenesandprimerdesignfor16SribosomalDNAampliconsinmetagenomicstudies.PlosOne2009,4(10):e7401.50.PatelRK,JainM:NGSQCToolkit:atoolkitforqualitycontrolofnextgenerationsequencingdata.PloSone2012,7(2):e30619.51.CaporasoJG,KuczynskiJ,StombaughJ,BittingerK,BushmanFD,CostelloEK,FiererN,PenaAG,GoodrichJK,GordonJI:QIIMEallowsanalysisofhigh-throughputcommunitysequencingdata.Naturemethods2010,7(5):335-336.52.DeSantisTZ,HugenholtzP,LarsenN,RojasM,BrodieEL,KellerK,HuberT,DaleviD,HuP,AndersenGL:Greengenes,achimera-checked16SrRNAgenedatabaseandworkbenchcompatiblewithARB.Appliedandenvironmentalmicrobiology2006,58 参考文献72(7):5069-5072.53.SuzanaG,DajanaP,MichaelK,StefanDS,IlkaW,MichelM,PawelG,SebastianK,AndreaH,MichaelW:LossofmitochondrialpeptidaseClppleadstoinfertility,hearinglossplusgrowthretardationviaaccumulationofCLPX,mtDNAandinflammatoryfactors.HumanMolecularGenetics2013,22(24):4871-4887.54.FredricksDN,FiedlerTL,MarrazzoJM:Molecularidentificationofbacteriaassociatedwithbacterialvaginosis.NewEnglandJournalofMedicine2005,353(18):1899-1911.55.QuickJ,QuinlanAR,LomanNJ:AreferencebacterialgenomedatasetgeneratedontheMinIONportablesingle-moleculenanoporesequencer.Gigascience2014,3(22):10.1186.56.TurnbaughPJ,HamadyM,YatsunenkoT,CantarelBL,DuncanA,LeyRE,SoginML,JonesWJ,RoeBA,AffourtitJP:Acoregutmicrobiomeinobeseandleantwins.nature2009,457(7228):480-484.57.TurnbaughPJ,LeyRE,MahowaldMA,MagriniV,MardisER,GordonJI:Anobesity-associatedgutmicrobiomewithincreasedcapacityforenergyharvest.nature2006,444(7122):1027-1131.58.CoxMJ,CooksonWO,MoffattMF:Sequencingthehumanmicrobiomeinhealthanddisease.Humanmoleculargenetics2013:ddt398.59.ScholzMB,LoC-C,ChainPS:Nextgenerationsequencingandbioinformaticbottlenecks:thecurrentstateofmetagenomicdataanalysis.Currentopinioninbiotechnology2012,23(1):9-15.60.AmannRI,LudwigW,SchleiferK-H:Phylogeneticidentificationandinsitudetectionofindividualmicrobialcellswithoutcultivation.Microbiologicalreviews1995,59(1):143-169.61.JiangB,LiangX,ChenY,MaT,LiuL,LiJ,JiangR,ChenT,ZhangX,LiS:Integratingnext-generationsequencingandtraditionaltonguediagnosistodeterminetonguecoatingmicrobiome.ScientificReports2012,2.62.LazarevicV,WhitesonK,HuseS,HernandezD,FarinelliL,ØsteråsM,SchrenzelJ,FrançoisP:MetagenomicstudyoftheoralmicrobiotabyIlluminahigh-throughputsequencing.Journalofmicrobiologicalmethods2009,79(3):266-271.63.SummanenP,TalanD,StrongC,McTeagueM,BennionR,ThompsonJ,VäisänenM-L,MoranG,WinerM,FinegoldS:Bacteriologyofskinandsoft-tissueinfections:comparisonofinfectionsinintravenousdrugusersandindividualswithnohistoryofintravenousdruguse.ClinicalInfectiousDiseases1995,20(Supplement2):S279-S282.64.McGuckinM,GoldmanR,BoltonL,SalcidoR:Theclinicalrelevanceofmicrobiologyinacuteandchronicwounds.Advancesinskin&woundcare2003,16(1):12-23.65.MarraCM,MaxwellCL,SmithSL,LukehartSA,RompaloAM,EatonM,StonerBP,AugenbraunM,BarkerDE,CorbettJJ:Cerebrospinalfluidabnormalitiesinpatientswith59 参考文献syphilis:associationwithclinicalandlaboratoryfeatures.JournalofInfectiousDiseases2004,189(3):369-376.66.PettE,SaeedK,DrydenM:Fusobacteriumspeciesinfections:clinicalspectrumandoutcomesatadistrictgeneralhospital.Infection2014,42(2):363-370.67.Seth-SmithHMB,HarrisSR,SkiltonRJ,RadebeFM,GolparianD,ShipitsynaE,DuyPT,CutcliffeLT,O’NeillC:Whole-genomesequencesofChlamydiatrachomatisdirectlyfromclinicalsampleswithoutculture.GenomeResearch2013,23(5):855-866.60 个人简介个人简介姓名:刘文丽性别:女出身年月:1992.09籍贯:内蒙古赤峰民族:汉族政治面貌:中共党员学习经历:2009.09-2013.06北京理工大学生命学院生物技术理学学士2013.08-2016.06军事医学科学院微生物流行病研究所军事预防医学理学硕士受过的主要奖励和荣誉:2009-2013年,获校级“人民奖学金”五次2012年05月,获校级“优秀学生干部”荣誉称号2014年12月,参与埃博拉疫情,所在课题组获“集体三等功”一次第一作者(共同第一)发表论文:YaoX,SunQ,LiuW,etal.CompleteGenomeSequenceofSerratiarubidaeaIsolatedinChina[J].Genomeannouncements,2016,4(2)刘文丽,米志强,王伟,舒鹏,童贻刚。基于16SrDNA宏基因组学技术探究未知病因足部溃烂的致病因素。生物技术通讯。2016刘文丽,王进,舒鹏,王玉琢,裴广倩,安小平,童贻刚,法云智。利用宏基因组测序分析一起食蟹猴致死因素。中国预防兽医学报。2016程实,刘文丽,舒鹏,米志强,安小平,童贻刚。难提取细菌基因组DNA提取方法的比较与优化。生物技术通讯。201661 致谢致谢行文至此,我为期三年的硕士生涯即将结束。在此,我要特别感谢在这三年里关心我、鼓励我、帮助我的老师、家长、师兄师姐和同学们,感谢你们的辛勤和无私付出,使我能够顺利毕业。首先要感谢的是我的导师童贻刚研究员。童老师学识渊博又治学严谨,他告诉我们科研不是碰运气,而是实干,从入学伊始到毕业答辩,童老师的勤奋务实的态度始终影响着我,他不仅教会我们在科研上脚踏实地,更教会我们在为人处世上耐心宽容,使我受益颇多。我相信从童老师身上学到的知识和精神,对我今后的人生仍有重要的指导作用。感谢安小平老师、米志强老师、张志毅老师、张湘莉兰老师、黄勇老师在实验和工作上的帮助。安老师作为高通量测序的组长,在我实验失败时,总能第一时间帮助我找到原因;米老师、张老师和黄老师在论文写作和生物信息学分析也给了我诸多帮助,没有他们的帮助,就没有我毕业课题顺利的完成。感谢范航师兄、王伟师兄、王玉琢师兄、康怀兴师兄、徐晓蒙师兄,感谢裴广倩师姐、王亚慧师姐,感谢王云飞实验员,感谢他们在实验和生活上的指导和帮助。感谢同窗舒鹏、刘小东,感谢他们三年的陪伴和扶持。一起通宵做任务,一起准备考试,一起准备答辩,这些都成为我人生中最美好的记忆,愿我们的友谊长存。感谢程实师妹、孙强师弟、邢少贞师妹、张雅薇师妹、李金蔓师妹、何鲖鲖师妹、赵亚超师弟、刘艳楠师妹、冯羽中师弟,感谢他们在实验和生活中的帮助和照顾。最后要感谢我的父母对我的养育之恩,感谢他们在我的学业上给予的鼓励和支持,感谢他们在我的生活上给予的关心和照顾,没有他们就没有现在的我,愿他们安康、快乐。62

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
关闭