中国汉族人群肺结核病宿主基因易感性全基因组关联分析研究

中国汉族人群肺结核病宿主基因易感性全基因组关联分析研究

ID:75589594

大小:2.06 MB

页数:55页

时间:2024-02-04

上传者:笑似︶ㄣ無奈
中国汉族人群肺结核病宿主基因易感性全基因组关联分析研究_第1页
中国汉族人群肺结核病宿主基因易感性全基因组关联分析研究_第2页
中国汉族人群肺结核病宿主基因易感性全基因组关联分析研究_第3页
中国汉族人群肺结核病宿主基因易感性全基因组关联分析研究_第4页
中国汉族人群肺结核病宿主基因易感性全基因组关联分析研究_第5页
中国汉族人群肺结核病宿主基因易感性全基因组关联分析研究_第6页
中国汉族人群肺结核病宿主基因易感性全基因组关联分析研究_第7页
中国汉族人群肺结核病宿主基因易感性全基因组关联分析研究_第8页
中国汉族人群肺结核病宿主基因易感性全基因组关联分析研究_第9页
中国汉族人群肺结核病宿主基因易感性全基因组关联分析研究_第10页
资源描述:

《中国汉族人群肺结核病宿主基因易感性全基因组关联分析研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

分类号论文编号密级硕±学位论文中国巧族人群肺结核病宿主基因易感性全基因组关联分析研究Genome-WideAssociationStudyofPulmonaryTuberculosisinChineseHanPoulationp研究生姓名:王廣学号:20131263指导教师:徐沪济教授第二军医大学第二附属医院学科:(、专业内科学风湿免疫病)学位类型:学术学位答辩日期:2016年5月二〇-六年五月 第二军医大学硕士学位论文中国汉族人群肺结核病宿主基因易感性全基因组关联分析研究Genome-wideassociationstudyofpulmonarytuberculosisinChineseHanpopulation研究生姓名:王赓指导教师:徐沪济教授专业名称:内科学(风湿免疫病)研究方向:感染性疾病的免疫遗传学研究培养单位:第二军医大学第二附属医院论文提交日期2016年5月第二军医大学第二附属医院(上海,200003) 独创性声明本人声工明所呈交的学位论文是我个人在导师指导下进行的研究作,论文中不包含其他人己经。除了文中特别加W标注和致谢的地方外一发表或撰写过的研究成果。与我同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示谢意。本人承担本声明的法律责任。乂年月日学位论文作者签名:义^日期:兴学位论文版权使用授权声明二二军医大学有关保留,第本人完全了解第、使用学位论文的规定军医大学有权保留并向国家有关部口或机构送交论文的复印件和电子版,允许论文被查阅和借阅。本人授权第二军医大学可W将学位论文全文或部分内容编入《中国学位论文全文数据库》、《中国优秀博硕±学位论文全文数据库》等数据库进行检索。可W采用影印、缩印或扫描等复)制手段保存、汇编学位论文。(保密的学位论文在解密后适用本授权书:学位论文作者签名;巧氏导师签名期;年:r月日日期:八年疋月巧日日^ 目录摘要...............................................................................................................1ABSTRACT......................................................................................................3缩略词表...........................................................................................................5引言...............................................................................................................6研究对象与方法...............................................................................................9一、对象.......................................................................................................9二、试剂.......................................................................................................9三、仪器、芯片和软件.............................................................................10四、技术方法.............................................................................................11结果.............................................................................................................19一、第一阶段全基因组关联分析.............................................................19二、第二阶段核心外显子基因扫描.........................................................24三、第三阶段基因分型验证.....................................................................25四、荟萃分析.............................................................................................26讨论与结论.....................................................................................................30综述.............................................................................................................32成年人肺结核病的宿主遗传学研究进展.....................................................32一、引言.....................................................................................................32二、概况.....................................................................................................32三、遗传流行病学:结核病宿主遗传因素.............................................32四、结核病候选基因研究.........................................................................33五、全基因组关联分析(GWAS).........................................................36六、新一代测序和前景.............................................................................38七、结论.....................................................................................................38参考文献.........................................................................................................40在读期间发表论文和参加科研工作情况说明.............................................50致谢.............................................................................................................51 中国汉族人群肺结核病宿主基因易感性全基因组关联分析研究摘要目的:通过全基因组关联分析探索中国汉族人群中肺结核病的宿主遗传易感性关联位点。对已发表的全基因组关联分析(GWAS)中非洲及欧洲人群宿主易感变异进行验证和比较研究。通过验证有统计学意义的关联位点,根据单核苷酸多态性所在位置及周围基因解释其生物学意义及易感机理。研究人群与方法:1.研究人群:本课题纳入的研究对象包括5149例来自全国多家结核病防治中心的肺结核病患者及来自长征医院、北京301医院体检中心的7042位健康体检者。2.方法1)第一阶段:应用IlluminaOmnizhonghua芯片在ISCAN分型扫描平台上对1853例成年汉族肺结核(Tuberculosis,TB)患者及3115例健康汉族人群进行单核苷酸多态性(SNP)基因分型。通过生物信息学方法进行病例对照Logistic回归关联分析,从中获取候选SNP进行后续验证。2)第二阶段:应用IlluminaCoreExome芯片在ISCAN分型扫描平台上对725例成年汉族结核患者及3927例健康汉族人群进行单核苷酸多态性(SNP)基因分型。通过生物信息学方法进行病例对照关联分析,并通过基因型推演(Imputation)对步骤1所得数据进行验证。3)第三阶段:在SequenomiPlex平台上检测2571例结核患者进行验证,并利用二期CoreExome芯片健康对照人群基因分型数据及其基因型推演结果进行对照,对步骤1中所找到的潜在SNP位点和已发表的非洲及欧洲人群宿主易感变异进行验证。4)最终,通过统计学方法,对三期数据进行荟萃分析(meta-analysis),从中获得与TB关联性SNP及易感基因。结果:第一阶段,经OmniZhonghua芯片扫描分型和全基因组关联分析,虽然我们没有-8发现严格意义上的全基因组显著位点(P<5×10),但在6号、22号等染色体上发现可能关联性趋势,因此,到我们选择了68个候选SNP进行后续验证。第二阶段,我们经CoreExome芯片扫描分型并与第一阶段数据进行荟萃分析-11-9(meta-analysis),发现rs117435254(Pmeta=1.43×10)和rs7364237(Pmeta=3.26×10)-1- 第二军医大学硕士学位论文两个全基因组显著关联位点。第三阶段:我们对从第一阶段数据中选择的68个候选SNP以及26个已发表的GWAS关联位点在独立结核病例样本中进行分型验证。已发表的26个GWAS关联位点,并未在本研究人群中得到证实。-10最终,我们对以上三阶段数据进行荟萃分析,得到rs532098(Pmeta=1.47×10)-8和rs9309112(Pmeta=3.14×10)两个全基因组显著关联位点。结论:我们的研究揭示了中国汉族人可能存在肺结核易感基因。研究发现的四个全基因组显著位点分别位于不同的基因区域:Rs117435254位于SF3A1内含子区域;rs7364237位于PES1基因内含子区域;rs532098位于MHC区域基因间区;rs9309112位于基因LRPPRC基因内含子区。研究提示,上述SNP及所在基因可能影响中国汉族人群的结核易感性。我们对已发表的26个GWAS关联位点进行了验证,并未在本研究人群中得到证实。说明在不同种族人群之间存在易感性差异,也可能说明本研究的样本量以及目前的统计学方法还不足以探测到潜在关联位点。以上结论仍需要更大规模的遗传学研究及生物功能研究来证实。关键词:肺结核,中国汉族人群,全基因组关联研究,单核苷酸多态性,易感基因-2- 中国汉族人群肺结核病宿主基因易感性全基因组关联分析研究AbstractObjectives:Tofindhostsusceptibilitylociandgenesassociatedwithtuberculosis(TB)inChineseHanpopulationbygenome-wideassociationstudy.ToreplicateandvalidatehostsusceptibilityvariantsofpublishedGWASsignificantSNPsinAfricanandEuropeanpopulations.Toexplainthebiologicalcorrelationofsinglenucleotidepolymorphismslocationandsurroundinggenesaccordingtoverifiedstatisticallysignificantassociatedloci.Methods:Thestudypopulationincludedsubjectsincluded5149casesofpatientswithpulmonaryTBfromTBcontrolcentersalloverChinaandin7042healthycontrolsfromMedicalCentersofChangzhengHospital,Beijing301Hospital.Inthefirststageofthestudy,weinitiallyconductedaGWASincludedindividualsof1853TB(cases)and3115healthycontrolsrecruitedfromChina.UsingOmniZhongHua-8version1.0BeadChipsonISCANplatform.Wegenotyped900,015SNPsintotalofbothcasesandcontrols.Weconductedgenome-wideassociationanalysisbyusingbioinformaticstools.Inthesecondstageofthestudy,weconductedagenome-widegenotypingincludedindividualsof725TB(cases)and3927healthycontrolsrecruitedfromChina.UsingIlluminaCoreExomechipsonISCANplatform.Weconductedgenome-wideassociationanalysisbyusingbioinformaticstools.ThenweconductedgenotypeimputationinthisdatasettryingtovalidatepromisingSNPsinstage1.Inthethirdstageofthestudy,weattemptedtoreplicatepromisingSNPsformstep1andpublishedTBassociatedSNPsofGWASstudiesinAfricanandEuropeanpopulations.Weconductedthisgenotypinginanindependentcohortof2571individualsfromChinabyusingSequenomiPlex.Inordertoconfirmtheresultofstage1,weusedcontrolsin3,927CoreExomecontrolcohortascommoncontrols(variantsimputedifnotdirectlygenotyped).Finally,Weconductedmeta-analysisofthreestagesinsearchingsusceptibilitygeneassociatedwithTBbymultiplestatisticalmethodsandbioinformaticstools.Results:-3- 第二军医大学硕士学位论文-8Inthefirststage,wefoundnogenome-widesignificantloci(P<5×10),butwefoundpossibletrendofsignificantassociationinchromosome6andchromosome22,therefore,wechosethe68candidatesSNPforsubsequentverification.Inthesecondstage,weconductedCoreExomemicorarraytypeandmeta-analysiswithstage1.Wediscoveredtwogenome-widesignificantSNPs,whichwerers117435254-11-9(Pmeta=1.43×10)andrs7364237(Pmeta=3.26×10).Thethirdstage:Wegenotypedofthe68candidateSNPsselectedfromthefirstphaseand26publishedassociatedlociintheindependentsamples.The26GWASreportedSNPshavenotbeenconfirmedinthisstudypopulationinmeta-analysisofstage2and3.-10Finally,weperformedmeta-analysisofthreestages.Rs532098(Pmeta=1.47×10)and-8rs9309112(Pmeta=3.14×10)werefoundgenome-widesignificant.Conclusions:OurresearchrevealedseveralpossibleTBhostsusceptibilitylociinChineseHanmayexist.Rs117435254islocatedinintronregionofSF3A1gene.Rs7364237islocatedinintronregionofPES1gene.Rs532098islocatedintragenicregionofMHCregion,Rs9309112islocatedinintronregionofLRPPRCgene.ThisstudyshowsthatSNPsorthegeneitimpactfunctionallymayaffectsusceptibilitytotuberculosisintheChineseHanpopulation.Thepreviouslyreported26GWASassociationlocihavenotbeenconfirmedinourstudypopulation.ItmayindicatethatdifferencesinTBsusceptibilitymayexistbetweendifferentethnicgroups.Itmayalsobeexplainedbyinadequatesamplesizeofthisstudyandweakpowerofcurrentstatisticalmethods,whicharenotenoughtodetectpotentialfalsenegativeresults.Theseconclusionsstillneedfurtherconfirmationbylarge-scalegeneticstudieswithadvancedmethodsandbiologicalfunctionstudies.KEYWORDS:Tuberculosis,HanChinesepopulation,Genome-wideassociationstudy,Singlenucleotidepolymorphism,Susceptibilitygenes-4- 中国汉族人群肺结核病宿主基因易感性全基因组关联分析研究缩略词表缩略词英文全称中文全称TBTuberculosis结核病WHOWorldHealthOrganization世界卫生组织IFNGInterferon,Gamma伽马干扰素基因NaturalResistance-Associated自然抵抗相关巨噬细胞蛋白NRAMP1MacrophageProtein11基因SLC11A1SoluteCarrierFamily11Member1溶质载体家族11成员1NOS2ANitricOxideSynthase2A一氧化氮合酶2A基因SNPSinglenucleotidepolymorphism单核苷酸多态性GWASGenome-wideassociationstudies全基因组关联分析MHCMajorhistocompatibilitycomplex主要组织相容性复合体PCPrincipalcomponent主要组分MAFMinorallelefrequency最小等位基因频率HWEHardy-WeinbergEquilibrium哈迪-温伯格平衡OROddsratio优势比LDLinkagedisequilibrium连锁不平衡HapMapHumanhaplotypemappingproject国际人类基因组单体型图计划s.e.Standarderror标准误QCQualitycontrol质量控制IBDIdentitybydescend亲缘鉴定DNADeoxyribonucleicAcid脱氧核糖核酸PCRPolymeraseChainReaction聚合酶链式反应UTRTranslatedregion非转录区-5- 第二军医大学硕士学位论文引言结核病是由结核分支杆菌感染所导致的全球性的传染性病。结核具有很高的发病[1]率和致死率,特别是在非洲和亚洲地区。迄今为止,肺结核仍然是由单一致病菌引发疾病中致死率最多的疾病。世界卫生组织(WHO)2006年的报道,中国每年约有130万新发病例。2010年全国第五次结核病调查显示:15岁及以上人群活动性肺结[2]核的患病率为0.459%。据WHO2014年全球结核报告,仅2013年一年,中国地[4]区占全球900万新发结核病例的11%。然而,活动性感染病例仅仅占结核病感染总[5]数的约十分之一,大部分人群仍处于潜伏感染状态。虽然我国预防接种和疾病管控逐渐严格规范,但近年来致病菌的耐药性仍让我们[6]看到了结核病死灰复燃的趋势。对宿主基因易感性进行深入研究,可以让我们更好[7]的了解结核病,进而制定更佳防御策略。近年来,随着对人类基因组的不断探索,对结核宿主的基因易感性的研究成为热点。结核宿主抵抗力或易感性相关的人类基因分别从趋化因子、转运体、杀菌作用、调理作用、细胞因子、抗原提成、细胞凋亡及下调、受体等途径影响了易感人群对结[8-11]核分枝杆菌病的易感性。目前,结核宿主易感基因多通过连锁分析研究(linkagestudies)和候选基因研究(candidategenestudies)完成。连锁分析发现了一些候选易感性基因,但只有染色体5p15,11p14,20p和20q区域可被反复验证。候选基因关联研究也揭示了许多与肺结核相关的候选基因,但仅在IFNG,NRAMP1(SLC11A1)和NOS2A基因得到验证。虽然众多候选基因研究已经揭示了结核病易感的候选基因,但由于有限的样本[11-15]量以及在跨人种验证过程中的复杂性,研究的统计学证据往往不惧说服力。随着高通量测序技术不断完善,让基因研究不仅仅局限于某个或某几个基因的多[16,17]态性或表达,而使得全基因组关联分析成为可能。近十年,全基因组关联研究[18](Genome-wideassociationstudy,GWAS)在世界范围内取得了重大突破。通过全基因组非假设性的探索,研究发现了许多与多基因疾病相关联的基因易感位点和区域,使人类疾病的遗传学研究进入了一个崭新的台阶。这些基因组关联分析研究为许多疾[19]病的机制研究,疾病预防甚至治疗对策提供了重要线索。GWAS研究是利用通过单核苷酸多态性(Singlenucleotidepolymorphism,SNP)设计的全基因组芯片对人类的基因组的SNP进行基因分型,通过对比患病人群和健康对照的基因型差异进行统计学关联性分析,寻找与疾病存在关联性的易感变异及基[14,20]因。-6- 中国汉族人群肺结核病宿主基因易感性全基因组关联分析研究SNP,是指发生在基因组中的单点突变,当该变异在人群中超过一定比例(例如>[21]1%),便称为SNP。例如,在人类基因组中的某特定碱基位置,大多数个体基因座位为胞嘧啶(C)碱基,但仍有少数个体该位置碱基为腺嘌呤(A)。那我们就可以[22]认为该碱基位置存在C或A两种可能变异,该基因座位的变异便称为SNP。尽管在迄今发现的SNP大多是二等位基因变异,但目前也发现在人群中存在三等位基[23]因的SNP。SNP的差异影响了众多疾病的易感性,例如镰状细胞性贫血,β地中海贫血和囊[24-26]性纤维化,均被证实由SNP所致。疾病的严重程度和身体对治疗方法的反应也与遗传变异相关。例如,在载脂蛋白E(apolipoproteinE,APOE)基因的单碱基突[27]变与阿尔茨海默氏病风险存在相关性。然而,结核作为一个传染性疾病,致病混杂因素较多,因此宿主遗传学研究有一定难度[28]。最早发表针对非洲人群的GWAS研究成功的发现了18q11(rs4331426)和11p3(rs4331426)上的关联位点,但并没有进行基因功能注释,且未被其他研究[29-34]成功验证。最先发表的结核病GWAS(Thye等,2010)确定位于chr18q11的-9rs4331426为结核病的易感位点(联合P值=6.8×10,OR=1.19,95%CI=1.13-1.27),此SNP附近没有明显的功能候选基因,此基因座位有可能通过顺式或反式作用调控[30]其他基因的表达。在此之后,Thye等于2012年将千人基因组计划的数据归集于全基因组数据集,在加纳,冈比亚,印尼及俄罗斯人群中,位于WT1基因(编码肾母-11细胞瘤1)的下游chr11q3上的SNPrs2057178(联合P=2.57×10)被确定为抗性基[34]因位点。最新发表在俄罗斯人群的GWAS研究中发现位于8q24染色体上的ASAP1基因内含子SNP(rs4733781,rs10956514)与结核病存在关联性,病验证该基因与树[36]突细胞的调节功能存在潜在关联。然而,在中国汉族人群验证研究中,结果和其他种族人群的研究结果不尽相同。虽然chr18q11位点被验证显著与中国人群结核病[10,37]发生相关,但其效应量(effectsize)与非洲人群相反(OR=0.62)。而chr11q3[38]染色体上rs2057178尚未在中国人群中被证实与结核病相关。这表明,结核病相关[39-44]性SNP及其效应量可能在不同人群中存在异质性。目前在亚洲人群中,在泰国和日本人群中的GWAS已进行了单独分析和荟萃分析,但没有产生任何令人信服的关联证据。仅在年龄分组后进行GWAS和验证研究,[46]发现年轻结核病(发病年龄小于45岁)与20q12上的风险位点相关。然而,由于人群遗传结构差异和传染源、传染途径和易感人群的相互作用,与其他复杂疾病相比,肺结核病全基因组关联研究依然收获甚少,需要进一步扩大样本量和更新生物信息学分[47-53]析手段,更深一步探索肺结核病的宿主遗传易感性。-7- 第二军医大学硕士学位论文目前尚无针对中国人群结核病的全基因组关联分析研究发表。因此,我们进行了大量的三阶段GWAS研究,旨在探讨中国汉族人群遗传因素对宿主结核病易感性的影响。本研究拟应用全基因组芯片技术,对TB感染进行宿主遗传学研究,重点探索TB宿主相关的多态性位点及相关基因,并与已发表的非洲及欧洲人群结果进行比较研究。该研究有助于发现TB宿主易感性相关变异位点,为TB的发病机制提供了更多思路与线索,并推动TB抗药性研究和宿主免疫方面的研究,推动TB易感人群风[54]险性评估和临床个性化医疗的应用。-8- 中国汉族人群肺结核病宿主基因易感性全基因组关联分析研究研究对象与方法一、对象在本研究中,我们进行了3个阶段的样本采集,阶段1(GWAS)中TB病例1835例,来自山东省多家结核防治中心收治的互无关联的住院及门诊汉族成年患者。阶段1中的对照例对照来自北京301医院。在阶段2(CoreExome)及阶段3(Sequenom)中,分别纳入了725例及2611例肺结核患者样品,样本来自上海,河南,浙江等地区多家结核防治中心收治的互无关联的住院及门诊汉族成年患者。诊断标准依据中国[55]结核病防治中心发布的肺结核诊断标准(WS288-2008)中临床诊断病例标准。所有患者均为无血缘关系的汉族成年,并排除HIV阳性患者。阶段1的3115例及阶段2、3的3927例健康对照分别来自北京301医院及上海长征医院体检中心的健康、无血缘关系的汉族成年受检者为对照。实验获得各个医院以及机构伦理委员会审核同意,所有研究对象均签署知情同意,并抽取外周静脉血5ml。各阶段情况见表1。表1三阶段样本处理方法及样本量发现阶段验证阶段阶段3:阶段1:阶段2:阶段及方法Sequenomeiplex质谱lluminaOmniZhonghua芯片IlluminaCoreExome芯片分型病例对照病例对照病例样本量1835311572539272571二、试剂FlexiGeneDNAKit德国QIAGEN生物公司TBE上海捷兰生物技术有限公司6*Loadingbuffer上海捷兰生物技术有限公司AL2000DNAMARKER(1000bp)北京艾德来公司PremixEXTAQ预混耐热DNA聚合酶日本TAKARA公司TAE缓冲液美国DECENTBI公司-9- 第二军医大学硕士学位论文琼脂糖粉西班牙SOLARBIO公司AxyPrep血基因组DNA小量试剂盒美国AXYGEN公司引物美国Invitrogen公司合成REPLI-gUltraFast全基因组扩增试剂盒德国QIAGEN生物公司HotStarTaqDNAPolymerase(1000U)德国QIAGEN生物公司iPLEXTMReagentKit美国SEQUENOM公司dNTPMixture日本TAKARA公司CleanResin美国SEQUENOM公司绿如蓝核酸染料北京天恩泽科技有限公司三、仪器、芯片和软件台式高速离心机PICO17美国Thermo公司台式低温离心机5810R德国Eppendof公司NANO-DROP美国Thermo公司BIORADPOWERPAC3000美国BioRad公司BIORADDNASUBCELL美国BioRad公司凝胶成像系统GIS-1600上海天能科技有限公司5417R台式高速低温离心机德国Eppendorf公司DY-A电泳仪上海西巴斯生物技术有限公司DY-A电泳仪上海西巴斯生物技术有限公司LDZX-40SBI不锈钢灭菌消毒器上海申安公司无裙边96孔PCR板美国AXYGEN公司ND1000紫外分光光度计美国AXYGEN公司Milli-QGard纯水仪美国Millipore公司ELx800酶标仪美国Bio-Tek公司ChemiDocXRS+成像系统美国BioRad公司5810R低温低速离心机德国Eppendorf公司D-37520台式离心机美国Thermo公司-10- 中国汉族人群肺结核病宿主基因易感性全基因组关联分析研究PCR仪(GeneAmpPCRSystem9700)美国AppliedBiosystem公司MassArrayTMNanodispenser韩国SAMSUNG公司HumanOmnizhonghua-8芯片美国Illumina公司InfiniumCoreExome-24芯片美国Illumina公司G384+10SpectrochipTM美国SEQUENOM公司iSCAN全基因组芯片扫描仪美国Illumina公司Sequenome质谱分型仪美国Illumina公司PLINKv1.07&v1.9软件http://pngu.mgh.harvard.edu/purcell/plink/MassARRAYTyper4.0软件美国SEQUENOM公司GenomeStudio软件美国Illumina公司SMARTPCA(EIGENSTRAT)软件http://genepath.med.harvard.edu/~reich/Software.htmRv3.0.2软件http://cran.r-project.org/IMUPTE2软件https://mathgen.stats.ox.ac.uk/impute/impute_v2.html四、技术方法(一)DNA提取(1)吸取7.5毫升缓冲液FG1置于15毫升离心管中。加入3ml全血和翻转离心管5次以混合。(2)离心:2000×g,5分钟。(3)弃上清,倒置离心管于清洁吸水纸上2分钟,确保颗粒保留在管中。(4)注:在极少数情况下,颗粒可能松动,所以倒慢。颠倒试管到吸收纸最小化从管的边缘和侧面上清液回流到沉淀。(5)立即加入1.5毫升缓冲液FG2/QIAGEN蛋白酶,封闭离心管,并震荡直至沉淀完全同质化。检查管同质化已经完成。(6)倒置管3次,将其放置于加热箱或水浴中,并在65下孵育10分钟。注:样品由红颜色变为橄榄绿色,表明蛋白质已消化。(7)加入1.5毫升异丙醇(100%),翻转摇匀,直到DNA沉淀可见呈线性或-11- 第二军医大学硕士学位论文团块状。(8)离心:2000×g,3分钟。(9)弃上清,倒置离心管于清洁吸水纸上,确保颗粒保留在管中。(10)加入1.5毫升70%乙醇,震荡5秒。(11)离心:2000×g,3分钟。(12)弃上清,倒置离心管于清洁吸水纸上至少5分钟,确保颗粒保留在管中。(13)将DNA沉淀风干,直到所有液体已蒸发(至少5分钟)(14)加入300µl的缓冲液FG3,涡旋震荡5秒,并65水浴1小时,使DNA溶解。(二)全基因组芯片分型方法本研究第一阶段(Omnizhonghua),我们对1853例中国汉族肺结核病患者和3115位中国汉族健康对照个体的队列进行的全基因组分型扫描。使用HumanOmniZhongHua-81.0版BeadChip芯片,芯片专门根据中国人群设计,总共设计了900015个SNP。第二阶段(CoreExome),我们对725例中国汉族肺结核病患者和3927位中国汉族健康对照个体的队列进行的基因分型扫描。使用InfiniumCoreExome-241.0版BeadChip芯片,芯片专门针对核心基因SNP以及外显子设计,总共设计了547321个SNP。Omnizhonghua和CoreExome芯片均在iSCAN系统上完成,实验步骤相同如下:(1)第1天(预扩增)准备500ngDNA样本,利用氢氧化钠其变性。DNA过夜恒温孵育,进行基因组全扩增,避免产生等位基因偏向性扩增,最终达到扩增约1000倍。(2)第2天(扩增后处理)应用随机内切酶对扩增产物进行酶切,将DNA切成300-600碱基对长度的片段。使用乙醇将DNA沉淀,并在缓冲液中重新悬浮。杂交:将DNA片段与芯片进行杂交(准备芯片,在毛细管流通的小室进行杂交),芯片的微珠上连接有50-mers长度特异性捕获探针,gDNA酶切后产物与探针互补序列结合,杂交过夜。(3)第3天(BeadChip芯片处理)单碱基延伸:双色荧光染料标记的核苷酸底物(T和C)在捕获探针上进行单碱基延伸。只有与基因组DNA发生互补结合的探针才能得到延伸。-12- 中国汉族人群肺结核病宿主基因易感性全基因组关联分析研究清洗芯片后在ISCAN平台上进行全基因组芯片扫描。利用Genomestudio软件进行判读基因分型,SNP位点通过对两种荧光颜色的识别进行区分和判读。(三)质谱SNP分型为了确认第1阶段的结果,我们试图通过基因分型对一期的68个候选SNP,以及GWAScatalog数据库(https://www.ebi.ac.uk/gwas/)上选取已发表的26个TB相关联SNP进行验证。通过质谱分型技术,在SequenomiPlex平台上对总共2571个结核病个体的84个SNP进行基因分型(26个已发表SNP与68个候选SNP有重合部分)。我们使用3927CoreExome队列中的健康对照数据作为对照(52个SNP为芯片直接分型,32个SNP通过基因型推演进行分型)。(1)试剂准备从-20℃取出10×PCRBuffer、MgCl2、dNTP、引物室温溶解,HotstarTaq-20℃保存,使用时取出。(2)PCR反应:根据已抽提样品编制384孔反应表,注明每孔对应的DNA样品的编号,所用引物。按表在384孔板各孔中分别加入1µLDNA模板,贴膜,2000rpm/10秒离心后备用。按下表配制PCR反应液:(以384个样本为例)试剂名称1rxn(µL)384rxn(µL)H2O0.95380PCRBuffer(10×,含15mM0.625250MgCl2)MgCl2(25mM)0.325130dNTP(2.5mMeach)1400引物使用液1400HotstarTaq(5U/µL)0.140终体积41600注:以上384孔反应液有4%过量。-13- 第二军医大学硕士学位论文取一排12联管,每孔加入配置好的PCR反应液133µL,短暂离心后备用。用10ul排枪取12联管中PCR反应液4ul,加入已有1uLDNA的384孔板中,使各孔终体积为5ul。(注意枪头不要碰到384孔板中的DNA样品,如果碰到需调换枪头)将装有5ul反应液的384孔板短暂离心后放入PCR仪,运行名为“PCR”的反应程序。PCR程序:94℃15min94℃20sec56℃30sec45cycles72℃1min72℃3min4℃i.PCR反应程序结束后,将384孔板短暂离心后备用,可在4保存。(3)SAP处理配制SAP反应液按以下表次序配制SAP反应液(以384个样本为例)试剂名称1rxn(µL)384rxn(µL)H2O1.53612SAPBuffer(10×)0.1768SAP酶(1U/µL)0.3120终体积2800注:以上384孔反应液有4%过量。取一排12联管,将SAP反应液以每孔66µL分装,短暂离心后,用10ul排枪分装于384孔PCR反应板,每孔加2µL,封膜、离心。将已加入SAP反应液的384孔板放入PCR仪中,运行名为“SAP”的反应程序。SAP程序:37℃,40min85℃,5min4℃,forever反应结束,将384孔板取出短暂离心备用。-14- 中国汉族人群肺结核病宿主基因易感性全基因组关联分析研究(4)延伸反应配制iPlex反应试剂试剂名称1rxn(µL)384rxn(µL)H2O0.755302iPlexBuffer(10×)0.280iPlexTerminationmix0.280引物使用液0.804321.6iPlexenzyme0.04116.4终体积2800注:以上384孔反应液有4%过量。取一排12联管,将iPlex反应液以每孔66µL分装,短暂离心后,用10uL排枪分装于384孔PCR反应板,每孔加2µL,封膜、离心。将已加入iPlex反应液的384孔板放入PCR仪中,运行名为“extension”的反应程序。程序:94℃30sec94℃5sec52℃5sec5cycles40cycles80℃5sec72℃3min4℃forever反应结束,将384孔板取出短暂离心备用。(5)产物纯化取6mg树脂在384孔树脂刮板上,均匀覆盖,刮去多余的树脂,放置20min。将反应结束的384孔板1000rpm离心1min,每孔加入25µL去离子水,倒置在树脂板上面(注意固定,不能移位),然后反置将树脂板扣在384孔板上,敲击使树脂落入384孔板,封膜。以384孔板的长轴为轴心,翻转384孔板20分钟,3500rpm、5分钟离心后备用。(6)检测NanodispenserSpectroCHIP芯片点样。将检测样品从384孔反应板转移到表面覆盖基质的MassARRAYSpectroCHIP芯片。-15- 第二军医大学硕士学位论文MassARRAYAnalyzerCompac质谱检测。将样品转移到SpectroCHIP芯片后,即可放入质谱仪进行检测,每个检测点只需3-5秒,全自动分析。最终利用TYPER软件分析实验结果,获得分型数据。(四)生物信息及统计方法第一阶段:应用IlluminaOmnizhonghua芯片在ISCAN分型扫描平台上对1853例成年汉族肺结核患者及3115例健康汉族人群进行单核苷酸多态性(SNP)基因分型。通过生物信息学方法进行病例对照关联分析(图1),从中获取候选SNP进行后续验证。图1GWAS生物信息分析流程图MAF:次要等位基因频率;IBD:亲缘确认;PCA:主成分分析;HWE:Hardy-Weinberg平衡;STRUCTURE:人群结构推断软件;EIGENSTRAT:人群分层软件(1)质量控制首先,我们利用PLINK软件对全基因组扫描所得到的原始数据进行质量控制:样本质控:1)去除样本得样率低于98%的样本;2)去除杂合率超过+3SD的样本;3)通过亲缘鉴定分析IBD(PI_HAT>0.1875)去除重复样本及亲缘样本。SNP质控:1)去除次要等位基因频率MAF<0.01的SNP;2)去除哈迪-温伯格-7平衡P<1.0×10的SNP;3)基因型缺失率>0.02的SNP;4)去除性染色体内的SNP;5)通过SNP位置与WTCHG(www.well.ox.ac.uk/~wrayner/strand)数据进行比较与-16- 中国汉族人群肺结核病宿主基因易感性全基因组关联分析研究更新。最终,总共有2889对照和1751结核病例,以及797497个SNP通过了质控。(2)主成分分析a)种族鉴定主成分分析主要应用EIGENSTRAT软件进行分析,我们在阶段1的样品与来自HapMap项目数据(TheInternationalHapMapProject,http://hapmap.ncbi.nlm.nih.gov/),来自4个世界主要人群。主要包括:CEU-欧洲人群;CHB-中国北京汉族人群;JPT-日本东京人群;YRI-非洲人群。分析取HapMap样本与研究样品之间的共同点是MAF>0.01和HWE>0.001的位点进行主成分分析(如图)。分析表明我们的样品与东亚样品(CHB和JPT)重叠,与其他种族具有明显区分,说明所有研究对象均为东亚人群(图2)。图2Hapmap人群与研究人群主成分分析PC:主成分;CEU:欧洲人群;CHB:中国北京汉族人群;JPT:日本东京人群;YRI:非洲人群;Oursample:本研究人群。b)研究样本主成分分析我们对病例-对照人群进行了独立主成分分析,计算出排名前20的主成分(PC),根据结果发现,人群被主成分1(PC1)分成两个群体。反复尝试对多个PC进行去除后,均无法改变分群的模式(图)。因此我们去掉了部分脱离主要群组的人群,进行再次分析(图),人群分层消失。最后,利用PLINK软件对第一阶段GWAS通过-17- 第二军医大学硕士学位论文质控的标本和SNP进行全基因组关联分析,并对前20的主成分(PC)中病例与对照存在显著统计学差异的PC(P<0.05)进行校正。图3第一阶段GWAS样本PCA分析结核病例(Case):1751(绿色);健康对照(Control):2889(红色)图4第一阶段GWAS排除次要分层人群样本PCA分析结核病例(Case):1648;健康对照(Control):2139第二阶段:应用IlluminaCoreExome芯片在iSCAN分型扫描平台上对725例成-18- 中国汉族人群肺结核病宿主基因易感性全基因组关联分析研究年汉族结核患者及3927例健康汉族人群进行单核苷酸多态性(SNP)基因分型。通过与第一阶段相同的生物信息学方法进行病例对照关联分析,并通过基因型推演(Imputation)对步骤1所得数据进行验证。应用软件为IMPUTE2,通过千人基因组计划推算第一阶段及已发表非洲及欧洲人群GWAS研究选出的候选84个SNP数据,其中第二阶段CoreExome芯片分型数据作为原始数据,以千人基因组计划数据作为推算参考基因数据库。第三阶段:利用二期CoreExome芯片健康对照人群基因分型数据及其基因型推演结果进行对照,对步骤1中所找到的潜在SNP位点和已发表的非洲及欧洲人群宿主易感变异进行验证。荟萃分析(meta-analysis):首先,对第一阶段和第二阶段的部分候选位点进行固定效应(Fixedeffect)荟萃分析;对于在非洲和欧洲人群中挑选的26个已发表关联位点,我们利用第二、三阶段的基因分型数据和基因型推演结果进行荟萃分析;最后三期数据进行荟萃分析,从中获得与TB关联性SNP及易感基因。所有荟萃分析均通过R软件进行统计学计算完成,最终,三期荟萃分析显著位点用LocusZoom局部特写作图。结果一、第一阶段全基因组关联分析经OmniZhonghua芯片扫描分型和全基因组关联分析。我们首先第一阶段GWAS全部通过质控的标本和SNP进行全基因组关联分析,并对前20的主成分(PC)中病例与对照存在显著统计学差异的PC(P<0.05)进行校正(PC1,2,6,9,11),基因膨胀系数(Genomicinflationfactor,GIF)=1.027(图5)。然后,我们对去除次要人群分层样本进行全基因组关联分析,并对前20的主成分(PC)中病例与对照存在显著统计学差异的PC(P<0.05)进行校正(PC1,2,4,5,10,15,19)进行校正(病例-对照P<0.05),GIF=1.033(图6),根据两次分析的QQ图(图7,8)和GIF我们认为矫正后的人群分层可以接受。虽然与全部标本相比,排除次要人群分成样本可能会减少样本量,但是由于后者的样本同质性较好,结果更为可靠,因此我们通过决定通过后者的关联分析结果选取第二、三阶段验证的候选SNP。-8根据一期数据,我们没有发现严格意义上的全基因组显著位点(P<5×10),但-5在6号、22号等染色体上发现可能关联性趋势,因此我们选择了P<5×10的潜在关联位点接近的周围和的位点,中选择了68个候选SNP进行后续验证(见表2)。-19- 第二军医大学硕士学位论文图5第一阶段GWAS全部标本关联分析曼哈顿图对PC1,2,6,9,11进行校正(病例-对照P<0.05);基因膨胀系数(Genomicinflationfactor)GIF=1.027;图中圆点为第一阶段GWAS关联分析-log10P值(纵轴)在染色体上碱基物理位置(横轴)的分布。图6第一阶段GWAS排除次要人群分层样本后关联分析曼哈顿图对PC1,2,4,5,10,15,19进行校正(病例-对照P<0.05);基因膨胀系数(Genomicinflationfactor)GIF=1.033;图中圆点为第一阶段GWAS关联分析-log10P值(纵轴)在染色体上碱基物理位置(横轴)的分布。-20- 中国汉族人群肺结核病宿主基因易感性全基因组关联分析研究图7第一阶段GWAS所有样本qq-plot分析图图中圆点表示为第一阶段关联分析观测-log10P(纵轴)与预期-log10P值(横轴)的关系。图8第一阶段GWAS排除次要分层人群样本后的qq-plot分析图图中圆点为第一阶段关联分析观测-log10P值(纵轴)与预期-log10P值(横轴)的关系。-21- 第二军医大学硕士学位论文表2第一阶段GWAS研究选择的候选SNPSNPID染色体碱基位置OR值P值rs119654526301197811.3857.67E-07rs692515861259818871.3171.24E-06rs292436297070811.4865.51E-06rs801611014465296591.2458.44E-06rs93091122440233930.641.29E-05rs1258628514776998561.311.87E-05rs28466119466239600.80772.30E-05rs1099059991049822101.3722.63E-05rs251209811805448331.2963.66E-05rs950710513184218991.2874.40E-05rs144313610541170050.75664.82E-05rs186712511200910090.81914.85E-05rs5320986326860301.2255.11E-05rs283677021392365740.79365.15E-05rs46921984255662490.80775.26E-05rs27006957335741870.81015.62E-05rs184204945785770.80165.65E-05rs1221897810159359620.65035.65E-05rs599763722291249501.2186.24E-05rs80543771628294050.86.24E-05rs93939546293903301.3047.08E-05rs188842821266154180.81937.32E-05rs1413520148131560.75287.34E-05rs270065556033381.2187.52E-05rs28583316327892550.82488.70E-05rs125081864151575131.3738.88E-05rs20749071628086420.79228.93E-05rs649380915537919331.2229.29E-05rs733468413762471570.8029.44E-05rs77936277356971700.81439.87E-05rs17915814950433631.2789.90E-05rs247852812289300191.2319.98E-05rs654119912170055841.2151.03E-04-22- 中国汉族人群肺结核病宿主基因易感性全基因组关联分析研究rs800731208439401.2191.03E-04rs948563061027329851.2441.10E-04rs676260531418795591.2571.14E-04rs27430410252870121.2131.14E-04rs486221041846368271.2081.23E-04rs107518671023390640.82531.38E-04rs37427718522800610.8231.48E-04rs28845253533722840.82781.50E-04rs289821313545431171.2211.52E-04rs932104661259090941.2811.53E-04rs796749812743870170.81191.54E-04rs665050514503435241.241.56E-04rs293521412111931641.211.58E-04rs935551961652881531.2561.61E-04rs124075111444659620.82461.71E-04rs1040665119510534471.2181.74E-04rs1243346514465436160.77131.75E-04rs732712101254569050.79961.77E-04rs2366870101283685881.3121.79E-04rs530587111255696490.77961.79E-04rs755309011617698050.83121.83E-04rs132183316325193400.67512.25E-04rs64574996323069260.83092.31E-04rs192571412267699121.1972.84E-02rs6575836141007490080.90133.71E-02rs778753171288108331.1522.53E-01rs1095651481313219401.0582.71E-01rs71203917329246661.0453.75E-01rs403631634490571.0584.07E-01rs143457919496248121.0464.08E-01rs190044213414036740.96795.17E-01rs9586174788243930.96755.17E-01rs653814012762621360.97956.84E-01-23- 第二军医大学硕士学位论文rs5867169224786781.0148.37E-01rs194863216745489470.98898.56E-01二、第二阶段核心外显子基因扫描第二阶段,我们经CoreExome芯片扫描分型,全基因组关联分析未发现显著位点。由于第二阶段结核病例样本量相对较小,因此我们与第一阶段数据进行固定效应荟萃分析(meta-analysis)。荟萃分析结果中发现两个全基因组显著关联位点(见表3):-11-9rs117435254(Pmeta=1.43×10)和rs7364237(Pmeta=3.26×10)。-24- 中国汉族人群肺结核病宿主基因易感性全基因组关联分析研究表3第一、二阶段荟萃分析中全基因组显著关联SNPGWASDiscoveryAlellesMAFHWEP-valueSNPMajorMinorCasesControlsCasesControlsORSEP-valuers117435254CT0.18690.14750.05130.49151.3950.065734.01E-07rs7364237GT0.24130.19980.15720.7871.3170.059223.32E-06CoreExomeReplicationAlellesMAFHWEP-valueSNPMajorMinorCasesControlsCasesControlsORSEP-valuers117435254CT0.08979660.056458610.06921.648740.1284377.96E-07rs7364237GT0.1261980.09209680.17670.56751.423750.1048131.40E-04Meta-AnalysisSNPSEP-valueGeners117435250.05851267SF3A11.43E-11480.05155939PES1rs73642373.26E-094三、第三阶段基因分型验证第三阶段:我们对从第一阶段数据中选择的68个候选SNP以及26个已发表的关联位点(表4)在独立结核病例样本中进行分型验证。通过第二、三阶段数据荟萃分析,我们已发表的非洲及欧洲人群26个结核病关联SNP进行验证,没有发现显著关-4联位点,荟萃分析后最低P值为9.27×10(rs3218255)。-25- 第二军医大学硕士学位论文表4已发表GWAS显著位点在第二、三阶段基因分型的荟萃分析SNPID染色体碱基位置P值(2期)P值(3期)P值(荟萃)rs321825522358744322.55E-050.629.27E-04rs65458832616257619.17E-040.994.27E-03rs190044213414036744.49E-030.423.85E-02rs233570422055730774.37E-020.961.02E-01rs283785721411388255.79E-02FailedNArs1721775781066824977.60E-020.273.08E-01rs1000560341060637228.01E-020.354.70E-02rs9586174788243938.77E-020.719.71E-02rs205717811323207631.11E-010.582.77E-01rs1095651481313219401.73E-010.681.66E-01rs192571412267699122.26E-010.007.27E-01rs653814012762621362.26E-010.601.90E-01rs5867169224786784.30E-010.623.53E-01rs937352361477428264.56E-010.557.29E-01rs143457919496248124.70E-010.583.67E-01rs433142618184447935.65E-010.061.56E-01rs71203917329246665.65E-010.785.25E-01rs778753171288108336.39E-010.017.93E-02rs1604418907261086.85E-010.344.04E-01rs6575836141007490087.26E-010.756.43E-01rs194863216745489477.46E-010.525.48E-01rs800596214950969068.07E-010.398.21E-01rs403631634490578.89E-010.839.87E-01rs78215658523793158.89E-010.062.73E-01rs473378181313659499.08E-010.747.92E-01rs425730818562601709.32E-010.818.46E-01四、荟萃分析最终,综合三期数据,对第一阶段候选的68个进行固定效应荟萃分析,6个变-5体显示出Pmeta<5×10位点潜在关联位点(表5;图9-13),其中rs532098(Pmeta-10-8=1.47×10)和rs9309112(Pmeta=3.14×10)两个全基因组显著关联位点。然而,SNP-26- 中国汉族人群肺结核病宿主基因易感性全基因组关联分析研究-61rs532098超出HWE平衡(P=7.28×10)。表5三阶段荟萃分析中潜在关联位点SNPID染色体碱基位置P值(GWAS)Pmeta所在或附近基因rs532098¶6326860305.11E-051.47E-10HLA-DRB1(left)HLA-DQA1(right)rs93091122440233931.29E-053.14E-08LRPPRCrs599763722291249506.24E-053.36E-07SEC14L2rs64574996323069262.31E-041.13E-06NOTCH4(left)C6orf10(right)rs28466119466239602.30E-051.28E-06B3GNT8rs28583316327892558.70E-054.32E-05HLA-DQB1(left)HLA-DQA2(right)¶SNPrs532098在第三阶段Sequenom队列中HWE过低(P=7.28e-61)Recombinationrate(cM/Mb)81002r806rs532098●0.8604●●●●●0.6(p−value)●●●●●●●●●●●●●●●●●●●4010●●●●●●●●●●●●●●●●●●●●●●●●●●●●0.4log2●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●−●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●0.2●●●●●●●20●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●0●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●0RheumatoidarthritisSj.gren'ssyndrome223GWAShitsChroniclymphocyticleukemiaNarcolepsy(ageofonset)Wegener'sgranulomatosisomittedNarcolepsy(ageofonset)Periodontitis(CDC/AAP)ATF6BC6orf10HLA−DRAHLA−DRB1HLA−DQA2TAP1HLA−DMAFKBPLHCG23HLA−DRB5HLA−DQB1HLA−DOBHLA−DMBPRRT1BTNL2HLA−DRB6HLA−DQB2BRD2LOC100507547HLA−DQA1TAP2HLA−DOAPPT2PSMB8HLA−DPA16genesPPT2−EGFL8PSMB8−AS1HLA−DPB1omittedEGFL8PSMB9AGPAT1LOC100294145MIR6721RNF5RNF5P132.232.432.632.833MIR6833Positiononchr6(Mb)AGER图9第一阶段数据rs532098上下游400kb视野作图图中菱形点为第一阶段关联分析-log10P值在染色体上碱基物理位置的分布;连锁不平衡(LD)相关程度通过不同颜色表示。本图使用LocusZoom软件绘制完成;疾病相关信息来自GWAScatalog;基因信息来自UCSC基因组浏览器。-27- 第二军医大学硕士学位论文8r21000.80.680Recombinationrate(cM/Mb)60.40.2rs9309112●●●60●●4●(p−value)●●●10●●●●●●40log−●●2●●●●●●20●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●0●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●0Cholesterol,totalHeight14GWAShitsLDLcholesterolomittedDNAmethylation(variation)LDLcholesterolTHADAPLEKHH2ABCG5LRPPRCPPM1BPREPLLOC728819ABCG8SLC3A1DYNC2LI1CAMKMT43.84444.244.444.6Positiononchr2(Mb)图10第一阶段数据rs9309112上下游400kb视野作图图中菱形点为第一阶段关联分析-log10P值在染色体上碱基物理位置的分布;连锁不平衡(LD)相关程度通过不同颜色表示。本图使用LocusZoom软件绘制完成;疾病相关信息来自GWAScatalog;基因信息来自UCSC基因组浏览器。82100rRecombinationrate(cM/Mb)0.88060.60.4●60rs5997637●0.24●●●(p−value)10●●●●40log●●●●●−●●●●2●●●●●●●●●●●●●●●●●●●●●●20●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●0●●●●●●●●●●●●●●●●●●0LDLcholesterolRheumatoidarthritisWilmstumor8GWAShitsCoronaryarterycalcificationomittedAdverseresponsetochemotherapy(neutropenia/leucopenia)(gemcitabine)MTMR3HORMAD2LIFSF3A1SEC14L3PES1OSBP2MIR6818OSMCCDC157SDC4PTCN2MIR3200LOC101929664GATSL3SEC14L2SEC14L6DUSP18TBC1D10AMTFP1GAL3ST1KIAA1656SEC14L4SLC35E4RNF21530.430.630.83131.2Positiononchr22(Mb)图11第一阶段数据rs5997637上下游400kb视野作图图中菱形点为第一阶段关联分析-log10P值在染色体上碱基物理位置的分布;连锁不平衡(LD)相关程度通过不同颜色表示。本图使用LocusZoom软件绘制完成;疾病相关信息来自GWAScatalog;基因信息来自UCSC基因组浏览器。-28- 中国汉族人群肺结核病宿主基因易感性全基因组关联分析研究Recombinationrate(cM/Mb)81002r8060.8●rs64574996040.6●●●●●(p−value)●●●●●●●●●●●●●●●●●●●40100.4●●●●●●●●●●●●●●●●●●●●●●●●●●log2●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●−●0.2●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●20●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●0●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●0Rheumatoidarthritis214GWAShitsChroniclymphocyticleukemiaNarcolepsy(ageofonset)omittedNarcolepsy(ageofonset)CLIC1NEU1CFBTNXBPPT2C6orf10HLA−DRAHLA−DRB1MSH5SLC44A4DXOATF6BHCG23HLA−DRB5HLA−DQB1MSH5−SAPCD1NELFEFKBPLBTNL2HLA−DRB6SAPCD1EHMT2STK19PRRT1HLA−DQA1VWA7C2C4ALOC10050754712genesVARSZBTB12C4BPPT2−EGFL8omittedLSM2LOC102060414EGFL8HSPA1LMIR1236AGPAT1HSPA1ASKIV2LMIR6721HSPA1BC4B_2RNF5C6orf48CYP21A2RNF5P131.83232.232.432.6SNORD48CYP21A1PMIR6833Positiononchr6(Mb)SNORD52TNXAAGER图12第一阶段数据rs6457499上下游400kb视野作图图中菱形点为第一阶段关联分析-log10P值在染色体上碱基物理位置的分布;连锁不平衡(LD)相关程度通过不同颜色表示。本图使用LocusZoom软件绘制完成;疾病相关信息来自GWAScatalog;基因信息来自UCSC基因组浏览器。82100rRecombinationrate(cM/Mb)0.88060.6rs284661●0.460●●●●●●●●●(p−value)4●0.210●40log●−●2●●20●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●0●●●●●●●●●●●●●●●●●●●●●●●●●0MigraineProstatecancer1GWAShitPriondiseasesSchizophreniaomittedHeightCYP2B7PCYP2F1AXLTGFB1ERICH4CEACAM21CEACAM5LYPD4CYP2B6CYP2S1CCDC97B3GNT8CEACAM4CEACAM6CD79ACYP2A13HNRNPUL1BCKDHACEACAM7CEACAM3B9D2PCAT19DMRTC2TMEM91LOC101927931RPS19EXOSC5MIR6797ATP5SLARHGEF141.641.84242.242.4Positiononchr19(Mb)图13第一阶段数据rs284661上下游400kb视野作图图中菱形点为第一阶段关联分析-log10P值在染色体上碱基物理位置的分布;连锁不平衡(LD)相关程度通过不同颜色表示。本图使用LocusZoom软件绘制完成;疾病相关信息来自GWAScatalog;基因信息来自UCSC基因组浏览器。-29- 第二军医大学硕士学位论文讨论与结论依据我们GWAS第一阶段数据,我们没有发现严格意义上的全基因组显著位点-8(P<5×10),但在6号、22号等染色体上发现可能关联性趋势,因此我们选择了P-5<5×10的潜在关联位点接近的周围和的位点,中选择了68个候选SNP进行后续验证。我们将第一、二阶段数据进行固定效应荟萃分析(meta-analysis),发现-11-9rs117435254(Pmeta=1.43×10)和rs7364237(Pmeta=3.26×10)两个全基因组显著关联位点。Rs117435254位于SF3A1基因内含子区域。SF3A1基因编码的剪接因子3a中蛋[56]白复合物的亚单位。该剪接因子3A异源三是成熟的U2小核糖核蛋白颗粒(核蛋[57]白)的一个组成部分。U2小核核糖起到剪接组件和前mRNA剪接的关键作用。SF3A1相关的途径是基因表达和mRNA剪接途径。基因注释包括多聚(A)RNA结[58]合。目前并未报道其与肺结核和类似感染性疾病的直接关联。Rs7364237位于PES1基因内含子区域。PES1基因该基因编码一个包含相关基因1(BRCA1)的C末端相互作用域的乳腺癌的核蛋白。所编码的蛋白质与核糖体合成[59]蛋白BOP1和WDR12相互作用形成的PeBoW络合物。PeBoW络合物对rRNA的预处理和60S核糖体亚基成熟相关的细胞增殖起这至关重要的作用。这个基因的表达[60]可能在乳腺癌细胞增殖和致瘤性中具有重要作用。研究发现该基因选择性剪接的转录物编码多种亚型变体。相关的疾病包括黄甲综合征(Yellownailsyndrome)和书[61]写困难。基因注释包括多聚(A)RNA结合和核蛋白复合物结合。目前并未报道[62]其与肺结核和类似感染性疾病的直接关联。-10我们对三阶段研究数据进行荟萃分析,得到rs532098(Pmeta=1.47×10)和-8rs9309112(Pmeta=3.14×10)两个全基因组显著关联位点。Rs9309112位于基因LRPPRC基因内含子区。LRPPRC基因编码一个具有多个三[63]角状五肽重复富含亮氨酸的蛋白(PPR)。这种蛋白的确切作用尚不可知,但研究表明,它可能参与细胞骨架组织作用,膜泡运输,核基因和线粒体基因的转录调控。该蛋白质主要定位于线粒体和被预测为具有N-末端线粒体靶向序列。与LRPPRC相关的疾病包括Leigh综合征,先天性乳酸酸中毒有关。基因注释包括聚(A)RNA结[64]合和泛素连接酶蛋白结合。目前并未报道其与肺结核存在关联。Rs532098位于MHC区域基因间区。HLA分子通过主要组织相容性复合体(MHC)[70]编码。它们不仅具有极高的多样性,还具有抗原呈递和诱发特异性免疫应答的功能。因此,我们合理的认为HLA是感染表型关联的候选基因。一项纳入了22项研究-30- 中国汉族人群肺结核病宿主基因易感性全基因组关联分析研究的关于HLA抗原荟萃分析研究表明,HLAI类B型基因B13等位基因在几乎所有原始研究和荟萃分析中与肺结核存在显著相关(P≤0.0001)。HLADR3和DR7表现出对结核病的相对保护性作用(P=0.002和P≤0.0001),而DR8则增加结核的患病风险(P=0.003)。SNPrs532098位于MHC区域HLA-DRB1与HLA-DQA1基因间区,提示该SNP与HLAⅡ类分子功能相关。但由于第三阶段样本中该SNP的超出-61HWE平衡(P=7.28×10)。这有可能由于样本抽样误差导致,也有可能是Sequenom质谱分型的问题,需要进一步Taqman探针PCR对该队列人群进行重新分型来验证,甚至需要更大样本量的独立人群来进行验证。由于MHC区域的高多样性,我们对该区域的分型存在很大难度。随着技术的不断发展,我们也许可以通过基因靶向测序或基因型推演的技术对该区域进行精细作图,试图验证该位点与结核感染之间的潜在关[65]联。通过第二、三阶段数据荟萃分析,我们对已发表的非洲及欧洲人群26个结核病关联SNP进行验证,没有发现显著关联位点,因此这些位点并未在本研究人群中得到证实。说明在不同种族人群之间存在易感性差异,也可能说明本研究的样本量以及[67]目前的统计学方法还不足以探测到潜在的假阴性结果。以上结论仍需更多设计更大规模的遗传学研究及生物功能研究来证实。开展肺结核宿主遗传学研究的主要是为了剖析导致结核病易感性和抗性的差异的根本基因型[68]差异,以便研究更好的防治对策。目前的研究结果证实了基因多态性和疾病表型之间存在一定关联。但是相比其他疾病的GWAS研究,肺结核病的遗传学研究并不理[69]想,需要更完善的技术与研究设计。-31- 第二军医大学硕士学位论文综述成年人肺结核病的宿主遗传学研究进展一、引言早期观测研究、候选基因研究以及近期兴起的全基因组关联分析研究皆表明,宿[70]主遗传易感性是结核病易感性的主要影响因素之一。由于诸多限制,候选基因研究结果的价值常常被质疑因,例如,缺乏足够统计学效力,样本量过小,独立群体研究结果缺乏可重复性,甚至出现相反的验证结果。因此,人们寄希望于新兴发展的全基因组关联方法。然而,在全基因组关联分析研究中获得的结果远低于最初预期,提示需要进一步增加样本量(例如,通过荟萃分析)并增加整个人类基因组研究的遗传[71]变异体覆盖密度。总体来说,迄今发现传染性疾病(尤其是肺结核)相关遗传变异体数量甚少。其另一个主要原因可能是传染性疾病影响繁殖成功率并参与了人类的自然选择。迄今为止大多全基因组关联分析的所发现的显著信号往往存在于基因组非[72]编码区或基因间区。这些变异体很多有可能仅仅是替代标记而已,而真正的致病遗传变异的发现及的相关因素的功能注释亟待关注。本文简要探讨了在探寻结核宿主[73]易感性因素的过程中进行的宿主遗传学研究和最新科学技术手段。二、概况传染性疾病影响人类健康和育龄期前的存活率,是最影响人类自然选择和改变人[74-75]群遗传结构最强源动力之一。在过去的几十年中,研究者对宿主遗传背景对传染病易感性的影响产生了浓厚兴趣,越来越多的研究者试图深入探讨和解密其中的关联[76]。随着人类基因组学的新技术和统计工具的出现,我们可以通过这些技术手段更[77]加深入具体的探索关联遗传变异以及遗传变异功能相关性的评估。这项研究的目的旨在确定相关性基因以及发现影响感染的通路,从而指定干预对策。目前突出问题在于:为什么某些个体对某种感染病原体易感,而另一些个体却可以耐受感染或具有保护性?三、遗传流行病学:结核病宿主遗传因素这一问题首先通过遗传流行病学研究提出。早在1982年,遗传流行病学作一门学科被创立,旨在描述病因与发病的相互互作,控制相关个体间的疾病发生,并试图[78]了解疾病更大社区及人群中的遗传特性。传染性疾病易感性的理论是基于对家族聚集性和成人以及他们的亲生和收养子-32- 中国汉族人群肺结核病宿主基因易感性全基因组关联分析研究[79]女的研究。研究者对传染病,特别是结核病,的遗传学及社会环境因素对人群死亡率的影响进行了研究。研究父母的亲生子女中发生相同传染病所导致的死亡风险明[80]显高于领养子女(比值比[OR]5.81)。这些发现表明感染表型存在遗传背景。1928年,结核病易感性具有遗传性的假设被一场发生在德国吕贝克的疫苗接种事故证实。结核分枝杆菌的毒力株被错误地发放,并作为结核病疫苗注射给新生儿。在251例进行接种的婴幼儿中,212例表现出结核病症状,77的新生儿死于该病,而[81]他们中有39例并没有发展结核病,也没有表现出任何临床症状。值得注意的是,所有的孩子都收到了相同剂量的强毒力分枝杆菌。这场疫苗之祸了新概念的提出:基[82]因控制的固有免疫和适应性免疫应答可能控制了结核感染的表型。随后,为了试图更精确地确定影响结核病表型的遗传组分,研究者进行了同卵及异卵双生子的比较研究。这些早期研究的作者们清楚认识到感染病菌非常相似背景甚至相同背景以及相似环境和社会条件的必要性。在同卵双胞胎中,结核病的符合率为66%,而异卵双胞胎的一致性只有23%。非孪生兄弟姐妹之间的一致率和异卵双胞[83-89]胎相近。值得注意的是,早期研究对研究设计的要求并没有现在严格,因此可能[90-92][79,80]导致重大的研究缺陷。这些缺陷在“Prophit调查”中得到了极大程度的解决,并对双生子研究数据进行了重新分析。该研究除了进一步证实同卵和异卵双胞胎之间发病一致性的差异,还揭示环境和其他因素也会影响发病(同卵双胎通常共同居住;女性双胞胎发病比例较高,且病例痰菌阳性结果比例较高;同卵双胞胎的父母结核病发病率较高)。因此,结核病作为一种“部分遗传性病”的概念被更强的印证。随后这[93]一概念又被结核病易感性种族差异观察研究所支持。基于这些早期的观察和研究,[94]遗传流行病学和统计遗传学领域飞速发展。四、结核病候选基因研究肺结核宿主遗传因素研究主要着眼于候选基因的研究,而不是家族全基因组连锁[95,96]分析,后者被证明较强基因变异的探索中更有用。单基因孟德尔疾病主要由遗传变异产生的较强效果所致,因此非常适合连锁分析。相比之下,复杂疾病研究的表型变异预期影响变异相对较低。因此,连锁研究中有限数量的基因标记方法明显限制[97-100]了其在研究多基因作用情况下的统计功效和分辨能力。另一个剖析分枝杆菌疾病易感性的方法是分析在易患广义感染如卡介苗炎(BCGitis)或其他巨噬细胞胞内病原体的候选基因研究对象中研究分支杆菌病(Mycobacterialdisease,MSMD)的孟德尔易感性。虽然这一想法引发的研究主要集中在γ干扰素受体(IFNGR)途径上的相关基因,但他并未从广义的人类结核病易感性上给出解释。缺乏令人信服的证据的原因可能是选定家系的数量有限,也可能是被鉴定为与MSMD相关重要的遗传变异-33- 第二军医大学硕士学位论文[101]体在人群整体中并不显著,尤其是罕见突变。研究者对候选基因研究的偏好,是由于其他方法需要大量结核患病亲属以及多例[102]罹患结核病家庭进行连锁分析,这往往对方法学要求较高。候选基因研究已经被广泛应用于传染病和非传染病的遗传学研究,研究已经发表大量结核病候选基因的。尽管结核病存在许多表型,如肺结核,肺外结核,幼儿结核病,原发和复发结核,但大多数遗传研究都集中在成人肺结核。候选基因的研究大多着眼于与一个特定的疾病表型和双等位基因变异之间的关联。这些变异不仅仅包括单核苷酸多态性(SNP),还包括其他类型的突变,如缺失、插入和拷贝数变异(CNV)。大多数这些研究主要[103]集中在编码区变体、剪接位点和启动子。候选基因研究中所研究基因的选择主要基于已知研究或根据功能相关性的假设。[104]因此,候选基因的研究大多是由一个先验假设驱动的。这种类型的研究中包括对先前候选基因研究中获得结果的验证。在候选基因研究的一个显著结果的进一步确认,进一步确认该基因在其他种族人群的表型相关性,甚至与病原体的相关性。[96]研究首先发现了的小鼠NRAMP1基因易感性分枝杆菌病的关联后后,NRAMP1(有名:溶质载体家族11,solutecarrierfamily11,SLC11A1,编码天然抗性相关巨噬细[105]胞的蛋白1)成为第一个被深入研究的结核病相关候选基因。SLC11A1参与巨噬细胞活化,中性粒细胞功能和先天免疫等其他功能。许多研究团队都试图证实结核病易感性与SLC11A1变异的关联。例如,研究在加拿大大型原住民家族中证实,结核[106]病与染色体2q35(包括SLC11A1)相关联。一项荟萃分析研究提示SLC11A1基[99]因多态性可能确实影响了结核病易感性。研究特别针对3’-非翻译区(UTR)变体(rs17235416)、等位变异体D543N(rs17235409)、INT4(rs3731865)和5’-(GT)n变异体(rs17235416)进行了分析,OR值为1.23至1.35之间。这证实这些变异体参与易感因素的作用。然而,不同种族人群对上述变异体的研究结果相互矛盾。多数候选基因研究都存在样本量小的根本问题,包括许多被纳入在上述SLC11A1荟萃分[107]析的研究。后来的研究证实,NRAMP1对小鼠的结核病抗性仅存在有限的相关性。HLA分子通过主要组织相容性复合体(MHC)编码。它们不仅具有极高的多样性,还具有抗原呈递和诱发特异性免疫应答的功能。因此,我们合理的认为HLA是[108]感染表型关联的候选基因。一项纳入了22项研究的关于HLA抗原荟萃分析研究表明,HLAI类B型基因B13等位基因在几乎所有原始研究和荟萃分析中与肺结核存在显著相关(P≤0.0001)。HLADR3和DR7表现出对结核病的相对保护性作用(P=0.002和P≤0.0001),而DR8则增加结核的患病风险(P=0.003)。当候选基因研究之间存在截然不同的结果,往往比较难以找到合适的验证群体进行确认或反驳。这种情况下,候选基因研究的结果可以通过功能实验进一步证实预先假设。-34- 中国汉族人群肺结核病宿主基因易感性全基因组关联分析研究一项甘露糖结合凝集素2(MBL2)变异对加纳人群结核病易感性的病例对照研究就[109]是一个很好的例子。MBL是一种胞浆调理素和胶原凝集素家族的一部分。MBL在对接触微生物病原体免疫反应的初始阶段中起重要作用。MBL通过结合病原体表面碳水化合物激活吞噬作用,并通过其他机制激活补体凝集素途径。MBL2外显子1的密码子52,54和57(rs5030737,rs1800450,rs1800451)等遗传变异会导致其结构上的结合缺陷。,假设隐性遗传模式的情况下,上述加纳人群结核病病例对照研究[110]表明MBL2G57E变异肺结核存在保护性相关(OR=0.60,P=0.008)。该研究发现这一变异与枝非洲分枝杆菌(mycobacterialcladeM.africanum)引起感染存在特异性相关。该关联在功能结合试验得到证实,其中非洲分枝杆菌比狭义结核分枝杆菌属的菌株更有效的结合的人MBL。通过阳性选择,肺结核可能通过非洲分枝杆菌推动了缺陷性MBL在非洲地区扩散。非洲肺结核患者MBL2变异的研究证实了的病原[111]体遗传因素互补分析分的合理性和可行性。而在其他基因中,研究结果却并不那么一致。单核细胞趋化蛋白-1(MCP-1)是小型诱导基因家族的成员,主要参与趋化单核细胞到达炎症和感染位点。在加纳人群[98,99]研究中,MCP1启动子等位基因2581G(rs1024611)与结核病抗性显著相关。与此相反,在较小样本量的韩国及墨西哥独立人群研究中,相同变异体显示与临床结核[112]病存在易感性相关。而这已变异在俄罗斯人群研究中即不具有易感性也没有抗性[113]关联,被认为是中性变异。总之,这些研究的结果表明,候选基因研究可能会在独立的研究团队中被证实,如图韩国和墨西哥人群的研究。另一方面,大型研究研究[114]也可能否定较小样本量研究的结果。原则上,比较在受影响和非受影响个体之间等位基因变异的比例似乎很合理。然而,候选基因研究存在很多缺点和弊端。首先,编码基因仅仅代表人类基因组中百分之二,因此候选基因研究只涉及整个基因组的一小部分[115]。第二,对一个基因在研究通路途径的精确功能估计是不完整的。第三,许多结核病候选基因研究进纳入了有限的病例和对照数量。因此,这些研究具有极低的统计效能,导致其报道的基因仅[116]仅存在弱关联性。这种研究也因此容易出现假阳性结果。候选基因研究的黄金标准是足够规模和统计学效能的独立验证研究。然而符合这一标准的结核病研究却很少[117]。候选基因研究存在另一个缺点是阴性报道的缺失,尤其是对于荟萃分析。在搜索候选基因研究报道的显著基因型-表型关联性时,那些得到非显著结果常常不会发表[118]和公布。因此,这些阴性结果不会被纳入到荟萃分析中,造成不可避免的发表偏移。这种发表偏倚需要被重视,以避免多余的研究工作,并减少不必要的科研资源浪[119]费。-35- 第二军医大学硕士学位论文五、全基因组关联分析(GWAS)全基因组关联分析(GWAS)技术在过去十年里取得了实质性进展。大型基因组数据库良好的建立并发展,适当统计工具也不断被开发。第一篇GWAS研究成果与[105]2007年被发表。与候选基因研究相比,GWAS不需要先验假设或任何预先形成的[120]假设,它对包括编码和非编码区在内的整个基因组进行扫描,寻找相关的遗传位点。利用商品化的基因扫描平台或定制的芯片,研究者可以对整个基因组的中数百万个SNP和拷贝数变异(Copynumbervariations,CNV)进行基因分型。在不同的芯片设计中,外显子组阵列是一种比较独特的形式,它几乎覆盖了所有已知的非同义变异。GWAS研究期望是在大型病例对照研究中发现和确定目前未知基因座与病理生理机制和通路之间的关系。截至2014年7月,已发表1900多个GWAS研究,覆盖了众多疾病表型的遗传易感性,发现了上千个SNPs与数百种表型之间的相关性。但[121-124]这些研究大多研究非传染性疾病和高加索血统个体。其中针对感染性疾病的易感性研究包括肺结核,艾滋病,南美锥虫病,乙型肝炎和丙型肝炎进行,幽门螺旋杆菌感染化,人乳头瘤病毒感染,巨细胞和Epstein-Barr病毒,麻风病,疟疾,利[125-127]什曼病,登革热休克综合征,细菌性脑膜炎和流感。在GWAS研究设计中,特别要注意对照的暴露状态,但这往往难以评估。例如,一项重型疟疾研究,对照必需谨慎根据感染状态进行选择,即,轻型疟疾和无症状疟原虫携带者需要从无寄生虫个体区分开。在肺结核,相应的要求:健康对照者需要根据自己暴露状态,胸部X线表现和他们的结核菌素实验(Tuberculinpurifiedproteinderivative(PPD)test)和/或干扰素释放试验(InterferonGammaReleaseAssay,IGRA)状[128]态进行分组。为了获得显著结果,GWAS要求病例和对照的足够样本大小。此外,在高通量-8的遗传变体测试中,应严格应用多个统计检验(Bonferroni校正)。P值等于5×10[129]被认为是一个个共同接受的评估全基因组关联分析结果显著的阈值。在分枝杆菌疾病中,迄今GWAS已在肺结核和麻风病中进行病得到全基因组显[103-105]著性结果。在肺结核中,研究首先在来自加纳的1300多例结核病患者和1900名健康对照中进行。利用AffymetrixSNP芯片6.0测试并分析了全基因组900000个SNP进行了分析。通过初始的GWAS方法,研究发现两个基因组区域与结核易感性或抗性相关联(图1)。研究把加纳研究组的数据与冈比亚小组结核病数据进行的合并时,研究发现了第一个显著关联位点位于18p11染色体的基因间区SNPrs4331426-9[130](OR=1.19,P=6.8×10)。Rs4331426的邻近基因分别是皮肤T细胞淋巴瘤相关抗根1(CTAGE1)和视网膜母细胞瘤结合蛋白8(RBBP8)。但是这两个基因的-36- 中国汉族人群肺结核病宿主基因易感性全基因组关联分析研究功能与在相关的结核途径中起重要作用的任何假设几乎都很难联系起来[130]。第二个基因是通过针对非洲人群的基因型推演获得的。基因型推演是通过“千人基因组计划”等大型基因型基准数据在虚拟环境下推算未被实际分型的SNP基因型频[131]率的技术。基因型推演是根据基因型参考标记数据和SNP的连锁不平衡(LD)来估算SNP基因型。研究者通常利用MACH/MINIMAC或IMPUTE等软件进行基[132]因型推演。通过基因型推演所找到的三个变异rs11031728,rs11031731和rs2057178,位于[133]染色体11p13且之间存在完全连锁不平衡。研究发现它们与结核抗病性有关结。-9变异体rs2057178在加纳的研究组取得相关性最强信号(OR=0.77,P值为2.63×10)。-11在冈比亚,印度尼西亚和俄罗斯人群进行关联性验证,显著性水平增加为P=2.57×10。11号染色体上的SNP与肾母细胞瘤1(WT1)基因距离45kb,并在从网钙蛋白1(Reticulocalbin1,RCN1)基因距离500kb,显然不能与通路相关的结核功能兼容的间隔。一个来自南非的GWAS证实了该11号染色体上的关联(OR0.62,P=-6-6-9[111]2.71×10),并发现了另外23个基因标记,P值范围为4.47×10和8.99×10之间。对于亚洲人群,相对小型的泰国和日本结核病病例对照GWAS研究并没有取得任何令人信服的结果。所发现的“风险”变异位于20q12的基因间区。该位点并没有[112]达到全基因组规模显著性,仅仅是在对参与者的年龄进行分层后才被识别。研究进一步在小型印度尼西亚病例对照队列中进行。研究采用非标准的低分辨率Affymetrix100KSNP芯片,其只包括95000个SNPs。该研究的结果在俄罗斯大型样[113]本中进行了验证,发现了8个提示性关联位点,P值在0.0004-0.006之间。然而,这些调查结果并没有达到全基因组水平显著,且至今没有被验证,仍需确认并等待推定相关遗传区域的精细定位。全基因组关联分析的结果清楚地表明显著关联位点几乎几乎都数量很少,而不是对应于复杂多基因疾病的概念。关联位点往往人类基因组非编码区域,从而难以判断其因果关系和生物学功能。这一问题存在于大多数迄今为止完成的GWAS中,无论[134]是感染性和非感染性疾病。麻风病同样是分枝杆菌导致的传染性疾病。首个两阶段麻风病GWAS在中国人[135]群中进行研究。研究通过Illumina平台进行病例对照组关联分析,获得了多个位于CCDC122,C13orf31,NOD2,TNFSF15,HLA-D和RIPK2基因上的全基因组显[114][115]著关联。另外一个研究提示IL23R和RAB32也是麻风病易感基因。值得注意的是,CCDC122,C13orf31,NOD2,TNFSF15,HLA-DR和RIPK2的相关SNP位[135]点在加纳麻风病人群的的基因研究并未得到证实。-37- 第二军医大学硕士学位论文麻风是非致死性疾病,因此不会影响生育下一代。这意味着,对于麻风易感性的[136]风险变体可以通过生育在基因库保留下来而免遭去除。相反,结核病属于潜在致死疾病,对于结核病的风险变异体可能会由于自然选择随着时间的推移而被消除。基于这些考虑,比较两种分枝杆菌疾病时,我们应该预期结核病和麻风病在获得关联位[137]点的数量和效应量上可能存在很大差异。这也解释了为何目前结核仅仅确定了两个显著位点,但麻风和大多数非传染性疾病易感性位点数量却很多。目前研究结果还提示传染性疾病的风险位点效应量通常较小,因此特别需要大量样本来进行研究。在大多数非传染性疾病也是如此,一些强效应变异体仅仅出现在极个别的疾病中,例如[116]在黄斑变性,其中50%以上遗传性可以被遗传变异解释。六、新一代测序和前景目前,第二代测序(Nextgenerationsequencing,NGS)技术的出现与快速发展[138]为我们解密基因组提供了新的手段。与传统的测序方法的相比,NGS可以让我们对整个基因组进行高效的测序。成百万的片段化DNA元件可以并行测序,然后重新组装起来。测序读取后再和参考基因组进行比对。单个个体和甚至整个研究组的基因[139]组变异性可已被读取,并与相关表型进行关联研究。然而时至今日,大部分遗传流行病学还是大样本病例对照研究研究。而这些研究[140]应用NGS的成本依然很高,一般研究无法负担。由于NGS实验成本的快速下降,此类应用全基因组测序研究基因易感性的大型遗传流行病学研究在不久的将来成为可能。如果这样的设想实现,基因组所有的基因变体中都会在测序数据中显示,进一步的精细作图实验将不再必要。但我们依然需要进一步确定真正的致病变异及其功能对表型的影响。七、结论传染性疾病受到多因素影响是显而易见的。这些因素包括环境条件,行为因素,病原体(包括病原体基因组和基因组变异,与宿主易感性的相互作用)和传播特点等。因此,当我们试图评估表型的遗传背景和自然选择的标记时,我们需要一个最准确评估病例和对照特性的标准和体系。到目前为止,遗传流行病学研究,主要在候选基因研究中,已经取得了了一系列的成果,但是这些结果是在大多数情况下不能被成功重复。然而,我们不能对候选基因全盘否定。独立研究组验证成功(有效的统计学意义)的大样本候选基因研究依然是合理且可信的。CCR5基因突变CCR5del32的研究就是为我们提供了一个有说服力[141]的例子。携带该位点纯合变异体的个体几乎完全不被HIV-1感染。-38- 中国汉族人群肺结核病宿主基因易感性全基因组关联分析研究遗憾的是,结核病候选基因研究并没有发现类似艾滋病那样令人信服的研究结果。与此相反,全基因组基因分型的应用已经发现在染色体基因间区域存在疾病强相关联的位点。这些结果已经在独立样本中被证实,如图冈比亚,马拉维,印度尼西亚和俄罗斯人群。现在研究者们正在试图解释这些变异体和低研究表型生物学作用,进一步解释其对发病机制的影响。随着研究这种复杂多基因疾病的样本量的增加,未来预计[142]会有更多、更强的疾病相关联位点被发现。目前,国际结核病宿主遗传学协会正在进行肺结核全基因组数据多重大型荟萃分析。除了SNP以外,该分析还纳入了新一代测序研究中发现的多重形态的相关性变异。-39- 第二军医大学硕士学位论文参考文献[1]ZumlaA,RaviglioneM,HafnerR,vonReynCF.Tuberculosis.TheNewEnglandjournalofmedicine.2013;368(8):745-55.[2]全国第五次结核病流行病学抽样调查技术指导组,全国第五次结核病流行病学抽样调查办公室.2010年全国第五次结核病流行病学抽样调查报告.中国防痨杂志.2012,V34(8):485-508.[3]MollerM,HoalEG.Currentfindings,challengesandnovelapproachesinhumangeneticsusceptibilitytotuberculosis.Tuberculosis.2010;90(2):71-83.[4]MeyerCG,ThyeT.Hostgeneticstudiesinadultpulmonarytuberculosis.Seminarsinimmunology.2014;26(6):445-53.[5]WorldHealthOrganization.GlobalTuberculosisReport2014.Geneva,Switzerland:WHO,2015.[6]Galagan,J.E.Genomicinsightsintotuberculosis.NatRevGenet,2014,15,307-20.[7]Ingram,V.M.Aspecificchemicaldifferencebetweentheglobinsofnormalhumanandsickle-cellanaemiahaemoglobin.Nature,1956,178(4537):792–794.[8]JChang,J.C.,Kan,Y.W.Beta-thalassemia,anonsensemutationinman.ProceedingsoftheNationalAcademyofSciencesoftheUnitedStatesofAmerica,1979,76(6):2886–2889.[9]Hamosh,A.,King,T.M.,Rosenstein,B.J.,Corey,M.,Levison,H.,Durie,P.,etal.CysticfibrosispatientsbearingboththecommonmissensemutationGly----Aspatcodon551andthedeltaF508mutationareclinicallyindistinguishablefromdeltaF508homozygotes,exceptfordecreasedriskofmeconiumileus.AmericanJournalofHumanGenetics,1992,51(2):245–250.[10]Wolf,A.B.,Caselli,R.J.,Reiman,E.M.,Valla,J..APOEandneuroenergetics:AnemergingparadigminAlzheimer'sdisease.NeurobiologyofAging,2012,34(4):1007–17.[11]ThyeT,VannbergFO,WongSH,Owusu-DaboE,OseiI,GyapongJ,etal.Genome-wideassociationanalysesidentifiesasusceptibilitylocusfortuberculosisonchromosome18q11.2.NatGenet,2010,42(9):739–741.[12]ThyeT,Owusu-DaboE,VannbergFO,vanCrevelR,CurtisJ,SahiratmadjaE,etal.Commonvariantsat11p13areassociatedwithsusceptibilitytotuberculosis.NatGenet,2012,44(3):257–259.[13]CurtisJ,LuoY,ZennerHL,Cuchet-LourencoD,WuC,LoK,etal.SusceptibilitytotuberculosisisassociatedwithvariantsintheASAP1geneencodingaregulatorofdendriticcellmigration.Naturegenetics.2015;47(5):523-7.[14]WangX,TangNL,LeungCC,KamKM,YewWW,TamCM,etal.AssociationofpolymorphismsintheChr18q11.2locuswithtuberculosisinChinesepopulation.Humangenetics.-40- 中国汉族人群肺结核病宿主基因易感性全基因组关联分析研究2013;132(6):691-5.[15]JiLD,ChaiPF,ZhouBB,TangNL,XingWH,YuanF,etal.Lackofassociationbetweenpolymorphismsfromgenome-wideassociationstudiesandtuberculosisintheChinesepopulation.Scandinavianjournalofinfectiousdiseases.2013;45(4):310-4.[16]PriceAL,PattersonNJ,PlengeRM,WeinblattME,ShadickNA,ReichD.Principalcomponentsanalysiscorrectsforstratificationingenome-wideassociationstudies.Naturegenetics.2006;38(8):904-9.[17]PurcellS,NealeB,Todd-BrownK,ThomasL,FerreiraMA,BenderD,etal.PLINK:atoolsetforwhole-genomeassociationandpopulation-basedlinkageanalyses.Americanjournalofhumangenetics.2007;81(3):559-75.[18]Yang,J.,Lee,S.H.,Goddard,M.E.,Visscher,P.M.GCTA:atoolforgenome-widecomplextraitanalysis.AmJHumGenet,2011,88,76-82.[19]KuCS,LoyEY,PawitanY,ChiaKS.Thepursuitofgenome-wideassociationstudies:wherearewenow?JHumGenet,2010,55(4):195–206.[20]McCarthyMI,AbecasisGR,CardonLR,GoldsteinDB,LittleJ,IoannidisJPA,HirschhornJN.Genome-wideassociationstudiesforcomplextraits:consensus,uncertaintyandchallenges.NatRevGenet,2008,9(5):356–369.[21]VisscherPM,BrownMA,McCarthyMI,YangJ.FiveyearsofGWASdiscovery.AmJHumGenet,2012,90(1):7–24.[22]KleinRJ,ZeissC,ChewEY,TsaiJY,SacklerRS,HaynesC,etal.Com-plementfactorHpolymorphisminage-relatedmaculardegeneration.Science,2005,308(5720):385–389.[23]TheWellcomeTrustCaseControlConsortium.Genome-wideassociationstudyof14,000casesofsevencommondiseasesand3,000sharedcontrols.Nature,2007,447(7145):661–678.[24]韩建文,张学军.全基因组关联研究现状.遗传,2011,33(1):25–35.[25]WorldHealthOrganization.Globaltuberculosiscontrol2011.Geneva,Switzerland:WHO,2011.[26]QuHQ,Fisher-HochSP,McCormickJB.Knowledgegainingbyhumangeneticstudiesontuberculosissusce-ptibility.JHumGenet,2011,56(3):177–182.[27]SteinCM.Geneticepidemiologyoftuberculosissuscep-tibility:impactofstudydesign.PLoSPathog,2011,7(1):e1001189.[28]YimJJ,SelvarajP.Geneticsusceptibilityintuberculosis.Respirology,2010,15(2):241–256.[29]Ben-SelmaW,HariziH,LetaiefM,BoukadidaJ.Age-andgender-specificeffectsonNRAMP1genepolymorphismsandriskofthedevelopmentofactivetuberculosisinTunisianpopulations.IntJInfectDis,2012,16(7):e543–e550.[30]AtesO,DolekB,DalyanL,MusellimB,OngenG,Topal-SarikayaA.Theassociationbetween-41- 第二军医大学硕士学位论文BsmIvariantofvitaminDreceptorgeneandsusceptibilitytotuberculosis.MolBiolRep,2011,38(4):2633–2636.[31]BonarA,ChmielaM,RozalskaB.Levelofmannose-bindinglectin(MBL)inpatientswithtuberculosis.PneumonolAlergolPol,2004,72(5−6):201–205.[32]MollerM,HoalEG.Currentfindings,challengesandnovelapproachesinhumangeneticsusceptibilitytotuberculosis.Tuberculosis,2010,90(2):71–83.[33]KeichoN,HijikataM,SakuradaS.Humangeneticsusce-ptibilitytotuberculosis.NihonRinsho,2011,69(8):1363–1367.[34]MiaoR,LiJQ,SunZP,XuF,ShenHB.Meta-analysisontheassociationofTIRAPS180Lvariantandtuberculosissusceptibility.Tuberculosis,2011,91(3):268–272.[35]FengWX,Flores-VillanuevaPO,MokrousovI,WuXR,XiaoJ,JiaoWW,SunL,MiaoQ,ShenC,ShenD,LiuF,JiaZW,ShenA.CCL2-2518(A/G)polymorphismsandtuberculosissusceptibility:ameta-analysis.IntJTubercLungDis,2012,16(2):150–156.[36]石彦杰,蒋海山,王群.常见结核病易感基因的研究现状.中华传染病杂志,2012,30(3):189–192.[37]王丹妹,何佟,虞道锐,吉丽敏,莫燕娜.基因多态性与结核病关系的研究进展.现代预防医学,2011,38(13):2570–2571,2574.[38]马麦卷,刘玮,曹务春.结核病易感基因研究进展.中华流行病学杂志,2011,32(7):650–656.[39]CaoS,LuoPF,LiW,TangWQ,CongXN,WeiPM.VitaminDreceptorgeneticpolymorphismsandtuberculosisamongChineseHanethnicgroup.ChinMedJ(Engl),2012,125(5):920–925.[40]ZhangJ,ChenY,NieXB,WuWH,ZhangH,ZhangM,etal.Interleukin-10polymorphismsandtuberculosissusceptibility:ameta-analysis.IntJTubercLungDis,2011,15(5):594–601.[41]CawsM,ThwaitesG,DunstanS,HawnTR,LanNTN,ThuongNTT,etal.TheinfluenceofhostandbacterialgenotypeonthedevelopmentofdisseminateddiseasewithMycobacteriumtuberculosis.PLoSPathog,2008,4(3):e1000034.[42]JallowM,TeoYY,SmallKS,RockettKA,DeloukasP,ClarkTG,etal.Genome-wideandfine-resolutionassociationanalysisofmalariainWestAfrica.NatGenet,2009,41(6):657–665.[43]VanCrevelR,ParwatiI,SahiratmadjaE,MarzukiS,OttenhoffTH,NeteaMG,etal.InfectionwithMycobacteriumtuberculosisBeijinggenotypestrainsisassociatedwithpolymorphismsinSLC11A1/NRAMP1inIndonesianpatientswithtuberculosis.JInfectDis,2009,200(11):1671–1674.[44]ClarkeL,Zheng-BradleyXQ,SmithR,KuleshaE,XiaoCL,TonevaI,etal.The1000GenomesProject:datamanagementandcommunityaccess.NatMethods,2012,9(5):459–462.[45]SciesielskiLK,KirschnerKM,ScholzH,PerssonAB.Wilms'tumorproteinWt1regulatesthe-42- 中国汉族人群肺结核病宿主基因易感性全基因组关联分析研究Interleukin-10(IL-10)gene.FEBSLett,2010,584(22):4665–4671.[46]LewisSJ,BakerI,DaveySmithG.Meta-analysisofvitaminDreceptorpolymorphismsandpulmonarytuberculosisrisk.IntJTubercLungDis,2005,9(10):1174–1177.[47]OttenhoffTH,VerreckFA,HoeveMA,vandeVosseE.Controlofhumanhostimmunitytomycobacteria.Tuber-culosis,2005,85(1−2):53–64.[48]RussellDG.Mycobacteriumtuberculosis:heretoday,andheretomorrow.NatRevMolCellBiol,2001,2(8):569–577.[49]AzadAK,SadeeW,SchlesingerLS.Innateimmunegenepolymorphismsintuberculosis.InfectImmun,2012,80(10):3343–3359.[50]MahasirimongkolS,YanaiH,MushirodaT,Prom-phittayaratW,WattanapokayakitS,PhromjaiJ,etal.Genome-wideassociationstudiesoftuberculosisinAsiansidentifydistinctat-risklocusforyoungtuberculosis.JHumGenet,2012,57(6):363–367.[51]BerryMP,GrahamCM,McNabFW,XuZH,BlochSA,OniT,etal.Aninterferon-inducibleneutrophil-drivenbloodtranscriptionalsignatureinhumantuberculo-sis.Nature,2010,466(7309):973–977.[52]DaiYY,ZhangX,PanHQ,TangSW,ShenHB,WangJM.Finemappingofgeneticpolymorphismsofpulmonarytuberculosiswithinchromosome18q11.2intheChinesepopulation:acase-controlstudy.BMCInfectDis,2011,11:282.[53]JiLD,ChaiPF,ZhouBB,TangNL,XingWH,YuanF,etal.Lackofassociationbetweenpoly-morphismsfromgenome-wideassociationstudiesandtuberculosisintheChinesepopulation.ScandJInfectDis,2013,45(4):310–314.[54]ColhounHM,McKeiguePM,DaveySmithG.Problemsofreportinggeneticassociationswithcomplexoutcomes.Lancet,2003,361(9360):865–872.[55]中国疾病预防控制中心结核病预防控制中心《中华人民共和国卫生行业标准(WS288-2008)——肺结核诊断标准》2008,ICS11.020.[56]TianJ,LiuY,ZhuB,TianY,ZhongR,ChenW,etal.SF3A1andpancreaticcancer:newevidencefortheassociationofthespliceosomeandcancer.Oncotarget.2015;6(35):37750-7.[57]SharmaS,WongpaleeSP,VashishtA,WohlschlegelJA,BlackDL.Stem-loop4ofU1snRNAisessentialforsplicingandinteractswiththeU2snRNP-specificSF3A1proteinduringspliceosomeassembly.Genes&development.2014;28(22):2518-31.[58]RohrmoserM,HolzelM,GrimmT,MalamoussiA,HarasimT,OrbanM,etal.InterdependenceofPes1,Bop1,andWDR12controlsnucleolarlocalizationandassemblyofthePeBoWcomplexrequiredformaturationofthe60Sribosomalsubunit.Molecularandcellularbiology.2007;27(10):3682-94.[59]ChengL,LiJ,HanY,LinJ,NiuC,ZhouZ,etal.PES1promotesbreastcancerbydifferentially-43- 第二军医大学硕士学位论文regulatingERalphaandERbeta.TheJournalofclinicalinvestigation.2012;122(8):2857-70.[60]XieW,QuL,MengL,LiuC,WuJ,ShouC.PES1regulatessensitivityofcolorectalcancercellstoanticancerdrugs.Biochemicalandbiophysicalresearchcommunications.2013;431(3):460-5.[61]NakaguroM,KiyonariS,KishidaS,CaoD,Murakami-TonamiY,IchikawaH,etal.NucleolarproteinPES1isamarkerofneuroblastomaoutcomeandisassociatedwithneuroblastomadifferentiation.Cancerscience.2015;106(3):237-43.[62]OlahovaM,HardySA,HallJ,YarhamJW,HaackTB,WilsonWC,etal.LRPPRCmutationscauseearly-onsetmultisystemmitochondrialdiseaseoutsideoftheFrench-Canadianpopulation.Brain:ajournalofneurology.2015;138(Pt12):3503-19.[63]RuzzenenteB,MetodievMD,WredenbergA,BraticA,ParkCB,CamaraY,etal.LRPPRCisnecessaryforpolyadenylationandcoordinationoftranslationofmitochondrialmRNAs.TheEMBOjournal.2012;31(2):443-56.[64]IntemannCD,ThyeT,NiemannS,BrowneEN,AmanuaChinbuahM,EnimilA,etal.AutophagygenevariantIRGM-261TcontributestoprotectionfromtuberculosiscausedbyMycobacteriumtuberculosisbutnotbyM.africanumstrains.PLoSPathog,2009,5(9):e1000577.[65]NewportMJ.Whyhasn'thumangeneticstoldusmoreabouttuberculosis?IntJTubercLungDis,2009,13(9):1049–1050.[66]VelezDR,HulmeWF,MyersJL,WeinbergJB,LevesqueMC,StryjewskiME,etal.NOS2A,TLR4,andIFNGR1interactionsinfluencepulmonarytuberculosissusceptibilityinAfrican-Americans.HumGenet,2009,126(5):643–653.[67]VelezDR,HulmeWF,MyersJL,StryjewskiME,AbbateE,EstevanR,etal.AssociationofSLC11A1withtuberculosisandinteractionswithNOS2AandTLR2inAfrican-AmericansandCaucasians.IntJTubercLungDis,2009,13(9):1068–1076.[68]SteinCM,ZalwangoS,ChiundaAB,MillardC,LeontievDV,HorvathAL,etal.LinkageandassociationanalysisofcandidategenesforTBandTNFαcytokineexpression:evidenceforassociationwithIFNGR1,IL-10,andTNFreceptor1genes.HumGenet,2007,121(6):663–673.[69]NicolMP,WilkinsonRJ.TheclinicalconsequencesofstraindiversityinMycobacteriumtuberculosis.TransRSocTropMedHyg,2008,102(10):955–965.[70]SirugoG,HennigBJ,AdeyemoAA,MatimbaA,NewportMJ,IbrahimME,etal.GeneticstudiesofAfricanpopulations:anoverviewondiseasesusceptibilityandresponsetovaccinesandtherapeutics.HumGenet,2008,123(6):557–598.[71]KarlssonEK,KwiatkowskiDP,SabetiPC.Naturalselectionandinfectiousdiseaseinhumanpopulations.NatRevGenet2014;15:379–93.[72]ChapmanSJ,HillAV.Humangeneticsusceptibilitytoinfectiousdisease.NatRevGenet-44- 中国汉族人群肺结核病宿主基因易感性全基因组关联分析研究2012;13:175–88.[73]MortonNE.Segregationandlinkageanalysis.ProgClinBiolRes1982;103(PtB):3–14.[74]SørensenTI,NielsenGG,AndersenPK,TeasdaleTW.Geneticandenviron-mentalinfluencesonprematuredeathinadultadoptees.NEnglJMed1988;318:727–32.[75]KaufmannSH.Envisioningfuturestrategiesforvaccinationagainsttuberculo-sis.NatRevImmunol2006;6:699–704.[76]DiehlK,VonVerschuerO.DerErbeinflussbeiderTuberkulose.Jena,Germany:GustavFischer;1933.[77]DehlingerE,KünschM.Zwillingstuberkulose.BeitrklinTbkBd1938;98:275.[78]KallmannFJ,ReisnerD.Twinstudiesonthesignificanceofgeneticfactorsintuberculosis.AmRevTuberc1943;47:549–74.[79]SimondsB.Tuberculosisintwins:areportfortheProphitCommitteeoftheRoyalCollegeofPhysicians.London:PitmanMedicalPublishing;1963.[80]ComstockGW.Tuberculosisintwins:are-analysisoftheProphitsurvey.AmRevRespirDis1978;117:621–4.[81]SteadWW,SennerJW,ReddickWT,LofgrenJP.Racialdifferencesinsuscepti-bilitytoinfectionbyMycobacteriumtuberculosis.NEnglJMed1990;322:422–7.[82]ThyeT,MeyerCG.HumangeneticvariabilityandsusceptibilitytopulmonaryTB.EurRespirMonogr2012;58:38–58.[83]BellamyR,BeyersN,McAdamKP,RuwendeC,GieR,SamaaiP,etal.GeneticsusceptibilitytotuberculosisinAfricans:agenome-widescan.ProcNatlAcadSciUSA2000;97:8005–9.[84]MillerEN,JamiesonSE,JobertyC,FakiolaM,HudsonD,PeacockCS,etal.Genome-widescansforleprosyandtuberculosissusceptibilitygenesinBrazil-ians.GenesImmun2004;5:63–7.[85]AltmüllerJ,PalmerLJ,FischerG,ScherbH,WjstM.Genomewidescansofcomplexhumandiseases:truelinkageishardtofind.AmJHumGenet2001;69:936–50.[86]RischN,MerikangasK.Thefutureofgeneticstudiesofcomplexhumandiseases.Science1996;273:1516–7.[87]RischNJ.Searchingforgeneticdeterminantsinthenewmillennium.Nature2000;405:847–56.[88]BotsteinD,RischN.Discoveringgenotypesunderlyinghumanphenotypes:pastsuccessesformendeliandisease,futureapproachesforcomplexdisease.NatGenet2003;33(Suppl.):228–37.[89]vandeVosseE,HoeveMA,OttenhoffTH.Humangeneticsofintracellularinfec-tiousdiseases:molecularandcellularimmunityagainstmycobacteriaandsalmonellae.LancetInfectDis2004;4:739–49.[90]JorgensenTJ,RuczinskiI,KessingB,SmithMW,ShugartYY,AlbergAJ.Hypothesis-drivencandidategeneassociationstudies:practicaldesignandanalyticalconsiderations.AmJEpidemiol-45- 第二军医大学硕士学位论文2009;170:986–93.[91]VidalSM,MaloD,VoganK,SkameneE,GrosP.Naturalresistancetoinfectionwithintracellularparasites:isolationofacandidateforBcg.Cell1993;73:469–85.[92]BellamyR,RuwendeC,CorrahT,McAdamKP,WhittleHC,HillAV.VariationsintheNRAMP1geneandsusceptibilitytotuberculosisinWestAfricans.NEnglJMed1998;338:640–4.[93]GreenwoodCM1,FujiwaraTM,BoothroydLJ,MillerMA,FrappierD,FanningEA,etal.Linkageoftuberculosistochromosome2q35loci,includingNRAMP1,inalargeaboriginalCanadianfamily.AmJHumGenet2000;67:405–16.[94]LiX,YangY,ZhouF,ZhangY,LuH,JinQ,etal.SLC11A1(NRAMP1)poly-morphismsandtuberculosissusceptibility:updatedsystematicreviewandmeta-analysis.PLoSONE2011;6:e15831.[95]NorthRJ,LaCourseR,RyanL,GrosP.ConsequenceofNramp1deletiontoMycobacteriumtuberculosisinfectioninmice.InfectImmun1999;67:5811–4.[96]KettanehA,SengL,TievKP,etal.Humanleukocyteantigensandsusceptibilitytotuberculosis:ameta-analysisofcase-controlstudies.IntJTubercLungDis2006;10:717–25.[97]ThyeT,NiemannS,WalterK,HomolkaS,IntemannCD,ChinbuahMA,etal.VariantG57EofmannosebindinglectinassociatedwithprotectionagainsttuberculosiscausedbyMycobacteriumafricanumbutnotbyM.tuberculosis.PLoSONE2011;6:e20908.[98]ThyeT,NejentsevS,IntemannCD,BrowneEN,ChinbuahMA,GyapongJ,etal.MCP-1promotervariant-362CassociatedwithprotectionfrompulmonarytuberculosisinGhana,WestAfrica.HumMolGenet2009;18:381–8.[99]IntemannCD,ThyeT,FörsterB,Owusu-DaboE,GyapongJ,HorstmannRD,etal.MCP1haplotypesassociatedwithprotectionfrompulmonarytuberculosis.BMCGenet2011;12:34.[100]Flores-VillanuevaPO,Ruiz-MoralesJA,SongCH,FloresLM,JoEK,Monta˜noM,etal.Afunctionalpromoterpolymorphisminmonocytechemoattractantprotein-1isassociatedwithincreasedsusceptibilitytopulmonarytuberculosis.JExpMed2005;202:1649–58.[101]WellcomeTrustCaseControlConsortium.Genome-wideassociationstudyof14,000casesofsevencommondiseasesand3,000sharedcontrols.Nature2007;447:661–78.[102]http://www.genome.gov/gwastudies/[103]BaldingDJ.Atutorialonstatisticalmethodsforpopulationassociationstudies.NatRevGenet2006;7:781–91.[104]http://www.1000genomes.org/[105]ThyeT,Owusu-DaboE,VannbergFO,vanCrevelR,CurtisJ,SahiratmadjaE,etal.Commonvariantsat11p13areassociatedwithsusceptibilitytotuberculosis.NatGenet2012;44:257–9.[106]ChimusaER,ZaitlenN,DayaM,MöllerM,vanHeldenPD,MulderNJ,etal.Genome-wide-46- 中国汉族人群肺结核病宿主基因易感性全基因组关联分析研究associationstudyofancestry-specificTBriskintheSouthAfricanColouredpopulation.HumMolGenet2014;23:796–809.[107]MahasirimongkolS,YanaiH,MushirodaT,PromphittayaratW,Wat-tanapokayakitS,PhromjaiJ,etal.Genome-wideassociationstudiesoftuberculosisinAsiansidentifydistinctat-risklocusforyoungtuberculosis.JHumGenet2012;57:363–7.[108]PngE,AlisjahbanaB,SahiratmadjaE,MarzukiS,NelwanR,BalabanovaY,etal.AgenomewideassociationstudyofpulmonarytuberculosissusceptibilityinIndonesians.BMCMedGenet2012;13:5.[109]ZhangFR,HuangW,ChenSM,SunLD,LiuH,LiY,etal.Genomewideassociationstudyofleprosy.NEnglJMed2009;361:2609–18.[110]ZhangF,LiuH,ChenS,LowH,SunL,CuiY,etal.IdentificationoftwonewlociatIL23RandRAB32thatinfluencesusceptibilitytoleprosy.NatGenet2011;43:1247–51.[111]MallerJ,GeorgeS,PurcellS,FagernessJ,AltshulerD,DalyMJ,etal.Commonvariationinthreegenes,includinganoncodingvariantinCFH,stronglyinflu-encesriskofage-relatedmaculardegeneration.NatGenet2006;38:1055–9.[112]VittiJJ,GrossmanSR,SabetiPC.Detectingnaturalselectioningenomicdata.AnnuRevGenet2013;47:97–120.[113]MillerLH,BaruchDI,MarshK,DoumboOK.Thepathogenicbasisofmalaria.Nature2002;415:673–9.[114]FlintJ,HardingRM,BoyceAJ,CleggJB.Thepopulationgeneticsofthehaemoglobinopathies.BaillieresClinHaematol1998;11:1–51.[115]KwiatkowskiDP.Howmalariahasaffectedthehumangenomeandwhathumangeneticscanteachusaboutmalaria.AmJHumGenet2005;77:171–92.[116]http://www.ncbi.nlm.nih.gov/SNP/[117]TimmannC,ThyeT,VensM,EvansJ,MayJ,EhmenC,etal.Genome-wideassociationstudyindicatestwonovelresistancelociforseveremalaria.Nature2012;489:443–6.[118]ManolioTA,CollinsFS,CoxNJ,GoldsteinDB,HindorffLA,HunterDJ,etal.Findingthemissingheritabilityofcomplexdiseases.Nature2009;461:747–53.[119]SchizophreniaWorkingGroupofthePsychiatricGenomicsConsortium.Biologicalinsightsfrom108schizophrenia-associatedgeneticloci.Nature2014;511:421–7.[120]NallsMA,PankratzN,LillCM,DoCB,HernandezDG,SaadM,etal.Large-scalemeta-analysisofgenome-wideassociationdataidentifiessixnewrisklociforParkinson’sdisease.NatGenet2014[121]FreedmanML,MonteiroAN,GaytherSA,CoetzeeGA,RischA,PlassC,etal.Principlesforthepost-GWASfunctionalcharacterizationofcancerriskloci.NatGenet2011;43:513–8.-47- 第二军医大学硕士学位论文[122]SheaJ,AgarwalaV,PhilippakisAA,MaguireJ,BanksE,DepristoM,etal.Comparingstrategiestofine-maptheassociationofcommonSNPsatchro-mosome9p21withtype2diabetesandmyocardialinfarction.NatGenet2011;43:801–5.[123]MusunuruK,StrongA,Frank-KamenetskyM,LeeNE,AhfeldtT,SachsKV,etal.FromnoncodingvarianttophenotypeviaSORT1atthe1p13cholesterollocus.Nature2010;466:714–9.[124]McLarenPJ,RipkeS,PelakK,WeintrobAC,PatsopoulosNA,JiaX,etal.Fine-mappingclassicalHLAvariationassociatedwithdurablehostcon-trolofHIV-1infectioninAfricanAmericans.HumMolGenet2012;21:4334–47.[125]LessardCJ,AdriantoI,IceJA,WileyGB,KellyJA,GlennSB,etal.IdentificationofIRF8,TMEM39A,andIKZF3-ZPBP2assusceptibilitylociforsystemiclupuserythematosusinalarge-scalemultiracialreplicationstudy.AmJHumGenet2012;90:648–60.[126]SannaS,LiB,MulasA,SidoreC,KangHM,JacksonAU,etal.Finemappingoffivelociassociatedwithlow-densitylipoproteincholesteroldetectsvariantsthatdoubletheexplainedheritability.PLoSGenet2011;7:e1002198.[127]TomlinsonIP,Carvajal-CarmonaLG,DobbinsSE,TenesaA,JonesAM,HowarthK,etal.MultiplecommonsusceptibilityvariantsnearBMPpathwaylociGREM1,BMP4,andBMP2explainpartofthemissingheritabilityofcolorectalcancer.PLoSGenet2011;7:e1002105.[128]VerbeekEC,BakkerIM,BevovaMR,BochdanovitsZ,RizzuP,SondervanD,etal.Afine-mappingstudyof7topscoringgenesfromaGWASformajordepressivedisorder.PLoSONE2012;7:e37384.[129]MaH,LiH,JinG,DaiJ,DongJ,QinZ,etal.Geneticvariantsat14q24.1andbreastcancersusceptibility:afine-mappingstudyinChinesewomen.DNACellBiol2012;31:1114–20.[130]DaiY,ZhangX,PanH,TangS,ShenH,WangJ.Finemappingofgeneticpolymor-phismsofpulmonarytuberculosiswithinchromosome18q11.2intheChinesepopulation:acase-controlstudy.BMCInfectDis2011;11:282.[131]MarchiniJ,HowieB.Genotypeimputationforgenome-wideassociationstud-ies.NatRevGenet2010;11:499–511.[132]HindorffLA,SethupathyP,JunkinsHA,RamosEM,MehtaJP,CollinsFS,etal.Potentialetiologicandfunctionalimplicationsofgenome-wideassoci-ationlociforhumandiseasesandtraits.ProcNatlAcadSciUSA2009;106:9362–7.[133]ENCODEProjectConsortium.AnintegratedencyclopediaofDNAelementsinthehumangenome.Nature2012;489:57–74.[134]DoolittleWF.IsjunkDNAbunk?AcritiqueofENCODE.ProcNatlAcadSciUSA2013;110:5294–300.[135]SongL,ZhangZ,GrasfederLL,BoyleAP,GiresiPG,LeeBK,etal.Openchromatindefinedby-48- 中国汉族人群肺结核病宿主基因易感性全基因组关联分析研究DNaseIandFAIREidentifiesregulatoryelementsthatshapecelltypeidentity.GenomeRes2011;21:1757–67.[136]O’GeenH,EchipareL,FarnhamPJ.UsingChIP-seqtechnologytogener-atehigh-resolutionprofilesofhistonemodifications.MethodsMolBiol2011;791:265–86.[137]RheeHS,PughBF.Comprehensivegenome-wideprotein–DNAinteractionsdetectedatsingle-nucleotideresolution.Cell2011;147:1408–19.[138]vandeWerkenHJ,LandanG,HolwerdaSJ,HoichmanM,KlousP,ChachikR,etal.Robust4C-seqdataanalysistoscreenforregulatoryDNAinteractions.NatMethods2012;9:969–72.[139]McGettiganPA.TranscriptomicsintheRNA-seqera.CurrOpinChemBiol2013;17:4–11.[140]DeanM,CarringtonM,WinklerC,HuttleyGA,SmithMW,AllikmetsR,etal.GeneticrestrictionofHIV-1infectionandprogressiontoAIDSbyadeletionalleleoftheCKR5structuralgene.Science1996;273:1856–62.[141]SanderJD,JoungJK.CRISPR-Cassystemsforediting,regulatingandtargetinggenomes.NatBiotechnol2014;32:347–55.[142]OzsolakF,MilosPM.RNAsequencing:advances,challengesandopportunities.NatRevGenet2011;12:87–98.-49- 第二军医大学硕士学位论文在读期间发表论文和参加科研工作情况说明1.WangG,MuR,XuH.ManagementofrheumatoidarthritisinPeople’sRepublicofChina–focusontocilizumabandpatientconsiderations.IntJGenMed.2015May12;8:187-942.陈凌,钱锋,叶玲英,林丽,吴歆,李梦梦,刘晓,张志国,张倜,王赓,徐沪济.抗CD74抗体不是汉族人群强直性脊柱炎患者的血清标志物,诊断学理论与实践.2015,14(4)3.唐仕超,王赓,张志国,徐沪济.补体C3、补体C4和C反应蛋白在系统性红斑狼疮活动和感染中的临床价值第二军医大学学报.2016,37(4)(共同第一作者)-50- 中国汉族人群肺结核病宿主基因易感性全基因组关联分析研究致谢白驹过隙,时光荏苒,硕士研究生涯即将以毕业落幕。回首过去的三年,往事历历在目。在老师们的悉心呵护、循循善诱令我受益匪浅,同事和同学给予我关心与帮助也令我倍感温暖。家人给予我无私的关怀也令我不忘初心。首先,三年成长历程中最应该感谢的人是导师徐沪济教授。感谢他在学习生活中对我的帮助,不但完成了课题,还带我走进了科研的大门,教导我做事、做人、做学问的道理。感谢导师在3年的培养中为我创造机会与提供平台,更加感谢导师在提点与指导。再此需要感谢长征风湿免疫科这个优秀的集体。感谢许臻、刘彧、钱锋、吴歆副教授,姜磊、周凌、叶玲英、李婷主治医师,陈凌、林丽、殷健、宋婧、赵娟、卢红娟医师,盛荣护士长,李梦梦、刘晓技师,风湿科每位护理教员及其他各位老师们在我学习期间及课题完成期间给予我的关心、指导和帮助。也真诚感谢魏萌、刘欣、张倜、张志国博士及唐仕超、金茜玫、吴慧珍硕士等各位师兄师姐师弟师妹们。感谢国家疾病控制中心结核病防治所主任赵雁林以及各地协助本课题收集标本的结核病防治所的老师。感谢301医院以及长征医院体检中心的各位老师帮助本课题收集健康标本。感谢每一位参与研究患者和健康对照个体。感谢澳大利亚昆士兰大学和昆士兰科技大学MatthewBrown教授,PaulLeo教授,ZhixiuLi博士等,牛津大学的AdrianCortes博士,感谢各位专家老师为本课题做出的配合与贡献以及对我的悉心指导。最后感谢父母对我的教育和培养,没有你们的悉心呵护和培养,也不会有我的今天。一路走来,收获无数,感受多多,谨以此再次向所有关心、帮助过我的老师、同学和朋友及家人表示衷心的感谢和崇高的敬意!-51-

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
关闭