rna-seq分析流程的完美以及基于rna-seq数据分析新基因在爪蟾发育阶段中的作用

rna-seq分析流程的完美以及基于rna-seq数据分析新基因在爪蟾发育阶段中的作用

ID:33812488

大小:5.48 MB

页数:59页

时间:2019-03-01

rna-seq分析流程的完美以及基于rna-seq数据分析新基因在爪蟾发育阶段中的作用_第1页
rna-seq分析流程的完美以及基于rna-seq数据分析新基因在爪蟾发育阶段中的作用_第2页
rna-seq分析流程的完美以及基于rna-seq数据分析新基因在爪蟾发育阶段中的作用_第3页
rna-seq分析流程的完美以及基于rna-seq数据分析新基因在爪蟾发育阶段中的作用_第4页
rna-seq分析流程的完美以及基于rna-seq数据分析新基因在爪蟾发育阶段中的作用_第5页
资源描述:

《rna-seq分析流程的完美以及基于rna-seq数据分析新基因在爪蟾发育阶段中的作用》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、密级:保密期限:RNA—Seq分析流程的完善以及基于RNA-Seq数据分析新基因在爪蟾发育阶段中的作用ImprovementofpipelineforanalyzingRNA·SeqdataandroleofnewgenesintheembryogenesisofXenopustropicalisrevealedbyRNA-·Seq学号姓名学位类别D201102095徐海波理学硕士(学-r鍪喜当生物化学与分子生物学程领域)士韧K,子刁刀’丁士切子指导教师张亚平院士、研究员吴东东副研究员完成时间2014

2、年4月答辩委员会主席签名独创性声明本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的研究成果。据我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得安徽大学或其他教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示谢意。学位论文作者签名:柱遣;彀\签字日期:20I中年‘月6日学位论文版权使用授权书本学位论文作者完全了解安徽大学有关保留、使用学位论文的规定,有权保留并向国家有关部门或

3、机构送交论文的复印件和磁盘,允许论文被查阅和借阅。本人授权安徽大学可以将学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文。(保密的学位论文在解密后适用本授权书)学位论文作者签名:徒基;良导师签名:签字日期:幼l牛年6月6日签字日期:磊r;月∥.峨y季。,∥年;hjj舷船,W摘要摘要二代测序技术的发展给转录组学的研究带来了巨大的飞跃,扩大了我们对真核生物中转录组的认识。目前RNA-Seq已经成为基因表达和转录组分析的重要手段,广泛被运用于寻找新的转录本

4、、检测基因表达水平变化、研究转录本可变剪接差异、RNA编辑位点变化等方面。RNA—Seq快速发展的同时也给我们带来了挑战——如何处理高通量数据,这对生物信息学带来巨大的挑战。针对有参考基因组的转录组数据的基础分析,Trapndl等人开发了广受欢迎和认可的“Tophm—Cufflinks.Cuffcompare—CuffditT’流程。基于实际使用过程中我们发现的一些问题以及我们科研工作中的需求,我们对这个转录组分析流程进行了修改和补充。通过自编Ped脚本程序,我们做了四个方面完善:①短读段映比对到基因

5、组上的处理:通过读取没有比对到基因组的序列的信息,根据polyA和碱基质量情况对测序序列进行相应处理,然后进行最终的序列比对;②转录本拼装过滤:通过自编Perl脚本程序,利用FPKM值、建库长度、ClassCode及表达量等对不可信转录本进行过滤,并利用比对信息对拼装结果的5’与3’端的位置信息进行校正以及对GENEID进行修改;③长链非编码转录本分析:通过CPC对新拼装的基因进行编码能力评判,再利用白编脚本,提取相应的信息,判断新拼装的基因的编码能力,并通过分析新基因与已知蛋白编码基因的位置关系对I

6、ncRNA进行分类;④可变剪接结构差异分析及可变剪接水平分析:通过Perl脚本编程写了两个分析程序,用来快速检测样本中可变剪切的差异及根据FPKM值计算不同样本中外显子可变剪切水平。上述工作提高了我们后续的数据分析的速度并为相关研究提供了一个很好的解决办法。新基因是生物进化的原材料。研究表明新基因在发育阶段有着重要的功能。胚胎发育阶段存在着大量的表观遗传修饰活动,如H3K4me3显著富集及cpG岛去甲基化,这提供了新基因可能产生于胚胎发育阶段这一可能性。基于上述完善的RNA.Seq数据分析流程,我们分

7、析了热带爪蟾的不同发育时期的转录组数据,并构建了基因共表达网络模块。我们发现年轻新基因显著富集在合子基因组激活(zGA)后的发育阶段,并且随着合子基因组激活后的发育阶段进行,重复新基RNA-Seq分析流程的完善以及基于RNA.Seq数据分析新基因在爪蟾发育阶段中的作用因的富集水平呈现下降趋势,而且这些新基因显示了组织特异性和发育阶段特异性富集。我们的数据支持新基因在发育过程中的重要作用。另外我们还鉴定出一些爪蟾特有的孤儿基因和IncRNA基因,这些基因也显示了组织特异性富集和发育阶段特异性富集,揭示了

8、其组织特异性表达模式。我们的数据支持了前面我们提出的假说,即一些年轻新基因产生于胚胎发育阶段并获得对发育阶段非常重要的新功能。关键词:转录组、爪蟾、重复新基因、IncRNA基因、WGCNAIIAbstractWiththedevelopmentofsciencetechnology,especiallythenextgenerationsequencingtechnology(RNA-Seq),transcriptomicshasmadegreatpro

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。