新一代测序数据的快速可视化方法研究

新一代测序数据的快速可视化方法研究

ID:34711771

大小:2.11 MB

页数:59页

时间:2019-03-09

新一代测序数据的快速可视化方法研究_第1页
新一代测序数据的快速可视化方法研究_第2页
新一代测序数据的快速可视化方法研究_第3页
新一代测序数据的快速可视化方法研究_第4页
新一代测序数据的快速可视化方法研究_第5页
资源描述:

《新一代测序数据的快速可视化方法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、硕士学位论文新一代测序数据的快速可视化方法研究RESEARCHONMETHODOFTHENEXTGENERATIONSEQUENCINGDATAVISUALIZATION韩超哈尔滨工业大学2016年12月万方数据国内图书分类号:TP39学校代码:10213国际图书分类号:004.9密级:公开工程硕士学位论文新一代测序数据的快速可视化方法研究硕士研究生:韩超导师:王亚东教授申请学位:工程硕士学科:计算机科学与技术所在单位:深圳研究生院答辩日期:2016年12月授予学位单位:哈尔滨工业大学万方数据ClassifiedIndex:TP39U.D.C:004.9Dissertationforth

2、eMasterDegreeinEngineeringRESEARCHONMETHODOFTHENEXTGENERATIONSEQUENCINGDATAVISUALIZATIONCandidate:HanChaoSupervisor:Prof.WangYadongAcademicDegreeAppliedfor:MasterDegreeinEngineeringSpeciality:ComputerScienceAndTechnologyAffiliation:ShenzhenGraduateSchoolDateofDefence:Dec.2016Degree-Conferring-Ins

3、titution:HarbinInstituteofTechnology万方数据摘要摘要随着新一代测序技术的成熟,基因组测序数据持续迅猛增长。限制当前基因组数据研究的问题已经不是如何产生数据,而是如何快速地对基因组数据进行分析。把基因组数据进行可视化处理,有利于研究人员更好、更直接地对数据进行观察,发现基因组数据间的内在联系,以及基因组数据中有可能存在的突变等问题。对基因组及其相关注释数据采用可视化的方式进行处理可以很大程度上把研究人员从枯燥繁杂的基因组数据的字符文件中释放出来,节省时间成本,更便于集中精力进行数据的分析工作。以参考基因组数据的坐标为可视化系统的坐标进行展示,较直观地呈现

4、不同序列数据之间存在的关系。现有的基因组可视化系统分为基于WEB和桌面程序两种形式,由于基于WEB的基因组可视化系统受限于网络带宽、传输速度等外在因素,影响可视化系统的速度与用户体验,本文将研究快速基因组可视化的方法,并实现基于桌面程序的基因组可视化系统,该系统小巧便捷,可以更好更快的对数据进行可视化处理,方便个人PC使用。本研究以人类基因组数据的可视化为中心展开,主要研究由变异引起的遗传信息的变化。实现了人类基因组数据、序列比对结构数据的可视化,针对基因组数据突变、反转等常见的变异类型进行可视化呈现的效果更加直观。有利于研究人员进一步研究相关疾病与药物的研制。本系统为研究人员等使用者提

5、供了选择、查找、平移以及放缩等较为丰富的交互操作,并且提出了一种基于B树的存储结构和R树的空间分割理论的针对新一代测序数据文件的索引构建方法,配合文件随机读取算法完成数据的快速读取工作,运用Bresenham画线算法更好地完成了本系统的可视化工作,对可视化响应速度和大跨度进行数据查询时的响应时间提高了近一倍。关键词:基因组;序列比对;索引构建;可视化;变异I万方数据AbstractAbstractAsthenewgenerationofsequencingtechnologymatures,genomesequencingdatasustainedrapidgrowth.Limitcur

6、rentgenomedataresearchquestionisnothowtogeneratedata,buthowtoanalyzethegenomedataquickly.Thegenomedatavisualizationprocessingishelpfulfortheresearcherscanbetterandmoredirectlytoobservethedata,andfindtheintrinsicrelationshipbetweengenomedata,andthepossibilityofmutationsandsoon.Visualprocessingonge

7、nomedataandrelatedannotationdatacanreleasedtheresearchersfromtheboringmultifariousgenomedatacharactersfiles.Soalottimecanbesaved,anditmaketheresearcherscanfocusonthedataanalysis.Thecoordinatesofthereferencegenomedatawe

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。