生物信息学在蛋白质结构与功能预测中的应用

生物信息学在蛋白质结构与功能预测中的应用

ID:32803605

大小:58.48 KB

页数:4页

时间:2019-02-15

生物信息学在蛋白质结构与功能预测中的应用_第1页
生物信息学在蛋白质结构与功能预测中的应用_第2页
生物信息学在蛋白质结构与功能预测中的应用_第3页
生物信息学在蛋白质结构与功能预测中的应用_第4页
资源描述:

《生物信息学在蛋白质结构与功能预测中的应用》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、生物信息学在蛋白质结构预测中的应用摘要:生物信息学是现代生命科学与信息科学、计算机科学、数学、统计学、物理学、化学等学科相互渗透而高度交叉形成的一门新兴前沿学科。随着人类基因组计划的完成,应用生物信息学技术预测蛋白质结构与功能将成为后基因组时代的一项重要任务。本文主要介绍了蛋白质结构与功能预测的基本方法以及国际著名的蛋白质结构预测技术评比CASPo关键词:生物信息学;蛋白质;结构预测生物信息学(bioinformatics)以获取、加工、储存、分配、分析和释读生物信息为手段,综合运用数学、计算机科学和生物学工具,以达到理解数据中的生物学含义的目的。对于蛋

2、白质结构和功能,尽管可以通过实验的方法来实现,但由于目前的蛋白检测技术水平述远远跟不上涌现如潮的新基因的数量,因此利用生物信息学工具快速预测蛋白结构与功能特性,对研究蛋白质组尤其是对那些通过实验难以测定结构的蛋白质分析则具有更大的理论意义与实用价值。蛋白质的空间结构往往决定其功能,因此揭示蛋白质的结构是一项非常有意义的工作。蛋白质是由20余种氨基酸形成的长链,氨基酸之间相互作用有形成一定的空间结构。蛋白质的结构一般分为4类:一级结构,即组成蛋白质的氨基酸序列;二级结构,即骨架原子间的相互作用形成的局部结构,三级结构,即二级结构在更大范围内的堆积形成的空间

3、结构;四级结构主耍描述不同亚基之间的相互作用⑴。根据蛋白质结构分类的不同,现在对蛋白质结构的预测方法主耍集中在二级结构和三级结构两个方面。所谓的蛋白质结构预测就是如何从蛋白质的氨基酸序列预测出其空间结构。由于蛋白质的生物学功能在很大程度上依赖于其空间结构,因而进行蛋白质的结构预测对了解未知蛋白生物学功能具有重要意义⑷。1、蛋白质二级结构预测蛋口质二级结构预测是蛋口质结构预测的关键步骤,在实际工作屮有着广泛的用途:T可用于全新蛋口质的设计或蛋白质突变的设计;@有助于确定蛋口质空间结构与功能的关系;@有助于多维核磁共振屮二级结构的指认以及晶体结构的解析。冃前

4、蛋口质二级结构预测的方法不断涌现,通常有3种类型:基于统计的预测方法、基于知识的预测方法和混合方法等。(1)基于统计的预测方法在基于统计的预测方法中,几种常用的统计方法分别是Chou-Fasman方法,G0R方法⑶、人工神经网络法⑷和最小近邻法同。Chou-Fasman方法对已知品体结构做精细研究后,统计出20种氨基酸在不同二级结构中所处的3种构象(螺旋、折叠以及无规卷曲)的分布频率,同时考虑氨基酸在蛋白质中的相对出现频率以及残基出现在结构中的频率,最后计算出每种氨基酸出现在上述3种构象中的构象参数。由于Chou-Fasman方法有一些规则不够明确,现在

5、使用较少。(1)基于知识的预测方法基于知识的预测方法主要有Lim方法和Cohen方法⑹。Lim方法是一种物理化学的方法,其基木思想主要有两点;一是考虑了氨基酸残基的物理和化学性质,如残基的亲水性、疏水性、带电性以及体积的大小等,二是考虑了邻近残基间的相互作用。该方法不仅考虑到短程相互作用即共价键和离子键等,而且在一定程度上也考虑了长程相互作用,包括范德华力、氢键和疏水作用。Lim方法的预测精度稍高,但这种方法的缺点是难于用通常的计算机语言来实现。Cohen方法主要用于a/P蛋白质的预测,它认为蛋白质是由一个或多个序列上连续的结构域组成,而且每个结构域由a

6、螺旋和0折叠单元组成,结构域的核心是由螺旋亚单元或扩展单元在结构域中通过疏水性残基相互作用。该方法把氨基酸分为疏水性氨基酸、亲水性氨基酸,过渡型氨基酸和带电荷氨基酸,然后根据已知数据库提供的信息找到二级结构与上述分类或其组合的关系。由于分类组合很多,因此该方法比较复杂。(2)混合方法近年来,混合方法在二级结构预测方面的进展比较迅速。混合方法是选择性合并以上提到的各种方法,调整不同方法在预测吋的权重以改善预测的准确率。这些单一预测方法的准确率很多都超过70%,如人工神经网络法和G0R方法,它们在混合方法中都使用得较为广泛。此外,在G0R方法基础上加入同源性

7、信息后,预测方法的准确率也可以得到较大提高⑺。2、蛋白质三级结构预测三级结构预测是蛋白质结构预测的终极目标,目前还没有一种公认的令人满意的预测方法。蛋白质的三维结构预测的一个方向是根据二级结构预测的结果,把可信度较高的二级结构进一步组装搭建出最后的蛋白质空间结构。这种方法虽可构建出一些蛋白质结构,但它依赖于前面的预测结果,受到的限制较多。另一个方向是不依赖二级结构预测的结果,直接从序列预测三维结构,目前该方向是蛋白质结构预测的主要方向。蛋白质结构预测方法有两种主要的分法。比较经典的分类方法是将其分为同源建模方法(HomologyModeling),折叠识

8、别方法(ProteinFoldRecognition)和从头预测(abiniti

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。