基于失衡数据分类模型的药物蛋白质虚拟筛选方法

基于失衡数据分类模型的药物蛋白质虚拟筛选方法

ID:22276476

大小:53.50 KB

页数:5页

时间:2018-10-28

基于失衡数据分类模型的药物蛋白质虚拟筛选方法_第1页
基于失衡数据分类模型的药物蛋白质虚拟筛选方法_第2页
基于失衡数据分类模型的药物蛋白质虚拟筛选方法_第3页
基于失衡数据分类模型的药物蛋白质虚拟筛选方法_第4页
基于失衡数据分类模型的药物蛋白质虚拟筛选方法_第5页
资源描述:

《基于失衡数据分类模型的药物蛋白质虚拟筛选方法》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、基于失衡数据分类模型的药物蛋白质虚拟筛选方法-->第1章绪论1.1课题研究的目的和意义随着计算机软硬件水平的不断提高,计算机的存储技术也在不断的发展。信息数据时代已经到来。因此,利用数据挖掘、机器学习等相关技术,从海量数据中提取出对生产、经营、日常生活有益的隐含信息已经是一种必然的趋势。在众多数据形态中存在一种特殊形态的数据集——失衡数据集(ImbalancedDataSets,IDS)。这类数据集类别往往是分布不平衡的,类别之间甚至可能出现数量级的差异[1]。...................

2、..................1.2虚拟筛选的基本方法和研究现状虚拟筛选可定义为:针对重要疾病特定靶标生物大分子的三维结构或定量构效关系(QSAR)模型,从现有小分子数据库中,搜寻与靶标生物大分子结合或符合QSAR模型的化合物,进行实验筛选研究[11]。.....................................第2章基于分子对接的虚拟筛选相关介绍2.1分子对接原理基础知识最初I.D.Kuntz根据配体与受体作用的“锁-钥原理”提出分子对接方法[39]。锁钥原理的基本思想是:蛋白

3、质与分子之间的结合在空间上和能量上具有互补性,即满足空间构象的相互匹配和能量的相互匹配,是一种刚性的结合方法。.....................................2.2基于分子对接的虚拟筛选虚拟筛选是化合物进行生物活性筛选之前,通过在计算机上对化合物分子进行生物活性预测,在提高先导化合物质量的同时,降低了后期临床实验的成本。其中基于分子对接的虚拟筛选是在计算机上首先确定靶蛋白的活性结合位点,然后对配体与靶蛋白可能产生的空间构象进行搜索,最终利用打分函数对可能的空间构象进行打分,

4、选择具有最好的空间构象的化合物作为候选化合物,进入临床筛选阶段。.....................................第3章基于密度聚类边界采样方法.................................213.1失衡数据处理中的常用方法....................................213.2常用的聚类采样算法............................23第4章基于Adaboost-SVM的药物蛋白虚拟筛选............

5、.........374.1支持向量机...............................374.2集成学习方法............................................42第4章基于Adaboost-SVM的药物蛋白虚拟筛选4.1支持向量机SVM是由Vapnik和Cortes提出的一种建立在统计学习理论和结构风险最小化等原理基础上的分类算法,具有避免局部最优解,抗“维度灾难”强等优点,而且对于小样本,非线性,高维数据等分类问题都有一定的优势,因此,目前被广泛

6、应用于网络流分类,舆情分析,语音识别等领域。...............................4.2集成学习方法集成学习(EnsembleLearning)方法是失衡数据处理中常用的方法之一,该方法最早是由Hansen和Salamon提出的集成神经网络分类模型,利用多个神经网络对训练数据集进行学习,并将学习结果进行整合,并利用实验充分证明该方法能显著提供学习系统的泛化能力。正是由于此方法蕴含着巨大的潜力,越来越多的专家和学者对集成学习领域进行了更加深入的探索。..............

7、.................结论随着生物化学,化学信息学等理论研究的不断深入,药物发现策略也在日益更新,计算机辅助药物设计成为了一种必然的趋势。本文通过对传统的基于分子对接虚拟筛选技术进行研究,分析了目前虚拟筛选技术所面临的问题,如打分函数的准确性问题以及训练集中大量的错误对接构象降低筛选准确率的问题。为了进一步提高先导化合物的筛选质量,本文通过将机器学习方法与虚拟筛选技术相结合的方式对传统虚拟筛选技术进行改进。

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。