真核生物中翻译起始位点与剪接位点的识别

真核生物中翻译起始位点与剪接位点的识别

ID:33728076

大小:922.80 KB

页数:42页

时间:2019-02-28

真核生物中翻译起始位点与剪接位点的识别_第1页
真核生物中翻译起始位点与剪接位点的识别_第2页
真核生物中翻译起始位点与剪接位点的识别_第3页
真核生物中翻译起始位点与剪接位点的识别_第4页
真核生物中翻译起始位点与剪接位点的识别_第5页
资源描述:

《真核生物中翻译起始位点与剪接位点的识别》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、内蒙古大学硕士学位论文真核生物中翻译起始位点与剪接位点的识别姓名:刘利申请学位级别:硕士专业:生物物理学指导教师:李前忠20070408内蒙古大学硕士学位论文真核生物中翻译起始位点与剪接位点的识别摘要本文以数理算法为基础,通过机器学习的方法来识别基因的功能位点。对序列统计分析的结果表明:尽管蛋白质的翻译起始和内含子的剪切过程有着复杂的蛋白质相互作用的参与,并且受着高级结构等诸多因素的影响,但在其中仍然存在基本的规律,这就是在一级序列中这些功能位点有着相对比较保守的特征。首先研究了脊椎动物基因的翻译起始位点(translationiniti

2、ationsite,TIS)。在真核生物中,翻译并不都是起始于第一个AUG密码子,还取决于AUG前后序列的信息。有文献报道接近40%的脊椎动物都包含有上游AUG,这就使翻译起始位点的预测变得很重要。本文结合位点倾I句矩阵(positionpropensitymatrix,PPM)和开放阅读框架(openreadingframe,ORF)的长度分布特征建立了一个线性分类器,此分类器能很好地把翻译起始位点和存在于5’UTR里的所谓上游AUG区分开来,同时也被用于从全长mRNA中识别出翻译起始位点。对于脊椎动物的全长mRNA序列,运用核糖体扫描

3、模型结合我们的分类器识别其翻译起始位点得到了很高的精度,总体预测率为97.8%。在人类全长mRNA上实验也得到了令人满意的结果。另外,为了寻找优秀的算法识别人类基因的剪接位点(splicejunctiousite),利用离散增量和位点倾向矩阵构成的六维向量来表示序列,用支持向量机(supportvectormachine,SVM)在向量空间中寻找最优超平面将真实的剪接位Ⅱ内蒙古大学硕士学位论文真核生物中翻译起始位点与剪接位点的识别点和虚假的剪接位点进行分类。计算结果表明,利用此算法预测人类的剪接位点有较高的预测能力。与其他的一些算法相比,

4、表现出参数少、精度高等优点。在数据集N269中检验,对于供体位点,真实位点识别率为96.7%,虚假位点的识别率为93。4%;对于受体位点,真实位点识别率为94.3%,虚假位点的识别率为92.9%。关键词:翻译起始位点,位点倾向矩阵,核糖体扫描模型,剪接位点,离散增量,支持向量机[II堕茎亘奎兰堡主兰丝堡苎塞堕兰塑!墅堡墨塑垡皇皇堕堡垒皇竺望型RECOGNITl0N0FTRANSLATIoNINITIATIONSITEANDSPLICINGSITEINEUl队RYoTEGENOMEABSTRACTBasedonmathematicalmet

5、hods,weidentifythefunctionalsitesofgenebyamachinelearv2ngsystem.StatisticanalysisofsequencesshowsthataltlloughSOnmnycomplexproteininteractionsand11igher-orderstructureinfluencetheproteintranslationinitiationandintroncleavageprocess,somerulesstillexist.Therearerelativecons

6、ervativecharactersintheirprimaryInthispaper,wefirstlydosomeresearchonvertebratetranslationinitiationsites.TIa璐lationinvertebratesdoesnotalwaysstartatthefirstAUGinallmRNA,implyingthattranslationdapendsalsoonsequenceinformationflankingAUGSomeonereportedthatalmost40%ofverteb

7、ratemRNAscontainupstreamAUGs.ItmakesthatthepredictionoftranslationinitiationsitesisaROll·trivialtasLBasedonpositionprope璐时matrix(PPM)andlengthdistibutionofopenreadingframe(ORF),wedevelopalinearclassifiertoperdictstartcodons.Thisclassifiermakesveryfinedistinctionbetweentra

8、nslationinitiationsitesandupstreamAUGswhichexistin5,unhjanslatedregion·Itisalsousedforpredicting

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。