基于极限学习机的半监督分类

基于极限学习机的半监督分类

ID:39540876

大小:3.11 MB

页数:75页

时间:2019-07-05

基于极限学习机的半监督分类_第1页
基于极限学习机的半监督分类_第2页
基于极限学习机的半监督分类_第3页
基于极限学习机的半监督分类_第4页
基于极限学习机的半监督分类_第5页
资源描述:

《基于极限学习机的半监督分类》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、代号10701学号1075490205分类号TP18密级公开UDC编号题(中、英文)目基于极限学习机的半监督分类Seim-supervisedclassificationbasedonExtremelearningmachine作者姓名付华学校指导教师姓名职称焦李成教授工程领域电子与通信工程企业指导教师姓名职称罗二平教授论文类型应用基础技术提交论文日期2013.2.28西安电子科技大学学位论文独创性(或创新性)声明秉承学校严谨的学风和优良的科学道德,本人声明所呈交的论文是我个人在导师指导下进行的研究工作及取得的研究成果。尽我所知,除

2、了文中特别加以标注和致谢中所罗列的内容以外,论文中不包含其他人已经发表或撰写过的研究成果;也不包含为获得西安电子科技大学或其它教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中做了明确的说明并表示了谢意。申请学位论文与资料若有不实之处,本人承担一切的法律责任。本人签名:日期西安电子科技大学关于论文使用授权的说明本人完全了解西安电子科技大学有关保留和使用学位论文的规定,即:研究生在校攻读学位期间论文工作的知识产权单位属西安电子科技大学。学校有权保留送交论文的复印件,允许查阅和借阅论文;学校可以公布

3、论文的全部或部分内容,可以允许采用影印、缩印或其它复制手段保存论文。同时本人保证,毕业后结合学位论文研究课题再撰写的文章一律署名单位为西安电子科技大学。本人签名:日期导师签名:日期摘要监督学习是对标记数据所包含信息进行学习,得出分类模型后对无标记数据进行分类,而无监督学习是直接对无标记数据信息进行学习。获取标记数据时需要耗费一定的人力和物力资源,则大量标记数据的获取通常比较困难,然而伴随着信息技术的飞速发展,收集大量未标记数据则相当容易。若只使用少量标记数据,有监督学习训练所得学习模型不具有良好的泛化能力,同时浪费了大量未标记数据所

4、包含的信息;若只使用大量未标记数据,无监督学习则忽略了标记数据的价值,造成资源浪费。因此,如何有效地利用少量标记数据和大量未标记数据共同改善学习性能的半监督学习成为当前机器学习研究中的热点问题之一。半监督学习分为半监督聚类和半监督分类。半监督分类是从监督学习的角度出发,在标记训练样本不足时利用大量未标记样本信息辅助分类器的训练,进而提升算法的学习精度。极限学习机是近年来提出的一种新颖的机器学习算法,与传统神经网络模型不同,极限学习机只要求激活函数无穷阶可微,在输入权值和隐藏层偏置值随机设置的情况下,神经网络的所有参数就不必迭代调整,

5、并且只通过一步计算即可解析求出网络的输出权值。算法结构简单计算速率快。算法优良的特性使其广泛应用于函数逼近、模式识别、数据分类等领域。但是,当极限学习机应用于分类问题时,由标记样本训练得出的极限学习机的分类模型分类正确率会随着标记样本的减少而降低。当获取有标记数据较为困难,而同时存在大量未标记数据时,利用极限学习机算法与半监督学习的优点,提出了基于极限学习机的半监督分类算法,本文所做工作如下:(1)提出结合模糊C均值与极限学习机的半监督分类算法。当数据集具有较少标记样本时,训练得出的极限学习机分类模型的分类正确率较低,这里使用模糊C

6、均值与极限学习机算法利用大量未标记样本信息对标记样本进行扩充,从而实现半监督分类,当数据集标记样本较少时,该算法分类正确率明显优于传统无监督聚类算法FCM以及有监督极限学习机分类算法。(2)模糊C均值算法具有易陷入局部最优和初始化敏感的缺点。这里使用全局C均值算法对第三章算法进行改进,全局模糊C均值算法,通过动态增加聚类中心的方式,不依赖于任何的初始条件,结合全局C均值与极限学习机的半监督分类算法进一步提高了算法性能。(3)对进化极限学习机进行研究,使用差分进化算法优化极限学习机网络参数,提出基于差分进化极限学习机的半监督分类算法,

7、优化极限学习机神经网络模型的同时提高了分类效果。关键字:半监督分类极限学习机模糊C均值全局C均值AbstractTraditionalsupervisedlearningandunsupervisedlearningaretwofrequently-usedlearningmethodsinthefieldofmachinelearning.Insupervisedlearning,alargenumberoflabeleddataaretakenaspriorknowledgetoconstructamodelwhichisuse

8、dtopredicttheunlabeleddata.Unsupervisedlearningisalwaysabsenceofanypriorknowledgetoanalyzethedataandcompleteclusterin

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。