基于粗糙集的分类和规则归纳法

基于粗糙集的分类和规则归纳法

ID:5321794

大小:547.12 KB

页数:4页

时间:2017-12-08

基于粗糙集的分类和规则归纳法_第1页
基于粗糙集的分类和规则归纳法_第2页
基于粗糙集的分类和规则归纳法_第3页
基于粗糙集的分类和规则归纳法_第4页
资源描述:

《基于粗糙集的分类和规则归纳法》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库

1、第25卷第2期武汉理工大学学报Vol.25No.22003年2月JOURNALOFWUHANUNIVERSITYOFTECHNOLOGYFeb.2003文章编号:1671-4431(2003)02-0073-03*基于粗糙集的分类和规则归纳法谭思云张青枝李志明(武汉理工大学)摘要:对象的信息不一致性是从实例中进行归纳学习的最大障碍,为此提出了一种新颖的方法对相互矛盾的信息系统进行分类和归纳规则。它是将粗糙集和一种基于统计方法的归纳学习运算法则相结合来完成的,并提出了一种基于粗糙集分类系统模型框架。通过举例

2、来说明这种模型系统,并讨论其有效性。关键词:粗糙集;机器学习;规则归纳法中图分类号:TP14文献标识码:A[1]从数据集中对对象进行归纳学习和分类是人工智能中很重要的领域。近几年来,已经开发了很多技术来进行归纳学习,其中,决策树学习技术是最流行的。QuinLan成功地开发了ID3,以及后来的版本C4.5和C5.0,它的最大优点是归纳出来的规则既简单又精确。但是,它不能处理数据集不一致的情况,而在分类的过程中,一般会碰到对象的描述是不确定、不精确或不完整的。当前,发展了许多理论、技术和运算法则来处[2]理这

3、种不精确数据的分析,其中,最成功的是模糊集理论和DS证据理论。波兰学者PawlakZ在1982年提[2,3]出的粗糙理论是一种新的数学工具,它能有效地分析和处理不精确、不一致、不完整等各种不完备信息,并从中发现隐含知识,揭示潜在规律。它还可以用来执行对不确定信息的机器学习和知识的公式推理。在大约20年时间里,它已经很快地应用到许多现实生活里去了,如医疗诊断、控制运算法则获取和过程控制、信息修补和结构工程等。文中论述了粗糙集理论的基本概念,并提出了一个基于粗糙集的分类和规则归纳的模型系统,最后举例验证其有效

4、性。1粗糙集的基本概念归纳学习经常涉及到不确定性的阐明。一般来说,不确定性可能是由于不完整或不一致的信息和知识引起的。显然,信息不精确种类是对象分类和规则归纳的最大障碍。但是,粗糙集理论提出了一种新方法来解决这个问题。近似空间和一个集的上近似及其下近似形成了两个粗糙集理论重要概念。一个粗糙集的近似空间是杂乱的分类里的重要分类领域环节。这样一个空间具有在一个领域中刻画所有的类的能力。上近似和下近似描绘的是拥有清晰概念但没有清晰界限难分辨的对象的类。1.1知识表达系统在粗糙集理论中,对象的知识是通过指定对象的

5、基本特征(属性)和它们的特征值(属性值)来描述的。一个知识表达系统定义为S=式中,U是一个对象的集合,Q是一个有限的属性集合,V=∪q∈QVq是属性值的集合,Vq表示属性q∈Q的范围,p:U×Q→V是一个信息函数,它指定U中每一对象x的属性值。这种定义方式使对象的知识可以方便地以数据表格形式描述,这种数据表称为知识表达系统。1.2粗糙集合的上近似集、下近似集和边界区不可分辨关系是粗糙集理论的最重要概念,它揭示出论域知识的颗粒状结构,而知识的粒度又是造成使用已有知识不能精确地表示某些概念的

6、原因。它也是论域U的等价关系,可以用下面方法定义。收稿日期:2002-10-10.作者简介:谭思云(1963-),男,副教授;武汉,武汉理工大学自动化学院(430070).*湖北省科技攻关项目(20020G0004).武汉理工大学学报2003年274月假设x,y∈U,P∈Q,x和y在信息系统S中关于属性P的不能分辨关系在数学上可以表示为^xPyiffp(x,q)=p(y,q)∀q∈p一个近似空间可以由S=(U,R)来表示。P的等价关系在信息系统S中被看成是一个基本集。举例说,在表1的信息系统中,论域U及等

7、效关系R={q1,q2}可表示如下U={x1,x2,x3,x4,x5,x6,x7,x8,x9,x10}表1典型的信息系统U/q1={{x1,x2,x3,x9},{x4,x5,x6,x7,x8,x10}}属性对象U决策dU/q2={{x1,x4,x9,x10},{x2,x5,x7},{x3,x6,x8}}q1q2x1100U/R={{x1,x9},{x2},{x3}{x4,x10},{x5,x7},{x6,x8}}x2111C1={x1,x4,x5,x8,x9,x10}⇒d=0x3121C2={x2,x3,

8、x5,x6,x7}⇒d=1x4000x5010从表1中可看出,x5和x7不可分辨,因为条件属性是一样的,结果却x6021不一样。这说明在x5和x7之间存在着矛盾。类似地,x6和x8之间也存在x7011矛盾。粗糙集理论给出了处理上面提到的信息不一致方法。那些根据已x8020有的知识肯定属于集合C的对象所组成的最大的集合叫做下近似集,可x9100x10000表示为R*(C)=∪{Y∈U/R,Y⊆C}*所有与C相交非空的等效类的并集

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。