数据挖掘实验报告数据准备 关联规则挖掘 分类知识挖掘概要

数据挖掘实验报告数据准备 关联规则挖掘 分类知识挖掘概要

ID:12612166

大小:618.99 KB

页数:11页

时间:2018-07-18

数据挖掘实验报告数据准备 关联规则挖掘 分类知识挖掘概要_第1页
数据挖掘实验报告数据准备 关联规则挖掘 分类知识挖掘概要_第2页
数据挖掘实验报告数据准备 关联规则挖掘 分类知识挖掘概要_第3页
数据挖掘实验报告数据准备 关联规则挖掘 分类知识挖掘概要_第4页
数据挖掘实验报告数据准备 关联规则挖掘 分类知识挖掘概要_第5页
资源描述:

《数据挖掘实验报告数据准备 关联规则挖掘 分类知识挖掘概要》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、数据挖掘实验报告班级学号姓名课程数据挖掘实验名称实验一:数据准备实验类型实验目的:(1)掌握利用文本编辑软件生成ARFF文件的方法;(2)掌握将EXCEL表格文件转换为ARFF文件的方法;(3)掌握数据的预处理方法。实验要求:(1)将下列表格中的数据利用文本编辑软件生成ARFF文件:姓名出生日期性别婚否工资职业信用等级黄大伟1970.05.08男3580教师优秀李明1964.11.03男是4850公务员优秀张明明1975.03.12女是职员优秀覃明勇1981.07.11男是2980职员良好黄燕玲1986.05.08女否2560工人一般表中没有填上的

2、数据为缺失数据。请列出你编辑ARFF文件并在WEKA中打开该文件。(2)将EXCEL表格文件“bankdata.xls”转换为ARFF文件的方法,并将它另存为ARFF文件“bankdata.arff”,在WEKA中打开该文件,写出操作过程。(3)数值属性的离散化:在WEKA中打开ARFF文件“bankdata.arff”,对属性“age”和“income”分别按等宽分箱和等深分箱进行离散化为三个箱。给出分箱的结果。实验结果:(1)@relationbook1@attribute姓名{黄大伟,'李明',张明明,覃明勇,黄燕玲}@attribute出生

3、日期{1970.05.08,1964.11.03,1975.03.12,1981.07.11,1986.05.08}@attribute性别{男,女}@attribute婚否{是,否}@attribute工资numeric@data黄大伟,1970.05.08,男,?,3580李',1964.11.03,男,是,4850张明明,1975.03.12,女,是,?覃明勇,1981.07.11,男,是,2980黄燕玲,1986.05.08,女,否,2560(2)先把bankdata.xls转化为CSV文件格式得到bankdata.csv,再在WEKA中打

4、开,再另存为ARFF格式,就可以得到bankdata.arff。即由转换为,再转换得在WEKA中打开如下:(3)对age按等宽进行离散化分箱如下:对income进行等深离散化分箱如下:实验名称实验二:关联规则挖掘实验类型综合性实验实验目的:(1)掌握WEKA关联规则挖掘中的数据准备方法。(2)掌握WEKA关联规则挖掘中的参数设置方法。(3)掌握关联规则挖掘结果的分析。实验要求:(1)将下列事务数据库转换为二元表格形式(以项目作为属性,在某个事务中,该项目出现则取值为yes,不出现则取值为no。)并生成ARFF文件格式。CustomerCommodi

5、tiesC1milk,egg,bread,chipsC2egg,popcorn,chips,beerC3egg,bread,chipsC4milk,egg,bread,popcorn,chips,beerC5milk,bread,beerC6egg,bread,beerC7milk,bread,chipsC8milk,egg,bread,butter,chipsC9milk,egg,butter,chips(2)选择关联规则算法并设置相关参数。(3)运行算法,输出频繁项集及强关联规则。(4)从挖掘结果来看,你发现了什么有兴趣的规则?实验结果:(1)

6、Customermilkeggbreadchipspopcornbeerbutterc1yesyesyesyesnononoc2noyesnoyesyesyesnoc3noyesyesyesnononoc4yesyesyesyesyesyesnoc5yesnoyesnonoyesnoc6noyesyesnonoyesnoc7yesnoyesyesnononoc8yesyesyesyesnonoyesc9yesyesnoyesnonoyes将文件保存为“yes-no.csv”,在WEKA中打开yes.csv文件,然后save为yes-no.arff即

7、生成ARFF文件格式。(2)打开数据文件:用“Explorer”打开“yes-no.arff”后,切换到“Associate”选项卡。选择算法:默认关联规则分析是用Apriori算法。点“Choose”按钮在弹出的窗口中可以选择关联规则算法。参数设置:单击“Choose”按钮右边的文本框会弹出参数设置对话框,可以修改默认的参数,弹出的窗口中点“More”可以看到各参数的说明。设置如下图:(3)运行算法单击“Start”按钮开始关联分析,输出频繁项集及强关联规则。(4)我发现本来在我们看来毫无联系的事物,经过分析发现它们有着密切联系。实验名称实验三:

8、分类知识挖掘实验类型综合性实验实验目的:(1)掌握利用决策树(C4.5算法)进行分类的方法。(2)掌握利用朴素贝叶斯分类的

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。