数 据 挖 掘 技 术 简 介

数 据 挖 掘 技 术 简 介

ID:44040869

大小:918.50 KB

页数:39页

时间:2019-10-18

数 据 挖 掘 技 术 简 介_第1页
数 据 挖 掘 技 术 简 介_第2页
数 据 挖 掘 技 术 简 介_第3页
数 据 挖 掘 技 术 简 介_第4页
数 据 挖 掘 技 术 简 介_第5页
资源描述:

《数 据 挖 掘 技 术 简 介》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、数据挖掘技术简介演讲人:钟云飞Email:peter@spss.com.cn2002年7月19日大纲什么是数据挖掘数据挖掘的标准流程:CRISP-DM数据挖掘工具——SPSSClementine简介第一部分:什么是数据挖掘?数据挖掘都干了些什么?英国电信需要发布一种新的产品,需要通过直邮的方式向客户推荐这种产品。。。。。。使直邮的回应率提高了100%数据挖掘都干了些什么?GUS日用品零售商店需要准确的预测未来的商品销售量,降低库存成本。。。。。。通过数据挖掘的方法使库存成本比原来减少了3.8%数据挖掘都干了些什

2、么?汇丰银行需要对不断增长的客户群进行分类,对每种产品找出最有价值的客户。。。。。。营销费用减少了30%数据挖掘都干了些什么?美国国防财务部需要从每年上百万比的军火交易中发现可能存在的欺诈现象。。。。。。发现可能存在欺诈的交易,进行深入调查,节约了大量的调查成本数据挖掘都干了些什么?美国国内税务局需要提高对纳税人的服务水平。。。。。。合理安排税务官的工作,为纳税人提供更迅捷、更准确的服务通过数据挖掘您可以发现最有价值的客户通过数据挖掘您可以使组合销售更有效率通过数据挖掘您可以留住那些最有价值的客户通过数据挖掘您

3、可以用更小的成本发现欺诈现象通过采用自动或半自动的手段,在海量数据中发现有意义的行为和规则的探测和分析活动。数据挖掘能够帮助你选择正确瞄准潜在目标,向现有的客户提供额外的产品,识别那些准备离开的好客户。什么是数据挖掘电信:流失银行:聚类(细分),交叉销售百货公司/超市:购物篮分析(关联规则)保险:细分,交叉销售,流失(原因分析)信用卡:欺诈探测,细分电子商务:网站日志分析税务部门:偷漏税行为探测警察机关:犯罪行为分析医学:医疗保健数据挖掘应用领域数据挖掘效益分析(直邮)(BigBank&CreditCardCo

4、mpany)目的:发现新客户数据挖掘以前数据挖掘以后差别发信的数量1,000,000750,000(250,000)成本$1,000,000$750,000($250,000)响应的数量10,0009,000(1,000)每个响应的毛利$125$125$0总毛利$1,250,000$1,125,000($125,000)净利润$250,000$375,000$125,000建模的费用040,000$40,000最终的利润$250,000$335,000$85,000第二部分:数据挖掘标准流程——CRISP-DM

5、CRISP-DM简介CRISP-DM是CRoss-IndustryStandardProcess-DataMining的缩写由SPSS、NCR、Daimler-Benz在1996年制定CRISP是当今数据挖掘业界通用流行的标准之一它强调数据挖掘在商业中的应用,解决商业中存在的问题,而不是把数据挖掘局限在研究领域CRISP-DM商业理解数据理解数据准备建立模型模型评估模型发布商业理解(BusinessUnderstanding)找问题-确定商业目标对现有资源的评估确定问题是否能够通过数据挖掘来解决确定数据挖掘的目

6、标制定数据挖掘计划数据理解(DataUnderstanding)确定数据挖掘所需要的数据对数据进行描述数据的初步探索检查数据的质量数据准备(DataPreparation)选择数据清理数据对数据进行重建调整数据格式使之适合建模建立模型(Modeling)对各个模型进行评价选择数据挖掘模型建立模型模型评估(Evaluation)评估数据挖掘的结果对整个数据挖掘过程的前面步骤进行评估确定下一步怎么办?是发布模型?还是对数据挖掘过程进行进一步的调整,产生新的模型模型发布(Deployment)把数据挖掘模型的结果送到

7、相应的管理人员手中对模型进行日常的监测和维护定期更新数据挖掘模型第三部分:数据挖掘工具—SPSSClementine简介Makeadifferencewiththepredictivepowerofdatamining应用Clementine达到你数据挖掘的目标图形化的界面、数据流的形式建立模型,保证了应用Clementine进行数据挖掘关注商业更甚于关注技术本身开放式的技术是更好的保护您的投资的保障高度的扩展性保证对数据库中大量的数据进行挖掘业界领先的发布技术使数据挖掘结果更好的传递到相应管理人员手中把你的商

8、业经验溶入数据挖掘过程是数据挖掘成功的关键Better dataminingresults!InsightBusinessproblem?What youknow丰富的数据挖掘算法PredictionNeuralnet,C5.0ClassificationNeuralnet,C5.0SegmentationKohonen,Kmeans,C5.0AssociationApriori,GR

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。