聚类算法在银行客户细分中的研究和应用

聚类算法在银行客户细分中的研究和应用

ID:36663440

大小:2.73 MB

页数:66页

时间:2019-05-13

聚类算法在银行客户细分中的研究和应用_第1页
聚类算法在银行客户细分中的研究和应用_第2页
聚类算法在银行客户细分中的研究和应用_第3页
聚类算法在银行客户细分中的研究和应用_第4页
聚类算法在银行客户细分中的研究和应用_第5页
资源描述:

《聚类算法在银行客户细分中的研究和应用》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、河南大学硕士学位论文聚类算法在银行客户细分中的研究和应用姓名:王国勋申请学位级别:硕士专业:应用数学指导教师:王天芹;石勇20090501河南大学研究生硕士学位论文第1页摘要数据挖掘是一种新兴的决策支持工具,而聚类分析是该领域的核心技术和非常活跃的研究方向。客户细分是客户关系管理的重要组成部分,它是指企业根据客户的内在和外在属性、及客户的消费行为特征对其分类,从而为不同类别的客户提供针对性的产品和服务。聚类是客户细分的有力工具,尤其是在金融行业中日益发挥出积极的导向作用。聚类是一种无监督学习过程,它按照事物的属性特征把事物聚集成若干簇,使同一簇内的数据对象之间具有较高的

2、相似性,而不同簇之间的数据对象相似度较低。聚类融合是将多个聚类结果进行组合来获得更加鲁棒和聚类准确率更高的数据划分结果。本文提出了一种基于投票机制的两层聚类融合模型,它通过解决以下几个方面的问题来实现对聚类精度及算法鲁棒性的提升:聚类成员的生成问题:聚类成员是聚类融合算法的基础,生成聚类成员的核心问题是获得多个相互具有差异性的原始聚类结果。在本文提出的模型中,涉及两个层次的聚类成员:第一层聚类成员为原始的聚类算法产生的聚类结果,它通过为多种聚类算法设置不同的参数来获得;第二层的聚类成员是将同一种算法在不同参数下的聚类结果进行组合得到的聚类融合结果,也就是说第二层的聚类成

3、员兼具聚类融合结果和聚类成员两个方面的性质。通过选择不同类型的聚类算法和设置不同的初始化参数可以得到有差异性的聚类成员,提高聚类融合质量。聚类融合函数设计问题:它是指用什么样的方法将多个聚类结果组合起来从而提升原始聚类算法的聚类效果。在本文的两层聚类融合模型中,主要采用多个聚类结果投票的方法作为聚类融合函数。投票机制的核心思想是一组成员对某件事物的共同判断优于单个成员的判断,它具有简单有效且便于理解的特点。聚类标签的匹配问题:在采用基于投票的聚类融合方法时,确定不同数据划分中簇的对应关系也是一个十分重要的问题。不同的算法、甚至同一个算法在不同参数下的聚类结果对实质相同的

4、同一个簇的描述或标签都可能是不同的。在本文研究中,通过将两次聚类中共享数据点最多的两个簇设置相同的类标号来解决标签匹配问题。第lI页河南大学研究生硕士学位论文本文还探讨了客户细分的一般性方法;并采用实证分析方法,利用某银行投资理财业务的客户基本资料和各类原始交易数据,通过设计先聚类后分类的数据挖掘方案,建立了有效的客户细分模型,这对银行提高客户关系管理的科学性有一定借鉴意义;并通过实际应用,验证了本文所提出的两层聚类融合方法的效果和适用性。关键词:数据挖掘;客户细分;聚类;聚类融合河南大学研究生硕士学位论文第1II页AbstractDataMiningisaemergi

5、ngdecision-makingsupportprocess,andclusteringanalysisisthecoretechnologyandveryactiveresearchdirectionoftheDataMining.ThecustomersegmentationisacomponentoftheCustomerRelationsManagement(CRM),whichmeansthattheenterprisesclassifythecustomersintodifferentgroupsbasedontheircharacteristic,dem

6、and,fancyandothersynthesisfactorsSOastoprovidethespecificproductsandservicestodissimilarcustomers.Asthepowerfultoolincustomersegmentation,theclusteringmethodsaredisplayingitsfunctionofguidanceinthisfield,especiallyinthefinancialindustry.Clusteringisaunsupervisedlearningprocess,itdividest

7、hedatapointsintoseveralpartsbymakingobjectsinthesameparthaveahighsimilarfeasureandobjectsindifferentpartareasdissimilaraspossible.Clusteringensemblemethodaremorerobustandhigheraccuratebycombiningmultipleclusteringresults.Inthispaper,weproposedanewtwo-layerclusteringensemb

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。