数据挖掘在电信客户细分中的应用研究-论文.pdf

数据挖掘在电信客户细分中的应用研究-论文.pdf

ID:53033779

大小:97.42 KB

页数:1页

时间:2020-04-14

数据挖掘在电信客户细分中的应用研究-论文.pdf_第1页
资源描述:

《数据挖掘在电信客户细分中的应用研究-论文.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、~gs-i技术158数据挖掘在电信客户细分中的应用研究张隽(中国移动通信集团上海有限公司,上海200030)摘要:电信企业在经营管理过程中积累了大量的客户信息,依据这些信息可以将客户划分为不同的群体,这就为企业实施精准化营销奠定了基础。本文对k-means聚类算法进行改进,利用遗传算法的全局优化特点,设计了自动确定聚类数、优化初始中心选取且消除噪声数据干扰的GK—means算法,构建了客户细分模型。最后,以以XX电信公司作为研究对象,构建其客户细分模型,依据客户细分结果分析了各个客户群体的特征,并针对性地提出了若干营销策略与建议。关键字:客户

2、细分;数据挖掘;K-means算法0引言以令人满意,故现在同时考虑距离与密度因素来优化初始中心的选取,即选取相距最远的k个处于高密度区域的点作为中心点。在电信企业客户关系管理中,通过聚类等数据挖掘技术进行客为此,首先将样本数据所处区域的密度定义为:户细分,然后归纳总结各个细分群体的特征,是提升营销效率及效Df纱(x)={P∈C1dis(x,P)r}(1)果的有效途径。传统的客户细分通常是采用了定性的经营描述与定其中,dis(x,p)为表示x与P样本之间的欧氏距离,r为样本数据量的统计学相结合的方法。随着数字化信息的增长,数据挖掘(Data所处

3、区域半径,C为样本数据集。Mining)技术被广泛应用于商业、金融业、企业生产以及市场营销等得到各个样本的密度之后,首先选出若干个高密度点组合方面,它已逐渐发展成为一种智能过程,可以和信息技术、统计技术集合,并从中取密度最大的点作为第一个初始聚类中心Z1,然等一起支持运营决策。后在集合剩余高密度点集中选取与距离最大的点作为第二个1研究现状初始聚类中心Z1,取满足的数据对象作为,依此类推,取满足max(~(dis(x,,),dis(x,,z:))×f=I,2.,)的数据对象作为乙,按照此方法就能计算数据挖掘作为-fq交叉学科,在整个数据挖掘过程

4、中需要涉及和出k个初始聚类中心。利用多领域的知识,以高度智能化的在线分析企业数据库的信息,从分析上述初始聚类中心的选取方法,其基本原理是选取欧式距离大量的、混杂的原始数据中,提取出潜在的和有价值的信息的一个过最大的高密度点集作为初始聚类中心,从而避免了选取的盲目性,保程n。随着数据挖掘技术的进一步发展和完善,数据挖掘技术的应用证了聚类质量。越来越广泛,从最初的金融业拓展到现在的零售业、服务业等,在具2.3消除噪声和孤立点数据体应用方面除了最初的价值评价,目前更多的用于顾客细分、识别潜在对数据所包含的信息进行分析的时候,不同的样本中所含有的在顾

5、客等领域。数据挖掘应用于客户细分的相关研究中,Zakrzewska信息量与价值不尽相同。为了对此加以区分,本文提出对每个样本数&Mnrlewski以银行积累的大量一手客户资料为分析对象,利用K-means据赋予一个权值,其计算公式如下所示:方法进行客户细分,但是发现细分结果对于噪声数据的敏感性较强。Zamir&Etzioni分别利用K.means聚类,SOM和模糊K-means将股票一豪操作者按照一定的标准如交易量、交易频率等进行了细分,发现模糊其中,3~dis(x,,_),I~Idis(xi,)表示与X,的欧氏距离。K—means的适用性最

6、强、效果最好。此处,为了减小“噪声数据的负面影响,提高聚类质量,故提2客户细分算法出加权平均的方法来计算各个类簇的均值,即:在众多的聚类算法中,由于k-means算法具有明显优于其他算法的特性,使得它获得广泛地应用。但是,k-means算法仍然存在明显(3)的不足之处,需要相应的改进,才能有效地实现客户细分。其中,AWM:(1』<)表示簇C,的加权平均值,n,表示簇c中样本的2.1k-means算法个数,表示簇c刀个样本之一,是簇c,中样本的权重。k-meafls算法是一个经典的聚类算法,它是采用动态的聚类过程,上述加权平均法虽然会增加计算工

7、作量,但是由于其能够有效地通过一步步的迭代逐渐达到收敛,并最终实现聚类分析。总的来说,降低对噪声与异常数据的敏感性,即便是数据集中存在少量的噪声与k-me~s聚类算法的基本原理是:先随机选取k个样本作为初始聚类异常数据也不会对权重的计算产生太大的影响。中心,计算其他样本与这个k个初始聚类中心的欧式距离并相关比较大小,然后将各个样本归入与其距离最近的初始类中,接着再计算迭3结论代后的各个类簇的中心点位置,并重复上述步骤,直至得到误差最小本文研究综合运用了计算机信息技术、数据挖掘技术、管理学和的聚类结果。市场营销学等多个领域的知识,并结合电信行业

8、的具体行业特征,构虽然k-me~s算法具有非常明显的优势,但是其仍然存在如下几建了基于数据挖掘的电信客户细分模型,将数据挖掘技术应用到电信点不足之处:(1)初始聚类

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。