基于密度的聚类算法研究

基于密度的聚类算法研究

ID:33728713

大小:4.47 MB

页数:63页

时间:2019-02-28

基于密度的聚类算法研究_第1页
基于密度的聚类算法研究_第2页
基于密度的聚类算法研究_第3页
基于密度的聚类算法研究_第4页
基于密度的聚类算法研究_第5页
资源描述:

《基于密度的聚类算法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、湖南大学硕士学位论文基于密度的聚类算法研究姓名:李伟雄申请学位级别:硕士专业:控制科学与工程指导教师:谭建豪20100410基于密度的聚类算法研究摘要基于密度的聚类方法在聚类分析技术中占有很重要的地位,在金融、市场营销、信息检索、信息过滤、科学观测与工程等各个领域广泛应用,是聚类分析中的研究重点。本文对基于密度的聚类算法进行了研究,并以DBSCAN(Density—BasedSpatialClusteringofApplicationswithNoise)为基础,提出了改进算法。基于密度网格聚类方法是基于密度聚类方法与基于网格聚类方法的融合,结合两种聚类方法的优点,本文提

2、出了一种改进的基于网格的密度聚类方法。本文主要在以下几个方面展开了研究:(1)首先对数据挖掘技术以及聚类分析技术的研究与发展进行了综述,阐述了聚类分析的基本原理以及数据结构,详细介绍了常用的聚类分析技术,并选择性的介绍了数据预处理方法。(2)针对DBSCAN的参数敏感性以及对密度分布不均数据集难以获得较好聚类效果的情况,本文提出了一种基于区域比例的改进算法。算法使用点的区域分布来度量点的密度,并定义候选核心点来提高簇的搜索效率。算法中使用基于密度的离群点检测方法LOF(10caloutlierfactor)来检测数据集中的离群点。(3)基于网格的密度聚类方法具有基于网格方

3、法聚类时间独立于数据集大小的特性,本文提出了一种改进的基于网格的密度聚类算法。算法通过密度函数将数据映射到网格结构,使用门限处理对网格进行分割,在二值化网格上聚类密度连通区域。该方法不仅具有基于网格聚类方法在聚类时间上的优势,也能对任意形状数据集聚类。(4)基于通用入侵检测模型构建了一种基于密度聚类的入侵检测模型,并将基于区域比例的聚类方法应用于入侵知识库的训练。实验结果验证了基于区域比例的聚类算法在应用中的有效性。实验表明以DBSCAN为基础的基于区域比例的聚类算法,在使用新的密度度量函数和区域比例思想后,对密度分布不均数据集的聚类比DBSCAN有更好的聚类效果,参数鲁

4、棒性也有提升,达到了预期的目的。基于网格的密度聚类算法能对任意形状的数据集聚类,并且聚类时间独立于数据集大小,是对基于密度聚类算法的很好补充。关键词:数据挖掘;聚类分析;密度聚类;网格聚类;入侵检测II硕士学位论文AbstractDensity-basedclusteringmethodplaysanimportantroleinclusteranalysis.Ithasbeenwidelyusedinfinancial,marketing,informationretrieval,informationfiltering,scientificobservationand

5、engineering.Itisthefocusofcurrentresearch.Density—bas·edclusteringalgorithmsarestudiedinthispaper,andalocalscalingbasedclusteringalgorithmisproposed.Clusteringalgorithmbasedongridanddensityintegratesdensity—basedandgrid—basedclusteringalgorithm,andcombinesadvantagesoftwoclusteringalgorith

6、ms.Thispaperpresentsaimprovedclusteringalgorithmbasedongridanddensity.Themaincontentsareoutlinedasfollowing:(1)Atfirst,allintroductionofdataminingtechniquesandtheoverviewofclusteranalysistechniquesareconcerned.Then,thepaperdescirbesbasicclusteringconceptanddatastructure,andspecifiessomeco

7、mmonlyusedclusteringalgorithmsanddatapreprocessingmethods.(2)ParametersensitivityandunsatisfactoryperformanceinclusteringunevendensitydistributiondatasetsarethemainweeknessofDBSCAN.thepaperpresentsaimprovedlocalscalingbasedclusteringalgorithmtoimprovetheweeknessofDB

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。