基于动态滑动窗口的改进数据流聚类算法-论文.pdf

基于动态滑动窗口的改进数据流聚类算法-论文.pdf

ID:58231898

大小:276.85 KB

页数:5页

时间:2020-05-07

基于动态滑动窗口的改进数据流聚类算法-论文.pdf_第1页
基于动态滑动窗口的改进数据流聚类算法-论文.pdf_第2页
基于动态滑动窗口的改进数据流聚类算法-论文.pdf_第3页
基于动态滑动窗口的改进数据流聚类算法-论文.pdf_第4页
基于动态滑动窗口的改进数据流聚类算法-论文.pdf_第5页
资源描述:

《基于动态滑动窗口的改进数据流聚类算法-论文.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、第29卷第1期郑州轻工业学院学报(自然科学版)Vo1.29No.12014年2月JOURNALOFZHENGZHOUUNIVERSITYOFLIGHTINDUSTRY(NaturalScience)Feb.2014文章编号:2095—476X(2014)01—0098—05基于动态滑动窗口的改进数据流聚类算法许颖梅(商丘师范学院计算机与信息技术学院,河南商丘476000)摘要:提出一种采用滑动窗口处理数据的优化算法DCluStream.该方法基于CluStream算法双层框架思想,在聚类特征中引入数据流入和流出滑动窗口的实际时间,动态调整窗口大小以适应有限内存

2、;对历史数据通过时间衰减机制来降低它对新数据对象的影响,使聚类效果更好.实验结果表明,与CluStream相比,本算法处理数据的效率更高且相对节约内存.关键词:滑动窗口;数据流聚类算法;时间衰减机制中图分类号:TP31l文献标志码:ADOI:10.3969/j.issn.2095—476X.2014.O1.021ImproveddatastreamclusteringalgorithmoverslidingwindowXUYing—mei(CollegeofComputerandInformationTechnology,ShangqiuNormalUnive

3、rsity,Shangqiu476000,China)Abstract:AnoptimizationalgorithmDCluStreamwasproposedwhichprocesseddataoverslidingwindow.Themethodadoptedonline-ofiineclusteringframeworkofCluStream.Therealtimeofthedataobjectcomingandoutofslidingwindowwasintroducedintothecharacteristicsofthecluster,adjust

4、ingthewin-dowsizereasonablyinthelimitedmemoryresourcesenvironment.Usingthetimedecaymechanismonhis—toricaldatacouldreducetheimpactofnewdataobject,whichcouldgetbetterclusteringresults.Theexper-imentalresultsshowedthatcomparedwiththealgorthmCluStream,dataprocessingeficiencyofthealgo-ri

5、thmwasrelativelyhigherwithsavingmemory.Keywords:slidingwindow;datastreamclusteringalgorithm;timedecaymechanism数据流聚类已经有很多算法.S.Guha等提出O引言了Localsearch算法,在有限的空间内对数据流进行数据流就是连续到达的一个序列,具有无限大聚类,使用一个不断迭代的过程进行k-means聚类.且不可预知性.对数据流的查询结果往往不是一次L.OCallaghan等在Localsearch的基础上又提出性而是持续的,即随着底层数据的到达而不断

6、返回了Stream算法,但这种算法是基于静态数据流的,最新的结果.数据流聚类算法作为数据流挖掘的工不能反映数据流的变化情况.c.C.Aggarwal等提具,具有很好的研究和应用前景,也是目前应用研出了一个解决数据流聚类问题的框架CluStream,将究的热点.聚类就是按一定特征将一个对象的集合数据流的聚类分成在线微聚类和离线宏聚类2个阶分成若干个类,每个类内的对象是相似的,但与其段.周晓云等提出基于Hoeffding界的高维数据流他类的对象是不相似的⋯.的子空间聚类发现及维护算法SHStream,在数据分收稿日期:2013—09—17基金项目:河南省基础与前沿

7、技术研究计划项目(132300410395;122300410395)作者简介:许颖梅(1979一),女,河南省商丘市人,商丘师范学院讲师,硕士,主要研究方向为网络安全第1期许颖梅:基于动态滑动窗口的改进数据流聚类算法·99·段上进行子空间聚类,通过迭代逐步得到满足聚类元组中的数据在第维的二阶距,t表示数据流进滑精度要求的聚类结果.杨春宇等基于数据流的连动窗口的时刻,:表示数据流出滑动窗口的时刻.续属性和标称属性提出一种适用于处理混合属性1.2时间衰减机制数据流的聚类算法HCluStream,可为混合属性构建随着数据源源不断地流入,在数据流聚类过程新的信息汇总

8、方式及距离度量.吴枫等在数据流中,也应

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。