对于蚁群聚类的历史灾害分级方法

对于蚁群聚类的历史灾害分级方法

ID:24678217

大小:58.50 KB

页数:8页

时间:2018-11-16

对于蚁群聚类的历史灾害分级方法_第1页
对于蚁群聚类的历史灾害分级方法_第2页
对于蚁群聚类的历史灾害分级方法_第3页
对于蚁群聚类的历史灾害分级方法_第4页
对于蚁群聚类的历史灾害分级方法_第5页
资源描述:

《对于蚁群聚类的历史灾害分级方法》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、对于蚁群聚类的历史灾害分级方法.freeleans聚类算法不同,蚁群聚类算法受初始聚类中心选取质量的影响不大,蚂蚁会根据各组混乱度自适应地对聚类中心进行调整,因而很适用于解决大批量问题,样本量越大,聚类中心层次性越强,蚂蚁聚类出的结果也越有意义。1.2历史灾害信息提取通过对历史灾害记录的大量分析,并结合历史专家的意见,我们对灾害信息的各项特征进行了标准化编码,并归纳出以下4项属性来提取各条记录的灾害信息。1)“受灾范围”指灾害波及的地域,以县为单位,通过地理信息系统转化现代的县制大小,该项为灾害记录必有属性,具

2、有较高的量化程度。2)“物情”包括对灾害的物态及影响描述,如“伤禾苗”、“水漂民居”、“决堤四十余丈”等。3)“民情”指对灾民生存情况的描述,如“民饥”、“溺死人畜”等。4)“政情”指对政府响应灾害情况的描述,如“诏免其租”、“祈祷雨泽”、“发仓赈济”等。后3项属性为可缺失属性,能有效涵盖住每条历史灾害记录的基本灾情信息。为了实现这3项属性的合理量化,先为各项属性分别编制出各自的特征区分码,再利用命名实体识别技术将历史灾害记录编入数据库。以“政情”属性为例,分为“无记录、祈祭、遣官、减租税粮、免租税粮和赈济”6

3、级,分别编码为“0/1/2/3/4/5”,凡是在历史灾害记录中出现“诏免盐粮、诏免税粮、免粮、免征秋粮、免征田粮”等描述的都视为“免租税粮”,在“政情”属性部分统一记为“4”。需要注意的是,“0/1/2/3/4/5这种递增方式可能并不符合实际灾情严重程度的上升幅度,因此还可能需要根据所得出的聚类结果和专家的评估意见对各等级所对应的编码进行适当的调整。至此将历史灾害分为4级,每条历史灾害数据有4项属性,属性值通过上述方法实现了初步量化,进而可以进行对历史灾害数据的聚类处理。在这里先默认这4项属性的权重是一样的,而

4、在实际历史灾害聚类时,可以根据所得出的聚类结果和专家反馈的评估意见进行权值修正,以进一步保证聚类的质量,即着重于在灾害信息量化过程中借鉴和利用历史专家的专业意见,而在聚类过程中则尽量实现快速的自动化处理,以使专家的指导和监督作用更多地体现在大方向上。1.3蚁群聚类算法描述算法描述如下,设灾害数据集合为S,每条灾害数据有p(此处p=4)个属性,首先将数据集S随机分配为k(此处k=4)个组,各组的灾害数据数量设为t璶(n∈1,k)。依次进行如下处理。1)数据预处理。因为大量的历史灾害记录都至少存在一项属性值缺失,0

5、值较多,数据聚合性差,为了改善这一问题,利用灰色关联系数的定义,按照式(1)进行归一化处理。第n个灾害数据的第i个初始属性值设为x璶i,预处理后,变为y璶i:y璶i=1/(2-(x璶i-x璵ini)/(x璵axi-x璵ini))(1)其中x璵axi,x璵ini分别为灾害数据集合S中第i个属性的最大值和最小值。2)选择一个出数据组。蚂蚁按照式(2)评估各个灾害数据组的混乱度,用chaos璶(n∈1,k)来表示,chaos值越大表示此组越混乱,那么其被蚂蚁整理的概率也就越大。第n个组的混乱度表示为:chaos璶=∑

6、t璶i=1(x璱-avg璶)2t璶(2)其中:x璱=∑pj=1y2璲,表示第n组中第i条数据各属性的平方和;avg璶=(∑t璶i=1x璱)/t璶表示第n组各x璱的平均值;chaos璶表示第n组中各灾害数据属性平方和的标准差。然后蚂蚁根据各个组的chaos值采用赌轮选择法13,选出一个出数据组。3)选出一个灾害数据。在选出的组中,蚂蚁按照式(3)评估其中每个灾害数据对该组的混乱度的影响,用influence来表示,influence值越大表示此灾害数据影响越大,那么蚂蚁把此数据从组中取出的概率也就越大。组中第i个

7、数据的影响力表示为:influence璱=(x璱-avg璶)2(3)其中求得x璱,avg璶的方法与第2)步相同。然后蚂蚁就组中各个灾害数据的influence值采用赌轮选择法,选出一个数据。4)选择一个入数据组。蚂蚁按照式(4)评估所选出的灾害数据与各个组的拟合度,用similarityn(n∈1,k)来表示,similarity值越大表示与该组拟合度越高,那么把该灾害数据放入对应组的概率就越大。与第n个组的拟合度表示为:similarity璶=1(x璱-avg璶)2(4)其中求得x璱,avg璶的方法与第2)步

8、相同。然后蚂蚁就各个组的similarity值采用赌轮选择法,选出一个数据入组。把选出的灾害数据放入此组中。5)选择蚂蚁。为了使算法收敛,需要使用一定数量的蚂蚁(獳gent),让它们分别进行2)~4)步,然后按照式(5)评估各个蚂蚁整理的质量,用fitness来表示,fitness值越大表示此蚂蚁整理的质量越高,采用fitness值最大的蚂蚁的整理方案来改变原聚类。第n只蚂蚁的整理质量

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。