spss在主成分分析中的应用

spss在主成分分析中的应用

ID:11658612

大小:492.00 KB

页数:22页

时间:2018-07-13

spss在主成分分析中的应用_第1页
spss在主成分分析中的应用_第2页
spss在主成分分析中的应用_第3页
spss在主成分分析中的应用_第4页
spss在主成分分析中的应用_第5页
资源描述:

《spss在主成分分析中的应用》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、SPSS在主成分分析中的应用一.主成分分析的原理。主成分分析是设法将原来众多具有一定相关性(比如P个指标),重新组合成一组新的互相无关的综合指标来代替原来的指标。通常数学上的处理就是将原来P个指标作线性组合,作为新的综合指标。最经典的做法就是用F1(选取的第一个线性组合,即第一个综合指标)的方差来表达,即Var(F1)越大,表示F1包含的信息越多。因此在所有的线性组合中选取的F1应该是方差最大的,故称F1为第一主成分。如果第一主成分不足以代表原来P个指标的信息,再考虑选取F2即选第二个线性组合,为了有效地反映原来信息,F1已有的信息就不需要再出现再F2中,用数学语言

2、表达就是要求Cov(F1,F2)=0,则称F2为第二主成分,依此类推可以构造出第三、第四,……,第P个主成分。主成分模型:满足以下条件:1.每个主成分系数平方和为1即:2.主成分之间互不相关即:3.主成分方差依次递减,即22二.利用SPSS进行主成成分分析实例以全国31个省市的8项经济指标为例,进行主成分分析。第一步:录入或调入数据(图1)。图1原始数据(未经标准化)第二步:打开“因子分析”对话框。沿着主菜单的“Analyze(分析)→DataReduction(降维)→Factor(因子分析)”的路径(图2)打开因子分析选项框(图3)。图2打开因子分析对话框的路径

3、22图3因子分析选项框第三步:选项设置。首先,在源变量框中选中需要进行分析的变量,点击右边的箭头符号,将需要的变量调入变量(Variables)栏中(图3)。在本例中,全部8个变量都要用上,故全部调入(图4)。因无特殊需要,故不必理会“Value”栏。下面逐项设置。图4将变量移到变量栏以后⒈设置Descriptives(描述)选项。单击Descriptives按钮(图4),弹出Descriptives(描述统计)对话框(图5)。22图5描述选项框在Statistics栏中选中Univariatedescriptives(单变量描述性)复选项,则输出结果中将会给出原始

4、数据的抽样均值、方差和样本数目(这一栏结果可供检验参考);选中Initialsolution(原始分析结果)复选项,则会给出主成分载荷的公因子方差(这一栏数据分析时有用)。在CorrelationMatrix(相关矩阵)栏中,选中Coefficients(系数)复选项,则会给出原始变量的相关系数矩阵(分析时可参考);选中Determinant(行列式)复选项,则会给出相关系数矩阵的行列式,如果希望在Excel中对某些计算过程进行了解,可选此项,否则用途不大。其它复选项一般不用,但在特殊情况下可以用到(本例不选)。设置完成以后,单击Continue按钮完成设置(图5)

5、。⒉设置Extraction(抽取)选项。打开Extraction对话框(图6)。因子提取方法主要有7种,在Method栏中可以看到,系统默认的提取方法是主成分.因此对此栏不作变动,就是认可了主成分分析方法。在Analyze栏中,选中Correlationmatirx(相关性矩阵)复选项,则因子分析基于数据的相关系数矩阵进行分析;如果选中Covariancematrix复选项,则因子分析基于数据的协方差矩阵进行分析。对于主成分分析而言,由于数据标准化了,这两个结果没有分别,因此任选其一即可。在Display(输出)栏中,选中Unrotatedfactorsoluti

6、on(非旋转因子解)复选项,则在分析结果中给出未经旋转的因子提取结果。对于主成分分析而言,这一项选择与否都一样;对于旋转因子分析,选择此项,可将旋转前后的结果同时给出,以便对比。选中ScreePlot(碎石图),则在分析结果中给出特征根按大小分布的折线图,以便我们直观地判定因子的提取数量是否准确。在Extract(抽取)栏中,有两种方法可以决定提取主成分(因子)的数目。一是根据特征根(Eigenvalues)的数值,系统默认的是。我们知道,在主成分分析中,主成分得分的方差就是对应的特征根数值。如果默认,则所有方差大于等于1的主成分将被保留,其余舍弃。如果觉得最后选取

7、的主成分数量不足,可以将值降低,例如取;如果认为最后的提取的主成分数量偏多,则可以提高值,例如取22。主成分数目是否合适,要在进行一轮分析以后才能肯定。因此,特征根数值的设定,要在反复试验以后才能决定。一般而言,在初次分析时,最好降低特征根的临界值(如取),这样提取的主成分将会偏多,根据初次分析的结果,在第二轮分析过程中可以调整特征根的大小。第二种方法是直接指定主成分的数目即因子数目,这要选中Numberoffactors复选项。主成分的数目选多少合适?开始我们并不十分清楚。因此,首次不妨将数值设大一些,但不能超过变量数目。本例有8个变量,因此,最大的主成分提取

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。