主成分分析在spss中的操作应用

主成分分析在spss中的操作应用

ID:18596509

大小:154.00 KB

页数:12页

时间:2018-09-19

主成分分析在spss中的操作应用_第1页
主成分分析在spss中的操作应用_第2页
主成分分析在spss中的操作应用_第3页
主成分分析在spss中的操作应用_第4页
主成分分析在spss中的操作应用_第5页
资源描述:

《主成分分析在spss中的操作应用》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、主成分分析在SPSS中的操作应用(1)2008-03-2415:15一、引言  主成分分析和因子分析在社会经济统计综合评价中是两个常被使用的统计分析方法。现在SPSS、SAS等统计软件使用越来越普遍,但SPSS并未像SAS一样,将主成分分析与因子分析作为两个独立的方法并列处理[注:主成分分析与因子分析二者是又有着区别与联系,最主要的不同在于它们的数学模型的构建上,具体区别请见参考文献2],而是根据二者之间的关系有机地将主成分分析嵌入到因子分析之中,这样虽然简化了分析程序,却为主成分分析的计算带来不便。且国内许多SPSS教程并没有详细讲解如果应

2、用SPSS进行主成分分析,如何使用SPSS对主成分分析进行计算呢?为使读者能够正确使用SPSS软件进行主成分分析,本文将通过一个实例来详细介绍如何用SPSS做主成分分析。接下来先简单介绍主成分分析原理与模型,以便读者对主成分分析有个大致的了解。二、主成分分析原理和模型[1](一)主分成分析原理主成分分析是设法将原来众多具有一定相关性(比如P个指标),重新组合成一组新的互相无关的综合指标来代替原来的指标。通常数学上的处理就是将原来P个指标作线性组合,作为新的综合指标。最经典的做法就是用F1(选取的第一个线性组合,即第一个综合指标)的方差来表达,

3、即Var(F1)越大,表示F1包含的信息越多。因此在所有的线性组合中选取的F1应该是方差最大的,故称F1为第一主成分。如果第一主成分不足以代表原来P个指标的信息,再考虑选取F2即选第二个线性组合,为了有效地反映原来信息,F1已有的信息就不需要再出现再F2中,用数学语言表达就是要求Cov(F1,F2)=0,则称F2为第二主成分,依此类推可以构造出第三、第四,……,第P个主成分。(二)主成分分析数学模型其中为X的协方差阵Σ的特征值多对应的特征向量,是原始变量经过标准化处理的值,因为在实际应用中,往往存在指标的量纲不同,所以在计算之前须先消除量纲的

4、影响,而将原始数据标准化,本文所采用的数据就存在量纲影响[注:本文指的数据标准化是指Z标准化]。R为相关系数矩阵,是相应的特征值和单位特征向量,进行主成分分析主要步骤如下:1.指标数据标准化(SPSS软件自动执行);2.指标之间的相关性判定;3.确定主成分个数m;4.主成分Fi表达式;5.主成分Fi命名;6.主成分与综合主成分(评价)值。主成分分析在SPSS中的操作应用(2)2008-03-2420:42(二)主成分分析在SPSS中的具体操作步骤运用SPSS统计分析软件Factor过程[2]对沿海10个省市经济综合指标进行主成分分析。具体操作

5、步骤如下:1.Analyze→DataReduction→FactorAnalysis,(即中文版:分析→降维→因子分析)弹出FactorAnalysis对话框2.把X1~X10选入Variables框3.Descriptives:CorrelationMatrix(相关矩阵)框组中选中Coefficients(系数),然后点击Continue,返回FactorAnalysis对话框4.点击“OK”图表2FactorAnalyze对话框(因子分析对话框)Descriptives子对话框  SPSS在调用FactorAnalyze过程进行分析时

6、,SPSS会自动对原始数据进行标准化处理,所以在得到计算结果后指的变量都是指经过标准化处理后的变量,但SPSS不会直接给出标准化后的数据,如需要得到标准化数据,则需调用Descriptives(分析→描述统计→描述)过程进行计算。图表3相关系数矩阵图表4方差分解主成分提取分析表主成分分析在SPSS中的操作应用(3)2008-03-2420:53图表5初始因子载荷矩阵从图表3可知GDP与工业增加值,第三产业增加值、固定资产投资、基本建设投资、社会消费品零售总额、地方财政收入这几个指标存在着极其显著的关系,与海关出口总额存在着显著关系。可见许多变

7、量之间直接的相关性比较强,证明他们存在信息上的重叠。主成分个数提取原则为主成分对应的特征值大于1的前m个主成分。注:特征值在某种程度上可以被看成是表示主成分影响力度大小的指标,如果特征值小于1,说明该主成分的解释力度还不如直接引入一个原变量的平均解释力度大,因此一般可以用特征值大于1作为纳入标准。通过图表4(方差分解主成分提取分析)可知,提取2个主成分,即m=2,从图表5(初始因子载荷矩阵)可知GDP、工业增加值、第三产业增加值、固定资产投资、基本建设投资、社会消费品零售总额、海关出口总额、地方财政收入在第一主成分上有较高载荷,说明第一主成分

8、基本反映了这些指标的信息;人均GDP和农业增加值指标在第二主成分上有较高载荷,说明第二主成分基本反映了人均GDP和农业增加值两个指标的信息。所以提取两个主成分是可以

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。