boxcox变换及其在stata软件中的实现

boxcox变换及其在stata软件中的实现

ID:25448119

大小:51.50 KB

页数:4页

时间:2018-11-20

boxcox变换及其在stata软件中的实现_第1页
boxcox变换及其在stata软件中的实现_第2页
boxcox变换及其在stata软件中的实现_第3页
boxcox变换及其在stata软件中的实现_第4页
资源描述:

《boxcox变换及其在stata软件中的实现》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、BoxCox变换及其在STATA软件中的实现【摘要】  目的:向医疗卫生领域的一线工作者介绍BoxCox变换。方法:利用STATA软件包拟合BoxCox回归模型。结果:通过使用示例数据库进行拟合,成功的进行了BoxCox变换,并进行了回归分析。结论:使用BoxCox变换是解决应变量不符合正态分布的重要方法,而STATA软件提供了进行BoxCox变换的可行之道。【关键词】BoxCox变换 STATA软件 boxcox命令    1BoxCox变换简介在统计工作中,特别是在一般线性模型的运用中,经常出

2、现连续型应变量不符合正态分布的情况(在线性模型中对自变量没有类似的要求[1]),此时如直接使用线性模型,显然是不合适的,而通常的解决办法有两种:一是对应变量y进行变量变换;二是使用广义线性模型。本研究讨论前者。对应变量y进行变量变换有许多方法,如倒数变换、指数变换等,而这些变换都可以通过一个公式而统一起来,这就是Box和Cox在1964年提出的BoxCox变换,其形式为[2]:y(λ)=yλ-1λ,ifλ≠0logy,ifλ=0显然,该变换在λ=0时为对数变换,λ=-1时为倒数变换,而在λ=0.5时为平方根变换

3、[3]。BoxCox变换还有一个扩展公式:y(λ)=(y+a)λ-1λ,ifλ≠0log(y+a),ifλ=0此时的a是为了使y+a>0。无论是基本式还是扩展式,真正需要估计的只有一个参数λ(因为a的取值非常明显),而对λ的估计,在Box和Cox论文中采用了两种方法,其一是最大似然估计,其二是Bayes方法。但对于一般的用户而言,两种方法的理论和推证过程都可以不管,最重要的是如何在实践中运用,这也是本研究所要重点关注的。如何在实践中完成BoxCox变换呢?最直接的当然是使用公式,但最简单的还是使用相关的

4、统计软件。现在我们就用较流行的统计软件STATA来实现BoxCox变换过程,由于STATA7.0以后的版本和以前的版本在变换命令的使用上有很大的不同,故本研究分别进行表述。  2示例一:STATA6.0软件的实现过程为了说明问题,我们使用一个叫auto的数据库进行示例,这个数据库来自1974年4月美国的消费报告和美国EPA的燃料消耗统计[4],我们的任务是研究汽车时速(mpg)与车重(pg经检验不符合正态分布。在STATA6.0软件中有直接的命令可供调用,其命令的基本格式为[5]:Boxcoxyx1x2x3,g

5、(y1)这里,y为应变量,xi表示的是自变量,y1为进行转换后生成的新变量,其命令名称boxcox,此处STATA只认为最靠近命令的变量为应变量,而其它的变量则被认为是自变量。如果要继续进行BoxCox回归,则在运行boxcox命令后紧接着运行regress命令从而得到回归的结果。下面我们来看实例。  2.1命令Boxcoxmpgpg现在符合了(见y1的检验),且对比结果表2和表3就会发现,两者的结果是有差异的,进行了应变量变换后的BoxCox回归的决定系数要高于普通的回归过程,且变量price也变得有意义了

6、。表1BoxCox变换结果(略)表2BoxCox回归结果(略)表3直接进行回归分析结果(略)表4变量在BoxCox变换前后正态性的检验结果(略)  3示例二:STATA7.0软件的实现过程实例同示例一。在STAT7.0软件中也有直接的命令可供调用,其命令的基本格式为[6]:Boxcoxyx1x2x3,lrtest注意,此处不能再如6.0版那样生成新变量,另外,此时命令运行的结果已经包含了BoxCox回归,所以在6.0中的regress命令也被取消了。而lrtest的意义是对回归系数进行检验。下面我们来看实

7、例。.L.编辑。  3.1命令Boxcoxmpgation:AnOvervieentofStatistics.UniversityofConnecticut,2005.  3陈峰.医用多元统计分析方法.北京:中国统计出版社,2000,131.  4王建民,编译.Stata2.05版软件使用手册.中国预防医学科学院(内部资料),1993,21.  5stataco.stata7.0uesrmanual,2000.  6stataco.stata7.0uesrmanual,1999.

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。