R软件-医学统计分析-有序logistic回归.pdf

R软件-医学统计分析-有序logistic回归.pdf

ID:51334678

大小:442.31 KB

页数:22页

时间:2020-03-10

R软件-医学统计分析-有序logistic回归.pdf_第1页
R软件-医学统计分析-有序logistic回归.pdf_第2页
R软件-医学统计分析-有序logistic回归.pdf_第3页
R软件-医学统计分析-有序logistic回归.pdf_第4页
R软件-医学统计分析-有序logistic回归.pdf_第5页
资源描述:

《R软件-医学统计分析-有序logistic回归.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、统计学进展/累积logisitic回归模型/曾庆1累积logisitic回归模型一、理论(一)模型定义假设结局变量Y有J个有序分类,其自然结局顺序表示为Y=1,2,...,J,每个分类(结局)的对应发生概率是π1,π2,...,πJ,则其有序分类小于等于j的累积发生概率表示为P(Y≤j)=π1+π2+...+πj,因此可以通过指定累积概率P(Y≤j)的阈值将整个结局变量Y的J个有序分类从该指定阈值点截断,使之成为二项结局分类。另外有p个自变量记为X=(x1,x2,…,xp),表示相应的影响因素(定性、定量均可)。由此定义累积log

2、it(Y≤j)函数:P(y≤j

3、x)P(y≤j

4、x)π1+π2+...+πjlogit[P(y≤j)]=ln=ln=ln1−P(y≤j

5、x)P(y>j

6、x)π+π+...+πj+1j+2J该累积logit(Y≤j)函数是两个累积概率比的对数值,它测定了结局变量Y小于等于分类j或者大于分类j的可能性大小。因为有J个有序分类结局,所以实际上可以写出至多J-1个的累积logit函数。P(y≤

7、1x)P(y≤

8、1x)π1logit[P(y≤1)]=ln=ln=ln1−P(y≤

9、1x)P(y>

10、1x)π+...+πj+2JJ−1个

11、LP(y≤J−

12、1x)P(y≤J−

13、1x)π+π+...+π12J−1logit[P(y≤J−1)]=ln=ln=ln1−P(y≤J−

14、1x)P(y>J−

15、1x)πJ将每个累积logit函数用线性函数的形式表示为logit[P(y≤1)]=β10+β11X1+...+β1pXpJ−1个Llogit[P(y≤J−1)]=β+βX+...+βXj−0,1j−1,11j−,1pp该模型就是累积logistic回归模型(cumulativelogitmodel)。对应的概率模型形式是exp(β+βX+...+βX)j0j

16、11jppP(y≤j)=1−exp(β+βX+...+βX)j0j11jpp为简化上述模型,进一步假定对于所有J-1个累积logit函数,各个自变量Xi所对应的回归系数βi都是相等的。即对每一个累积logit函数各有一个不同的截距βj0,然而对所有的累积logit函数,自变量Xi却有一个相同的βi。在此假设条件下,不同累积logit的回归线相互平行,只是截距βj0不同,这称为成比例发生比假设或平行线假设。满足平行线假设的模型简化后的是plogit[P(y≤j)]=βj0+β1X1+...+βpXp=βj0+∑βiXii=1log

17、it[P(y≤1)]=β10+β1X1+...+βpXp写成系列模型则是Llogit[P(y≤J−1)]=β+βX+...+βXJ−0,111pp该简化后的模型就称为成比例比数比累积logit模型(proportional-oddscumulativelogit统计学进展/累积logisitic回归模型/曾庆2model)。该模型有J−1截距,p个回归系数,共J+p−1个回归系数。一般认为累积logistic回归模型就是成比例比数比累积logit模型。对应的概率模型形式是exp(βj0+β1X1+...+βpXp)1P(y

18、≤j)==1+exp(β+βX+...+βX)1+exp[−(β+βX+...+βX)]j011ppj011pp使用成比例比数比累积logit模型首先需要对平行线假设进行检验。如果平行假设被拒绝,便说明自变量Xi对不同的logit有不同的βi,因而说明成比例比数比累积logit模型不适合,需要采用其他模型来进行资料的分析。(二)似然函数和对数似然函数对于有n个独立观察对象的样本,第i个观察对象Xi出现获得Y=j分类结局的概率记作Pj=P(Y=j

19、Xi),它是累积概率函数的差,即Pj=P(Y=j

20、Xi)=P(Y≤j

21、Xi)-P(Y≤

22、j-1

23、Xi)。由此构造似然函数L为:nnJnJL=Pyi1Pyi2LPyiJ=Pyij=PY≤jXPY≤jXyij∏(i1i2iJ)∏∏(ij)∏∏[(

24、i-)(

25、1-i)]i=1i=1j=1i=1j=1式中yij表示第i个观察对象自变量(探索变量)取值Xi时已观察到结局变量Y=j等级J时所对应的编码,它满足∑yij=1,即只有一个yij取值为1(属于该类),其余均为0。j=1相应的对数似然函数LL为nJnJLL=∑∑yijln(Pij)=∑∑yijln[logit(Pij)−logit(Pi,j−1)]i=1j=1i=1j=1

26、二、实例分析【实例1】现有资料如表1所示,试使用累积Logistic回归模型考察工作满意度与性别、收入水平之间的关系。表1不同性别及收入水平人群的满意度情况性别收入水平满意度(人)(y)(gender)(income)非常不满稍微满意比较满意非常满

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。