(概率论与数理统计 茆诗松) 第5章 统计量及其分布(5.3).ppt

(概率论与数理统计 茆诗松) 第5章 统计量及其分布(5.3).ppt

ID:57300702

大小:437.50 KB

页数:41页

时间:2020-08-10

(概率论与数理统计 茆诗松) 第5章 统计量及其分布(5.3).ppt_第1页
(概率论与数理统计 茆诗松) 第5章 统计量及其分布(5.3).ppt_第2页
(概率论与数理统计 茆诗松) 第5章 统计量及其分布(5.3).ppt_第3页
(概率论与数理统计 茆诗松) 第5章 统计量及其分布(5.3).ppt_第4页
(概率论与数理统计 茆诗松) 第5章 统计量及其分布(5.3).ppt_第5页
资源描述:

《(概率论与数理统计 茆诗松) 第5章 统计量及其分布(5.3).ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、样本均值样本方差样本标准差样本偏度§5.3统计量及其分布样本峰度次序统计量样本分位数样本中位数5.3.1统计量与抽样分布当人们需要从样本获得对总体各种参数的认识时,最好的方法是构造样本的函数,不同的函数反映总体的不同特征。定义5.3.1设x1,x2,…,xn为取自某总体的样本,若样本函数T=T(x1,x2,…,xn)中不含有任何未知参数。则称T为统计量。统计量的分布称为抽样分布。按照这一定义:若x1,x2,…,xn为样本,则以及经验分布函数Fn(x)都是统计量。而当,2未知时,x1,x1/等均不是统

2、计量。统计量是样本的一个函数统计量是统计推断的基础尽管统计量不依赖于未知参数,但是它的分布一般是依赖于未知参数的。5.3.2样本均值及其抽样分布定义5.3.2设x1,x2,…,xn为取自某总体的样本,其算术平均值称为样本均值,一般用表示,即思考:在分组样本场合,样本均值如何计算?二者结果相同吗?xx=(x1+…+xn)/n定理5.3.2数据观测值与均值的偏差平方和最小,即在形如(xic)2的函数中,样本均值的基本性质:定理5.3.1若把样本中的数据与样本均值之差称为偏差,则样本所有偏差之和为0,即最小,其

3、中c为任意给定常数。样本均值的抽样分布:定理5.3.3设x1,x2,…,xn是来自某个总体的样本,x为样本均值。(1)若总体分布为N(,2),则xx的精确分布为N(,2/n);若总体分布未知或不是正态分布,但E(x)=,Var(x)=2,则n较大时的渐近分布为N(,2/n)。这里渐近分布是指n较大时的近似分布.中心极限定理(centrallimittheorem)x的分布趋于正态分布的过程在重复选取容量为n的样本时,由样本均值的所有可能取值形成的相对频数分布一种理论概率分布推断总体均值的理

4、论基础样本均值的抽样分布5.3.3样本方差与样本标准差称为样本标准差。s*=s*2定义5.3.3称为样本方差,其算术平方根在n不大时,常用作为样本方差,其算术平方根也称为样本标准差。xi与样本均值的平均偏差平方和在这个定义中,(xix)2n1称为偏差平方和的自由度。其含义是:x在确定后,n个偏差x1x,x2x,…,xnx能自由取值,因为只有n1个数据可以自由变动,而第n个则不(xix)=0.称为偏差平方和,中样本偏差平方和有三个不同的表达式:(xix)2=xi2–(xi)2/n=

5、xi2–nx它们都可用来计算样本方差。思考:分组样本如何计算样本方差?样本均值的数学期望和方差,以及样本方差的数学期望都不依赖于总体的分布形式。定理5.3.4设总体X具有二阶矩,即E(x)=,Var(x)=2,x1,x2,…,xn为从该总体得到的样本,x和s2分别是样本均值和样本方差,则E(x)=,Var(x)=2/n,E(s2)=2习题5.3Q8Q3Q75.3统计量及其分布(续)样本矩次序统计量样本分位数箱线图5.3.4样本矩及其函数样本均值和样本方差的更一般的推广是样本矩,这是一类常见的

6、统计量。定义5.3.4ak=(xik)/n称为样本k阶原点矩,特别,样本一阶原点矩就是样本均值。称为样本k阶中心矩。特别,样本二阶中心矩就是样本方差。bk=(xix)k/n当总体关于分布中心对称时,我们用x和s刻画样本特征很有代表性,而当其不对称时,只用就显得很不够。为此,需要一些刻画分布形状的统计量,如样本偏度和样本峰度,它们都是样本中心矩的函数。样本偏度1反映了总体分布密度曲线的对称性信息。样本峰度2反映了总体分布密度曲线在其峰值附近的陡峭程度。定义:1=b3/b23/2称为样本偏度,2=b

7、4/b22称为样本峰度。x和s偏态与峰态分布的形状扁平分布尖峰分布偏态峰态左偏分布右偏分布与标准正态分布比较!偏度峰度数据分布偏斜程度的测度偏态系数=0为对称分布偏态系数>0为右偏分布偏态系数<0为左偏分布偏态系数大于1或小于-1,被称为高度偏态分布;偏态系数在0.5~1或-1~-0.5之间,被认为是中等偏态分布;偏态系数越接近0,偏斜程度就越低数据分布扁平程度的测度峰态系数=0扁平峰度适中峰态系数<0为扁平分布峰态系数>0为尖峰分布5.3.5次序统计量及其分布一、定义5.3.7设x1,x2,…,xn是取自总

8、体X的样本,x(i)称为该样本的第i个次序统计量,它的取值是将样本观测值由小到大排列后得到的第i个观测值。其中,x(1)=minx1,x2,…,xn称为该样本的最小次序统计量,称x(n)=maxx1,x2,…,xn为该样本的最大次序统计量。例5.3.6设总体X的分布为仅取0,1,2的离散 均匀分布,分布列为0121/31/31/3在一个样本中,x1,x2,…,xn是独立同分布的,而次序统计量

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。