第十八讲 估计量的评选标准及区间估计

第十八讲 估计量的评选标准及区间估计

ID:1608885

大小:620.50 KB

页数:9页

时间:2017-11-12

第十八讲 估计量的评选标准及区间估计_第1页
第十八讲 估计量的评选标准及区间估计_第2页
第十八讲 估计量的评选标准及区间估计_第3页
第十八讲 估计量的评选标准及区间估计_第4页
第十八讲 估计量的评选标准及区间估计_第5页
资源描述:

《第十八讲 估计量的评选标准及区间估计》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、第十八讲估计量的评选标准及区间估计1.估计量的评价标准判断估计量好坏的标准是:有无系统偏差;波动性的大小;伴随样本容量的增大是否是越来越精确,这就是估计的无偏性,有效性和相合性。(1)无偏性设是未知参数的估计量,则是一个随机变量,对于不同的样本值就会得到不同的估计值,我们总希望估计值在的真实值左右徘徊,即其数学期望恰等于的真实值。定义:设()是未知参数的估计量,若存在,且对有=,则称是的无偏估计量,称具有无偏性。在科学技术中,-称为以作为的估计的系统误差,无偏估计的实际意义就是无系统误差。例1:设总体的阶中心矩存在,是的一个

2、样本,证明:不论服从什么分布,是的无偏估计量。证明:与同分布,第七章参数估计第3节估计量的评选标准从上一节得到:对于同一参数,用不同的估计方法求出的估计量可能不相同,用相同的方法也可能得到不同的估计量,也就是说,同一参数可能具有多种估计量,而且,原则上讲,其中任何统计量都可以作为未知参数的估计量,那么采用哪一个估计量为好呢?这就涉及到估计量的评价问题。对定义的理解:设是总体X的分布参数,,即服从某一分布形式的任意总体分布,参数的估计量()(是简单随机样本的函数)的数学期望都等于。特别,不论服从什么分布,只要存在,总是的无偏估

3、计。例2:设总体的都存在,且,若均为未知,则的估计量是有偏的。证明:,的估计量是有偏的。若在的两边同乘以,则所得到的估计量就是无偏了即,而恰恰就是样本方差可见,可以作为的估计,而且是无偏估计。因此,常用作为方差的估计量。从无偏的角度考虑,比作为的估计好。在实际应用中,对整个系统(整个实验)而言无系统偏差,就一次实验来讲,可能偏大也可能偏小,实质上并说明不了什么问题,只是平均来说它没有偏差。所以无偏性只有在大量的重复实验中才能体现出来;另一方面,我们注意到:无偏估计只涉及到一阶矩(均值),虽然计算简便,但是往往会出现一个参数的

4、无偏估计有多个,而无法确定哪个估计量好。例3:设总体服从指数分布,其概率密度为其中为未知,又是的一样本,则和都是的无偏估计。证明:,是的无偏估计。而则服从参数为的指数分布,其概率密度为即是的无偏估计。事实上,,中的每一个均可作为的无偏估计。(2)有效性:定义:设()与()都是的无偏估计量,若,有且至少存在一个同分布多维随机变量最小值的分布函数:那么,究竟哪个无偏估计更好、更合理,这就看哪个估计量的观察值更接近真实值的附近,即估计量的观察值更密集的分布在真实值的附近。我们知道,方差是反映随机变量取值的分散程度。所以无偏估计以方

5、差最小者为最好、最合理。为此引入了估计量的有效性概念。使上式中的不等号成立,则称有效。例4:(续例3)试证当时,的无偏估计量较的无偏估计量有效。证明: 又当时,显然有,故较有效。(3)相合性(一致性)定义:设()是参数的估计量,若对于任意,当时()以概率收敛于,则称为的相合估计量。即,若对于任意都满足:,有,则称为的相合估计量。例如:在任何分布中,是的相合估计;而都是的相合估计量。不过,相合性只有在n相当大时,才能显示其优越性,而在实际中,往往很难达到,因此,在实际工作中,关于估计量的选择要视具体问题而定。总体服从参数为的指

6、数分布,服从参数为的指数分布。关于无偏性和有效性是在样本容量固定的条件下提出的,即我们不仅希望一个估计量是无偏的,而且是有效的,自然希望伴随样本容量的增大,估计值能稳定于待估参数的真值,为此引入一致性概念。(课间休息)2.区间估计定义:设总体的分布函数含有一个未知参数,(是可能取值的范围),对于给定的,若由样本确定的两个统计量和,对于任意满足:(4.1)则称:随机区间[]为的置信水平为的置信区间,和分别称为置信水平为的双侧置信区间的置信下限和置信上限。称为置信水平。当是连续型随机变量时,对于给定的,我们总是按要求求出置信区间

7、;而当是离散型随机变量时,对于给定的,我们常常找不到区间[]使得恰为,此时我们去找区间[]使得至少为且尽可能地接近。例1: 设总体,为已知,为未知,是来自的样本,求的置信水平为的置信区间.解: 我们知道是的无偏估计,且有第3节区间估计从点估计中,我们知道:只要得到样本观测值,点估计值能给我们对的值有一个明确的数量概念。但是仅仅是的一个近似值,它并没有反映出这个近似值的误差范围,这对实际工作都来说是不方便的,而区间估计正好弥补了点估计的这个缺陷。定义中(4.1)式的意义在于:若反复抽样多次,每个样本值确定一个区间[],每个这样

8、的区间要么包含的真值,要么不包含的真值。据Bernoulli大数定律,在这样多的区间中,包含真值的约占100()%,不包含真值的约仅占100%,比如,=0.005,反复抽样1000次,则得到的1000个区间中不包含真值的区间仅为5个..据标准正态分布的上分位点的定义有:即这样,我们就得到了

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。