统计学复习相关资料

统计学复习相关资料

ID:27803920

大小:366.17 KB

页数:12页

时间:2018-12-06

统计学复习相关资料_第1页
统计学复习相关资料_第2页
统计学复习相关资料_第3页
统计学复习相关资料_第4页
统计学复习相关资料_第5页
资源描述:

《统计学复习相关资料》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、第一章1.统计学的概念统计学是一门收集、整理、显示和分析统计数据的科学,其目的是探索数据内在的数量规律性。2.统计学的分类:描述统计和推断统计描述统计:是用图形、表格和概括性的数字对数据进行描述的统计方法。推断统计:是根据样本信息对总体进行估计、假设检验、预测或其他推断的统计方法。3.统计数据误差的分类:非抽样误差和抽样误差非抽样误差:是由于调查过程屮各有关环节工作失误造成的。是可以避免的抽样谋差:是利用样木推断总体时产生的谋差。是不可避免的,但可以计量和控制。4.①总体:所研究的全部个体(数据)的集合,是唯一的,确定的,其中的每一个个体也称为元素(总体单位)。总体容量N分为有限总体

2、和无限总体②样本:从总体中抽取的一部分元索的集合构成样本的元素的数目称为样本容量或样木量n③变虽:是总体中个体单位所具冇的特征或特性变量的具体表现称为变量值,即数据④变量可以分为分类变量(categoricalvariable):说明事物类别的名称.如性别(男,女)特点:只能用文字表示,无人小,平行排列顺序变fi(rankvariable):说明事物冇序类别的名称。如产品等级。特点:只能用文字表示,有大小,可排序数值型变量(metricvariable):说明事物数字特征的名称。如:成绩、年龄、产量。特点:可用数字表示。分类变暈和顺序变量属于定性变量数值型变量属于定量变量第二章5.①

3、统计数据的分组:是将预处理过的数据按照某种特征或标准分成不同的组别。分组的作用:突出了组间差异,而掩盖了纽内差异②按定性指标分组——晶质标志分组按定量指标分组——数虽标志分组③数最标志分组“编制次数分布表等距分组异距分组单变量值分组:指每个组值只用一个貝体的变量值表现的数列编制条件:变量是离散变量,变量的不同取值个数较少。同时具备组距分组:指每个组的变虽值用一个区间来表现编制条件:变量是连续变量;或:总体单位数较多,变量不同取值个数也较多的离散变量。等距分组:变量值变动区间的长度相等异距分组:变罐值变动区间的长度不完全相等2.组限:指每组两端表示各组界限的变量值,各组的最小值为下限,

4、最人值为上限注意:对于离散变量,相邻组组限可以间断,也可重叠;対于连续变量,相邻组组限必须重叠纽距:每纽变量值变动区间的长度,为上下限之差纟R屮值:每组变量取值范围的屮点数值组中值=上限+下限23.图形图①条形图…-川于显示分类变量和顺序变量的次数分布②饼图——用于显示内部结构③直方图用于显示数值型变量的次数分布④茎叶图用于显示数值型变最的次数分布及具体构成4.①众数:指总体中出现次数最多的变虽值,用M0表示,它不受极端数值的彩响,用来说明总体屮人多数单位所达到的一般水平o组距分组众数的确定:一L+/1"4-/2L表示众数所在组的下组限,△1表示众数组次数与前一组次数Z差,△2表

5、示众数组次数与后一组次数Z差,i表示众数组的组距②中位数:将总体各单位标志值按大小顺序排列后,处于数列中间位置的标志值,用e表示。它不受极端数值的影响,在总体标志值差异很人时,具有较强的代表性。未分组的数据组距分组数据当为奇数时~XZ3=L+—2L表示中位数所在组的卞组限,表示中位数所在组一下各组的累枳次数,八'表示中位数所在组的次数,i表示中位数所在纽的组距。中位数的数学性质:各变虽值打中位数的离差绝对值Z和最小,即■n。瓦

6、Xi-Me

7、=min

8、OX-乂]+乂r+—+乂壮Z=1nnc/■%C加权均值——数据已分组yxfi-—Xfl+Xlfl+…+Xkfk_z=lfl+fl+…十fk几Z=1决定平均数的变动范围71——起到权衡轻重的作用②调和平均数:调和平均数,是各数据倒数的(简单)算术平均数的倒数加权调和平均数KVM注意:平均数二标志总量/单位数如果知道分子,用加权调和平均数;如果知道分母,用加权算术平均数③儿何平均数:是N项变量值连乘积的开N次方根应用:用于计算现象的平均比率或平均速度应用的前提条件:各个比率或速度的连乘积等于总比率或总速度;相乘的各个比率或速度不为零或负值④切尾均值:去掉人小两端的若干数值示计算屮间数据

9、的均值⑤中位数、众数、均值三者的关系对称分布左偏分布右偏分布X—M°=3(X-MJ2.离散程度①极差:指所研究的数据中,最大值与最小值之差(一般应用于对称、单峰、大样本)优点:计算方法简单、易懂;缺点:1、极差易受极端值的彩响;2、由于极差只利用了数据两端的信息,没冇反映中间数据的分散状况,因而不能准确描述数据的分散程度。②四分位差一内距25%25%25%25%QiQsQ3四G位聾=Q3_Q,内距二上四分位数■下四分位数特点:反映了中间5()%数据的离散程

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。