500 likes | 666 Views
《 统计学概论 》. 主讲/制作:李铁峰 电话 :13979708403. 第五章 抽样推断 ( 10 学时). 第一节 抽样推断的基本概念 第二节 随机抽样方法与抽样分布 第三节 参数估计 第四节 假设检验. 假设检验. 随机抽样方法与抽样分布 参数估计. 重点、难点. 不予以介绍. 练习. 退出. 第一节 抽样推断的基本概念. 一、 抽样推断的含义 二、 抽样推断的作用 三、 抽样推断的几个基本概念. 重点. 请点击此处返回. 抽样组织方式:简单随机抽样、类型抽样、等距抽样、整群抽样、多阶段抽样、等等。.
E N D
《统计学概论》 主讲/制作:李铁峰 电话:13979708403
第五章 抽样推断(10学时) 第一节 抽样推断的基本概念 第二节 随机抽样方法与抽样分布 第三节 参数估计 第四节 假设检验 假设检验 随机抽样方法与抽样分布 参数估计 重点、难点 不予以介绍 练习 退出
第一节 抽样推断的基本概念 一、抽样推断的含义 二、抽样推断的作用 三、抽样推断的几个基本概念 重点 请点击此处返回
抽样组织方式:简单随机抽样、类型抽样、等距抽样、整群抽样、多阶段抽样、等等。抽样组织方式:简单随机抽样、类型抽样、等距抽样、整群抽样、多阶段抽样、等等。 直接观察法、报告法、询问法、等等 抽样方法:重复抽样和不重复抽样。 一、抽样推断的含义 • 抽样推断—— • 随机原则—— 二、抽样推断的作用 教材76~77页 三、抽样推断的几个基本概念 重点 教材74页 四个方面各有其专门方法 点估计、区间估计 重点 Z检验、T检验、F检验等 → 误差可算可控制 教材74页 返回
→ 教材75页 是唯一确定的 三、抽样推断的几个基本概念 ㈠总体和样本 1.总体 ⑴概念 ⑵分类 • 按其单位数多少分 • 有限总体 • 无限总体 • 按其单位标志性质分 • 变量总体 • 属性总体 2.样本 ㈡参数和统计量 ㈢样本容量和样本个数 ㈣抽样误差和抽样平均误差 → 用数量标志描述的,如右上表 → 用品质标志描述的,如右下表
2.样本 ⑴概念 ⑵分类 • 按其单位数多少分 • 大样本 → n≥30 • 小样本 → n<30 • 按其单位标志性质分 • 变量样本 • 属性样本 ㈡参数和统计量 → 教材75页 不是唯一确定的,是随机的 → 用数量标志描述的,如右上表 → 用品质标志描述的,如右下表
㈡参数和统计量 1.参数(全及指标、全及总体指标) ⑴概念 教材75页 反映总体特征(数量、属性)的综合指标 是唯一确定的变量 ⑵内容 2.统计量(样本指标)
→ 不同性质的总体,其参数内容不同 简单式 加权式 加权式 ⑵内容 ①变量总体 a.总体单位数 b.总体平均数 c.总体方差 ②属性总体 a.总体单位数 b.总体成数 c.总体成数方差 2.统计量(样本指标) ⑴概念 教材76页 反映样本特征(数量、属性)的综合指标 → 是一个随机变量 ⑵内容 简单式 加权式 加权式
→ 不同性质的样本,其统计量内容不同 简单式 加权式 加权式 加权式 加权式 ⑵内容 ①变量样本 a.样本单位数 b.样本平均数 c.样本方差 d.修正样本方差 ②属性样本 a.样本单位数 b.样本成数 c.样本成数方差 ㈢样本容量和样本个数 简单式 加权式 加权式 简单式
→教材76页 ㈢样本容量和样本个数 1.样本容量(n) ⑴概念 即样本单位数,是指一个样本所包含的单位数。 ⑵确定 • 一般确定 • 社会经济统计的抽样推断多取大样本 • 科学实验的抽样观察多取小样本 • 具体确定 详见§3 教材90页“必要抽样数目的确定” 2.样本个数 ⑴概念 亦称样本可能数目,是指从全及总体中可能抽取的样本个数。 ⑵确定 • 影响因素 • 样本容量 • 抽样方法 • 具体计算 详见§2 ㈣抽样误差和抽样平均误差 →教材77页 → 样本容量大,则样本个数少;反之,则多。 → 重复抽样的样本个数多,不重复抽样的样本个数少。
㈣抽样误差和抽样平均误差 1.抽样误差 ⑴概念 是指在遵守随机原则的条件下,用抽样总体指标估计 或推断全及总体指标所不可避免的误差。 ⑵具体内容 ⑶特点 ①是抽样调查所固有的,不可避免 ②其大小是可计算,是可控制的 ③它是个随机变量 2.抽样平均误差(平均误差) →教材77页
→教材77页 这些抽样误差的平均数即为平均数抽样平均误差( )。 2.抽样平均误差(平均误差) ⑴概念 简称平均误差,是指所有可能组成的样本的抽样平均数或抽样成数 与总体平均数或总体成数的平均误差(差异)。 样本不是唯一确定的,而是随机的。 假设所有可能不同的样本有C个 注意: 抽样误差的平均数不是算术平均,而是标准差式的平均。 ⑵意义 • 抽样平均误差越大,则表示样本的代表性低 • 抽样平均误差越小,则表示样本的代表性高 ⑶计算 详见§2 变量 样本 这些抽样误差的平均数即为成数抽样平均误差( )。 属性 样本 返回
第二节 随机抽样方法与抽样分布 ※ 抽样推断的抽样组织方式 一、重复简单随机抽样与抽样分布 二、不重复简单随机抽样与抽样分布 三、抽样平均误差的计算综述 四、抽样分布定理 怎样抽样 ※ 抽样推断的抽样方法 ※ 重点 略 请点击此处返回
→ 举例理解 :教材77页 一、重复简单随机抽样与抽样分布 ㈠重复简单随机抽样 1.概念 教材77页 2.特点 ㈡抽样分布 1.样本平均数的抽样分布 ⑴概念 样本平均数的概率分布 举例: ⑵构成要素 • 样本平均数 • 频数或频率 ⑶有关指标 2.样本成数的抽样分布 → 教材77页 → 教材78页 教材78页表5-2 组别 次数
⑶有关指标 ①样本平均数的数学期望值即样本平均数的平均数 a.定义式 b.推导式 举例 表5-1 表5-2 ②样本平均数的方差( )或标准差( ) :教材78例1 定义式 解: 推导式
②样本平均数的方差( )或标准差( ) ②样本平均数的方差( )或标准差( ) 依据教材77页抽样平均误差的概念,可知样本平均数的标准差 即为平均数的抽样平均误差(抽样标准误差)。 所以,平均数抽样平均误差的计算为: 举例: 2.样本成数的抽样分布 教材80例2
→ 教材81页 举例: 2.样本成数的抽样分布 ⑴概念 样本成数的概率分布 从甲(男)、乙(女)、丙(女)三人中抽取两人形成 样本,有关资料如下表所示: ⑵构成要素 • 样本成数 • 频数或频率 ⑶有关指标 样本成数的抽样分布 组别 次数
⑶有关指标 ①样本成数的数学期望值即样本成数的平均数 a.定义式 b.推导式 举例 ②样本成数的方差( )或标准差( )
举例:从甲(男)、乙(女)、丙(女)三人中抽取两人形成样本, 举例:从甲(男)、乙(女)、丙(女)三人中抽取两人形成样本, 有关资料如下表所示: ②样本成数的方差( )或标准差( ) 由上左表得 定义式 由上右表得 解: 推导式
②样本成数的方差( )或标准差( ) 依据教材77页抽样平均误差的概念,可知样本成数的标准差 即为成数的抽样平均误差(抽样标准误差)。 所以,成数抽样平均误差的计算为: 举例
例1、从甲(男)、乙(女)、丙(女)三人中抽取两人形成样 例1、从甲(男)、乙(女)、丙(女)三人中抽取两人形成样 本,有关资料如下表所示: 例2、 上左 表 定义 式 二、不重复 简单随机抽样与抽样分布 上右 表 解: 推导 式 教材86页例5 返回
同于 “重复简单随机抽样的抽样分布” 只是样本个数更少而已 → 举例理解 :教材82页 二、不重复简单随机抽样与抽样分布 ㈠不重复简单随机抽样 1.概念 教材81页 2.特点 ㈡抽样分布 1.样本平均数的抽样分布 ⑴概念 样本平均数的概率分布 举例: ⑵构成要素 • 样本平均数 • 频数或频率 ⑶有关指标 2.样本成数的抽样分布 → 教材82页 → 教材82页 教材83页表5-5 组别 次数
⑶有关指标 ①样本平均数的数学期望值即样本平均数的平均数 a.定义式 b.推导式 举例 表5-4 表5-5 ②样本平均数的方差( )或标准差( ) 同于 “重复简单随机抽样 样本平均数抽样分布相关指标的计算” 只是样本个数更少而已 :教材82例3 定义式 解: 推导式
②样本平均数的方差( )或标准差( ) ②样本平均数的方差( )或标准差( ) 依据教材77页抽样平均误差的概念,可知样本平均数的标准差 即为平均数的抽样平均误差(抽样标准误差)。 所以,平均数抽样平均误差的计算为: 举例: 2.样本成数的抽样分布 同于 “重复简单随机抽样 样本平均数抽样分布相关指标的计算” 只是样本个数更少而已 条件: N 很大 教材85例4
→ 教材86页 举例: 2.样本成数的抽样分布 ⑴概念 样本成数的概率分布 从甲(男)、乙(女)、丙(女)三人中抽取两人形成 样本,有关资料如下表所示: ⑵构成要素 • 样本成数 • 频数或频率 ⑶有关指标 样本成数的抽样分布 同于 “重复简单随机抽样的抽样分布” 只是样本个数更少而已 组别 次数
⑶有关指标 ①样本成数的数学期望值即样本平均数的平均数 a.定义式 b.推导式 举例 ②样本成数的方差( )或标准差( ) 同于 “重复简单随机抽样 样本成数抽样分布相关指标的计算” 只是样本个数更少而已
举例:从甲(男)、乙(女)、丙(女)三人中抽取两人形成样本, 举例:从甲(男)、乙(女)、丙(女)三人中抽取两人形成样本, 有关资料如下表所示: ②样本成数的方差( )或标准差( ) 由上左表得 定义式 由上右表得 解: 推导式
②样本成数的方差( )或标准差( ) 依据教材77页抽样平均误差的概念,可知样本成数的标准差 即为成数的抽样平均误差(抽样标准误差)。 所以,成数抽样平均误差的计算为: 举例 同于 “重复简单随机抽样 样本成数抽样分布相关指标的计算” 只是样本个数更少而已 条件: N 很大
例1、从甲(男)、乙(女)、丙(女)三人中抽取两人形成样 例1、从甲(男)、乙(女)、丙(女)三人中抽取两人形成样 本,有关资料如下表所示: 例2、 上左 表 定义 式 三、抽样平均误差 的计算综述 上右 表 解: 推导 式 返回 教材86页例5
三、抽样平均误差的计算综述 ⑴理论公式(定义式) 实务中一般不宜采用 ⑵推导公式(推导式) 注意: 原因: 、 为一系列数值
⑵推导公式(推导式) 实务中注意公式的选用: 在未明确重复抽样和不重复抽样时,若已知总体单位 数,则应选择不重复抽样平均误差计算公式。 样 本 容量大 样 本 容量大 教材90页 样 本 容量大 样 本 容量大 条件: N 很大 条件: N 很大 举 例
举例: 例1、灯泡2,000只,抽400只检查,结果平均寿命4,000小时,标准 差300小时,求该次抽样的平均误差(即灯泡平均寿命抽样平均误差)? 例2、随机抽400名学生,发现近视眼的有280名,求该次抽样的平 均误差(即学生近视率抽样平均误差)? 例3、罐头60,000桶,抽300桶,其中有6桶不合格,求罐头合格率 抽样平均误差? 四、抽样分布定理 → 略 教材87页 返回
第三节 参数估计 一、 二、 三、抽样组织方式 重点 难点 参数估计 参数估计 参数估计 必要抽样数目的确定 必要抽样数目的确定 简单了解 请点击此处返回
一、参数估计 ㈠概念 教材88页 ㈡方法 1.点估计 ⑴概念 ⑵举例 ⑶效果评价 • 有的可能效果很好 • 有的可能效果不好 注意: • 无偏性 • 有效性 • 一致性 ⑷适用范围 2.区间估计 → 教材88页 → 教材88页 作为一个优良的估计量应符合三个标准 → 教材88页
→ 教材89页 t为概率度,可通过正态分布概率表查得。 2.区间估计 ⑴概念 ⑵必备要素 ⑶数学公式 ⑷举例 重复抽样 变量总体 不重复抽样 重复抽样 属性总体 不重复抽样
⑶数学公式 ⑷举例 总体平均数估计 即 总体总量估计
⑷举例 ①已知概率度t或置信度F(t),估计总体指标的可能范围 教材89例7、8 ②已知总体指标的可能范围,估计其置信度F(t) 教材90例9 ③综合举例 某厂生产一批电子元件,从中按比列抽取部 分电子元件进行耐用时数检测,耐用时数小于 1,000小时为不合格品,有关资料如右表所示, 在95.45%的置信度下。 要求:计算该批电子元件平均耐用时数的可 能范围及该批电子元件合格率的可能范围。
运用计算器的 单变量统计运算功能 输入数据 结果输出
二、必要抽样数目的确定 返回
二、必要抽样数目的确定 1.意义 • 达到抽样误差的事先控制 • 有效避免人力、财力的浪费 2.方法 运用极限误差计算式反推出样本单位数n的确定公式 ⑴变量总体 ⑵属性总体 3.影响因素 →举例:教材91页例10 →举例:教材91页例12 →举例:教材91页例11 →举例:教材92页例13
重复抽样 3.影响因素 ① ② ③ ④ ⑤ 三、抽样组织方式 不重复抽样 → 方式不同,则其必要抽样数目不同 返回
三、抽样组织方式 简单随机抽样(纯随机抽样) 类型抽样(分层抽样、分类抽样) 等距抽样(机械抽样、系统抽样) 整群抽样(集团抽样) 多阶段抽样 1.简单随机抽样 ⑴概念 按随机原则直接从总体 个单位中抽取 个单位形成样本的一 种抽样组织方式。 它是最基本最简单的抽样组织方式,其他各种抽样组织方式下 的误差公式均是从简单随机抽样的误差公式演化而来的。 ⑵具体抽样方法 ⑶抽样误差的计算 2.等距抽样
⑵具体抽样方法 ①直接抽选法 总体单位不多或比较集中,到现场从全部单位中按事先确定的 抽样数目直接对实物进行现场抽取。 ②抽签法 先把全及总体各个单位都编上号码,并做成签,再把签掺合均 匀,任意抽取所需单位数,然后按照抽中的号码查对调查单位加以 登记。 ③随机数字表法 将全及总体各个单位加以编号,然后从随机数字表的任何一行 任何一列向任何方向开始读数,读到编号范围内的数字,即为抽中 的样本单位,直到抽够预定样本单位数量为止。 ⑶抽样误差的计算 2.等距抽样 →举例 → 略 前面已介绍
可以是与单位变量值大小无关的无关标志,也可以是与单位变量值密切相关的有关标志。可以是与单位变量值大小无关的无关标志,也可以是与单位变量值密切相关的有关标志。 2.等距抽样 ⑴概念 先将总体的所有单位按某一标志顺序排列,然后依照固定 的顺序和间隔抽取一个样本单位的一种抽样组织方式。 ⑵具体抽样方法 随机抽选法 半距中点取样法 对称等距取样法 ⑶抽样误差的计算 →随机样本 →中位样本、半距样本 →对称样本 → 举例 ※
:以随机抽选法为例 005 007 012 017 002 005 006 006 015 015 016 016 025 029 029 举例 总体单位数20,样本单位数5,采用等距抽样中的随机抽选法。 具体操作: ①将总体单位按某一标志(如:学生财务编号)顺序排列 ②将总体单位顺序分成 组,每组包括 个单位 ③在第1组中随机抽取1个单位即为第1个样本单位 ④从第1个样本单位开始,每加 个间隔来抽取下一个样本单位 ⑶抽样误差的计算 ①理论上 按无关标志排列,则 ,故用 公式计算 。 按有关标志排列,则 且 ,故用 公式计算 。 ②实践中 均采用 公式来计算,且采用 公式来计算。 259 123 125 126 257 258 366 090 090 126 256 256 259 356 356 采用简单随机抽样组织方式 原因:等距抽样一般都采用不重复抽样方法。 返回
课后练习: 《统计学概论习题集》45~50页 请点击此处结束
第五章结束, 谢谢大家! 主讲/制作:李铁峰 退出
随机数字表是包含许多随机数字的表格,它是从0到9十个数码随机组合而成的数字表格。随机数字表是包含许多随机数字的表格,它是从0到9十个数码随机组合而成的数字表格。 为了方便使用,表格中的数字可编成2个数码一组,或4个数码一组,甚至10个数码一组。 抽样时,先根据编号的位数确定使用随机数字表中的若干位数字,然后从表中任一行、任一列、任一方向(上、下、左、右均可)开始取数,遇属编号范围内的数字即为样本单位,否则跳过。重复抽样可保留重复出现的数字,不重担抽样则不保留重复出现的数字。
43 43 36 36 47 47 36 36 46 46 24 24 举例:N=50,n=5,采用简单随机抽样中的随机数字表法。 17 17 12 12 07 07 假设从第一行第三列开始取数顺序确定样本点
举例:N=50,n=5,采用简单随机抽样中的随机数字表法。举例:N=50,n=5,采用简单随机抽样中的随机数字表法。 6242 6242 8114 8114 5720 5720 4253 4253 7107 7107 5313 5313 假设从第二行第六列开始取数码后两位数顺序确定样本点 返回