310 likes | 500 Views
第六章 参数估计. ( parameter estimation ). 安徽师范大学体育学院. 0 概 述. 用样本统计量的来估计相应总体参数,称为 参数估计。 判断 估计量 优劣的标准 无偏性 有效性 一致性 充分性. 参数估计的基本方式. 以样本统计量的抽样分布(概率分布)为理论依据,按一定概率要求,由样本统计量的值估计总体参数值的所在范围,称为总体参数的 区间估计 。. 用某一样本统计量的值来估计相应总体参数的值叫总体参数的 点估计 。.
E N D
第六章 参数估计 (parameter estimation) 安徽师范大学体育学院
0 概 述 • 用样本统计量的来估计相应总体参数,称为参数估计。 • 判断估计量优劣的标准 无偏性 有效性 一致性 充分性
参数估计的基本方式 以样本统计量的抽样分布(概率分布)为理论依据,按一定概率要求,由样本统计量的值估计总体参数值的所在范围,称为总体参数的区间估计。 用某一样本统计量的值来估计相应总体参数的值叫总体参数的点估计。 • 用样本对总体的未知参数进行估计的方法常见的有两种: • 点估计(point estimation) • 区间估计(interval estimation)
第一节 总体参数的点估计 设总体为 为样本观测值。 利用样本特征数去估计总体特征数 。 点估计的方法: 例如:
例1: 为了考察安师大男生的身高状况,随机抽测50人得到 试估计师大男生的平均身高和标准差。 解: 在上例中安师大男生平均身高的估计值是170cm,但其真正的平均身高是否就是170cm? 未必就是,这里面存在误差。那么这种误差是如何产生的呢?
第二节 抽样误差和标准误 • 一、抽样误差 由于总体的个体之间存在着差异,使得样本指标与总体指标之间有差异,这种误差称为抽样误差。 • 抽样误差的来源总体内个体之间的差异。 例如,在上例中师大男生的平均身高如果是μ=168cm,则估计误差为2cm,这是由抽样误差造成的,抽样误差来自于各学生的身高差异。估计误差的大小与抽样误差大小有关。
二、标准误 (standard error,SE) (一)标准误的概念 若总体 或总体分布不明但样本含量很大时,样本平均数服从或近似服从正态分布, 即 : 是反映样本均数抽样误差大小的指标。 的离散程度反映了抽样误差的大小, 定义:样本均数的标准差称为均数的标准差,又称标准误。 记作 :
(二)标准的计算 • 总体标准差σ一般是未知的,应用中以样本标准差 S近似代替,从而可得标准误的计算公式 。 例如,例1中标准误为:
第三节 总体均数的区间估计 引言 前面,我们讨论了参数点估计. 它是用样本算得的一个值去估计未知参数. 但是,点估计值仅仅是未知参数的一个近似值,它没有反映出这个近似值的误差范围,使用起来把握不大. 区间估计正好弥补了点估计的这个缺陷 .
在例1利用点估计的方法,得到平均身高的估计值为显然存在误差,但误差究竟有多大?还是不知道。在例1利用点估计的方法,得到平均身高的估计值为显然存在误差,但误差究竟有多大?还是不知道。 • 因此,若能估计出平均身高所在范围,并给出相应的可靠性程度则更现实,实用价值更大,这就是区间估计。
一、基本概念 (一)区间估计:具体如前述。 • 简单地说就是用一个区间去估计未知参数,把未知参数估计在某两个界限之间。 (二)置信区间: • 按照预先给定的概率(1- α)确定的包含未知总体参数的可能范围。它是以上下置信限(L1 , L2)为界。
一、基本概念 (三)置信概率: • 又称置信水平或置信度,指在区间估计中,预先选定(规定)的概率。用 1-α表示。常取95%或99%。 (四)显著性水平: • 在使用置信区间作估计时,被估计的参数不在该区间内的概率。用α表示。一般α取值要求较小。
要点 置信区间表达了区间估计的精确性。 置信概率(1-α)表达了区间估计的可靠性。它是区间估计的可靠概率。 显著性水平α表达了区间估计的不可靠的概率。
二、置信区间的计算 (一)μ未知, 时 例1设X1,…Xn是取自的样本, 求参数 的置信度为 的置信区间. 选 的点估计为 寻找未知参数的 一个良好估计. 明确问题,是求什么参数的置信区间? 置信水平是多少? 解: ~N(0, 1) 寻找一个待估参数和 估计量的函数 ,要求 其分布为已知. 有了分布,就可以求出 U取值于任意区间的概率.
对给定的置信水平 查正态分布表得 为什么 这样取? 使 对于给定的置信水平(大概率), 根据U的分布, 确定一个区间, 使得U取值于该区间的概率为 置信水平.
对给定的置信水平 查正态分布表得 使 从中解得
于是所求 的 置信区间为 也可简记为
置信水平 是多少? 2. 寻找参数 的一个良好的点估计T (X1,X2,…Xn) 3. 寻找一个待估参数 和估计量T的函数 S(T, ),且其分布为已知. 称S(T, )为枢轴量. 从例1解题的过程,我们归纳出求置信区间的一般步骤如下: 1. 明确问题, 是求什么参数的置信区间?
4. 对于给定的置信水平,根据S(T, )的分布,确定常数a, b,使得 P(a ≤S(T, )≤b)= 5. 对“a≤S(T, )≤b”作等价变形,得到如下 形式: 则 就是 的100( )%的置信区间.
可见,确定区间估计很关键的是要寻找一个待估参数 和估计量T 的函数S(T, ), 且S(T, )的分布为已知, 不依赖于任何未知参数 (这样我们才能确定一个大概率区间). 而这与总体分布有关,所以,总体分布的形式是否已知,是怎样的类型,至关重要.
这里,我们主要讨论总体分布为正态的情形. 若样本容量很大,即使总体分布未知,应用中心极限定理,可得总体的近似分布,于是也可以近似求得参数的区间估计.
单个正态总体均值 和方差 的区间估计. 两个正态总体均值差 和方差比 的区间估计. 教材上讨论了以下几种情形: 比例 p 的区间估计. 下面我们举几个例子,其余部分请自己看.
例2:已知某校18岁男生的100m跑成绩近似服从正态分布 , 未知,今抽测50人,得 ,求该校男生(18岁)百米跑成绩平均值的95%置位区间。 解:已知: 查表:uα/2=1.96 1.求μ的置信区间,置信水平为1-α=0.95 2.μ的良好估计量为 所以:本题目的结果应为 3.构造统计量的函数 4.依据例1的结果 即:μ的95%的置信区间为(12.38,12.82 )
(二) 例3: 解: 根据前面分析,该区间形如 由于σ未知,只能用 S 代替 根据前面分析,所以: 即:该统计量服从自由度为n-1的 t分布。? 据上次课内容知:
所以:可以查 t分布表:得 所以:μ的1-α的置信区间为:
例4: 随机抽测末学校39名男生100m跑成绩资料,已知 试求该校男生100m跑成绩的95%的置信区间。 解: 查表: (p370) 所以:
小结 1.参数估计可分为点估计和区间估计。 2.抽样误差的来源总体内个体之间的差异。 3.标准误反映了抽样误差的大小,与σ成正比与样本含量的平方根成反比 4.用某一样本统计量的值来估计相应总体参数的值叫总体参数的点估计 5.以样本统计量的抽样分布(概率分布)为理论依据,按一定概率要求,由样本统计量的值估计总体参数值的所在范围,称为总体参数的区间估计。
作业: 1.P134:2 4 5 2.区间估计的基本思想是什么? 3.区间估计的步骤如何?
t 分布 • t分布具有以下特点 1.t分布密度函数曲线关于t=0对称,并在t=0处达到最大值 2.随着自由度的增大,t分布渐近标准正态分布。