130 likes | 255 Views
均数的标准误及其应用. 一、均数的抽样误差与标准误 1 、标准误的意义 已知 1000 名 18 岁女生的身高 μ=160.00cm,σ=5.00cm, 先从该总体中随机抽样,每次抽 100 人,共抽 K 次,得 K 个样本均数和标准差如下: X 1 =162.30cm , S 1 =4.12cm X 2 =160.32cm , S 2 =4.85cm X 3 =159.67cm , S 3 =5.04cm X 4 =161.48cm , S 4 =5.21cm
E N D
均数的标准误及其应用 一、均数的抽样误差与标准误 1、标准误的意义 已知1000名18岁女生的身高μ=160.00cm,σ=5.00cm,先从该总体中随机抽样,每次抽100人,共抽K次,得K个样本均数和标准差如下: X1=162.30cm, S1=4.12cm X2=160.32cm,S2=4.85cm X3=159.67cm,S3=5.04cm X4=161.48cm, S4=5.21cm X5=159.30cm, S5=4.98cm …… …… XK=162.30cm, SK=4.12cm X6 X5 X3 160 X2 X4 X1
标准误计算 • 标准误反映了样本均数与总体均数之间的差异,说明均数抽样误差的大小。 2、计算 总体 样本 从公式中可以再次得到抽样误差的特点: 可以计算,可以控制,但不能消灭。 3、标准误的应用: (1)描述抽样误差的大小。 (2)估计总体均数的可信区间。 (3)作假设检验。
标准差与标准误的比较 标准差 标准误 • 意义 表示个体观察值间的变异, 表示样本均数间的变异程 说明观察值X围绕均数 度,说明样本均数围绕总 分散程度的指标. 体均数的分散程度的指标 • 计算公式不同 • 应用1表示个体观察值间的变异程度 1表示样本均数间的变异程 不同 2计算标准误 度,描述抽样误差的大小. 3估计正常值范围 2做假设检验 3估计可信区间
二、t 分布 • 在一定条件下,样本均数的分布也是正态分布,也可经u转换成标准正态分布, u =(X-μ)/σX 但实际中σX并不知,多用S X代替,则 t =(X-μ)/SX 无数个t值构成了t 分布 t分布多用于总体均数的区间估计和t检验。
特点 1、t分布的特点 A 以0为中心,中间高,两边低,左右对称。 B 形状由自由度(v)决定,v 越大,曲线越高耸,越接近标准 正态分布。但v为∞时,t 分布便成为u分布。 2、t分布曲线下的面积分布(t 界值表)
三、总体均数的估计 即用样本指标值估计总体指标值。 • 点值估计:X µ • 可信区间(CI):按预先给定的概率确定的包含未知总体参数的可能范围。 预制的概率1-α称为可信度,一般取95%。 95%CI的确切含义是:由样本均数确定的总体均数所在范围包含总体均数的可能性为95%。 CI的两个要素:准确度和精密度
可信区间的计算 A、 未知σ,按t分布估计 1、双侧CI: 2、单侧CI: μ<x +tα,νS/√n 或μ>x -tα,νS/√n
续 B 已知σ,或未知σ,但n足够大(n> 50),按 u分布估计 1、已知σ: 95%的置信区间: 99%的置信区间: 2、未知σ,但n足够大(n>50): 95%的置信区间: 99%的置信区间: 注意:均数的可信区间和参考值范围是不同的两个概念。
随机抽取某地健康男子20人,测得该样本的收缩压均数为随机抽取某地健康男子20人,测得该样本的收缩压均数为 118.4mmhg S=10.8mmhg ,估计该地男子收缩压总体均的95% 置信区间。 解:=20-1=19,查t值表t0.05,19=2.093,代入公式: =118.4−2.093 ; 118.4+2.09.3 =(113.3,123.5) 该地健康男子收缩压总体均数95%置信区间为113.3~123.5 mmhg。 总体均数95%置信区间的涵义是指,从理论上来说,做100次抽样,可得100个置信区间,平均有95%个置信区间包括总体均数,只有5个置信区间不包括总体均数,这种估计方法会有5%犯错误的风险。
1.t分布的图型形状与___________有关。 2. ___________情况下,t值=u值。 3.标准误愈小,表示_________愈小,_________对_________估计愈可靠。 4、样本标准误反映了抽样误差的大小,显然n越大抽样误差越大,用样本推断总体的精度越高。 5、参数估计有点值估计和区间估计两种方法,后者不涉及抽样误差,所以比前者更重要。
练习 1、_________小,表示用该样本均数估计总体均数的可靠性大。 A.CV B.S C.Sx D.R 2、与标准正态分布(u分布)比较,t分布的 A.中心位置左移 B.中心位置右移 C.分布曲线峻峭一些 D.分布曲线平坦一些 E.以上都不是 3、已知某资料x=7.32, s=0.18, n=9,t0.05,8=2.306, U0.05=1.96,则这组资料的95%可信区间为; A、7.18~7.46 B、6.95~7.89 C、7.20~7.44 D、7.01~7.63 E、7.00~7.50.
4、 表示 A.总体的95%个体值在该区间内 B.样本的95%个体值在该区间内 C.平均每100个总体均数,有95个总体均数在该区间内 D.平均每100个样本(含量相同)均数,有95个样本均数在该区间内 E.平均每100个样本(含量相同)有95个样本所得出的该区间包括总体均数