210 likes | 374 Views
新世纪全国高等中医药院校规划教材. 中医药统计学. 主编 周仁郁. 2 计量资料分析. 2.1 计量资料的区间估计. 2.1.1 随机抽样. 统计设计. 选估计 , 检验 , 回归 , 设计方法. 搜集资料. 按设计抽样 , 搜集报表 , 试验. 统计工作. 整理资料. 对原始数据分组和归纳. 分析资料. 计算和统计处理 , 作出结论. 计量资料. 定量方法测得大小 , 连续总体. 统计资料. 计数资料. 无序分类 , 离散. 分类资料. 等级资料. 有序分类 , 离散.
E N D
新世纪全国高等中医药院校规划教材 中医药统计学 主编 周仁郁
2 计量资料分析 2.1 计量资料的区间估计 2.1.1 随机抽样 统计设计 选估计,检验,回归,设计方法 搜集资料 按设计抽样,搜集报表,试验 统计工作 整理资料 对原始数据分组和归纳 分析资料 计算和统计处理,作出结论
计量资料 定量方法测得大小,连续总体 统计资料 计数资料 无序分类,离散 分类资料 等级资料 有序分类,离散 从总体X随机抽取容量为n的样本X1,X2,…,Xn 看成n个随机变量, 简单随机样本 ⑴代表性,Xi与总体X同分布 ⑵独立性,X1,X2,…,Xn独立
有限总体一般采用返回抽样,研究对象数量相对于样本大得多时可近似采用无返回抽样.等概抽样称单纯随机抽样,常用抽签或随机数表等方法实施 2.1.2 无偏点估计 定义1样本均数 样本方差 样本标准差S 样本变异系数
样本均数 中位数 居中位置的值 集中趋势 众数 频率最大的值 样本方差 样本标准差 离散程度 样本变异系数 样本标准误 极差 最大与最小值之差 四分位数 25%、75%位置值
样本均数与标准差、标准误常合写在一起 样本构成不含总体任何未知参数的函数称统计量 称为θ的无偏估计量 估计量的一个具体值称一个点估计 定理1设X1,X2,…,Xn为总体X的简单随机样本
定理1表明,样本均数、样本方差S2分别是总体均数EX、总体方差DX的一个无偏点估计定理1表明,样本均数、样本方差S2分别是总体均数EX、总体方差DX的一个无偏点估计 计算器用“MODE 3”两键选择“标准差方式” “SHIFT AC”两键清零, 数据用“DATA”键输入 “Kout n/∑x/∑x2”两键调样本容量/数据和/平方和 “SHIFT X-/ xσn-1/ xσn”两键调用样本均数/ 标准差 总体M阶原点矩的估计量称矩估计 总体参数的称为最大似然估计∏f(Xi) 总体方差DX的矩估计
例1开胸顺气丸崩解时间X~N(μ,σ).随机抽取5丸崩解时间为:36,40,32,41,36(min),作μ及σ2的无偏点估计例1开胸顺气丸崩解时间X~N(μ,σ).随机抽取5丸崩解时间为:36,40,32,41,36(min),作μ及σ2的无偏点估计 由数据计算得 =37,S2=13 μ及σ2的点估计为 2.1.3 μ的u估计 定义2总体未知参数θ , ∈(0,1), P(θ1<θ<θ2)=1- ,随机区间(θ1,θ2)称置信区间,1- 称置信度, 称显著水平
置信区间是总体参数的估计范围,下判断有把握的概率为置信度1-,犯错误的概率为显著水平置信区间是总体参数的估计范围,下判断有把握的概率为置信度1-,犯错误的概率为显著水平 显著水平常用=0.05、=0.01,也可用=0.1等 当置信度为1-=0.95时,表明在总体中独立地抽取100个样本,那么就会有100个常数区间,其中大约有95个区间包含待估计的参数,可靠性为95% 总体X~N(μ,σ2) ~ ~N(0,1)
满足条件P(|u|≥u/2)=的数值u/2称u分布双侧界值满足条件P(|u|≥u/2)=的数值u/2称u分布双侧界值 满足条件P(|u|≥u)=的数值u称u分布单侧界值 u/2右边与左边曲线下面积和(称双尾概率)为α u右边曲线下面积(称为单尾概率)为α u界值可用Mathcad2000函数qnorm(1-α,0,1) 可在统计用表5查最下面一行
定理2已知,正态总体均数μ的置信度1-的置信区间定理2已知,正态总体均数μ的置信度1-的置信区间
在σ已知时,μ的置信度1-α的置信区间为 例2伤寒论用桂枝39张处方,桂枝用量服从σ为3g的正态分布,根据样本均数8.14g,显著水平0.05,估计桂枝用量μ的置信区间 μ的置信度0.95的置信区间为 =(7.1984,9.0816)
2.1.4 σ2的χ2估计 定义3u1,u2,…,un互相独立标准正态变量,χ2=u12+u22+…+un2服从自由度df=n的χ2分布,χ2~χ2(n) χ2界值可用Mathcad2000函数qchisq(1-α,df) 可查统计用表6 定理3X1,X2,…,Xn为总体X~N(μ,σ2)简单随机样本 ~χ2(n -1 )
~N(0,1) ~N(0,1) ~χ2(1) ~χ2(n) ~χ2(n -1)
由定理2可得σ2的置信度1-α的置信区间 df=n-1 例3某药含碳量服从正态分布,允许方差0.0482(mg2)内,任取5件测得含碳量1.32,1.55,1.36,1.40,1.44(mg),根据α=0.05判断该药生产是否稳定 由计算得n=5, =1.414,S=0.0882,df=n-1=4
σ2的置信度0.95的置信区间 = (0.0028,0.0642) 置信区间的下限0.0028>0.0482=0.0023 可认为该药生产不稳定
2.1.5 μ的t估计 定义4u~N(0,1),χ2~χ2(n),u,χ2独立,自由度为n的t分布,记为t~t(n) t分布界值可用Mathcad函数qt (1-α,df) 可查统计用表5
定理4X1,X2,…,Xn为总体X~N(μ,σ2)简单随机样本 ~χ2(n -1) ~N(0,1) ~t(n-1) 由定理3得σ未知时μ的置信度1-α的置信区间
df=n-1 大样本时,总体不论是否服从正态分布,根据中心极限定理,样本均数渐近服从正态分布, 可使用μ的u估计 例4逍遥丸崩解时间服从正态分布,同一批号随机抽取5丸测得崩解时间为21,18,20,16,15(min),求该批药丸崩解时间总体均数置信度为0.99置信区间
由计算得n=5, =18,S=2.5495,df=5-1=4 该批丸崩解时间总体均数置信度0.99的置信区间 置信区间的上限23.2495低于药典规定的60分钟 可认为该批药丸崩解时间合格