1 / 57

第七章 参数估计

点估计的问题就是要构造一个适当的统计量 ( X 1 , X 2 , …, X n ) ,用样 本的一组观察值( x 1 , x 2 , …, x n ),得到 的观察值 ( x 1 , x 2 , …, x n ), 以此来估计未知参数 θ .称统计量 ( X 1, X 2, … , X n )为 θ 的估计量,称. ( x 1 , x 2 , …, x n )为 θ 的估计值.. 第七章 参数估计. 第一节 参数的点估计. 一、点估计问题.

Download Presentation

第七章 参数估计

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 点估计的问题就是要构造一个适当的统计量 ( X1, X2, …,Xn ),用样 本的一组观察值( x1, x2, …,xn),得到 的观察值 ( x1, x2, …,xn ), 以此来估计未知参数θ.称统计量 ( X1, X2, …, Xn )为θ的估计量,称 ( x1, x2, …,xn)为θ的估计值. 第七章 参数估计 第一节 参数的点估计 一、点估计问题 设总体 X 的分布函数的形式为已知的F (x,θ),其中 x 是自变量,θ为未知参数(它可以是一个数,也可以是一个向量).借助于总体 X 的一个样本(X1, X2, …, Xn ),来估计未知参数θ的值的问题,称为参数的点估计问题.

  2. 设总体 X 的分布函数为 , 其中 为 k 个未知参数.假设总体 X 的各阶原点矩 存在, 则E (X l )是 的函数,记作μl=μl( ) 即 ,l=1,2,…,k. 对于总体 X 的样本( X1, X2, …,Xn ),样本的 l 阶原点矩为 ,l = 1,2, …,k. 二、矩估计法 令 μl =Al , l=1,2,…,k,

  3. 从上述方程组中解出 ,分别记作 以此作为未知参数 的估计量,称为矩估计量.

  4. 如果样本观察值为( x1, x2, …,xn),则得未知参数 的矩估计值为 上述估计未知参数的方法就叫做矩估计法. 例1设总体 X 服从参数为的泊松分布,其中 >0 为未知,又设X1, X2, …,Xn为 X 的样本,求的矩估计量. 解 令 ,即 得 的矩估计量为 .

  5. 例2设总体 X 服从参数为 的指数分布,其概率密度为 其中 为未知,又设 为 X 的样本,求 的矩估计量. 解 由于 , 即 因此得到 的矩估计量为 .

  6. 例3设总体 X 在区间 [a, b] 上服从均匀分布,a 与 b 为未知,X1 ,X2 ,,Xn是来自总体 X 的样本,求 a 与 b 的矩估计量. 解 令 即 整理得

  7. 于是得到 a、b 的矩估计量为

  8. 例4设总体 X 的均值为 ,方差为 ,且 ,但 与 均未知,又设总体 X 的一个样本为(X1,X2 ,, Xn),求 与 的矩估计量. 解 令 即 解此方程组得到 与 的矩估计量为

  9. 注 此例说明,无论总体 X 服从什么分布,样本均值 都是总体均值 的矩估计量,样本二阶中心矩就是总体方差 的矩估计量. 例5某厂生产一批铆钉,现要检验铆钉头部直径,从这批产品中随机抽取12只,测得头部直径(单位:mm)如下: 13.30 13.38 13.40 13.43 13.32 13.48 13.54 13.31 13.34 13.47 13.44 13.50 设铆钉头部直径这一总体 X 服从正态分布 ,试求 与 的矩估计值. 解 由例4可得

  10. 1.设总体X为离散型随机变量,其分布律为 其中θ为未知参数,取值范围为 .设 X1, X2, , Xn为来自 X 的样本,则 X1, X2, ,Xn 的联合分布律为 .又设 x1, x2, , xn为一组样本值,令 称 L(θ)为样本的似然函数. (1) 若有 ,使得对一切 ,有 成立,则称 为θ的极大( 或最大 )似然估计值,相应的统计量 称为θ的极大( 或最大 )似然估计量. 三、极大似然估计法

  11. 我们规定,使得 的 就是θ的极大似然估计值.由于ln x是单增函数,所以与 有相同的驻点,因此只需从 中解出 就是θ的极大似然估计值,称方程 (2) (2)为极大似然方程.

  12. 例6设总体 ,X1, X2 , … , Xn 为总体 X 的样本,求 的极大似然估计量. 解 设样本值为x1,x2 ,…,xn. 由于 X 的分布律为 x = 0, 1, 2,… 所以似然函数为 令 得 的极大似然估计值为 因此得到 的极大似然估计量为

  13. 从总体中任取一件产品进行观测,其结果可用随机变量 X 表示如下: 则 X 服从参数为 p 的(0-1)分布,其分布律为 设 X1, X2 , … , Xn为 X 的一个样本,观察值为 x1,x2 ,…,xn,则似然函数为 例7设一批产品中含有次品,次品率 p 未知,从中抽取容量为 n 的样本,求 p 的极大似然估计量.

  14. 解得 p 的极大似然估计值为 因此 p 的极大似然估计量为 2.设总体 X 为连续型随机变量,其概率密度为 , ,θ为未知参数.设 X1, X2 , … , Xn 为来自总体 X 的样本,其观察值为 x1,x2 ,…,xn.则似然函数为 (3) 似然方程为 (4) 解出θ的极大似然估计值为 ( x1,x2 ,…,xn) . 极大似然估计量为 ( X1,X2 ,…,Xn) .

  15. 例8设总体 X 的概率密度为 其中 为未知参数,( X1, X2 , … , Xn )为样本,求 的极大似然估计量. 解 设样本值为( x1, x2 , … , xn )(xi>0, i = 1, 2 , … , n),似然函数为

  16. 得 的极大似然估计值为 于是得到 的极大似然估计量为

  17. 例9设总体 X 的概率密度为 又设 X1, X2 , … , Xn 为 X 的样本,求θ的矩估计量与极大似然估计量. 解 (1)由于 令 即 解得θ的矩估计量为

  18. (2)设样本值为 x1, x2 , … , xn (0< xi < 1),似然函数为 令 解得θ的极大似然估计值为 因此, θ的极大似然估计量为

  19. 3.设总体 X 的分布中含有 k 个参数θ1, θ2 , …θk , 则似然函数是这些未知参数的函数 取对数后,求出lnL 关于θi 的偏导数并令它等于零,得到似然方程组 由此方程组解得θi 的极大似然估计值 .

  20. 例10设总体 , 与 未知,( X1, X2 , … , Xn )为总体 X 的样本,求 与 的极大似然估计量. 解X 的概率密度为 设 x1, x2,…, xn 为样本值,似然函数为

  21. 解得 与 的极大似然估计值为 因此, 与 的极大似然估计量为

  22. 解X 的概率密度为 设样本值为 x1, x2 , … , xn ( ),似然函数为 因为L(a, b)是 a 的单增函数,a 越大, L(a, b)就越大,但 a 不能大于 x(1) = min{x1, x2 , … , xn };又因为L(a, b)是 b 的单减函数,b 越小,L(a, b)就越大,但b 不能小于 x(n) = max{x1, x2 , … , xn } .对于满足a ≤ x(1), b ≥ x(n)的任意 a, b 有 例11设总体 X 在区间 [a, b] 上服从均匀分布,其中a、b未知,X1, X2, …,Xn为总体 X 的样本,求a、b的极大似然估计量.

  23. 当 a = x(1),b = x(n)时, L(a, b) 取得最大值 所以 a, b 的极大似然估计值为 a, b 的极大似然估计量为 , 4.极大似然估计的性质 设 u ( ) 是关于未知参数θ的函数, , u ( )具有单值反函数,又设 是总体分布中所含参数θ的极大似然估计,则 是 u 的极大似然估计.

  24. 定义 设 是未知参数θ的估计量,若 ,则称 为θ的无偏估计(量). 例12设 ( X1, X2, …,Xn)是来自具有有限均值 与方差 的总体 X 的一个样本.证明:样本均值 是 的无偏估计,样本方差 S 2是 的无偏估计. 四、估计量的评选标准 1.无偏性 估计量是样本的函数,它是一个随机变量,由不同的方法得到的估计量可能相同也可能不同.而对同一估计量,由不同的样本观察值得到参数的估计值也可能不同.我们很自然地要求估计量的期望等于参数的真值,即无偏性.

  25. 因此, 与 分别为 与 的无偏估计.

  26. 例13设总体 X 的均值为 ,( X1, X2, X3)是总体 X 的样本,证明下列两个估计量 都是 的无偏估计. 设 与 是参数θ的两个无偏估计量,若 , 则称 比 有效. 证 由于 所以 与 都是 的无编估计. (只需 k1+k2 + +kn=1,则 = k1 X1 +k2 X2 + +kn Xn 就是 的无偏估计) 2.有效性

  27. 例14比较例13中 与 哪个更有效. 解 设 .由于 显见 ,因此 比 有效. 另外,取 ,则 于是可知 比 更有效.

  28. 为参数θ的估计量,若当 时, 按概率收敛于θ,即对于任意正数ε,有 , 则称 为θ的一致估计(量). 根据大数定律可知,样本均值 是总体均值 的一致估计量. 3.一致性

  29. 点估计是通过构造统计量 (X1, X2, … ,Xn)来对总体 X 中的未知参数θ进行估计,由一个样本值( x1, x2, … ,xn)可得到θ的估计值 ( x1, x2, … ,xn) .这种估计值是无法知道误差的.我们要定出一个范围,并要求以一 定的概率保证这个范围包含着θ的真值.这个范围通常以区间的形式给出,我们把这个区间称为置信区间. 定义 设总体 X 的分布中含有一个未知参数θ,(X1, X2, …,Xn)是来自总体 X 的一个样本.如果对于给定的常数 ,统计量 θ1= θ1 (X1, X2, …,Xn)与θ2= θ2(X1, X2, …,Xn)满足 (1) 则称随机区间(θ1 ,θ2 )是θ的置信度为 的置信区间,分别称θ1与θ2为θ的置信下限与置信上限. 第二节 参数的区间估计

  30. 1- 称为置信度或置信水平.(1)式的含义是,随机区间(θ1 ,θ2 )以 的概率包含着θ, 也就是说,对每一个样本值 ( x1, x2, … ,xn)可求得一个具体的区间(θ1(x1, x2, … ,xn ),θ2 (x1, x2, … ,xn )).在这些众多的区间中,包含θ的有100 ( ) %个,不包含θ的有100 %个. 例1设总体 , 为已知, 未知,( X1, X2, …,Xn)为来自总体 X 的一个样本,求 的置信度为 的置信区间. 解 由于 是 的无偏估计,且有 由正态分布表可查得 ,使

  31. 即有 取 ,于是得到 的置信度为 的置信区间为

  32. 求未知参数θ的置信区间的一般方法: 1°对于给定的样本X1, X2, … , Xn,构造样本函数 , 它包含待估参数θ,而不含其它未知参数, 并且 Z 的分布已知,在 Z 的分布中不依赖任何未知参数. 2°对于给定的置信度 ,定出两个常数 a,b(一般地,按 Z 所服从的分布的上 分位点来确定),使 3°从 a < Z (X1, X2, … , Xn ) < b 得到等价的不等式θ1(X1, X2, … , Xn ) <θ< θ2(X1, X2, … , Xn ) ,其中θ1 =θ1(X1, X2, … , Xn )与θ2 =θ2(X1, X2, … , Xn )都是统计量,于是得到θ的一个置信度为 的置信区间( θ1 ,θ2).

  33. 设(X1, X2, … , Xn)是来自正态总体 的样本. 1.设 已知,求 的置信度为 的置信区间 2.设 未知,求 的置信度为 的置信区间 第三节 正态总体 均值与方差的置信区间 一、单个正态总体均值的置信区间

  34. 由于 S 2 是 的无偏估计,因此用S 2 代替 ,有 由附表3查得 ,有 即 于是得到 的 置信区间为 , 图

  35. 例1某车间生产的螺杆直径服从正态分布 , 今随机地从中抽取5只测得直径值为22.3,21.5,22.0,21.8,21.4. (1)已知 ,求 的0.95置信区间; (2)如果 未知,求 的0.95置信区间. 解 (1)已知 、 ,查表得 ,因此 的0.95置信区间为

  36. (2) 未知, , s = 0.367.查表得 =2.7764,因此 的0.95置信区间为

  37. 1.设 已知, 求 的置信度为 的置信区间 由于 对于给定置信度 ,查表可得 及 ,使 即 因此, 的 置信区间为 二、单个正态总体方差的置信区间

  38. 2.设 未知, 求 的置信度为 的置信区间 由于 对于给定置信度 , 查表可得 及 , 使得 即 因此,方差 的置信度为 的置信区间为

  39. 而标准差 的 的置信区间为 例2从正态总体 中抽取容量为5的样本,其观测值为 1.86 3.22 1.46 4.01 2.64 (1)已知 ,求 的0.95置信区间; (2)如果 未知,求 的0.95置信区间. 解 (1)已知 ,查表得 , =12.833.由已知数据算得 ,因此 的0.95置信区间为

  40. (2) 未知, 查表得 , =11.143,由已知数据算得 ,因此 的0.95置信区 间 为

  41. 设总体 ,总体 ,X与 Y 独立,( X1, X2, … , Xm)与( Y1, Y2, … , Yn)分别来自 X 与 Y 的相互独立的样本,并设它们的样本均值分别为 , ,样本方差分别为 , . 1.设 和 都已知,求 的置信度为 的置信区间 由于 与 相互独立,且 , ,于是可知 , 从而 三、两个正态总体均值差的置信区间

  42. 对于给定的置信度 ,查表得 ,使 , 即 从而得到 的置信度为 的置信区间为

  43. 2.设 为未知, 求 的置信度为 的置信区间 其中 . 例3设总体 X~ N( ,4),总体Y~N( ,6),分别独立地从这两个总体中抽取样本,样本容量依次为16和24,样本均值依次为16.9和15.3,求两个总体均值差 的置信度为0.95的置信区间. 解 由题设可知 m=16,n =24, =16.9, =15.3, = 4, = 6, = 0.95, =0.05,查附表1得 1.96.从而可得 的置信度为 0.95 的 置信区间为

  44. 例4为了估计磷肥对某种农作物增产的作用,选20块条件大致相同的地块进行对比试验.其中10块地施磷肥,另外10块地不施磷肥,得到单位面积的产量(单位:kg)如下:例4为了估计磷肥对某种农作物增产的作用,选20块条件大致相同的地块进行对比试验.其中10块地施磷肥,另外10块地不施磷肥,得到单位面积的产量(单位:kg)如下: 施 磷 肥:620 570 650 600 630 580 570 600 600 580 不施磷肥:560 590 560 570 580 570 600 550 570 550 设施磷肥的地块单位面积产量 X ~ N ( , ),不施磷肥的地块单位面积产量 Y ~ N( , ).求 的置信度为0.95的置信区间. 解 由题设,两个正态总体的方差相等,但 未知, m=10,n=10, =0.05, =0.95, =600, = 570, , , ,查表得 , 因此 , 的置信度为0.95的置信区间为

  45. 1.设 均已知,求 的置信水平为 的置信区间 由于 与 相互独立,且 从而可知 . 四、两个正态总体方差比的置信区间

  46. 对于给定的置信度 , 查表得 及 ,使 即 , , 因此, 的置信度为 的置信区间为 .

  47. 2.设 与 都未知,求 的置信水平为 的置信区间 . 例5设总体 X ~ N(24, ), 总体Y ~ N (20, ) .从总体 X 和 Y 中独立地抽得样本值如下: 总体 X:23,22,26,24,22,25; 总体 Y:22,18,19,23,17. 求 的置信度为0.95的置信区间. 解 已知 =24, m = 6; = 20,n = 5.由已知数据可算得 , . 因 =0.95,故 = 0.05.查附表5,可得 F0.025(6, 5) = 6.98, F0.025(5, 6) = 5.99 . 从而可得 的置信度为0.95的置信区间为

  48. 例6从参数 都未知的两正态总体 中分别独立地抽取样本,它们的样本容量分别为 m = 10,n = 8,样本方差分别为 s12 = 3.6,s22 = 2.8,求二总体方差比 的置信度为0.95的置信区间. 解 这里 = 0.95, = 0.05,查 F 分布表得: , . 的置信度为0.95的置信区间为

  49. 设 X为非正态总体,其均值E ( X )与方差D ( X )均存在但未知.(X1,X2,…,Xn )为来自总体 X 的一个样本,样本容量 n 很大( n ≥50 ).我们要求 E ( X )的置信度为 的近似置信区间. 由中心极限定理可知随机变量 当 n 很大时近似地服从标准正态分布 N (0, 1). 由于样本方差 S 2 是D ( X )的无偏估计,利用 S 2 代替D( X ),有 近似地服从标准正态分布N(0,1). 第四节 非正态总体参数的区间估计 一、总体均值的区间估计

  50. 对于给定的置信度 ,有 , 从而得到E ( X )的置信度为 的近似置信区间为 .

More Related