1 / 48

# 概率论与数理统计实验 - PowerPoint PPT Presentation

I am the owner, or an agent authorized to act on behalf of the owner, of the copyrighted work described.

## PowerPoint Slideshow about '概率论与数理统计实验' - chenoa

Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author.While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server.

- - - - - - - - - - - - - - - - - - - - - - - - - - E N D - - - - - - - - - - - - - - - - - - - - - - - - - -
Presentation Transcript

1、参数估计

2、假设检验

3、实例

4、作业

X1, X2,…, Xn

（一）、点估计的求法

1、矩估计法

1、数学期望的置信区间

(1) 方差2已知, 的置信区间

(2) 方差 2未知,的置信区间

2、方差的区间估计

 未知时,方差 2的置信区间为

（三）参数估计的命令

1、正态总体的参数估计

[muhat,sigmahat,muci,sigmaci] = normfit(X,alpha)

r=normrnd(10,2,100,2);

[mu,sigm,muci,sigmci]=normfit(r);

[mu1,sigm1,muci1,sigmci1]=normfit(r,0.01);

mu=9.8437 9.9803

sigm=1.9138 1.9955

muci=9.4639 9.5843

10.2234 10.3762

sigmci=1.6803 1.7520

2.2232 2.3181

mu1=9.8437 9.9803

sigm1=1.9138 1.9955

muci1=9.3410 9.4562

10.3463 10.5043

sigmci1=1.6152 1.6841

2.3349 2.4346

fuction [muratio,sgmratio]=fugailv(mu,sgm,n,m,alpha)

% mu,sgm分别为参数真值。

%n为模拟试验次数，即产生随机数的组数

%m为样本容量。即每组随机数的个数

%1-alpha为置信水平

muci=[];%mu的区间估计

sgmci=[];%sgm的区间估计

h=0;%包含mu的区间的个数

t=0;%包含sgm的区间的个数

for i=1:n

r=normrnd(mu,sgm,1,m);%产生正态分布随机数

[mu1,sgm1,muci1,sgmci1]=normfit(r,alpha);

%给出参数的点估计和区间估计

muci=muci1;

sgmci=sgmci1;

if muci(1)<=mu&muci(2)>=mu

%判断mu是否在区间内

h=h+1;

end;

if sgmci(1)<=sgm&sgmci(2)>=sgm

%判断sgm是否在区间内

t=t+1;

end;

end;

muratio=h/n;%mu的覆盖率

smgratio=t/n;%sgm的覆盖率

[muratio,sgmratio]=fugailv(0,1,1000,200,0.05)

[muratio,sgmratio]=fugailv(10,2,2000,500,0.01)

[muratio,sgmratio]=fugailv(4,6,5000,400,0.025)

2、其它分布的参数估计

(1).取容量充分大的样本（n>50），按中心极限定理，它近似地服从正态分布；

(2).使用Matlab工具箱中具有特定分布总体的估计命令.

10[muhat, muci] = expfit(X,alpha)-----在显著性水平alpha下，求指数分布的数据X的均值的点估计及其区间估计.

20 [lambdahat, lambdaci] =poissfit(X,alpha)-----在显著性水平alpha下，求泊松分布的数据X 的参数的点估计及其区间估计.

30[phat, pci] = weibfit(X,alpha)-----在显著性水平alpha下，求Weibull分布的数据X 的参数的点估计及其区间估计.

[phat,pci]=mle(‘dist’,data,alpha,p1)只用于二项分布，

%产生10个二项分布随机数参数为20和0.75

[p,pci]=mle(‘binomial’,rv,0.05,20)

rv=12 14 18 13 12 14 16 15 18 16

p=0.7400

pci=[0.6734， 0.7993]

r=exprnd(0.5,100,1);

[lamta,lamtaci]=expfit(r);

[lamta,lamtaci]=expfit(r,0.01);

lamta=0.4579

lamtaci=0.3799， 0.5627

lamta=0.4579

lamtaci=0.3587，0.6015

F是参数向量 的函数，通常称为目标函数。此问题

3、不常用分布的参数估计（极大似然估计）

①最速下降法

②Newton(牛顿）法及其修正的方法。

③共轭方向法和共轭梯度法

④变尺度法（拟牛顿法）

P359------P379

1.参数检验：如果观测的分布函数类型已知，这时构造出的统计量依赖于总体的分布函数，这种检验称为参数检验.

2.非参数检验：如果所检验的假设并非是对某个参数2.非参数检验：如果所检验的假设并非是对某个参数

①根据实际问题提出原假设H0与备择假设H1，

②选择适当的统计量，并在原假设H0成立的条

③按问题的具体要求，选取适当的显著性水平

④根据样本观测值计算统计量的观测值，并与临界值

（一）、参数检验

1、单个正态总体均值检验

(1) 方差2已知

(2) 方差2未知

2、单个正态总体方差检验

3、两个正态总体均值检验

（1）已知 选取统计量

（2）方差未知 选取统计量

5、参数检验的计算机命令

10 z检验

（1）命令ztest函数

（2）功能：给定方差条件下进行正态总体均值得检验

（3）语法：h=ztest(x,m,sigm);

h=ztest(x,m,sigm,alpha);

[h,sig,ci]=ztest(x,m,sigm,alpha,tail);

h=1,则拒绝原假设，h=0, 则接收原假设

（4）描述：ztest(x,m,sigm)在0.05水平下进行Z检验，以确定服从正态分布的样本均值是否为m，sigm为给定的标准差

h=ztest(x,m,sigm,alpha)给出显著水平控制参数alpha，

[h,sig,ci]=ztest(x,m,sigm,alpha,tail)允许指定是进行单侧检验还是双侧检验。

tail参数可以有下面几个取值：

•tail=0（为默认设置）指定备择假设

•tail=1指定备择假设

•tail=-1指定备择假设

sig为与z统计量相关的p值。即当 时，统计量Z大于其观测值z0的概率。

ci为均值真值的1-alpha置信区间。

（5）应用实例

x=normrnd(0,1,1,100);

[h,sig,ci]=ztest(x,0,1)

h=0

sig=0.6317

ci=[-0.1481 0.2439]

3.25 3.27 3.24 3.26 3.24

x=[3.25 3.27 3.24 3.26 3.24]；

[h,sig,ci]=ztest(x,3.25,0.04,0.01)

h=0

sig=0.9110

ci=[3.2059 3.298]

9.8 10.4 10.6 9.6 9.7 9.9 10.9 11.1 9.6 10.2

10.3 9.6 9.9 11.2 10.6 9.8 10.5 10.1 10.5 9.7

x=[9.8 10.4 10.6 9.6 9.7 9.9 10.9 11.1 9.6 10.2

10.3 9.6 9.9 11.2 10.6 9.8 10.5 10.1 10.5 9.7]；

[h,sig,ci]=ztest(x,10,0.4,0.05,1)

h=1

sig=0.0127

ci=[10.0529 inf]

20 单个样本的t检验

（1）命令ttest函数

（2）功能：未知方差条件下进行正态总体均值得检验

（3）语法：h=ttest(x,m);

h=ttest(x,m,alpha);

[h,sig,ci]=ttest(x,m,alpha,tail);

h=1,则拒绝原假设，h=0, 则接收原假设

（4）格式的使用和参数的取值含义与ztest大致相同

（5）应用实例

4.98 5.11 5.20 5.11 5.00 5.61 4.88 5.27 5.38 5.20

5.46 5.27 5.23 4.96 5.35 5.15 5.35 4.77 5.33 5.54

x=[4.98 5.11 5.20 5.11 5.00 5.61 4.88 5.27 5.38 5.20

5.46 5.27 5.23 4.96 5.35 5.15 5.35 4.77 5.33 5.54]；

m=mean(x)

[h,sig,ci]=ttest(x,5.20,0.05)

h=0

sig=0.8796

ci=[5.1052 5.3098]

30 两个样本的t检验

（1）命令ttest2函数

（2）功能：两个样本均值差异的t检验

（3）语法：[h,significance,ci]=ttest2(x,y);

[h,significance,ci]=ttest2(x,y,m,alpha);

[h,significance,ci]=ttest2(x,y,alpha.tail);

h=1,则拒绝原假设，h=0, 则接收原假设

（4）格式的使用和参数的取值含义与ttest大致相同

（5）应用实例

x=[86 87 56 93 84 93 75 79];

y=[80 79 58 91 77 82 76 66 ];

[h,significance,ci]=ttest2(x,y);

h=0

significance=0.3393

ci=-6.4236 17.4236

（二）非参数检验

1. Jarque-Bera检验

（1）数学原理： Jarque-Bera检验是评价X服从正态分布的假设是否成立。该检验基于样本偏度和峰度，样本偏度接近于0，样本峰度接近于3。

（2）函数名称：jbtest

（3）语法：H=jbtest(x);

H=jbtest(x, alpha);

[H,p,jbstat,cv]=jbtest(x, alpha);

H=1,则拒绝服从正态，H=0, 则接收服从正态

（4） alpha为显著水平，p为p值，jbstat为检验统计量的值，cv为确定是否拒绝原假设的的临界值。

（5）应用实例

x=[459 362 624 542 509 584 433 748 815 505612 452 434 982 640 742 565 706 593 680926 653 164 487 734 608 428 1153 593 844527 552 513 781 474 388 824 538 862 659775 859 755 49 697 515 628 954 771 609402 960 885 610 292 837 473 677 358 638699 634 555 570 84 416 606 1062 484 120447 654 564 339 280 246 687 539 790 581621 724 531 512 577 496 468 499 544 645764 558 378 765 666 763 217 715 310 851]；

[H,p,jbstat,cv]=jbtest(x, 0.05);

1、一元线性回归

y是因变量， x是自变量，b0 b1为待估参数。

2、多元线性回归

y是因变量，x1,x2,…,xn是自变量，

b0,b1,…bn为待估参数。

3、函数名称: regress

（1）语法：b=regress(y,x);

（2）说明：b返回参数的估计值。Yy和x均为列向量，要对数据x做一个处理，如下例题所示。

x=[100;110;120;130;140;150;160;170;180;190];

Y= [45;51;54;61;66;70;74;78;85;89];

scatter(x,Y)

a=ones(length(x),1);

z=[a,x]

B=regress(Y,z);

b= -2.7394 0.4830