slide1
Download
Skip this Video
Download Presentation
第五章 统计原理 § 5.1 数理统计的基本概念 5.1.1 总体和样本 在实际中,我们把研究对象的全体组成的集合称为总体;组成总体的每一个元素称为个体;总体的一个子集称为样本。

Loading in 2 Seconds...

play fullscreen
1 / 42

第五章 统计原理 § 5.1 数理统计的基本概念 5.1.1 总体和样本 在实际中,我们把研究对象的全体组成的集合称为总体;组成总体的每一个元素称为个体;总体的一个子集称为样本。 - PowerPoint PPT Presentation


  • 69 Views
  • Uploaded on

第五章 统计原理 § 5.1 数理统计的基本概念 5.1.1 总体和样本 在实际中,我们把研究对象的全体组成的集合称为总体;组成总体的每一个元素称为个体;总体的一个子集称为样本。 在数学上,我们把随机变量 X 称为总体, 并把随机变量 X 的概率分布称为总体分布 ; 把相互独立且与总体 X 同分布的随机变量( X 1 , X 2 , … , X n )称为来自总体 X 的一个简单随机样本; n 称为样本容量;把样本( X 1 , X 2 , … , X n )的每一个具体值.

loader
I am the owner, or an agent authorized to act on behalf of the owner, of the copyrighted work described.
capcha
Download Presentation

PowerPoint Slideshow about ' 第五章 统计原理 § 5.1 数理统计的基本概念 5.1.1 总体和样本 在实际中,我们把研究对象的全体组成的集合称为总体;组成总体的每一个元素称为个体;总体的一个子集称为样本。' - keefe-palmer


An Image/Link below is provided (as is) to download presentation

Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author.While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server.


- - - - - - - - - - - - - - - - - - - - - - - - - - E N D - - - - - - - - - - - - - - - - - - - - - - - - - -
Presentation Transcript
slide2
第五章 统计原理

§5.1数理统计的基本概念

5.1.1 总体和样本

在实际中,我们把研究对象的全体组成的集合称为总体;组成总体的每一个元素称为个体;总体的一个子集称为样本。

在数学上,我们把随机变量X称为总体,并把随机变量X的概率分布称为总体分布;把相互独立且与总体X 同分布的随机变量(X1,X2,…,Xn)称为来自总体X的一个简单随机样本;n称为样本容量;把样本(X1,X2,…,Xn)的每一个具体值

slide3
(x1,x2,…,xn)称为样本(X1,X2,…,Xn)的一组样本观测值或样本实现。(x1,x2,…,xn)称为样本(X1,X2,…,Xn)的一组样本观测值或样本实现。

5.1.2 统计量

设(X1,X2,…,Xn)是来自总体X的一个简单随机样本,称样本的函数T=g(X1,X2,…,Xn)为统计量,如果它不依赖于任何未知参数。统计量的具体值亦称做统计量的实现。

几个常用的统计量:

1、样本均值

slide4
2、样本方差

3、样本标准差

4、样本k 阶原点矩

slide5
5、样本k 阶中心矩

6、顺序统计量

最小统计量

最大统计量

极差

slide6
例1 设假设总体X服从参数为p(0<p<1)的0-1分布,p未知。(X1,X2,…,X5)是来自X的简单随机样本。

(1)指出X1+X3,min(X1,X2,…,X5),X5+2p(X5-X2),X2-EX4,(X3-X5)2,中哪些是统计量,哪些不是统计量?

(2)如果(0,1,0,1,1)是一个样本值,求样本均值和样本方差 。

slide7
例2 设一个样本由六个6,七个7,八个8,九个9和十个10组成.求样本容量,样本均值、样本方差和样本极差。

例3 设某地区抽样调查200个居民家庭,得到月支出的统计资料如下:

slide8
求样本均值和样本方差近似值。

5.1.3 经验分布函数

对于任意实数x,设μn表示样本(X1,X2,…,Xn)的n个观察值中不大于x的观察值的个数,则μn表示在对总体X的n次独立重复观测中,事件{X≤x}出现的次数。因此在对总体X的n次独立重复观测中,事件{X≤x}出现的频率

slide9
称为总体X的经验分布函数或样本分布函数 。

对于给定的样本值(x1,x2,…,xn),经验分布函数具有分布函数的一切性质,经验分布函数也是一个阶梯型的函数;经验分布函数依概率收敛于总体的分布函数。

经验分布函数依概率收敛于总体的分布函数这个结论,为进行统计推断提供了依据。

例4根据例1(2)和例2中的数据,分别求其经验分布函数。

slide10
§5.2 抽样分布

5.2.1χ2分布

设(X1,X2,…,Xn)是来自正态总体N(0,1)的样本,称统计量

χ2 =X12+X22+…+Xn2

服从自由度为n的χ2分布,记为χ2 ~ χ2(n)。

χ2分布上α分位点:对于给定的α(0<α<1),称满足条件

为χ2(n)分布的上α分位点。

slide11
5.2.2 t分布

随机变量X~N(0,1),Y~χ2(n),且X和Y相互独立,则称随机变量

服从自由度为n的t分布,记为T~t(n)。

t分布上α分位点:对于给定的α(0<α<1),称满足条件

为t(n)分布的上α分位点。

slide12
5.2.3 正态总体的抽样分布

设(X1,X2,…,Xn)是来自正态总体N(μ,σ2)的一个样本,则

(1)样本均值

(2)随机变量

(3)样本均值和样本方差相互独立

(4)随机变量

slide13
例5 设总体X服从N(0,0.32),(X1,X2,…,X10)是来自X的一个容量为10的样本,求概率

例6 假设一种电子元件的使用寿命X(小时)服从正态分布N(3000,8002)。一名顾客购买了50个元件,试求这50个元件的平均使用寿命超过3250的概率。

slide14
§5.3 参数估计

5.3.1 统计估计的概念

在统计中,估计既表示由样本特征求总体特征的过程,也表示由样本求得的总体特征的估计值。

一、参数估计和非参数估计

可以用有限个参数表示的估计问题,统称为参数估计,否则称为非参数估计。

二、参数估计的方法

参数估计有两种基本类型:点估计和区间估计。

slide15
点估计,也称“定值估计”,既可以指用统计量的值做为未知参数的估计值,也可以指用来估计未知参数的统计量。点估计,也称“定值估计”,既可以指用统计量的值做为未知参数的估计值,也可以指用来估计未知参数的统计量。

区间估计是指根据估计可靠程度的要求,由样本确定总体参数的一个区间范围。

5.3.2 参数的点估计

最常用的点估计方法:矩估计法和极大似然估计法。

一、矩估计法

矩估计法是用样本矩来估计总体矩,用样本矩的函数来估计总体矩的相应函数的一种估计方法。

slide16
例7设总体X服从参数为λ的指数分布,其中λ未知。(X1,X2,,Xn)是来自X的简单随机样本,求λ的矩估计量。

例8 设X为任意总体,EX =μ,DX =σ2>0存在,但未知。(X1,X2,,Xn)是来自总体X的简单随机样本,求μ和σ2的矩估计量。

二、极大似然估计法

设总体X的概率密度为f(x,θ)(当X为离散型时, f(x,θ)=P{X=x},即为概率分布),其中θ为待估参数。设(x1,x2,,xn)为样本(X1,X2,,Xn)的一组观测值,称

slide17
为似然函数 。

对于给定的样本观测值(x1,x2,,xn),使似然函数L(θ)达到最大值的参数值 ,称为未知参数θ的极大似然估计值,相应的统计量称为未知参数θ的极大似然估计量。

极大似然估计量,可以用微积分中求函数的极大值的方法来求.不过,这里求的不是函数的极大值,而求是函数的极大值点。

slide18
由于lnx是x的严格单增函数,因此L(θ)和lnL(θ)在同一处取极大值,因此我们也称lnL(θ)为似然函数。由于lnx是x的严格单增函数,因此L(θ)和lnL(θ)在同一处取极大值,因此我们也称lnL(θ)为似然函数。

求极大似然的一般步骤:

(1)由总体分布写出似然函数L(θ)和ln L(θ) ;

(2)求似然函数关于θ的导数:

如果分布含有多个未知参数(θ1,θ2,…,θr),这时似然函数就是这些未知参数的函数,由方程组

slide19
(3)解上述方程可以得到参数θ的极大似然估计。(3)解上述方程可以得到参数θ的极大似然估计。

例9设总体X服从参数为(1/θ)的指数分布,求参数θ的极大似然估计量。若有一组样本值340,410,450,520,620,190,210,800,270,500,求θ的极大似然估计值。

slide20
例10设总体X服从参数为p的0-1分布,求参数p的极大似然估计量。例10设总体X服从参数为p的0-1分布,求参数p的极大似然估计量。

若从一大批产品中,用还原方法抽取了50件产品,发现其中有2件是次品,求p的极大似然估计值。

例11 假设总体X~N(μ,σ2), μ与σ2都未知.试根据来自X的简单随机样本(X1,X2,,Xn),求μ与σ2的极大似然估计量。

slide21
三、评价估计量的标准

1、无偏性

设 是未知参数θ的估计量,如果E =θ,则称 是θ的无偏估计量。

例12 设X为任意总体,EX =μ,DX = σ2存在。(X1,X2,,Xn)是来自总体X的简单随机样本,证明(1)样本均值是μ的无偏估计量;(2)样本方差是σ2的无偏估计量。

slide22
2、有效性

设 与 为未知参数θ的两个无偏估计量,如果

D <D

则称 是比 有效的估计量。

在未知参数的任意两个无偏估计中,显然应该选更有效的,即方差较小的。

3、一致性

设 为未知参数θ的估计量,如果 依概率收敛于θ,则称 是θ的一致估计量。

slide23
例13 设X为任意总体,其k阶原点矩ak= EXk(k>0)存在。设(X1,X2,,Xn)是来自总体X的简单随机样本,证明样本k阶原点矩 是总体k阶原点矩ak的无偏与一致估计量。

5.3.3 正态总体参数的区间估计

一、区间估计的概念

未知参数θ的区间估计,也称置信区间,是以统计量为端点,以充分大的概率包含未知参数θ值的随机区间。

slide24
设θ是总体X的未知参数,(X1,X2,,Xn)是来自总体X的简单随机样本。对给定的数α(0<α<1),如果存在两个统计量 和 ,满足

则称(随机)区间 称为参数θ的区间估计或置信区间,称概率1-α为置信区间的置信度(水平)。

二、一个正态均值μ的置信区间

1、总体方差σ2已知

均值的1-α为置信区间为

slide25
其中uα/2为标准正态分布双侧分位数。

例14某企业生产的滚珠直径X服从N(μ,0.0006)。现从产品中随机抽取6颗进行检测,得到它们的平均值为1.495cm,标准差为0.0226cm。试求滚珠平均直径的置信水平为0.95的置信区间。

置信区间的长度l为

slide26
2、总体方差σ2未知

均值的1-α为置信区间为

其中tα/2(n-1)为t( n-1 )分布双侧分位数。

例15 在例14中若总体方差未知,试求滚珠平均直径的置信水平为0.95的置信区间。

三、一个总体方差σ2的置信区间

总体方差σ2的1-α置信区间为

slide27
其中 是是自由度为ν的χ2分布水平p的上侧分位数。

标准差的1-α置信区间为

slide28
例16从自动车床加工的一批零件中随机抽取了16件,测得零件长度的平均值为2.125cm,标准差为0.017cm。假设零件的长度服从正态分布,求零件长度标准差的0.95置信区间。例16从自动车床加工的一批零件中随机抽取了16件,测得零件长度的平均值为2.125cm,标准差为0.017cm。假设零件的长度服从正态分布,求零件长度标准差的0.95置信区间。

§5.4假设检验

一、假设检验的基本概念

1、统计假设的概念

统计假设是关于总体参数或数字特征、总体的分布以及两个或两个以上总体之间的关系的一切论断或命题,简称假设。通常用字母“H”表示假设。

slide29
2、统计假设的基本类型

(1)参数假设与非参数假设

可以用有限个参数表示的统计假设称为参数假设,否则称为非参数假设。

(2)原假设与备择假设

两个二者必居其一的假设,其中一个称做原假设,习惯上记为H0;而另一个称做备择假设,习惯上记为H1。原假设也称为零假设;备择假设也称为对立假设。

3、统计假设的检验

slide30
统计假设的检验,简称假设检验,是指按照一定规则即检验准则,根据样本来判断所作假设的真伪,以决定接受还是否定假设。统计假设的检验,简称假设检验,是指按照一定规则即检验准则,根据样本来判断所作假设的真伪,以决定接受还是否定假设。

(1)检验准则

检验准则,简称为检验,指接受还是否定假设所依据的规则。检验准则通常用原假设的否定域来表示。

否定域亦称拒绝域或临界域,假设H0的否定域是样本空间的一个区域V,当样本值落入区域V时,否定假设H0。

slide31
(2)假设检验的理论依据

小概率原则。所谓小概率原则,就是根据具体问题的要求,指定一个可以认为“充分小”的数α(0<α<1),并且把概率不大于α的事件认为是“实际不可能事件”,即认为这样的事件在一次试验或观测中实际上不会出现。

4、假设检验的基本步骤

(1)根据实际问题的要求提出原假设H0和备择假设H1,并且在作出最后的判断之前,将始终在假设H0成立的假定下进行分析;

slide32
(2)构造适当的检验统计量J,在假设H0成立下,其分布已知;(2)构造适当的检验统计量J,在假设H0成立下,其分布已知;

(3)对给定的水平(0<<1),确定否定域V;

(4)根据检验统计量J的观察值,作出统计决策。

5、假设检验的两类错误

否定了本来真实的假设,称为第一类(弃真)错误,犯这类错误的概率记为 ;

接受了本来错误的假设,称为第二类(存伪)错误,犯这类错误的概率记为β。

slide33
二、一个总体参数的假设检验

1、一个总体均值的假设检验

(1)正态总体,方差σ2已知

slide34
例17 味精厂用一台包装机自动包装味精,包得的袋装味精重量服从N(μ,0.0152)。当机器正常时,其均值为0.5kg。某日开工后随机地抽取9袋味精,称得平均重量为0.511kg,问在显著性水平0.05下,这台包装机是否正常?
slide36
例18 某厂生产的螺杆直径服从正态分布N(μ,σ2)。现从中抽取5件,测得平均直径为21.8mm,标准差为0.367mm。若σ2未知,在显著性水平0.05下,检验假设H0:μ=21是否成立。

例19 用某种农药施入农田种防治病虫害,经过三个月后,如果土壤中的浓度不低于5ppm,认为仍有残效。在一块已施药的农田中随机抽取10个土样进行分析,其浓度的平均值为4.08ppm,标准差为1.80ppm。假设土壤残余农药的浓度服从正态分布,在显著性水平0.05下,问该农药经过三个月后是否仍有残效?

slide38
例20 某厂生产的一种型号的电阻元件其平均电阻一直保持在2.64欧姆。改变生产工艺后,测得所生产的100个元件的平均电阻为2.62欧姆,标准差为0.06欧姆,在显著性水平0.01下,问新工艺对该电阻元件的生产有无显著影响?
slide39

-

2

(

n

1

)

S

c

=

2

s

2

0

2、一个正态总体方差σ2的假设检验(自由度为n-1)

slide40
例21 设某厂生产的产品服从N(μ, 0.0482)。今任取5件进行检测,得到其平均值为1.414,方差为0.00778。问在显著性水平0.1下,能否认为总体的方差没有显著变化?
slide42
例22 某厂生产了一批产品,按规定次品率不超过0.05才能出厂,否则不能出厂。现从产品中随机抽取50件进行检查,发现有4件次品,问在显著性水平0.05下,该批产品能否出厂?
ad