250 likes | 509 Views
第 5 章 中心极限定理与大数定律. 大数定理: 讨论大量随机变量的算术平均值稳定性的一系列定理. 中心极限定理: 讨论在什么条件下,大量随机变量之和的极限分布为正态分布的一系列定理. 1. 大数定律. 定义 设随机变量序列 { X n } , 如果存在一个常数 列 , 使 得对任意的 ε>0 ,有. 则称 { X n } 服从大数定律. 大数定理. 马尔可夫大数定理. 切比雪夫大数定理. 泊松大数定理. 伯努利大数定理. 辛钦大数定理. 定理 1 ( 马尔可夫大数定律 ) 设 {X n } 为随机变量序列 , 且有
E N D
第5章 中心极限定理与大数定律 大数定理: 讨论大量随机变量的算术平均值稳定性的一系列定理 中心极限定理: 讨论在什么条件下,大量随机变量之和的极限分布为正态分布的一系列定理
1. 大数定律 定义设随机变量序列{Xn},如果存在一个常数列 ,使 得对任意的ε>0,有 则称{Xn}服从大数定律.
大数定理 马尔可夫大数定理 切比雪夫大数定理 泊松大数定理 伯努利大数定理 辛钦大数定理
定理1 (马尔可夫大数定律) 设{Xn}为随机变量序列,且有 则对任意的ε>0 ,有 证:
定理2 (切比雪夫大数定律)设 {Xn}是两两不相关随机变量序列,方差一致有界D(Xn)=σn2 <C (n=1,2,...),其中常数C与n无关,则对任意的ε>0,有 证:
定理3 (泊松大数定律) 设每次试验中事件A发生 的概率为 ,n次重复独立试验中事件A发生的次 数为 ,事件的频率 ,则对任意ε>0,有 证:
定理4 (伯努里利大数定律) 设每次试验中事件A发生的概率为p,n次重复独立试验中事件A发生的次数为 ,事件的频率有 ,则对任意ε>0, (伯努里利大数定律是泊松大数定律的特例) 意义:Bernoulli大数定理表明当试验次数无限增加时事件 A 的频率按概率收敛到事件 A的概率. 这为频率的稳定性提供了理论依据.
定理5 (辛钦大数定律)设{Xi}为相互独立的随机变量序列,且有相同期望E(Xi)=u,(i=1,2,...),则对任意的ε>0 ,有 注意辛钦大数定理成立的条件中只需 的数学 期望存在;而当 的方差存在时,其即为切比雪夫大 数定理的直接推论. 大数定理是参数估计和假设检验的重要理论基础.
1.中心极限定理: 概率论中有关论证随机变量和的 极限分布是正态分布(Gauss)分布 的一系列定理。 意义:大量的独立同分布的随机变量之和的分布 可近似认为是正态分布. 这是数理统计中大样本问题研究的理论基础.
定理6 林德贝格-勒维定理(独立同分布中心极限定理) 设X1,X2,…,X n,…为独立同分布序列,期望μ,方差σ2>0,设 注以上定理表明只要n比较大,就有近似结果:
例1用机器包装味精,每袋味精净重为随机变量,期望值为100克,标准差为10克,一箱内装200袋味精,求一箱味精净重大于20500克的概率?例1用机器包装味精,每袋味精净重为随机变量,期望值为100克,标准差为10克,一箱内装200袋味精,求一箱味精净重大于20500克的概率? 解 设一箱净重为X,箱中第i袋味精净重为Xi,(i=1,2,…,200) 则 X1,X2,…,X200独立同分布, EXi=100, DXi=102=100,且 由中心极限定理得X近似服从正态分布, EX=200EXi=20000, DX=200DXi=20000, 所求为P(X>20500)= 1-P(X≤20500) =0.0002 故一箱味精净重大于20500的概率为0.0002.
例2一生产线生产的产品成箱包装,每箱的重 量是随机的.假设每箱平均重50kg,标准差为5kg.若用最大载重量为5吨的汽车承运,试用中心极限定理说明每车最多可以装多少箱,才能保障不超载的概率大于0.9772. 解 设Xi(i=1,2,…,n)为装运的第i箱的重量,n是所求的箱数.则 X1,X2,…,Xn独立同分布, EXi=50, DXi=52=25,令 由中心极限定理得 所以 即最多可以装98箱.
定理7若随机变量μn~B(n,p)(n=1,2,…),则对任 意a<b有 注: (1) 定理称为棣莫佛-拉普拉斯定理. (2)它表示当n很大时,二项分布可用正态分布近似逼近: 即 若X~B(n,p),当n很大时,有近似结果X~N[np,np(1-p)].
定理8 (泊松定理)二项概率的泊松近似 例3:每颗子弹击中飞机的概率为0.01, 连发500发,求命中5发的概率.
例4某保险公司多年的统计资料表明,在索赔户 中被盗索赔户占20%,随机抽查100户,利用棣莫佛-拉普拉斯积分定理求被盗索赔户不少于14户且不多于30户的近似值. 解设X表示100户中被盗索赔户数,则 X~B(100,0.2) 由棣莫佛-拉普拉斯定理得: X近似服从正态分布, EX=np=20, DX=np(1-p)=16, 所以 X~N(20,16) 所求 P(14≤X≤30) =0.927
例5某校有4900个学生,已知每天每个学生去阅览室自修的概率为0.1,问阅览室要准备多少座位,才能以此为准99%的概率保证每个去阅览室自修的学生都有座位。例5某校有4900个学生,已知每天每个学生去阅览室自修的概率为0.1,问阅览室要准备多少座位,才能以此为准99%的概率保证每个去阅览室自修的学生都有座位。
例:6 某厂有400台同类机器,每台发生故障的概率 为0.02,假如各台机器彼此独立,求最多2台 机器发生故障的概率。 解:
例7: 某车间有200台独立工作的车床,各台车床开 工的概率都是0.6,每台开工车床要耗电1千瓦, 问供电所至少要供给这个车间多少千瓦电力, 才能以99.9%的概率保证这个车间不会因供电 不足而影响生产。 解: 则
应用: 用频率代替概率时误差的近似估计 Bernoulli大数定理: 而由棣莫弗-拉普拉斯中心极限定理可得
例6 已知某厂生产一批无线电元件,合格品占1/6 (1)选出6000个这种元件,试问在这6000个元件中, 合格品的比例与1/6之差小于1%的概率是多少? (2)选出6000个这种元件,试问误差限定为多少时,才能保证频率与概率之差不大于 的概率为0.99? 此时合格品数落在哪个范围内? (3)选出多少个这种元件,使选出的这批元件中合格品的比例与1/6的差异不大于0.01的概率不小于0.95? 解:把任选n个元件看作n次Bernoulli试验, 为其中 的合格品数,则
说明相应的合格品数落在 925~1075 之间. 所以至少要选 5336 个元件. 注:若p 未知,则可利用