490 likes | 708 Views
常见的离散型随机变量的概率分布. (I) 两点 分布. 设 E 是一个只有两种可能结果的随机试验 , 用 Ω={ 1 , 2 } 表示其样本空间 . P({ 1 })=p , P({ 2 })=1-p. 来源. 1, = 1 0, = 2. X( )=. 200 件产品中 , 有 196 件是正品 ,4 件是次品 , 今从中随机地抽取一件 , 若规定. 例 5. 1, 取到合格品 0, 取到不合格品. X( )=. 则 P{X=1}=196/200=0.98,
E N D
(I)两点分布 设E是一个只有两种可能结果的随机试验,用Ω={1, 2}表示其样本空间. P({1})=p , P({2})=1-p • 来源 1, = 1 0, = 2 X()=
200件产品中,有196件是正品,4件是次品,今从中随机地抽取一件,若规定200件产品中,有196件是正品,4件是次品,今从中随机地抽取一件,若规定 例 5 1, 取到合格品 0, 取到不合格品 X()= 则 P{X=1}=196/200=0.98, P{X=0}=4/200=0.02 故 X服从参数为0.98的两点分布 . 即 X ∼ B(1,0.98).
贝努里概型 和 二项分布 (II) 例设生男孩的概率为p,生女孩的概率为 q=1-p,令X表示随机抽查出生的4个婴儿中“男孩”的个数. 我们来求X的概率分布.
X =1 X =2 X =3 X =4 X=0 X表示随机抽查的4个婴儿中男孩的个数, 生男孩的概率为 p. 男 女 X可取值0,1,2,3,4. X的概率分布是:
例将一枚均匀骰子抛掷3次, 令X 表示3次中出现“4”点的次数 不难求得, X的概率分布是:
一般地,设在一次试验中我们只考虑两个 互逆的结果:A或 , 或者形象地把两个互逆结果叫做“成功”和“失败”. 掷骰子:“掷出4点”,“未掷出4点” 新生儿:“是男孩”,“是女孩” 抽验产品:“是正品”,“是次品” 再设我们重复地进行n次独立试验 ( “重复”是指这次试验中各次试验条件相同 )
每次试验成功的概率都是p,失败的概率 都是q=1-p. 这样的n次独立重复试验称作n重贝努里试验,简称贝努里试验或贝努里概型. 用X表示n重贝努里试验中事件A(成功)出现的次数,则 称r.v.X服从参数为n和p的二项分布,记作 X~B(n,p)
(2)每次试验只考虑两个互逆结果A或 , 且P(A)=p, ; 注:贝努里概型对试验结果没有等可能的要求,但有下述要求: (1)每次试验条件相同; (3)各次试验相互独立. 二项分布描述的是n重贝努里试验中出现 “成功”次数X的概率分布.
例某类灯泡使用时数在2000小时以上视为正品.已知有一大批这类的灯泡,其次品率是0.2.随机抽出20只灯泡做寿命试验,求这20只灯泡中恰有3只是次品的概率.例某类灯泡使用时数在2000小时以上视为正品.已知有一大批这类的灯泡,其次品率是0.2.随机抽出20只灯泡做寿命试验,求这20只灯泡中恰有3只是次品的概率. 解: 设X为20只灯泡中次品的个数 ,则. X ~ B (20, 0.2),
下面我们研究二项分布B(n,p)和两点分布B(1,p)之间的一个重要关系.下面我们研究二项分布B(n,p)和两点分布B(1,p)之间的一个重要关系. • 说明 设试验E只有两个结果:A和. 记p=P(A),则P( )= 1- p ,0<p<1, 我们把试验E在相同条件下,相互独立地进行n次,且记X为n次独立试验中结果A出现的次数.把描述第i次实验的随机变量记作Xi 则 Xi∼ B(1,p), 且X1,X2 , ,Xn也是相互独立的,则有 X= X1+X2++Xn
其中 >0 是常数,则称 X 服从参数为 的 泊松分布,记作X~P( ). (III) 泊松分布 一、泊松分布的定义及图形特点 设随机变量X所有可能取的值为0 , 1 , 2 , … , 且概率分布为:
易见 例9 某一无线寻呼台,每分钟收到寻呼的次数X服从参数=3的泊松分布. 求:(1)一分钟内恰好收到3次寻的概率. (2)一分钟内收到2至5次寻呼的概率. 解: (1)P{X=3}=(33/3!)e-3≈0.2240 (2) P{2≤X≤5} =P{X=2}+P{X=3}+P{X=4}+P{X=5} =[(32/2!)+(33/3!)+(34/4!)+(35/5!)]e-3 ≈0.7169
例 某一城市每天发生火灾的次数X服从参数为0.8的泊松分布. 求:该城市一天内发生3次以上火灾的概率. 解: P{X≥3}=1- P{X<3} =1-[P{X=0}+ P{X=1}+P{X=2}] =1-[(0.8 0/0!)+(0.81/1!)+(0.82/2!)]e-0.8 ≈0.0474
泊松分布的图形特点: X~P( )
二、二项分布与泊松分布 历史上,泊松分布是作为二项分布的近似,于1837年由法国数学家泊松引入的 . • 命题 对于二项分布B(n,p),当n充分大,p又很小时,则对任意固定的非负整数k,有近似公式
我们把在每次试验中出现概率很小的事件称作稀有事件. 如地震、火山爆发、特大洪水、意外事故等等 由泊松定理,n重贝努里试验中稀有事件出现的次数近似地服从泊松分布.
例 某出租汽车公司共有出租车400辆,设每天每辆出租车出现故障的概率为0.02, 求:一天内没有出租车出现故障的概率. 解: 将观察一辆车一天内是否出现故障看成一次试验E.因为每辆车是否出现故障与其它车无关,于是观察400辆出租车是否出现故障就是做400次伯努利试验,设X表示一天内出现故障的出租车数,则: X ∼B(400, 0.02). 令=np=400×0.02=8 于是: P{一天内没有出租车出现故障}=P{X=0} ≈(80/0!)e-8 =0.0003355
常见的连续型随机变量 正态分布、均匀分布、指数分布
德莫佛 一、正态分布 正态分布是应用最广泛的一种连续型分布. 德莫佛(De Moivre)最早发现了二项分布的一个近似公式,这一公式被认为是正态分布的首次露面. 正态分布在十九世纪前叶由 高斯(Gauss)加以推广,所以通常称为高斯分布.
其中 和 都是常数, 任意, >0, 则称X服从参数为 和 的正态分布. 记作 (I)、正态分布的定义 若r.v. X 的概率密度为 (Normal) f (x)所确定的曲线叫作正态曲线.
正态分布的密度曲线是一条关于 对称的钟形曲线. (II)、正态分布 的图形特点 特点是“两头小,中间大,左右对称”.
正态分布 的图形特点 决定了图形的中心位置, 决定了图形中峰的陡峭程度.
令x=μ+c,x=μ-c (c>0),分别代入f (x),可得 f (μ+c)=f (μ-c) 且 f (μ+c) ≤f (μ), f (μ-c)≤f (μ) 故f(x)以μ为对称轴,并在x=μ处达到最大值:
当x→ ∞时,f(x) → 0, 这说明曲线 f(x)向左右伸展时,越来越贴近x轴。即f (x)以x轴为渐近线。
用求导的方法可以证明, x = μ σ 为f (x)的两个拐点的横坐标。
实例 年降雨量问题,我们用上海99年年降雨量的数据画出了频率直方图。 从直方图,我们可以初步看出,年降雨量近似服从正态分布。
下面是我们用某大学大学生的身高的数据画出的频率直方图。下面是我们用某大学大学生的身高的数据画出的频率直方图。 红线是拟合的正态密度曲线 可见,某大学大学生的身高应服从正态分布。
人的身高高低不等,但中等身材的占大多数,特高和特矮的只是少数,而且较高和较矮的人数大致相近,这从一个方面反映了服从正态分布的随机变量的特点。人的身高高低不等,但中等身材的占大多数,特高和特矮的只是少数,而且较高和较矮的人数大致相近,这从一个方面反映了服从正态分布的随机变量的特点。
除了我们在前面遇到过的年降雨量和身高外,在正常条件下各种产品的质量指标,如零件的尺寸;纤维的强度和张力;农作物的产量,小麦的穗长、株高;测量误差,射击目标的水平或垂直偏差;信号噪声等等,都服从或近似服从正态分布.
(III) 、设X~ , X的分布函数是
的正态分布称为标准正态分布. 其密度函数和分布函数常用和 表示: (IV)、标准正态分布
,则 设 ~N(0,1) 标准正态分布的重要性在于,任何一个 一般的正态分布都可以通过线性变换转化为 标准正态分布. 它的依据是下面的定理: 定理1 根据定理1,只要将标准正态分布的分布函数制成表,就可以解决一般正态分布的概率计算问题.
(V)、正态分布表 书末附有标准正态分布函数数值表,有了它,可以解决一般正态分布的概率计算查表. 表中给的是x>0时, Φ(x)的值. 当-x<0时
若 ~N(0,1) 若 X~N(0,1),
(VI)、3 准则 P(|X| 1)=2 (1)-1=0.6826 P(|X| 2)=2 (2)-1=0.9544 P(|X| 3)=2 (3)-1=0.9974 由标准正态分布的查表计算可以求得, 当X~N(0,1)时, 这说明,X的取值几乎全部集中在[-3,3]区间 内,超出这个范围的可能性仅占不到0.3%.
时, 可以认为,Y 的取值几乎全部集中在 区间内. 这在统计学上称作“3 准则” (三倍标准差原则). 将上述结论推广到一般的正态分布,
例(1)假设某地区成年男性的身高(单 位:cm)X~N(170,7.692),求该地区成年 男性的身高超过175cm的概率。 解: (1) 根据假设X~N(170,7.692),则 故事件{X>175}的概率为 P {X>175}= =0.2578
(2)公共汽车车门的高度是按成年男性与车门顶头碰头机会在0.01以下来设计的,问车门高度应如何确定?(2)公共汽车车门的高度是按成年男性与车门顶头碰头机会在0.01以下来设计的,问车门高度应如何确定? 解: (2) 设车门高度为h cm,按设计要求 P(X≥ h)≤0.01 或 P(X< h)≥ 0.99, 下面我们来求满足上式的最小的 h.
求满足 P(X< h ) 0.99 的最小的h . 即 h=170+17.92 188 查表得 (2.33)=0.9901>0.99 因为X~N(170,7.692), 故 P(X< h)= 0.99 设计车门高度为 188厘米时,可使 男子与车门碰头 机会不超过0.01. 所以 =2.33,
二、均匀分布(Uniform) 若 r.v. X的概率密度为: 则称X服从区间( a, b)上的均匀分布,记作: X~ U[a, b] (注:X~ U(a, b))
若X~ U[a, b],则对于满足 的c,d, 总有 均匀分布常见于下列情形: 如在数值计算中,由于四舍五 入,小数点后某一位小数引入的误差,例如对小数点后第一位进行四舍五 入时,那么一般认为误差服从(-0.5, 0.5)上的均匀分布。
三、指数分布:若 r.v X具有概率密度 则称 X服从参数为 的指数分布. 常简记为 X~E( ) . 指数分布常用于可靠性统计研究中,如元件的寿命.
1、定义若随机变量X的对数服从均值为 ,标 准差为 的正态分布,则称其服从参数为 和 的对数正态分布.即,若 , 其中 .此时 X的概率密度函数为 记作 ,这里 和 分别是 均值和标准差. 四、对数正态分布
四、对数正态分布 它是一种偏态图形,是描述零件疲劳寿命的一种分布形式。如螺旋弹簧,螺栓,齿轮以及轴类零件的疲劳寿命分布。
e((x-a)/b)m ƒ(x)= (x)= 五威布尔分布 1. m(xa)m-1 bm x≥a 式中:m—形状参数 a—位置参数:产品的最低寿命 b—尺度参数(对图形起放大或缩小作用) F(x)=1 e((x-a)/b)m R(x)=e((x-a)/b)m 2. m(xa)m-1 bm
例:某零件寿命服从m=4,a=1200h,b=3090的威布尔分布,试求:此零件工作2500 h的可靠度 和失效率及可靠度为0.99的可靠寿命。 解:R(2500)=e((25001200)/3090)4=0.969 44-1 30904 =0.0000964/h t0.90=1200+3090(㏑.99)¼=2178h
五、威布尔分布 威布尔分布是根据最弱环节模型或串联模型得到的,能充分反映材料缺陷和应力集中源对材料疲劳寿命的影响,而且具有递增的失效率,所以,将它作为材料或零件的寿命分布模型或给定寿命下的疲劳强度模型是合适的。
五、威布尔分布 目前,二参数的威布尔分布主要用于滚动轴承的寿命试验以及高应力水平下的材料疲劳试验,三参数的威布尔分布用于低应力水平的材料及某些零件的寿命试验,一般而言,它具有比对数正态分布更大的适用性。但是,威布尔分布参数的分析法估计较复杂,区间估计值过长,实践中常采用概率纸估计法,从而降低了参数的估计精度.这是威布尔分布目前存在的主要缺点,也限制了它的应用。