430 likes | 1.18k Views
§ 3 . 协方差及相关系数. 一、协方差. 任意两个随机变量 X 和 Y 的协方差 , 记为 Cov ( X , Y ), 定义为. 1. 定义. Cov(X , Y )= E {[ X - E ( X )][ Y -E( Y ) ]}. 2. 简单性质. ⑴ Cov ( X , Y )= Cov( Y , X ). ⑵ Cov ( aX , bY ) = ab Cov( X , Y ) a , b 是常数.
E N D
§3.协方差及相关系数 一、协方差 任意两个随机变量X和Y的协方差,记为Cov(X,Y), 定义为 1.定义 Cov(X,Y)=E{[ X-E(X)][Y-E(Y) ]} 2.简单性质 ⑴ Cov(X,Y)= Cov(Y,X) ⑵ Cov(aX,bY) = ab Cov(X,Y) a,b是常数 ⑶ Cov(X1+X2,Y)= Cov(X1,Y) + Cov(X2,Y)
3. 计算协方差的一个简单公式 由协方差的定义及期望的性质,可得 Cov(X,Y)=E{[ X-E(X)][Y-E(Y) ]} =E(XY)-E(X)E(Y)-E(Y)E(X)+E(X)E(Y) =E(XY)-E(X)E(Y) 即 Cov(X,Y)=E(XY) -E(X)E(Y) 可见,若X与Y独立, Cov(X,Y)= 0 .
4. 随机变量和的方差与协方差的关系 D(X+Y)= D(X)+D(Y)+ 2Cov(X,Y) D(X-Y)= D(X)+D(Y)-2Cov(X,Y) 协方差的大小在一定程度上反映了X和Y相互间的关系,但它还受X与Y本身度量单位的影响. 例如: Cov(kX, kY)=k2Cov(X,Y) 为了克服这一缺点,这就引入了相关系数 .
二、相关系数 定义: 设D(X)>0, D(Y)>0, 称 为随机变量X和Y的相关系数 .
Y -1 0 1 X -1 0 1 1/8 1/8 1/8 1/8 0 1/8 1/8 1/8 1/8 {或者 =0} {或者 =3/4} 例1 (X,Y)的联合分布为: 由对称性得 EY=EX=0 EY2=EX2=3/4 另外 =1/8-1/8-1/8+1/8 =0 所以 求相关系数ρXY,并判断X,Y是否相关,是否独立. Cov(X,Y)=EXY-EXEY=0 即 X与Y不相关. 解 =0 亦即 ρXY=0 另一方面 P(X=-1,Y=-1)=1/8≠ P(X=-1)P(Y=-1)=(3/8)×(3/8) =3/4 所以X与Y不独立.
例2 已知 的概率密度 求 解:
例3 已知二维随机变量 X,Y 的联合分布律为: X Y -2 0 1 -1 0.3 0.12 0.18 1 0.10 0.18 0.12 求X,Y的协方差与相关系数。 解:先求边缘分布律: X -1 1 Y -2 0 1 Pk 0.6 0.4 Pk 0.4 0.3 0.3
下面求X,Y 的方差: X与Y 的相互关系数为:
令 ,则上式为 相关系数的性质: 证: 由方差的性质和协方差的定义知, 对任意实数b,有 0≤D(Y-bX)= b2D(X)+D(Y)-2bCov(X,Y ) D(Y- bX)=
故 = 0 但由 并不一定能推出X和Y 独立. 2. X和Y独立时,=0,但其逆不真. 由于当X和Y独立时,Cov(X,Y)= 0. 请看下例.
设(X,Y)服从单位圆域x2+y2≤1 上的均匀分布,证明: XY =0。 例 1 证明:
同样得E(Y)=0 ∴Cov(X,Y)=E(XY)-E(X)E(Y)=0 可易得D(X)>0, D(Y)>0. ∴XY =0, 故X与Y不相关. 而X和Y不相互独立.
例2:若二维随机变量(X,Y)服从正态分布, 试证X、Y 相互独立的充分必要条件是ρ=0。 。 证: 边缘分布密度为:
若(X,Y)具有二维正态分布 N(0,0,1,1,ρ), 以下画出 取几个不同ρ值时(X,Y)的密度函数曲面三维图象:
存在常数a,b(b≠0), 使P{Y=a+bX}=1, 即X和Y以概率1线性相关.
小结|ρXY|的大小反映了X,Y之间线性关系的密切程度:小结|ρXY|的大小反映了X,Y之间线性关系的密切程度: ρXY=0时, X,Y之间无线性关系; |ρXY|=1时,X,Y之间具有线性关系. 由此定义 ρXY ≠0,X,Y相关 ρXY=0,X,Y不相关 显然 X,Y独立 注 X,Y不相关,不一定有X,Y独立. 若(X,Y)服从二维正态分布,则X,Y独立X,Y不相关.
例3设(X,Y)服从二维正态分布,且X~N(1,9),Y~N(0,16), 解 =0 所以 =3
第四章 随机变量的数字特征 §4 矩、协方差矩阵 1、矩的定义
§4连续型随机变量的概率密度 Γ- 函 数
2 协方差矩阵的定义 将二维随机变量(X1,X2)的四个二阶中心矩 排成矩阵的形式: 称此矩阵为(X1,X2)的协方差矩阵.
若 称矩阵 n维随机变量(X1,X2, …,Xn) 的协方差矩阵. 都存在, 为(X1,X2, …,Xn) 的协方差矩阵
下面给出n元正态分布的概率密度的定义. |C|是它的行列式, 表示C的逆矩阵, X和 是n维列向量, 表示X的转置. 设(X1,X2, …,Xn)是一个n维随机向量, 若它的概率密度为 f (x1,x2, …,xn) 则称X服从n元正态分布. 其中C是(X1,X2, …,Xn) 的协方差矩阵.
对一切不全为0的实数a1,a2,…,an, • a1X1+ a2X2+ …+ an Xn均服从正态分布. n元正态分布的几条重要性质 1. X=(X1,X2, …,Xn)服从n元正态分布 2. 若X=(X1,X2, …,Xn)服从n元正态分布, 则(Y1,Y2, …,Yk)也服从多元正态分布. 3. 设(X1,X2, …,Xn)服从n元正态分布,则 • “X1,X2, …,Xn相互独立” 等价于 “X1,X2, …,Xn两两不相关”
例2设随机变量X和Y相互独立且X~N(1,2), Y~N(0,1). 试求Z=2X-Y+3的概率密度. 解: X~N(1,2),Y~N(0,1),且X与Y独立, 故X和Y的联合分布为正态分布,X和Y的 任意线性组合是正态分布. 即 Z~N(E(Z), D(Z)) E(Z)=2E(X)-E(Y)+3=2+3=5 D(Z)=4D(X)+D(Y)=8+1=9 Z~N(5, 32) 故Z的概率密度是
第四章 随机变量的数字特征 例3 解:
设随机变量X 的概率密度为 例1 求 E ( 1 / X )。 例题补充 解
例2已知( X,Y )的分布律为 求 解
且 例3 设 X 的可能取值为 ,求 X 的分布律。 解 设X 的分布律为 所以
已知 例4 的次数, 对X 独立观察 4 次,Y 表示X的观察值大于 求 解 由题意可知
例5 已知 服从参数为 3 的指数分布, X , Y相互独立, 求 解 由随机变量的性质可知
,且 设 例6 ⑴ 求 (X ,Y) 的分布律; ⑵ 求 X + Y 的方差。 解 ⑴X ,Y 的取值都为-1和1,则
第四章 小 结 1 阐述了数学期望、方差的概念及背景,要掌握 它们的性质与计算,会求随机变量函数的数学 期望和方差。 2 要熟记两点分布、二项分布、泊松分布、均匀 分布、指数分布和正态分布的数学期望与方差。 3 给出了契比雪夫不等式,要会用契比雪夫不等式 作简单的概率估计。 4 引进了协方差、相关系数的概念,要掌握它们的 性质与计算。 5 要掌握二维正态随机变量的不相关与独立的等价 性。 6 给出了矩与协方差矩阵。