1 / 27

第三节 协方差和相关系数

第三节 协方差和相关系数. 对于二维随机向量( X,Y) 而言,如果 X 和 Y 的数学期望和方差都存在,这时 EX、DX、EY、DY 分别反映了随机变量 X 和 Y 各自的部分特性。 然而二维随机向量的联合分布中还包含有 X 与 Y 之间相互关系的信息,能不能像数学期望和方差那样,用某些数值来刻画 X 和 Y 之间的联系的某些特性呢? 协方差和相关系数就是描述两个随机变量之间联系的数字特征。. 定义 5- 6 设( X,Y) 是 一 个 二 维 随 机 向 量,且. 存在,则称.

chessa
Download Presentation

第三节 协方差和相关系数

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 第三节 协方差和相关系数 对于二维随机向量(X,Y)而言,如果 X 和 Y 的数学期望和方差都存在,这时 EX、DX、EY、DY 分别反映了随机变量 X 和 Y 各自的部分特性。 然而二维随机向量的联合分布中还包含有 X 与 Y 之间相互关系的信息,能不能像数学期望和方差那样,用某些数值来刻画 X 和 Y 之间的联系的某些特性呢? 协方差和相关系数就是描述两个随机变量之间联系的数字特征。

  2. 定义 5-6 设(X,Y)是 一 个 二 维 随 机 向 量,且 存在,则称 为 X 与 Y 的协方差(Covariance)。 性质 5-8 设 X,Y 和 Z 是任意随机变量,且它们的方差均存在,则 (3) 对于任意常数 a 和 b,有: 证明 由协方差的定义容易验证(2)和(3),下面仅证(1)和(4)。 (1)

  3. 定义 5-6 设(X,Y)是 一 个 二 维 随 机 向 量,且 存在,则称 为 X 与 Y 的协方差(Covariance)。 性质 5-8 设 X,Y 和 Z 是任意随机变量,且它们的方差均存在,则 (3) 对于任意常数 a 和 b,有: 证明 由协方差的定义容易验证(2)和(3),下面仅证(1)和(4)。 (4)

  4. 定义 5-6 设(X,Y)是 一 个 二 维 随 机 向 量,且 存在,则称 为 X 与 Y 的协方差(Covariance)。 性质 5-8 设 X,Y 和 Z 是任意随机变量,且它们的方差均存在,则 (3) 对于任意常数 a 和 b,有: 证明 由协方差的定义容易验证(2)和(3),下面仅证(1)和(4)。 以上这些性质是计算协方差时经常要用到的。 同时,我们显然还有:

  5. 性质 5-9 设随机变量 X 与 Y 的方差存在,则 证明 由方差的定义知, 类似地可以证明: 性质 5-9 可推广为:设 X1,…,Xn 的方差均存在,则 用归纳法和性质5-8的(4)即可证明: 注意: 当 X1,…,Xn 不独立时, 不一定成立。

  6. 第i个产品为次品 第i个产品为正品 例 5-24 设 X 服从超几何分布,即 求 EX,DX。 解 为叙述方便,不妨设n ≤ M,且以产品检验为例加以说明。 产品共 N 件,其中 M 件是次品,以 X 表示抽验的 n 件产品中次品的个数,显然 设 显然 其中X1,…,Xn不独立。由第一章例1-12知, 其中 i= 1,2,…,n 。 所以

  7. 下面计算 X 的方差 DX。 因为 Xi 服从 0-1 分布, 所以,又当i<j, i,j=1,2,…,n 时, 所以, XiXj 的概率分布为 故

  8. 再由性质 5-9 的推广知,

  9. 协方差是关于两个随机变量的一个数字特征,它的数值 在一定程度上反映了这两个随机变量相互间的某种关系,不 过用它来描述这关系马上就会发现一个不足的地方,这就是: 设随机变量 X 和 Y 的协方差为: 如随机变量 X 和 Y 各自增大 k倍( k ≠ 0),则 即协方差却为: 即协方差却增大了 倍。 而kX, kY相互之间的联系与 X,Y 之间的关系从直观上 看并无差别。 为克服这一缺点,可在计算协方差之前,先对随机变量进 行“标准化”。故引入相关系数概念。

  10. 定义 5-7 设(X,Y)为二维随机向量,且 X 和 Y 的 方差均存在,都为正( >0 ),则称 为随机变量X与Y的相关系数(coefficient of correlation)。 易见,对k ≠ 0, 有 因为有: 和

  11. 例5-25 设 ( X ,Y )的密度函数为: 其中 为常数,且 证明 略。 从而二维正态分布的五个参数均有明确的含义。

  12. 定理 5-5 设随机变量 X 与 Y 的方差存在,相关系数 为 则有: 的充分必要条件是 X 与 Y 以概率 1 线性相关,即存在常数 a 与 b,使有 证明 (1) 令 则有: 运用定理 5-3(柯西-施瓦茨不等式),可得 即:

  13. 的充分必要条件是 X 与 Y 以概率 1 线性相关,即存在常数 a 与 b,使有 证明 (2):由上述(1)的证明过程可知: 等价于 即: 这等价于二次方程: 仅有一个重根 即 又因为 所以 而由性质 5-6 (DX=0,有 P(X=a)=1) 知:

  14. 的充分必要条件是 X 与 Y 以概率 1 线性相关,即存在常数 a 与 b,使有 证明 (2): 而由性质 5-6 (DX=0,有 P(X=a)=1) 知: 的充分必要条件是: 令 即有:

  15. 定理表明:当 时,在X与Y之间存在着线性关系 的事件概率为1,即 X 与 Y 之间线性关系不成立的事件的概 概率为零。 当 ,称 X 与 Y 正线性相关; 当 ,称 X 与 Y 负线性相关; 当 这种线性相关的程度随着 的减小而减弱。当 时,称 X 与 Y 是不相关的, 即它们没有线性关系。 由此可知,相关系数 是描述随机变量之间线性 关系强弱的一个数字特征。

  16. 定理 5-6 若随机变量 X 与 Y 相互独立,则 X 与 Y 不相关;反之不然。 证明 由于 X 与 Y 独立,即知 所以, 即 X 与 Y 不相关。 从而可知: 特别注意:但当 X 与 Y 不相关时, X 与 Y 却不一定 独立。反例参见以下 例 5-26。

  17. 例 5-26 设随机变量 Θ 的密度函数为 且令 X=sinΘ,Y=cosΘ,证明: (1) X 与 Y 不相关; (2) X 与 Y 不独立。 证明(1) 由随机变量函数的期望公式知, 于是, 又显然 可见X与Y是不相关的。 即知

  18. 例 5-26 设随机变量 Θ 的密度函数为 且令 X=sinΘ,Y=cosΘ,证明: (1) X 与 Y 不相关; (2) X 与 Y 不独立。 证明(2)设(X,Y)的联合分布函数为 F(x,y),则: 其中,由 可得 或 可得

  19. 例 5-26 设随机变量 Θ 的密度函数为 且令 X=sinΘ,Y=cosΘ,证明: (1) X 与 Y 不相关; (2) X 与 Y 不独立。 再由第三章例3-21(见教材第63页)知,X,Y 的密度函数,故 从而可知, 即知 X 与 Y 不独立。此时 X 与 Y 存在函数关系:

  20. 定理 5-6和 例 5-26说明:两个随机变量之间的 独立与不相关是两个不同的概念。 “不相关”只说明两个随机变量之间没有线性关系, 但可能存在其他函数关系,也可能相互独立。 而“独立”说明两个随机变量之间既无线性关系, 也无其他函数关系,所以“独立”必导致“不相关”; 反之不然。

  21. 随机变量 X 与Y 的关系 “独立”“不独立” (无任何关系) (有某种关系) 相关 “不相关” (有线性关系),(没有线性关系) 关系可有强弱 “不相关” (没有线性关系) 没有任何其它关系 (但存在其他函数关系)

  22. 例 5-27 若 则 X 与 Y 相互独立的充分必要条件是 X 与 Y 不相关。 证明 显然只要证明充分性即可。 设 X 与 Y 不相关,由二维正态分布时性质可知, 则当ρ=0时的二维正态分布的联合密度函数为: 这说明 X 与 Y 相互独立。 在一般情况下, X 与 Y 相互独立可以推得 X 与 Y不相 相关;反之不成立。 但是,对于二维正态随机向量(X,Y)而言,“X与Y相 互独立”和“X与Y不相关”是等价的。

  23. 例 5-28 设随机向量(X,Y)的联合密度函数为 求: 解(1)由于相关系数 由 DX、DY 和 Cov(X,Y)确定, 所以,先计算 DX、DY 和Cov(X,Y)。

  24. 所以

  25. 所以 又 从而 现再来计算相关系数得:

  26. (2)由性质 5-8 和 性质 5-9 知:

  27. 第五章 习题 (P133) 23,24,25,26*,27,28* 协方差和相关系数

More Related