270 likes | 461 Views
第三节 协方差和相关系数. 对于二维随机向量( X,Y) 而言,如果 X 和 Y 的数学期望和方差都存在,这时 EX、DX、EY、DY 分别反映了随机变量 X 和 Y 各自的部分特性。 然而二维随机向量的联合分布中还包含有 X 与 Y 之间相互关系的信息,能不能像数学期望和方差那样,用某些数值来刻画 X 和 Y 之间的联系的某些特性呢? 协方差和相关系数就是描述两个随机变量之间联系的数字特征。. 定义 5- 6 设( X,Y) 是 一 个 二 维 随 机 向 量,且. 存在,则称.
E N D
第三节 协方差和相关系数 对于二维随机向量(X,Y)而言,如果 X 和 Y 的数学期望和方差都存在,这时 EX、DX、EY、DY 分别反映了随机变量 X 和 Y 各自的部分特性。 然而二维随机向量的联合分布中还包含有 X 与 Y 之间相互关系的信息,能不能像数学期望和方差那样,用某些数值来刻画 X 和 Y 之间的联系的某些特性呢? 协方差和相关系数就是描述两个随机变量之间联系的数字特征。
定义 5-6 设(X,Y)是 一 个 二 维 随 机 向 量,且 存在,则称 为 X 与 Y 的协方差(Covariance)。 性质 5-8 设 X,Y 和 Z 是任意随机变量,且它们的方差均存在,则 (3) 对于任意常数 a 和 b,有: 证明 由协方差的定义容易验证(2)和(3),下面仅证(1)和(4)。 (1)
定义 5-6 设(X,Y)是 一 个 二 维 随 机 向 量,且 存在,则称 为 X 与 Y 的协方差(Covariance)。 性质 5-8 设 X,Y 和 Z 是任意随机变量,且它们的方差均存在,则 (3) 对于任意常数 a 和 b,有: 证明 由协方差的定义容易验证(2)和(3),下面仅证(1)和(4)。 (4)
定义 5-6 设(X,Y)是 一 个 二 维 随 机 向 量,且 存在,则称 为 X 与 Y 的协方差(Covariance)。 性质 5-8 设 X,Y 和 Z 是任意随机变量,且它们的方差均存在,则 (3) 对于任意常数 a 和 b,有: 证明 由协方差的定义容易验证(2)和(3),下面仅证(1)和(4)。 以上这些性质是计算协方差时经常要用到的。 同时,我们显然还有:
性质 5-9 设随机变量 X 与 Y 的方差存在,则 证明 由方差的定义知, 类似地可以证明: 性质 5-9 可推广为:设 X1,…,Xn 的方差均存在,则 用归纳法和性质5-8的(4)即可证明: 注意: 当 X1,…,Xn 不独立时, 不一定成立。
第i个产品为次品 第i个产品为正品 例 5-24 设 X 服从超几何分布,即 求 EX,DX。 解 为叙述方便,不妨设n ≤ M,且以产品检验为例加以说明。 产品共 N 件,其中 M 件是次品,以 X 表示抽验的 n 件产品中次品的个数,显然 设 显然 其中X1,…,Xn不独立。由第一章例1-12知, 其中 i= 1,2,…,n 。 所以
下面计算 X 的方差 DX。 因为 Xi 服从 0-1 分布, 所以,又当i<j, i,j=1,2,…,n 时, 所以, XiXj 的概率分布为 故
协方差是关于两个随机变量的一个数字特征,它的数值 在一定程度上反映了这两个随机变量相互间的某种关系,不 过用它来描述这关系马上就会发现一个不足的地方,这就是: 设随机变量 X 和 Y 的协方差为: 如随机变量 X 和 Y 各自增大 k倍( k ≠ 0),则 即协方差却为: 即协方差却增大了 倍。 而kX, kY相互之间的联系与 X,Y 之间的关系从直观上 看并无差别。 为克服这一缺点,可在计算协方差之前,先对随机变量进 行“标准化”。故引入相关系数概念。
定义 5-7 设(X,Y)为二维随机向量,且 X 和 Y 的 方差均存在,都为正( >0 ),则称 为随机变量X与Y的相关系数(coefficient of correlation)。 易见,对k ≠ 0, 有 因为有: 和
例5-25 设 ( X ,Y )的密度函数为: 其中 为常数,且 证明 略。 从而二维正态分布的五个参数均有明确的含义。
定理 5-5 设随机变量 X 与 Y 的方差存在,相关系数 为 则有: 的充分必要条件是 X 与 Y 以概率 1 线性相关,即存在常数 a 与 b,使有 证明 (1) 令 则有: 运用定理 5-3(柯西-施瓦茨不等式),可得 即:
的充分必要条件是 X 与 Y 以概率 1 线性相关,即存在常数 a 与 b,使有 证明 (2):由上述(1)的证明过程可知: 等价于 即: 这等价于二次方程: 仅有一个重根 即 又因为 所以 而由性质 5-6 (DX=0,有 P(X=a)=1) 知:
的充分必要条件是 X 与 Y 以概率 1 线性相关,即存在常数 a 与 b,使有 证明 (2): 而由性质 5-6 (DX=0,有 P(X=a)=1) 知: 的充分必要条件是: 令 即有:
定理表明:当 时,在X与Y之间存在着线性关系 的事件概率为1,即 X 与 Y 之间线性关系不成立的事件的概 概率为零。 当 ,称 X 与 Y 正线性相关; 当 ,称 X 与 Y 负线性相关; 当 这种线性相关的程度随着 的减小而减弱。当 时,称 X 与 Y 是不相关的, 即它们没有线性关系。 由此可知,相关系数 是描述随机变量之间线性 关系强弱的一个数字特征。
定理 5-6 若随机变量 X 与 Y 相互独立,则 X 与 Y 不相关;反之不然。 证明 由于 X 与 Y 独立,即知 所以, 即 X 与 Y 不相关。 从而可知: 特别注意:但当 X 与 Y 不相关时, X 与 Y 却不一定 独立。反例参见以下 例 5-26。
例 5-26 设随机变量 Θ 的密度函数为 且令 X=sinΘ,Y=cosΘ,证明: (1) X 与 Y 不相关; (2) X 与 Y 不独立。 证明(1) 由随机变量函数的期望公式知, 于是, 又显然 可见X与Y是不相关的。 即知
例 5-26 设随机变量 Θ 的密度函数为 且令 X=sinΘ,Y=cosΘ,证明: (1) X 与 Y 不相关; (2) X 与 Y 不独立。 证明(2)设(X,Y)的联合分布函数为 F(x,y),则: 其中,由 可得 或 可得
例 5-26 设随机变量 Θ 的密度函数为 且令 X=sinΘ,Y=cosΘ,证明: (1) X 与 Y 不相关; (2) X 与 Y 不独立。 再由第三章例3-21(见教材第63页)知,X,Y 的密度函数,故 从而可知, 即知 X 与 Y 不独立。此时 X 与 Y 存在函数关系:
定理 5-6和 例 5-26说明:两个随机变量之间的 独立与不相关是两个不同的概念。 “不相关”只说明两个随机变量之间没有线性关系, 但可能存在其他函数关系,也可能相互独立。 而“独立”说明两个随机变量之间既无线性关系, 也无其他函数关系,所以“独立”必导致“不相关”; 反之不然。
随机变量 X 与Y 的关系 “独立”“不独立” (无任何关系) (有某种关系) 相关 “不相关” (有线性关系),(没有线性关系) 关系可有强弱 “不相关” (没有线性关系) 没有任何其它关系 (但存在其他函数关系)
例 5-27 若 则 X 与 Y 相互独立的充分必要条件是 X 与 Y 不相关。 证明 显然只要证明充分性即可。 设 X 与 Y 不相关,由二维正态分布时性质可知, 则当ρ=0时的二维正态分布的联合密度函数为: 这说明 X 与 Y 相互独立。 在一般情况下, X 与 Y 相互独立可以推得 X 与 Y不相 相关;反之不成立。 但是,对于二维正态随机向量(X,Y)而言,“X与Y相 互独立”和“X与Y不相关”是等价的。
例 5-28 设随机向量(X,Y)的联合密度函数为 求: 解(1)由于相关系数 由 DX、DY 和 Cov(X,Y)确定, 所以,先计算 DX、DY 和Cov(X,Y)。
所以 又 从而 现再来计算相关系数得:
第五章 习题 (P133) 23,24,25,26*,27,28* 协方差和相关系数