470 likes | 657 Views
多元统计基本概念. 1. 数据表达. 2. 数据类型. 3. 随机向量的分布函数和分布密度. 4 均值. 5 协差阵. 1. 数据表达. P 表示变量, n 表示项目或实验单元. 例如,某书店销售情况 变量 1 销售金额: 42 52 48 58 变量 2 售出数量 4 5 4 3. 2. 数据类型 (1) 数据类型分类 Nominal ( 标称、名义 ) 取值为 0 或 1( 表示属性 ) Ordinal ( 次序、有序 ) 取值为 1 , 2 , 3 , … ,
E N D
多元统计基本概念 1.数据表达 2.数据类型 3.随机向量的分布函数和分布密度 4 均值 5 协差阵
1.数据表达 • P表示变量, n表示项目或实验单元 例如,某书店销售情况 变量1 销售金额:42 52 48 58 变量2 售出数量 4 5 4 3
2.数据类型 (1) 数据类型分类 Nominal (标称、名义) 取值为0或1(表示属性) Ordinal (次序、有序) 取值为1,2,3,…, (表示等级) Interval(区间) 取值为任意实数 Ratio (比例) 取值为0和1之间的实数 (表示数量关系,有大小、倍数的关系) (2) 定量数据和定性数据 定量数据(Interval、 Ratio),定性数据(Nominal), Ordinal界于二者之间。 Ordinal向Nominal的转化。
3.随机向量的分布函数和分布密度 联合分布函数∶ 分布密度函数∶ 满足
4 均值 设X=(X1,X2,…,Xp)'是p维随机变量,定义X的数学期望为
均值 X1 X2
2、性质 1)设为常数,则; 2)设分别为常数矩阵,则
定义:设和分别为维和维随机向量,则其协方差矩阵为定义:设和分别为维和维随机向量,则其协方差矩阵为 若令
三、相关系数矩阵 若(x1,x2,…,xp)’和(y1,y2,…,yp)分别是p和q维随机向量,则其相关系数矩阵为
三、多元正态分布 1 多元正态分布定义 2 多元正态分布的定义及基本性质 3 多元正态分布参数估计
1 多元正态分布定义 若随机向量的分布密度函数为 其中 为对称正定矩阵, 则称服从p维正态分布。其数学期望与协方差矩阵 分别为 特例1(一元正态分布) 则
特例2 (二元正态分布) 设 则
是对角阵,则 1) 若 相互独立 练习: 设 其中 问与是否独立? 2 多元正态分布的定义及基本性质 与是否独立?
2) 若 为常数阵,d为常数向量,则 正态随机向量的线性函数还是正态的 3) 若 则 2 多元正态分布的定义及基本性质
练习:设3维随机向量 试求的分布
3) 若 则 2 多元正态分布的定义及基本性质 思考题:设随机向量 与独立?且 问 服从什么分布?
3 多元正态分布参数估计 样本 多元样本数据 为一元样本 多元分析的任务∶根据样本数据来分析各变量之间的关系,推断总体的性质。
样本平均值 样本平均值是n个 点的重心
例题: • 计算均值、离差阵、协方差和相关阵
样本离差(平方乘积和)矩阵S • 计算离差阵
样本协差阵 (样本协方差) (样本方差)
样本相关矩阵R ----样本相关系数 R为非负定矩阵
总体均值和协方差矩阵的最大似然估计 设 用最大似然法求出的均值和协方差的估计量分别为
基本性质 1) 是总体均值的无偏估计 2) 是总体协方差的无偏估计 分别是总体均值和协差阵的有效估计 和 3) 和 是总体均值和协差阵的一致估计估计 4) 和
10. 定理设 和 S 分别是正态总体 样本均值和离差阵,则 1) 2) 3) 和 S 相互独立
四、多元统计中常用的分布 1 Wishart分布 2 T2分布 3 Wilks分布 在一元统计中,常用的分布有卡方分布、t分布和F分布。在多元统计中,他们分别发展为Wishart分布、T2分布和Wilks分布。
1 分布和Wishart分布 定义1 设为相互独立且同服从于分布的随机变量。则 所服从的分布叫做分布, 为自由度且记为。
定理2. 由(1)式定义的随机变量的分布密度函数为
定理3. 设, 且与相互独立,则 推论2 设是抽自正态总体的简单随机样本,则统计量
Wishart分布 它是多元样本离差平方和矩阵的分布 定义1 设为相互独立且同服从于分布,令 则 (1) 所服从的分布叫做自由度为的p维维希特分布,记作
显然,当p=1 时,有 Wishart分布像卡方分布一样具有加法性质,若 相互独立,则
2 分布与分布 设,且与相互独立,则称随机变量 服从自由度为的分布, 记为。 将T平方,即
在多元统计中分布是一元统计中t分布的推广 定义:若, S与X相互独立、称随机变量 是自由度为(p,n)的分布 可以转化为F分布 Hotelling
3、分布与Wilks分布 定义3 设,,且与相互独立,则称随机变量 服从自由度为的分布, 记为。 F—分布事实上为从正态总体随机抽取的两个样本方差的比,在方差分析和回归分析中广泛使用
描述的变异程度的统计参数称为广义方差,其定义有很多描述的变异程度的统计参数称为广义方差,其定义有很多 如 F—统计量的推广是统计量 定义:若 相互独立,则称随机变量 的分布是自由度为(p,n1,n2)的分布
小结 • 随机向量 • 分布函数和密度函数 • 均值向量和协方差矩阵 • 特殊分布