1 / 47

多元统计基本概念

多元统计基本概念. 1. 数据表达. 2. 数据类型. 3. 随机向量的分布函数和分布密度. 4 均值. 5 协差阵. 1. 数据表达. P 表示变量, n 表示项目或实验单元. 例如,某书店销售情况 变量 1 销售金额: 42 52 48 58 变量 2 售出数量 4 5 4 3. 2. 数据类型 (1) 数据类型分类 Nominal ( 标称、名义 ) 取值为 0 或 1( 表示属性 ) Ordinal ( 次序、有序 ) 取值为 1 , 2 , 3 , … ,

elam
Download Presentation

多元统计基本概念

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 多元统计基本概念 1.数据表达 2.数据类型 3.随机向量的分布函数和分布密度 4 均值 5 协差阵

  2. 1.数据表达 • P表示变量, n表示项目或实验单元 例如,某书店销售情况 变量1 销售金额:42 52 48 58 变量2 售出数量 4 5 4 3

  3. 2.数据类型 (1) 数据类型分类 Nominal (标称、名义) 取值为0或1(表示属性) Ordinal (次序、有序) 取值为1,2,3,…, (表示等级) Interval(区间) 取值为任意实数 Ratio (比例) 取值为0和1之间的实数 (表示数量关系,有大小、倍数的关系) (2) 定量数据和定性数据 定量数据(Interval、 Ratio),定性数据(Nominal), Ordinal界于二者之间。 Ordinal向Nominal的转化。

  4. 3.随机向量的分布函数和分布密度

  5. 3.随机向量的分布函数和分布密度 联合分布函数∶ 分布密度函数∶ 满足

  6. 4 均值 设X=(X1,X2,…,Xp)'是p维随机变量,定义X的数学期望为

  7. 均值 X1 X2

  8. 2、性质 1)设为常数,则; 2)设分别为常数矩阵,则

  9. 5 方差

  10. 协方差矩阵

  11. 定义:设和分别为维和维随机向量,则其协方差矩阵为定义:设和分别为维和维随机向量,则其协方差矩阵为 若令

  12. 三、相关系数矩阵 若(x1,x2,…,xp)’和(y1,y2,…,yp)分别是p和q维随机向量,则其相关系数矩阵为

  13. 三、多元正态分布 1 多元正态分布定义 2 多元正态分布的定义及基本性质 3 多元正态分布参数估计

  14. 1 多元正态分布定义 若随机向量的分布密度函数为 其中 为对称正定矩阵, 则称服从p维正态分布。其数学期望与协方差矩阵 分别为 特例1(一元正态分布) 则

  15. 特例2 (二元正态分布) 设 则

  16. 是对角阵,则 1) 若 相互独立 练习: 设 其中 问与是否独立? 2 多元正态分布的定义及基本性质 与是否独立?

  17. 2) 若 为常数阵,d为常数向量,则 正态随机向量的线性函数还是正态的 3) 若 则 2 多元正态分布的定义及基本性质

  18. 练习:设3维随机向量 试求的分布

  19. 3) 若 则 2 多元正态分布的定义及基本性质 思考题:设随机向量 与独立?且 问 服从什么分布?

  20. 3 多元正态分布参数估计 样本 多元样本数据 为一元样本 多元分析的任务∶根据样本数据来分析各变量之间的关系,推断总体的性质。

  21. 样本平均值 样本平均值是n个 点的重心

  22. 例题: • 计算均值、离差阵、协方差和相关阵

  23. 样本离差(平方乘积和)矩阵S • 计算离差阵

  24. 样本协差阵 (样本协方差) (样本方差)

  25. 样本相关矩阵R ----样本相关系数 R为非负定矩阵

  26. 二组样本的协方差矩阵

  27. 总体均值和协方差矩阵的最大似然估计 设 用最大似然法求出的均值和协方差的估计量分别为

  28. 基本性质 1) 是总体均值的无偏估计 2) 是总体协方差的无偏估计 分别是总体均值和协差阵的有效估计 和 3) 和 是总体均值和协差阵的一致估计估计 4) 和

  29. 10. 定理设 和 S 分别是正态总体 样本均值和离差阵,则 1) 2) 3) 和 S 相互独立

  30. 四、多元统计中常用的分布 1 Wishart分布 2 T2分布 3 Wilks分布 在一元统计中,常用的分布有卡方分布、t分布和F分布。在多元统计中,他们分别发展为Wishart分布、T2分布和Wilks分布。

  31. 1 分布和Wishart分布 定义1 设为相互独立且同服从于分布的随机变量。则 所服从的分布叫做分布, 为自由度且记为。

  32. 定理2. 由(1)式定义的随机变量的分布密度函数为

  33. 定理3. 设, 且与相互独立,则 推论2 设是抽自正态总体的简单随机样本,则统计量

  34. Wishart分布 它是多元样本离差平方和矩阵的分布 定义1 设为相互独立且同服从于分布,令 则 (1) 所服从的分布叫做自由度为的p维维希特分布,记作

  35. 显然,当p=1 时,有 Wishart分布像卡方分布一样具有加法性质,若 相互独立,则

  36. 2 分布与分布 设,且与相互独立,则称随机变量 服从自由度为的分布, 记为。 将T平方,即

  37. 在多元统计中分布是一元统计中t分布的推广 定义:若, S与X相互独立、称随机变量 是自由度为(p,n)的分布 可以转化为F分布 Hotelling

  38. 3、分布与Wilks分布 定义3 设,,且与相互独立,则称随机变量 服从自由度为的分布, 记为。 F—分布事实上为从正态总体随机抽取的两个样本方差的比,在方差分析和回归分析中广泛使用

  39. 描述的变异程度的统计参数称为广义方差,其定义有很多描述的变异程度的统计参数称为广义方差,其定义有很多 如 F—统计量的推广是统计量 定义:若 相互独立,则称随机变量 的分布是自由度为(p,n1,n2)的分布

  40. 小结 • 随机向量 • 分布函数和密度函数 • 均值向量和协方差矩阵 • 特殊分布

More Related