1 / 48

概率论与数理统计 第 20 讲

概率论与数理统计 第 20 讲. 本文件可从网址 http://math.shekou.com 上下载. 样本分布. 总体. 总体是指的一个随机变量 X . 关于这个随机变量的一些知识 , 我们不知道 , 因此希望通过一系列的试验来获得 . 这就是数理统计的任务. 样本 样本 是指的与总体 X 的分布完全一样的 n 个相互独立的一组随机变量 X 1 , X 2 ,..., X n , 其中 n 称为 样本容量 而对样本做一次观察得到的具体的试验数据 , 称作 样本值 , 用小写字母 x 1 , x 2 ,..., x n 表示. 例如.

naoko
Download Presentation

概率论与数理统计 第 20 讲

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 概率论与数理统计第20讲 本文件可从网址 http://math.shekou.com 上下载

  2. 样本分布

  3. 总体 • 总体是指的一个随机变量X. • 关于这个随机变量的一些知识, 我们不知道, 因此希望通过一系列的试验来获得. 这就是数理统计的任务.

  4. 样本 • 样本是指的与总体X的分布完全一样的n个相互独立的一组随机变量X1,X2,...,Xn, 其中n称为样本容量 • 而对样本做一次观察得到的具体的试验数据, 称作样本值, 用小写字母x1,x2,...,xn表示.

  5. 例如 • 假设总体X~N(m,s2), • 设有10个样本X1, X2, …, X10相互独立, • Xi~N(m,s2), i=1,2,...,10.

  6. 对这10个样本X1, X2, …, X10进行一次试验(当然是由10次试验拼成的一次试验), 得到10个实数为 • 10.5, 11.23, 8.4, 9.94, 13.22, 5.08, 7.62, 12.33, • 10.02, 9.97 • 这10个实数就叫做样本值.

  7. 因此样本值是实数, 而样本则是随机变量. • 样本值是对样本的观察结果.

  8. 数理统计的任务 • 在概率论的各个题目中, 随机变量的分布往往是知道的, 是通过某些已知的信息计算另一些信息.

  9. 而在实际中, 经常是有一个我们关心的总体X, 我们即不知道它的分布, 也不知道它的数学期望和方差. 但是, 我们可以对其进行反复地试验, 则试验n次, 得到n个样本值, 这n个样本值可以看作是对n个与总体分布相同的样本进行观察而获得的.

  10. 例如, • 有一个我们对之一无所知的随机变量X, 我们对其进行100次试验得到了100个观察值如下: • 10.5, 11.23, 8.4, 9.94, 13.22, 5.08, 7.62, 12.33, 10.02, 9.97 • 13.1, 14.02, 11.4, 10.88, 6.2, 11.9, 10.33, 5.01, 12.02, 13.1 • 5.5, 7.23, 12.4, 9.23, 10.15, 7.77, 9.34, 10.3, 12.73, 12.00 • 12.6, 11.23, 8.4, 9.94, 13.22, 5.08, 7.62, 12.33, 10.02, 9.97 • 13.1, 14.02, 11.4, 10.88, 6.2, 11.9, 10.33, 5.01, 12.02, 13.1 • 10.02, 7.53, 12.4, 9.23, 10.15, 7.77, 9.34, 10.3, 12.73, 12.00 • 10.5, 21.23, 8.4, 9.94, 13.22, 5.08, 7.55, 12.33, 10.02, 9.97 • 13.1, 14.02, 11.4, 10.88, 6.2, 11.9, 10.33, 5.01, 12.02, 13.1 • 7.5, 7.43, 12.4, 9.23, 11.45, 7.66, 9.34, 10.3, 12.73, 12.00 • 12.5, 11.2, 10.4, 9.94, 13.22, 5.08, 7.62, 12.33, 10.02, 9.97

  11. 当然, 实际得到的数据可能更多, • 有时候为了获得对总体的较深的认识, 需要几千个甚至几万个样本值.

  12. 数理统计的问题是, 怎样在获得了这些试验数据之后, 能够对总体X的某些信息获得一些估计?获得一些知识?

  13. 这又分为两类, 一类是对总体的分布进行一些统计. • 而另一类则是对总体的一些特征值, 经常是数学期望和方差进行一些统计.

  14. 对分布进行统计通常就是用的直方图进行统计, 下面是用excel工具进行统计的直方图

  15. 而本课则更侧重于假设已知总体X为正态分布的情况下, 对它的两个参数, 期望和方差的估计进行讨论. 这种情况叫做正态总体.

  16. 定义 样本(X1,X2,...,Xn)的函数f(X1,X2,...,Xn)称为统计量, 其中f(X1,X2,...,Xn)不含参数.

  17. 对于正态总体, 统计量通常是用来估计总体的期望和方差, 因此有两个用来估计期望和方差的统计量必须记住.

  18. 定理 设X1,X2,...,Xn相互独立, Xi~N(mi, si), i=1,2,...,n, 则它们的线性函数

  19. 另类证法 • 按中心极限定理, 大量的任何分布的随机变量之和趋近于正态分布. 或者说任何正态分布的随机变量可被认为是大量的随机变量的和, 则任何正态分布的各个随机变量之和相当于更多的随机变量的和, 当然也只能服从正态分布.

  20. 否则的话, 如果正态分布的随机变量之和不是正态分布, 必导致中心极限定理不成立.

  21. 推论 设(X1,X2,...,Xn)是取自正态总体N(m,s2)的样本, 则有

  22. 定理 设X1,X2,...,Xn相互独立, Xi~N(0, 1), i=1,2,...,n, 则 即n个相互独立的标准正态分布的随机变量的平方和服从n个自由度的c2(n)分布

  23. 定理 设X1,X2,...,Xn相互独立, Xi~N(0, 1), i=1,2,...,n, 则

  24. 证明这个定理需要较深的线性代数的知识

  25. 推论 设(X1,X2,...,Xn)是取自正态总体N(m,s2)的样本, 则有

  26. 证 因为Xi~N(m,s2)

  27. 此定理的用处在于

  28. 定理 设两个随机变量X与Y相互独立, 并且X~N(0,1), Y~c2(n), 则

  29. 推论1 设(X1,X2,...,Xn)是取自正态总体N(m,s2)的样本,

  30. 此推论的意义在于

  31. 推论2 设X1,X2,...,Xn和Y1,Y2,...,Ym分别来自两个相互独立的正态总体N(m1,s2)和N(m2,s2), 则

  32. 定理 设两个随机变量X1和X2相互独立, 且X1~c2(n1),X2~c2(n2), 则有

  33. 推论 设设X1,X2,...,Xn和Y1,Y2,...,Ym分别来自两个相互独立的正态总体

  34. Excel软件的几个常用的统计函数 • everage(数据) • 计算样本均值,字符不计在内 • everagea(数据) • 同样是计算样本均值,但字符单元算作0

  35. var和vara计算样本方差 • varp和varpa也是计算样本方差,但除以n • stdev和stdeva计算样本标准差 • stdevp和stdevpa同样计算样本标准差,但也是由varp开方得来.

  36. 关于分布的函数 • normsdist(x) 标准正态分布函数F0(x) • normsinv(x) 标准正态分布函数的反函数

  37. normdist(x,m,s,c) • 返回均值为m,标准差为s的正态分布函数值或者正态概率密度函数值(如果c为true则返回分布函数, 否则返回概率密度函数值) • norminv(x,m,s) • 返回均值为m,标准差为s的正态分布函数的反函数值.

  38. chidist(x,n) 返回自由度为n的c2分布在x点处的单尾概率, 即概率P(c2>x) • chiinv(p,n) 返回自由度为n的c2分布的单尾概率函数的逆函数.

  39. tdist(x,n,tails) 返回自由度为n的t分布在x点处的单尾或者双尾概率, 如果tails为1, 返回单尾概率, 否则返回双尾概率. • tinv(p,n) 返回自由度为n的t分布的双尾概率分布函数的反函数.

  40. fdist(x,n1,n2) 返回第一个自由度为n1,第二个自由度为n2的F分布的分布函数fdist(x,n1,n2) 返回第一个自由度为n1,第二个自由度为n2的F分布的分布函数 • finv(p,n1,n2) 返回第一个自由度为n1,第二个自由度为n2的F分布的分布函数的反函数.

  41. 作业 第104页开始, 习题5-2第1,2,3,7题学号不小于2003021561的学生交作业

More Related