480 likes | 696 Views
概率论与数理统计 第 20 讲. 本文件可从网址 http://math.shekou.com 上下载. 样本分布. 总体. 总体是指的一个随机变量 X . 关于这个随机变量的一些知识 , 我们不知道 , 因此希望通过一系列的试验来获得 . 这就是数理统计的任务. 样本 样本 是指的与总体 X 的分布完全一样的 n 个相互独立的一组随机变量 X 1 , X 2 ,..., X n , 其中 n 称为 样本容量 而对样本做一次观察得到的具体的试验数据 , 称作 样本值 , 用小写字母 x 1 , x 2 ,..., x n 表示. 例如.
E N D
概率论与数理统计第20讲 本文件可从网址 http://math.shekou.com 上下载
总体 • 总体是指的一个随机变量X. • 关于这个随机变量的一些知识, 我们不知道, 因此希望通过一系列的试验来获得. 这就是数理统计的任务.
样本 • 样本是指的与总体X的分布完全一样的n个相互独立的一组随机变量X1,X2,...,Xn, 其中n称为样本容量 • 而对样本做一次观察得到的具体的试验数据, 称作样本值, 用小写字母x1,x2,...,xn表示.
例如 • 假设总体X~N(m,s2), • 设有10个样本X1, X2, …, X10相互独立, • Xi~N(m,s2), i=1,2,...,10.
对这10个样本X1, X2, …, X10进行一次试验(当然是由10次试验拼成的一次试验), 得到10个实数为 • 10.5, 11.23, 8.4, 9.94, 13.22, 5.08, 7.62, 12.33, • 10.02, 9.97 • 这10个实数就叫做样本值.
因此样本值是实数, 而样本则是随机变量. • 样本值是对样本的观察结果.
数理统计的任务 • 在概率论的各个题目中, 随机变量的分布往往是知道的, 是通过某些已知的信息计算另一些信息.
而在实际中, 经常是有一个我们关心的总体X, 我们即不知道它的分布, 也不知道它的数学期望和方差. 但是, 我们可以对其进行反复地试验, 则试验n次, 得到n个样本值, 这n个样本值可以看作是对n个与总体分布相同的样本进行观察而获得的.
例如, • 有一个我们对之一无所知的随机变量X, 我们对其进行100次试验得到了100个观察值如下: • 10.5, 11.23, 8.4, 9.94, 13.22, 5.08, 7.62, 12.33, 10.02, 9.97 • 13.1, 14.02, 11.4, 10.88, 6.2, 11.9, 10.33, 5.01, 12.02, 13.1 • 5.5, 7.23, 12.4, 9.23, 10.15, 7.77, 9.34, 10.3, 12.73, 12.00 • 12.6, 11.23, 8.4, 9.94, 13.22, 5.08, 7.62, 12.33, 10.02, 9.97 • 13.1, 14.02, 11.4, 10.88, 6.2, 11.9, 10.33, 5.01, 12.02, 13.1 • 10.02, 7.53, 12.4, 9.23, 10.15, 7.77, 9.34, 10.3, 12.73, 12.00 • 10.5, 21.23, 8.4, 9.94, 13.22, 5.08, 7.55, 12.33, 10.02, 9.97 • 13.1, 14.02, 11.4, 10.88, 6.2, 11.9, 10.33, 5.01, 12.02, 13.1 • 7.5, 7.43, 12.4, 9.23, 11.45, 7.66, 9.34, 10.3, 12.73, 12.00 • 12.5, 11.2, 10.4, 9.94, 13.22, 5.08, 7.62, 12.33, 10.02, 9.97
当然, 实际得到的数据可能更多, • 有时候为了获得对总体的较深的认识, 需要几千个甚至几万个样本值.
数理统计的问题是, 怎样在获得了这些试验数据之后, 能够对总体X的某些信息获得一些估计?获得一些知识?
这又分为两类, 一类是对总体的分布进行一些统计. • 而另一类则是对总体的一些特征值, 经常是数学期望和方差进行一些统计.
对分布进行统计通常就是用的直方图进行统计, 下面是用excel工具进行统计的直方图
而本课则更侧重于假设已知总体X为正态分布的情况下, 对它的两个参数, 期望和方差的估计进行讨论. 这种情况叫做正态总体.
定义 样本(X1,X2,...,Xn)的函数f(X1,X2,...,Xn)称为统计量, 其中f(X1,X2,...,Xn)不含参数.
对于正态总体, 统计量通常是用来估计总体的期望和方差, 因此有两个用来估计期望和方差的统计量必须记住.
定理 设X1,X2,...,Xn相互独立, Xi~N(mi, si), i=1,2,...,n, 则它们的线性函数
另类证法 • 按中心极限定理, 大量的任何分布的随机变量之和趋近于正态分布. 或者说任何正态分布的随机变量可被认为是大量的随机变量的和, 则任何正态分布的各个随机变量之和相当于更多的随机变量的和, 当然也只能服从正态分布.
否则的话, 如果正态分布的随机变量之和不是正态分布, 必导致中心极限定理不成立.
推论 设(X1,X2,...,Xn)是取自正态总体N(m,s2)的样本, 则有
定理 设X1,X2,...,Xn相互独立, Xi~N(0, 1), i=1,2,...,n, 则 即n个相互独立的标准正态分布的随机变量的平方和服从n个自由度的c2(n)分布
定理 设X1,X2,...,Xn相互独立, Xi~N(0, 1), i=1,2,...,n, 则
推论 设(X1,X2,...,Xn)是取自正态总体N(m,s2)的样本, 则有
定理 设两个随机变量X与Y相互独立, 并且X~N(0,1), Y~c2(n), 则
推论1 设(X1,X2,...,Xn)是取自正态总体N(m,s2)的样本,
推论2 设X1,X2,...,Xn和Y1,Y2,...,Ym分别来自两个相互独立的正态总体N(m1,s2)和N(m2,s2), 则
定理 设两个随机变量X1和X2相互独立, 且X1~c2(n1),X2~c2(n2), 则有
推论 设设X1,X2,...,Xn和Y1,Y2,...,Ym分别来自两个相互独立的正态总体
Excel软件的几个常用的统计函数 • everage(数据) • 计算样本均值,字符不计在内 • everagea(数据) • 同样是计算样本均值,但字符单元算作0
var和vara计算样本方差 • varp和varpa也是计算样本方差,但除以n • stdev和stdeva计算样本标准差 • stdevp和stdevpa同样计算样本标准差,但也是由varp开方得来.
关于分布的函数 • normsdist(x) 标准正态分布函数F0(x) • normsinv(x) 标准正态分布函数的反函数
normdist(x,m,s,c) • 返回均值为m,标准差为s的正态分布函数值或者正态概率密度函数值(如果c为true则返回分布函数, 否则返回概率密度函数值) • norminv(x,m,s) • 返回均值为m,标准差为s的正态分布函数的反函数值.
chidist(x,n) 返回自由度为n的c2分布在x点处的单尾概率, 即概率P(c2>x) • chiinv(p,n) 返回自由度为n的c2分布的单尾概率函数的逆函数.
tdist(x,n,tails) 返回自由度为n的t分布在x点处的单尾或者双尾概率, 如果tails为1, 返回单尾概率, 否则返回双尾概率. • tinv(p,n) 返回自由度为n的t分布的双尾概率分布函数的反函数.
fdist(x,n1,n2) 返回第一个自由度为n1,第二个自由度为n2的F分布的分布函数fdist(x,n1,n2) 返回第一个自由度为n1,第二个自由度为n2的F分布的分布函数 • finv(p,n1,n2) 返回第一个自由度为n1,第二个自由度为n2的F分布的分布函数的反函数.
作业 第104页开始, 习题5-2第1,2,3,7题学号不小于2003021561的学生交作业