480 likes | 688 Views
应用数理统计. 武汉理工大学统计学系 唐湘晋. 赵选民等 , 《 数理统计 》 , 科学出版社 , 2002 茆诗松等 , 《 概率论与数理统计教程 》 , 高等教育出版社 , 2004 中山大学数学系 , 《 概率论与数理统计 》 , 高等教育出版社 , 2001 吴翊等 , 《 应用数理统计 》 , 国防科技大学出版社 , 1995. 参 考 书 目. 数理统计与概率论是两个有密切联系的学科, 它们都以随机现象的统计规律为研究对象。. 但在研究问题的方法上有很大区别:. 概率论 —— 已知随机变量服从某分布 , 寻求分布的性质、数字特征、及其应用;.
E N D
应用数理统计 武汉理工大学统计学系唐湘晋
赵选民等,《数理统计》,科学出版社,2002茆诗松等,《概率论与数理统计教程》,高等教育出版社,2004中山大学数学系,《概率论与数理统计》,高等教育出版社,2001吴翊等,《应用数理统计》,国防科技大学出版社,1995赵选民等,《数理统计》,科学出版社,2002茆诗松等,《概率论与数理统计教程》,高等教育出版社,2004中山大学数学系,《概率论与数理统计》,高等教育出版社,2001吴翊等,《应用数理统计》,国防科技大学出版社,1995 参 考 书 目
数理统计与概率论是两个有密切联系的学科,它们都以随机现象的统计规律为研究对象。 但在研究问题的方法上有很大区别: 概率论 —— 已知随机变量服从某分布,寻求分布的性质、数字特征、及其应用; 数理统计——通过对实验数据的统计分析, 寻找所服从的分布和数字特征, 从而推断整体的规律性。 数理统计的核心问题——由样本推断总体
统计学从方法上讲有两大类:描述性统计方法和数理统计方法(即抽样统计方法).统计学从方法上讲有两大类:描述性统计方法和数理统计方法(即抽样统计方法). • 描述性统计方法: 全部资料 • 数理统计方法: 部分资料 抽样统计方法
数理统计学是数学的一个分支,它研究怎样用有效的方法去收集、整理、分析带随机影响的数据,并在此基础上对所讨论的问题给出统计性的估计和推断。数理统计学是数学的一个分支,它研究怎样用有效的方法去收集、整理、分析带随机影响的数据,并在此基础上对所讨论的问题给出统计性的估计和推断。 数理统计学的内容:概括为两大类 用有效的方法去收集数据。 抽样理论和试验设计 有效地使用数据。中心内容—统计推断 它包括参数估计,假设检验,回归分析,方差分析,多元统计分析等等。
有效性的含义 上述有效性有两个含义: • 可以建立一个在数学上便于处理的模型来描述所得的数据, • 数据中要包含尽可能多的与所研究的问题有关的信息。
关于统计推断 • 由于统计推断中使用的仅仅是部分数据,且带有随机性,故所得结论只能做到尽可能而非绝对的精确可靠,而结论的正确性程度显然可以用概率来度量,因此概率论是数理统计的基础。 • 统计方法的具体使用并不需要很高深的数学知识,但不具备较多较深的数学知识,这些方法的理论依据就说不清楚。本课主要介绍数理统计方法,也给出一些必要的数学推导,但不追求其严密性和完整性。
数理统计方法的应用 几乎在人类活动的一切领域中都能够不同程度地发现数理统计方法的应用。 • 实验数据的处理离不开数理统计方法; • 在工农业生产中,最佳生产工艺的安排,最佳配方的确定,优良品种的对比试验,产品质量的控制管理,产品验收方案的制定,电子元器件寿命的计算等都要用到数理统计方法。
在医药卫生领域,流行病的研究、新药的药效试验以及某种疾病的发病率与其它因素的关系的研究都是数理统计方法的用武之地。在医药卫生领域,流行病的研究、新药的药效试验以及某种疾病的发病率与其它因素的关系的研究都是数理统计方法的用武之地。 • 在生物遗传学、气象预报、地震研究、地质探矿等方面的研究中,数理统计方法是必备工具之一。 • 数理统计方法在社会科学方面的应用也愈来愈广泛,教育学,人口学,社会保险业,各种社会问题的抽样调查,市场预测,民意测验等都有数理统计方法涉足。 总之,只要安排试验和处理数据,就可以用数理统计方法。
数理统计学发展简史 • 统计学的起源:统计学起源于古代,早在公元前3050年的古埃及就为建造金字塔进行过全国国力统计。到了16世纪,西欧各国政府对收集公民有关资料发生兴趣。Statistics(统计学)源于State. • 数理统计的正式诞生。在数学家建立了概率论后,才奠定了数理统计发展的理论基础。一般认为,它诞生于19世纪后期。
19世纪后期到20世纪四十年代。在这时期,英国人高尔顿、皮尔逊、费歇等作了大量开创性工作。尤其,费歇于1922年的一篇论文是数理统计学建立过程的一个里程碑,该文主要观点至今仍基本有效。到了四十年代,数理统计学已发展成为一个成熟的数学分支,它的重要标志是瑞典统计学家H.Cramer于1949年的著作《Mathematical Methods of Statistics》
二战后。这时期的一个突出特点是计算机的发明和使用。它使人们能够处理大量的数据及其运算,把数理统计的研究引入到宏观世界和微观世界,又出现了一些新的分支。二战后。这时期的一个突出特点是计算机的发明和使用。它使人们能够处理大量的数据及其运算,把数理统计的研究引入到宏观世界和微观世界,又出现了一些新的分支。 最后,特别提一下我国的许宝禄教授在极限理论、马氏过程、多元分析、正交设计、过程设计和判别函数等许多方面都有突出的贡献,他的许多研究成果都达到了世界先进水平。
第一章 基础知识 经典的数理统计是以概率统计为基础的,概率论与数理统计的关系极为密切,为以后学习的方便,这里对概率论做一个简单的回顾。 • 1、 概率论的回顾 • 2、 数理统计简介
§1、概率论的回顾 • 确定性现象和不确定性现象、随机现象 • 概率论:研究和揭示随机现象的统计规律性的一个数学分支 • 随机事件的定义、运算及运算律 • 古典概型、几何概型、统计概型的定义及性质 • 概率的公理化定义 • 条件概率,乘法公式,全概率公式,贝叶斯公式(逆概率公式、后验公式),独立性
随机变量、分布函数及其性质 • 随机变量函数的分布 • 多维随机变量及其分布 • 随机变量的数字特征:期望、方差、协方差、相关系数及其性质
条件数学期望 • 定义 设 X是一个r.v.,且EX存在. 则记 称E(X|Y=y)为已知Y=y时X的条件期望. • 定义 设g(y)= E(X|Y=y),随机变量g(Y)就可记作E(X|Y), 且称为已知Y时X的条件数学期望。
条件数学期望的性质 • 如果 X 和 Y 独立,且EX存在,则 E(X|Y)=EX • E(h(Y)|Y)=h(Y) • E(q(X,Y)|Y=y)=E(q(X,y)|Y=y) • E(E(X|Y))=E(X) 重期望定理
§2、随机变量的特征函数 • 定义称随机变量eitX的数学期望(t)=EeitX为X的特征函数。 • 随机变量的特征函数(t)是实变量t的复值函数,总是存在的,且与随机变量一一对应。 • 当X为连续型时, • 当X为离散型时,
§4 随机矩阵 一、数学期望 1、定义 是有随机变量构成的随机矩阵,定义X的数学期望为
特别当时 ,便可得到随机向量 的数学期望为 2、性质 1)设a为常数,则 ; 2)设 分别为常数矩阵,则 3)设 为n个同阶矩阵,则
二、协方差矩阵 1、定义:设 和 分别为p维和q维随机向量,则其协方差矩阵为
2、性质 1)若 和 相互独立。则
若 的分量相互独立, 则协方差矩阵,除主对角线上的元素外均为零,即
2)随机向量X的协方差矩阵是非负定矩阵。 证:设a为任意与X有相同维数的常数向量,则 3)设A是常数矩阵,b为常数向量,则
4) 若 和 分别是p和q维随机向量,A和B为常数矩阵,则 证明 5) 若 是p个不全为零的常数, 是相互独立的p维随机向量,则
三、相关系数矩阵 若 和 分别是p和q维随机向量,则其相关系数矩阵为
§5 随机向量的变换 一、一元随机变量的变换 设X具有概率密度函数fx(x),函数y=(x)严格单调,其反函数x=(y)有连续导数,则Y=(X)的概率密度函数为 其中y的取值范围与x的取值范围相对应。
例 设随机变量X服从均匀分布U(0,1),即密度函数 y的取值范围为(0,),则
二、多元随机向量的变换 若 有密度函数 , 有函数组 其逆变换存在 则 的概率密度函数为
其中 特别:若 ,其中 为 阶可逆常数矩阵, 为 维常数向量,则
§6、常见分布族 • 分布族 • 分布族 • 多元正态分布族 • 指数分布族
这里 是含参变量的广义积分。 一、分布族 若连续型r.v X具有概率密度 则称 X 服从参数为 的 分布,记作 其中 均为正常数,分别称为形状参数和尺度参数。
函数具有以下性质: (1) (2) (3) 对自然数n, • 分布在水文统计、最大风速或最大风压的概率计算中经常要用到.
不少常见的重要分布是分布的特殊情形. • 当 时, 分布即是参数为的指数分布; • 当 时, 分布则是统计学中十分重要的 分布,其概率密度为
性质1设 X~(, ),则 ,它的数学 期望与方差分别为: E(X)= /, D(X)= / 2. 性质2设 X~(, ), 则它的特征函数为: 性质3设 Xi~(i, ), i=1,2,…,n,且 Xi相互独立,则 X1+X2+…+Xn ~(1+2+…+ n ,)
二、分布族 定义若连续型 r.v X具有概率密度 则称 X 服从参数为 的 分布,记作 其中 均为正常数。
性质1设X~Be(a, b),则 它的数学期望与方差分别为: E(X)= a /(a+b), D(X)=ab/[(a+a)2(a+b+1)]. 性质2设 且相互独立,则 (提示:作变量变换 ,求出(U,V)的联合 密度函数。)
二维正态随机变量的性质 设 则 (1) , (2) 服从正态分布, (3) X与Y不相关 (4) X与Y独立
多元正态分布族 定义 如果p维随机向量 (随机变量) (联合)概率密度函数为 其中 则称随机向量X为p维正态随机向量, 称为均值向量, V为协方差矩阵(协差阵),且
多元正态分布的性质 (1) p维正态分布由其均值向量和协方差阵唯一确定,且特征函数为: (2)对于任一p维向量 及p阶非负定矩阵V,必存在p维正态随机向量 (3) 设 ,A是 常数矩阵,b是m维向量,若令Y=AX+b,则
(4) X为p维正态随机向量的充要条件为对任一p维向量c, 是一维正态随机变量。 (5) 设 为多维正态随机向量,则X1与X2互不相关的充要条件是X1与X2相互独立。 (6) 若 ,且 ,则
(7)n个独立的p元正态随机向量的和仍服从p元正态分布,即若 相互独立,且 则 (8) 设 ,则存在 矩阵 使得 其中 。