1 / 24

第十二章 曲线回归

第十二章 曲线回归. 第一节 曲线的类型与特点. 第二节 曲线方程的配置. 第三节 多项式回归. 本章主要内容有: ①确定两个变数间数量变化的某种特定的规则或规律; ②估计表示该种曲线关系特点的一些重要参数,如回归参数、极大值、极小值和渐近值等; ③利用曲线方程进行 X 观察值范围内的预测,或在论据充足时进行 X 观察值范围外的预测。. a>0,b>0. a>0,b<0. 第一节 曲线的类型与特点. 一、指数函数曲线. 指数函数方程有两种形式 :.

makana
Download Presentation

第十二章 曲线回归

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 第十二章 曲线回归 第一节 曲线的类型与特点 第二节 曲线方程的配置 第三节 多项式回归 本章主要内容有: ①确定两个变数间数量变化的某种特定的规则或规律; ②估计表示该种曲线关系特点的一些重要参数,如回归参数、极大值、极小值和渐近值等; ③利用曲线方程进行X观察值范围内的预测,或在论据充足时进行X观察值范围外的预测。 《试验统计方法》

  2. a>0,b>0 a>0,b<0 第一节 曲线的类型与特点 一、指数函数曲线 指数函数方程有两种形式: 以上两式的χ都是作为指数出现的,因而称作指数函数。指数函数中的参数b一般用来描述增长或衰减的速度。以为例,如图所示,当a<0、b>0时,y随X的增大而增大(增长),曲线凹向上;当a>0、b<0时,y随X的增大而减小(衰减),曲线也是凹向上。 《试验统计方法》

  3. b>0 b<0 第一节 曲线的类型与特点 二、对数函数曲线 对数函数方程的一般表达方式为: 由于上式中x以自然对数的形式出现,故称对数函数。对数函数表示x变数的较大变化可引起y 变数的较小变化。由图可见,当b>0时,y随x的增大而增大,曲线凸向上;当b<0时,y随x的增大而减小,曲线凹向上。根据对数函数的性质,x为大于0的正数。 《试验统计方法》

  4. a>0,b>1 a>0,b<0 a>0,0<b<1 第一节 曲线的类型与特点 三、幂函数曲线 幂函数曲线指y是x某次幂的 函数曲线,其方程为: 左上图是幂函数曲线的图像。当a>0、b<1时,y随x的增大而增大,曲线凹向上;当a>0、0b<1时,y也随x的增大而增大,但变化较缓,曲线凸向上;a>0、b<0时,y随x的增大而减小,曲线凹向上,且以χ轴和y轴为渐近线 。 《试验统计方法》

  5. a>0,b>0 a>0,b<0 第一节 曲线的类型与特点 四、双曲函数曲线 双曲函数因其属于变形双曲线而得名,其曲线方程一般有以下3种形式 : 以上 为例,该曲线方程通过原点(0,0),当a>0、b>0时,y随x的增大而增大,但速率趋小,曲线凸向上,并向y=1/b渐近; a>0、b<0时,y随x的增大而增大,速率趋大,并向χ=-a/b渐近, 《试验统计方法》

  6. k 第一节 曲线的类型与特点 五、S型曲线 S型曲线主要用于描述动、植物的自然生长过程,故又称生长曲线,生长过程的基本特点是开始增长较慢,而在以后的某一范围内迅速增长,达到一定的限度后增长又缓慢下来,曲线呈拉长的“S”,故称S型曲线。 最著名的S曲线是Logistic生长曲线,Logistic曲线方程为: 式中a、b和k为>0的参数。当x=0时,,当x→∞,。所以时间为0的起始量为,时间为无限延长的终极量为k ,曲线在时有一拐点,这时,恰好最终极量k的一半。在拐点左侧,曲线凹向上,表示速率由小趋大,在拐点右侧,曲线凸向上,速率由大趋小,见图。 《试验统计方法》

  7. 第二节 曲线方程的配置 曲线方程配置是指对两个变数资料进行曲线回归分析,获得一个显著的曲线方程。 又称曲线配合或曲线拟合。 一、直线化法曲线回归分析的一般程序 1.根据变数X与Y之间的确切关系,选择适当和曲线类型 ; 确定曲线类型是曲线回归分析的关键。除了应有专业知识的支撑外,统计上常采用图示法和直线化法辅助选择。 图示法是将试验数据按自然尺度绘出散点图,然后按照散点趋势画出反映它们之间变化规律的曲线,并与已知的各种曲线方程相比较,找出与之最为相似的曲线图型,作为选定的曲线类型。 直线化法是在散点图的基础上选出一种曲线类型,对该曲线方程进行尺度转换使之直线化,再将原数据进行相同的尺度转换,用转换后的数据绘出新的散点图。若此散点图具有直线趋势。即表明选取的曲线类型是恰当的。 《试验统计方法》

  8. 第二节 曲线方程的配置 几种常用曲线回归方程的尺度转换方法见下表 : 《试验统计方法》

  9. 第二节 曲线方程的配置 2.对选定的曲线类型,在线性化后按最小二乘法原理配置直线回归方程,并作显著性测验 。 经过上表的尺度转换后可得到新的变数y`和x`,应用第九章直线相关的方法可求得两新变数间的线性相关数。若此不显著,则分析结束,表明所选曲线方程不适合;若显著,则表明所选曲线方程在统计上是恰当的,可继续求解回归计数,获得直线回归方程。 《试验统计方法》

  10. 第二节 曲线方程的配置 3.将直线回归方程转换成相应的曲线方程,并对有关统计参数作出推断 。 获得显著的直线回归方程后,可直接反转换成相应的曲线回归方程,并根据曲线方程的特性进一步估计有关参数,包括回归参数、极小值、极大值、渐近值和拐点等。必要时,也可利用曲线方程进行x 观察范围内的预测,或在论据充足时进行x观察范围外的预测。 《试验统计方法》

  11. 第二节 曲线方程的配置 在应用上述程序配置曲线方程时,应注意以下3点: (1)若同一资料用两种或两种以上不同类型的曲线方程配置,结果均为显著,则需选择其中最佳的曲线方程。判别的统计标准是不同曲线方程下离回归平方和的大小,最小者当选。为方便起见,也可根据直线化后的绝对值大小直接确定。 (2)若按上表的转换仍无法找出显著的直线化方程,可考虑采用多项式逼近,见本章第三节。 (3)本书介绍的曲线回归分析系经变换后的线性化方法,实践证明这是非常有效的方法。但也有一些方程无法进行直线化转换,此时可直接采用最小二乘法拟合,且一般预期可比线化方法获得更好的拟合度。但由于直接拟合方法较为复杂,本书未作介绍。 《试验统计方法》

  12. 第二节 曲线方程的配置 二、指数曲线方程的配置 指数曲线方程 两边取自然对数,即有 : 令 获得直线回归方程 : 若与x的线性相关系数 显著,就可进一步计算回归统计数: 《试验统计方法》

  13. 第二节 曲线方程的配置 三、幂函数曲线方程和配置 其尺度转换见表,具体步骤略。 四、Logistic 曲线方程的配置 为Logistic曲线方程,式中k为未知常数,进行线性化处理,必须首先确定k值。 根据k是生长过程中的终极量的特点,可由两种方法估计: ①如果y是累积频率,则显然k=100%; 《试验统计方法》

  14. 第二节 曲线方程的配置 ②如果y 是生长量或繁殖量,则可取3对自变数等距的观察值(x1,y1)(x2,y2)和(x3,y3)分别代入Logistic曲线方程后得到联立方程: 若 令,则可解得: 利用三点法求k时注意: 1、三个x点应是等差数列; 2、三个点的范围应尽可能大; 3、其中的一个点中应由最大的y值点。 《试验统计方法》

  15. 第二节 曲线方程的配置 有了k的估值后,可将Logistic曲线方程移项并取自然对数得: 因此,y和x对于Logistic方程的符合度可由y和χ的相关系数给出: 回归统计数a和b由下式估计: 《试验统计方法》

  16. 第三节 多项式回归 一、多项式回归方程 (一)多项式回归方程式 当两个变数间的曲线关系很难确定时,可以使用多项式去逼近,称为多项式回归。最简单的多项式是二次多项式,其方程为: 多项式方程的一般形式为: 这是一个具有k-1个弯曲(k-1个极值)和k-2个拐点的曲线。 《试验统计方法》

  17. 第三节 多项式回归 (二)多项式方程次数的初步确定 两个变数的n对观察值配置多项式方程时,最多可配到k=n-1次多项式,k越大,包含的统计数越多,计算和解释越复杂。一个多项式回归方程应取多少次为宜,可根据资料的散点图作出初步选择。散点所表现的曲线趋势的峰数+谷数+1。即为多项式回归方程的次数。若散点波动较大或峰谷两侧不对称,可再高一次。 《试验统计方法》

  18. 第三节 多项式回归 (三)多项式回归统计数的计算 一般仍采用类似于多元线性回归的方法求解多项式回归的统计数 若令 则该式可化为: 这是一般的多元线性回归方程,。可采用矩阵方法求解。 获得相应的多项式回归统计数 : 《试验统计方法》

  19. 第三节 多项式回归 (四)多项式回归方程的估计标准误 多项式回归分析中,y变数的总平方和SSy,亦可分解为回归和离回归两部分: 上式中,Uk为k次多项式的回归平方和,即Y变数总变异中能为X的k次多项式所说明的部分:QK为k次多项式的离回归平方和。其中: k次多项式的离回归标准误可定义为: 《试验统计方法》

  20. 第三节 多项式回归 二、多项式回归的假设测验 多项式回归的假设测验包括三项内容: ① 总的多项式回归关系是否成立? ② 能否以k-1次多项式代替k次多项式,即是否有必要配到k次式? ③ 在一个k次多项式中,X的一次分量项、二次分量项、……、k-1次分量项能否被略去(相应的自由度和平方和并入误差) ? 《试验统计方法》

  21. 第三节 多项式回归 (一)多项式回归关系的假设测验 Y变数的总平方和SSy分解成多项式回归(Uk)和离回归(Qk)两部分。前者由X的各次分量项的不同所引起,其有v=k;后者与X的不同无关,具有v=n-(k+1)。因此,由F值: 可测验多项式回归关系的真实性。 《试验统计方法》

  22. 第三节 多项式回归 同多元相关系数相类似,k次多项式的回归平方和占Y总平方和的比率的平方根值(记作 )称相关指数。 和线性相关时的情况 一样 表示k次多项的决定系数,即在Y的总变异中,可由X的k次多项式说明的部分所占的比率。 《试验统计方法》

  23. 第三节 多项式回归 (二)k次多项式必要性的假设测验 F测验是一个综合性的测验,它的显著并不能排除多项式方程中个别乃至若干分量不显著的可能性。如果一个k次多项式中的k次项并不显著,我们就可以繁为简,由(k-1)次方程描述Y与X的曲线关系。 K次多项式的回归平方和是Uk,其v=k;k-1次多项式的回归平方和是Uk-1,具v=k-1。从回归误差的角度看,有必要测验多项式增加一次所用去的1个自由度,对于离回归平方和的减少(或回归平方和的增加)是否“合算”。因此由: 可测验k次多项式的适合性。 《试验统计方法》

  24. 第三节 多项式回归 (三)各次分量项的假设测验 当证实需要一个k次多项式时,仍有必要了解k次式中的其它各次分量项是否显著。与多元线性回归中偏回归关系的假设测验相类似,各次分量项的测验亦需先计算偏回归平方和 : 其具有v=1,故由: 可测验i次分量是否显著。 《试验统计方法》

More Related