1 / 45

第七章 非线性回归

第七章 非线性回归. 两个变数间呈现曲线关系的回归称曲线回归 ( curvilinear regression ) 或称非线性回归 ( non-liner regression ). 第一节 非线性关系的类型与特点. 一、非线性关系的类型与特点. 根据非线性关系的性质和特点可大致分为 6 类:指数形式关系、对数形式关系、幂形式关系、双曲形式关系、型形式关系和多项式形式关系。. ( 一 ) 指数关系曲线. 两种形式:. a >0,b>0. a >0,b<0. ( 二 ) 对数关系曲线. 方程为 :. b>0. b <0. ( 三 ) 幂关系曲线.

eilis
Download Presentation

第七章 非线性回归

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 第七章 非线性回归 两个变数间呈现曲线关系的回归称曲线回归(curvilinear regression)或称非线性回归(non-liner regression) 第一节 非线性关系的类型与特点 一、非线性关系的类型与特点 根据非线性关系的性质和特点可大致分为6类:指数形式关系、对数形式关系、幂形式关系、双曲形式关系、型形式关系和多项式形式关系。

  2. (一) 指数关系曲线 两种形式: a >0,b>0 a >0,b<0

  3. (二) 对数关系曲线 方程为: b>0 b <0

  4. (三) 幂关系曲线 方程为: a>0,b>1 a >0,b<0 a>0,0<b<1

  5. (四) 双曲关系曲线 a>0,b<0 a>0,b>0

  6. (五) S型曲线 最著名的曲线是Logistic生长曲线,它最早由比利时数学家P.F.Vehulst于1838年导出,但直至20世纪20年代才被生物学家及统计学家R.Pearl和L.J.Reed重新发现,并逐渐被人们所发现。目前它已广泛应用于多领域的模拟研究。

  7. 第二节 曲线方程的配置 配置曲线回归方程的三个步骤: 1、根据变数X与Y之间的确切关系,选择适当的曲线类型。 2、对选定的曲线类型,在线性化后按最小二乘法原理配置直线回归方程。 3、将直线回归方程转换成相应的曲线回归方程,并对有关统计参数作出推断。

  8. 一、指数曲线方程的配置 显著,则计算: 如果:

  9. 例如:在测定每升空气中污染物的毫克数(x,mg/L)和透光度(y)的关系,得结果见表。试为该资料配置指数曲线方程。例如:在测定每升空气中污染物的毫克数(x,mg/L)和透光度(y)的关系,得结果见表。试为该资料配置指数曲线方程。

  10. 此相关系数对于υ=16(n=18)是极显著的,故可计算得:此相关系数对于υ=16(n=18)是极显著的,故可计算得:

  11. 二、幂函数曲线方程的配置 当x、y都大于0时,

  12. 如果: 显著。

  13. 例如:研究30个粉尘颗粒的平均宽度(x,mm)和重量(y,mg)的关系,得表。试做回归分析。例如:研究30个粉尘颗粒的平均宽度(x,mm)和重量(y,mg)的关系,得表。试做回归分析。

  14. 可见,二者呈明显的对数关系。

  15. 此相关系数对于υ=16(n=18)是极显著的,故可计算得:此相关系数对于υ=16(n=18)是极显著的,故可计算得:

  16. 三、Logistic曲线方程的配置 为Logistic曲线方程,式中k为未知常数。必须首先确定k值。

  17. 若令 可得: 方程移项并取自然对数得: 若令 可得直线回归方程:

  18. 显著

  19. 例如:某股票上市后不同天数下的开盘价格(元)于下表7.8。试用Logistic方程描述股票价格与上市天数的关系。例如:某股票上市后不同天数下的开盘价格(元)于下表7.8。试用Logistic方程描述股票价格与上市天数的关系。

  20. 做散点图。可见二者呈明显的型曲线关系。

  21. 先估计终极量k,取开花后0天、12天和24天的结果代入,可得:先估计终极量k,取开花后0天、12天和24天的结果代入,可得: 获得k后,可令 并将 分别列于表中。 对y′和x进行线性回归分析,5个二级数据为:

  22. 相关系数为: 此相关系数对υ=7(n=9)为显著,所以表中资料以Logistic方程描述是合适的。进而可得:

  23. 第三节 多项式回归 (一)多项式回归方程式 当两个变数间的曲线关系很难确定时,可以适应多项式去逼近,称为多项式回归(polynomial regression)。 最简单的是二次多项式,其方程为:

  24. 它的图象是抛物线。当b2>0时,曲线凹向上,有一个极小值; b2 <0时,曲线凸向上,有一个极大值。

  25. 三次多项式的方程为: 它的图形具有两个弯曲(一个极大值和一个极小值)和一个拐点的曲线。当b3>0时,曲线由凸向上转为凹向上; b3 <0时,曲线由凹向上转为凸向上。

  26. 多项式方程的一般形式为: 是一个具有k-1个弯曲(k-1个极值)和k-2个拐点的曲线。 (二)多项式方程次数的初步确定 两个变数的n对观察值配置多项式方程时,最多可配到k=n-1次多项式。K越大,包含的统计数越多,计算和解释越复杂。一个多项式回归方程应取多少次为宜,可根据资料的散点图作出选择。散点所表现的曲线趋势的峰数+谷数+1

  27. (三)多项式回归统计数的计算 一般采用类似于多元线性回归的方法求解多项式回归的统计数 这是一般的多元线性回归方程。

  28. 例7.8,测定每亩施肥量(斤)和每亩产量(kg)的关系,得结果于下表。试建立多项式回归方程。

  29. 从散点图看。呈单峰趋势,没有明显的凹凸变化,故预期可用二次式配合。从散点图看。呈单峰趋势,没有明显的凹凸变化,故预期可用二次式配合。

  30. 至此即获得了二元线性回归方程:

  31. 二、多项式回归的假设检验 (一)多项式回归关系的假设检验

  32. (三)各次分量项的假设检验

More Related