340 likes | 421 Views
3.1 回归分析的基本思想及其初步应用(二). 高二数学 选修 2-3 第三章 统计案例. 复习回顾. ( 3 )代入公式. ^. ( 4 )写出直线方程为 y=bx+a, 即为所求的回归直线方程。. 一、求回归直线方程的步骤:. y=bx+a+e ,. 1 、线性回归模型: y=bx+a+e , (3) 其中 a 和 b 为模型的未知参数, e 称为随机误差 。. E(e)=0,D(e)= (4). 二、回归分析. 2 、 (1) 随机误差 ( 2 )残差. 3 、 残差平方和 它代表了随机误差的效应。.
E N D
3.1回归分析的基本思想及其初步应用(二) 高二数学 选修2-3第三章 统计案例
(3)代入公式 ^ (4)写出直线方程为y=bx+a,即为所求的回归直线方程。 一、求回归直线方程的步骤:
y=bx+a+e, 1、线性回归模型: y=bx+a+e,(3) 其中a和b为模型的未知参数,e称为随机误差。 E(e)=0,D(e)=(4) 二、回归分析
2、 (1)随机误差 (2)残差 3、残差平方和 它代表了随机误差的效应。
2、残差平方和 残差平方和越小模拟效果越好
我们可以用相关指数R2来刻画回归的效果,其计算公式是我们可以用相关指数R2来刻画回归的效果,其计算公式是
解释 预报 1
温度xoC 21 23 25 27 29 32 35 产卵数y/个 7 11 21 24 66 115 325 案例2一只红铃虫的产卵数y和温度x有关。现收集了7组观测数据列于表中: (1)试建立产卵数y与温度x之间的回归方程;并预测温度为28oC时产卵数目。 (2)你所建立的模型中温度在多大程度上解释了产卵数的变化?
解:选取气温为解释变量x,产卵数 为预报变量y。 选变量 350 300 250 200 150 100 50 0 0 3 6 9 12 15 18 21 24 27 30 33 36 39 估计参数 由计算器得:线性回归方程为y=19.87x-463.73 相关指数R2=r2≈0.8642=0.7464 分析和预测 当x=28时,y =19.87×28-463.73≈ 93 探索新知 一元线性模型 方案1 画散点图 选 模 型 假设线性回归方程为 :ŷ=bx+a 当x=28时,y =19.87×28-463.73≈ 93 所以,一次函数模型中温度解释了74.64%的产卵数变化。
奇怪? 93>66 ? 模型不好?
问题1 问题2 选用y=bx2+a ,还是y=bx2+cx+a ? 如何求a、b ? 产卵数 y=bx2+a 变换 y=bt+a 非线性关系 线性关系 气温 合作探究 二次函数模型 方案2 问题3 t=x2
温度 21 23 25 27 29 32 35 温度的平方t 441 529 625 729 841 1024 1225 产卵数y/个 7 11 21 24 66 115 325 t 方案2解答 平方变换:令t=x2,产卵数y和温度x之间二次函数模型y=bx2+a就转化为产卵数y和温度的平方t之间线性回归模型y=bt+a 作散点图,并由计算器得:y和t之间的线性回归方程为y=0.367t-202.54,相关指数R2=r2≈0.8962=0.802 将t=x2代入线性回归方程得: y=0.367x2 -202.54 当x=28时,y=0.367×282-202.54≈85,且R2=0.802, 所以,二次函数模型中温度解 释了80.2%的产卵数变化。
变换 y=bx+a 非线性关系 线性关系 问题1 如何选取指数函数的底? 问题2 指数函数模型 合作探究 方案3 产卵数 气温 对数
温度xoC 21 23 25 27 29 32 35 z=lgy 0.85 1.04 1.32 1.38 1.82 2.06 2.51 对数变换:在 中两边取常用对数得 产卵数y/个 7 11 21 24 66 115 325 令 ,则 就转换为z=bx+a z 由计算器得:z关于x的线性回归方程 为z=0.118x-1.665 , 相关指数R2=r2≈0.99252=0.985 x 方案3解答 当x=28oC 时,y ≈44 ,指数回归模型中温度解释了98.5%的产卵数的变化
产卵数 产卵数 气温 气温 最好的模型是哪个? 线性模型 指数函数模型 二次函数模型
比一比 最好的模型是哪个?
用身高预报体重时,需要注意下列问题: 1、回归方程只适用于我们所研究的样本的总体; 2、我们所建立的回归方程一般都有时间性; 3、样本采集的范围会影响回归方程的适用范围; 4、不能期望回归方程得到的预报值就是预报变量的精确值。 事实上,它是预报变量的可能取值的平均值。 小结 ——这些问题也使用于其他问题。 涉及到统计的一些思想: 模型适用的总体; 模型的时间性; 样本的取值范围对模型的影响; 模型预报结果的正确理解。
从一组样本数据出发,确定变量之间的数学关系式从一组样本数据出发,确定变量之间的数学关系式 对这些关系式的可信程度进行各种统计检验,并从影响某一特定变量的诸多变量中找出哪些变量的影响显著,哪些不显著 利用所求的关系式,根据一个或几个变量的取值来预测或控制另一个特定变量的取值,并给出这种预测或控制的精确程度 什么是回归分析?(内容)
相关分析中,变量 x变量 y 处于平等的地位;回归分析中,变量 y 称为因变量,处在被解释的地位,x 称为自变量,用于预测因变量的变化 相关分析中所涉及的变量 x 和 y 都是随机变量;回归分析中,因变量 y 是随机变量,自变量 x可以是随机变量,也可以是非随机的确定变量 相关分析主要是描述两个变量之间线性关系的密切程度;回归分析不仅可以揭示变量 x 对变量 y 的影响大小,还可以由回归方程进行预测和控制 回归分析与相关分析的区别