1 / 38

第 14 章 相关分析与回归分析

第 14 章 相关分析与回归分析. 参考资源: http://218.192.12.13/kcpt/jkx.html. 第 14 章 相关分析与回归分析. 本章教学任务: 相关分析的数学指标--协方差、相关系数 使用 Excel 的数学分析工具进行回归分析的方法. 基本概念. 函数关系与相关关系 函数关系:指客观现象之间确实存在的,且在数量上表现为确定性的相互依存关系。 相关关系: 指客观现象之间确实存在的,但在数量上表现为不确定的相互依存关系。 区别与联系: 区别:相关关系数量不确定,函数关系数量是确定的;

Download Presentation

第 14 章 相关分析与回归分析

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 第14章相关分析与回归分析 参考资源: http://218.192.12.13/kcpt/jkx.html

  2. 第14章 相关分析与回归分析 • 本章教学任务: • 相关分析的数学指标--协方差、相关系数 • 使用Excel的数学分析工具进行回归分析的方法

  3. 基本概念 • 函数关系与相关关系 • 函数关系:指客观现象之间确实存在的,且在数量上表现为确定性的相互依存关系。 • 相关关系: 指客观现象之间确实存在的,但在数量上表现为不确定的相互依存关系。 • 区别与联系: • 区别:相关关系数量不确定,函数关系数量是确定的; • 联系:函数关系往往通过相关关系表现出来,相关关系的研究中常常使用函数关系的方式。

  4. 基本概念 • 相关关系的种类: • 按相关程度划分: • 完全相关: • 不完全相关: • 零相关:。 • 按相关的方向划分: • 正相关: • 负相关: • 按相关形式划分: • 线性相关: • 非线性相关: • 按变量多少划分: • 单相关: • 复(多)相关: • 偏相关。 • 按相关性质划分: • 真实相关: • 虚假相关:

  5. 基本概念 • 相关分析与回归分析 • 相关分析:用一个指标来表明现象间依存关系的密切程度。 • 回归分析:根据相关关系的具体形态,选择一个合适的数学模型,来近似地表达变量间的平均变化关系。 • 局限性:现象之间是否存在真实相关,必须由相关学科来确定,因此,相关与回归必须要在定性分析前提下进行,不能进行纯数量的计算。

  6. 基本概念 • 两者的联系: • 相关分析要依靠回归分析来表现现象数量相关的具体形式; • 回归分析必须依靠相关关系来表明变量之间的密切程度。 • 从广义上讲,回归分析就是相关分析,从狭义上讲,相关关系只需确定变量间的关系,而回归分析还要在此基础上找到数学模型。 • 两者的区别: • 相关分析不说明谁是自变量,谁是因变量,而回归分析必须首先要确定谁是自变量,谁是因变量,不能颠倒。 • 相关分析中的每一个变量都是随机的;回归分析中自变量是一般变量,因变量是随机变量。

  7. 相关分析 实践中进行相关分析要依次解决以下问题; • 确定现象之间有无相关关系以及相关关系的类型。 • 判定现象之间相关关系的密切程度, • 拟合回归方程, • 判断回归分析的可靠性 • 根据回归方程进行内插外推预测和控制。

  8. 协方差计算 • 设(X,Y)为二元随机变量,称数值 E{[X – E(X)][Y – E(Y)]}为随机变量X与Y的协方差,记作Cov(X ,Y),即:

  9. 协方差计算 • Excel当中提供了协方差计算函数COVAR(array1,array2)。 • 功能:返回协方差,利用协方差可以决定两个数据集之间的关系。 • 语法:COVAR(array1,array2) • 参数:array1是进行求协方差运算的第一个单元格区域,array2是进行求协方差运算的第二个单元格区域。 • 我们可以使用【数据分析】菜单或者直接使用COVAR函数计算协方差。

  10. 协方差计算 • 【例14-1】2006年十个大城市的人均可支配收入与商品房成交均价的数据,试计算其协方差。

  11. 协方差计算

  12. 相关系数计算 • 相关分析是用相关系数ρ来表示两个变量间相互的直线关系,并判断其密切程度的统计方法。

  13. 相关系数计算 • 相关系数的性质 • |ρ|≤ 1 • 如果ρ> 0,则称随机变量X与Y之间存在正的线性相关关系。 越接近于1,X与Y之间正的线性相关程度越强。 • 如果ρ= 1,则称随机变量X与Y之间存在正的线性函数关系; • 如果ρ= -1,则称随机变量X与Y之间存在负的线性相关关系; • 如果ρ= 0,则称随机变量X与Y之间不相关。

  14. 相关系数计算 • Excel当中提供了协方差计算函数CORREL(array1,array2) • 功能:返回单元格区域 array1 和 array2 之间的相关系数。使用相关系数可以确定两种属性之间的关系。 • 语法:CORREL(array1,array2) • 参数:array1是求相关系数运算的第一个单元格区域,array2是进行求求相关系数运算的第二个单元格区域。

  15. 协方差计算 • 【例14-2】2006年十个大城市的人均可支配收入与商品房成交均价的数据,试计算其相关系数。

  16. 协方差计算

  17. 相关系数计算 • 相关系数表明了两组数据之间的直线相关关系,我们借助Excel的图表功能来直观的反映其关系。

  18. 相关系数计算 • 执行菜单【插入】-【图表】命令,在【图表向导-4步骤之1-图表类型】中选择“XY散点图”,【子图表类型】选择第一个图表。 • 在【图表向导-4步骤之2-源数据】中,设置【数据区域】为“=Sheet1!$B$3:$C$12”,【系列产生在】为“列”。 • 在【图表向导-4步骤之3-图表选项】中,设置坐标轴的标题。 • 在【图表向导-4步骤之2-图表位置】中,选中“作为其中的对象插入”,在下拉列表中选择“Sheet1”。单击【完成】,插入图表。

  19. 回归分析 • 所谓回归分析法,是在掌握大量观察数据的基础上,利用数理统计方法建立因变量与自变量之间的回归关系函数表达式(称回归方程式)

  20. 回归分析 • 相关分析研究变量间相关的程度和相关的方向;而回归分析不仅可以反映变量间影响的大小,还可进一步利用回归方程进行预测和控制。 • 相关分析不必确定哪个变量为因变量,哪个变量为自变量,各变量的地位是平等的;而回归分析则必须事先研究确定变量中哪个变量为因变量,处于被解释的特殊地位。 • 尽管相关分析和回归分析都可以研究随机变量与随机变量、随机变量与非随机变量之间的关系,但在通常的回归分析中,总是假定自变量为非随机的固定变量。

  21. 一元线性回归分析 • 一元线性回归是最简单和基本的回归分析,主要是寻找并确定两个变量之间的的线性关系。

  22. 一元线性回归分析 • 【例14-3】已知某公司随机抽样的10个销售地广告费用与销售额的数据,推测销售额y和广告投放额x之间存在某种线性关系:y=ax+b,请根据数据求出一元线性回归方程,预测当广告投放50万元时的销售额。

  23. 一元线性回归分析 • 依次单击【工具】→【数据分析】菜单项(若【数据分析】菜单项没出现在【工具】菜单中,则需进行加载。有关加载操作请参见例11-2),弹出【数据分析】对话框。

  24. 一元线性回归分析 • 打开【工具】-【数据分析】菜单,出现【数据分析】对话框,在列表中选择【回归】。单击【确定】。在【回归】对话框中输入图中参数。

  25. 一元线性回归分析 从图中数据得出广告费x与销售额y的关系是: (B33与B34单元格数据),根据此关系算出的x=50时,y= 616.61。

  26. 多元线性回归分析 • 很多时候,我们研究的问题是受多个因素影响的,需要建立多元回归方程,进行多元回归分析,确定结果与多个变量之间的关系。

  27. 多元线性回归分析 • 【例14-4 】仍然是该公司随机抽样的10个销售地广告费用与销售额的数据,为了更加准确的判断广告投放效果,将广告费用细分为电视广告费和平面广告费,请根据此数据确定多元线性回归方程: y=β0+β1x1 +β2x2 其中y为销售额,x1为电视广告费,x2为平面广告费。

  28. 多元线性回归分析 • 打开【工具】-【数据分析】菜单,出现【数据分析】对话框,在列表中选择【回归】。单击【确定】。在【回归】对话框中输入图中参数。

  29. 多元线性回归分析 从图中数据得出广告费x与销售额y的关系是: (B31,B32,B30 ),从上式看出,电视广告费x1变动对y的影响要比平面广告费x2对y的影响显著,也就是说增加电视广告费可以更好地促进销售额的增长。

  30. 非线性回归 • 在许多实际问题中,回归函数往往是较复杂的非线性函数。主要有以下几种形式:

  31. 非线性回归 • 一般情况下,我们首先通过观察Excel生成的数据图表,大致判断变量之间的关系,然后将非线性方程转化成线性方程,再进行回归分析计算。需要指出的是,对于较复杂的系统,非线性回归分析需要应用多学科的综合知识,这里向大家介绍的是一个基本的,初步的方法。

  32. 非线性回归 • 一般情况下,我们首先通过观察Excel生成的数据图表,大致判断变量之间的关系,然后将非线性方程转化成线性方程,再进行回归分析计算。需要指出的是,对于较复杂的系统,非线性回归分析需要应用多学科的综合知识,这里向大家介绍的是一个基本的,初步的方法。

  33. 非线性回归 • 【例14-5】已知有某公司的日生产产量与日耗电量的数据,推测两者之间存在某种关系,试确定其回归方程。

  34. 非线性回归 • 从生成的图表看,数据与多项式类型的趋势线吻合较好。因此推测其回归方程为二次多项式模型: 其中x为坐标横轴,表示产量;y为坐标纵轴,表示耗电量。

  35. 非线性回归 • 在表中“产量”与“耗电量”之间加入一列“产量平方”,其值为产量的平方(因为Excel要求自变量必须相邻,因此“产量平方”必须与“产量”相邻)。这样,二次多项式转变成了二元线性

  36. 多元线性回归分析 • 打开【工具】-【数据分析】菜单,出现【数据分析】对话框,在列表中选择【回归】。单击【确定】。在【回归】对话框中输入图中参数。

  37. 非线性回归 计算数据得出耗电量y与产量x之间的回归方程是: (B31,B32,B33单元格数据)

  38. 非线性回归 • 其他类型的非线性回归都可以通过采用与本例类似的“图表观察-拟合趋势线-推断回归方程形式-转化成多元线性回归问题-使用【数据分析】工具-计算各项参数”的步骤完成。 • 另外,也可以在【添加趋势线】的步骤中,直接使用Excel来显示公式,具体操作在下一章——时间序列分析中的趋势预测法小节介绍。

More Related