380 likes | 508 Views
第 14 章 相关分析与回归分析. 参考资源: http://218.192.12.13/kcpt/jkx.html. 第 14 章 相关分析与回归分析. 本章教学任务: 相关分析的数学指标--协方差、相关系数 使用 Excel 的数学分析工具进行回归分析的方法. 基本概念. 函数关系与相关关系 函数关系:指客观现象之间确实存在的,且在数量上表现为确定性的相互依存关系。 相关关系: 指客观现象之间确实存在的,但在数量上表现为不确定的相互依存关系。 区别与联系: 区别:相关关系数量不确定,函数关系数量是确定的;
E N D
第14章相关分析与回归分析 参考资源: http://218.192.12.13/kcpt/jkx.html
第14章 相关分析与回归分析 • 本章教学任务: • 相关分析的数学指标--协方差、相关系数 • 使用Excel的数学分析工具进行回归分析的方法
基本概念 • 函数关系与相关关系 • 函数关系:指客观现象之间确实存在的,且在数量上表现为确定性的相互依存关系。 • 相关关系: 指客观现象之间确实存在的,但在数量上表现为不确定的相互依存关系。 • 区别与联系: • 区别:相关关系数量不确定,函数关系数量是确定的; • 联系:函数关系往往通过相关关系表现出来,相关关系的研究中常常使用函数关系的方式。
基本概念 • 相关关系的种类: • 按相关程度划分: • 完全相关: • 不完全相关: • 零相关:。 • 按相关的方向划分: • 正相关: • 负相关: • 按相关形式划分: • 线性相关: • 非线性相关: • 按变量多少划分: • 单相关: • 复(多)相关: • 偏相关。 • 按相关性质划分: • 真实相关: • 虚假相关:
基本概念 • 相关分析与回归分析 • 相关分析:用一个指标来表明现象间依存关系的密切程度。 • 回归分析:根据相关关系的具体形态,选择一个合适的数学模型,来近似地表达变量间的平均变化关系。 • 局限性:现象之间是否存在真实相关,必须由相关学科来确定,因此,相关与回归必须要在定性分析前提下进行,不能进行纯数量的计算。
基本概念 • 两者的联系: • 相关分析要依靠回归分析来表现现象数量相关的具体形式; • 回归分析必须依靠相关关系来表明变量之间的密切程度。 • 从广义上讲,回归分析就是相关分析,从狭义上讲,相关关系只需确定变量间的关系,而回归分析还要在此基础上找到数学模型。 • 两者的区别: • 相关分析不说明谁是自变量,谁是因变量,而回归分析必须首先要确定谁是自变量,谁是因变量,不能颠倒。 • 相关分析中的每一个变量都是随机的;回归分析中自变量是一般变量,因变量是随机变量。
相关分析 实践中进行相关分析要依次解决以下问题; • 确定现象之间有无相关关系以及相关关系的类型。 • 判定现象之间相关关系的密切程度, • 拟合回归方程, • 判断回归分析的可靠性 • 根据回归方程进行内插外推预测和控制。
协方差计算 • 设(X,Y)为二元随机变量,称数值 E{[X – E(X)][Y – E(Y)]}为随机变量X与Y的协方差,记作Cov(X ,Y),即:
协方差计算 • Excel当中提供了协方差计算函数COVAR(array1,array2)。 • 功能:返回协方差,利用协方差可以决定两个数据集之间的关系。 • 语法:COVAR(array1,array2) • 参数:array1是进行求协方差运算的第一个单元格区域,array2是进行求协方差运算的第二个单元格区域。 • 我们可以使用【数据分析】菜单或者直接使用COVAR函数计算协方差。
协方差计算 • 【例14-1】2006年十个大城市的人均可支配收入与商品房成交均价的数据,试计算其协方差。
相关系数计算 • 相关分析是用相关系数ρ来表示两个变量间相互的直线关系,并判断其密切程度的统计方法。
相关系数计算 • 相关系数的性质 • |ρ|≤ 1 • 如果ρ> 0,则称随机变量X与Y之间存在正的线性相关关系。 越接近于1,X与Y之间正的线性相关程度越强。 • 如果ρ= 1,则称随机变量X与Y之间存在正的线性函数关系; • 如果ρ= -1,则称随机变量X与Y之间存在负的线性相关关系; • 如果ρ= 0,则称随机变量X与Y之间不相关。
相关系数计算 • Excel当中提供了协方差计算函数CORREL(array1,array2) • 功能:返回单元格区域 array1 和 array2 之间的相关系数。使用相关系数可以确定两种属性之间的关系。 • 语法:CORREL(array1,array2) • 参数:array1是求相关系数运算的第一个单元格区域,array2是进行求求相关系数运算的第二个单元格区域。
协方差计算 • 【例14-2】2006年十个大城市的人均可支配收入与商品房成交均价的数据,试计算其相关系数。
相关系数计算 • 相关系数表明了两组数据之间的直线相关关系,我们借助Excel的图表功能来直观的反映其关系。
相关系数计算 • 执行菜单【插入】-【图表】命令,在【图表向导-4步骤之1-图表类型】中选择“XY散点图”,【子图表类型】选择第一个图表。 • 在【图表向导-4步骤之2-源数据】中,设置【数据区域】为“=Sheet1!$B$3:$C$12”,【系列产生在】为“列”。 • 在【图表向导-4步骤之3-图表选项】中,设置坐标轴的标题。 • 在【图表向导-4步骤之2-图表位置】中,选中“作为其中的对象插入”,在下拉列表中选择“Sheet1”。单击【完成】,插入图表。
回归分析 • 所谓回归分析法,是在掌握大量观察数据的基础上,利用数理统计方法建立因变量与自变量之间的回归关系函数表达式(称回归方程式)
回归分析 • 相关分析研究变量间相关的程度和相关的方向;而回归分析不仅可以反映变量间影响的大小,还可进一步利用回归方程进行预测和控制。 • 相关分析不必确定哪个变量为因变量,哪个变量为自变量,各变量的地位是平等的;而回归分析则必须事先研究确定变量中哪个变量为因变量,处于被解释的特殊地位。 • 尽管相关分析和回归分析都可以研究随机变量与随机变量、随机变量与非随机变量之间的关系,但在通常的回归分析中,总是假定自变量为非随机的固定变量。
一元线性回归分析 • 一元线性回归是最简单和基本的回归分析,主要是寻找并确定两个变量之间的的线性关系。
一元线性回归分析 • 【例14-3】已知某公司随机抽样的10个销售地广告费用与销售额的数据,推测销售额y和广告投放额x之间存在某种线性关系:y=ax+b,请根据数据求出一元线性回归方程,预测当广告投放50万元时的销售额。
一元线性回归分析 • 依次单击【工具】→【数据分析】菜单项(若【数据分析】菜单项没出现在【工具】菜单中,则需进行加载。有关加载操作请参见例11-2),弹出【数据分析】对话框。
一元线性回归分析 • 打开【工具】-【数据分析】菜单,出现【数据分析】对话框,在列表中选择【回归】。单击【确定】。在【回归】对话框中输入图中参数。
一元线性回归分析 从图中数据得出广告费x与销售额y的关系是: (B33与B34单元格数据),根据此关系算出的x=50时,y= 616.61。
多元线性回归分析 • 很多时候,我们研究的问题是受多个因素影响的,需要建立多元回归方程,进行多元回归分析,确定结果与多个变量之间的关系。
多元线性回归分析 • 【例14-4 】仍然是该公司随机抽样的10个销售地广告费用与销售额的数据,为了更加准确的判断广告投放效果,将广告费用细分为电视广告费和平面广告费,请根据此数据确定多元线性回归方程: y=β0+β1x1 +β2x2 其中y为销售额,x1为电视广告费,x2为平面广告费。
多元线性回归分析 • 打开【工具】-【数据分析】菜单,出现【数据分析】对话框,在列表中选择【回归】。单击【确定】。在【回归】对话框中输入图中参数。
多元线性回归分析 从图中数据得出广告费x与销售额y的关系是: (B31,B32,B30 ),从上式看出,电视广告费x1变动对y的影响要比平面广告费x2对y的影响显著,也就是说增加电视广告费可以更好地促进销售额的增长。
非线性回归 • 在许多实际问题中,回归函数往往是较复杂的非线性函数。主要有以下几种形式:
非线性回归 • 一般情况下,我们首先通过观察Excel生成的数据图表,大致判断变量之间的关系,然后将非线性方程转化成线性方程,再进行回归分析计算。需要指出的是,对于较复杂的系统,非线性回归分析需要应用多学科的综合知识,这里向大家介绍的是一个基本的,初步的方法。
非线性回归 • 一般情况下,我们首先通过观察Excel生成的数据图表,大致判断变量之间的关系,然后将非线性方程转化成线性方程,再进行回归分析计算。需要指出的是,对于较复杂的系统,非线性回归分析需要应用多学科的综合知识,这里向大家介绍的是一个基本的,初步的方法。
非线性回归 • 【例14-5】已知有某公司的日生产产量与日耗电量的数据,推测两者之间存在某种关系,试确定其回归方程。
非线性回归 • 从生成的图表看,数据与多项式类型的趋势线吻合较好。因此推测其回归方程为二次多项式模型: 其中x为坐标横轴,表示产量;y为坐标纵轴,表示耗电量。
非线性回归 • 在表中“产量”与“耗电量”之间加入一列“产量平方”,其值为产量的平方(因为Excel要求自变量必须相邻,因此“产量平方”必须与“产量”相邻)。这样,二次多项式转变成了二元线性
多元线性回归分析 • 打开【工具】-【数据分析】菜单,出现【数据分析】对话框,在列表中选择【回归】。单击【确定】。在【回归】对话框中输入图中参数。
非线性回归 计算数据得出耗电量y与产量x之间的回归方程是: (B31,B32,B33单元格数据)
非线性回归 • 其他类型的非线性回归都可以通过采用与本例类似的“图表观察-拟合趋势线-推断回归方程形式-转化成多元线性回归问题-使用【数据分析】工具-计算各项参数”的步骤完成。 • 另外,也可以在【添加趋势线】的步骤中,直接使用Excel来显示公式,具体操作在下一章——时间序列分析中的趋势预测法小节介绍。