1 / 117

第五章 统计数据关系的分析

第五章 统计数据关系的分析. §5.1 相关分析. 变量间的关系可以分为两类 : 函数关系和相关关系。. 相关关系是研究变量间的相关关系的。. 相关分析方法 : 提出统计指标来描述变量间的相关关系。. 相关的分类 : a. 有正相关和负相关之分。 正相关 : 变量的增减性一致 ; 负相关 : 变量的增减性相反。 b. 有直线相关和曲线相关之分。.

rocco
Download Presentation

第五章 统计数据关系的分析

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 第五章统计数据关系的分析

  2. §5.1相关分析

  3. 变量间的关系可以分为两类:函数关系和相关关系。变量间的关系可以分为两类:函数关系和相关关系。

  4. 相关关系是研究变量间的相关关系的。

  5. 相关分析方法:提出统计指标来描述变量间的相关关系。相关分析方法:提出统计指标来描述变量间的相关关系。

  6. 相关的分类:a.有正相关和负相关之分。正相关:变量的增减性一致;负相关:变量的增减性相反。b.有直线相关和曲线相关之分。相关的分类:a.有正相关和负相关之分。正相关:变量的增减性一致;负相关:变量的增减性相反。b.有直线相关和曲线相关之分。

  7. 例:从某大学男生中随机抽取10名,测得其身高,体重数值如下(米,公斤):(1.71,65),(1.63,63),(1.84,70),(1.90,75),(1.58,60),(1.60,55),(1.75,64),(1.78,69),(1.80,65),(1.64,58)考察体重与身高的关系.例:从某大学男生中随机抽取10名,测得其身高,体重数值如下(米,公斤):(1.71,65),(1.63,63),(1.84,70),(1.90,75),(1.58,60),(1.60,55),(1.75,64),(1.78,69),(1.80,65),(1.64,58)考察体重与身高的关系.

  8. 画散点图 : X-身高, Y-体重在坐标平面上描出点(Xi,Yi) , i=1,2…n

  9. 定义:设样本为(Xi,Yi)i=1,2, …,n称为X与Y的样本相关系数.

  10. 1. 为1时Y与X是完全的直线关系2. 为0时Y与X没有一点直线关系3. 接近1时Y与X的直线关系越强 4. 接近0时Y与X的直线关系越弱

  11. r的等级分类:1. 0<︱r︱≤0.3, 微弱相关;2. 0.3<︱r︱≤0.5, 低度相关;3.0.5<︱r︱≤0.8, 显著相关;4. ︱r︱>0.8 , 高度相关。

  12. §5.2 回归分析5.2.1一元线性回归分析

  13. 回归分析也是研究变量间的相关关系的。

  14. 回归分析方法:先提出一个模型把变量联系起来,然后把它加工成方程,此方程经检验有效后可用来预报。回归分析方法:先提出一个模型把变量联系起来,然后把它加工成方程,此方程经检验有效后可用来预报。

  15. 一.一元线性回归模型:Y=a+bX+其中Y为可观测随机变量,X为可观测非随机变量,为不可观测随机变量,a,b是常数。一.一元线性回归模型:Y=a+bX+其中Y为可观测随机变量,X为可观测非随机变量,为不可观测随机变量,a,b是常数。

  16. 任务是找a,b的估计代入后去除. =a+bX

  17. 二.参数a,b的估计

  18. Yi=a+bXi+i, ,i =1,2…n . Q(a,b)=使Q(a,b)达到最小的a,b的值称为a,b的最小二乘估计,这时称=a+bX 为一元线性回归方程,它的图象称为回归直线。

  19. 问题的解为:

  20. 对前例:

  21. 因此所求的一元线性回归方程为: = -21.06+49.6X

  22. 三.一元线性回归方程的有效性检验

  23. 记SSY=称为总偏差平方和 SSR= 称为回归平方和SSE= 称为误差平方和

  24. 定理:下面分解式成立SSY=SSR+SSE

  25. 1. 比值为1时Y与X是完全的直线关系2. 比值为0时Y与X没有一点直线关系3. 比值接近1时Y与X的直线关系越强 4. 比值接近0时Y与X的直线关系越弱

  26. 定理:

  27. 四.预测:设回归方程为: =a+bX经检验有效后可应用它进行预测.当X=x0时,Y0的预测值为:

  28. 5.2.2多元线性回归分析

  29. k元线性回归模型:Y=b0+b1X1+…bkXk+

  30. 样本为:(Yi,Xi1,Xi2, …,Xik) i=1,2, …,n

  31. Q(b0,b1, …,bn)=使Q(b0,b1, …,bn)达到最小的b0,b1, …,bn的值依次称为b0,b1, …,bn的最小二乘估计.

  32. 这时称=b0+b1X1+…bkXkk元线性回归方程.

  33. 记其中 是bi的最小二乘估计,i=0,1,2, …,k

  34. 最小二乘估计的表达式.

  35. 5.2.3可线性化模型的回归分析

  36. 1.一元曲线回归模型例:双曲线回归模型为:Y=a+b +

  37. 令 原模型可化为: Y=a+b +应用数据 i=1,2, …,n求得回归方程=a+b

  38. 由此可得双曲线回归方程: =a+b

  39. 2.多项式回归模型:Y=令则原模型化为k元线性回归模型:2.多项式回归模型:Y=令则原模型化为k元线性回归模型:

  40. 设样本为:(Xi,Yi), i=1,2, …,n由 可以得到X1,X2, …,Xk的取值,从而可求得b0,b1, …,bk的最小二乘估计.

  41. k元线性回归方程:=b0+b1X1+…bkXk等量代换得k阶多项式回归方程:k元线性回归方程:=b0+b1X1+…bkXk等量代换得k阶多项式回归方程:

  42. §5.3. 动态数列分析

  43. 概念回忆:按时间次序排列的数据序列.也称动态数列或时间数列.概念回忆:按时间次序排列的数据序列.也称动态数列或时间数列.

  44. 5.3.1动态数列的影响因素

  45. 一. 时间序列的构成要素 时间序列各项指标数值的不同,是由许多因素共同作用的结果。影响因素归纳起来大体有四类。

  46. 一、长期趋势(T)。指现象在一段较长的时间内发展水平持续的沿着一个方向,逐渐向上或向下变动或保持平稳的趋势。一、长期趋势(T)。指现象在一段较长的时间内发展水平持续的沿着一个方向,逐渐向上或向下变动或保持平稳的趋势。

  47. 例如粮食生产由于种植方法的不断改良、日益发达的农田水利等因素的影响,从较长时间来看,总趋势是持续增加,向上发展的.认识和掌握事物的长期趋势,可以把握事物发展变化的基本特点。例如粮食生产由于种植方法的不断改良、日益发达的农田水利等因素的影响,从较长时间来看,总趋势是持续增加,向上发展的.认识和掌握事物的长期趋势,可以把握事物发展变化的基本特点。

  48. 二、季节变动(S)。指现象受季节性因素影响而发生的变动。其变动的特点是,在一年或更短的时间内使现象呈周期性重复的变化。引起季节变动的原因既有自然因素,也有人为因素,如气候条件、节假日以及风俗习惯等等。认识和掌握季节变动,对管理部门作决策有重要的作用.二、季节变动(S)。指现象受季节性因素影响而发生的变动。其变动的特点是,在一年或更短的时间内使现象呈周期性重复的变化。引起季节变动的原因既有自然因素,也有人为因素,如气候条件、节假日以及风俗习惯等等。认识和掌握季节变动,对管理部门作决策有重要的作用.

  49. 三、循环变动(C)。指现象发生周期比较长的涨落起伏的变动.通常周期少则三年,一般在五年以上.三、循环变动(C)。指现象发生周期比较长的涨落起伏的变动.通常周期少则三年,一般在五年以上.

More Related