160 likes | 339 Views
第七章 相关分析. 第一节 相关分析的作用与种类. 一 、相关分析的概念及与函数关系的区别 (一)相关关系:两个现象数值变化不完全确定的随机关系,是一种不完全确定的依存关系。 相关分析:是研究两个或两个以上变量之间相关程度大小以及用一定函数表达现象相关关系的方法。 (二)相关关系与函数关系的区别 函数关系:变量之间是一种完全确定性的关系,并可用数学公式表示出来。
E N D
第一节 相关分析的作用与种类 一、相关分析的概念及与函数关系的区别 (一)相关关系:两个现象数值变化不完全确定的随机关系,是一种不完全确定的依存关系。 相关分析:是研究两个或两个以上变量之间相关程度大小以及用一定函数表达现象相关关系的方法。 (二)相关关系与函数关系的区别 函数关系:变量之间是一种完全确定性的关系,并可用数学公式表示出来。 相关关系:变量间不是完全确定的关系,且不能用数学公式准确表示出来。 二、相关分析的作用 1、确定现象之间有无关系。 2、确定相关关系表现形式。 3、确定相关关系的密切程度和方向。
三、相关关系的种类 (一)按相关关系的程度:不相关、完全相关、不完全相关。 (二)按相关关系方向:正相关、负相关。 (三)按相关形式:线性相关、非线性相关。 (四)按影响因素的多少:单相关、复相关。
相关分析的主要内容 一、确定相关关系的存在(相关关系呈现的形态和方向, 相关关系的密切程度) 二、确定相关关系的数学表达式 三、确定因变量估计值误差的程度
第二节 相关关系的判断 一、相关关系的判断 (一)一般判断(定性分析) (二)相关表 (三)相关图 二、相关系数 (一)相关系数的概念 是反映两个变量之间线性关系密切程度的指标,变动范围为 (二)相关系数的计算 (常用公式)
相关系数的性质 =1 1.当 ,x与y变量为完全相关 2.当 的数值愈大,愈接近1,表示x与y的相关程度愈高 当 的数值愈小,愈接近0,表示x与y的相关程度愈低 3.当 >0 表示x与y为正相关 0 表示x与y为负相关 < 当 4.当 =0 表示x与y完全没有关系
第三节 回归分析与一元线性回归 一、回归分析的概念与相关分析的区别 (一)回归分析的概念 就是对具有相关关系的两个或两个以上变量之间数量变化的一般关系进行测定,确定一个相应的数学表达式,以便从一个已知量来推测另一个未知量,为估算预测提供一个重要的方法。 (二)回归分析与相关分析的区别与联系 区别:1、相关分析研究的两个变量是对等关系,回归分析不是对等关系。 2、相关分析的两个变量都是随机变量,回归分析自变量是给定的,因变量是随机的。 。
3回归方程在进行预测估计时,只能给出自变量(x)的3回归方程在进行预测估计时,只能给出自变量(x)的 数值来估计因变量(y)的可能值。不能由y来推测x 联系:1、相关分析是回归分析的基础。 2、回归分析是相关分析的继续
二、一元线性回归模型 (一)一元线性回归模型的概念 根据成对的两种变量的数据,配合一个直线方程式,其一般形式: a+bx (二)配合最佳的回归直线模型的条件和方法 1、两变量间存在显著相关关系。 2、两变量间存在直线相关关系。 3、应用最小平方法原理配合一元线性回归模型。 满足: 得 =
若下一年X=4(百万元) 可预测工业总产值为: 对于分组资料:
[ 例7—3 ] 学习 时数(x) 学习 成绩(y) xy 4 16 40 160 16 1600 41.2 484 432.64 6 36 60 360 4 3600 51.6 4 108.16 7 49 50 350 1 2500 56.8 144 27.04 10 100 70 700 4 4900 72.4 64 108.16 13 169 90 1170 25 8100 88 784 676 合计40 370 310 2740 50 20700 -- 1480 1352 五位同学的《统计学》考试成绩 (1)建立学习成绩(y)倚学习时间(x)的直线回归方程
(2)计算学习时数与学习成绩之间的相关系数(要求列(2)计算学习时数与学习成绩之间的相关系数(要求列 表计算所需数据资料,写出公式和计算过程,结果保留 两位小数) 解 (1) (1)
(2) 学习时数x与成绩y之间是高度正相关
三、估计标准误 估计值与实际值之间有一定离差,其值的大小是判断回归方程代表性大小的一个统计分析指标。估计标准误就是反映实际值 与估计值 的平均变异程度的指标。 根据定义: 具体计算应用下式: 估计标准误与相关系数的关系: