第十三章
Download
1 / 61

????????? - PowerPoint PPT Presentation


  • 122 Views
  • Uploaded on

第十三章. 直线相关与直线回归. 119.6. 121.9. 125.1. 117.0. 115.4. 124.7. 120.1. 123.0. 122.8. 117.3. 120.6. 121.5. 125.0. 125.9. 123.2. 126.6. 122.0. 127.6. 125.1. 120.1. 119.5. 126.1. 126.4. 125.6. 118.9. 130.4. 124.9. 125.8. 126.1. 1. 20.9. 116.1. 124.0. 124.6. 118.7.

loader
I am the owner, or an agent authorized to act on behalf of the owner, of the copyrighted work described.
capcha
Download Presentation

PowerPoint Slideshow about '?????????' - gent


An Image/Link below is provided (as is) to download presentation

Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author.While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server.


- - - - - - - - - - - - - - - - - - - - - - - - - - E N D - - - - - - - - - - - - - - - - - - - - - - - - - -
Presentation Transcript
4870876

第十三章

直线相关与直线回归


4870876

119.6

121.9

125.1

117.0

115.4

124.7

120.1

123.0

122.8

117.3

120.6

121.5

125.0

125.9

123.2

126.6

122.0

127.6

125.1

120.1

119.5

126.1

126.4

125.6

118.9

130.4

124.9

125.8

126.1

1

20.9

116.1

124.0

124.6

118.7

119.1

121.9

118.0

117.0

114.6

123.9

116.0

125.3

123.6

123.6

126.4

115.5

119.2

114.0

123.4

126.6

117.3

113.6

127.6

120.5

113.6

130.2

128.3

118.2

124.7

122.4

118.8

123.1

122.7

126.6

127.8

125.9

110.5

124.8

115.2

119.4

128.0

116.7

132.4

129.3

121.7

115.0

120.4

122.1

127.0

135.3

125.7

111.2

124.3

124.2

124.7

121.7

121.3

124.1

119.9

121.7

113.8

116.7

129.9

128.5

126.5

122.8

120.1

118.2

122.5

127.7

124.9

123.3

120.3

125.7

某市1995年104名男童身高(cm)资料如下


4870876

1 不同饲料组大鼠肝中维生素A含量(IU/g)

大鼠对号

正常饲料组

维生素

E

缺乏组

1

2

3

1

3550

2450

2

2000

2400

3

3000

1

800

4

3950

3200

5

3800

3250

6

3750

2700

7

3450

2500

8

3050

1750

26550

20050

合计


2 sah il 6 pg ml

2 SAH患者血清和脑脊液IL-6(pg/ml)检测结果


Sah il 6

SAH患者血清和脑脊液IL-6散点图


Linear correlation

第一节 直线相关(linear correlation)

直线相关分析:描述两变量间是否有直线关系以及直线关系的方向和密切程度的分析方法

条件:两变量(x,y)都是来自正态分布的随机变量


4870876

负相关

正相关

-1< r <0

0< r <1

非线性相关r = 0

零相关r = 0

完全正相关

r =1

零相关r = 0

零相关r = 0

完全负相关

r = -1

直线相关示意图

一、直线相关的概念


4870876

二、相关系数的意义与计算

直线相关系数:又称积差相关系数,是说明具有直线关系的两个变量间,相关关系的密切程度与相关方向的指标。 r 


4870876

二、相关系数的意义与计算

范围:

大小:

符号:


4870876

13.1(P212) 在脑血管疾病的诊断治疗中,脑脊液白细胞介素-6(IL-6)水平是影响诊断与预后分析的一项重要指标,但脑脊液在临床上有时又不容易采集到。某医生欲了解急性脑血管病病人血清IL-6(pg/ml)与脑脊液IL-6 (pg/ml)水平,随机抽取了某医院确诊的10例蛛网膜下腔出血(SAH)患者24小时内血清IL-6和脑脊液IL-6数据如表2,问SAH患者血清IL-6和脑脊液IL-6间是否有直线相关关系存在?


4870876

直线相关分析步骤

2、计算:

lxx=6104.664

lyy=16242.101

lxy=7201.698

r=0.7232

1、绘制散点图:


4870876

三、相关系数的假设检验

1、tr检验

=n-2


13 1 sah il 6 il 6

13.1 SAH患者血清IL-6和脑脊液IL-6间相关系数的假设检验步骤:

H0 :=0 即SAH患者血清IL-6和脑脊液IL-6间无直线相关关系

H1 :≠0即SAH患者血清IL-6和脑脊液IL-6间有直线相关关系

=0.05


4870876

r=0.7232, n=10, 代入公式 计算得

t=…=2.962

根据=10-2=8查t界值表得0.01< P < 0.02,按=0.05的检验水准,拒绝H0,接受H1,可认为SAH患者血清IL-6和脑脊液IL-6间有直线相关关系


4870876

三、相关系数的假设检验

2、查表法

根据r值及=n-2查附表13-1(P222) 相关系数r界值表


4870876

相关分析应用中应注意的问题

1.相关分析一定要有实际意义

2.进行相关分析前要先绘制散点图

3.分析相关的密切程度时样本含量要足够大


4870876

第 二 节

直线回归

Linear Regression


4870876

编号

(1)

尿雌三醇

mg/24h(2

产儿体重

kg(3)

编号

(1)

尿雌三醇mg/24h(2)

产儿体重

kg(3)

1

7

2.5

17

17

3.2

2

9

2.5

18

25

3.2

3

9

2.5

19

27

3.4

4

12

2.7

20

15

3.4

5

14

2.7

21

15

3.4

6

16

2.7

22

15

3.5

7

16

2.4

23

16

3.5

8

14

3.0

24

19

3.4

9

16

3.0

25

18

3.5

10

16

3.1

26

17

3.6

11

17

3.0

27

18

3.7

12

19

3.1

28

20

3.8

13

21

3.0

29

22

4.0

14

24

2.8

30

25

3.9

15

15

3.2

31

24

4.3

16

16

3.2

表2 孕妇尿中雌三醇含量与产儿的体重


4870876

编号

体重

(

kg

)

肺活量

(

L

)

1

42

2.55

2

42

2.2

3

46

2.75

4

46

2.4

5

46

2.8

6

50

2.81

7

50

3.41

8

50

3.1

9

52

3.46

10

52

2.85

11

58

3.5

12

58

3

表3 12名一年级女大学生体重与肺活量


4870876

回归的由来

英国统计学家Pearson K(1857~1936)1903年搜集了1078个家庭人员的身高、前臂长等指标的记录,发现儿子身高(Y,英寸)与父亲身高(X,英寸)存在线形关系:

= 33.73+0.516 X


4870876

回归的由来

即高个子父亲儿子的平均身高虽然比矮个子父亲儿子的平均身高要高一些,但稍矮于其父亲的平均身高;而矮个子父亲儿子的平均身高虽然比高个子父亲儿子的平均身高要矮一些,但稍高于其父亲的平均身高。英国人类学家Galton F(1822~1911)将这种趋向于种族稳定的现象称之为“回归”。


4870876

在实际生活当中,由于其它因素的干扰,许多双变量之间的关系呈直线趋势,但并不是严格的直线关系,为了区别于两变量间的直线关系,我们称这种关系为在实际生活当中,由于其它因素的干扰,许多双变量之间的关系呈直线趋势,但并不是严格的直线关系,为了区别于两变量间的直线关系,我们称这种关系为直线回归。

直线回归仍用直线方程来描述两变量间的回归关系,但称为直线回归方程.

直线回归的概念


4870876

一、两变量的散点图在实际生活当中,由于其它因素的干扰,许多双变量之间的关系呈直线趋势,但并不是严格的直线关系,为了区别于两变量间的直线关系,我们称这种关系为


4870876

一、两变量的散点图在实际生活当中,由于其它因素的干扰,许多双变量之间的关系呈直线趋势,但并不是严格的直线关系,为了区别于两变量间的直线关系,我们称这种关系为


Sah il 61

SAH在实际生活当中,由于其它因素的干扰,许多双变量之间的关系呈直线趋势,但并不是严格的直线关系,为了区别于两变量间的直线关系,我们称这种关系为患者血清和脑脊液IL-6散点图


4870876

医学上,还有许多现象之间也都有类似的或强或弱的相互依存的关系,例如:身高与体重、体温与脉搏、年龄与血压、胰岛素与血糖水平、毒物剂量与动物的存活时间等等医学上,还有许多现象之间也都有类似的或强或弱的相互依存的关系,例如:身高与体重、体温与脉搏、年龄与血压、胰岛素与血糖水平、毒物剂量与动物的存活时间等等


4870876
二、直线回归方程医学上,还有许多现象之间也都有类似的或强或弱的相互依存的关系,例如:身高与体重、体温与脉搏、年龄与血压、胰岛素与血糖水平、毒物剂量与动物的存活时间等等

直线回归方程:

b:回归系数

b0:截距


4870876

y医学上,还有许多现象之间也都有类似的或强或弱的相互依存的关系,例如:身高与体重、体温与脉搏、年龄与血压、胰岛素与血糖水平、毒物剂量与动物的存活时间等等

x


4870876
回归系数与截距的计算医学上,还有许多现象之间也都有类似的或强或弱的相互依存的关系,例如:身高与体重、体温与脉搏、年龄与血压、胰岛素与血糖水平、毒物剂量与动物的存活时间等等


13 2 13 1

医学上,还有许多现象之间也都有类似的或强或弱的相互依存的关系,例如:身高与体重、体温与脉搏、年龄与血压、胰岛素与血糖水平、毒物剂量与动物的存活时间等等2 SAH患者血清和脑脊液IL-6(pg/ml)检测结果

例13.2 对例13.1进行回归分析


4870876

2医学上,还有许多现象之间也都有类似的或强或弱的相互依存的关系,例如:身高与体重、体温与脉搏、年龄与血压、胰岛素与血糖水平、毒物剂量与动物的存活时间等等、求回归系数b和截距b0:

1、绘制散点图:


X y l xx l yy l xy

计算医学上,还有许多现象之间也都有类似的或强或弱的相互依存的关系,例如:身高与体重、体温与脉搏、年龄与血压、胰岛素与血糖水平、毒物剂量与动物的存活时间等等x、y、lxx、lyy、lxy

x=59.26

y=142.87

lxx=6104.664

lyy=16242.101

lxy=7201.698


4870876

列出回归方程:医学上,还有许多现象之间也都有类似的或强或弱的相互依存的关系,例如:身高与体重、体温与脉搏、年龄与血压、胰岛素与血糖水平、毒物剂量与动物的存活时间等等


4870876

例:某地一年级医学上,还有许多现象之间也都有类似的或强或弱的相互依存的关系,例如:身高与体重、体温与脉搏、年龄与血压、胰岛素与血糖水平、毒物剂量与动物的存活时间等等12名女大学生的体重与肺活量数据如下,试分析肺活量与体重关系

表3 12名一年级女大学生体重与肺活量

编号

体重

(

kg

)

肺活量

(

L

)

1

42

2.55

2

42

2.2

3

46

2.75

4

46

2.4

5

46

2.8

6

50

2.81

7

50

3.41

8

50

3.1

9

52

3.46

10

52

2.85

11

58

3.5

12

58

3


4870876

2医学上,还有许多现象之间也都有类似的或强或弱的相互依存的关系,例如:身高与体重、体温与脉搏、年龄与血压、胰岛素与血糖水平、毒物剂量与动物的存活时间等等、求回归系数b和截距b0:

1、绘制散点图:


X y l xx l yy l xy1

计算医学上,还有许多现象之间也都有类似的或强或弱的相互依存的关系,例如:身高与体重、体温与脉搏、年龄与血压、胰岛素与血糖水平、毒物剂量与动物的存活时间等等x、y、lxx、lyy、lxy

x=49.33

y=2.9025

lxx=306.6667

lyy=1.8892

lxy=18.04


4870876

列出回归方程:医学上,还有许多现象之间也都有类似的或强或弱的相互依存的关系,例如:身高与体重、体温与脉搏、年龄与血压、胰岛素与血糖水平、毒物剂量与动物的存活时间等等


4870876

直线回归方程的图示医学上,还有许多现象之间也都有类似的或强或弱的相互依存的关系,例如:身高与体重、体温与脉搏、年龄与血压、胰岛素与血糖水平、毒物剂量与动物的存活时间等等

在自变量X的实测范围内任取相距较远且易读数的两X值代入回归方程求得两点坐标、连线即得其回归直线


4870876

(一)总体回归系数的估计与假设检验医学上,还有许多现象之间也都有类似的或强或弱的相互依存的关系,例如:身高与体重、体温与脉搏、年龄与血压、胰岛素与血糖水平、毒物剂量与动物的存活时间等等

1、总体回归系数的区间估计

bt/2,sb

三、直线回归的统计推断


4870876

方差分析医学上,还有许多现象之间也都有类似的或强或弱的相互依存的关系,例如:身高与体重、体温与脉搏、年龄与血压、胰岛素与血糖水平、毒物剂量与动物的存活时间等等

t检验

2、回归系数的假设检验


4870876

回归系数的假设检验:方差分析法医学上,还有许多现象之间也都有类似的或强或弱的相互依存的关系,例如:身高与体重、体温与脉搏、年龄与血压、胰岛素与血糖水平、毒物剂量与动物的存活时间等等

方差分析的基本思想:

把总的离均差平方和(即总变异)分解为至少两个部分,其中有一部分表示处理因素的效应,有一部分表示抽样误差的影响,然后比较两者的均方,计算F值,若F值远大于1,可认为处理有效应,否则认为处理无效应。


4870876

Q医学上,还有许多现象之间也都有类似的或强或弱的相互依存的关系,例如:身高与体重、体温与脉搏、年龄与血压、胰岛素与血糖水平、毒物剂量与动物的存活时间等等

Y

X

应变量Y的离均差平方和的分解


4870876

应变量医学上,还有许多现象之间也都有类似的或强或弱的相互依存的关系,例如:身高与体重、体温与脉搏、年龄与血压、胰岛素与血糖水平、毒物剂量与动物的存活时间等等Y的离均差平方和的分解

SS总 = SS回 + SS剩


4870876

回归系数的方差分析医学上,还有许多现象之间也都有类似的或强或弱的相互依存的关系,例如:身高与体重、体温与脉搏、年龄与血压、胰岛素与血糖水平、毒物剂量与动物的存活时间等等

SS总 = SS回 + SS剩

总= n – 1 回= 1 剩= n - 2

SS总 =lYY

SS回 =blXY =lXY2/lXX

SS剩= SS总-SS回= lYY -lXY2/lXY


13 3 13 2

医学上,还有许多现象之间也都有类似的或强或弱的相互依存的关系,例如:身高与体重、体温与脉搏、年龄与血压、胰岛素与血糖水平、毒物剂量与动物的存活时间等等13.3:对例13.2建立的回归方程的回归系数进行假设检验

  • H0:β=0

    H1:β≠0

    α=0.05

  • 计算统计量F,求得概率值P

  • 做出推断:


4870876
回归系数的假设检验:医学上,还有许多现象之间也都有类似的或强或弱的相互依存的关系,例如:身高与体重、体温与脉搏、年龄与血压、胰岛素与血糖水平、毒物剂量与动物的存活时间等等t检验法

 = n - 2

其中Sy.x表示去除X影响后Y的变异大小


4870876

(二)应变量条件均数的区间估计医学上,还有许多现象之间也都有类似的或强或弱的相互依存的关系,例如:身高与体重、体温与脉搏、年龄与血压、胰岛素与血糖水平、毒物剂量与动物的存活时间等等

:是总体中x取某定值时Y的条件均数


4870876
四、直线回归的应用医学上,还有许多现象之间也都有类似的或强或弱的相互依存的关系,例如:身高与体重、体温与脉搏、年龄与血压、胰岛素与血糖水平、毒物剂量与动物的存活时间等等

1、描述两变量之间的依存关系:

2、利用回归方程进行预测预报:

3、用容易测量的指标估计不容易测量的指标:

估计值的置信区间:

个体值的预测区间:

4、利用回归方程进行统计控制


4870876

应用直线回归的注意事项医学上,还有许多现象之间也都有类似的或强或弱的相互依存的关系,例如:身高与体重、体温与脉搏、年龄与血压、胰岛素与血糖水平、毒物剂量与动物的存活时间等等

(1)回归分析前应先作出散点图;

(2)做回归分析要有实际意义;

(3)应注意建立线性回归模型的基本假定

(4)两变量间有直线关系时不一定是因果关系

(5)应对回归系数作假设检验

(6)回归直线不宜外延。

(7)要注意离群值对回归效果的影响


4870876

直线相关与回归的区别与联系医学上,还有许多现象之间也都有类似的或强或弱的相互依存的关系,例如:身高与体重、体温与脉搏、年龄与血压、胰岛素与血糖水平、毒物剂量与动物的存活时间等等

区别:1. 相关说明相关关系,回归

说明依存关系;

2. r与b有区别;

3. 资料要求不同。


1 r b 2 r b 3 r 2

联系:医学上,还有许多现象之间也都有类似的或强或弱的相互依存的关系,例如:身高与体重、体温与脉搏、年龄与血压、胰岛素与血糖水平、毒物剂量与动物的存活时间等等1. r与b正负号一致;

2. r与b的假设检验等价;

3.可用回归解释相关。

决定系数:即相关系数的平方r2,是回归平方和与总的离均差平方和之比。

故回归平方和是引入相关变量后总平方和减少的部分。


4870876

SPSS医学上,还有许多现象之间也都有类似的或强或弱的相互依存的关系,例如:身高与体重、体温与脉搏、年龄与血压、胰岛素与血糖水平、毒物剂量与动物的存活时间等等的应用:

相关分析:

analyze→correlate

→bivariate correlations

→variables: x →ok

y


4870876

样本相关系数医学上,还有许多现象之间也都有类似的或强或弱的相互依存的关系,例如:身高与体重、体温与脉搏、年龄与血压、胰岛素与血糖水平、毒物剂量与动物的存活时间等等

SPSS的应用:

相关系数的假设检验P值


4870876

SPSS医学上,还有许多现象之间也都有类似的或强或弱的相互依存的关系,例如:身高与体重、体温与脉搏、年龄与血压、胰岛素与血糖水平、毒物剂量与动物的存活时间等等的应用:

回归分析:

analyze→regression

→linear regression

→ dependent: y →ok

Independent: x


4870876

SPSS医学上,还有许多现象之间也都有类似的或强或弱的相互依存的关系,例如:身高与体重、体温与脉搏、年龄与血压、胰岛素与血糖水平、毒物剂量与动物的存活时间等等的应用:

样本回归系数

回归系数假设检验的P值


4870876

SPSS医学上,还有许多现象之间也都有类似的或强或弱的相互依存的关系,例如:身高与体重、体温与脉搏、年龄与血压、胰岛素与血糖水平、毒物剂量与动物的存活时间等等的应用:

总体回归系数β的可信区间


4870876

作业:医学上,还有许多现象之间也都有类似的或强或弱的相互依存的关系,例如:身高与体重、体温与脉搏、年龄与血压、胰岛素与血糖水平、毒物剂量与动物的存活时间等等

P514 计算分析题 1.1


ad