1 / 75

# 第十一章 . 簡單直線迴歸與簡單相關 Simple Linear Regression and Simple Correlation - PowerPoint PPT Presentation

I am the owner, or an agent authorized to act on behalf of the owner, of the copyrighted work described.

## PowerPoint Slideshow about '第十一章 . 簡單直線迴歸與簡單相關 Simple Linear Regression and Simple Correlation' - melvin-hansen

Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author.While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server.

- - - - - - - - - - - - - - - - - - - - - - - - - - E N D - - - - - - - - - - - - - - - - - - - - - - - - - -
Presentation Transcript

### 第十一章. 簡單直線迴歸與簡單相關Simple Linear Regression and Simple Correlation

＊迴歸分析的意義

• 簡單直線迴歸分析(simple regression analysis): 利用一個變數來預測(或解釋)另一個變數，並找出兩個變數間的關係模式。
• 如氮肥施用量與稻穀產量的關係、氣溫高低與飲料銷售量的關係、雨量與小麥產量的關係、成人年齡與血液中膽固醇含量的關係等。
• 主要是探討變數間的相關性(relationship)。

• 例1：氮肥用量與水稻穀收量表(公斤)
• 例3：年雨量與小麥產量

• 水稻穀產量(y)與氮肥用量(x)可以用直線關係描述

yi=β0+βxi，i=1, …,6(=n)

y i：依變數(Dependent variable)

x i：獨立(自)變數(Independent variable)

β0：截距(Intercept) x=0時y的值

β：斜率(Slope) x變動一個單位y變動的量

εi：誤差(Error)或殘差(Residual)

y

β0

0

The Simple Linear Regression Model (Here β1 > 0)

An observed value of y when x equals x0

Straight line defined by the equation

μy∣x=β0+β1x

Error term

Mean value of y when x equals x0

Slope = β1

One-unit change in x

y-intercept

x

x0= A specific value of the independent variable x

• 獨立性(Independent)
• 常態性(Normality)
• 直線關係(Linearity)
• 相同變方(homogeneity of Variance)

--------------------------------------------------------------------------------------------------------------------------- ---------

--------------------------------------------------------------------------------------------------------------------------------------

yi

e5

e4

e6

e3

e1

e2

xi

• 所需統計值

### 說明: b=5.65表示年齡增加一歲膽固醇增加5.65單位

σ2之估算

SSE之自由度為n-2

11.4迴歸系數與截距假設檢定(1)t值檢定法(a) 斜率(迴歸系數)是否有意義
• H0：β=0 V.S. Ha：β≠0
• 顯著水準α
• 檢定統計值(Test statistic)
• 決策方法 若｜tβ｜>tα/2,n-2 拒絕H0
• β之(1-α) ％信賴區間
(b)截距t值檢定
• H0：β0=0 V.S. Ha：β0≠0
• 顯著水準α
• 檢定統計值(Test statistic)
• 決策方法 若｜tβ0｜>tα/2,n-2 拒絕H0
• β0之(1-α) ％信賴區間

• 斜率H0：β=0 V.S. Ha：β≠0 α＝0.05

｜tβ｜＝13.95 > t0.025,4＝4.604，拒絕H0

• β之95 ％信賴區間

• 截距H0：β0=0 V.S. Ha：β0≠0 α＝0.05

｜tβ0｜＝4.1095 > t0.025,4＝2.776,接受Ha

• β0之95 ％信賴區間

• 斜率H0：β=0 V.S. Ha：β≠0 α＝0.05

｜tβ｜＝6.7419 > t0.025,10＝2.228，拒絕H0

• β之95 ％信賴區間

• 截距H0：β0=0 V.S. Ha：β0≠0 α＝0.05

｜tβ0｜＝1.2756 < t0.025,10＝2.228

Y

X

(2) 回歸分析變方分析法

SST=SSR+SSE

Syy=bSxy+(Syy-bSxy)

• SST = Syy = 2183.50
• SSR = b Sxy=(22.1143) ×(96.75)

=2139.56

• SSE = SST - SSR

=2183.50-2139.56

=43.94

• SST = Syy = 54001.7825
• SSR = b Sxy=(5.65025) ×(7558.15)

=42705.4370

• SSE = SST - SSR

=51000.7825-42705.4370

=9395.3455

• R2 = 決定係數

=可由獨立變數解釋之變異

= SSR / SST

0 < R2 < 1

• 當只有一個獨立變數時

R2 = (簡單相關係數)２=r2 (見11.11節)

Y

X

F = 420705.4370 / 939.53455

= 45.4530 ， F0.05,10=4.9646 拒絕H0

F = 45.4530 = (6.7419)2=(tβ)2

R2 = SSR / SST

=42705.4370 / 52100.7825

=0.8197

=(0.9054)2

11.5迴歸直線推測值 及信賴區間估算
• 其 之估算變方及信賴區間公式如下

• 氮肥為1.75時,稻穀收量分佈平均值的估算值
• 95％信賴區間

• 年齡為55歲之膽固醇分佈平均值的估算值
• 95％信賴區間

• 其 之估算變方及信賴區間公式如下

• 氮肥為2.6時,稻穀收量分佈新估算值
• 95％信賴區間

• 年齡為70歲之膽固醇的觀測值
• 95％信賴區間

• 獨立變數下的依變數必須有重複

H0：符合直線假定

v.s.

Ha：不符合直線假定

• 顯定水準：α
• 決策方法：

FLF=MSLF / MSPE > Fα，k-2，n-k拒絕H0

FLF = 1.0240 < F0.05，4，17 = 2.9647, 無法拒絕 ,符合直線性

F= 6228.7096 / 18.6205

= 334.5082 > F0.05，1，21 = 4.32478

• 同質變方(Homogeneity of Variance)
• 殘差圖
• 殘差v.s.獨立變數
• 殘差v.s.預測值 殘差v.s.時間

Residual

Residual

Residuals fan out

Residuals fannel in

(a) Increasing error variance

(b) Decreasing error variance

Residual

Residuals from a horizontal band

(c) Constant error variance

11.11簡單相關(simple correction) --探討兩個變數之間的關係
• 問題：

 資料型態( xi , yi )

• 假定(Assumption)
• 每對資料均為獨立
• 常態分布
• 相同變方
• X與Y的關係為直線

y

μy

μy

μy

μχ

μχ

μχ

(c) ρ= 0 無相關

(a) ρ> 0 正相關

(b) ρ< 0 負相關

• 負相關：落在第Ⅰ及Ⅲ象限的點數 < 落在第Ⅱ及Ⅳ象限的點數
• 無相關：落在第Ⅰ及Ⅲ象限的點數 = 落在第Ⅱ及Ⅳ象限的點數

• 乘積和：
• X平方和：
• Y平方和：

，r 之範圍：-1 ≦ r ≦1

r = 1

r = -1

y

y

x

x

(a)完全正相關

(b)完全負相關

0 < r < 1

-1 < r < 0

y

y

x

x

(a)不完全正相關

(b)不完全負相關

r = 0

r = 0

y

y

x

x

(a)無相關

(b)曲線關系

11.14簡單相關係數顯著性檢定

H0：ρ= 0 v.s. Ha：ρ≠ 0

• 例3：年雨量與小麥產量