CHAPTER 15 簡單線性迴歸及相關
500 likes | 904 Views
CHAPTER 15 簡單線性迴歸及相關. 基礎統計學 STATISTICS FOR MANAGEMENT AND ECONOMICS. 目錄. 15.1 導 論 15.2 建立迴歸模型 15.3 估計迴歸係數 15.4 迴歸模型的假設條件 15.5 評價迴歸模型 15.6 利用迴歸模型進行預測 15.7 公式彙整. 15.1 導 論. 應用 1 某兒童早餐穀片的產品經理想預測下年度穀片的需求量,為了採用迴歸分析,她和幕僚們列出了以下所有可能影響銷售量的變數: 1. 產品價格。 2. 5 到12歲兒童的總人口數 ( 目標市場 )。
CHAPTER 15 簡單線性迴歸及相關
E N D
Presentation Transcript
CHAPTER 15簡單線性迴歸及相關 基礎統計學 STATISTICS FOR MANAGEMENT AND ECONOMICS
目錄 15.1 導 論 15.2 建立迴歸模型 15.3 估計迴歸係數 15.4 迴歸模型的假設條件 15.5 評價迴歸模型 15.6 利用迴歸模型進行預測 15.7 公式彙整
15.1 導 論 • 應用1 某兒童早餐穀片的產品經理想預測下年度穀片的需求量,為了採用迴歸分析,她和幕僚們列出了以下所有可能影響銷售量的變數: 1. 產品價格。 2. 5到12歲兒童的總人口數 ( 目標市場 )。 3. 競爭產品的價格。 4. 廣告曝光率。 5. 今年的銷售量。 6. 去年的銷售量。
15.1 導 論 • 應用2 某投機者正考慮大筆買進黃金,他將採用迴歸分析來預測未來兩年的黃金價格。在進行分析之前,他列出了以下的自變數: 1. 市場利率。 2. 通貨膨脹率。 3. 原油價格。 4. 金飾的需求量。 5. 工業及商業用黃金的需求量。 6. 道瓊工業指數的平均值。
15.1 導 論 • 應用3 某不動產代理商想要更精確預測房屋的銷售價格。她深信以下變數將影響房屋售價: 1. 面積大小。 2. 房間的數量。 3. 房屋方位座向。 4. 屋況。 5. 座落的區段。
例題15.1 • 工作年資與年終獎金之間有何關聯? 隨機抽取甲公司六名員工並記錄他們的工作年資與年終獎金( 單位:1,000美元) 列示如下: 請分析工作年資與年終獎金之間有何關聯?
例題15.1 • 解 答 計算共變數及x的變異數, 接著導出樣本迴歸係數。
例題15.2 福特二手車價格與累積里程數 北美洲的汽車經銷商賣出新車時,經常參考藍皮書(Blue Book)來決定顧客抵購舊車的價格。每月出刊的藍皮書詳載各汽車廠牌重要車款二手車的交易價格,每款車會因為車況及配備不同而有不同的建議價格。這些價格乃源自於近期二手車拍賣市場買方的平均買價。但是藍皮書中並未指出累積里程數如何影響價格,雖然累積里程數是評鑑二手車的一個極重要因素。為了探討這個議題,某二手車經銷商隨機自前一月二手車拍賣市場中抽取100輛三年舊的福特Tauruses,每輛車都是在最佳狀況且配有自動排檔、AM/FM錄音帶播放匣及冷氣設備。經銷商記錄了售價 ( 單位為1,000美元 ) 與累積里程數 ( 單位為1,000哩 ),所有資料被儲存在XM15-02的檔案中,部分資料如下,經銷商想找出兩變數之迴歸模型。
例題15.2 解 答 本題核心在研究兩區間變數之間的關係。累積里程數普遍被認為會影響二手車的價格,因此設定價格為依變數y,累積里程數為自變數x。 從樣本資料可計算下列各式:
接著導出樣本迴歸係數。 最後找出樣本迴歸線,
斜率係數 b1為 0.0669,表示每增加1,000哩的累積里程,車價平均減少66.9美元。換言之,累積里程每額外增加1哩,車價平均降低0.0669美元。 截距 b0 為17.250,表示在 x = 0 時,也就是車子根本還沒開始上路,售價為17,250美元。然而,在這個例題,這種解釋是沒有意義的,因為在我們的樣本中,累積里程數x是介於19.1和49.2之間,並沒有任何車的累積哩程為0,只要 x 值不在樣本 x 的範圍內,就不能準確地解釋 y 的值。 解釋迴歸係數時,必須謹記在心,這些解釋僅適用於樣本,也就是這100個觀測值。如果要推論到整個母體,一定得循著較嚴謹的統計推論方法。 解釋迴歸模型
15.4 迴歸模型的假設條件 • 對所有x值而言,y都是屬於常態分配且具有相同的標準差。
15.5 評價迴歸模型 • 檢定回歸直線的斜率(β1) • 計算判定係數(R2) • 檢定相關係數(ρ)
15.5.2 1的估 計值與抽樣分配 • 檢定回歸直線的斜率β1 H0:β1=0 H1:β1≠0
例題15.3 • 福特二手車的價格與累積里程數相關嗎? • 檢定斜率係數 請檢定斜率係數,以確定是否有足夠的證據認定例題15.2中價格與累積里程數有線性關係。顯著水準為5%。 • 解 答 在例題15.2,已得到下列各值:
例題15.3 • 拒絕域為, 或 因此,否決虛無假設(H0:β1=0)
例題15.4 • 測量福特Tauruses二手車售價與累計里程數線性關係的強度 請根據例題15.2計算判定係數並敘述該統計量所代表的涵義。
例題15.4 • 解 答 在例題15.2中,已有下列資料: 在例題15.3中,也已算得下式:
例題15.4 所以, R2為0.6483,這個結果說明了64.83% 的售價總變異可用累計里程數的變異來解釋,剩下的35.17% 則是不可解釋的。
15.5.5 檢定相關係數ρ 母體的相關係數(population coefficient of correlation),因為 經常是未知的母體參數,必須由樣本資料來估計它的值,樣本相關係數(sample coefficient of correlation)的公式如下:
15.5.5 檢定相關係數ρ 檢定統計量為下式:
例題15.5 • 福特Tauruses二手車售價與累積里程數是否線性相關? • 解 答 在前面例題中,已經算出Sxy=-2.909, ,
例題15.5 相關係數為, T檢定統計量為: 拒絕域為, 或
15.6 利用迴歸模型進行預測 • 在對依變數進行預測區間時,又可分為兩種: • 第一種是預測依變數的平均數; • 第二種是預測個別的依變數。
例題15.6 • 預測福特Tauruses的個別售價與售價的平均值 1.某二手車經銷商正要去標購一輛三年舊的福特Tauruses,配有自動排檔、AM/FM錄音帶播放匣及冷氣設備,且累積里程數有40,000哩(xg=40),為了決定他該以多少價格搶標,經銷商需要預估該二手車的售價。
例題15.6 2.第1點中的二手車經銷商有機會參與標購由一家租車公司所提供的一些福特Tauruses舊車,那家租車公司有250輛福特Tauruses,全配有自動排檔、AM/FM錄音帶播放匣及冷氣設備,且累積里程數均為40,000哩(xg=40) ,經銷商想要預估這批二手車的平均售價。
例題15.6 • 解 答 1.經銷商想預測單一汽車的售價,所以他必須採用預測區間的公式,從前面的例題中,已經有下列資料:
例題15.6 從附錄可查得: 在95% 的信賴水準下,信賴區間為:
例題15.6 2.經銷商想預測一整批汽車的平均售價,所以他必須採用的E(y|x=xg)的信賴區間公式。 在95%的信賴水準下,平均售價的預測信賴區間為:
15.7 公式彙整 • 迴歸係數之最小平方估計式 • 誤差平方和
15.7 公式彙整 • 估計值的標準誤 • β1的檢定統計量 • b1的估計標準差
15.7 公式彙整 • 判定係數 • 個別依變數的預測區間
15.7 公式彙整 • 依變數平均數的信賴區間 • 樣本的相關係數 • 檢定ρ=0之t檢定統計量