1 / 27

迴歸分析

Chapter 4. 迴歸分析. 迴歸分析原理. 迴歸分析的目的在於找出一條最能夠代表所有觀測資料 ( 樣本點 ) 的函數 ( 迴歸估計式 ) ,用這個函數代表應變數和自變數之間的關係. 迴歸分析原理. 最小平方法 在進行樣本迴歸線的估計時,基本的想法是:最好的樣本迴歸線應該使得估計值 () 和觀測值 ( Y) 間的差距最小。先計算出樣本點和迴歸線在 Y 軸方向距離 ( e) 平方的總和,在極小化的要求下,分別對 a 、 b ( 樣本迴歸係數 ) 偏微分,再進行聯立求解,即可得到 a 、 b. 簡單線性迴歸分析. 應用時機

isanne
Download Presentation

迴歸分析

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Chapter 4 迴歸分析

  2. 迴歸分析原理 • 迴歸分析的目的在於找出一條最能夠代表所有觀測資料(樣本點)的函數(迴歸估計式),用這個函數代表應變數和自變數之間的關係 多變量分析—管理上的應用

  3. 迴歸分析原理 • 最小平方法 • 在進行樣本迴歸線的估計時,基本的想法是:最好的樣本迴歸線應該使得估計值()和觀測值(Y)間的差距最小。先計算出樣本點和迴歸線在Y軸方向距離(e)平方的總和,在極小化的要求下,分別對a、b(樣本迴歸係數)偏微分,再進行聯立求解,即可得到a、b 多變量分析—管理上的應用

  4. 簡單線性迴歸分析 • 應用時機 • 簡單線性迴歸分析可以應用在:(1)以單一變數進行預測,(2)判斷二個變數之間相關的方向和程度 • 統計模型 • 若由機率分佈的角度來看,則母體迴歸式表示X與條件期望值E(Y∣X)之間的關係,此時上式亦可表示為 多變量分析—管理上的應用

  5. 簡單線性迴歸分析 • 簡單線性迴歸模型基本假設 • Xi為獨立變數X的第i個觀測值,Yi為對應Xi的應變數觀測值;而參數α、β為X、Y線性關係的係數。 (1)在各個Xi之下所對應的Y,其平均值可表示為下列線性迴歸式:E(Y)= α+βXi (2)對每一個Xi而言,其所應的Y為變異數相等的分配,即Var(Y∣Xi)=σ^2 (3)Yi之間無關,且其共變數為0,即應變數任意觀測值之間無線性關係。Cov(Yi, Yj)=0 (4)自變數X為非隨機變數,且至少應該有兩個以上不同的觀測值 (5)若使用最大概似估計法時,應該先假設應變數為某一分配;而在利用OLSE估計後,進行參數檢定時,應假設Y為常態分配:Y~N[(α+βX,σ^2] 多變量分析—管理上的應用

  6. 簡單線性迴歸分析 • 參數估計--最小平方估計法 (Ordinary Least Square Estimation,OLSE) 多變量分析—管理上的應用

  7. 簡單線性迴歸分析 • 斜率β的抽樣分配、信賴區間及檢定 • β的抽樣分配 • β的信賴區間 • β的統計檢定 多變量分析—管理上的應用

  8. 簡單線性迴歸分析 • 截距α的抽樣分配、信賴區間及檢定 • α的抽樣分配 • α的信賴區間 • α的統計檢定 多變量分析—管理上的應用

  9. 觀測值、估計值和平均值的關係 • F統計量檢定 多變量分析—管理上的應用

  10. 判定係數 • 判定係數值愈接近1,表示所設定的迴歸模型愈適合描繪X、Y之間的關係 多變量分析—管理上的應用

  11. 實例與應用4-1 • 模型設定 • 尖峰用電=a+b╳氣溫 • 參數估計 • 尖峰用電估計值=-95.913+3.609╳氣溫 • 模型判斷 • 由Model Summary表中可知,判定係數(R Square)為0.745;由ANOVA表可知,p值小於0.05顯著水準,表示整體而言,上述樣本迴歸線可以描繪氣溫和用電量的關係。 • 在Coefficient表中,t檢定的結果,常數項係數的p值為0.02、自變項係數的p值為0,皆小於0.05,表示此二個參數的估計在統計上顯著異於0 多變量分析—管理上的應用

  12. 複迴歸模型與虛擬變數 • 虛擬變數應用時機 • 自變數為屬質的資料(如:性別、畢業學校、產業別),或者是由問卷調查所得的結果(如:所得級距、量表資料) • 考慮季節性或循環因素時 • 模型設定考量因素 • 經濟性 • 相關性 • 自變數和應變數的相關性 • 自變數之間的相關性 • 重要性 多變量分析—管理上的應用

  13. 複迴歸模型 • 複迴歸模型的基本假設 多變量分析—管理上的應用

  14. 虛擬變數迴歸模型 • 虛擬變數迴歸模型的一般式 • 虛擬變數的設定 • 當一變數有n種情況時,必須設定n-1個虛擬變數 • 多個變數、多項虛擬變數的設定 • 將解釋變數設為「性別」及「求學地區」,各設定一個虛擬變數 • 將解釋變數設為「個人背景」,設定3個虛擬變數 多變量分析—管理上的應用

  15. 實例與應用4-2 • 分析一 • 在未考慮季節虛擬變數之下,修正後判定係數為0.362,而ANOVA表中F檢定的p-value小於顯著水準0.05,整體模式尚能適合用來解釋樣本資料 多變量分析—管理上的應用

  16. 實例與應用4-2 • 分析一 • 在係數表中,自變數標準化係數的t檢定僅存貨(STOCK)的參數項無法拒絕為0,表示ROE可能和存貨無關 多變量分析—管理上的應用

  17. 實例與應用4-2 • 分析二 • 在考慮季節虛擬變數之下,修正後判定係數為0.458,而ANOVA表中F檢定的p-value小於顯著水準0.05,相關係數明顯提高,表示模型比分析一的模型還適合 多變量分析—管理上的應用

  18. 實例與應用4-2 • 分析二 • 在係數表中,自變數標準化係數的t檢定有短期負債(SDEBT)、存貨(STOCK)、D1等三項變數的參數項無法拒絕為0,表示在考慮季節之下,ROE可能和短期負債、存貨無顯著相關 多變量分析—管理上的應用

  19. 簡單虛擬迴歸和變異數分析 • 變異數分析可以利用F統計量檢定不同情況之間是否有顯著差異,而迴歸分析除了前述功能之外,還可以表示差異的程度和相關的方向,同時,其結果也可以用來進行預測 • 變異數分析假設母體態分配,而且各組的變異數相等,必須先檢定樣本是否符合假設;但迴歸分析則無以上限制 多變量分析—管理上的應用

  20. 實例與應用4-3 • 變異數分析 • F值為11,大於臨界值(=4),其P-value為0,表示不同性別的購買次數有顯著差異 • 虛擬迴歸分析 • 由迴歸結果可知,男女的購買次數有顯著差異,且男性的期望購買次數為5次、女性的期望購買次數為3次 多變量分析—管理上的應用

  21. 虛擬變數的不同應用型態 多變量分析—管理上的應用

  22. 虛擬變數的不同應用型態 多變量分析—管理上的應用

  23. 虛擬變數的不同應用型態 多變量分析—管理上的應用

  24. 結果解讀 • 複判定係數 • 修正後複判定數 • 偏判定係數 多變量分析—管理上的應用

  25. 迴歸分析的分析步驟 • 設立模型 • 考慮自變數的屬性(屬量或屬質)和數目(變數並非愈多愈好) • 參數估計 • 參數估計的方法一般採最小平方法,迴歸模型中估計的參數包括:常數項係數、自變項係數、判定係數 • 模型判斷 • 參數檢定:前述參數之檢定及模型整體F檢定 • 假設檢定:殘差項常態分配適合度檢定、共線性、異質變異、自我相關檢定、線性判斷 • 結果應用 • 迴歸分析能夠表示變數之間的關係,且具有預測的作用 • 在用樣本迴歸估計式進行預測時,應注意自變數範圍若大於樣本全距,則發生預測誤差的可能性就會提高 • 由迴歸分析的結果只能判斷自變數和應變數的相關程度,二者之間並不一定有因果關係 多變量分析—管理上的應用

  26. 相關、變異數分析和迴歸分析的變數比較 多變量分析—管理上的應用

More Related