340 likes | 492 Views
Chapter 12. Regression and Correlation Analysis. Definition. Regression Analysis Correlation Analysis Independent Variable (symbol X) Dependent Variable (symbol Y). Regression Analysis. Simple Regression Analysis 1 Dependent var. and 1 Independent var.
E N D
Chapter 12 Regression and Correlation Analysis
Definition • Regression Analysis • Correlation Analysis • Independent Variable (symbol X) • Dependent Variable (symbol Y) BC428(Chapter 12) A.Bootsara Prakobtham
Regression Analysis • Simple Regression Analysis • 1 Dependent var. and 1 Independent var. • relation of 2 Var : Simple linear regression or simple non-linear regression • Multiple Regressin Analysis • 1 Dependent var. and >1 Independent var. BC428(Chapter 12) A.Bootsara Prakobtham
Scatter Diagram • Check Straight line? • uses plot graph : Y-axis is Dependent Var. X-axis is Independent Var. • get equation by : Straight line Linear regression Equation Non-straight line Non-Linear regression Equation BC428(Chapter 12) A.Bootsara Prakobtham
Scatter Diagram BC428(Chapter 12) A.Bootsara Prakobtham
เป็นการตรวจสอบลักษณะความสัมพันธ์กันก่อนที่จะคำนวณค่าทางสถิติเป็นการตรวจสอบลักษณะความสัมพันธ์กันก่อนที่จะคำนวณค่าทางสถิติ BC428(Chapter 12) A.Bootsara Prakobtham
คำสั่ง Graphs Scatter .. Output Ex12.1 1 part จากกราฟแสดงว่า ตัวแปรค่าใช้จ่ายในการวิจัย กับผลกำไรมีความสัมพันธ์กันในเชิงเส้นตรง BC428(Chapter 12) A.Bootsara Prakobtham
Simple Regression Analysis • เป็นการศึกษาความสัมพันธ์ 2 ตัวแปร โดยที่ต้องทราบค่าของตัวแปรตัวหนึ่งล่วงหน้า • วัตถุประสงค์ • ศึกษาความสัมพันธ์ของตัวแปรว่ามีความสัมพันธ์กันมากน้อยเพียงใด • ใช้ความสัมพันธ์ที่วิเคราะห์ได้มาประมาณค่า Y (เมื่อมีการกำหนดค่า X) BC428(Chapter 12) A.Bootsara Prakobtham
only simple linear regression analysis • equation ( population ) • Y = 0+1X+ • equation ( sample ) • Y = b0+b1X+e • predicted equation ( Y estimation ) ^ • Y = b0+b1X BC428(Chapter 12) A.Bootsara Prakobtham
จากรูปแสดงค่า1เมื่อ X และ Y มีความสัมพันธ์เป็นรูปเส้นตรง BC428(Chapter 12) A.Bootsara Prakobtham
ข้อตกลงเบื้องต้นของสมการY = b0+b1X+e • E(e) = 0 • Var(e) = ค่าคงที่ • e is normal distribution • each e are independent BC428(Chapter 12) A.Bootsara Prakobtham
การหาค่าสัมประสิทธิ์การถดถอยของตัวอย่างการหาค่าสัมประสิทธิ์การถดถอยของตัวอย่าง • จะใช้วิธี กำลังสองน้อยที่สุด(Least square method) ซึ่งเป็นวิธีที่ใช้หาค่า b0และ b1เพื่อทำให้ผลบวกของค่าคลาดเคลื่อนยกกำลังสองมีค่าน้อยที่สุด • เป็นการคำนวณหาค่า b0และ b1จากสมการ • ค่า b0เป็นระยะที่เส้นถดถอยตัดแกน Y • ค่า b1เป็นค่าความชันของเส้นถดถอย โดยที่ b1> 0 เป็นค่า X และ Y เปลี่ยนแปลงในทิศทางเดียวกัน b1< 0 เป็นค่า X และ Y เปลี่ยนแปลงในทิศทางตรงกันข้าม b1= 0 เป็นค่า X ไม่มีผลต่อ Y BC428(Chapter 12) A.Bootsara Prakobtham
ถ้า X เพิ่มขึ้น 1 หน่วย ค่า Y จะเพิ่มขึ้น b1 หน่วย ถ้า X เพิ่มขึ้น 1 หน่วย ค่า Y จะลดลง b1 หน่วย ไม่ว่า X จะเปลี่ยนไปเท่าไหร่ Y ก็จะมีค่าเท่าเดิม BC428(Chapter 12) A.Bootsara Prakobtham
ความคลาดเคลื่อนมาตรฐานของการกะประมาณค่าความคลาดเคลื่อนมาตรฐานของการกะประมาณค่า • เป็นการวัดการกระจายของข้อมูลรอบเส้นถดถอย • สัญลักษณ์ที่ใช้คือ Sy.x Sy.x = 0 การประมาณค่า Y จากเส้นถดถอยมีความถูกต้อง 100% Sy.xเพิ่มมากขึ้น การประมาณค่า Y จากเส้นถดถอยไม่ได้ให้ความถูกต้องเท่าที่ควร BC428(Chapter 12) A.Bootsara Prakobtham
การทดสอบสมมติฐานเกี่ยวกับสัมประสิทธิการถดถอยการทดสอบสมมติฐานเกี่ยวกับสัมประสิทธิการถดถอย 1. ต้องทดสอบว่า 1= 0 ? • ถ้า 1≠0 จะใช้สมการถดถอยเชิงเส้นประมาณค่า Y จาก X ได้ • สมมติฐาน H0 : 1 = 0 H1 : 1 ≠ 0 • สถิติทดสอบ t หรือ F • df = n-2 2. ต้องทดสอบว่า 0= 0 ? BC428(Chapter 12) A.Bootsara Prakobtham
สัมประสิทธิ์การกำหนด(Coefficient of Determination) • หมายถึงสัดส่วนที่ตัวแปร X สามารถอธิบายการเปลี่ยนแปลงของตัวแปร Y ได้ • สัญลักษณ์ที่ใช้คือ r2 (R square) • r2 = Explained Variation Total Variation • คุณสมบัติของค่า r2 1. 0≤r2≤1 2. ค่า r2 แสดงให้ทราบว่าความแปรผันที่เกิดขึ้นใน Y เป็นผลเนื่องมาจาก X ร้อยละเท่าไร 3. ยิ่งค่าr2 ยิ่งมากแสดงว่า Y และ X มีความสัมพันธ์กันมาก BC428(Chapter 12) A.Bootsara Prakobtham
สัมประสิทธิ์สหสัมพันธ์อย่างง่าย(Correlation Coefficient) • ใช้วัดความสัมพันธ์ระหว่าง X และ Y ว่ามีความสัมพันธ์กันมากหรือน้อย • สัญลักษณ์ที่ใช้คือ r (ใช้ r) • -1≤r≤1 • สมมติฐาน H0 : =0 H1: ≠0 • สถิติทดสอบ t-test (n<30) หรือ Z-test (n≥30) BC428(Chapter 12) A.Bootsara Prakobtham
ความหมายของ r สัมประสิทธ์สหสัมพันธ์ = BC428(Chapter 12) A.Bootsara Prakobtham
การตรวจสอบข้อตกลงเบื้องต้นใน Simple Linear Regresion Analysis ใช้ตรวจสอบเงื่อนไขของการวิเคราะห์ความถดถอยเชิงเส้น • ค่าเฉลี่ยของความคลาดเดลื่อนเป็น 0 • ค่าความแปรปรวนของ eเป็นค่าคงที่ เมื่อ Y มีการเปลี่ยนแปลงไป • ค่า e มีการแจกแจงแบบปกติ • แต่ละค่าของ e เป็นอิสระต่อกัน BC428(Chapter 12) A.Bootsara Prakobtham
1. การตรวจสอบค่าเฉลี่ยของความคลาดเดลื่อน • การหาค่า b0และ b1โดยทำให้ผลบวกกำลังสองของความคลาดเคลื่อนมีค่าต่ำสุด จะทำให้ผลรวมของความคลาดเคลื่อนเป็น 0 • ดังนั้น ค่าเฉลี่ยของความคลาดเคลื่อน = 0 • เพราะฉะนั้นเงื่อนไขนี้เป็นจริงเสมอ BC428(Chapter 12) A.Bootsara Prakobtham
2. การตรวจสอบค่าความแปรปรวนของค่าคลาดเคลื่อน • ตรวจสอบว่า Var(e) = 2 • กรณีที่ Var(e) ไม่เท่ากันทุกค่าของ X จะเรียกว่าเกิดปัญหา ^ Heteroscedastic เพราะว่า Var(e) = Var(Y) • การตรวจสอบจะพิจารณาจากกราฟ โดยดูความสัมพันธ์ระหว่าง e กับ Y BC428(Chapter 12) A.Bootsara Prakobtham
กราฟแสดงความสัมพันธ์ระหว่าง e กับ Y ในรูปแบบต่าง ๆ BC428(Chapter 12) A.Bootsara Prakobtham
3. การทดสอบค่าคลาดเคลื่อนมีการแจกแจงแบบปกติหรือไม่ • ใช้การตรวจสอบโดยใช้ Shaporo-Wilk หรือ Kolmogorov-Smirnov • หรืออาจจะดูจาก Histrogramของค่าคลาดเคลื่อน BC428(Chapter 12) A.Bootsara Prakobtham
4. ทดสอบแต่ละค่าของค่าความคลาดเคลื่อนต้องเป็นอิสระกัน • ใช้สถิติทดสอบของ Durbin-Watson พิจารณาจาก • หรือพิจารณาจากค่า sig ถ้า sig< แสดงว่าค่าความคลาดเคลื่อนแต่ละค่ามีความสัมพันธ์ BC428(Chapter 12) A.Bootsara Prakobtham
คำสั่งที่ใช้ในการทดสอบคำสั่งที่ใช้ในการทดสอบ • ทดสอบข้อ 1 ค่าเฉลี่ยของความคลาดเดลื่อนเป็น 0 และข้อ 4แต่ละค่าของ e เป็นอิสระต่อกัน คำสั่ง Analyze Regression Linear • ทดสอบข้อ 3 ค่า e มีการแจกแจงแบบปกติ คำสั่ง Analyze Descriptive Statistics Explore • ทดสอบข้อ 2 ค่าความแปรปรวนของ eเป็นค่าคงที่ คำสั่ง Graph Scatter… BC428(Chapter 12) A.Bootsara Prakobtham
แปลผลจากตัวอย่างที่ 12.1 ได้ output 5 ส่วน • ส่วนที่ 1 แสดงชื่อตัวแปรอิสระในการทดสอบ • ใช้ค่าใช้จ่ายในการวิจัย เป็นตัวแปรอิสระ • ใช้วิธีการทดสอบคือ Enter BC428(Chapter 12) A.Bootsara Prakobtham
ส่วนที่ 2 แสดงค่าสถิติที่ใช้ในการพิจารณา • ผลกำไรมีความสัมพันธ์กับค่าใช้จ่ายอย่างมาก (แปลต่อ) • ความแปรผันที่เกิดขึ้นในผลกำไรเป็นผลต่อเนื่องมาจากค่าใช้จ่าย 97.7 % ที่เหลือมาจากสาเหตุอื่นอีก 2.3% • การประมาณผลกำไรจากค่าใช้จ่ายในการวิจัยจะมีค่าความคลาดเคลื่อนประมาณ 1.72 หมื่นบาท • ค่า Durbin-Watson มีค่าเข้าใกล้ 2 แสดงว่าความคลาดเคลื่อนเป็นอิสระต่อกัน BC428(Chapter 12) A.Bootsara Prakobtham
ส่วนที่ 3 แสดงการทดสอบค่าสัมประสิทธิ์การถดถอย (1) • สมมติฐาน H0 : ค่าใช้จ่ายไม่มีความสัมพันธ์กับกำไรในเชิงเส้นตรง • H1 : ค่าใช้จ่ายมีความสัมพันธ์กับกำไรในเชิงเส้นตรง • สถิติทดสอบ F = 608.918 • ระดับนัยสำคัญ = 0.05 • Sig = 0.000 • 0.000<0.05 Reject H0 นั่นคือค่าใช้จ่ายมีความสัมพันธ์กับกำไรในเชิงเส้นตรง BC428(Chapter 12) A.Bootsara Prakobtham
ส่วนที่ 4 แสดงการทดสอบ 0และ1 เพื่อสร้างสมการถอถอย • 1. การทดสอบ0 (ทดสอบเกี่ยวกับส่วนการตัดแกน Y) • สมมติฐาน H0 : 0 =0 • H1 : 0 ≠0 • สถิติทดสอบ t = 1.819 • ระดับนัยสำคัญ = 0.05 • Sig = 0.092 • 0.092>0.05 Accept H0 นั่นคือ0 =0 BC428(Chapter 12) A.Bootsara Prakobtham
ส่วนที่ 4(ต่อ) แสดงการทดสอบ 1 (เหมือนการทดสอบส่วนที่ 3) 1. การทดสอบ 1 (ทดสอบเกี่ยวกับส่วนการตัดแกน Y) • สมมติฐาน H0 : 1 =0 H1 : 1 ≠0 • สถิติทดสอบ t = 24.676 • ระดับนัยสำคัญ = 0.05 • Sig = 0.000 • 0.000<0.05 Reject H0นั่นคือ1 ≠ 0 ดังนั้นจึงสรุปได้ว่าสมการความถดถอยซึ่งแสดงความสัมพันธ์ระหว่างค่าใช้จ่ายในการวิจัยและผลกำไรเป็น ^ จาก สมการ Y = b0+b1X จะได้ ว่า ^ Profit = 2.597+4.922Expend BC428(Chapter 12) A.Bootsara Prakobtham
ส่วนที่ 5 แสดงค่าสถิติทดสอบความคลาดเคลื่อนของการประมาณค่ากำไร ด้วยกำไร • ค่าเฉลี่ยของกำไรโดยประมาณเป็น 36.07 หมื่นบาท • ค่าประมาณต่ำสุดของกำไรเป็น 17.36 หมื่นบาท • ค่าประมาณสูงสุดของกำไรเป็น 51.82 หมื่นบาท • ค่าประมาณส่วนเบี่ยงเบนมาตรฐานของกำไรเป็น 11.35 หมื่นบาท • จำนวนข้อมูลทั้งหมด 15 ค่า BC428(Chapter 12) A.Bootsara Prakobtham
สรุปผลการทดสอบข้อ 3 ค่า e มีการแจกแจงแบบปกติ มี 4 ส่วน ส่วนที่ 1 แปลผลเอง ส่วนที่ 2 แปลผลเอง BC428(Chapter 12) A.Bootsara Prakobtham
ส่วนที่ 3 แปลผลเอง ส่วนที่ 4 แปลผลเอง BC428(Chapter 12) A.Bootsara Prakobtham
แปลผลทดสอบข้อ 2 ค่าความแปรปรวนของ eเป็นค่าคงที่ กราฟแสดงความสัมพันธ์ระหว่างค่าความคลาดเคลื่อนกับกำไร จุดต่าง ๆ มีการกระจายที่ไม่ได้เพิ่มขึ้นหรือลดลง แสดงว่าค่าความคลาดเคลื่อนมีการกระจายตัวคงที่ BC428(Chapter 12) A.Bootsara Prakobtham