321 likes | 606 Views
หน่วยที่. 14. การวิเคราะห์สหสัมพันธ์. และ. การถดถอยเชิงเส้นอย่างง่าย. การวิเคราะห์สหสัมพันธ์. 14.1. เชิงเส้นอย่างง่าย. 14.2. การวิเคราะห์การถดถอย. เชิงเส้นอย่างง่าย. ตอนที่. การวิเคราะห์สหสัมพันธ์. 14.1. เป็นการตรวจหาหรือตรวจสอบ. ระดับความสัมพันธ์ระหว่างตัวแปร โดย.
E N D
หน่วยที่ 14 การวิเคราะห์สหสัมพันธ์ และ การถดถอยเชิงเส้นอย่างง่าย
การวิเคราะห์สหสัมพันธ์การวิเคราะห์สหสัมพันธ์ 14.1 เชิงเส้นอย่างง่าย 14.2 การวิเคราะห์การถดถอย เชิงเส้นอย่างง่าย ตอนที่
การวิเคราะห์สหสัมพันธ์การวิเคราะห์สหสัมพันธ์ 14.1 เป็นการตรวจหาหรือตรวจสอบ ระดับความสัมพันธ์ระหว่างตัวแปร โดย ไม่สนใจว่าตัวแปรใดเป็นเหตุและตัวแปรใด เป็นผล
การวิเคราะห์สหสัมพันธ์อย่างง่ายการวิเคราะห์สหสัมพันธ์อย่างง่าย การวิเคราะห์สหสัมพันธ์เชิงเส้นอย่างง่าย กรณีที่ศึกษาความสัมพันธ์ระหว่าง ตัวแปรสองตัวเรียกว่า และถ้าความสัมพันธ์ระหว่างตัวแปร สองตัวเป็นแบบเส้นตรงจะเรียกว่า
แผนภาพการกระจาย (scatter diagram) การสังเกตความสัมพันธ์ระหว่างตัวแปร สามารถทำได้โดยนำค่าข้อมูล ของตัวแปรแต่ละคู่ที่สังเกตได้มาลงจุดบน ระนาบ xy แผนภาพที่ได้จากการนำค่า ข้อมูลมาลงจุดเรียกว่า
y y y y y y x x x x x x
n xy– ( x) (y) r= n( x2) (x)2 n( y2)– (y)2 สัมประสิทธิ์สหสัมพันธ์เชิงเส้นอย่างง่าย(r) เป็นค่าที่ใช้วัดระดับความสัมพันธ์ เชิงเส้นระหว่างตัวแปร X และตัวแปร Y สำหรับข้อมูลตัวอย่างที่รวบรวมไว้ ค่า -1 r 1
ตัวอย่าง บริษัทผู้ผลิตฮาร์ดแวร์คอมพิวเตอร์ แห่งหนึ่งต้องการทราบว่า จำนวนพนักงาน ของบริษัท กับยอดขายของบริษัทมีความ สัมพันธ์กันมากน้อยเพียงใด โดยบริษัทเก็บ ข้อมูลย้อนหลัง 10 ปี ดังตาราง
วิธีทำ 10 (800.62)– (268)(27.73) r= nxy– (x) (y) r= 10(7668)–(268)2 10(83.8733)–(27.73)2 n(x2)– (x)2 n(y2)– (y)2 จากสูตร = 0.99
ค่าสัมประสิทธิ์สหสัมพันธ์ค่าสัมประสิทธิ์สหสัมพันธ์ มีค่าเป็นบวกและมีค่าเท่ากับ 0.99 แสดงว่า จำนวนพนักงานขายบริษัทแห่งนี้มีความ สัมพันธ์กับยอดขาย ของบริษัทไปในทิศทาง เดียวกันและมีความ สัมพันธ์กันสูง
ตัวอย่าง การทดสอบสมมุติฐานของ สัมประสิทธิ์สหสัมพันธ์เชิงเส้นอย่างง่าย โรงพยาบาลแห่งหนึ่งได้คำนวณ ค่าสัมประสิทธ์สหสัมพันธ์ของ ความดันที่เกิดจากการบีบตัวของหัวใจและ ความดันที่เกิดจากการคลายตัวของหัวใจจาก การวัดความดันโลหิตของนักศึกษา 14 คน ปรากฏว่าได้ค่า r= 0.658
การทดสอบสมมุติฐานของ สัมประสิทธิ์สหสัมพันธ์เชิงเส้นอย่างง่าย จงทดสอบนัยสำคัญทางสถิติของ r ที่ระดับนัยสำคัญ 0.05 พร้อมสรุปผลการทดสอบ
วิธีทำ r n – 2 t= 1– r 0.65814– 2 = 1– (0.658) 1. กำหนดสมมุติฐาน H0 : = 0 H1 : 0 2. กำหนดระดับนัยสำคัญในการทดสอบ 0.05 3. คำนวณค่าสถิติทดสอบ = 3.044
ปลายหางโค้ง 2 ด้าน = 0.05 = 0.025 2 4. เปิดค่าวิกฤตจากตาราง t หน้า 322 ค่า = 0.05 แต่เป็นการทดสอบสมมุติฐานสองทาง ดังนั้นค่า จึงหาร 2 พื้นที่
บริเวณยอมรับ H0 tคำนวณ = 3.044 0.025 0.025 - + -tตาราง = -2.179 tตาราง = 2.179
5. ค่า tคำนวณ มากกว่าค่า tตาราง หรือตกอยู่ ในบริเวณวิกฤตดังนั้นจึงสรุปได้ว่าปฏิเสธ สมมุติฐานว่าง(H0)ที่ระดับนัยสำคัญ 0.05 หรือกล่าวได้ว่าความดันที่เกิดจากการบีบตัว ของหัวใจและความดันที่เกิดจากการคลายตัว ของหัวใจมีความสัมพันธ์กันที่ระดับ นัยสำคัญ 0.05
การวิเคราะห์การถดถอย เชิงเส้นอย่างง่าย 14.2 สมการถดถอยเชิงเส้นอย่างง่าย เป็นการศึกษาอิทธิพลที่ตัวแปรหนึ่ง มีต่อตัวแปรอีกตัวหนึ่งโดยใช้ตัวแบบ ความสัมพันธ์เชิงคณิตศาสตร์สร้างสมการ เส้นตรงที่เป็นตัวแทนความสัมพันธ์ ระหว่างตัวแปร 2 ตัวแปรที่เรียกว่า
ตัวแปรอิสระ 1 2 เช่น ระดับมลพิษในแม่น้ำ ตัวแปรตาม เช่น อัตราการตายของสัตว์ในแม่น้ำ ตัวแปรที่ศึกษาแบ่งเป็น 2 ประเภท
ตัวอย่าง บริษัทผลิตฉนวนป้องกัน ไฟฟ้ารั่วแห่งหนึ่งกำลังทดลอง พัฒนาฉนวนกันไฟฟ้ารั่วชนิดใหม่ โดยศึกษาความสัมพันธ์ระหว่างแรงดัน ที่ต้องใช้ในการอัดวัสดุที่นำมาทำฉนวน (หน่วย: 10 ปอนด์ต่อตารางนิ้ว) กับขนาด ความหนาของฉนวน(หน่วยเป็น 0.1 นิ้ว) จากการทดลองให้บันทึกข้อมูลดังนี้
y = b0 + b1 x n (xy) – ( x)( y) b1 = n ( x2) – ( x)2 5 (37) – (15)(10) = 5 (55) – (15)2 b0 = y – b1x หาค่า b0และ b1เพื่อแทนค่าสมการ = 0.7 = 2 – (0.7)(3) = – 0.1
สมการถดถอยเชิงเส้นอย่างง่าย คือ y = - 0.1+ 0.7x ค่าคงที่ b0เท่ากับ -0.1 หมายความว่า ถ้าแรงดันที่ใช้อัดวัสดุเท่ากับ 0 หรือถ้าไม่ใช้ แรงดันในการอัดวัสดุเลยความหนาของ ฉนวนจะเท่าเดิม ค่าสัมประสิทธิ์การถดถอย b1เท่ากับ 0.7 หมายความว่า ถ้าแรงดันที่ใช้
อัดวัสดุเพิ่มขึ้น 10 ปอนด์ ต่อตารางนิ้ว ขนาดความหนาของฉนวนก็จะเพิ่มขึ้น 0.7 นิ้ว
(y – y)2 ค่า r2 = 1 – (y – y)2 สัมประสิทธิ์แห่งการกำหนด (r2) คือ ผลรวมความแปรปรวนทั้งหมดใน y ที่อธิบายได้ด้วยเส้นถดถอย
ตัวอย่าง สถานีดับเพลิงแห่งหนึ่ง คำนวณหาค่าสัมประสิทธิ์แห่งการกำหนด ของระยะห่างของสถานีที่เกิดเพลิงไหม้ กับสถานีดับเพลิงและมูลค่าความเสียหาย ที่เกิดขึ้นได้เท่ากับ 0.93 จงอธิบายความหมายของค่าดังกล่าว
วิธีทำ ค่าสัมประสิทธิ์แห่งการกำหนดเท่ากับ 0.93 หมายความว่า ความแปรปรวนทั้งหมด ของมูลค่าความเสียหายที่เกิดขึ้น สามารถ อธิบายได้ด้วยเส้นถดถอย มีเพียงร้อยละ 7 ของความแปรปรวนทั้งหมดของมูลค่า ความเสียหายที่เกิดขึ้นที่ไม่สามารถอธิบาย ได้ด้วยเส้นถดถอย