380 likes | 1.04k Views
บทที่ 9. สถิติแบบไม่ใช้พารามิเตอร์. บทที่ 9 Non-parametric.
E N D
บทที่ 9 สถิติแบบไม่ใช้พารามิเตอร์
บทที่ 9 Non-parametric ในการศึกษาสถิติอ้างอิงที่ผ่านมา ไม่ว่าจะเป็นการประมาณค่าพารามิเตอร์ หรือการทดสอบสมมติฐานเกี่ยวกับพารามิเตอร์ มักทราบว่าประขากรมีการแจกแจงแบบใด และการแจกแจงที่สำคัญก็คือการแจกแจงแบบปกติ และข้อสมมติ (assumption) ของสถิติต่างๆเช่นการวิเคราะห์ความแปรปรวน ก็มีข้อสมมติของการแจกแจงของประชากรว่ามีการแจกแจงแบบปกติ
แต่ในความเป็นจริงเราต้องทำการทดสอบก่อนว่าข้อมูลที่ทำการศึกษานั้นมาจากประชากรที่มีการแจกแจงแบบปกติจริงหรือไม่ การทดสอบทำได้หลายลักษณะ เช่นการพิจารณาจากกราฟ หรือสถิติ Kolmogorov-Smirnov ถ้าข้อมูลไม่ได้มาจากประชากรที่มีการแจกแจงแบบปกติก็ไม่สามารถใช้สถิติหลายๆตัวที่ผ่านมาได้ เช่น t-test F-test ดังนั้น Non-parametric จึงนำมาใช้ในสถิติอ้างอิงในกรณีที่ไม่ทราบการแจกแจงของประชากร
Menu Analyze > Non-parametric Tests > ผลจากการใช้คำสั่งนี้มีสถิติให้เลือกดังนี้ 1. Chi-square 2. Binomial 3. Runs 4. 1-sample K-S 5. 2-independent samples 6. K-independent samples 7. 2-related samples 8. K-related samples
กรณี 1-sample สถิติที่ใช้ในการทดสอบในกรณีตัวอย่างกลุ่มเดียวมีหลายตัวด้วยกัน เช่น 1. Binomial test 2. Sign test 3. Wilcoxon-signed rank test 4. Wald-Wolfowitz runs test 5. Kolmogorov-Smirnov test 6. Chi-square test
Binomial test เป็นการทดสอบว่าสัดส่วนของสิ่งที่สนใจของประชากรมีค่าดังที่คาดไว้หรือไม่ โดยลักษณะของประชากรมี 2 แบบเท่านั้นคือสิ่งที่สนใจกับสิ่งที่ไม่สนใจเท่านั้น H0 : p = p* vs H1: p p* H0 : p = p* vs H1: p < p* H0 : p = p* vs H1: p > p* สถิติที่ใช้ในการทดสอบคือ T = จำนวนของการเกิดสิ่งที่เราสนใจ
Sign test เป็นการทดสอบว่าค่ามัธยฐานของประชากรมีค่าเท่ากับค่าที่คาดไว้หรือไม่ วิธีการคือเปรียบเทียบค่าสังเกตจากตัวอย่างสุ่มกับค่า med.ที่คาดไว้ ถ้าค่าสังเกตมีค่ามากกว่าค่า med. ให้เครื่องหมาย + ถ้าค่าสังเกตมีค่าน้อยกว่า med. ให้เครื่องหมาย -
สมมติฐานในการทดสอบคือสมมติฐานในการทดสอบคือ H0 : P(+) = P(-) =0.5 vs H1 : P(+) P(-) H0 : P(+) = P(-) =0.5 vs H1 : P(+) > P(-) H0 : P(+) = P(-) =0.5 vs H1 : P(+) < P(-) สถิติที่ใช้ในการทดสอบ คือ M โดย M คือจำนวนเครื่องหมาย + หรืออาจเป็นเครื่องหมาย - M มีการแจกแจงแบบทวินาม
Wilcoxon-Signed rank test ในการทดสอบ Sign test เป็นการทดสอบโดยใช้เครื่องหมายไม่นำขนาดของผลต่างระหว่าง ค่าสังเกตกับค่า med. มาพิจารณา ดังนั้น Wilcoxon-Signed rank test จึงนำผลต่างดังกล่าวมาพิจารณา แล้วให้อันดับ (rank) กับค่าความแตกต่างนั้นโดยไม่คำนึงถึงเครื่องหมาย แล้วแบ่งออกเป็น 2 กลุ่มคือ อันดับของกลุ่มที่มีเครื่องหมาย + และอันดับของกลุ่มที่มีเครื่องหมาย - H0 : vs H1 : ให้ di =
สถิติที่ใช้ในการทดสอบคือสถิติที่ใช้ในการทดสอบคือ T+ = ผลรวม rank ที่มีเครื่องหมาย + T- = ผลรวม rank ที่มีเครื่องหมาย - T = T+ หรือ T- ที่มีค่าน้อยกว่า การทดสอบนี้สามารถทดสอบกับความแตกต่างของประชากร 2 กลุ่มแต่ตัวอย่างทั้ง 2 กลุ่มเป็น related samples (xi , yi ) หาค่า di = yi - xi แล้วทำวิธีเหมือนกับกรณี 1-sample
Wald-Wolfowitz runs test เป็นการทดสอบว่าค่าสังเกตที่ได้มานั้นได้มาโดยสุ่มหรือไม่ H0 : ข้อมูลที่ศึกษาได้มาโดยสุ่ม H1 : ข้อมูลที่ศึกษาไม่ได้มาโดยสุ่ม สถิติที่ศึกษาคือจำนวน run Run คือ กลุ่มของค่าสังเกตที่มีเครื่องหมายเหมือนกันอยู่ติดกัน ถูกคั่นด้วยเครื่องหมายที่ต่างออกไป
ลักษณะของการทดสอบนี้ จะแทนค่าสังเกตด้วยเครื่องหมาย 2 ชนิด อาจเป็น + - โดยเครื่องหมาย + อาจเป็นค่าสังเกตที่มีค่ามากกว่า med. และ เครื่องหมาย - คือค่าสังเกตที่มีค่าน้อยกว่า med. ตัวอย่าง : 15 12 13 10 9 17 9 8 13 (med.=10) + + + 0 - + - - + (5 runs) ปฏิเสธสมมติฐานถ้าจำนวน run มีมากหรือน้อยจนเกินไป
Kolmogorov-Smirnov test เป็นการทดสอบว่าตัวอย่างที่สุ่มได้นั้นมีการแจกแจงแบบที่คาดไว้หรือไม่ ลักษณะการทดสอบใช้ฟังก์ชั่นการแจกแจงแบบสะสม H0 : F(x) = F0(x) vs H1: F(x) F0(x) F0(x) คือ distribution function ของประชากรที่คาดว่าจะเป็น
ให้ S(x) คือการแจกแจงแบบสะสมของค่าสังเกตจากตัวอย่าง สถิติที่ใช้ในการทดสอบคือค่าความแตกต่างที่มากที่สุดระหว่าง F0(x) และ S(x) D = max.IF0(x) - S(x)I
Chi-Square test สำหรับตัวอย่าง 1 กลุ่ม เป็นการทดสอบว่าประชากรมีการแจกแจงดังที่คาดไว้หรือไม่ แต่ลักษณะของข้อมูลไม่เหมือนกับ Kolmogorov-Smirnov test เพราะข้อมูลในการทดสอบ Chi-square เป็นค่าความถี่ที่ตกใน categories ต่างๆ โดยค่า X จะถูกแบ่งออกเป็น k categories แล้วพิจารณาในแต่ละ category ว่ามีค่าสังเกตอยู่ใน category นั้นเท่าใด
H0 : ประชากรมีการแจกแจงดังที่คาดไว้ H0 : ประชากรไม่ได้มีการแจกแจงดังที่คาดไว้ สถิติที่ใช้ในการทดสอบคือ เมื่อ Oiคือความถี่ของค่าสังเกตที่ตกใน cat. ที่ i Eiคือความถี่ของค่าคาดหวังเมื่อ H0จริงที่ตกใน cat. ที่ i
Menu Analyze > Nonparametric test > Binomial หน้าจอจะปรากฏ box ทางขวามือคือ box test variable list ใส่ชื่อตัวแปรที่เราต้องการทดสอบลงใน box นี้ Test Proportion : โดยปกติจะทำการทดสอบที่ค่า 0.5 แต่อาจใส่ค่าความน่าจะเป็นของ success ลงในช่องนี้ Define dichotomy : ในการระบุว่าจะแบ่งข้อมูลออกเป็น 2 กลุ่มได้อย่างไร ทำโดย 1. ใช้จากข้อมูล 2. กำหนดค่า cut point
OPTION กลุ่มของ Statistics ประกอบด้วย 1. Descriptive 2. Quartiles หาค่า Q1 , Q2 , Q3 กลุ่มของ missing values ประกอบด้วย 1. Exclude cases test by test : วิเคราะห์ตัวแปรที่ไม่สูญหาย ไม่ตัดทิ้งทั้งหมด (Default) 2. Exclude cases listwise : ตัด case ที่มีค่าสูญหายออกไม่นำมาวิเคราะห์สถิติใดๆทั้งสิ้น
Menu Analyze > Nonparametric test > Runs หน้าจอปรากฏ box ทางขวามือเป็น box ของ Test variable list ใส่ชื่อตัวแปรที่ต้องการทดสอบลงใน box นี้ Cut point : การแบ่งกลุ่มข้อมูล เลือกได้ 4 วิธีคือ 1. Median 2. Mean 3. Mode 4. Custom (ระบุค่าที่ต้องการให้แบ่ง)
Menu Analyze > Nonparametric test > Chi-Square ใส่ชื่อตัวแปรที่ต้องการทดสอบลงใน box ทางขวามือ Expected Values : ค่าคาดหวังในแต่ละ categories 1. ทุกกลุ่มมีค่าคาดหวังเท่ากัน 2. แต่ละกลุ่มมีค่าคาดหวังไม่เท่ากันให้ใส่จำนวนร้อยละของค่าคาดหวังในแต่ละกลุ่มลงไป (หรืออาจใส่สัดส่วนของค่าคาดหวัง) click add จนครบทุก categories ลำดับของการใส่มีความสำคัญ cat. 1 ใส่ค่าคาดหวังก่อนตามด้วย cat. 2 ,3...
Expect Range 1. Get from data : โปรแกรมจะถือว่าค่าสังเกตที่แตกต่างกันคือกลุ่มที่ต่างกัน (Default) 2. Use Specified range : เรากำหนดช่วงที่ใช้ในการทดสอบเองใส่ค่าจำนวนเต็มแสดงค่าสูงสุดต่ำสุดในแต่ละช่วงที่ต้องการทดสอบ
Menu Analyze > Nonparametric test > 1 sample K-S ใส่ชื่อตัวแปรที่ต้องการทดสอบลงใน box ทางขวามือ ลักษณะการทดสอบโดย Kolmogorov-Smirnov สามารถทดสอบได้ว่าประชากรมีการแจกแจงแบบต่างๆดังนี้ 1. Normal (Default) 2. Uniform 3. Poisson
2 Independent samples สำหรับการทดสอบในกรณีที่ตัวอย่าง 2 กลุ่มเป็นอิสระต่อกัน Non-parametric มีสถิติในการทดสอบหลายตัวด้วยกันคือ 1. Mann-Whitnet U test 2. Kolmogorov-Smirov Z test 3. Moses extremes reaction 4. Wald-Wolfowitz run s test
Menu > Analyze> 2 Independent Samples > .. หน้าจอจะปรากฏ box variable list และ Grouping variable ใส่ตัวแปรที่ต้องการทดสอบความแตกต่างลงไปใน variable list และกลุ่มของตัวแปรใน grouping variable ตัวอย่าง ต้องการทดสอบว่าเงินเดือนเริ่มต้นของชนชาติมีความแตกต่างกันหรือไม่ ใส่ Beginning Salary ลงใน variable list ใส่ Minority ลงใน grouping variable พร้อมทั้ง define groups (ระบุกลุ่มที่ต้องการทดสอบ)
Mann-Whitney U test เป็นการทดสอบว่าค่ากลางของประชากร 2 กลุ่มมีค่าแตกต่างกันหรือไม่ ค่ากลางนั้นมักใช้ค่ามัธยฐาน วิธีการนำค่าสังเกตจากตัวอย่างที่ 1 (ขนาด n1) และค่าสังเกตจากตัวอย่างที่ 2 (ขนาด n2) มาให้อันดับจากน้อยไปมาก ตั้งแต่ 1 จนถึง n1+n2 ให้ S คือผลรวม rank ของกลุ่มที่ 1 สถิติที่ใช้ในการทดสอบคือ
Kolmogorov-Smirnov Z test เป็นการทดสอบว่า ตัวอย่างที่เป็นอิสระต่อกัน 2 กลุ่มนั้นมีการแจกแจงที่เหมือนกันหรือไม่ ลักษณะของการทดสอบใช้การแจกแจงแบบสะสมจากตัวอย่างทั้ง 2 ชุดมาพิจารณาความแตกต่าง นำค่าความแตกต่างที่มากที่สุดมาทดสอบว่าต่างกันอย่างมีนัยสำคัญหรือไม่ สถิติที่ใช้ในการทดสอบคือ D = max.IS1(x) - S2(x)I
Wald-Wolfowitz runs test เป็นสถิติที่ใช้ในการทดสอบว่าตัวอย่างที่เป็นอิสระต่อกัน 2 กลุ่มนั้นมาจากประชากรที่มีการแจกแจงที่เหมือนกันหรือไม่ วิธีการคือนำค่าสังเกตจากตัวอย่างทั้ง 2 กลุ่มมารวมกันจัดเรียงลำดับแล้วนับจำนวน run ที่เกิดขึ้น ถ้าจำนวน run มีมากเกินไป แสดงว่าตัวอย่างทั้ง 2 กลุ่มไม่น่าจะมาจากประชากรกลุ่มเดียวกัน
K-independent samples ในการทดสอบว่าตัวอย่างที่เป็นอิสระต่อกัน k กลุ่มโดย k > 2 มีค่ามัธยฐานที่แตกต่างกันหรือไม่ สถิติที่ใช้ในการทดสอบคือ 1. Kruskal-Wallis H test 2. Median test H0 : M1 = M2 = …. = Mk H1 : MJ อย่างน้อย 1 ค่าแตกต่างจากค่าอื่น j=1,2,…,k
2-related samples ในกรณีที่ตัวอย่าง 2 กลุ่มมีความสัมพันธ์กันเช่นอาจเป็นตัวอย่างชุดเดียวกันทำข้อสอบซ้ำ 2 ครั้งหรืออาจเป็นคู่แฝดที่ศึกษาพฤติกรรมบางอย่าง สิ่งที่ต้องการศึกษาคือค่ากลางของประชากร 2 กลุ่มมีความแตกต่างกันหรือไม่ สถิติที่ใช้ในการทดสอบคือ 1. Wilcoxon test 2. Sign test 3. McNemar test
ลักษณะของข้อมูลจะใส่เป็น 2 ตัวแปร เช่น pre-test คือตัวแปรที่ 1 post-test คือตัวแปรที่ 2 Clickvar. 1 ตามด้วย var. 2 เมื่อปรากฏทั้ง 2 ตัวแปรแล้วจึง click ลูกศรให้ใส่ตัวแปรใน box ทางขวามือ
k-related samples ในกรณีที่ตัวอย่าง k กลุ่มมีความสัมพันธ์กัน สิ่งที่ต้องการศึกษาคือค่ากลางของประชากร k กลุ่มมีความแตกต่างกันหรือไม่ สถิติที่ใช้ในการทดสอบคือ 1. Friedman test 2. Kendall’s W test 3. Cohcran’s Q test
Friedman test เป็นการศึกษาว่าค่ามัธยฐานของประชากร k กลุ่มมีความแตกต่างกันหรือไม่โดยที่ตัวอย่างมีความสัมพันธ์กัน ลักษณะคล้ายกับการวางแผนการทดลองแบบ RBD โดยมี Block เป็นความสัมพันธ์ ค่าสังเกตในแต่ละ Block มีความสัมพันธ์กันไม่ใช่เป็นอิสระต่อกันเหมือนในกรณีของค่าสังเกตใน RBD
Kendall’s W test เป็นการวัดความสอดคล้องของค่ามัธยฐานของประชากร k กลุ่มว่ามีความแตกต่างกันหรือไม่ เมื่อตัวอย่างมีความสัมพันธ์กัน ตัวอย่างเช่น การให้คะแนนผู้เข้าแข่งขันร้องเพลง 10 คนโดยมีกรรมการ 5 ท่านเป็นผู้ให้คะแนน ลักษณะนี้มีตัวอย่างขนาด 10 แล้วทำการศึกษาว่าการให้คะแนนของกรรมการ 5 (k=5) ท่านนั้นมีความสอดคล้องกันหรือไม่
Cochran’s Q test เป็นการศึกษาว่าประชากร k กลุ่มมีค่ามัธยฐานแตกต่างกันหรือไม่ โดยตัวอย่างนั้นมีความสัมพันธ์กัน และลักษณะของข้อมูลในแต่ละกลุ่มอยู่ในรูปของความถี่ โดยจะแบ่งออกเป็น 2 ส่วนคือ ส่วนที่มีค่าสังเกตมากกว่าหรือเท่ากับมัธยฐาน และอีกส่วนหนึ่งคือส่วนที่มีค่าสังเกตที่ต่ำกว่ามัธยฐาน