1 / 29

บท ที่ 6 สถิติเชิงพรรณนา

บท ที่ 6 สถิติเชิงพรรณนา. 4122608A โปรแกรมประยุกต์ด้าน วิทยาศาสตร์ อ.ชาณิภา ซ่อนกลิ่น. ประเภทของสถิติที่ใช้วิเคราะห์ข้อมูล.

radley
Download Presentation

บท ที่ 6 สถิติเชิงพรรณนา

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. บทที่ 6 สถิติเชิงพรรณนา 4122608A โปรแกรมประยุกต์ด้านวิทยาศาสตร์ อ.ชาณิภา ซ่อนกลิ่น

  2. ประเภทของสถิติที่ใช้วิเคราะห์ข้อมูลประเภทของสถิติที่ใช้วิเคราะห์ข้อมูล ในการวิเคราะห์ข้อมูลของงานวิจัย โดยส่วนใหญ่จะใช้สถิติเป็นเครื่องมือในการวิเคราะห์ ผู้วิจัยต้องเลือกใช้สถิติตามวัตถุประสงค์ของงานวิจัย ลักษณะของข้อมูลและข้อตกลงเบื้องต้นของสถิตินั้นๆ ซึ่งจะทำให้ผลวิจัยมีความถูกต้อง มีคุณภาพและเป็นที่น่าเชื่อถือ

  3. ประเภทของสถิติที่ใช้วิเคราะห์ข้อมูลประเภทของสถิติที่ใช้วิเคราะห์ข้อมูล แบ่งเป็น 2 ประเภท คือ 1.สถิติเชิงพรรณนา(Descriptive Statistics) คือ สถิติที่ใช้เพื่ออธิบาย บรรยาย หรือสรุปลักษณะของกลุ่มข้อมูลที่เป็นตัวเลขที่เก็บรวบรวมมา ซึ่งจะไม่สามารถอ้างอิงลักษณะของประชากรได้(ยกเว้นมีการเก็บข้อมูลของประชากรทั้งหมด) ตัวอย่างสถิติเชิงพรรณนา เช่น - การแจกแจงความถี่(Frequencies Distribution) - การวัดค่ากลางของข้อมูล(Measures Central Tendency) - การวัดการกระจายของข้อมูล(Measures of Dispersion)

  4. ประเภทของสถิติที่ใช้วิเคราะห์ข้อมูลประเภทของสถิติที่ใช้วิเคราะห์ข้อมูล แบ่งเป็น 2 ประเภท คือ 2.สถิติเชิงอนุมาน(Inferential Statistics) คือ สถิติที่ใช้ในการวิเคราะห์ข้อมูลกลุ่มตัวอย่างที่เป็นตัวแทนของประชากร ซึ่งสามารถนำผลการวิเคราะห์นั้นไปสรุปอ้างอิงถึงประชากรได้ โดยใช้ทฤษฎีความน่าจะเป็น(Probability Concepts) ตัวอย่างสถิติเชิงอนุมาน เช่น - การประมาณค่า(Estimation) - การทดสอบสมมติฐาน(Hypothesis Test)

  5. สถิติเชิงพรรณนา(Descriptive Statistics) 1. การแจกแจงความถี่(Frequencies Distribution) เป็นการจัดเรียงข้อมูลเป็นกลุ่ม (Grouping Data) เพื่อหาความถี่(หรือจำนวน) แยกตามค่าของตัวแปรที่ต้องการจำแนก เช่น การจำแนกจำนวนและร้อยละของนักศึกษาแยกตามคณะ ตารางแจกแจงความถี่แบบทางเดียว ความถี่(Frequencies)หมายถึง การเกิดขึ้นของข้อมูลใดข้อมูลหนึ่งที่เกิดขึ้นซ้ำๆกัน

  6. สถิติเชิงพรรณนา(Descriptive Statistics) 1. การแจกแจงความถี่(Frequencies Distribution) ตารางแจกแจงความถี่แบบ 2 ทาง เช่น ตารางแสดงจำนวนนักศึกษาแยกตามคณะและเพศ ตารางแจกแจงความถี่แบบ 3 ทาง เช่น ตารางแสดงจำนวนนักศึกษาแยกตามคณะ สาขาวิชา และเพศ

  7. สถิติเชิงพรรณนา(Descriptive Statistics) 1. การแจกแจงความถี่(Frequencies Distribution) ตารางแจกแจงความถี่สะสม คือ ตารางที่แสดงผลรวมของความถี่ของอันตรภาคชั้นนั้นกับความถี่ของอันตรภาคชั้นที่มีค่าต่ำกว่าทั้งหมด เช่น ตารางแสดงความถี่สะสมของนักเรียนระดับชั้นมัธยมศึกษาปีที่ 1 ถึง ปี 3

  8. สถิติเชิงพรรณนา(Descriptive Statistics) 1. การแจกแจงความถี่(Frequencies Distribution) การแจกแจงความถี่โดยใช้กราฟหรือแผนภูมิ จะเป็นลักษณะการนำเสนอข้อมูลที่ชัดเจนมากกว่าตารางต่างๆ ข้างต้นที่แสดงเป็นตัวเลข ตัวอย่างกราฟหรือแผนภูมิ เช่น ฮิสโตแกรม(Histogram) กราฟเส้นโค้งความถี่(Frequencies Curve)

  9. สถิติเชิงพรรณนา(Descriptive Statistics) 1. การแจกแจงความถี่(Frequencies Distribution) การแจกแจงความถี่ใช้ได้กับข้อมูลเชิงปริมาณและข้อมูลเชิงคุณภาพ แต่จะเหมาะกับข้อมูลเชิงคุณภาพมากกว่า ซึ่งได้แก่ ข้อมูลระดับนามบัญญัติ และข้อมูลเรียงลำดับ คำสั่งในโปรแกรม PSPP ที่ใช้วิเคราะห์ คือ คำสั่ง Frequencies

  10. สถิติเชิงพรรณนา(Descriptive Statistics) 2. การวัดค่ากลางของข้อมูล(Measures Central Tendency) คือ การหาค่ากลางๆ ที่เป็นตัวเลข เพื่อใช้เป็นตัวแทนของข้อมูลชุดหนึ่งๆ ซึ่งพบว่าในการวิจัยทั่วๆไป นิยมใช้ค่ากลางในการสรุปลักษณะหรือตัวแปรกันมาก สถิติที่ใช้วัดค่ากลางของข้อมูล เช่น ค่าฐานนิยม(Mode) ค่ามัธยฐาน(Median) ค่าเฉลี่ย(Mean)

  11. สถิติเชิงพรรณนา(Descriptive Statistics) 2. การวัดค่ากลางของข้อมูล(Measures Central Tendency) 2.1 ค่าฐานนิยม(Mode) คือ ค่าข้อมูลที่มีความถี่มากที่สุด สัญลักษณ์ที่ใช้ คือ Mo 2.2 ค่ามัธยฐาน(Median) คือ ค่าของข้อมูลที่อยู่ ณ ตำแหน่งตรงกลางของชุดข้อมูลที่มีการจัดเรียงลำดับจากค่ามากไปหาค่าน้อยหรือค่าน้อยไปหาค่ามากแล้ว สัญลักษณ์ที่ใช้ คือ Md 2.3 ค่าเฉลี่ย(Mean) หรือค่ามัชฌิมเลขคณิต เป็นค่าที่คำนวณมาจากการนำค่าผลรวมของข้อมูลทั้งหมดหารด้วยจำนวนทั้งหมด สัญลักษณ์ที่ใช้คือ

  12. สถิติเชิงพรรณนา(Descriptive Statistics) 2. การวัดค่ากลางของข้อมูล(Measures Central Tendency) 2.3 ค่าเฉลี่ยประชากร = = x1+x2+x3 +….xN 2.4 ค่าเฉลี่ยตัวอย่าง X = = x1+x2+x3+…. xn N n

  13. สถิติเชิงพรรณนา(Descriptive Statistics) 2. การวัดค่ากลางของข้อมูล(Measures Central Tendency) ความสัมพันธ์ระหว่างค่ากลาง ฐานนิยมมัธยฐานค่าเฉลี่ย ข้อมูลมีการแจกแจงแบบปกติ (Normal Distribution) Mo = Md = ที่มา http://www.sahavicha.com/?name=knowledge&file=readknowledge&id=4053

  14. สถิติเชิงพรรณนา(Descriptive Statistics) 2. การวัดค่ากลางของข้อมูล(Measures Central Tendency) ความสัมพันธ์ระหว่างค่ากลาง ฐานนิยมมัธยฐานค่าเฉลี่ย ข้อมูลมีการแจกแจงแบบเบ้ซ้าย (Negative Skewed Distribution) Mo > Md > ที่มา http://www.sahavicha.com/?name=knowledge&file=readknowledge&id=4053

  15. สถิติเชิงพรรณนา(Descriptive Statistics) 2. การวัดค่ากลางของข้อมูล(Measures Central Tendency) ความสัมพันธ์ระหว่างค่ากลาง ฐานนิยมมัธยฐานค่าเฉลี่ย ข้อมูลมีการแจกแจงแบบเบ้ขวา (Positive Skewed Distribution) Mo < Md < ที่มา http://www.sahavicha.com/?name=knowledge&file=readknowledge&id=4053

  16. สถิติเชิงพรรณนา(Descriptive Statistics) 2. การวัดค่ากลางของข้อมูล(Measures Central Tendency) ข้อดีและข้อจำกัดของค่ากลาง

  17. สถิติเชิงพรรณนา(Descriptive Statistics) 2. การวัดค่ากลางของข้อมูล(Measures Central Tendency) สถิติที่ใช้ในการวัดตำแหน่งข้อมูล การคำนวณหาค่าของข้อมูลในตำแหน่งใดๆสามารถทำได้โดยคำนวณจากเปอร์เซ็นต์ไทล์(Percentile) หรือควอไทล์(Quartiles)

  18. สถิติเชิงพรรณนา(Descriptive Statistics) 2. การวัดค่ากลางของข้อมูล(Measures Central Tendency) สถิติที่ใช้ในการวัดตำแหน่งข้อมูล • ควอไทล์ คือ ค่าของข้อมูลที่อยู่ตำแหน่งควอไทล์ที่ต้องการ เช่น ควอไทล์ที่ 1 คือค่าของข้อมูลที่อยู่ตำแหน่งที่มีจำนวนข้อมูลที่มีค่าน้อยกว่าอยู่ร้อยละ 25 และมีจำนวนค่าของข้อมูลที่มากกว่าหรือเท่ากับอยู่ร้อยละ 75 • โดยการคำนวณจะแบ่งข้อมูลออกเป็น 4 ส่วนเท่าๆกัน ซึ่งค่าควอไทล์จะมี 3 ค่า • ควอไทล์ที่ 1 (Q1) คือ ค่าเปอร์เซ็นต์ไทล์ที่ 25 • ควอไทล์ที่2 (Q2) คือ ค่าเปอร์เซ็นต์ไทล์ที่ 50 • ควอไทล์ที่3 (Q3) คือ ค่าเปอร์เซ็นต์ไทล์ที่ 75 1/4 1/4 1/4 1/4 ----------------------------- Q1 Q2 Q3

  19. สถิติเชิงพรรณนา(Descriptive Statistics) 3. การวัดการกระจายของข้อมูล(Measures of Dispersion) เป็นการเปรียบเทียบข้อมูลมากกว่า 1 กลุ่ม เพื่อดูลักษณะของข้อมูลว่าข้อมูลภายในกลุ่มมีความแตกต่างกันมากน้อยเพียงใดเมื่อเปรียบเทียบกับข้อมูลอีกกลุ่มหนึ่ง ถ้าข้อมูลมีการกระจายมาก แสดงว่าข้อมูลแต่ละตัวมีค่าแตกต่างจากค่ากลางมาก ถ้าข้อมูลมีค่าการกระจายน้อยแสดงว่าข้อมูลมีค่าแตกต่างจากค่ากลางน้อย

  20. สถิติเชิงพรรณนา(Descriptive Statistics) 3. การวัดการกระจายของข้อมูล(Measures of Dispersion) อายุการใช้งานจอภาพคอมพิวเตอร์ 2 ยี่ห้อ พิจารณาค่ากลางของข้อมูล(ค่าเฉลี่ย) เท่ากันแสดงว่าอายุการใช้งานของทั้งสองยี่ห้อไม่แตกต่างกัน แต่ถ้าพิจารณาข้อมูลภายในกลุ่ม จะพบว่ายี่ห้อที่ 1 มีอายุการใช้งานแตกต่างจากค่ากลาง(13)มากกว่า ส่วนยี่ห้อที่ 2 มีอายุการใช้งานใกล้เคียงกับค่ากลาง ดังนั้นถ้าพิจารณาการกระจายข้อมูลควรเลือกจอภาพยี่ห้อที่ 2 ยี่ห้อที่ 1(ปี) : 9 9 7 8 19 19 20 ยี่ห้อที่ 2(ปี) : 15 14 15 11 13 11 12 ค่าเฉลี่ยของอายุการใช้งานทั้งสองยี่ห้อเท่ากัน คือ 13 ปี

  21. สถิติเชิงพรรณนา(Descriptive Statistics) 3. การวัดการกระจายของข้อมูล(Measures of Dispersion) ดังนั้นการเปรียบเทียบข้อมูลหลายๆชุด ควรพิจารณาทั้งค่าเฉลี่ยและการกระจายของข้อมูลควบคู่กันไป ถ้าข้อมูลหลายๆชุดมีค่าเฉลี่ยเท่ากัน การตัดสินใจว่าข้อมูลชุดใดดีกว่ากันก็จะพิจารณาที่ค่าการกระจายที่มีค่าต่ำสุด เพราะชุดที่มีค่าการกระจายมากแสดงว่าค่ากลางไม่เป็นตัวแทนที่ดีของข้อมูลชุดนั้น

  22. สถิติเชิงพรรณนา(Descriptive Statistics) 3. การวัดการกระจายของข้อมูล(Measures of Dispersion) สถิติสำหรับการคำนวณหาค่ากระจาย 3.1 พิสัย(Range) คือ ค่าสูงสุด – ค่าต่ำสุด (R = Xmax - Xmin) 3.2 พิสัยควอไทล์(Inter-Quartile Range:IQR) คือ ความแตกต่างระหว่าง ควอไทล์ที่3 กับ ควอไทล์ที่1 (IQR = Q3 – Q1) 3.3 ค่าความแปรปรวน(Variance) เป็นค่าที่นิยมนำมาใช้ในการวัดการกระจายมากที่สุด มาจากค่าความแตกต่างระหว่างค่าของข้อมูลแต่ละค่ากับค่าเฉลี่ย ซึ่งถ้าค่าที่ได้เป็น 0 แสดงว่าข้อมูลชุดนั้นไม่มีการกระจายหรือทุกค่ามีค่าเท่ากับค่ากลางนั้นเอง

  23. สถิติเชิงพรรณนา(Descriptive Statistics) 3. การวัดการกระจายของข้อมูล(Measures of Dispersion) สถิติสำหรับการคำนวณหาค่ากระจาย 3.3 ค่าความแปรปรวน(Variance) • ค่าความแปรปรวนของประชากร = = • ค่าความแปรปรวนตัวอย่าง S2 = หน่วยของความแปรปรวน คือ หน่วยข้อมูลยกกำลังสอง เช่น (ปี)2

  24. สถิติเชิงพรรณนา(Descriptive Statistics) 3. การวัดการกระจายของข้อมูล(Measures of Dispersion) สถิติสำหรับการคำนวณหาค่ากระจาย 3.4 ค่าส่วนเบี่ยงเบนมาตรฐาน(Standard Deviation : Std. deviation)คือ ค่ารากที่สองของค่าความแปรปรวน • ค่าส่วนเบี่ยงเบนมาตรฐานประชากร • ค่าส่วนเบี่ยงเบนมาตรฐานตัวอย่าง

  25. สถิติเชิงพรรณนา(Descriptive Statistics) 3. การวัดการกระจายของข้อมูล(Measures of Dispersion) สถิติสำหรับการคำนวณหาค่ากระจาย 3.5 ค่าคลาดเคลื่อนมาตรฐานของค่าเฉลี่ย(Standard Error of Mean : S.E. mean)คือ ค่าที่พิจารณามาจากความแตกต่างระหว่างค่าเฉลี่ยของกลุ่มตัวอย่างกับค่าเฉลี่ยของประชากร ( ) ค่ากระจายที่ได้ไม่ว่าจะคำนวณโดยวิธีใด ถ้าที่ได้มีค่ามากแสดงว่าข้อมูลมีการกระจายมาก หากค่าที่ได้มีค่าน้อยแสดงว่าข้อมูลมีการกระจายน้อย

  26. การวัดลักษณะของเส้นโค้งการวัดลักษณะของเส้นโค้ง 1.ความเบ้ (Skewness) เป็นค่าที่ใช้วัดลักษณะของเส้นโค้งว่ามีความเบ้หรือไม่ • ไม่เบ้ คือ ค่าสัมประสิทธิ์ความเบ้เป็นศูนย์ แสดงว่าข้อมูลมีความสมมาตร • เบ้ซ้าย คือ ค่าสัมประสิทธิ์ความเบ้เป็นลบ • เบ้ขวา คือ ค่าสัมประสิทธิ์ความเบ้เป็นบวก ที่มา: http://www.pertrac.com/blog/the-risk-assessment-spectrum-a-critical-tool-for-investors-pt2/

  27. การวัดลักษณะของเส้นโค้งการวัดลักษณะของเส้นโค้ง 2.ความโด่ง (Kurtosis) เป็นค่าที่ใช้วัดลักษณะของเส้นโค้งว่ามีความโด่งหรือไม่ • ค่าเป็นศูนย์ คือ กราฟที่มีการแจกแจงปกติ • ค่าเป็นบวก คือ เส้นโด่งสูงมาก • ค่าเป็นลบ คือ เส้นโด่งน้อยหรือป้าน ที่มา: http://www.unt.edu/rss/class/Jon/ISSS_SC/Module003/isss_m3_describingdata/node6.html/

  28. การวิเคราะห์สถิติเชิงพรรณนาการวิเคราะห์สถิติเชิงพรรณนา 1.คำสั่ง Frequencies เป็นคำสั่งที่ให้หาจำนวนและร้อยละของข้อมูลหนึ่งกลุ่ม หรือ เป็นคำสั่งที่ใช้สร้างตารางแจกแจงความถี่ทางเดียวของตัวแปรที่สนใจ ใช้ได้ทั้งข้อมูลเชิงปริมาณ และข้อมูลเชิงคุณภาพ 2.คำสั่ง Descriptive เป็นคำสั่งที่ใช้ในการหาค่าสถิติเบื้องต้น ซึ่งแสดงออกมาเป็นตารางสถิติต่างๆ ใช้ได้ดีกับข้อมูลเชิงปริมาณ 3. คำสั่ง Explore เป็นคำสั่งที่ใช้ในการสรุปค่าสถิติเบื้องต้น แยกตามตัวแปรที่สนใจ โดยมากมักใช้กับข้อมูลเชิงปริมาณที่ต้องการจำแนกตามข้อมูลเชิงคุณภาพ เช่น สร้างตารางสรุปค่าสถิติเบื้องต้นแยกตามเพศ 4. คำสั่ง Crosstabs เป็นคำสั่งเกี่ยวกับการสร้างตารางแจกแจงแบบหลายทาง และสามารถแสดงได้ทั้งค่าความถี่ ร้อยละ การคำนวณค่าสถิติเพื่อทดสอบสมมติฐาน เช่น สถิติทดสอบไคสแคว์(Chi-square Test) เหมาะกับข้อมูลเชิงคุณภาพ

  29. แบบฝึกหัด จงสร้างแฟ้มข้อมูลดังต่อไปนี้แล้วตอบคำถาม 1.จงสร้างตารางแจกแจงความถี่ของตัวแปร time แยกตามตัวแปร group 2.หาค่าเฉลี่ยของตัวแปร timeแยกตามตัวแปรgroup 3.หาสถิตที่ใช้วัดการกระจายมา 2 ชนิดพร้อมทั้งอธิบาย ผลลัพธ์ 4.สร้างตาราง crosstabs แสดงความถี่ ร้อยละ ของตัวแปร timeและ group

More Related