240 likes | 363 Views
R For Statistical Analysis. ปราณี นิลกรณ์. การใช้ R เพื่อการวิเคราะห์ทางสถิติ. สำหรับผู้ไม่คุ้นกับการใช้ คำสั่ง หรือ การเขียนโปรแกรม มีผู้พัฒนา package ที่ทำเป็นเมนูให้เลือก ซึ่งเรียก R Commander
E N D
R For Statistical Analysis ปราณี นิลกรณ์
การใช้ R เพื่อการวิเคราะห์ทางสถิติ • สำหรับผู้ไม่คุ้นกับการใช้ คำสั่ง หรือ การเขียนโปรแกรม มีผู้พัฒนา package ที่ทำเป็นเมนูให้เลือก ซึ่งเรียก R Commander • ในการบรรยายนี้ จะเน้น การวิเคราะห์ข้อมูลโดยใช้ RCommander โดยเรียงลำดับขั้นตอนการวิเคราะห์ตั้งแต่ • การอ่านข้อมูลเข้า • การคำนวณสถิติพรรณนา • การสร้างกราฟ • การใช้สถิติอนุมาน เช่น การทดสอบสมมติฐาน การวิเคราะห์การถดถอย
R commander • การใช้ R commander เหมือนกับการใช้โปรแกรมสำเร็จรูปทางสถิติอื่นๆ (เช่น SPSS) คือมีเมนูและ dialog box ให้คลิ้กเลือกในการอ่านข้อมูลเข้า จัดการข้อมูลและวิเคราะห์ข้อมูล • รายละเอียดเกี่ยวกับ R commander และวิธีใช้ อ่านได้จาก Getting Started With the R Commander โดย John Fox (10 July 2010) (อยู่ใน Help ของ R Commander)
R Commander หน้าต่าง R commander แบ่งเป็น 3 ส่วน คือ • ส่วนบนสุด เป็น script window สำหรับเก็บคำสั่ง R ที่เกิดจากการใช้เมนูต่างๆหรือผู้ใช้อาจพิมพ์คำสั่ง R ลงไปเองโดยตรง • ส่วนกลางเป็น output window • ส่วนล่าง เป็น message window ที่ระบบใช้แสดงข้อผิดพลาด คำเตือน หรือ ข้อมูลอื่นๆให้ผู้ใช้ทราบ • ถ้าผู้ใช้สร้างกราฟ จะมีหน้าต่างกราฟต่างหาก
เมนู ของ R Commander • File จัดการเกี่ยวกับไฟล์ • Edit แก้ไขเนื้อหาใน script และ output windows • Data สำหรับอ่านและจัดการเกี่ยวกับข้อมูล • Statistics สำหรับคำนวณสถิติต่างๆ • Graphs สำหรับสร้างกราฟพื้นฐานทางสถิติ • Models สำหรับคำนวณสถิติที่เกี่ยวข้องกับตัวแบบทางสถิติ เช่น การถดถอยฯลฯ • Distribution คำนวณความน่าจะเป็นภายใต้การแจกแจงต่างๆ • Tools สำหรับ load packages และ plug-in ต่างๆ • Help
Toolbar ของ R Commander • ใต้แถบเมนู จะมี toolbar ดังนี้ Tool Bar
Toolbar ของ R Commander • ปุ่มซ้ายสุด แสดงชุดข้อมูลที่กำลังใช้งานอยู่(active data set) เริ่มต้น จะยังไม่มี active data set ถ้าคลิ้กปุ่มนี้ จะสามารถเลือกชุดข้อมูลที่มีอยู่ในหน่วยความจำมาใช้ได้ • ตรงกลางเป็นปุ่ม Edit data set และ View data set ใช้สำหรับเรียก active data set มาแก้ไข หรือดูข้อมูล • ปุ่มขวาสุด แสดง ตัวแบบสถิติที่ใช้อยู่ เริ่มต้น จะยังไม่มี active model
Data Input การนำข้อมูลเข้ามาใน R Commander ทำได้หลายวิธี • Key ข้อมูลเข้าโดยตรง โดยใช้ Data -> New data set … • import ข้อมูลจาก text file, SPSS, Minitab, Stata, Excel, Access, dBase • อ่าน data set จากที่มีอยู่ใน R package
การ Key ข้อมูลเข้าโดยตรง • ให้เลือก Data-> New data set .. จาก R Commander menu จะปรากฏหน้าต่างดังนี้
การ Key ข้อมูลเข้าโดยตรง • ให้พิมพ์ชื่อ ชุดข้อมูลลงไปตามที่ต้องการตั้ง(ถ้าไม่ตั้ง โดยอัตโนมัติจะมีชื่อเป็น “Dataset”) • ชื่อ data set อาจเริ่มต้นด้วย ตัวอักษรเล็ก /ตัวอักษรใหญ่ แล้วตามด้วย ตัวอักษรทั้งหมด /periods/ underscores/ตัวเลข แต่ห้ามมี Blank มิฉะนั้นจะถือว่ามีหลายชุดข้อมูล • แล้ว Click OK จะปรากฏ Data Editor Window ดังภาพต่อไป • ชื่อ data set ที่ตั้งไว้นี้ จะใช้เป็นชื่ออ้างอิงข้อมูลที่อ่านเข้ามาต่อไป
การ Key ข้อมูลเข้าโดยตรง • ใส่ข้อมูล แต่ละตัวแปรตามต้องการ • ตั้งชื่อตัวแปรโดยการคลิ้กที่ var1 , var2 ฯลฯ จะทำให้ปรากฏ Variable editor dialog box ดังนี้ • ให้พิมพ์ชื่อตัวแปรตามที่ต้องการลงไปแทน var1 var2 ฯลฯ • เลือกเมนู File -> Close from the Data Editor หรือ คลิ้ก ที่มุมขวาบนเพื่อปิด Data editor ข้อมูลที่พิมพ์เข้าไปจะเป็น active data set
การอ่านข้อมูลจาก Text File • ในการเก็บข้อมูลใน Text File แถวแรกควรเป็นชื่อตัวแปร • แถวต่อๆไป เป็นค่าของตัวแปร โดย 1 แถวเป็นข้อมูลของ 1 case(คน) หรือ 1 หน่วยสังเกต • ข้อมูลของแต่ละตัวแปรควรแยกจากกันด้วย อย่างน้อย 1 ช่องว่าง หรือ มี comma คั่น หรือ ใช้ tab คั่น • ข้อมูลสูญหาย ให้ใช้ NA แทน • ตัวแปรที่มีค่าข้อมูลเป็น string R จะถือว่าตัวแปรนั้นเป็น factor • ใช้คำสั่ง Data -> Import data from text file
ตัวอย่างข้อมูลใน Text file Id VitaminC Placebo 1 145 417 2 185 279 3 387 678 4 593 636 5 248 170 6 245 699 7 349 372 8 902 582 9 159 363 10 122 258 11 264 288 12 1052 526 13 218 180 14 117 172 15 185 278
การอ่านข้อมูลจาก Text File • R Commander จะขึ้นหน้าต่างดังนี้ให้
การอ่านข้อมูลจาก Text File • ให้ตั้งชื่อ data set ตามที่ต้องการ แล้ว Click OK • Read Text Data dialog จะเปิด Open file dialog ให้ ให้ไปที่ไฟล์ที่ต้องการอ่าน แล้วคลิ้ก Open จะทำให้ไฟล์ถูกอ่านเข้ามาใน R และชุดข้อมูลนี้จะเป็น active data set • ถ้าต้องการดูข้อมูล ให้ click View data set • การอ่านข้อมูลจาก SPSS, Excel ฯลฯทำได้ทำนองเดียวกัน
การจัดการข้อมูล การ recode • เลือก Data->Manage variables in active data set->Recode Variables การคำนวณตัวแปรใหม่ • เลือก Data->Manage variables in active data set ->Compute New Variables
การคำนวณสถิติพรรณนา • เมื่อมี active data set แล้ว สามารถคำนวณสถิติต่างๆได้ด้วย menu ของ R commander • การคำนวณสถิติพรรณนา เลือกเมนู Statistics -> Summaries->Numerical summaries จะปรากฏ dialog box ดังนี้ • เฉพาะตัวแปร numeric เท่านั้นที่ปรากฏใน dialog box • เลือกตัวแปรที่ต้องการ แล้วคลิ้ก OK
การสร้างกราฟ • เลือกเมนู Graphs->Histogram….. จะปรากฏ Histogram dialog box ให้เลือกตัวแปรที่ต้องการ แล้วคลิ้ก OK • กราฟอื่น เลือกได้ทำนองเดียวกัน
การทดสอบสมมติฐาน – เปรียบเทียบค่าเฉลี่ย 2 ประชากร ข้อมูลจับคู่ • เลือกเมนู Statistics->Means-> Paired t test ข้อมูลอิสระ • เลือกเมนู Statistics->Means-> Independent samples t test
การทดสอบการเท่ากันของความแปรปรวนของ 2 ประชากร • เลือกเมนู Statistics->Variances-> Levene’s test • ตัวอย่าง output Levene's Test for Homogeneity of Variance (center = median) Df F value Pr(>F) group 1 12.508 0.0006091 *** 103 --- Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ‘ 1
การหาความเชื่อมั่นของแบบสอบถามการหาความเชื่อมั่นของแบบสอบถาม • เลือกเมนู Statistics->Dimensional Analysis-> scale reliability