1 / 20

K-means Clustering

K-means Clustering. K-means Clustering. K-means การจัดกลุ่มแบบ K-means หรือเรียกอีกอย่างหนึ่งว่า การวิเคราะห์กลุ่มแบบไม่เป็น ขั้นตอน ( Nonhierarchical Cluster Analysis) หรือ การแบ่งส่วน ( Partioning )

mikej
Download Presentation

K-means Clustering

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. K-means Clustering

  2. K-means Clustering • K-means การจัดกลุ่มแบบ K-means หรือเรียกอีกอย่างหนึ่งว่า การวิเคราะห์กลุ่มแบบไม่เป็น ขั้นตอน (Nonhierarchical Cluster Analysis) หรือ การแบ่งส่วน (Partioning) • K-means เป็นอัลกอริทึมเทคนิคการเรียนรู้โดยไม่มีผู้สอนที่ง่ายที่สุด เพราะเป็น การแก้ปัญหาการจัดกลุ่มที่รู้จักกันทั่วไป โดยอัลกอริทึม K-Means จะตัดแบ่ง (Partition) วัตถุออกเป็น K กลุ่ม และแทนค่าแต่ละกลุ่มด้วยค่าเฉลี่ยของกลุ่ม ซึ่งใช้เป็นจุดศูนย์กลาง (centroid) ของกลุ่มในการวัดระยะห่างของข้อมูลในกลุ่มเดียวกัน

  3. วิธีการทำ K-Mean Clustering • วิธีการ • 1.กำหนดหรือสุ่มค่าเริ่มต้น จำนวน kค่า(กลุ่ม) และกำหนดจุด ศูนย์กลางเริ่มต้น k จุด เรียกว่า cluster centers หรือ(centroid) • 2. นำวัตถุทั้งหมดจัดเข้ากลุ่ม โดยทำการหาค่าระยะห่างระหว่างข้อมูล กับจุดศูนย์กลาง หากข้อมูลไหนใกล้ค่าจุดศูนย์กลางตัวไหนที่สุดอยู่ กลุ่มนั้น • 3. หาค่าเฉลี่ย แต่ละกลุ่ม ให้เป็นค่าจุดศูนย์กลางใหม่ • 4. ทำซ้ำข้อ 2 จนกระทั่งค่าเฉลี่ยหรือจุดศูนย์กลางในแต่ละกลุ่มจะไม่ เปลี่ยนแปลงจึงหยุดทำ

  4. ตัวอย่างการทำK-Mean Clustering

  5. ตัวอย่างการทำK-Mean Clustering • สุ่มค่าเริ่มต้น จำนวน k ค่า เรียกว่า cluster centers (centroid) • สมมติ k =3 แสดงว่า c1,c2และc3 เป็น centroidที่เราสุ่มขึ้นมา c1(2, 10),c2(5,8) และ c3(1,2)

  6. ตัวอย่างการทำK-Mean Clustering ขั้นตอนที่ 1 • หาความห่างกันระหว่างข้อมูล 2 ข้อมูล คือ หาความห่างจากข้อมูล A=(x1,y1)และ centroid =(x2,y2)โดยใช้สูตร Euclidean ดังนี้ • และนำไปใส่ในตาราง หรือ

  7. ตัวอย่างการทำK-Mean Clustering ขั้นตอนที่ 2 หาระยะห่างระหว่างข้อมูล กับจุดศูนย์กลาง (ตัวอย่างบางชุดข้อมูล)

  8. ตัวอย่างการทำK-Mean Clustering เมื่อใส่ข้อมูลในตารางจะได้การจัดกลุ่มข้อมูลดังต่อไปนี้ และนำไปสร้างกลุ่มใหม่

  9. ตัวอย่างการทำK-Mean Clustering Custer 1 A1 (2,10) Custer 3 A2(2,5) A8(1,2) Custer 2 A3(8,4) A4(5,8) A5(7,5) A6(6,4) นำมาสร้างกลุ่มใหม่ จะได้การจัดกลุ่มใหม่ดังภาพ

  10. ตัวอย่างการทำK-Mean Clustering ขั้นตอนที่ 3 หาค่าเฉลี่ยแต่ละกลุ่ม ให้เป็น ค่าจุดศูนย์กลางใหม่ สำหรับCluster 1มีจุดเดียวคือ A1(2, 10)แสดงว่า C1(2,10)ยังคงเดิม สำหรับ Cluster 2มี 5 จุดอยู่กลุ่มเดียวกัน เพราะฉะนั้นหา C2ใหม่ ( (8+5+7+6+4)/5, (4+8+5+4+9)/5 ) =C2(6,6) สำหรับ Cluster 3มี 2 จุดอยู่กลุ่มเดียวกัน ( (2+1)/2, (5+2)/2 ) =C3(1.5,3.5)

  11. ตัวอย่างการทำK-Mean Clustering รอบที่ 2ทำตามวิธีที่ 1-4 จะได้ผลลัพธ์ดังนี้

  12. ตัวอย่างการทำK-Mean Clustering • สร้างกลุ่มใหม่ • หาจุดศูนย์กลางใหม่จะได้ • C1=(2+4/2,10+9/2)=(3,9.5) • C2=(6.5,5.25) • C3=(1.5,3.5) Custer 2 A3(8,4) A4(5,8) A5(7,5) A6(6,4) Custer 1 A1(2,10) A8(4,9) Custer 3 A2(2,5) A7(1,2) รอบที่ 2

  13. ตัวอย่างการทำK-Mean Clustering รอบที่ 3

  14. ตัวอย่างการทำK-Mean Clustering • สร้างกลุ่มใหม่ • หาจุดศูนย์กลางใหม่จะได้ • C1=(3.67,9) • C2=(7,4.33) • C3=(1.5,3.5) Custer 1 A1(2,10) A8(4,9) A4(5,8) Custer 2 A3(8,4) A4(5,8) A6(6,4) Custer 3 A2(2,5) A7(1,2) รอบที่ 3

  15. ตัวอย่างการทำK-Mean Clustering รอบที่ 4

  16. ตัวอย่างการทำK-Mean Clustering • สร้างกลุ่มใหม่ • หาจุดศูนย์กลางใหม่จะได้ • C1=(3.67,9) • C2=(7,4.33) • C3=(1.5,3.5) Custer 1 A1(2,10) A8(4,9) A4(5,8) Custer 2 A3(8,4) A4(5,8) A6(6,4) Custer 3 A2(2,5) A7(1,2) รอบที่ 4 Stop **เมื่อไม่มีการเปลี่ยนแปลงให้หยุดการทำงาน**

  17. ตัวอย่างการทำK-Mean Clustering ผลลัพธ์ จะได้ผลลัพธ์ดังภาพ ก่อน ผลลัพธ์

  18. ข้อดีของการทำ K-Mean Clustering 1.เมื่อจำนวนข้อมูลมีจำนวนมาก และมีจำนวนกลุ่มน้อย การหา ค่าเฉลี่ยแบบ K-meansอาจจะคำนวณได้เร็วกว่า การจัดกลุ่ม แบบอื่น ๆ (Hierarchical) 2.ขั้นตอนการหาค่าเฉลี่ยแบบ K-meansอาจจะได้สมาชิก ภายในกลุ่ม หนาแน่นกว่าการจัดกลุ่มแบบ Hierarchicalโดยเฉพาะถ้ากลุ่มเป็นวงกลม

  19. ข้อด้อยของการทำ K-Mean Clustering การหาค่า K ที่เหมาะสมคาดเดาได้ยาก 2. ทำงานได้ไม่ดีถ้ากลุ่มข้อมูลไม่เป็นรูปวงกลม 3. มีข้อจากัดในเรื่องของขนาด ความหนาแน่น และรูปร่าง

  20. สมาชิก 1.นางสาวภัทรพร แสงสัมพันธ์ รหัสนิสิต 57160198 2.นางสาวชาลินี ศิลารัตน์ รหัสนิสิต 57160406 3.นางสาวณิชานันทน์ แดงมา รหัสนิสิต 57160410 4.นางสาวชลิดา พงศ์จริยา รหัสนิสิต 57160566 5.นางสาวเบญจมาศ แควภูเขียวรหัสนิสิต 57160580 6.นางสาวปภัสวรรณ คำทูม รหัสนิสิต 57160583

More Related