1 / 28

การจัดการข้อมูล : การทำคลังข้อมูล การวิเคราะห์เหมือง ข้อมูลและการทำให้จินตนาการเห็น

การจัดระเบียบบริหารข้อมูล : สถานที่จัดเก็บข้อมูล หาวิธีการจัดเก็บข้อมูล, การจัดเรียงลำดับของข้อมูล ที่สามารถมองเห็นได้และเป็นระเบียบ ( Data Management: Warehousing, Analyzing, Mining, and Visualization ).

Download Presentation

การจัดการข้อมูล : การทำคลังข้อมูล การวิเคราะห์เหมือง ข้อมูลและการทำให้จินตนาการเห็น

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. การจัดระเบียบบริหารข้อมูล : สถานที่จัดเก็บข้อมูล หาวิธีการจัดเก็บข้อมูล, การจัดเรียงลำดับของข้อมูล ที่สามารถมองเห็นได้และเป็นระเบียบ( Data Management:Warehousing, Analyzing,Mining, and Visualization)

  2. การจัดการข้อมูล: การทำคลังข้อมูล การวิเคราะห์เหมือง ข้อมูลและการทำให้จินตนาการเห็น • (Data Management : Warehousing, Analyzing, Mining • And Visualization) • หัวข้อ • การจัดการข้อมูล(Data Management): ปัจจัยแห่งความสำเร็จที่จำเป็นอย่างยิ่ง • การทำคลังข้อมูล (Data Warehousing) • การค้นพบสารสนเทศและองค์ความรู้จากซอฟท์แวร์ธุรกิจอัจฉริยะ (Information and Knowledge Discovery with Business Intelligence)

  3. 4 แนวความคิดของการทำเหมืองข้อมูลและระบบงาน (Data Mining Concepts and Applications) 5 เทคโนโลยีเพื่อการนำเสนอภาพข้อมูล (Data Visualization Technologies) 6 การจัดทำฐานข้อมูลการตลาด (Marketing Databases in Action) 7 ระบบการจัดการข้อมูลแบบเว็บ (Web-based Data Management System)

  4. วัตถุประสงค์ 1. ตระหนักถึงความสำคัญของข้อมูลประเด็นของการ จัดการข้อมูลและวงจรชีวิตของข้อมูล 2. สามารถบอกถึงที่มาของข้อมูล(หรือแหล่งข้อมูล) การเก็บรวบรวมข้อมูลและคุณภาพของข้อมูลในประเด็นต่างๆได้ 3. สามารถบรรยายระบบการจัดการเอกสาร 4. สามารถอธิบายการดำเนินการเพื่อทำคลังข้อมูลและ บทบาทของคลังข้อมูลที่จะมาสนับสนุนการตัดสินใจ

  5. 5. บรรยายการค้นพบสารสนเทศ (Information) และองค์ ความรู้ (Knowledge) และธุรกิจอัจฉริยะ(Business Intelligence) 6. เข้าใจถึงอำนาจและผลดีของการทำเหมืองข้อมูล 7.บรรยายวิธีการนำเสนอข้อมูลและระบบสารสนเทศเชิง ภูมิศาสตร์การจำลองสถานการณ์ให้เห็นและสภาพที่เป็นจริงทั้งหมดเพื่อใช้เป็นเครื่องมือช่วยสนับสนุนการตัดสินใจ 8. สามารถอภิปรายถึงบทบาทของฐานข้อมูลการตลาดและสามารถยกตัวอย่างได้ 9. ตระหนักถึงบทบาทของเว็บที่จะส่งผลต่อการการจัดการ ข้อมูล

  6. 1.การจัดการข้อมูล:ปัจจัยแห่งความสำเร็จ1.การจัดการข้อมูล:ปัจจัยแห่งความสำเร็จ • ระบบสารสนเทศต่าง ๆ จะไม่สามารถสำเร็จได้โดยปราศจากข้อมูล หากปราศจากข้อมูลแล้วก็จะไม่มีระบบสารสนเทศ หรือ หากปราศจากข้อมูล ก็จะทำให้ไม่สามารถตัดสินใจได้ดี • ปัญหาของข้อมูลและความยุ่งยาก (Data Problems and Difficulties) • ปริมาณข้อมูลจะเพิ่มขึ้นแบบทวีคูณ ข้อมูลเดิมก็จะต้องมีการเก็บรักษาเป็นระยะเวลานาน • ข้อมูลกระจายกระจายอยู่ทั่วองค์กร แต่ละหน่วยงานจะเก็บรวบรวมข้อมูลด้วยวิธีที่หลากหลาย

  7. การเพิ่มขึ้นของปริมาณข้อมูลภายนอกองค์กร (External data) • ความปลอดภัยของข้อมูล เป็นสิ่งที่จำเป็นอย่างยิ่ง • การคัดเลือกเครื่องมือในการจัดการข้อมูลเป็นปัญหาหลัก วงจรชีวิตของข้อมูล (Data life cycle Process) เพื่อทำความเข้าใจวิธีการที่จะบริหารข้อมูลให้ดียิ่งขึ้นมันก็จำเป็นที่จะต้องดูการไหลเวียนของข้อมูลในองค์กรว่าไปที่ไหนและอย่างไร ธุรกิจไม่ได้ดำเนินงานโดยใช้ข้อมูลดิบ (Raw Data) แต่จะดำเนินงานอยู่บนข้อมูลที่ถูกประมวลผลมาเป็นสารสนเทศ (Information) และองค์ความรู้ (Knowledge)

  8. แหล่งข้อมูล(Data Sources) วงจรชีวิตของข้อมูลเริ่มจากการได้รับข้อมูลมาจากแหล่งข้อมูล แหล่งข้อมูลสามารถแบ่งออกเป็น แหล่งข้อมูลภายใน ข้อมูลส่วนบุคคล และแหล่งข้อมูลภายนอก แหล่งข้อมูลภายใน(InternalData Sources) ข้อมูลภายในองค์กรมักจะเกี่ยวกับคน สินค้า บริการ ซึ่งจะพบในที่หนึ่งที่ใดหรือหลาย ๆ ที่ เช่นข้อมูลเกี่ยวกับ ลูกจ้างและค่าแรง

  9. ข้อมูลส่วนบุคคล (Personal Data) ผู้ใช้งานหรือพนักงานของบริษัททั่ว ๆ ไปอาจจะทำเอกสารของตนเองตามหน้าที่และความเชี่ยวชาญที่ตนมีโดยจัดเก็บเป็นข้อมูลส่วนตัว แหล่งข้อมูลภายนอก (External Data Sources) แหล่งข้อมูลภายนอกมีมากมายมหาศาลจึงมักไม่มีความสัมพันธ์กับระบบงานใดเป็นการเฉพาะ

  10. อินเตอร์เน็ตและการบริการฐานข้อมูลเชิงพาณิชย์ (Theinternet and Commercial Database Services)ฐานข้อมูลนับพันจะสามารถใช้งานได้โดยผ่านระบบอินเตอร์เน็ตโดยมีส่วนหนึ่งจะให้บริการฟรี สำนักพิมพ์บางสำนักพิมพ์จัดให้มีบริการเชิงพาณิชย์ (ผู้ใช้งานต้องเสียค่าบริการ) วิธีการเก็บรวบรวมข้อมูลดิบ (Methods for Collecting Raw Data) ความหลากหลายของข้อมูลและแหล่งข้อมูลส่งผลให้วิธีการเก็บรวบรวมข้อมูลมีความซับซ้อน บางครั้งจำเป็นต้องเดินทางออกภาคสนามเพื่อเก็บข้อมูล และบางกรณีก็จำเป็นต้องควานหาข้อมูลดิบจากผู้คนทั่วไป

  11. คุณภาพของข้อมูล(Data Quality) และความถูกต้อง สอดคล้องของข้อมูล (Data Integrity) คุณภาพของข้อมูล (Data Quality: DQ เป็นประเด็น ที่สำคัญที่สุดประเด็นหนึ่ง เนื่องจากคุณภาพของข้อมูลจะเป็นสิ่งที่กำหนดประโยชน์และคุณภาพของการตัดสินใจที่บนรากฐานของข้อมูล คุณภาพของข้อมูลคือสิ่งที่สำคัญพื้นฐานที่ส่งผลต่อความชาญฉลาดในการดำเนินธุรกิจคุณภาพของข้อมูลในระบบเว็บเบส (Data Qualityin Web-Based Systems)

  12. ข้อมูลที่ถูกรวบรวมจากอินเตอร์เน็ต ในลักษณะงานประจำ จะต้องมีการจัดระเบียบข้อมูลให้เป็นระบบและจัดเก็บข้อมูลก่อนที่จะนำข้อมูลไปใช้งาน การจัดการเอกสารคืออะไร ? การจัดการเอกสารคือ การควบคุมเอกสารอิเล็กทรอนิกส์ (ได้แก่ Page images, spreadsheets,word processing document และเอกสารอื่นๆตลอดวงจรชีวิต ของเอกสารที่มีอยู่ในองค์กร ตั้งแต่เริ่มสร้างจนกระทั่ง กลายเป็นเอกสารสำคัญในที่สุด

  13. 2. คลังข้อมูล (Data warehousing) บริษัทขนาดใหญ่ถึงกลางจำนวนมากที่ทำคลังข้อมูล ขึ้นมาเพื่อให้การประมวลผล การวิเคราะห์และคำสั่งค้นคืน ข้อมูล (Query) สามารถทำได้ง่ายและรวดเร็วขึ้น การประมวลผลรายการเปลี่ยนแปลง (Transaction Processing) เป็นระบบสารสนเทศ ซึ่งประมวลผลข้อมูลที่ได้รับจากการเกิดขึ้นของการทำรายการเปลี่ยนแปลง รายการเปลี่ยนแปลง เป็นเหตุการณ์ที่เป็นส่วนหนึ่งของทำ ธุรกิจ เช่น การขาย ได้มีบทบาทที่สำคัญในการสนับสนุนการดำเนินงานขององค์กร

  14. มีทางเลือกอยู่ 2 ทางเลือกในการนำไปสู่การประมวลผลการวิเคราะห์ วิธีแรก คือ ทำงานโดยตรงกับระบบปฏิบัติการ (Operational system) และใช้ Software tools, front-end tools และ middleware วิธีที่ 2 คือใช้ Data warehouse วิธีแรกจะเหมาะสมสำหรับบริษัทที่มีจำนวนผู้ใช้ไม่มาก ที่จะสอบถามข้อมูลและทำการวิเคราะห์ข้อมูลผ่านระบบปฏิบัติการ ซึ่งผู้ใช้ส่วนใหญ่จะต้องมีความรู้และทักษะด้านเทคนิคในการใช้เครื่องมืออาทิ Spreadsheets และกราฟฟิก

  15. ข้อดีของคลังข้อมูล คือ • ความสามารถในการเข้าถึงข้อมูลได้อย่างรวดเร็ว เนื่องจากมีการจัดเก็บข้อมูลในจัดว่างข้อมูลไว้เฉพาะที่ • ความสามารถในการเข้าถึงข้อมูลได้ง่ายและได้บ่อยครั้ง โดยการใช้เว็บบราวเซอร์ • คุณสมบัติของคลังข้อมูล • การจัดการอย่างเป็นระบบ (Organization) • ความสอดคล้อง (Consistency) • ระยะเวลา (Time-variant) • ความไม่แปรเปลี่ยน (Non-Volatile)

  16. 5. ความสัมพันธ์ (Relational) 6. การทำงานแบบไคลแอนท์-เซอร์ฟเวอร์ (Clientserver) 7. การทำงานแบบเว็บเบส (Web-based) ข้อดีประโยชน์ ผู้ใช้งานทำการวิเคราะห์ข้อมูลได้อย่างลึกซึ้งและให้ภาพรวมของข้อมูลในองค์กรซึ่งเป็นสิ่งที่ดีกว่าการให้ข้อมูลเล็กย่อยในปริมาณที่มากจึงลดภาระในการคำนวณลงได้ต้นทุน/ค่าใช้จ่าย ค่าใช้จ่ายในการจัดทำคลังข้อมูลจะมีมูลค่าค่อนข้างสูง (เป็นค่าใช้จ่ายในการสร้างและบำรุงรักษา)

  17. 3. การค้นพบสารสนเทศและองค์ความรู้จากซอฟท์แวร์ธุรกิจอัจฉริยะ (Informatiob and Knowledge Discovery with Buisness Intelligence) ซอฟท์แวร์ธุรกิจอัจฉริยะ (Buisness Intelligence) หรือ BI BI คือ ประเภทของระบบงานและเทคนิคที่มีการรวบรวมการจัดเก็บและการวิเคราะห์ ตลอดจนจัดให้มีการเข้าถึงเข้าใช้ข้อมูล เพื่อช่วยให้ผู้ใช้สามารถดำเนินธุรกิจและตัดสินใจกลยุทธ์ได้ดีกว่าเดิม

  18. 4. แนวความคิดของการทำเหมืองข้อมูลและระบบงาน (Data mining Concepts and Application) • การทำเหมืองข้อมูลได้กลายมาเป็นเครื่องมือหลักในการวิเคราะห์ข้อมูลขนาดใหญ่ ในบางกรณีข้อมูลจะรวมกันอยู่ในคลังข้อมูลและตลาดข้อมูลแต่บางกรณีข้อมูลจะมีเผยแพร่อยู่บนอินเตอร์เน็ตและอินทราเน็ต • สมรรถนะหรือความสามารถของเหมืองข้อมูล • ความสามารถในการพยากรณ์แนวโน้มและพฤติกรรมได้อย่างอัตโนมัติ • การค้นพบรูปแบบที่ไม่เคยรู้จักหรือมีมาก่อนอย่างอัตโนมัติ

  19. เครื่องมือการทำเหมืองข้อมูล (The tools of Data Mining) • ประกอบด้วย 2 ขั้นตอน คือ • สร้างลูกเต๋าข้อมูลหรือเรียกว่า Data cube • สกัดเอาข้อมูลจาก Data cube โดยใช้ฟังชั่นของเหมือง ข้อมูล Data cube คือ เป็นข้อมูลหลายมิติ ส่วนคนที่ทำเหมืองข้อมูลจะเป็นผู้ที่มาใช้เครื่องมือและเทคนิคในการทำเหมือง • ระบบงานที่ทำเหมืองข้อมูล (Data Mining Application) • มีระบบงานที่ทำเหมืองข้อมูลจำนวนมากที่เป็นระบบงานด้านธุรกิจและด้านอื่น ๆ

  20. เทคนิคการทำเหมืองข้อมูลและประเภทของสารสนเทศเทคนิคการทำเหมืองข้อมูลและประเภทของสารสนเทศ • Case-based reasoning : เป็นการใช้เหตุการณ์ที่เกิดขึ้นในอดีตเพื่อจดจำลักษณะรูปแบบ • Neural computing : คือ วิธีการเรียนรู้ของเครื่องโดยที่ข้อมูลในอดีตถูกตรวจสอบเพื่อการจดจำรูปแบบ • Inteligent agents : จากข้อมูลที่มีปริมาณมากจะหาข้อมูลได้ง่ายโดยใช้ Internet • Association analysis : สามารถใช้คำสั่งเพื่อแยกแยะข้อมูลขนาดใหญ่และบอกออกมาเป็นกฎทางสถิติ • เครื่องมืออื่น ๆ เช่น Decision trees

  21. 5. เทคโนโลยีการนำเสนอภาพข้อมูล (Data Visualization) เมื่อมีการประมวลผลข้อมูลแล้ว ก็ต้องมีการนำเสนอให้ผู้ใช้ได้เห็นในรูปแบบตัวอักษร , กราฟ , ตาราง การนำเสนอภาพข้อมูล (Data Visualization) การนำเสนอภาพข้อมูลอาจจะมีการใช้ภาพเคลื่อนไหวสั้นๆ (Video clip) การนำเสนอข้อมูลแบบหลายมิติ (Multidimensionality Visualization) ความยากในการนำเสนอสารสนเทศแบบหลายมิติ ภายในตารางหนึ่งตาราง หรือในหนึ่งกราฟ ก็ยากมากขึ้น

  22. ระบบสารสนเทศทางภูมิศาสตร์ (Geographical Information System : GIS) GIS เป็นระบบที่มีฐานรากอยู่บนระบบคอมพิวเตอร์ (Computer-based system) เพื่อการรวบรวม จัดเก็บ ตรวจสอบ บูรณการและจัดการ ตลอดจนนำเสนอข้อมูลโดยการใช้แผนที่ดิจิตอล ลักษณะงาน GIS จะแบ่งออกเป็น 2 กลุ่มใหญ่ๆ ได้แก่ กลุ่มหน้าที่ (Function) และกลุ่มของระบบงาน (Application) โดยมีหน้าที่หลัก ๆ 4 อย่าง คือ การออกแบบและการวางแผน, รูปแบบเพื่อการตัดสินใจ, การจัดการฐานข้อมูล, รูปภาพเชิงพื้นที่

  23. ซอฟท์แวร์ GIS(GIS Software) ความสามารถในซอฟแวร์ GIS จะแปรผันตั้งแต่ระบบคอมพิวเตอร์เบื้องต้นไปจนถึงระบบที่มีเครื่องมือในระดับองค์กรขนาดใหญ่ เพื่อช่วยในการวิเคราะห์ข้อมูล ข้อมูล GIS ข้อมูล GIS ที่มีการใช้งานจะแปรผันตามแหล่งข้อมูล

  24. 6. การใช้งานฐานข้อมูลการตลาด(Marketing Databases In Action) คลังข้อมูลและตลาดข้อมูลให้บริการกับผู้ใช้งานทุกด้าน แต่ระบบที่โดดเด่นส่วนใหญ่จะอยู่ในสาขาการตลาด ซึ่งเราเรียกว่า ฐานข้อมูลการตลาด (Marketing Database หรือ Database marketing) ฐานข้อมูลรายการเปลี่ยนแปลงด้านการตลาด (The Marketing Transaction Database) ฐานข้อมูลซึ่งสามารถบอกได้ว่าลูกค้าชอบอะไรและต้องการอะไร ข้อมูลดังกล่าวเรียกว่า The Marketing Transaction Database)เรียกย่อ ๆ ว่า MTD

  25. ความสามรถของ MTD MTD ให้ข้อมูลที่ปรับเปลี่ยน ( Dynamic) และโต้ตอบได้ สำหรับการตลาดแล้วรายการเปลี่ยนแปลง (Transaction) จะเกิดขึ้นพร้อมกับการแลกเปลี่ยนข้อมูล สำหรับสื่อที่สามารถโต้ตอบได้ ซึ่งจะทำให้สามารถตอบสนองต่อลูกค้านั้น ณ เวลานั้นๆ ได้

  26. 7. ระบบการจัดการข้อมูลแบบเว็บ (Web-Based Data Management System) การวิเคราะห์และตัดสินใจทางธุรกิจผ่านระบบคอมพิวเตอร์ (Business Intelligence) เริ่มจากการหาและรวบรวมข้อมูล (โดยคลังข้อมูล) จนถึงการทำเหมืองข้อมูลสามารถทำบนเว็บหรือ ผ่านทางเทคโนโลยีเว็บและพาณิชย์อิเล็คทรอนิกส์ (e-commerce เรียกย่อๆ ว่า EC ) ทั้งหมดนี้ทำได้โดยผ่านอินทราเน็ต (Intranet) หรือ เอ็กซ์ทราเน็ต (Extranet)

  27. หัวข้อที่ควรนำมาพิจารณาเกี่ยวกับการบริหารจัดการหัวข้อที่ควรนำมาพิจารณาเกี่ยวกับการบริหารจัดการ • ประเด็นต้นทุนกับประโยชน์ที่จะได้รับ ควรพิจารณาต้นทุนค่าใช้จ่ายให้รอบครอบก่อนรับเทคโนโลยีใหม่ ๆ เข้ามา • ตำแหน่งของสถานที่ที่เป็นแหล่งข้อมูลถ้าเก็บข้อมูลไว้ ใกล้ ๆ กับแหล่งข้อมูลจะ Update ได้อย่างรวดเร็วแต่มีปัญหาเรื่องความปลอดภัยควรเก็บไว้ส่วนกลางจะรักษาความปลอดภัยและแก้ไขข้อผิดพลาดได้ง่าย • ประเด็นแง่กฎหมายเมื่อทำเหมืองข้อมูล ทำให้บริษัทเลือกโปรแกรมส่งเสริมการขายกับลูกค้าบางกลุ่ม (ตามกฎหมายส่วนลดสามารถให้ได้ในการซื้อปริมาณมาก ๆ)

  28. 4. การกู้คืนข้อมูลที่มีความเสียหาย องค์กรสามารถดำเนินงานต่อไปได้เมื่อเกิดความเสียหายในระบบข้อมูล 5. ภายในหรือภายนอก : บริษัท ควรลงทุนทำระบบต่าง ๆ นี้เอง หรือหาบริษัทภายนอกมาจัดระบบให้ 6. ความปลอดภัยของข้อมูลและจริยธรรม 7. จริยธรรม : ผู้เก็บข้อมูลสาธารณะ พบกับปัญหาที่มีผู้เข้ามาใช้โดยไม่จ่ายค่าธรรมเนียม 8. ความเป็นส่วนตัว บริษัท: บุคคลจะป้องกันเรื่องเช่นนี้อย่างไร 9. การชะล้างข้อมูล : เมื่อไรจึงควรจะสะสางข้อมูลเก่า ล้าสมัย

More Related