290 likes | 382 Views
การจัดระเบียบบริหารข้อมูล : สถานที่จัดเก็บข้อมูล หาวิธีการจัดเก็บข้อมูล, การจัดเรียงลำดับของข้อมูล ที่สามารถมองเห็นได้และเป็นระเบียบ ( Data Management: Warehousing, Analyzing, Mining, and Visualization ).
E N D
การจัดระเบียบบริหารข้อมูล : สถานที่จัดเก็บข้อมูล หาวิธีการจัดเก็บข้อมูล, การจัดเรียงลำดับของข้อมูล ที่สามารถมองเห็นได้และเป็นระเบียบ( Data Management:Warehousing, Analyzing,Mining, and Visualization)
การจัดการข้อมูล: การทำคลังข้อมูล การวิเคราะห์เหมือง ข้อมูลและการทำให้จินตนาการเห็น • (Data Management : Warehousing, Analyzing, Mining • And Visualization) • หัวข้อ • การจัดการข้อมูล(Data Management): ปัจจัยแห่งความสำเร็จที่จำเป็นอย่างยิ่ง • การทำคลังข้อมูล (Data Warehousing) • การค้นพบสารสนเทศและองค์ความรู้จากซอฟท์แวร์ธุรกิจอัจฉริยะ (Information and Knowledge Discovery with Business Intelligence)
4 แนวความคิดของการทำเหมืองข้อมูลและระบบงาน (Data Mining Concepts and Applications) 5 เทคโนโลยีเพื่อการนำเสนอภาพข้อมูล (Data Visualization Technologies) 6 การจัดทำฐานข้อมูลการตลาด (Marketing Databases in Action) 7 ระบบการจัดการข้อมูลแบบเว็บ (Web-based Data Management System)
วัตถุประสงค์ 1. ตระหนักถึงความสำคัญของข้อมูลประเด็นของการ จัดการข้อมูลและวงจรชีวิตของข้อมูล 2. สามารถบอกถึงที่มาของข้อมูล(หรือแหล่งข้อมูล) การเก็บรวบรวมข้อมูลและคุณภาพของข้อมูลในประเด็นต่างๆได้ 3. สามารถบรรยายระบบการจัดการเอกสาร 4. สามารถอธิบายการดำเนินการเพื่อทำคลังข้อมูลและ บทบาทของคลังข้อมูลที่จะมาสนับสนุนการตัดสินใจ
5. บรรยายการค้นพบสารสนเทศ (Information) และองค์ ความรู้ (Knowledge) และธุรกิจอัจฉริยะ(Business Intelligence) 6. เข้าใจถึงอำนาจและผลดีของการทำเหมืองข้อมูล 7.บรรยายวิธีการนำเสนอข้อมูลและระบบสารสนเทศเชิง ภูมิศาสตร์การจำลองสถานการณ์ให้เห็นและสภาพที่เป็นจริงทั้งหมดเพื่อใช้เป็นเครื่องมือช่วยสนับสนุนการตัดสินใจ 8. สามารถอภิปรายถึงบทบาทของฐานข้อมูลการตลาดและสามารถยกตัวอย่างได้ 9. ตระหนักถึงบทบาทของเว็บที่จะส่งผลต่อการการจัดการ ข้อมูล
1.การจัดการข้อมูล:ปัจจัยแห่งความสำเร็จ1.การจัดการข้อมูล:ปัจจัยแห่งความสำเร็จ • ระบบสารสนเทศต่าง ๆ จะไม่สามารถสำเร็จได้โดยปราศจากข้อมูล หากปราศจากข้อมูลแล้วก็จะไม่มีระบบสารสนเทศ หรือ หากปราศจากข้อมูล ก็จะทำให้ไม่สามารถตัดสินใจได้ดี • ปัญหาของข้อมูลและความยุ่งยาก (Data Problems and Difficulties) • ปริมาณข้อมูลจะเพิ่มขึ้นแบบทวีคูณ ข้อมูลเดิมก็จะต้องมีการเก็บรักษาเป็นระยะเวลานาน • ข้อมูลกระจายกระจายอยู่ทั่วองค์กร แต่ละหน่วยงานจะเก็บรวบรวมข้อมูลด้วยวิธีที่หลากหลาย
การเพิ่มขึ้นของปริมาณข้อมูลภายนอกองค์กร (External data) • ความปลอดภัยของข้อมูล เป็นสิ่งที่จำเป็นอย่างยิ่ง • การคัดเลือกเครื่องมือในการจัดการข้อมูลเป็นปัญหาหลัก วงจรชีวิตของข้อมูล (Data life cycle Process) เพื่อทำความเข้าใจวิธีการที่จะบริหารข้อมูลให้ดียิ่งขึ้นมันก็จำเป็นที่จะต้องดูการไหลเวียนของข้อมูลในองค์กรว่าไปที่ไหนและอย่างไร ธุรกิจไม่ได้ดำเนินงานโดยใช้ข้อมูลดิบ (Raw Data) แต่จะดำเนินงานอยู่บนข้อมูลที่ถูกประมวลผลมาเป็นสารสนเทศ (Information) และองค์ความรู้ (Knowledge)
แหล่งข้อมูล(Data Sources) วงจรชีวิตของข้อมูลเริ่มจากการได้รับข้อมูลมาจากแหล่งข้อมูล แหล่งข้อมูลสามารถแบ่งออกเป็น แหล่งข้อมูลภายใน ข้อมูลส่วนบุคคล และแหล่งข้อมูลภายนอก แหล่งข้อมูลภายใน(InternalData Sources) ข้อมูลภายในองค์กรมักจะเกี่ยวกับคน สินค้า บริการ ซึ่งจะพบในที่หนึ่งที่ใดหรือหลาย ๆ ที่ เช่นข้อมูลเกี่ยวกับ ลูกจ้างและค่าแรง
ข้อมูลส่วนบุคคล (Personal Data) ผู้ใช้งานหรือพนักงานของบริษัททั่ว ๆ ไปอาจจะทำเอกสารของตนเองตามหน้าที่และความเชี่ยวชาญที่ตนมีโดยจัดเก็บเป็นข้อมูลส่วนตัว แหล่งข้อมูลภายนอก (External Data Sources) แหล่งข้อมูลภายนอกมีมากมายมหาศาลจึงมักไม่มีความสัมพันธ์กับระบบงานใดเป็นการเฉพาะ
อินเตอร์เน็ตและการบริการฐานข้อมูลเชิงพาณิชย์ (Theinternet and Commercial Database Services)ฐานข้อมูลนับพันจะสามารถใช้งานได้โดยผ่านระบบอินเตอร์เน็ตโดยมีส่วนหนึ่งจะให้บริการฟรี สำนักพิมพ์บางสำนักพิมพ์จัดให้มีบริการเชิงพาณิชย์ (ผู้ใช้งานต้องเสียค่าบริการ) วิธีการเก็บรวบรวมข้อมูลดิบ (Methods for Collecting Raw Data) ความหลากหลายของข้อมูลและแหล่งข้อมูลส่งผลให้วิธีการเก็บรวบรวมข้อมูลมีความซับซ้อน บางครั้งจำเป็นต้องเดินทางออกภาคสนามเพื่อเก็บข้อมูล และบางกรณีก็จำเป็นต้องควานหาข้อมูลดิบจากผู้คนทั่วไป
คุณภาพของข้อมูล(Data Quality) และความถูกต้อง สอดคล้องของข้อมูล (Data Integrity) คุณภาพของข้อมูล (Data Quality: DQ เป็นประเด็น ที่สำคัญที่สุดประเด็นหนึ่ง เนื่องจากคุณภาพของข้อมูลจะเป็นสิ่งที่กำหนดประโยชน์และคุณภาพของการตัดสินใจที่บนรากฐานของข้อมูล คุณภาพของข้อมูลคือสิ่งที่สำคัญพื้นฐานที่ส่งผลต่อความชาญฉลาดในการดำเนินธุรกิจคุณภาพของข้อมูลในระบบเว็บเบส (Data Qualityin Web-Based Systems)
ข้อมูลที่ถูกรวบรวมจากอินเตอร์เน็ต ในลักษณะงานประจำ จะต้องมีการจัดระเบียบข้อมูลให้เป็นระบบและจัดเก็บข้อมูลก่อนที่จะนำข้อมูลไปใช้งาน การจัดการเอกสารคืออะไร ? การจัดการเอกสารคือ การควบคุมเอกสารอิเล็กทรอนิกส์ (ได้แก่ Page images, spreadsheets,word processing document และเอกสารอื่นๆตลอดวงจรชีวิต ของเอกสารที่มีอยู่ในองค์กร ตั้งแต่เริ่มสร้างจนกระทั่ง กลายเป็นเอกสารสำคัญในที่สุด
2. คลังข้อมูล (Data warehousing) บริษัทขนาดใหญ่ถึงกลางจำนวนมากที่ทำคลังข้อมูล ขึ้นมาเพื่อให้การประมวลผล การวิเคราะห์และคำสั่งค้นคืน ข้อมูล (Query) สามารถทำได้ง่ายและรวดเร็วขึ้น การประมวลผลรายการเปลี่ยนแปลง (Transaction Processing) เป็นระบบสารสนเทศ ซึ่งประมวลผลข้อมูลที่ได้รับจากการเกิดขึ้นของการทำรายการเปลี่ยนแปลง รายการเปลี่ยนแปลง เป็นเหตุการณ์ที่เป็นส่วนหนึ่งของทำ ธุรกิจ เช่น การขาย ได้มีบทบาทที่สำคัญในการสนับสนุนการดำเนินงานขององค์กร
มีทางเลือกอยู่ 2 ทางเลือกในการนำไปสู่การประมวลผลการวิเคราะห์ วิธีแรก คือ ทำงานโดยตรงกับระบบปฏิบัติการ (Operational system) และใช้ Software tools, front-end tools และ middleware วิธีที่ 2 คือใช้ Data warehouse วิธีแรกจะเหมาะสมสำหรับบริษัทที่มีจำนวนผู้ใช้ไม่มาก ที่จะสอบถามข้อมูลและทำการวิเคราะห์ข้อมูลผ่านระบบปฏิบัติการ ซึ่งผู้ใช้ส่วนใหญ่จะต้องมีความรู้และทักษะด้านเทคนิคในการใช้เครื่องมืออาทิ Spreadsheets และกราฟฟิก
ข้อดีของคลังข้อมูล คือ • ความสามารถในการเข้าถึงข้อมูลได้อย่างรวดเร็ว เนื่องจากมีการจัดเก็บข้อมูลในจัดว่างข้อมูลไว้เฉพาะที่ • ความสามารถในการเข้าถึงข้อมูลได้ง่ายและได้บ่อยครั้ง โดยการใช้เว็บบราวเซอร์ • คุณสมบัติของคลังข้อมูล • การจัดการอย่างเป็นระบบ (Organization) • ความสอดคล้อง (Consistency) • ระยะเวลา (Time-variant) • ความไม่แปรเปลี่ยน (Non-Volatile)
5. ความสัมพันธ์ (Relational) 6. การทำงานแบบไคลแอนท์-เซอร์ฟเวอร์ (Clientserver) 7. การทำงานแบบเว็บเบส (Web-based) ข้อดีประโยชน์ ผู้ใช้งานทำการวิเคราะห์ข้อมูลได้อย่างลึกซึ้งและให้ภาพรวมของข้อมูลในองค์กรซึ่งเป็นสิ่งที่ดีกว่าการให้ข้อมูลเล็กย่อยในปริมาณที่มากจึงลดภาระในการคำนวณลงได้ต้นทุน/ค่าใช้จ่าย ค่าใช้จ่ายในการจัดทำคลังข้อมูลจะมีมูลค่าค่อนข้างสูง (เป็นค่าใช้จ่ายในการสร้างและบำรุงรักษา)
3. การค้นพบสารสนเทศและองค์ความรู้จากซอฟท์แวร์ธุรกิจอัจฉริยะ (Informatiob and Knowledge Discovery with Buisness Intelligence) ซอฟท์แวร์ธุรกิจอัจฉริยะ (Buisness Intelligence) หรือ BI BI คือ ประเภทของระบบงานและเทคนิคที่มีการรวบรวมการจัดเก็บและการวิเคราะห์ ตลอดจนจัดให้มีการเข้าถึงเข้าใช้ข้อมูล เพื่อช่วยให้ผู้ใช้สามารถดำเนินธุรกิจและตัดสินใจกลยุทธ์ได้ดีกว่าเดิม
4. แนวความคิดของการทำเหมืองข้อมูลและระบบงาน (Data mining Concepts and Application) • การทำเหมืองข้อมูลได้กลายมาเป็นเครื่องมือหลักในการวิเคราะห์ข้อมูลขนาดใหญ่ ในบางกรณีข้อมูลจะรวมกันอยู่ในคลังข้อมูลและตลาดข้อมูลแต่บางกรณีข้อมูลจะมีเผยแพร่อยู่บนอินเตอร์เน็ตและอินทราเน็ต • สมรรถนะหรือความสามารถของเหมืองข้อมูล • ความสามารถในการพยากรณ์แนวโน้มและพฤติกรรมได้อย่างอัตโนมัติ • การค้นพบรูปแบบที่ไม่เคยรู้จักหรือมีมาก่อนอย่างอัตโนมัติ
เครื่องมือการทำเหมืองข้อมูล (The tools of Data Mining) • ประกอบด้วย 2 ขั้นตอน คือ • สร้างลูกเต๋าข้อมูลหรือเรียกว่า Data cube • สกัดเอาข้อมูลจาก Data cube โดยใช้ฟังชั่นของเหมือง ข้อมูล Data cube คือ เป็นข้อมูลหลายมิติ ส่วนคนที่ทำเหมืองข้อมูลจะเป็นผู้ที่มาใช้เครื่องมือและเทคนิคในการทำเหมือง • ระบบงานที่ทำเหมืองข้อมูล (Data Mining Application) • มีระบบงานที่ทำเหมืองข้อมูลจำนวนมากที่เป็นระบบงานด้านธุรกิจและด้านอื่น ๆ
เทคนิคการทำเหมืองข้อมูลและประเภทของสารสนเทศเทคนิคการทำเหมืองข้อมูลและประเภทของสารสนเทศ • Case-based reasoning : เป็นการใช้เหตุการณ์ที่เกิดขึ้นในอดีตเพื่อจดจำลักษณะรูปแบบ • Neural computing : คือ วิธีการเรียนรู้ของเครื่องโดยที่ข้อมูลในอดีตถูกตรวจสอบเพื่อการจดจำรูปแบบ • Inteligent agents : จากข้อมูลที่มีปริมาณมากจะหาข้อมูลได้ง่ายโดยใช้ Internet • Association analysis : สามารถใช้คำสั่งเพื่อแยกแยะข้อมูลขนาดใหญ่และบอกออกมาเป็นกฎทางสถิติ • เครื่องมืออื่น ๆ เช่น Decision trees
5. เทคโนโลยีการนำเสนอภาพข้อมูล (Data Visualization) เมื่อมีการประมวลผลข้อมูลแล้ว ก็ต้องมีการนำเสนอให้ผู้ใช้ได้เห็นในรูปแบบตัวอักษร , กราฟ , ตาราง การนำเสนอภาพข้อมูล (Data Visualization) การนำเสนอภาพข้อมูลอาจจะมีการใช้ภาพเคลื่อนไหวสั้นๆ (Video clip) การนำเสนอข้อมูลแบบหลายมิติ (Multidimensionality Visualization) ความยากในการนำเสนอสารสนเทศแบบหลายมิติ ภายในตารางหนึ่งตาราง หรือในหนึ่งกราฟ ก็ยากมากขึ้น
ระบบสารสนเทศทางภูมิศาสตร์ (Geographical Information System : GIS) GIS เป็นระบบที่มีฐานรากอยู่บนระบบคอมพิวเตอร์ (Computer-based system) เพื่อการรวบรวม จัดเก็บ ตรวจสอบ บูรณการและจัดการ ตลอดจนนำเสนอข้อมูลโดยการใช้แผนที่ดิจิตอล ลักษณะงาน GIS จะแบ่งออกเป็น 2 กลุ่มใหญ่ๆ ได้แก่ กลุ่มหน้าที่ (Function) และกลุ่มของระบบงาน (Application) โดยมีหน้าที่หลัก ๆ 4 อย่าง คือ การออกแบบและการวางแผน, รูปแบบเพื่อการตัดสินใจ, การจัดการฐานข้อมูล, รูปภาพเชิงพื้นที่
ซอฟท์แวร์ GIS(GIS Software) ความสามารถในซอฟแวร์ GIS จะแปรผันตั้งแต่ระบบคอมพิวเตอร์เบื้องต้นไปจนถึงระบบที่มีเครื่องมือในระดับองค์กรขนาดใหญ่ เพื่อช่วยในการวิเคราะห์ข้อมูล ข้อมูล GIS ข้อมูล GIS ที่มีการใช้งานจะแปรผันตามแหล่งข้อมูล
6. การใช้งานฐานข้อมูลการตลาด(Marketing Databases In Action) คลังข้อมูลและตลาดข้อมูลให้บริการกับผู้ใช้งานทุกด้าน แต่ระบบที่โดดเด่นส่วนใหญ่จะอยู่ในสาขาการตลาด ซึ่งเราเรียกว่า ฐานข้อมูลการตลาด (Marketing Database หรือ Database marketing) ฐานข้อมูลรายการเปลี่ยนแปลงด้านการตลาด (The Marketing Transaction Database) ฐานข้อมูลซึ่งสามารถบอกได้ว่าลูกค้าชอบอะไรและต้องการอะไร ข้อมูลดังกล่าวเรียกว่า The Marketing Transaction Database)เรียกย่อ ๆ ว่า MTD
ความสามรถของ MTD MTD ให้ข้อมูลที่ปรับเปลี่ยน ( Dynamic) และโต้ตอบได้ สำหรับการตลาดแล้วรายการเปลี่ยนแปลง (Transaction) จะเกิดขึ้นพร้อมกับการแลกเปลี่ยนข้อมูล สำหรับสื่อที่สามารถโต้ตอบได้ ซึ่งจะทำให้สามารถตอบสนองต่อลูกค้านั้น ณ เวลานั้นๆ ได้
7. ระบบการจัดการข้อมูลแบบเว็บ (Web-Based Data Management System) การวิเคราะห์และตัดสินใจทางธุรกิจผ่านระบบคอมพิวเตอร์ (Business Intelligence) เริ่มจากการหาและรวบรวมข้อมูล (โดยคลังข้อมูล) จนถึงการทำเหมืองข้อมูลสามารถทำบนเว็บหรือ ผ่านทางเทคโนโลยีเว็บและพาณิชย์อิเล็คทรอนิกส์ (e-commerce เรียกย่อๆ ว่า EC ) ทั้งหมดนี้ทำได้โดยผ่านอินทราเน็ต (Intranet) หรือ เอ็กซ์ทราเน็ต (Extranet)
หัวข้อที่ควรนำมาพิจารณาเกี่ยวกับการบริหารจัดการหัวข้อที่ควรนำมาพิจารณาเกี่ยวกับการบริหารจัดการ • ประเด็นต้นทุนกับประโยชน์ที่จะได้รับ ควรพิจารณาต้นทุนค่าใช้จ่ายให้รอบครอบก่อนรับเทคโนโลยีใหม่ ๆ เข้ามา • ตำแหน่งของสถานที่ที่เป็นแหล่งข้อมูลถ้าเก็บข้อมูลไว้ ใกล้ ๆ กับแหล่งข้อมูลจะ Update ได้อย่างรวดเร็วแต่มีปัญหาเรื่องความปลอดภัยควรเก็บไว้ส่วนกลางจะรักษาความปลอดภัยและแก้ไขข้อผิดพลาดได้ง่าย • ประเด็นแง่กฎหมายเมื่อทำเหมืองข้อมูล ทำให้บริษัทเลือกโปรแกรมส่งเสริมการขายกับลูกค้าบางกลุ่ม (ตามกฎหมายส่วนลดสามารถให้ได้ในการซื้อปริมาณมาก ๆ)
4. การกู้คืนข้อมูลที่มีความเสียหาย องค์กรสามารถดำเนินงานต่อไปได้เมื่อเกิดความเสียหายในระบบข้อมูล 5. ภายในหรือภายนอก : บริษัท ควรลงทุนทำระบบต่าง ๆ นี้เอง หรือหาบริษัทภายนอกมาจัดระบบให้ 6. ความปลอดภัยของข้อมูลและจริยธรรม 7. จริยธรรม : ผู้เก็บข้อมูลสาธารณะ พบกับปัญหาที่มีผู้เข้ามาใช้โดยไม่จ่ายค่าธรรมเนียม 8. ความเป็นส่วนตัว บริษัท: บุคคลจะป้องกันเรื่องเช่นนี้อย่างไร 9. การชะล้างข้อมูล : เมื่อไรจึงควรจะสะสางข้อมูลเก่า ล้าสมัย