490 likes | 701 Views
Het organiseren van data en informatie. Hoofdstuk 3: Fundamentals of information systems Ralph Stair & George Reynolds. Hoorcollege ICT in Organisatie, Beleid en Management (IOBM) Marco Spruit : http://www.cs.uu.nl/staff/spruit.html. Principes en Leerdoelen [1/3].
E N D
Het organiseren van data en informatie Hoofdstuk 3: Fundamentals of information systems Ralph Stair & George Reynolds Hoorcollege ICT in Organisatie, Beleid en Management (IOBM) Marco Spruit : http://www.cs.uu.nl/staff/spruit.html
Principes en Leerdoelen [1/3] Data » Databases » Data mining » Business intelligence • Data management en data modellering zijn centrale aspecten in het organiseren van data en informatie • Definieer algemene data management concepten en termen, en licht de voordelen van de databasebenadering in data management uit • Beschrijf het relationele database model en schets de basiskenmerken hiervan Het organiseren van data en informatie :: Stair & Reynolds :: H3
Principes en Leerdoelen [2/3] • Een goed ontworpen en goed beheerde database is een extreem waardevol hulpmiddel in het ondersteunen van de besluitvorming • Stel de standaard functies vast die door alle database management systems uitgevoerd worden • Bepaal de populaire database management systems voor eindgebruikers Het organiseren van data en informatie :: Stair & Reynolds :: H3
Principes en Leerdoelen [3/3] • Het aantal en soorten van database toepassingen zal zich verder blijven ontwikkelen en zal concrete zakelijke voordelen blijven opleveren • Benoem en bespreek huidige database toepassingen Het organiseren van data en informatie :: Stair & Reynolds :: H3
Waarom leren over Database Systemen? • Databasesystemen (Ned: “gegevensbanken”) verwerken en organiseren (grote) hoeveelheden gegevens • Informatiekunde: waar/hoe is de informatie? • Databasegebruik in allerlei functies: • Marketing manager: klantgegevens • Bedrijfsjurist: eerdere vonnissen, precedenten • … Het organiseren van data en informatie :: Stair & Reynolds :: H3
Flashback 1/2: Data versus Informatie • Data: ruwe feiten • Alfanumeriek, beeld, geluid, video • Voorbeeld: “spruit” “1” • Informatie: verzameling van feiten die dusdanig zijn georganiseerd dat er toegevoegde waarde aanwezig is boven de ruwe feiten Voor mensen begrijpelijk en bruikbaar! Het organiseren van data en informatie :: Stair & Reynolds :: H3
Flashback 2/2: Informatiesystemen Componenten van een computer-gebaseerd informatiesysteem • Geconfigureerd om data te verzamelen, manipuleren, bewaren, en transformeren naar informatie Het organiseren van data en informatie :: Stair & Reynolds :: H3
Introductie • Database: een georganiseerde verzameling gegevens • Database management system (DBMS): een verzameling programma’s om een database mee te beheren • Manipuleert de database • Verschaft een interface tussen de database en de gebruiker (zowel database als andere applicaties) • Database administrator (DBA): een IT professional die de databases van een organisatie beheert en onderhoudt Het organiseren van data en informatie :: Stair & Reynolds :: H3
Data Management • Zonder data en de mogelijkheid om ermee te (ver-)werken, kan een organisatie de meeste bedrijfsactiviteiten niet succesvol uitvoeren • Betalen van werknemers • Versturen van facturen • Bestellen van nieuwe voorraden • Data bestaat uit ruwe feiten • Om data te transformeren in betekenisvolle informatie, moet het eerst worden geordend worden op een betekenisvolle wijze Het organiseren van data en informatie :: Stair & Reynolds :: H3
De Datahiërarchie [1/3] • Bit (een binair getal): een circuit dat óf AAN óf UIT staat • Byte: acht bits • Karakter: basis eenheid van informatie • Elke byte representeert een character • Kan een hoofdletter, kleine letter, numeriek getal, speciaal symbool zijn • Veld (kolom; rubriek): bijv. een naam, nummer, of andere combinatie van karakters die een aspect van een zakelijk object of activiteit beschrijven Het organiseren van data en informatie :: Stair & Reynolds :: H3
Bits-Byte-Karakter: Decimaal versus Binair • Wikipedia voorbeeld bij getalsystemen • …en vice versa Het organiseren van data en informatie :: Stair & Reynolds :: H3
De Datahiërarchie [2/3] • Record (rij): een verzameling van gerelateerde velden • File (tabel; dossier): een verzameling van gerelateerde records • Database (gegevensbank): een verzameling van geïntegreerde en gerelateerde files • Datahiërarchie: bits, karakters, velden, records, files, en databases Het organiseren van data en informatie :: Stair & Reynolds :: H3
De Datahiërarchie [3/3] Figuur 3.1: De datahiërarchie Het organiseren van data en informatie :: Stair & Reynolds :: H3
Entiteiten, Attributen, en Sleutels [1/2] • Entiteit: een gegeneraliseerde klasse van mensen, plaatsen, of ‘dingen’ (objecten) waarvoor data wordt verzameld/onderhouden • Attribuut: Een kenmerk van een entiteit • Data item: De waarde van een attribuut • Sleutel: Een veld of verzameling velden in een record dat gebruikt wordt om het record te identificeren • Primaire sleutel: Een sleutel waarmee ieder record uniek geïdentificeerd kan worden Het organiseren van data en informatie :: Stair & Reynolds :: H3
Entiteiten, Attributen, en Sleutels [2/2] Figuur 3.2: Sleutels en Attributen Het organiseren van data en informatie :: Stair & Reynolds :: H3
Entiteiten, Attributen, en Terroristen • p.112,§1: Van attributen & data naar terrorismebestrijding… http://news.cnet.com/8301-13578_3-10059987-38.html?part=rss&subj=news&tag=2547-1_3-0-20 Het organiseren van data en informatie :: Stair & Reynolds :: H3
De Databasebenadering [1/4] • De traditionele benadering van database management: voor iedere toepassing worden aparte data bestanden aangemaakt • Resulteert in dataredundantie (duplicatie) • Dataredundantie conflicteert met data-integriteit • De databasebenadering van database management: ‘een vijver’ van gerelateerde data wordt gedeeld door meerdere toepassingen • Significante voordelen t.o.v. de traditionele benadering Het organiseren van data en informatie :: Stair & Reynolds :: H3
De Databasebenadering [2/4] Figure 3.3: De databasebenadering van Data Management Het organiseren van data en informatie :: Stair & Reynolds :: H3
De Databasebenadering [3/4] Tabel 3.1: Voordelen van de databasebenadering Het organiseren van data en informatie :: Stair & Reynolds :: H3
De Databasebenadering [4/4] Tabel 3.2: Nadelen van de databasebenadering Het organiseren van data en informatie :: Stair & Reynolds :: H3
Data Modellering [1/2] • Data model: een diagram van data entiteiten en hun onderlinge relaties • Entiteit-relatie (ER) diagram: een type data model dat gebruik maakt van eenvoudige grafische symbolen om de organisatie van —en relaties tussen — de data te tonen Het organiseren van data en informatie :: Stair & Reynolds :: H3
Data Modellering [2/2] 1-n relatie => 1-1 relatie => Figuur 3.4: Entiteit-Relatie (ER) Diagram voor een Klantorder DB Het organiseren van data en informatie :: Stair & Reynolds :: H3
Het Relationele Database Model [1/2] • Relationele model: alle data elementen worden geplaatst in tweedimensionale tabellen (relaties), die het logische equivalent zijn van bestanden (files) • In het relationele model geldt: • Elke rij in een tabel representeert een data entiteit • Kolommen van de tabel representeren attributen • Domein: de toegestane waarden voor data attributen • Data dictionary: gedetailleerde beschrijving van alle data die in de database voorkomt Het organiseren van data en informatie :: Stair & Reynolds :: H3
Het Relationele Database Model [2/2] Figuur 3.5: Een Relationeel Database Model Het organiseren van data en informatie :: Stair & Reynolds :: H3
Datamanipulatie [1/2] • Selecteren: het elimineren van rijen volgens bepaalde criteria • Projecteren: het elimineren van kolommen in een tabel • Samenvoegen: het combineren van twee of meer tabellen • Verbinden: het relateren of verbinden van twee of meer tabellen via gedeelde data attributen Het organiseren van data en informatie :: Stair & Reynolds :: H3
Datamanipulatie [2/2] Wie is de manager van de Sales Manual en sinds wanneer is hij in dienst? Figuur 3.7: Het verbinden van tabellen om de vraag te kunnen beantwoorden: Het organiseren van data en informatie :: Stair & Reynolds :: H3
Overzicht van Database Types • Flat file • Simpel databaseprogramma waarin records geen relatie met elkaar hebben • Voorbeeld: Excel • Single user • Slechts één persoon kan tegelijkertijd gebruik maken van de database • Voorbeelden: Access, FileMaker • Multi-user • Meerdere mensen hebben tegelijkertijd toegang tot hetzelfde database systeem • Voorbeelden: zie volgende slide… Het organiseren van data en informatie :: Stair & Reynolds :: H3
http://www.dbm.nl/site/jsp/nieuws.jsp?art_iID=10734 Het organiseren van data en informatie :: Stair & Reynolds :: H3
Datamanipulatie en Rapportage [1/2] • Structured Query Language (SQL): Dé standaard vraagtaal voor relationele databases • Query-By-Example (QBE):een visuele benadering om SQL vragen te formuleren • Data manipulation language (DML): Commando’s die de data in een database manipuleren • Database programma’s kunnen rapporten documenten, en allerlei andere vormen van uitvoer produceren Het organiseren van data en informatie :: Stair & Reynolds :: H3
Manipulatie en Rapportage [2/2] Table 3.3: Voorbeelden van SQL Commando’s Het organiseren van data en informatie :: Stair & Reynolds :: H3
Database Beheer • Database administrator (DBA): Stuurt aan en voert uit alle activiteiten binnen de database omgeving • Plannen, ontwerpen, aanmaken, opereren, beveiligen, monitoren en onderhouden van de database systemen (Figuur 3.16!) • Vaststellen en invoeren van beleid en procedures • Werknemers trainen Het organiseren van data en informatie :: Stair & Reynolds :: H3
Selecteren van een Database Systeem • Belangrijke database eigenschappen die overwogen dienen te worden • Grootte van de database • Kosten van het systeem • Aantal gelijktijdige gebruikers • Uitvoeringssnelheid (lezen/schrijven) • Integratiemogelijkheden met andere systemen • Leverancier overwegingen • Open-source? Het organiseren van data en informatie :: Stair & Reynolds :: H3
Verbinden van Databases met Internet • Verbinden van databases met het Internet is belangrijk voor veel organisaties en mensen • Semantische Web • Ontwikkeling van een naadloze integratie van traditionele databases met het Internet • Laat mensen een aantal traditionele databases tegelijkertijd benaderen en manipuleren via het Internet • W3C: “The Semantic Web provides a common framework that allows data to be shared and reused across application, enterprise, and community boundaries”. [http://www.w3.org/2001/sw/SW-FAQ] Het organiseren van data en informatie :: Stair & Reynolds :: H3
Over Databases, Internet, en De Wet… • Wat vindt onze overheid eigenlijk van al die databases en het internet…? Het organiseren van data en informatie :: Stair & Reynolds :: H3
Data Warehouses, Marts, Mining [1/3] • Data warehouse: verzamelt bedrijfsinformatie uit meerdere bronnen in de organisatie • Data mart: een deelverzameling van een data warehouse • Data mining: een informatieanalyse gereedschap voor het blootleggen van patronen en relaties in een data warehouse of data mart Het organiseren van data en informatie :: Stair & Reynolds :: H3
MBI afstudeervoorbeeld: Data mining • MBI scriptie van A. Vleugel: Data mining: finding patterns in historical data to improve the forecasting procedure of employee service providers . Het organiseren van data en informatie :: Stair & Reynolds :: H3
Data Warehouses, Marts, Mining [2/3] Figuur 3.17: Elementen van een Data Warehouse Het organiseren van data en informatie :: Stair & Reynolds :: H3
Data Warehouses, Marts, Mining [3/3] Tabel 3.5: Regelmatig voorkomende Data Mining toepassingen Het organiseren van data en informatie :: Stair & Reynolds :: H3
De Weerbarstige Werkelijkheid… Het organiseren van data en informatie :: Stair & Reynolds :: H3
Business Intelligence [1/2] • Business intelligence (BI): het verzamelen van de juiste informatie, tijdig, in een bruikbare vorm, en het analyseren van deze informatie om het zaken doen op een positieve manier te beïnvloeden • Transformeert data naar bruikbareinformatie, die vervolgens gedistribueerd wordt door de gehele organisatie Het organiseren van data en informatie :: Stair & Reynolds :: H3
Business Intelligence [2/2] • Competitive intelligence: een aspect van business intelligence dat zich beperkt tot informatie over concurrenten en de manierenwaarop deze kennis strategie, tactieken, en de dagelijkse gang van zaken beïnvloedt • Counterintelligence: de stappen die een organisatie neemt om informatie te beschermen die gezocht wordt door “vijandige” intelligence verzamelaars Het organiseren van data en informatie :: Stair & Reynolds :: H3 http://www.fas.org/irp/ops/ci/cistrategy2007.pdf
Wie zijn de Business Intelligence leveranciers tot 2007? [IDC Research (2006), The BI Tools Market in 2006] Het organiseren van data en informatie :: Stair & Reynolds :: H3
Wie zijn de Business Intelligence leveranciers in 2008? Het organiseren van data en informatie :: Stair & Reynolds :: H3
Gedistribueerde Databases • Gedistribueerde database • De data kan verspreid zijn over verschillende kleinere databases die onderling verbonden zijn via telecommunicatie apparaten • Bedrijven krijgen meer flexibiliteit in hoe databases georganiseerd en gebruikt worden • Gerepliceerde database • Bevat een identieke verzameling van frequent gebruikte data Het organiseren van data en informatie :: Stair & Reynolds :: H3
Online Analytical Processing (OLAP) • Software waarmee gebruikers data kunnen verkennen vanuit verschillende perspectieven Tabel 3.6: Vergelijking van OLAP en Data Mining Het organiseren van data en informatie :: Stair & Reynolds :: H3
Objectgeoriënteerde Databases • Objectgeoriënteerd database management systeem (OODBMS) • Programma’s die een objectgeoriënteerdee database manipuleren en een gebruikersinterface en verbindingen naar andere toepassingen verschaffen • Object-relational database management system (ORDBMS) • Een DBMS met speciale ondersteuning voor audio, video, en geografische data Het organiseren van data en informatie :: Stair & Reynolds :: H3
Samenvatting [1/3] • Datahiërarchie: bits, karakters, velden, records, files, en databases • Entiteit: een gegeneraliseerde klasse van mensen, plaatsen, of ‘dingen’ (objecten) waarvoor data wordt verzameld/onderhouden • Attribuut: Een kenmerk van een entiteit • Data model: een diagram van data entiteiten en hun onderlinge relaties • Relationele model: alle data elementen worden geplaatst in tweedimensionale tabellen (relaties) Het organiseren van data en informatie :: Stair & Reynolds :: H3
Samenvatting [2/3] • Selecteren: het elimineren van rijen volgens bepaalde criteria • Projecteren: het elimineren van kolommen in een tabel • Een database management system (DBMS) is een groep programma’s die als interface gebruikt worden tussen: • Database en toepassingsprogramma’s • Database en de gebruiker • Data dictionary: gedetailleerde beschrijving van alle data die in de database voorkomt Het organiseren van data en informatie :: Stair & Reynolds :: H3
Samenvatting [3/3] • Data warehouse: database die bedrijfsinformatie verzamelt over alle aspecten van bedrijfsprocessen, producten, klanten • Data mining: een informatieanalyse gereedschap voor het blootleggen van patronen en relaties in een data warehouse • Business intelligence (BI): het verzamelen van de juiste informatie, tijdig en bruikbaar, en het analyseren van deze informatie om het zaken doen positief te beïnvloeden Het organiseren van data en informatie :: Stair & Reynolds :: H3