1 / 16

Datenstruktur 1: Textdatei

Daten. Texteditor. beliebige Anwendung. Datenstruktur 1: Textdatei

afya
Download Presentation

Datenstruktur 1: Textdatei

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Daten Texteditor beliebige Anwendung Datenstruktur 1: Textdatei Heike Boß, wohnhaft in der Darmstädter Straße 46, hat die Konten 200004 und 200005. Auf dem ersten Konto hat sie derzeit 4560,00 €, auf dem zweiten Konto hat sie 2398,78 €. Für beide Konten hat sie einen Kreditrahmen von 2000 €. Friedrich Coy wohnt im Siedlerweg 17und hat die Konten 200001 und 200002. Auf dem ersten Konto hat er derzeit 23,56 € (mit einem Kreditrahmen von 50 €), auf dem zweiten Konto hat er 1200 € (mit einem Kreditrahmen von 500 €. Hans-Peter Daab, wohnhaft in der Adalbert-Stifter-Str. 10, hat auf seinem Konto 200006 derzeit kein Geld (aber auh keine Schulden); Kredit hat er derzeit auch nicht. Vorteil: Nachteil:

  2. Daten Texteditor beliebige Anwendung Datenstruktur 2: Textdatei standardisiert Heike Boß wohnt in der Darmstädter Straße 46. Sie hat Konto 200004 mit einem Kontostand von 4560,00 € und einem Kreditrahmen von 2000 €. Sie hat Konto 200005 mit einem Kontostand von 2398,78 € und einem Kreditrahmen von 2000 €. Friedrich Coy wohnt im Siedlerweg 17. Er hat Konto 200001 mit einem Kontostand von 23,56 € und einem Kreditrahmen von 50 €. Er hat Konto 200002 mit einem Kontostand von 1200 € und einem Kreditrahmen von 500 €. Hans-Peter Daab wohnt in der Adalbert-Stifter-Str. 10. Er hat Konto 200006 mit einem Kontostand von 0 € und einem Kreditrahmen von 0 €. Vorteil: Nachteil:

  3. Struktur- info Validator Daten Texteditor beliebige Anwendung (noch) Datenstruktur 2: Textdatei standardisiert mit expliziter Strukturdefinition Name wohnt in Strasse. Sie/Er hat Konto Kontonummer mit einem Kontostand von Kontostand und einem Kreditrahmen von Kreditrahmen. Sie/Er hat Konto Kontonummer mit einem Kontostand von Kontostand und einem Kreditrahmen von Kreditrahmen. (und so weiter) Vorteil: Nachteil:

  4. Struktur- info Validator Daten Texteditor beliebige Anwendung (immer noch) Datenstruktur 2: Textdatei standardisiert mit expliziter Strukturdefinition (BNF) Bank ::= <Eintrag> <Bank> Eintrag ::= <Inhaber> <Konten> Konten ::= <Konto> <Konten> Inhaber ::= <Name> wohnt in <Strasse>. Konto ::= (Sie|Er) hat Konto <Kontonummer> mit einem Kontostand von <Kontostand> und einem Kreditrahmen von <Kreditrahmen>. Strasse ::= <Zeichenfolge> Zeichenfolge ::= <Zeichen> <Zeichenfolge> Zeichen ::= (A|B|C … Z) Kontonummer ::= <Ganzzahl> Ganzzahl::= <Ziffer> <Ganzzahl> Ziffer ::= (0|1|2 … 9) Kreditrahmen ::= <Fließpunktzahl> …

  5. Struktur- info Daten Daten- erfassung beliebige Anwendung Datenstruktur 3: Strukturdatei (selbstverständlich standardisiert; Vorbild: Lochkarte) IHeike Boß Darmstädter Straße 46 K200004 4560,00 € 2000 € K200005 2398,78 € 2000 € IFriedrich Coy Siedlerweg 17 K200001 23,56 € 50 € K200002 1200 € 500 € IHans-Peter Daab Adalbert-Stifter-Str. 10 K200006 0 € 0 €. Vorteil: Nachteil:

  6. Struktur- info Daten Daten- erfassung beliebige Anwendung Datenstruktur 3: Strukturdatei (comma separated value; CSV) I;Heike Boß;Darmstädter Straße 46 K;200004;4560,00 €;2000 € K;200005;2398,78 €;2000 € I;Friedrich Coy;Siedlerweg 17 K;20000;23,56 €;50 € K;200002;1200 €;500 € I;Hans-Peter Daab;Adalbert-Stifter-Str. 10 K;200006;0 €;0 €. Vorteil: Nachteil:

  7. Struktur- info Daten Daten- erfassung beliebige Anwendung Noch Datenstruktur 3: Strukturdatei (comma separated value; ohne Zeilenstruktur) I;Heike Boß;Darmstädter Straße 46;K;200004;4560,00 €;2000 €;K;200005; 2398,78 €;2000 €;I;Friedrich Coy;Siedlerweg 17;K;20000;23,56 €;50 €;K; 200002;1200 €;500 €;I;Hans-Peter Daab;Adalbert-Stifter-Str. 10;K;200006;0 €;0 €. Vorteil: Nachteil:

  8. Struktur- info Daten Daten- erfassung beliebige Anwendung Noch Datenstruktur 3: Strukturdatei (Binärformat; anderes Beispiel) - nicht für das menschliche Auge bestimmt - Vorteil: Nachteil: Attribut Datentyp Mannschaftsname char [20] Spiele gespielt int Sätze gewonnen int Sätze verloren int Punkte gewonnen int Punkte verloren int

  9. DDL Interface Daten beliebige Anwendung Datenstruktur 4: Datenbank mit Data Dictionary Daten in irgendeinem internen Format; Strukturbeschreibung: in irgendeiner DDL Beispiel (SQL-DDL): CREATE TABLE Inhaber ( Nr integer; Name varchar (50); Strasse varchar (50); PRIMARY KEY (Nr);); CREATE TABLE Konto ( Kontonummer integer; Kontostand integer; Kreditrahmen integer; Inhaber integer; PRIMARY KEY (Kontonummer); FOREIGN KEY (Inhaber) REFERENCES Inhaber;); Data Diction. Vorteil: Nachteil:

  10. Zwischenfazit: Unstrukturierte Daten: Textdatei ohne explizite Strukturierung; Semantik erschließt sich aus der Textinterpretation Strukturierte Daten: Erst wird eine bindende Struktur festgelegt (-> Semantische Datenmodellierung), dann werden Daten entsprechend dieser Struktur eingegeben (Anwender benötigt spezielle Schnittstelle, da er die Struktur nicht kennt resp. kennen soll). Die Struktur ist weitgehend statisch; Änderungen („Schema Evolution“) machen Mühe.

  11. Wie geht der Nicht-Informatiker vor? • Er nimmt keine semantische Datenmodellierung vor (kann/will er nicht ...). • Er erhebt zunächst seine Daten und strukturiert sie (vielleicht) anschließend. • Er vertraut auf geeignete Werkzeuge, die ihm die Auswertung ermöglichen. • Beispiel: F&A (für eigene Datensammlungen) • Beispiel: Google (für fremde Datensammlungen) • Vorgehen stößt an Grenzen (s.o.) • Ausweg: • Der Anwender ergänzt die Daten um syntaktisch/semantische Zusätze („Tags“).

  12. Datenstruktur 5: Textdatei mit Tags (zunächst nur Idee) Heike Boß wohnt in der Darmstädter Straße 46. Sie hat Konto 200004 mit einem Kontostand von 4560,00 € und einem Kreditrahmen von 2000 €. Sie hat Konto 200005 mit einem Kontostand von 2398,78 € und einem Kreditrahmen von 2000 €. Friedrich Coy wohnt im Siedlerweg 17. Er hat Konto 200001 mit einem Kontostand von 23,56 € und einem Kreditrahmen von 50 €. Er hat Konto 200002 mit einem Kontostand von 1200 € und einem Kreditrahmen von 500 €. Hans-Peter Daab wohnt in der Adalbert-Stifter-Str. 10. Er hat Konto 200006 mit einem Kontostand von 0 € und einem Kreditrahmen von 0 €. Vorteil: Nachteil: Straße Name Kontonummer Kontostand Kreditrahmen

  13. Nochmals Datenstruktur 5: Textdatei mit Tags (nun aber – fast – richtig) Inhaber Heike Boß wohnt in der Straße Darmstädter Straße 46. Sie hat Konto Kontonummer 200004 mit einem Kontostand von 4560,00 € und einem Kreditrahmen von 2000 €. Sie hat Konto Kontonummer 200005 mit einem Kontostand von 2398,78 € und einem Kreditrahmen von 2000 €. Friedrich Coy wohnt im Siedlerweg 17. Er hat Konto 200001 mit einem Kontostand von 23,56 € und einem Kreditrahmen von 50 €. Er hat Konto 200002 mit einem Kontostand von 1200 € und einem Kreditrahmen von 500 €. Hans-Peter Daab wohnt in der Adalbert-Stifter-Str. 10. Er hat Konto 200006 mit einem Kontostand von 0 € und einem Kreditrahmen von 0 €. Vorteil: Nachteil:

  14. Nochmals Datenstruktur 5: Textdatei mit Tags (nochmals besser) Anfang_InhaberAnfang_Name Heike Boß Ende_Name wohnt in der Anfang_Straße Darmstädter Straße 46 Ende_StraßeEnde_Inhaber. Sie hat Anfang_Konto Anfang_Kontonummer 200004 Ende_Kontonummer mit einem Anfang_Kontostand von 4560,00 € Ende_Kontostand und einem Anfang_Kreditrahmen von 2000 € Ende_Kreditrahmen Ende_Konto. Sie hat Anfang_Konto Anfang_Kontonummer 200005 Ende_Kontonummer mit einem Anfang_Kontostand von 2398,78 € Ende_Kontostand und einem Anfang_Kreditrahmen von 2000 € Ende_Kreditrahmen Ende_Konto. Friedrich Coy wohnt im Siedlerweg 17. Er hat Konto 200001 mit einem Kontostand von 23,56 € und einem Kreditrahmen von 50 €. Er hat Konto 200002 mit einem Kontostand von 1200 € und einem Kreditrahmen von 500 €. Hans-Peter Daab wohnt in der Adalbert-Stifter-Str. 10. Er hat Konto 200006 mit einem Kontostand von 0 € und einem Kreditrahmen von 0 €. Was fehlt in dieser Datenstruktur? Was ist zuviel?

  15. Nochmals Datenstruktur 5: Textdatei mit Tags (XML) <Inhaber> <Name> Heike Boß </Name> <Straße> Darmstädter Straße 46 </Straße> <Konto> <Kontonummer> 200004 </Kontonummer> <Kontostand> 4560,00 € </Kontostand> <Kreditrahmen 2000 € </Kreditrahmen> </Konto> <Konto> <Kontonummer> 200005 </Kontonummer> <Kontostand 2398,78 € </Kontostand> <Kreditrahmen> 2000 € </Kreditrahmen> </Konto> </Inhaber> Friedrich Coy wohnt im Siedlerweg 17. Er hat Konto 200001 mit einem Kontostand von 23,56 € und einem Kreditrahmen von 50 €. Er hat Konto 200002 mit einem Kontostand von 1200 € und einem Kreditrahmen von 500 €. Hans-Peter Daab wohnt in der Adalbert-Stifter-Str. 10. Er hat Konto 200006 mit einem Kontostand von 0 € und einem Kreditrahmen von 0 €.

  16. Fazit: Unstrukturierte Daten: Textdatei ohne explizite Strukturierung; Semantik erschließt sich aus der Textinterpretation Semistrukturierte Daten: Die Strukturinformation ist Teil der Daten (implizit oder explizit). Die Struktur weist Variationen auf. Neue von der bisherigen Struktur abweichende Daten sind jederzeit einfügbar (keine Schema-Evolution nötig). Strukturinformation (Schema) lässt sich nachträglich aus den Daten gewinnen. Strukturierte Daten: Erst wird eine bindende Struktur festgelegt (-> Semantische Datenmodellierung), dann werden Daten entsprechend dieser Struktur eingegeben (Anwender benötigt spezielle Schnittstelle, da er die Struktur nicht kennt resp. kennen soll). Die Struktur ist weitgehend statisch; Änderungen („Schema Evolution“) machen Mühe.

More Related