1 / 20

Geoinformation III

Geoinformation III. Vorlesung 12. XML. Übersicht über den dritten Vorlesungsblock. 1. Offene Systeme, Rechnernetze und das Internet Die e X tensible M arkup L anguage XML 2. Grundlagen, Spezifikation von Datenformaten 3. Vom UML-Diagramm zum XML-Format 4. Geographic Markup Language GML:

kane-brock
Download Presentation

Geoinformation III

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Geoinformation III Vorlesung 12 XML

  2. Übersicht über den dritten Vorlesungsblock 1.Offene Systeme, Rechnernetze und das Internet Die eXtensible Markup Language XML 2. Grundlagen, Spezifikation von Datenformaten 3. Vom UML-Diagramm zum XML-Format 4. Geographic Markup Language GML: • der vom OpenGIS-Consortium als XML-Anwendung definierte Standard für Geo-Objekte Thomas H. Kolbe - Geoinformationen III - 5. Semester - WS 1/2 - Vorlesung 11

  3. Extensible Markup Language Eines der größten Hindernisse bzgl. der Interoperabilität von Systemen sind die vielen proprietären Datenformate, deren Struktur zudem oftmals nicht offengelegt ist. • XML ist eine Meta-Sprache zur Definition eigener Datenformate • in XML spezifizierte Dokumentenformate heißen XML-Anwendungen • Beispiele für bekannte XML-Anwendungen: • Scalable Vector Graphics SVG • Synchronised Media Integration Language SMIL • Geographic Markup Language GML vom OpenGIS Consortium • XML-Dokumente sind sowohl maschinen- als auch menschenlesbar • Struktur und Syntax von XML-Dokumenten ähnelt HTML • Der Entwurf von XML ist formal und präzise • Korrektheit von XML-Dokumenten kann zu großen Teilen bereits außerhalb des eigentlichen Anwendungsprogramms geprüft werden Thomas H. Kolbe - Geoinformationen III - 5. Semester - WS 1/2 - Vorlesung 11

  4. XML – Dokument XML–Prozessor (PARSER) Anwendung Extensible Markup Language (XML) 1.0 • W3C Recommendation (Feb. 1998) • Das World-Wide-Web-Consortium (W3C) ist für die Entwicklung von Standards für das WWW zuständig Second Edition: W3C Recommendation (Okt. 2000) http://www.w3.org/TR/2000/REC-xml-20001006 In dem oben genannten Dokument werden XML-Dokumente und das Verhalten eines XML-Prozessors (Parser) definiert, der ein XML-Dokument liest und an eine Anwendung weiterreicht, die die Information verarbeitet: Thomas H. Kolbe - Geoinformationen III - 5. Semester - WS 1/2 - Vorlesung 11

  5. Quelltext Ergebnis Beispielanfrage:Welche Berufe hatte der alte Gauß? paragraph (Absatz) HTML bold (fett) <p ><b>Carl F. Gauß</b></p> <ul> <li>1777 bis 1855</li> <li>Mathematiker</li> <li>Geodät</li> <li>Physiker</li> </ul> • Carl F. Gauß • 1777 bis 1855 • Mathematiker • Geodät • Physiker List item Problem: für die Darstellung im Webbrowser geeignet, allerdings nicht für thematische Abfragen und Recherchen. Die Auszeichnungen (Tags) sagen nur etwas über die Formatierung, aber nicht über die Bedeutung (Semantik) des Textinhaltes aus. unnamed list Thomas H. Kolbe - Geoinformationen III - 5. Semester - WS 1/2 - Vorlesung 11

  6. <?xml version=“1.0“ encoding=“ISO-8859-1“ standalone=“yes“?> <!DOCTYPE person SYSTEM “person.dtd“> <person> <name> <vorname>Carl</vorname> <vorname>F.</vorname> <nachname>Gauß</nachname> </name> <geburtsjahr>1777</geburtsjahr> <todesjahr>1855</todesjahr> <beruf>Mathematik</beruf> <beruf>Geodät</beruf> <beruf>Physiker</beruf> </person> XML - Beispiel So sähe die entsprechende XML-Datei zum Beispiel der vorigen Folie aus. Durch entsprechend definiertes Markup (Tags) werden aus einfachen Daten (maschinen-) interpretierbare Informationen. Die Syntax und Struktur ähnelt der von HTML. Thomas H. Kolbe - Geoinformationen III - 5. Semester - WS 1/2 - Vorlesung 11

  7. Element person Start-Tag Inhalt End-Tag Elemente, Tags und Zeichen • Der String Carl Friedrich Gauß und die Leerzeichen sind Zeichendaten • <person> und </person> sind Auszeichnungen (Markup) • Das Tag ist die gebräuchlichste Form der Auszeichnung in einem XML-Dokument • für leere Elemente, also Elemente ohne Inhalt, kann folgende Syntax abkürzend verwendet werden <br/> anstatt <br></br> • zwischen Groß- und Kleinschreibung wird unterschieden Person  person <person> Carl Friedrich Gauß </person> Thomas H. Kolbe - Geoinformationen III - 5. Semester - WS 1/2 - Vorlesung 11

  8. <person> <name> <vorname>Friedrich</vorname> <nachname>Gauß</nachname> </name> <beruf>Mathematiker</beruf> <beruf>Geodät</beruf> </person> Wurzelelement name beruf beruf vorname nachname Mathematiker Geodät Geschwister Geschwister Friedrich Gauß XML – Dokumente sind Bäume Kindelement von person person Elternelement von vor- und nachname Thomas H. Kolbe - Geoinformationen III - 5. Semester - WS 1/2 - Vorlesung 11

  9. XML-Dokumente mit gemischtem Inhalt <biographie> <name><vorname>Carl Friedrich</vorname> <nachname>Gauß</nachname> </name> war einer der wichtigsten Geodäten und Mathematiker.<name> <nachname>Gauß</nachname></name> war außerdem ein anerkannter <beruf>Physiker</beruf>. Am<datum><Tag>23.</Tag><monat>Februar </monat><jahr>1855</jahr></datum> ist er gestorben. </biographie> • Das Wurzellement biographie enthält die Kindelemente name, beruf und datum und eine Menge roher, unstrukturierter Zeichendaten. Es enthält einen gemischten Inhalt. Thomas H. Kolbe - Geoinformationen III - 5. Semester - WS 1/2 - Vorlesung 11

  10. entspricht Attribute • Elemente können neben dem Inhalt auch noch Attribute besitzen • Ein Attribut ist ein Paar aus einem Namen und einem Wert • Die Zuweisung erfolgt im Start-Tag eines Elements • Die Namen werden von den Werten durch Gleichheitszeichen und optional durch Leerzeichen getrennt • Die Werte sind in einfache oder doppelte Anführungszeichen eingeschlossen <person geboren=“1777/04/30“ gestorben=“1855/02/23“> Carl Friedrich Gauß </person> <person geboren = ‘1777/04/30‘ gestorben = ‘1855/02/23‘> Carl Friedrich Gauß </person> Thomas H. Kolbe - Geoinformationen III - 5. Semester - WS 1/2 - Vorlesung 11

  11. <Carls_Geburtstag>30 4 1777</Carls_Geburtstag> f <Monat/Tag/Jahr>21/01/2002</Monat/Tag/Jahr> f <4-you>Ich mag dich</4-you> <Vorname_Name>Carl Gauß</Vorname_Name> <téléphone>0190 666666</téléphone> XML – Namen I XML-Namen (Element-, Attributnamen,...) dürfen folgende Zeichen enthalten: • Buchstaben: A – Z ; a – z (englische Buchstaben) • Nichtenglische Buchstaben und Ideogramme: ö, f, x, ç • Ziffern: 0 – 9 • Nur folgende Interpunktionszeichen: Unterstrich ( _ ), Bindestrich ( - ), Punkt ( . ) • Doppelpunkt ist für Namensräume reserviert • XML-Namen müssen mit Buchstaben, Ideogrammen oder Unterstrich beginnen • Reserviert sind alle Namen die mit XML, xml, Xml, xMl ... beginnen Thomas H. Kolbe - Geoinformationen III - 5. Semester - WS 1/2 - Vorlesung 11

  12. <Monat-Tag-Jahr>21/01/2002</Monat-Tag-Jahr> <_4-you>Ich mag dich</_4-you> f <Carl‘s_Geburtstag>30 4 1777</Carl‘s_Geburtstag> f <Vorname Name>Carl Friedrich</Vorname Name> <owoya>Melina Merkouri</owoya > XML – Namen II XML-Namen (Element-, Attributnamen,...) dürfen folgende Zeichen enthalten: • Buchstaben: A – Z ; a – z (englische Buchstaben) • Nichtenglische Buchstaben und Ideogramme: ö, f, x, ç • Ziffern: 0 – 9 • Nur folgende Interpunktionszeichen: Unterstrich ( _ ), Bindestrich ( - ), Punkt ( . ) • Doppelpunkt ist für Namensräume reserviert • XML-Namen müssen mit Buchstaben, Ideogrammen oder Unterstrich beginnen • Reserviert sind alle Namen die mit XML, xml, Xml, xMl ... beginnen Thomas H. Kolbe - Geoinformationen III - 5. Semester - WS 1/2 - Vorlesung 11

  13. Entity-Referenzen XML reserviert einige Zeichen (<>&“‘/). Um diese dennoch verwenden zu können verwenden werden sie durch Entity-Referenzen ersetzt. XML gibt genau fünf Entity-Referenzen vor: &lt; Kleiner-als-Zeichen (<) &amp; das Ampersand (&) &gt; Großer-als-Zeichen (>) &quot; geraden doppelten Anführungszeichen (“) &apos; Apostroph oder einfachen Anführungszeichen (‘) Bsp.: <Autor>Witte &amp; Schmidt</Autor> bedeutet: <Autor>Witte & Schmidt</Autor> das &amp; kann von Parsern nicht missverstanden werden Es können weitere Entity-Referenzen festgelegt werden. Thomas H. Kolbe - Geoinformationen III - 5. Semester - WS 1/2 - Vorlesung 11

  14. CDATA-Abschnitte Um die aufwendige Nutzung der Entity-Referenzen zu umgehen gibt die Möglichkeit der CDATA-Abschnitte: CDATA-Abschnitte: Alles was sich zwischen <![CDATA[ und ]]> befindet, wird als reine Zeichenkette interpretiert. Es gibt keine Auszeichnungen, nur noch Zeichendaten. Beispiel: <![CDATA[XML ist so komplex! <seufz> Sei´s drum! ]]> <seufz> ist hier kein Tag sondern nur ein Zeichenstring Thomas H. Kolbe - Geoinformationen III - 5. Semester - WS 1/2 - Vorlesung 11

  15. Kommentare Kommentare benutzt man um den Quellcode für menschliche Leser verständlich zu machen. Kommentare beginnen mit <!-- und enden mit --> Bsp.:<!-- Hier beschreibe ich die Person Gauß-- > • Die Regeln für Kommentare: • -- sollte innerhalb eines Kommentars nicht auftreten • ein 3-facher Bindestich als Teil des Schlusszeichens ---> ist verboten • Kommentare sind niemals zwingend • Sie dürfen nicht innerhalb von Tags oder andere Kommentaren stehen Thomas H. Kolbe - Geoinformationen III - 5. Semester - WS 1/2 - Vorlesung 11

  16. Steueranweisungen • XML-Dokumente sind normalerweise weitgehend unabhängig von den Programmen, die mit ihnen arbeiten • In manchen Fällen kann es sinnvoll sein, Hinweise oder Befehle zum Lesen bzw. zur Bearbeitung in ein Dokument einzubauen • Steueranweisungen (Processing Instructions) dienen der Übergabe von Informationen an bestimmte Anwendungsprogramme • Steueranweisungen können eine beliebige Menge Text enthalten, der „ungeparsed“, d.h. ohne Konvertierungen oder Ersetzungen an die entsprechende Anwendung weitergereicht wird. • Beispiel:<?robots index=“yes“ follow=“no“?> Ende mit ?> Beginn mit <? Name der Anwendung beliebiger Text Thomas H. Kolbe - Geoinformationen III - 5. Semester - WS 1/2 - Vorlesung 11

  17. Verwendete XML-Version Verwendeter Zeichensatz Eigenständige Datei JA / Nein XML-Deklaration • Die XML-Deklaration • ist eine optionale Steueranweisung • steht als erste im Dokument • gibt Auskunft über <?xml version=“1.0“ encoding=“ISO-8859-1“ standalone=“yes“?> <person> Carl Friedrich Gauß </person> Thomas H. Kolbe - Geoinformationen III - 5. Semester - WS 1/2 - Vorlesung 11

  18. <name><nachname>Gauß</nachname></name> Wohlgeformtheit I Alle XML-Dokumente müssen ohne Ausnahme wohlgeformt sein: 1. Jedes Start-Tag muss ein dazugehöriges End-Tag haben <person geboren=“1777/04/30“ gestorben=“1855/02/23“> Carl Friedrich Gauß </person> 2. Elemente dürfen einander nicht überschneiden 3. Attributwerte müssen in Anführungszeichen stehen <vorname>Friedrich</vorname> <name><nachname>Gauß</name></nachname> Thomas H. Kolbe - Geoinformationen III - 5. Semester - WS 1/2 - Vorlesung 11

  19. <person><!-- Hier bezeichne ich Personen--> Carl Friedrich Gauß </person> Wohlgeformtheit II Alle XML-Dokumente müssen ohne Ausnahme wohlgeformt sein: 4. Element- und Attributbezeichner müssenXML-Namen sein <person geboren=“1777/04/30“ geboren=“1855/02/23“> Carl Friedrich Gauß </person> 5. Ein Element darf nicht 2 Attribute mit gleichem Namen besitzen 6. Kommentare & Steueranweisungen dürfen nicht innerhalb Tags stehen <person<!-- Hier bezeichne ich Personen-->> Carl Friedrich Gauß </person> Thomas H. Kolbe - Geoinformationen III - 5. Semester - WS 1/2 - Vorlesung 11

  20. <person> <beruf>Geodät</beruf> </person> <person> <vorname>Carl</vorname> </person> <Autor>Witte &amp; Schmidt</Autor> <person> <namef> <vorname>Carl</vorname> </name> <beruf>Geodät</beruf> </person> 7. In den Zeichendaten eines Elements oder Attributs dürfen keine ungeschützten <- oder &- Zeichen stehen. Wohlgeformtheit III Alle XML-Dokumente müssen ohne Ausnahme wohlgeformt sein: 8. Es muss genau ein Wurzelelement geben <Autor>Witte & Schmidt</Autor> Thomas H. Kolbe - Geoinformationen III - 5. Semester - WS 1/2 - Vorlesung 11

More Related