220 likes | 339 Views
Gábor Dénes Főiskola. ELŐADÁS VÁZLATOK (kiegészítés) XML - eXtensible Markup Language KNAPP GÁBOR knapp@gdf-ri.hu 2000/2001. Információ átadás. Szóbeli előadás (prédikáció) Tartalom/Szerkezet/Forma, teljes metakommunikáció Guttenberg galaxis (írás, képi megjelenítés
E N D
Gábor Dénes Főiskola ELŐADÁSVÁZLATOK (kiegészítés) XML - eXtensible Markup Language KNAPP GÁBOR knapp@gdf-ri.hu 2000/2001
Információ átadás • Szóbeli előadás (prédikáció) • Tartalom/Szerkezet/Forma, teljes metakommunikáció • Guttenberg galaxis (írás, képi megjelenítés • Tartalom (nincs metakommunikáció) • Szerkezet fontossá válik • Forma (hordozza a szerkezetet, az emberi agy dolgozza fel) • Digitális világ • Tartalom • Forma (WYSIWIG, csábítóan módosítható) • elsikkad a Szerkezet 2
Digit feldolgozás Információ (gép) Digit feldolgozás Információ (gép) Információ útja a számítógép világában Hagyományos Információ (ember) Szöveg- szerkesztő Információ (ember) Papír Információ (gép,ember) Digit tárolás Digit feldolgozás Papír Kép Információ (ember) Korszerű 3
Problémák - Megjelenítés • Gyártó függőség • Sok gyártó (Freelance - Power Point) • Saját formátumok • Időtállóság • Sok alkalmazás (ChiWriter, Word) • Sok verzió (Word 6, 7, 8, 2000) • HW függés (Commodore, 5.25” FDD) • Egyfolytában konvertálni kell !!! • igen sokat ! általában a legrosszabbkor ! • Részleges megoldások • RTF - szép megjelenés • PS,PDF - lapleíró nyelvek 4
Problémák - Újrafeldolgozás • Akkor is gond, ha megoldódott a formátum kérdése • Klasszikus (cellux, uhu) • Keresés válogatás • Szabad szöveges keresés -> sok irreleváns találat • Formai jegyek alapján nem megy(Címekben keresünk, nem 14pt-s dőlt-ben)(Forma azonos, pl. fax, telefon) • Tartalmi szempontok alapján kell válogatni! • Részleges megoldások • Word stílusok (túl nagy a kísértés, kötött megjelenítés) • HTML (előre definiált tag-ek, kevés lehetőség)(Nem tudunk 100 000 találattal mit kezdeni!) • Teljesebb megoldás kell ! 5
(első) Megoldás - SGML • Cél • kereshető, szűrhető (tartalmi szerkezet) • újrafeldolgozható (időtálló, kereshető) • hosszú életű (időtálló, szabványos) • tervezhető (a struktúra „felélesztése”) • több (multi) média • Tartalom, • Megjelenés, • Szerkezet SZÉTVÁLASZTÁSA • kb. szöveges adatbázis • Standard Generalized Markup Language - ISO:1996 6
SGML WORD Az SGML hatóköre Tartalom (Információ) Forma (Megjelenítés) Szerkezet (Struktúra) 7
Document Type Definition • Tervezhető dokumentum típus • egységes, szabványos • külön állományban tárolódik a DTD • ellenőrzést tesz lehetővé • Az elemek szabadon definiálhatók • Típusmegkötések, értéktartományok • Fa struktúra • Előírt sorrend, számosság • Felhasználás (nagyobb cégek már csak így hajlandók) • szótárak, jogszabályok • ipar (autó, repülő, Pentagon) 8
Word 2 Word 6 Word 95 Word 2000 ? papír HTML PDF XML? Zsákutcák Megjelenítés kérdései • Problémák • sokféleség, változékonyság • a szerzői jogok „formához” kötöttek • a lényeg nem a kiadás, hanem a „befogadás” • a lényeg nem a forma, hanem a tartalom+szerkezet • Hagyományos „multimédia” előállítás 9
Állandó (tartós) DTD Tartalom Forma PDF SGML editor HTM CD 10 Megjelenítés SGML-ben • Az SGML önmagában nem jelenít meg
SGML előnyei/ hátrányai • Előnyök • Tartalom és forma szétválasztása • szöveges adatbázis • Független • hardver, operációs rendszer, szoftver verzió • Sokféle médiumra dolgozhat • www, CD, papír, WAP • Hátrányok • Bonyolult, nehezen integrálható • Körülményes terjesztés • Speciális szaktudást igényel • Drága 11
HTML • Közben 90-es évek eleje -> HTML, SGML alkalmazás • Egyszerű, jól olvasható, készíthető • Szabvány (!? - MS/Netscape) • Szoftver független (!? - MS/Netscape) • Forma orientált, nem a tartalomra koncentrál • Hivatkozásokat jól kezel • Nem jól kereshető (túl sok találat - hiányzik a szerkezet) • Túlságosan leegyszerűsített • Sok, olcsó szoftver • Nem fejleszthető már tovább ………………………... 12
EDI gyors pontos SGML elérhetőség újrafelhasználhatóság XML HTML gyorsan készül Internet kompatibilis ??? (Archiválás) Megoldandó problémák Értékes Rövid távú Hosszú távú Nem értékes 13
XML (eredeti) céljai • Interneten is felhasználható • SGML kompatibilis • Könnyen integrálható • Bővíthető • Specifikáció és az adatok könnyű feldolgozása(Az XML specifikáció nincs 40 oldal) • Független (W3C) • Ember által is jól olvasható (ASCII) • Egyszerű ellenőrzés, validálás, Well-formed document 14
XML XML HTML SGML, XML, HTML SGML 15
XML történet • 1996.07 W3C XML munkacsoport • 1996.11 SGML’96, első XML tervezet • 1997.03 Microsoft CDF, XML alapon • 1997.04 XML Working Draft • 1997.12 XML Proposed Recommendation • 1998.02 XML 1.0 • Támogatók: • Sun, IBM, Oracle, Microsoft, Adobe, W3C, SAP, Software AG 16
XML összetevők • DTD Struktúra • XML Tartalom • XSL (CSS) Forma • Csupán a megjelenítéshez nem kell DTD, csak a szerkesztéshez, ill. ellenőrzéshez! • A DTD (és az XSL is) lehet magában a HTML állományban -> Önleíró állomány • Egyebek (részben kidolgozás alatt): • XLink Dokumentumok közötti kapcsolat • XPointer Dokumentumon belüli kapcsolatok • DOM XML felhasználása programnyelvekbe • XSLT Transzformálás • XQL Lekérdező nyelv • … lásd http://www.w3c.org/xml 17
BOLT KÉSZLET CIKK+ NÉV DARAB LEÍRÁS+ Példa - Dokumentum szerkezet 18
Példa - DTD • <!ELEMENT bolt (keszlet) > • <!ELEMENT keszlet (cikk)* > • <!ELEMENT cikk (nev,darab,leiras+) > • <!ATTLIST cikk id CDATA #IMPLIED • tipus CDATA #IMPLIED> • <!ELEMENT nev (#PCDATA) > • <!ELEMENT darab EMPTY > • <!ATTLIST darab no CDATA #IMPLIED> • <!ELEMENT leiras (#PCDATA) > 19
Példa - XML dokumentum • <?xml version="1.0"?> • <bolt> • <keszlet> • <cikk id="1" tipus="akcio"> • <nev>turmixgép</nev> • <darab no="12"/><leiras>…</leiras></cikk> • <cikk id="2" tipus="hasznalt"> • <nev>konyhai mérleg</nev> • <darab no="1"/><leiras>…</leiras></cikk> • … • </keszlet> • </bolt> 20
XML egyéb felhasználása • XML/EDI • EDI: szabvány, kiforrott, de drága, zárt hálózat • www.bizTalk.org (Microsoft szervezés) • European XML/EDI pilot project: 2000 július • Adatbázis alkalmazások (egyelőre interpreter+RDB) • Oracle: XSQL servlet IBM: Middleware - Message Broker • Microsoft: XQL és SQL egyformán fontos (SQL 2000)! • Kisvállalatok? • Kommunikációs nyelv (Prezentációs réteg szabványa) • nem internetes alkalmazások internetre integrálása • egységes formátum! (Word 2000: HTML+CSS+XML) 21
XML összefoglaló • Strukturált adatok szöveg formátumban • Megtekintéséhez nem kell az előállító program • Hasonlít a HTML-hez, de nem az! • Az XML-ben a tag-ek csak határolók, nincs hatásuk a megjelenésre • Olvasható, de gép számára készült • szigorú formai szabályok, nincs lazaság (ld. HTML) • Az XML elnevezés egy egész szabvány családot takar • sőt, újabb nyelvek alapja: SMIL, MathML, X3D, CML • Nagy terjedelmű, de nem baj • jó hatékonyságúak a tömörítő technikák • Újdonság, de mégsem egészen az • az SGML elveire, a HTML tapasztalataira épít • Független, ingyenes, támogatott 22