1 / 85

Cours de cycle C CNAM de Lyon XML et gestion de contenus Web

Cours de cycle C CNAM de Lyon XML et gestion de contenus Web. accary. tiphaine@free.fr http://accary.tiphaine.free.fr/teaching/XML_CNAM. Tiphaine Accary-Barbier. Programme du cours. Technologies XML. Gestion de contenus Web. Nouvelles architectures et techniques d'exploitation du Web

leo-harris
Download Presentation

Cours de cycle C CNAM de Lyon XML et gestion de contenus Web

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Cours de cycle CCNAM de LyonXML et gestion de contenus Web accary. tiphaine@free.fr http://accary.tiphaine.free.fr/teaching/XML_CNAM Tiphaine Accary-Barbier ACCARY-BARBIER / CNAM - Cycle C - 2007-2008

  2. Programme du cours • Technologies XML • Gestion de contenus Web • Nouvelles architectures et techniques d'exploitation du Web • services web, web sémantique, médiation et architectures pair à pair (6 séances) • Notation : Note TP + Note examen • Volume horaire total : 15 séances de 3h ACCARY-BARBIER / CNAM - Cycle C - 2007-2008

  3. 1ère partie : Technologies XML CHAPITRE 1 : XML et DTD CHAPITRE 2 : Schémas XML CHAPITRE 3 : XPath et XSLT CHAPITRE 4 : Applications XML ACCARY-BARBIER / CNAM - Cycle C - 2007-2008

  4. Chapitre 1 : XML et DTD • 1. XML : contexte et origine • 1.1. Document, multimédia ,hyperdocuments et web • 1.2. Pourquoi XML : SGML, HTML • 2. Présentation de XML • 2.1. Structure d'un document XML • 2.1.1. Prologue • 2.2.2. Arbre des élément • 2.2.3. Commentaires • 2.2. Documents bien formés, documents valides • 3. Les DTD • 3.1. Déclaration d’éléments • 3.2. Déclaration d’attributs • 3.3. Déclaration d’entités • 3.4. Déclaration de notations • En savoir plus… ACCARY-BARBIER / CNAM - Cycle C - 2007-2008

  5. année nom "titre" entreprise p2 p1 Qu'appelle t'on "Document" ? • Un document est à la fois un contenu et un contenant : • Structure logique : squelette sémantique -> (SGML) • Structure physique : "mise en forme" -> (HTML) Logiques Physiques Modèlesde document DEA PFE - entête - intro - état-art -spécif-générales -spécif-détaillées -maquette -conclusion -biblio formatA4 documents spécifiques ACCARY-BARBIER / CNAM - Cycle C - 2007-2008

  6. INSA le 1/4/2003 bbbbbbbbbbbbbbbbbbbbbbbbbbbb bbbbbbbbbbbbbbbbbbbbbbbbbbbb bbbbbbbbbbbbbb. ccccccccccccccccccccccccccccc cccccccccccccccccccccccccccccccc cccccccccccccccccccccccccccccccc cccccccccccccccccccccccccccccccc cccccccccccccccccccccccccccccccc réf. JD/PRF/C-INSA/1 P 1 / 2 réf. JD/PRF/C-INSA/1 P 2 / 2 Un exemple de document Direction à Paul Haddock sujet:Médiathèque Cher collègue aaaaaaaaaaaaaaaaaaaaaaaaaaaa aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa aaaaaaaaaaaaaaaaaaaaaaaaa. Sincères salutations bbbbbbbbbbbbbbbbbbbbbbbbbb bbbbbbbbbbbbbbbbbbbbbbbbbbbb bbbbbbbbbbbbbbbbbbbbbbbbbbbb Jean Dupont Directeur Général ACCARY-BARBIER / CNAM - Cycle C - 2007-2008

  7. INSA le 1/4/2003 date Entête Direction exp à Paul Haddock dest sujet :Médiathèque sujet Cher collègue titre aaaa ... aaaa. §a bbbb ...... bbb. racine logique spécif. Corps §b bbbb .. bbb. cccc .........ccccc §c Sincères salutations formule sign fin Jean Dupont nom-s Directeur Général tit-s Structure logique ACCARY-BARBIER / CNAM - Cycle C - 2007-2008

  8. logo INSAle 1/4/2003 date Direction exp c-ent àPaulHaddock dest sujet : Médiathèque sujet titre Chercollègue p1 aaaa ... aaaa. §a corps1 bbbb ...... bbb. §b1 hp1 réf. JD/PRF/C-INSA/1 bp1 P 1 / 2 np1 bbbb .. bbb. §b2 racine phys. spécif. cccc .........ccccc §c Sincèressalutations formule corps2 sign JeanDupont nom-s p2 DirecteurGénéral tit-s hp2 réf. JD/PRF/C-INSA/1 bp2 P 2 / 2 np2 Structure physique ACCARY-BARBIER / CNAM - Cycle C - 2007-2008

  9. Définitions du Multimédia • Document multimédia : • Document utilisant au moins 2 médias télécommunications Information et documentation Micro informatique Audio-visuel Technologies fédératrices : numérisation & modélisation MULTIMEDIA ACCARY-BARBIER / CNAM - Cycle C - 2007-2008

  10. formation : • nouvelles technologies • éducatives • auto-formation • formation "juste à temps" Infoloisir :s'informer et/ou se distraire • jeux • visites (musée, ...) • encyclopédies l'information revue de presse: l'information • que je veux • quand je veux • où je veux services et commerces • catalogues • communication entre entreprises Documentation • accès au contenu des • documents (distant) • bibliothèque virtuelle • aide à la recherche • d'information communication • courrier électronique • audio messagerie • visio conférences • échange de documents Métiers du multimédia Multimédia ACCARY-BARBIER / CNAM - Cycle C - 2007-2008

  11. Origines de l'hypertexte • Concept d’hypertexte : 1945 Vannevar Bush (conseiller de Roosevelt) décrit un bureau électromécanique futuriste appelé MEMEX • Destiné à étendre les capacités de la mémoire. • Ce bureau devait contenir des microfilms et les retrouver automatiquement à partir d'un index. • Possibilité de créer un index pour toute paire de microfilms, ce qui revient à créer des hyperliens. • Gestion informatique dans les années 1960 (Engelbart, Nelson, ...) • invention du terme "hypertexte" et de la souris. • Terme hypertexte inventé en 1965 par Ted Nelson : • Réseau constitué par un ensemble de documents informatiques (originaux, citations, annotations) liés entre eux  • Hypertexte non linéaire, par opposition à un livre. • Popularité grâce L'application HyperCard publiée par Apple en 1987 • ATTENTION : • système hypertexte (logiciel) ≠ hyperdocument textuel (données) • système hypermédia (logiciel) ≠ hyperdocument multimédia (informations) ACCARY-BARBIER / CNAM - Cycle C - 2007-2008

  12. A1 AUTEUR : Vannevar Bush Vannevar Bush était le conseillé du président Roosevelt. On lui attribue les premiers travaux sur les hypertextes. En 1945, il publia un article "As we may think" dans lequel il présente son système MEMEX--------------- P1 ARTICLE : As we may think auteur : Vannevar Bush date : juillet 1945 éditeur : Atlantic Monthly pages : 101-108 Résumé : V. Bush présente un système graphique de gestion de notes manuscrites, nommé le MEMEX (Memory Extension) --- As we may think Vannevar Bush ---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------- C1 Concept : Hypertexte Le concept d'hypertexte est simple: des fenêtres dans un écran sont associées à des objets appelés noeuds. Ces noeuds sont reliés par des liens, --------- --------- Liens hypertextuels ACCARY-BARBIER / CNAM - Cycle C - 2007-2008

  13. Définition d'un Hyperdocument • Hyperdocument : • Généralisation du concept d'hypertexte aux documents • Ensemble structuré de noeuds et de liens • Associés à des contenus • Textuels (avec ou sans formules) • Graphiques (géométrique ou photographique) • Sonores ou vidéos • Structure (hypergraphe - graphe – arbre) définie par les liens (typés) entre les nœuds • Conception différente de celle d'un document • Plusieurs vues possibles • Nécessité de chemins pour guider le lecteur • Document hypermédia : • Fusion des concepts d’hyperdocument et de multimédia ACCARY-BARBIER / CNAM - Cycle C - 2007-2008

  14. Liens et Hyperliens • Liens de composition (partage de l’information) • Fort : pas de partage de l'objet composé • Faible : partage de l'objet composé avec d'autres objets • Liens signifiant un remplacement (gestion de versions d’objets) • Liens d'association : portent une sémantique • Hyperliens (h-lien) définissent un parcours dans un hyperdocument • Liens exprimant des rapprochements sémantiques • Voisinage, • Equivalence ou similitude • Etc. ACCARY-BARBIER / CNAM - Cycle C - 2007-2008

  15. réseau mondial (INTERNET) réseaux nationaux (EN : RENATER) réseaux régionaux (EN : ARAMIS ) réseaux inter-établissement (ROCAD) réseaux d'établissement (INSA) réseaux locaux (Dépt IF) Internet • Réunit actuellement : • Des centaines de millions d'utilisateurs • Dans presque tous les pays • Structure complexe • Aspect hiérarchique • Interconnections transversales • Supporte diverses applications • Dont le WEB (WWW) ACCARY-BARBIER / CNAM - Cycle C - 2007-2008

  16. Histoire du World-Wide Web (W3) • Système d'information hypermédia sur INTERNET; • Conçu en 1989 par Tim Berners-Lee (au CERN) pour permettre aux chercheurs-visiteurs du CERN d'échanger des informations scientifiques (articles, rapports) après leur séjour • Fondé sur l'extension du concept "hyperdocument" aux réseaux internationaux (hyperdocument réparti) • Amélioration de l'existant (mais pas révolution) : • permet un accès plus convivial à des serveurs existants (WAIS, GOPHER, FTP, ...existaient avant mais exigeaient des "clients" spécifiques) ACCARY-BARBIER / CNAM - Cycle C - 2007-2008

  17. Architecture du Web • Le Web est un système d’information en réseau constitué d’agents (programme agissant pour une personne, une entité ou un processus) qui échangent de l’information. • Les trois piliers de l’architecture du Web : • Identification • Ressources identifiées par un schéma d’adressage universel et unique, les URIs [RFC2396] • Interaction • Ressources échangées selon des protocoles comme HTTP, FTP, SMTP,… • Représentation • Ressources représentées via un ensemble non-exclusif de formats • XML participe à la représentation des ressources sur le Web ACCARY-BARBIER / CNAM - Cycle C - 2007-2008

  18. URL : Universal Resource Locator • Le WEB permet d'établir des liens entre documents • Stockés sur n'importe quel serveur d'INTERNET, • Accessibles par différents protocoles (HTTP, FTP, GOPHER, ...); • Ces documents peuvent être: • Des fichiers, • Des résultats d'interrogation de B.D., • Des résultats de programmes, .... • Accès aux documents via leur URL : adresse d'un document ACCARY-BARBIER / CNAM - Cycle C - 2007-2008

  19. Format d'une URL • méthode: //machine :port/fichier[#ancre | ?paramètres] 80 par défaut ou un nombre entre 1023 et 65537 liste des paramètres (requêtes) nom du pointeur dans le doc. HTML nom de la machine Chemin d'accès (relatif ou absolu) http://www.insa-lyon.fr:80/Labos/LISI/themes/siam.htm#dad http://www.univ-lyon1.fr/cgi-bin/phf-lyon1?Qname=accary ACCARY-BARBIER / CNAM - Cycle C - 2007-2008

  20. Principes généraux de fonctionnement du Web • Modèle classique "client - serveur". • Serveur WEB : Programme qui "tourne" sur un ordinateur dont le seul but est de répondre aux requêtes des Client. • Demande de transfert de fichier • Résultat de l'exécution d'un programme sur le serveuroriginalité du WEB qui permet son interfaçage avec pratiquement n'importe quel logiciel • Client WEB : Programme qui permet à un utilisateur: • De soumettre des requêtes à un serveur WEB • De visualiser les résultats • De naviguer dans un document HTML • De dialoguer avec d'autres types de serveurs (FTP, Mail,...) • éventuellement d'autres services (selon le type de client) ACCARY-BARBIER / CNAM - Cycle C - 2007-2008

  21. Exemple de fonctionnement pour HTTP • HyperText Transfer Protocol défini pour gérer les échanges entre serveurs et clients WEB : • tout serveur WWW écoute enpermanence les requêtes des clients potentiels sur un port TCP • le client effectue une connexion TCP sur le port HTTP du serveur ciblé • le serveur accepte la connexion • le client émet une requête(commande GET & URL du document demandé) • le serveur expédie le document demandé ("fichier" HTML) • le serveur coupe la connexion. ACCARY-BARBIER / CNAM - Cycle C - 2007-2008

  22. Chapitre 1 : XML et DTD • 1. XML : contexte et origine • 1.1. Document, multimédia ,hyperdocuments et web • 1.2. Pourquoi XML : SGML, HTML • 2. Présentation de XML • 2.1. Structure d'un document XML • 2.1.1. Prologue • 2.2.2. Arbre des élément • 2.2.3. Commentaires • 2.2. Documents bien formés, documents valides • 3. Les DTD • 3.1. Déclaration d’éléments • 3.2. Déclaration d’attributs • 3.3. Déclaration d’entités • 3.4. Déclaration de notations • En savoir plus… ACCARY-BARBIER / CNAM - Cycle C - 2007-2008

  23. Origines de XML : SGML • Standard Generalized Markup Language • Norme ISO 8879 en 1986, révisée en 1988 et 1994 • Métalangage de balisage de documents • Lisible par l’être humain et traitable par une machine • Permettant de définir des langages de balisage<titre>Le corbeau et le renard</titre> • Objectifs : • Définir un modèle de structure logique pour coder l’information • Coder l’information selon ce modèle • Assurer la pérennité des informations • Assurer l’indépendance des informations vis-à-vis des matériels et des logiciels ACCARY-BARBIER / CNAM - Cycle C - 2007-2008

  24. Document SGML • Composants du document SGML • DTD (Definition de Type de Document) • Précise la structure du document • Instance du document • Texte du document + élément définis dans la DTD • Instance conforme à 1 seule DTD • Synthèse du document • Options, jeu de caractère, fonctions similaires… • SGML est un langage documentaire répandu • Encyclopédie, AAP, ATA, DoD, EDF, SNCF, ONU, etc. ACCARY-BARBIER / CNAM - Cycle C - 2007-2008

  25. Limites de SGML • Inadapté pour une gestion Hyperdocumentaire • Très complexe et lourd d’options inutiles • Pauvreté du mécanisme de liaison • Liens internes par le biais d'identifiants et d'entités • Pas de liens vers l'extérieur du document • Pas de notion d'ancre • Uniquement des liens contextuel • Pas de mécanismes d’Hyperliens • Mal adapté aux applications WEB • Pas de Browser/Editeur SGML du domaine public • Solutions propriétaires “onéreuses” • N'utilise pas de notion de fragment • Obligation de connaître la DTD liée à une instance • dans un contexte WEB, il est difficile de transmettre les DTD associées à chaque fragment (DTD volumineuse, définie pour un document complet, calcul dynamique complexe) ACCARY-BARBIER / CNAM - Cycle C - 2007-2008

  26. HyperText Markup Language • Modèle de représentation d'hyperdocuments • Utilisé par les serveurs et les clients WEB • Défini selon le standard SGML • Conçu pour la représentation d'hyperdocuments • Modèle en constante évolution : • HTML-1 (1989) : du texte, quelques styles, des liens hypertextes • HTML-2 (1994) : HTML-1 + des images, des formulaires interactifs • HTML-3 (1996) : HTML-2 + des graphiques vectoriels, du son, des applets • HTML-4 (1998) : HTML-3 + vidéo, outils pour INTRANET, ---- • Amené à disparaître en faveur de XHTML (norme XML) ACCARY-BARBIER / CNAM - Cycle C - 2007-2008

  27. La "DTD" HTML • Définit la structure "logico-physique" d'un "document" HTML • Structure simple avec un nombre réduit de types d'éléments SGML • Noeud : <HTML> contenu du noeud </HTML> • entête : <HEAD> contenu entête </HEAD> • titre : <TITLE> titre </TITLE> • paragraphe : <P> texte du paragraphe </P> • ancre : <A URL> texte-ancre </A> • etc. • Les formats des images, des polices, des enrichissements, ... sont prédéfinis (JPEG, GIF, ....) ACCARY-BARBIER / CNAM - Cycle C - 2007-2008

  28. Exemple de document HTML <HTML><HEAD> <TITLE>Le Corbeau et le Renard </TITLE> <AUTHOR> <A REF="http://....--@encyclopédie--> Jean de la Fontaine </A> <AUTHOR></HEAD> <BODY> <UL> <LI> Maître Corbeau sur un arbre perché,</LI> <LI> tenait en son bec un fromage, </LI> ------ </UL> </BODY> </HTLM> ACCARY-BARBIER / CNAM - Cycle C - 2007-2008

  29. Limites de HTML • HTML est limité : • Orienté vers la présentation hypertextuelle • Application SGML figée : • Impossibilité de définir de nouvelles balises • Adaptations difficile aux applications particulières du client • Difficultés à trouver l’information recherchée • Critères de sélection (résumé, mots-clés…etc.) • Pauvreté des types d’hyperliens ACCARY-BARBIER / CNAM - Cycle C - 2007-2008

  30. Limites sémantiques de HTML • Modélisations logique et physique confondues • besoin d'une sémantique <Langage> HTML </Langage> • besoin de dissocier la présentation Tag Langage, Style:Italique <HTML> <HEAD> <TITLE>Rapport PFE</TITLE> </HEAD> <BODY> <H1>Dossier Médical</H1> <P> Limites du langage <I>HTML</I> </P> </BODY> <HTML> Dossier Médical Limites du langageHTML ACCARY-BARBIER / CNAM - Cycle C - 2007-2008

  31. Solution : XML • HTML et SGML : Solutions imparfaites pour l'échange d'information documentaire structurée sur Internet ou intranet • XML = Extensible Markup Language développé par le W3C • Sous-ensemble restreint de SGML adapté aux applications WEB qui offre la liberté dans la définition du langage de balisage • Rend possible le traitement des fragments documentaires sans connaître leur DTD -> vise à permettre sur le WEB : • la diffusion de fragments d'instance SGML sans en développer la DTD • la réception et le traitement d'instance SGML sans en connaître la DTD ACCARY-BARBIER / CNAM - Cycle C - 2007-2008

  32. Chapitre 1 : XML et DTD • 1. XML : contexte et origine • 1.1. Document, multimédia ,hyperdocuments et web • 1.2. Pourquoi XML : SGML, HTML • 2. Présentation de XML • 2.1. Structure d'un document XML • 2.1.1. Prologue • 2.2.2. Arbre des élément • 2.2.3. Commentaires • 2.2. Documents bien formés, documents valides • 3. Les DTD • 3.1. Déclaration d’éléments • 3.2. Déclaration d’attributs • 3.3. Déclaration d’entités • 3.4. Déclaration de notations • En savoir plus… ACCARY-BARBIER / CNAM - Cycle C - 2007-2008

  33. Objectifs de XML • Standard développé par le W3 Consortium qui doit : • Être facilement utilisable sur le Web • Supporter une grande variété d’applications • Être compatible avec SGML • Être facilement traitable par des programmes annexes • Avoir le minimum d'option (idéalement zéro) • Permettre des document lisibles et raisonnablement clairs • Être rapide à concevoir • Décrire les documents de manière formelle et concise • Permettre de créer facilement des documents • Ne pas tenir compte de la concision du balisage ACCARY-BARBIER / CNAM - Cycle C - 2007-2008

  34. Langages dérivés et applications • Langages : • Présenter/transformer : XSL, XSLT • Localiser des fragments de documents : Xpath • Décrire des liens : Xlink, Xpointer (HyTime, HTML) • Décrire un schéma : Schémas • Et aussi : SAX, DOM, RDF, SOAP, ... • Applications : • Échanges de données • Bureautique • Sites Web • Bases de données • E-commerce, ... ACCARY-BARBIER / CNAM - Cycle C - 2007-2008

  35. Avantages et limites de XML • Avantages : • Productivité • Réutilisabilité • Pérennité • Intégrité • Partage • Portabilité • Limites : • XML n’est qu’une syntaxe • XML ne porte aucune sémantique • Description de structures uniquement • Pas de types ACCARY-BARBIER / CNAM - Cycle C - 2007-2008

  36. Structure, contenu et présentation • Trois aspects dans les documents : • Le contenu • La structure logique • La présentation • XML permet de représenter les contenus textuels et la structure logique • Les autres contenus sont des ressources externes (photos, vidéo, sons...) • La présentation est décrite par des moyens complémentaires (CSS, XSL) • La présentation peut changer, indépendamment des contenus et de la structure ACCARY-BARBIER / CNAM - Cycle C - 2007-2008

  37. Structure d'un document • Prologue • Déclaration XML • Déclarations de modèle de document : DTD • Instructions de traitement • Arbre des élément • Éléments • Attributs, • Entités,… • Commentaires ACCARY-BARBIER / CNAM - Cycle C - 2007-2008

  38. Chapitre 1 : XML et DTD • 1. XML : contexte et origine • 1.1. Document, multimédia ,hyperdocuments et web • 1.2. Pourquoi XML : SGML, HTML • 2. Présentation de XML • 2.1. Structure d'un document XML • 2.1.1. Prologue • 2.2.2. Arbre des élément • 2.2.3. Commentaires • 2.2. Documents bien formés, documents valides • 3. Les DTD • 3.1. Déclaration d’éléments • 3.2. Déclaration d’attributs • 3.3. Déclaration d’entités • 3.4. Déclaration de notations • En savoir plus… ACCARY-BARBIER / CNAM - Cycle C - 2007-2008

  39. Déclaration XML • Contient les infos de traitement pour le processeur XML: <?xml version="1.0" [encoding = "encodage"] [standalone = "yes|no"] ?> • Elle indique : • La conformité du document à une version de la norme XML. • xml version="1.0" • le jeu de caractères utilisés dans le document • encoding(par défaut "UTF-8") • La présence ou non de références (DTD) externes • Standalone(par défaut "no") ACCARY-BARBIER / CNAM - Cycle C - 2007-2008

  40. Déclaration de DTD • DTD XML facultative définit la structure du document • Elément racinedu document • Ensemble des éléments utilisables et règles d'utilisations • Déclaration de DTD Interne <!DOCTYPE element_racine [ contenu de la DTD ]> • Déclaration de DTD externe (dans plusieurs documents) • SYSTEM : DTD stockée sur l'ordinateur à l'adresse précisée. • PUBLIC :DTD publiée (par ex par le W3C), • le processeur utilise le nom ou l'URI pour retrouver la DTD <!DOCTYPE element_racine SYSTEM "uri_DTD"> <!DOCTYPE element_racine PUBLIC "nom" "uri_DTD"> ACCARY-BARBIER / CNAM - Cycle C - 2007-2008

  41. Instruction de traitement (processing instruction) • Les Processing instructions (PIs) • sont généralement utilisées dans le prologue du document. • permettent de passer des instructions aux applications <?NomAppli paramètres?> • Exemples : lien vers les feuilles de style <?xml-stylesheet type="text/xsl" href="biblio.xsl"?> <?xml-stylesheet href="biblio.css" type="text/css"?> ACCARY-BARBIER / CNAM - Cycle C - 2007-2008

  42. Chapitre 1 : XML et DTD • 1. XML : contexte et origine • 1.1. Document, multimédia ,hyperdocuments et web • 1.2. Pourquoi XML : SGML, HTML • 2. Présentation de XML • 2.1. Structure d'un document XML • 2.1.1. Prologue • 2.2.2. Arbre des élément • 2.2.3. Commentaires • 2.2. Documents bien formés, documents valides • 3. Les DTD • 3.1. Déclaration d’éléments • 3.2. Déclaration d’attributs • 3.3. Déclaration d’entités • 3.4. Déclaration de notations • En savoir plus… ACCARY-BARBIER / CNAM - Cycle C - 2007-2008

  43. Structure • Document XML est une structure logique arborescente • Elément racine unique + fils (constituants logiques) • Contenu structuré en eléments qualifiés par des attributs avec des valeurs • Élément : paire de balises (tags) et son contenu : <chapitre>...</chapitre> • Les balises ouvrantes portent les attributs : <chapitreversion="provisoire"date="16/06/03"> • Eléments terminaux : vides ou chaînes de caractères • L’imbrication et l’ordre des éléments reflètent la structure • Eléments choisis en fonction du type de document • LivreCuisine, Plat, Recette, Ingrédient, Temps, Préparation, Étape, etc. ACCARY-BARBIER / CNAM - Cycle C - 2007-2008

  44. Exemple : Structure et balises |____ livre (lang="fr) (ref="ASI2002) | |___ achat (date="10/11/2003") (lieu="FNAC") | |___ titre (type="roman") (genre="SF) | | |____ "Prélude à fondation" | |___ auteurs | | |____ auteur | | |_____ nom | | | |_____ "Asimov" | | |_____ prénom | | |_____ "Isaac" | |___ éditeur | |____ "Livre de Poche" <livre lang="fr" ref="ASI2002"> <achat date="10/11/2003" lieu="FNAC" /> <titre type="roman" genre="SF"> Prélude à fondation </titre> <auteurs> <auteur> <nom> Asimov </nom> <prénom> Isaac </prénom> </auteur> </auteurs> <éditeur> Pocket </éditeur></livre> ACCARY-BARBIER / CNAM - Cycle C - 2007-2008

  45. Éléments <nom_élément> contenu de l'élément </nom_élément> • Règles syntaxiques sur les éléments : • Balises ouvrante et fermante doivent correspondre : <titre>...</titre> • Imbrication correcte (pas de chevauchement) : <livre>...<titre>...</titre>...</livre> • Casse importante : <titre> différent de <TITRE> • Nom d'élément • Doit commencer par une lettre ou un souligné • Ne peut comporter que des chiffres, des lettres, des traits d'union, des points, des double points ou des soulignés. • Elément sans contenu = élément vide. • peut s'écrire avec une balise ouvrante terminé par la chaîne "\>" <achat date="08/06/2001" /> ACCARY-BARBIER / CNAM - Cycle C - 2007-2008

  46. Attributs <achat date="10/11/2003" lieu="FNAC" /> • Un attribut • Sert à préciser l'élément et son contenu (langue,...) • Possède un nom et une valeur obligatoirement spécifiée. • Est porté par la balise ouvrante de l'élément • Dans un élément • 0 à n attributs non ordonnés • Chaque attribut ne peut apparaître qu'une fois • Certains attributs sont prédéfinis • xml:lang, xml:space, xmlns • On peut « cacher » du contenu dans les attributs • Ex : <auteur prénom="Jean" nom="Dupont"/> ACCARY-BARBIER / CNAM - Cycle C - 2007-2008

  47. Identificateurs et références • Attribut prédéfinis permettant des relations non hiérarchiques dans la structure du document : • ID : identificateur unique dans le document (ex : ref) • IDREF : référence à un élément portant un attribut de type ID (ex : item) • Exemple : Référence à un ouvrage de biblio.xml <Para> ...voir <Livre item="MOL1999"/> en fin d’ouvrage...</Para>...<livre lang="en" ref="MOL1999"> […]</livre> ACCARY-BARBIER / CNAM - Cycle C - 2007-2008

  48. Entités • Substituts pour des séquences d'information. • Définies dans l'en-tête du document ou dans la DTD • Peuvent être référencées à plusieurs reprises • Appel avec la syntaxe &nom_entite; • Exemple : Il fait 25&deg;C. Permet d'afficher 25°C • Caractères ambigus -> Entités prédéfinies : • &lt; pour le caractère < (lighter) • &gt; pour le caractère > (greater) • &amp; pour le caractère & (ampersand) • &quot; pour le caractère " (quotation mark) • &apos; pour le caractère ‘ (apostrophe) • Lettres accentuées et alphabets latins : entités numériques du type &#code_car; (code_car = code ISO) • Exemple : &#65; code l'entité numérique pour le caractère A. ACCARY-BARBIER / CNAM - Cycle C - 2007-2008

  49. Chapitre 1 : XML et DTD • 1. XML : contexte et origine • 1.1. Document, multimédia ,hyperdocuments et web • 1.2. Pourquoi XML : SGML, HTML • 2. Présentation de XML • 2.1. Structure d'un document XML • 2.1.1. Prologue • 2.2.2. Arbre des élément • 2.2.3. Commentaires • 2.2. Documents bien formés, documents valides • 3. Les DTD • 3.1. Déclaration d’éléments • 3.2. Déclaration d’attributs • 3.3. Déclaration d’entités • 3.4. Déclaration de notations • En savoir plus… ACCARY-BARBIER / CNAM - Cycle C - 2007-2008

  50. Commentaires et CDATA • Commentaires : <!-- commentaire --> • Autorisés partout sauf dans le prologue et dans une balise. • <p <!-- balise ouvrante --> > est illégal • Contient n'importe quel type de données sauf le -- <!-- mes livres préférés --><livre>Fondation<!-- a relire --></livre> • Sections CDATA :<![CDATA[ ... ]]> • Données que le processeur XML n'interprétera pas • passer des caractères réservés à une application. • Echapper un fragment de texte entier <![CDATA[<Bande_Dessinée> a compléter </Bande_Dessinée>]]> ACCARY-BARBIER / CNAM - Cycle C - 2007-2008

More Related