1 / 35

Le Web sémantique. Un Web de métadonnées

Le Web sémantique. Un Web de métadonnées. Le Web est une collection de documents (HTML, PDF…) Le Web devient une collection de bases de données (RDF, RDFa). Web de documents vs Web de données. hier aujourd’hui demain. Données. Page HTML.

duff
Download Presentation

Le Web sémantique. Un Web de métadonnées

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Le Web sémantique.Un Web de métadonnées Tutoriel JABES 2010 – Yann Nicolas

  2. Le Web est une collection de documents (HTML, PDF…) Le Web devient une collection de bases de données (RDF, RDFa) Web de documentsvsWeb de données

  3. hieraujourd’huidemain

  4. Données Page HTML Le Document HTML est fait pour être lu par des humains ; pas pour être exploité par des programmes Le contenu des données est utilisé dans un document HTML

  5. hieraujourd’huidemain

  6. Page HTML Données Données HTML + RDFa Le Document HTML + RDFa peut être lu par des humains et exploité par des programmes La base de données est dans le Web, pas sous le Web (deep Web) les données sont présentes dans le document HTML

  7. La victoire des métadonnées • Rich snippets • SearchMonkey • Open Graph Protocol

  8. Métadonnées de… • Documents • Produits commerciaux • Entreprises et autres organismes • Evénements • Jeux • Recettes de cuisine

  9. Métadonnées de recette Google

  10. Métadonnées de documentsselon Yahoo

  11. Métadonnées de documentsselon Yahoo

  12. L’enjeu Que le Web de données ne parle pas seulement de vidéos, de produits commerciaux, de congrès et de recettes de cuisine mais également des fonds de nos bibliothèques, de nos thèses, de nos manuscrits, de nos articles, de nos revues… et de nos auteurs, directeurs de thèse, organismes, vocabulaires …

  13. Comment mettre nos métadonnées sur le Web de données ? Sudoc.zip

  14. Comment mettre nos métadonnées sur le Web de donnéessans y mettre nos notices ? Notices = paquets ficelés  Ouvrir ces paquets ! • Dissection d’une notice MARC • Vers des métadonnées en RDF

  15. Partons d’une notice Sudoc en UNIMARC décrivant l’édition commerciale d’une thèse

  16. cam0 22 450 001 134144422 005 20100315113520.000 010 ‎$a978-2-275-03443-0‎$bbr.‎$d38 EUR 073 1‎$a9782275034430 100 ‎$a20090610d2009 k y0frey0103 ba 101 0 ‎$afre 102 ‎$aFR 105 ‎$ay va 001yy 106 ‎$ar 200 1 ‎$aAnthropologie juridique de la personne morale‎$bTexte imprimé‎$fJean-François Quievy,...‎$gpréface de Didier R. Martin,... 210 ‎$aParis‎$cLGDJ-Lextenso éd.‎$dDL 2009 215 ‎$a1 vol. (XI-416 p.)‎$d24 cm 225 2 ‎$aBibliothèque de droit privé‎$x0520-0261‎$vtome 510 306 ‎$aLGDJ = Librairie générale de droit et de jurisprudence 320 ‎$aBibliogr. p. [369]-396. Notes bibliogr. Index 328 0‎$zTexte remanié de‎$bThèse de doctorat‎$cDroit privé‎$eParis 11‎$d2008 410 |‎$tBibliothèque de droit privé‎$x0520-0261‎$v510 451 |‎$tAnthropologie juridique de la personne morale‎$bTexte imprimé‎$fJean-François Quievy‎$c[S.l.]‎$n[s.n.]‎$d2008‎$p1 vol. (343 p.) 606 ‎$aAnthropologie juridique‎$2rameau 606 ‎$aSociétés‎$xDroit‎$2rameau 606 ‎$aPersonnes morales‎$2rameau 686 ‎$aKA.111‎$2local_cujas 700 1‎$aQuievy‎$bJean-François‎$f1980-....‎$4070 702 1‎$aMartin‎$bDidier‎$f1944-....‎$4080 801 3‎$aFR‎$bAbes‎$c20100315‎$gAFNOR

  17. Notice = paquet Mais j’ai triché

  18. cam0 22 450 001 134144422 005 20100315113520.000 010 ‎$a978-2-275-03443-0‎$bbr.‎$d38 EUR 073 1‎$a9782275034430 100 ‎$a20090610d2009 k y0frey0103 ba 101 0 ‎$afre 102 ‎$aFR 105 ‎$ay va 001yy 106 ‎$ar 200 1 ‎$aAnthropologie juridique de la personne morale‎$bTexte imprimé‎$fJean-François Quievy,...‎$gpréface de Didier R. Martin,... 210 ‎$aParis‎$cLGDJ-Lextenso éd.‎$dDL 2009 215 ‎$a1 vol. (XI-416 p.)‎$d24 cm 225 2 ‎$aBibliothèque de droit privé‎$x0520-0261‎$vtome 510 306 ‎$aLGDJ = Librairie générale de droit et de jurisprudence 320 ‎$aBibliogr. p. [369]-396. Notes bibliogr. Index 328 0‎$zTexte remanié de‎$bThèse de doctorat‎$cDroit privé‎$eParis 11‎$d2008 410 |‎$0001025449‎$tBibliothèque de droit privé‎$x0520-0261‎$v510 451 |‎$0127264191‎$tAnthropologie juridique de la personne morale‎$bTexte imprimé‎$fJean-François Quievy‎$c[S.l.]‎$n[s.n.]‎$d2008‎$p1 vol. (343 p.) 606 ‎$3028070364‎$aAnthropologie juridique‎$2rameau 606 ‎$3027480968‎$aSociétés‎$xDroit‎$2rameau 606 ‎$3027883248‎$aPersonnes morales‎$2rameau 686 ‎$aKA.111‎$2local_cujas 700 1‎$3127281851‎$aQuievy‎$bJean-François‎$f1980-....‎$4070 702 1‎$3086099582‎$aMartin‎$bDidier‎$f1944-....‎$4080 801 3‎$aFR‎$bAbes‎$c20100315‎$gAFNOR Liens aux autorités

  19. Notice bibliographique avec liens aux autorités = plusieurs paquets liés entre eux

  20. a pour auteur a pour directeur Edition de la Thèse . Titre = « Anthropologie… » . Langue = « fre » Personne . Nom = « Jean-François Quiévy » Id=127281851 Personne . Nom = « Didier martin» Id= 086099582 Concept Rameau . Forme retenue = « Personnes morales » Id=027883248 Collection . Titre = «  Bibliothèque de droit privé  » Id=001025449 Id=134144422 appartient à a pour sujet

  21. a pour auteur a pour directeur Concept Rameau . Forme retenue = « Personnes morales » Personne . Nom = « Jean-François Quiévy » Id=127281851 Personne . Nom = « Didier martin» Collection . Titre = «  Bibliothèque de droit privé  » Id= 086099582 Id=iso639-3/fra Id=001025449 Langue . Libellé= « Français » Edition de la Thèse . Titre = « Anthropologie… » . Langue = « fre » Id=027883248 Id=134144422 appartient à a pour sujet a pour langue

  22. a pour directeur a pour auteur a pour édition Edition de la Thèse . Titre = « Anthropologie… » . Langue = « fre » Id=027883248 Personne . Nom = « Jean-François Quiévy » Id=127281851 Personne . Nom = « Didier martin» Id= 086099582 Id=001025449 Collection . Titre = «  Bibliothèque de droit privé  » Langue . Libellé= « Français » Id=iso639-3/fra La thèse comme Œuvre . Titre = « Anthropologie… » Concept Rameau . Forme retenue = « Personnes morales » Id=123456789 Id=134144422 a pour sujet a pour langue appartient à

  23. Démarche • Vider la notice bibliographique • Déporter le maximum d’information dans des notices d’autorité • L’information contenue dans une autorité est • séparée • plus facile à réutiliser  Web de données : une façon de pousser cette logique jusqu’au bout

  24. Défaire le paquet de métadonnées • Décomposer la notice en affirmations élémentaires et indépendantes (triplets) 123456789 est de type Thèse 123456789 a pour auteur 127281851 127281851 a pour nom « Jean-François Quiévy » 123456789 a pour édition 134144422 134144422 est de type Edition 134144422 appartient à 001025449 001025449 est de type Collection 001025449 a pour titre« Bib. De droit privé »

  25. On est passé de MARC à RDF (Resource Description Framework – W3C) 123456789 a pour auteur 127281851 127281851 a pour nom « J.F. Quiévy » • 2 informations indépendantes l’une de l’autre • 2 informations dans la même base ou non !  Information distribuée sur le Web

  26. Comment faire des liens si les informations qui composaient le paquet-notice sont éclatées ??sur le Web ?

  27. Des informations décentralisées et des identifiants globaux Information gérée par la base catalogue : http://www.catalogue.org/123456789 a pour auteur http://www.referentiel.org/127281851 Information gérée par la base référentiel : http://www.référentiel.org/127281851 a pour nom « J.F. Quiévy »

  28. Qu’est-ce que ça change ????? #1

  29. N’importe qui peut compléter la « notice » ! • Car n’importe qui peut affirmer quelque chose sur ma thèse Exemple : http://www.ma-bib-perso.org/yann possède-un-exemplaire-de http://www.catalogue.org/134144422  Je m’exemplarise dans le Sudoc…ps : je prête aussi

  30. N’importe qui peut réutiliser mes données! • Car tout le monde comprend les triplets RDF (bientôt). Exemple : De nouvelles interfaces, de nouveaux outils  Où sont les limites du catalogue ? Une AOC ?

  31. Raisonner • N’importe qui peut tirer de mes données des choses que j’ignorais • Exemple : • Le catalogue dit que ce livre appartient à la collection http://www.issn.org/collection/001025449 • La base ISSN dit que cette collection est une collection d’ouvrages de droit privé (règle). • « on » peut en déduire que ce livre est un livre de droit privé (ce qui n’était pas dans la notice)

  32. Lever le dilemme de l’interopérabilité • Dilemme : • Populaire mais pauvre (Dublin Core simple) • Rester riche et mourir seul (MARC, TEF) • Solution : tef:auteur sous-propriété de dc:creator

  33. Nos données dans le Web de données • Calames RDFa en 2008 • Autorités Fin 2010 • STAR Fin 2010 • Portail des thèses 2011

  34. Aller plus loin • RDF Primer http://www.w3.org/TR/rdf-primer/ • RDFa (RDF dans une page HTML) http://www.w3.org/TR/xhtml-rdfa-primer/

More Related