1 / 32

Participer au Web de données

Participer au Web de données. … en utilisant les technologies du Web sémantique. Architecture du Web. World Wide Web : toile d’araignée de serveurs d’informations reliés les uns aux autres par des liens physiques (le réseau matériel) et des liens logiques (les liens hypertextes)

forbes
Download Presentation

Participer au Web de données

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Participer au Web de données … en utilisant les technologies du Web sémantique

  2. Architecture du Web World Wide Web : toile d’araignée de serveurs d’informations reliés les uns aux autres par des liens physiques (le réseau matériel) et des liens logiques (les liens hypertextes) Architecture du Web: infrastructure technologique définie par des standards Standardisation de l’architecture du Web assurée par un organisme, le W3C (World Wide Web Consortium) Accessibilité aux contenus et aux machines

  3. Comment fonctionne le Web ? Un espace global d’information :réseau de machines reliées entre elles Un protocole qui permet le dialogue entre machines : http Le principe de l’hypertexte pour relier les ressources Un langageuniversel Des identifiants Web, les URI (Uniform resource identifier) Les URL sont des URI qui identifient les ressources et les localisent sur Internet URI

  4. Évolutions du web Web 1.0 web de documents Navigation d’un document à un autre en utilisant des liens hypertexte une page HTML = la représentation d’un document Le navigateur n’interprète pas le contenu du document Web 2.0 web collaboratif

  5. Le Web de documents Documents Données Base de données Hyperlien Base de données Yann Nicolas, Le Web de données, enssib, 11 octobre 2012

  6. Limites du Web de documents Les données structurées des BDD sont soit cachées (« web profond ») Soit présentes mais non interprétables par des machines Seules les pages HTML sont liées entre elles Les données de différentes BDD ne sont pas liées entre elles « Il faut sortir les données des Bases de données pour les mettre dans l’espace global du Web » Tim Berners-Lee

  7. Métadonnées et données structurées • Méta-données : Données « sur » d’autres données • Par exemple une notice en Unimarc : un ensemble de métadonnées • Les métadonnées sont des données structurées (interprétables par des machines) • Par exemple une notice en Unimarc est un ensemble de données structurées • Métadonnées Définition : informations structurées qui décrivent, expliquent, localisent, facilitent la gestion d’une ressource d’information

  8. Le Web de données ? Un Web constitué de données accessibles, structurées, dans un format non-propriétaire, identifiées et liées entre elles sémantiquement (Définition de Tim Berners-Lee dès 1999) Web sémantique Ensemble de standards et de technologies visant à faire entrer les données structurées dans l’environnement du Web en adoptant les principes, l’architecture et les techniques qui ont permis la construction de cet espace d’interopérabilité globale qu’est la toile aujourd’hui (E Bermès et G Poupeau, 2012) Web de données extension du Web, construite selon les technologies du Web sémantique, permettant de relier non pas des documents (pages HTML) mais les données elles-mêmes et de les rendre interprétables par les machines

  9. Le Web de données liées Documents Données Base de données Liens entre les bases de données Hyperlien Base de données Yann Nicolas, Le Web de données, enssib, 11 octobre 2012

  10. SUDOC Ce qu’on veut BNF

  11. Technologies du Web sémantique des identifiants Une grammaire Un langage de requête dédié pour communiquer RDF URI Des systèmes d’écriture SPARQL RDF/XML N3, Turtle, N-triples RDFa Des Vocabulaires(ontologies) Exprimés en RDFS ou OWL

  12. RDF Resource Description Framework Objectif : assurer l’interopérabilité des données sur le Web Objectif : permettre aux machines d’interpréter la nature des relations entre deux ressources du Web Charles DarwinA écritOn the origins of species objet sujet prédicat Triplet RDF En RDF, toute information doit être exprimée sous la forme d’une phrase simple : sujet – prédicat – objet Qu’on appelle triplet Ressource Nature de la relation URI Ressource (entité) URI Ressource (entité) URI Littéral : Chiffre, date, mot …

  13. RDF Resource Description Framework Charles DarwinA écritOn the origins of species objet sujet prédicat Est un type de relation appelé propriété Appartient à une classe Classes et propriétés sont déclarées dans des vocabulaires (ontologies) et sont identifiées par des URI Charles Darwin est une instance de la classe « personne » L’objet « On the origins of species » peut être un littéral ou une entité, instance de la classe « œuvres » identifiée par son URI

  14. Le graphe RDF sujet objet prédicat Est né à Charles Darwin Shrewsbury Fait partie de A pour sujet Une même ressource peut être sujet, prédicat ou objet dans plusieurs triplets. L’ensemble de ces triplets reliés les uns aux autres par les URI qu’ils ont en commun constitue un graphe Angleterre Le grand voyage de C. Darwin (film) A réalisé Hannes Schuler

  15. Le Web de données aujourd’hui (linking open data cloud) Espace global et ouvert d’information, sans cesse grossissant, dans lequel les bases et données sont liées entre elles en RDF Principe: Utilisation d’URI accessibles via HTTP Donner accès aux données utiles via RDF et Sparql

  16. Construction du Web de données LC 2 modèles d’interopérabilité SUDOC BnF Partage d’un référentiel commun Modèle « hub and spoke »

  17. Modèles d’interopérabilité du Web de données Modèle « follow your nose” Interopérabilité basée sur les liens

  18. Quand les géants du Web utilisent les technologies du Web de données … Open graph protocol knowledge graph

  19. Google : knowledge graph

  20. Facebook : Open graph protocol

  21. Open graph protocol

  22. Que peut apporter le Web de données aux bibliothèques? Ouverture à d’autres communautés d’utilisateurs Visibilité par les moteurs de recherche Interopérabilité :Le Web devient une gigantesque base de données liées et ouvertes Mettre nos données à disposition des autres Réutiliser les données des autres : enrichir les catalogues, pousser des contenus

  23. Comment y arriver ? Des données structurées Des vocabulaires normalisés • Des identifiants pérennes : URI • pour désigner les ressources • pour exprimer les relations entre les données Une syntaxe normalisée : RDF

  24. Des données structurées

  25. 000 cam 22 3 450 001FRBNF42226398000000X003http://catalogue.bnf.fr/ark:/12148/cb42226398b010 $a978-2-603-01444-8$brel.100 $a20100624d2005 m y0frey50 ba1011 $afre102 $aFR105 $a||||z 00|||106 $ar2001 $aGuide des chenilles d'Europe$bTexte imprimé$eles chenilles de plus de 500 espèces de papillons sur 165 plantes hôtes$fD.J. Carter$g[ill.] B. Hargreaves 210 $aParis$cDelachaux et Niestlé$dDL 2005215 $a1 vol. (311 p.)$cill.$d20 cm2252 $aˆLes ‰guides du naturaliste300 $aBibliogr. p. 301-303410 0$034235813$tˆLes ‰Guides du naturaliste$x1022-2707$d2005454 1$tField guide to caterpillars of butterflies and moths in Britain and Europe606 $312000511$aChenilles$311931301$yEurope$311975688$xGuides pratiques et mémentos$2rameau676 $a595.781 39$v22700 1$312013664$aCarter$bDavid$f1943-....$4070702 1$312367696$aHargreaves$bBrian$4440801 0$aFR$bFR-751131015$c20100624$gAFNOR$2intermrc http://catalogue.bnf.fr/ark:/12148/cb34235813n http://catalogue.bnf.fr/ark:/12148/cb120136648 http://catalogue.bnf.fr/ark:/12148/cb12367696d

  26. Des URI pour désigner les ressources http://catalogue.bnf.fr/ark:/12148/cb42226398b Guide des chenilles d'Europe / D.J. Carter ; [ill.] B. Hargreaves. - Paris : Delachaux et Niestlé, DL 2005 http://catalogue.bnf.fr/ark:/12148/cb34235813n Les Guides du naturaliste http://catalogue.bnf.fr/ark:/12148/cb120136648 http://catalogue.bnf.fr/ark:/12148/cb12367696d Carter, David (1943-....) Hargreaves, Brian

  27. Des vocabulaires normalisés Pour exprimer les relations entre les données 2001 $aGuide des chenilles d'Europe 700 1$312013664$aCarter$bDavid$f1943-.... $4070 200 $a Titre propre DC : Title ISBD : Title proper RDA : Title proper 700 $4070 Auteur du texte DC : Creator RDA : Creator RDA : Author

  28. Des URI pour exprimer les relations (1)

  29. Des URI pour exprimer les relations (2) DC : Title http://purl.org/dc/elements/1.1/title ISBD : has title proper http://iflastandards.info/ns/isbd/elements/P1004 RDA : Title proper http://rdvocab.info/Elements/titleProper DC : Creator http://purl.org/dc/elements/1.1/creator RDA : Author http://rdvocab.info/roles/author

  30. Une syntaxe normalisée RDF Le sujet est toujours une URI Le prédicat est toujours une URI L’objet peut êtreun texte (« littéral »)ou une URI 200 $aGuide des chenilles d'Europe Cette ressource sujet sujet a pour titre propre verbe prédicat complément d’objet objet "Guide des chenilles d'Europe" Sujet Prédicat objet http://catalogue.bnf.fr/ark:/12148/cb42226398b http://iflastandards.info/ns/isbd/elements/P1004 "Guide des chenilles d’Europe"

  31. Un réseau de relations entre des données http://iflastandards.info/ns/isbd/elements/P1004 A pour titre propre A pour auteur A pour patronyme http://rdvocab.info/roles/author http://xmlns.com/foaf/0.1/familyName http://xmlns.com/foaf/0.1/givenName A pour prénom http://rdvocab.info/RDARelationshipsWEMI/containedInManifestation Appartient à http://rdvocab.info/ElementsGr2/dateOfBirth A pour date de naissance A pour titre clé http://iflastandards.info/ns/isbd/elements/P1033 "Guide des chenilles d’Europe" "Carter" http://catalogue.bnf.fr/ark:/12148/cb42226398b "David" http://catalogue.bnf.fr/ark:/12148/cb120136648 1943 http://data.bnf.fr/what-happened/date-1943 http://catalogue.bnf.fr/ark:/12148/cb34235813n "Les Guides du naturaliste"

  32. Des exemples Isidore : http://www.rechercheisidore.fr Plateforme de recherche permettant l’accès aux données numériques en sciences humaines et sociales Données en accès libre (open access) Moissonnage ciblé des métadonnées Conversion et enrichissement des métadonnées en RDF

More Related