1 / 30

UE303.c : cours n°3 Conception de système d’information multimédia

UE303.c : cours n°3 Conception de système d’information multimédia. Sensibilisation au catalogage : pratique & projet. Par : Sahbi SIDHOM MCF. Université Nancy 2 Equipe de recherche SITE – LORIA sahbi.sidhom@loria.fr. Promo. Master IST-IE 05/06. I. Processus d’abstraction.

miette
Download Presentation

UE303.c : cours n°3 Conception de système d’information multimédia

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. UE303.c : cours n°3Conception de système d’information multimédia Sensibilisation au catalogage : pratique & projet Par : Sahbi SIDHOM MCF. Université Nancy 2 Equipe de recherche SITE – LORIA sahbi.sidhom@loria.fr Promo. Master IST-IE 05/06

  2. I.Processus d’abstraction

  3. Systèmes d’écriture Motif significatif Motif non-significatif Indice « naturel » Indice arbitraire Pictural Quasipictural Pictogramme et Dessins (isolés) Pictographie et bandes dessinées Écriture logosyllabique : Représentation linguistique systématique Écriture alphabétique/ syllabique (représentation phonémique systématique ) Variations dans la représentation graphique [Goody, 94]

  4. Observations sur Corpus confrontation Élaboration d’hypothèses structurelles confrontation Système de règles Analyse morphosyntaxique Parseur Corpus de Test essais Tests Corpus d’Évaluation essais Evaluations Modification Exécution Exécution Analyse des résultats Analyse et Critiques confrontation vs. extension 1 Analyse de Corpus textuels

  5. Abstraction par l’ « Alphabet » • L’alphabet représente aussi le point d’aboutissement d’un processus d’élaboration “logique”. Selon J. Goody, on arrive au niveau d’abstraction ([Goody, 94], p.75) à partir : 1. de logogrammes (des signes pour des mots), 2. de syllabes (des signes pour reproduire des sons), 3. de l’initiale, une lettre, ou une nouvelle lettre pour représenter l’élément phonétique commun à un groupe de syllabes. • L’alphabet ne peut émerger que lorsque toute la série des syllabes est mise dans une forme graphique. • Qui dit alphabet, dit un niveau d’abstraction très élevé

  6. Canaux communicationnels comme sources de connaissances : • l’écriture a ses racines dans les arts graphiques, • les arts graphiques donnent accès à la lecture et à l’écriture (cunéiforme de Mésopotamie, Les hiéroglyphes ou du chinois • l’écriture graphique ou imagée est la source des écritures syllabiques ou alphabétiques, • le système graphique réussit à doubler et à amplifier le système linguistique, • les sources de connaissances visuelles ne sont pas indépendantes aux sources langagières ( la rhétorique ). • Établissement d’un lien commun entre ces différents canaux communicationnels : • L’analyse du multimédia subordonnée à l’analyse de son contenu textuel constitue une nouvelle source de connaissance complémentaire à la nature du document source. • La description textuelle selon un processus adéquat de productions de contenu constitue une autre forme d’accès à une source de connaissances qui n’est pas forcément écrite.

  7. Exemple de texte en hiératique et sa correspondance en écriture hiéroglyphique : Exemple 1: Remarque ?

  8. Les 7 caractères démotiques ajoutés à l'écriture grecque : Exemple 2 : Remarque ?

  9. Le signe devient alors «idéogramme» : Exemple 3 : Remarque ?

  10. Exemple 4 : Remarque ?

  11. Observations sur Corpus confrontation Élaboration d’hypothèses structurelles confrontation Système de règles de réécriture Implémentation d’Analyseur Méthodologie d’analyse Corpus de Test essais Tests Corpus d’Évaluation essais Evaluations Modification Exécution Exécution Analyse des résultats Analyse et Critiques confrontation vs. extension 1 Analyses sur Corpus non textuels 1

  12. II.Étude de cas

  13. 1. INA de France En 1970, l’ORTF (Office national de la Radio et Télévision Française) charge le cabinet d’organisation SEMA (Documentation et gestion) de mettre au point une méthode d’analyse afin de gagner du temps sur la préparation de l’indexation des films d’actualités [LUSTIÈRE, 99]. L’analyse plan par plan, appelée « analyse chronologique », se révèle indispensable pour situer le sujet dans son contexte et faciliter la réponse à la demande. La grille d’analyse chronologique mise au point à cette époque est utilisée jusqu’à présent à l’INA.

  14. On peut y relever des informations élaborées (niveaux d’analyse) avec le concours des cinémathécaires sur un document donné : - la position des plans et la description plan par plan, -les mouvements de caméra, - les personnes identifiées et les lieux de l’action, • la distinction entre image et son. • Évolutions (notices)

  15. 1949-1975

  16. 1975-1985

  17. Le thésaurus est composé de quatre langages documentaires : -les noms communs, -les noms propres géographiques, -les noms propres de personnes morales, -les noms propres de personnes physiques. Les données traitées donnent lieu à trois types d’index édités sur microfiches : -l’index analytique : descripteurs décrivant le contenu, -l’index des titres : titres des séries, des émissions et des sujets, -l’index générique : les noms des génériques des séries, des émissions et des sujets. Pour aider à l’indexation et à la recherche, deux éditions du langage de description sont effectuées sous les noms : -liste alphabétique du thésaurus, et -liste méthodique du thésaurus.

  18. 1985-1997

  19. Vers le numérique : 2000

  20. Guide actuel de l’indexation audiovisuelle à l’I.N.A. La grille d’analyse chronologique mise au point, à l’époque de l’ORTF et le cabinet SEMA en 1970 [DEGEZ, 70], est utilisée jusqu’à présent à l’INA. Les informations qu’on peut relever dans cette grille (ou niveaux d’analyse) sont : -la position des plans et la description plan par plan, -les mouvements de caméra, -les personnes identifiées et les lieux de l’action, -la distinction entre image et son. On distingue plusieurs grilles d’analyse selon la nature de production tout en préservant le même principe de l’élaboration de la grille initiale, nous citons : -PRODUCTION PROPRE (CODE 01) -ACHATS DE DROITS (CODE 03) -MIXTE (production propre + EVN ou achat ou archives) (CODE 04) -EVN(CODE 05) -ARCHIVES (CODE 10), etc.

  21. Construction de descripteurs

  22. Etc.

  23. Construction de résumés

  24. Etc.

  25. 2. Autre méthode d’analyse : par abstraction à l’analyse linguistique • On peut bien s’inspirer d’un modèle d’analyse linguistique : • Étape morphologique « objets » isolés, propriétés des objets • Étape lexicale termes « qui désignent » • Étape syntaxique relations(objet, terme) • Étape sémantique sens, interprétations • Étape pragmatiquemises en contexte (ou valeurs ajoutées)

  26. III.mini-projet

  27. Application • Retrouver un catalogue en ligne qui donne accès à des ressources hétérogènes (ou multimédia) • Dresser la topologie/typologie des documents présents • Construire un petit corpus de documents : s’aider par un logiciel documentaire ou un SGBDD • Analyser selon une des méthodes : • méthode INA : grilles chronologiques (à adapter) • méthode linguistiques : 5 étapes d’analyse • Identifier les limites de la méthode choisie • Comment y remédier : éléments de solution à proposer

  28. Étapes avec SuperDoc: 1. Sur Internet : • Choisir un catalogue en ligne sur des documents hétérogènes (texte, image F/A, audio, vidéo, …) 2. Avec le logiciel documentaire : • Définir les champs pour une notice • Insérer du contenu dans les notices, sans oublier : • URL pour la source, • résumé, • descripteurs • Équations de recherche simples • Équations de recherche complexes (expertes) • Exprimer un besoin informationnel

  29. Quelques URLs de ressources • http://erick.dronnet.free.fr/ • http://gallica.bnf.fr/ • http://gallica.bnf.fr/anthologie/ • http://www.lesite.tv/ • http://www.ina.fr/ • http://www.cerimes.education.fr

More Related