1 / 12

La situation actuelle : Coexistence de « tunnels méthodologiques»

La situation actuelle : Coexistence de « tunnels méthodologiques». Hétérogénéité des procédures 1. Hétérogénéité des procédures (2). Procédures de Type 1 Entièrement formalisables Procédures de Type 2 Nécessitant une intervention humaine Appuyées sur des ressources complexes.

aleda
Download Presentation

La situation actuelle : Coexistence de « tunnels méthodologiques»

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. La situation actuelle : Coexistence de « tunnels méthodologiques» Lyon Janvier 2007

  2. Hétérogénéité des procédures 1 Lyon Janvier 2007

  3. Hétérogénéité des procédures (2) • Procédures de Type 1 Entièrement formalisables • Procédures de Type 2 Nécessitant une intervention humaine Appuyées sur des ressources complexes Lyon Janvier 2007

  4. Meta objets textométriquesLa segmentation Lyon Janvier 2007

  5. Distance entre textes 1 Calcul d’une distance • Segmentation • Identification • Formalisation de la distance • Formule de calculJaccard, chi-deux, etc. • Visualisations d2(j, j’) = S(…) i Lyon Janvier 2007

  6. Distance entre textes 2 <T=a1> aa abab bba ba ba abababr fdf av hh o o o hjhh oo oo bba ba ba abababr fdf av hh bba ba ba abababr fdf av hh o aa abab <T=a2> aa abab bba ba ba abababr fdf av hh o o o hjhh oo oo bba ba ba abababr fdf av hh bba ba ba abababr fdf av hh o o <T=a3> bab bba ba ba abababr fdf av fdf av hh bba ba ba fdf a1 a2 a3 …. an a1 a2 a3 an 0 .78 .35 .35 0 .35 .42 0 .56 .0 89 78 35 28 15 0 1 99 58 45 28 19 1 0 82 58 35 24 20 0 0 76 63 38 28 20 0 0 de la les et des yy zz a1 a2 a3 … an Lyon Janvier 2007

  7. Echange d’objets textométriques Lyon Janvier 2007

  8. Texte & structures • Segmentation • Trame textométrique il est un air Lyon Janvier 2007

  9. Texte, structure & forme intégrée • Etiquettes Représentationintégrée Partitions il est un air Annot. div. Lyon Janvier 2007

  10. Les sélections 1types généralisés (Tgen) • sous-ensemble d ’occurrences du corpus • Exemples de Tgen(s) • les occurrences d ’un segment répétés • les cooccurrences de deux formes à l ’intérieur de phrases. • un ensemble de formes présentant un lien au plan sémantique • le résultat d ’un surlignage sélectif par un humain • une classe de fréquence Lyon Janvier 2007

  11. Les sélections 2zones (ou topes) • sous-ensemble d ’occurrences du corpus • Exemples de Topes • une partie du corpus • une section particulière (paragraphe, phrase, etc.) • une zone mise en évidence lors d’une analyse. • un ensemble de zones sélectionnées Lyon Janvier 2007

  12. XML : Norme de stockage et d’échange des méta objets • Textes, textes balisés, textes catégorisés • Segmentation • Trame textométrique • Localisation des occurrences d’une unité • Partition du corpus textuel • Tableau lexicaux, tableaux de segments • Résultats d’analyses statistiques sur la répartition dans les corpus d’objets textométriques Lyon Janvier 2007

More Related