L analyse syntaxique de l oral probl mes et m thode
This presentation is the property of its rightful owner.
Sponsored Links
1 / 18

L'analyse syntaxique de l'oral : problèmes et méthode PowerPoint PPT Presentation


  • 59 Views
  • Uploaded on
  • Presentation posted in: General

L'analyse syntaxique de l'oral : problèmes et méthode. Christophe Benzitoun, Estelle Campione, José Deulofeu, Sandrine Henry, Frédéric Sabio, Sandra Teston, André Valli, Jean Véronis ---- Equipe DELIC Université de Provence. Problématique. Paroles prononcées

Download Presentation

L'analyse syntaxique de l'oral : problèmes et méthode

An Image/Link below is provided (as is) to download presentation

Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author.While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server.


- - - - - - - - - - - - - - - - - - - - - - - - - - E N D - - - - - - - - - - - - - - - - - - - - - - - - - -

Presentation Transcript


L analyse syntaxique de l oral probl mes et m thode

L'analyse syntaxique de l'oral :problèmes et méthode

Christophe Benzitoun, Estelle Campione, José Deulofeu, Sandrine Henry, Frédéric Sabio, Sandra Teston, André Valli, Jean Véronis

----

Equipe DELIC

Université de Provence


Probl matique

Problématique

  • Paroles prononcées

    • non non non non je veux pas de Pa- de de Paris gare d' Austerlitz

  • Paroles reconnues

    • Nancy dans nonante jours à Le Havre de Paris gare d' Austerlitz

  • Analyse syntaxique de l’oral : complexité décourageante mais…


Conventions de transcription

Conventions de transcription

  • Fidélité maximale

    • Processus de validation

    • On note les répétitions, inachèvements, euh, etc.

  • Pauses (semi-automatique)

  • Intonations (automatique)

  • Délimitation de certains phénomènes

  • Pas de ponctuation

    • Ne pas surimposer a priori le modèle de l’écrit

(Campione, 2001)


Exemple 1

Exemple 1

Gras : disfluences

Souligné : interruptions

L2on a un poste consacré aux objets sonores ↗ + donc là ça va de: {bruit : le locuteur tape sur un objet} ça hein des verres enfin tout un tas tout un tas de choses qui sont amplifiées retraitées ↗ par des effets rediffusés ↗ + et: un quatrième poste ↗ qui est surtoutce qui est: qui est: dédié aux: ce qu'on appelle les machines tournantes ↘ donc tout c- tout ce qui est enregistrements analogiques numériques les bandes les disques durs les machins ↗ enfin tout ce qui peut: tout ce qui peut s'enregistrer ↗ + donc qui consiste euh qui consiste à les:+ à travailler sur des supports en différentes vitesses ↗ à manipuler à la main des bandes magnétiques analogiques ↗ pour jouer sur des vitesses obtenir des formes des choses comme ça ↗ + qui consiste aussi à les: à les repiquer à la volée des: des petits morceaux de ce que sont en train de faire les autres ↗ pour les retraiter différemment sur des boucles ou des choses comme ça ↗ pour ré-impulser ↗ + pour ré-impulser de la matière sur laquelle les autres vont réagir ↗ et puis et vice versa l'interaction elle est là ↘


Exemple 2

Exemple 2

  • Mêmes phénomènes dans les dialogues finalisés:

L1non + non non non je veux pas de Pa- de de Paris gare d' Austerlitz mais de Marseille ou d' Aix suivant les possibilités parce que je souhaiterais pouvoir voyager en TGV jusqu' à Lyon + parce qu' il y a un changement à Lyon le train n' est pas direct + et je voudrais après prendre le train Corail + qui euh conduit jusqu' à Belfort et et au-delà

Machinenous ne savons pas quel jour c' est Pâques + désirez-vous partir de Paris gare d' Austerlitz vers 14 heures le vendredi 11 juillet et arriver à Aix en Provence vers 16 heures 26 le dimanche 16 mars et voyager dans un train corail + parlez s' il vous plaît


Exemple 2 l explication

Exemple 2 (l’explication)

Prononcé :

non + non non non

je veux pas de Pa- de

de Paris gare d' Austerlitz

mais de Marseille ou d' Aix

suivant les possibilités

parce que

je souhaiterais

pouvoir

voyager en TGV jusqu' à Lyon

+ parce qu' il y a un changement à Lyon le train n' est pas direct + et je voudrais après prendre le

train Corail

+ qui euh conduit

jusqu' à Belfort et et au-delà

Compris :

Nancy dans nonante

jours à Le Havre

de Paris gare d' Austerlitz

à Metz deux mardi seize dernier

seize vingt-six

Pâques

je souhaiterais

pour Le Havre en

voyager en TGV Cannes Lyon

oov de Thionville à Angers mardi onze sept de Cannes et arriver à Aix en Provence dans un

train corail

^ ^ oov Mâcon vingt-huit

juin quatorze de la


Les difficult s

Les difficultés

  • Les « disfluences »

    • Hésitations, amorces, répétitions, etc.

    • Inachèvements, ruptures de construction

  • La segmentation

    • Adieu la phrase ?

  • L’organisation syntaxique

    • Enchaînements, listes, parenthétiques

    • Particules discursives


Disfluences

« Disfluences »

  • Repérer

    • pauses, répétitions, amorces

    • inachèvements, autocorrections, anacoluthes

  • But :

    • laisser la possibilité de les « gommer » avant analyse

    • Utile pour l’analyse humaine mais pour l’analyse automatique…

    • Exemple :

donc tout c- tout ce qui est enregistrements analogiques numériques

donc tout ce qui est enregistrements analogiques numériques

c'est comme ça petit à petit en travaillant qu'on s'est aperçu / +euh que euh cinquante pour cent hein environ et même à partir de certaines altitudes plus* / +euh par exemple de-que la: + euh d- euhcin-bon plus de cinquante pour cent / + de la:de la fl- de la flore / + est endémique / à la Corse ^


Segmentation

Segmentation

  • Phrase = unité graphique

    • point + majuscule

    • ne correspond pas nécessairement aux relations syntaxiques

    • exemple :

Soyons direct, ║ après l'avoir fréquenté depuis des années, après l'avoir écouté pendant des heures au long de monologues sans fin, on aime Claude Got. ═ Et peut-être encore plus aujourd'hui qu'hier, alors qu'on l'accuse de vouloir imposer une «société sanitaire», sans plaisirs ni risques, ennuyeuse à mourir. [Libération, 9 mars 2004 ]


L analyse syntaxique de l oral probl mes et m thode

  • Unités maximales

    • tout ce qui est lié à travers l’arbre de dépendances

    • exemple :

2 U.M. :

1. Soyons direct

_______________________________________________

2. après l'avoir fréquenté depuis des années, après l'avoir écouté pendant des heures au long de monologues sans fin, on aime Claude Got. Et peut-être encore plus aujourd'hui qu'hier, alors qu'on l'accuse de vouloir imposer une «société sanitaire», sans plaisirs ni risques, ennuyeuse à mourir.


L analyse syntaxique de l oral probl mes et m thode

(Exemple 1)

on a un poste consacré aux objets sonores + donc là ça va de ça hein des verres enfin tout un tas tout un tas de choses qui sont amplifiées retraitées par des effets rediffusés+ et un quatrième poste qui est surtoutce qui est qui est dédié aux ce qu'on appelle les machines tournantes donc tout c- tout ce qui est enregistrements analogiques numériques les bandes les disques durs les machins enfin tout ce qui peut tout ce qui peut s'enregistrer + donc qui consiste euh qui consiste à les+ à travailler sur des supports en différentes vitesses à manipuler à la main des bandes magnétiques analogiques pour jouer sur des vitesses obtenir des formes des choses comme ça + qui consiste aussi à les à les repiquer à la volée des des petits morceaux de ce que sont en train de faire les autres pour les retraiter différemment sur des boucles ou des choses comme ça pour ré-impulser+ pour ré-impulser de la matière sur laquelle les autres vont réagir et puis et vice versa

__________________________________________________________________

l'interaction elle est là


L analyse syntaxique de l oral probl mes et m thode

(Exemple 3)

voilà

__________________________________________________________________________

nous nous étions interrompus + euh au moment où nous avons rencontré les deux Anglaises dont une était euh+ noire + et qui était d'ailleurs la seule parlant français

____________________________________________________________________________________

alors nous le euh + nous avons a- accepté de+ de les prendre avec nous

____________________________________________________________________________________

nous nous sommes mis d'accord pour partager les frais d'essence euh+

____________________________________________________________________________________

parce que c'est vrai que ça faisait + euh+ ça fait l'éch- l'essence était très chère +eteuh+ quand on en trouvait +

____________________________________________________________________________________

et nous voilà partis donc euh à cinq + le Dogon les deux Anglaises mon épouse et moi euh + et euh + et six avec le chauffeur même +

____________________________________________________________________________________

nous nous n'oublions pas ce+ le chauffeur +

____________________________________________________________________________________

et nous sommes partis donc euh

____________________________________________________________________________________

nous sommes allés à Sanga donc Sanga qui étaiteuhqui est qui est toujours euh+

____________________________________________________________________________________


Organisation syntaxique

Organisation syntaxique

  • Enchaînements

    • Marqueurs

    • Difficulté : intra ou inter UM

      • indices syntaxiques, prosodiques...

      • Exemples :

alors...

donc...

et...

et alors...

et puis...

mais...

sinon...

parce que...

etc.

  • il y en a qui ne retourneront pas à l'hôpital parce que c'est embêtant

  • L1 eh bè le le pâtissier a eu une lettre recommandée accusé de réception +

  • L2 parce qu'il avait pas prévenu (ex. Debaisieux, 2001)


L analyse syntaxique de l oral probl mes et m thode

  • Listes

    • même place syntaxique à l’intérieur d’une UM

    • interprétation :

      • coordination? autocorrection? précision?

      • souvent indécidable

  • tout un tas de choses qui sontamplifiées

  • retraitées par des effets rediffusés

  • tout ce qui est enregistrements analogiques numériques les bandes

  • les disques durs

  • les machins

  • enfin tout ce qui peut s'enregistrer

  • et un quatrième poste qui est est dédié ...

    • qui consiste à travailler ...

    • qui consiste aussi à les repiquer ...


L analyse syntaxique de l oral probl mes et m thode

  • Parenthétiques

    • UM à l’intérieur d’UM

(Exemple 1)

on a un poste consacré aux objets sonores + donc là ça va de ça hein des verres enfin tout un tas tout un tas de choses qui sont amplifiées retraitées par des effets rediffusés+ et un quatrième poste qui est surtoutce qui est qui est dédié aux ce qu'on appelle les machines tournantes donc tout c- tout ce qui est enregistrements analogiques numériques les bandes les disques durs les machins enfin tout ce qui peut tout ce qui peut s'enregistrer + donc qui consiste euh ...


L analyse syntaxique de l oral probl mes et m thode

  • Inserts

    • extrêmement fréquentes

    • souvent ambiguës (bon, quoi, etc.)

(Teston & Véronis, 2004)

bon


L analyse syntaxique de l oral probl mes et m thode

on a

un poste consacré aux objets sonores

donc là ça va de ça hein des verres enfin tout un tas de choses qui sont amplifiées retraitées par des effets rediffusés

et un quatrième poste

qui est dédié à

ce qu'on appelle les machines tournantes

donc tout ce qui est enregistrements analogiques

les bandes

numériques

les disques durs

les machins

enfin tout ce qui peut s’enregistrer

donc qui consiste

à travailler sur des supports en différentes vitesses

à manipuler à la main des bandes magnétiques analogiques

pour

jouer sur des vitesses

obtenir

des formes

des choses comme ça

qui consiste aussi à les repiquer à la volée des petits morceaux de ce que sont en train de faire les autres

pour les retraiter différemment sur

des boucles

ou des choses comme ça

pour ré-impulser de la matière sur laquelle les autres vont réagir et vice versa

l’interation elle est là


Conclusion

Conclusion

  • Marquage et « gommage » des « disfluences »

  • Identification des listes et organisation de l’énoncé en arbres « marcottés »

  • Identification et isolement des « inserts »

    marquage des relations syntaxiques de manière plus familière


  • Login