1 / 30

8 e Journées INTEX / NooJ

8 e Journées INTEX / NooJ. La flexion des verbes acadiens en NooJ Michael LONG Univ. De Moncton, Canada Univ. du Nouveau-Brunswick, Canada avec un soutien du Gouvernement du Canada Conseil de Recherche en Sciences Humaines. Verbes acadiens :.

nani
Download Presentation

8 e Journées INTEX / NooJ

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 8eJournées INTEX / NooJ La flexion des verbes acadiens en NooJ Michael LONGUniv. De Moncton, CanadaUniv. du Nouveau-Brunswick, Canada avec un soutien du Gouvernement du CanadaConseil de Recherche en Sciences Humaines

  2. Verbes acadiens : • Introduction - Le français acadien contexte et influences • Trois Groupes - VFS + VANG + VVF • VVF - Les défis • VVF - 2 approches pour l’identification- description flexionnelle - grammaires morphologiques • VVF - du nouveau • Conclusion

  3. Introduction…Contexte et influences Le français acadien… • Langue parlé par le peuple acadien • La nature du « territoire » acadien • Selon la région … … contexte de contacte étroit avec l’anglais … peu de contact avec l’anglais Influences… • le français standard • l’anglais

  4. Introduction…Corpus Chiac Kasparian (1,988 ko – 317,662 mots) Maillet(9,522 ko – 188,191 mots) Malenfant (1,550 ko – 20,777 mots) Nord-Est (2,806 ko – 54,671 mots) Parkton (8.335 ko – 192,293 mots) 773,594 mots • Corpus oraux – 2 de plus, dont une région avec peu de contacte avec l’anglais. • Corpus lit. – Riche en vieux formes; étend la couverture par rapport aux régions.

  5. Trois Groupes – VFS + VANG + VVF VFS - DELAF VENG - « pis il dit, you know mémére, you need a boy » Contexte anglais …pas tellement traîtés encore VANG - « ils allont runner out de prêtres » « …que mes enfants turnont out de même » - Contexte de phrase français - VANG conjuguer en français - description de l’an dernier tient

  6. VANG: trois graphes suffisent WorkerWork GiverGive SetterSet

  7. Trois Groupes – VFS + VANG + VVF VVF - « on a arrangé le bas pour que s’a saye chaud » … que ce soit « c’est souvent qu’ils veniont toute la famille » … qu’ils viennent «Le prêtre se gréyait dans ses pus belles hardes » … s’habillait

  8. VVF – Les défis • Terminaison « -ont », « -iont »ils parlont ils parlent Pils parliont ils parlaient Iils parliont qu’ils parlent S • Régularisation de la racineils devenont ils deviennent Pils deveniont ils devenaient Iqu’ils deveniont qu’ils deviennent S • Emplois variés du passé simple à l’oral « … fallit espérer après que le petit seyit au monde. »« ila fallu / fallaitattendre que le petitsoitau monde. »

  9. VVF – Les défis • Transcriptions « fautives »- accents mére vs. mère- consonnes raccomoder vs. raccommoder - voyelles supprimées décidra vs. décidera- pour souligner la prononciation? - forme voulu? - manque de cohérence dans la transcription? • Substitution / inversion de sons.- il counnaît vs. il connaît- consarver vs. conserver - erssouder vs. ressouder

  10. VVF – Deux approches - (Flexion) Avoir = <E>/W +<BW>(ai/P+1+s … +ont/P+3+p) +<B3>(ais/I+1+2+s … +aient/I+3+p) +<BW>aur(ais/C+1+s … +aient/C+3+p) + <BW> arr(aient/C+3+p+acad + iont/C+3+p+acad) +<BW>(aie/S+1+s … +aient/S+3+p)

  11. VVF – Deux approches - (Flexion) Avoir =<E>/W +<BW>(ai/P+1+s … + ont/P+3+p +avont/P+3+p+acad) +<B3>(ais/I+1+2+s … + aient/I+3+p +iont/I+3+p+acad) +<BW>aur(ais/C+1+s … + aient/C+3+p + iont/C+3+p+acad) +<BW>arr(aient/C+3+p+acad + iont/C+3+p+acad) +<BW>(aie/S+1+s … + aient/S+3+p + ayiont/S+3+p+acad) Avantage : Consolidation de la description Contrainte :Description limitée à Avoir(pas un problème puisque nul autre verbe ne se conjugue selon cette description)

  12. VVF – Deux approches - (Flexion) Tenir =<E>/W +<BW>tiendre/W+acad +tchendre/W+acad +<B4>iens/P+1+s … +enons/P+1+p +<BW>tchens/P+1+s+acad …+tchenons/P+1+p+acad + <B4>ienne/S+1+s …+enions/S+1+p +<BW>tchenne/S+1+s+acad +tchenions/S+1+p+acad

  13. VVF – Deux approches - (Flexion) Tenir=<E>/W +<BW>tiendre/W+acad +tchendre/W+acad + <B4> iens/P+1+s … + enons/P+1+p + <BW> tchens/P+1+s+acad …+ tchenons/P+1+p+acad + <B4> ienne/S+1+s …+ enions/S+1+p + <BW> tchenne/S+1+s+acad + tchenions/S+1+p+acad 3 formes infinitifs

  14. VVF – Deux approches - (Flexion) Tenir = <E>/W + <BW> tiendre/W+acad + tchendre/W+acad +<B4>iens/P+1+s … +enons/P+1+p +<BW>tchens/P+1+s+acad …+tchenons/P+1+p+acad + <B4> ienne/S+1+s …+ enions/S+1+p + <BW> tchenne/S+1+s+acad + tchenions/S+1+p+acad formes multiples pour P

  15. VVF – Deux approches - (Flexion) Tenir = <E>/W + <BW> tiendre/W+acad + tchendre/W+acad + <B4> iens/P+1+s … + enons/P+1+p + <BW> tchens/P+1+s+acad …+ tchenons/P+1+p+acad + <B4>ienne/S+1+s …+enions/S+1+p +<BW>tchenne/S+1+s+acad +tchenions/S+1+p+acad formes multiples pour S

  16. VVF – Deux approches - (Flexion) Tenir =<E>/W +<BW>tiendre/W+acad +tchendre/W+acad +<B4>iens/P+1+s … +enons/P+1+p +<BW>tchens/P+1+s+acad …+tchenons/P+1+p+acad + <B4>ienne/S+1+s …+enions/S+1+p +<BW>tchenne/S+1+s+acad +tchenions/S+1+p+acad Problème :Description fautive pour Venirqui se conjugue comme Tenir en français standard.Besoin donc de multiplier les conjugaisons « modèles »

  17. VVF – Deux approches - (.nom) On demande à NooJ de trouver la combinaison (Variable 1)ar(Variable 2)

  18. VVF – Deux approches - (.nom) On lui met une contrainte, disant que s’il trouve « ér » ou « er » entre les même deux variables, et que ce mot est accompagné du code « V »…

  19. VVF – Deux approches - (.nom) Il doit associer le lemme du mot trouvé dans la contrainte,ainsi que les informations flexionnelles, à la combinaison (Variable 1)ar(Variable 2)

  20. VVF – Deux approches - (.nom) Il doit également lui associer une information « source ».

  21. VVF – Deux approches - (.nom) Cette information « source »,(inclus dans le fichier« properties.def ») apparaît alors dans le vocabulaire, etpermet de repérer la source d’une analyse donnée. Ce qui permet de vérifier l’efficacité du grammaire.

  22. VVF – Deux approches Transcriptions « fautives » .nom - accents mére vs. mère* consonnes raccomoder vs. raccommoder* voyelles supprimées décidra vs. décideraSubstitution / inversion de sons. .nom - il counnaît vs. il connaît- consarver vs. conserver - erssouder vs. ressouder Terminaison « -ont », « -iont » .nom / .nod ils parlont ils parlent Régularisation de la racine .nod ils devenont ils deviennent

  23. VVF – Deux approches-résultats Corpus base Acad.dic ont.nom les deux Chiac 4,841 5,261 4,858 5,273 1,108 994 1,092 982 Maillet 25,750 25,980 25,988 26,177 2,189 2,099 2,019 1,960 Malenfant 3,108 3,633 3,145 3,650 516 418 496 401 NE 4,849 4,980 4,878 5,004 250 218 225 197 Parkton 10,380 11,125 10,488 11,125 1,394 1,212 1,310 1,212

  24. VVF – Deux approches-résultats Corpus base les deux + autres delta Chiac 4,841 5,273 5,477 + 636 1,108 982 916 - 192 Maillet 25,750 26,177 26,648 + 898 2,189 1,960 1,717 - 472 Malenfant 3,108 3,650 3,697 + 589 516 401 387 - 129 NE 4,849 5,004 5,041 + 192 250 197 190 - 60 Parkton 10,380 11,125 11,307 + 927 1,394 1,212 1,105 - 289

  25. VVF – Deux approches-résultats Corpus base les deux + autres delta Chiac 4,841 5,273 5,477 + 636 1,108 982 916 - 192 Maillet 25,750 26,177 26,648 + 898 2,189 1,960 1,717 - 472 Malenfant 3,108 3,650 3,697 + 589 516 401 387 - 129 NE 4,849 5,004 5,041 + 192 250 197 190 - 60 Parkton 10,380 11,125 11,307 + 927 1,394 1,212 1,105 - 289 Tenir compte de la réduction en termes inconnu, plus que l’augmentation de termes connus (double analyses)

  26. VVF – du nouveau… Grammaire syntaxique qui comprend des éléments orthographique… qui permet de trouver des mots inconnus, qui terminent par « is / it / i », et qui sont précédés de <PRO>

  27. VVF – du nouveau…

  28. VVF – Deux approches-Intérrogation Inclusion du standard et des variants en un dictionnaire+ permettra une ressource à base large+ minimisera les analyses fausses- implique redondance de paradigmes flexionnelles - travail de longue haleine Inclusion des variants en .nom+ identification rapide de formes - multiplication de ressources - introduction d’analyses fausses Autres possibilités…- maintien du DELAF et ajout de « filtre » Acad.dic- hiérarchie de « .nom » embriqués

  29. Conclusion… L’étude effectuée jusqu’à présent commence à permettre de repérer les verbes « non standards » en français acadien, avec des résultats encourageants. Le travail révèle que certains éléments pourraient améliorer et/ou rendre plus efficace le processus, dont… • Inclure un élément journalistique dans le corpus- pour étendre la base- pour voir un français acadien dit un peu plus neutre • Souligner l’importance d’ une transcription conséquente • Trancher sur la question du dédoublement (dictionnaires ou morphologie?)

  30. 8eJournées INTEX / NooJ La flexion des verbes acadiens en NooJ Michael LONGUniv. De Moncton, CanadaUniv. du Nouveau-Brunswick, Canada avec un soutien du Gouvernement du CanadaConseil de Recherche en Sciences Humaines

More Related