Journ e internationale de la langue maternelle unesco
This presentation is the property of its rightful owner.
Sponsored Links
1 / 39

JOURNÉE INTERNATIONALE DE LA LANGUE MATERNELLE UNESCO PowerPoint PPT Presentation


  • 65 Views
  • Uploaded on
  • Presentation posted in: General

JOURNÉE INTERNATIONALE DE LA LANGUE MATERNELLE UNESCO. PARIS 21 février 2007. ATELIER Expériences récentes pour mesurer les langues dans le cyberespace: un tour d’horizon et la méthode Funredes/Union Latine.

Download Presentation

JOURNÉE INTERNATIONALE DE LA LANGUE MATERNELLE UNESCO

An Image/Link below is provided (as is) to download presentation

Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author.While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server.


- - - - - - - - - - - - - - - - - - - - - - - - - - E N D - - - - - - - - - - - - - - - - - - - - - - - - - -

Presentation Transcript


Journ e internationale de la langue maternelle unesco

JOURNÉE INTERNATIONALE DE LA LANGUE MATERNELLE UNESCO

PARIS

21 février 2007


Journ e internationale de la langue maternelle unesco

ATELIERExpériences récentes pour mesurer les langues dans le cyberespace:un tour d’horizon et la méthode Funredes/Union Latine


Daniel pimienta pimienta@funredes org fundaci n redes y desarrollo http funredes org

Daniel [email protected] REDES Y DESARROLLOhttp://funredes.org


Approches existantes

APPROCHES EXISTANTES


Approches futures

APPROCHES FUTURES


Methode funredes union latine http funredes org lc

METHODE FUNREDES/UNION LATINEHTTP://FUNREDES.ORG/LC

  • BASÉE SUR MOTEUR DE RECHERCHE

  • APPROCHE LINGUISTIQUE SERIEUSE

  • TRAVAIL STATISTIQUE SOIGNÉ

  • LA SEULE DOCUMENTÉE 100%

  • LA SEULE AVEC SUIVI RÉGULIER

  • VARIETE D’INDICATEURS

  • VARIETE D’ESPACE


Methode funredes union latine

METHODE FUNREDES/UNION LATINE

  • LIMITATION EN LANGUES (anglais, allemand, espagnol, français, italien, portugais, roumain)

  • DONNE RÉSULTATS RELATIFS

  • MESURE L’ESPACE INDEXÉ

  • FUTUR INCERTAIN


Methodologie funredes union latine

METHODOLOGIEFUNREDES/UNION LATINE

 Définition 57 concepts équivalents sémantiquement ===> 1600 termes

 Mesure comparative fréquence avec moteurs de recherche (automatisé para programme)

 Méthode statistique (distribution, moyenne, variance, loi de Fischer, intervalle de confiance)

 Résultats % par rapport anglais

 Evaluation anglais par recoupement et résultats absolus autres langues.


Concepts crit res linguistiques

CONCEPTS: CRITÈRES LINGUISTIQUES

Neutralité culturelle

Homographie trans-linguistique

Homographie trans linguistique avec un des éléments d'un mot composé

Homographie trans-linguistique par emprunt

Homographie avec une abréviation

Homographie avec un nom propre fréquent

Pseudo-homographie trans-linguistique

Significations non équivalentes

Morpho-syntaxe non équivalente : nom, verbe

Morpho-syntaxe non équivalente : adjectifs et noms

Pluricentrisme lexique et sémantique

Pluricentrisme orthographique

Formes aggrégées (allemand)


Neutralidad cultural

Neutralidad cultural

Propiedad de una palabra en relación con su frecuencia de uso en la lengua en función de la cultura respectiva.

Las palabras francesasvin,parfum, gastronomie y las palabras del lenguaje diplomático no son neutras culturalmente, en relación con el francés.

 Para obtener una muestra con el coeficiente de variación menor posible, se dejaron de lado las palabras no neutras culturalmente.


Homograf a interling stica

Homografía interlingüística

La grafía de una palabra en un idioma es idéntica a la de otra palabra en otro idioma, incluido el caso de faux amis (significación diferente). Puede haber homografías con o sin diacríticos.

Ejemplo de grafía idéntica (con el mismo sentido): casa en castellano y portugués.

Ejemplos de faux amis: red en castellano y red en inglés (rojo); hier en francés (ayer) y hier en allemán (aquí).

 Rechazar las palabras homógrafas (con o sin diacríticos).Se han tenido en cuenta, para rechazarlas, las homografías entre los idiomas del estudio o con un idioma muy presente en Internet, como el alemán. Para evitar el riesgo estadístico de homografías con otros idiomas, se descartan por principio las palabras de menos de cuatros letras.


Homograf a interling stica por pr stamo

Homografía interlingüística por préstamo

Cuando una palabra de un idioma es aceptada tal cual en otro.

Anglicismos comme business, sandwich o software.

El galicismo, deja vu en inglés, castellano, etc. (homógrafo de la expresión francesa sin diacríticos).

 Excluir sistemáticamente o deducir (mardi-gras)


Homograf a con una abreviaci n

Homografía con una abreviación

Sept, siete en francés, homógrafo de las abreviaciones de septiembre en varios idiomas, sobre todo eninglés.

Evitar estas palabras.

Estamos relativamente protegidos por la consigna de evitar palabras de menos de cuatros letras.


Homograf a con un nombre propio frecuente

Homografía con un nombre propio frecuente

Windows es ventana en inglés.... pero es asimismo el nombre de un programa muy citado en la Internet.

Evitar estas palabras.


Pseudohomograf a interling stica

Pseudohomografía interlingüística

La escritura de una palabra con une error de ortografía frecuente en un idioma corresponde a otra en otro idioma.

Ambasador en rumano puede confundirse con ambas(s)adoren inglés.

Se rechazan estas palabras solamente si la lengua con que se confunde es el inglés.


Significados no equivalentes

Significados no equivalentes

Prix en francés equivale en su significado a premio y a precio.

Evitar estas palabras, salvo si fuera posible incluir todos los significantes que completarían el sentido en las lenguas que lo necesiten.


Morfosintaxis no equivalente sustantivo verbo

Morfosintaxis no equivalente: sustantivo, verbo

El inglés es diferente morfosintácticamente de los demás idiomas estudiados, suele tener una misma forma como sustantivo y variante verbal, ésta última equivalente a su vez de muchas formas conjugadas en los demás idiomas.

Love en inglés es el sustantivo que significa amor y el verbo amar: en el infinitivo (cuando sigue a to), en el presente del indicativo (amo, amas, ama, amamos, amáis, aman), etc.

Evitar estas palabras.

Esta característica del inglés nos lleva a excluir los verbos.


Morfosintaxis no equivalente adjetivos y sustantivos

Morfosintaxis no equivalente: adjetivos y sustantivos

Adjetivos, invariables en inglés, varían en género y en número en los demás idiomas estudiados.

Los sustantivos, que en general sólo varían en número en los demás idiomas, varían en rumano también según el caso (nominativo, genitivo, etc.) y la diferencia determinado / no determinado.

El adjetivo inglés yellowcorresponde a amarillo / amarilla / amarillos / amarillas. El sustantivo inglés instability / instabilitiesa las variantes rumanas siguientes:instabilitate / instabilitatea / instabilităţii / instabilităţi / instabilităţile / instabilităţilor.

 Incluir las variantes de género, número y caso en los idiomas en la necesidad de equivalencia lo exige.


Pluricentrismo l xico y sem ntico

Pluricentrismo léxico y semántico

Cuando un idioma tiene más de un centro normativo léxico-semántico.

Según el país hispanohablante, se dice nafta o gasolina.

Americano, en muchos países de América Latina, no tiene el mismo sentido que en otros o en España.

 Incluir las variantes sinonímicas nacionales o regionales cuando corresponda.


Pluricentrismo ortogr fico

Pluricentrismo ortográfico

Cuando un idioma tiene más de un centro normativo ortográfico.

Casos del inglés y del portugués: ortografía diferente en EE. UU. y en el Reino Unido (theater y theatre), en Portugal y en Brasil (electricidade y eletricidade).

 Incluir las variantes ortográficas nacionales o regionales cuando corresponda.


Formas agregadas

Formas agregadas

Las formas agregadas son comunes en alemán y el motor no las contabiliza.

 Corregir globalmente las cifras en función de un porcentage de frecuencia.


Conceptos ejemplos

CONCEPTOS: EJEMPLOS

INGLÉS: cheese, cheeses

ESPAÑOL: queso, quesos

FRANCÉS: fromage, fromages

ITALIANO: formaggi, formaggio

PORTUGUÉS: queijo, queijos

RUMANO: branza, branze, branzei, branzele, branzelor, branzeturi, branzeturile, branzeturilorbrânza, brânze, brânzei, brânzele, brânzelor, brânzeturi, brânzeturile, brânzeturilor, brânzã

ALEMÁN: kaese, kaesen, kase, kasen, käse, käsen


Conceptos ejemplos1

CONCEPTOS: EJEMPLOS

INGLÉS: yellow

ESPAÑOL: amarilla,amarillas amarillo, amarillos

FRANCÉS: jaune, jaunes

ITALIANO: gialla, gialle, gialli, giallo

PORTUGUÉS: Amarela, amarelas, amarelo, amarelos

RUMANO: Galben, galbena, galbene, galbeni, galbenã

ALEMÁN: gelb, gelbe, gelbem, gelben, gelber, gelbes


Search engine

SEARCH ENGINE

All are tested:

Altavista, Excite, Fastsearch (Alltheweb), Google, Hotbot, Infoseek, iWon, Lycos, Northernlight, Yahoo et Webtop.

The best suited is selected:

  • Counting reliability

  • Handling of diacritics

  • coherence of results

  • Size of Index

  • Homogeneity vs. Language


Search engine1

SEARCH ENGINE

  • Almost always a headache…

  • Takes time to validate and understand tricks…


Computing

COMPUTING

  • Completely automatized by PHP program interfacing the web.

  • Data base of results for comparation and historical storage.


Statistical method

STATISTICAL METHOD

  • Normal distribution

  • Covariance analysis for sound results

  • 90% and 99% confidence interval

    Computed from Student T-Distribution


Products

PRODUCTS

  • RAW PORCENTAGE OF LANGUAGE COMPARED TO ENGLISH

  • VARIANCE COEFFICIENT

  • CONFIDENCE INTERVAL


Evaluation of english porcentage

EVALUATION OF ENGLISH PORCENTAGE

- The least scientifical part

  • Made by crosschecking with the porcentrage of reamaining languages and modelling

  • More and more difficult to do…


Derived results and indicators

DERIVED RESULTS AND INDICATORS

  • ABSOLUTE PERCENT

  • WEIGHTED PRESENCE OF LANGUAGE

  • (RELATIVE TO NUMBER OF SPEAKERS)

  • PRODUCTIVITY

  • (RELATIVE TO NUMBERS OF INTERNAUTS)

  • - EVOLUTIONS


1998 2005 evolution web pages by language vs english

1998-2005EVOLUTION % WEB PAGESBY LANGUAGE vs. ENGLISH


Indicators 2005

INDICATORS 2005

(Sources: Global Reach y Funredes/Union Latina)


Derived results and indicators1

DERIVED RESULTS AND INDICATORS

  • GOOGLE ALLOW HIGH FLEXIBILITY OF SEARCHES:

  • BY GENERIC DOMAIN

  • BY TOP LEVEL DOMAIN

  • BY COUNTRY

  • BY LANGUAGE

  •  This allow, with our methodology, to produce interesting indicators such as productivity per language per country…


Other activities of funredes observatory

OTHER ACTIVITIESOF FUNREDES OBSERVATORY

  • Measuring languages in other Internet spaces such as: newsgroups, blogospehere, wikipedia

  • “Measuring” cultures via citation index of representative personnages and weighting evolutions.

  • Automatic translation in electronic conferences.


And by the way

AND BY THE WAY…

ENGLISH WEB PAGES ARE

BELOW 50% SINCE 2002….

CAN YOU BELIEVE IT?

Go check: http://FUNREDES.ORG/LC


  • Login