1 / 54

Internacionalización (i18n)

Internacionalización (i18n). Pedro Valero Universidad de Valencia. Objetivos. Valorar la importancia de la internacionalización de las interfaces Re conocer los problemas derivados de la traducción a otros lenguajes y los diferentes alfabetos existentes

Download Presentation

Internacionalización (i18n)

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Internacionalización (i18n) Pedro Valero Universidad de Valencia

  2. Objetivos • Valorar la importancia de la internacionalización de las interfaces • Reconocer los problemas derivados de la traducción a otros lenguajes y los diferentes alfabetos existentes • Saber cómo evaluar si el software está adecuadamente internacionalizado • Conocer los recursos técnicos sobre como internacionalizar las interfaces Conocer la internacionalización de las interfases • Conocer los alfabetos y esquemas de codificación

  3. Contenidos • Introducción • Internacionalización y localización • Ventajas • Elementos • Escritura • Esquemas de codificación • Modelo de internacionalización y localización • Guia técnica

  4. Introducción

  5. Software internacionalDefiniciones • Es un producto que esta preparado para ser vendido en un ámbito fuera de la región o país donde fue creado • En un sentido completo es si se puede vender en todo el mundo • Como veremos hay diferentes niveles de internacionalización

  6. InternacionalizaciónVentajas • Los productos se pueden colocar en el mercado mas fácilmente • El mantenimiento del código es más fácil si solo hay una versión

  7. Internacionalización • Internacionalización • Es el proceso de diseñar una aplicación de tal manera que pueda adaptarse a diferentes lenguajes y regiones sin necesidad de cambiar el código • Localización • Es el proceso de adaptar software para una región especifica o lenguaje añadiéndole componentes específicos y traduciendo texto

  8. Localización • Convenciones locales, la cultura y el lenguaje de una región particular • El conjunto de letras que se utilizan para escribir una lengua se dice escritura. • Cada localización solo tiene una escritura

  9. Beneficios • Añadiendo la localización el mismo ejecutable funciona en todo el mundo • Los elementos textuales, como los mensajes o las etiquetas de los componentes no están en el código, están fuera y se cogen dinámicamente • Las dependencias culturales como fechas, monedas, aparecen en formatos que están acorde con la localización

  10. Elementos • Cultura • Lengua hablada • Colores • Números • Unidades de medida • Monedas • Escritura

  11. Iconos Texto Audio clips Ayuda en línea Formato de moneda, fechas y números Calendarios Medidas Colores Gráficos Números de teléfono Direcciones Títulos honoríficos Elementos

  12. Iconos • Mullet y Sano (1995) señalan que la comunicabilidad de cualquier representación depende de que haya un contexto compartido entre el que envía el mensaje y el que lo recibe que permita que los signos sean interpretados dentro de una lógica similar a la que fueron codificados.

  13. ElementosCultura • La cultura de una región o pais puede hacer percibir un mismo objeto de dos maneras diferentes en puntos geográficos diferentes • Ejemplos • Tan pronto como sea posible es inmediatamente en Estados Unidos y puede ser este mes en la cultura latinoamericana • La mano izquierda es ofensiva en algunas culturas

  14. ElementosCultura • Hay que cuidar como de dibujan hombres y mujeres juntos y como van vestidos • Algunos simbolos com la esvastica, martillo y hoz, sol naciente, cruces, estrellas representan ideas politicas y relogiosas • En un pais islámico puede entenderse como ofensivas cosas que en Occidente no tiene ningun significado • Mover la cabeza, hacer adiós con la mano, mujeroes en bikin, bebidas alcoholicas

  15. ElementosColores • Tienen significado a través de la tradición en la mayor parte de las culturas • Occidental • Negro es un color asociado con la muerte y con funerales • Blanco asociado con pureza • Verde y azul frío y tranquilo • Rojo, caliente y símbolo de riesgo, peligro • Oriental • Blanco asociado con la muerte • Rojo casamiento

  16. ElementosColores • Cada cultura tiene sus estándares, por lo que es difícil generalizar • Semáforo • Rojo (parar), ambar (precaución) i verde (adelante), pero no tan solo estos los podemos asmuir de una manera generalizada

  17. Elementos Calendarios, formato y separadores de fecha y hora • Hay otros tipos de calendario aparte Gregoriano • Budista, el chino, hebreo, etc... • Formato calendario gregoriano • aa/mm/dd aa dos ultimos digitos del año • aaddd mm mes • aaaa/nn/dd dd dia • dd/mm/aa aaaa año • mm/dd/aa

  18. Elementos Formatos de números y monedas • Para cada país hace falta tener en cuenta el símbolo de la moneda y el formato numérico • USA $1,234,56 • Noruega kr1.234,56 • Suiza sFr1234,56 • Alemania 1.234,56DM • Euro ?

  19. Ordenación • Las ordenaciones son importantes en el proceso de internacionalización y un tema complejo • En un principio las ordenaciones de caracteres son de la A a la Z, mayúsculas primero y después las minúsculas, los número de ordenan de 0 a 9 • Este tipo de regla no siempre es aceptable, porque hay reglas más complicadas cuando hay que considerar un segundo carácter al mismo tiempo

  20. Mal caracola  chacal  cura  danza  llama  luna  marmota Bien caracola  cura  chacal  danza  luna  llama  marmota Ordenación en castellano

  21. Ordenación en castellano • En castellano por ejemplo, ch es un doble caracter, que se ha tratar como un solo caracter y se ordena despues de la c y antes de la d. La ll es un doble caracter que tambíen hay que considerarlo como uno solo y se ordena despues de la l y antes de la m

  22. Elementos específicosUnidades de medida • La mayor parte del mundo utiliza el sistema métrico excepto Estados Unidos • Utiliza la milla, la pulgada, etc..

  23. Europea Thai Oriente medio Extremo oriente Thai Europa, oeste, central y este, griego, ruso, turco,indonesio Un byte Arabe, Hebreo Chino tradicional,Chino simplificado,Japonés, Koreano Thai Un byte Izquierda a derecha Multibyte Arabe, Hebreo, Latin Kana, hangul, caracteres ideográficos Bidireccional Un byte Latin, griego, Cirílico Horizontal y vertical Izquierda a derecha Zonas

  24. ElementosEscrituras • Las escrituras se pueden clasificar en ideogramas y escrituras fonéticas • Un ideograma tien un significado especial y no tiene relación con su pronuciación • Las letras de una escritura fonética representan determinados sonidos, como por ejemplo M • Los tres sistemas de escritura mas importantes son: • Occidentales • Oriente medio • Oriente lejano

  25. Escrituras Occidentales • Las escrituras occidentales son: Latín, griego y cirílico • Las siguientes características son comunes a las tres escrituras: • Fonéticas • Se leen de izquierda a derecha en una línea horizontal • Utilizan letras mayúsculas y minúsculas diferentes • Utilizan numeración aràbiga 0,1,2,3,4,5,6,7,8,9

  26. EscriturasExtremo Oriente • Las escrituras del oriente lejano estan basados en caracteres ideográficos chinos • Los caracteres chinos son únicos, por su sistema especial de construcción, su larga história y su pronunciación • Su antigüedad se remonta a 4000 años y se utilizan de esta forma desde hace mas de 2000 años • Actualmente se utilizan unos cuantos miles de caracteres

  27. EscriturasLejano oriente

  28. EscriturasEsquemas de codificación • Cada tipo de escritura ha de ser representada en sistemas informáticos • Esta representación se concreta en un esquema de codificación • Estos esquemas se codifican a través de mapas de caracteres

  29. ASCII • El mapa de carácteres ASCII consta de 128 carácteres • Los caracteres en el rango de o a 31 y el carácter 127 son especiales, tipicamente de control • Cada carácter es un indice en el mapa de caracteres, por ejemplo el número 65 es la letra A y el 97 la letra a • El codigo ASCII de 128 caracters solo se utilizaba para el inglés • En principio con 128 caracteres habia bastante • Al necesitar nuevos idiomas se empezó a utilizar el resto de 128 caracteres

  30. Tipos de esquemas de codificación • Mapa de caracteres de un octeto (SBCS) • Mapa de caracteres de doble octeto (DBCS) • Unicode

  31. Mapa de caracteres de un solo octeto (SBCS) • Son mapas de caracteres de hasta 256 caracteres (256 = 2^8). • Es una extensión del código ASCII, al que se han añadido 128 caracteres del 128 al 255 • Se denomina mapa de caracteres extendido • ISO • 8859-2 Latín europa del este • 8859-5 Cirilico Europa del este • 8859-1 Latin Europa Oeste • 8859-7 Griego • 8859-3 Turco • 8859-8 Hebreo • 8859-6 Arabe

  32. ISO 8859 - I Latin

  33. ASCII ISO 8879

  34. Mapa de caràcters de doble octeto (DBCS) • Las escrituras del extremo oriente utilizan caracteres ideográficos • Necesitan un mapa de caracteres mas grande de 256 caracteres • Para resolverlo se hizo el mapa de caracteres de doble octeto • Notación de 16 bits • 65536 (2^16) caràcters • El DBCS de un solo octeto se corresponde con el código ASCII • Algunos caracteres se definen como octetos de comienzo y un segundo de código

  35. Codigo KANJI

  36. Codi KANJI • El codigo Kanji definido por el JIS (Japan Industry Standard JIS.). • El JIS nivel I contiene alrededor de 3000 de los caracteres mas normales • El nivel 2 añade 3500 caracteres mas • El tercer nivel se ha definido recientemente e incrementa el mapa de caracteres en mas de 6000 caracteres • JIS está basado en un formato de 7 bits que requieren secuencias de ESCAPE especiales para entrar o salir del modo DBCS.

  37. Problemas • Duplicidad en la codificación de caracteres • Multiples códigos de caracteres incosistentes debido al conflicto entre estándares nacionales y de la indústria • El código ASCII de 7 bits o el de 8 bits, estan limitados a 128 y 256 posiciones de código y son inadecuados en un entorno global • Internet ha añadido un punto más a la demanda de un conjunto de caracteres único en el mundo

  38. Unicode • Unicode es una codificación de caracteres de 16 bits • Consensuado, participan • Apple, Borland, Digital, Hewlett-Packard, IBM, Lotus, Metaphor, Microsoft, Next, Novell, Research Libraries Group, Sun, WordPerfect, i Xerox • Se puede hacer un acceso aleatorio en los caracteres • Los programas no tienen que guardar estados al analizar cadenas • El codigo Unicode es único para un carácter determinado

  39. Unicode

  40. Unicode

  41. UnicodeDisposición de símbolos i letras

  42. Un modelo de localización Recursos localizados Código de la aplicación Producto localizado = +

  43. Guía técnica • En esta parte de discuten problemas generales de conversiones a diferentes versiones del lenguaje y las diferentes necesidades que se preveen para planificar la localización

  44. Desarrollo • Activación en el momento de la ejecución o al menos en el de la compilación

  45. Puntos a revisar • Elementos específicos de la localización • Convenciones en el procesamiento de texto que incluye • ordenació, classificació de caràcters, pronunciación, guionado, funciones de gestión de cadenas e intercambio de ficheros (Importación y exportación de ficheros) • Gestión de las entradas • Gestión de les salidas

  46. Traducción del texto • Todas las lenguas tienen gramática y sintaxis diferentes • El texto traducido cambia de tamaño, hay que prever que pueda crecer • Ejemplo: • Mover se traduce como verschieben en alemán • 5 contra 11

  47. Organización de diálogos (Layout) • La organización de controles y elementos en una ventana ha de considerar la expansión de las etiquetas de texto • En hebreo y árabe la información se escribe de derecha a izquierda (Hace falta invertir la presentación ) • Algunos idiomas incluyen marcas diacríticas que requieren espació adicional • Permite un 30% de expansión

  48. Barra de estado • La versión inglesa solo ha de ocupar el 50% de la barra de estado

  49. Menús • Evitar menús muy densos • Límite 80 caractere • Aceleradores coinciden con el primer carácter de una palabra

  50. Desarrollo de codigo internacional • Documentar todos los recursos que tienen que ser localizados • Es útil hacer dos localizaciones en paralelo para poder evaluar la i18n • Es importante dispones de herramientas y utilidades para hacer la localización

More Related