1 / 49

ÍNDICE

ÍNDICE. Introducción Objetivos Procesamiento de imágenes Formato WAVE De imagen a sonido Experimentos Noticias Conclusiones. INTRODUCCIÓN. U n gran porcentaje de la información nos llega a través de la vista. -Problema: personas con deficiencias visuales.

brick
Download Presentation

ÍNDICE

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. ÍNDICE • Introducción • Objetivos • Procesamiento de imágenes • Formato WAVE • De imagen a sonido • Experimentos • Noticias • Conclusiones

  2. INTRODUCCIÓN • Un gran porcentaje de la información nos llega a travésde la vista. -Problema: personas con deficiencias visuales. -Solución: métodos alternativos (tacto...) • Avances en la sonificación de datos. -No sucede lo mismo con las imágenes. • Sonificación:Representación de imágenes por medio de sonidos.

  3. INTRODUCCIÓN • Optófono como instrumento para sonificar una imagen o escena. • Problema: limitadacapacidad de asimilación de información auditiva en comparación con la visual. - Solución: eliminar información para simplificar.

  4. SONIFICACIÓN • Sonificación: uso de sonido no hablado (nonspeech audio) para tratar o canalizar la información • Áreas de interés: desde el estudio sobre la percepciónhumana hasta la elección de dispositivos acústicos. • Foro internacional de investigación en el área de lasonificación (ICAD).

  5. ACCESO A LA INFORMACIÓN (La percepción) • Proceso mediante el cual se maneja la información. • Según Jacobson (1950,1951) el ojo tiene una capacidad de asimilación de información de 130 x 106 x 18 = 2340 x 106 bits/s. • Un humano puede distinguir un rango de frecuencia entre 30 y 16000 Hz. • La capacidad del oído con estos datos es de     1450 x 4 x 7.7 = 44600 bits/s.

  6. ACCESO A LA INFORMACIÓN(Distintas formas de percepción) • Percepción como una colección de datos y su procesamiento. • Diversos animales obtienen la información en una forma poco usual: - Murciélagos: emiten ultrasonidos - Serpiente cascabel: detecta infrarrojos - Pez torpedo: produce corrientes eléctricas

  7. ACCESO A LA INFORMACIÓN¿y si falla la percepción visual? • Braille (XIX) inventó un sistema para representar las letras del alfabeto en relieve. -Inconvenientes: excesivo volumen de las copias y alto coste deproducción. • Métodos complementarios: grabaciones en cinta magnetofónica, escáner y ordenador.. • Proyecto Tiflonet, Web por y para ciegos.

  8. ACCESO A LA INFORMACIÓN¿y si falla la percepción visual? • Aparatos para convertir información visual: *TVSS: Sistema de substitución sensorial *Contador Geiger: emite señales acústicas en respuesta a diferentes niveles de radiación según cambios en el medio. *Pulsioxímetro: produce señales acústicas que varían en intensidad según el nivel de oxígeno en sangre del paciente. • ¿Y qué pasa con las imágenes? • Aplicación de la sonificación.

  9. ÍNDICE • Introducción • Objetivos • Procesamiento de imágenes • Formato WAVE • De imagen a sonido • Experimentos • Noticias • Conclusiones

  10. OBJETIVOS • Transformar unaseñal visual simplificada (imagen bidimensional o sintética) en una señal de audioequivalente. • Optófono que distingue intensidades de gris. • Es importante la simplificación de la escena a sonificar. -Diferentes métodos de segmentación de imágenes : * Reducción de la resolución espacial * Detección de bordes

  11. ÍNDICE • Introducción • Objetivos • Procesamiento de imágenes • Formato WAVE • De imagen a sonido • Experimentos • Noticias • Conclusiones

  12. PROCESAMIENTO DE IMÁGENES • Representación de imágenes • Conversión a grises • Negativo de una imagen • Umbralización • Cuantización • Reducción de la resolución de la imagen • Filtros

  13. REPRESENTACIÓN DE IMÁGENES • Imagen digital > f (x,y) -(x,y) : coordenadas de la imagen -f : nivel de gris en la posición (x,y) • Se caracteriza por MxNxL: -M : número de filas -N : número de columnas -L : número de bits para representar cada pixel

  14. PROCESAMIENTO DE IMÁGENES • Representación de imágenes • Conversión a grises • Negativo de una imagen • Umbralización • Cuantización • Reducción de la resolución de la imagen • Filtros

  15. CONVERSIÓN A GRISES • Optófono sólo trabaja con niveles de gris. -Convertir la imagen a escala de grises. • El ojo humano percibe desde 380 a 780 nm (desde el violeta hasta el rojo). • Obtención de gris a partir de colores: Y = R*0.3 + G*0.59 + B*0.11

  16. CONVERSIÓN A GRISES • Imagen de Lenna como imagen clásica en el procesado de imágenes. ). • Imagen de Lenna a color; • b) Imagen de Lenna en escala de grises (256 niveles)

  17. PROCESAMIENTO DE IMÁGENES • Representación de imágenes • Conversión a grises • Negativo de una imagen • Umbralización • Cuantización • Reducción de la resolución de la imagen • Filtros

  18. NEGATIVO DE UNA IMAGEN • Transformar cada píxel en la escala de grises en una imagen con niveles de intensidad invertidos. • Operación: nuevo_píxel = MAX - viejo_píxel Fig. 6: a) Lenna a 256 niveles de gris; b) Lenna en negativo.

  19. PROCESAMIENTO DE IMÁGENES • Representación de imágenes • Conversión a grises • Negativo de una imagen • Umbralización • Cuantización • Reducción de la resolución de la imagen • Filtros

  20. UMBRALIZACIÓN • Método de segmentación: - Imagen en escala de grises > Imagen con sólo dos niveles de gris separando objetos del fondo. si (viejo_píxel>umbral)       nuevo_píxel = MAX sino       nuevo_píxel = MIN

  21. UMBRALIZACIÓN • Ejemplos: Lenna a 256 niveles de gris; Lenna con un umbral alto; Lenna con un umbral bajo; Lenna con un umbral intermedio;

  22. PROCESAMIENTO DE IMÁGENES • Representación de imágenes • Conversión a grises • Negativo de una imagen • Umbralización • Cuantización • Reducción de la resolución de la imagen • Filtros

  23. CUANTIZACIÓN • Convertir una imagen con una escala degrises de x niveles a otra con una escala menor, reduciendo el volumen de datos. Lenna a 8 niveles de gris; Lenna a 256 niveles de gris; Lenna a 16 niveles de gris; Lenna a 4 niveles de gris.

  24. PROCESAMIENTO DE IMÁGENES • Representación de imágenes • Conversión a grises • Negativo de una imagen • Umbralización • Cuantización • Reducción de la resolución de la imagen • Filtros

  25. REDUCCIÓN DE LA RESOLUCIÓN • Una imagen de grandes dimensiones generará muchos sonidos. - Inconveniente: difícil de asemejar a una escena. • Habrá que eliminar información para simplificar. Lenna con una resolución de 64 x 64 píxeles Lenna con una resolución de 256 x 256

  26. PROCESAMIENTO DE IMÁGENES • Representación de imágenes • Conversión a grises • Negativo de una imagen • Umbralización • Cuantización • Reducción de la resolución de la imagen • Filtros

  27. ÍNDICE • Introducción • Objetivos • Procesamiento de imágenes • Formato WAVE • De imagen a sonido • Experimentos • Conclusiones

  28. FORMATO WAV • Introducción • Características • Conceptos • Formato

  29. FORMATO WAV • Introducción • Formato de archivo originario de Microsoft. • Es un estándar en audio digital para PC . • Contienen información del audio del mundo real, esto es la representación digital de una señal analógica.

  30. FORMATO WAV • Características • Muy flexible → Usado para tratamiento del sonido • Gran Calidad → Ocupa gran tamaño • Compatibilidad para convertirse en otros formatos.

  31. FORMATO WAV • Conceptos • Frecuencia del tono. • Sonido. • Timbre. • Intensidad.

  32. FORMATO WAV • Frecuencia: • indicar el número de veces que se repite en un segundo cualquier fenómeno periódico • Su unidad es el herzio. • Frecuencia del tono: • característica del sonido que indica su altura. • A medida que aumenta la frecuencia también lo hace el tono

  33. FORMATO WAV • Sonido: • fenómeno físico que estimula el sentido del oído debido a vibraciones del medio que llegan al oído interno • Timbre: • cualidad que permite distinguir los sonidos producidos por los diferentes instrumentos • Intesidad • cualidad que permite distinguir entre sonidos fuertes o débiles

  34. FORMATO WAV Un fichero WAVE se compone de: • cabecera formada por el descriptor RIFF • dos sub-campos • “fmt” , que especifica el formato de los datos • “data”, campo de datos

  35. ÍNDICE • Introducción • Objetivos • Procesamiento de imágenes • Formato WAVE • De imagen a sonido • Experimentos • Noticias • Conclusiones

  36. De La Imagen al Sonido • Vamos a generar sonido a partir de una imagen digital en escala de grises en base a las características visuales de la misma • Es decir, Sonificamos una imagen por columnas, creando una onda sonora de cada uno de los píxeles que contiene.

  37. De la Imagen al Sonido Para sonificar la imagen antendemos a la siguiente relaciónintuitiva: • El nivel de gris de cada píxel está directamente relacionado con la amplitud de la onda que genera (el volumen del sonido). • La altura de cada píxel determina la frecuencia de la onda (que está relacionada íntimamente con el tono del sonido)

  38. De la Imagen al Sonido • La suma que se forma de la contribución de cada uno de los píxeles es el sonido correspondiente a la primera columna. Para sonificar la imagen entera, barremos las sucesivas columnas, generando así el sonido total compuesto por los sonidos individuales de cada una de ellas • De esta manera, la duración del sonido debido a la sonificación de toda la imagen será suma de las duraciones parciales de las ondas de todas las columnas.

  39. De la Imagen al Sonido • Cuando la imagen k-1-ésima es transformada en sonido, la imagen k-ésima es muestreada, digitaliza y almacenada como M columnas x N filas.

  40. De la Imagen al Sonido • La sonificación de forma algebraica se puede expresar como: • x=1..N, la posición de la columna en la imagen de dimensiones NxM, • y=1..M la posición del píxel en la columna, • Ix,y el nivel de gris del píxel situado en la posición (x, y) de la imagen • w la frecuencia perteneciente a la altura y

  41. De la Imagen al Sonido • Problema • El acoplamiento de las funciones correspondientes a las columnas para crear la sonificación de toda la imagen creará sonidos extremadamente complejos y sin aparente sentido • Más problemas en imágenes de gran detalle y multitud de grises.

  42. De la Imagen al Sonido • El conjunto de frecuencias usado en el proceso de sonificación puede ser en principio arbitrario • Hay dos buenos conjuntos de frecuencias • la distribución lineal (equidistante) • la exponencial • El uso de la Escala Natural y Cromática expresa de un modo más intuitivoel sonido producido.

  43. De la Imagen al Sonido • ¿Por qué la escala natural? • Por la educación del oido humano • El salto de una frecuencia a otro no es lineal, aunque lo parezca • La escala natural se utiliza fundamentalmente para imágenes de dimensiones pequeñas • ¿Por qué la escala cromática? • nuestro salto unitario se corresponde con un semitono • algo más grandes pues en una única octava tenemos hasta 12 sonidos diferentes

  44. De la imagen al Sonido • Conclusiones: • El sonido creado tras el barrido de la imagen representará a la propia imagen • Hay que aprender a “escuchar las imágenes” • importancia en personas con discapacidades visuales

  45. ÍNDICE • Introducción • Objetivos • Procesamiento de imágenes • Formato WAVE • De imagen a sonido • Experimentos • Noticias • Conclusiones

  46. ÍNDICE • Introducción • Objetivos • Procesamiento de imágenes • Formato WAVE • De imagen a sonido • Experimentos • Noticias • Conclusiones

  47. NOTICIAS • Ciegos ven en el PC (Revista Siglo 21) • Blind see with sound (BBC)

  48. ÍNDICE • Introducción • Objetivos • Procesamiento de imágenes • Formato WAVE • De imagen a sonido • Experimentos • Noticias • Conclusiones

  49. CONCLUSIONES • Campo de investigación actual: SONIFICACIÓN • Exceso de información de las imágenes: necesidad de segmentación (técnicas). • Pensado para personas con discapacidades visuales.

More Related