1 / 27

Proyecto Fin de Carrera

Diseño, implementación y evaluación de técnicas de estimación de fiabilidad en tareas de localización de locutores. Proyecto Fin de Carrera. Autor: David Morales Cervera Tutor: Javier Macías Guarasa. Introducción Estudio teórico Diseño e implementación Evaluación Conclusiones

seda
Download Presentation

Proyecto Fin de Carrera

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Diseño, implementación y evaluación detécnicas de estimación de fiabilidad en tareas de localización de locutores Proyecto Fin de Carrera Autor: David Morales Cervera Tutor: Javier Macías Guarasa

  2. PFC David Morales Cervera Introducción Estudio teórico Diseño e implementación Evaluación Conclusiones Líneas futuras Índice

  3. PFC David Morales Cervera IntroducciónMotivación y objetivos • Marco: Sistemas de reconocimiento automático del habla • Crecimiento espectacular del rendimiento • Tendencia a utilizar micrófonos alejados del locutor • Problemas adicionales paliados usando arrays de micrófonos  tareas de localización son fundamentales • Localización: Problemas influyen en fiabilidad de resultados • Objetivos: • Diseño e implementación de técnicas para la generación de medidas de fiabilidad en las estimaciones de posición de locutores en entornos acústicos reverberantes • Evaluación de los algoritmos de estimación de fiabilidad implementados

  4. PFC David Morales Cervera Introducción Estudio teórico Diseño e implementación Evaluación Conclusiones Líneas futuras Índice

  5. PFC David Morales Cervera Estudio teóricoTécnicas deLocalización • Buscamos: • Precisión • Rapidez • Resolución espacial y temporal • Tres tipos de métodos en la literatura: • Basados en diferencias de tiempo de llegada (TDOA)‏ • Maximización de la respuesta en potencia dirigida (SRP: Steered Response Power)‏ • Basados en subespacios de alta resolución

  6. PFC David Morales Cervera TDOA se divide en dos etapas: Se estiman retardos entre pares de señales Se combinan los resultados con la geometría del array SRP se basa en la distribución de potencia de señal captada por el array apuntado: Estudio teóricoTécnicas de Localización

  7. PFC David Morales Cervera Estudio teóricoIntegración en el sistema • Fiabilidad total: • Calcular grado de incertidumbre relación entre la posición real y la estimada del locutor • Fiabilidad parcial (de cada par de micros): • Mejorar las estimaciones de posición

  8. PFC David Morales Cervera Estudio teóricoRedes neuronales artificiales • Conocimiento alcanzado tras aprendizaje • Decisiones: • Topología • Func. Activación • Algoritmo aprendizaje

  9. PFC David Morales Cervera Introducción Estudio teórico Diseño e implementación Evaluación Conclusiones Líneas futuras Índice

  10. PFC David Morales Cervera Diseño e implementación del sistemaMetodología de trabajo • Características del sistema a determinar: • Posibles técnicas de estimación: • Deterministas • Redes neuronales • Datos de entrada: • Todos los disponibles en tiempo real • Datos de salida: • Todos los disponibles • Fiabilidad parcial • Fiabilidad total • Posiciones SRP • Energías par de micros • Contenido espectral • ¿Cómo la calculamos?

  11. PFC David Morales Cervera Diseño e implementación del sistemaMetodología de trabajo • Características del sistema a determinar: • Herramientas disponibles: • Software libre • Para redes: MUME • Para localización: SRP • Estrategia experimental: • Rigurosa • Uso óptimo de recursos • Evaluación cuantitativa y gráficas significativas: • Comportamiento de la red • Relación con medidas de fiabilidad real

  12. PFC David Morales Cervera Conf trn Pesos .wgt val Conf DAT .tau DAT .max tst Result Conf DAT .cnf BD Diseño e implementación del sistemaArquitectura propuesta SRP pos2tau genNNData DAT .asc Mume test Mume train makeLoos Loo_n …

  13. PFC David Morales Cervera Diseño e implementación del sistemaSoluciones propuestas • Datos de red neuronal: • Entrada: • Retardo de cada par de micros • Salida: • Fiabilidad total • Fiabilidad parcial • Conversión de datos • Estrategias de codificación pos2tau genNNData

  14. PFC David Morales Cervera Diseño e implementación del sistemaSoluciones propuestas • Codificación de datos: • Sin procesar • ‏Estandarización sin recorte • Estandarización con recorte • Multi neurona genNNData • ¿Estimación  y ?

  15. PFC David Morales Cervera BD Train Test Train Val Test Train Test Diseño e implementación del sistemaEstrategia de experimentación • Uso óptimo de recursos (datos) disponibles • Problemática: • Tamaños entrenamiento y evaluación: • Buenos modelos • Fiabilidad resultados evaluación • Datos sucios • Solución: n-fold cross validation makeLoos

  16. PFC David Morales Cervera Introducción Estudio teórico Diseño e implementación Evaluación Conclusiones Líneas futuras Índice

  17. Evaluación del sistemaBases de datos • Idiap AV16.3 • 16 micros • 3 cámaras • 6216 tramas PFC David Morales Cervera

  18. Evaluación del sistemaBases de datos • HIFI-MM1 • 1200 seq • 12 locutores • 7404 tramas PFC David Morales Cervera

  19. Evaluación del sistemaExperimentos iniciales • Comportamiento red neuronal PFC David Morales Cervera

  20. PFC David Morales Cervera Evaluación del sistemaExperimentos iniciales • Evaluación de valores de : • Eliminamos extremos • Evaluación de # de neuronas intermedias: • Resultados similares • Consideraciones sobre el tiempo de proceso: • 500 iteraciones 5s, 106 iteraciones 2 días • Consideraciones sobre tamaño BD:

  21. Evaluación del sistemaExperimentos sobre HIFI-MM1 • Resultados prometedores PFC David Morales Cervera

  22. Evaluación del sistemaExperimentos sobre HIFI-MM1 • ¡Anomalías! • Relación con errores reales: PFC David Morales Cervera

  23. Evaluación del sistemaExperimentos sobre AV16.3 • Comportamiento irregular: pocos datos PFC David Morales Cervera

  24. PFC David Morales Cervera Índice • Introducción • Estudio teórico • Diseño e implementación • Evaluación • Conclusiones • Líneas futuras

  25. PFC David Morales Cervera ConclusionesAportaciones • Definición metodología rigurosa de trabajo: • Validación cruzada (n-fold cross validation) • Redes neuronales (early stopping) • Desarrollo de aplicaciones y herramientas de soporte: • pos2tau, genNNData, makeLoos, tauMume, SRP, MUME, mumeLib • Experimentación: • Scripts de soporte para facilitar trabajos posteriores • Resultados prometedores y anomalías detectadas

  26. PFC David Morales Cervera Líneas futuras • Revisión de los resultados y datos en busca de posibles causas de las anomalías • Uso de nuevos datos de entrada • Implementación de nuevas estrategias en cálculo fiabilidad parcial • Implementación de nuevas estrategias de normalización • Experimentación con otras BD • Integración de estimación de fiabilidad en SRP

  27. PFC David Morales Cervera ConclusionesObjetivo fundamental • Diseñar, implementar y evaluar técnicas para permitir la obtención de medidas de fiabilidad en las estimaciones de posición de locutores, para mejorar los sistemas de localización basados en la explotación de la estructura espacio-temporal proporcionada por agrupaciones de micrófonos • Primer trabajo del grupo en esa tarea

More Related