Detección de líneas de referencia de palabras en cursiva según la Entropía

Detección de líneas de referencia de palabras en cursiva según la Entropía • Rodríguez de Torres Jaramillo, Joaquín Carlos • Rivas Pérez, Manuel • Peña Cantillana, Felipe

Índice • Introducción. - On-line. - Off-line. - Analytic aproach. - Holistic aproach. - Resumen. • Método propuesto. - Otras técnicas. - Extracción de puntos del contorno. - Generación de histogramas. - Elección del histograma según “la Entropia”. - Deducción de líneas de referencia. • Ejemplos prácticos. • Bibliografía. • Turno de preguntas.

Introducción • On-line: la escritura manual es producida a través de un dispositivo como un lápiz electrónico o tabletas gráficas Reconocimiento de la escritura manual (cursive script recognition): 2. Off-line: se trabaja con imágenes digitales introducidas a través de un escáner o cámara digital

Características On-line • Uso de lápiz electrónico o tabletas gráficas. • Colaboración entre escritor y el computador. • Línea de escritura no tiene grosor. • Reconocimiento basado en un dato unidimensional, es decir, la línea de escritura es representada mediante una secuencia de puntos cuya localización es función del tiempo.

Características Off-line • No necesita de dispositivos especiales para realizar la escritura. • No hay ningún tipo de colaboración entre escritor y el computador. • La escritura posee grosor. • Reconocimiento basado en un dato bidimensional.

Off-line Nos centraremos en el reconocimiento Off-line, donde podemos encontrar dos estrategias fundamentales aplicadas al problema del CSR: • Analytical aproach o segmentation-based: En este primer caso, la palabra es considerada como un conjunto de unidades más pequeñas, las técnicas de reconocimiento de palabra se basan en el reconocimiento de esas unidades que la forman. • Holistic aproach o word-based: En este segundo caso, el reconocimiento de la palabra se realiza considerando ésta como un todo, es decir, no se intenta identificar los caracteres de los que está compuesta.

Analytical aproach vs Holistic aproach Analytical aproach: • Los puntos de segmentación de la palabra son establecidos correctamente solo cuando se conoce la secuencia correcta de caracteres que forman dicha palabra. • El reconocimiento de caracteres sólo es exitoso cuando la segmentación es correcta. • Tomar muchos potenciales puntos de segmentación, pero esto se complica bastante al mezclarlo con la elección de los posibles caracteres que forman dicha palabra. • Pobre uso de la información contextual obtenida de caracteres vecinos.

Analytical aproach vs Holistic aproach Holistic aproach: • Extraer un vector que caracteriza la palabra. • Por comparación con prototipos de palabras almacenadas en un diccionario se concluirá que palabra es ésta. • Con este método se gana en velocidad y evita todos aquellos problemas surgidos de la segmentación de la palabra en unidades más pequeñas. • Se aproxima más al método de lectura humano. • El único problema que plantea este método es el de tener un léxico apropiado para el reconocimiento de las palabras.

Aplicaciones - Reconocimiento direcciones postales - Lectoras para ciegos - Impresos rellenados manualmente - Talones bancarios

Resumen Reconocimiento de palabras • Reconocimiento On-line Reconocimiento de palabras cursivas o escritura manual • Analytic aproach • Reconocimiento Off-line • Holistic aproach

Etapas de reconocimiento

Preprocessing • Convertir la entrada de escritura manual en una forma más eficiente. • Elegir entre modificar la imagen o preservar características. • Normalización, reducción de ruido, búsqueda de líneas de referencia

Preprocessing • Extracción contorno (contour tracing) • Corrección de inclinación (skew correction) • Corrección del declive (slant correctíon) • Búsqueda de líneas de referencia (reference line finding) o baselines • Suavizado (smoothing) • Cambio de escala (scaling) • Extracción del esqueleto (thinning)

Preprocessing Skew/base-line correction Slant correction Base-line finding Thinning

Slant correction n1=3 n2=3 n3=1

Slant correction

Slant correction Hyper SPARC 125 MHz

Líneasdereferencia • Objetivo: Detectar primitivas significativas: ascendentes y descendentes • Dividir palabra en 3 partes: superior (ascendentes), central (cuerpo), inferior (descendentes)

Líneasdereferencia • Problema: Escritura cursiva es a menudo inclinada • Enderezamiento => Distorsiones (pérdidas de información) • Métodos conocidos complejos (requieren corrección previa de la inclinación, skew correction)

Líneasdereferencia • Método • 1) Extracción puntos del contorno • 2) Generación histogramas ordenadas • 3) Selección histograma más compacto (entropía menor) • 4) Deducción líneas de referencia

1.-Extraccióndelcontorno • Objetivo: Eliminar puntos sobrantes • Barras de ‘t’, letras ‘i’, ‘j’ • Para encontrar todos los puntos del borde de S, podemos rastrear la imagen y comprobar los cuatro vecinos de cada 1 (negro) para ver si alguno de ellos es 0 (blanco) o vv.

1.- Extracción del contorno

2.-Generación de histogramas • Cada ordenada de los puntos es proyectada en un eje cuyo ángulo de inclinación con respecto a la horizontal varía desde +30º hasta –30º en pasos de 1º => 61 proyecciones • Calcular histograma de densidad para cada proyección => 61 histogramas

2.-Generación de histogramas • Dado un punto del contorno P(x,y) y un ángulo de proyección  con respecto a la horizontal, sus coordenadas en el nuevo sistema de referencia se obtienen aplicando una rotación: aunque solo necesitaremos la proyección y’:

PROYECCIONES (I) Y P1(X1,Y1) P2(X2,Y2) Y1 Y2 P3(X3,Y3) Y3 X1 O X2 X3 X Yi son iguales => Puntos siguen dirección OX

PROYECCIONES (II) Y P1(X1,Y1) P2(X2,Y2) Y3 Y2 P3(X3,Y3) Y1 X1 O X2 X3 X Yi son distintos => Puntos NO siguen dirección OX

PROYECCIONES (III) X’ Y’ Y P1(X1,Y1) P2(X2,Y2) Y3 Y2 P3(X3,Y3) Y1 O X1 X2 X3 X Y’3 Y’2 Y’1 Yi son distintos => Puntos NO siguen dirección OX Yi’ son iguales => Puntos siguen dirección OX’

2.-Generación de histogramas

3.- Elección del histograma • Entropía: • Ni = Nº de pixeles con proyección yi en el vector proyección • N = Nº total de puntos • Pi = frecuencia de ocurrencia de la ordenada yi

3.- Elección del histograma • Entropía máxima => Todas Pi son iguales => Distribución homogénea, muy extendida (plana) • Entropía mínima => Todas Pi son nulas (excepto una) => Distribución heterogénea, poco extendida (abrupta)

3.- Elección del histograma • La dirección de la inclinación de la palabra se obtiene minimizando la entropía • Se calcula la entropía para cada histograma de densidad y se coge el de mínima entropía

3.- Elección del histograma

4.- Obtención de las líneas • Cada histograma presenta 3 picos: central (cuerpo), izquierda (zona ascendentes), derecha (zona descendentes) • Ausencia picos laterales (no hay ascendentes / descendentes) • Líneas de referencia: rectas separan pico central de las zonas laterales. Ordenadas al origen son los umbrales

4.- Obtención de las líneas • Heurística de aproximación : donde fmax es la frecuencia del pico central

4.- Obtención de las líneas

Líneas de referencia

Ventajas • No causa ninguna deformación en la imagen de partida, lo cual es importante a la hora de detectar la primitivas salientes de la imagen • Menos complejo que los métodos que usan regresiones lineales

Ejemplos Elmira Almaden Tennesse Treadwell

Inconvenientes • La heurística no siempre se verifica aunque la dirección sea la correcta => Búsqueda adaptativa mejorando los umbrales (thresholding) • Problemas con las ‘T’, ‘F’ que originan picos parásitos que impiden la detección del pico central (aunque ocurre pocas veces)

Inconvenientes Four Ten Mal Two Tappan Bien Talmage

Ejemplos Fiskill Thiells Taberg

Ejemplos one nine seven six

Ejemplos dollars eighteen Criterio de la entropía Criterio del pico maximal

Comparativa

Detección de líneas de referencia de palabras en cursiva según la Entropía

Detección de líneas de referencia de palabras en cursiva según la Entropía

Presentation Transcript

Coordenadas y Referencias

Período de la Antigüedad

Navy Enlisted Advancement System (NEAS)

ASF | 1

Étima

UNIVERSIDAD TECNOLOGICA DE SANTIAGO – UTESA –

DICTADO INVER 4 dictado de palabras sílabas inversas

Palabras emparejadas 2 Lectura de palabras Arial Verdana Century Gothic

Estadísticas de los Servicios: líneas de actuación Fernando Cortina García fcortina@ine.es

Virosis cutáneas y Micosis superficiales

DICTADO 5 30 palabras variadas.

ORTOGRAFÍA 2 5 series de 5 palabras con g - j. agenda agente ágil agitar agujero

ORTOGRAFÍA 7 5 series de 5 palabras variadas huella huevo universo uva beber

PROPUESTA DE LÍNEAS ESTRATÉGICAS, PROGRAMAS Y ACCIONES PARA EL II PLAN DE ACCIÓN LOCAL DE TOLOSA

2.2 MODELO DE REFERENCIA DEL PROTOCOLO B-ISDN

ESTUDIO DE LA PALABRA

separar_10

MARCO DE REFERENCIA PARA UNA POLITICA AGROPECUARIA DE MEDIANO PLAZO

separo_3

Objetivo geral

ORTOGRAFÍA 17 5 series de 5 palabras variadas. proyectil prohibido pollo ovillo ovalado

separo_1