Zeichenerkennung

Zeichenerkennung Algorithmische Geometrie Leonid Zavodnik, 2014

Gliederung • Was ist die Zeichenerkennung • Anwendungen • Schwierigkeiten • Techniken der Erkennung • Alternativen Leonid Zavodnik, 2014

Was ist Zeichenerkennung Leonid Zavodnik, 2014

Was ist Zeichenerkennung • Klassifizierung des Eingangssymbols gemäß einer vorbestimmten Klasse Leonid Zavodnik, 2014

Anwendungen • Digitalisierung von Büchern und Dokumenten • Automatische Überprüfung von Klausuren • Erkennung von Autokennzeichen • Verkehrszeichenerkennung • Chipkartenverarbeitungssystemen • Adressen und Postleitzahl Erkennung Leonid Zavodnik, 2014

Schwierigkeiten • Ähnliche Symbolen können in Größe, Form und Stil variieren • Verschiedene Verzerrungen • Keine klaren und strengen Zeichenbildungsregeln Leonid Zavodnik, 2014

Techniken Leonid Zavodnik, 2014

Online-Methoden Leonid Zavodnik, 2014

Direction Based Algorithm • Zeichen durch einen regulären Ausdruck modellieren • Bewegungsrichtungen beschreiben 3 Leonid Zavodnik, 2014

Direction Based Algorithm ) Leonid Zavodnik, 2014

K-NN Classifier and DTW-Based Dissimilarity Measure • Unähnlichkeit bewerten • Alle Striche vergleichen • Abstaende messen • «nächste-Nachbarn Regel» benutzen • Beste Probe auswählen Leonid Zavodnik, 2014

Offline-Erkennung Leonid Zavodnik, 2014

Clustering • Trennung der Daten in Gruppen • Homogenität innerhalb der Cluster • Daten sind sehr ähnlich in demselben Cluster • Heterogenität zwischen den Cluster • Daten von unterschiedlichen Clustern haben maximale Unterschiede Leonid Zavodnik, 2014

K-Means-Algorithm • Am häufigsten verwendeten Techniken zur Gruppierung von Objekten • Optimiert die quadratischen Abweichungen von einem Mittelwert • Nur mit numerischen Attributen verwendet werden Leonid Zavodnik, 2014

K-Means-Algorithm • Clusterzentren werden zufällig gewählt Leonid Zavodnik, 2014

K-Means-Algorithm • Alle andere Punkte werden jeweils dem Cluster mit dem nächsten Clusterzentrum zugeordnet Leonid Zavodnik, 2014

K-Means-Algorithm • Die Zentren der Cluster werden neu berechnet Leonid Zavodnik, 2014

K-Means-Algorithm • Wiederholen alle Schritte Leonid Zavodnik, 2014

K-Means-Algorithm Nachteile • Ergebnis anhängig von den anfänglichen Clusterzentren • Laufzeit 1 Iteration • Anzahl der Cluster muss im Voraus bekannt sein Leonid Zavodnik, 2014

Hierarchische Algorithmen • Divisiven • Agglomerativen Leonid Zavodnik, 2014

Hierarchische Algorithmen • Vorteile • Flexibilität durch Verwendung komplexer Distanzmaße • Keine eigenen Parameter • Ergebnis als Cluster-Hierarchie • Nachteile • Analyseaufwand • Laufzeit-Komplexität • Divisiv: • Agglomerativ: Leonid Zavodnik, 2014

Hierarchische Algorithmen • Eingabe • Ergebnis Leonid Zavodnik, 2014

Self Organizing Map (SOM) Algorithm • Flexibel, stark und parallelisierbar • Bilderkennung, Signalverarbeitung, Visualisierung • Struktur • 2 Schichten: Input und Mapping, vollständig verbunden • Jeder Mapping knoten initialisiert mit zufälligen Zahlen • Lernen • Der Unterschied zwischen Input-knoten und Mapping-knoten wird in einem Adaptionsschritt verringert • Alle benachbarten Knoten proportional adaptiert Leonid Zavodnik, 2014

Self Organizing Map (SOM) Algorithm Ergebnis: räumliche Anordnung der Eingangsdaten, bei den ähnlichen Regionen gruppiert Leonid Zavodnik, 2014

Expectation Maximization Algorithm 2 Schritte • Expectation-Schritt • die Punkte werdenbesser zugeordnet • Maximization-Schritt • das Modell wird so verändert, dass es besser zu den Daten passt Leonid Zavodnik, 2014

Expectation Maximization Algorithm Leonid Zavodnik, 2014

Feature Extraction • Extraktion der wichtige Merkmale • Seitenverhältnis • Prozentuale Anzahl der Pixel • Anzahl der Striche • Durchschnittliche Entfernung von der Mitte • Symmetrie bezüglich der Koordinatenachsen • Mehr Kontrolle über die Merkmale • Entwicklungzeit wächst Leonid Zavodnik, 2014

Projection Method • Schwarzen Pixel auf Achsen projizieren • Feature: die Anzahl der Pixel g Leonid Zavodnik, 2014

Zoning • Symbol in kleine Fragmente teilen • Feature: Anzahl (Durschnitt) der Pixel in jedem Fragment g Leonid Zavodnik, 2014

Border Transition Technique (BTT) • Symbol in vier Quadranten teilen • Feature: Anzahl der zero‑to‑one transitions in jedem Quadrant g Leonid Zavodnik, 2014

Graph Matching Method • End point verbindet nur ein Pixel • Curve point verbindet zwei Pixel • Branch point verbindet drei oder mehr Pixel 3 Leonid Zavodnik, 2014

Pattern Matching • Zeichen durch die Analyse von Form und der Vergleich der Merkmale identifiziert • Photometric pattern matching • Arbeitet mit Bild als eine Matrix von Intensitätswerten oder Funktionen • Geometric pattern matching • Arbeitet mit der Geometrie des Objekts Leonid Zavodnik, 2014

Pattern Matching • Hohe Bearbeitungsgeschwindigkeit • Unwirksam, wenn es Verzerrungen der Schrift, Schiefe, Streckungen, unnötige Verbindungen oder zerrissene Striche gibt • Vorgehensweise • Symbol auf eine normierte Größe bringen • In Blöcke gruppiert (z.B. 8x8), um die Anzahl der Merkmale zu reduzieren • Die Kanten mit Lowpassfiltering und Downsampling glätten • Die Merkmale vergleichen Leonid Zavodnik, 2014

Patternerkennung • A • 0 0 0 0 0 0 1 1 0 0 0 0 0 0 0 • 0 0 0 0 0 0 1 1 0 0 0 0 0 0 0 • 0 0 0 0 0 1 1 1 1 0 0 0 0 0 0 • 0 0 0 0 0 1 1 0 1 0 0 0 0 0 0 • 0 0 0 0 1 1 0 0 1 1 0 0 0 0 0 • 0 0 0 0 1 1 0 0 1 1 0 0 0 0 0 • 0 0 0 1 1 0 0 0 0 1 1 0 0 0 0 • 0 0 0 1 1 0 0 0 0 1 1 0 0 0 0 • 0 0 0 1 1 0 0 0 0 1 0 1 0 0 0 • 0 0 1 0 0 1 1 1 1 0 0 1 0 0 0 • 0 0 1 1 1 1 1 1 1 1 1 1 1 0 0 • 0 1 1 0 0 0 0 0 0 0 0 1 1 0 0 • 0 1 1 0 0 0 0 0 0 0 0 0 1 1 0 • 1 1 0 0 0 0 0 0 0 0 0 0 1 1 0 • 1 1 0 0 0 0 0 0 0 0 0 0 0 1 1 Leonid Zavodnik, 2014

Patternerkennung • Mitte der Matrix finden • Radius berechnen • Durch die Anzahl der Spuren teilen • Sektoren bestimmen • Trek-Sector Matrix generieren • Anzahl von „1“ auf jedem Schnittpunkt des Sektors und der Spur zählen • Die resultierende Matrix mit Vorlagen aus der Datenbank vergleichen • 0 0 0 0 0 0 1 1 0 0 0 0 0 0 0 • 0 0 0 0 0 0 1 1 0 0 0 0 0 0 0 • 0 0 0 0 0 1 1 1 1 0 0 0 0 0 0 • 0 0 0 0 0 1 1 0 1 0 0 0 0 0 0 • 0 0 0 0 1 1 0 0 1 1 0 0 0 0 0 • 0 0 0 0 1 1 0 0 1 1 0 0 0 0 0 • 0 0 0 1 1 0 0 0 0 1 1 0 0 0 0 • 0 0 0 1 1 0 0 0 0 1 1 0 0 0 0 • 0 0 0 1 1 0 0 0 0 1 0 1 0 0 0 • 0 0 1 0 0 1 1 1 1 0 0 1 0 0 0 • 0 0 1 1 1 1 1 1 1 1 1 1 1 0 0 • 0 1 1 0 0 0 0 0 0 0 0 1 1 0 0 • 0 1 1 0 0 0 0 0 0 0 0 0 1 1 0 • 1 1 0 0 0 0 0 0 0 0 0 0 1 1 0 • 1 1 0 0 0 0 0 0 0 0 0 0 0 1 1 Leonid Zavodnik, 2014

Artificial Neural Network • Lernfähig,flexibel • Niedrige Reaktionszeit • Hohe Geschwindigkeit • Für Echtzeitsysteme gut geeignet • Verbindungen mit «Gewichte» • Zusammenhänge zwischen Eingängen und Ausgängen • Korrekte Ergebnis bei unvollständigen (verzerrten) Daten Leonid Zavodnik, 2014

Alternative • OCR Ungenauigkeit >30% • reCAPTCHA für Digitalisierung der Bücher • 1 000 000 Wörter pro Tag • 2 500 000 Bücher pro Jahr • 2009- Google gekauft • Für Googlemaps benutzt • http://www.ted.com/talks/luis_von_ahn_massive_scale_online_collaboration Leonid Zavodnik, 2014

Quellen • Suruchi G. Dedgaonkar, Anjali A. Chandavale, Ashok M. Sapkal: • Survey of Methods for Character Recognition, S. 180-189, ISSN: 2277-3754 • http://ijeit.com/vol 1/Issue 5/IJEIT1412201205_36.pdf (17.06.2014) • Faisal Mohammad, Jyoti Anarase, Milan Shingote, Pratik Ghanwat: • Optical Character Recognition Implementation Using Pattern Matching, S. 2089, ISSN: 0975-9646 • http://www.ijcsit.com/docs/Volume 5/vol5issue02/ijcsit20140502254.pdf(17.06.2014) • http://de.wikipedia.org/wiki/K-Means-Algorithmus (17.06.2014) • http://de.wikipedia.org/wiki/EM-Algorithmus(17.06.2014) • http://de.wikipedia.org/wiki/Selbstorganisierende_Karte(17.06.2014) Leonid Zavodnik, 2014

Zeichenerkennung

Zeichenerkennung

Presentation Transcript