1 / 38

Zeichenerkennung

Zeichenerkennung. Algorithmische Geometrie. Gliederung. Was ist die Zeichenerkennung Anwendungen Schwierigkeiten Techniken der Erkennung Alternativen. Was ist Zeichenerkennung. Was ist Zeichenerkennung. Klassifizierung des Eingangssymbols gemäß einer vorbestimmten Klasse. Anwendungen.

damian
Download Presentation

Zeichenerkennung

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Zeichenerkennung Algorithmische Geometrie Leonid Zavodnik, 2014

  2. Gliederung • Was ist die Zeichenerkennung • Anwendungen • Schwierigkeiten • Techniken der Erkennung • Alternativen Leonid Zavodnik, 2014

  3. Was ist Zeichenerkennung Leonid Zavodnik, 2014

  4. Was ist Zeichenerkennung • Klassifizierung des Eingangssymbols gemäß einer vorbestimmten Klasse Leonid Zavodnik, 2014

  5. Anwendungen • Digitalisierung von Büchern und Dokumenten • Automatische Überprüfung von Klausuren • Erkennung von Autokennzeichen • Verkehrszeichenerkennung • Chipkartenverarbeitungssystemen • Adressen und Postleitzahl Erkennung Leonid Zavodnik, 2014

  6. Schwierigkeiten • Ähnliche Symbolen können in Größe, Form und Stil variieren • Verschiedene Verzerrungen • Keine klaren und strengen Zeichenbildungsregeln Leonid Zavodnik, 2014

  7. Techniken Leonid Zavodnik, 2014

  8. Online-Methoden Leonid Zavodnik, 2014

  9. Direction Based Algorithm • Zeichen durch einen regulären Ausdruck modellieren • Bewegungsrichtungen beschreiben 3 Leonid Zavodnik, 2014

  10. Direction Based Algorithm ) Leonid Zavodnik, 2014

  11. K-NN Classifier and DTW-Based Dissimilarity Measure • Unähnlichkeit bewerten • Alle Striche vergleichen • Abstaende messen • «nächste-Nachbarn Regel» benutzen • Beste Probe auswählen Leonid Zavodnik, 2014

  12. Offline-Erkennung Leonid Zavodnik, 2014

  13. Clustering • Trennung der Daten in Gruppen • Homogenität innerhalb der Cluster • Daten sind sehr ähnlich in demselben Cluster • Heterogenität zwischen den Cluster • Daten von unterschiedlichen Clustern haben maximale Unterschiede Leonid Zavodnik, 2014

  14. K-Means-Algorithm • Am häufigsten verwendeten Techniken zur Gruppierung von Objekten • Optimiert die quadratischen Abweichungen von einem Mittelwert • Nur mit numerischen Attributen verwendet werden Leonid Zavodnik, 2014

  15. K-Means-Algorithm • Clusterzentren werden zufällig gewählt Leonid Zavodnik, 2014

  16. K-Means-Algorithm • Alle andere Punkte werden jeweils dem Cluster mit dem nächsten Clusterzentrum zugeordnet Leonid Zavodnik, 2014

  17. K-Means-Algorithm • Die Zentren der Cluster werden neu berechnet Leonid Zavodnik, 2014

  18. K-Means-Algorithm • Wiederholen alle Schritte Leonid Zavodnik, 2014

  19. K-Means-Algorithm Nachteile • Ergebnis anhängig von den anfänglichen Clusterzentren • Laufzeit 1 Iteration • Anzahl der Cluster muss im Voraus bekannt sein Leonid Zavodnik, 2014

  20. Hierarchische Algorithmen • Divisiven • Agglomerativen Leonid Zavodnik, 2014

  21. Hierarchische Algorithmen • Vorteile • Flexibilität durch Verwendung komplexer Distanzmaße • Keine eigenen Parameter • Ergebnis als Cluster-Hierarchie • Nachteile • Analyseaufwand • Laufzeit-Komplexität • Divisiv: • Agglomerativ: Leonid Zavodnik, 2014

  22. Hierarchische Algorithmen • Eingabe • Ergebnis Leonid Zavodnik, 2014

  23. Self Organizing Map (SOM) Algorithm • Flexibel, stark und parallelisierbar • Bilderkennung, Signalverarbeitung, Visualisierung • Struktur • 2 Schichten: Input und Mapping, vollständig verbunden • Jeder Mapping knoten initialisiert mit zufälligen Zahlen • Lernen • Der Unterschied zwischen Input-knoten und Mapping-knoten wird in einem Adaptionsschritt verringert • Alle benachbarten Knoten proportional adaptiert Leonid Zavodnik, 2014

  24. Self Organizing Map (SOM) Algorithm Ergebnis: räumliche Anordnung der Eingangsdaten, bei den ähnlichen Regionen gruppiert Leonid Zavodnik, 2014

  25. Expectation Maximization Algorithm 2 Schritte • Expectation-Schritt • die Punkte werdenbesser zugeordnet • Maximization-Schritt • das Modell wird so verändert, dass es besser zu den Daten passt Leonid Zavodnik, 2014

  26. Expectation Maximization Algorithm Leonid Zavodnik, 2014

  27. Feature Extraction • Extraktion der wichtige Merkmale • Seitenverhältnis • Prozentuale Anzahl der Pixel • Anzahl der Striche • Durchschnittliche Entfernung von der Mitte • Symmetrie bezüglich der Koordinatenachsen • Mehr Kontrolle über die Merkmale • Entwicklungzeit wächst Leonid Zavodnik, 2014

  28. Projection Method • Schwarzen Pixel auf Achsen projizieren • Feature: die Anzahl der Pixel g Leonid Zavodnik, 2014

  29. Zoning • Symbol in kleine Fragmente teilen • Feature: Anzahl (Durschnitt) der Pixel in jedem Fragment g Leonid Zavodnik, 2014

  30. Border Transition Technique (BTT) • Symbol in vier Quadranten teilen • Feature: Anzahl der zero‑to‑one transitions in jedem Quadrant g Leonid Zavodnik, 2014

  31. Graph Matching Method • End point verbindet nur ein Pixel • Curve point verbindet zwei Pixel • Branch point verbindet drei oder mehr Pixel 3 Leonid Zavodnik, 2014

  32. Pattern Matching • Zeichen durch die Analyse von Form und der Vergleich der Merkmale identifiziert • Photometric pattern matching • Arbeitet mit Bild als eine Matrix von Intensitätswerten oder Funktionen • Geometric pattern matching • Arbeitet mit der Geometrie des Objekts Leonid Zavodnik, 2014

  33. Pattern Matching • Hohe Bearbeitungsgeschwindigkeit • Unwirksam, wenn es Verzerrungen der Schrift, Schiefe, Streckungen, unnötige Verbindungen oder zerrissene Striche gibt • Vorgehensweise • Symbol auf eine normierte Größe bringen • In Blöcke gruppiert (z.B. 8x8), um die Anzahl der Merkmale zu reduzieren • Die Kanten mit Lowpassfiltering und Downsampling glätten • Die Merkmale vergleichen Leonid Zavodnik, 2014

  34. Patternerkennung • A • 0 0 0 0 0 0 1 1 0 0 0 0 0 0 0 • 0 0 0 0 0 0 1 1 0 0 0 0 0 0 0 • 0 0 0 0 0 1 1 1 1 0 0 0 0 0 0 • 0 0 0 0 0 1 1 0 1 0 0 0 0 0 0 • 0 0 0 0 1 1 0 0 1 1 0 0 0 0 0 • 0 0 0 0 1 1 0 0 1 1 0 0 0 0 0 • 0 0 0 1 1 0 0 0 0 1 1 0 0 0 0 • 0 0 0 1 1 0 0 0 0 1 1 0 0 0 0 • 0 0 0 1 1 0 0 0 0 1 0 1 0 0 0 • 0 0 1 0 0 1 1 1 1 0 0 1 0 0 0 • 0 0 1 1 1 1 1 1 1 1 1 1 1 0 0 • 0 1 1 0 0 0 0 0 0 0 0 1 1 0 0 • 0 1 1 0 0 0 0 0 0 0 0 0 1 1 0 • 1 1 0 0 0 0 0 0 0 0 0 0 1 1 0 • 1 1 0 0 0 0 0 0 0 0 0 0 0 1 1 Leonid Zavodnik, 2014

  35. Patternerkennung • Mitte der Matrix finden • Radius berechnen • Durch die Anzahl der Spuren teilen • Sektoren bestimmen • Trek-Sector Matrix generieren • Anzahl von „1“ auf jedem Schnittpunkt des Sektors und der Spur zählen • Die resultierende Matrix mit Vorlagen aus der Datenbank vergleichen • 0 0 0 0 0 0 1 1 0 0 0 0 0 0 0 • 0 0 0 0 0 0 1 1 0 0 0 0 0 0 0 • 0 0 0 0 0 1 1 1 1 0 0 0 0 0 0 • 0 0 0 0 0 1 1 0 1 0 0 0 0 0 0 • 0 0 0 0 1 1 0 0 1 1 0 0 0 0 0 • 0 0 0 0 1 1 0 0 1 1 0 0 0 0 0 • 0 0 0 1 1 0 0 0 0 1 1 0 0 0 0 • 0 0 0 1 1 0 0 0 0 1 1 0 0 0 0 • 0 0 0 1 1 0 0 0 0 1 0 1 0 0 0 • 0 0 1 0 0 1 1 1 1 0 0 1 0 0 0 • 0 0 1 1 1 1 1 1 1 1 1 1 1 0 0 • 0 1 1 0 0 0 0 0 0 0 0 1 1 0 0 • 0 1 1 0 0 0 0 0 0 0 0 0 1 1 0 • 1 1 0 0 0 0 0 0 0 0 0 0 1 1 0 • 1 1 0 0 0 0 0 0 0 0 0 0 0 1 1 Leonid Zavodnik, 2014

  36. Artificial Neural Network • Lernfähig,flexibel • Niedrige Reaktionszeit • Hohe Geschwindigkeit • Für Echtzeitsysteme gut geeignet • Verbindungen mit «Gewichte» • Zusammenhänge zwischen Eingängen und Ausgängen • Korrekte Ergebnis bei unvollständigen (verzerrten) Daten Leonid Zavodnik, 2014

  37. Alternative • OCR Ungenauigkeit >30% • reCAPTCHA für Digitalisierung der Bücher • 1 000 000 Wörter pro Tag • 2 500 000 Bücher pro Jahr • 2009- Google gekauft • Für Googlemaps benutzt • http://www.ted.com/talks/luis_von_ahn_massive_scale_online_collaboration Leonid Zavodnik, 2014

  38. Quellen • Suruchi G. Dedgaonkar, Anjali A. Chandavale, Ashok M. Sapkal: • Survey of Methods for Character Recognition, S. 180-189, ISSN: 2277-3754 • http://ijeit.com/vol 1/Issue 5/IJEIT1412201205_36.pdf (17.06.2014) • Faisal Mohammad, Jyoti Anarase, Milan Shingote, Pratik Ghanwat: • Optical Character Recognition Implementation Using Pattern Matching, S. 2089, ISSN: 0975-9646 • http://www.ijcsit.com/docs/Volume 5/vol5issue02/ijcsit20140502254.pdf(17.06.2014) • http://de.wikipedia.org/wiki/K-Means-Algorithmus (17.06.2014) • http://de.wikipedia.org/wiki/EM-Algorithmus(17.06.2014) • http://de.wikipedia.org/wiki/Selbstorganisierende_Karte(17.06.2014) Leonid Zavodnik, 2014

More Related