vb@rchiv
VB Classic
VB.NET
ADO.NET
VBA
C#
vb@rchiv Offline-Reader - exklusiv auf der vb@rchiv CD Vol.4  
 vb@rchiv Quick-Search: Suche startenErweiterte Suche starten   Impressum  | Datenschutz  | vb@rchiv CD Vol.6  | Shop Copyright ©2000-2025
 
zurück

 Sie sind aktuell nicht angemeldet.Funktionen: Einloggen  |  Neu registrieren  |  Suchen

Fortgeschrittene Programmierung
Re: ocr mit vb 
Autor: +++MaRuSo+++
Datum: 04.10.07 21:47

Hallo,

also OCR ist eine Wissenschaft für sich.
Alles in allem kommt es vor allem auf die Rahmenbedingungen an unter der deine Texterkennung laufen soll.

Das Komplizierteste bei Texterkennung ist, dass es tausende von Schrifttypen gibt.

Ich habe mal für mich eine Texterkennung geschrieben die den Bildschirm nach Textpassagen scannt die mit einem Rahmen umzogen waren.
Dann hab ich diese Bereiche jeweils in einem Bild gespeichert und mit meinem Programm analysiert.

Da hab ich eine recht einfache Methode gewählt.
Da in meinem Fall der Schrifttyp, die Schriftfarbe und Hintergrundfarbe immer gleich waren und es sich bei den zu erkennenden Zeichen um eine übersichtliche Anzahl handelte.

Ich hab, wie schon geschrieben, die Bildbereiche in eine Picturebox geladen.

Weitere Vorgehensweise:
Schritt 1:
Zuerst die einzelnen Zeichen im Bild separieren. (Noch keine Analyse um was für ein Zeichen es sich handelt. Nur die Bereiche der einzelnen Zeichen erkennen. Sozusagen für jedes Zeichen ein Bild erstellen.

Schritt 2:

Die erkannten Bereiche dann mit zuvor abgespeicherten Mustern vergleichen.

Zusätzlich hab ich die kleinen Bildchen wieder in 9 Bereiche unterteilt und die Pixeldichte der jeweiligen Bereiche berechnet und verglichen. Nach einer Lernphase von ca. 1000 Durchläufen lag die Erkennung bei 99,95 %

Das ist hier vielleicht nicht der optimale und/oder einfachste Weg um sowas an zu stellen. Aber mir ist damals nix besseres eingefallen.
Und wie gesagt das ganze funzt bei mir wohl nur so gut weil es sich um immer wiederkehrende Zeichen bei gleichen Rahmenbedingungen handelt. Und sich die Menge der zu analysierenden Zeichen auch in grenzen hält. (ca. 100 Zeichen )

Bilder wie sie zum Beispiel bei Sicherheitsabfragen bei Anmeldeformularen verwendet werden sind mit dieser Methode nicht zu knacken. Da diese Bilder ja absichtlich dermaßen verfälscht werden um eben solche Analysen zu verhindern. Da hat ja schon manch ein Mensch, mit seiner ganzen Phantasie, schwierigkeiten noch was zu erkennen.
alle Nachrichten anzeigenGesamtübersicht  |  Zum Thema  |  Suchen

 ThemaViews  AutorDatum
ocr mit vb798marco_Köln28.09.07 15:20
Re: ocr mit vb678+++MaRuSo+++04.10.07 21:47
OT: ocr mit vb476TTSAddict08.10.07 05:49

Sie sind nicht angemeldet!
Um auf diesen Beitrag zu antworten oder neue Beiträge schreiben zu können, müssen Sie sich zunächst anmelden.

Einloggen  |  Neu registrieren

Funktionen:  Zum Thema  |  GesamtübersichtSuchen 

nach obenzurück
 
   

Copyright ©2000-2025 vb@rchiv Dieter Otter
Alle Rechte vorbehalten.
Microsoft, Windows und Visual Basic sind entweder eingetragene Marken oder Marken der Microsoft Corporation in den USA und/oder anderen Ländern. Weitere auf dieser Homepage aufgeführten Produkt- und Firmennamen können geschützte Marken ihrer jeweiligen Inhaber sein.

Diese Seiten wurden optimiert für eine Bildschirmauflösung von mind. 1280x1024 Pixel