OCR-Algorithmus

Hi,

hat jemand zufällig einen Basis-Algorithmus zur Texterkennung parat? Oder auch Tutorials, Papers, eigene Ideen, Vorgehensweisen, Tipps etc.

Wäre super! Danke!

Maxi

gibts da nich ganz ganz ganz viel unter google?
naja, drucktext geht ganz gut, zahlen auch:

zeilen erkennen, einzelnen buchstaben erkennen, auf ein raster legen und ein neuronales netz drüber jagen gibt ganz gute ergebnisse... einfaches perzeptron oder da gibts noch son anderes, welches die buchstaben auch sklaierungs und positionsinvariant erkennen kann, weiß grad nich wie das heißt.

aber google weiß mehr als wir hier alle zusammen

Korbinian

wavelets (oder auch einfache binaerisierung) mit anschliessender pca (oder besser lda) verwenden. dann das fenster entsprechend ueber das bild schieben. eine grosse trainingsmenge sollte von vorteil sein. evtl das bild noch rotieren, damit die buchstaben gerade stehen (houghtransformation um die schraeglage rauszufinden [vorausgesetzt es gibt linien] und dann rotieren (bilineare interpolation)).
willst du nicht nur characters sondern woerter, empfehlen sich vielleicht hmms oder sowas in der richtung. braucht aber auch grosse trainingsmenge und ist nicht so schnell imlementiert.

XFame

Entschuldigung, aber was genau hat das in diesem Forum verloren :D?

Wüsste jetzt nicht, wozu/wie ich die genannten Verfahren anwenden müsste bzw. was sie überhaupt bewirken...

Korbinian

...dann solltest du entweder exzessiv google und wiki benutzen, oder ocr bleiben lassen. musterkennung hat viel mit mathe und wahrscheinlichkeitsrechnung zu tun, wenn dir diese verfahren nicht gelaeufig sind und du auf den gebieten nicht wirklich ahnung hast (ingenieursmathe oder hoeher solltest du schon gehoert haben) wirds schwierig.

wenn du einfach mal nur bisschen rumprogrammieren wolltest, gibts vielleicht trotzdem nen weg: google mal nach weka, das ist ein framework, welches viele klassifikatoren und anderes (regressionen, pca, ...) bietet. damit kommst du vielleicht schnell ans ziel.

Jester

Naja, es gibt auch einfachere Verfahren. Für viele Fälle ist ein sogenanntes matched Filter ausreichend. Man definiert sich für jedes Zeichen eine (oder auch mehrere) Schablone und schiebt die über das Bild und merkt sich an jeder Stelle wie gut sie paßt (Stichwort: kreuzkorrelation). Die mit dem besten Wert nimmt man, sofern sie einen gewissen Mindestgüte hat. Das Verfahren ist bei weißem Rauschen als Hintergrund optimal im Sinne der SNR. Für Scans und sowas sollte das eigentlich ganz annehmbar sein.