Statistikbasierter Lösungsansatz für die Fehlerkorrektur in OCR-Systemen: Auf Grundlage der n-Gramm Häufigkeitstabellen von Wolfgang Schönpflug PDF (Adobe DRM) download by Bilal Erkin

Statistikbasierter Lösungsansatz für die Fehlerkorrektur in OCR-Systemen: Auf Grundlage der n-Gramm Häufigkeitstabellen von Wolfgang Schönpflug

GRIN Verlag
Publication date: January 2010
ISBN: 9783640731299
Digital Book format: PDF (Adobe DRM)

Buy PDF

List price:
$17.99
Our price:
$15.99

You save: $2.00 (11%)
GET THIS EBOOK
FOR FREE!
Join our Facebook sweepstake, share and
get 10 likes. Winners
get notified in 24H!
Die vorliegende Verschriftlichung ist eine Hauptseminararbeit für die Lehrveranstaltung 'Angewandte linguistische Datenverarbeitung' und beschäftigt sich mit den Erkennungsfehlern, die während einer Texterkennung (OCR) entstehen können. Solche Fehler können die Unterschlagung einiger Buchstaben innerhalb eines Wortes, die falsche Reihenfolge der Zeichen in einer Zeichenkette oder solche sein, die den Sinn des Satzes durch Fehlinformationen entstellen. In der Texterkennungstechnik werden heutzutage mehrere Methoden und Verfahren angewendet, um diesen Problemen entgegenzuwirken, die sich in ihrer Effizienz, Schnelligkeit, Korrektheit und Bedienerfreundlichkeit stark unterscheiden. Diese Arbeit wird sich deshalb nur auf den statistikbasierten Lösungsansatz wenden, dessen Grundlage die aufgestellten Mono-, Di-, Tri- und n-Gramm Tabellen von Wolfgang Schönpflug bilden. Es wird erst auf die typischen OCR-Fehler und ihre Ursachen eingegangen, um danach die Häufigkeitstabellen von Wolfgang Schönpflug auf ihren Aufbau hin zu analysieren. In Kapitel 2 geht es um den Lösungsansatz mit den Häufigkeitstabellen, ihre Implementierung, Form der Darstellung und Vorgehensweise. Die Diskussion über eine Internationalisierung des Verfahrens und die mögliche Erweiterbarkeit schließt die Arbeit ab.
Zur Lektüre werden zur leichten Verständlichkeit Grundkenntnisse in der Programmiersprache Java und ihren Funktionen vorausgesetzt. Die Überlegungen für bestimmte Lösungsrealisierungen nehmen Bezug auf einige Java-spezifische Datenstrukturen und in Java bekannten Algorithmen.
Please sign in to review this product.
Format:
Devices:
Statistikbasierter Lösungsansatz für die Fehlerkorrektur in OCR-Systemen: Auf Grundlage der n-Gramm Häufigkeitstabellen von Wolfgang Schönpflug PDF (Adobe DRM) can be read on any device that can open PDF (Adobe DRM) files.

File Size:
258 Kb
Language:
GER
Copy From Text:
Disabled.
Printing:
Disabled.