Nieuws:

Welkom, Gast. Alsjeblieft inloggen of registreren.
Heb je de activerings-mail niet ontvangen?

Auteur Topic: goede OCR software?  (gelezen 2919 keer)

Offline wolfke

  • Lid
goede OCR software?
« Gepost op: 2011/08/16, 20:07:13 »
ik vind alleen maar heel oude items hieroer.
Wat is een OCR-aanrader voor ubuntu 10.04. ?

Re: goede OCR software?
« Reactie #1 Gepost op: 2011/08/16, 23:48:48 »
Ik gebruik altijd XSane, maar welk programma je ook gebruikt, zelf wat dingen corrigeren hou je altijd. Althans dat is mijn ervaring, zowel in het verleden met Windows programma's als nu met Ubuntu, c.q. Linux programma's. Voor XSane moet je wel gocr installeren.
Er zijn nog wel meer programma's maar daar heb ik nooit mee gewerkt, dus wacht nog even de antwoorden af van andere forumleden. :)
« Laatst bewerkt op: 2011/08/16, 23:52:26 door Gijsbert »
In der Beschränkung zeigt sich der Meister.

Offline Bertel

  • Lid
Re: goede OCR software?
« Reactie #2 Gepost op: 2011/08/17, 01:35:38 »
Zie http://forum.ubuntu-nl.org/algemeen-42/goede-ocr-voor-linux-eventueel-nieuwe-scanner-met-oem-software-onder-wine/
Ingeval deze programma's niet naar verwachting werken, hierbij nog een 'eigen' ambachtelijke oplossing voor pure tekstherkenning (geen handschriftherkenning, foto's of bladindeling).  ;)

Installatie
1. Zoekterm in Ubuntu softwarecentrum : ocr
2. Kies: Command line OCR tool tesseract-ocr en installeer dat bestand
3. Kies daarna: tesseract-ocr language files for Dutch text en installeer ook dit
(OCR wordt geïnstalleerd in /user/share met daarin tessdata)

Gebruik
0. Scanner/printer aanzetten en te scannen document invoeren in apparaat.
1. Ga naar Toepassingen--> Grafisch--> Scannen (Simple Scan): kies in het menu Document--> Scannen--> Foto (dit geeft meteen het gewenste dpi.)
2. Druk op symbool Scannen, gebruik daarna desnoods Bijsnijden
3. (Bijgesneden) Document vanuit Scannen opslaan in  /home/gebruikersnaam als document.tif (met één f en niet comprimeren)

4. Het volgende commando ingeven in terminal of gebruik een adequate snelstarter:
~$ tesseract /home/gebruikersnaam document.tif output -l documenttaal
in mijn geval dus bv.:
bertel@bertels-desktop:~$ tesseract document.tif output -l nld
(-l nld is daarbij ter verhoging van de correctheid toegevoegd !!!)

5. Het nieuwe document is te vinden als /home/gebruikersnaam/output.txt
6. Voor maximale correctheid even de spellingchecker gebruiken.
7. Open output.txt met LibreOffice Writer en kies in Bestand voor Exporteren als PDF.

Snelstarter
Maak een snelstarter met:
• Naam: Tesseract ocr nl
• Opdracht: tesseract document.tif output -l nld
• Commentaar: Het gescande bestand als document.tif opgeslagen in de home-map wordt daar ook uitgevoerd als output.txt.
Zet die snelstarter neer in het toepassingen menu of op het bureaublad of op een dock.


Wat is vrije software?

Offline aartje

  • Lid
Re: goede OCR software?
« Reactie #3 Gepost op: 2011/08/17, 07:52:14 »
Als je er geld voor over hebt (zoiets van 148 Euro) dan zou je de
commerciële versie van ABBYY kunnen aanschaffen. Dat is veruit
de beste.

zie: http://www.ocr4linux.com

Daarna is gimagereader (gratis) in samenwerking met tesseracct
de beste volgens mij

zie: http://sourceforge.net/projects/gimagereader/


Offline wolfke

  • Lid
Re: goede OCR software?
« Reactie #4 Gepost op: 2011/08/17, 20:32:29 »
bedankt, ik weet weer wat doen.