Nieuws:

Welkom, Gast. Alsjeblieft inloggen of registreren.
Heb je de activerings-mail niet ontvangen?

Auteur Topic: Goede OCR voor Linux ? Eventueel nieuwe scanner met OEM software onder Wine ?  (gelezen 2073 keer)

Offline aartje

  • Lid
Ik gebruik al jaren (12?) een HP type 5p scanner (SCSI). Het scannen
deed ik onder Win98SE met de bijgeleverde software (HP Paperport,
Omnipage OCR). Dat ging prima. Je kon de gescande documenten
laten vertalen naar doc (windows)-formaat. De karakter herkenning
was heel behoorlijk.
Ondertussen heb ik een computer waar Win98SE niet meer op draait.
Ik gebruik nu Ubuntu (al jaren ) en heb geprobeerd de oude paperport
en omnipage onder wine te installeren. Dat werkt niet.
Ik heb verder tesseract ge-installeerd, dat werkt redelijk, maar je document
moet wel met gimp aangepast worden om een redelijke karakter-
herkenning te krijgen. Met het programma gimagereader (een grafisch
frontend van tesseract) gaat het weer wat gemakkelijker.

Verder heb ik de trial versie van Abbyy op Linux geprobeerd. Ik moet
zeggen dat de karakter herkenning uitstekend is! Je kan (volgens mij)
alleen maar naar ongestructureerde tekst exporteren.
Verder is de trial-versie maar 100 pagina's en is de prijs voor een
privé-persoon te hoog (149 euro ex.btw). Ik hoef geen 12000 pagina's
per jaar te converteren. Ik heb gezien dat er ook nog een
Scanto office van Abbyy bestaat onder Windows voor een lagere
prijs, maar ik betwijfel of dat onder Linux aan de praat te krijgen is.

Wat ook nog een mogelijkheid is, is om eens een nieuwe scanner
te kopen (heb ik ook mijn SCSI-kaart niet meer nodig) en
dan de meegeleverde software onder Wine te gebruiken.

Mijn vragen zijn daarom:
1) Bestaat er goede OCR -software die ook onder Linux
   te gebruiken is (desnoods onder Wine). Hoeft niet gratis
    te zijn (30 á 40 euro vind ik redelijk als ik niet meer dan
    gemiddeld 1 keer per dag een pagina wil scannen en naar
    office-formaat wil converteren.)?
2) Zou er een (recente) scanner aangeraden kunnen worden
    waarbij software meegeleverd wordt die ook onder Linux
    werkt (desnoods onder Wine)?


In deze video wordt uitgelegd hoe je met Gscan2PDF OCR kunt gebruiken: http://www.youtube.com/watch?v=UjjogfWfWsQ


[Mod edit: URL doorklikbaar gezet (spatie toegevoegd)  ;)]
« Laatst bewerkt op: 2011/07/06, 11:44:38 door asphyxia »

Offline aartje

  • Lid
In deze video wordt uitgelegd hoe je met Gscan2PDF OCR kunt gebruiken: http://www.youtube.com/watch?v=UjjogfWfWsQ
IK heb hem geprobeerd. Dit produceert ook (net als gimagereader) een tekst zonder structuur,
dus geen doc- of rtf-formaat oid.

Ik gebruik OCR-feeder. Je kan hem laten scannen met tesseract-nl (zie ask ubuntu waar dat uitgelegd wordt).