Hm, interessant allemaal, maar ik ben er nog niet.
Ik heb dus een pak met tekst, overtypen zou mij nogal wat tijd gaan kosten en eigenlijk wil ik er gewoon een .doc of odt van maken zodat ik heb gemakkelijk kan verspreiden en anderen er iets aan kunnen toevoegen.
gscan2pdf doet het prima.
Ik heb bij het scannen OCR gescande pagina's aangevinkt.
Maar het lukt mij nog steeds niet goed om de tekst uit het bestand te halen.
Ik heb het opgeslagen als text, maar als ik dat bestand via Libre Office open, staan er wel letters alleen geen letters die vagelijk lijken op de oorspronkelijke gescande tekst. Het goede is wel dat ik nu een tekst heb die ik kan bewerken.
Sla ik het als pdf of als djvu dan kom ik ook niet verder.
De handleiding is nou ook niet bepaald duidelijk hierin.
Inmiddels ben ik weer wat verder. Bij het scannen kiezen voor ocr gescande pagina's dan kiezen voor tesseract en, helaas keuze uit 1 taal, Engels.
Ik krijg dan een herkenbare tekst maar nog met zoveel fouten dat het niet opschiet.
De zoektocht wordt voortgezet.