Nieuws:

Welkom, Gast. Alsjeblieft inloggen of registreren.
Heb je de activerings-mail niet ontvangen?

Auteur Topic: OCRfeeder start niet  (gelezen 624 keer)

OCRfeeder start niet
« Gepost op: 2017/10/19, 16:29:48 »
Ik wil een aantal documenten in PDF en A4 ombouwen naar ander lettertype en schermformaat.
OCRfeeder heb ik eerder gebruikt maar wil met de huidige Ubuntu 16.04 wel installeren maar niet starten.
Wat is hier de oplossing voor?
Ubuntu 20.04 LTS op Fujitsu S762, MSI desktop, HP840; allen hebben geen data maar draaien op dezelfde DropBox; verder met Firefox, LibreOffice, Wine en Gmail

Re: OCRfeeder start niet
« Reactie #1 Gepost op: 2017/10/19, 16:42:48 »
Wel kan ik in de Terminal OCRfeeder aan de praat krijgen, maar dat geeft een lang onbegrijpelijk verhaal van wat er allemaal fout is...
Ubuntu 20.04 LTS op Fujitsu S762, MSI desktop, HP840; allen hebben geen data maar draaien op dezelfde DropBox; verder met Firefox, LibreOffice, Wine en Gmail

Offline ajjp

  • Lid
Re: OCRfeeder start niet
« Reactie #2 Gepost op: 2017/10/19, 21:28:07 »
Zijn alle ¨is afhankelijk van:" pakketten wel geïnstalleerd?

Re: OCRfeeder start niet
« Reactie #3 Gepost op: 2017/10/19, 21:38:45 »
OCRfeeder is geïnstalleerd
1) met Ubuntu Software
2) met Synaptic
met beiden geen succes...
Ubuntu 20.04 LTS op Fujitsu S762, MSI desktop, HP840; allen hebben geen data maar draaien op dezelfde DropBox; verder met Firefox, LibreOffice, Wine en Gmail

Offline aartje

  • Lid
Re: OCRfeeder start niet
« Reactie #4 Gepost op: 2017/10/20, 08:12:38 »
Ik raad je aan om gimagereader te installeren. Dat is , naar mijn mening, het
enige vrije OCR programma dat nog redelijk werkt. Het is gebaseerd op tesseract
, een door HP vrijgegeven OCR-engine.

Verder halen dat soort programma's het niet bij commerciële als Abby en Omnipage
en blijft dat behelpen. Ik heb via marktplaats een commerciële oudere  (legale!)versie gekocht van
Omnipage die ik onder Windows7 onder Virtualbox heb draaien. Zelfs de scanner kan
ik dan gebruiken. Omnipage is top !

Re: OCRfeeder start niet
« Reactie #5 Gepost op: 2017/10/20, 14:04:37 »
Verder OCRfeeder getest via Terminal.
Gelezen, dat ik OCRfeeder ook kan gebruiken als commandline interpreter. Dus:
Als ik invoer "OCRfeeder gui" dan krijg ik inderdaad het startscherm van OCRfeeder te zien; plus nog wat commentaar waar ik niks van begrijp. Wel maak ik er uit op, dat allerlei "afhankelijkheden" niet worden meegeladen tijdens de installatie.
Ik moet allerlei dingen "importeren uit gi"... hoe doe je dat dan?
Ubuntu 20.04 LTS op Fujitsu S762, MSI desktop, HP840; allen hebben geen data maar draaien op dezelfde DropBox; verder met Firefox, LibreOffice, Wine en Gmail

Offline ajjp

  • Lid
Re: OCRfeeder start niet
« Reactie #6 Gepost op: 2017/10/20, 15:16:44 »
Citaat
Ik moet allerlei dingen "importeren uit gi"... hoe doe je dat dan?
Je bedoelt de gir1.2-nnn pakketten?
Als je in Synaptic ocrfeeder selecteert, en de tab Afhankelijkheden kiest, krijg je een rijtje pakketten in beeld. Bij mij (Xubuntu 16.04): acht python pakketten, drie gir1.2 pakketten en nog iso-codes, ghostscript en een tesseract-ocr pakket. Als ze bij jou niet automatisch meegeïnstalleerd worden, dan zul je ze via Synaptic stuk voor stuk moeten installeren.

Re: OCRfeeder start niet
« Reactie #7 Gepost op: 2017/10/20, 17:30:00 »
Dat heb ik ook gevonden die 16 stuks afhankelijkheden. Bij de geïnstalleerde pakketten wordt (alles?) in detail opgesomd, maar ik zie alleen python 2.7 ;  de rest moet nog uitzoeken. Maar ik ga proberen die afhankelijkheden bij te laden.
Bedankt!
 
Ubuntu 20.04 LTS op Fujitsu S762, MSI desktop, HP840; allen hebben geen data maar draaien op dezelfde DropBox; verder met Firefox, LibreOffice, Wine en Gmail

Re: OCRfeeder start niet
« Reactie #8 Gepost op: 2017/10/20, 19:01:07 »
Dat heb ik ook gevonden die 16 stuks afhankelijkheden. Bij de geïnstalleerde pakketten wordt (alles?) in detail opgesomd, maar ik zie alleen python 2.7 ;  de rest moet ik nog uitzoeken. Maar ik ga proberen die afhankelijkheden bij te laden.
Bedankt!
Ubuntu 20.04 LTS op Fujitsu S762, MSI desktop, HP840; allen hebben geen data maar draaien op dezelfde DropBox; verder met Firefox, LibreOffice, Wine en Gmail

Re: OCRfeeder start niet
« Reactie #9 Gepost op: 2017/10/20, 19:18:30 »
Alle afhankelijkheden opgezocht en de ontbrekende bijgeladen.
Geen resultaat...
Er is nog een vreemd iets gaande: ik kan onder 16.04 ook geen database starten. Elk programma dat ik probeer,  staat een tijdje te starten en stopt dan weer.
En onder Ubuntu 14.04 werkte alles prima...
 
Ubuntu 20.04 LTS op Fujitsu S762, MSI desktop, HP840; allen hebben geen data maar draaien op dezelfde DropBox; verder met Firefox, LibreOffice, Wine en Gmail

Offline rico70

  • Lid
Re: OCRfeeder start niet
« Reactie #10 Gepost op: 2017/10/20, 19:34:07 »
In Linux Mint 18.2 MATE en Ubuntu MATE 17.10 werkt het ook niet vanuit het menu

Re: OCRfeeder start niet
« Reactie #11 Gepost op: 2017/10/20, 19:37:51 »
En dit werkt !!

$ ocrfeeder-cli -i input1.jpg input2.jpg -f html -o output.htm

gevonden in

https://forum.ubuntu-nl.org/index.php?action=post;topic=103070.0;last_msg=1010132

voor mijn probleem getest met

$ ocrfeeder-cli -i invoer.jpg -f jpeg -o uitvoer.txt

met de ontbrekende gui is het makkelijker! Maar voorlopig kan ik vooruit.

Ubuntu 20.04 LTS op Fujitsu S762, MSI desktop, HP840; allen hebben geen data maar draaien op dezelfde DropBox; verder met Firefox, LibreOffice, Wine en Gmail

Re: OCRfeeder start niet
« Reactie #12 Gepost op: 2017/10/20, 21:00:24 »
Foutje:
$ ocrfeeder-cli -i invoer.jpg -f jpeg -o uitvoer.txt
moet zijn
$ ocrfeeder-cli -i invoer.jpg -f TXT -o uitvoer.txt

we komen er wel... de TXT moet in hoofdletters...
Ik moet er nog 60 converteren...
Ubuntu 20.04 LTS op Fujitsu S762, MSI desktop, HP840; allen hebben geen data maar draaien op dezelfde DropBox; verder met Firefox, LibreOffice, Wine en Gmail

Re: OCRfeeder start niet
« Reactie #13 Gepost op: 2017/10/21, 07:59:20 »
Twaalf brokken tekst & plaatje in JPG omgezet naar TXT.
Fouten circa 4 op de 2000 tekens dat is ongeveer 2 promille en een mooi resultaat!
De fouten zijn meestal
ook = 00k (o wordt nul)
iedereen = ledereen (i wordt L)
en dat soort kleinigheden door kopiefout van origineel > papier > scan > JPG omdat de originelen naar het drukken waren verwijderd.
Ik vind dit prima! Er moet toch gecollationeerd worden en vergt weinig correctie.

Dit neemt niet weg, dat het wegvallen van de gui van OCRfeeder opgelost moet worden! Het omzetten van elke opdracht in een BASH regel en testen vreet tijd!
Ubuntu 20.04 LTS op Fujitsu S762, MSI desktop, HP840; allen hebben geen data maar draaien op dezelfde DropBox; verder met Firefox, LibreOffice, Wine en Gmail

Offline peer

  • Lid
Re: OCRfeeder start niet
« Reactie #14 Gepost op: 2017/10/21, 08:01:31 »
kun je geen wildcard (*) gebruiken??

Re: OCRfeeder start niet
« Reactie #15 Gepost op: 2017/10/21, 08:06:17 »
@peer
Dat lost de fout van OCRfeeder niet op...
Ubuntu 20.04 LTS op Fujitsu S762, MSI desktop, HP840; allen hebben geen data maar draaien op dezelfde DropBox; verder met Firefox, LibreOffice, Wine en Gmail

Re: OCRfeeder start niet
« Reactie #16 Gepost op: 2018/05/18, 11:06:26 »
Opnieuw de OCRFeeder willen gebruiken: hij start nog steeds niet automatisch op! Platform Ubuntu 16.04 op 32bits
Moet ik dat via een ander kanaal nog ergens melden?
Ubuntu 20.04 LTS op Fujitsu S762, MSI desktop, HP840; allen hebben geen data maar draaien op dezelfde DropBox; verder met Firefox, LibreOffice, Wine en Gmail

Re: OCRfeeder start niet
« Reactie #17 Gepost op: 2018/05/18, 11:12:32 »
Via de Terminal:
dick@dick-A68I-350-DELUXE-R2-0:~/Documenten$ ocrfeeder-cli -i Pilates-Brooke-Siler-inhoud.jpg -f TXT -o uitvoer.txt

/usr/lib/python2.7/dist-packages/ocrfeeder/util/lib.py:26: PyGIWarning: Gtk was imported without specifying a version first. Use gi.require_version('Gtk', '3.0') before import to ensure that the right version gets loaded.
  from gi.repository import Gtk

Waar slaat dat allemaal op??
Ubuntu 20.04 LTS op Fujitsu S762, MSI desktop, HP840; allen hebben geen data maar draaien op dezelfde DropBox; verder met Firefox, LibreOffice, Wine en Gmail