Nieuws:

Welkom, Gast. Alsjeblieft inloggen of registreren.
Heb je de activerings-mail niet ontvangen?

Auteur Topic: omzetten .pdf naar bewerkbaar tekstbestand  (gelezen 13666 keer)

omzetten .pdf naar bewerkbaar tekstbestand
« Gepost op: 2008/09/28, 15:13:26 »
dag allemaal,

ik heb een hp printer 6300 officejet die kan scannen.
alleen lukt het niet er een bewerkbaar tekstbestand uit te krijgen met xsane of kooka.
wel lukt het om een .pdf bestand te genereren.

maar dan....met welk programma krijg ik dat pdf-betabd weer naar een .doc-bestand dat ik kan bewerken.

al iets geprobeerd met konqueror en gnome maar het lukt niet
graag even een stap voor stap-hulp

hans

Offline ptb

  • Lid
omzetten .pdf naar bewerkbaar tekstbestand
« Reactie #1 Gepost op: 2008/09/28, 15:24:54 »
Als je tekst scant zal een ocr programma het plaatje weer moeten vertalen in een bewerkbaar tekstbestand.Heb er geen ervaring mee maar zoek in synaptic eens op ocr.verder kan ik je er niet mee helpen vrees ik

omzetten .pdf naar bewerkbaar tekstbestand
« Reactie #2 Gepost op: 2008/09/28, 15:47:42 »
dank je,
ik heb al gekeken naar ocr, maar ik krijg dat niet aan de praat
hans

omzetten .pdf naar bewerkbaar tekstbestand
« Reactie #3 Gepost op: 2008/09/28, 15:50:16 »
Heb je ook niks in het forum kunnen vinden? Het lijkt me sterk dat je de eerste bent die OCR wil gebruiken met Ubuntu.

Offline siegi

  • Lid
omzetten .pdf naar bewerkbaar tekstbestand
« Reactie #4 Gepost op: 2008/09/28, 16:02:02 »

omzetten .pdf naar bewerkbaar tekstbestand
« Reactie #5 Gepost op: 2008/09/28, 16:18:04 »
ank j heb dat al doorgelezen.
het belangrijkste probleem is dat er g\ik de knop in konqueror on\m e.e.a. naar tekst om te zetten niet kan vinden.
zal echter het verhaal van jou siegi nog eens intensief doorlzen

overigens dank voor de bijf\drage allemaal, hans

omzetten .pdf naar bewerkbaar tekstbestand
« Reactie #6 Gepost op: 2008/09/28, 16:21:11 »
Met een origineel .pdf bestand (b.v. een handleiding) kuj je de tekst en plaatjes selecteren en in een Open Office document plakken en dan bewerken. Heb je dat geprobeerd met het gescande en omgezette bestand? Heb het zelf nooit zo geprobeerd, kun je dat eens testen?
Wie de gemakkelijkste weg niet zoekt is een luiaard. :)
Linux User #228066

omzetten .pdf naar bewerkbaar tekstbestand
« Reactie #7 Gepost op: 2008/09/28, 16:23:47 »
nog even , ik heb het geprobeerd met kooka en gescan2pdf en xsane.

allen producren een pdf -file, het makkelijks gescan2pdf.
de software genoemd in het artikel siegi tesseract en ocrad kan ik niet vinden inde repos.

dit even als toetje op mijn vorige reactie.

hans

Offline Ivan1986

  • Lid
omzetten .pdf naar bewerkbaar tekstbestand
« Reactie #8 Gepost op: 2008/09/28, 16:25:59 »
Logischer wijze gaat dit niet werken.....

even duidelijk maken:

ee, pdf is en soort van gecomprimeerde map waar alle figuren en lettertypes ingestoken worden. dan krijgen deze coördinaten net zoals alle tekstvelden coördinaten krijgen (elke alinia is een, dacht ik)

als je nu het document dat je scant omzet naar een pdf dan ga je enkel een bald met 1 tekening hebben die je nog steeds niet kan bewerken.....

je meot echt iets hebben dat de letters kan detecteren in je document..... ik heb eens gegoogeld maar vond nog niks....



Citaat van: prikkebeen2
Met een origineel .pdf bestand (b.v. een handleiding) kuj je de tekst en plaatjes selecteren en in een Open Office document plakken en dan bewerken. Heb je dat geprobeerd met het gescande en omgezette bestand? Heb het zelf nooit zo geprobeerd, kun je dat eens testen?

omzetten .pdf naar bewerkbaar tekstbestand
« Reactie #9 Gepost op: 2008/09/28, 16:31:07 »
Oke, ik snap nu dus dat dit met omgezette scans niet werkt. Ik had wel een vermoeden maar nog nooit geprobeerd dus.
Maar ja, als je mijn sig ziet begrijp je het wel denk ik:)
Wie de gemakkelijkste weg niet zoekt is een luiaard. :)
Linux User #228066

omzetten .pdf naar bewerkbaar tekstbestand
« Reactie #10 Gepost op: 2008/09/28, 16:45:44 »
dank weer, overigens ben ik ok al met open office aan de gang geweest omdat je daar wel bestanden als .pdf kunt wegschrijven
gek is dat je het denkelijk niet andersom kunt doen
hans

omzetten .pdf naar bewerkbaar tekstbestand
« Reactie #11 Gepost op: 2008/09/28, 16:56:11 »
Citaat van: dutch1
dank weer, overigens ben ik ok al met open office aan de gang geweest omdat je daar wel bestanden als .pdf kunt wegschrijven
gek is dat je het denkelijk niet andersom kunt doen
hans
Als je een ODF/DOC/RTF/TXT etc. bestand opslaat als pdf dan wordt het een afbeelding en gaat de tekstinformatie verloren. Er staat dan niet meer in 'hier staat een letter k in 10 punts verdana'  maar in : "pixel 3 van boven en 200 van links is zwart". Dus je hebt als je van PDF (of gescande informatie vanuit je printer) weer naar  ODF/DOC/RTF/TXT wilt omzetten een programma nodig dat uitzoekt welke pixels welke letter moeten voorstellen, OCR dus.

Offline joop13

  • Lid
omzetten .pdf naar bewerkbaar tekstbestand
« Reactie #12 Gepost op: 2008/09/28, 17:11:08 »
Online kun je wel PDF's omzetten onder andere via deze link: http://www.zamzar.com/

Er staan ook nog andere mogelijkheden bij: http://www.pepermunt.net/software/hoe-kan-ik-een-pdf-maken.html
Door gebrek aan visie gaat het volk ten onder, een keur van raadgevers brengt het tot bloei.

Twee laptops 16.04 Ubuntu, 1 laptop Linux Mint,

omzetten .pdf naar bewerkbaar tekstbestand
« Reactie #13 Gepost op: 2008/09/28, 17:39:02 »
joop, dank voor de tip, heb een proeffile gesti\uurtd en wacht op het resultaat, zal de andere ook proberen.
kan nu spullen aan de mannen in marika en suatrlie (zoons) sturen

hans

Offline ptb

  • Lid
omzetten .pdf naar bewerkbaar tekstbestand
« Reactie #14 Gepost op: 2008/09/29, 14:02:52 »
In openoffice 3 (beta) kun je een pdfimportextensie (ook nog beta)installeren zie
http://extensions.services.openoffice.org/node/874
misschien heb je daar iets aan (in de toekomst)

omzetten .pdf naar bewerkbaar tekstbestand
« Reactie #15 Gepost op: 2008/09/29, 14:47:15 »
dag ptb,

dank voor de tip.
de linux-file is een .ox-file
hoe ga ik daarmee om, of hoe installeer ik deze file in open office?
hans

Offline ptb

  • Lid
omzetten .pdf naar bewerkbaar tekstbestand
« Reactie #16 Gepost op: 2008/09/29, 20:03:42 »
Het is nogal beta allemaal.Je hebt openoffice 3 beta2 nodig (downloaden van openoffice als deb file) van
http://download.openoffice.org/3.0beta/   .na installatie de extensie downloaden en installeren in de geinstalleerde openoffice via  extra>extensiebeheer. (oxt betekent volgens mij office extensie)

omzetten .pdf naar bewerkbaar tekstbestand
« Reactie #17 Gepost op: 2008/10/01, 09:57:23 »
Ook ik heb eens zitten experimenteren met een ingescand document. OCR lukt langs geen kanten. De enige mogelijke oplossing die ik vind is de Linux versie van abby finereader Je kan er een gratis testversie downloaden. Helaas kost een licentie 400 €. Bij Xsane kan ik ook omzetten naar een txt bestand, maar ik krijg de foutmelding dat ie gocr niet kan vinden. Een oplossing vind ik hier niet voor.

omzetten .pdf naar bewerkbaar tekstbestand
« Reactie #18 Gepost op: 2008/10/01, 17:40:33 »
Volgens deze pagina is tesseract-ocr één van de betere gratis ocr programma's onder Linux. Helaas blijkt het programma geen grafische interface te hebben waar ik als Windowsgebruiker zo verslaafd aan ben ...

Offline ptb

  • Lid
omzetten .pdf naar bewerkbaar tekstbestand
« Reactie #19 Gepost op: 2008/10/01, 19:40:47 »
http://code.google.com/p/tesseract-ocr/
Een gui zit wel in de planning blijkbaar
Tesseract heeft ook een nederlandse taalpakket of hoe je het ook noemt(staat ook in synaptics)

Offline WardB

  • Lid
omzetten .pdf naar bewerkbaar tekstbestand
« Reactie #20 Gepost op: 2008/10/02, 08:13:04 »
Via deze website doen ze je PDF bestand gratis converteren:

www.zamzar.com.  Upload je PDF, kies de gewenste extensie en voer je mailadres in.

Wacht een paar uur en je krijgt via de mail je document binnen.

Ik gebruik het regelmatig

Succes ermee!

omzetten .pdf naar bewerkbaar tekstbestand
« Reactie #21 Gepost op: 2008/10/02, 09:43:02 »
Citaat van: WardB
Via deze website doen ze je PDF bestand gratis converteren:

www.zamzar.com.  Upload je PDF, kies de gewenste extensie en voer je mailadres in.

Wacht een paar uur en je krijgt via de mail je document binnen.

Ik gebruik het regelmatig

Succes ermee!
Dan heb je een afbeelding in een *.doc document maar geen bewerkbare tekst ... Een aangemaakt pdf document kan je perfect de tekst uithalen met pdf-editor, maar het gaat hier om een scanresultaat. Ik zal een topic openen om meer uitleg te verkrijgen van Tesserac-ocr want ik slaag er niet in om het te gebruiken. Tja, windows verslaafd zeker? ... :P

Offline WardB

  • Lid
omzetten .pdf naar bewerkbaar tekstbestand
« Reactie #22 Gepost op: 2008/10/02, 09:59:30 »
De tekst zit in de tekstvakken verborgen. Als het één pagina is kost het niet veel moeite om dat als plaate tekst in een nieuw document te plakken.

Anyway, jammer dat het niet makkelijk is in dit geval.

omzetten .pdf naar bewerkbaar tekstbestand
« Reactie #23 Gepost op: 2008/10/05, 14:04:46 »
Wardb,

Allereerst heb ik dat zanzar-programma nu 1 keer gebruikt en dat was OK.

Interessante opmerking in je laatste post:
Als ik dus een .pdf bestand open, met ik alleen de letterbestanden copuleren en dan heb ik een mooie tekst of bestaan daar ook convergeer programmaś voor.
Hans