Nieuws:

Welkom, Gast. Alsjeblieft inloggen of registreren.
Heb je de activerings-mail niet ontvangen?

Auteur Topic: Dubbele harde returns verwijderen  (gelezen 3806 keer)

Offline woteb

  • Lid
  • Steunpunt: Nee
Dubbele harde returns verwijderen
« Gepost op: 2008/08/18, 12:13:30 »
Ik heb van iemand een grote tekst (> 66 blz) teruggekregen. Nu staat het gecorrigeerde document vol met dubbele harde returns (kunnen er wel duizend zijn):  Dus:

tetkst


tekst

Die dubbele harde returns wil ik eruit hebben, en liefst met een zoek/vervang functie zodat de tekst er zo uit komt te zien:

tekst

tekst

Ik heb verschillende programma's die dat eventueel kunnen: OpenOffice.org, Abiword, mousepad, kate en kwrite. Graag zou ik een van deze programma's met de zoek/vervang functie willen gebruiken om mijn rtf bestand van al deze dubbele harde returns te ontdoen, want met de hand is een monnikenwerk. Eventuel converteren van rtf naar txt is geen probleem.

Hoe dit allemaal is gekomen? Ik heb met OpenOffice.org dit document aangemaamkt en expres als rtf opgeslagen. Nu heb ik een idee dat OpenOffice.org en RTF niet helemaal goed met elkaar overweg kunnen.
Laptop, HP 550, Dual Core 1 GB RAM/2 Ghz:: Debian 5.0 Testing (Squeeze)  (lite-blokkendoos editie) Fluxbox / IceWM / XFCE4 / Openbox / LXDE.
3 Werkstations + 1 laptop: Debian 5.0 Testing (Squeeze)  (lite-blokkendoos editie Gnome/XFCE/IceWM)
Server: Debian 5.0 Stable (Lenny)

Offline AptlyNamed

  • Lid
  • Steunpunt: Nee
Dubbele harde returns verwijderen
« Reactie #1 Gepost op: 2008/08/18, 12:31:26 »
Het is in ieder geval op te lossen door een 'Regex Search & Replace' plugin voor Gedit te installeren (http://halfhourhacks.blogspot.com/2008/03/gedit-regular-expression-plugin.html). en dan in het als teksbestand geconverteerde bestand met een regular expression drie of meer 'newline' en een eventuele 'carriage return' karakter te vervangen door een enkele newline.

dus zoeken naar: (\n\r?){3,}
vervangen door: \1

'wrap around' uitvinken


Maar je zoekt een KDE oplossing, enkele van die programma's die je noemde zullen ook wel regular expressions ondersteunen. Ik zie dat OpenOffice writer ook een optie heeft bij 'zoeken en vervangen' maar het lukte mij niet om dubbele witregels te vervangen. Bij sommige programma's moet je in plaats van '\1' om naar het eerste deel tussen haakjes terug te verwijzen '$1' gebruiken.

Offline woteb

  • Lid
  • Steunpunt: Nee
Dubbele harde returns verwijderen
« Reactie #2 Gepost op: 2008/08/18, 15:08:42 »
Gelukt.... en heel hartelijk bedankt. Scheelt mij een paar uur monnikenwerk.... :)
Laptop, HP 550, Dual Core 1 GB RAM/2 Ghz:: Debian 5.0 Testing (Squeeze)  (lite-blokkendoos editie) Fluxbox / IceWM / XFCE4 / Openbox / LXDE.
3 Werkstations + 1 laptop: Debian 5.0 Testing (Squeeze)  (lite-blokkendoos editie Gnome/XFCE/IceWM)
Server: Debian 5.0 Stable (Lenny)

Offline woteb

  • Lid
  • Steunpunt: Nee
Dubbele harde returns verwijderen
« Reactie #3 Gepost op: 2008/08/18, 17:48:23 »
Trouwens, heeft iemand een oplossing voor OpenOffice.org om dergelijke dingen als tabs, returns e.d. te verwijderen?
Laptop, HP 550, Dual Core 1 GB RAM/2 Ghz:: Debian 5.0 Testing (Squeeze)  (lite-blokkendoos editie) Fluxbox / IceWM / XFCE4 / Openbox / LXDE.
3 Werkstations + 1 laptop: Debian 5.0 Testing (Squeeze)  (lite-blokkendoos editie Gnome/XFCE/IceWM)
Server: Debian 5.0 Stable (Lenny)

Offline Dorst

  • Lid
  • Steunpunt: Nee
Dubbele harde returns verwijderen
« Reactie #4 Gepost op: 2008/08/18, 21:39:12 »
Citaat van: woteb
Trouwens, heeft iemand een oplossing voor OpenOffice.org om dergelijke dingen als tabs, returns e.d. te verwijderen?
Interessante vraag! Ik denk dat doe ik even (is immers in MS Word een koud kunstje) maar in de zoek/vervang functie van OO kom ik hier inderdaad niets over tegen. Ben nu toch wel benieuwd of ik wat over het hoofd zie, of dat dit echt niet mogelijk is.

Offline Ronnie

  • Artworkteam
    • ronnie.vd.c
  • Steunpunt: Nee
Dubbele harde returns verwijderen
« Reactie #5 Gepost op: 2008/08/19, 00:33:37 »
Citaat van: woteb
Trouwens, heeft iemand een oplossing voor OpenOffice.org om dergelijke dingen als tabs, returns e.d. te verwijderen?
Zoek in de help (index) naar: reguliere expressies;lijst met

Daar vind je een hele lijst met reguliere expressies.

Als het shift-enters zijn, dan heb je geluk, dan kun je met
Zoeken: \n\n
Vervangen: \n

en daarna
Zoeken: \n\
Vervangen: \n

de 66 paginas vervangen door een enkele witregel. Deze zijn dan wel gewone enters en geen shift-enters
Ben je ook blij dat Ubuntu zo toegankelijk en gratis is, en wil je graag net als ik iets terugdoen, kijk dan eens rond bij mwanzo, dé poort naar het bijdragen aan Ubuntu en haar gemeenschap!

Documentatie Terminal

Offline Dorst

  • Lid
  • Steunpunt: Nee
Dubbele harde returns verwijderen
« Reactie #6 Gepost op: 2008/08/24, 21:29:48 »
Even geprobeerd, maar OO Writer vindt ook geen shift-enters. Maar goed, dat is nog tot daar aan toe. Het zal toch niet echt zo zijn dat in OO geen mogelijkheid zit om harde returns (regeleinde) automatisch te vervangen? Dat is dan wel een behoorlijk gemis.