Hallo Erik,
Nog bedankt voor je hulp. Het volgende deel van je script liet zien dat het ook bij mij werkt op txt bestanden (En uiteraard staan alle bestanden in dezelfde map
)
#!/bin/bash
folder=""
for f in *.txt #alle txt bestanden in die map
do
founddate=$(grep -o "[0-9]\{1,2\}-[0-9]\{1,2\}-[0-9]\{2,\}" $f)
echo "Gevonden datum is: "$founddate
done
Het werkt echter niet bij tekst doorzoekbare pdf bestanden. Mogelijk dat je de tekstlaag apart moet benaderen en niet het complete pdf bestand. Maar ik weet nu in ieder geval dat die datum er in principe moet zijn uit te halen. Daar ben ik al erg blij mee.
Desnoods laat ik tijdens het OCR proces de tekst ook in een apart tijdelijk TXT bestand plaatsen, waar ik dan de datum uit kan halen om in de PDF bestandsnaam op te nemen, waarna het TXT bestand weer kan worden verwijderd
Inderdaad leuk met die scriptjes bezig te zijn, maar het is lang geleden dat ik zoiets deed. Ben in een heel grijs verleden ooit Pascal programmeur geweest, maar ik merk nu dat dat behoorlijk ver is weggezakt.
Groet, Jan