Het mooie bij awk is dat die een bestand zowel regel voor regel als ook verder woord voor woord "leest"
en kan bewerken.
De grondgedachte is dat telkens één regel gelezen wordt.
(dat is het principe, een bestand die niet uit regels bestaat komt dus niet in aanmerking)
Elke regel wordt automatisch opgesplitst in zijn woorden. ($1 bevat het eerste, $2 het twede enz.)
(mits dat niet zou passen kun je ook een ander teken dan de spatie als afscheidingsteken definiëren !)
En verder kun je van alles ermee doen, incusief andere programma's oproepen.
In jouw geval dus misschien:
1.) Pak alleen de regel waarin zinvolle letters zitten (de anderen sla over)
2.) Zoek precies dat "woord" dat qua vorm een kenteken kan zijn.
3.) Formatteer de boel netjes en print hem.
(op die manier kun je zo'n awk-script ook best in een pipeline inzetten !)
track
p.s.: om een voorbeeld te kunnen geven, kun je misschien het ruwe resultaat van jouw herkenner in de Extra opties.. Bijlage: zetten ?