Ok,
Bijna het gewenste resultaat.
Ik heb het script tot het volgende aangepast (aangezien hij de html tags op een of andere manier niet wou herkennen):
#!/bin/sh
fileName="nopic.txt"
htmlFile="nopic.html"
length=`wc -l $fileName`
## PROCESS THE FILE
awk 'BEGIN {
FS = "\t"; # Field seperator
RS = "\n"; # Record seperator
print "
Overview MoviesOverview made on
Number of Entries
";
}
{
# Open the row
print " ";
# Set the column type
# The first data row contains headers
if(NR == 1)
{
cellType = "th";
print "<" cellType " width=\"50\">" $37 "" cellType "><" cellType "width=\"40\"> Season " cellType "><" cellType " width=\"100\">" $44 "" cellType "><" cellType " width=\"75\">" $35 "" cellType "><" cellType " width=\"75\">" $31 "" cellType "><" cellType " width=\"75\">" $25 "" cellType "><" cellType " width=\"50\">" $42 "" cellType ">
";
}
else
{
cellType = "td";
print "<" cellType " width=\"50\">" $37 "" cellType "><" cellType " width=\"40\">" $39 "" cellType "><" cellType " width=\"100\">" $44 "" cellType "><" cellType " width=\"75\">" $35 "" cellType "><" cellType " width=\"75\">" $31 "" cellType "><" cellType " width=\"75\">" $25 "" cellType "><" cellType " width=\"50\">" $42 "" cellType ">";
}
}
END {
# Output the HTML footer
print "
\r\n\r\n";
}' $fileName >> $htmlFile
## OUTPUT INFORMATION TO TERMINAL
echo "The HTML table for \"$fileName\" has been written to \"$htmlFile\"."
echo $length
echo $length-1
Gevolg:
Hij verwerkt perfect alle nodige info van de records, alleen de headers staan nog niet correct. Hij voegt 'season' voor het begin van de tabel toe en bij gevolg staan alle (buiten de eerste) kolommen fout.
Kort overzicht van de output:
Overview made on
Number of Entries Season
Title Year Storage Medium Rating Location Webpage
24 (2001) 1-6 2001 Divx 5 out of 5
http://www.imdb.com/title/tt028533125th Hour (2002) 2002 Divx 4 out of 5
http://www.imdb.com/title/tt030790128 Days Later... (2002) 2002 Divx not yet rated Zie 10 Items Or Less
http://www.imdb.com/title/tt028904328 Weeks Later (2007) 2007 Divx not yet rated Zie 10 Items Or Less
http://www.imdb.com/title/tt0463854300 (2006) 2006 Divx 4 out of 5
http://www.imdb.com/title/tt0416449(voor het geval het niet duidelijk moest zijn aan de hand van de output, de kolom waarin de gegevens van season staan, draagt de titel year enz...)
Tevens nog uit te zoeken is hoe ik de datum en het aantal rijen moet integreren want dat geeft ook nog een probleempje.