Webanalyse: Die Suche nach toten Links

Das Tool list-urls

list-urls ist ein einfaches Python-Programm, das alle URLs einer Seite abfragt und diese dann auf den Bildschirm ausgibt. Allerdings ist es nicht in der Lage, Frames zu behandeln. Dennoch fristet dieses Helferlein durchaus ein berechtigtes Dasein. Es lässt sich ausgezeichnet in Scripts einbauen. Nehmen wir an, Sie möchten eine Nachricht erhalten, sobald sich auf einer bestimmten Seite ein Link ändert. Das ist mit ein bisschen Shell-Programmierung einfach zu erledigen. Fragen Sie eine Seite ab und lassen Sie diese in eine Datei schreiben.

./list-urls.py http://192.168.71.130 > url1.txt

Danach ändern Sie die zu testende Seite und führen dasselbe Procedere noch einmal durch, nur dass Sie die Datei anders benennen.

./list-urls.py http://192.168.71.130 > url2.txt

Ein weiteres Bordmittel von Linux hilft, den Unterschied der beiden Dateien herauszufinden.

diff url1.txt url2.txt

Ist keine Veränderung zu sehen, löscht zum Beispiel ein Script in einer if-Schleife die Datei url1.txt und benennt url2.txt in url1.txt um. Variieren die Dateien, können Sie sich zum Beispiel durch eine E-Mail informieren lassen, durch einen Automatismus einen Mirror anpassen und so weiter.