Zugriffe kontrollieren |
|
Allgemeines |
|
Wenn Sie ein Projekt im WWW plaziert haben, werden Sie sicher auch interessiert sein zu erfahren, wie häufig darauf zugegriffen wird. Um richtig einschätzen zu können, wie gut Ihr Projekt ankommt und was Sie daran verbessern sollten, reichen allerdings reine Zugriffszahlen nicht aus. Um aussagekräftige Ergebnisse über die Abrufe Ihrer WWW-Seiten zu erhalten, sind Statistiken nötig, die Ihnen die Zugriffe nach bestimmten Kriterien aufschlüssen. So gibt es Statistiken, die auflisten, welche Dateien am häufigsten abgerufen wurden, zu welchen Tageszeiten die meisten Besucher zu verzeichnen sind, oder welche WWW-Browser am häufigsten verwendet werden.
Bei besseren Providern gehört es zum Service, daß Sie Zugriff auf Logdateien haben, die Ihren Speicherbereich betreffen. Die meisten Provider bieten auch CGI-Dienste an, mit deren Hilfe Sie die Besucherzahlen nach verschiedenen Kriterien als Statistik aufbereitet bekommen.
Wenn Sie Ihre Homepage bei Discount-Providern wie Compuserve, T-Online usw. haben, stehen Ihnen solche Dienste bislang nicht zur Verfügung. Um in solchen Fällen an genaue Zugriffsstatistiken zu kommen, können Sie einen öffentlichen CGI-Dienst in Anspruch nehmen. Dort bekommen Sie für eine geringe Jahresgebühr einen Zugriffszähler sowie ordentlich aufbereitete Statsitiken für Ihre Homepage, egal wie deren Adresse lautet. Ein Nachteil bei dieser Lösung ist allerdings, daß bei jedem Zugriff auf Ihre Homepage zusätzlich auf den fremden CGI-Dienst zugegriffen werden muß. In diesem Dokument finden Sie Verweise zu öffentlichen CGI-Diensten.
Grundlage aller Zugriffsstatistiken sind Logdateien. Jeder Server-Rechner im Internet führt solche Logdateien, in denen er alle Zugriffe protokolliert. Dazu gibt es ein allgemeines Modell, wie Einträge in einer Logdatei auszusehen haben. Ein Eintrag nach diesem Modell hat folgendes Aussehen:
ad25-175.compuserve.com - - [02/Mar/1997:05:03:49 -0500] "GET /selfhtml/tg.htm HTTP/1.0" 200 1788 |
Jede Zeile in der Logdatei dokumentiert einen Zugriff auf eine Datei. Am Beginn steht, wer zugegriffen hat. Bei den meisten Zugangsprovidern erhalten die Anwender beim Einwählen ins Internet eine dynamische Session-Nummer, unter der sie dann in den Logdateien der Server auftauchen, die sie besucht haben. Im obigen Beispieleintrag ist erkennbar, daß sich der Anwender über CompuServe ins Internet eingewählt hat. Die Angabe ad25-175 ist eine dynamische Session-Nummer.
Anstelle der beiden Bindestriche im obigen Beispiel können von Fall zu Fall noch Daten stehen. Anstelle des ersten Bindestriches kann der Anwender-Logname stehen (entsprechend der Spezifikation rfc931). Anstelle des zweiten Bindestriches kann ein Anwendername stehen, den der Anwender sich selbst gegeben hat.
Als nächstes zeigt der Eintrag, wann genau der Zugriff erfolgte. Im Beispiel war das am 2. März 1997 um 5.03 Uhr (und 49 Sekunden) morgens, und zwar minus 5 Stunden gerechnet gegenüber GMT (Greenwich Meridian Time) aus Sicht der Systemzeit des Server-Rechners.
Dahinter folgt ein Kurzprotokoll des HTTP-Headerbefehls, mit dem der WWW-Browser des Anwenders die Datei angefordert hat. GET ist dabei die übliche Methode. Dahinter wird die Datei angegeben, auf die der Zugriff erfolgte. Im Beispiel ist das die Datei http://www.netzwelt.com/selfhtml/tg.htm. Da es sich um einen Eintrag aus der Logdatei von www.netzwelt.com handelt, wird nur der Pfadname relativ zu der Domain-Adresse angezeigt. Schließlich zeigt die HTTP-Anforderung noch die verwendete HTTP-Protokollversion an. Das war zur Auswertungszeit die Version 1.0.
Dahinter folgt eine Codenummer, die darüber Aufschluß gibt, ob die Anforderung erfolgreich war, und wenn nicht, welches der Fehler war. Dabei sind folgende Nummern wichtig:
200 = Die Anforderung war erfolgreich
4xx, 5xx = Es traten Fehler auf. Zum Beispiel war die angeforderte Datei nicht vorhanden.
Die letzte Zahl in der Zeile schließlich gibt an, wieviele Bytes von der Datei an den aufrufenden WWW-Browser übertragen wurden. Wenn Sie die Bytezahl mit der tatsächlichen Dateigröße vergleichen, können Sie feststellen, ob die Datei vollständig übertragen wurde, oder ob die Übertragung vorzeitig abgebrochen wurde. So kommt es zum Beispiel oft vor, daß Grafiken nicht vollständig übertragen werden, weil der Anwender bereits vorher auf einen Verweis zu einer anderen Seite klickt.
Neben den reinen Zugriffs-Logdateien führen die meisten Server-Rechner auch Herkunfts-Logdateien. Darin wird festgehalten, von welcher anderen Datei aus ein Zugriff auf eine Datei erfolgte. Solche Herkunfts-Logdateien können interessante Aufschlüsse darüber geben, wo offensichtlich Verweise auf Ihr Projekt existieren und wie viele Besucher von dort kamen. Bei den meisten Providern erhalten Sie auch auf solche Logdateien Zugriff. Wenn nicht, fragen Sie ruhig danach.
Logdateien sind normalerweise sehr groß und etwa so spannend wie ein Telefonbuch. Um eine aussagekräftige Übersicht über die Zugriffe auf Ihre Seiten zu erhalten, sollte Ihr Provider Statistiken anbieten. Die Statistiken stehen Ihnen meistens als dynamisch generierte HTML-Dateien zur Verfügung, die ein CGI-Programm durch Auslesen der Logdatei erzeugt.
Statistiken stellen Ihnen die Zugriffe nach einem bestimmten Kriterium sortiert dar. Folgende Kriterien sind typisch:
Solche Statistiken sind meistens als gut lesbare Listen aufbereitet. Manche Provider bieten auch grafische Aufbereitungen von Statistiken an.
Die folgende Checkliste soll Ihnen helfen, Statistiken zu interpretieren und Schlüsse daraus zu ziehen:
weiter: | Adressenwechsel von WWW-Projekten |
zurück: | WWW-Projekte bekannt machen |