Wir lassen unsere Server durch zwei Systeme überwachen. Einmal ein System (nagios), was hier im Büro steht und einmal durch einen externen Dienstleister, Serverguard24. Serverguard24 bietet übrigens einen super Service, auch für Provider.
Mich hat es gewurmt, dass bei Serverguard24 nur die durchschnittliche Antwortzeit der Server gemessen wurde. Dank meiner penetranten freundlichen Nachfragen gibt es jetzt dort auch die durchschnittlichen Antwortzeiten von verschiedenen Perzentilen. Ein guter Alternativservice, pingdom, kann das noch nicht.
Warum ist das eine wichtige Kennzahl?
Der Hintergrund ist ganz einfach: angenommen die Antwortzeiten der Website liegen alle relativ dicht beieinander. Mal sind es 1.1, mal 1.2 und mal 1.3 Sekunden. Dann kann man ohne Probleme den Durchschnitt nehmen. Sobald die Streuung größer wird möchte man eigentlich wissen, wie oft ein Kunde zu lang auf seine Seite warten muss. Das können - je nach Website und Anforderungen - 4 oder 5 Sekunden sein.
Also nach dem Motto: 95% der Besucher mussten weniger als X Sekunden warten. Die 90% und 95% Wartezeiten sind die Wichtigen! Und nicht der Durchschnitt.
Zusammenfassend
Falsche Aussage: der durchschnittliche Kunde musste 1,8 Sekunden auf die Website warten
Richtig Aussage: 95% der Besucher mussten weniger als 3 Sekunden warten.
Hier als Beispiel die aktuellen Zahlen von Hitflip:

Wie man sieht ist die durchschnittliche Response Zeit mit 0,666 Sekunden gar nicht schlecht. 5% müssen aber 0,778 Sekunden oder mehr warten. Das ist auch noch ein ganz guter Wert. Mehr als eine Sekunde sollte es aber für 95% der Leute nicht sein, unabhängig vom Durchschnitt.
Denn wie heißt es nochmal so schön zu Durchschnitten? With one foot in boiling water, and one foot in freezing water, on average you’re doing just fine.
Danke für die (penetrante) freundliche Nachfrage.
Hier haben wir bereits seit einiger Zeit nach einer guten Alternative zur durchschnittlichen Response Zeit gesucht!
Andreas
März 20th, 2008