Ein Thema, mit dem ich mich auf Hitmeister viel beschäftige, ist Fraud. Bei mehreren 100.000 Kunden in der Datenbank hat man zwangsläufig auch mit Betrügern und Irren zu tun. Wir bieten die Zahlung per Lastschrift auf eigenes Risiko an und geben damit den Kunden effektiv einen Kurzkredit. Eine zentrale Frage, die wir da bearbeiten, ist wem man wann und bis zu welchem Betrag die Zahlung per Lastschrift erlaubt. Kunden, die kein Geld auf dem Konto haben oder aber die Lastschrift zurückgehen lassen, verursachen bei uns erhebliche wirtschaftliche Schäden.
Gleichzeitig ist es für uns wichtig, möglichst vielen Kunden die Zahlung per Lastschrift zu erlauben. Wenn dem Kunden diese Zahlungsmöglichkeit nicht angezeigt, verdoppelt sich die Abbrecherquote auf der Zahlungsseite. Und das obwohl wir mit Kreditkarte, Paypal, Sofortueberweisung usw. viele andere Methoden anbieten. Die Deutschen lieben Lastschrift (fast so viel wie Rechnung, wie eine interessante Studie im shopbetreiber-blog gezeigt hat), ausblenden kostet also Kunden.
Wer per Lastschrift zahlen kann, wird durch verschiedene Faktoren determiniert:
- Kundenhinstorie
- SCHUFA, Creditreform, Bürgel Scores
- Mikrogeographische Merkmale
- Zusammensetzung des Warenkorbs
- usw. (secret sauce)
Mein Kollege Matthias, unser Leiter Kundenservice, meinte er hätte das Gefühl, dass Nachts wesentlich mehr Fraud betrieben wird, als tagsüber. Die Tageszeit könnte also ein Faktor für die Menge an Rücklastschriften sein. Genauso wie der Wochentag, oder auch der Tag im Monat (wenn am Ende des Monats das Geld knapp wird…)
Ich bin mal hergegangen und habe den Fraud im Tages-, Wochen- und Monatsverlauf analysiert. In den Grafiken unten habe ich die Zahlen normalisiert und dabei den Durchschnitt auf 100 gesetzt. Als Datenbasis dienten alle Lastschriften auf Hitmeister bisher. Die genauen Zahlen sind natürlich streng geheim…
Zuerst zum Wochenverlauf: keine wirklich messbaren Auswirkungen. Schwankungen um die 5% im wochenverlauf würde ich als “random noise” ignorieren bzw. nicht als Faktor benutzen.

Im Monatsverlauf: am Ende des Monats steigt die Rücklastschriftquote schon an. Ich habe den linearen Trend mal eingezeichnet. Die Varianz zwischen den Tagen ist aber so hoch, dass sich das nicht wirklich als Faktor eignet. Eventuell irgendwann in der Zukunft mal, bei Leuten, mit niedrigen SCHUFA-Scores.

Was hingegen interessant ist, ist wie sich der Fraud (also Rücklastschriften) im Tagesverlauf entwickelt.

Nach ca. 01:00 Nachts steigt der Fraud massiv an. Zwischen 01:00 und 08:00 Uhr ist die Rücklastschriftenquote teilweise doppelt so hoch wie tagsüber. Diese Information wird sicherlich in die nächste Iteration unseres Fraud-Prevention-Systems einfliessen.
Ich spiele immer wieder mit dem Gedanken, von dem aktuellen regelbasierten System zu einem Bayesschen Filter zu wechseln. Das Grundproblem bei der Bonitätsprüfung ist letztendlich das gleiche wie beim Spam-Management: wie unterscheide ich ham (gute Kunden) von spam (schlechte Kunden). Der Vorteil von einem Bayesschen Filter: das System lernt die Filterregeln von alleine und erkennt Muster und Tendenzen die wir per Hand nicht finden. Sind GMX-Adressen beliebter bei Betrügern? Gibt es bei Vornamen Häufungen? Was kaufen Betrüger gerne? Der Nachteil: das System wird irgendwo zu einer Blackbox, die von uns nur noch begrenzt nachvollziehbare Entscheidungen fällt. Da braucht man Wege um den alpha und beta Fehler zu messen. Ein interessantes Thema, was mich aber immer wieder auch ärgert. Warum bestellen Leute Sachen, die sich nicht bezahlen können? Bei Nahrungsmittel oder Strom meinetwegen, aber muss jemand der Privatinsolvenz angemeldet hat noch eine PS3 kaufen, die er nicht bezahlen kann?