Digital Marketing

Warum ein Online-Shop gute Datenqualität braucht

Wie umgehen mit Kundendaten?

Sowohl Produkt- als auch Kundendaten sind Stammdaten. Aber die Datenstruktur und das Nutzungsverhalten unterscheiden sich fundamental. Deshalb sind hier andere Maßnahmen erforderlich.

In gut gepflegten Datenbanken finden sich etwa vier bis sechs Prozent der Datensätze doppelt angelegt - sogenannte Dubletten. Leider sind die Datenbanken vieler Online-Händler alles andere als gut gepflegt: Kunden tragen sich neu ein, weil sie das Passwort zu ihrem alten Account nicht mehr wissen. Oder sie tun es absichtlich, weil sie auf der Blacklist stehen. Vielleicht wollen sie auch nur ein weiteres Mal Neukundenvorteile nutzen. Daher sehen wir bei Online-Händlern oft zweistellige Dublettenraten.

Einkäufe bei Online-Shops
Einkäufe bei Online-Shops
Foto: Statista

Viele Shops bieten heute auch eine "Gastbestellung" an, bei der nur die für die Bestellung notwendigen Daten erhoben werden, der User aber kein Passwort erhält. Ist der User aber zufrieden, kommt er wieder - und gibt seine Adresse ein weiteres Mal ein. Dubletten sind somit vorprogrammiert.

Selbst wenn die Dublettenrate im einstelligen Prozentbereich liegt, verfälscht sie Analysen beträchtlich, denn Dubletten betreffen die Stammkunden. Wer nur einmal bestellt hat, kann seine Adresse nicht doppelt angegeben haben. Bei einer Dublettenrate von fünf Prozent gehen wir als Richtwert davon aus, dass der Stammkundenbestand sogar zu 30 Prozent betroffen ist.

Stammkunden sind für viele Analysen besonders wichtig. Im Folgenden ein Beispiel, wie eine Recommendation Engine für das Cross-Selling die passenden Produkte findet.

Warum schaden Dubletten?

Damit eine Recommendation Engine Empfehlungen für das Cross-Selling erzeugen kann ("wer das gekauft hat, kauft auch das"), muss sie bisherige Verbundkäufe analysieren. Diese können in einem einzelnen Warenkorb liegen, sie können aber auch aus mehreren Käufen des gleichen Kunden gebildet werden.

Nehmen wir an, ein Kunde kauft

  • beim ersten Kauf Produkt A und B

  • beim zweiten Mal Produkt C und

  • beim dritten Kauf Produkt D, E und F.

Wird nur jeder Warenkorb einzeln analysiert, können nur die Zusammenhänge A+B, D+E, D+F und E+F ermittelt werden - es ergeben sich vier Kombinationen. Bringt man alle drei Käufe zusammen, ergeben sich 15 Kombinationen, also mehr als das Dreifache.

Ist der Kunde beim ersten Kauf unter einem anderen Datensatz gespeichert als bei den beiden anderen, ergeben sich aus A+B eine Kombination sowie aus den Produkten C, D, E und F sechs Kombinationen, zusammen also 7. Schon eine einzelne Dublette reduziert hier die für den Lernprozess verfügbaren Paarungen auf weniger als die Hälfte (7 statt 15).

Eine weitere wichtige Kennzahl ist der Customer Lifetime Value (CLV). Hierbei wird ermittelt, welchen Deckungsbeitrag ein Kunde bringt, bevor er abspringt. Der CLV ist eine Grundlage für die Entscheidung, wie viel man für die Gewinnung eines weiteren Kunden auszugeben bereit ist. Wenn man den CLV je Werbemaßnahme ermitteln kann, lassen sich Entscheidungen treffen, welche Werbemaßnahmen man besser abschaltet und wovon mehr gebucht werden sollte.

Gelangt der Kunde beim ersten Kauf über eine bestimmte Werbemaßnahme - zum Beispiel ein Schnäppchen auf einer Preissuchmaschine - in den Shop, kann sich aber beim zweiten Kauf nicht an sein Passwort erinnern und registriert sich deshalb neu, können die weiteren Käufe nicht der Werbemaßnahme zugeordnet werden. Die Listung auf der Preissuchmaschine wird dann möglicherweise abgeschaltet, obwohl sie sich lohnen würde.

Dubletten werden außerdem von Kunden aktiv angelegt, um ein Blacklisting zu umschiffen. Wer sie zulässt, beliefert Nichtzahler, Dauerrücksender etc. Das hat zwar nichts mit Analytics zu tun, aber durchaus mit Rendite.