Kostenlose Temp Mailohne Schnickschnack.

05.12.2024

Post Mortem: Temp Mail Chaos am Black Friday – was wir gerne früher gewusst hätten

Post Mortem: Temp Mail Chaos am Black Friday – was wir gerne früher gewusst hätten

Black Friday ist bekanntlich die Zeit des Jahres, in der E-Mail-Postfächer weltweit heißlaufen. Doch für uns bei Müllmail, eurem zuverlässigen Anbieter für Temp Mail, entwickelte sich der diesjährige Black Friday zu einer echten Bewährungsprobe. Was ist passiert? Warum hat unser System versagt? Und wie haben wir die Krise gemeistert? Dieser Post Mortem Bericht gibt einen Einblick.

Black Friday und die Flut der Temp Mails

Wir wussten, dass Black Friday eine hohe Belastung für unser System bedeuten würde, aber was in diesem Jahr passierte, sprengte alle Erwartungen. Ein Paradebeispiel: Ein großer Discounter schickte innerhalb von nur fünf Minuten ganze 12.000 E-Mails - man könnte sagen, wir waren zu "Lidl" vorbereitet. Unser System war zum damaligen Zeitpunkt schlichtweg nicht für solch eine Flut ausgelegt – und quittierte den Dienst.

Eine hektische Phase der Fehlersuche

Die Herausforderung war doppelt: Zum einen mussten wir die Ursache klären – war es wirklich nur der Black-Friday-Ansturm oder steckten gezielte Angriffe dahinter? Zum anderen arbeiteten wir rund um die Uhr, um unseren Dienst wiederherzustellen. In dieser Zeit wurden wir schmerzlich daran erinnert, dass selbst kleinste Engpässe in der Infrastruktur riesige Auswirkungen haben können.

Unsere Maßnahmen: Trial, Panic! & Error

Um die Probleme zu lösen und zukünftige Überlastungen zu vermeiden, haben wir mehrere Maßnahmen ergriffen. Hier ein Überblick:

1. Datenbanklayout vereinfachen

Als ersten Schritt haben wir unser Datenbanklayout vereinfacht, um die Last auf der CPU zu reduzieren. Diese Änderung brachte nur eine minimale Verbesserung, zeigte uns aber, wo die wirklichen Flaschenhälse lagen.

2. Sizing des Mailservers anpassen

Wir haben unserem Mailserver zusätzliche Ressourcen zugewiesen – statt der bisherigen 8 CPU-Kerne nun respektable 16 Kerne. Auch hier zeigte sich schnell: Es war nicht genug.

3. Adaptierung der Mailaufbereitung

Ein weiteres Bottleneck war die Verarbeitung und Aufbereitung von E-Mails. Temporär haben wir diese Prozesse vereinfacht, aber bei zu vielen gleichzeitig eintreffenden Mails stießen wir erneut an Grenzen. Schas.

4. Serverupgrade

Schließlich haben wir in einer Nacht- und Nebelaktion kurzerhand eine komplette Servermigration vollzogen – von einem 32-Kern- auf einen 96-Kern-Server. Doch auch diese Maßnahme war nur ein Teil der Lösung.

Die Lösung: Sinnvolles Rate Limiting

Die entscheidende Maßnahme war letztlich die Einführung eines sinnvollen Rate Limitings für eingehende E-Mails. Dieses gab unserem System die notwendige „Bedenkzeit“, um jede Mail effizient zu verarbeiten, ohne dass ein wachsendes Backlog unseren Dienst lahmlegt. Seitdem läuft unser System wieder stabil.

Ein großes Dankeschön an unsere Nutzer

Wir möchten uns bei allen Nutzern von Müllmail für ihre Geduld und ihr Vertrauen bedanken. Wir lernen aus dieser Erfahrung und werden weiterhin daran arbeiten, unser System noch robuster zu machen. Sollten dennoch Zustellprobleme auftreten, könnt ihr uns jederzeit unter kontakt@team.muellmail.com erreichen.

Was wir mitnehmen

Black Friday hat uns eines gezeigt: Selbst gut durchdachte und auch erprobte Systeme können an ihre Grenzen stoßen, wenn unerwartete Belastungen auftreten. Durch die von uns gesetzten Maßnahmen und den unermüdlichen Einsatz unseres Teams haben wir diese Herausforderung gemeistert (auf Holz klopf). Es ist unser Ziel, auch in der Zukunft eure erste Anlaufstelle zu sein, wenn es um Temp Mails geht.