Tous les types d'email temporaire.Une plateforme.

12/05/2024

Post Mortem : chaos des courriers temporaires au Black Friday - ce qu’on aurait aimé savoir plus tôt

Black Friday : Le chaos des mails temporaires expliqué

Le Black Friday est, comme chacun sait, la période de l’année où les boîtes mail chauffent. Pour nous, chez Müllmail, votre fournisseur de temp mails, cette édition 2024 s’est transformée en véritable crash test. Que s’est-il passé ? Pourquoi notre système a-t-il cédé ? Et comment avons-nous géré la crise ? Voici notre rapport post mortem.

Black Friday et la déferlante de mails temporaires

On s’attendait à une forte charge - mais ce qui nous a frappés a dépassé toutes les prévisions. Exemple : un grand distributeur a envoyé plus de 12 000 e-mails en l’espace de cinq minutes. On peut dire qu’on était un peu trop "Lidl" préparés.
Notre système, tel qu’il était, n’était tout simplement pas dimensionné pour une telle avalanche… et il a lâché.

Une course effrénée contre les bugs

Première mission : comprendre. Était-ce un pic "naturel" ou une attaque ciblée ? En parallèle, nous avons travaillé 24h/24 pour relancer notre service. Cette épreuve nous a montré à quel point un petit goulot d’étranglement peut tout faire basculer dans l’infrastructure.

Nos mesures : Trial, Panic! & Error

Pour résoudre les problèmes et éviter qu’ils ne se reproduisent, plusieurs actions ont été lancées :

1. Simplification du schéma de base de données

Première tentative : simplifier notre structure de base de données pour réduire la charge CPU. Amélioration minime, mais cela a permis d’identifier les vrais goulets.

2. Redimensionnement du serveur mail

Nous avons doublé la puissance CPU du serveur mail, passant de 8 à 16 cœurs. Résultat : toujours pas suffisant.

3. Ajustement du traitement des mails

Autre goulot : la façon dont les mails sont traités/formatés. Nous avons simplifié temporairement le processus, mais trop d’e-mails en même temps, et rebelote : saturation. Ch***.

4. Migration vers un nouveau serveur

En mode commando, nous avons migré toute l’infra sur un serveur 96 cœurs (contre 32 avant). Là encore : ce n’était qu’un morceau du puzzle.

La vraie solution : un rate limiting intelligent

Ce qui a vraiment sauvé notre service ? La mise en place d’un rate limiting intelligent pour les e-mails entrants. Cela permet au système de respirer et d’absorber les volumes sans backlog paralysant. Depuis, tout roule.

Merci à nos utilisateurs

Merci à vous tous pour votre patience et votre confiance. On tire les leçons de cette expérience et on renforce nos bases pour l’avenir. Si un souci de livraison devait survenir, contactez-nous sur kontakt@team.muellmail.com.

Ce qu’on retient

Le Black Friday nous a appris une chose : même les systèmes bien conçus peuvent exploser face à l’imprévu. Grâce à notre équipe et aux mesures prises, nous avons surmonté la tempête (en touchant du bois). Et on compte bien rester votre référence Temp Mail, même lors du prochain raz-de-marée promotionnel.