Todos los tipos de correo temporal.Una plataforma.

12/05/2024

Post Mortem: Caos de correos temporales en Black Friday - lo que nos habría gustado saber antes

Caos de correos temporales en Black Friday explicado

Post Mortem: Caos de correos temporales en Black Friday - lo que nos habría gustado saber antes

El Black Friday es, por excelencia, la época del año en la que los buzones de correo electrónico colapsan. Pero para nosotros en Müllmail, tu proveedor de correos temporales de confianza, este Black Friday se convirtió en una verdadera prueba de fuego. ¿Qué pasó? ¿Por qué falló nuestro sistema? ¿Y cómo logramos salir del caos? Este post mortem lo explica todo.

Black Friday y la avalancha de correos temporales

Sabíamos que el Black Friday pondría a prueba nuestros servidores, pero lo que ocurrió superó todas las expectativas. Un ejemplo claro: un gran minorista envió la increíble cifra de 12.000 correos electrónicos en solo cinco minutos - se podría decir que estábamos demasiado "Lidl" preparados. Nuestro sistema no estaba listo para tal avalancha y colapsó.

Una fase frenética de resolución de errores

El reto fue doble: primero, identificar la causa raíz - ¿era solo el tráfico del Black Friday o estábamos siendo atacados? - y segundo, trabajar sin parar para restablecer el servicio. Este episodio fue un recordatorio brutal de cómo incluso el más pequeño cuello de botella puede causar un caos a gran escala.

Nuestras medidas: prueba, ¡pánico! y error

Para solucionar los problemas y evitar que vuelvan a repetirse, tomamos varias medidas. Aquí te las contamos:

1. Simplificación de la base de datos

El primer paso fue simplificar la estructura de la base de datos para reducir la carga del CPU. El resultado fue una mejora mínima, pero nos ayudó a detectar los verdaderos cuellos de botella.

2. Ajuste de la capacidad del servidor de correo

Asignamos más recursos al servidor de correo - pasamos de 8 a 16 núcleos. Sin embargo, pronto vimos que eso tampoco bastaba.

3. Adaptación del procesamiento de correos

Otro punto débil era el procesamiento y saneamiento de los correos entrantes. Simplificamos temporalmente esos procesos, pero cuando llegaron demasiados correos a la vez, volvimos a estrellarnos. F#+!.

4. Actualización del servidor

Por último, realizamos una migración de emergencia a un servidor mucho más potente: de 32 a 96 núcleos. Aun así, esto solo fue parte de la solución.

La solución real: ¡limitación de velocidad!

Lo que realmente salvó el sistema fue la implementación de una limitación de velocidad lógica para correos entrantes (¡quién lo hubiera dicho!). Esto dio al sistema el “aire” necesario para procesar cada correo sin acumular una cola infinita que lo sobrecargara. Desde entonces, todo ha vuelto a la normalidad.

Gracias a nuestra comunidad

Queremos agradecer sinceramente a todos los usuarios de Müllmail por su paciencia y confianza. Hemos aprendido mucho de esta experiencia y seguiremos trabajando para que el sistema sea aún más sólido y confiable.
¿Sigues teniendo problemas con la entrega? Escríbenos cuando quieras a kontakt@team.muellmail.com.

Lo que aprendimos

El Black Friday nos dejó una lección clara: incluso los sistemas que parecen sólidos pueden colapsar ante una carga inesperada. Pero gracias a las medidas tomadas y al incansable trabajo de nuestro equipo, salimos adelante (¡tocamos madera!). Nuestro objetivo sigue siendo ser tu opción de confianza para correos temporales - incluso en los días más caóticos del año.