#5 Autoscaling lag et gestion des incidents chez Doctolib 🇫🇷
Benoit Lafontaine, Engineering Director chez Doctolib, nous partage le post mortem d’un incident récent dû à une évolution soudaine de la charge sur la partie patient de leur service.
Malgré une architecture d’auto-scaling déjà en place, le service a été dégradé quelques minutes. Benoît revient également sur la façon dont les incidents sont gérés chez Doctolib.
Ressources
Extrait audio d'un JT de M6, 19-45, disponible sur le kit presse du site doctolib.fr
Post Mortem
In Post Mortem, engineers reflect on real-life incidents of IT systems they experienced.
In each episode, we zoom on a specific event, ranging from a system outage, a cyber-attack, or a machine learning algorithm going wild with production data. We try to understand what happened and how the people behind those systems solved the situation.
Along the way, you'll get hands-on advice shared by experienced practitioners that you can implement within your team to limit the risk of such incidents.
- Nombre d'épisodes: 26
- Dernier épisode: 2024-02-04
- Technologies