#5 Autoscaling lag et gestion des incidents chez Doctolib 🇫🇷

#5 Autoscaling lag et gestion des incidents chez Doctolib 🇫🇷

Post Mortem · 2020-11-25
33:08

Benoit Lafontaine, Engineering Director chez Doctolib, nous partage le post mortem d’un incident récent dû à une évolution soudaine de la charge sur la partie patient de leur service.

Malgré une architecture d’auto-scaling déjà en place, le service a été dégradé quelques minutes. Benoît revient également sur la façon dont les incidents sont gérés chez Doctolib.

Ressources

Extrait audio d'un JT de M6, 19-45, disponible sur le kit presse du site doctolib.fr

Superfail, une émission de France Culture

Newsletter tech de Doctolib

Post Mortem

In Post Mortem, engineers reflect on real-life incidents of IT systems they experienced.
In each episode, we zoom on a specific event, ranging from a system outage, a cyber-attack, or a machine learning algorithm going wild with production data. We try to understand what happened and how the people behind those systems solved the situation.
Along the way, you'll get hands-on advice shared by experienced practitioners that you can implement within your team to limit the risk of such incidents.

  • Nombre d'Ă©pisodes: 26
  • Dernier Ă©pisode: 2024-02-04
  • Technologies

Où pouvez-vous écouter?

Apple Podcasts Logo Podtail Logo Google Podcasts Logo RSS

Épisodes