Artwork

Contenu fourni par Emmanuel Bernard, Guillaume Laforge, Vincent Massol, Antonio Goncalves, Arnaud Héritier, Emmanuel Bernard, Guillaume Laforge, Vincent Massol, Antonio Goncalves, and Arnaud Héritier. Tout le contenu du podcast, y compris les épisodes, les graphiques et les descriptions de podcast, est téléchargé et fourni directement par Emmanuel Bernard, Guillaume Laforge, Vincent Massol, Antonio Goncalves, Arnaud Héritier, Emmanuel Bernard, Guillaume Laforge, Vincent Massol, Antonio Goncalves, and Arnaud Héritier ou son partenaire de plateforme de podcast. Si vous pensez que quelqu'un utilise votre œuvre protégée sans votre autorisation, vous pouvez suivre le processus décrit ici https://fr.player.fm/legal.
Player FM - Application Podcast
Mettez-vous hors ligne avec l'application Player FM !

LCC 245 - Interview SRE avec Nicolas Helleringer et Maxime Brugidou - partie 2

56:07
 
Partager
 

Manage episode 331070349 series 43620
Contenu fourni par Emmanuel Bernard, Guillaume Laforge, Vincent Massol, Antonio Goncalves, Arnaud Héritier, Emmanuel Bernard, Guillaume Laforge, Vincent Massol, Antonio Goncalves, and Arnaud Héritier. Tout le contenu du podcast, y compris les épisodes, les graphiques et les descriptions de podcast, est téléchargé et fourni directement par Emmanuel Bernard, Guillaume Laforge, Vincent Massol, Antonio Goncalves, Arnaud Héritier, Emmanuel Bernard, Guillaume Laforge, Vincent Massol, Antonio Goncalves, and Arnaud Héritier ou son partenaire de plateforme de podcast. Si vous pensez que quelqu'un utilise votre œuvre protégée sans votre autorisation, vous pouvez suivre le processus décrit ici https://fr.player.fm/legal.

Nicolas et Maxime de Critéo partagent avec Emmanuel leur expérience de mise en place d’une organisation SRE (Site Reliability Engineering). Suite et fin de cette interview.

Enregistré le 12 novembre 2020

Téléchargement de l’épisode LesCastCodeurs-Episode–245.mp3

Interview Ta vie, ton oeuvre

Twotter Nicolas Twitter Maxime Criteo Labs

Intros et premiers sujets en partie 1

Episode 243 - partie 1

Concepts intéressants

Standard Operating Procedure Gestion d’incident

Dashboard

Postmortem

Comment ça se passe ?

Relation avec l’équipe produit

On code sur le produit ? Feedback loop

Quid de systèmes fondamentalement en risque du black swan (échec systémique)

Une équipe SRE par boite ? Une équipe SRE par produit ?

Le monitoring

Quoi mesurer ? Beaucoup, peu ?

Entraînements et cas réels

Que se passe-t-il quand cela chie dans la colle ? On s’entraine ? Vous faite le draining d’erreur budget

Drainer des clusters pour maintenance et impact sur l’utilisateur

Conclusions

Livres Google sur le Site Reliability Engineering

Nous contacter

Faire un crowdcast ou une crowdquestion Contactez-nous via twitter https://twitter.com/lescastcodeurs sur le groupe Google https://groups.google.com/group/lescastcodeurs ou sur le site web https://lescastcodeurs.com/

  continue reading

308 episodes

Artwork
iconPartager
 
Manage episode 331070349 series 43620
Contenu fourni par Emmanuel Bernard, Guillaume Laforge, Vincent Massol, Antonio Goncalves, Arnaud Héritier, Emmanuel Bernard, Guillaume Laforge, Vincent Massol, Antonio Goncalves, and Arnaud Héritier. Tout le contenu du podcast, y compris les épisodes, les graphiques et les descriptions de podcast, est téléchargé et fourni directement par Emmanuel Bernard, Guillaume Laforge, Vincent Massol, Antonio Goncalves, Arnaud Héritier, Emmanuel Bernard, Guillaume Laforge, Vincent Massol, Antonio Goncalves, and Arnaud Héritier ou son partenaire de plateforme de podcast. Si vous pensez que quelqu'un utilise votre œuvre protégée sans votre autorisation, vous pouvez suivre le processus décrit ici https://fr.player.fm/legal.

Nicolas et Maxime de Critéo partagent avec Emmanuel leur expérience de mise en place d’une organisation SRE (Site Reliability Engineering). Suite et fin de cette interview.

Enregistré le 12 novembre 2020

Téléchargement de l’épisode LesCastCodeurs-Episode–245.mp3

Interview Ta vie, ton oeuvre

Twotter Nicolas Twitter Maxime Criteo Labs

Intros et premiers sujets en partie 1

Episode 243 - partie 1

Concepts intéressants

Standard Operating Procedure Gestion d’incident

Dashboard

Postmortem

Comment ça se passe ?

Relation avec l’équipe produit

On code sur le produit ? Feedback loop

Quid de systèmes fondamentalement en risque du black swan (échec systémique)

Une équipe SRE par boite ? Une équipe SRE par produit ?

Le monitoring

Quoi mesurer ? Beaucoup, peu ?

Entraînements et cas réels

Que se passe-t-il quand cela chie dans la colle ? On s’entraine ? Vous faite le draining d’erreur budget

Drainer des clusters pour maintenance et impact sur l’utilisateur

Conclusions

Livres Google sur le Site Reliability Engineering

Nous contacter

Faire un crowdcast ou une crowdquestion Contactez-nous via twitter https://twitter.com/lescastcodeurs sur le groupe Google https://groups.google.com/group/lescastcodeurs ou sur le site web https://lescastcodeurs.com/

  continue reading

308 episodes

Tous les épisodes

×
 
Loading …

Bienvenue sur Lecteur FM!

Lecteur FM recherche sur Internet des podcasts de haute qualité que vous pourrez apprécier dès maintenant. C'est la meilleure application de podcast et fonctionne sur Android, iPhone et le Web. Inscrivez-vous pour synchroniser les abonnements sur tous les appareils.

 

Guide de référence rapide