LCC 243 - Interview SRE avec Nicolas Helleringer et Maxime Brugidou - partie 1

1:02:52
 
Partager
 

Manage episode 279242851 series 25488
Par Emmanuel Bernard, Guillaume Laforge, Vincent Massol, and Antonio Goncalves, découvert par Player FM et notre communauté - Le copyright est détenu par l'éditeur, non par Player F, et l'audio est diffusé directement depuis ses serveurs. Appuyiez sur le bouton S'Abonner pour suivre les mises à jour sur Player FM, ou collez l'URL du flux dans d'autre applications de podcasts.

Nicolas et Maxime de Critéo partagent avec Emmanuel leur expérience de mise en place d’une organisation SRE (Site Reliability Engineering).

Enregistré le 12 novembre 2020

Téléchargement de l’épisode LesCastCodeurs-Episode–243.mp3

Interview Ta vie, ton oeuvre

Twotter Nicolas Twitter Maxime Criteo Labs

SRE en 2 phrases

Site Reliability Engineering C’est une façon de monter un salaire de sysadmin ?

Pourquoi

Ops et dev, pourquoi “merger” ? DevOps avec un sysadmin dans l’équipe vs SRE Cela a du sens de le faire sur un “petit projet” ou uniquement si on gère 300k machines ?

SRE au quotidien

Journée type

Dashboard

On code en quoi?

Pager (pendant les horaires travails vs dehors) Les weekends

Taille SRE pour pour du 24/7

Combien de fois est-on appelé par nuit ? Prod fallback

Le development

Livre: le projet Unicorn

Concepts intéressants

50% eng

SLO SLI SLA La difficulté de la valeur initiale Perf passées vs calcul théorique

Error budget Blast radius Burn rate

Pré conclusion

C’est la fin de la partie 1 de cette interview

Nous contacter

Faire un crowdcast ou une crowdquestion Contactez-nous via twitter https://twitter.com/lescastcodeurs sur le groupe Google https://groups.google.com/group/lescastcodeurs ou sur le site web https://lescastcodeurs.com/ Flattr-ez nous (dons) sur https://lescastcodeurs.com/ En savoir plus sur le sponsoring? sponsors@lescastcodeurs.com

261 episodes