LCC 243 - Interview SRE avec Nicolas Helleringer et Maxime Brugidou - partie 1
Manage episode 331070351 series 43620
Nicolas et Maxime de Critéo partagent avec Emmanuel leur expérience de mise en place d’une organisation SRE (Site Reliability Engineering).
Enregistré le 12 novembre 2020
Téléchargement de l’épisode LesCastCodeurs-Episode–243.mp3
Interview Ta vie, ton oeuvreTwotter Nicolas Twitter Maxime Criteo Labs
SRE en 2 phrasesSite Reliability Engineering C’est une façon de monter un salaire de sysadmin ?
PourquoiOps et dev, pourquoi “merger” ? DevOps avec un sysadmin dans l’équipe vs SRE Cela a du sens de le faire sur un “petit projet” ou uniquement si on gère 300k machines ?
SRE au quotidienJournée type
Dashboard
On code en quoi?
Pager (pendant les horaires travails vs dehors) Les weekends
Taille SRE pour pour du 24/7
Combien de fois est-on appelé par nuit ? Prod fallback
Le development
Concepts intéressants50% eng
SLO SLI SLA La difficulté de la valeur initiale Perf passées vs calcul théorique
Error budget Blast radius Burn rate
Pré conclusionC’est la fin de la partie 1 de cette interview
Nous contacterFaire un crowdcast ou une crowdquestion Contactez-nous via twitter https://twitter.com/lescastcodeurs sur le groupe Google https://groups.google.com/group/lescastcodeurs ou sur le site web https://lescastcodeurs.com/ Flattr-ez nous (dons) sur https://lescastcodeurs.com/ En savoir plus sur le sponsoring? sponsors@lescastcodeurs.com
296 episodes