Eric Duquesnoy public
[search 0]
Téléchargez l'application!
show episodes
 
Artwork

1
#DataOops

Romain Ferraton, Fabien Beaumont, Eric Duquesnoy

icon
Unsubscribe
icon
Unsubscribe
Chaque mois
 
DataOops : savoir-faire et compétences réunies autour des sujets données et DevOps. On y parle : - databases & performances : techniques d'optimisations, bonnes et mauvaises pratiques, détections des problèmes et même de hardware et de cloud - modélisations des données : les différents types de modélisation et leur spécificités. - devops : des bases du devops aux éléments les plus pointus et bien sur les liens entre les 3 domaines Retrouves nous sur https://www.dataoops.org pour plus de détails.
  continue reading
 
Loading …
show series
 
Des nouvelles de DuckDB avec l'interface graphique DuckDB UI, Les vecteurs dans les principales bases de données relationnelles comme Oracle, SQL Server ou PostgreSQL et comment fabriquer ses embeddings. Enfin une discussion sur les avantages et inconvénients entre la solution NO/Low Code et le Code de l'intégration à la BI…
  continue reading
 
Comment accélérer un chargement massif dans un columnstore sur SQL Server : un retour d'expérience approfondi avec 1 milliard de lignes chargé en 6 minutes.DuckDB passe en v0.10 et stabilise son stockage.MS Fabric annonce que le Vacuum sera bientot possible et voici pourquoi c'est une bonne chose...Par Romain Ferraton, Fabien Beaumont, Eric Duquesnoy
  continue reading
 
REX sur des erreurs de modélisation avec des vues trop imbriquées, performance postgresql windows vs linux. DuckDB une star sur Github qui rejoint Postgresql. MS Fabric des prix d'appel pour les entreprises avec un ratio prix/performance attractif.Par Romain Ferraton, Fabien Beaumont, Eric Duquesnoy
  continue reading
 
Episode 43 : bilan 2023 avec les lakehouses, la gouvernance des données, les bases de données vectorielles, les IA génératives et autres LLM, Oracle Cloud et les bases AutonomousPar Romain Ferraton, Fabien Beaumont, Eric Duquesnoy
  continue reading
 
Onyxia est une UX open source pour mettre en place un datalab avec des services basés sur des containers et orchestrés par K8s. Minio pour le stockage, Keycloak et Vault pour la sécurité s'intègre parfaitement.Cette solution est mise en oeuvre à l'INSEE avec le datalab SSP et Frederic Comte, Architecte Data à l'INSEE nous en explique les fondements…
  continue reading
 
Une interview de Sylvain Lesage développeur chez Hugging Face dans l'équipe en charge de la prévisualisation des datasets : le dataset viewer. Il nous parle de son parcours et de son expérience chez Hugging Face, une société très inspirée dans le monde de l'IA.Par Romain Ferraton, Fabien Beaumont, Eric Duquesnoy
  continue reading
 
Partie 1 : La couche sémantique et l'architecture de Power BI. Partie 2 : Comptage approximatif et l'algorythme hyperlolog. Partie 3 : les différents types d'encodage avec les columnstore index SQL Server & Apache Parquet et des stockages colonnaires en généralPar Romain Ferraton, Fabien Beaumont, Eric Duquesnoy
  continue reading
 
Episode 37 : Oracle Database Data Cartbridge ou comment faire une extension dans la base Oracle. SQL Server Journalisation Minimale. L'importance du tri des données pour les performances avec Parquet. Le tableau de bord des bases de données : +900 databases étudiées. La DataGouvernance un sujet qui n'est pas uniquement technique.…
  continue reading
 
Databricks : formation en ligne gratuite et aparté Delta Lake 3.0.Oracle DB : un dashboard sur les features et innovation depuis la 11.2 avec 1608 features. Les tendances des bases de données (Relationnelles et NoSQL). Les bases de données vectorielles : qu'est ce qui les différencie et les points importants pour les choisir.…
  continue reading
 
SQL : un language incontournable dans le traitement des données. On en parle avec une approche historique, les dialectes et les nouvelles approches qui rendent ce language plus vivant que jamais.Dans la deuxième partie de l'épisode on vous parle de Microsoft DataFabric : où en est-on avec ce nouveau service orienté données proposé par Microsoft.…
  continue reading
 
Microsoft a lancé un nouveau service chapeau : Microsoft Fabric. Senser regrouper tous les services autour de l'analytique, ce service est plein de promesses. Premiers avis sur ce service avec Fabien Beaumont. Romain Ferraton aborde ensuite les bases de données vectorielles, support de la mémoire des IAs. Capables de recherches sémantiques accéléré…
  continue reading
 
4 sujets dans cet épisode :Une REX sur un problème de modélisation de données IOT dans SQL Server.L'arrivée des fonctionnalités spatiales sur DuckDB.Discussion sur l'observabilité : théorie et un exemple de log machine friendly avec Serilog.Discussion sur le datameshPar Romain Ferraton, Fabien Beaumont, Eric Duquesnoy
  continue reading
 
On parle un tout petit peu de chatGPT mais d'abord des évènements étendus (extended events) sur SQL Server et de leurs capacités à faire remonter des informations précieuses pour le diagnostique voir l'analyse du code.Ensuite nous abordons le benchmark TPCH et la comparaison des performances des bases Cloud comme comme Snowflake, BigQuery, SingleSt…
  continue reading
 
Un tour d'horizon sur les solutions Datalake du marché et discussion sur le DatasharingCoté Devops : comme le devops est perçu suivant le type d'entrepriseFinOps : pilotage des coutsNews : Nouveau Meetup Silicon ChaletPar Romain Ferraton, Fabien Beaumont, Eric Duquesnoy
  continue reading
 
DuckDB est une base de données OLAP in-process et très légère : très utile pour la préparation de données en SQL Surtout quand cette base est compilée en C++, très performante, dotée de nombreuses fonctions, capable de lire et écrire des fichiers csv ou parquet et utilisable via ODBC,JDBC, API python ou C++ ou tout simplement via CLI.Apache Arrow e…
  continue reading
 
Le result cache (ou query cache) en base de données permet d'accélérer les requêtes répétitives et consommatrices sur les bases de données. Quelles databases disposent de cette fonctionnalité ?Optimiser sa consommation de ressources dans le cloud : le FinOpsPar Romain Ferraton, Fabien Beaumont, Eric Duquesnoy
  continue reading
 
3 parties dans cet épisode : la gestion des plans d'exécution particuliers dans les bases de données, les étapes pour concevoir son datavault et finalement une introduction a TerraformPar Romain Ferraton, Fabien Beaumont, Eric Duquesnoy
  continue reading
 
Dans un datavault les clefs ne sont pas incrémentales, alors quelle technique utiliser : SHA256 ou fonction de hashache vers un entier ? Une partie sur l'indexation et l'ordre des colonnes, une autre sur le InMemory, la compression et le stockage colonne sur SQL Server, Oracle et HANA.Par Romain Ferraton, Fabien Beaumont, Eric Duquesnoy
  continue reading
 
Loading …

Guide de référence rapide

Écoutez cette émission pendant que vous explorez
Lire