show episodes
 
Loading …
show series
 
Dans cet épisode du BigData Hebdo, Vincent Heuschling et Paul Peton explorent les dernières annonces d'OpenAI, d’Anthropic et de Google concernant les agents AI et leur monétisation. Au programme les SDK, les workflows, etc... **A retenir dans cet épisode** - Les dernières annonces d'OpenAI, Anthropic, et Google. - Les agents ont de l’argent, il co…
  continue reading
 
Dans cet épisode on explore les défis et les évolutions du RAG (Retrieval-Augmented Generation) dans le contexte de l'IA. L'équipe du Bigdata Hebdo discute des promesses des éditeurs, des difficultés rencontrées par les utilisateurs, et des mécanismes d'IA nécessaires pour traiter efficacement les documents. On parle des enjeux liés à l'OCR, au chu…
  continue reading
 
Dans cet épisode du Big Data Hebdo, Vincent Heuschling et Nicolas Wlodarczyk discutent des caractéristiques et des avantages de la base de données NoSQL Aerospike. Nicolas partage son parcours dans le domaine de l'IT et explique comment Aerospike se distingue par sa rapidité et sa scalabilité, et sa capacité à optimiser les infrastructures. Chapitr…
  continue reading
 
Dans cet épisode du Big Data Hebdo, Vincent Heuschling, Paul Peton, et Jérôme Mainaud discutent des événements marquants de l'été 2025 dans le domaine de l'IA et du Big Data, notamment le drama autour de Luc Julia, du lancement raté de GPT5, de l'importance des modèles open source, et les initiatives européennes en matière de souveraineté technolog…
  continue reading
 
Avec Christophe Blefari (aka Blef) on discute des défis actuels des équipes data et de la réponse apportée par NAO. Comment le “Data vide coding” peut accélérer la productivité des projets data ? On évoque aussi le passage par YC qui a eu un impact significatif sur le produit et la société. On termine cet épisode avec le regard averti de Christophe…
  continue reading
 
Dans cet épisode du Big Data Hebdo, Vincent Heuschling et Quentin Ambard reviennent sur le Data and AI Summit 2025 de Databricks. En autres on parle de : L'acquisition de Néon pour avoir une BDD au dessus du Lakehouse Lakeflow Designer pour avoir une approche low-code L'intégration de l'IA Databricks One pour rendre l'interface plus accessible Les …
  continue reading
 
Dans cet épisode du Big Data Hebdo, on regarde l'évolution des formats de fichiers Table, en se concentrant sur Parquet, Delta Lake, Iceberg et Duck Lake. On évoque la gestion des metadata et les catalogues pour la gouvernance des données.Par Vincent Heuschling, Alexander Dejanovski, Jérôme Mainaud, Nicolas Steinmetz
  continue reading
 
(00:00:00) Episode 218 : Agents IA (00:02:58) Définition d'un agent IA (00:09:49) Agents et outils (00:10:30) TAO & ReAct (00:39:50) Frameworks Dans cet épisode thématique, on explore les agents IA, dernière itération de l'IA Générative. Qu'est ce qui distingue un agent d’un chatbot ou d’un simple prompt ? On parle aussi de la relation entre agents…
  continue reading
 
(00:00:00) Episode 217 : BDH live à Devoxx Paris 2025 (00:01:04) Conférence Bug Bash et tests autonomes (00:06:23) Windsurf : révolution du coding assistant (00:16:23) Automatisation de la veille technologique (00:22:28) LLM spécialisés vs généraux (00:37:00) Ariga Atlas pour les bases de données Cet épisode spécial du Big Data Hebdo, enregistré à …
  continue reading
 
Dans cet épisode, on revient sur l’évolution de la data-ingénierie à travers deux outils : DBT et SQLMesh. Comment ces outils ont émergé avec la montée en puissance du SQL dans les architectures modernes ? Comment ils répondent aux enjeux de modélisation, d’industrialisation et de gouvernance de la donnée ? L’épisode est aussi l’occasion d’aborder …
  continue reading
 
Dans cet épisode du Big Data Hebdo, on fait le point sur le RAG (Retrieval-Augmented Generation) : est-il toujours au cœur des usages d’IA générative en entreprise, ou dépassé par les nouveaux paradigmes comme l’agentic AI ? Paul, Jérôme, Nicolas et Vincent reviennent sur : Les fondamentaux du RAG : pourquoi est-il apparu ? Comment fonctionne techn…
  continue reading
 
Dans cet épisode du Big Data Hebdo, 🎙️ j’ai eu le plaisir d’échanger avec Nicolas Korchia de Indexima, qui nous dévoile comment leur solution révolutionne la performance des requêtes analytiques sur Snowflake⚡ 👉 Indexima for Snowflake analyse les requêtes en temps réel et génère automatiquement des agrégats optimisés avec les Dynamic Tables, réduis…
  continue reading
 
🎙️ On plonge dans les séries temporelles et l’intégration SQL avec Warp 10, en compagnie de Mathias Herbert (Senx.io). 📊 SQL atteint vite ses limites face aux time series. Comment faire mieux sans exploser la facture cloud ? WarpLibapporte une solution en s’intégrant dans Databricks, Starburst et bientôt Snowflake ! Show notes et chapitres sur http…
  continue reading
 
Le BigDataHebdo reçoit Florian Caringi, responsable des plateformes Data & IA au sein du groupe BPCE. On discute de l'évolution des architectures Big Data, de Hadoop aux environnements hybrides et cloud, avec une adoption massive de Google Cloud (BigQuery, Vertex AI) pour des usages analytiques et data science. Florian partage son expérience sur le…
  continue reading
 
Le BigDataHebdo, reçoit Mehdi, Developer Advocate chez MotherDuck, pour explorer l’univers de DuckDB et MotherDuck. Au programme, les origines académiques de DuckDB, son évolution en tant que moteur SQL analytique performant, et son extension MotherDuck qui permet de l’utiliser comme un Data Warehouse en ligne. Show notes sur http://bigdatahebdo.co…
  continue reading
 
Dans cet épisode on revient brièvement sur l'année écoulée, et on vous parle de ce qu'on prévoit sur 2025. Evidement ces prédictions sont très tintées d'IA ! Retrouvez tous les épisodes avec leurs shownotes : https://bigdatahebdo.com/?src=shownotes ----------------- Cette publication est sponsorisée par Datatask (https://datatask.io/) et CerenIT (h…
  continue reading
 
Dans cet épisode on revient sur FoundationDB. FoundationDB est le socle de beaucoup de services (Icloud, Snowflake...) mais reste peu connue. Qui de mieux que l'équipe de spécialistes de Clever cloud qui l'a utilisé pour construire ses "Databases as a Service" pour en parler ? C'est donc un épisode conjoint avec leur podcast "Message à Caractère in…
  continue reading
 
Dans cet épisode on revient sur FoundationDB. FoundationDB est le socle de beaucoup de services (Icloud, Snowflake...) mais reste peu connue. Qui de mieux que l'équipe de spécialistes de Clever cloud qui l'a utilisé pour construire ses "Databases as a Service" pour en parler ? C'est donc un épisode conjoint avec leur podcast "Message à Caractère in…
  continue reading
 
Episode enregistré en Live au Salon de la Data et De l'IA de Nante en Septembre 2024. On débat de la Data-Quality avec la contribution du public. à retrouver aussi sur Youtube https://youtu.be/9_C6hbZpDrw Les shownotes de cet épisode sont à retrouver sur https://bigdatahebdo.com/podcast/episode-207-live-salon-data-ia/ Retrouvez tous les épisodes de…
  continue reading
 
Les shownotes de cet épisode sont à retrouver sur https://bigdatahebdo.com/podcast/episode-204-70-milliards-de-relections/ Retrouvez tous les épisodes de ce podcast sur https://bigdatahebdo.com Et sur la chaine Youtube ------------------ Cette publication est sponsorisée par Datatask et CerenIT. CerenIT vous accompagne pour concevoir, industrialise…
  continue reading
 
Les shownotes de cet épisode sont à retrouver sur https://bigdatahebdo.com/podcast/episode-203-pas-de-treve-olympique-pour-les-llms/ Retrouvez tous les épisodes de ce podcast sur https://bigdatahebdo.com ------------------ Cette publication est sponsorisée par Datatask et CerenIT. CerenIT vous accompagne pour concevoir, industrialiser ou automatise…
  continue reading
 
Retrouvez les shownotes de cet épisode sur https://bigdatahebdo.com/podcast/episode-202-data-architecture-avec-frederic-brossard-de-dcube/ ------------------ Cette publication est sponsorisée par Datatask et CerenIT. CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données tempor…
  continue reading
 
Retrouvez les liens de cet épisode dans les shownotes sur https://bigdatahebdo.com/podcast/episode-201-snowflake-summit-24-part-2-ml-et-genai/ ------------------ Cette publication est sponsorisée par Datatask et CerenIT. CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données te…
  continue reading
 
Retrouvez les liens de cet épisode dans les shownotes sur https://bigdatahebdo.com/podcast/episode-200-snowflake-summit-24-part-1-data-engineering/ ------------------ Cette publication est sponsorisée par Datatask et CerenIT. CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos donné…
  continue reading
 
Retrouvez les liens de cet épisode dans les shownotes sur https://bigdatahebdo.com/podcast/episode-199-databricks-dais-2024/ ------------------ Cette publication est sponsorisée par Datatask et CerenIT. CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez…
  continue reading
 
Retrouvez les liens de cet épisode dans les shownotes sur https://bigdatahebdo.com/podcast/episode-198-ia-gen-et-anssi/ ------------------ Cette publication est sponsorisée par Datatask et CerenIT. CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous…
  continue reading
 
Retrouvez les liens de cet épisode dans les shownotes sur https://bigdatahebdo.com/podcast/episode-197-gladia-avec-jean-louis-queguiner/ ------------------ Cette publication est sponsorisée par Datatask et CerenIT. CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporel…
  continue reading
 
Retrouvez les liens de cet épisode dans les shownotes sur https://bigdatahebdo.com/podcast/episode-196-python-news-et-autres/ ------------------ Cette publication est sponsorisée par Datatask et CerenIT. CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrive…
  continue reading
 
Retrouvez les liens de cet épisode dans les shownotes sur https://bigdatahebdo.com/podcast/episode-195-dbt-avec-florian-eiden ------------------ Cette publication est sponsorisée par Datatask et CerenIT. CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrive…
  continue reading
 
Retrouvez les liens de cet épisode dans les shownotes sur https://bigdatahebdo.com/podcast/episode-194-self-service-data-avec-tristan-mayer/ ------------------ Cette publication est sponsorisée par Datatask et CerenIT. CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temp…
  continue reading
 
Retrouvez les liens de cet épisode dans les shownotes sur https://bigdatahebdo.com/podcast/episode-193-microsoft-fabric-avec-marie-aubert ------------------ Cette publication est sponsorisée par Datatask et CerenIT. CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données tempore…
  continue reading
 
Retrouvez les liens de cet épisode dans les shownotes sur https://bigdatahebdo.com/podcast/episode-192-duckdb-et-autres-avec-christophe-blefari ------------------ Cette publication est sponsorisée par Datatask et CerenIT. CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données t…
  continue reading
 
Retrouvez les liens de cet épisode dans les shownotes sur https://bigdatahebdo.com/podcast/episode-191-popsink-avec-benjamin-djidi ------------------ Cette publication est sponsorisée par Datatask et CerenIT. CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. E…
  continue reading
 
Retrouvez les liens de cet épisode dans les shownotes sur https://bigdatahebdo.com/podcast/episode-190-databricks-dbrx-avec-quentin-ambard ------------------ Cette publication est sponsorisée par Datatask et CerenIT. CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données tempor…
  continue reading
 
Retrouvez les liens de cet épisode dans les shownotes sur https://bigdatahebdo.com/podcast/episode-189-la-compta-du-futur-et-autres-news/ ------------------ Cette publication est sponsorisée par Datatask et CerenIT. CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données tempore…
  continue reading
 
Retrouvez les liens de cet épisode dans les shownotes sur https://bigdatahebdo.com/podcast/episode-188-data-ops-avec-matthieu-rousseau/ ------------------ Cette publication est sponsorisée par Datatask et CerenIT. CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporell…
  continue reading
 
Retrouvez les liens de cet épisode dans les shownotes sur https://bigdatahebdo.com/podcast/episode-186-plus-jquery-que-terraform/ ------------------ Cette publication est sponsorisée par Datatask et CerenIT. CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ec…
  continue reading
 
* La Nuit de la Data et de l'IA - And the winners are... : -> https://www.republikgroup-it.fr/palmares-2024-tda * IA ACT * Probabl is a new AI company built around popular library scikit-learn -> https://techcrunch.com/2024/02/01/probabl-is-a-new-ai-company-built-around-popular-library-scikit-learn/ * From Silos to Standardization: Leveraging DBT f…
  continue reading
 
### Promptologues * How to Cut RAG Costs by 80% Using Prompt Compression -> https://towardsdatascience.com/how-to-cut-rag-costs-by-80-using-prompt-compression-877a07c6bedb * Prompt Compression avec LLMLingua -> https://github.com/microsoft/LLMLingua ### LLM Infra* Introducing Pinecone Serverless -> https://www.pinecone.io/blog/serverless/ * embedch…
  continue reading
 
### LLM fever* [GAIC-fr] Analyse des annonces IA de MS Ignite -> https://www.youtube.com/watch?v=rJTcJHh6bcY * LightOn annonce la seconde version d’Alfred, son modèle LLM open-source -> https://www.actuia.com/actualite/lighton-annonce-la-seconde-version-dalfred-son-modele-llm-open-source/ * Introducing Claude 2.1 -> https://www.anthropic.com/index/…
  continue reading
 
### LLM fever * Kyutai, le laboratoire d'intelligence artificielle en mode science ouverte -> https://www.sciencesetavenir.fr/high-tech/intelligence-artificielle/kyutai-le-laboratoire-d-intelligence-artificielle-en-mode-science-ouverte-qui-veut-concurrencer-les-gafam_175123 * ChatGPT Réinventé: comment le faire philosopher pour améliorer ses résult…
  continue reading
 
Loading …

Guide de référence rapide

Écoutez cette émission pendant que vous explorez
Lire