Pour les demandes entreprises : (+33) 970 466 303

Pour les demandes particuliers : (+33) 180 272 016

A propos de la formation Apache Spark 3.5 & Databricks

La formation Apache Spark 3.5 & Databricks permet de maîtriser le traitement Big Data moderne, l’analytics distribué et le Machine Learning à grande échelle. Elle s’appuie sur Apache Spark 3.5 (dernière version stable) et la plateforme Databricks (Lakehouse) utilisée en entreprise pour l’analyse avancée des données.

Détails
Objectifs pédagogiques de la formation Apache Spark 3.5 & Databricks
  • Comprendre l’architecture Big Data et Spark Traiter de grands volumes de données avec Spark SQL Développer des applications Spark en Python (PySpark) Utiliser Databricks pour l’ingestion
  • le traitement et l’analytics Gérer les données avec Delta Lake Optimiser les performances et les coûts Mettre en œuvre des pipelines Data Engineering

Qui devrait suivre cette formation Apache Spark 3.5 & Databricks ?

Public visé par la formation Apache Spark 3.5 & Databricks

Data Engineers Data Analysts avancés Développeurs Big Data Ingénieurs BI & Analytics Responsables Data et IT

Prérequis de la formation Apache Spark 3.5 & Databricks

Bonnes bases en SQL Connaissances en Python recommandées Notions de data analytics ou bases de données

Formations Similaires

Déroulé de la formation Apache Spark 3.5 & Databricks



Module 1 : Introduction au Big Data & Spark
Écosystème Big Data moderne
Architecture Apache Spark 3.5
Concepts RDD, DataFrames et Datasets

Module 2 : Spark SQL & DataFrames
Lecture et écriture des données
Requêtes SQL distribuées
Fonctions avancées et transformations

Module 3 : PySpark pour le Data Engineering
Développement avec PySpark
Traitement batch et streaming
Gestion des erreurs et bonnes pratiques

Module 4 : Databricks Platform
Présentation de Databricks Lakehouse
Notebooks, clusters et jobs
Gestion collaborative et versioning

Module 5 : Delta Lake & gestion des données
Architecture Delta Lake
ACID transactions
Versioning, Time Travel et optimisation

Module 6 : Spark Streaming
Structured Streaming
Ingestion temps réel
Cas d’usage streaming

Module 7 : Performance & optimisation
Partitionnement et caching
Tuning Spark 3.5
Gestion des ressources

Module 8 : Atelier pratique / Projet final
Création d’un pipeline Big Data complet
Ingestion, transformation et analytics
Exploitation sur Databricks
 

Formations Similaires
Qlikview Détails
Qlik Sense Détails
SAP HANA Détails
SAP BI(BO) Détails
Suite Microsoft (SSIS-SSAS-SSRS) Détails
Data Science Détails
Python Détails
Talend Détails
Microsoft BI (MCSE) Détails
Microsoft Power BI Détails
sap bi / bw Détails
Informatica PowerCenter Détails
Big Data & machine learning Détails
Machine Learning Supervisé et Non Supervisé Détails
Machine Learning pratique Détails
Business Data Analyst Détails
Finance Data Analyst (Power BI, Python pour Finance) Détails
Data Analysts – Analyse et Interprétation de Données Détails
Power BI Data Analyst Associate (PL-300) Détails
IIBA ECBA Détails
Apache Spark 3.5 & Databricks Détails

Vous pouvez faire l’inscription ou la demande du devis avec un seul click