A propos de la formation Apache Spark 3.5 & Databricks

La formation Apache Spark 3.5 & Databricks permet de maîtriser le traitement Big Data moderne, l’analytics distribué et le Machine Learning à grande échelle. Elle s’appuie sur Apache Spark 3.5 (dernière version stable) et la plateforme Databricks (Lakehouse) utilisée en entreprise pour l’analyse avancée des données.

Détails

Categorie : BI & Big Data
Duree : 5 jours

Objectifs pédagogiques de la formation Apache Spark 3.5 & Databricks

Comprendre l’architecture Big Data et Spark Traiter de grands volumes de données avec Spark SQL Développer des applications Spark en Python (PySpark) Utiliser Databricks pour l’ingestion

le traitement et l’analytics Gérer les données avec Delta Lake Optimiser les performances et les coûts Mettre en œuvre des pipelines Data Engineering

Qui devrait suivre cette formation Apache Spark 3.5 & Databricks ?

Public visé par la formation Apache Spark 3.5 & Databricks

Data Engineers Data Analysts avancés Développeurs Big Data Ingénieurs BI & Analytics Responsables Data et IT

Prérequis de la formation Apache Spark 3.5 & Databricks

Bonnes bases en SQL Connaissances en Python recommandées Notions de data analytics ou bases de données

Formations Similaires

Qlikview Détails
Qlik Sense Détails
SAP HANA Détails
SAP BI(BO) Détails
Suite Microsoft (SSIS-SSAS-SSRS) Détails
Data Science Détails
Python Détails
Talend Détails
Microsoft BI (MCSE) Détails
Microsoft Power BI Détails
sap bi / bw Détails
Informatica PowerCenter Détails
Big Data & machine learning Détails
Machine Learning Supervisé et Non Supervisé Détails
Machine Learning pratique Détails
Business Data Analyst Détails
Finance Data Analyst (Power BI, Python pour Finance) Détails
Data Analysts – Analyse et Interprétation de Données Détails
Power BI Data Analyst Associate (PL-300) Détails
IIBA ECBA Détails
Apache Spark 3.5 & Databricks Détails

Déroulé de la formation Apache Spark 3.5 & Databricks

Module 1 : Introduction au Big Data & Spark
Écosystème Big Data moderne
Architecture Apache Spark 3.5
Concepts RDD, DataFrames et Datasets

Module 2 : Spark SQL & DataFrames
Lecture et écriture des données
Requêtes SQL distribuées
Fonctions avancées et transformations

Module 3 : PySpark pour le Data Engineering
Développement avec PySpark
Traitement batch et streaming
Gestion des erreurs et bonnes pratiques

Module 4 : Databricks Platform
Présentation de Databricks Lakehouse
Notebooks, clusters et jobs
Gestion collaborative et versioning

Module 5 : Delta Lake & gestion des données
Architecture Delta Lake
ACID transactions
Versioning, Time Travel et optimisation

Module 6 : Spark Streaming
Structured Streaming
Ingestion temps réel
Cas d’usage streaming

Module 7 : Performance & optimisation
Partitionnement et caching
Tuning Spark 3.5
Gestion des ressources

Module 8 : Atelier pratique / Projet final
Création d’un pipeline Big Data complet
Ingestion, transformation et analytics
Exploitation sur Databricks

Formations Similaires

Qlikview Détails

Qlik Sense Détails

SAP HANA Détails

SAP BI(BO) Détails

Suite Microsoft (SSIS-SSAS-SSRS) Détails

Data Science Détails

Python Détails

Talend Détails

Microsoft BI (MCSE) Détails

Microsoft Power BI Détails

sap bi / bw Détails

Informatica PowerCenter Détails

Big Data & machine learning Détails

Machine Learning Supervisé et Non Supervisé Détails

Machine Learning pratique Détails

Business Data Analyst Détails

Finance Data Analyst (Power BI, Python pour Finance) Détails

Data Analysts – Analyse et Interprétation de Données Détails

Power BI Data Analyst Associate (PL-300) Détails

IIBA ECBA Détails

Apache Spark 3.5 & Databricks Détails

Catégorie

BI & Big Data

Durée

5 jours

Nous contacter

Votre Nom / Nom Entreprise

Telephone

Lieu souhaité pour la formation :

Comment nous avez-vous connu ?

Message

Formation Apache Spark 3.5 & Databricks

A propos de la formation Apache Spark 3.5 & Databricks

Qui devrait suivre cette formation Apache Spark 3.5 & Databricks ?

Déroulé de la formation Apache Spark 3.5 & Databricks