Pour les demandes entreprises : (+971) 561803315

Pour les demandes particuliers : (+971) 561803315

A propos de la formation Formation Apache Spark 3.5 & Databricks

La formation Apache Spark 3.5 & Databricks permet de maîtriser le traitement Big Data moderne, l’analytics distribué et le Machine Learning à grande échelle. Elle s’appuie sur Apache Spark 3.5 (dernière version stable) et la plateforme Databricks (Lakehouse) utilisée en entreprise pour l’analyse avancée des données.

Détails
Objectifs pédagogiques de la formation Formation Apache Spark 3.5 & Databricks
  • Comprendre l’architecture Big Data et Spark Traiter de grands volumes de données avec Spark SQL Développer des applications Spark en Python (PySpark) Utiliser Databricks pour l’ingestion
  • le traitement et l’analytics Gérer les données avec Delta Lake Optimiser les performances et les coûts Mettre en œuvre des pipelines Data Engineering

Qui devrait suivre cette formation Formation Apache Spark 3.5 & Databricks ?

Public visé par la formation Formation Apache Spark 3.5 & Databricks

Data Engineers Data Analysts avancés Développeurs Big Data Ingénieurs BI & Analytics Responsables Data et IT

Prérequis de la formation Formation Apache Spark 3.5 & Databricks

Bonnes bases en SQL Connaissances en Python recommandées Notions de data analytics ou bases de données

Formations Similaires

Déroulé de la formation Formation Apache Spark 3.5 & Databricks


 

Module 1 : INtroduction au Big Data & Spark

Écosystème Big Data moderne

Architecture Apache Spark 3.5

Concepts RDD, DataFrames et Datasets

Module 2 : Spark SQL & DataFrames

Lecture et écriture des données

Requêtes SQL distribuées

Fonctions avancées et transformations

Module 3 : PySpark pour le Data Engineering

Développement avec PySpark

Traitement batch et streaming

Gestion des erreurs et bonnes pratiques

Module 4 : Databricks Platform

Présentation de Databricks Lakehouse

Notebooks, clusters et jobs

Gestion collaborative et versioning

Module 5 : Delta Lake & gestion des données

Architecture Delta Lake

ACID transactions

Versioning, Time Travel et optimisation

Module 6 : Spark Streaming

Structured Streaming

Ingestion temps réel

Cas d’usage streaming

Module 7 : Performance & optimisation

Partitionnement et caching

Tuning Spark 3.5

Gestion des ressources

Module 8 : Atelier pratique / Projet final

Création d’un pipeline Big Data complet

Ingestion, transformation et analytics
Exploitation sur Databricks

Formations Similaires
Qlikview Détails
Qlik Sense Détails
SAP HANA Détails
SAP BI(BO) Détails
Suite Microsoft (SSIS-SSAS-SSRS) Détails
Data Science Détails
Python Détails
Talend Détails
Microsoft BI (MCSE) Détails
Microsoft Power BI Détails
sap bi / bw Détails
Informatica PowerCenter Détails
Formation Big Data & machine learning Détails
Formation Machine Learning Supervisé et Non Supervisé Détails
Machine Learning pratique Détails
Business Data Analyst Détails
Finance Data Analyst (Power BI, Python pour Finance) Détails
Data Analysts – Analyse et Interprétation de Données Détails
Power BI Data Analyst Associate (PL-300) Détails
IIBA ECBA Détails
Formation Apache Spark 3.5 & Databricks Détails

Vous pouvez faire l’inscription ou la demande du devis avec un seul click