Ci-dessous, les différences entre deux révisions de la page.
Les deux révisions précédentesRévision précédente | |||
formations:masters:ue:m1:tbd8 [2025/08/22 09:42] – supprimée - modification externe (Date inconnue) 127.0.0.1 | formations:masters:ue:m1:tbd8 [2025/08/22 09:42] (Version actuelle) – ↷ Page déplacée de formations:masters:ue:cours:m1:tbd8 à formations:masters:ue:m1:tbd8 treinen | ||
---|---|---|---|
Ligne 1: | Ligne 1: | ||
+ | ~~NOTOC~~ | ||
+ | |||
+ | |||
+ | ====== Technologies Big Data ====== | ||
+ | |||
+ | |||
+ | ===== Description ===== | ||
+ | |||
+ | Le cours présente les technologies modernes pour le traitement de données massives. | ||
+ | Il se concentre sur les principes du traitement de données distribuées, | ||
+ | |||
+ | ===== Syllabus ===== | ||
+ | |||
+ | - Introduction au Big Data : limites des systèmes classiques de traitement des données | ||
+ | - Traitement (centralisé) de jeux de données de moyenne taille | ||
+ | * numpy et pandas | ||
+ | - Introduction au traitement des données distribuées | ||
+ | * Hadoop et Map Reduce | ||
+ | - Traitement distribué de données massives en mémoire centrale : Spark | ||
+ | - Modèles de données distribuées de Spark : RDDs, Dataframes | ||
+ | - Spark SQL | ||
+ | - Structure interne et optimisation de Spark | ||
+ | |||
+ | |||
+ | ===== Pré-requis ===== | ||
+ | Connaissance des langages SQL et Python. Avoir suivi au moins un cours de bases de données relationnelles. | ||
+ | |||