Le cours présente les technologies modernes pour le traitement de données massives. Il se concentre sur les principes du traitement de données distribuées, et s'appuie sur l’utilisation de librairies de calcul dans le cloud.
Connaissance des langages SQL et Python. Avoir suivi au moins un cours de bases de données relationnelles.