module #1 Introduction à l'ingénierie des données Vue d'ensemble de l'ingénierie des données, de son importance et de son rôle dans la science des données
module #2 Principes fondamentaux de l'ingénierie des données Principes de base du traitement, du stockage et de l'architecture des données
module #3 Modèles d'ingestion de données Conception et implémentation de pipelines d'ingestion de données
module #4 Options de stockage de données Bases de données relationnelles, bases de données NoSQL et entrepôt de données
module #5 Solutions de stockage Big Data HDFS, HBase et autres options de stockage Big Data
module #6 Principes fondamentaux du traitement des données Traitement par lots, traitement par flux et traitement en temps réel
module #7 Principes fondamentaux d'Apache Spark Introduction à Apache Spark, Spark Core et Spark SQL
module #8 Traitement par lots avec Apache Spark Cas d'utilisation et implémentations du traitement par lots avec Spark
module #9 Traitement par flux avec Apache Spark Cas d'utilisation et implémentations du traitement par flux avec Spark
module #10 Traitement en temps réel avec Apache Flink Introduction à Apache Flink et aux cas d'utilisation du traitement en temps réel
module #11 Data Pipelines et gestion des flux de travail Conception et implémentation de pipelines de données avec Apache Airflow et Apache NiFi
module #12 Qualité des données et gouvernance des données Mesures de qualité des données, gouvernance des données et lignage des données
module #13 Sécurité des données et contrôle d'accès Bonnes pratiques en matière de chiffrement, de contrôle d'accès et de sécurité des données
module #14 Ingénierie des données basée sur le cloud Ingénierie des données basée sur le cloud avec AWS, GCP et Azure
module #15 Conteneurisation et orchestration Conteneurisation avec Docker et orchestration avec Kubernetes
module #16 Surveillance et journalisation dans l'ingénierie des données Bonnes pratiques de surveillance et de journalisation dans l'ingénierie des données
module #17 Tests et validation dans l'ingénierie des données Stratégies de test et de validation pour les pipelines et systèmes de données
module #18 Ingénierie des données pour l'apprentissage automatique Ingénierie des données pour les modèles d'apprentissage automatique et les applications d'IA
module #19 Cas d'utilisation de l'ingénierie des données dans le monde réel Études de cas et Exemples concrets d'applications d'ingénierie des données
module #20 Outils et technologies d'ingénierie des données Enquête sur les outils et technologies d'ingénierie des données
module #21 Meilleures pratiques d'ingénierie des données Meilleures pratiques pour la conception, le développement et le déploiement de l'ingénierie des données
module #22 Ingénierie des données à grande échelle Considérations relatives à l'évolutivité et aux performances pour les systèmes d'ingénierie des données à grande échelle
module #23 Ingénierie des données pour la science des données Collaboration entre les ingénieurs de données et les scientifiques des données
module #24 Bilan et conclusion du cours Planifier les prochaines étapes de la carrière d'ingénieur des données