modulo #1 Introduzione all'ingegneria dei dati Panoramica sull'ingegneria dei dati, importanza e ruolo nella scienza dei dati
modulo #2 Fondamenti di ingegneria dei dati Elaborazione dei dati, archiviazione dei dati e nozioni di base sull'architettura dei dati
modulo #3 Modelli di inserimento dei dati Progettazione e implementazione di pipeline di acquisizione dati
modulo #4 Opzioni di archiviazione dei dati Database relazionali, database NoSQL e data warehousing
modulo #5 Soluzioni di archiviazione di Big Data HDFS, HBase e altri sistemi di archiviazione di Big Data options
modulo #6 Fondamenti di base sull'elaborazione dei dati Elaborazione in batch, elaborazione in flusso ed elaborazione in tempo reale
modulo #7 Fondamenti di base su Apache Spark Introduzione ad Apache Spark, Spark Core e Spark SQL
modulo #8 Elaborazione in batch con Apache Spark Casi d'uso e implementazioni dell'elaborazione in batch con Spark
modulo #9 Elaborazione in streaming con Apache Spark Casi d'uso e implementazioni dell'elaborazione in flusso con Spark
modulo #10 Elaborazione in tempo reale con Apache Flink Introduzione ad Apache Flink e casi d'uso dell'elaborazione in tempo reale
modulo #11 Pipeline di dati e gestione del flusso di lavoro Progettazione e implementazione di pipeline di dati con Apache Airflow e Apache NiFi
modulo #12 Qualità dei dati e governance dei dati Metriche di qualità dei dati, governance dei dati e derivazione dei dati
modulo #13 Sicurezza dei dati e controllo degli accessi Crittografia dei dati, controllo degli accessi e migliori pratiche di sicurezza
modulo #14 Ingegneria dei dati basata sul cloud Dati basati sul cloud engineering con AWS, GCP e Azure
modulo #15 Containerizzazione e orchestrazione Containerizzazione con Docker e orchestrazione con Kubernetes
modulo #16 Monitoraggio e registrazione nell'ingegneria dei dati Best practice per il monitoraggio e la registrazione nell'ingegneria dei dati
modulo #17 Test e validazione nell'ingegneria dei dati Strategie di test e validazione per pipeline e sistemi di dati
modulo #18 Ingegneria dei dati per l'apprendimento automatico Ingegneria dei dati per modelli di apprendimento automatico e applicazioni di intelligenza artificiale
modulo #19 Real- Casi d'uso dell'ingegneria dei dati nel mondo Casi di studio ed esempi reali di applicazioni di ingegneria dei dati
modulo #20 Strumenti e tecnologie di ingegneria dei dati Indagine sugli strumenti e sulle tecnologie di ingegneria dei dati
modulo #21 Migliori pratiche di ingegneria dei dati Best practice per la progettazione, lo sviluppo e l'implementazione dell'ingegneria dei dati
modulo #22 Ingegneria dei dati su scala Considerazioni su scalabilità e prestazioni per sistemi di ingegneria dei dati su larga scala
modulo #23 Ingegneria dei dati per la scienza dei dati Collaborazione tra ingegneri e scienziati dei dati
modulo #24 Riepilogo e conclusione del corso Pianificare i prossimi passi nella carriera di Data Engineering