modulo #1 Introduzione ai Big Data Panoramica dei big data, delle sue caratteristiche e della sua importanza nelle aziende moderne
modulo #2 Fondamenti di Hadoop Introduzione a Hadoop, al suo ecosistema e ai componenti principali (HDFS, MapReduce, YARN)
modulo #3 HDFS (Hadoop Distributed File System) Esplorazione approfondita di HDFS, della sua architettura e delle strategie di archiviazione dei dati
modulo #4 Programmazione MapReduce Programmazione con MapReduce, inclusa la scrittura di mapper, reducer e driver
modulo #5 YARN (Yet Another Resource Negotiator) Comprensione di YARN, dei suoi componenti e della gestione delle risorse in Hadoop
modulo #6 Strumenti dell'ecosistema Hadoop Introduzione agli strumenti dell'ecosistema Hadoop come Hive, Pig e Sqoop
modulo #7 Hive (Hadoop SQL) Utilizzo di Hive per query di dati, data warehousing e SQL-like operations
modulo #8 Pig (linguaggio di programmazione) Utilizzo di Pig per elaborazione dati, flussi di dati e scripting procedurale
modulo #9 Sqoop (da SQL a Hadoop) Utilizzo di Sqoop per inserimento dati, trasferimento dati e integrazione dati
modulo #10 Database NoSQL Introduzione ai database NoSQL, ai loro tipi (chiave-valore, documento, grafico) e casi d'uso
modulo #11 HBase (database NoSQL distribuito) Utilizzo di HBase per archiviazione dati distribuita, scalabile e tollerante agli errori
modulo #12 Cassandra (database NoSQL distribuito) Utilizzo di Cassandra per archiviazione dati distribuita, altamente disponibile e scalabile
modulo #13 MongoDB (database NoSQL orientato ai documenti) Utilizzo di MongoDB per archiviazione dati e query flessibili basate su documenti
modulo #14 Fondamenti di Spark Introduzione ad Apache Spark, al suo ecosistema e ai componenti principali (Spark Core, Spark SQL, MLlib)
modulo #15 Programmazione Spark Programmazione con Spark, inclusa la scrittura di applicazioni Spark, RDD e DataFrame
modulo #16 Spark SQL e DataFrame Utilizzo di Spark SQL e DataFrame per query di dati, trasformazione di dati e analisi di dati
modulo #17 Spark MLlib (libreria di apprendimento automatico) Utilizzo di Spark MLlib per apprendimento automatico, data mining e analisi predittiva
modulo #18 Elaborazione dati in tempo reale con Spark Streaming Utilizzo di Spark Streaming per elaborazione dati in tempo reale, elaborazione in tempo evento e analisi di flusso
modulo #19 Kafka (piattaforma di streaming distribuita) Utilizzo di Kafka per streaming distribuito, architettura basata sugli eventi e pipeline di dati in tempo reale
modulo #20 Architettura e componenti di Kafka Esplorazione approfondita dell'architettura Kafka, broker, argomenti, partizioni e consumatori
modulo #21 Ingestione dati con Flume e NiFi Utilizzo di Flume e NiFi per ingestione dati, integrazione dati e analisi dati gestione del flusso
modulo #22 Sicurezza e governance dei Big Data Importanza della sicurezza, della governance e della conformità dei Big Data, tra cui crittografia dei dati, controllo degli accessi e auditing
modulo #23 Casi d'uso dei Big Data e applicazioni industriali Esplorazione dei casi d'uso dei Big Data e delle applicazioni industriali, tra cui IoT, sanità, finanza e vendita al dettaglio
modulo #24 Riepilogo e conclusione del corso Pianificare i prossimi passi nella carriera in Big Data Tools and Technologies