module #1 Inleiding tot Big Data en Data Lakes Overzicht van big data, data lakes en hun belang in moderne data-analyse
module #2 Data Lake-architectuur Inzicht in de componenten en architectuur van een data lake, inclusief opname-, opslag- en verwerkingslagen
module #3 Opties voor Big Data-opslag Vergelijking van opties voor big data-opslag, inclusief HDFS-, HBase-, Cassandra- en NoSQL-databases
module #4 Data Lake-opslag Diepgaande duik in opties voor data lake-opslag, inclusief objectopslag (bijv. S3, Azure Blob), bestandssystemen en kolomopslag
module #5 Data-opname en -verwerking Overzicht van concepten voor gegevensopname en -verwerking, inclusief batch- en streamverwerking en gegevenspijplijnen
module #6 Apache NiFi en Apache Beam Praktische introductie tot Apache NiFi en Apache Beam voor het bouwen van gegevens pijpleidingen
module #7 Datacatalogi en metadatabeheer Het belang van datacatalogi en metadatabeheer in data lakes begrijpen, inclusief data governance en kwaliteit
module #8 Apache Hive en Presto Inleiding tot Apache Hive en Presto voor het opvragen en analyseren van data in data lakes
module #9 Data Lake-beveiliging en -beheer Best practices voor het beveiligen en beheren van data lakes, inclusief toegangscontrole, encryptie en auditing
module #10 Datakwaliteit en validatie Strategieën voor het waarborgen van datakwaliteit en validatie in data lakes, inclusief dataprofilering en datareiniging
module #11 Data Lake-beheer en -bewaking Overzicht van data lake-beheer en -bewaking, inclusief clusterbeheer en prestatie-optimalisatie
module #12 Cloudgebaseerde data lakes Cloudgebaseerde data lakes verkennen, inclusief AWS Lake Formation, Azure Data Lake en Google Cloud Data Lake
module #13 On-Premises Data Lakes Bouwen en beheren van on-premises data lakes, inclusief hardware- en softwareoverwegingen
module #14 Hybride en Edge Data Lakes Ontwerpen en implementeren van hybride en edge data lakes, inclusief use cases en architecturen
module #15 Data Lake Use Cases en Toepassingen Verkennen van real-world use cases en toepassingen van data lakes, inclusief customer 360, IoT en machine learning
module #16 Data Lake Optimalisatie en Afstemming Best practices voor het optimaliseren en afstemmen van data lakes, inclusief queryoptimalisatie en opslagoptimalisatie
module #17 Data Lake Governance en Compliance Zorgen voor data lake governance en compliance, inclusief gegevensprivacy, beveiliging en wettelijke vereisten
module #18 Data Lake Architectuurpatronen Ontwerppatronen voor data lake-architectuur, inclusief lambda-, kappa- en mediatorpatronen
module #19 Real-Time Gegevensverwerking en Analytics Streamverwerking en realtimeanalyse in data lakes, inclusief Apache Kafka en Apache Flink
module #20 Datavisualisatie en rapportage Visualiseren en rapporteren van gegevens in data lakes, inclusief Tableau, Power BI en D3.js
module #21 Machine learning en AI op data lakes Machine learning- en AI-modellen bouwen op data lakes, inclusief gegevensvoorbereiding en modelimplementatie
module #22 Data lake-migratie en -integratie Data lakes migreren en integreren met bestaande systemen, inclusief datawarehouse- en ETL-integratie
module #23 Data lake-kostenoptimalisatie en ROI Kosten optimaliseren en ROI in data lakes meten, inclusief kostenanalyse en TCO-berekening
module #24 Best practices en probleemoplossing voor data lakes Best practices voor het ontwerp, de implementatie en het oplossen van problemen met data lakes, inclusief veelvoorkomende valkuilen en oplossingen
module #25 Cursus samenvatting en conclusie Plannen van de volgende stappen in Big Data-opslag en -beheer in Data Lakes-carrière