moduuli #1 Introduction to Big Data and Data Lakes Big datan, datalakkien yleiskatsaus ja niiden merkitys nykyaikaisessa data-analytiikassa
moduuli #2 Data Lake Architecture Data Laken komponenttien ja arkkitehtuurin ymmärtäminen, mukaan lukien tiedonkeruu , tallennus- ja käsittelykerrokset
moduuli #3 Big Data Storage Options Suurten tietojen tallennusvaihtoehtojen vertailu, mukaan lukien HDFS-, HBase-, Cassandra- ja NoSQL-tietokannat
moduuli #4 Data Lake Storage Syvä sukellus Data Lake -tallennusvaihtoehtoihin, mukaan lukien objektivarastot (esim. S3, Azure Blob), tiedostojärjestelmät ja saraketallennus
moduuli #5 Datan käsittely ja käsittely Yleiskatsaus tietojen käsittely- ja käsittelykonsepteihin, mukaan lukien erä- ja stream-käsittely, ja dataputket
moduuli #6 Apache NiFi ja Apache Beam Käytännön esittely Apache NiFi:stä ja Apache Beamista dataputkien rakentamiseen
moduuli #7 Data Catalogs and Metadata Management Dataluetteloiden tärkeyden ymmärtäminen ja metatietojen hallinta datajärvissä, mukaan lukien tietojen hallinta ja laatu
moduuli #8 Apache Hive ja Presto Johdatus Apache Hiveen ja Prestoon datajärvissä olevien tietojen kyselyyn ja analysointiin
moduuli #9 Data Lake Security and Governance Parhaat käytännöt datalakkien suojaamiseen ja hallintaan, mukaan lukien kulunvalvonta, salaus ja auditointi
moduuli #10 Datan laatu ja validointi Strategiat tietojen laadun ja validoinnin varmistamiseen datajärvissä, mukaan lukien datan profilointi ja tietojen puhdistaminen
moduuli #11 Data Laken hallinta ja valvonta Yleistietojärven hallinnasta ja seurannasta, mukaan lukien klusterin hallinta ja suorituskyvyn optimointi
moduuli #12 Pilvipohjaiset datajärvet Pilvipohjaisten datajärvien tutkiminen, mukaan lukien AWS Lake Formation, Azure Data Lake ja Google Cloud Data Lake
moduuli #13 On-Premises Data Lakes Omalaisten datajärvien rakentaminen ja hallinta, mukaan lukien laitteisto- ja ohjelmistonäkökohdat
moduuli #14 Hybridi- ja Edge Data Lakes Suunnittelu ja käyttöönotto hybridi- ja reunatietojärvet, mukaan lukien käyttötapaukset ja arkkitehtuurit
moduuli #15 Data Lake -käyttötapaukset ja -sovellukset Datalakkien todellisten käyttötapausten ja sovellusten tutkiminen, mukaan lukien asiakkaan 360, IoT ja koneoppiminen
moduuli #16 Data Lake Optimization and Tuning Parhaat käytännöt datalakkien optimointiin ja virittämiseen, mukaan lukien kyselyn optimointi ja tallennusoptimointi
moduuli #17 Data Laken hallinto ja vaatimustenmukaisuus Data Laken hallinnan ja vaatimustenmukaisuuden varmistaminen, mukaan lukien tietosuoja, turvallisuus, ja lakisääteiset vaatimukset
moduuli #18 Data Lake -arkkitehtuurimallit Data Lake -arkkitehtuurin suunnittelumallit, mukaan lukien lambda-, kappa- ja välitysmallit
moduuli #19 Reaaliaikainen tietojenkäsittely ja analytiikka Stream-käsittely ja reaaliaikainen aika-analytiikka datajärvissä, mukaan lukien Apache Kafka ja Apache Flink
moduuli #20 Datan visualisointi ja raportointi Datalakkien visualisointi ja raportointi, mukaan lukien Tableau, Power BI ja D3.js
moduuli #21 Machine Learning ja AI on Data Lakes Koneoppimisen ja tekoälymallien rakentaminen datajärville, mukaan lukien tietojen valmistelu ja mallin käyttöönotto
moduuli #22 Data Lake Migration and Integration Datajärvien siirto ja integrointi olemassa oleviin järjestelmiin, mukaan lukien tietovarasto ja ETL integraatio
moduuli #23 Data Laken kustannusten optimointi ja sijoitetun pääoman tuottoprosentti Datajärven kustannusten optimointi ja ROI-mittaus, mukaan lukien kustannusanalyysi ja TCO-laskenta
moduuli #24 Data Laken parhaat käytännöt ja vianetsintä Data Laken suunnittelun parhaat käytännöt , käyttöönotto ja vianetsintä, mukaan lukien yleiset sudenkuopat ja ratkaisut
moduuli #25 Kurssin yhteenveto ja johtopäätökset Big Data Storage and Managementin tulevien vaiheiden suunnittelu Data Lakes -uralla