moduł #1 Wprowadzenie do Big Data Przegląd Big Data, jego charakterystyki i znaczenie w nowoczesnych obliczeniach
moduł #2 Wyzwania w przetwarzaniu Big Data Dyskusja na temat wyzwań w przetwarzaniu i analizowaniu Big Data, w tym skalowalność, szybkość i różnorodność
moduł #3 Przegląd narzędzi do przetwarzania Big Data Wprowadzenie do popularnych narzędzi do przetwarzania Big Data, w tym baz danych Hadoop, Spark i NoSQL
moduł #4 Programowanie MapReduce Wprowadzenie do programowania MapReduce, w tym koncepcje mappera, reducera i combinera
moduł #5 Ekosystem Hadoop Przegląd ekosystemu Hadoop, w tym HDFS, YARN i Hive
moduł #6 Podstawy Spark Wprowadzenie do Apache Spark, w tym Resilient Distributed Datasets (RDD) i DataFrames
moduł #7 Spark SQL i DataFrames Szczegółowe spojrzenie na Spark SQL i DataFrames, w tym przetwarzanie danych i zapytania
moduł #8 Spark Streaming Wprowadzenie do Spark Streaming, w tym przetwarzanie danych w czasie rzeczywistym i przetwarzanie w czasie zdarzeń
moduł #9 Podstawy baz danych NoSQL Wprowadzenie do baz danych NoSQL, w tym bazy klucz-wartość, dokumentowe i grafowe
moduł #10 Projektowanie skalowalnych systemów Zasady i najlepsze praktyki projektowania skalowalnych systemów do przetwarzania dużych zbiorów danych
moduł #11 Architektura systemów rozproszonych Przegląd architektury systemów rozproszonych, w tym master-slave, peer-to-peer i mikrousługi
moduł #12 Techniki algorytmiczne dla dużych zbiorów danych Wprowadzenie do technik algorytmicznych dla dużych zbiorów danych, w tym filtrowanie, próbkowanie i agregacja
moduł #13 Kompresja i kodowanie danych Techniki kompresji i kodowania danych, w tym kodowanie Huffmana i kompresja LZW
moduł #14 Szkicowanie danych i Aproksymacja Przegląd szkicowania danych i technik aproksymacji, w tym filtry Blooma i szkice Count-Min
moduł #15 Klastrowanie i klasyfikacja Wprowadzenie do algorytmów klasteryzacji i klasyfikacji dla dużych zbiorów danych, w tym k-means i drzewa decyzyjne
moduł #16 Przetwarzanie grafów i analiza sieci Przegląd przetwarzania grafów i analizy sieci, w tym GraphX i NetworkX
moduł #17 Wykrywanie anomalii i analiza wartości odstających Wprowadzenie do wykrywania anomalii i analizy wartości odstających, w tym podejścia statystyczne i uczenia maszynowego
moduł #18 Wizualizacja dużych zbiorów danych Przegląd wizualizacji dużych zbiorów danych, w tym narzędzia wizualizacyjne i najlepsze praktyki
moduł #19 Analiza w czasie rzeczywistym i IoT Wprowadzenie do analizy w czasie rzeczywistym i IoT, w tym przetwarzanie strumieniowe i przetwarzanie brzegowe
moduł #20 Bezpieczeństwo i zarządzanie w dużych zbiorach danych Przegląd bezpieczeństwa i zarządzania w dużych zbiorach danych, w tym szyfrowanie danych i kontrola dostępu
moduł #21 Big Data Studia przypadków dotyczące danych Studia przypadków z życia wzięte dotyczące przetwarzania i analizy dużych zbiorów danych w różnych branżach
moduł #22 Skalowanie w górę i w dół Najlepsze praktyki skalowania w górę i w dół systemów dużych zbiorów danych, w tym równoważenie obciążenia i automatyczne skalowanie
moduł #23 Testowanie i debugowanie systemów dużych zbiorów danych Wprowadzenie do testowania i debugowania systemów dużych zbiorów danych, w tym testowanie jednostkowe i testowanie integracyjne
moduł #24 Etyka i odpowiedzialność społeczna dużych zbiorów danych Dyskusja na temat etyki i odpowiedzialności społecznej dużych zbiorów danych, w tym prywatności i uczciwości danych
moduł #25 Podsumowanie i zakończenie kursu Planowanie kolejnych kroków w karierze w zakresie algorytmów przetwarzania dużych zbiorów danych