модуль #1 Введение в большие данные Определение больших данных, их характеристик и важности для принятия бизнес-решений
модуль #2 Обзор аналитики больших данных Понимание различных типов аналитики и роли аналитики больших данных в business
модуль #3 Технологии больших данных Обзор баз данных Hadoop, Spark, NoSQL и других технологий больших данных
модуль #4 Экосистема Hadoop Углубленный взгляд на Hadoop, включая HDFS, MapReduce и YARN
модуль #5 Основы Spark Введение в Apache Spark, его архитектуру и варианты использования
модуль #6 Базы данных NoSQL Понимание различных типов баз данных NoSQL, включая базы данных«ключ-значение», документальные и графовые базы данных
модуль #7 Прием и обработка данных Сбор, обработка и хранение больших данных с использованием таких инструментов, как Flume, Kafka и NiFi
модуль #8 Хранение и управление данными Проектирование и внедрение решений для хранения данных с использованием HDFS, HBase и Cassandra
модуль #9 Хранилище данных и ETL Создание хранилищ данных и выполнение операций ETL (извлечение, преобразование, загрузка)
модуль #10 Инструменты анализа больших данных Обзор инструментов анализа больших данных, включая Hive , Pig и Spark SQL
модуль #11 Основы машинного обучения Введение в концепции машинного обучения, включая обучение с учителем и без учителя
модуль #12 Машинное обучение с помощью Spark Построение моделей машинного обучения с использованием Spark MLlib и Spark ML»
модуль #13 Глубокое обучение с большими данными Введение в концепции и методы глубокого обучения, включая нейронные сети и сверточные нейронные сети
модуль #14 Текстовая аналитика и НЛП Анализ и обработка неструктурированных данных с использованием обработки естественного языка ( НЛП)
модуль #15 Визуализация данных для больших данных Визуализация аналитических данных больших данных с помощью таких инструментов, как Tableau, Power BI и D3.js
модуль #16 Случаи использования и приложения больших данных Изучение реального мира варианты использования и применения анализа больших данных в различных отраслях
модуль #17 Безопасность и управление большими данными Обеспечение безопасности, конфиденциальности и соответствия данным в средах больших данных
модуль #18 Аналитика больших данных с помощью Python Использование Python для анализа больших данных, включая манипулирование данными, визуализацию и машинное обучение
модуль #19 Аналитика больших данных с R Использование R для анализа больших данных, включая манипулирование данными, визуализацию и машинное обучение
модуль #20 Большой Аналитика данных в облаке Развертывание аналитики больших данных на облачных платформах, включая AWS, Azure и GCP
модуль #21 Аналитика больших данных в реальном времени Разработка и внедрение решений для анализа больших данных в реальном времени с использованием таких инструментов, как Apache Storm и Apache Flink
модуль #22 Качество и управление большими данными Обеспечение качества, целостности и управления данными в средах больших данных
модуль #23 Примеры анализа больших данных Изучение практических примеров и истории успеха анализа больших данных в различных отраслях
модуль #24 Лучшие практики в области анализа больших данных Лучшие практики и рекомендации по реализации проектов в области анализа больших данных
модуль #25 Подведение итогов и заключение курса Планирование следующих шагов в карьере аналитика больших данных