学徒模式
10 模块 / ~100 页面
巫师模式
~25 模块 / ~400 页面
数据科学云基础设施
( 25 模块 )
模块 #1
云计算简介
云计算概述,优势和关键概念
模块 #2
云提供商概述
主要云提供商比较(AWS,Azure,GCP,IBM Cloud)
模块 #3
云安全基础知识
云中的安全问题,最佳实践和合规性
模块 #4
云中的数据科学
基于云的数据科学的优势,常见用例
模块 #5
云存储选项
云存储服务概述(S3,Blob 存储,云存储)
模块 #6
数据提取和处理
在云中提取和处理大型数据集(Kinesis,Event Hubs,Cloud Pub/Sub)
模块 #7
基于云的数据仓库
基于云的数据仓库解决方案(Redshift,BigQuery,Synapse)
模块 #8
基于云的机器学习
基于云的机器学习服务概述(SageMaker,Azure Machine Learning, AutoML)
模块 #9
数据科学的容器化
使用容器 (Docker) 实现可重现的数据科学工作流
模块 #10
基于云的容器编排
在云中编排容器 (Kubernetes,ECS,ACI)
模块 #11
数据科学的无服务器计算
数据科学中的无服务器计算概念和应用
模块 #12
基于云的数据可视化
基于云的数据可视化工具和服务 (Tableau,Power BI,D3.js)
模块 #13
云中的大数据分析
在云中处理和分析大数据 (Hadoop,Spark,HBase)
模块 #14
基于云的自然语言处理
基于云的 NLP 服务和应用程序 (NLTK,spaCy,Stanford CoreNLP)
模块 #15
基于云的计算机视觉
基于云的计算机视觉服务和应用程序 (OpenCV,TensorFlow,PyTorch)
模块 #16
云成本优化策略
优化数据科学工作负载的云成本
模块 #17
数据科学的云架构
为数据科学工作负载设计可扩展且高效的云架构
模块 #18
基于云的协作和版本控制
云端数据科学团队的协作和版本控制工具 (GitHub,GitLab,Bitbucket)
模块 #19
基于云的监控和日志记录
基于云的数据科学工作负载的监控和日志记录工具
模块 #20
基于云的备份和恢复
基于云的数据科学工作负载的备份和恢复策略
模块 #21
数据科学的云安全
云端数据科学工作负载的安全最佳实践
模块 #22
云合规性和治理
基于云的数据科学工作负载的合规性和治理注意事项
模块 #23
将数据科学工作负载迁移到云
将本地数据科学工作负载迁移到云的策略
模块 #24
构建基于云的数据科学团队
构建基于云的数据科学团队的组织考虑因素
模块 #25
课程总结与结论
规划数据科学职业云基础设施的下一步