mlops-zoomcamp - DataTalks.Club 提供的免费 MLOps 课程

Created at: 2021-10-21 17:35:28
Language: Jupyter Notebook

MLOps Zoomcamp

我们的 MLOps Zoomcamp 课程

概述

目的

教授生产 ML 服务的实际方面 — 从收集需求到模型部署和监控。

目标受众

数据科学家和 ML 工程师。软件工程师和数据工程师也有兴趣了解如何将ML投入生产。

先决条件

  • docker
  • 熟悉命令行
  • 之前接触过机器学习(在工作或其他课程中,例如从ML Zoomcamp)
  • 以前的编程经验(至少1年以上)

时间线

开课时间:5月16日

教学大纲

这是一个草案,将会改变。

模块 1: 简介

  • 什么是 MLOps
  • MLOps 成熟度模型
  • 运行示例:纽约出租车行程数据集
  • 为什么我们需要 MLOps
  • 课程概述
  • 环境准备
  • 作业

更多详情

模块 2: 实验跟踪

  • 实验跟踪简介
  • MLflow 入门
  • 使用 MLflow 进行实验跟踪
  • 使用 MLflow 保存和加载模型
  • 模型注册表
  • MLflow在实践中
  • 作业

模块 3: 编排和 ML 管道

  • ML 管道:简介
  • 完善
  • 将笔记本转换为管道
  • Kubeflow Pipelines
  • 作业

模块 4: 模型部署

  • 批处理与在线
  • 对于在线:Web 服务与流媒体
  • 以批处理模式提供模型
  • 网络服务
  • Streaming (Kinesis/SQS + AWS Lambda)
  • 作业

模块 5: 模型监控

  • ML 监控与软件监控
  • 数据质量监控
  • 数据漂移/概念漂移
  • 批量监控与实时监控
  • 工具:显然,普罗米修斯和格拉法娜
  • 作业

模块 6: 最佳实践

  • 开发运营
  • 虚拟环境和 Docker
  • Python:日志记录,linting
  • 测试:单元、集成、回归
  • CI/CD (github actions)
  • 基础设施即代码(地球化、云化)
  • 饼干切割机
  • 生成文件
  • 作业

模块 7: 流程

  • CRISP-DM, CRISP-ML
  • ML Canvas
  • 数据横向画布
  • MLOps Stack Canvas
  • ML 项目中的文档实践(模型卡工具包)

项目

  • 具有上述所有内容的端到端项目

运行示例

为了更轻松地将不同的模块连接在一起,我们希望在整个课程中使用相同的运行示例。

可能的候选人:

教师

  • 拉里萨·维森格列耶娃
  • 克里斯蒂安·马丁内斯
  • 科凯文
  • 西奥菲洛斯·帕帕纳吉奥图
  • 阿列克谢·格里戈列夫
  • 埃梅利德拉尔
  • 塞贾尔·瓦伊迪亚

DataTalks.Club 的其他课程:

常见问题

我想开始为课程做准备。我该怎么办?

如果你尚未使用 Flask 或 Docker

如果你以前没有使用 ML 的经验

  • 查看 ML Zoomcamp 中的模块 1 以获取概述
  • 如果你想学习Scikit-Learn,模块3也将有所帮助(我们将在本课程中使用它)
  • 我们还将使用 XGBoost。你不必很好地了解它,但是如果你想了解更多信息,请参阅ML Zoomcamp的模块6

我已注册,但尚未收到邀请链接。这正常吗?

是的,我们还没有自动化它。你最终会收到我们的邮件,别担心。

如果你想确保你不会错过任何东西:

它会直播吗?

否,是的。将有两个部分:

  • 讲座:预先录制,你可以在方便的时候观看。
  • 办公时间:每周一(欧洲中部时间17:00)直播,但录制,因此你可以稍后观看。

合作 伙伴

感谢我们的朋友传播有关课程的信息