微软的 Azure 云倡导者很高兴提供为期 10 周、每节课、每节课的有关数据科学的课程。每节课都包括课前和课后测验、完成课程的书面说明、解决方案和作业。我们基于项目的教学法允许你在构建的同时学习,这是一种行之有效的新技能“坚持”的方式。
衷心感谢我们的作者:Jasmine Greenaway,Dmitry Soshnikov,Nitya Narasimhan,Jalen McGee,Jen Looper,Maud Levy,Tiffany Souterre,Christopher Harrison。
![]() |
---|
初学者的数据科学 - @nitya的 Sketchnote |
开始使用以下资源:
学生:要自行使用此课程,请分叉整个存储库并自行完成练习,从讲座前测验开始。然后阅读讲座并完成其余的活动。尝试通过理解课程而不是复制解决方案代码来创建项目;但是,该代码在每个面向项目的课程的 /solutions 文件夹中可用。另一个想法是与朋友组成一个学习小组,一起浏览内容。为了进一步学习,我们建议使用Microsoft Learn。
Mohit Jaisal 的 GIF
🎥 单击上面的图像以获取有关创建该项目的人的视频!
在构建此课程时,我们选择了两个教学原则:确保它基于项目并包括频繁的测验。在本系列结束时,学生将学习数据科学的基本原理,包括道德概念、数据准备、处理数据的不同方式、数据可视化、数据分析、数据科学的实际用例等。
此外,课前的低风险测验设定了学生学习主题的意图,而课后的第二次测验可确保进一步的保留。该课程设计灵活有趣,可以全部或部分进行。这些项目从小规模开始,到10周周期结束时变得越来越复杂。
关于测验的说明:所有测验都包含在此应用程序中,总共 40 个测验,每个测验三个问题。它们从课程内链接,但测验应用程序可以在本地运行;按照文件夹中的说明进行操作。它们正在逐渐本地化。
quiz-app
![]() |
---|
初学者数据科学:路线图 - @nitya的草图笔记 |
课数 | 主题 | 课程分组 | 学习目标 | 链接课程 | 作者 |
---|---|---|---|---|---|
01 | 定义数据科学 | 介绍 | 了解数据科学背后的基本概念及其与人工智能、机器学习和大数据的关系。 | 课程视频 | 德米特里 |
02 | 数据科学伦理 | 介绍 | 数据伦理概念、挑战和框架。 | 课 | 妮佳 |
03 | 定义数据 | 介绍 | 数据的分类方式及其共同来源。 | 课 | 茉莉花 |
04 | 统计学与概率导论 | 介绍 | 用于理解数据的概率和统计的数学技术。 | 课程视频 | 德米特里 |
05 | 使用关系数据 | 使用数据 | 介绍关系数据以及使用结构化查询语言(也称为 SQL)(发音为“see-quell”)探索和分析关系数据的基础知识。 | 课 | 克里斯托弗 |
06 | 使用 NoSQL 数据 | 使用数据 | 介绍非关系数据,其各种类型以及探索和分析文档数据库的基础知识。 | 课 | 茉莉花 |
07 | 使用蟒蛇 | 使用数据 | 使用 Python 通过 Pandas 等库进行数据探索的基础知识。建议对 Python 编程有基本的了解。 | 课程视频 | 德米特里 |
08 | 数据准备 | 使用数据 | 有关清理和转换数据以处理丢失、不准确或不完整数据的挑战的数据技术的主题。 | 课 | 茉莉花 |
09 | 可视化数量 | 数据可视化 | 了解如何使用 Matplotlib 可视化鸟类数据 |
课 | 珍 |
10 | 可视化数据分布 | 数据可视化 | 可视化区间内的观测值和趋势。 | 课 | 珍 |
11 | 可视化比例 | 数据可视化 | 可视化离散百分比和分组百分比。 | 课 | 珍 |
12 | 可视化关系 | 数据可视化 | 可视化数据集及其变量之间的联系和相关性。 | 课 | 珍 |
13 | 有意义的可视化 | 数据可视化 | 使可视化对有效解决问题和见解有价值的技术和指南。 | 课 | 珍 |
14 | 数据科学生命周期简介 | 生命周期 | 介绍数据科学生命周期及其获取和提取数据的第一步。 | 课 | 茉莉花 |
15 | 分析 | 生命周期 | 数据科学生命周期的这一阶段侧重于分析数据的技术。 | 课 | 茉莉花 |
16 | 通信 | 生命周期 | 数据科学生命周期的这一阶段侧重于以更易于决策者理解的方式呈现来自数据的见解。 | 课 | 杰伦 |
17 | 云中的数据科学 | 云数据 | 本系列课程介绍了云中的数据科学及其优势。 | 课 | 蒂芙尼和莫德 |
18 | 云中的数据科学 | 云数据 | 使用低代码工具训练模型。 | 课 | 蒂芙尼和莫德 |
19 | 云中的数据科学 | 云数据 | 使用 Azure 机器学习工作室部署模型。 | 课 | 蒂芙尼和莫德 |
20 | 野外数据科学 | 在野外 | 现实世界中的数据科学驱动的项目。 | 课 | 妮佳 |
按照以下步骤在代码空间中打开此示例:
按照以下步骤使用本地计算机在容器中打开此存储库,并使用 VS Code Remote - 容器扩展打开 VSCode:
要使用此存储库,你可以在隔离的 Docker 卷中打开存储库:
注意:在后台,这将使用远程容器:在容器卷中克隆存储库...命令在Docker卷而不是本地文件系统中克隆源代码。卷是保存容器数据的首选机制。
或者打开本地克隆或下载的存储库版本:
你可以使用 Docsify 脱机运行本文档。分叉此存储库,在本地计算机上安装 Docsify,然后在此存储库的根文件夹中键入 。该网站将在本地主机上的端口 3000 上提供服务:。
docsify serve
localhost:3000
请注意,笔记本不会通过 Docsify 呈现,因此当你需要运行笔记本时,请在运行 Python 内核的 VS Code 中单独执行此操作。
如果你想翻译全部或部分课程,请按照我们的翻译指南进行操作
我们的团队制作其他课程!退房: