Data-Science-For-Beginners - 供为期 10 周、20 节课的关于数据科学的课程。

Created at: 2021-03-04 00:30:15
Language: Jupyter Notebook
License: MIT

初学者数据科学 - 课程

在 GitHub 代码空间中打开

GitHub 许可证 GitHub 贡献者 GitHub 问题 GitHub 拉取请求 欢迎公关

GitHub 观察者 GitHub 分叉 GitHub 明星

微软的 Azure 云倡导者很高兴提供为期 10 周、每节课、每节课的有关数据科学的课程。每节课都包括课前和课后测验、完成课程的书面说明、解决方案和作业。我们基于项目的教学法允许你在构建的同时学习,这是一种行之有效的新技能“坚持”的方式。

衷心感谢我们的作者:Jasmine GreenawayDmitry SoshnikovNitya NarasimhanJalen McGeeJen LooperMaud LevyTiffany SouterreChristopher Harrison

🙏 特别感谢🙏我们的微软学生大使作者、审稿人和内容贡献者,特别是Aaryan Arora,Aditya GargAlondra SanchezAnkita SinghAnupam MishraArpita Das,ChhailBihari Dubey,Dibri NsoforDishita BhasinMajd SafiMax BlumMiguel CorreaMohamma Iftekher (Iftu) Ebne Jalal瑙林·塔巴苏姆、雷蒙德·旺萨·普特拉、罗希特·亚达夫、萨姆里迪·夏尔马、三亚·辛哈、希娜·纳鲁拉陶克尔·艾哈迈德、约根德拉辛格·帕瓦尔、维杜希·古普塔贾斯琳·松迪

素描笔记 (@sketchthedocs)
初学者的数据科学 - @nitya的 Sketchnote

你是学生吗?

开始使用以下资源:

  • 学生中心页面在此页面中,你将找到初学者资源,学生包,甚至获得免费证书券的方法。这是你要不时添加书签和检查的页面,因为我们至少每月切换一次内容。
  • 微软学习学生大使加入全球学生大使社区,这可能是你进入微软的方式

开始

教师:我们提供了一些关于如何使用这门课程的建议。我们希望你在我们的论坛中提供反馈!

学生:要自行使用此课程,请分叉整个存储库并自行完成练习,从讲座前测验开始。然后阅读讲座并完成其余的活动。尝试通过理解课程而不是复制解决方案代码来创建项目;但是,该代码在每个面向项目的课程的 /solutions 文件夹中可用。另一个想法是与朋友组成一个学习小组,一起浏览内容。为了进一步学习,我们建议使用Microsoft Learn

认识团队

宣传视频

Mohit Jaisal 的 GIF

🎥单击上面的图像以获取有关创建该项目的人的视频!

教育学

在构建此课程时,我们选择了两个教学原则:确保它基于项目并包括频繁的测验。在本系列结束时,学生将学习数据科学的基本原理,包括道德概念、数据准备、处理数据的不同方式、数据可视化、数据分析、数据科学的实际用例等。

此外,课前的低风险测验设定了学生学习主题的意图,而课后的第二次测验可确保进一步的保留。该课程设计灵活有趣,可以全部或部分进行。这些项目从小规模开始,到10周周期结束时变得越来越复杂。

查找我们的行为准则贡献翻译指南。我们欢迎你的建设性反馈!

每节课包括:

  • 可选草图注释
  • 可选的补充视频
  • 课前热身测验
  • 书面课程
  • 对于基于项目的课程,有关如何构建项目的分步指南
  • 知识检查
  • 一个挑战
  • 补充阅读
  • 分配
  • 课后测验

关于测验的说明:所有测验都包含在此应用程序中,总共 40 个测验,每个测验三个问题。它们从课程内链接,但测验应用程序可以在本地运行;按照文件夹中的说明进行操作。它们正在逐渐本地化。

quiz-app

素描笔记 (@sketchthedocs)
初学者数据科学:路线图 - @nitya的草图笔记
课数 主题 课程分组 学习目标 链接课程 作者
01 定义数据科学 介绍 了解数据科学背后的基本概念及其与人工智能、机器学习和大数据的关系。 课程视频 德米特里
02 数据科学伦理 介绍 数据伦理概念、挑战和框架。 妮佳
03 定义数据 介绍 数据的分类方式及其共同来源。 茉莉花
04 统计学与概率导论 介绍 用于理解数据的概率和统计的数学技术。 课程视频 德米特里
05 使用关系数据 使用数据 介绍关系数据以及使用结构化查询语言(也称为 SQL)(发音为“see-quell”)探索和分析关系数据的基础知识。 克里斯托弗
06 使用 NoSQL 数据 使用数据 介绍非关系数据,其各种类型以及探索和分析文档数据库的基础知识。 茉莉花
07 使用蟒蛇 使用数据 使用 Python 通过 Pandas 等库进行数据探索的基础知识。建议对 Python 编程有基本的了解。 课程视频 德米特里
08 数据准备 使用数据 有关清理和转换数据以处理丢失、不准确或不完整数据的挑战的数据技术的主题。 茉莉花
09 可视化数量 数据可视化 了解如何使用 Matplotlib 可视化鸟类数据 🦆
10 可视化数据分布 数据可视化 可视化区间内的观测值和趋势。
11 可视化比例 数据可视化 可视化离散百分比和分组百分比。
12 可视化关系 数据可视化 可视化数据集及其变量之间的联系和相关性。
13 有意义的可视化 数据可视化 使可视化对有效解决问题和见解有价值的技术和指南。
14 数据科学生命周期简介 生命周期 介绍数据科学生命周期及其获取和提取数据的第一步。 茉莉花
15 分析 生命周期 数据科学生命周期的这一阶段侧重于分析数据的技术。 茉莉花
16 通信 生命周期 数据科学生命周期的这一阶段侧重于以更易于决策者理解的方式呈现来自数据的见解。 杰伦
17 云中的数据科学 云数据 本系列课程介绍了云中的数据科学及其优势。 蒂芙尼莫德
18 云中的数据科学 云数据 使用低代码工具训练模型。 蒂芙尼莫德
19 云中的数据科学 云数据 使用 Azure 机器学习工作室部署模型。 蒂芙尼莫德
20 野外数据科学 在野外 现实世界中的数据科学驱动的项目。 妮佳

GitHub 代码空间

按照以下步骤在代码空间中打开此示例:

  1. 单击代码下拉菜单,然后选择使用代码空间打开选项。
  2. 选择窗格底部的“+ 新建代码空间”。有关详细信息,请查看 GitHub 文档

VSCode 远程 - 容器

按照以下步骤使用本地计算机在容器中打开此存储库,并使用 VS Code Remote - 容器扩展打开 VSCode:

  1. 如果这是你第一次使用开发容器,请确保你的系统满足入门文档中的先决条件(即已安装 Docker)。

要使用此存储库,你可以在隔离的 Docker 卷中打开存储库:

注意:在后台,这将使用远程容器:在容器卷中克隆存储库...命令在Docker卷而不是本地文件系统中克隆源代码。是保存容器数据的首选机制。

或者打开本地克隆或下载的存储库版本:

  • 将此存储库克隆到本地文件系统。
  • 按 F1 并选择“远程容器: 在容器中打开文件夹...”命令。
  • 选择此文件夹的克隆副本,等待容器启动,然后尝试操作。

离线访问

你可以使用 Docsify 脱机运行本文档。分叉此存储库,在本地计算机上安装 Docsify,然后在此存储库的根文件夹中键入 。该网站将在本地主机上的端口 3000 上提供服务:。

docsify serve
localhost:3000

请注意,笔记本不会通过 Docsify 呈现,因此当你需要运行笔记本时,请在运行 Python 内核的 VS Code 中单独执行此操作。

需要帮助!

如果你想翻译全部或部分课程,请按照我们的翻译指南进行操作

其他课程

我们的团队制作其他课程!退房: