0 点赞

机器学习教程07章-集成方法-随机森林和AdaBoost

当做重要决定时,大家可能都会考虑吸取多个专家而不只是一个人的意见。 机器学习处理问题时又何尝不是如此? 这就是集成方法背后的思想。
0 点赞

Spark 持久化操作

Spark的一个重要特性,对RDD持久化操作时每个节点将RDD中的分区持久化到内存(或磁盘)上,之后的对该RDD反复操作过程中不需要重新计算该RDD,而是直接从内存中调用已缓存的分区即可。 当然,持久化适用于将要多次计算反复调用的RDD。不然的话会出现RDD重复计算,浪费资源降低性能的情况
0 点赞

机器学习教程06章-支持向量机(Support Vector Machines, SVM)

支持向量机(Support Vector Machines, SVM):是一种监督学习算法。
0 点赞

机器学习教程05-Logistic回归

Logistic 回归 或者叫逻辑回归 虽然名字有回归,但是它是用来做分类的。其主要思想是: 根据现有数据对分类边界线(Decision Boundary)建立回归公式,以此进行分类。
0 点赞

机器学习教程04-基于概率论的分类方法:朴素贝叶斯

贝叶斯分类是一类分类算法的总称,这类算法均以贝叶斯定理为基础,故统称为贝叶斯分类。本章首先介绍贝叶斯分类算法的基础——贝叶斯定理。最后,我们通过实例来讨论贝叶斯分类的中最简单的一种: 朴素贝叶斯分类。
0 点赞
0 点赞

机器学习教程03-决策树的理解和应用场景

本章主要讲解决策树的概念、应用场景、案例等知识
0 点赞
0 点赞

机器学习教程02-k-近邻算法

k-近邻(kNN, k-NearestNeighbor)算法是一种基本分类与回归方法,我们这里只讨论分类问题中的 k-近邻算法。
0 点赞

机器学习教程01--机器学习基础

机器学习(Machine Learning,ML) 是使用计算机来彰显数据背后的真实含义,它为了把无序的数据转换成有用的信息。是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。

发布
问题