首页 > TensorFlow教程 > 机器学习 阅读数:22

机器学习是什么

机器学习(Machine Learning)是让计算机能够自动地从某些数据中总结出规律,并得出某种预测模型,进而利用该模型对未知数据进行预测的方法。它是一种实现人工智能的方式,是一门交叉学科,综合了统计学、概率论、逼近论、凸分析、计算复杂性理论等。

目前机器学习的研究和应用大概集中在如图 1 所示的领域。
机器学习的研究和应用领域
图 1:机器学习的研究和应用领域

其中,机器学习让统计学习得到延伸;模式识别侧重于“感知”特征,而机器学习则会“学习”特征;数据挖掘领域中用到的算法也经常可在模式识别和机器学习中应用。

计算机视觉、语音识别和自然语言处理(这里特指文本处理)目前是机器学习领域最热门的三大方向:
  • 计算机视觉是一门研究如何让机器替代人的眼睛,对“看到”的图片进行分析、处理的科学,在图像分类、人脸识别、车牌识别、目标检测及自动驾驶等均有十分广泛的应用;
  • 目前基于深度学习的语音识别和语音合成技术已经非常成熟,应用随处可见,如智能音箱、实物机器人(例如早教机器人)及虚拟人物等;
  • 自然语言处理旨在使用自然语言处理技术让计算机“读懂”人类的语言,相关应用有机器翻译、智能客服、垃圾信息识别等。

机器学习的分类

1) 有监督学习(Supervised Learning)

当我们已经拥有一些数据及数据对应的类标时,就可以通过这些数据训练出一个模型,再利用这个模型去预测新数据的类标,这种情况称为有监督学习。有监督学习可分为回归问题和分类问题两大类。

在回归问题中,我们预测的结果是连续值;而在分类问题中,我们预测的结果是离散值。常见的有监督学习算法包括线性回归、逻辑回归、K-近邻、朴素贝叶斯、决策树、随机森林、支持向量机等。

2) 无监督学习(Unsupervised Learning)

在无监督学习中是没有给定类标训练样本的,这就需要我们对给定的数据直接建模。常见的无监督学习算法包括 K-means、EM 算法等。

3) 半监督学习(Semi-supervised Learning)

半监督学习介于有监督学习和无监督学习之间,给定的数据集既包括有类标的数据,也包括没有类标的数据,需要在工作量(例如数据的打标)和模型的准确率之间取一个平衡点。

4) 强化学习(Reinforcement Learning)

从不懂到通过不断学习、总结规律,最终学会的过程便是强化学习。强化学习很依赖于学习的“周围环境”,强调如何基于“周围环境”而做出相应的动作。

具体分类如图 2 所示。
机器学习的分类
图 2:机器学习的分类