人工智能包括机器学习,机器学习包括深度学习,学好机器学习的基础对入门深度学习有很好的帮助。
机器学习是20世纪50年代就出现的数据分析技术,最近几年才风靡是因为深度学习和增强学习的崛起,如AlphaGo和人脸识别等。前人定义机器学习为一个让计算机自主学习的技术领域,它的核心目的是拟合, 分类和预测,具有极强的融合性,各种交叉学科都可能见到它的身影。
我个人理解就是扔一堆数据给计算机,然后它能分析出数据的规律,进而拟合出规律并预测下一个数据的属性。
应用:语音、人脸识别、语言翻译、计算机视觉、电影推荐、排序等等
分类
监督学习(扔给计算机的数据是带有标签的,就是带有数据的属性,比如带有标签的猫的照片数据,计算机会知道它是猫):
1、回归(regression):利用数据拟合出一个规律,比如(1,1),(2,2)这两点给计算机,它会拟合出y=x这条直线,这也叫线性回归,如果数据变成三维或更高维,则称为多元线性回归。
2、分类(classification):计算机主要对数据进行分类,比如猫是猫,狗是狗,这种分类的主流方法有很多,以后会逐一介绍:逻辑回归(名字叫回归但实际是分类哦)、感知机(深度学习的基础)、贝叶斯分类器(为数据分析引入了概率,考试的话送分的)、支持向量机(面试必问,很强大,但实际工业用得少)、决策树(对结果有非常高的解释性,考试的话送分的)、随机森林(很多棵决策树就变成了森林)、K近邻(近朱者赤近墨者黑,考试的话送分的),等等
非监督学习(就是数据没有标签了,计算机不知道谁是谁,只能根据数据的距离或概率分布等作出决策):
1、聚类(clustering):最常用的方法就是聚类,其中最主流、简单的是K均值(与K近邻都是有参数K和距离公式,但两者大大不同),还有高斯混合模型、谱聚类等等
强化学习(模型能以“试错”的方式进行学习,通过与环境进行交互获得的奖赏指导行为,即可以评价每一次的行为,目标是使模型获得最大的奖赏):
1、马尔可夫决策过程(Markov Decision Process)
学习
要想全面掌握机器学习,我们还要学习很多的学习算法,如著名的梯度下降(BGD、SGD…),牛顿法等,很多基础理论知识,如经验风险最小化、方差—误差、数据集(训练集、测试集、验证集)、过拟合、矩阵分解(奇异值分解SVD)、降维(PCA、LDA…)。
可能很多人像我刚上课一样觉得机器学习就是不断编程嘛,搞代码的一门课,其实不然,如果只是编程,调一个很成熟的sklearn库就能解决大多问题,而且巨方便,但这样和搭积木没有太多区别。深入机器学习就必须了解这些库是怎么通过一行行代码实现的,这样跟调参侠就会拉开差距,所以数学知识很重要,涉及高数、线代、概率论,还有一些凸优化。一起加油吧!
附上其他笔记的链接:
《无废话的机器学习笔记(二)(线性回归)》
《无废话的机器学习笔记(三)(梯度下降)》
《无废话的机器学习笔记(四)(感知机、逻辑回归、贝叶斯)》
《无废话的机器学习笔记(五)(SVM)》
《无废话的机器学习笔记(六)(决策树,KNN)》
《无废话的机器学习笔记(七)(聚类: kmeans、GMM、谱聚类)》
《无废话的机器学习笔记(番外)(数据集,方差-偏差,过拟合,正则化,降维)》