您当前的位置：首页 > 电脑百科 > 人工智能

什么是机器学习？

时间：2019-07-15 10:04:51 来源：网络作者：

+ 加入收藏

机器学习

人工智能，是使计算机具有智能的根本途径，其应用遍及人工智能的各个领域，它主要使用归纳、综合而不是演绎，而机器学习是人工智能的核心。

“机器学习是一门人工智能的科学，该领域的主要研究对象是人工智能，特别是如何在经验学习中改善具体算法的性能

01 机器学习分类

传统机器学习
机器学习可以理解成是生产算法的算法。需要人来先做特征提取，然后在把特征向量化后交给机器去训练。
传统机器学习分为监督学习和无监督学习。
深度学习
深度学习是基于深度神经网络的学习（DNN）。深度学习可以自动提取特征。深度学习可以采用 End-to-End 的学习方式，只需要进行很少的归一化和白化，就可以将数据交给模型去训练。

02 机器学习中的一些概念

首先我们需要了解几个机器学习中的起码要知道是怎么回事的概念，了解了后面看代码才不会一脸懵逼。

训练样本
就是用于训练的数据。包括了现实中的一些信息数据，以及对应的结果，也就是标签。
训练
对训练样本的特征进行统计和归纳的过程。
分类模型
总结出的特征，判断标准。
验证
用测试数据集验证模型是否正确的过程。这个过程是在模型训练完后进行的，就是再用另外一些样本数据，代入到模型中去，看它的准确率如何。

2.1 聚类

聚类是一种典型的无监督学习，是把数据进行分类的过程。进行聚类的基本思想是，利用向量之间的距离 —— 空间中的欧式距离或曼哈顿距离，根据距离的大小判断对象是否应该归为同一类别。

上图是对3个一维向量分类的例子。明显的能看到，离得近的两个们可以近似的认为它们属于同一类别。

2.2 回归

回归简单的说就是一个由果索因的过程。这是机器学习中很常用的一个手段。

回归分为：

1. 线性回归

2. 非线性回归

实际使用那种回归模型，需要根据情况而定。

2.2.1 线性回归

线性回归模型：

其中 w 是一个特征张量，储存着与每个变量x中元素对应的特征元素，x 就是输入的训练数据张量，b 是一个偏置量。

这其实就是高中概率与统计章节中常见的一个公式。就像解那时候的应用题一样，我们需要根据一堆（x，y）求解一个合适的 w 和 b。

看看上面这个应用题，是否想起了高中时代的数学课？

2.2.2 损失Loss函数

损失函数是用来评估模型预测结果和真实情况差距的，差距越小，说明我们的模型越好，越准确。这就是损失函数的公式！

当我们假设一个w和b后，循环计算每一个 x 所得的值和真实 x 所对应的值相减，然后将每一个差相加求和，得到一个差值之和，就是当前的损失。

损失越小，说明所寻找到的 w 和 b 就越合适，当 Loss 为 0 时，说明此时模型的准确率为 100% 。

事实上，这和高中概率与统计应用题，给你一堆 x，y ，然后求一个系数w 和常量b 出来是一样的一样的。只不过在计算机中，由于算力比手算强大太多了，所以我们可以一遍一遍的调整 w 和 b 这两个参数，使 Loss 一直向趋于 0 的方向移动，从而使模型的准确率趋于 100% 。

通常，为了使 Loss 始终保持为正，也会有如下损失函数：

求平方使得结果横为正数。

比如这个函数的图像可能是一个三维的碗，那么我们的任务就是找到碗底的位置，也就是极值，因为在该点有解，即损失最小。

2.2.3 梯度下降法寻找最优解

对于复杂函数，我们要直接求解是巨困难的，甚至有时可以说是处于不可解的状态。我们需要寻找损失函数的极值，可以使用牛顿迭代法的思想进行迭代寻找。

那对于复杂函数是不是就只能束手无策了呢？在你了解牛顿迭代法之后就可以回到不是了，而此前对于这个问题也许只能回答不能了。

通过迭代，我们可以逐步的逼近索要寻找的极值。

这里，我们还人为的引入了一个 η 参数，这个参数用于调整步长。步子迈大了可能会越过极值，迈小了有会产生很大的计算量，具体取多大合适，还是要多看看老司机们烫过的坑。

普通的梯度下降法（批梯度下降法，BGD），需要遍历所有的数据样本，在样本量不大的时候还是可以的，毕竟这么干精度起码是很高的。但是如果样本容量巨大，那每次遍历所有样本，必然都会消耗很多时间成本。并且如果我们的损失函数不是一个凸函数误差曲面就会存在多个局部极小值（即局部碗底），那采用这种方法可能会陷入局部最优解中。

如上图就是一个非凸损失函数，有可能在梯度下降的过程中走到了一个局部最低点去，而这其实不是真正的最低点。

为了加快收敛速度，随机梯度下降法（SGD）就诞生了。它的思想是每次仅随机的抽取样本总体中的一个样本，来决定下一步的走向。它的好处是不用遍历所有的样本，所以对于样本容量巨大的情况，能够极大的加快收敛。但可想而知，每次随便取一个样本来更新权值，最终的权值很可能并不是最优解，不过有时在考虑现实情况的时候，这点精度误差也是可接受的。

那我们可不可以既要速度，又要精度呢？当 CoorChice 这么问的时候，你可就是知道套路问题的套路答案了（也许下次 CoorChice 就不会按套路走了，啊哈哈！）。答案就是 小批梯度下降法（Mini-batch GD）。它的思想是每次选取一定量的样本进行训练，然后再更新权值。即不用全部遍历，也不会因为每次更新仅由一个样本来决定而损失过多的精度。两头兼顾，当然也比较中庸。

2.2.4 交叉熵

在了解交叉熵之前，先了解一下什么是信息熵？首先看两个相关公式。

信息量公式：

没错，通过对一种情况发生的先验概率进行对数计算的结果，被用来表征这种事件发生的信息量。

信息熵公式：

就是将所有事件的信息熵进行加和。这个值越大，表明对于预测一个事件而言的不确定性就越大。

上面的公式是信息熵公式，它表示对于一系列事件，根据其历史发生数据可以计算出一个先验概率，根据这个先验概率，可以计算出该事件发生的信息量，再将信息量乘以先验概率，就可以得到单个事件的熵。将这些事件的熵求和，就可以得到信息熵了。它有什么作用呢？就是用来量化信息量的，如果越不确定，则其信息熵就越大。对于一个有序的系统（按部就班）来说，它的信息熵就比较小了。

如果理解了信息熵，接下来就可以更进一步的了解交叉熵了。首先，交叉熵损失函数如下：

y 表示期望输出值，a 表示实际模型的输出。交叉熵是用来干什么的呢？它表示的训练结果和实际标签结果的差距。交叉熵函数也有这种常用的形式：

通常交叉熵会和 Softmax 激励函数一起在输出层计算输出。

03 深度学习的基本概念

深度学习是基于深度神经网络的学习。它的概念类似与人的神经结构，由神经元可链接成一个神经网络，每个神经元被作为一个网络节点。

好像一下又回到了生物课！深度学习相对于传统的机器学习来说，很明显的优势在于能够自动提取特征，可将线性不可分的问题转变为线性可分的问题。

使用传统机器学习，不管用朴素贝叶斯、决策树、支持向量机SVM等分类模型之前，必须对大量的模型进行处理，人工的从中提取特征用于量化。而在深度学习中，通过大量的线性分类器的堆叠，加上一些非线性因素，可以使一些特征能够自动的显现出来，而干扰因素经过过滤也能很大程度的被忽略。

总之，这种方式的机器学习肯定是更加先进的，但是需要消耗的资源也会更大。深度学习由于是自动提取特征的，所以会导致我们有时候无法判断处究竟为什么会是这个模型，不便于我们分析问题，它就像一个黑盒一样，给它数据，它给你结果，而你很难了解里面发生了什么。

3.1 神经元的组成

通常，一个神经元由一个 “线性模型” 和一个 “激励函数” 组成。线性模型其实就是上面提到过的线性回归模型。

如图就是一个神经网络，它共有两层，一个是神经元层（隐含层），一个是输出层。通常我们在说一个网络的深度时，是不会把输入层不计入的。

在神经元中，有一个线性模型 wx + b 和一个激活函数 f。我们的数据将会通过一个个的神经元，每个神经元都有一组权重，用于提取一类特征，相当于是我们把数据进行了一层一层的剖析。

3.2 激励函数

激励函数，通常也会被称为激活函数，它是跟随在 f(x) = wx + b 函数之后，用来加入一些非线性的因素的。通过激活函数，可以将线性函数作为输入，经过激活函数后，变成非线性的，这样一来就更接近真实世界的复杂情况了。列举几个常用的激活函数，有助理解。

3.2.1 Sigmoid函数

从函数可以看到，这个函数的值域为（0，1），0.5值处为函数的对称中心。有时在 <-4 和 >4 的区间中，函数曲线越来越趋于水平，也就是导数很趋于0，这会导致梯度下降时，我们的对权值的更新微乎其微，也就是出现梯度消失的问题。

当然，它作为比较常用的激励函数，有其自己很适用的问题领域，比如二分类问题。

3.2.2 ReLu函数y = max(x, 0)

这是个很受欢迎的函数，光是看看它简洁的函数式你就不能拒绝它！这个函数在 > 0 的时候，输入就等于输出，计算量会小很多，所以收敛速度会快很多。

3.2.3 Softmax

这个函数看起来比较复杂，它通常被用于处理多分类问题。可以看看它的定义式，就是个体在总体中的占比情况。

从图中可以很直观的看出这个函数的功能，就是各种分类的概率啊。

3.3 独热编码

对于多分类问题，标注分类可以使用使用独热编码来进行，比如这样一个例子：

就是说，有几个类型就定义一个几维的向量，然后向量中只有一个元素为1，其余均为0，通过1在向量中的位置来表示类型。

3.3 过拟合和欠拟合

在训练过程中，可能会因为过拟合或者欠拟合而导致最终训练出来的模型准确率不足或者因泛化性差而导致准确率低。

欠拟合
样本过少，无法归纳出足够的共性
过拟合
参数过多，导致在训练集上准确率很高，但换新样本会严重误判。

总结

在了解了机器学习是干什么的之后，又了解了一些基本概念在机器学习中会被经常用到的，相信你对机器学习也不会保持一种敬畏感了，知道它很厉害，但是不知道为什么厉害。

现在开始，可以试着到 TensorFlow 官网看一些入门的 code 例子，然后结合这些概念理解下每个步骤是在干什么，为什么要这么做？

在前面，大家也会看到，在机器学习中用到了很多统计学的知识，所以很多人会认为机器学习其实就是统计学而已。

实际上 CoorChice 认为，机器学习只是用了统计学作为工具，去研究解决问题，实际上它是有一套自己的理论和套路的，就像物理用数据作为工具去解决问题一样。

机器学习在解决实际问题的过程中，会需要很多学科的交叉来分析问题，构建模型。当然，总体的思想看起来还是很简单的，只不过面对真世界中的复杂情况下，其探寻求解过程会比较复杂。

Tags：机器学习点击:() 评论:()

声明：本站部分内容及图片来自互联网,转载是出于传递更多信息之目的,内容观点仅代表作者本人,如有任何标注错误或版权侵犯请与我们联系(Email:2595517585@qq.com)，我们将及时更正、删除，谢谢。

▌相关推荐

AI系统中（机器学习算法）导致偏差的原因总结

基于算法的业务或者说AI的应用在这几年发展得很快。但是，在实际应用的场景中，我们经常会遇到一些非常奇怪的偏差现象。例如，Facebook将黑人标记为灵长类动物、城市图像识别系统...【详细内容】

2021-11-08　　Tags: 机器学习点击:(32)　　评论:(0)　　加入收藏

这725个机器学习术语表，太全了

这是几位机器学习权威专家汇总的725个机器学习术语表，非常全面了，值得收藏！英文术语中文翻译 0-1 Loss Function 0-1损失函数 Accept-Reject Samplin...【详细内容】

2021-10-21　　Tags: 机器学习点击:(43)　　评论:(0)　　加入收藏

程序员10 个入门级的机器学习开源项目

要开始为开源项目做贡献，有一些先决条件：1. 学习一门编程语言：由于在开源贡献中你需要编写代码才能参与开发，你需要学习任意一门编程语言。根据项目的需要，在后期学习另一种语言...【详细内容】

2021-10-20　　Tags: 机器学习点击:(37)　　评论:(0)　　加入收藏

人工智能、机器学习领域13个常见概念

作者：阿米特·V. 乔希（Ameet V Joshi）来源：华章科技 01 人工智能艾伦·图灵（Alan Turing）对人工智能的定义如下：如果窗帘后面有一台机器，并且有人正在与之互动（无论以何...【详细内容】

2021-09-07　　Tags: 机器学习点击:(76)　　评论:(0)　　加入收藏

字节跳动开源云原生机器学习平台 Klever

字节跳动基础架构团队基于火山引擎机器学习平台 Clever 及其丰富的行业落地经验，推出开源项目 Klever，以工程化的方式降低智能技术落地门槛，助力企业快速打造智能业务。作者：陈...【详细内容】

2021-02-19　　Tags: 机器学习点击:(170)　　评论:(0)　　加入收藏

机器学习算法中如何执行回归数据的特征选择

特征选择是识别和选择与目标变量最相关的输入变量子集的过程。特征选择最简单的情况可能是存在数字输入变量和用于回归预测建模的数字目标的情况。这是因为可以计算出每个输...【详细内容】

2021-01-15　　Tags: 机器学习点击:(117)　　评论:(0)　　加入收藏

轻松理解机器学习算法：Adaboost算法

1、集成学习及Boosting算法集成学习属于机器学习，它是一种“训练思路”，并不是某种具体的方法或者算法。集成学习的核心思想是把已有的算法进行结合，从而得到更好的效果。集成...【详细内容】

2020-12-29　　Tags: 机器学习点击:(176)　　评论:(0)　　加入收藏

Python迁移学习：机器学习算法

“终有一天，人工智能会像我们看待非洲平原上低级生物的化石一样看待我们。在人工智能眼中，人类只是直立行走的猿猴，用着粗糙的语言和简陋的工具，从诞生起就注定会灭绝。”&mdash...【详细内容】

2020-12-17　　Tags: 机器学习点击:(147)　　评论:(0)　　加入收藏

一款强大的机器学习可视化IDE

专注Python、AI、大数据，请关注公众号七步编程！人工智能方向的项目，和数据可视化是紧密相连的。模型训练过程中梯度下降过程是什么样的？损失函数的走向如何？训练模型的准确度怎么...【详细内容】

2020-10-15　　Tags: 机器学习点击:(357)　　评论:(0)　　加入收藏

机器学习概念和经典算法，我用大白话给你讲清楚了！入门必看

在数据领域，很多人都在说机器学习，但是只有很少的人能说清楚怎么回事。网上关于机器学习的文章，大多都是充斥各种定理的厚重学术三部曲(我搞定半个定理都够呛)，或是关于人工智能...【详细内容】

2020-09-25　　Tags: 机器学习点击:(111)　　评论:(0)　　加入收藏

▌简易百科推荐

可解释的AI (XAI)：如何使用LIME 和 SHAP更好地解释模型的预测

作为数据科学家或机器学习从业者，将可解释性集成到机器学习模型中可以帮助决策者和其他利益相关者有更多的可见性并可以让他们理解模型输出决策的解释。在本文中，我将介绍两个...【详细内容】

2021-12-17　　deephub　　　　Tags:AI 　点击:(16)　　评论:(0)　　加入收藏

AI系统中（机器学习算法）导致偏差的原因总结

2021-11-08　　数据学习DataLearner　　　　Tags:机器学习　点击:(32)　　评论:(0)　　加入收藏

人工智能会超过人类吗？顶尖科学家：人工智能在常识判断方面具有局限

11月2日召开的世界顶尖科学家数字未来论坛上，2013年诺贝尔化学奖得主迈克尔·莱维特、2014年诺贝尔生理学或医学奖得主爱德华·莫索尔、2007年图灵奖得主约瑟夫·斯发斯基、1986年图灵奖得主约翰·霍普克罗夫特、2002...【详细内容】

2021-11-03　　张淑贤　　证券时报　　Tags:人工智能　点击:(39)　　评论:(0)　　加入收藏

火爆业界的边缘计算，到底是什么？

鉴于物联网设备广泛部署、5G快速无线技术闪亮登场，把计算、存储和分析放在靠近数据生成的地方来处理，让边缘计算有了用武之地。边缘计算正在改变全球数百万个设备处理和传输...【详细内容】

2021-10-26　　　　计算机世界　　Tags:边缘计算　点击:(45)　　评论:(0)　　加入收藏

这725个机器学习术语表，太全了

2021-10-21　　Python部落　　　　Tags:机器学习　点击:(43)　　评论:(0)　　加入收藏

程序员10 个入门级的机器学习开源项目

2021-10-20　　TSINGSEE青犀视频　　　　Tags:机器学习　点击:(37)　　评论:(0)　　加入收藏

Logistic Regression：最基础的神经网络

SimpleAI.人工智能、机器学习、深度学习还是遥不可及？来这里看看吧~ 从基本的概念、原理、公式，到用生动形象的例子去理解，到动手做实验去感知，到著名案例的学习，到用所学来实现...【详细内容】

2021-10-19　　憨昊昊　　　　Tags:神经网络　点击:(47)　　评论:(0)　　加入收藏

直击痛点 NLP技术的价值和落地｜超级观点

语言是人类思维的基础，当计算机具备了处理自然语言的能力，才具有真正智能的想象。自然语言处理（Natural Language Processing, NLP）作为人工智能（Artificial Intelligence, AI）的核心技术之一，是用计算机来处理、理解以及运...【详细内容】

2021-10-11　　　　36氪　　Tags:NLP 　点击:(49)　　评论:(0)　　加入收藏

边缘计算是个啥？为什么说发展5G离不开它？

边缘计算是什么？近年来，物联网设备数量呈线性增长趋势。根据艾瑞测算， 2020年，中国物联网设备的数量达74亿，预计2025年突破150亿个。同时，设备本身也变得越来越智能化，AI与互联网在...【详细内容】

2021-09-22　　汉智兴科技　　　　Tags: 　点击:(55)　　评论:(0)　　加入收藏

学了这些基础算法，人工智能就算入门了

说起人工智能，大家总把它和科幻电影中的机器人联系起来，而实际上这些科幻场景与现如今的人工智能没什么太大关系。人工智能确实跟人类大脑很相似，但它们的显著差异在于人工智能...【详细内容】

2021-09-17　　异步社区　　　　Tags:人工智能　点击:(57)　　评论:(0)　　加入收藏

推荐资讯

聊聊如何自定义数据脱	河南人到底有多爱吃面
人称“犬中四煞”的4	离婚后，约定每月给孩子
“三皇五帝”分别是哪	印度低种姓群体如何翻
日本研发“飞行摩托”	2021年Steam最畅销游