我正在参加「启航方案」

界说

利用计算机的运算能力,从许多的数据中发现一个 “函数”或“模型” ,并通过它来模拟现实世界事物间的关系,然后实现预测、判断等意图。建模的进程便是机器“学习”进程

和传统程序的区别

什么是机器学习

传统程序员把已知的规则界说好后输入给机器的,而机器学习则从已知数据中,通过不断试错、自我优化、自身总结,概括出来。传统程序是程序员来界说函数,而机器学习中是机器练习出函数。

标签

在机器学习中,自变量x1,x2,x3,…,xn,就叫做特征(feature),因变量y叫做标签(label)。而一些前史特征和一些前史标签的调集,便是机器学习的数据集。当机器通过练习找到一个函数/模型,咱们还需求验证和评价,假如函数欠好,就需求调整或许找新的函数/模型。

机器学习纷歧定要标签,能够分为三种状况来划分:

  • 练习数据集全部有标签,叫监督学习(supervised learning);
  • 练习数据集没有标签,叫做无监督学习(unsupervised learing);
  • 在练习数据会集,有的数据有标签,有的数据没有标签,咱们叫做半监督学习(semi-supervised learning)。

监督学习

监督学习被分为两类:回归问题和分类问题。

什么是机器学习

回归问题

标签是接连数值。比方预测房价、湿度、温度等。

分类问题

标签是离散性数值。比方预测明日是否会下雨、美国是否会被我国超越等。

无监督学习

目前它大多数只应用在聚类、降维等有限的场景中,往往作为数据预处理的一个子过程显显身手。

半监督学习

半监督学习的原理、功能和流程与监督学习是很类似的,区别主要在于多了“伪标签的生成”环节,也是给无标签的数据人工“贴标签”。

许多问题无法通过“监督”学习来处理,比方说你要规划一个机器人来陪你玩牌?这就需求强化学习了。

强化学习

强化学习和监督学习的差异在于:监督学习是从数据学习,而强化学习是从环境给它的奖惩中学习。

强化学习智能体在调整战略的时候需求思路比较长远,它纷歧定每次都明确地选择最优动作,而是要在探索(未知领域)和利用(当前知识)之间找到平衡。它重复试错、不断搜集反应,搜集可供自己学习的信号,每通过一个练习周期,都变得比本来强一点,通过亿万次的练习变得非常强大。《强化学习》第 2 版。

深度学习

深度学习是一种适用深层神经网络算法的机器学习模型,也能够应用于监督学习、半监督学习和无监督学习里,也能够应用于强化学习中。

长期以来,图形图画、自然语言和文本的处理是计算机职业的难题,由于这类信息的数据集,并不是结构化的,需求人工依据信息的类型来选择特征进行提取,这样关于特征的提取是有限的,就拿图画来说,只能提取出一些简单的滤波器。

深度学习能对非结构化的数据集进行自动的杂乱特征提取,完全不需求人工干预。

来历

本篇为学习笔记,来自于time.geekbang.org/column/arti… 。