前语

人工智能是一个巨大的研讨范畴。尽管咱们已经在人工智能的理论研讨和算法开发方面取得了一定的进展,可是咱们现在把握的才能仍然十分有限。机器学习是人工智能的一个重要范畴,它研讨核算机怎么仿照或完结人类的学习行为,以获取新的常识或技能,并经过重新组织已有的常识结构来不断进步本身的功能。深度学习是机器学习中的一个研讨方向,经过多层处理,将初始的“低层”特征表明逐渐转化为“高层”特征表明,然后能够用“简单模型”完结复杂的分类等学习使命。深度学习在人工智能的各个范畴都有广泛的运用。

专栏介绍

许多人对AI技能有爱好,但由于其常识点繁复,难以体系学习,学习没有方向等等问题。咱们的专栏旨在为零根底、初学者和从业人员供给福利,一起探究AI技能,从根底开端学习和介绍。让你从零根底动身也能学会和把握人工智能技能。

专栏阐明

本专题文章以及触及到整体系列文章首要涵盖了多个盛行的主题,包含人工智能的前史、运用、深度学习、机器学习、自然言语处理、强化学习、Q学习、智能代理和各种搜索算法。这个人工智能教程供给了对人工智能的介绍,有助于您了解其背面的概念。咱们的教程旨在为初级和中级读者供给完好的人工智能常识,从根本概念到高档概念。

学习纲要

与人类所的智能形成比照,人工智能是指机器所显示的智能。 本教程涵盖了以下整体学习道路内容:

【人工智能技术专题】「入门到精通系列教程」打好AI基础带你进军人工智能领域的全流程技术体系(机器学习知识导论)

前提条件

在学习人工智能之前,需求具备以下根本常识,以便轻松了解一些编程相关的功能。

  • 熟悉至少一种核算机言语,如C,C++,Java或Python(引荐Python)。
  • 对根本数学有一定的了解,如微积分、概率论、线性代数和数理核算等,不太懂也没事,我也会带着咱们进行剖析学习。

面向读者

本教程专为对人工智能有爱好的毕业生、研讨生以及将人工智能作为课程一部分的初中级学者规划,同时也包含一些专业人士需求了解的高档概念。

学习方针

本专栏首要供给了人工智能的介绍,能够协助您了解人工智能背面的概念以及人工智能的运用,深度学习,机器学习,自然言语处理,强化学习,Q学习,智能代理,各种搜索算法等。

  • 学习后将把握:机器学习和深度学习的概念,常用的机器学习算法和神经网络算法。

  • 人工神经网络,自然言语处理,机器学习,深度学习,遗传算法等各种人工智能范畴的根本概念及其在Python中的怎么完结。

  • 知道和把握相关人工智能和Python编程的根本常识。 还会把握了AI中运用的根本术语以及一些有用的python软件包,如:nltk,OpenCV,pandas,OpenAI Gym等。

中心内容

本章的中心内容道路包含以下四个方面组成,首要围绕着机器学习的相关常识概论和常识根底进行剖析和介绍,让咱们打好根底。

【人工智能技术专题】「入门到精通系列教程」打好AI基础带你进军人工智能领域的全流程技术体系(机器学习知识导论)

机器学习的概念界说

提到机器学习,咱们就需求在回忆一下人工智能的概念,这样子便利咱们进行比照和剖析两者之间的联系。

回忆人工智能

【人工智能(Artificial intelligence)是一门触及理论、办法、技能及运用体系的新式技能科学,其研讨和开发旨在仿照、扩展和延伸人类智能】。人工智能作为一个笼统而广泛的概念,其最终方针是使核算机能够仿照人的思想办法和行为。尽管人工智能的开展始于上世纪50年代,但由于其时的数据和硬件设备等限制,其开展缓慢。

机器学习概念

【机器学习(Machine Learning)是一种运用数据和算法来仿照人类学习办法的数据剖析技能,它是人工智能和核算机科学的产物】。机器学习经过从经历中学习,逐步进步精确性,并能够在不依赖预先确认的方程式模型的情况下直接从数据中“学习”信息。

国外闻名学者对机器学习的界说

Well-posed Learning Problem:A computer program is said to learn from experience (E) with respect to some task (T)and some performance measure (P),if its performance on T,as measure by P,improves with experience E.(Tom Mitchell,1998)

中文翻译

适定学习问题:据说核算机程序能够从经历中学习(E关于某个使命 (T) 和某个绩效指标 ( P ),假如它的绩效P对T的点评跟着经历e的进步而进步(汤姆米切尔,1998)。

【人工智能技术专题】「入门到精通系列教程」打好AI基础带你进军人工智能领域的全流程技术体系(机器学习知识导论)

机器学习开展历程

1956年,人工智能这一术语被提出,用于探究一些问题的有用解决方案。后来,美国国防部借助“神经网络”这一概念,开端练习核算机仿照人类的推理进程。跟着时间的推移,谷歌、微软等科技巨子改善了机器学习算法,并将查询的精确度进步到了新的高度。从2010年起,跟着数据量的增加、算法、核算和存储容量的进步,机器学习得到了更进一步的开展。

【人工智能技术专题】「入门到精通系列教程」打好AI基础带你进军人工智能领域的全流程技术体系(机器学习知识导论)

机器学习和人工智能的联系

机器学习(Machine learning)是人工智能的子集,是完结人工智能的一种途径,但并不是仅有的途径

【人工智能技术专题】「入门到精通系列教程」打好AI基础带你进军人工智能领域的全流程技术体系(机器学习知识导论)
它是一门专门研讨核算机怎样仿照或完结人类的学习行为,以获取新的常识或技能,重新组织已有的常识结构使之不断改善本身的功能的学科。大概在上世纪80年代开端蓬勃开展,诞生了一大批数学核算相关的机器学习模型。

机器学习和人类学习的比照

核算机仿照人类的学习行为,以获取新的常识或技能,并重新组织已有的常识结构,使之不断改善本身。

人类学习的行为处理办法

【人工智能技术专题】「入门到精通系列教程」打好AI基础带你进军人工智能领域的全流程技术体系(机器学习知识导论)

机器学习的行为处理办法

【人工智能技术专题】「入门到精通系列教程」打好AI基础带你进军人工智能领域的全流程技术体系(机器学习知识导论)

经典的「垃圾邮件过滤」运用

经过经典的「垃圾邮件过滤」运用,咱们再来了解下机器学习的原理。

运用程序

「垃圾邮件过滤」是一个经典的机器学习运用,能够协助用户自动过滤掉垃圾邮件,减少打扰和安全危险。在这个运用中,机器学习的原理是经过对已知的垃圾邮件和非垃圾邮件进行剖析和分类,树立一个可用于分类的模型。

原理剖析

在这个例子中:

  • T:将邮件分类为垃圾邮件和非垃圾邮件
  • E:看着你将电子邮件符号为垃圾邮件或非垃圾邮件
  • P:正确分类为垃圾邮件/非垃圾邮件的电子邮件数量(或分数)

在练习模型时,咱们经过对分类成果的评估,来优化模型的精确性和鲁棒性。最终,模型会依据邮件的内容或其他特征,自动判别是否为垃圾邮件,并进行过滤。这种依据机器学习的垃圾邮件过滤办法,能够有用进步用户的工作效率和信息安全性。

机器学习三要素

机器学习三要素包含数据、模型、算法。

【人工智能技术专题】「入门到精通系列教程」打好AI基础带你进军人工智能领域的全流程技术体系(机器学习知识导论)
这三要素之间的联系,能够用下面这幅图来表明:
【人工智能技术专题】「入门到精通系列教程」打好AI基础带你进军人工智能领域的全流程技术体系(机器学习知识导论)

数据(数据驱动)

数据驱动指咱们依据客观的量化数据,进行自动的搜集、剖析和处理,以支持决议计划的一种办法。

【人工智能技术专题】「入门到精通系列教程」打好AI基础带你进军人工智能领域的全流程技术体系(机器学习知识导论)

经过数据的搜集和剖析,咱们能够获得更具可信度和精确性的信息和洞察,然后作出更为明智的决议计划。相对而言,经历驱动则愈加依赖片面经历和直觉判别,简单受到情感和成见的影响,这种“拍脑袋”的办法危险较大,常常不能得出精确的决议计划。因而,数据驱动的办法愈加可靠和客观,已成为现代科学和工业界中不可或缺的一部分。

100100011101000000101000110111010110
100100111101110000001111100110100100
100001101101111101010011100001101001
111111010000110111001010111100001011
110011111101111111100100001110110110
010000110100110110000110000100010000
010101110011001111011001110100010111
001000010101100101000001000010011110
011101001111110010111010101010111100
100010000101100010101101010111000101
010010000100101011110011100001010000
010110000010011101010010101110110001
011011111010111100010100010100010000
011010011011011010001000101111001101
000101000001100110001100100010010110
100101010100010011100101010101111101

练习集与数据集

数据驱动中会触及到以下两个概念(练习集与数据集):

  • 练习集(Training Set):练习集是用来练习模型的数据调集。在房价预估中,咱们能够运用已知的前史数据来练习模型,例如,前史房价数据、房屋面积、房间数量等特征作为模型的输入,真实房价作为模型的输出。经过练习集的数据,咱们能够确认拟合曲线的参数,以树立一个精确的模型。

  • 测验集(Test Set):测验集是为了测验已经练习好的模型的精确度而预备的数据调集。在房价预估中,咱们能够将不知道的数据样本(例如,新的房屋面积和房间数量等特征)作为输入,经过之前练习好的模型来猜测它的房价。然后,咱们能够将这个猜测值与真实的房价进行比较,然后来衡量模型的精确度。经过不断地测验和改善,咱们能够得到一个越来越精确的模型,以猜测不知道的房价。

    【人工智能技术专题】「入门到精通系列教程」打好AI基础带你进军人工智能领域的全流程技术体系(机器学习知识导论)

模型

模型是指为了依据数据X做出决议计划Y而提出的假定函数。模型能够有不同的形状,常见的有核算型和规矩型。

核算型模型是经过对大量的数据进行练习,学习到数据特征之间的联系,并依据这些联系进行决议计划。常见的核算型模型包含神经网络模型、决议计划树模型、逻辑回归模型等。

规矩型模型则是将人类的专业常识和经历转化为机器能够了解和完结的规矩办法,经过规矩匹配和逻辑推理来进行决议计划。常见的规矩型模型包含专家体系、常识图谱等。

无论是哪种形状的模型,都需求从数据中学习、提取有用的特征,练习出能够作出精确决议计划的假定函数。经过不断的优化和调整,模型能够不断进步猜测和决议计划的精确性和鲁棒性。

算法

算法是指学习模型的核算办法,而核算学习则是依据练习数据集,在假定空间中挑选最优模型的学习战略。为了得到最优模型,一般需求运用最优化的办法求解。

机器学习算法中心的大体方向是一下这几种算法根基:分类、聚类、反常查看以及回归等。

【人工智能技术专题】「入门到精通系列教程」打好AI基础带你进军人工智能领域的全流程技术体系(机器学习知识导论)

分类算法

分类是一种机器学习模型练习办法,它的练习集和测验集都是符号好的,经过学习并辨认数据的相关特征,树立模型对新的不知道数据进行分类和猜测。

【人工智能技术专题】「入门到精通系列教程」打好AI基础带你进军人工智能领域的全流程技术体系(机器学习知识导论)

聚类算法

聚类是一种机器学习办法,它能够从海量数据会集辨认数据的类似性和差异性,将类似的数据分组聚合为多个类别。经过聚类,咱们能够更好地了解数据之间的联系,然后作出更有意义的决议计划。

【人工智能技术专题】「入门到精通系列教程」打好AI基础带你进军人工智能领域的全流程技术体系(机器学习知识导论)

反常检测

反常检测是一种数据剖析技能,它能够协助咱们辨认与正常数据散布规矩不同的离群点。经过对数据点进行散布规矩剖析,反常检测能够协助咱们找到那些与其他数据点异于寻常的数据点,以避免数据误解和错误决议计划。

【人工智能技术专题】「入门到精通系列教程」打好AI基础带你进军人工智能领域的全流程技术体系(机器学习知识导论)

回归

回归是一种机器学习算法,它能够依据对已知属性值数据的练习,为模型寻觅最佳拟合参数,并用于猜测新样本的输出值。经过回归,咱们能够构建一个数学模型来描绘输入特征和输出变量之间的联系,以猜测新的输出值。这种技能能够运用于各种场景,例如股票市场猜测,房价猜测等。

【人工智能技术专题】「入门到精通系列教程」打好AI基础带你进军人工智能领域的全流程技术体系(机器学习知识导论)

机器学习的技能分类

机器学习技能可分为三类:监督学习、无监督学习和强化学习,这三类技能是机器学习范畴中运用最为广泛的技能,也是现代工业界中遍及选用的技能。

【人工智能技术专题】「入门到精通系列教程」打好AI基础带你进军人工智能领域的全流程技术体系(机器学习知识导论)
之前在前面的文章介绍了对应的学习概念和算法,那么接下来我就再次稳固和回忆温习一下下面之前的机器学习方向类型。

针关于机器学习技能方向的监督学习、无监督学习和强化学习的各种具体剖析和原理具体探究会在“【人工智能技能专题】「入门到通晓系列教程」打好AI根底带你进军人工智能范畴的全流程技能体系(机器学习算法概论)”进行剖析和阐明。

监督学习(Supervised Learning)

监督学习(Supervised Learning)是一种机器学习的办法,它必需求确认方针变量的值,以便机器学习算法能够发现特征和方针变量之间的联系

有标签数据的学习办法,是经过已有的标示数据练习模型,再运用此模型对不知道数据进行分类、猜测等使命,监督学习算法用于依据已知的输入和输出数据创立模型以进行未来猜测。

中心原理

监督学习(Supervised Learning)包含分类和回归两种学习办法,它的练习集具有符号信息。

  • 分类算法:咱们将数据分为多个离散类别,经过学习已经确认好的类别(即标签),来猜测新的不知道数据所属的类别。

  • 回归算法:咱们处理的是接连型数据,它的方针变量是一系列接连值。在回归中,咱们依据已知的数据和输出变量之间的联系,树立一个模型,以猜测新的不知道数据的输出成果。真实的输出成果能够是任何接连值,如价格、温度等。

分类算法逻辑事例简介

样本集:练习数据+测验数据

  • 练习样本 = 特征(feature)+方针变量(label:分类-离散值/回归-接连值)
    • 特征:独立丈量得到的练习样本集的列
    • 方针变量:机器学习猜测算法的测验成果
  • 方针变量:分类问题中的离散值,也能够是回归问题中的接连值。

在分类算法中,方针变量一般是标称型,例如真与假;而在回归算法中,方针变量一般是接连型,例如1~100。

常识数据信息

一般情况下,在分类算法中,能够选用以下几种办法确认一个实例所属的类别:

  1. 选用规矩集的办法确认类别,例如:数学成果大于90分为优异;
  2. 选用概率散布的办法确认类别,例如:经过核算散布发现,90%的同学数学成果在70分以下,那么大于70分定为优异;
  3. 运用练习样本会集的一个实例确认类别,例如:经过样本调集,咱们练习出一个模型实例,得出年轻、数学成果中高、谈吐高雅等特征时,咱们认为是优异。

无监督学习(Unsupervised Learning)

无监督学习(Unsupervised Learning)包含聚类和降维两种办法,其练习集没有符号信息

从未标示的数据中,经过核算学办法挖掘数据潜在的结构和规矩,完结聚类、降维等使命,无监督学习检测输入数据中的隐藏办法以进行猜测。

无监督学习的运用包含以下几个方面:

  • 聚类:无监督学习能够将数据分成多个类别,使得每个类别内部的数据类似度较高,而不同类别之间的数据差异较大;
  • 密度估计:无监督学习能够经过练习样本来确认变量的概率散布,以此得出数据的核算特征;
  • 降维:无监督学习能够经过减少数据的维度,使得数据的特征愈加简单被调查和了解,一般能够运用二维或三维图形来展现数据信息。
    【人工智能技术专题】「入门到精通系列教程」打好AI基础带你进军人工智能领域的全流程技术体系(机器学习知识导论)

强化学习(Reinforcement Learning)

强化学习(Reinforcement Learning):经过稀疏和推迟的反应标签来进行学习

依据环境的呼应及其反应,动态调整战略,不断优化学习进程,然后到达最优化方针的一种学习办法。

强化学习能够运用来自其本身行为和经历的反应,经过反复试验在交互式环境中学习。

常见机器学习算法

针关于机器学习算法的各种具体剖析和原理具体探究会在“【人工智能技能专题】「入门到通晓系列教程」打好AI根底带你进军人工智能范畴的全流程技能体系(机器学习算法概论)”进行剖析和阐明。

现在的人工智能范畴,有多种盛行的机器学习算法,其中包含:

【人工智能技术专题】「入门到精通系列教程」打好AI基础带你进军人工智能领域的全流程技术体系(机器学习知识导论)

  • 神经网络(Neural networks):神经网络仿照人脑的工作办法,适用于自然言语翻译、图画辨认、语音辨认和图画创立等运用;
  • 线性回归(Logistic regression):用于依据不同值之间的线性联系进行数值猜测,例如能够用于猜测房价;
  • 逻辑回归(Clustering):用于分类反应变量的猜测,例如答案为“是/否”的问题,适用于垃圾邮件分类和出产线上的质量操控等运用;
  • 聚类(Cluserting):选用无监督学习,能够辨认数据中的办法并进行分组;
  • 决议计划树(Decision tress):用于猜测数值或将数据分类,具有易于验证和审计的长处;
  • 随机森林(Random forests):选用多个决议计划树成果的组合来猜测值或类别。

机器学习的实践运用

机器学习运用广泛,以下是一些最常见的运用场景:

【人工智能技术专题】「入门到精通系列教程」打好AI基础带你进军人工智能领域的全流程技术体系(机器学习知识导论)

  • 图画辨认:机器学习能够用于辨认图画和视频中的物体、人像、地点等;
  • 语音辨认:机器学习能够将语音转换为文本,反之亦然;
  • 自然言语处理:机器学习能够用于了解和解释人类言语;
  • 引荐体系:机器学习能够依据用户过去的行为向用户引荐产品或服务;
  • 反常检测:机器学习能够用于检测数据中的反常办法或行为;
  • 诈骗检测:机器学习能够用于检测金融交易中的诈骗活动;
  • 猜测性保护:机器学习能够用于猜测机器或设备何时可能发生毛病;
  • 机器人:机器学习能够用于教机器人执行使命;
  • 自动驾驶汽车:机器学习能够用于使汽车能够自动驾驶,例如Google的Naymo、Tesla的FSD以及百度的Apollo自动驾驶体系。

内容总结

机器学习概念界说

机器学习是仿照人类学习行为的核算机科学范畴,旨在经过赋予机器获取新常识和技能的才能,完结人工智能体系的智能化。机器学习运用先进算法进行深层次的核算剖析和核算,完结自主学习和智能化决议计划。它能够辨认、分类、猜测等各类使命,并从现实国际中学习办法和规矩。

机器学习的技能分类

机器学习技能能够首要分为三类:监督学习、无监督学习和强化学习。这三种技能在机器学习范畴中运用广泛,也在现代工业界中被广泛选用。

数据

数据驱动是人工智能(AI)中的一种办法,经过对大量数据的处理、剖析和整理等操作,运用数据模型和算法来完结智能运用。

模型

模型是指为了依据数据X做出决议计划Y而提出的假定函数。模型能够有不同的形状,常见的有核算型和规矩型。

算法

算法是学习模型的核算办法,而核算学习是挑选最优模型的学习战略。为了得到最优模型,需求运用最优化办法进行求解。

常见机器学习算法

以下是机器学习中常见的几种算法:

  • 神经网络(Neural networks):仿照人脑的工作办法,适用于自然言语处理、图画和语音辨认等运用;
  • 线性回归(Logistic regression):依据不同值之间的线性联系进行数值猜测,例如能够用于猜测房价;
  • 逻辑回归(Clustering):用于分类反应变量的猜测,例如答案为“是/否”的问题,适用于垃圾邮件分类和出产线上的质量操控等运用;
  • 聚类(Clustering):选用无监督学习,能够辨认数据中的办法并进行分组;
  • 决议计划树(Decision trees):用于猜测数值和分类,具有易于验证和审计的长处;
  • 随机森林(Random forests):选用多个决议计划树成果的组合来猜测值或类别。

机器学习的实践运用

机器学习能够运用于图画辨认、语音辨认、自然言语处理、引荐体系、反常检测、诈骗检测、猜测性保护、机器人和自动驾驶汽车等范畴,然后完结比如检测反常、猜测机器毛病和自动驾驶等多种人工智能运用。