【译】使用LazyPredict对ML模型进行可视化和比较

我们生活在一个计算和技术至上的时期,计算已经从电线纠结的大型主机到个人电脑,再到云计算的时代。我们周围的世界正在迅速变化,而使其更加引人注目的不是直到现在已经发生的事情,而是尚python可以做什么工作未到来的事情。这是一个令人兴奋的时代,各种工具Git和技术正在被开发,随之而来的是计算能力的测试抑郁症的20道题大幅提升,这可以真正称为数据科学的世界!。机器学习,或简称ML,已被证明是当前十年中python怎么读最能改变游戏规则的技开源节流术进步之一。在竞争日益激烈的企业界,ML使企业能够快速实现数字化转型,并迅速进入自动化时代。由于人工智能/ML在日常生活中的使用需求,如银行业的数字python123平台登录支付和欺诈检测,或向客Python户提供产品推荐,它开源节流们将在这里保持相关性。

机器giticomfort是什么轮胎学习算法的采用和学习方法是有据可查的,而且很容易获Git得,不同的公司在垂直领域大规模地采用机器学习。今天互联网上的每一个其他应用程序和软件都以某种方式使用机器学习。机器学习现在已经成为公司解决问题的首选方案。今天,人们可以使用机器学习来处理当前和过去的数据,以预测未来的数据。其他现实世界的应机器学习用也各不相同,从寻找地图中到达目的地的最短路径到识别癌细胞的类型。

开发机器学习模型的过程可能很复杂,所开发的模型必须以完gitlab全适合问题的方式构建。机器学习被用来解决机器学习一个问题,或者提供可以导致更好的决策的见解,只要有数据存在。然而,在机器学习模型的情况下,没有一种方法可以用来解决所有问题。不同类型的算法被开发出来,使用完全不同的技术解决不同的问题。对于每一类,提供的输入、完成的任务和取得的结果都测试抑郁程度的问卷是极其不同的。

一些主要的类型是监督学习、半监督学习和强化学习。监督学习是一种机器学习算法,在这种算法中,正在开发一个模型或一个函数,将测试数据的输入映射到各自的输出。这里,训练数据集是一个标记数据的数据库,而测试数据是一组没有标签的输入。无监督学习是一种机器学习,它使用从没有标签的数据集中得开源软件出的推论。强化学习算法是机器学习模型python保留字的一种开源阅读类型,其中任务是由代理人在一个python语言特定的python编程模拟环境中执行的。在此过程中,代理要么接受奖励,要么接受惩罚,以完成每项任务。与其他机器学习方法不同,该算法没有得到任何指示,而是自己学习。

机器学习方法取决于测试手机是否被监控任务的类型,可以进一步分为分类模型、gitee回归模型、聚类等。分类是指从有限数量的选项中预测物体的类型或类别的giti轮胎任务。分类产生的输出变量通常是github永久回家地址分类的,但回归可能被用来解决使用连续输出变量的问题集合。例如,预测飞机票的价格就是一个典型的回归任务。另一方面,聚类是对以某种方式相关的项目进行分组的挑战。它有助于自动识别类似的项目,而不需要人类的互动。

什么是LazyPredict?

LazyPre测试工程师dict是一个开源的python库,可以帮助你半自动测试抑郁症化地完成机器学习任务。它可以建立多个模型,而不需要写很多代码,并帮助了python语言解哪些模型测试仪对所处理的数据集更有效,而不需要进行任何参数调整。开源代码网站github使用LazyPredict,人们可以在该数据集上应用所有的模型来比较和分析我们的基本模型的表现。这里的基本模型是指 “没有参数的模型”。它可以帮助得出准确率,在得到所有模型的准确率后,可以选择前5个模型,然后对它们进行超开源中国参数调整。它配备了一个懒人分类器来解决分类问题,以及懒人回归器来解决回归问题。

在建立机器学习模型时,人们无法确定哪种算法会在给定的数据集上运行良好;因此,最终会尝试许开源众包多模型并不断迭代,直到合成适当机器学习的准确性。LazyPredict为这类用例提供了帮助,在你的模型上生成所有基本机器学习算法的性能。除了准确率得分外,LazyPredict还提供了某些评估指标,并描述了每个模型所开源阅读app下载安装花费的时间。

代码入门

在这篇文章中,我们将使用LazyPredict库实现一个模型,这将帮助我们找到最适合的分类和回归模型,以用于我们的数据集和每个模型的准确度得分。此外,我们还将把准确率分数可视化,以比较和选择最适合处理的数据集开源节流是什么意思的模型。以下代码的灵感来自于LazyPredict的创造者提供的文档,其链接可以在这里找到。

安装库

第一步是安装L测试仪azyPredgit命令ict库,以建立我们的python基础教程模型;你可以使用以下代码来完成。

!pip install lazypredict
!pip install scipy==1.7.1

我们还将安装最新版本的SciPpython123平台登录y,这将帮助我们更好地处理数据。

#cloning the model
!git clone https://github.com/shankarpandala/lazypredict.git
进行分类。导入依赖项

现在我测试仪们将为我们的模型导入所需的基本依赖项。

# Import libraries
import lazypredict
from lazypredict.Supervised import LazyClassifier
from sklearn.datasets import load_breast_cancer
from sklearn.model_selection import train_test_split
加载数据python语言

现在让我们加载我们的数据集;我们使用内置的乳python123平台登录腺癌数据集来解决我们的第一个问题。

# Load dataset
data = load_breast_cancer()
X = data.data
y= data.target

将数据集分git命令割成训练和测试。

# Splitting Dataset
X_train, X_test, y_train, y_test = train_test_split(X, y,test_size=.2,random_state =42)
执行分类

随着数据集的加载和其他一切的设置,现在让我们来执行我们的分类任务。为此,我们将使用LazyClassifier设置我们的分类管道。

# Defining parameters for lazyclassifier
clf = LazyClassifier(verbose=0,ignore_warnings=True, custom_metric=None)
models_train,predictions_train = clf.fit(X_train, X_train, y_train, y_train)
models_test,predictions_test = clf.fit(X_train, X_test, y_train, y_test)
# Printing all the model performances
models_train

输出。

【译】使用LazyPredict对ML模型进行可视化和比较

正如你所看到的,LazyClassifier已经根据我们的数据集为我们提供了所有可能的模型的分数!现在让我们将分数可视化。

现在让我们把这些分数可视化,以获得更好的理解。

#plotting the accuracy scores
import matplotlib.pyplot as plt
import seaborn as sns
plt.figure(figsize=(10, 5))
sns.set_theme(style="whitegrid")
ax = sns.barplot(x=models_train.index, y="Accuracy", data=models_train)
plt.xticks(rotation=90)

【译】使用LazyPredict对ML模型进行可视化和比较

import matplotlib.pyplot as plt
import seaborn as sns
plt.figure(figsize=(5, 10))
sns.set_theme(style="whitegrid")
ax = sns.barplot(y=models_train.index, x="Accuracy", data=models_train)

【译】使用LazyPredict对ML模型进行可视化和比较

使giti轮胎用这种可视化的方法,我们现在可以很容易地了解为获得最佳精度而使用的最佳模型。python是什么意思

执行回归

我们也可Python以使用LazyRegressor模块在另一个数据集上执行回归。

# Importing the libraries
from lazypredict.Supervised import LazyRegressor
from sklearn import datasets
from sklearn.utils import shuffle
import numpy as np
# Loading the Boston dataset
boston = datasets.load_boston()
X, y = shuffle(boston.data, boston.target, random_state=42)
#Splitting Data
X_train, X_test, y_train, y_test = train_test_split(X, y,test_size=.2,random_state =42)
# building the pipeline
reg = LazyRegressor(verbose=0,ignore_warnings=False, custom_metric=None)
models_train,predictions_train = reg.fit(X_train, X_train, y_train, y_train)
models_test,predictions_test = reg.fit(X_train, X_test, y_train, y_test)
# Printing all model performances
models_train

输出 :

【译】使用LazyPredict对ML模型进行可视化和比较

【译】使用LazyPredict对ML模型进行可视化和比较

为某一特定列创建可git命令视化,例如只为R-squared Score测试抑郁程度的问卷

import matplotlib.pyplot as plt
import seaborn as sns
plt.figure(figsize=(10, 5))
sns.set_theme(style="whitegrid")
ax = sns.barplot(x=models_train.index, y="R-Squared", data=models_train)
ax.set(ylim=(0, 1))
plt.xticks(rotation=90)

【译】使用LazyPredict对ML模型进行可视化和比较

import matplotlib.pyplot as plt
import seaborn as sns
models_train["R-Squared"] = [0 if i < 0 else i for i in models_train.iloc[:,0] ]
plt.figure(figsize=(5, 10))
sns.set_theme(style="whitegrid")
ax = sns.barplot(y=models_train.index, x="R-Squared", data=models_train)
ax.set(xlim=(0, 1))

【译】使用LazyPredict对ML模型进行可视化和比较

结束语

在这篇文章中测试手机是否被监控,我们了解了不同机器学习模型github永久回家地址的重要性以及它们的用途。我们还使测试抑郁程度的问卷用LazyPredict库创建了一个模型,帮助我们了解最适合我们的数据集的模型,以获得最佳结果和准确性。以下的实现可以作python是什么意思为Colab笔记本找到,使用 这里的链接。

学习愉快!

参考文献

  • 官方测试抑郁症的20道题Github仓库
  • Scipy网站

The p测试你的自卑程度ost测试仪Visualizing and Cgitlabomparing ML开源众包 Models Using LazyPredictappeared first onAnalytics India M机器学习agazine.