python数据挖掘使用Evidently创建机器学习模型仪表板

2024-04-02 19:04:59 329人浏览独家记忆

Python 官方文档：入门教程 => 点击学习

摘要

目录1、安装包2、导入所需的库3、加载数据集4、创建模型5、创建仪表板6、可用报告类型1)数据漂移2)数值目标漂移3)分类目标漂移4)回归模型性能5)分类模型性能6)概率分类模型性能

1、安装包

使用 pip 软件包管理器安装，运行


$ pip install evidently

该工具允许在 Jupyter notebook 中以及作为单独的html文件构建交互式报告。如果你只想将交互式报告生成为HTML文件或导出为jsON配置文件，则安装现已完成。

为了能够在 Jupyter notebook 中构建交互式报告，我们使用Jupyter nbextension。如果想在 Jupyter notebook 中创建报告，那么在安装之后，您应该在 terminal 中运行以下两个命令。

要安装 jupyter Nbextion，请运行：


$ jupyter nbextension install --sys-prefix --symlink --overwrite --py evidently

运行


jupyter nbextension enable evidently --py --sys-prefix

有一点需要注意：安装后单次运行就足够了。无需每次都重复最后两个命令。

2、导入所需的库

在这一步中，我们将导入创建ML模型所需的库。我们还将导入用于创建用于分析模型性能的仪表板的库。此外，我们将导入 pandas 以加载数据集。


import pandas as pd
import numpy as np
from sklearn.ensemble import RandomForestRegressor
from evidently.dashboard import Dashboard
from evidently.tabs import RegressionPerfORManceTab
from evidently.model_profile import Profile
from evidently.profile_sections import RegressionPerformanceProfileSection

3、加载数据集

在这一步中，我们将加载数据并将其分离为参考数据和预测数据。


raw_data = pd.read_csv('/content/day.csv', header = 0, sep = ',', parse_dates=['dteday'])
ref_data = raw_data[:120]
prod_data = raw_data[120:150]
ref_data.head()

4、创建模型

在这一步中，我们将创建机器学习模型，对于这个特定的数据集，我们将使用随机森林回归模型。


target = 'cnt'
datetime = 'dteday'
numerical_features = ['mnth', 'temp', 'atemp', 'hum', 'windspeed']
cateGorical_features = ['season', 'holiday', 'weekday', 'workingday', 'weathersit',]
features = numerical_features + categorical_features
model = RandomForestRegressor(random_state = 0)
model.fit(ref_data[features], ref_data[target])
ref_data['prediction']  = model.predict(ref_data[features])
prod_data['prediction'] = model.predict(prod_data[features])

5、创建仪表板

在这一步中，我们将创建仪表板来解释模型性能并分析模型的不同属性，如 MAE、MAPE、误差分布等。


column_mapping = {}
column_mapping['target'] = target
column_mapping['prediction'] = 'prediction'
column_mapping['datetime'] = datetime
column_mapping['numerical_features'] = numerical_features
column_mapping['categorical_features'] = categorical_features
dashboard = Dashboard(tabs=[RegressionPerformanceTab])
dashboard .calculate(ref_data, prod_data, column_mapping=column_mapping)
dashboard.save('bike_sharing_demand_model_perfomance.html')

在上图中，可以清楚地看到显示模型性能的报告，可以使用上述代码下载并创建的 HTML 报告。

6、可用报告类型

1)数据漂移

检测特征分布的变化

2)数值目标漂移

检测数值目标和特征行为的变化。

3)分类目标漂移

检测分类目标和特征行为的变化

4)回归模型性能

分析回归模型的性能和模型误差

5)分类模型性能

分析分类模型的性能和错误。适用于二元和多类模型

6)概率分类模型性能

分析概率分类模型的性能、模型校准的质量和模型错误。适用于二元和多类模型。

以上就是Python数据挖掘使用Evidently创建机器学习模型仪表板的详细内容，更多关于Evidently创建机器学习模型仪表板的资料请关注编程网其它相关文章！

您可能感兴趣的文档:

--结束END--

本文标题: python数据挖掘使用Evidently创建机器学习模型仪表板

本文链接: https://lsjlt.com/news/158009.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

猜你喜欢

python数据挖掘使用Evidently创建机器学习模型仪表板

目录1、安装包2、导入所需的库3、加载数据集4、创建模型5、创建仪表板6、可用报告类型1)数据漂移2)数值目标漂移3)分类目标漂移4)回归模型性能5)分类模型性能6)概率分类模型性能...

99+

2024-04-02
python怎么使用Evidently创建机器学习模型仪表板

这篇文章主要讲解了“python怎么使用Evidently创建机器学习模型仪表板”，文中的讲解内容简单清晰，易于学习与理解，下面请大家跟着小编的思路慢慢深入，一起来研究和学习“python怎么使用Evidently创建机器学习模型仪表板”吧...

99+

2023-06-25
如何使用PHP进行数据挖掘和机器学习？

随着信息时代的到来，数据已经成为人类生产和生活中不可或缺的资源。数据挖掘和机器学习作为数据分析的重要手段，已经受到越来越广泛的关注和应用。PHP作为一种广泛应用于Web开发的服务器端脚本语言，也逐渐开始在数据挖掘和机器学习领域崭露头角。本篇...

99+

2023-05-21

机器学习数据挖掘 PHP
机器学习：学习KMeans算法，了解模型创建、使用模型及模型评价

机器学习：学习KMeans算法，了解模型创建、使用模型及模型评价作者：i阿极作者简介：Python领域新星作者、多项比赛获奖者：博主个人首页 😊😊😊如果觉得文章不错或能帮助到你学习，可以点...

99+

2023-08-31

机器学习 python kmeans 算法
如何在Python中利用机器学习算法进行数据挖掘和预测

如何在Python中利用机器学习算法进行数据挖掘和预测引言随着大数据时代的到来，数据挖掘和预测成为了数据科学研究的重要组成部分。而Python作为一种简洁优雅的编程语言，拥有强大的数据处理和机器学习库，成为了数据挖掘和预测的首选工具。本文将...

99+

2023-10-22

机器学习预测 Python 数据挖掘
Python中怎么创建线性回归机器学习模型

Python中怎么创建线性回归机器学习模型，相信很多没有经验的人对此束手无策，为此本文总结了问题出现的原因和解决方法，通过这篇文章希望你能解决这个问题。线性回归机器学习模型1.要使用的数据集由于线性回归是我们在本文中学习的第一个机器学习模型...

99+

2023-06-16
python人工智能human learn绘图创建机器学习模型

目录什么是 human-learn安装 human-learn互动绘图创建模型并进行预测预测新数据解释结果预测和评估测试数据结论如今，数据科学家经常给带有标签的机器学习模型数据，以便...

99+

2024-04-02
使用C++构建机器学习模型：大型数据集的处理技巧

通过利用 c++++ 的优势，我们可以构建机器学习模型来处理大型数据集：优化内存管理：使用智能指针（如 unique_ptr、shared_ptr）使用内存池并行化处理：多线程（使用 s...

99+

2024-05-12

机器学习大数据 apache c++
使用C++训练机器学习模型：从数据预处理到模型验证

在 c++++ 中训练 ml 模型涉及以下步骤：数据预处理：加载、转换并工程化数据。模型训练：选择算法并训练模型。模型验证：划分数据集，评估性能，并调整模型。通过遵循这些步骤，您可以成功...

99+

2024-05-11

机器学习 c++
使用C++构建机器学习模型：初学者入门指南

使用 c++++ 构建机器学习模型的初学者指南。首先安装编译器和线性代数库，创建数据集，建立线性回归模型，优化模型权重以训练模型，然后使用模型预测目标值。实战案例演示了使用房屋面积和价格...

99+

2024-05-12

机器学习 c++
C++技术中的机器学习：使用C++构建机器学习模型的步骤是什么？

c++++ 是构建机器学习模型的理想选择。构建模型的步骤包括：数据收集和预处理、模型选择、模型训练、模型评估和模型部署。实战案例演示了使用 mlpack 库构建线性回归模型的过程，包括数...

99+

2024-05-12

机器学习 c++
如何在C++中构建机器学习模型并处理大规模数据？

如何在 c++++ 中构建机器学习模型并处理大规模数据：构建模型：使用 tensorflow 库定义模型架构并构建计算图。处理大规模数据：使用 tensorflow 的 datasets...

99+

2024-05-16

机器学习大数据 python c++
使用Java中的TensorFlow来构建和训练机器学习模型

如果您觉得本博客的内容对您有所帮助或启发，请关注我的博客，以便第一时间获取最新技术文章和教程。同时，也欢迎您在评论区留言，分享想法和建议。谢谢支持！一、引言 1.1 TensorFlow简介 TensorFlow是由Google B...

99+

2023-09-28

机器学习 java tensorflow
Python使用机器学习模型实现温度预测详解

目录温度预测回归分析温度预测随机森林 Python 写法使用 Python 可以使用机器学习模型进行温度预测。常用的模型有回归分析、随机森林等。使用前需要准备足够的历史数据并进行...

99+

2023-01-31

Python机器学习温度预测 Python温度预测 Python 预测
如何利用机器学习模型对PySpark流数据进行预测

这篇文章将为大家详细讲解有关如何利用机器学习模型对PySpark流数据进行预测，文章内容质量较高，因此小编分享给大家做个参考，希望大家阅读完这篇文章后对相关知识有一定的了解。概述流数据是机器学习领域的一个新兴概念学习如何使用机器学习模型（如...

99+

2023-06-19
Python 字典在机器学习中的应用：构建智能模型的基础

Python 字典是一种无序的数据结构，允许用户使用索引值（键）来访问特定的数据项。与列表不同，字典中的数据项是通过索引值而不是位置来访问的。这使得字典对于存储和检索数据非常高效，特别是在需要快速访问特定数据项的情况下。在机器学习中，...

99+

2024-02-22

Python 字典机器学习分类器回归模型聚类算法
Python中的实时数据类型在机器学习中有何应用？

随着人工智能和机器学习技术的不断发展，实时数据处理成为了机器学习领域中一个非常重要的概念。Python作为一门非常流行的编程语言，在实时数据处理和机器学习领域中也扮演着非常重要的角色。本文将讨论Python中的实时数据类型在机器学习中的应...

99+

2023-10-23

对象实时数据类型
揭秘 Python 机器学习背后的奥秘：如何利用数据创造价值

Python 机器学习简介机器学习是计算机科学的一个分支，它致力于让计算机学习如何像人一样思考和行动。机器学习算法可以从数据中学习，并在没有被明确编程的情况下做出决策。 Python 机器学习是一个功能强大的工具，可用于各种任务，包括：...

99+

2024-02-14

Python 机器学习数据算法模型
C++技术中的大数据处理：如何使用机器学习算法进行大数据预测和建模？

利用 c++++ 中的机器学习算法进行大数据预测和建模包括：使用分布式处理库（如 spark）处理大数据集。使用智能指针和引用计数管理内存。利用多线程提高性能。常见的机器学习算法包括：线...

99+

2024-05-12

机器学习大数据处理 apache c++
使用Python部署机器学习模型的10个实践经验分别怎么样的

今天就跟大家聊聊有关使用Python部署机器学习模型的10个实践经验分别怎么样的，可能很多人都不太了解，为了让大家更加了解，小编给大家总结了以下内容，希望大家根据这篇文章可以有所收获。有时候，作为数据科学家，我们会忘记公司付钱让我们干什么。...

99+

2023-06-16