首页 > 资讯 > 后端开发 > Python >Python中Sweetviz如何实现探索性数据分析

284

分享到

Python中Sweetviz如何实现探索性数据分析

2023-06-25 12:06:31 284人浏览薄情痞子

Python 官方文档：入门教程 => 点击学习

摘要

小编给大家分享一下python中Sweetviz如何实现探索性数据分析，希望大家阅读完这篇文章之后都有所收获，下面让我们一起去探讨吧！Sweetviz 是一个开源 Python 库，它只需三行代码就可以生成漂亮的高精度可视化效果来启动EDA

小编给大家分享一下python中Sweetviz如何实现探索性数据分析，希望大家阅读完这篇文章之后都有所收获，下面让我们一起去探讨吧！

Sweetviz 是一个开源 Python 库，它只需三行代码就可以生成漂亮的高精度可视化效果来启动EDA(探索性数据分析)。输出一个html。文末提供技术交流群，喜欢点赞支持，收藏。

Python中Sweetviz如何实现探索性数据分析

如上图所示，它不仅能根据性别、年龄等不同栏目纵向分析数据，还能对每个栏目做众数、最大值、最小值等横向对比。

所有输入的数值、文本信息都会被自动检测，并进行数据分析、可视化和对比，最后自动帮你进行总结，是一个探索性数据分析的好帮手。

1.准备

请选择以下任一种方式输入命令安装依赖：
1. windows 环境打开 Cmd (开始-运行-CMD)。
2. MacOS 环境打开 Terminal (command+空格输入Terminal)。
3. 如果你用的是 vscode编辑器或 PyCharm，可以直接使用界面下方的Terminal.

pip install sweetviz

2.sweetviz 基本用法

sweetviz 使用的原理是，使用一行代码，生成一个数据报告的对象（其中，my_dataframe是pandas中的DataFrame，一种表格型数据结构）：

import pandas as pdimport sweetviz as sv# 读取数据my_dataframe = pd.read_csv('../ImpartData/iris.csv')# 分析数据my_report = sv.analyze(my_dataframe)# 生成报告my_report.show_html()

执行完成后，会在当前文件夹下生成一个HTML的报告文件

Python中Sweetviz如何实现探索性数据分析

双击这个html，你就能看到精美的分析报告了：

Python中Sweetviz如何实现探索性数据分析

其中，分析数据有三种函数可以用，除了上面提到的analyze函数，还有 compare 和 compare_intra 函数。

首先是analyze函数：

analyze(source: UNIOn[pd.DataFrame, Tuple[pd.DataFrame, str]],            target_feat: str = None,            feat_cfg: FeatureConfig = None,            pairwise_analysis: str = 'auto')

可见其有以下4个参数可以配置：

source：以pandas中的DataFrame数据结构作为分析对象。
target_feat：需要被标记为目标对象的字符串。
feat_cfg：需要被跳过、或是需要被强制转换为某种数据类型的特征。
pairwise_analysis：相关性分析可能需要花费较长时间。如果超过了你的忍受范围，就需要设置这个参数为on或者off，以判断是否需要分析数据相关性。

compare()丨两个数据集比较

my_report = sv.compare([my_dataframe, "Training Data"], [test_df, "Test Data"], "Survived", feature_config)

要比较两个数据集，只需使用该 compare() 函数。它的参数与 analyze() 相同，只是插入了第二个参数来覆盖比较数据帧。建议使用 [dataframe, “name”] 参数格式以更好地区分基础数据帧和比较数据帧。（例如 [my_df, "Train"] 比 my_df 更好）

compare_intra()丨数据集栏目比较

my_report = sv.compare_intra(my_dataframe, my_dataframe["Sex"] == "male", ["Male", "Female"], feature_config)

想要对数据集中某个栏目下的参数进行分析，就采用这个函数进行。
例如，如果需要比较“性别”栏目下的“男性”和“女性”，就可以采用这个函数。

3.调整报告布局

一旦你创建了你的报告对象，只需将它传递给两个show函数中的一个：

1. show_html():

show_html( filepath='SWEETVIZ_REPORT.html',            open_browser=True,            layout='widescreen',            scale=None)

**show_html(…)**将在当前文件路径中创建并保存 HTML 报告。有以下参数：

layout (布局)：无论是 'widescreen'或 ‘vertical'。当鼠标移过每个功能时，宽屏布局会在屏幕右侧显示详细信息。新的（从 2.0 开始）垂直布局在水平方向上更加紧凑，并且可以在单击时扩展每个细节区域。
scale：使用浮点数（scale=0.8或 None ）来缩放整个报告。
open_browser：启用 WEB 浏览器的自动打开以显示报告。如果不需要，可以在此处禁用它。

2.show_notebook():

show_notebook( w=None,                h=None,                scale=None,                layout='widescreen',                filepath=None)

它将嵌入一个 IFRAME 元素，在notebook中显示报告（例如 Jupyter、Google Colab 等）。

请注意，由于Notebook通常是一个更受限制的环境，因此使用自定义宽度/高度/比例值 (w , h , scale) 可能是个好主意。选项是：

w（宽度）：设置报告输出窗口的宽度。可以是百分比字符串 ( w=“100%”) 或像素 (w=900)。
h（高度）：设置报告输出窗口的高度。可以是像素数 (h=700) 或将窗口拉伸到与所有特征 ( h=“full”)一样高。
scale：与上面的 show_html 相同。
layout：与上面的 show_html 相同。
scale：与上面的 show_html 相同。
filepath：可选的输出 HTML 报告。

看完了这篇文章，相信你对“Python中Sweetviz如何实现探索性数据分析”有了一定的了解，如果想了解更多相关知识，欢迎关注编程网Python频道，感谢各位的阅读！

您可能感兴趣的文档:

--结束END--

本文标题: Python中Sweetviz如何实现探索性数据分析

本文链接: https://lsjlt.com/news/304576.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

回答

如何调试操作系统的错误？
操作系统

2023-11-15发布

回答

操作系统中的I/O系统是如何实现的？
操作系统

2023-11-15发布

回答

如何实现操作系统的内存管理？
操作系统

2023-11-15发布

回答

什么是虚拟内存，它对操作系统有什么影响？
操作系统

2023-11-15发布

回答

ASP中的MVC架构和WebForms架构有什么区别和使用场景？
ASP.NET

2023-11-15发布

回答

ASP中的数据验证和数据校验有什么不同？
ASP.NET

2023-11-15发布

回答

ASP中的ADO对象和DAO对象有什么区别和使用方法？
ASP.NET

2023-11-15发布

回答

Node.js中的包管理器NPM是什么？如何使用它进行依赖管理？
node.js

2023-11-15发布

回答

Vue.js中的动态组件是什么？如何使用它来动态渲染组件？
VUE

2023-11-15发布

回答

如何使用Vue.js实现懒加载和预加载？
VUE

2023-11-15发布

Python中Sweetviz如何实现探索性数据分析

1.准备

2.sweetviz 基本用法

3.调整报告布局

1. show_html():

2.show_notebook():

Python中Sweetviz如何实现探索性数据分析

Python Sweetviz轻松实现探索性数据分析

Python 数据分析教程探索性数据分析

Python中常用探索性数据分析方法有哪些

Python数据分析：数据探索和预测

Python 数据分析的实验室：实验和探索

Python如何实现Excel数据的探索和清洗

PHP 中 Elasticsearch 实现大数据分析与挖掘技术探索

Python 更快进行探索性数据分析的四个方法

Python数据可视化探索实例分享

利用Python自制网页并实现一键自动生成探索性数据分析报告

Python 数据分析的权威指南：深入探索

如何在 Python 中使用 numpy 实现实时数据分析？

Python中怎么实现数据分析

如何在PHP中实现大数据分析

如何在Python中进行数据可视化和探索

Python 数据分析的艺术：探索高级技巧和技术

ASP接口如何实现大数据索引的多维分析？

运算符的盛宴：探索Python中操纵和分析数据的工具

运算符的奥秘：探索Python中操纵和分析数据的工具

python分析数据的方法是什么

如何使用Python实现抽奖小程序

python copy函数的作用是什么

python ffmpeg模块怎么安装和使用

python进程池创建队列的方法是什么

python无法运行文件的原因有哪些

python can't open file报错怎么解决

python keyerror错误怎么解决

python字符串处理与应用的方法有哪些

python全局变量如何定义