Pandas 计算相关性系数corr()方式

2024-04-02 19:04:59 624人浏览八月长安

Python 官方文档：入门教程 => 点击学习

摘要

目录pandas 计算相关性系数corr()相关：数据之间有关联，相互有影响相关性系数：衡量相关性强弱的构造如下数据pandas相关系数-DataFrame.corr()参数参数说明

Pandas 计算相关性系数corr()

构造如下数据

import pandas as pd

data = pd.DataFrame(
    data={
        'age': [2,7,10,16,20],
        'height': [70,90,143,166,178],
        'score': [98,37,103,76,53]
    }
)

使用corr()方法计算相关性系数：

# 计算相关性系数的列 必须都是数值型的数据！
corr = data.loc[:, ["age","height"]].corr()        # 会计算两两列之间的相关性系数
print("corr\n", corr)
"""
corr
            age   height
age     1.00000  0.96043
height  0.96043  1.00000
"""

自身与自身的相关性系数为 1

计算多列相关性系数：

corr = data.loc[:, ["age","height","score"]].corr()
print("corr\n", corr)
"""
corr
             age    height     score
age     1.000000  0.960430 -0.340053
height  0.960430  1.000000 -0.096782
score  -0.340053 -0.096782  1.000000
"""

pandas相关系数-DataFrame.corr()参数

DataFrame.corr(method='pearson', min_periods=1)

参数说明

method：可选值为{‘pearson’, ‘kendall’, ‘spearman’}
pearson：Pearson相关系数来衡量两个数据集合是否在一条线上面，即针对线性数据的相关系数计算，针对非线性数据便会有误差。
kendall：用于反映分类变量相关性的指标，即针对无序序列的相关系数，非正太分布的数据
spearman：非线性的，非正太分布的数据的相关系数
min_periods：样本最少的数据量
返回值：各类型之间的相关系数DataFrame表格。

为区分不同参数之间的区别，我们实验如下：

from pandas import DataFrame
import pandas as pd
x=[a for a in range(100)]
#构造一元二次方程，非线性关系
def y_x(x):
    return 2*x**2+4
y=[y_x(i) for i in x]
 
data=DataFrame({'x':x,'y':y})
 
#查看下data的数据结构
data.head()
Out[34]: 
   x   y
0  0   4
1  1   6
2  2  12
3  3  22
4  4  36
 
data.corr()
Out[35]: 
          x         y
x  1.000000  0.967736
y  0.967736  1.000000
 
data.corr(method='spearman')
Out[36]: 
     x    y
x  1.0  1.0
y  1.0  1.0
 
data.corr(method='kendall')
Out[37]: 
     x    y
x  1.0  1.0
y  1.0  1.0

因为y经由函数构造出来，x和y的相关系数为1，但从实验结构可知pearson系数，针对非线性数据有一定的误差。

需要说明，数据之间的相关关系，并不代表其之间的因果关系，相关系数为1，只能说明二者之间具备完全相关性，但不能说y是x的果。

以上为个人经验，希望能给大家一个参考，也希望大家多多支持编程网。

您可能感兴趣的文档:

--结束END--

本文标题: Pandas 计算相关性系数corr()方式

本文链接: https://lsjlt.com/news/119417.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

猜你喜欢

Pandas 计算相关性系数corr()方式

目录Pandas 计算相关性系数corr()相关：数据之间有关联，相互有影响相关性系数：衡量相关性强弱的构造如下数据pandas相关系数-DataFrame.corr()参数参数说明...

99+

2024-04-02
pandas计算相关系数corr返回空的问题解决

目录解决方法问题复现解决方法查看dataframe的数据类型，转为数值类型即可： dataframe = dataframe.astype("float") 或者逐列转换： for...

99+

2023-01-17

pandas corr返回空 pandas corr返回
VB.NET计算数字相关函数的使用方法

这篇文章将为大家详细讲解有关VB.NET计算数字相关函数的使用方法，文章内容质量较高，因此小编分享给大家做个参考，希望大家阅读完这篇文章后对相关知识有一定的了解。VB.NET编程语言一经出现，就凭借其强大的功能受到广大开发人员的青睐。它的应...

99+

2023-06-17
Vue3计算属性和异步计算属性方式

目录一、简要介绍二、计算属性核心源码三、异步计算属性核心源码一、简要介绍不论是计算属性，还是异步计算属性，都是依托于Vue3整体的响应式原理实现的。其核心依旧是Reac...

99+

2024-04-02
肯德尔（Kendall）相关系数概述及Python计算例

目录 1. 何谓相关（correlation） 2. 肯德尔相关 3. 肯德尔相关的假设 4. 计算公式及代码示例 4.1 Tau-a 4.2 Tau-b 1. 何谓相关（correlation）相...

99+

2023-09-16

python scipy.stats 概率统计相关系数
相关性分析、相关系数矩阵热力图

相关性相关性分析是研究两组变量之间是否具有线性相关关系，所以做相关性分析的前提是假设变量之间存在线性相关性，得到的结果也是描述变量间的线性相关程度。除此之外，相关性分析方法还会有其他的假设条件。而灰色关联度分析首先对数据量...

99+

2023-09-04

python 数据分析
数学建模：相关性分析学习——皮尔逊（pearson）相关系数与斯皮尔曼（spearman）相关系数

目录前言一、基本概念及二者适用范围比较 1、什么是相关性分析 2、什么是相关系数 3、适用范围比较二、相关系数 1.皮尔逊相关系数（Pearson correlation） 1、线性检验 2、正态检验 3、求相关系数 2、斯皮尔曼相关...

99+

2023-08-31

python pandas 数据分析
Java中性能相关的设计模式有哪些

这篇文章主要介绍“Java中性能相关的设计模式有哪些”，在日常操作中，相信很多人在Java中性能相关的设计模式有哪些问题上存在疑惑，小编查阅了各式资料，整理出简单好用的操作方法，希望对大家解答”Java中性能相关的设计模式有哪些”的疑惑有所...

99+

2023-07-02
Android编程计算函数时间戳的相关方法总结

本文实例讲述了Android编程计算函数时间戳的相关方法。分享给大家供大家参考，具体如下：对于做性能的人来说，知道时间的花在哪了是比较重要的，可以在函数前后得到系统的时间，计算时间戳能够得到每个函数的时间。在JAVA中可以通过System....

99+

2023-05-31

android 时间戳 roi
操作系统虚拟化与云计算：探索其相辅相成的关系

操作系统虚拟化操作系统虚拟化是一种通过软件将一台物理服务器划分为多个虚拟机的技术。每个虚拟机都可以运行自己的操作系统和应用程序，就像它们在物理服务器上一样。这允许在单一物理系统上运行多个应用程序，从而提高资源利用率并降低成本。云计算 ...

99+

2024-04-02
使用Python计算皮尔逊相关系数，并用热力图展示

学习笔记☞学习计算皮尔相关逊系数，并用热力图展示出来。由于是自我练习的笔记，所以这里先通过Pandas随机生成一部分时序数据，然后再调用corr()函数来计算皮尔逊相关系数，并把计算结果先展示输出出来，最后通过热力图的方式把...

99+

2023-09-10

python pandas numpy
C语言计算大数相加的方法

本文实例为大家分享了C语言计算大数相加的具体代码，供大家参考，具体内容如下问题描述输入两个整数a和b，输出这两个整数的和。a和b都不超过100位。算法描述　　由于a和b都比较...

99+

2024-04-02
Vue中computed计算属性和data数据获取方式

目录computed计算属性和data数据获取解决方法一解决方法二computed计算属性取对象的值，第一次报错undefined报错和打印值解决方案computed计算属性和dat...

99+

2024-04-02
java 对数和指数计算方式

目录java计算对数和指数Java普通对数（log）计算如下代码：java计算对数和指数 public static void main(String[] args) throw...

99+

2024-04-02
vue计算属性computed方法内传参方式

目录vue计算属性computed方法内传参计算属性computed与method的区别什么是计算属性？computed实例computed与method的区别关于传参问题vue计算...

99+

2022-11-13

vue计算属性传参 vue computed方法内传参 vue computed传参
详解Python进行数据相关性分析的三种方式

目录相关性实现NumPy 相关性计算SciPy 相关性计算Pandas 相关性计算线性相关实现线性回归：SciPy 实现等级相关排名：SciPy 实现等级相关性：NumPy 和 Sc...

99+

2024-04-02
php日期之间相差天数计算方法

php 中有两种计算日期差的方法：1. 使用 dateinterval 类，2. 使用 strtotime 和 date_diff 函数。具体实现方法分别为：1. 使用 diff 方法获...

99+

2024-04-09

php 日期计算
C++ 函数参数传递方式与程序设计模式的关系

c++++ 中函数参数传递方式与程序设计模式紧密相关，不同的传递方式将影响函数行为和模式选择。按值传递副本传递变量，适合不可变对象或复制成本高的对象。按引用传递直接操作变量，适合输入输出...

99+

2024-04-12

c++ 函数参数
Pearson相关性分析& plot绘图（相关性系数柱状图、绘制非空值数量柱状图）

Pearson相关性分析 & plot绘图（相关性系数柱状图、绘制非空值数量柱状图） 1.Pearson相关性分析 Pearson相关性分析是一种用于检测两个变量之间线性关系强度的统计方法，其结果介于...

99+

2023-09-29

python numpy 机器学习
关于matplotlib及相关cmap参数的取值方式

目录matplotlib及相关cmap参数的取值matplotlib中各种图形参数解释柱状图bar的使用散点图scatter的使用折线图plot的使用箱型图boxplot的使用饼图p...

99+

2024-04-02