首页 > 资讯 > 后端开发 > Python >python怎么实现K-means算法

317

分享到

python怎么实现K-means算法

2023-06-01 23:06:15 317人浏览安东尼

Python 官方文档：入门教程 => 点击学习

摘要

本篇内容介绍了“python怎么实现K-means算法”的有关知识，在实际案例的操作过程中，不少人都会遇到这样的困境，接下来就让小编带领大家学习一下如何处理这些情况吧！希望大家仔细阅读，能够学有所成！　　K-means 聚类算法　　特点　　

本篇内容介绍了“python怎么实现K-means算法”的有关知识，在实际案例的操作过程中，不少人都会遇到这样的困境，接下来就让小编带领大家学习一下如何处理这些情况吧！希望大家仔细阅读，能够学有所成！

　　K-means 聚类算法

　　特点

　　对初始化敏感。初始点选择的不同，可能会产生不同的聚类结果

　　最终会收敛。不管初始点如何选择，最终都会收敛

　　算法思想

　　选择K个点作为初始质心

　　repeat

　　将每个点指派到最近的质心，形成K个簇

　　重新计算每个簇的质心

　　until 簇不发生变化或达到最大迭代次数

　　代码实现

　　实验目的

　　根据下列成绩单，将5名同学成绩归为A类、B类、C类。

　　限制：使用Kmeans算法实现，但不直接调用sklearn第三方库的KMeans函数。

　　学生姓名　　小测1　　小测2　　小测3　　期末成绩　　项目答辩　　成绩

　　张三　　12　　15　　13　　28　　24　　?

　　李四　　7　　11　　10　　19　　21　　?

　　王五　　12　　14　　11　　27　　23　　?

　　赵六　　6　　7　　4　　13　　20　　?

　　刘七　　13　　14　　13　　27　　25　　?

　　实验步骤

　　1. 数据准备

　　将数据储存为csv文件，格式如下

　　学生姓名,小测1,小测2,小测3,期末成绩,项目答辩

　　张三,12,15,13,28,24

　　李四,7,11,10,19,21

　　王五,12,14,11,27,23

　　赵六,6,7,4,13,20

　　刘七,13,14,13,27,25

　　在从csv文件中读取数据，并选取可用的数据(排除姓名列)

　　data = pd.read_csv('grade.csv')

　　new_data = data.iloc[:, 1:].values

　　2. KMeans算法实现

　　KMeans算法涉及两点之间距离的计算，我们提前写好一个函数：输入两个点的坐标，返回两点之间的欧氏距离

　　def eucliDist(A, B):

　　return math.sqrt(sum([(a - b) ** 2 for (a, b) in zip(A, B)]))

　　函数k_means(c,data,max,label)实现KMeans算法：

　　a. 输入：质心列表c，待聚类数据data，最大迭代次数max，标签列表label

　　b. 计算data中的每个点分别到3个质心的欧式距离，得到一个矩阵metrix

　　metrix = [[eucliDist(a, b) for a in data] for b in c]

　　c. 比较矩阵metrix同一列的数值大小，将对应的学生划归距离较短的质心所属的类，将标签存储为列表.

　　classifier = []

　　for (d, e, f) in zip(metrix[0], metrix[1], metrix[2]):

　　m = min(d, e, f)

　　if d == m:

　　classifier.append(label[0])

　　elif e == m:

　　classifier.append(label[1])

　　else:

　　classifier.append(label[2])

　　d. 重新计算质心的坐标，新质心的坐标=被划归同一类点的坐标的平均值

　　n1, n2 = 0, 0

　　c1 = [0, 0, 0, 0, 0]

　　c2 = c1

　　c3 = c1

　　for i in range(0, num):

　　if classifier[i] == label[0]:

　　c1 = [a + b for (a, b) in zip(c1, data[i])]

　　n1 = n1 + 1

　　elif classifier[i] == label[1]:

　　c2 = [a + b for (a, b) in zip(c2, data[i])]

　　n2 = n2 + 1

　　else:

　　c3 = [a + b for (a, b) in zip(c3, data[i])]

　　c1 = [a / n1 for a in c1]

　　c2 = [a / n2 for a in c2]

　　c3 = [a / (num - n1 - n2) for a in c3]

　　e. 重复b~d，直到质心坐标不再变化或达到最大迭代次数

　　f. 返回标签列表

　　完整函数如下

　　def k_means(c, data, max,label):

　　# a. 输入质心列表c，待聚类数据`data`，最大迭代次数max

　　max = max - 1

　　num = len(data)

　　# b. 计算data中的每个点分到k个质心的距离，得到一个矩阵，如

　　metrix = [[eucliDist(a, b) for a in data] for b in c]

　　print(metrix)

　　# c. 比较矩阵同一列的数值大小，将对应的学生划归距离较短的质心所属的类，将标签存储为列表

　　classifier = []郑州做人流手术费用 Http://4g.zyfuke.com/

　　for (d, e, f) in zip(metrix[0], metrix[1], metrix[2]):

　　m = min(d, e, f)

　　if d == m:

　　classifier.append(label[0])

　　elif e == m:

　　classifier.append(label[1])

　　else:

　　classifier.append(label[2])

　　print(classifier)

　　# d. 重新计算质心的坐标，新质心的坐标=被划归同一类点的坐标的平均值

　　n1, n2 = 0, 0

　　c1 = [0, 0, 0, 0, 0]

　　c2 = c1

　　c3 = c1

　　for i in range(0, num):

　　if classifier[i] == label[0]:

　　c1 = [a + b for (a, b) in zip(c1, data[i])]

　　n1 = n1 + 1

　　elif classifier[i] == label[1]:

　　c2 = [a + b for (a, b) in zip(c2, data[i])]

　　n2 = n2 + 1

　　else:

　　c3 = [a + b for (a, b) in zip(c3, data[i])]

　　c1 = [a / n1 for a in c1]

　　c2 = [a / n2 for a in c2]

　　c3 = [a / (num - n1 - n2) for a in c3]

　　print(max)

　　print([c1,c2,c3])

　　# e. 重复b~d，直到质心坐标不再变化,或达到最大迭代次数

　　if c != [c1, c2, c3] and max > 0:

　　c = [c1, c2, c3]

　　print(c)

　　k_means(c, data, max, label)

　　return classifier

　　3. 设置参数，调用函数，得到结果

　　设置初始质心、标签列表、最大迭代次数

　　# 选择K个点作为初始质心

　　c = [[12, 15, 13, 28, 24], [ 7, 11, 10, 19, 21],[12, 14, 11, 27, 23]]

　　label = ['A', 'B', 'C']

　　max = 20

　　调用函数，整理结果

　　grade = k_means(c, new_data, max, label)

　　grade = pd.Series(grade, index=data['学生姓名'])

　　print(grade)

　　实验结果

　　初始质心为[12, 15, 13, 28, 24], [ 7, 11, 10, 19, 21],[12, 14, 11, 27, 23]时，迭代2次即收敛，结果如下

　　学生姓名　　小测1　　小测2　　小测3　　期末成绩　　项目答辩　　成绩

　　张三　　12　　15　　13　　28　　24　　A

　　李四　　7　　11　　10　　19　　21　　B

　　王五　　12　　14　　11　　27　　23　　C

　　赵六　　6　　7　　4　　13　　20　　B

　　刘七　　13　　14　　13　　27　　25　　A

“Python怎么实现K-means算法”的内容就介绍到这里了，感谢大家的阅读。如果想了解更多行业相关的知识可以关注编程网网站，小编将为大家输出更多高质量的实用文章！

您可能感兴趣的文档:

--结束END--

本文标题: python怎么实现K-means算法

本文链接: https://lsjlt.com/news/228008.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

回答

如何调试操作系统的错误？
操作系统

2023-11-15发布

回答

操作系统中的I/O系统是如何实现的？
操作系统

2023-11-15发布

回答

如何实现操作系统的内存管理？
操作系统

2023-11-15发布

回答

什么是虚拟内存，它对操作系统有什么影响？
操作系统

2023-11-15发布

回答

ASP中的MVC架构和WebForms架构有什么区别和使用场景？
ASP.NET

2023-11-15发布

回答

ASP中的数据验证和数据校验有什么不同？
ASP.NET

2023-11-15发布

回答

ASP中的ADO对象和DAO对象有什么区别和使用方法？
ASP.NET

2023-11-15发布

回答

Node.js中的包管理器NPM是什么？如何使用它进行依赖管理？
node.js

2023-11-15发布

回答

Vue.js中的动态组件是什么？如何使用它来动态渲染组件？
VUE

2023-11-15发布

回答

如何使用Vue.js实现懒加载和预加载？
VUE

2023-11-15发布

python怎么实现K-means算法

python怎么实现K-means算法

python实现k-means算法

Python实现聚类K-means算法

Python实现聚类K-means算法详解

Python如何实现聚类K-means算法

python中k-means和k-means++原理及实现

python中实现k-means聚类算法详解

python中k-means和k-means++原理是什么及怎么实现

K-means算法怎么在Python中应用

Python 中怎么实现一个k-means 均值聚类算法

利用Python如何实现K-means聚类算法

K-MEANS聚类——Python实现

人工智能——K-Means聚类算法及Python实现

如何使用Python语言实现K-Means聚类算法

Python中K-means算法的示例分析

利用python实现聚类分析K-means算法的详细过程

python利用K-Means算法实现对数据的聚类案例详解

K-means聚类算法介绍与利用python实现的代码示例

一文读懂K-Means原理与Python实现

K-Means聚类算法及其python实现（已附上代码至本博客）

python分析数据的方法是什么

如何使用Python实现抽奖小程序

python copy函数的作用是什么

python ffmpeg模块怎么安装和使用

python进程池创建队列的方法是什么

python无法运行文件的原因有哪些

python can't open file报错怎么解决

python keyerror错误怎么解决

python字符串处理与应用的方法有哪些

python全局变量如何定义