k-means聚类_Python_移动技术网

k-means聚类

这里介绍一下简单的使用欧氏距离的kmeans

思路：

1、确定n个中心点

2、计算每个点与中心点的距离

3、然后对每一个点的与n个中心点的距离进行比较，将点划分到距离最短的那个中心点簇中

4、此时以n个中心点形成n个簇

5、然后取这些簇中各个点的特征值的均值为新的中心点

6、重复2、3、4，迭代对应的次数，输出结果

代码：

#引入包，数据使用的是sklearn包中带的鸾尾花数据
import numpy as np
from matplotlib import pyplot as plt
from sklearn import datasets
from random import shuffle

#导入数据，data是花的特征数据，target是花的类型数据
data=datasets.load_iris().data
target=datasets.load_iris().target

#数据量
x=data.shape[0]
#特征值数
y=data.shape[1]
#打乱原始数据
index=np.arange(x)
shuffle(index)
data=data[index]
target=target[index]
#迭代次数
iter_num=10
#由于事先知道有3类，所以聚类中心数设置为3
centor_num=3
#取打乱后的数据的前3个作为初始聚类中心
centor_cd=data[:3,:]
#初始化距离矩阵，因为有x个点，3个聚类中心
dist=np.zeros((x,3))

#迭代次数
for i in range(iter_num):
    
    #循环遍历鸾尾花的特征数据
    for j in range(x):
        #获取距离
        distance=(data[j]-centor_cd)**2
        distance=np.sum(distance,axis=1)
        distance=np.sqrt(distance)
        #更新距离矩阵
        dist[j] = distance
    #获取算法结果
    cluster_id=np.argmin(dist , axis=1)
    #聚类错误的数量
    losess=np.sum(cluster_id != target)
    
    #更新聚类中心，采用每一次迭代生成簇的特征值的均值
    for k in range(centor_num):
        d=data[cluster_id==k]
        centor_cd[k]=np.mean(d,axis=0)

print("聚类成功")
print(cluster_id)

本文地址：https://blog.csdn.net/csefrfvdv/article/details/107490184

您可能感兴趣的文章:

如您对本文有疑问或者有任何想说的，请点击进行留言回复，万千网友为您解惑！

Visual Studio Code搭建django项目的方法步骤

之前我们使用vscode搭建c#项目，今天写一篇关于django项目的搭建，其实以其说是搭建django框架，不如说是如何通过vscode开发django项目；... [阅读全文]

记一次Django响应超慢的解决过程

在本地windows机器开发的django项目运行正常，放到服务器上后响应超慢，花了一整个工作日没找到原因（非常绝望），又花了一整个周末才找到原因和临时解决办法... [阅读全文]

Python绘制组合图的示例

绘制组合图：组合图就是将多个形状，组合到⼀个图形中，主要作⽤是节约作图的空间，节省读者的时间，从⽽提⾼信... [阅读全文]

python绘制趋势图的示例

import matplotlib.pyplot as plt #plt用于显示图片import matplotlib.image as mping #mpin... [阅读全文]

PyCharm设置注释字体颜色以及是否倾斜的操作

如下所示：file–>settings–>editor–> color scheme–>language defaults–>co... [阅读全文]

Python类成员继承重写的实现

类成员的继承和重写成员继承：子类继承了父类除构造方法外的所有成员方法重写：子类可以重新定义父类中的方法，这样就会覆盖父类中的方法，也称为重写代码如下class ... [阅读全文]

python Matplotlib模块的使用

一、matplotlib简介与安装　　matplotlib也就是matrix plot library，顾名思义，是python的绘图库。它可与numpy一起使... [阅读全文]

pycharm2020.2 配置使用的方法详解

突然发现, pycharm 2020.2都出来了哈, 现在jetbrain团队对中文用户也比较友好, 比以前更加适合小白了再就是很多类似的教程pycharm还停... [阅读全文]

python 服务器运行代码报错ModuleNotFoundError的解决办法

一、问题描述一段 python 代码在本地的 ide 上运行正常，部署到服务器运行后，出现了 modulenotfounderror: no module na... [阅读全文]

简单了解Python字典copy与赋值的区别

描述python 字典(dictionary) copy() 函数返回一个字典的浅复制。语法copy()方法语法：dict.copy()返回值返回一个字典的浅复... [阅读全文]


验证码：

验证码：

k-means聚类

2020年07月22日 | 移动技术网IT编程 | 我要评论

您可能感兴趣的文章:

相关文章:

网友评论