ML之K-means：基于DIY数据集利用K-means算法聚类(测试9种不同聚类中心的模型性能)

2024-06-24 11:45:24

输出结果

设计思路

1、使用均匀分布函数随机三个簇，每个簇周围10个数据样本。
2、绘制30个数据样本的分布图像。
3、测试9种不同聚类中心数量下，每种情况的聚类质量，并作图。

实现代码

import numpy as np
import matplotlib.pyplot as plt
from sklearn.cluster import KMeans
from scipy.spatial.distance import cdist

#1、使用均匀分布函数随机三个簇，每个簇周围10个数据样本。
cluster1 = np.random.uniform(0.5, 1.5, (2, 10))
cluster2 = np.random.uniform(5.5, 6.5, (2, 10))
cluster3 = np.random.uniform(3.0, 4.0, (2, 10))

#2、绘制30个数据样本的分布图像。
X = np.hstack((cluster1, cluster2, cluster3)).T
plt.scatter(X[:,0], X[:, 1])
plt.xlabel('x1')
plt.ylabel('x2')
plt.title('DIY data:30, Random 3 clusters(10 data samples around each cluster)')
plt.show()

#3、测试9种不同聚类中心数量下，每种情况的聚类质量，并作图。
K = range(1, 10)
meandistortions = []

for k in K:
    kmeans = KMeans(n_clusters=k)
    kmeans.fit(X)
    meandistortions.append(sum(np.min(cdist(X, kmeans.cluster_centers_, 'euclidean'), axis=1))/X.shape[0])

plt.plot(K, meandistortions, 'bx-')
plt.xlabel('k')
plt.ylabel('Average Dispersion')
plt.title('K-means: Selecting k with the Elbow Method')
plt.show()

K-means聚类：原理简单的聚类算法

对于监督学习而言,回归和分类是两类基本应用场景:对于非监督学习而言,则是聚类和降维.K-means属于聚类算法的一种,通过迭代将样本分为K个互不重叠的子集. 对于K-means聚类而言,首先要确定的第 ...
如何利用K-Means将文件夹中图像进行分类？

重磅干货,第一时间送达 K-Means聚类是最常用的无监督机器学习算法之一.顾名思义,它可用于创建数据集群,从本质上将它们隔离. 现在,我们将做一个简单的示例,将文件夹中的图像进行分离,该文件夹既有猫 ...
基于K-Means聚类算法的主颜色提取

重磅干货,第一时间送达 01.简介本期我们将一起实现基于K-Means聚类算法的主色提取.在深入研究代码之前,让我们先了解一下K-Means算法的背景知识. 02.K均值类聚算法 K-Means算法 ...
k-means聚类算法原理总结

k-means算法是非监督聚类最常用的一种方法,因其算法简单和很好的适用于大样本数据,广泛应用于不同领域,本文详细总结了k-means聚类算法原理 . 目录 1. k-means聚类算法原理 2. k ...
供应链选址（1）-基于自定义距离的广义Kmeans 聚类

low profile,no profile 背景介绍出于种种原因,在供应链环节需要添加新的配送中心(Distribution Center)来满足业务需求.这些原因可能是因为需求逐年增长,也有可能 ...
ML之LightGBM：基于titanic数据集利用LightGBM和shap算法实现数据特征的可解释性(量化特征对模型贡献度得分)

ML之LightGBM:基于titanic数据集利用LightGBM和shap算法实现数据特征的可解释性(量化特征对模型贡献度得分) 相关文章 ML之LightGBM:基于titanic数据集利用Li ...
ML之FE：基于BigMartSales数据集利用Featuretools工具实现自动特征工程之详细攻略daiding

ML之FE:基于BigMartSales数据集利用Featuretools工具实现自动特征工程之详细攻略daiding 基于BigMartSales数据集利用Featuretools工具实现自动特征工 ...
ML之FE：基于BigMartSales数据集利用Featuretools工具(1个dataframe表结构切为2个Entity表结构)实现自动特征工程之详细攻略

ML之FE:基于BigMartSales数据集利用Featuretools工具(1个dataframe表结构切为2个Entity表结构)实现自动特征工程之详细攻略相关文章 ML之FE:基于BigMa ...
ML之SVM：基于Js代码利用SVM算法的实现根据Kaggle数据集预测泰坦尼克号生存人员

ML之SVM:基于Js代码利用SVM算法的实现根据Kaggle数据集预测泰坦尼克号生存人员实验数据设计思路实现代码(部分代码) /** js代码实现SVM算法 */ //ML之SVM:基于Js代 ...
ML：基于自定义数据集利用Logistic、梯度下降算法GD、LoR逻辑回归、Perceptron感知器、SVM支持向量机、LDA线性判别分析算法进行二分类预测(决策边界可视化)

ML:基于自定义数据集利用Logistic.梯度下降算法GD.LoR逻辑回归.Perceptron感知器.支持向量机(SVM_Linear.SVM_Rbf).LDA线性判别分析算法进行二分类预测(决策 ...
ML之FE：基于自定义数据集(银行客户信息贷款和赔偿)对比实现特征衍生(手动设计新特征、利用featuretools工具实现自动特征生成)

ML之FE:基于自定义数据集(银行客户信息贷款和赔偿)对比实现特征衍生(手动设计新特征.利用featuretools工具实现自动特征生成)相关文章ML之FE:基于自定义数据集(银行客户信息贷款和赔偿) ...
ML之FE：基于load_mock_customer数据集(模拟客户)利用featuretools工具实现自动特征生成/特征衍生

ML之FE:基于load_mock_customer数据集(模拟客户)利用featuretools工具实现自动特征生成/特征衍生推荐文章 ML之FE:基于load_mock_customer数据集( ...
ML之FE：基于load_mock_customer数据集(模拟客户,单个DataFrame)利用featuretools工具实现自动特征生成/特征衍生

ML之FE:基于load_mock_customer数据集(模拟客户,单个DataFrame)利用featuretools工具实现自动特征生成/特征衍生推荐文章 ML之FE:基于load_mock_ ...
DL之DNN：基于自定义数据集利用深度神经网络(输入层(10个unit)→2个隐藏层(10个unit)→输出层1个unit)实现回归预测实现代码

DL之DNN:基于自定义数据集利用深度神经网络(输入层(10个unit)→2个隐藏层(10个unit)→输出层1个unit)实现回归预测实现代码基于自定义数据集利用深度神经网络(输入层(10个uni ...

ML之K-means：基于DIY数据集利用K-means算法聚类(测试9种不同聚类中心的模型性能)

输出结果

设计思路

实现代码

相关推荐