分享好友 最新动态首页 最新动态分类 切换频道
聚类模型——k-means
2024-12-27 10:20
“物以类聚,人以群分”,所谓的聚类,就是将样本划分为由类似的对象组成的多个类的过程。聚类后,我们可以更加准确的在每个类中单独使用统计模型进行估计、分析或预测
也可以探究不同类之间的相关性和主要差异。
聚类和分类的区别:分类是已知类别的,聚类未知类别

目录

一、K-means

1,算法流程

K-means聚类的算法流程

图解过一遍

2,WCSS(Within-Cluster Sum of Squares)  簇内平方和评估

 3,题目复习

1,EG1

2,EG2

3,EG3

 4,EG4

 5,EG5​

二、K-means使用

1.sklearn库对鸢尾花(iris)数据集的聚类

2.手肘法ELBOW

3,应用——图像压缩 

图解过一遍

1)计算各点与各重心间的距离

2)将最近的重心所在簇作为该点所属的簇

 (3) 计算每个簇的平均值,作为其重心

 

WCSS 随着簇的增加而变小,所以可以用于相同数量的簇的情况下的比较。WCSS 指的是对所有簇计算其所属的数据点与簇的重心之间距离的平方和,并将它们相加得到的值。这个值越小,说明聚类效果越好。

随着簇的增加,WCSS 会变小,但有时 WCSS 的变小幅度会从簇的数量为某个值时开始放缓。通过使用 Elbow 方法,可以确定合理的簇的数量。
                        ​​​​​​​        

 

1,EG1

 B注意是负的WCSS

2,EG2

 有n条数据,代表要计算n条数据,n条数据的k个特征与m重心间的距离

选D

3,EG3

 这要通过每个数据到每个中心的距离进行比较,距离小的归属哪个中心,这样就有n个点距离和m个中心进行比较,需要进行n*m次

 4,EG4

 这题就没必要初始化中心点去搞了,画个图很直观看得出两个类的中心点(4,5)和(3,1)吧

 

 

        手肘法的核心思想是随着聚类数k的增大样本划分会更加精细,每个簇的聚合程度会逐渐提高,那么误差平方和SSE自然会逐渐变小。

        并且,当k小于真实聚类数时,由于k的增大会大幅增加每个簇的聚合程度,故SSE的下降幅度会很大,而当k到达真实聚类数时,再增加k所得到的聚合程度回报会迅速变小,所以SSE的下降幅度会骤减,然后随着k值的继续增大而趋于平缓,也就是说SSE和k的关系图是一个手肘的形状,而这个肘部对应的k值就是数据的真实聚类数。当然,这也是该方法被称为手肘法的原因。

 
 
 
 

最新文章
Web性能优化最佳实践指南
网站性能直接影响用户体验和转化率。据统计,页面加载时间每增加1秒,转化率就会下降7%。本文将从多个维度介绍如何优化网站性能。1. 资源压缩与合并// 2. 合并多个CSS文件 2. 懒加载策略1. 浏览器缓存策略 2. Service Worke
解锁AI绘画:如何轻松生成超逼真美女写真?
进入主界面后,你会看到多种风格选项,包括高清写实、卡通风格、复古艺术等。选择你想要的风格,然后点击继续。步骤三:输入你的需求描述在生成框中,输入你想要生成的美女类型,比如“清纯自然的女孩,长发,穿着白色裙子”。尽量使用生动
淘宝每天补单的好处是什么?淘宝不补单能做起来吗?(每天补单是不是把淘宝客关了)
在电商领域,补单通常指的是通过合法手段增加销量和提升商品排名的行为。淘宝作为中国最大的电商平台之一,其内部的搜索排名机制和销量密切相关。每天补单对商家而言,有着不可忽视的积极作用。 一、淘宝每天补单的好处是什么? 1. 提升搜
直通车推广的扣费公式是什么?有何作用?
在淘宝平台里面,商家都会使用一些推广工具来进行宝贝的推广,直通车是经常使用的一种,可以给店铺带来流量,但是它的计算公式有很多种,现在我们来了解下。1、直通车扣费公式:实际扣费=下一名出价X下一名质量得分/您的质量得分 + 0.01元
火爆直播强获客,火爆视频强宣传!六重豪礼助招商!
抖音、快手、视频号、小红书的出现,让短视频和直播站在了更大的风口上!越来越多的渠道商通过直播找产品,越来越多的企业通过短视频进行品牌宣传,产品招商!直播+短视频营销已来,抓住风口,就能抓住商机!十七年火爆,聚势新媒体,直播
科美诊断:12月11日融资净买入155.09万元,连续3日累计净买入336.65万元
证券之星消息,12月11日,科美诊断(688468)融资买入460.3万元,融资偿还305.21万元,融资净买入155.09万元,融资余额1.18亿元,近3个交易日已连续净买入累计336.65万元,近20个交易日中有17个交易日出现融资净买入。融券方面,当日无融券
财经早报:ETF又开启资金“扫货”模式 美国量子计算妖股又暴涨超50%
登录新浪财经APP 搜索【信披】查看更多考评等级  国资委重磅发布!“央企市值管理九条”来了,多家公司意愿强出手并购大股东资产  鼓励业务多元化的控股上市公司进一步突出专业化发展特色,探索将内部业务独立、质地优良、成长性好、具
发帖秒收录的网站(华网优站网,收录快)百度收录方法有几种
在现今的网络时代,网站内容被收录对企业及个人的网络推广极为关键。部分网站能实现发帖后即刻收录,华网优站网便是其中之一。该平台专业提供网站技术服务,尤其在软文收录方面表现尤为突出。华网优站网向客户提供了文章收录服务。文章一经
神力股份跌6.49%,成交额7191.41万元,今日主力净流入-335.35万
12月16日,跌6.49%,成交额7191.41万元,换手率2.47%,总市值28.57亿元。根据AI大模型测算神力股份后市走势。短期趋势看,连续3日被主力资金减仓。主力没有控盘。中期趋势方面,下方累积一定获利筹码。近期该股获筹码青睐,且集中度渐增。
鸿蒙十大榜单_2024第三季度板块股票营收排行榜
  公司所在地:重庆  所属行业:汽车整车  赛力斯发布2024年第三季度财报,实现营业收入415.82亿元,同比增长636.25%,归母净利润24.13亿,同比354.1%;每股收益为1.6元。  NO.2、华勤技术:366.12亿元  公司所在地:上海  所
相关文章
推荐文章
发表评论
0评