当前位置:网站首页>系统(层次)聚类
系统(层次)聚类
2022-08-02 04:43:00 【每天一道题】
概念
系统聚类的合并算法通过计算两类数据点间的距离,对最为接近的两类数据点进行组合,并反复迭代这一过程,直到将所有数据合成一类,并生成聚类谱系图。
其中距离的计算有多种:
1.样品与样品之间的常用距离:
2.指标与指标之间的常用距离:
3.类与类之间的常用距离:
(1)最短距离法:
(2)最长距离法:
(3)组间平均连接法:
(4)组内平均连接法:
(5)重心法:
算法流程
1.将每个对象看作一类,计算两两之间的最小距离。
2.将距离最小的两个类合并成一个新类。
3.重新计算新类与所有类之间的距离。
4.重复二三步,直到所有类最后合成一类。
5.结束。
SPSS操作



最终合并为一类后,随之而来也有一个问题,题目中到底应该聚成多少类。这里就需要用到肘部法则,他可以估计出最优的聚类数量。
用图形估计聚类的数量
肘部法则:通过图形大致的估计出最优的聚类数量。
下面的图为一个例题图:
可以明显看出K值从1到5时,畸变程度变化最大。超过5以后,畸变程度变化显著降低。因此肘部就是K=5,故可将系别数设定为5。
边栏推荐
猜你喜欢

HSCTF2022-re题解
Deep Blue Academy - Handwritten VIO Homework - Chapter 2

爬虫_爬取wasde月度供需平衡表(实例)

Minecraft 1.18.1、1.18.2模组开发 23.3D动画盔甲制作

Minecraft 1.18.1, 1.18.2 module development 23.3D animation armor production

单调队列模板 滑动窗口

【QT】Qt Creator生成动态库(DLL)并调用

【Gazebo入门教程】第一讲 Gazebo的安装、UI界面、SDF文件介绍

关于地图GIS的一次实践整理(下) Redis的GIS实践

线代005
随机推荐
A Practical Arrangement of Map GIS Development Matters (Part 1)
MES如何做好生产过程监控,本文给出了详细解答
安全测试常见问题
PDF file conversion format
应用pca和K-means实现用户对物品类别的喜好细分划分
RADIUS 如何提高 WiFi 无线网络安全性?
通关剑指 Offer——剑指 Offer II 008. 和大于等于 target 的最短子数组
【无标题】
Crawler_crawl wasde monthly supply and demand balance table (example)
Centos7.9+mysql8.0开启指定IP远程连接数据库
立方体卫星Light-1
Anatomy of Unreal Playback System (Part 1)
CAN光端机解决泰和安TX3016C消防主机长距离联网问题 实现CAN与光纤之间的双向数据智能转换
【STM32】ADC采集光敏数据(不看库函数手册进行配置)
互动投影墙深受展览展示喜爱的原因分析
What if some fields don't want to be serialized?
力扣练习——39 正方形数组的数目
Use the advanced timer of GD32F207 to generate hidden bugs in PWM waves
UE4 局域网联机案例
转:张五常:比知识更重要的,是思维方式