La agrupación puede resultar beneficiosa para comprender la estructura de un conjunto de datos, encontrar similitudes entre elementos de datos, identificar valores atípicos y reducir la dimensionalidad de los datos. Se utiliza comúnmente en diversas áreas, como el aprendizaje automático, la minería de datos, la bioinformática y el procesamiento de imágenes.
Pasos:
1. Preparación de datos
2. Seleccionar una medida de distancia
3. Elegir el número de clusters
4. Agrupación
5. Evaluación de la agrupación