By Kardi Teknomo

Translated by Jaime Orjuela ( Escuela Colombiana de Ingenier�a )

Read the English version of this tutorial off-line in any device. Purchase the complete e-book of K Means Clustering tutorial here

< Previous | Next | Contents >

Ejemplo numerico de Agrupamiento K-medias

El proceso de agrupamiento k-medias es simple, Inicialmente se determina el n�mero de grupos K y se asume el centroide o centro de esos grupos. Para determinar los centroides hay dos alternativas pr�cticas: la primera es tomar de forma aleatoria K objetos como centroides iniciales y la segunda es tomar los primeros K objetos en secuencia.

Luego el algoritmo ejecuta los siguientes tres pasos hasta que alcance el criterio de convergencia, es decir que los objetos no se muevan de grupo.

  1. Se determina el o los centroides iniciales de acuerdo al n�mero de cluster esperado.
  2. Se determina la distancia de cada objeto con relaci�n a los centroides
  3. Se agrupan los objetos con base en la distancia m�nima.

Ejemplo Numerico

El ejemplo num�rico mostrado a continuaci�n es dado para entender una simple iteraci�n. Puede descargar la implementaci�n del ejemplo num�rico en Matlab aqu� . Otro ejemplo de agrupamiento k-medias usando Visual Basic est� disponible aqu� . El mismo ejemplo en MS Excel puede ser descargado al final de esta p�gina.

Sup�ngase que se tienen cuatro tipos de medicina con dos atributos (peso e �ndice PH) como se muestra en la siguiente tabla:

MEDICINA

PESO

�NDICE PH

A

1

1

B

2

1

C

4

3

D

5

4

Cada medicina puede ser representada como un punto en un espacio coordenado:

Ejemplo Numerico

? Valor inicial de los centroides: Sean C1 y C2 los centroides de los k-grupos. Si se eligen las medicinas A y B como los primeros centroides que quedan en los puntos (1,1) y (2,1).

Ejemplo Numerico

? Distancia de cada objeto a los centroides: Se calcula la distancia de cada objeto utilizando la distancia euclidiana Ejemplo Numerico , as� por ejemplo la distancia entre la medicina C (4,3) y el primer centroide (1,1,) es Ejemplo Numerico , y su distancia con el segundo centroide (2,1) es Ejemplo Numerico . Resultando en la primera iteraci�n la siguiente matriz de distancias:

Ejemplo Numerico

? Agrupaci�n: Se asigna entonces cada objeto a cada grupo teniendo en cuenta el m�nimo error de partici�n de cada elemento en cada grupo, entonces la medicina A se asigna al grupo 1 (con centroide en (1,1)) y las medicinas B, C y D al grupo 2 (con centroide en (2,1)).

Ejemplo Numerico

? Iteraci�n 1, determinar centroides: Conociendo los miembros de los grupos, se vuelve a calcular el centroide de cada grupo y la matriz de distancias. Como el grupo 1 tiene s�lo un miembro el centroide de ese grupo permanece en (1,1). El grupo 2 tiene ahora 3 miembros, por lo que el nuevo centroide es:

Ejemplo Numerico .

Ejemplo Numerico

? Iteraci�n 1, Distancia de los objetos a los centroides: Nuevamente se calculan la distancia para todos los objetos con base en los nuevos centroides, similar al paso 2. Obteniendo las siguiente matriz de distancias:

Ejemplo Numerico

? Iteraci�n 1, Agrupaci�n de Objetos: Similar al paso 3, se asigna nuevamente cada objeto a cada grupo teniendo en cuenta el m�nimo error de partici�n de cada elemento en cada grupo, entonces ahora las medicinas A y B quedan asignadas al grupo 1 (con centroide en 1,1) y las medicinas C y D al grupo 2 (con centroide en 11/3,8/3).

Ejemplo Numerico

? Iteraci�n 2, determinaci�n de Centroides: Repitiendo el paso 4, Se recalculan los centroides:

Ejemplo Numerico

Ejemplo Numerico

? Iteraci�n 2, Distancia de los objetos a los Centroides: Repitiendo el paso 2, Se recalcula la matriz de distancias:

Ejemplo Numerico

? Iteraci�n 2, Agrupaci�n de Objetos: Nuevamente se asignan los objetos en cada grupo basado el criterio de m�nima distancia:

Ejemplo Numerico

Los casos de entrada tendr�n bajo esta nueva iteraci�n la misma clasificaci�n, concluy�ndose que el c�lculo de centroides se ha estabilizado, y no es necesario continuar iterando.

Ver m�s en: Datos multivariados (hasta n dimensiones) y otros tipos de distancia aqu�

Nota:

Zlatan Aki Mur, un investigador AI independiente de Croacia ha contribuido con el Archivo de MS Excel basado este ejemplo. Usted puede descargar el ejemplo aqu�

Do you have question regarding this k means tutorial? Ask your question here

< Previous | Next | Contents >

These tutorial is copyrighted .

Preferable reference for this tutorial is

Teknomo, Kardi. K-Means Clustering Tutorials. http:\\people.revoledu.com\kardi\tutorial\kMean\