By Kardi Teknomo
Translated by Jaime Orjuela ( Escuela Colombiana de Ingenier�a )
<
Previous
|
Next
|
Contents
>
Ejemplo numerico de Agrupamiento K-medias
El proceso de agrupamiento k-medias es simple, Inicialmente se determina el n�mero de grupos K y se asume el centroide o centro de esos grupos. Para determinar los centroides hay dos alternativas pr�cticas: la primera es tomar de forma aleatoria K objetos como centroides iniciales y la segunda es tomar los primeros K objetos en secuencia.
Luego el algoritmo ejecuta los siguientes tres pasos hasta que alcance el criterio de convergencia, es decir que los objetos no se muevan de grupo.
- Se determina el o los centroides iniciales de acuerdo al n�mero de cluster esperado.
- Se determina la distancia de cada objeto con relaci�n a los centroides
- Se agrupan los objetos con base en la distancia m�nima.
El ejemplo num�rico mostrado a continuaci�n es dado para entender una simple iteraci�n. Puede descargar la implementaci�n del ejemplo num�rico en Matlab aqu� . Otro ejemplo de agrupamiento k-medias usando Visual Basic est� disponible aqu� . El mismo ejemplo en MS Excel puede ser descargado al final de esta p�gina.
Sup�ngase que se tienen cuatro tipos de medicina con dos atributos (peso e �ndice PH) como se muestra en la siguiente tabla:
MEDICINA |
PESO |
�NDICE PH |
A |
1 |
1 |
B |
2 |
1 |
C |
4 |
3 |
D |
5 |
4 |
Cada medicina puede ser representada como un punto en un espacio coordenado:
? Valor inicial de los centroides: Sean C1 y C2 los centroides de los k-grupos. Si se eligen las medicinas A y B como los primeros centroides que quedan en los puntos (1,1) y (2,1).
? Distancia de cada objeto a los centroides: Se calcula la distancia de cada objeto utilizando la distancia euclidiana , as� por ejemplo la distancia entre la medicina C (4,3) y el primer centroide (1,1,) es , y su distancia con el segundo centroide (2,1) es . Resultando en la primera iteraci�n la siguiente matriz de distancias:
? Agrupaci�n: Se asigna entonces cada objeto a cada grupo teniendo en cuenta el m�nimo error de partici�n de cada elemento en cada grupo, entonces la medicina A se asigna al grupo 1 (con centroide en (1,1)) y las medicinas B, C y D al grupo 2 (con centroide en (2,1)).
? Iteraci�n 1, determinar centroides: Conociendo los miembros de los grupos, se vuelve a calcular el centroide de cada grupo y la matriz de distancias. Como el grupo 1 tiene s�lo un miembro el centroide de ese grupo permanece en (1,1). El grupo 2 tiene ahora 3 miembros, por lo que el nuevo centroide es:
.
? Iteraci�n 1, Distancia de los objetos a los centroides: Nuevamente se calculan la distancia para todos los objetos con base en los nuevos centroides, similar al paso 2. Obteniendo las siguiente matriz de distancias:
? Iteraci�n 1, Agrupaci�n de Objetos: Similar al paso 3, se asigna nuevamente cada objeto a cada grupo teniendo en cuenta el m�nimo error de partici�n de cada elemento en cada grupo, entonces ahora las medicinas A y B quedan asignadas al grupo 1 (con centroide en 1,1) y las medicinas C y D al grupo 2 (con centroide en 11/3,8/3).
? Iteraci�n 2, determinaci�n de Centroides: Repitiendo el paso 4, Se recalculan los centroides:
? Iteraci�n 2, Distancia de los objetos a los Centroides: Repitiendo el paso 2, Se recalcula la matriz de distancias:
? Iteraci�n 2, Agrupaci�n de Objetos: Nuevamente se asignan los objetos en cada grupo basado el criterio de m�nima distancia:
Los casos de entrada tendr�n bajo esta nueva iteraci�n la misma clasificaci�n, concluy�ndose que el c�lculo de centroides se ha estabilizado, y no es necesario continuar iterando.
Ver m�s en: Datos multivariados (hasta n dimensiones) y otros tipos de distancia aqu�
Nota:
Zlatan Aki Mur, un investigador AI independiente de Croacia ha contribuido con el Archivo de MS Excel basado este ejemplo.
Usted puede descargar el ejemplo aqu�
Do you have question regarding this k means tutorial? Ask your question here
<
Previous
|
Next
|
Contents
>
These tutorial is copyrighted .
Preferable reference for this tutorial is
Teknomo, Kardi. K-Means Clustering Tutorials. https:\\people.revoledu.com\kardi\tutorial\kMean\