an lisis de conglomerados cluster analysis n.
Download
Skip this Video
Loading SlideShow in 5 Seconds..
Análisis de Conglomerados (Cluster Analysis ) PowerPoint Presentation
Download Presentation
Análisis de Conglomerados (Cluster Analysis )

Loading in 2 Seconds...

play fullscreen
1 / 20

Análisis de Conglomerados (Cluster Analysis ) - PowerPoint PPT Presentation


  • 171 Views
  • Uploaded on

Análisis de Conglomerados (Cluster Analysis ). Agrupamientos. ¿ Cuál agrupamiento es mejor ?. Métodos de Agrupación. Métodos jerárquicos: Los objetos se agrupan (dividen) por partes hasta clasificar todos los objetos.

loader
I am the owner, or an agent authorized to act on behalf of the owner, of the copyrighted work described.
capcha
Download Presentation

Análisis de Conglomerados (Cluster Analysis )


An Image/Link below is provided (as is) to download presentation

Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author.While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server.


- - - - - - - - - - - - - - - - - - - - - - - - - - E N D - - - - - - - - - - - - - - - - - - - - - - - - - -
Presentation Transcript
agrupamientos
Agrupamientos

Claudia Jiménez R

m todos de agrupaci n
Métodos de Agrupación

Métodos jerárquicos:

  • Los objetos se agrupan (dividen) por partes hasta clasificar todos los objetos.
  • No requiere fijar un número de clústeres o grupos (menos supervisado).

Métodos de capa única:

  • Se tiene un número de grupos predefinidos y cada objeto se ubica en un grupo hasta alcanzar estabilidad en los valores de los centroides.
  • Requiere, generalmente, fijar a priori un número de clústeres.

Claudia Jiménez R

m todos jer rquicos
Métodos Jerárquicos

Varios niveles de agrupamiento

Dendograma

Claudia Jiménez R

m todos aglomerativos
Métodos aglomerativos

Esquema general algoritmo:

1. Cada objeto corresponde a un grupo.

2. En cada iteración se juntan los dos grupos más cercanos bajo algún criterio de cercanía entre grupos.

3. Los dos grupos recién unidos forman un único grupo.

4. Iterar hasta formar un único grupo.

El método jerárquico aglomerativo más utilizado es el de Ward, por el nombre de su autor.

Claudia Jiménez R

m todo de ward
Método de Ward
  • Este procedimiento trata de identificar grupos de casos, tratando de minimizarla varianza dentro de los grupos.
  • Se minimiza la distancia euclideanacuadrada a las medias del conglomerado o grupo.

Claudia Jiménez R

dendogramas
Dendogramas

Un dendograma es un árbol en el que el largo de las ramas está asociado inversamente a la fortaleza de la relación.

Debajo de la línea roja

Claudia Jiménez R

m todos divisivos
Métodos divisivos
  • Esquema general algoritmo:

1. Todos los objetos corresponde a un grupo.

2. Cada grupo se separa bajo algún criterio de maximización de varianza entre grupos.

3. Dividir cada uno de los grupos hasta que:

– Todos los grupos sean tan homogéneos que no vale la pena seguir dividiendo.

– Los grupos son tan pequeños que no vale la pena seguir dividiendo.

Claudia Jiménez R

m todos de una sola capa o particionales
Métodos de una sola capa o particionales

Algoritmos iterativos: en cada iteración ubican a los objetos en el grupo más cercano a él, de acuerdo con los valores de los centroides.

Claudia Jiménez R

slide11

La técnica k-medias en Matlab

[idx,ctrs] = kmeans(X,2,... 'Distance','city’);

  • La funciónkmeanstrata a cadaobservacióncomo un objetolocalizado en el espacio. Se puedenescogercincomedidas de distancia.
  • Cadaclústeresdefinidoporsusmiembros y porsucentroide. El centroideesaquelqueminimiza la suma de lasdesviacionesdesdecualquierpunto del grupo a esepunto central. La funciónkmeansminimizaunafuncióndiferentedependiendo de la medida de distanciaque se utilice.
  • Se puedencontrolar los detalles de la minimizacióncomoincluir los valoresiniciales de los centroides o el máximonúmero de iteraciones.

Claudia Jiménez R

slide13

Ejemplos usando Rattle y Matlab

Tamaños de clústeres:

[1] "4 10 12“

Suma de cuadrados en clúster:

[1] 116752251 251603917 221327040

Medida de distancia: Euclidiana

Medida de distancia: City block

slide15

Ejemplos creando dos grupos

Medida de distancia: Euclidiana

Tamaños de clústers:

[1] "8 18“

Suma de cuadrados en clúster:

[1] 392880110 644939334

agrupamiento probabilista
Agrupamiento probabilista

Función gmdistribution en Matlab: funciones normales

Claudia Jiménez R

comparaci n de agrupamientos con los lirios usando una interfaz de matlab
Comparación de agrupamientos con los lirios, usando una interfaz de Matlab

Fuzzy C-means

Clustering sustractivo

findcluster('iris.dat')

interpretar y elaborar un perfil de cada grupo
Interpretar y elaborar un perfil de cada grupo
  • Debe buscarse una semántica que diferencie a los objetos de cada grupo.
  • Enfoques complementarios:
    • Análisis y comparación de los centroides de cada grupo.
    • Análisis gráfico para determinar la variables que marcan diferencias significativas.
slide20

Evaluación VISUAL DE Agrupamientos

K-medias

Probabilístico EM

Datos originales

Claudia Jiménez R