1 / 31

Escalogramas multidimensionales

Escalogramas multidimensionales. Introducción. Dada una matriz de distancias, D, (contiene ceros en la diagonal es simétrica y cuadrada) obtener las variables que han generado estas distancias La matriz puede ser de similaridades (con unos en la diagonal y cuadrada y simétrica)

winslow
Download Presentation

Escalogramas multidimensionales

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Escalogramas multidimensionales

  2. Introducción • Dada una matriz de distancias, D, (contiene ceros en la diagonal es simétrica y cuadrada) obtener las variables que han generado estas distancias • La matriz puede ser de similaridades (con unos en la diagonal y cuadrada y simétrica) • distancia =1- similaridad

  3. Coordenadas principales • Dada la matriz D de distancias, ¿Podemos encontrar las variables que podrían haberla generado? • Es decir, ¿Podemos encontrar una matriz de datos X que puede haber generado la D?

  4. Método: entender como se genera una matriz D conocida la X y reconstruir el camino al reves para encontrar la matrix X a partir de la D

  5. Obtención de las coordenadas principales Definamos: (Esta matriz es una estandarización de la matriz de distancias) (determinamos el rango de la matriz de distancias estandarizada)

  6. Coordenadas principales (Aproximamos la matriz Q como producto XX’ para cierta X)

  7. Ejemplo

  8. (Estas distancias estandarizadas suman ahora cero por filas y columnas, para facilitar la lectura, la matriz se ha dividido por 10000)

  9. Ejemplo Los vectores y valores propios de Q son:

  10. Las coordenadas resultantes de tomar dos dimensiones son:

  11. Ejemplo

  12. Justificación del método Con esta matriz de variables de media cero podemos calcular dos matrices cuadradas: La S de covarianzas entre variables y la Q matriz de productos escalares entre observaciones

  13. Relación entre la matriz de distancias, D, y la Q: Conclusión: Dada la matriz Q podemos obtener la D

  14. Forma de recuperar la Q dada la D Observemos que como las variables tienen media cero, la suma de una fila de Q es cero. t =traza(Q)

  15. Ecuación para recuperar la Q dada la D

  16. Obtener la matriz X dada la Q • Realizar la descomposición espectral de la matriz cuadrada Q Q=ABA’=AB1/2B1/2A’ donde A y B contienen los valores y vectores propios no nulos. Entonces: X=AB1/2

  17. Diremos que la matriz D es compatible con una metrica euclidea si la matriz Q obtenida como Q=-(1/2)PDP • es semidefinida positiva

  18. Ejemplo: similitud entre productos

  19. Ejemplo

  20. Relación con componentes • Componentes: valores y vectores propios de S • Coordenadas: valores y vectores propios de Q Si los datos son métricos ambos procedimientos son idénticos Coordenadas generaliza componentes para datos no exactamente métricos

  21. BiplotsRepresentación en dos dimensiones de una matriz de datos o distancias por filas y columnas Representar conjuntamente los observaciones por las filas de V2 y Las variables mediante las coordenadas D1/2 A’2 Se denominan biplots a los gráficos de dos dimensiones para una matriz de datos, que aproximan su estructura por filas y columnas

  22. Biplot

  23. Justificación

  24. Escalado no métrico • Se parte de una matriz de similaridades entre objetos • Se supone que las variables que determinan las distancias euclídeas entre los elementos estan relacionadas con las similaridades observadas entre los objetos pero solo de una forma monótona similaridad =F (distancia)

  25. Escalado no métrico

  26. Idea del método • Si tenemos una relación monótona entre x e y debe haber una relación lineal exacta entre los rangos de x y los de y • Asignar rangos estimar una regresión e iterar

More Related