1 / 46

L’Analisi Fattoriale (PCA) con SPSS

L’Analisi Fattoriale (PCA) con SPSS. Cristina Zogmaister. Aprire lib/psico/corsi/zogmaister Trascinare SECONDA LEZIONE nel vostro spazio Lanciare SPSS PASW 18 Aprire dal vostro spazio il file customer_satisfaction.sav. L’Analisi Fattoriale è un processo iterativo. Passi preliminari

Download Presentation

L’Analisi Fattoriale (PCA) con SPSS

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. L’Analisi Fattoriale (PCA) con SPSS Cristina Zogmaister

  2. Aprire lib/psico/corsi/zogmaister • Trascinare SECONDA LEZIONE nel vostro spazio • Lanciare SPSS PASW 18 • Aprire dal vostro spazio il file customer_satisfaction.sav

  3. L’Analisi Fattoriale è un processo iterativo Passi preliminari • Selezionare e misurare un insieme di variabili • verificare l’adeguatezza delle variabili – es. normalità delle distribuzioni, presenza di outlier, linearità delle relazioni, rapporto tra nr. di variabili e nr. di fattori attesi, rapporto tra nr. di variabili e nr. di soggetti.

  4. L’Analisi Fattoriale è un processo iterativo Analisi fattoriale (processo iterativo) • Eseguire una prima analisi fattoriale • Determinare il numero di fattori • Eseguire la rotazione • prima obliqua, • poi eventualmente ortogonale • Interpretare i risultati e dare un nome ai fattori • Il criterio che guida l’AF è l’interpretabilità • Una buona AF ‘ha senso’, una cattiva AF ‘non ha senso’

  5. L’Analisi Fattoriale è un processo iterativo Passi successivi: • verificare la struttura fattoriale (replicabilità), • stabilire la validità di costrutto dei fattori (correlazioni con altre variabili; effetto delle manipolazioni sui punteggi fattoriali)

  6. File dati: customer_satisfaction.sav • Intervista a 200 clienti di un ristorante • Obiettivo: capire quali sono gli aspetti che determinano il livello di soddisfazione nei confronti del ristorante • Ipotesi di partenza: 4 aspetti • Qualità del cibo • Qualità del servizio (cortesia del personale) • Ambiente • Prezzo

  7. Il questionario • 12 domande relative ai quattro aspetti ipotizzati alla base della soddisfazione dei clienti (x1 – x12) • Qualità del cibo • Qualità del servizio (cortesia del personale) • Ambiente • Prezzo • 3 domande sulla soddisfazione (d1 – d3) • 3 domande sociodemografiche

  8. E’ possibile riassumere le risposte relative alla soddisfazione nelle 4 dimensioni ipotizzate? • Sono rispettati i prerequisiti per un’analisi fattoriale? • Ampiezza del campione • idealmente 300 casi o più, ma dipende da numero di fattori, forza delle relazioni tra le variabili • Adeguato numero di variabili • Almeno 3 per ogni fattore (meglio di più) • Ci sono outlier univariati (e multivariati)? • Le variabili sono distribuite normalmente? • Se le variabili non sono normali, la soluzione è meno chiara (e non si possono applicare test statistici che implicano la normalità) • Le relazioni tra le coppie di variabili sono lineari? • La matrice è fattorializzabile? • correlazioni bivariate sufficientemente elevate (>|.30|) • test di Bartlett (troppo sensibile)

  9. L’analisi fattoriale • Analizza • Riduzione dimensione • Fattoriale

  10. Scegliamo le variabili su cui vogliamo operare la PCA (x1 – x12)

  11. Indicazioni di base • Chiediamo la matrice delle correlazioni • Metodo di estrazione: PCA • Numero di fattori (per il momento non lo conosciamo) • Scree plot

  12. Default: PCA Default: criterio mineigen

  13. Esaminiamo l’output • Matrice di correlazioni iniziali: diversi r>|.30|

  14. Comunalità • È la somma dei quadrati delle correlazioni della variabile con i fattori. Indica quanta della varianza della variabile è spiegata dai fattori

  15. Varianza totale spiegata 3.159 / 12 = .26325 = 25% La varianza totale spiegata dai fattori (prima della rotazione) Mineigen

  16. Scree plot Sia lo scree plot, sia il criterio mineigen suggeriscono la presenza di 4 componenti

  17. Matrice delle componenti Matrice di correlazione tra le componenti e le variabili. Tutti e quattro i fattori sono correlati in maniera sostanziale (r>|.32|) con molte variabili e le variabili sono correlate con più fattori. La soluzione non è chiara (perché non è stata fatta la rotazione)

  18. Eseguiamo la rotazione • Ortogonale o obliqua? • Prima obliqua, se non ci sono correlazioni sostanziali passiamo a una rotazione ortogonale.

  19. Matrice di correlazione tra le componenti (in fondo all’output)

  20. Rotazione ortogonale (varimax) • Varianza totale spiegata: una nuova parte della tabella indica la varianza spiegata dai fattori dopo la rotazione La varianza totale non cambia rispetto a prima della rotazione, ma è suddivisa in maniera diversa tra i fattori

  21. Matrice delle componenti ruotata Più chiara!!! Ogni variabile ha saturazioni importanti su una sola componente.

  22. Interpretiamo le componenti 1 = ? 2 = ? 3 = ? 4 = ?

  23. Report dell’analisi • E’ stata condotta l’analisi delle componenti principali. Un primo esame dello screeplot suggeriva la presenza di 4 componenti. Anche il criterio Mineigen suggeriva una soluzione a 4 componenti. Questa numerosità corrispondeva a quella che era stata precedentemente ipotizzata in fase di costruzione del questionario. • Le analisi successive hanno confermato la presenza di 4 componenti, non correlate. Con una rotazione obliqua (criterio oblimin) emergeva una correlazione massima tra le componenti di r = |.167|, perciò è stata condotta una rotazione ortogonale (criterio varimax). • La soluzione a quattro componenti spiega il 75% della varianza osservata nelle variabili. • Le quattro componenti sono interpretate come: qualità del cibo, qualità del servizio, ambiente, prezzo. • La matrice delle componenti ruotate è presentata in Tab. 1.

  24. Domanda n. 2: Le domande sulla soddisfazione (d1, d2, d3) possono essere riassunte in un unico punteggio? (la scala è monofattoriale?) • Svolgete la PCA e provate a dare una risposta.

  25. Risposta • La PCA ha confermato la presenza di un unico fattore sottostante alle domande relative alla soddisfazione. I tre item sono altamente correlati tra di loro (correlazione minima r = .81) e un’unica componente spiega il 90 % della varianza.

  26. Domanda n. 3Legame tra le 4 componenti e la soddisfazione • Calcolo dei punteggi nei fattori • Punteggio fattoriale • Punteggio sommato

  27. Calcolo dei punteggi fattoriali • Conduciamo l’analisi fattoriale • Estrazione: PCA • Nr. componenti: 4 • Rotazione: Varimax • Calcolo dei punteggi fattoriali

  28. Date etichette appropriate

  29. Calcolare il punteggio fattoriale per la soddisfazione • Correlazione tra i quattro fattori di valutazione e il fattore di soddisfazione

  30. Calcoliamo i punteggi sommati s.cibo = x1 + x4 + x9 s.personale = x6 + x11 + x12. s.ambiente = x2 + x7 + x8. s.prezzo = x3 + x 5 + x10. s.Sodd = d1 + d2 + d3.

  31. Correlazioni • Tra punteggi fattoriali e punteggi sommati: sono molto alte • Tra punteggi sommati e soddisfazione: rivelano gli stessi legami già visti in precedenza.

  32. Ora da soli: file personalità.sav • A 459 persone è stato somministrato un questionario di self-report di personalità • Dovevano valutare quanto si sentivano descritti da ciascuno di 44 diversi aggettivi • Ipotesi: 5 componenti (big five) • Energia • Amicalità • Coscienziosità • Stabilità emotiva • Apertura mentale Quante sono le componenti? Sono ortogonali o oblique? Corrispondono alle 5 componenti ipotizzate?

  33. Quante sono le componenti?

  34. Mineigen: 10

  35. Quante sono le componenti? • Mineigen: massimo 10 • Scree plot: 5 • Attesa teorica: 5 • Partiamo da 5 componenti, vediamo se la soluzione è interpretabile

  36. Le componenti sono correlate? (Rotazione oblimin)No

  37. Rotazione Varimax – prima componentecoscienziosità

  38. Seconda componente: energia

  39. Terza componente: (in)stabilità emotiva

  40. Quarta componente: (mancanza di) amicalità

  41. Quinta componente: apertura mentale

  42. Da soli: BimbiCompetenze.sav • 177 bambini della scuola per l’infanzia. • Batteria di 10 test • Questi punteggi possono essere ridotti a un numero inferiore di dimensioni? • Quante? • Quali? • Sono correlate tra di loro? • Quale percentuale di varianza osservata viene spiegata complessivamente, quale percentuale di varianza viene spiegata da ciascuna dimensione? • Ci sono variabili pure? Quali? • Suggerimenti per migliorare la batteria di test?

More Related