Dall’analisi Fattoriale alla regressione lineare

Dall’analisi Fattoriale alla regressione lineare Metodi Quantitativi per Economia, Finanza e ManagementEsercitazione n° 7

Step di analisi • Analisisoluzione • Rotazionefattori • Interpretazionefattori • Produzione dataset con fattori • Numero di fattori • RegolaAutovalori >1 • Lettura SCREEPLOT • 1/3 variabilioriginali • Variabilitàspiegata 60%-75% • Confrontosoluzioniscelte • Comunalitàfinali

PROC FACTOR – Opzioni Analisi fattoriale con il metodo delle componenti principali. PROCFACTORDATA=CORSO.TELEFONIA N=8 FUZZ=0.35SCREEOUT=CORSO.FACTORS ROTATE=VARIMAX REORDER; VARelenco variabili; RUN;

PROC REG – Riepilogo • Individuazione variabili dipendente e regressori • Trasformazione di eventuali variabili qualitative in dummy • Stimare un modello di regressione lineare utilizzando la procedura automatica di selezione delle variabili (stepwise) • Controllarela bontà del modello (R-square, Test F) • Controllarela significativitàdeisingolicoefficienti (Test t) • Analisi di influenza con i soli regressorisceltinella stepwise. • Se si è in presenza di osservazioniinfluenti: eliminarle e ripetereipunti 3, 4, 5 • In assenza di osservazioniinfluenti: passare al punto 7

PROC REG – Riepilogo • Verificare la presenza di multicollinearità (se i regressori del modello sono i fattori di un’analisi fattoriale non è necessario perchè risultano non correlati per costruzione  tutti i VIFj =1) • Se si è in presenza di multicollinearità: azioni per eliminarla e ripetereipunti 3, 4, 5, 6 • In assenza di multicollinearità: passare al punto 8 • Verificarel’impattodeiregressorinellaspiegazione del fenomeno (ordinarliusandoilvaloreassolutodeicoefficientistandardizzati e controllareil segno deicoefficienti) • Interpretazionedel coefficientistandardizzati

PROC REG – Sintassi Modello di regressione lineare procregdata=dataset; model variabile_dipendente= regressore_1 ... regressore_p /option(s); run; • OPTIONS: • STB calcola i coefficienti standardizzati • selection=stepwise applica la procedura stepwise per la selezione dei regressori • slentry=… livello di significatività richiesto per il test F parziale affinchè il singolo regressore possa entrare nel modello • slstay=… livello di significatività richiesto per il test F parziale affinchè il singolo regressore non sia rimosso dal modello • VIF per verificare presenza di multicollinearietà

Statistiche di influenza Sintassi • La PROC REG fornisce nell’output i valori della distanza di Cook e del levarage H per ogni osservazione del dataset: procregdata=dataset noprint; modelvariabile_dipendente= regressore_1 ... regressore_p / influence; outputout=dataset_outputcookd=cook H=leverage; run; • OPTIONS: • Influencee r forniscono una serie di indicatori di influenza tra cui D e H • Cookd= crea nel dataset di output una variabile con i valori della Distanza di Cook per ogni osservazione • H= crea nel dataset di output una variabile con i valori del Leverage per ogni osservazione • Noprint= utile soprattutto per dataset con molte informazioni, permette di non stampare l’output

Esercizio Il dataset ct_telefonia.sas7bdat contiene i dati di 126,761 clienti di una compagnia telefonica e 25 variabili quantitative

Esercizio • Allocare una libreria che punti alla cartella in cui si è salvato il dataset. • Accertarsi che le opzioni per l’output HTML siano correttamente impostate • Effettuare un’analisi fattoriale utilizzando tutte le variabili elencate escludendo la variabile ARPU. • Scegliere il numero di fattori ottimali • Salvare i fattori interpretati in un nuovo dataset

Esercizio Variabili da utilizzare per l’analisi fattoriale: CONTATTI_INBOUND CONTATTI_OUTBOUND REC_CONT_INBOUND REC_CONT_OUTBOUND MINUTI_VOCE_FREE MINUTI_VOCE_ITZ MINUTI_VOCE_OFFNET MINUTI_VOCE_ONNET RECENZA_CAMBIO_PIANO AMMONT_RICARICA_BONUS AMMONT_RICARICA_PAG AMMONT_RICARICA_PAG_LOTTO_SISAL AMMONT_RICARICA_RICORRENTE NUMERO_RICARCIHE_BONUS NUMERO_RICARICHE_RICORRENTI D_OPZ_ESTERO D_OP_NUM_PREF D_RIC_RICORRENTE FLAG_OPZ_COUNTRY

Esercizio • Stimare un modello di regressione lineare utilizzando • come variabile dipendente il valore dell’Arpu •  come potenziali regressori oltre ai fattori individuati al punto • precedente, anche le variabili età del cliente, anzianità della sim e • numero di sim attive per cliente: • Utilizzare l’opzione di stepwise (ed i relativi livelli di significatività) • Effettuare tutti i passaggi presenti nelle slide di riepilogo (slide 4 e 5) rispondendo anche alle seguenti domande: • a. Il valore dell’R-quadro è soddisfacente? • b. Cosa possiamo affermare osservando i dati relativi al test F e ai test t? • c. Quale regressore influenza maggiormente la variabile dipendente.

Dall’analisi Fattoriale alla regressione lineare

Dall’analisi Fattoriale alla regressione lineare

Presentation Transcript

ANALISI NON LINEARE DELLE STRUTTURE con C.D.S. Win - OpenSees

Corso di Analisi Statistica per le imprese Esercitazione: Inferenza nel modello di regressione lineare

Ottimizzazione multi obiettivo e vincolata applicata ad un modello di regressione lineare multipla

Lineare Optimierung

Regressione Logistica

La regressione multipla lineare

MODELLO DI REGRESSIONE LINEARE MULTIPLA

Algebra lineare

Dall analisi logica all analisi dei rapporti sintattici nella frase 26 marzo 2009 irrelombardia.it

INFERENZA NEL MODELLO DI REGRESSIONE LINEARE MULTIPLA (parte 1)

ANALISI della VARIANZA FATTORIALE

PREGEO 10 Rimini 19 Giugno 09 Analisi e rappresentazioni delle tipologie dall 1 alla 18

Introduzione alla Regressione Lineare e alla Correlazione

Algebra lineare

Cap. 13 Regressione

Regressione lineare

Lineare Regression

Dall’ archivio alla battaglia di Legnano

Regressione logistica

LA REGRESSIONE LINEARE MULTIPLA

Lineare Verflechtung

Metodi di Analisi Non Lineare applicati a Segnali Fisiologici