INDICE DELL’INCONTRO

INDICE DELL’INCONTRO • Analisi di segmentazione per Obiettivi • La segmentazione ad Albero: Chaid • Cenni alle Reti Neurali

SEGMENTAZIONE PER OBIETTIVI: CHAID perché la Segmentazione ad Albero?... Consideriamo per esempio le domande d4-13 tot del file dati caffarel.sav, vale a dire la spesa che ciascun intervistato sarebbe disposto a sostenere per acquistare il gianduiotto. Relativamente alle variabili socio demo possiamo evidenziare delle differenze significative? Se consideriamo il gradimento per il prodotto (dom 4_6) e/o per la confezione (dom 4_7) e/o il percepito per la marca Caffarel (dom 4_10) e/o per il giunduitto stesso (dom 4_14), quali conclusioni possiamo trarre relativamente al gradimento complessivo? Proviamo in base a quanto visto sino ad ora a procedere …… (analisi bivariate, multivariate – regressione-….)

SEGMENTAZIONE PER OBIETTIVI: CHAID Il metodo CHAID permette di analizzare TUTTI gli incroci possibili evidenziandone solo quelli significativi Si basa su una procedura iterativa: nella prima fase, la popolazione viene divisa in due o più gruppi sulla base della variabile esplicativa più significativamente legata alla variabile dipendente prescelta ; ciascuno di questi gruppi ottenuti nella prima fase viene ulteriormente diviso in sottogruppi più piccoli sulla base delle rimanenti variabili esplicative. Il processo di divisione termina quando non possono più essere individuati predittori statisticamente significativi ; i sottogruppi finali (segmenti) vengono quindi rappresentati in un diagramma ad albero.

SEGMENTAZIONE PER OBIETTIVI: CHAID I segmenti individuati sono mutuamente esclusivi ed esaustivi. In altre parole, i segmenti non si sovrappongono e ciascuna unità della popolazione è contenuta in un unico segmento. Dal momento che ogni segmento è definito da combinazioni delle variabili esplicative, è possibile riclassificare ogni osservazione (azienda/clienti/prospect) nel segmento appropriato semplicemente conoscendo tali variabili

SEGMENTAZIONE PER OBIETTIVI: CHAID I segmenti individuati sono mutuamente esclusivi ed esaustivi. In altre parole, i segmenti non si sovrappongono e ciascuna unità della popolazione è contenuta in un unico segmento. Dal momento che ogni segmento è definito da combinazioni delle variabili esplicative, è possibile riclassificare ogni osservazione (azienda/clienti/prospect) nel segmento appropriato semplicemente conoscendo tali variabili Da un punto di vista marketing l’impiego di tale tecnica risulta molto interessante per “studiare/individuare” sottoinsiemi di clienti – nell’accezione più ampia del termine – latenti, ossia rappresentati come risultato dell’analisi congiunta di più variabili. Esempio: sempre con riferimento al gianduiotto Caffarel analizziamo il prezzo che gli intervistati sarebbero disposti a spendere file: dati Caffarel – questionario Caffarel sintassi: CHAID_DESCRITTIVA.sps

SEGMENTAZIONE PER OBIETTIVI: CHAID Esempio: proviamo quindi a rispondere alle domande precedenti file caffarel.sav, variabili d4_13tot d4_6_1- d4_6_7, d4_7_1-d4_7_2, d4_10_1-d4_10_9, d4_14_1-d4_14_7, UOMO, SIGLE, BAMBINI, LAUREA, MEDIE, età. Come e perchè ricodificate le variabili socio-demo.

SEGMENTAZIONE PER OBIETTIVI: le Reti Neurali Le reti neurali traggono ispirazione dalle scienze biologiche. Si tratta infatti di un’insieme connesso di unità che agiscono in modo equivalente ad un insieme di neuroni biologici. L’origine dello studio delle reti neurali si può far risalire alla fine degli anni ‘40, quando D.O. Hebb propose una legge di apprendimento che sta alla base delle modello di analisi delle reti neurali. Durante gli anni ‘50 e ‘60 si assistette ad una vera e propria esplosione di studi relativi alle reti neurali, studi che portarono al Perceptron, che sembrò rappresentare la risposta ottimale alla domanda che maggiormente stava a cuore dei ricercatori dell’epoca: come poter riprodurre artificialmente l’intelligenza umana. In realtà si trattò di una pura illusione; infatti tale modello, il Perceptron, era in grado solo di riprodurre alcune capacità del cervello umano. Per esempio risultò particolarmente efficacie nelle previsioni meteorologiche. Per circa un ventennio le reti neurali restarono un dominio per pochi studiosi almeno fino alla metà degli anni ‘80; quando grazie ai nuovi algoritmi (Back-propagation, 1986), ma soprattutto allo sviluppo delle capacità di calcolo degli elaboratori, si tornò a parlare delle possibili applicazioni delle reti neurali. Le reti neurali sono state originariamente create con l’intento di studiare il comportamento del sistema nervoso. Come è noto, tale sistema è costituito da un numero elevatissimo di cellule nervose (neuroni), collegati da connessioni dette sinapsi. Ogni neurone è in grado di eccitarsi e di trasmettere uno stimolo elettrico in risposta alle combinazioni di stimoli che riceve dagli altri neuroni. La trasmissione degli stimoli dipende dalla natura delle sinapsi e tale natura si modifica durante la crescita per effetto dell’apprendimento.

SEGMENTAZIONE PER OBIETTIVI: le Reti Neurali La struttura generale La struttura generale di una rete neurale è costituita da una serie di nodi di entrata (unità di input), una o più serie di nodi intermedi (livelli e unità nascoste) e una serie di nodi di uscita (unità di uscita). Qualora non esistano livelli nascosti si parlerà di percettroni, altrimenti di reti multistrato.

SEGMENTAZIONE PER OBIETTIVI: le Reti Neurali Un modello di rete neurale viene specificato attraverso 5 caratteristiche: il modello generale del neurone l’architettura della rete la modalità di attivazione dei neuroni il paradigma di apprendimento la legge di apprendimento 1) Il modello generale del neurone: il neurone viene specificato attraverso: canali di ingresso: sono le fonti di informazioni del neurone; pesi delle connessioni: riproducono le sinapsi del cervello umano e hanno il compito di mediare il segnale trasmesso da un neurone ad un altro; w(ij) funzione di attivazione: associa attraverso una funzione (solitamente una somma) i pesi e i segnali in arrivo al neurone; NETj = funzione di uscita: rappresenta il reale valore di uscita dal neurone verso il neurone successivo (può essere una funzione lineare o no e può contenere un valore di soglia per cui il neurone trasmette l’informazione solo se tale valore viene superato). OUT = f’(NET)

SEGMENTAZIONE PER OBIETTIVI: le Reti Neurali 2) L’architettura della rete: è definita in funzione del tipo di neuroni e di connessioni esistenti fra gli stessi. Si parla di reti stratificate quando i neuroni sono connessi solo con quelli dello stato adiacente; viceversa si ha una rete cosiddetta completamente connessa quando ogni neurone è connesso con qualunque altro neurone della rete. Le più usate in ambito di previsionale sono quelle stratificate. RETI MULTISTRATO In relazione al numero ottimale di strati nascosti in generale 1o 2 strati risultano più che sufficienti; per quanto riguarda il numero dei nodi per ciascun strato in letteratura vengono forniti diversi proposte : - Media tra il numero di nodi di input e nodi di output - Radice quadrata della somma del numero dei nodi di input e di output - Metà del numero dei nodi di input -.... esperienza e soprattutto tante prove! In generale il secondo livello nascosto ha un numero di nodi superiori al primo.

SEGMENTAZIONE PER OBIETTIVI: le Reti Neurali 3) La modalità di attivazione dei neuroni: stabilisce il modo in cui i neuroni vengono attivati. Esistono due tipologie di attivazione dei neuroni, il modo parallelo (sincrono) in cui ad ogni istante t i neuroni si attivano e al tempo t+1 modificano il loro stato; il modo sequenziale (asincrono) in cui i neuroni vengono aggiornati uno alla volta. In generale la funzione di attivazione è quella funzione attraverso la quale i neuroni trasmettono le informazioni ricevute dai neuroni “precedenti” (NET = )ai neuroni “successivi” (OUT = f(NET)). Le principali funzioni di attivazione impiegate sono quella lineare, quella a soglia, quella logistica (in assoluto la più usata) la gaussiana e la tangente iperbolica.

SEGMENTAZIONE PER OBIETTIVI: le Reti Neurali • 4) Il paradigma di apprendimento: caratterizza il modo in cui una rete apprende. • Esistono 3 tipologie di apprendimento: supervised learning (apprendimento con supervisione mediante esempi), unsupervised learning (apprendimento senza sueprvisione) e reinforcemente learning (apprendimento mediante rinforzo). • In generale un paradigma di apprendimento può essere definito come: • inizializzazione dei pesi delle connessioni (casuale) • sottomissione alla rete di un pattern di input e corrispondente output desiderato • calcolo del output della rete • aggiornamento dei pesi • riproposta del pattern di input fino a quando l’errore non è inferiore ad prefissato valore.

SEGMENTAZIONE PER OBIETTIVI: le Reti Neurali La rete adatta i pesi in funzione della differenza fra il valore di output ottenuto e quello desiderato d = Y* - Y il paradigma è soddisfatto se d è moltiplicato per il valore di ciascun input x(i) e questo prodotto e aggiunto a ciascun peso. Negli anni ‘70 e ‘80 viene proposta l’algoritmo di apprendimento per reti multistrato denominato : Back-propagation In generale gli strati nascosti vengono addestrati ri-propagando all’indietro l’errore rilevato sull’output La funzione di attivazione impiegata è quella logistica (sigmoide) per cui Δw(ij) = η*δ (j)*x(i) ove δ è legato alla differenza tra il valore stimato e quello ottenuto dal modello (errore)

SEGMENTAZIONE PER OBIETTIVI: le Reti Neurali • Alcune considerazioni relative all’algoritmo della Back-propagation: • i pesi iniziali, scelti in modo casuale, non devono essere troppo elevati • è opportuno scegliere un tasso di apprendimento h alto all’inizio per favorire l’apprendimento diminuendone poi il valore con il procedere della fase di apprendimento. • in alternativa si può introdurre un altro parametro (Momentum = a<1) cosicché il cambiamento dei pesi risulti proporzionale al cambiamento precedente: • Δw(ij) = η*δ (j)*x(i) + α*wn-1(ij) • Per ottimizzare l’algoritmo nel 1987 è stato proposto di normalizzare i dati in entrata nell’intervallo -1/2;+1/2 • La Scatola Nera: il principale limite all’impiego di tale metodologia nell’analisi dei dati di marketing è legato alla difficoltà di “spiegare” il comportamento di una rete. • Infatti una volta ottenuta una struttura che sia in grado non solo di “fittare” al meglio l’insieme dei dati forniti, ma anche di generalizzare interpretando delle nuove osservazioni, resta sempre il problema di poter valutare il ruolo delle diverse variabili indipendenti. A differenza delle tecniche statistiche non è possibile, se non in via approssimata, attribuire un peso alle diverse variabili esplicative.

INDICE DELL’INCONTRO