
Originariamente Scritto da
Tormenta
Allora bando alle ciance vi ho tenuto anche troppo sulle spine (1 ora e mezza per tornare a casa, maledetta città!!!!)
Dunque la cluster analysis effettuata all'inizio del topic non mi ha soddisfatto appieno anche perchè è qualcosa di qualitativo, diciamo una preparazione all'analisi vera e propria. La Multiple Discriminant Analysis fa invece al caso nostro, ma prima di tutto occorre fattorizzare la variabile da prevedere. In pratica l'
EA lo scompongo a piacimento in 5 classi. Classe 1 valori < -1,5 (
EA--). Classe 2 valori tra -1,5 e 0,5 (
EA-). Classe 3 valori tra -0,5 e +0,5 (
EA neutro o debolmente positivo/negativo). Classe 4 valori tra 0,5 ed 1,5 (
EA+) e classe 5 con valori > 1,5 (
EA++

).
La metodologia utilizzata non fa altro che calcolare le funzioni discriminanti basate sugli indici noti(che sono variabili continue) con le quali siamo poi in grado di prevedere grazie a degli "scores" l'appartenenza ad una delle 5 classi di
EA (variabile discreta).
Non vi stò qui a "spippettare" sui calcoli statistici

ma in pratica una volta calcolate le funzioni discriminanti per ognuna delle 5 classi non devo far altro che applicarci le mie variabili e calcolare gli "scores". La classe con lo scores più alto vince

.
Il matricione di variabili con lag temporale zero è stato ingrandito con le serie degli indici di teleconnessione laggati da uno a 4 mesi (il MEI fino a 10 mesi) a scopo di poter fare una previsione. Ho osservato che per molte variabili la correlazione con l'
EA cresceva al crescere del lag, come se il segnale di un indice impiegasse del tempo per trasferirsi dal suo luogo di osservazione fino all'Est Atlantico. Inizialmente avevo detto che il modello aveva predetto l'87 % dei mesi nella giusta classe, ma in realtà ho dovuto correggere una cosuccia che l'ha fatto scendere al 75....in pratica il modello vecchio è in grado si di predirre con miglior successo il pattern di
EA dicembrino, ma necessita di variabili laggate 1, e quindi i cui valori sono disponibili proprio a dicembre

, e sarebbe come fare una previsione a Dicembre per Dicembre

. Dunque ho optato per lasciar fuori tutte le variabili laggate 1 e con il metodo Forward Stepwise che permette di aggiungere variabili al modello una alla volta finchè l'aggiunta di una nuova non ne migliora la "significatività", ecco
li che ho ottenuto il mio set di variabili e le mie funzioni discriminanti.
Queste sono le 12 variabili di cui necessitiamo conoscerne i valori per fare una previsione dicembrina dell'
EA:
Indice MEI laggato 3 e 4 e 6(Agosto e Settembre Giugno(anch'essa ben correlato con l'
EA dicembrina!!!)
Indice
EA laggato 4 e 5 (Luglio e Agosto)
EA/
WR di Agosto
La
PDO di Ottobre e Agosto
La
QBO di Agosto
La
NAO di Ottobre
La
AO di Ottobre
INDONINO di Ottobre.
Una volta conosciuti i valori di questi indici è possibile tramite ste benedette funzioni discriminanti che vi allego calcolare a che classe apparterrà il prossimo Dicembre. Basta moltiplicare il valore dell'indice per quello corrispondente della funzione discriminante per ognuno dei 5 gruppi (colonne nell'allegato) e aggiungere la costante finale. Ogni gruppo avrà cosi uno scores, il più alto contrassegnerà la classe.
Segnalibri