Modellino forecast CM Oropa

only**snow** · 19/11/2016, 11:26

Ciao a tutti,

In questi giorni ho provato a definire un modellino che cercasse di spiegare i centimetri di neve caduti a Oropa nella serie storica 1950-2015 nei mesi di Dicembre-Gennaio-Febbraio-Marzo sulla base degli indici teleconnettivi .

Ho quindi consultato la base dati ncep: Climate Prediction Center - Northern Hemisphere Teleconnection Patterns

Da questa base dati ho identificato questa "short-list" di indici:

NAO
EA-WR
PNA
SCAND
EA
West Pacific
Polar/Eurasia

Una volta definita la lista dei regressori con la lista degli indici, ho identificato ed escluso i regressori correlati fra loro per un valore assoluto superiore al 70%.

Dopo di che ho lavorato sulla variabile dipendente ovvero la serie storica dei centimetri di neve caduti ad Oropa, identificando in base ad un taglio della distribuzione dei percentili (5%-95%) i valori outliers sia negativi (ho identificato come percentile inferiore 1 cm accumulati in un mese) e positivi (ho identificato come outliers valori superiori a 152 cm in un mese).

Ho quindi "cappato" a 1 cm i valori outliers inferiori e "floorato" a 152 cm i valori sopra soglia e deciso di tagliare la serie storica, ritenendo rappresentatativi esclusivamente i dati dal 1980 (ho quindi escluso il periodo 1950-1980).

Una volta fatto questo ho semplicemente effettuato una regressione lineare con criterio di selezione stepwise in base al valore di significatività (10%) dei regressori.

Due sono i modelli finali risultatanti da questa selezione:

Primo modello

Intercetta--> Coeff.regressione= 46,84544, Pvalue=<.0001
NAO INDEX -->Coeff.regressione= -8,08997, Pvalue=0.0170
EA WR --> Coeff.regressione=-11,21781, Pvalue=0.0013
SCAND --> Coeff.regressione=8,61089, Pvalue=0.0158

Secondo modello

Intercetta--> Coeff.regressione= 47,17537, Pvalue=<.0001
NAO INDEX -->Coeff.regressione= -8,26136, Pvalue=0.01390
EA WR --> Coeff.regressione=-11,60266, Pvalue=0.0008
SCAND --> Coeff.regressione=8,15270, Pvalue=0.0212
POL_EUR--> Coeff.regressione=6,48291, Pvalue=0.0514

L' R^2 della regressione per il primo modello è pari al 15,98% mentre per il secondo è pari a 18,25%

Tutto sommato lo ritengo un buon valore, di seguito il Plot dei cm osservati sulla serie storica e dei cm che sarebbero stati previsti dal modello, come vedete il modello fa ancora fatica a stimare i picchi della serie storica:

Su questo sarei curioso di sentire vostri suggerimenti per andare a limare questo GAP, magari provando ad inserire qualche altro regressore che non ho ancora identificato

Intanto vi metto l'excel dove se volete potete "divertirvi" col modello in due modi:

Provare a strimare i cm dei 4 mesi invernali ipotizzando valori degli indici simili a osservazioni del passato (basta selezionare dal menu a tendina)
Provare a stimare i cm basandosi su valori "judgemental" inseriti da voi

Excel del modello--> Oropa_Forecast_v1.xlsx - Google Drive

Sono stato forse un po' lungo, fatemi sapere se volete vostre opinioni qualora lo riteniate interessante!