Ciao a tutti,

In questi giorni ho provato a definire un modellino che cercasse di spiegare i centimetri di neve caduti a Oropa nella serie storica 1950-2015 nei mesi di Dicembre-Gennaio-Febbraio-Marzo sulla base degli indici teleconnettivi .

Ho quindi consultato la base dati ncep: Climate Prediction Center - Northern Hemisphere Teleconnection Patterns

Da questa base dati ho identificato questa "short-list" di indici:


  • NAO
  • EA-WR
  • PNA
  • SCAND
  • EA
  • West Pacific
  • Polar/Eurasia


Una volta definita la lista dei regressori con la lista degli indici, ho identificato ed escluso i regressori correlati fra loro per un valore assoluto superiore al 70%.

Dopo di che ho lavorato sulla variabile dipendente ovvero la serie storica dei centimetri di neve caduti ad Oropa, identificando in base ad un taglio della distribuzione dei percentili (5%-95%) i valori outliers sia negativi (ho identificato come percentile inferiore 1 cm accumulati in un mese) e positivi (ho identificato come outliers valori superiori a 152 cm in un mese).

Ho quindi "cappato" a 1 cm i valori outliers inferiori e "floorato" a 152 cm i valori sopra soglia e deciso di tagliare la serie storica, ritenendo rappresentatativi esclusivamente i dati dal 1980 (ho quindi escluso il periodo 1950-1980).


Una volta fatto questo ho semplicemente effettuato una regressione lineare con criterio di selezione stepwise in base al valore di significatività (10%) dei regressori.

Due sono i modelli finali risultatanti da questa selezione:

Primo modello


  • Intercetta--> Coeff.regressione= 46,84544, Pvalue=<.0001
  • NAO INDEX -->Coeff.regressione= -8,08997, Pvalue=0.0170
  • EA WR --> Coeff.regressione=-11,21781, Pvalue=0.0013
  • SCAND --> Coeff.regressione=8,61089, Pvalue=0.0158



Secondo modello


  • Intercetta--> Coeff.regressione= 47,17537, Pvalue=<.0001
  • NAO INDEX -->Coeff.regressione= -8,26136, Pvalue=0.01390
  • EA WR --> Coeff.regressione=-11,60266, Pvalue=0.0008
  • SCAND --> Coeff.regressione=8,15270, Pvalue=0.0212
  • POL_EUR--> Coeff.regressione=6,48291, Pvalue=0.0514


L' R^2 della regressione per il primo modello è pari al 15,98% mentre per il secondo è pari a 18,25%

Tutto sommato lo ritengo un buon valore, di seguito il Plot dei cm osservati sulla serie storica e dei cm che sarebbero stati previsti dal modello, come vedete il modello fa ancora fatica a stimare i picchi della serie storica:




Su questo sarei curioso di sentire vostri suggerimenti per andare a limare questo GAP, magari provando ad inserire qualche altro regressore che non ho ancora identificato


Intanto vi metto l'excel dove se volete potete "divertirvi" col modello in due modi:

  1. Provare a strimare i cm dei 4 mesi invernali ipotizzando valori degli indici simili a osservazioni del passato (basta selezionare dal menu a tendina)
  2. Provare a stimare i cm basandosi su valori "judgemental" inseriti da voi


Excel del modello--> Oropa_Forecast_v1.xlsx - Google Drive


Sono stato forse un po' lungo, fatemi sapere se volete vostre opinioni qualora lo riteniate interessante!