ma si dai; anche per solo gioco.
Ripropongo dunque anche quest'anno una previsione sintetica della anomalia termica dell'area del centro italia dei mesi di gennaio e febbraio (come media) basata su valori di grandezze di input relative ai mesi di settembre ed ottobre (sempre come media), quindi una previsione a lag -4 mesi.
Come molti di voi già sanno si tratta di una indice (o formula, che dir si voglia), basata su grandezze di input quasi tutte riconducibili ad anomalie oceaniche.
Alcune sono grandezze note:
amo
tna
oni
altre sono costruite tramite il server noaa, cercando di prendere porzioni di oceano specifiche:
NCP (north central pacific): Latitude Range used: 50.5 to 29.5
Longitude Range used: 168.8 to 200.6
NEP (north east pacific): Latitude Range used: 58.1 to 37.1
Longitude Range used: 204.4 to 240.0
NWP (north west pacific): Latitude Range used: 60.0 to 35.2
Longitude Range used: 131.2 to 170.6
NEA (north east atlantic): Latitude Range used: 58.1 to 27.6
Longitude Range used: 330.0 to 358.1
NWA (north west atlantic): Latitude Range used: 37.1 to 20.0
Longitude Range used: 277.5 to 300.0
Infine c'è la QBO.
Rispetto allo scorso anno ho eliminato alcune grandezze, cercando quindi di ridurre, per quanto possibile, il problema "overfitting".
La formula è costituita in origine da polinomi di primo ordine, ma successivamente alcune variabili sono state messe in funzione di altre, per cui la forumla finale risulta abbastanza complessa.
Come già avevo spiegato tempo fa, avevo provato a correlare al meglo una serie storica di valori relativi al periodo (che quindi acquista la valenza di periodo di hindcast) 1950-1980.
Avevo ottenuto questi parametri di correlazione:
Corr.: 0.87
R2: 0.748
R2adj: 0.635
Quindi in definitiva un buon adattamento.
La serie 1981-2007 (che quindi ha valenza di serie di forecast) tuttavia mi divergeva abbastanza sugli anni recenti (vedi grafico), dopo una buona performance fino grosso modo agli anni 90-95.
Tuttavia osservando meglio il grafico si nota che andamenti similari si possono trovare anche per la serie recente, anche se tutto è caratterizzato da medie vistosamente più basse. Questo dipende dal fatto che le anomalie oceaniche di input agiscono in alcuni casi (vedi NCP, NEA) come anticorrelazione, ovvero più sono elevate, più l'indice è basso; ma è chiaro che in epoca di global warming il calore eccessivo degli oceani porta a valori eccessivamente bassi.
Allora ho inserito nella formulazione l'aggiunta del fattore GW, ovvero l'anomalia delle temperature globali, opportunamente pesate.
Il risultato è il secondo grafico, da cui è tratta la previsione. Come si vede l'indice accosta abbastanza bene anche sulla serie recente le anomalie termiche, pur riducendosi un po' la performance sulla serie di hindcast.
Riepilogando i parametri di correlazione della formula corretta con le anomalie globali:
Serie di hindcast
Corr: 0.776; R2=0.55; R2adj= 0.315
Serie di forecast
Corr: 0.674; R2=0.304; R2adj= 0 ca.
Secondo alcuni il valore di R2 nella serie di forecast rappresenta la valenza previsionale dell'indice, che quindi sarebbe dell'ordine del 30%.
Altri dati sono l'errore medio nella serie di forecast che è di 0.62°C; il percentile 75% è pari a 0.84°C e del 90% di 1.12°C (sempre sulla serie di forecast).
Concludendo si ricava per genn-febb 2009 una anomalia prevista di 1.52°C
Come si vede gli ultimi anni sono stati un po' maggiorati (soprattutto l'errere vistoso del 2006), quindi speriamo che anche quest'anno si riesca a stare su anomalie più contenute![]()
alcune considerazioni.
come dicevo la formulazione finale è abbastanza complessa, per cui si rischia di perdere, nella ricerca della migliore correlazione attraverso l'ottimizzazione dei valori costanti, il senso fisico del tutto.
Tuttavia la struttura di base della formula è abbastanza semplice, e poggia su poche variabili (anomalie oceaniche).
Ad esempio agendo solo su NCP, NEA, NEP, NWP NWA (ma quest'ultimo si potrebbe anche togliere) con semplici polonomi di primo ordine si riesce abbastanza facilmente ad accostare bene la serie 1980-1950, ottenendo correlazioni prossime o superiori a 0.70 (vedi grafico). Questa cosa forse vale più della formulazione "complessa" sopra esposta, e merita di essere approfondita.
Poi però è difficile trovare l'accostamento della serie recente, per i motivi sopra detti.
Quello che mi piacerebbe fare è usare variabili già detrendizzate, senza usare a posteriori la correzione delle anomalie globali; alcune prove l'ho fatte, ma è molto difficile trovare il "giusto peso".
![]()
"i modelli matematici non ricalcolano ma "RITRATTANO"
previsore e co-fondatore di Arezzo Meteo www.arezzometeo.com
Segnalibri