Avevo più volte in passato criticato il continuo postare sul forum di medie delle temperature per spiegare un determinato periodo climatico o per screditare una teoria climatica Infatti se per esempio dopo un evento freddo e nevoso arriva la sciroccata chiaro che le medie potrebbero risultare normali o anche di qualche grado superiore alla normalità.Se una simile configuraziione breve perido freddo e intenso + successiva rimonta africana dovesse verificarsi molte volte durante un inverno le medie direbbbero poco però nei fatti si sarebberero verificati molti eventi estremi e quindi non consoni alla normalità climatica.

Ecco a tal proposito un articolo interessante (autore Michele Machetti)

La (non) affidabilità delle medie trentennali
Che cos'è la media? La media è una funzione matematica, utilizzata in statistica per descrivere sinteticamente un insieme corposo di dati. La media è un numero, che si calcola in questo modo:
Ma che effetto ha la media sull'insieme di dati? Come può descriverli? La media tende ad appiattire la serie di dati, quindi più dati si danno “in pasto” a quella formula là sopra, più si perde informazione riguardo ad eventi “particolari” (numeri molto alti o molto bassi). È tanto più inutile quanto lo scarto, o oscillazione, dei dati è alta.
Le medie trentennali vengono utilizzate in meteorologia per un confronto con le temperature attuali . Così sappiamo se siamo sopra o sotto media rispetto al periodo. Il problema principale deriva dal fatto che più dati si mettono dentro la media, meno ci accorgiamo se c'è un trend: in particolar modo con le medie trentennali non ci accorgiamo assolutamente della variazione climatica di anno in anno, non solo, ma la media trentennale non ci da nemmeno informazioni sul trend di quei 30 anni, ne sulle variazioni di temperatura; è un numero e anche abbastanza inutile se preso singolarmente. Se confrontato con le temperature annuali è ancora più inutile in quanto non ci da assolutamente nessuna informazione se non quella di essere sopra-media o sotto-media, che di per se è un'informazione inutile. Farei notare, inoltre, che dal punto di vista matematico è praticamente impossibile avere un giorno “in media”.
Ora facciamo un po' di matematica seria, osserviamo qualche dato climatico e proviamo dapprima ad usare la media trentennale, dopodiché, proviamo ad usare altri metodi, spiegandoli. Ho scelto per l'”esperimento” i primi 4 giorni di giugno. Sono state quindi prese le temperature medie di ogni giorno, le temperature si riferiscono a Roma Fiumicino. Un tempo piuttosto breve dal quale non si possono ricavare informazioni vere, è solo una dimostrazione matematica di come andrebbe utilizzata la stessa per fare un'analisi seria e non per sfruttarla come ci pare e piace.
01/06
02/06
03/06
04/06
1982
22,8
22,1
22,5
22,4
1983
20,3
21,5
21
23,8
1984
17,9
18
18,3
17,9
1985
21,3
19,3
21,9
22,4
1986
16,3
17,3
17
17,8
1987
17,4
18,1
18,7
19,8
1988
24,3
23,4
24,2
24,9
1989
18,9
19,8
18,9
19,2
1990
17,9
18,2
19
20,2
1991
17,6
18,7
18,2
18,6
1992
21,8
23,6
21,7
17,8
1993
22,3
21,7
21,2
20,2
1994
19,7
22,8
21,8
21,4
1995
15,1
15,8
17,8
18,2
1996
20,6
22,3
23,2
20,6
1997
16,7
19,8
19,6
19,8
1998
21,2
21,1
23,7
25,6
1999
23,6
23,2
24,2
22,8
2000
21,2
21,4
21,9
21,1
2001
21
21,2
20,1
17,8
2002
19,7
19,8
20,1
20,9
2003
20,5
21,2
21,4
22,2
2004
19,8
19,8
17,9
19,3
2005
20,4
21,6
21,6
22,1
2006
14,6
13,6
16,6
17,8
2007
19,2
18,5
15,9
18,9
2008
20,7
20,1
20,1
19,2
2009
18,9
19,4
20,6
20,8
2010
18,9
18,8
17,3
19
2011
18,9
20
22,6
22,9
2012
19,5
21,2
21
19,5

Questi sono i dati comprensivi anche del 2012, che non rientra nella media trentennale. Proviamo ora a tracciare il grafico della media e a confrontarlo con il 2012:
Come si può vedere, il grafico del 2012 risulta essere praticamente tutto sopra la media del periodo.
Questo è fuorviante. Non si può, infatti, confrontare un singolo anno con una media trentennale, una media trentennale va confrontata con un'altra media trentennale. Solo allora ha senso di esistere e ci può dare qualche informazione veramente utile.
Seguendo questo ragionamento dovremmo confrontare il 2012 con uno degli anni addietro, per esempio il 2011. Facciamolo.
Come si può vedere, da un inizio poco più caldo, siamo passati, negli ultimi due giorni evidenziati, ad un decisivo raffreddamento. Questi sono dati, qui su questo grafico si può fare un'analisi obiettiva. Confrontando tra di loro più anni si può avere anche idea del trend.
Il problema è che l'analisi dei dati non è cosa facile, e i dati sono davvero molti. Quindi può essere conveniente raggruppare una serie di dati e farne una media, ma a quel punto a media si confronti media uguale e non medie prese a caso solo perché conviene. Per esempio potrei calcolarmi le ultime due medie quinquennali e metterle a confronto con la media trentennale, per dimostrare di come posso, non manomettere, ma evidenziare solo ciò che mi fa comodo.
Direi che è molto efficace. In realtà ha senso solo confrontare i due quinquenni dai quali si evince un andamento meno estremo e più tendente a temperature miti nell'ultimo quinquennio.
È chiaro ormai che il clima segue variazioni cicliche cadenzate in circa 20 anni. È quindi estremamente impreciso utilizzare una media trentennale. Andrebbe utilizzata una media a più corto respiro, triennale o quinquennale, per evidenziare un qualche trend.
Diamo quindi a medie trentennali medie trentennali, a medie annue medie annue, a medie quinquennali medie quinquennali.
Se proprio non possiamo fare a meno di utilizzare la cara media trentennale, almeno che la si usi con conoscenza, capendo veramente cosa significa e affinandone la tecnica utilizzando, a supporto di essa, un altro calcolo come ad esempio la deviazione standard. In questo modo la media trentennale ci può dire qualcosa di più, e possiamo sapere se siamo o non siamo veramente in media con il periodo trentennale (e non con le temperature stagionali. Per avere una media stagionale andrebbero controllate le temperature di stagione in stagione dalla notte dei tempi, fatta la media, fatta la deviazione standard. Ovviamente tutto ciò è impossibile.). La formula della deviazione standard è la seguente:
Utilizzando questa formuletta, possiamo calcolare intorno alla media un range, in cui è più probabile che cadano i valori. Invece di utilizzare una serie di numeri come media, si utilizza un intervallo. In realtà i meteorologi già utilizzano questo sistema, anche se vanno un po' ad occhio. Questo determina, il più delle volte, tutta una serie di scorrettezze sul sopra-media e il sotto-media. Molto spesso viene considerato uno scarto di 1 grado. Farà piacere sapere agli amanti delle medie, che lo scarto è quasi sempre di ben 2 gradi e sono dell'idea che la matematica sia un metodo molto più obiettivo della sensazione personale.
Facciamo ora il grafico ora della media con deviazione e confrontiamolo con il 2012.
Tutto è ben chiaro.
Ciò che prima poteva sembrare sopra-media o sotto-media, non lo è più. Prima avremmo detto che questi 4 giorni sono stati praticamente tutti sopra-media, fatta eccezione per l'ultimo. Ora invece possiamo asserire che siamo in media col periodo e che anzi, c'è un violento e repentino cambiamento, nell'ultimo giorno, che ci porta in picchiata, pur rimanendo in media.
La matematica è lo strumento principale di analisi dei dati, ma solo se saputa utilizzare. Mi pare che ci sia molto pressappochismo nel settore e che si utilizzino formule e valori per far risaltare le proprie idee. Formule magari fatte bene e corrette, ma applicate malamente e grossolanamente.

Michele Machetti