Ah, ho lasciato in sospeso una questione, la costruzione delle medie "alla greca", che come abbiamo visto sono composte da massima, minima, e alcuni altri campioni giornalieri a ore fisse, ma con collocazioni orarie che a mio avviso possono portare a una inflazione delle medie NOAA generalmente adottate nei confronti. Per avere 12 mesi di dati dei bollettini mensili, mi mancava un mese (giugno 2010) che ora è online. I dati di origine sono scaricati dall'indirizzo HNMS scegliendo i vari mesi in basso a sinistra.
Vediamo allora, riassumendo in un unico confronto tutte le stazioni e tutti i mesi, le medie mensili delle temperature medie calcolate alla greca, alla maniera NOAA (tmin+tmax) / 2 e la differenza fra le due costruzioni.
Come vediamo le medie brandite dal nostro socio greco tratte dal sito HNMS nei mesi estivi sono inflazionate di circa un grado (+1 in giugno, +1,1 in luglio, +0,7 in agosto) per effetto della loro pura costruzione matematica. Se a questo aggiungiamo la folta presenza di stazioni in aree affette da isola di calore al fosforo bianco, le superlative medie greche diventano davvero poco poco sorprendenti...Codice:---------------------------------------- media mese --------------- bias greca NOAA ---------------------------------------- 1 9,9 10,0 -0,1 2 10,9 10,8 0,1 3 12,7 12,4 0,3 4 16,4 15,8 0,6 5 20,9 19,8 1,1 6 24,6 23,5 1,0 7 27,5 26,5 1,1 8 26,5 25,8 0,7 9 22,5 22,6 0,0 10 18,9 18,9 0,0 11 14,2 14,3 -0,2 12 12,5 12,7 -0,1 ---------------------------------------- media 18,3 17,9 0,4 ---------------------------------------- Fonte: elaborazione su dati HNMS
Più tardi vedo di fare qualcosa di più elaborato (magari usando solo le stazioni con dati disponibili per tutti i 12 mesi) e posto la documentazione originale. Si sa mai che qualcuno pensi che ho fatto il furbetto. Se qualcuno non mi crede, scarica i dati origine, si rifà i conti, e poi viene a dirci se quadrano con quelli che ho fatto io oppure no.
Ultima modifica di Borat; 27/10/2010 alle 12:35
Ecco qui i soli mesi estivi (luglio e agosto 2009, giugno 2010) con un confronto dettagliato per tutte le stazioni HNMS di cui sono forniti i dati dei tre mesi estivi.
Non ricordo bene quali stazioni siano quelle ateniesi, ma noto nel mucchio Helliniko (con un bias estivo di +0,8°C) e Tatoi (con un bias di +1,1°C).Codice:Mesi estivi (lug-ago 2009, giu 2010). Valori medi per stazione -------------------------------------------------------------------- station tmax tmin tmean NOAA bias -------------------------------------------------------------------- AGHIALOS 30,3 19,5 26,6 24,9 1,7 AGRINIO 33,4 17,9 27,0 25,6 1,4 ALEXANDROUPOLI 30,6 19,5 26,6 25,0 1,5 ANDRAVIDA 30,3 18,8 26,2 24,6 1,6 ARAXOS 30,8 20,0 27,0 25,4 1,5 ARGOSTOLI 29,4 20,2 26,1 24,8 1,3 ARTA 31,8 18,0 25,6 24,9 0,7 CHRYSOUPOLI 29,1 19,6 25,3 24,3 1,0 ELEYSINA 32,2 23,0 28,5 27,6 0,9 HELLINIKO 32,0 22,7 28,1 27,4 0,8 HERAKLEIO 28,7 22,1 26,0 25,4 0,6 HIOS 29,2 21,3 26,6 25,2 1,3 IERAPETRA 31,1 23,6 27,6 27,4 0,3 IKARIA 26,9 23,9 25,3 25,4 -0,0 IOANNINA 29,1 15,2 23,6 22,1 1,5 KALAMATA 30,8 18,3 26,2 24,6 1,6 KARPATHOS 28,4 23,1 25,6 25,8 -0,2 KASTELI 28,7 19,6 24,6 24,1 0,5 KASTORIA 28,6 14,0 22,9 21,3 1,6 KERKYRA 30,4 19,9 26,5 25,1 1,4 KOS 29,7 22,5 26,0 26,1 -0,1 KOZANI 28,6 16,9 24,0 22,7 1,2 LAMIA 33,0 19,4 27,1 26,2 0,9 LARISA 32,5 18,7 27,0 25,6 1,5 LIMNOS 29,0 20,7 25,8 24,9 0,9 METHONI 28,1 20,1 25,1 24,1 1,0 MHLOS 30,5 22,4 26,9 26,5 0,4 MYKONOS 27,8 22,3 25,2 25,0 0,2 MYTILINI 31,2 21,8 27,2 26,5 0,7 NAXOS 27,8 22,4 25,5 25,1 0,4 PREVEZA 29,3 20,8 25,7 25,1 0,6 RODOS 29,6 24,0 27,1 26,8 0,3 SAMOS 31,9 23,0 28,3 27,5 0,8 SANTORINI 28,6 23,0 26,0 25,8 0,2 SERRES 32,3 19,0 26,4 25,7 0,7 SITEIA 27,3 22,9 25,1 25,1 0,0 SKYROS 27,7 21,7 25,4 24,7 0,7 SOUDA 30,2 21,5 26,3 25,8 0,5 SPATA 30,3 20,6 27,0 25,5 1,5 SYROS 28,6 22,7 26,1 25,6 0,5 TANAGRA 31,2 19,4 27,0 25,3 1,7 TATOI 29,9 20,6 26,4 25,3 1,1 THESSALONIKI 30,2 21,0 26,3 25,6 0,6 TRIKALA_IMATHIAS 31,7 19,0 25,9 25,3 0,6 TRIKALA_THESSALI 32,6 18,2 26,8 25,4 1,4 TRIPOLI 29,9 15,3 24,2 22,6 1,6 TYMPAKI 30,8 20,0 27,0 25,4 1,6 VELO 32,3 20,7 27,9 26,5 1,5 ZAKYNTHOS 31,5 20,4 27,5 25,9 1,6 -------------------------------------------------------------------- media 30,1 20,4 26,2 25,3 0,9 -------------------------------------------------------------------- Fonte: elaborazione su dati HNMS
In breve, quando ci capitano tra le mani delle medie ateniesi, prima controlliamo se la stazione è urbana in isola di calore (e generalmente lo è), poi controlliamo se è media greca o NOAA (e generalmente è media greca) e a quel punto possiamo anche buttarle via.
Ed ecco qui la documentazione per controllare: i singoli bollettini HNMS, un file CSV con i dati delle singole stazioni per mese, e lo stesso archivio in formato .dta per Stata 8 e seguenti. MEGAUPLOAD - The leading online storage and file delivery service
E giusto per menarla ancora un po', per Siviglia aeroporto (quindi non stazione urbana in fornace di isola di calore, ma sito aeroportuale) trovo per gli stessi mesi una media NOAA totale di 27.7°C.
Per Elefsina come vediamo sopra trovo invece medie NOAA di 27.6, per Helliniko 27.4 e per Tatoi 25.3°C, con media complessiva 26,8°C. Chiaramente la stazione comparabile con Siviglia S.Paolo è Tatoi, lontana dalla città. Comunque Siviglia in un fresco aeroporto sbaraglia i forni greci con isola di calore.
OK, basta così.
Intanto Salonicco oggi è sferzata da vento e pioggia...
Direi che Borat ha proprio ragione, il greco quello era nutrito da una vera e propria ossessione motivata da cosa non si sa.
I dati sfornati da Borat dimostrano che da questo confronto di stazione con la media maggiore in Europa Siviglia esce VINCENTE ed Atene esce PERDENTE.
Ho dato un'ulteriore occhiata a come funzionano le medie alla greca, le quali sono composte dalla media tra temperatura minima, temperatura massima, e tre temperature istantanee rilevate nel corso delle 24 ore (mi pare 8, 14 e 20 o qualcosa di simile).
Allora ho prelevato dal sito HNMS (HNMS) i bollettini dei tre mesi dell'estate scorsa e ci ho dato un'occhiatina, con risultati che voglio condividere.
I bollettini contengono le medie mensili di temperature minime, massime e medie calcolate alla maniera greca. Vediamo per iniziare il numero di stazioni sulle quali abbiamo informazioni per mese per queste tre variabili, con l'aggiunta della media NOAA (tmin+tmax)/2 calcolata da me per le stazioni con abbastanza informazione per farlo
Una prima semplice tabellina da vedere è quella dei bias delle medie alla greca rispetto alle medie NOAA:Codice:Numero di stazioni con dati validi per mese. Estate 2010. -------------------------------------------------- mese tmin tmax tmean NOAA -------------------------------------------------- 6 50 50 50 50 7 50 50 50 50 8 47 47 47 47 -------------------------------------------------- totale 147 147 147 147 -------------------------------------------------- Fonte: elaborazione su dati HNMS
Gran bel caldazzo; le medie estive delle stazioni disponibili sono infatti di 31°C per le massime, 21°C per le minime e 26,8°C per le medie calcolate alla maniera greca. Che scendono a 25,8°C (cioè di un grado) se le calcoliamo con la media degli estremi. Che è una cattiva statistica anche perché già di suo tende a sovrastimare la media integrale...Codice:Valori medi mensili, estate 2010. ------------------------------------------------------------ mese tmin tmax tmean NOAA bias ------------------------------------------------------------ 6 18,7 28,3 24,6 23,5 1,0 7 21,5 31,2 27,3 26,3 1,0 8 22,3 32,9 28,5 27,6 0,9 ------------------------------------------------------------ media 20,8 30,8 26,8 25,8 1,0 ------------------------------------------------------------ Fonte: elaborazione su dati HNMS
Ora proviamo a costruire una tabella con i valori medi estivi dettagliati rispetto alle varie stazioni, soltanto quelle per le quali sono disponibili le medie di tutti e tre i mesi estivi. Eccola qui:
Si vede bene che le medie greche in media sovrastimano un bel po' quelle NOAA (oltre un grado l'estate scorsa). Ma a occhio, con i dati grezzi, non ci si capisce un granché. Allora, visto che in un altro topic si è parlato di boxplot, vediamo un boxplot di questo bias:Codice:Valori medi estivi estate 2010. -------------------------------------------------------------------- stazione tmin tmax tmean NOAA bias -------------------------------------------------------------------- AGHIALOS 20,3 31,7 27,6 26,0 1,7 AGRINIO 18,1 34,1 27,4 26,1 1,3 ALEXANDROUPOLI 20,5 30,9 27,1 25,7 1,3 ANDRAVIDA 19,0 30,2 26,3 24,6 1,7 ARAXOS 19,6 30,9 26,8 25,3 1,6 ARGOSTOLI 20,5 29,8 26,3 25,1 1,1 ARTA 18,2 32,0 25,8 25,1 0,7 CHRYSOUPOLI 20,4 30,1 26,2 25,3 0,9 ELEYSINA 22,4 32,4 28,7 27,4 1,3 HELLINIKO 23,5 32,9 29,1 28,2 0,9 HERAKLEIO 23,1 30,5 27,4 26,8 0,6 HIOS 22,4 30,2 27,5 26,3 1,2 IERAPETRA 24,0 30,5 27,6 27,2 0,3 IKARIA 21,4 28,9 25,8 25,2 0,7 IOANNINA 15,7 29,7 24,1 22,7 1,5 KALAMATA 20,4 30,1 26,4 25,3 1,1 KASTORIA 14,4 29,2 23,5 21,8 1,7 KERKYRA 20,0 30,9 26,8 25,5 1,3 KOZANI 17,0 29,6 24,7 23,3 1,4 LAMIA 20,0 33,8 27,9 26,9 1,0 LARISA 19,5 33,3 27,8 26,4 1,4 LIMNOS 21,6 29,5 26,4 25,5 0,9 MHLOS 21,9 31,0 27,6 26,5 1,2 MYKONOS 22,9 29,1 26,4 26,0 0,4 MYTILINI 23,1 32,2 28,3 27,7 0,6 NAXOS 22,5 28,6 26,0 25,5 0,4 PREVEZA 20,4 29,6 25,7 25,0 0,7 PYRGOS 17,5 30,7 26,3 24,1 2,2 RODOS 24,1 29,6 27,0 26,8 0,2 SANTORINI 23,4 30,3 27,1 26,9 0,2 SERRES 19,3 33,8 27,5 26,5 1,0 SKYROS 22,2 28,6 26,2 25,4 0,8 SOUDA 22,9 30,8 27,2 26,9 0,3 SPATA 21,4 30,6 26,8 26,0 0,8 SYROS 23,4 28,7 26,4 26,0 0,4 TANAGRA 20,0 32,1 27,9 26,1 1,8 TATOI 21,6 31,5 27,7 26,5 1,2 THESSALONIKI 21,3 30,9 27,0 26,1 0,9 TRIKALA_IMATHIAS 19,3 32,5 26,7 25,9 0,8 TRIPOLI 17,4 30,5 25,3 23,9 1,4 TYMPAKI 20,7 30,9 27,0 25,8 1,2 VELO 20,0 32,8 28,5 26,4 2,1 ZAKYNTHOS 21,5 32,2 28,4 26,9 1,5 -------------------------------------------------------------------- media 20,7 30,9 26,8 25,8 1,1 -------------------------------------------------------------------- Fonte: elaborazione su dati HNMS
che mostra una sovrastima netta e sistematica (e che risulta anche significativa all'1 per 10.000 in un semplice ttest per i dati mediati sul trimestre per stazione, quindi con n=43).
Una ulteriore notarella da fare è che l'amico mesogeiakos (o chi per lui) ci ha postato l'ennesimo risultato trionfale dell'invincibile calura ateniese con un confronto sulla media non integrale tra Atene Thiseio e Siviglia S.Pablo (Atene, che forno!). Solo che la stazione ateniense ovviamente prescelta è in un forno di isola di calore con attorno 4 o 5 milioni di abitanti e quella spagnola è in un aeroporto extraurbano. Allora ho evidenziato sopra in neretto sottolineato un paio di stazioni ateniesi che non sono state usate nel confronto: Elefsina (27.4°C) ed Helliniko (28.2°C), non prive di isola di calore anche loro ma meno centrali. E se è buona la media di Siviglia postata sopra per l'ultima estate (28.6°C), si direbbe che senza isola di calore il tostapane spagnolo le abbia messe sotto tutte e due. Anzi, se guardiamo attentamente la colonna delle medie NOAA, si vede che non ce n'è nemmeno una pari o superiore a quella di Siviglia postata dal nostro socio.
Il che, giusto per sfottere il suo atteggiamento campanil-nazional-agonistico, equivale un po' a dire che Siviglia da sola ha sbaragliato tutta la Grecia.
Mi sono tolto la curiosità di andare a vedere un caso di come può funzionare la media greca applicata a dati spagnoli. Ho prelevato i dati suborari di una Davis urbana di Siviglia (IALSEVIL4, Tiempo en Sevilla) e con alcune elaborazioni elementari ne ho ricavato le medie calcolate con l'algorimo greco. Notare che ho fatto una cosa un tantino sbrigativa senza stare ad arrovellarmi con ore legali e solari; solo per tenere conto della differenza di longitudine, anziché usare le misure istantanee alle 9, 14 e 20, ho usato quelle alle 10, 15 e 21. Penso che ci sia l'ora legale anche in Spagna e che si potessero usare le misure delle 11, 16 e 22, ma penso che le variazioni introdotte sarebbero nell'ordine dei decimi.
Comunque ecco cosa esce per l'estate 2010:
Il fatto che le misure siano a passi di 20 minuti può alzare di qualche decimo le minime e abbassare di qualche decimo le massime. Ma nel complesso non mi è chiaro che altri effetti possa avere.Codice:Medie mensili IALSEVIL4 estate 2010 ------------------------------------------- media mese -------------------------------- integrale* NOAA** greca*** ------------------------------------------- 6 24,3 24,7 24,9 7 29,4 30,2 30,6 8 29,9 30,5 30,8 ------------------------------------------- media 27,9 28,5 28,8 ------------------------------------------- * dei valori a passi di 20 minuti ** basata su tmin e tmax a passi di 20 minuti *** basata su estremi e valori istantanei a passi di 20 minuti
Interessante. La media greca applicata ai dati di Siviglia butta su un grado come normalmente succede, ma non butta su un ulteriore grado rispetto alla media NOAA come invece accade esaminando i dati della rete greca HNMS visti sopra. Questo è molto interessante. Forse la stazione è ventilata, forse ci sono differenze serie di schermatura. Che ci siano differenze di regime termometrico giornaliero tra Andalusia e bacino ateniese si sapeva già.
Un dettaglio interessante è che questa stazione risulta avere media NOAA di 0,1°C inferiore a quella del metar all'aeroporto di Siviglia S.Pablo. Curioso. Potrebbe essere ombreggiata dagli edifici o su un palo alto su un tetto alto, ma non ne trovo foto e lavorare alla cieca senza vedere le stazioni non è bene. Cmq abbiamo il risultato che la media greca applicata ai dati spagnoli inflaziona la stima della media ma probabilmente meno di quanto accada in Grecia, e non si sa perché.
Se ho ben capito,il modo di calcolare le medie in Grecia è diverso da quello che abbiamo in Spagna e in Italia.Inoltre,la stazione ateniese meno influenzata dall'isola di calore pare sia Tatoi.
Le medie pubblicate dall'HNMS sono costruite con la formula
tmean = (tmin +tmax +th8 +th14 + th20) / 5
dove th8 sta per temperatura alle 8, th14 per temperatura alle 14 ecc. E' invece molto diffuso il calcolo della media con la formula
tmed = (tmin + tmax) / 2
che non ha campioni extra nelle ore diurne assolate ad alzare la media come la formula greca, ed è la comune media degli estremi che qualche volta tutti abbiamo usato e che viene usata come standard nei confronti e nelle serie storiche, specie quelle che risalgono indietro a tempi anteriori all'avvento delle stazioni automatiche con microprocessore e memoria.
Un'altra formula per la media, detta media integrale, è data da
tmed = sommatoria(temperatura istantanea da 1 a i) / i
cioè sommare un grande numero di campioni di temperatura a spaziatura costante (ad esempio 2 minuti, 5 minuti, 30 minuti ecc) che coprono tutta la giornata con uguali numeri di campioni per ogni ora, fascia della giornata eccetera, e dividere per il numero di addendi.
La formula greca pare sovrastimare sia la media integrale (che è la miglior stima della temperatura media giornaliera) sia la media NOAA. Solo che mi è risultato che quella stazione di Siviglia mostra una differenza piccola tra media NOAA e media greca, mentre esaminando i dati greci si trovano differenze molto grandi.
Circa Tatoi, mi pare però che sia anche lontanina dalla città e a diversa altitudine. Personalmente sono incline a ritenere che Atene non sia più monitorabile a norma per una stazione extraurbana. La città ha invaso tutto il bacino ateniese e per andare fuori città ci si deve anche allontanare dalle caratteristiche climatiche medie della città, per ovvie variazioni di altitudine e morfologia del terreno.
Ultima modifica di Borat; 30/10/2010 alle 16:18
Segnalibri