Se prelevi i dati giornalieri dal sito NOAA, del quale ora non ricordo l'indirizzo perché non lo uso da un bel po', c'è una colonna contenente il numero di campioni utilizzati per il calcolo della media riportata. Personalmente, se sono meno di 21 o 22 campioni trovo la media integrale dubbia perché c'è rischio che manchino campioni con valori rilevabili molto lontani dal vero valore medio integrale, che sbilanciano la media calcolata trascinandola lontano dalla media vera. Il problema è che il sito ti dice quanti campioni ha usato, e sottraendo quel valore da 24 puoi ottenere quanti campioni mancano. Ma non ti dice "dove" sono (nel tempo) i campioni che mancano. Per quanto ne sai, potrebbero mancare i due campioni di temperatura massima o i due di minima, e se si tratta di un giorno con grande escursione termica la stima della vera media tramite il calcolo della media integrale è compromessa perché si ha errore di copertura (una porzione rilevante e influente della variabilità del fenomeno non è appunto "coperta" dalla rilevazione di campioni).
Ecco bravo, ottima scelta. Anche perché se passi di lì vedi dov'è e ti passa la voglia di usarla.
Trova una stazione Idrografico - se c'è e mi pare che ci sia - e usa quella. L'Idro di BZ è roba dell'Idro di BZ, e AM/ENAV è roba AM/ENAV. In mancanza di ulteriore informazione, basta questo.
Nei confronti, ricordati anche la questione che ho menzionato in altro topic, cioè che a pari rete si ha una situazione di errori sovra-correlati rispetto ai confronti fra reti diverse. Ergo trovare risultati simili a pari rete vale meno che trovare valori simili tra diverse reti, in quanto la correlazione fra le misure di due stazioni è una combinazione, uso una terminologia di origine psicometrica, di una componente di tratto e una componente di metodo.
Cioè.
La stazione 1 misura
t1 = ta +tb + err1
La stazione 2 misura
t2 = ta + tc + err2
dove ta = effetto climatico generale, tb = effetto microclimatico del sito 1, tc = effetto microclimatico del sito 2, err1 = errore di misurazione della stazione 1, erro2=errore di misurazione della stazione 2.
t1 e t2 in presenza di correlazione accentuata tra err1 ed err2 risulteranno sovra-correlati rispetto a quanto si otterrebbe in assenza di correlazione tra err1 ed err2, ma a te interessa la differenza fra i ta. Solo che t1 e t2 contengono rispettivamente err1 ed err2, che sono correlati, per cui t1 e t1 saranno correlati e lo sarebbero anche se tutti gli altri termini fossero indipendenti fra le due stazioni. Che due stazioni a pari rete diano valori simili è meno informativo della circostanza di due stazioni che danno valori simili a rete diversa. Questo nella misura in cui le stazioni differiscono tra reti e la correlazione tra gli errori diminuisce a stazioni diverse rispetto a quella che si ha a stazioni uguali.
...non so se sono stato chiaro. In breve, due stazioni uguali misurano in modo simile e fanno gli stessi errori, per cui se hai dubbi su una stazione la metti meglio sulla graticola se la confronti con una di una rete diversa, perché una stazione della stessa rete tenderebbe per costruzione ad avallare le sue misure in quanto checché sia la differenza fra i ta, c'è la correlazione fra gli errori a garantire correlazione fra t1 e t2. Ecco, detto così in parole povere è più chiaro.
Segnalibri