interessante il tuo intervento! devo però dire che parlando di "varianza più ampia" mi ero espresso male e in modo incompleto. quello che volevo dire io, in soldoni, è: se c'è una mensilità che casualmente (per il basso numero di stazioni) chiude a -10 °C dalla 1981-2010, mentre l'anomalia reale se fosse stata calcolata con più stazioni sul territorio nazionale sarebbe stata di -9 C, è un conto; se invece altrettanto casualmente una data mensilità chiude a -9 °C dalla 1981-2010 con un campione esiguo, mentre con un campionamento più capillare sul territorio avrebbe chiuso a -10 °C, è un altro. Il primo caso, in verità, è più probabile. Mi si può a questo punto dire: perchè la sottostima casuale di un grado è più probabile rispetto alla sovrastima di un grado? Non dovrebbe essere probabilisticamente uguale?
La risposta è: non proprio. Questo perchè nel primo caso l'anomalia reale, con ipotetici infiniti punti di misurazione sul territorio nazionale, sarebbe stata di -9 °C. Nel secondo caso invece, l'anomalia parimenti reale sarebbe stata di -10 °C. Quindi, prendendo due anomalie concettualmente omogenee (cioè entrambe "reali" e non calcolate solo con pochi dati), il -10 °C è meno probabile del -9 °C. Capisci cosa intendo? Se una sottostima casuale di 1 °C rispetto al valore reale avveniva in, chessò, il 10% dei casi a inizio Ottocento e una sovrastima casuale di 1 °C rispetto al valore reale avveniva sempre nel 10% dei casi, ma al tempo stesso un mese su 50 chiudeva nel suo valore reale, corrispondente all'avere teoricamente - e così non era - tantissime stazioni sparse per la nazione, con un sottomedia di 9 gradi, e soltanto un mese su 100 chiudeva nel suo valore parimenti reale con un sottomedia di 10 gradi, tu nel primo caso andrai a calcolare (dividendo per il peso statistico della sottostima di una certa entità) un cinquantesimo diviso un decimo (il 10% di cui parlavamo prima), mentre nel secondo caso andrai a calcolare un centesimo diviso un decimo: ottieni un cinquecentesimo nel primo caso e un millesimo nel secondo caso. Ecco perchè, tendenzialmente (ribadisco: tendenzialmente), è più facile trovare una mensilità con anomalia estremamente bassa frutto di una sottostima di un valore semplicemente molto basso, rispetto al trovare una mensilità con anomalia semplicemente molto basso frutto di una sovrastima di un valore estremamente basso. Spero di avere reso il concetto...
Va da sè che un ragionamento analogo, ma esattamente ribaltato, può essere applicato ai mesi del lontanissimo passato che risultano "piccare" verso l'alto in modo estremo come anomalia nazionale.
In sostanza, nella classifica delle mensilità più fredde è probabile che i picchi verso il basso enfatizzati da una sottostima casuale siano più frequenti rispetto ai picchi verso il basso smorzati da una sottostima casuale; analogamente, per le mensilità più calde è probabile trovare più picchi verso l'alto enfatizzati da una sovrastima casuale, piuttosto che picchi verso l'alto smorzati da una sottostima casuale. Questo per il motivo che dicevamo prima riguardo il freddo, ma invertendo specularmente la faccenda: se il grafico mostra +5 °C per sovrastima casuale di un grado, significa che il valore reale era +4 °C; se un grafico mostra +4 °C (e quindi il picco del lontano passato rischia di passare relativamente inosservato) per sottostima casuale di un grado, significa che il valore reale era +5 °C. Ma un valore reale di +5 °C e un valore parimenti reale di +4 °C non sono affatto probabilisticamente uguali: è molto più improbabile il primo.
Spero di essermi almeno in parte chiarito.![]()
Sai, ogni frase gira seguendo un'onda che tornerà, perché il mondo è rotondità.
Segnalibri