giusta osservazione. Infatti l'approccio statistico di una distribuzione dati deve tenere conto di altri parametri oltre la media soprattutto quando questi contemplano spesso valori nulli.
Si dovrebbe calcolare sia la deviazione standard ma soprattutto i quartili della distribuzione disponendo i dati in ordine crescente (25% dei dati per ciascun quartile), con la mediana che rappresenta quello principale; come valori attesi si deve considerare l'intervallo compreso tra il primo ed il terzo quartile.
Vedere posts di Lorenzo (CausaEffetto) nel thread nazionale delle anomale di Settembre.
Meteosfera
Reti: MNW - WU - Sup.
"Colui che segue la folla non andrà mai più lontano della folla. Colui che va da solo sarà più probabile che si troverà in luoghi dove nessuno è mai arrivato" (Albert Einstein)
Riporto qualche definizione (media lo darei per scontato):
deviazione standard: radice quadrata della varianza, ovvero della media quadratica degli scarti (sommatoria degli scarti al quadrato diviso il numero dei valori);
mediana: in una serie di valori ordinati in modo crescente, è il dato centrale se il numero di questi valori è dispari; la media dei due valori centrali se il numero dei valori è pari.
quartile: ciascuna mediana corrispondente alla suddivisione di una serie di dati in 4 parti, sempre ordinati in senso crescente.
Il quartile 0 (Q0) rappresenta il primo dato, Q1 è la mediana della serie compresa nel primo 50%, Q2 la mediana del blocco compreso tra il 25 ed il 75%, Q3 la mediana della serie tra il 50 ed il 100%, Q4 l'ultimo dato.
Allora in una distribuzione di dati si può considerare sia l'intervallo compreso tra la media e la deviazione standard ma anche quello compreso tra Q1 e Q3, con Q2 che rappresenta anche la mediana dell'intera serie di dati.
Quest'ultimo approccio è utile soprattutto quando si hanno diversi dati nulli o comunque molta variabilità tra essi.
Esempio banale di una distruibuzione di 10 dati:
0 0 0 3 12 22 31 45 90 110
Media 31.3
Dev. standard: 39.48 (supera addirittura la media e l'estremo inferiore è negativo, quindi senza significato);
intervallo di valori attesi: -8.18 < 31.3 < 70.78
Quartili:
Q0 = 0; Q1 = 0,75; Q2 = 17; Q3 = 41,5; Q4 = 110.
intervallo di valori attesi: 0.75 < 17 < 41.5
Quest'ultimo approccio come si può vedere è più lineare ed accettabile del primo, in questo caso.
Spero di essere stato chiaro.
ps. corretto.
Ultima modifica di Stefano83; 04/09/2013 alle 18:10
Meteosfera
Reti: MNW - WU - Sup.
"Colui che segue la folla non andrà mai più lontano della folla. Colui che va da solo sarà più probabile che si troverà in luoghi dove nessuno è mai arrivato" (Albert Einstein)
Il concetto di media è chiaro, ma non ho capito perchè il discorso va applicato solo ai mesi estivi e non a qualsiasi mese dell'anno
Le medie che riguardano il mio paese, sono calcolate sulla base dei dati degli archivi presenti dal 1916
Per esempio nel mese più secco, che è luglio, ci sono diverse annate con valori pari a 0 mm o simili e altre con magari un unico evento da 80 mm
Ciò non toglie che comunque dal 1916 al 2013 la media è comunque 16 mm
Stesso discorso si può applicare ad un qualsiasi mese dell'anno
Se nel Dicembre 1985 sono caduti solo 3 mm, o nel Dicembre 1950 sono caduti 350 mm, la media secolare del mese rimane sempre 205 mm
le medie sono quelle, in effetti la matematica non è un opinione.
Il discorso di Franko era centrato sul fatto che in estate le pioggie non sono costanti, e ogni estate ha un andamento a sè.
Nelle altre stagioni può piovere di meno o di più, ma la forbice non è molto ampia.
Per dire; chiudere un dicembre a 0mm non è cosa usuale, al contrario di Giugno-Luglio-Agosto.
Esempio
dati luglio in 9 anni: 0,15,0,45,5,90,0,5,120.. (uscirà una media 31mm ma in nessun anno sono stato in media)
dati dicembre in 9 anni: 50,70,81,130,60,75,95,55,100 (media 80mm accostata in più annate)
Segnalibri