
Originariamente Scritto da
CausaEffetto
Provo a chiarire qualche dubbio partendo da qualche tua considerazione che riporto:
Per 90° percentile si intende la soglia al di sotto della quale sono presenti il 90% dei dati e al di sopra della quale sono presenti il 10% dei dati. Tale soglia è espressione della coda superiore (calda) della distribuzione dei dati termici.
Per 10° percentile si intende la soglia al di sotto della quale sono presenti il 10% dei dati e al di sopra della quale sono presenti il 90% dei dati. Tale soglia è espressione della coda inferiore (fredda) della distribuzione dei dati termici.
Per questo motivo superare tale soglia, in senso estremo (valori maggiori al 90° percentile e inferiori al 10° percentile), ha una probabilità teorica del 10%.
Tornando all'esempio della stagione estiva ed alla soglia dei 35° tale valore nel periodo 1981-2010 è stato superato 257 volte su 2760 osservazioni (92 osservazioni giornaliere per 30 anni). Frequenza di superamento = 9,3%, differente dal 10% che ci si attenderebbe per il fatto che i dati vengono arrotondati al decimo di grado durante le osservazioni e durante il calcolo del percentile.
E' preferibile il metodo dei percentili per diversi aspetti:
- l'estremo stagionale soffre maggiormente rispetto ad una soglia percentile estrema di sovrastime e/o sottostime della strumentazione nel corso del tempo o di una sua sostituzione o allocazione geografica differente;
- la mediazione dei valori estremi stagionali soffrirebbe comunque di queste eventuali stime e sovrastime in quanto la caratteristica della media è proprio quella di essere influenzata da eventuali outlier;
- lavorare sui valori estremi stagionali significa analizzare un dato di cui non si conosce a priori la probabilità empirica di accadimento mentre la soglia percentile contiene intrensicamente questo livello empirico di probabilità;
- lavorare esclusivamente sui valori estremi significa non considerare il peso dei restanti valori caratterizzanti la distribuzione delle osservazioni;
- il range di normalità climatica sulla distribuzione dei dati delle code estreme non ha senso statisticamente. Esempio per comprendere. ipotizziamo una media di valori estremi stagionali di 36° ed un sigma di 1°. Il range sarebbe 35 - 37. Non ha significato statistico e climatologico un range a due code in quanto a noi interessa solo il superamento nel verso dell'estremità, in questo caso da 36° in su.
Infine, per poter dissolvere qualche dubbio, qualche considerazione che anticipa futuri post relativamente all'analisi delle soglie estreme.
Superare i 35° in estate è normale o anomalo? Molto semplicisticamente vedremo che se lo supero 8-9 volte (10% circa di 92 osservazioni giornaliere) di in una stagione è normalissimo. E se le supero 8-9 volte consecutivamente? e se non lo supero mai? e se lo supero 50 volte? a queste domande posso fornire una risposta perchè utilizzando la soglia percentile conosco il peso di questo valore rispetto all'intera distribuzione dei dati.

Segnalibri