Allora per quel che riguarda il primo punto è mio intento verificare attraverso l'analisi statistica se esiste o meno una correlazione tra un eventuale cambiamento climatico (delle temperature e/o delle piogge) e la vita (in termini di anni di apertura) delle industrie, ma non so come fare.
Il fatto di non riuscire a trovare un modello mi può portare ad affermare che non esiste correlazione?
Per quanto riguarda l'aspetto dell'analisi descrittiva mi chiedevo ma la media e la deviazione standard va fatta mese per mese? O stagionale?
Ammesso che sia presente un cambiamento climatico, dal momento che mi sembra di capire che il tutto sia vincolato al test di quell'ipotesi, si potrebbe provare a verificare se esiste correlazione tra il delta della temperatura / pioggia ed il delta della vita dell'attività industriale.
Devi calcolare la media e la deviazione standard dei valori che compongono il blocco trentennale. Vedi l'esempio che ti allego in riferimento ad un blocco trentennale composto dalla temperatura media giornaliera annuale.
[B]Lorenzo Smeraldi : [/B]le migliori idee sono sempre quelle che vengono realizzate
Mi scuso per l'insistenza ma facendo come mi ha detto ottengo per il trentennio di riferimento media=20.4 e deviazione standard=0.4676 mentre per il secondo trentennio (quello attuale) media=20.8 e deviazione standard=1.13581. Concludo che non esiste cambiamento climatico?
Su quale base concluderesti che non esiste cambiamento climatico? Quello è il punto di partenza ... adesso bisogna tradurre il problema reale in problema statistico cioè effettuare un test che ci metta nella condizione di poter affermare in termini probabilsitici che è presente o meno un cambiamento climatico.
P.S.: prova a verificare i valori delle deviazioni standard perchè a naso mi sembra che l'incremento sia piuttosto elevato. Hai calcolato le medie e deviazioni standard della tempartura annuale o di una determinata stagione o di un determinato mese? Entrambi i blocchi sono formati da 30 valori?
[B]Lorenzo Smeraldi : [/B]le migliori idee sono sempre quelle che vengono realizzate
Ops! Va bene lo stesso se i due blocchi sono da 29 elementi?
un'altra domanda il test di ipotesi come va impostato? cioè nella mia ipotesi nulla io devo mettere media(del secondo blocco) >= quella calcolata??? e a questo punto il confronto con il primo trentennio in che termini va fatto per concludere se esiste o meno questo ipotizzato cambiamento?
Può anche andare bene un blocco di 29 elementi anche perchè secondo me dovrai valutare questo aspetto poiché non è detto che un probelma del tuo tipo si risolva mantenendo la convenzione trentennale ... mi spiego meglio. Se la durata media dell'attività industriale è 15 anni mi importa relativamente di un cambiamento climatico che interviene in seno a 30 o più anni. Potrebbe interessarmi di valutare un cambiamento su archi temporali più ristretti.
Tornando al test, l'ipotesi nulla io la imposto sempre Media1 = Media2
Adesso devo staccare ... vedo di prepararti un esempio.
[B]Lorenzo Smeraldi : [/B]le migliori idee sono sempre quelle che vengono realizzate
Dammi pure del "tu" Roberta ...
- Calcolo media e sigma campionari, in questo caso di due campioni, il clima 1951-1980 (media1 = 13,6 °C; sigma1 = 0,45 °C) ed il clima 1981-2010 (media2 = 14,4 °C; sigma2 = 0,74 °C), con n = 30
- Formulo l'ipotesi nulla: media1 = media2 "equivalente a" media1 - media2 = 0
- Fisso il valore di alfa = 5% = 0,05
- Valuto le code del test: due
- Calcolo la statistica test : z = (13,6 – 14,4) / 0,158124 = -5,05931
- P-value = 4,208e-007 < 0,05
- Rifiuto l'ipotesi nulla cioè i campioni appartengono a popolazioni differenti cioè siamo in presenza di un cambiamento climatico
Alcune veloci considerazioni ... il valore di alfa stabilito mi sembra coerente con il grado di rischio che si vuole correre nel rifiutare l'ipotesi nulla. Ho proposto l'utilizzo della statistica Z in quanto le popolazioni presentano distribuzione normale sia in riferimento alla temperatura sia in riferimento alla precipitazione cumulata. Inoltre essendo in presenza di grandi campioni (n >= 30) le varianze incognite delle popolazioni sono sostituite con le varianze campionarie pertanto il valore a denominatore della statistica Z (0,158124) è il risultato della radice quadrata della sommatoria dei rapporti fra varianza campionaria e n=30. Infine, l'assunzione è che le varianze delle popolazioni di riferimento siano differenti e che i campioni siano indipendenti, non accoppiati.
Questo è quanto propongo a titolo di esempio poi valuta tu se le assunzioni che ho fatto nell'eseguire il test siano contestabili sotto certi punti di vista. Non sono uno statistico pertanto prendi questo esempio esclusivamente come spunto di lavoro da condurre successivamente con il dovuto rigore richiesto nella ricerca che stai eseguendo.
[B]Lorenzo Smeraldi : [/B]le migliori idee sono sempre quelle che vengono realizzate
Segnalibri