Ciao Roberta,
per quanto riguarda la questione della correlazione devo pensarci ed avrei bisogno di maggior dettagli in merito. Qual'è l'ipotesi di partenza? In che senso devi mettere in correlazione ... mi spiego ... non è che puoi forzare una correlazione, o è presente o non è presente.
Per verificare la presenza o meno di un cambiamento climatico spero di poterti suggerire qualcosa di interessante. Personalmente inizierei col calcolarmi dei blocchi trentennali (o ventennali) dei dati che hai a disposizione e ne calcolerei la media e la deviazione standard, cioè calcolerei i parametri di differenti climi di riferimento. Ipotizzando che questi blocchi trentennali rappresentino dei campioni statistici di un clima reale, attraverso un test statistico verificherei l'appartenenza o meno ad una stessa popolazione di riferimento, il clima reale per l'appunto.
[B]Lorenzo Smeraldi : [/B]le migliori idee sono sempre quelle che vengono realizzate
Allora per quel che riguarda il primo punto è mio intento verificare attraverso l'analisi statistica se esiste o meno una correlazione tra un eventuale cambiamento climatico (delle temperature e/o delle piogge) e la vita (in termini di anni di apertura) delle industrie, ma non so come fare.
Il fatto di non riuscire a trovare un modello mi può portare ad affermare che non esiste correlazione?
Per quanto riguarda l'aspetto dell'analisi descrittiva mi chiedevo ma la media e la deviazione standard va fatta mese per mese? O stagionale?
Ammesso che sia presente un cambiamento climatico, dal momento che mi sembra di capire che il tutto sia vincolato al test di quell'ipotesi, si potrebbe provare a verificare se esiste correlazione tra il delta della temperatura / pioggia ed il delta della vita dell'attività industriale.
Devi calcolare la media e la deviazione standard dei valori che compongono il blocco trentennale. Vedi l'esempio che ti allego in riferimento ad un blocco trentennale composto dalla temperatura media giornaliera annuale.
[B]Lorenzo Smeraldi : [/B]le migliori idee sono sempre quelle che vengono realizzate
Dammi pure del "tu" Roberta ...
- Calcolo media e sigma campionari, in questo caso di due campioni, il clima 1951-1980 (media1 = 13,6 °C; sigma1 = 0,45 °C) ed il clima 1981-2010 (media2 = 14,4 °C; sigma2 = 0,74 °C), con n = 30
- Formulo l'ipotesi nulla: media1 = media2 "equivalente a" media1 - media2 = 0
- Fisso il valore di alfa = 5% = 0,05
- Valuto le code del test: due
- Calcolo la statistica test : z = (13,6 – 14,4) / 0,158124 = -5,05931
- P-value = 4,208e-007 < 0,05
- Rifiuto l'ipotesi nulla cioè i campioni appartengono a popolazioni differenti cioè siamo in presenza di un cambiamento climatico
Alcune veloci considerazioni ... il valore di alfa stabilito mi sembra coerente con il grado di rischio che si vuole correre nel rifiutare l'ipotesi nulla. Ho proposto l'utilizzo della statistica Z in quanto le popolazioni presentano distribuzione normale sia in riferimento alla temperatura sia in riferimento alla precipitazione cumulata. Inoltre essendo in presenza di grandi campioni (n >= 30) le varianze incognite delle popolazioni sono sostituite con le varianze campionarie pertanto il valore a denominatore della statistica Z (0,158124) è il risultato della radice quadrata della sommatoria dei rapporti fra varianza campionaria e n=30. Infine, l'assunzione è che le varianze delle popolazioni di riferimento siano differenti e che i campioni siano indipendenti, non accoppiati.
Questo è quanto propongo a titolo di esempio poi valuta tu se le assunzioni che ho fatto nell'eseguire il test siano contestabili sotto certi punti di vista. Non sono uno statistico pertanto prendi questo esempio esclusivamente come spunto di lavoro da condurre successivamente con il dovuto rigore richiesto nella ricerca che stai eseguendo.
[B]Lorenzo Smeraldi : [/B]le migliori idee sono sempre quelle che vengono realizzate
Rieccomi, scusami se non ho risposto all'ultimo messaggio ma sono stata impegnata con un altro esame.
Ho ripreso la mia analisi statistica realizzando che non v è stato alcun cambiamento climatico ne nelle temperature massime ne nei mm di pioggia. Ti sembra verosimile una tale conclusione?
Come ti sembra l'idea di procedere con un'analoga analisi mese per mese (pensavo che a pari temperatura media in realtà ci potrebbero essere estati più calde e inverni più freddi).
Ancora grazie, Roberta\fp\
Difficile dare un parere senza aver alcun dato alla mano e senza avere a disposizione i test che hai condotto ...
Come ti anticipavo qualche post indietro è sensato dover riflettere sulla lunghezza dei campioni climatici di riferimento e sulla frequenz<a di osservazione (stagionale, annuale, ecc...). Da quello che ho capito, per la tua analisi potrebbere essere significativa anche una variazione climatica su base pluriennale di più corta durata rispetto al trentennio (oscillazione ciclica? ) o addirittura di anno in anno in quanto potrebbe essere sensato analizzare la risposta del tessuto economico in funzione della variabilità climatica e non del cambiamento climatico.
Ciao.
[B]Lorenzo Smeraldi : [/B]le migliori idee sono sempre quelle che vengono realizzate
Sono ancora io, spero che sia l'ultima volta che ti disturbo....ho fatto i test di ipotesi sulle temperature minime annuali considerando i due trentenni cioè impostando come ipotesi nulla l'uguaglianza delle medie dei due trentenni...mi risulta un p value del 2% e quindi ad un livello di significatività del 5 % io posso parlare di cambiamento climatico....a questo punto ha senso mettere, secondo te, in correlazione le temperature minime del secondo trentennio (che è quello dell'industrializzazione) con gli anni di apertura e chiusura delle industrie?? e quindi dire attraverso per esempio r^quadro se la regressione è significativa oppure no?
GRAZIE
Ultima modifica di robertaxx3; 11/07/2012 alle 10:33
Secondo me no ... in questo caso metteresti in relazione il fatto che faccia caldo o freddo con l'attività industriale ma non il fatto che faccia più/meno caldo o più /meno freddo, cioè ometteresti il legame con il cambiamento climatico.
(Come ti anticipavo in interventi precedenti ... ti interessa il cambiamento climatico o la variabilità climatica?)
Così analizzeresti la risposta (a lag nullo, altro aspetto che forse dovresti considerare ... cioè la risposta è istantanea o avviene con un certo ritardo?) dell'industria alla variabilità climatica non alla variazione climatica.
Ti avevo anche suggerito di valutare il fatto di svincolarti dalla definizione di clima basata sui 30 anni perchè nel tuo contesto potrebbe essere sensato valutare una variazione di durata inferiore (ad esempio decennale) che assume comunque un significato differente rispetto alla variabilità cioè considerando poi solo i confronti fra decenni che hanno messo in luce un cambiamento significativo (tramite solito test statistico). Sottolineo il termine "confronto" perchè secondo me devi mettere in relazione queste variazioni con quelle dell'industria. Utilizzare i trentenni significa avere a disposizione più di una coppia di trentenni altrimenti come fai a verificare la validità dell'assunto in riferimento ad un unico cambiamento climatico (confronto fra due trentenni)?
Se invece il problema è rivolto esclusivamente ad un determinato periodo storico in cui è intervenuto un solo cambiamento climatico (cioè ti interessa testare la risposta a quel determinato cambiamento climatico o più in generale in presenza di un cambiamento climatico qualsiasi, indipendentmente dal periodo storico?) secondo me il problema si modifica leggermente ed occorre valutare la significatività del trend della temperatura e dell'industria in seno a quel periodo storico.
Questi sono gli spunti che mi sento di dare sempre premesso che mi sto muovendo un po' alla cieca non avendo nulla di tangibile sottomano.
Un'ultima precisazione ... hai parlato di r^2 della regressione ... attenzione a non confondere r^2 della correlazione con R^2 della regressione lineare perché secondo me a te interessa r^2 della correlazione cioè verificare se la correlazione c'e' o non c'e'. ipotizzare sucessivamente (eventualmente) un modello di regressione lineare fra i dati significa poi assumere che esiste una relazione di causa-effetto fra quei dati ...
[B]Lorenzo Smeraldi : [/B]le migliori idee sono sempre quelle che vengono realizzate
Capisco quello che dici...se non ti spiace io farei un punto della situazione di come ho inteso ciò che tu mi hai detto e come poi ho proceduto giusto per spiegarmi meglio ed essere sicuri che parliamo della stessa cosa. sono date le popolazioni delle temperature minime tra il 1931 e il 1991 con solo questi dati l'obiettivo della mia analisi statistica è quello di determinare se esiste cambiamento climatico e in questo caso se esso può essere messo in relazione con l'apertura e la chiusura delle industrie (considerate nel caso di una eventuale regressione come predittori categorici).
l'analisi l'ho impostata in questo modo : ho considerato il 1931 -1961 come periodo di riferimento e l'ho quindi confrontato con 1961-1991 (anche in virtù del fatto che questi 30 coincidevano proprio con il periodo di apertura delle industrie). il test sulla media mi ha rivelato che le due medie sono diverse....a questo punto anche secondo me come tu dici la regressione considerando le temperature come y non ha senso....ma posso considerare il cambiamento come temperatura dei vari anni (1991-1961) meno il valore medio della popolazione di riferimento (1931-1961) e quindi cercare di trovare se esiste una correlazione di questi con i predittori?
Scusa l'insistenza e soprattutto l'ignoranza in materia. Ammetto di essermi addentrata in un campo di cui non ho competenza ma purtroppo avevo questi dati disponibili e a me serve giusto un 'analisi statistica.
Stavo pensando che forse questo metodo di utilizzo degli scarti possa risultare più efficace:
Giugno 2012:anomalie termiche e pluviometriche
mio post n.122
In sostanza propongo di utilizzare gli scarti in riferimento ad un periodo di riferimento mobile. Nel tuo caso si potrebbe fare la media dei decenni:
1931-1940
1941-1950
1951-1960
1961-1970
1971-1980
1981-1990
e fare gli scarti
1951 - media (1931-1940)
1952 - media (1931-1940)
.
.
1960 - media (1931-1940)
1961 - media (1941-1950)
.
.
ecc.
[B]Lorenzo Smeraldi : [/B]le migliori idee sono sempre quelle che vengono realizzate
Segnalibri