n è la numerosità del tuo campione nel tuo caso il numero di osservazioni dal 1957 al 2007. p è il numero dei regressori o, se vuoi, delle variabili dipendenti x, ovvero il numero degli indici teleconnettivi che usi nel tuo modello.
L'obiezione di tormenta è molto pertinente. In effetti un alto numero di regressori ti permette un adattamento molto elevato del modello ai dati. Ciascun singolo regressore può però dare un contributo quasi nullo nella spiegazione della variabile risposta.
Comunque complimenti per l'idea e per la passione e la determinazione con cui la stai perseguendo.
![]()
purtroppo non ho la memoria fresca degli studi di statistica, quindi non mi esprimo sulle obiezioni che avete fatto.
Però ragazzi, come si dice a roma: le chiacchiere stanno a zero.
Il risultato finale è il grafico di pagina 1: indici di correlazione a parte, la sovrapposizione tra le termiche e l'indice è straordinaria comunque.
o forse non ho capito le obiezioni..
Ok, ok con calma...
Cerco di capire leggendo e rileggendo i tuoi post Nivis ma probabilmente il tuo cervellone non può competere con il mio...
Per me state parlando arabo, quindi ti chiedo gentilmente: che cosa sono queste "formule" e che sta a significare quell'indice di -0.90?
Detto cosi mi dice assai poco, ma considera la mia ignoranza in questo campo![]()
Forse mi sono espresso male, ma il mio obiettivo non era certo quello di screditare il risultato ottenuto ad ora, quanto piuttosto spronare al miglioramento della metodologia.
Se Nivis Tempestas si accorgesse che alcuni degli indici teleconnettivi inseriti nell'analisi non contribuissero in maniera significativa alla previsione delle variabili di interesse potrebbe essere il caso di eliminarli, a costo di perdere qualche punto decimale della correlazione da lui calcolata.
Questa eliminazione avrebbe questi due effetti: la relazione tra le altre variabili esplicative e la variabile risposta diverebbe più significativa (e ciò avrebbe un riflesso immediato sui coefficienti di queste) e paradossalmente il valore di R^2 adjusted potrebbe migliorare.
![]()
PhD in Polar Sciences - Il mio libro su Amazon: L'apocalisse climatica del 536
Estremi termici dal 1774: -18.6° (1985) / +38.1° (2003)
Il mio sito e la mia stazione meteo: http://meteopsn.altervista.org/index.html
In sintesi: le formule di cui parlo permettono di prevedere con un medio-alto grado di precisione (-0.90 e' l'indice di correlazione che va da -1 a 1, tale per cui in 0 non c'e' nessuna correlazione mentre piu' ci si avvicina a -1 o 1 piu' la correlazione e' alta, inversa e diretta rispettivamente) l'andamento termico e pluviometrico della mia citta' sulla base degli indici climatici di settembre, e ora sto cercando il modo di estendere il modello a tutta l'Italia.
Non ero a conoscenza del R^2 adjusted (del resto non ho fatto gran che di statistica) ma effettivamente alcuni regressori potrebbero portare un contributo piuttosto scarso, come dite.
![]()
PhD in Polar Sciences - Il mio libro su Amazon: L'apocalisse climatica del 536
Estremi termici dal 1774: -18.6° (1985) / +38.1° (2003)
Il mio sito e la mia stazione meteo: http://meteopsn.altervista.org/index.html
Scusate se non ho risposto prima.
Ho dato l'input non per giudicare il lavoro fatto ma per aiutare ad ottenere qualcosa che forse è molto buono, e cioè gli studi postati da Nivis e da Stellon che mi sembrano molto robusti come idee ma un pò deficitari in rigore statistico tutto qui.
Il coefficiente di correlazione serve per determinare e scoprire se esiste una relazione lineare tra due variabili, in questo caso la variabile empirica (i dati osservati) con quelli predetti, benissimo. E' naturale che, poichè le formule a quanto mi pare di capire non sono altro che una Multiple Linear Regression, ossia una Regressione Lineare a più Variabili, e poichè i coefficienti ricavati non sono altro che quelli che minimizzano gli scarti, che ci sia una corrispondenza lineare, sempre più alta all'aumentare del numero dei predictors. I valori proposti misurano il grado di correlazione quindi, ma non la bontà del modello. I valori proposti devo dire sono comunque molto buoni ma....quello che serve ora è andare ad uno step successivo dello studio. Per quantificare quanto realmente sia efficace il modello lineare, e cioè quanto sia in grado di prevedere con il minimo scarto le temperature e le precipitazioni di Padova. Nei metodi statistici correntemente usati si applica il coefficiente di determinazione R^2 che restituisce il valore della varianza spiegata dal modello (il grado di informazione in essa contenuta e che è possibile ottenere dal modello).
Questo coefficiente è però influenzato dal numero dei predittori, così si usa la formula che ha postato prima Nivis.
Questo è R^2.
Allego un PDF di una delle Lectures di un corso che ho seguito in Polonia lo scorso Giugno, spero sia d'aiuto anche se può sembrare un pò complicato, ma è molto completo.
Ciao
Stazione meteo Sacrofano (Roma)http://nuovosalario.altervista.org/C...antage_Pro.htm
Paolo, www.centrometeoitaliano.it
se la tua equazione è ottenuta come una regressione lineare a più variabili il valore che ne esce ha un significato diverso da quello che intendi. Esso infatti come detto sopra non restituisce il grado di predittabilità del modello ma la correlazione (andamento lineare tra le due variabili) tra il valore predetto e quello osservato. E' logico che poichè il modello tende a linearizzare il valore predetto su quello osservato avrai sempre (o quasi) un valore alto.
![]()
Stazione meteo Sacrofano (Roma)http://nuovosalario.altervista.org/C...antage_Pro.htm
Paolo, www.centrometeoitaliano.it
Bisognerebbe utilizzare metodologie di analisi multivariata per capire il "peso" di ogni variabile così da scartare quelle poco significative.![]()
Davis Vantage Pro2 wireless. LaCrosse WS 2300 cablata con schermo artigianale autoventilabile.
"L'uomo non ha avuto il mondo in regalo dai suoi genitori, lo ha avuto in prestito dai propri figli"
Stazione meteo Sacrofano (Roma)http://nuovosalario.altervista.org/C...antage_Pro.htm
Paolo, www.centrometeoitaliano.it
Segnalibri