Sempre parlando di "overfitting" nel contesto OPI vorrei provare a condividere qualche speculazione che mi sono fatto nel corso di questi mesi rileggendo più volte il paper sulla ricerca.
Voglio esemplificare circa questo concetto di "overfitting" rispetto ai dati del campione perchè spesso si usa questo termine in modo improprio e per far compredere a quanti faticano a capire come sia possibile l'esistenza di questo problema in un contesto di analisi numerica in ambito statistico.
Partiamo da un punto fisso. L'OPI è la risultante di due valori, il "grado di ellitticizzazione del VP" e "l'inclinazione dell'asse del VP".
Dal momento che il "grado di ellitticizzazione del VP" è calcolato come anomalia di geopotenziale tra polo, nord asia e nord america, già questo valore contiene intrinsicamente un'informzione relativa all'asse del VP perchè è calcolato in riferimento ad un asse.
L'informazione fornita dal parametro "inclinazione dell'asse del VP" potrebbe essere ininfluente (ed omessa ??) e potrebbe contribuire ad autoadattare il valore OPI ai dati osservati, cioè fungere da mero rettificatore di valori.
Da qui potrebbe nascere un problema di overfitting.
Come vedete ho utilizzato condizionali e dubitativi ma credo che non si possa sottovalutare questo aspetto dell'overfitting e reputo che sia materia di approfondimento nel caso OPI.
Tra l'altro, durante la diretta di ottobre 2013 sulla formazione dell'indice OPI nel corso dei 31 giorni del mese osservavo come il parametro "inclinazione asse del VP" assumeva quasi sempre valore nullo e alla fine, la risultante del valore numerico OPI era fornita quasi esclusivamente dal paramtero "grado di ellitticizzazione".
![]()
[B]Lorenzo Smeraldi : [/B]le migliori idee sono sempre quelle che vengono realizzate
Sì. E c'è anche un'altra questione ancora molto aperta, secondo me. Pochi ne hanno parlato, ma vorrei evidenziare il fatto che tutto l'impianto teorico si basa su un'assunzione analitica prettamente descrittiva che dovrebbe permettere di prevedere un valore numerico fisicamente misurabile quale l'AO. Ora, tralasciando quel che è già stato detto a proposito della natura dinamica, caotica, non lineare di un sistema nel quale i processi stocastici sono prevalenti, elaborare un modello che permetta di rappresentare un fenomeno fisico misurabile (variabile prognostica) richiede che la variabile analitica sia a sua volta una quantità fisica misurabile (variabile diagnostica). Nell'elaborazione dell'OPI, trovo che ci siano un po' troppe assunzioni di natura descrittivo/soggettiva (grado di ellitticizzazione del VP e inclinazione dell'asse del VP ad ottobre) analizzate su corse modellistiche. Ci sta che nell'analisi di parametri predittivi ci possa essere una certa dose di descrizione soggettiva (quando, per es., si considerano localizzazione di pattern delle SST), ma in questo caso la cosa mi pare un po' troppo prevalente. Per es. l'indice SAI di Cohen è una variabile diagnostica osservabile e fisicamente misurabile.
Penso che la cosa possa essere estesa, una sorta di work in progress. Che però cozza fortemente con certe enfasi esponenziali che leggevo a tal proposito lo scorso autunno, ma come dicevo tempo fa io non sono esperto di (e non mi interessa per nulla il) marketing teleconnettivo, per cui non aggiungo altro su questo aspetto della questione.
~~~ Always looking at the sky~~~
Si quoto,
oltre ad un probabile problema di "overfitting" è presente anche il problema che sollevi e in questo caso non c'e' nemmeno bisogno di usare il condizionale.
Considerazione generale ... mi fa molto piacere poter discutere di queste tematiche circa l'OPI con persone che ancora sanno usare la proria testa nel valutare i lavori. E lo dico con tutta sincerità. Non è un caso che ho sollevato la questione overfitting in questo momento, cioè a giochi invernali chiusi, a riflettori spenti, per non alimentare polemiche e sterili critiche. Credo che ora sia il momento giusto per avanzare critiche costruittive, di sostanza e di metodo, non perchè il valore predetto (1,6) è lontano dal valore reale (0,2) anzi, confesso che mi dispiace per questa debacle, ma perchè è giusto cominciare ad approcciare all'OPI in modo serio e quale periodo migliore quando gli animi sui forum meteo si spengono perchè l'inverno è passato ? \as\
Concludo con un pensiero personale. Sono certo che anche Cohen si mostrerà molto critico verso il lavoro sia per la questione overftting sia per la questione da te sollevata. Più i valori di correlazione sono alti più destano sospetto e critiche in ambito accademico perchè in quella sede si è consapevoli dei rischi che si corrono con le correlazioni statistiche. Finchè non si sperimentano sulla propria pelle tali rischi (come capitato spesso a me ad inizio carriera lavorativa in ambito finanziario) nn ci si rende conto di quanto sia duro e faticoso il lavoro del ricercatore e quanto sia controproducente non aprirsi in modo altrettanto costruttivo alle critiche costruttive![]()
[B]Lorenzo Smeraldi : [/B]le migliori idee sono sempre quelle che vengono realizzate
Forse ti è sfuggito?
Incontro sulla meteorologia
Di cosa stai parlando? Magari c'è gente che semplicemente non ha tempo di venire su un forum a rispondere alle "critiche costruttive"... Grazie per i consiglinn ci si rende conto di quanto sia duro e faticoso il lavoro del ricercatore e quanto sia controproducente non aprirsi in modo altrettanto costruttivo alle critiche costruttive![]()
Filippo Casciani membro del CSCT TEAM
No, non mi è sfuggito, anzi mi fa piacere che si parli di OPI in incontri di un certo rilievo.
Stavo semplicemente riflettendo, come ho anche scritto (riflessione personale) che per esperienza personale ho pagato lo scotto di non mostrare attenzione verso le critiche che mi venivano mosse. Fino a quel momento tendevo a sottovalutare l'importanza di muoversi in ambienti in cui si favorisce l'incontro di idee differenti e si stimola la critica costruttiva. Il riferimento era che fino ad oggi, in questo ed altri thread, molti utenti, me compreso, hanno evitato di andare avanti nell'approfondire seriamente le questioni perchè le discussioni erano spesso inquinate dalla presenza costante di disturbatori che mai entravano nel merito e nella sostanza delle questioni e questo fatto, di certo, non ha nemmeno agevolato la vostra presenza ed un'apertura nei confronti di chi critica con cognizione di causa![]()
[B]Lorenzo Smeraldi : [/B]le migliori idee sono sempre quelle che vengono realizzate
Ah, ah, ah ah....ADESSO NON C'E' TEMPO ???........ma come, a Ottobre per fare grancassa hanno/avete riempito di 3d sull'OPI TUTTI I FORUM e BLOG METEO italiani e non solo, E ORA NON C'E' TEMPO di venire a rispondere sui forum ???....ma per favore va, ma almeno abbiate la decenza di non tirare fuori simili scuse assolutamente INESISTENTI.
Sestriere 8/12/14
Fede http://webgis.arpa.piemonte.it/webme...DTOT=001191902
Mi sembra chiaro l'approccio di queste ultime pagine , veramente spettacolari da leggerle per come si sta affrontando l'argomento ( lorenzo, step ecc..): imparzialità, competenza ma sopratutto con molto tatto e rispetto per gli autori tralasciando le polemiche.
Invece si fraintende sempre.
...se nn si è capito, lo dico penso a nome di tutti, se ne continuiamo a parlare non è per occupare mezzora sul forum o per rigirare il coltello nella piaga ma perchè continua a interessarci e capire un "fallimento" può essere un info preziosa - aggiungo, meglio subito il riscontro negativo e non un risultato ambiguo per qualche anno e dopo ko... vi avrebbe fatto solo perdere tempo.
Ecco perchè eviterei certe affermazioni...non l'avrei scritto sul forum ma sn sincero anchio ho pensato ad una risposta simile a quella di Marco
Ah, ah, ah ah....ADESSO NON C'E' TEMPO ???........ma come, a Ottobre per fare grancassa hanno/avete riempito di 3d sull'OPI TUTTI I FORUM e BLOG METEO italiani e non solo, E ORA NON C'E' TEMPO di venire a rispondere sui forum ???....ma per favore va, ma almeno abbiate la decenza di non tirare fuori simili scuse assolutamente INESISTENTI.Forse ti è sfuggito?
Incontro sulla meteorologia
Di cosa stai parlando? Magari c'è gente che semplicemente non ha tempo di venire su un forum a rispondere alle "critiche costruttive"... Grazie per i consigli![]()
Inverno 2016?" Che l' HP si ammali di PRIAPISMO !!"
Cassano M: PET
“Mai discutere con un cretino..dopo 5 min non si capisce + chi sia tra i due”
Segnalibri