
Originariamente Scritto da
snowaholic
Io su questo invece ritengo più affidabile la serie intera, proprio perché stiamo facendo regressioni lineari su una serie fortemente autocorrelata e con problemi di collinearità allungare il periodo dovrebbe portare a stime meno distorte, anche perché consente di stimare meglio le variabili che hanno andamento ciclico ed evitare problemi accidentali di collinearità presenti nei sottoperiodi.
Inoltre la CO2 ha poca variabilità fino al 1950 e la varianza della stima dei coefficienti è inversamente proporzionale alla variabilità della variabile esplicativa, non si può sperare di avere una buona stima della CO2 usando solo quel periodo. Qui non c'è un problema di overfitting, si usa una serie lunga con poche variabili, il problema è l'autocorrelazione e il rischio di correlazioni spurie.
Sarebbe interessante vedere in termini di previsione quanta differenza emerge nei prossimi anni, con l'aggiunta di nuovi dati in cui le principali variabili dovrebbero muoversi in direzioni opposte si dovrebbe aprire un divario notevole tra le varie ipotesi, che quindi risulterebbero testabili in tempi relativamente brevi (5-10 anni).
Segnalibri