Il mio ragionamento è che se la nostra variabile dipendente è il tasso di denuncia/chiamata in giudizio o quel che è, e questo tasso è il numero di eventi "favorevoli" (diciamo così) diviso per la popolazione, a noi interessa una grandezza latente data dalla propensione alla corruzione, che possiamo identificare nella probabilità che un soggetto della popolazione sia corrotto (uso parole grosse per semplificare ma magari sono cause banali per assenteismo che anziché gettare una macchia sugli enti locali farebbero invece onore ai dirigenti e/o ai politici che fanno le denuncia, spero che questo sia chiaro a chi ci legge). Ora, la popolazione non è la grandezza su popolazione che ci interessa: è "fissa" e la conosciamo già. Quello che ci interessa è la probabilità, che ci richiede di dividere per la popolazione, appunto i 126000. Se in un territorio dato con una popolazione data vogliamo stimare la proporzione di qualcosa, la popolazione è quella e quel che conta è il numero di "successi". Sotto ripetuto campionamento, 126000 rimane quello e ciò che varierà è il numero di casi favorevoli (denunce della corte).
Ho paura di non essermi molto spiegato, in questioni di teoria della probabilità oimè sono abbastanza arrugginito![]()
Ultima modifica di Borat; 19/02/2010 alle 17:37
Va bene, ci ho pensato un po' ma vedo che non riesco io stesso a chiarirmi la questione più di così, per cui mi arrendo all'evidenza di essere rimba (e all'esigenza di riprendere in mano qualche libro di statistica teorica, perché ormai parametro non so neanche più come si scriva).
Posto ancora un paio di tabelline, basate su semplici raggruppamenti secondo criteri comuni e criteri Istat degli stessi dati.
I dati di partenza sono questi. Nelle colonne a destra si vedono le classificazioni extra che ho aggiunto. Notare la collocazione del Lazio nel Centro. A mio avviso il Lazio è fisicamente Centro e lo metto lì. Secondo alcuni il Lazio è Sud e mi tirerebbero le orecchie. Ma non importa, ho finito gli esami da un bel po' di anni e me ne infischio, faccio come voglio io. Invece ho dubbi sulla collocazione dell'Emilia Romagna nell'NE quando si distingue tra NO e NE. La cosa è complicata. Boh, fanno tutti così, non ho un'opinione mia, per cui non ho nessuna ragione di infischiarmene di un parere altrui e colloco l'Emilia Romagna nel NE.
Ora una semplice tabulazione Nord-Centro-Sud:Codice:Regione Casi Tasso Pop Area3 Area5 Area3_2 --------------------------------------------------------------------------- Lombardia 75 7.8 9642406 Nord NO N Liguria 23 14.3 1609822 Nord NO N Val d'Aosta 5 39.7 125979 Nord NO AO-BZ-TN Piemonte 44 10 4401266 Nord NO N P.A. Bolzano 18 36.1 498857 Nord NE AO-BZ-TN Emilia-Romagna 28 6.5 4275802 Nord NE N Friuli-Venezia Giulia 15 12.3 1222061 Nord NE N Veneto 30 6.2 4832340 Nord NE N P.A. Trento 30 57.7 519800 Nord NE AO-BZ-TN Marche 16 10.3 1553063 Centro Centro C Toscana 79 21.5 3677048 Centro Centro C Umbria 44 49.7 884450 Centro Centro C Abruzzo 21 15.9 1323987 Centro Centro C Lazio 159 28.6 5561017 Centro Centro C Puglia 65 15.9 4076546 Sud Sud S Calabria 133 66.2 2007707 Sud Sud S Molise 20 62.3 320838 Sud Sud S Basilicata 32 54.1 591001 Sud Sud S Campania 123 21.2 5811390 Sud Sud S Sardegna 35 21 1665617 Sud Isole S Sicilia 127 25.3 5029683 Sud Isole S
che, per chi studia scienze politiche o sociali e vuole tenersi su posizioni culturaliste sembra corroborare fortemente la tesi putnamiana/banfieldiana delle tre italie e del familismo amorale ecc ecc, poi una tabellina con la classificazione a 5 aree:Codice:area3 Tasso ------------------ Nord 9.9 Centro 24.5 Sud 27.4 ------------------ Media 18.8 ------------------
che non so come commentare perché non sono molto interessato alle differenze tra NO e NE (salvo nelle questioni climatiche).Codice:area5 Tasso ------------------ NO 9.3 NE 10.6 Centro 24.5 Sud 29.1 Isole 24.2 ------------------ Media 18.8 ------------------
Poi, in post precedenti è stato osservato che sono altini i tassi di Bolzano, Trento e Aosta e sono state avanzate delle ipotesi per spiegarlo. Proviamo allora a rifare la tabella sopra (a 3 ripartizioni) trattando però a parte Aosta, Bolzano e Trento.
Com'è ovvio rimangono inalterati i tassi di Centro e Sud, cala un po' quello del Nord, ma si evidenzia un aspetto che le teorie culturaliste non sono in grado di spiegare. Non solo si vede che in piccole e coese comunità del Nord tenute unite da identità condivise ci sono più casi che al Sud, ma viene forte il sospetto che fattori strutturali/istituzionali come la potestà sugli enti locali (cioè un aspetto giuridico e istituzionale, non culturale) possano influire, e che il tutto non dipenda solo dal familismo amorale delle teorie di mio nonno (Banfiel,Putnam ecc ecc), ma che la gente freghi dove ha le cose da fregare a porta di mano, e se metti l'allarme e il filo spinato non frega più. Interessante anche che NO e NE, che nei luoghi comuni dei sociologi della domenica sono tristi realtà metropolitane o semi-metropolitane dove lo spirito della comunità e morto e quindi ci si scatena nelle ruberie, esibiscano tassi quasi 6 volte inferiori appunto ai paradisi bucolici della montagna vip.Codice:area3_2 Tasso -------------------- N 8.3 AO-BZ-TN 46.3 C 24.5 S 27.4 -------------------- Media 18.8 --------------------
Comincio a sospettare che i libri di Putnam e Banfield che ho letto siano pieni di stronzate.
Ultima modifica di Borat; 19/02/2010 alle 19:01
Lo trovi in quasi tutti i bar: sigarette e caffé si trovano ovunque.
Cmq non sono proprio temi innovativi quelli che sto commentando. Prova a mettere in google Putnam (robert d. putnam - Cerca con Google) oppure familismo amorale (familismo amorale - Cerca con Google) e vedi il macello di risultati che escono.
Aggiungo una tabella dimenticata ieri, quella con le 5 ripartizioni con AO-BZ-TN trattati a parte.
In versione grafica:Codice:area5_2 mean -------------------- NO 9.1 NE 7.0 Centro 24.5 Sud 29.1 Isole 24.2 AO-BZ-TN 46.3 -------------------- Media 18.8 --------------------
C'è un aspetto su cui ho rimuginato stanotte. Per esperienza personale, nei capoluoghi delle province autonome è abbastanza difficile vedere qualcuno che getta a terra l'incarto di un chewingum. Nelle condotte dotate di visibilità e sanzionabilità pubbliche a mio avviso esiste veramente un elevato livello di civismo in quelle zone. Questo è accuratamente previsto dalle tesi culturaliste. Una posizione culturalista non può spiegare gli elevati tassi di contestazione per danno erariale/corruzione nelle aree civiche del Nord, ma una tesi non-culturalista non può spiegare perché a Bolzano non si buttino le cicche perterra. La cosa non mi è chiara. Potrebbe essere un mix di aspetti culturali e istituzionali o potrebbero esserci logiche differenti che governano da un lato il civismo del cittadino comune e dall'altro il comportamento dell'amministratore pubblico.![]()
Ultima modifica di Borat; 20/02/2010 alle 12:07
Forse c'è un "costo fisso", cioè un certo numero di casi di corruzione ci sono sempre, che incide maggiormente dunque sulle regioni con minore popolazione.
Solofilo - freddofilo e seccofilo in inverno, caldofilo e variabilofolo in primavera, caldofilo e seccofilo in estate, tiepidofilo e variabilofilo in autunno - mi piacciono 6 ore di sole dopo 1 ora di temporale, o le giornate secche ed anticicloniche invernali dopo 1 giorno di neve fitta
E perché dovrebbe essere invariante fra le regioni penalizzando quelle con poca popolazione?
Si potrebbe sostenere che è l'amministrazione regionale, una per regione e presente sia nelle regioni da molti milioni di abitanti sia nelle regioni da 126.000 abitanti. Sarebbe compatibile con il relativamente alto tasso del Molise.
Solo che le regioni da molti milioni di abitanti (Lombardia, Sicilia) tendono anche ad avere numerose province, ciascuna delle quali ha competenze da leccarsi le dita (ambiente, acqua, rifiuti, edilizia scolastica, non so che cos'altro) e un seppur limitato numero di dipendenti con cui sbizzarrirsi in clientelismi ecc, poi il giro delle "consulenze" e via sguazzando.
Si può provare un modello linare generalizzato di regressione di Poisson con variabile dipendente il numero di casi (exposure la popolazione) e variabili indipendenti tre dummy (1-Centro, 2-Sud, 3-AO-BZ-TN) e il numero di province.
Questo dovrebbe permettere di espungere gli effetti delle province. Forse.
Eccolo
Codice:. poisson casi centro sud aobztn province, exposure(pop) Iteration 0: log likelihood = -142.47373 Iteration 1: log likelihood = -142.30798 Iteration 2: log likelihood = -142.30794 Iteration 3: log likelihood = -142.30794 Poisson regression Number of obs = 21 LR chi2(4) = 342.70 Prob > chi2 = 0.0000 Log likelihood = -142.30794 Pseudo R2 = 0.5463 ------------------------------------------------------------------------------ casi | Coef. Std. Err. z P>|z| [95% Conf. Interval] -------------+---------------------------------------------------------------- centro | .8807774 .0964534 9.13 0.000 .6917323 1.069823 sud | 1.016618 .0872777 11.65 0.000 .8455571 1.18768 aobztn | 1.167077 .184621 6.32 0.000 .8052265 1.528927 province | -.0713892 .0136746 -5.22 0.000 -.0981909 -.0445875 _cons | -11.07599 .1349637 -82.07 0.000 -11.34052 -10.81147 pop | (exposure) ------------------------------------------------------------------------------ . poisgof Goodness-of-fit chi2 = 169.529 Prob > chi2(16) = 0.0000Il modello non fitta molto bene i dati, 169 di chi2 con 16 df è un disastro. Notare che se uso una regressione negative binomial per assorbire la sovradispersione, i risultati sostanziali sono gli stessi ma cala di brutto la pseudo-varianza spiegata.
Ora, non ricordo come si fa con questo programma a confrontare due coefficienti di regressione, ma a occhio l'effetto dell'unione a tre AO-BZ-TN è maggiore di quello del Sud. Qui pare proprio che le peculiarità istituzionali si mangino anche il familismo amorale. Invece più sono le province più pare calare il numero di casi di corruzione. Il contrario di quello che ipotizzavo io.
![]()
![]()
Ecco il test:
Se teniamo sotto controllo il numero di province, l'effetto della terna AO-BZ-TN non è più statisticamente diverso da quello del Sud.Codice:. test _b[aobztn]==_b[sud] ( 1) - [casi]sud + [casi]aobztn = 0 chi2( 1) = 0.88 Prob > chi2 = 0.3469Solo che secondo i risultati del modello il numero di province abbassa l'inclinazione alla cleptomania nei pubblici amministratori. La cosa comincia a diventare fumosa.
Per ora, pare voler dire che in AO-BZ-TN tenuto conto del limitato numero di province, tutto sommato si ruba quanto al sud (e non di più come appare guardando i tassi grezzi). Ma più che nel resto del Nord però.
Ci capisco sempre meno.
Ultima modifica di Borat; 20/02/2010 alle 16:26
Segnalibri