Chiaramente sotto assunto che i gruppi siano mutualmente esclusivi.
In realtà non lo sono perché ci sono mega-doline (quindi 4) stabilmente frequentate dall'uomo per attività turistiche come Campo Felice, ci sono paesi situati in doline (in Slovenia), ma la maggioranza delle doline sono disabitate, ecc ecc.
Forse è meglio il metodo delle dummy-variables. Definiti gli attributi di classificazione (vanno bene i 4 di prima secondo me), crei 4 nuove colonne di dati. Per ogni sito/evento di minima, dài a ogni attributo (paese, sito disabitato frequentato) un tag di 0 che lo disattiva o 1 che lo attiva.
Ad esempio:
Codice:
--------------------------------------------------------------------
Sito tmin quando paese loc.freq. disab. dolina
--------------------------------------------------------------------
Busa di Manna -44 1/09 0 0 1 1
Busa Sponde Alte -43 1/09 0 0 1 1
...
Livigno -38 2/56 1 0 0 0
...
--------------------------------------------------------------------
Mi pare che il maggior contributo che questo metodo può dare sia permettere di classificare i paesi in dolina, e non direi che ce ne siano tanti. Qualcuno ce ne sarà di sicuro (ne ho visti alcuni anch'io), bisogna vedere se qualcuno inizia a riportare le loro temperature.
Segnalibri