Chiaramente sotto assunto che i gruppi siano mutualmente esclusivi.

In realtà non lo sono perché ci sono mega-doline (quindi 4) stabilmente frequentate dall'uomo per attività turistiche come Campo Felice, ci sono paesi situati in doline (in Slovenia), ma la maggioranza delle doline sono disabitate, ecc ecc.

Forse è meglio il metodo delle dummy-variables. Definiti gli attributi di classificazione (vanno bene i 4 di prima secondo me), crei 4 nuove colonne di dati. Per ogni sito/evento di minima, dài a ogni attributo (paese, sito disabitato frequentato) un tag di 0 che lo disattiva o 1 che lo attiva.

Ad esempio:
Codice:
--------------------------------------------------------------------
Sito               tmin    quando   paese  loc.freq.  disab.  dolina
--------------------------------------------------------------------
Busa di Manna       -44     1/09      0         0        1        1
Busa Sponde Alte    -43     1/09      0         0        1        1
...
Livigno             -38     2/56      1         0        0        0
...
--------------------------------------------------------------------
Mi pare che il maggior contributo che questo metodo può dare sia permettere di classificare i paesi in dolina, e non direi che ce ne siano tanti. Qualcuno ce ne sarà di sicuro (ne ho visti alcuni anch'io), bisogna vedere se qualcuno inizia a riportare le loro temperature.