Milano Strutture Ricettive Alberghi 2013

I dati utilizzati sono quelli del comune di Milano, disponibili sul sito: http://dati.comune.milano.it/

![CC](http://dati.comune.milano.it/templates/tableless/images/rd/lic_cc-by.gif)

In [1]:
import pandas as pd

CSV_FILE = 'StruttureRicettAlbergh-2013.csv'

In [2]:
df = pd.read_csv(CSV_FILE, sep=';')
df.head()


Out[2]:
Zona Nil Tipologia esercizio Insegna Indirizzo Categoria (stelle) Numero camere Numero posti letto
0 1 1 Albergo Boscolo Hotel Exedra Cso Matteotti Giacomo, 4/6 5 154 308
1 1 1 Albergo Carlton Hotel Baglioni Via Senato, 5 5 93 186
2 1 1 Albergo Four Season Hotel Milan Via Gesu', 10 5 118 240
3 1 1 Albergo Hotel Pierre Milano Via De Amicis Edmondo, 32 5 47 92
4 1 1 Albergo Park Hyatt Milano Via Grossi Tommaso, 1 5 106 212

In [3]:
df.describe()


Out[3]:
Zona Nil Categoria (stelle) Numero camere Numero posti letto
count 451.000000 451.000000 451.000000 451.000000 451.000000
mean 4.113082 27.299335 2.949002 60.447894 114.660754
std 2.675499 23.046937 1.127265 69.140011 137.748169
min 1.000000 1.000000 1.000000 7.000000 7.000000
25% 2.000000 10.000000 2.000000 16.000000 25.000000
50% 3.000000 21.000000 3.000000 35.000000 67.000000
75% 7.000000 43.500000 4.000000 75.000000 146.000000
max 9.000000 88.000000 5.000000 439.000000 922.000000

In [8]:
import thinkstats2
import thinkplot

Distribuzione Categoria (stelle)


In [40]:
df = df.rename(columns={'Categoria (stelle)': 'stelle'})
stars = df['stelle']

hist_stars = thinkstats2.Hist(stars, label='Stelle')

In [41]:
thinkplot.Hist(hist_stars)



In [42]:
stars.describe()


Out[42]:
count    451.000000
mean       2.949002
std        1.127265
min        1.000000
25%        2.000000
50%        3.000000
75%        4.000000
max        5.000000
Name: stelle, dtype: float64

Posti letto


In [46]:
df = df.rename(columns={'Numero posti letto': 'posti'})

posti = df['posti']

posti.describe()


Out[46]:
count    451.000000
mean     114.660754
std      137.748169
min        7.000000
25%       25.000000
50%       67.000000
75%      146.000000
max      922.000000
Name: posti, dtype: float64

Tipologia Struttura


In [58]:
df = df.rename(columns={'Tipologia esercizio': 'tipo'})

df['tipo'] = df['tipo'].apply(lambda x: x[0].upper() + x[1:], 1)

types = df.groupby(['tipo'])

from IPython.display import HTML

for i, type in types:
    display(HTML("<li>%s - <b>%d</b></li>" %(i, len(type))))


  • Albergo - 397
  • Residence - 54
  • 
    
    In [ ]: