I dati utilizzati sono quelli del comune di Milano, disponibili sul sito: http://dati.comune.milano.it/
In [1]:
import pandas as pd
CSV_FILE = 'StruttureRicettAlbergh-2013.csv'
In [2]:
df = pd.read_csv(CSV_FILE, sep=';')
df.head()
Out[2]:
In [3]:
df.describe()
Out[3]:
In [8]:
import thinkstats2
import thinkplot
In [40]:
df = df.rename(columns={'Categoria (stelle)': 'stelle'})
stars = df['stelle']
hist_stars = thinkstats2.Hist(stars, label='Stelle')
In [41]:
thinkplot.Hist(hist_stars)
In [42]:
stars.describe()
Out[42]:
In [46]:
df = df.rename(columns={'Numero posti letto': 'posti'})
posti = df['posti']
posti.describe()
Out[46]:
In [58]:
df = df.rename(columns={'Tipologia esercizio': 'tipo'})
df['tipo'] = df['tipo'].apply(lambda x: x[0].upper() + x[1:], 1)
types = df.groupby(['tipo'])
from IPython.display import HTML
for i, type in types:
display(HTML("<li>%s - <b>%d</b></li>" %(i, len(type))))
In [ ]: