Q007 - Qual è la disponibilità della sede che ospita il laboratorio?


In [1]:
# -*- coding: UTF-8 -*-

# Render our plots inline
%matplotlib inline 

import pandas as pd
import matplotlib
import matplotlib.pyplot as plt
import numpy as np
import seaborn
import shutil

pd.set_option('display.mpl_style', 'default') # Make the graphs a bit prettier, overridden by seaborn
pd.set_option('display.max_columns', None) # Display all the columns
plt.rcParams['font.family'] = 'sans-serif' # Sans Serif fonts for all the graphs

# Reference for color palettes: http://web.stanford.edu/~mwaskom/software/seaborn/tutorial/color_palettes.html

# Change the font
matplotlib.rcParams.update({'font.family': 'Source Sans Pro'})

In [2]:
# Load csv file first
data = pd.read_csv("data/lab-survey.csv", encoding="utf-8")

In [3]:
# Check data
#data[0:4] # Equals to data.head()

In [4]:
%%capture output

# Save the output as a variable that can be saved to a file
# Get the distribution of way of living
kind = data["D7"].value_counts(dropna=False)
print "Data:"
print kind
print ""
print "Data %:"
print data["D7"].value_counts(normalize=True,dropna=False) * 100

In [5]:
# Save+show the output to a text file
%save Q007-DisponibilitáSede01.py str(output)
shutil.move("Q007-DisponibilitáSede01.py", "text/Q007-DisponibilitáSede01.txt")


The following commands were written to file `Q007-DisponibilitáSede01.py`:
Data:
Ospitalitá gratuita    24
Affitto                23
Sede propria           11
Affitto agevolato       5
Altro                   5
Occupazione             2
NaN                     0
dtype: int64

Data %:
Ospitalitá gratuita    34.285714
Affitto                32.857143
Sede propria           15.714286
Affitto agevolato       7.142857
Altro                   7.142857
Occupazione             2.857143
NaN                     0.000000
dtype: float64


In [6]:
# Swap nan for a more understandable word
old_dict = kind.to_dict()
new_dict = {}
for i in old_dict:
    if type(i) is float and np.isnan(i):
        new_dict["Nessuna risposta"] = old_dict[i]
    else:
        new_dict[i.capitalize()] = old_dict[i]

kindu = pd.Series(new_dict)
kind = kindu.order()

In [7]:
# Plot the data
plt.figure(figsize=(8,6))
plt.xlabel(u'Disponibilitá sede', fontsize=16)
plt.ylabel('Lab', fontsize=16)
plt.title(u"Qual è la disponibilità della sede che ospita il laboratorio?", fontsize=18, y=1.02)
my_colors = seaborn.color_palette("husl", len(kind)) # Set color palette
kind.plot(kind="bar",color=my_colors)
plt.savefig(u"svg/Q007-DisponibilitáSede.svg")
plt.savefig(u"png/Q007-DisponibilitáSede.png")
plt.savefig(u"pdf/Q007-DisponibilitáSede.pdf")



In [8]:
%%capture output

# Save the output as a variable that can be saved to a file
# Get "other" data
kind_other = data["D7[other]"].str.lower().value_counts()
print "Data:"
print kind_other
print ""
print "Data %:"
print data["D7[other]"].str.lower().value_counts(normalize=True) * 100

In [9]:
# Save+show the output to a text file
%save Q007-DisponibilitáSede02.py str(output)
shutil.move("Q007-DisponibilitáSede02.py", "text/Q007-DisponibilitáSede02.txt")


The following commands were written to file `Q007-DisponibilitáSede02.py`:
Data:
comodato d'uso al comune da parte di associazione comunità san benedetto    1
-                                                               1
affidamento a seguito di gara                                   1
in trattativa                                                   1
concessione comunale                                            1
dtype: int64

Data %:
comodato d'uso al comune da parte di associazione comunità san benedetto    1.428571
-                                                               1.428571
affidamento a seguito di gara                                   1.428571
in trattativa                                                   1.428571
concessione comunale                                            1.428571
dtype: float64


In [10]:
# Plot bar
plt.figure(figsize=(8,6))
plt.title(u'Qual è la disponibilità della sede che ospita il laboratorio? Altro', fontsize=18, y=1.02)
plt.xticks(range(len(kind_other.index)),kind_other.index,rotation=90)
plt.xlabel(u'Disponibilitá sede', fontsize=16)
plt.ylabel('Lab', fontsize=16)
ind = np.arange(len(kind_other))   # the x locations for the groups
width = 0.35                         # the width of the bars

my_colors = seaborn.color_palette("husl", len(kind_other)) # Set color palette
rect1 = plt.bar(ind,kind_other,width,color=my_colors,align='center')
plt.savefig(u"svg/Q007-DisponibilitáSede02.svg")
plt.savefig(u"png/Q007-DisponibilitáSede02.png")
plt.savefig(u"pdf/Q007-DisponibilitáSede02.pdf")



In [10]: