Ahora vamos a ver un conjunto de datos muy famosos, los datos iris, son 150 mediciones sobre 3 especies de plantas:
Cada planta tiene cuatro propiedades que se midieron:
Vamos a empezar con varias versiones de los datos, incrementando en complejidad:
In [ ]:
import pandas as pd
import numpy as np # modulo de computo numerico
import matplotlib.pyplot as plt # modulo de graficas
# esta linea hace que las graficas salgan en el notebook
import seaborn as sns
%matplotlib inline
In [ ]:
df=pd.read_csv('files/ejemplo.csv')
print('df.shape)
df.head()
In [ ]:
sns.pairplot(df,hue='Tipo')
plt.title('Distribuciones de Datos')
plt.show()
In [ ]:
In [ ]:
In [ ]:
In [ ]:
In [ ]:
In [ ]:
In [ ]: