Software utilizado.
Este es un documento interactivo escrito como un notebook de Jupyter, en el cual se presenta un tutorial sobre la extracción, transformación, visualización y carga de datos usando Python en el contexto de la ciencia de los datos. Los notebooks de Jupyter permiten incoporar simultáneamente código, texto, gráficos y ecuaciones. El código presentado en este notebook puede ejecutarse en los sistemas operativos Windows, Linux y OS X.
Haga click aquí para obtener instrucciones detalladas sobre como instalar Jupyter en Windows y Mac OS X.
Haga clic aquí para ver la última versión de este documento en nbviewer.
Descargue la última versión de este documento a su disco duro; luego, carguelo y ejecutelo en línea en Try Jupyter!
*
Para el archivo AportesDiario_2015.csv
, responda las siguientes preguntas usando IPython.
In [14]:
import pandas as pd
import statistics as st
import numpy as np
1.-- Cuántos registros tiene el archivo?
In [8]:
x=pd.read_csv('AportesDiario_2015.csv', sep=';',decimal=',',thousands='.',skiprows=2)
len(x)
Out[8]:
In [9]:
x.head()
Out[9]:
2.-- Cuántas regiones hidrológicas diferentes hay?
In [10]:
len(set(x['Region Hidrologica']))
Out[10]:
3.-- Cuántos rios hay?
In [11]:
len(set(x['Nombre Rio']))
Out[11]:
4.-- Cuántos registros hay por región hidrológica?
In [17]:
y = x.groupby('Region Hidrologica')
y.size()
Out[17]:
5.-- Cuál es el promedio de aportes en energía kWh por región?
In [13]:
x.groupby('Region Hidrologica').mean()['Aportes %']
Out[13]:
6.-- Cuáles registros no tienen datos?
In [35]:
Caudal=len(x[x['Aportes Caudal m3/s'].isnull()])
Aportes=len(x[x['Aportes Energia kWh'].isnull()])
Aport =len(x[x['Aportes %'].isnull()])
print (Caudal)
print (Aportes)
print (Aport)
In [36]:
# x.dropna() borra los registros na
len(x) - len(x.dropna())
Out[36]:
7.-- Grafique (gráfico de barras) la producción promedio por región hidrológica?
In [38]:
import matplotlib
%matplotlib inline
In [39]:
x.groupby('Region Hidrologica').mean()['Aportes Energia kWh'].plot(kind='bar')
Out[39]:
In [ ]:
In [ ]:
In [ ]: