Pandas es un libreria de alto rendimiento, facil de usar para manejar estructuras de datos y analizarlas.
Checate mas en :
Para usar pandas, solo tiene que importar el modulo ..tambien te conviene importar numpy y matplotlib..juega n muy bien con pandas
In [1]:
import pandas as pd
import numpy as np # modulo de computo numerico
import matplotlib.pyplot as plt # modulo de graficas
# esta linea hace que las graficas salgan en el notebook
%matplotlib inline
Pandas te sirve si quieres:
Y mucho mas...
Una estructura de datos en Pandas se llama un DataFrame, con el manejamos todos los datos y aplicamos tranformaciones.
Asi creamos un DataFrame vacio:
In [4]:
df = pd.DataFrame()
df
Out[4]:
No nos sirve nada vacio, entonces agreguemos le informacion!
Suponte que eres un taquero y quieres hacer un dataframe de cuantos tacos vendes en una semana igual y para ver que tacos son mas populares y echarle mas ganas en ellos,
Ojo! Si ponemos la variable de un dataframe al final de una celda no saldra una tabla con los datos, eah!
In [9]:
df = pd.DataFrame()
df['Tripas'] = np.random.randint(100,size=7)
df['Chorizo'] = np.random.randint(100,size=7)
df['Pastor'] = np.random.randint(100,size=7)
df.index = ['L','Mar','Mier','J','V','S','D']
df
Out[9]:
In [10]:
df.describe()
Out[10]:
pero talvez solo queramos estadisticas de Pastor, entonces seria:
In [11]:
df['Pastor'].describe()
Out[11]:
o talvez solo nos interese del Lunes:
Ojo! Tenemos que usar .ix para seleccionar un renglon
In [13]:
df.ix['L'].describe()
Out[13]:
In [14]:
df.boxplot()
Out[14]:
In [17]:
df['Total']=df['Pastor']+df['Tripas']+df['Chorizo']
df
Out[17]:
In [19]:
df.drop('Pastor',axis=1)
Out[19]:
In [19]:
df.to
In [20]:
In [21]:
In [ ]: