Pandas es un libreria de alto rendimiento, facil de usar para manejar estructuras de datos y analizarlas.
Checate mas en :
Para usar pandas, solo tiene que importar el modulo ..tambien te conviene importar numpy y matplotlib..juega n muy bien con pandas
In [1]:
import pandas as pd
import numpy as np # modulo de computo numerico
import matplotlib.pyplot as plt # modulo de graficas
# esta linea hace que las graficas salgan en el notebook
%matplotlib inline
Pandas te sirve si quieres:
Y mucho mas...
Una estructura de datos en Pandas se llama un DataFrame, con el manejamos todos los datos y aplicamos tranformaciones.
Asi creamos un DataFrame vacio:
In [2]:
df= pd.DataFrame()
No nos sirve nada vacio, entonces agreguemos le informacion!
Suponte que eres un taquero y quieres hacer un dataframe de cuantos tacos vendes en una semana igual y para ver que tacos son mas populares y echarle mas ganas en ellos,
Ojo! Si ponemos la variable de un dataframe al final de una celda no saldra una tabla con los datos, eah!
In [3]:
df['Pastor']=np.random.randint(100, size=7)
df['Tripas']=np.random.randint(100, size=7)
df['Chorizo']=np.random.randint(100, size=7)
df.index=['Lunes','Martes','Miercoles','Jueves','Viernes','Sabado','Domingo']
df
Out[3]:
In [4]:
df.describe()
Out[4]:
pero talvez solo queramos estadisticas de Pastor, entonces seria:
In [5]:
df['Pastor'].describe()
Out[5]:
o talvez solo nos interese del Lunes:
Ojo! Tenemos que usar .ix para seleccionar un renglon
In [6]:
df.ix['Lunes']
Out[6]:
In [8]:
df.boxplot()
plt.title("Boxplot")
plt.show()
In [9]:
df['Tacos Total']=df['Pastor']+df['Tripas']
df
Out[9]:
In [10]:
df=df.drop("Tripas",axis=1)
df
Out[10]:
In [11]:
df.to_csv("Tacos.csv")
In [13]:
df=pd.read_csv("Tacos.csv")