Pandas es un libreria de alto rendimiento, facil de usar para manejar estructuras de datos y analizarlas.
Checate mas en :
Para usar pandas, solo tiene que importar el modulo ..tambien te conviene importar numpy y matplotlib..juega n muy bien con pandas
In [1]:
import pandas as pd
import numpy as np # modulo de computo numerico
import matplotlib.pyplot as plt # modulo de graficas
# esta linea hace que las graficas salgan en el notebook
%matplotlib inline
Pandas te sirve si quieres:
Y mucho mas...
Una estructura de datos en Pandas se llama un DataFrame, con el manejamos todos los datos y aplicamos tranformaciones.
Asi creamos un DataFrame vacio:
In [12]:
df = pd.DataFrame()
No nos sirve nada vacio, entonces agreguemos le informacion!
Suponte que eres un taquero y quieres hacer un dataframe de cuantos tacos vendes en una semana igual y para ver que tacos son mas populares y echarle mas ganas en ellos,
Ojo! Si ponemos la variable de un dataframe al final de una celda no saldra una tabla con los datos, eah!
In [13]:
df['Pastor']=np.random.randint(100, size=7)
df['Tripas']=np.random.randint(100, size=7)
df['Chorizo']=np.random.randint(100, size=7)
df.index=['Lunes','Martes','Miercoles','Jueves','Viernes','Sabado','Domingo']
df
Out[13]:
In [6]:
df.describe()
Out[6]:
pero talvez solo queramos estadisticas de Pastor, entonces seria:
In [7]:
df['Chorizo'].describe()
Out[7]:
o talvez solo nos interese del Lunes:
Ojo! Tenemos que usar .ix para seleccionar un renglon
In [8]:
df.ix['Lunes']
Out[8]:
In [9]:
df.boxplot()
plt.title("Boxplot")
plt.show()
In [10]:
df['Tacos Total']=df['Pastor']+df['Tripas']+df['Chorizo']
df
Out[10]:
In [11]:
df=df.drop("Chorizo",axis=1)
df
Out[11]:
In [19]:
df.to_csv("Tacos.csv")
In [20]:
df=pd.read_csv("Tacos.csv")
In [21]:
In [ ]: