Hola Pandas!

Pandas = Manejo de informacion facil!

Que es pandas?

Pandas es un libreria de alto rendimiento, facil de usar para manejar estructuras de datos y analizarlas.

Checate mas en :

Para usar pandas, solo tiene que importar el modulo ..tambien te conviene importar numpy y matplotlib..juegan muy bien con pandas


In [8]:
import pandas as pd
import numpy as np # modulo de computo numerico
import matplotlib.pyplot as plt # modulo de graficas

Y yo para que quiero eso? De que sirve pandas?

Pandas te sirve si quieres:

  • Trabajar con datos de manera facil.
  • Explorar un conjunto de datos de manera rapida, enterder los datos que tienes.
  • Facilmente manipular informacion, por ejemplo sacar estadisticas.
  • Graficas patrones y distribuciones de datos.
  • Trabajar con Exceles, base de datos, sin tener que suar esas herramientas.

Y mucho mas...

El DataFrame en Pandas

Una estructura de datos en Pandas se llama un DataFrame, con el manejamos todos los datos y aplicamos tranformaciones.

Asi creamos un DataFrame vacio:


In [12]:
df= pd.DataFrame()

No nos sirve nada vacio, entonces agreguemos le informacion!

LLenando informacion con un Dataframe

Situacion:

Suponte que eres un taquero y quieres hacer un dataframe de cuantos tacos vendes en una semana igual y para ver que tacos son mas populares y echarle mas ganas en ellos,

Asumiremos:

  • Que vende tacos Pastor y de Tripa
  • Hay 7 dias en una semana, 0 Lunes, 7 es Domingo
  • Crearemos el numero de tacos como numeros enteros aleatorios (np.random.randint)

Ojo! Si ponemos la variable de un dataframe al final de una celda no saldra una tabla con los datos, eah!


In [16]:
df['Pastor']=np.random.randint(100, size=7)
df['Tripas']=np.random.randint(100, size=7)
df


Out[16]:
Pastor Tripas
0 7 59
1 61 54
2 57 93
3 17 33
4 12 90
5 91 68
6 98 50

In [ ]: