In [2]:
#%% librerias
import pandas as pd
# Crear un dataFrame
data = {'Company':['GOOG','GOOG','MSFT','MSFT','FB','FB'],
'Person':['Sam','Charlie','Amy','Vanessa','Carl','Sarah'],
'Sales':[200,120,340,124,243,350]}
In [3]:
df = pd.DataFrame(data)
In [4]:
df
Out[4]:
Ahora ya podemos usar la funcion .groupby() para agrupar la informacion en base a los nombres de las columnas. Agrupemos la informacion por el nombre de la compania. Esto creara un objeto DataFrameGroupBy
In [5]:
df.groupby('Company')
Out[5]:
Este objeto lo podemos guardar como una nueva variable
In [6]:
by_comp = df.groupby("Company")
Y en seguida mandar llamar los metodos de agregacion
In [7]:
by_comp.mean()
Out[7]:
In [8]:
df.groupby('Company').mean()
Out[8]:
Mas ejemplos de funciones
In [9]:
by_comp.std()
Out[9]:
In [10]:
by_comp.min()
Out[10]:
In [11]:
by_comp.max()
Out[11]:
In [12]:
by_comp.count()
Out[12]:
In [13]:
by_comp.describe()
Out[13]:
In [14]:
by_comp.describe().transpose()
Out[14]:
In [15]:
by_comp.describe().transpose()['GOOG']
Out[15]: