El primer tipo de dato que vamos a aprender en pandas es Series
Una series es muy similar a un arreglo de Numpy, la diferencia es que una serie tiene etiquetas en su eje, por tal motivo podemos generar indices por etiquetas en vez de un numero.
In [2]:
# librerias
import numpy as np
import pandas as pd
In [3]:
labels = ['a','b','c']
my_list = [10,20,30]
arr = np.array([10,20,30])
d = {'a':10,'b':20,'c':30}
Usando listas
In [4]:
pd.Series(data=my_list)
Out[4]:
In [5]:
pd.Series(data=my_list,index=labels)
Out[5]:
In [6]:
pd.Series(my_list,labels)
Out[6]:
Arreglos Numpy
In [7]:
pd.Series(arr)
Out[7]:
In [8]:
pd.Series(arr,labels)
Out[8]:
Diccionarios
In [9]:
pd.Series(d)
Out[9]:
In [10]:
pd.Series(data=labels)
Out[10]:
In [11]:
# Inclusive funciones
pd.Series([sum,print,len])
Out[11]:
In [12]:
ser1 = pd.Series([1,2,3,4],index = ['USA', 'Germany','USSR', 'Japan'])
In [13]:
ser1
Out[13]:
In [14]:
ser2 = pd.Series([1,2,5,4],index = ['USA', 'Germany','Italy', 'Japan'])
In [15]:
ser2
Out[15]:
In [16]:
ser1['USA']
Out[16]:
Operations are then also done based off of index:
In [17]:
ser1 + ser2
Out[17]: