Para el siguiente ejercicio utilizaremos la informacion de SF Salaries Dataset de Kaggle. La informacion contiene los siguientes campos:
Import pandas as pd.
In [1]:
Leer Salaries.csv de la carpeta data como un dataframe de nombre sal.
In [2]:
Checar las primeras 5 filas de informacion
In [8]:
Out[8]:
Usar el metodo .info() para encontrar cuantos registros tenemos.
In [9]:
Promedio del BasePay
In [10]:
Out[10]:
El valor maximo de OvertimePay en los datos
In [11]:
Out[11]:
Cual es el trabajo de JOSEPH DRISCOLL? Nota: Usar mayusculas, si no la respuesta no se mostrara, ya que existe otro Joseph Driscoll con minusculas.
In [12]:
Out[12]:
Cuanto dinero gana JOSEPH DRISCOLL (incluyendo beneficios)?
In [13]:
Out[13]:
Cual es el nombre de la persona con el mayor sueldo (incluyendo beneficios)?
In [14]:
Out[14]:
Cual es el nombre de la persona con el menor salario (incluyendo beneficios)? Existe algo raro en su pago?
In [15]:
Out[15]:
Cual es el promedio (mean) del BasePay de todos los empleados por anio (2011-2014) ?
In [16]:
Out[16]:
Cuantos trabajos unicos existen ?
In [17]:
Out[17]:
Cuales son los 5 trabajos mas comunes ?
In [18]:
Out[18]:
In [5]:
Out[5]:
Cuantas personas tienen la palabra Chief en el nombre de su trabajo?
In [3]:
In [4]:
Out[4]:
Existe alguna correlacion entre la longitud del nombre del trabajo y el salario
In [22]:
In [23]:
Out[23]: