In [1]:
%matplotlib inline
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import scipy.stats as stats

headers=["nome", "unidade", "depto", "jornada", "categoria",
         "classe", "ref", "func", "func_estr", "tempo", "parcelas",
         "salario", "salario_liq"]

In [2]:
raw = pd.read_csv("USP.txt", delimiter=';', index_col=False, names=headers, header=0)

In [3]:
np.unique(raw.categoria)


Out[3]:
array(['Celetista', 'Compl Apos', 'Doc Apos', 'Docente', 'Func Apos',
       'Func Aut'], 
      dtype='<U10')

In [18]:
dat = raw[raw.categoria == "Celetista"]

In [19]:
plt.hist(list(dat.salario), bins=100)
plt.xlim(0, 25000)


Out[19]:
(0, 25000)

In [20]:
np.median(dat.salario)


Out[20]:
6898.0100000000002

In [35]:
dat = raw[raw.categoria == "Celetista"]

In [36]:
funcoes = np.unique(dat.func)
resul = []
for funcao in funcoes:
    resul.append([funcao, len(dat[dat.func == funcao])])

In [37]:
len(dat[dat.func == np.unique(dat.func)[2]])


Out[37]:
3

In [38]:
resul


Out[38]:
[['Abatedor', 4],
 ['Administrador', 10],
 ['Advogado', 3],
 ['Agente de Inovação', 5],
 ['Agente de Relacoes Internacionais', 14],
 ['Agente de Vigilância', 278],
 ['Almoxarife', 41],
 ['Analista Acadêmico', 40],
 ['Analista Assuntos Administrativos', 182],
 ['Analista Contábil Financeiro', 48],
 ['Analista de Comunicação', 73],
 ['Analista de O&M', 1],
 ['Analista de Recursos Humanos', 9],
 ['Analista de Sistemas', 310],
 ['Armador', 2],
 ['Arquiteto', 30],
 ['Arte Finalista', 27],
 ['Ascensorista', 3],
 ['Assessor', 7],
 ['Assistente Administrativo', 27],
 ['Assistente Administrativo Especializado', 5],
 ['Assistente Social', 65],
 ['Assistente Técnico', 23],
 ['Assistente Técnico Especializado', 12],
 ['Atendente de Classe', 4],
 ['Atendente de Enfermagem', 2],
 ['Ator', 1],
 ['Auditor', 3],
 ['Aux Documentação e Informação', 93],
 ['Aux de Inspecao de Carne e Laticinio', 1],
 ['Auxiliar Academico', 92],
 ['Auxiliar Administrativo', 33],
 ['Auxiliar Agropecuario', 117],
 ['Auxiliar Contábil e Financeiro', 23],
 ['Auxiliar Gráfico', 39],
 ['Auxiliar de Administração', 795],
 ['Auxiliar de Apoio Educativo', 6],
 ['Auxiliar de Biotério', 24],
 ['Auxiliar de Caixa', 13],
 ['Auxiliar de Comunicação', 12],
 ['Auxiliar de Consultório Dentário', 48],
 ['Auxiliar de Cozinha', 225],
 ['Auxiliar de Enfermagem', 91],
 ['Auxiliar de Esporte', 6],
 ['Auxiliar de Laboratorio', 324],
 ['Auxiliar de Laboratório', 4],
 ['Auxiliar de Lavanderia', 11],
 ['Auxiliar de Manutenção', 16],
 ['Auxiliar de Manutenção/obras', 281],
 ['Auxiliar de Materiais', 79],
 ['Auxiliar de Museu', 7],
 ['Auxiliar de Necropsia', 10],
 ['Auxiliar de Recursos Humanos', 8],
 ['Auxiliar de Saude', 3],
 ['Auxiliar de Serviços Gerais', 523],
 ['Auxiliar de Topografo Agrimensor', 5],
 ['Biblioteconomista', 4],
 ['Bibliotecário', 278],
 ['Biologista', 2],
 ['Bioquímico', 1],
 ['Biólogo', 62],
 ['Carpinteiro', 5],
 ['Cenotecnico', 6],
 ['Cirurgião Dentista', 96],
 ['Concertino (s)', 1],
 ['Contador', 100],
 ['Contínuo', 11],
 ['Copeiro', 3],
 ['Copista e Arquivista Musical', 2],
 ['Costureiro', 3],
 ['Cozinheiro', 148],
 ['Desenhista', 38],
 ['Desenhista Copista', 3],
 ['Desenhista Projetista', 4],
 ['Diagramador', 5],
 ['Digitador', 1],
 ['Editor', 1],
 ['Educador', 101],
 ['Educador Em Praticas Desportivas', 46],
 ['Eletricista', 77],
 ['Encanador', 28],
 ['Encanador Industrial', 1],
 ['Enfermeiro', 242],
 ['Enfermeiro do Trabalho', 1],
 ['Engenheiro', 145],
 ['Engenheiro de Seguranca do Trabalho', 4],
 ['Espec Cooperação Extensão Universit', 13],
 ['Especialista', 2],
 ['Especialista Conservacao e Restauro', 8],
 ['Especialista em Biotério', 9],
 ['Especialista em Compras', 1],
 ['Especialista em Document Museologica', 4],
 ['Especialista em Laboratório', 719],
 ['Especialista em Pesq Apoio de Museu', 31],
 ['Especialista em Projetos Exposição', 6],
 ['Especialista em Proteção Radiológica', 5],
 ['Estatistico Matematico', 5],
 ['Farmacêutico', 85],
 ['Fisioterapeuta', 46],
 ['Fonoaudiólogo', 74],
 ['Fotógrafo', 25],
 ['Fotógrafo Especialista', 1],
 ['Funileiro', 1],
 ['Físico', 32],
 ['Garcom', 16],
 ['Geólogo', 1],
 ['Inspetor de Carne e Laticinio', 2],
 ['Inspetor de Orquestra', 2],
 ['Instrumentista de Fila (s)', 18],
 ['Instrumentista de Fila (t)', 5],
 ['Instrutor de Línguas', 1],
 ['Jardineiro', 66],
 ['Jornalista', 55],
 ['Lactarista', 11],
 ['Locutor', 1],
 ['Locutor/operador', 5],
 ['Marceneiro', 50],
 ['Mecânico', 15],
 ['Mecânico Manutenção', 3],
 ['Meio Oficial Pedreiro', 5],
 ['Mestre de Embarcacao', 1],
 ['Montador de Orquestra', 2],
 ['Motorista', 370],
 ['Motorista Maritimo', 2],
 ['Médico', 417],
 ['Médico Veterinário', 35],
 ['Médico do Trabalho', 14],
 ['Nutricionista', 44],
 ['Não Informada', 21],
 ['Oficial Ar Condicionado Refrigeração', 1],
 ['Operador de Audiovisual', 45],
 ['Operador de Caldeira', 14],
 ['Operador de Computador', 7],
 ['Operador de Máquinas', 65],
 ['Operador de Som', 6],
 ['Operador de Telemonitoramento', 4],
 ['Orient de Estrut Musical Tec Vocal', 9],
 ['Orientador de Arte Dramatica', 17],
 ['PROFEI', 8],
 ['PROFEM', 48],
 ['Pedreiro', 78],
 ['Pescador', 2],
 ['Pianista Cravista (s)', 1],
 ['Pintor', 41],
 ['Procurador', 45],
 ['Produtor de Comunicacao Visual', 4],
 ['Produtor de Radio', 2],
 ['Professor', 18],
 ['Professor Cálculo Numérico', 1],
 ['Professor Dr. Cálculo Numérico', 1],
 ['Professor Dr. Química', 5],
 ['Professor Educ. Artística', 1],
 ['Professor Geografia', 1],
 ['Professor de História', 1],
 ['Professor de Português', 1],
 ['Professor de Química', 4],
 ['Programador Computador', 2],
 ['Programador Musical', 2],
 ['Psicólogo', 65],
 ['Publicitario', 3],
 ['Químico', 50],
 ['Recepcionista', 95],
 ['Regente Assistente', 5],
 ['Regente Titular e Diretor Artistico', 4],
 ['Relacoes Publicas', 1],
 ['Revisor', 4],
 ['Salva Vidas', 18],
 ['Secretario Executivo', 2],
 ['Secretária', 3],
 ['Secretária Executiva', 4],
 ['Secretário', 785],
 ['Segundo Solista (s)', 5],
 ['Segundo Solista (t)', 7],
 ['Serralheiro', 9],
 ['Servente', 1],
 ['Soldador', 2],
 ['Sonoplasta Iluminador', 7],
 ['Supervisor de Vigilancia', 1],
 ['Tec Assuntos Administrativos', 1697],
 ['Tec em Equip Hospitalar Clínico', 2],
 ['Tecnico Agricola', 14],
 ['Tecnico Em Higiene Dental', 5],
 ['Tecnico Em Vidraria', 4],
 ['Tecnico Juridico', 4],
 ['Tecnico de Documentação e Informação', 185],
 ['Tecnico de Museu', 24],
 ['Tecnico de Rede de Computador', 28],
 ['Tecnico de Telecomunicacoes', 18],
 ['Tecnólogo', 10],
 ['Telefonista', 8],
 ['Terapeuta Ocupacional', 18],
 ['Topografo Agrimensor', 2],
 ['Torneiro', 3],
 ['Tratador de Agua', 7],
 ['Técnico Acadêmico', 421],
 ['Técnico Assuntos Financeiros', 115],
 ['Técnico Contábil e Financeiro', 94],
 ['Técnico de Apoio Educativo', 148],
 ['Técnico de Biotério', 20],
 ['Técnico de Comunicação', 24],
 ['Técnico de Enfermagem', 445],
 ['Técnico de Enfermagem do Trabalho', 7],
 ['Técnico de Gráfica', 61],
 ['Técnico de Laboratório', 1159],
 ['Técnico de Manutenção', 2],
 ['Técnico de Manutenção Eletrônica', 54],
 ['Técnico de Manutenção/obras', 272],
 ['Técnico de Necropsia', 15],
 ['Técnico de Obras', 5],
 ['Técnico de Recursos Humanos', 140],
 ['Técnico de Segurança do Trabalho', 28],
 ['Técnico em Compras', 90],
 ['Técnico em Informática', 341],
 ['Técnico em Mecatronica', 1],
 ['Técnico em Mecânica', 41],
 ['Técnico em Nutrição e Dietética', 28],
 ['Técnico em Prótese Dentária', 13],
 ['Técnico em Radiologia', 56],
 ['Vendedor', 13],
 ['Vidraceiro', 3],
 ['Vigia', 427],
 ['Violino Spalla (s)', 3],
 ['Visitador Sanitario', 10],
 ['Webdesigner', 2],
 ['Zelador', 30],
 ['Zootecnista', 2]]

In [39]:
ndat = dat[dat.func == "Analista de Sistemas"]

In [41]:
plt.hist(list(ndat.salario), bins=50)
plt.xlim(0, 15000)


Out[41]:
(0, 15000)

In [42]:
ndat[ndat.unidade == "SAS"]


Out[42]:
nome unidade depto jornada categoria classe ref func func_estr tempo parcelas salario salario_liq
20020 Nelson Barbosa Junior SAS Seção Técnica de Informática 40 Horas Celetista Superior 2 B Analista de Sistemas Chefe de Seção Técnica 28 0 16286.33 11302.98

In [ ]:


In [ ]: