In [22]:
%matplotlib inline
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import scipy.stats as stats
from pandas.tools.plotting import table

headers=["nome", "unidade", "depto", "jornada", "categoria",
         "classe", "ref", "func", "func_estr", "tempo", "parcelas",
         "salario", "salario_liq"]

In [23]:
raw = pd.read_csv("USP.txt", delimiter=';', index_col=False, names=headers, header=0)

In [24]:
np.unique(raw.categoria)


Out[24]:
array(['Celetista', 'Compl Apos', 'Doc Apos', 'Docente', 'Func Apos',
       'Func Aut'], dtype=object)
np.median(

In [38]:
dat = raw[(raw.categoria == "Celetista")]

In [39]:
np.median(dat.salario)


Out[39]:
6898.0100000000002

In [27]:
np.max(dat.tempo)


Out[27]:
51

In [28]:
plt.hist2d(dat.tempo, dat.salario, bins=30)
plt.xlabel("Anos de serviço")
plt.ylabel("Salário bruto mensal")
plt.colorbar()
plt.show()



In [29]:
funcoes = np.unique(dat.func)
resul = []
resul_med = []
resul_sum = []
i = 0
for funcao in funcoes:
    resul.append([i, funcao, len(dat[dat.func == funcao])])
    resul_med.append([funcao, len(dat[dat.func == funcao]), np.median(dat[dat.func == funcao].salario)])
    resul_sum.append([i, funcao, np.sum(dat[dat.func == funcao].salario)])
    i += 1
resul = np.array(resul)
resul_med = np.array(resul_med)
resul_sum = np.array(resul_sum)

In [30]:
resul_med


Out[30]:
array([['Abatedor', '4', '4145.305'],
       ['Administrador', '10', '17202.615'],
       ['Advogado', '3', '2523.48'],
       ['Agente de Inovação', '5', '11926.86'],
       ['Agente de Relacoes Internacionais', '13', '3893.59'],
       ['Agente de Vigilância', '278', '8031.035'],
       ['Almoxarife', '41', '8553.73'],
       ['Analista Acadêmico', '40', '17591.01'],
       ['Analista Assuntos Administrativos', '181', '13345.27'],
       ['Analista Contábil Financeiro', '46', '15812.13'],
       ['Analista de Comunicação', '73', '12491.41'],
       ['Analista de O&M', '1', '2523.48'],
       ['Analista de Recursos Humanos', '9', '16884.98'],
       ['Analista de Sistemas', '309', '12810.53'],
       ['Armador', '2', '7404.22'],
       ['Arquiteto', '29', '10148.1'],
       ['Arte Finalista', '27', '7898.74'],
       ['Ascensorista', '3', '4382.03'],
       ['Assessor', '7', '2523.48'],
       ['Assistente Administrativo', '26', '2208.04'],
       ['Assistente Administrativo Especializado', '5', '2523.48'],
       ['Assistente Social', '65', '12607.33'],
       ['Assistente Técnico', '23', '2208.04'],
       ['Assistente Técnico Especializado', '12', '2523.48'],
       ['Atendente de Classe', '4', '4260.16'],
       ['Atendente de Enfermagem', '2', '4712.565'],
       ['Ator', '1', '4073.07'],
       ['Auditor', '3', '18154.46'],
       ['Aux Documentação e Informação', '93', '4504.22'],
       ['Aux de Inspecao de Carne e Laticinio', '1', '5744.95'],
       ['Auxiliar Academico', '92', '4634.95'],
       ['Auxiliar Administrativo', '33', '2208.04'],
       ['Auxiliar Agropecuario', '117', '4086.04'],
       ['Auxiliar Contábil e Financeiro', '23', '4785.98'],
       ['Auxiliar Gráfico', '39', '4537.97'],
       ['Auxiliar de Administração', '793', '3562.28'],
       ['Auxiliar de Apoio Educativo', '6', '3234.255'],
       ['Auxiliar de Biotério', '24', '4540.46'],
       ['Auxiliar de Caixa', '12', '5065.365'],
       ['Auxiliar de Comunicação', '12', '4224.35'],
       ['Auxiliar de Consultório Dentário', '47', '6925.45'],
       ['Auxiliar de Cozinha', '224', '3395.46'],
       ['Auxiliar de Enfermagem', '88', '7064.465'],
       ['Auxiliar de Esporte', '6', '3873.165'],
       ['Auxiliar de Laboratorio', '321', '4067.52'],
       ['Auxiliar de Laboratório', '4', '2208.04'],
       ['Auxiliar de Lavanderia', '11', '4179.74'],
       ['Auxiliar de Manutenção', '16', '946.3'],
       ['Auxiliar de Manutenção/obras', '278', '3334.225'],
       ['Auxiliar de Materiais', '79', '5568.95'],
       ['Auxiliar de Museu', '7', '6079.09'],
       ['Auxiliar de Necropsia', '10', '5936.78'],
       ['Auxiliar de Recursos Humanos', '8', '6817.255'],
       ['Auxiliar de Saude', '3', '5204.85'],
       ['Auxiliar de Serviços Gerais', '519', '3556.26'],
       ['Auxiliar de Topografo Agrimensor', '5', '5568.95'],
       ['Biblioteconomista', '4', '2523.48'],
       ['Bibliotecário', '277', '14087.36'],
       ['Biologista', '2', '2523.48'],
       ['Bioquímico', '1', '2523.48'],
       ['Biólogo', '62', '14770.57'],
       ['Carpinteiro', '5', '4400.35'],
       ['Cenotecnico', '6', '5640.14'],
       ['Cirurgião Dentista', '96', '11945.235'],
       ['Concertino (s)', '1', '11066.21'],
       ['Contador', '100', '12346.835'],
       ['Contínuo', '11', '3861.26'],
       ['Copeiro', '3', '3788.75'],
       ['Copista e Arquivista Musical', '2', '9777.7'],
       ['Costureiro', '3', '3175.44'],
       ['Cozinheiro', '145', '3261.05'],
       ['Desenhista', '38', '8876.06'],
       ['Desenhista Copista', '3', '6686.88'],
       ['Desenhista Projetista', '4', '2515.745'],
       ['Diagramador', '5', '7030.67'],
       ['Digitador', '1', '5791.71'],
       ['Editor', '1', '12665.53'],
       ['Educador', '99', '9143.77'],
       ['Educador Em Praticas Desportivas', '46', '14790.28'],
       ['Eletricista', '73', '5643.94'],
       ['Encanador', '26', '5920.95'],
       ['Encanador Industrial', '1', '946.3'],
       ['Enfermeiro', '241', '11144.75'],
       ['Enfermeiro do Trabalho', '1', '16919.31'],
       ['Engenheiro', '145', '13953.05'],
       ['Engenheiro de Seguranca do Trabalho', '4', '9514.385'],
       ['Espec Cooperação Extensão Universit', '13', '9814.66'],
       ['Especialista', '2', '2523.48'],
       ['Especialista Conservacao e Restauro', '8', '10487.22'],
       ['Especialista em Biotério', '9', '17308.38'],
       ['Especialista em Compras', '1', '14457.37'],
       ['Especialista em Document Museologica', '4', '11153.69'],
       ['Especialista em Laboratório', '712', '10350.81'],
       ['Especialista em Pesq Apoio de Museu', '31', '8904.15'],
       ['Especialista em Projetos Exposição', '6', '14682.565'],
       ['Especialista em Proteção Radiológica', '5', '16152.41'],
       ['Estatistico Matematico', '5', '16245.24'],
       ['Farmacêutico', '85', '13953.05'],
       ['Fisioterapeuta', '46', '9224.425'],
       ['Fonoaudiólogo', '74', '8331.11'],
       ['Fotógrafo', '24', '7487.9'],
       ['Fotógrafo Especialista', '1', '13723.43'],
       ['Funileiro', '1', '7959.41'],
       ['Físico', '32', '12667.94'],
       ['Garcom', '16', '5105.66'],
       ['Geólogo', '1', '10808.56'],
       ['Inspetor de Carne e Laticinio', '2', '10309.54'],
       ['Inspetor de Orquestra', '2', '4688.1'],
       ['Instrumentista de Fila (s)', '18', '11360.445'],
       ['Instrumentista de Fila (t)', '5', '7898.74'],
       ['Instrutor de Línguas', '1', '7898.74'],
       ['Jardineiro', '63', '4576.35'],
       ['Jornalista', '54', '12051.015'],
       ['Lactarista', '11', '3642.79'],
       ['Locutor', '1', '5303.13'],
       ['Locutor/operador', '5', '6695.08'],
       ['Marceneiro', '50', '5744.95'],
       ['Mecânico', '15', '5920.95'],
       ['Mecânico Manutenção', '3', '946.3'],
       ['Meio Oficial Pedreiro', '5', '4285.94'],
       ['Mestre de Embarcacao', '1', '8406.23'],
       ['Montador de Orquestra', '2', '1755.71'],
       ['Motorista', '366', '3727.74'],
       ['Motorista Maritimo', '2', '5269.87'],
       ['Médico', '415', '15216.07'],
       ['Médico Veterinário', '34', '12044.635'],
       ['Médico do Trabalho', '14', '8135.12'],
       ['Nutricionista', '44', '12500.88'],
       ['Oficial Ar Condicionado Refrigeração', '1', '7117.44'],
       ['Operador de Audiovisual', '45', '7030.67'],
       ['Operador de Caldeira', '14', '4872.53'],
       ['Operador de Computador', '7', '2823.45'],
       ['Operador de Máquinas', '65', '4346.58'],
       ['Operador de Som', '6', '7015.04'],
       ['Operador de Telemonitoramento', '4', '6799.69'],
       ['Orient de Estrut Musical Tec Vocal', '9', '12728.55'],
       ['Orientador de Arte Dramatica', '17', '10238.1'],
       ['PROFEI', '8', '11641.785'],
       ['PROFEM', '48', '9580.185'],
       ['Pedreiro', '77', '4665.45'],
       ['Pescador', '2', '5512.95'],
       ['Pianista Cravista (s)', '1', '7539.7'],
       ['Pintor', '41', '5920.95'],
       ['Procurador', '45', '18071.7'],
       ['Produtor de Comunicacao Visual', '4', '12441.15'],
       ['Produtor de Radio', '2', '14391.91'],
       ['Professor', '18', '2523.48'],
       ['Professor Cálculo Numérico', '1', '2523.48'],
       ['Professor Dr. Química', '3', '2523.48'],
       ['Professor Educ. Artística', '1', '757.04'],
       ['Professor Geografia', '1', '757.04'],
       ['Professor de História', '1', '757.04'],
       ['Professor de Português', '1', '1514.09'],
       ['Professor de Química', '1', '2523.48'],
       ['Programador Computador', '2', '2208.04'],
       ['Programador Musical', '2', '8005.545'],
       ['Psicólogo', '65', '10700.92'],
       ['Publicitario', '3', '15094.08'],
       ['Químico', '50', '13127.375'],
       ['Recepcionista', '95', '3904.2'],
       ['Regente Assistente', '5', '14033.24'],
       ['Regente Titular e Diretor Artistico', '4', '14958.26'],
       ['Relacoes Publicas', '1', '13268.65'],
       ['Revisor', '4', '10253.1'],
       ['Salva Vidas', '18', '2773.37'],
       ['Secretario Executivo', '2', '13234.25'],
       ['Secretária', '3', '2208.04'],
       ['Secretária Executiva', '4', '2208.04'],
       ['Secretário', '781', '7768.52'],
       ['Segundo Solista (s)', '5', '10585.07'],
       ['Segundo Solista (t)', '7', '7898.74'],
       ['Serralheiro', '9', '4975.91'],
       ['Servente', '1', '946.3'],
       ['Soldador', '2', '946.3'],
       ['Sonoplasta Iluminador', '7', '8628.49'],
       ['Supervisor de Vigilancia', '1', '8844.36'],
       ['Tec Assuntos Administrativos', '1684', '5303.13'],
       ['Tec em Equip Hospitalar Clínico', '2', '7421.435'],
       ['Tecnico Agricola', '14', '5731.34'],
       ['Tecnico Em Higiene Dental', '5', '10701.99'],
       ['Tecnico Em Vidraria', '4', '6020.24'],
       ['Tecnico Juridico', '4', '8375.205'],
       ['Tecnico de Documentação e Informação', '183', '7293.15'],
       ['Tecnico de Museu', '24', '6789.19'],
       ['Tecnico de Rede de Computador', '28', '8756.42'],
       ['Tecnico de Telecomunicacoes', '18', '8476.98'],
       ['Tecnólogo', '10', '14905.61'],
       ['Telefonista', '8', '4437.37'],
       ['Terapeuta Ocupacional', '18', '8904.15'],
       ['Topografo Agrimensor', '2', '10259.26'],
       ['Torneiro', '3', '2208.04'],
       ['Tratador de Agua', '7', '4170.58'],
       ['Técnico Acadêmico', '421', '8121.63'],
       ['Técnico Assuntos Financeiros', '115', '8121.63'],
       ['Técnico Contábil e Financeiro', '94', '8270.185'],
       ['Técnico de Apoio Educativo', '148', '5249.55'],
       ['Técnico de Biotério', '20', '6613.43'],
       ['Técnico de Comunicação', '24', '8197.905'],
       ['Técnico de Enfermagem', '439', '5817.57'],
       ['Técnico de Enfermagem do Trabalho', '7', '4991.99'],
       ['Técnico de Gráfica', '61', '7873.76'],
       ['Técnico de Laboratório', '1150', '6990.49'],
       ['Técnico de Manutenção', '2', '8430.755'],
       ['Técnico de Manutenção Eletrônica', '53', '9092.39'],
       ['Técnico de Manutenção/obras', '270', '7605.9'],
       ['Técnico de Necropsia', '15', '6715.76'],
       ['Técnico de Obras', '5', '8693.96'],
       ['Técnico de Recursos Humanos', '138', '9018.635'],
       ['Técnico de Segurança do Trabalho', '28', '6875.465'],
       ['Técnico em Compras', '89', '8453.78'],
       ['Técnico em Informática', '337', '5549.8'],
       ['Técnico em Mecatronica', '1', '6990.49'],
       ['Técnico em Mecânica', '40', '7226.255'],
       ['Técnico em Nutrição e Dietética', '28', '6538.22'],
       ['Técnico em Prótese Dentária', '13', '6808.71'],
       ['Técnico em Radiologia', '55', '7589.68'],
       ['Vendedor', '13', '8236.92'],
       ['Vidraceiro', '3', '5744.95'],
       ['Vigia', '419', '4951.69'],
       ['Violino Spalla (s)', '3', '16245.24'],
       ['Visitador Sanitario', '10', '7996.915'],
       ['Webdesigner', '2', '11044.22'],
       ['Zelador', '30', '4436.46'],
       ['Zootecnista', '2', '15079.515']], 
      dtype='<U39')

In [31]:
np.argmin(resul_med[:,3])


---------------------------------------------------------------------------
IndexError                                Traceback (most recent call last)
<ipython-input-31-b0dd44b523b8> in <module>()
----> 1 np.argmin(resul_med[:,3])

IndexError: index 3 is out of bounds for axis 1 with size 3

In [ ]:
float(resul_sum[70][2]) + float(resul_sum[41][2]) + float(resul_sum[127][2])

In [ ]:
resul_m

In [ ]:
ndat = dat[dat.depto == "Gabinete do Reitor"]

In [ ]:
plt.hist(list(ndat.salario), bins=25)
plt.xlim(0, 10000)

In [ ]:
np.median(ndat.salario)

In [37]:
ndat.to_csv("reitor.csv")

In [ ]: