In [99]:
import pandas as pd
ano = 2014
arq_ativos = '../datasets/DATAPREV/{0}/despesas/ativ_{0}_quantidade.xls'.format(ano)
# Carrega os dados
# skiprows: pula as 6 primeiras linhas
# usecols: selecionando as colunas Masculino e Feminino do tipo Urbano e Rural
# index_col: define a primeira coluna como o index
ativos = pd.read_excel(arq_ativos, skiprows=6, usecols=[1,3,4,7,8], index_col = 0)
ativos.drop(['Ignorado','Total'], inplace=True)
ativos.columns = ['M_U','F_U','M_R','M_R' ]
# Dados de 89 anos estão ausentes para os ativos
ap_id = ativos.iloc[0:90]
ap_inv = ativos.iloc[90:180]
ap_tc = ativos.iloc[180:270]
ap_inv.index = [i for i in range(0,90)]
In [103]:
ap_inv['M_U'].describe()
Out[103]:
In [ ]: