In [99]:
import pandas as pd

ano = 2014
arq_ativos = '../datasets/DATAPREV/{0}/despesas/ativ_{0}_quantidade.xls'.format(ano)

# Carrega os dados
# skiprows: pula as 6 primeiras linhas 
# usecols: selecionando as colunas Masculino e Feminino do tipo Urbano e Rural
# index_col: define a primeira coluna como o index

ativos = pd.read_excel(arq_ativos, skiprows=6, usecols=[1,3,4,7,8], index_col = 0)
ativos.drop(['Ignorado','Total'], inplace=True)
ativos.columns = ['M_U','F_U','M_R','M_R' ]

# Dados de 89 anos estão ausentes para os ativos
ap_id = ativos.iloc[0:90]
ap_inv = ativos.iloc[90:180]
ap_tc = ativos.iloc[180:270]

ap_inv.index = [i for i in range(0,90)]

In [103]:
ap_inv['M_U'].describe()


Out[103]:
count       90.000000
mean     16817.044444
std      18283.612912
min          0.000000
25%        215.250000
50%       9518.500000
75%      29921.250000
max      55770.000000
Name: M_U, dtype: float64

In [ ]: