In [22]:
%matplotlib inline

In [23]:
import datetime

In [24]:
import pandas as pd

In [25]:
councilman = pd.read_csv('../data/sequential_id.csv')
secreataries = pd.read_csv('../data/secretary-councilman.csv')

# sequencial dos vereadores de são paulo
sequencial = councilman.sequential_id.tolist()
sequencial.extend(secreataries.sequential_id.tolist())

In [36]:
df = pd.read_csv(
    '/home/flavio/Downloads/bem_candidato_2016/bem_candidato_2016_SP.txt',
    encoding='iso-8859-1', sep=';', decimal=',', thousands='.', 
    names=['DATA_GERACAO', 'HORA_GERACAO', 'ANO_ELEICAO', 
           'DESCRICAO_ELEICAO', 'UF', 'SQ_CAND', 'CD_TIPO_BEM', 'DS_TIPO_BEM', 
           'DETALHE_BEM', 'VALOR_BEM', 'DATA_ULTIMA_ATU', 'HORA_ULTIMA_ATU'],
    usecols=['SQ_CAND', 'DS_TIPO_BEM', 'DETALHE_BEM', 'VALOR_BEM'],
    index_col=False
)

In [37]:
df.head(10)


Out[37]:
SQ_CAND DS_TIPO_BEM DETALHE_BEM VALOR_BEM
0 250000004546 Casa CASA DE MORADA 250000
1 250000004546 Outros bens móveis CAMINHONETE MARCA CHEVROLET MODELO S-10 4X4 AN... 95000
2 250000004546 Outros bens imóveis PROPRIEDADE AGRÍCOLA DENOMINADA SITIO SÔ CÂNDI... 350000
3 250000004547 Casa CASA DE MORADA 224777.2
4 250000004547 Outros bens móveis VEICULO MARCA VW MODELO CROSSFOX ANO 2010/2011 51000
5 250000004548 Casa IMOVEL RESIDENCIAL 23500
6 250000004548 Linha telefônica LINHA TELEFONICA ADQUIRIDA 3428.88
7 250000004548 Quotas ou quinhões de capital COTA DE EMPRESA JRB MONTAGENS 57000
8 250000004548 Quotas ou quinhões de capital COOPERATIVA RURAL COONAI, ATLTERADO PARA CREDI... 525.68
9 250000004548 Depósito bancário em conta corrente no País COOPERATIVA DE CREDITO CREDICOONAI 1378.88

In [38]:
df['VALOR_BEM'] = df.VALOR_BEM.astype(float)

In [39]:
df['election_year'] = 2016

In [40]:
df = df[df['SQ_CAND'].isin(sequencial)]

In [41]:
df.head(1)


Out[41]:
SQ_CAND DS_TIPO_BEM DETALHE_BEM VALOR_BEM election_year
761 250000004979 Apartamento AVENIDA APRIGIO BEZERRA DA SILVA, 1415 - APTO.... 200000.0 2016

In [42]:
df = df.rename(columns={
    'SQ_CAND': 'sequential_id', 
    'DS_TIPO_BEM': 'kind', 
    'DETALHE_BEM': 'description',
    'VALOR_BEM': 'value', 
})

In [43]:
today = datetime.date.today()
df.to_csv(f"../data/{today}-property.csv", index=False)

In [ ]: