In [1]:
from datetime import datetime
import pandas as pd
import pandas.io.data
import numpy as np
import scipy as sp
import matplotlib.pyplot as plt
pd.set_option('max_columns', 50)
%matplotlib inline
In [2]:
# Leer los archivos
ddaa_bad = pd.read_csv('Derechos_Concedidos_V_Region-xls-Petorca-WGS84-csv-V3.csv')
ddaa_raw = pd.read_csv('Derechos_Concedidos_V_Region-xls-Petorca-raw.csv')
In [3]:
print len(ddaa_bad['Fecha de Resolución/ Envío al Juez/ Inscripción C.B.R.'])
print len(ddaa_raw['Fecha de Resolución/ Envío al Juez/ Inscripción C.B.R.'])
In [4]:
#ddaa_bad['indice'] = ddaa_bad.apply(lambda x: x['Código de \nExpediente'] + ',' + str(x['N° \nSolicitud']), 1)
#ddaa_raw['indice'] = ddaa_raw.apply(lambda x: x['Código de \nExpediente'] + ',' + str(x['N° \nSolicitud']), 1)
In [5]:
print len(ddaa_bad.columns)
print len(ddaa_raw.columns)
In [6]:
ddaa_bad.set_index('N°',inplace=True)
ddaa_raw.set_index('N°',inplace=True)
In [7]:
print ddaa_bad.index.get_duplicates()
print ddaa_raw.index.get_duplicates()
In [8]:
#ddaa_bad.ix[254]
In [9]:
ddaa_bad["index"] = ddaa_bad.index
ddaa_bad.drop_duplicates('index', take_last=False, inplace=True)
ddaa_bad.drop('index', axis=1, inplace=True)
In [10]:
print ddaa_bad.index.get_duplicates()
print ddaa_raw.index.get_duplicates()
In [11]:
#ddaa_bad.drop('Fecha de Resolución/ Envío al Juez/ Inscripción C.B.R.', axis=1, inplace=True)
In [12]:
lost = np.setdiff1d(ddaa_raw.index.values,ddaa_bad.index.values)
ddaa_lost = ddaa_raw.ix[lost]
ddaa_lost.to_csv('Derechos_Concedidos_V_Region-xls-Petorca-raw_lost.csv')
In [13]:
ddaa_bad.rename(columns={'Fecha de Resolución/ Envío al Juez/ Inscripción C.B.R.': 'Fecha'}, inplace=True)
In [14]:
ddaa_good = ddaa_bad.join(ddaa_raw['Fecha de Resolución/ Envío al Juez/ Inscripción C.B.R.'])
In [15]:
#ddaa_good[['Fecha de Resolución/ Envío al Juez/ Inscripción C.B.R.','Fecha']].tail()
In [16]:
ddaa_good.drop('Fecha', axis=1, inplace=True)
In [17]:
ddaa_good.to_csv('Derechos_Concedidos_V_Region-xls-Petorca-WGS84-csv-V4.csv')
In [18]:
print len(ddaa_good['Fecha de Resolución/ Envío al Juez/ Inscripción C.B.R.'])
In [19]:
#ddaa_good['Fecha de Resolución/ Envío al Juez/ Inscripción C.B.R.'].describe()
In [20]:
#ddaa_good.to_csv('Derechos_Concedidos_V_Region-xls-Petorca-WGS84-csv-V4.csv')
In [21]:
#%qtconsole
In [22]:
#ddaa_raw['indice'] = ddaa_raw.apply(lambda x: x['Código de \nExpediente'] + ',' + str(x['N° \nSolicitud']), 1)
In [23]:
#ddaa_bad.columns
In [24]:
#ddaa_raw.to_csv('test.csv')