In [1]:
import pandas as pd
In [2]:
def del_space(ele):
t = [a.capitalize() for a in str(ele).split()]
return ' '.join(t)
def bloques(ele):
nombres_correctos = {
'Alianza Cambiemos': 'Frente PRO',
'Alianza Pro': 'Frente PRO',
'Alianza Unión Pro': 'Frente PRO',
'Frente Pro': 'Frente PRO',
'Frente PRO': 'Frente PRO',
'Alianza Coalición Cívica': 'Coalición Cívica ARI',
'Frente Progresista Ccari': 'Coalición Cívica ARI',
'Coalición Cívica': 'Coalición Cívica ARI',
'Coalición Cívica ARI': 'Coalición Cívica ARI',
'Afirmación Para Una República Igualitaria': 'Coalición Cívica ARI',
'Coalición Cívica Ari': 'Coalición Cívica ARI',
'Alianza Frente Para La Victoria': 'Frente para la Victoria',
'Alianza Frente Para La Victoria Riojano': 'Frente para la Victoria',
'Frente Para La Victoria': 'Frente para la Victoria',
'Pj Frente Para La Victoria': 'Frente para la Victoria',
'Unidad Federalista': 'Frente para la Victoria',
'Frente Renovador De La Concordia': 'Frente para la Victoria',
'Alianza Frente Popular Riojano': 'Frente para la Victoria',
'Alianza Frente Just. Chaco Merece Más': 'Frente para la Victoria',
'Justicialista': 'Frente para la Victoria',
'Movimiento Santiago Viable': 'Frente para la Victoria',
'Frente De Todos': 'Frente para la Victoria',
'Frente De Todos': 'Frente para la Victoria',
'Alianza Partido Justicialista - Frente Justicialista Para La Victoria': 'Frente para la Victoria',
'Justicialista San Luis': 'PJ de San Luis',
'Pj De San Luis': 'PJ de San Luis',
'Alianza Compromiso Federal': 'PJ de San Luis',
'Pj La Pampa': 'PJ La Pampa',
'Partido Justicialista La Pampa': 'PJ La Pampa',
'Frente Popular Salteño': 'Justicialista 8 De Octubre',
'Proyecto Sur Unen': 'Proyecto Sur-UNEN',
'Proyecto Sur-unen': 'Proyecto Sur-UNEN',
'Unión Civica Radical': 'Unión Cívica Radical',
'Unión Por Chaco': 'Unión Cívica Radical',
'Frente Acuerdo Cívico Y Social': 'Unión Cívica Radical',
'Alianza Frente Pampeano Cívico Y Social': 'Unión Cívica Radical',
'Alianza Concertación Para El Desarrollo': 'Unión Cívica Radical',
'Alianza Frente Cívico Federal Ucr-confe': 'Unión Cívica Radical',
'Encuentro Por Corrientes (a.c. Y S.)': 'Unión Cívica Radical',
'Federalismo Santafesino': 'Santa Fe Federal',
'Alianza Santa Fe Federal': 'Santa Fe Federal',
'Santiago Del Estero': 'Frente Cívico Por Santiago',
'Frente Cívico Por Catamarca': 'Frente Cívico Y Social De Catamarca',
'Alianza Frente Cívico Y Social': 'Frente Cívico Y Social De Catamarca',
'Frente Amplio Progresista': 'Gen',
'Alianza Frente Cívico': 'Frente Cívico De La Provincia De Córdoba',
'Frente Progresista Cívico Y Social': 'Partido Socialista',
}
if ele in nombres_correctos.keys():
return nombres_correctos[ele]
else:
return ele
def paises(ele):
nombres_correctos = {' Ecuador': 'Ecuador',
' Irlanda del Norte': 'Irlanda del Norte',
' Suiza': 'Suiza',
'Gran Bretaña': 'Reino Unido de Gran Bretaña',
'Reino Unido': 'Reino Unido de Gran Bretaña',
'Reino Unido de Gran Bretaña': 'Reino Unido de Gran Bretaña',
'República\nCheca': 'República Checa',
'Estados Unidos de América': 'Estados Unidos',
'Corea': 'Corea del Sur',
'Guyana Francesa': 'Guayana',
'Holanda': 'Países Bajos'}
if ele in nombres_correctos.keys():
return nombres_correctos[ele]
else:
return ele
def autoridad_correcta(ele):
autoridad_correcta = {
'ABAL MEDINA, Juan': 'ABAL MEDINA, Juan Manuel',
'AGUIRRE DE SORIA, Hilda': 'AGUIRRE, Hilda Clelia',
'BERMEJO, Adolfo': 'BERMEJO, Rolando Adolfo',
'BERMEJO, Rolando': 'BERMEJO, Rolando Adolfo',
'BERTONE, Rosana': 'BERTONE, Rosana Andrea',
'BIANCALANI, Fabio': 'BIANCALANI, Fabio Dario',
'BONGIORNO, Maria José': 'BONGIORNO, María José',
'BORELLO, María Teresa': 'BORELLO, Marta',
'BORELLO, Marta Teresita': 'BORELLO, Marta',
'CABRAL,Salvador': 'CABRAL, Salvador',
'CASTILLO, Oscar': 'CASTILLO, Oscar Aníbal',
'CIMADEVILLA Mario': 'CIMADEVILLA, Mario Jorge',
'CIMADEVILLA, Mario': 'CIMADEVILLA, Mario Jorge',
'COBOS, Julio': 'COBOS, Julio César',
'COLAZO, Mario': 'COLAZO, Mario Jorge',
'CORRADI, Ana María': 'CORRADI DE BELTRAN, Ana María',
'CORRADI, Ana': 'CORRADI DE BELTRAN, Ana María',
'CORRADI, Ana María': 'CORRADI DE BELTRAN, Ana María',
'CORREGIDO, Elena': 'CORREGIDO, Elena Mercedes',
'CREXELL, Lucila': 'CREXELL, Carmen Lucila',
'DE LA ROSA, Graciela': 'DE LA ROSA, María Graciela',
'DE LA ROSA, Maria': 'DE LA ROSA, María Graciela',
'DE LA ROSA, María': 'DE LA ROSA, María Graciela',
'DIAZ, María Rosa': 'DÍAZ, María Rosa',
'DÍAZ, Maria Rosa': 'DÍAZ, María Rosa',
'ESCUDERO, Sonia': 'ESCUDERO, Sonia Margarita',
'ESTENSSORO, Maria': 'ESTENSSORO, María Eugenia',
'ESTENSSORO, Maria Eugenia': 'ESTENSSORO, María Eugenia',
'FELLNER, Liliana': 'FELLNER, Liliana Beatriz',
'FERNANDEZ, Aníbal': 'FERNÁNDEZ, Aníbal Domingo',
'FERNANDEZ, Aníbal Domingo': 'FERNÁNDEZ, Aníbal Domingo',
'FILMUS, Daniel': 'FILMUS, Daniel Fernando',
'GARCIA LARRABURU, Silvina': 'GARCIA LARRABURU, Silvina Marcela',
'GARCIA LARRABURU, Silvina\nMarcela': 'GARCIA LARRABURU, Silvina Marcela',
'GIACOPPO, Silvia Del Rosario': 'GIACOPPO, Silvia del Rosario',
'GIUSTINIANI Rubén': 'GIUSTINIANI, Rubén Héctor',
'GIUSTINIANI, Ruben': 'GIUSTINIANI, Rubén Héctor',
'GIUSTINIANI, Rubén': 'GIUSTINIANI, Rubén Héctor',
'GIUSTINIANI, Rubén Hector': 'GIUSTINIANI, Rubén Héctor',
'GODOY, Ruperto': 'GODOY, Ruperto Eduardo',
'GONZALEZ, Pablo': 'GONZÁLEZ, Pablo Gerardo',
'GONZALEZ, Pablo Gerardo': 'GONZÁLEZ, Pablo Gerardo',
'GONZÁLEZ, Pablo': 'GONZÁLEZ, Pablo Gerardo',
'HIGONET, Maria': 'HIGONET, María de los Ángeles',
'HIGONET, Maria de los Ángeles': 'HIGONET, María de los Ángeles',
'HIGONET, María de los Angeles': 'HIGONET, María de los Ángeles',
'IRRAZABAL, Juan': 'IRRÁZABAL, Juan Manuel',
'IRRAZABAL, Juan Manuel': 'IRRÁZABAL, Juan Manuel',
'IRRAZÁBAL, Juan': 'IRRÁZABAL, Juan Manuel',
'ITURREZ DE CAPPELLINIi, Ada Hilda': 'ITÚRREZ de CAPPELLINI, Ada Rosa Del Valle',
'ITURREZ DE CAPELLINI, Ada Hilda': 'ITÚRREZ de CAPPELLINI, Ada Rosa Del Valle',
'ITURREZ DE CAPPELLINI, Ada Rosa': 'ITÚRREZ de CAPPELLINI, Ada Rosa Del Valle',
'ITURREZ DE CAPPELLINI, Ada': 'ITÚRREZ de CAPPELLINI, Ada Rosa Del Valle',
'ITURREZ DE CAPPELLINI, Ada Hilda': 'ITÚRREZ de CAPPELLINI, Ada Rosa Del Valle',
'ITURREZ DE CAPPELLINI, Ada Rosa\ndel Valle': 'ITÚRREZ de CAPPELLINI, Ada Rosa Del Valle',
'ITURREZ DE CAPPELLINI, Ada Rosa del Valle': 'ITÚRREZ de CAPPELLINI, Ada Rosa Del Valle',
'ITÚRREZ DE CAPPELLINI, Ada': 'ITÚRREZ de CAPPELLINI, Ada Rosa Del Valle',
'ITÚRREZ de CAPELLINI, Ada': 'ITÚRREZ de CAPPELLINI, Ada Rosa Del Valle',
'KUNATH, Sigrid': 'KUNATH, Sigrid Elisabeth',
'LABADO, María': 'LABADO, María Ester',
'LATORRE. Roxana': 'LATORRE, Roxana',
'LEGUIZAMON, Maria Laura': 'LEGUIZAMÓN, María Laura',
'LEGUIZAMON, María Laura': 'LEGUIZAMÓN, María Laura',
'LOPEZ, Osvaldo': 'LOPEZ, Osvaldo Ramón',
'LUENZO, Alfredo': 'LUENZO, Alfredo Héctor',
'LUNA, Teresa': 'LUNA, Mirtha Teresita',
'LUNA, Teresita': 'LUNA, Mirtha Teresita',
'MARINO, Juan': 'MARINO, Juan Carlos',
'MAYANS, José': 'MAYANS, José Miguel Ángel',
'MAYANS, José Miguel': 'MAYANS, José Miguel Ángel',
'MAYANS, José Miguel Angel': 'MAYANS, José Miguel Ángel',
'MIRKIN, Beatriz': 'MIRKIN, Beatriz Graciela',
'MONTERO Laura': 'MONTERO, Laura Gisela',
'MONTERO, Laura': 'MONTERO, Laura Gisela',
'MORANDINI, Norma': 'MORANDINI, Norma Elena',
'NEGRE DE ALONSO, Liliana': 'NEGRE DE ALONSO, Liliana Teresita',
'PERSICO, Daniel': 'PERSICO, Daniel Raúl',
'PETCOFF NAIDENOFF, Luis': 'PETCOFF NAIDENOFF, Luis Carlos',
'PICHETTO, Miguel Angel': 'PICHETTO, Miguel Ángel',
'PILATTI VERGARA, Maria Inés': 'PILATTI VERGARA, María Inés',
'PILATTI VERGARA, María Ines': 'PILATTI VERGARA, María Inés',
'RACHED, Emilio': 'RACHED, Emilio Alberto',
'RIOFRIO, Marina': 'RIOFRÍO, Marina Raquel',
'RIOFRIO, Marina Raquel': 'RIOFRÍO, Marina Raquel',
'RODRIGUEZ SAA, Adolfo': 'RODRÍGUEZ SAÁ, Adolfo',
'ROJKES, Beatriz': 'ROJKES DE ALPEROVICH, Beatriz',
'ROLDAN, Josè María': 'ROLDAN, José María',
'ROLDAN, José': 'ROLDAN, José María',
'ROLDAN, José Maria': 'ROLDAN, José María',
'ROLDÁN, José': 'ROLDAN, José María',
'ROZAS, Angel': 'ROZAS, Ángel',
'SOLANAS, Fernando': 'SOLANAS, Fernando Ezequiel',
'URTUBEY, Rodolfo': 'URTUBEY, Rodolfo Julio'}
if ele in autoridad_correcta.keys():
return autoridad_correcta[ele]
else:
return ele
In [3]:
# Nombre correcto del destino
csvs = ['../viajes_{0}.csv'.format(i) for i in range(2012, 2018)]
for csv in csvs:
df = pd.read_csv(csv)
df['Destino'] = df['Destino'].apply(paises)
df.to_csv(csv, index=False)
In [4]:
# Nombre correcto del bloque
csvs = ['../viajes_{0}.csv'.format(i) for i in range(2012, 2018)]
for csv in csvs:
df = pd.read_csv(csv)
df['Bloque'] = df['Bloque'].apply(del_space)
df['Bloque'] = df['Bloque'].apply(bloques)
df.to_csv(csv, index=False)
In [5]:
# Nombre correcto de la autoridad
csvs = ['../viajes_{0}.csv'.format(i) for i in range(2012, 2018)]
for csv in csvs:
df = pd.read_csv(csv)
df['Autoridad'] = df['Autoridad'].apply(autoridad_correcta)
df.to_csv(csv, index=False)