Bloques y Paises

En algunos PDF, los nombre de los paises y de los bloques estan escritos un poco distinto. Los unificamos


In [1]:
import pandas as pd

In [2]:
def del_space(ele):
    t = [a.capitalize() for a in str(ele).split()]
    return ' '.join(t)

    
def bloques(ele):
    nombres_correctos = {
        'Alianza Cambiemos': 'Frente PRO',
        'Alianza Pro': 'Frente PRO',
        'Alianza Unión Pro': 'Frente PRO',
        'Frente Pro': 'Frente PRO',
        'Frente PRO': 'Frente PRO',

        'Alianza Coalición Cívica': 'Coalición Cívica ARI',
        'Frente Progresista Ccari': 'Coalición Cívica ARI',
        'Coalición Cívica': 'Coalición Cívica ARI',
        'Coalición Cívica ARI': 'Coalición Cívica ARI',
        'Afirmación Para Una República Igualitaria': 'Coalición Cívica ARI',
        'Coalición Cívica Ari': 'Coalición Cívica ARI',

        'Alianza Frente Para La Victoria': 'Frente para la Victoria',
        'Alianza Frente Para La Victoria Riojano': 'Frente para la Victoria',
        'Frente Para La Victoria': 'Frente para la Victoria',
        'Pj Frente Para La Victoria': 'Frente para la Victoria',
        'Unidad Federalista': 'Frente para la Victoria',
        'Frente Renovador De La Concordia': 'Frente para la Victoria',
        'Alianza Frente Popular Riojano': 'Frente para la Victoria',
        'Alianza Frente Just. Chaco Merece Más': 'Frente para la Victoria',
        'Justicialista': 'Frente para la Victoria',
        'Movimiento Santiago Viable': 'Frente para la Victoria',
        'Frente De Todos': 'Frente para la Victoria',
        'Frente De Todos': 'Frente para la Victoria',
        'Alianza Partido Justicialista - Frente Justicialista Para La Victoria': 'Frente para la Victoria',

        'Justicialista San Luis': 'PJ de San Luis',
        'Pj De San Luis': 'PJ de San Luis',
        'Alianza Compromiso Federal': 'PJ de San Luis',
        
        'Pj La Pampa': 'PJ La Pampa',
        'Partido Justicialista La Pampa': 'PJ La Pampa',
        
        'Frente Popular Salteño': 'Justicialista 8 De Octubre',

        'Proyecto Sur Unen': 'Proyecto Sur-UNEN',
        'Proyecto Sur-unen': 'Proyecto Sur-UNEN',
        
        'Unión Civica Radical': 'Unión Cívica Radical',
        'Unión Por Chaco': 'Unión Cívica Radical',
        'Frente Acuerdo Cívico Y Social': 'Unión Cívica Radical',
        'Alianza Frente Pampeano Cívico Y Social': 'Unión Cívica Radical',
        'Alianza Concertación Para El Desarrollo': 'Unión Cívica Radical',
        'Alianza Frente Cívico Federal Ucr-confe': 'Unión Cívica Radical',
        'Encuentro Por Corrientes (a.c. Y S.)': 'Unión Cívica Radical',
        
        'Federalismo Santafesino': 'Santa Fe Federal',
        'Alianza Santa Fe Federal': 'Santa Fe Federal',
        
        'Santiago Del Estero': 'Frente Cívico Por Santiago',
        
        'Frente Cívico Por Catamarca': 'Frente Cívico Y Social De Catamarca',
        'Alianza Frente Cívico Y Social': 'Frente Cívico Y Social De Catamarca',
        
        'Frente Amplio Progresista': 'Gen',
        
        'Alianza Frente Cívico': 'Frente Cívico De La Provincia De Córdoba',
        
        'Frente Progresista Cívico Y Social': 'Partido Socialista',
    }

    if ele in nombres_correctos.keys():
        return nombres_correctos[ele]
    else:
        return ele
    
    
def paises(ele):
    nombres_correctos = {' Ecuador': 'Ecuador',
                        ' Irlanda del Norte': 'Irlanda del Norte',
                        ' Suiza': 'Suiza',
                        'Gran Bretaña': 'Reino Unido de Gran Bretaña',
                         'Reino Unido': 'Reino Unido de Gran Bretaña',
                        'Reino Unido de Gran  Bretaña': 'Reino Unido de Gran Bretaña',
                        'República\nCheca': 'República Checa',
                        'Estados Unidos de América': 'Estados Unidos',
                        'Corea': 'Corea del Sur',
                        'Guyana Francesa': 'Guayana',
                        'Holanda': 'Países Bajos'}
    
    if ele in nombres_correctos.keys():
        return nombres_correctos[ele]
    else:
        return ele
    
def autoridad_correcta(ele):
    autoridad_correcta = {
            'ABAL MEDINA, Juan': 'ABAL MEDINA, Juan Manuel',
            'AGUIRRE DE SORIA, Hilda': 'AGUIRRE, Hilda Clelia',
            'BERMEJO, Adolfo': 'BERMEJO, Rolando Adolfo',
            'BERMEJO, Rolando': 'BERMEJO, Rolando Adolfo',
            'BERTONE, Rosana': 'BERTONE, Rosana Andrea',
            'BIANCALANI, Fabio': 'BIANCALANI, Fabio Dario',
            'BONGIORNO, Maria José': 'BONGIORNO, María José',
            'BORELLO, María Teresa': 'BORELLO, Marta',
            'BORELLO, Marta Teresita': 'BORELLO, Marta',
            'CABRAL,Salvador': 'CABRAL, Salvador',
            'CASTILLO, Oscar': 'CASTILLO, Oscar Aníbal',
            'CIMADEVILLA Mario': 'CIMADEVILLA, Mario Jorge', 
            'CIMADEVILLA, Mario': 'CIMADEVILLA, Mario Jorge',
            'COBOS, Julio': 'COBOS, Julio César',
            'COLAZO, Mario': 'COLAZO, Mario Jorge',
            'CORRADI,  Ana María': 'CORRADI DE BELTRAN, Ana María',
            'CORRADI, Ana': 'CORRADI DE BELTRAN, Ana María', 
            'CORRADI, Ana María': 'CORRADI DE BELTRAN, Ana María',
            'CORREGIDO, Elena': 'CORREGIDO, Elena Mercedes',
            'CREXELL, Lucila': 'CREXELL, Carmen Lucila',
            'DE LA ROSA, Graciela': 'DE LA ROSA, María Graciela',
            'DE LA ROSA, Maria': 'DE LA ROSA, María Graciela',
            'DE LA ROSA, María': 'DE LA ROSA, María Graciela',
            'DIAZ, María Rosa': 'DÍAZ, María Rosa', 
            'DÍAZ, Maria Rosa': 'DÍAZ, María Rosa',
            'ESCUDERO, Sonia': 'ESCUDERO, Sonia Margarita',
            'ESTENSSORO, Maria': 'ESTENSSORO, María Eugenia',
            'ESTENSSORO, Maria Eugenia': 'ESTENSSORO, María Eugenia',
            'FELLNER, Liliana': 'FELLNER, Liliana Beatriz', 
            'FERNANDEZ, Aníbal': 'FERNÁNDEZ, Aníbal Domingo',
            'FERNANDEZ, Aníbal Domingo': 'FERNÁNDEZ, Aníbal Domingo',
            'FILMUS, Daniel': 'FILMUS, Daniel Fernando',
            'GARCIA LARRABURU, Silvina': 'GARCIA LARRABURU, Silvina Marcela',
            'GARCIA LARRABURU, Silvina\nMarcela': 'GARCIA LARRABURU, Silvina Marcela',
            'GIACOPPO, Silvia Del Rosario': 'GIACOPPO, Silvia del Rosario',
            'GIUSTINIANI Rubén': 'GIUSTINIANI, Rubén Héctor', 
            'GIUSTINIANI, Ruben': 'GIUSTINIANI, Rubén Héctor', 
            'GIUSTINIANI, Rubén': 'GIUSTINIANI, Rubén Héctor',
            'GIUSTINIANI, Rubén Hector': 'GIUSTINIANI, Rubén Héctor',
            'GODOY, Ruperto': 'GODOY, Ruperto Eduardo', 
            'GONZALEZ, Pablo': 'GONZÁLEZ, Pablo Gerardo',
            'GONZALEZ, Pablo Gerardo': 'GONZÁLEZ, Pablo Gerardo',
            'GONZÁLEZ, Pablo': 'GONZÁLEZ, Pablo Gerardo',
            'HIGONET, Maria': 'HIGONET, María de los Ángeles',
            'HIGONET, Maria de los Ángeles': 'HIGONET, María de los Ángeles', 
            'HIGONET, María de los Angeles': 'HIGONET, María de los Ángeles',
            'IRRAZABAL, Juan': 'IRRÁZABAL, Juan Manuel',
            'IRRAZABAL, Juan Manuel': 'IRRÁZABAL, Juan Manuel',
            'IRRAZÁBAL, Juan': 'IRRÁZABAL, Juan Manuel',
            'ITURREZ  DE CAPPELLINIi, Ada Hilda': 'ITÚRREZ de CAPPELLINI, Ada Rosa Del Valle',
            'ITURREZ DE CAPELLINI, Ada Hilda': 'ITÚRREZ de CAPPELLINI, Ada Rosa Del Valle',
            'ITURREZ DE CAPPELLINI,  Ada Rosa': 'ITÚRREZ de CAPPELLINI, Ada Rosa Del Valle',
            'ITURREZ DE CAPPELLINI, Ada': 'ITÚRREZ de CAPPELLINI, Ada Rosa Del Valle',
            'ITURREZ DE CAPPELLINI, Ada Hilda': 'ITÚRREZ de CAPPELLINI, Ada Rosa Del Valle',
            'ITURREZ DE CAPPELLINI, Ada Rosa\ndel Valle': 'ITÚRREZ de CAPPELLINI, Ada Rosa Del Valle',
            'ITURREZ DE CAPPELLINI, Ada Rosa del Valle': 'ITÚRREZ de CAPPELLINI, Ada Rosa Del Valle',
            'ITÚRREZ DE CAPPELLINI, Ada': 'ITÚRREZ de CAPPELLINI, Ada Rosa Del Valle', 
            'ITÚRREZ de CAPELLINI, Ada': 'ITÚRREZ de CAPPELLINI, Ada Rosa Del Valle',
            'KUNATH, Sigrid': 'KUNATH, Sigrid Elisabeth', 
            'LABADO, María': 'LABADO, María Ester', 
            'LATORRE. Roxana': 'LATORRE, Roxana',
            'LEGUIZAMON, Maria Laura': 'LEGUIZAMÓN, María Laura', 
            'LEGUIZAMON, María Laura': 'LEGUIZAMÓN, María Laura',
            'LOPEZ, Osvaldo': 'LOPEZ, Osvaldo Ramón',
            'LUENZO, Alfredo': 'LUENZO, Alfredo Héctor',
            'LUNA, Teresa': 'LUNA, Mirtha Teresita',  
            'LUNA, Teresita': 'LUNA, Mirtha Teresita', 
            'MARINO, Juan': 'MARINO, Juan Carlos',
            'MAYANS, José': 'MAYANS, José Miguel Ángel',
            'MAYANS, José Miguel': 'MAYANS, José Miguel Ángel', 
            'MAYANS, José Miguel Angel': 'MAYANS, José Miguel Ángel',
            'MIRKIN, Beatriz': 'MIRKIN, Beatriz Graciela',
            'MONTERO Laura': 'MONTERO, Laura Gisela', 
            'MONTERO, Laura': 'MONTERO, Laura Gisela',
            'MORANDINI, Norma': 'MORANDINI, Norma Elena',
            'NEGRE DE ALONSO, Liliana': 'NEGRE DE ALONSO, Liliana Teresita',
            'PERSICO, Daniel': 'PERSICO, Daniel Raúl',
            'PETCOFF NAIDENOFF, Luis': 'PETCOFF NAIDENOFF, Luis Carlos',
            'PICHETTO, Miguel Angel': 'PICHETTO, Miguel  Ángel',
            'PILATTI VERGARA, Maria Inés': 'PILATTI VERGARA, María Inés',
            'PILATTI VERGARA, María Ines': 'PILATTI VERGARA, María Inés',
            'RACHED, Emilio': 'RACHED, Emilio Alberto', 
            'RIOFRIO, Marina': 'RIOFRÍO, Marina Raquel',
            'RIOFRIO, Marina Raquel': 'RIOFRÍO, Marina Raquel',
            'RODRIGUEZ SAA, Adolfo': 'RODRÍGUEZ SAÁ, Adolfo',
            'ROJKES, Beatriz': 'ROJKES DE ALPEROVICH, Beatriz',
            'ROLDAN, Josè María': 'ROLDAN, José María', 
            'ROLDAN, José': 'ROLDAN, José María',
            'ROLDAN, José Maria': 'ROLDAN, José María', 
            'ROLDÁN, José': 'ROLDAN, José María',
            'ROZAS, Angel': 'ROZAS, Ángel',
            'SOLANAS, Fernando': 'SOLANAS, Fernando Ezequiel', 
            'URTUBEY, Rodolfo': 'URTUBEY, Rodolfo Julio'}
    
    if ele in autoridad_correcta.keys():
        return autoridad_correcta[ele]
    else:
        return ele

In [3]:
# Nombre correcto del destino
csvs = ['../viajes_{0}.csv'.format(i) for i in range(2012, 2018)]

for csv in csvs:
    df = pd.read_csv(csv)
    df['Destino'] = df['Destino'].apply(paises)
    df.to_csv(csv, index=False)

In [4]:
# Nombre correcto del bloque
csvs = ['../viajes_{0}.csv'.format(i) for i in range(2012, 2018)]

for csv in csvs:
    df = pd.read_csv(csv)
    df['Bloque'] = df['Bloque'].apply(del_space)
    df['Bloque'] = df['Bloque'].apply(bloques)
    df.to_csv(csv, index=False)

In [5]:
# Nombre correcto de la autoridad
csvs = ['../viajes_{0}.csv'.format(i) for i in range(2012, 2018)]

for csv in csvs:
    df = pd.read_csv(csv)
    df['Autoridad'] = df['Autoridad'].apply(autoridad_correcta)
    df.to_csv(csv, index=False)