In [151]:

    
import pandas as pd
pd.set_option('display.mpl_style', 'default') # Make the graphs a bit prettier
# Variável para evitar impressão de logs para gerar o PDF
impressao = True #Coloque False caso queira imprimir os logs

Funções gerais



In [152]:

    
def consulta_refext(row, name_file, name_col_ref, name_col_filt, name_col_search):
    """
    Traz valor de referência externa (em arquivo csv) baseado em valor de referência do arquivo de origem.
    O primeiro argumento passado é a "linha".
    O segundo argumento é o nome do arquivo csv que será consultado (indicar o nome com a extensão .csv)
    O terceiro argumento é o nome da coluna no dataframe (.csv) consultado que servirá de refência para a localização 
    O quarto argumento é o nome da coluna de filtro do dataframe atual
    O quinto argumento é o nome da coluna no dataframe (.csv) consultado que contém o valor a ser retornado.
        Uso:
        od2007_ex['coluna a receber o valor'] = od2007_ex.apply(lambda row: consulta_refext(row, 'filename.csv', 'reference column', 'filter column', 'searched column'), axis=1)
    """
    if row [name_col_filt]==0:
        return row[name_col_filt]
    data_frame = pd.read_csv(name_file,sep=';')
    return int(data_frame[data_frame[name_col_ref]==row[name_col_filt]][name_col_search])



In [153]:

    
def verifica_DUMMY(data_frame, nome_variavel):
    """
    Verifica se uma variável, dummy, contém algum valor diferente de 0 ou de 1.
        Uso:
        
    """
    contador_de_erros = 0
    for index, value in data_frame.iterrows():
        if int(value[nome_variavel]) != 1 and int(value[nome_variavel]) != 0:
            if not impressao:
                print("Erro encontrado no registro " + str(index+1) + ". Valor encontrado: " + str(value[nome_variavel]))
            contador_de_erros += 1
    print("Total de erros encontrados: " + str(contador_de_erros))



In [154]:

    
def substitui_CD_ENTRE(row):
    """
    Substitui, na variável CD_ENTRE, 5 por 0 e 6 por 1
    Recebe como entrada uma "linha" do DataFrame e retorna o valor "correto"
        Uso:
        dataframe['CD_ENTRE'] = dataframe.apply(lambda row: substitui_CD_ENTRE(row), axis=1)
    """
    if row['CD_ENTRE'] == 5:
        return 0
    elif row['CD_ENTRE'] == 6:
        return 1
    else:
        print("Erro encontrado. Linhda com erro:\n")
        print(row)
        print("Retornando o valor já existente na célula")
        return row['CD_ENTRE']



In [155]:

    
def gera_ID_DOM(row):
    """
    Gera o ID_DOM baseado no 'ANO', na 'ZONA_DOM' e no 'NO_DOM'
    O argumento passado é a "linha".
        Uso:
        od2007_ex['ID_DOM'] = od2007_ex.apply(lambda row: gera_ID_DOM(row), axis=1)
    """
    ano = int(row['ANO'])
    zona = int(row['ZONA_DOM'])
    no_dom = int(row['NO_DOM'])
    return int(str(ano)+str('%03d'%(zona)) + str('%04d'%(no_dom)))



In [156]:

    
def gera_ID_FAM(row):
    """
    Gera o ID_FAM baseado no 'ID_DOM' e no 'NO_FAM'
    O argumento passado é a "linha".
        Uso:
        od2007_ex['ID_FAM'] = od2007_ex.apply(lambda row: gera_ID_FAM(row), axis=1)
    """
    id_dom = int(row['ID_DOM'])
    no_fam = int(row['NO_FAM'])
    return int(str(id_dom) + str('%02d'%(no_fam)))



In [157]:

    
def gera_ID_PESS(row):
    """
    Gera o ID_PESS baseado no 'ID_FAM' e no 'NO_PESS'
    O argumento passado é a "linha".
        Uso:
        od2007_ex['ID_PESS'] = od2007_ex.apply(lambda row: gera_ID_PESS(row), axis=1)
    """
    id_fam = int(row['ID_FAM'])
    no_pess = int(row['NO_PESS'])
    return int(str(id_fam) + str('%02d'%(no_pess)))



In [158]:

    
def gera_ID_VIAG(row):
    """
    Gera o ID_VIAG baseado no 'ID_PESS' e no 'NO_VIAG'
    O argumento passado é a "linha".
        Uso:
        od2007_ex['ID_VIAG'] = od2007_ex.apply(lambda row: gera_ID_VIAG(row), axis=1)
    """
    id_pess = int(row['ID_PESS'])
    no_viag = int(row['NO_VIAG'])
    return int(str(id_pess) + str('%02d'%(no_viag)))



In [159]:

    
#Reading csv file and store its contend in an intern dataframe
od2007_ex = pd.read_csv('exemplo_OD2007.csv', sep=';', decimal=',')



In [160]:

    
#Reading csv file and store its contend in an intern dataframe
addcol_2007_ex = pd.read_csv('OD_2007_addcol.csv', sep=';', decimal=',')
addcol_2007_ex = addcol_2007_ex[:5000]



In [161]:

    
#Replacing a column from a dataframe to another
od2007_ex['OCUP'] = addcol_2007_ex['CD_ATIV']



In [162]:

    
#Renaming the column UCOD to UCOD_DOM
od2007_ex.rename(columns={'UCOD':'UCOD_DOM'}, inplace=True)



In [163]:

    
#Creating the column UCOD_ESC (it will go to the end of dataframe)
od2007_ex['UCOD_ESC']=None



In [164]:

    
#Creating the column UCOD_TRAB1 (it will go to the end of dataframe)
od2007_ex['UCOD_TRAB1']=None



In [165]:

    
#Creating the column UCOD_TRAB2 (it will go to the end of dataframe)
od2007_ex['UCOD_TRAB2']=None



In [166]:

    
#Creating the column UCOD_ORIG (it will go to the end of dataframe)
od2007_ex['UCOD_ORIG']=None



In [167]:

    
#Creating the column UCOD_DEST (it will go to the end of dataframe)
od2007_ex['UCOD_DEST']=None



In [168]:

    
#Reordering the columns, precisely, these that were just created (at the end of dataframe) near to other contend related variables
od2007_ex = od2007_ex[['UCOD_DOM',
 'ANO',
 'CD_ENTRE',
 'DIA_SEM',
 'ZONA_DOM',
 'SUBZONA_DOM',
 'MUN_DOM',
 'CO_DOM_X',
 'CO_DOM_Y',
 'ID_DOM',
 'F_DOM',
 'FE_DOM',
 'NO_DOM',
 'TIPO_DOM',
 'TOT_FAM',
 'ID_FAM',
 'F_FAM',
 'FE_FAM',
 'NO_FAM',
 'COND_MORA',
 'QT_AUTO',
 'QT_BICI',
 'QT_MOTO',
 'CD_RENFAM',
 'REN_FAM',
 'ID_PESS',
 'F_PESS',
 'FE_PESS',
 'NO_PESS',
 'SIT_FAM',
 'IDADE',
 'SEXO',
 'ESTUDA',
 'GRAU_INSTR',
 'OCUP',
 'SETOR_ATIV',
 'CD_RENIND',
 'REN_IND',
 'UCOD_ESC',
 'ZONA_ESC',
 'SUBZONA_ESC',
 'MUN_ESC',
 'CO_ESC_X',
 'CO_ESC_Y',
 'UCOD_TRAB1',                      
 'ZONA_TRAB1',
 'SUBZONA_TRAB1',
 'MUN_TRAB1',
 'CO_TRAB1_X',
 'CO_TRAB1_Y',
 'UCOD_TRAB2',
 'ZONA_TRAB2',
 'SUBZONA_TRAB2',
 'MUN_TRAB2',
 'CO_TRAB2_X',
 'CO_TRAB2_Y',
 'ID_VIAG',
 'F_VIAG',
 'FE_VIAG',
 'NO_VIAG',
 'TOT_VIAG',
 'UCOD_ORIG',
 'ZONA_ORIG',
 'SUBZONA_ORIG',
 'MUN_ORIG',
 'CO_ORIG_X',
 'CO_ORIG_Y',
 'UCOD_DEST',
 'ZONA_DEST',
 'SUBZONA_DEST',
 'MUN_DEST',
 'CO_DEST_X',
 'CO_DEST_Y',
 'DIST_VIAG',
 'MOTIVO_ORIG',
 'MOTIVO_DEST',
 'MODO1',
 'MODO2',
 'MODO3',
 'MODO4',
 'MODO_PRIN',
 'TIPO_VIAG',
 'H_SAIDA',
 'MIN_SAIDA',
 'ANDA_ORIG',
 'H_CHEG',
 'MIN_CHEG',
 'ANDA_DEST',
 'DURACAO',
 'TIPO_EST_AUTO',
 'VALOR_EST_AUTO']]



In [169]:

    
#Storing the variables list in the "cols" variable
cols = od2007_ex.columns.tolist()
if not impressao:
    #printing "cols" variable to check if the reorder operation was effective
    cols









    Out[169]:





['UCOD_DOM',
 'ANO',
 'CD_ENTRE',
 'DIA_SEM',
 'ZONA_DOM',
 'SUBZONA_DOM',
 'MUN_DOM',
 'CO_DOM_X',
 'CO_DOM_Y',
 'ID_DOM',
 'F_DOM',
 'FE_DOM',
 'NO_DOM',
 'TIPO_DOM',
 'TOT_FAM',
 'ID_FAM',
 'F_FAM',
 'FE_FAM',
 'NO_FAM',
 'COND_MORA',
 'QT_AUTO',
 'QT_BICI',
 'QT_MOTO',
 'CD_RENFAM',
 'REN_FAM',
 'ID_PESS',
 'F_PESS',
 'FE_PESS',
 'NO_PESS',
 'SIT_FAM',
 'IDADE',
 'SEXO',
 'ESTUDA',
 'GRAU_INSTR',
 'OCUP',
 'SETOR_ATIV',
 'CD_RENIND',
 'REN_IND',
 'UCOD_ESC',
 'ZONA_ESC',
 'SUBZONA_ESC',
 'MUN_ESC',
 'CO_ESC_X',
 'CO_ESC_Y',
 'UCOD_TRAB1',
 'ZONA_TRAB1',
 'SUBZONA_TRAB1',
 'MUN_TRAB1',
 'CO_TRAB1_X',
 'CO_TRAB1_Y',
 'UCOD_TRAB2',
 'ZONA_TRAB2',
 'SUBZONA_TRAB2',
 'MUN_TRAB2',
 'CO_TRAB2_X',
 'CO_TRAB2_Y',
 'ID_VIAG',
 'F_VIAG',
 'FE_VIAG',
 'NO_VIAG',
 'TOT_VIAG',
 'UCOD_ORIG',
 'ZONA_ORIG',
 'SUBZONA_ORIG',
 'MUN_ORIG',
 'CO_ORIG_X',
 'CO_ORIG_Y',
 'UCOD_DEST',
 'ZONA_DEST',
 'SUBZONA_DEST',
 'MUN_DEST',
 'CO_DEST_X',
 'CO_DEST_Y',
 'DIST_VIAG',
 'MOTIVO_ORIG',
 'MOTIVO_DEST',
 'MODO1',
 'MODO2',
 'MODO3',
 'MODO4',
 'MODO_PRIN',
 'TIPO_VIAG',
 'H_SAIDA',
 'MIN_SAIDA',
 'ANDA_ORIG',
 'H_CHEG',
 'MIN_CHEG',
 'ANDA_DEST',
 'DURACAO',
 'TIPO_EST_AUTO',
 'VALOR_EST_AUTO']



In [170]:

    
if not impressao:
    #Describing data (whole dataframe)- count, mean, std, min and max
    od2007_ex.describe()









    Out[170]:






  
    
      
      UCOD_DOM
      ANO
      CD_ENTRE
      DIA_SEM
      ZONA_DOM
      SUBZONA_DOM
      MUN_DOM
      CO_DOM_X
      CO_DOM_Y
      ID_DOM
      ...
      TIPO_VIAG
      H_SAIDA
      MIN_SAIDA
      ANDA_ORIG
      H_CHEG
      MIN_CHEG
      ANDA_DEST
      DURACAO
      TIPO_EST_AUTO
      VALOR_EST_AUTO
    
  
  
    
      count
      0
      0
      5000.000000
      5000.000000
      5000.000000
      0
      5000
      5000.000000
      5000.000000
      5000.000000
      ...
      5000.000000
      5000.000000
      5000.000000
      5000.000000
      5000.000000
      5000.00000
      5000.000000
      5000.000000
      5000.000000
      5000.000000
    
    
      mean
      NaN
      NaN
      5.955000
      3.505800
      6.196600
      NaN
      36
      333194.919400
      7396076.016600
      63683.969000
      ...
      1.944200
      11.159000
      15.863200
      1.708400
      11.415000
      18.36280
      1.680600
      24.195600
      0.329800
      0.961800
    
    
      std
      NaN
      NaN
      0.207325
      2.022074
      2.768299
      NaN
      0
      1054.619144
      1254.622705
      27216.197166
      ...
      1.152281
      6.536778
      18.340681
      3.703473
      6.613919
      18.10171
      3.592654
      25.497462
      1.212488
      12.430287
    
    
      min
      NaN
      NaN
      5.000000
      0.000000
      1.000000
      NaN
      36
      331372.000000
      7393989.000000
      10001.000000
      ...
      0.000000
      0.000000
      0.000000
      0.000000
      0.000000
      0.00000
      0.000000
      0.000000
      0.000000
      0.000000
    
    
      25%
      NaN
      NaN
      6.000000
      2.000000
      4.000000
      NaN
      36
      332308.000000
      7394890.000000
      41447.000000
      ...
      1.000000
      7.000000
      0.000000
      0.000000
      7.000000
      0.00000
      0.000000
      7.000000
      0.000000
      0.000000
    
    
      50%
      NaN
      NaN
      6.000000
      4.000000
      6.000000
      NaN
      36
      332999.500000
      7396106.000000
      67044.000000
      ...
      2.000000
      12.000000
      0.000000
      0.000000
      12.000000
      15.00000
      0.000000
      15.000000
      0.000000
      0.000000
    
    
      75%
      NaN
      NaN
      6.000000
      5.000000
      8.000000
      NaN
      36
      333780.000000
      7397231.000000
      81210.000000
      ...
      3.000000
      17.000000
      30.000000
      1.000000
      17.000000
      30.00000
      1.000000
      30.000000
      0.000000
      0.000000
    
    
      max
      NaN
      NaN
      6.000000
      6.000000
      11.000000
      NaN
      36
      336071.000000
      7398071.000000
      111201.000000
      ...
      4.000000
      23.000000
      59.000000
      40.000000
      23.000000
      58.00000
      40.000000
      210.000000
      8.000000
      500.000000
    
  

8 rows × 86 columns

Passo 1: UCOD_DOM

Na coluna "UCOD_DOM", linha i, ler o valor da linha i da coluna "ZONA_DOM", daí, buscar o mesmo valor na coluna "Zona 2007" do arquivo UCOD-2007.csv. Ao achar, retornar o valor da mesma linha, só que da coluna "UCOD_DOM"

[Teste: no banco completo, checar se o min == 1 e o max == 67]



In [171]:

    
#Getting from the csv file the "UCOD" code correspondent to the "ZONA_DOM" code
od2007_ex['UCOD_DOM'] = od2007_ex.apply(lambda row: consulta_refext(row, 'UCOD-2007.csv', 'Zona 2007', 'ZONA_DOM', 'UCOD'), axis=1)



In [172]:

    
if not impressao:
    #Describing data ("UCOD_DOM" column) - count, mean, std, min and max
    od2007_ex['UCOD_DOM'].describe()









    Out[172]:





count    5000.000000
mean        2.559400
std         1.673748
min         1.000000
25%         1.000000
50%         1.000000
75%         4.000000
max         5.000000
Name: UCOD_DOM, dtype: float64



In [173]:

    
if not impressao:
    #Count for check "UCOD_DOM"
    od2007_ex['UCOD_DOM'].value_counts()









    Out[173]:





1    2632
4    1675
5     693
dtype: int64



In [174]:

    
if not impressao:
    #Verifying value interval for check - conditions: "UCOD_DOM < 1" and "UCOD_DOM > 67"
    od2007_ex[(od2007_ex['UCOD_DOM']<1) | (od2007_ex['UCOD_DOM']>67)]









    Out[174]:






  
    
      
      UCOD_DOM
      ANO
      CD_ENTRE
      DIA_SEM
      ZONA_DOM
      SUBZONA_DOM
      MUN_DOM
      CO_DOM_X
      CO_DOM_Y
      ID_DOM
      ...
      TIPO_VIAG
      H_SAIDA
      MIN_SAIDA
      ANDA_ORIG
      H_CHEG
      MIN_CHEG
      ANDA_DEST
      DURACAO
      TIPO_EST_AUTO
      VALOR_EST_AUTO
    
  
  
  

0 rows × 91 columns

Passo 2: "ANO"

Preencher a coluna "ANO" com valor 4 em todas células

Categorias:

valor	ano_correspondente
1	1977
2	1988
3	1997
4	2007



In [175]:

    
#Assigning value '4' to all cels of the "ANO" column
od2007_ex["ANO"]=4



In [176]:

    
if not impressao:
    #Describing data ("ANO" column) - count, mean, std, min and max
    od2007_ex['ANO'].describe()









    Out[176]:





count    5000
mean        4
std         0
min         4
25%         4
50%         4
75%         4
max         4
Name: ANO, dtype: float64

Passo 3: "CD_ENTRE"

Substituir todos valores 5 por 0.
Substituir todos valores 6 por 1.

Categorias:

Valor	Descricao
0	Completa sem viagem
1	Completa com Viagem



In [177]:

    
if not impressao:
    #Counting for check "CD_ENTRE"
    od2007_ex['CD_ENTRE'].value_counts()









    Out[177]:





6    4775
5     225
dtype: int64



In [178]:

    
#Replacing the values 5 for 0
od2007_ex.loc[od2007_ex['CD_ENTRE']==5,'CD_ENTRE'] = 0
#Replacing the values 6 for 1
od2007_ex.loc[od2007_ex['CD_ENTRE']==6,'CD_ENTRE'] = 1



In [179]:

    
if not impressao:
    #Counting "CD_ENTRE" in order to compare the values before and after the replacement
    od2007_ex['CD_ENTRE'].value_counts()









    Out[179]:





1    4775
0     225
dtype: int64



In [180]:

    
#Verifying if there was left some value other than 0 or 1
verifica_DUMMY(od2007_ex, 'CD_ENTRE')









    



Total de erros encontrados: 0

Passo 4: "DIA_SEM"

Checar se existe algum erro na coluna

Categorias:

Valor	Descrição
2	Segunda-Feira
3	Terça-Feira
4	Quarta-Feira
5	Quinta-Feira
6	Sexta-Feira

[Teste: Checar se existe algum número < 2 ou > 6. Se encontrar, retornar erro indicando em qual linha.]



In [181]:

    
if not impressao:
    #Counting for check "DIA_SEM"
    od2007_ex['DIA_SEM'].value_counts()









    Out[181]:





6    1246
2    1078
4     886
0     705
5     549
3     536
dtype: int64



In [182]:

    
if not impressao:
    #Verifying value interval for check - conditions: "DIA_SEM < 1" and "DIA_SEM > 67"
    od2007_ex[(od2007_ex['DIA_SEM']<2) | (od2007_ex['DIA_SEM']>6)]









    Out[182]:






  
    
      
      UCOD_DOM
      ANO
      CD_ENTRE
      DIA_SEM
      ZONA_DOM
      SUBZONA_DOM
      MUN_DOM
      CO_DOM_X
      CO_DOM_Y
      ID_DOM
      ...
      TIPO_VIAG
      H_SAIDA
      MIN_SAIDA
      ANDA_ORIG
      H_CHEG
      MIN_CHEG
      ANDA_DEST
      DURACAO
      TIPO_EST_AUTO
      VALOR_EST_AUTO
    
  
  
    
      4
      1
      4
      1
      0
      1
      NaN
      36
      333858
      7394484
      10018
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      9
      1
      4
      1
      0
      1
      NaN
      36
      333801
      7394422
      10019
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      71
      1
      4
      1
      0
      1
      NaN
      36
      333622
      7394465
      11018
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      72
      1
      4
      1
      0
      1
      NaN
      36
      333622
      7394465
      11018
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      88
      1
      4
      1
      0
      1
      NaN
      36
      333739
      7394550
      11027
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      105
      1
      4
      1
      0
      1
      NaN
      36
      333683
      7394479
      11033
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      140
      1
      4
      0
      0
      1
      NaN
      36
      333807
      7394422
      11066
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      143
      1
      4
      1
      0
      1
      NaN
      36
      333800
      7394465
      11067
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      146
      1
      4
      1
      0
      1
      NaN
      36
      333738
      7394460
      11073
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      155
      1
      4
      1
      0
      1
      NaN
      36
      333739
      7394550
      11077
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      205
      1
      4
      1
      0
      1
      NaN
      36
      333729
      7394551
      11132
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      216
      1
      4
      1
      0
      1
      NaN
      36
      333739
      7394550
      11134
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      245
      1
      4
      1
      0
      1
      NaN
      36
      333739
      7394550
      11161
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      246
      1
      4
      1
      0
      1
      NaN
      36
      333739
      7394550
      11161
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      253
      1
      4
      0
      0
      1
      NaN
      36
      333880
      7394458
      11162
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      256
      1
      4
      1
      0
      1
      NaN
      36
      333728
      7394534
      11165
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      257
      1
      4
      1
      0
      1
      NaN
      36
      333728
      7394534
      11165
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      280
      1
      4
      0
      0
      2
      NaN
      36
      333721
      7394629
      20040
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      281
      1
      4
      0
      0
      2
      NaN
      36
      333721
      7394629
      20040
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      282
      1
      4
      0
      0
      2
      NaN
      36
      333721
      7394629
      20040
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      283
      1
      4
      0
      0
      2
      NaN
      36
      333721
      7394629
      20040
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      316
      1
      4
      1
      0
      2
      NaN
      36
      333593
      7396032
      21014
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      317
      1
      4
      1
      0
      2
      NaN
      36
      333593
      7396032
      21014
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      320
      1
      4
      0
      0
      2
      NaN
      36
      333573
      7396022
      21020
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      331
      1
      4
      1
      0
      2
      NaN
      36
      333516
      7396150
      21025
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      342
      1
      4
      1
      0
      2
      NaN
      36
      333413
      7396177
      21030
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      349
      1
      4
      1
      0
      2
      NaN
      36
      333413
      7396177
      21030
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      350
      1
      4
      1
      0
      2
      NaN
      36
      333413
      7396177
      21030
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      353
      1
      4
      1
      0
      2
      NaN
      36
      333446
      7395979
      21031
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      354
      1
      4
      1
      0
      2
      NaN
      36
      333446
      7395979
      21031
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
    
    
      4779
      5
      4
      1
      0
      11
      NaN
      36
      335282
      7397403
      111016
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4780
      5
      4
      1
      0
      11
      NaN
      36
      335282
      7397403
      111016
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4781
      5
      4
      1
      0
      11
      NaN
      36
      335282
      7397403
      111016
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4794
      5
      4
      0
      0
      11
      NaN
      36
      335108
      7397559
      111020
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4795
      5
      4
      1
      0
      11
      NaN
      36
      335095
      7397824
      111021
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4800
      5
      4
      0
      0
      11
      NaN
      36
      335431
      7397340
      111024
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4801
      5
      4
      0
      0
      11
      NaN
      36
      335431
      7397340
      111024
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4804
      5
      4
      1
      0
      11
      NaN
      36
      334955
      7397603
      111064
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4805
      5
      4
      1
      0
      11
      NaN
      36
      334955
      7397603
      111064
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4814
      5
      4
      1
      0
      11
      NaN
      36
      335675
      7397437
      111081
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4839
      5
      4
      1
      0
      11
      NaN
      36
      335730
      7397340
      111086
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4840
      5
      4
      1
      0
      11
      NaN
      36
      335730
      7397340
      111086
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4843
      5
      4
      0
      0
      11
      NaN
      36
      335872
      7397009
      111092
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4854
      5
      4
      1
      0
      11
      NaN
      36
      335753
      7397316
      111103
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4859
      5
      4
      1
      0
      11
      NaN
      36
      335753
      7397316
      111103
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4860
      5
      4
      1
      0
      11
      NaN
      36
      335753
      7397316
      111103
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4861
      5
      4
      0
      0
      11
      NaN
      36
      335826
      7397243
      111104
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4862
      5
      4
      0
      0
      11
      NaN
      36
      335952
      7397207
      111105
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4865
      5
      4
      0
      0
      11
      NaN
      36
      335846
      7397209
      111108
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4892
      5
      4
      1
      0
      11
      NaN
      36
      335874
      7397355
      111121
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4893
      5
      4
      1
      0
      11
      NaN
      36
      335874
      7397355
      111121
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4898
      5
      4
      1
      0
      11
      NaN
      36
      335733
      7397337
      111124
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4914
      5
      4
      1
      0
      11
      NaN
      36
      335850
      7397219
      111126
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4941
      5
      4
      1
      0
      11
      NaN
      36
      335735
      7397496
      111161
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4956
      5
      4
      1
      0
      11
      NaN
      36
      335808
      7397246
      111164
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4959
      5
      4
      1
      0
      11
      NaN
      36
      335848
      7397343
      111166
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4964
      5
      4
      1
      0
      11
      NaN
      36
      335848
      7397343
      111166
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4965
      5
      4
      1
      0
      11
      NaN
      36
      335848
      7397343
      111166
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4970
      5
      4
      1
      0
      11
      NaN
      36
      335748
      7397321
      111167
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4991
      5
      4
      1
      0
      11
      NaN
      36
      335794
      7397088
      111194
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
  

705 rows × 91 columns

Passo 5: "ZONA_DOM"

Checar se existe algum erro

Categorias:

1 a 460

[Teste: Checar se existe algum número < 1 ou > 460. Se encontrar, retornar erro indicando em qual linha.]



In [183]:

    
if not impressao:
    #Verifying value interval for check - conditions: "ZONA_DOM < 1" and "ZONA_DOM > 460"
    od2007_ex[(od2007_ex['ZONA_DOM']<1) | (od2007_ex['ZONA_DOM']>460)]









    Out[183]:






  
    
      
      UCOD_DOM
      ANO
      CD_ENTRE
      DIA_SEM
      ZONA_DOM
      SUBZONA_DOM
      MUN_DOM
      CO_DOM_X
      CO_DOM_Y
      ID_DOM
      ...
      TIPO_VIAG
      H_SAIDA
      MIN_SAIDA
      ANDA_ORIG
      H_CHEG
      MIN_CHEG
      ANDA_DEST
      DURACAO
      TIPO_EST_AUTO
      VALOR_EST_AUTO
    
  
  
  

0 rows × 91 columns

Passo 6: "SUBZONA_DOM"

A coluna "SUBZONA_DOM" ficará vazia (missing values) em 2007 porque este ano já contém os dados de coordenadas.

Para os anos em que esse input não existe originalmente, esse campo é critério para inserção de coordenadas.

Passo 7: "MUN_DOM"

Checar se existe algum erro

Categorias

1 a 39

[Teste: Checar se existe algum número < 1 ou > 39. Se encontrar, retornar erro indicando em qual linha.]



In [184]:

    
if not impressao:
    #Verifying value interval for check - conditions: "MUN_DOM < 1" and "MUN_DOM > 39"
    od2007_ex[(od2007_ex['MUN_DOM']<1) | (od2007_ex['MUN_DOM']>39)]









    Out[184]:






  
    
      
      UCOD_DOM
      ANO
      CD_ENTRE
      DIA_SEM
      ZONA_DOM
      SUBZONA_DOM
      MUN_DOM
      CO_DOM_X
      CO_DOM_Y
      ID_DOM
      ...
      TIPO_VIAG
      H_SAIDA
      MIN_SAIDA
      ANDA_ORIG
      H_CHEG
      MIN_CHEG
      ANDA_DEST
      DURACAO
      TIPO_EST_AUTO
      VALOR_EST_AUTO
    
  
  
  

0 rows × 91 columns

Passo 8: "CO_DOM_X"

Em 2007 já existe a informação de "CO_DOM_X"

Para os demais anos:

[Na coluna "CO_DOM_X", linha i, ler o valor da linha i da coluna "SUBZONA_DOM", daí, buscar o mesmo valor na coluna "Subzonas_XXXX" do arquivo CO-SUBZONAS-XXXX.csv. Ao achar, retornar o valor da mesma linha, só que da coluna "CO_X"]

[Obs.: ainda preciso construir esses csv, ou seja, determinar os centroides das subzonas a partir do MapInfo]

Passo 9: "CO_DOM_Y"

Em 2007 já existe a informação de "CO_DOM_Y"

Para os demais anos:

[Na coluna "CO_DOM_Y", linha i, ler o valor da linha i da coluna "SUBZONA_DOM", daí, buscar o mesmo valor na coluna "Subzonas_XXXX" do arquivo CO-SUBZONAS-XXXX.csv. Ao achar, retornar o valor da mesma linha, só que da coluna "CO_Y"]

[Obs.: ainda preciso construir esses csv, ou seja, determinar os centroides das subzonas a partir do MapInfo]

Passo 10: "ID_DOM"

construir o "ID_DOM"

[Na coluna "ID_DOM", linha i, ler o valor da linha i da coluna "ZONA_DOM", e concatenar esse valor (com 3 dígitos) com o número do domicílio , que é o valor da linha i da coluna "NO_DOM" (com 4 dígitos). Resultado será um ID_DOM, que pode se repetir nas linhas, de 7 dígitos. Isso deve ser concateado com o "Ano". Resultado = 8 dígitos]

Outra possibilidade, concatenar com a UCOD ao invés da zona...



In [185]:

    
#Generating "ID_DOM" from the concatenation of "ANO", "ZONA_DOM" and "NO_DOM" variables
od2007_ex['ID_DOM'] = od2007_ex.apply(lambda row: gera_ID_DOM(row), axis=1)

Passo 11: "F_DOM"

Checar se existe algum erro na coluna "F_DOM"

Categorias

Valor	Descrição
0	Demais registros
1	Primeiro Registro do Domicílio

[Teste: Checar se existe algum número diferente de 0 ou 1. Se encontrar, retornar erro indicando em qual linha.]



In [186]:

    
#Verifying if there was left some value other than 0 or 1
verifica_DUMMY(od2007_ex, 'F_DOM')









    



Total de erros encontrados: 0

"FE_DOM" e "NO_DOM"

Nada há que se fazer em relação aos dados das colunas "FE_DOM" e "NO_DOM"

Passo 12: "TIPO_DOM"

Substituir valores da coluna "TIPO_DOM"

Substituir todos valores 1 por 0.
Substituir e todos valores 2 por 1.
Substituir e todos valores 3 por 1.

Categorias anteriores

Valor	Descrição
1	Particular
2	Coletivo
3	Favela

Categorias novas

Valor	Descrição
0	Particular
1	Coletivo

[Teste: Checar se existe algum número diferente de 0 ou 1. Se encontrar, retornar erro indicando em qual linha.]



In [187]:

    
if not impressao:
    #Counting for check "TIPO_DOM"
    od2007_ex['TIPO_DOM'].value_counts()









    Out[187]:





1    4444
2     556
dtype: int64



In [188]:

    
#Replacing the values 1 for 0
od2007_ex.loc[od2007_ex['TIPO_DOM']==1,'TIPO_DOM'] = 0
#Replacing the values 2 for 1
od2007_ex.loc[od2007_ex['TIPO_DOM']==2,'TIPO_DOM'] = 1



In [189]:

    
if not impressao:
    #Counting "TIPO_DOM" in order to compare the values before and after the replacement
    od2007_ex['TIPO_DOM'].value_counts()









    Out[189]:





0    4444
1     556
dtype: int64



In [190]:

    
#Verifying if there was left some value other than 0 or 1
verifica_DUMMY(od2007_ex, 'TIPO_DOM')









    



Total de erros encontrados: 0

"TOT_FAM"

Nada há que se fazer em relação aos dados da coluna "TOT_FAM"

Passo 13: "ID_FAM"

Construir o "ID_FAM"

Na coluna "ID_FAM", linha i, ler o valor da linha i da coluna "ID_DOM", e concatenar esse valor (com 8 dígitos) com o número da família, que é o valor da linha i da coluna "NO_FAM" (com 2 dígitos).

Resultado será um ID_FAM, que pode se repetir nas linhas, de 10 dígitos.



In [191]:

    
#Generating "ID_FAM" from the concatenation of "ID_DOM" and "NO_FAM" variables
od2007_ex['ID_FAM'] = od2007_ex.apply(lambda row: gera_ID_FAM(row), axis=1)

Passo 14: "F_FAM"

Checar se existe algum erro na coluna "F_FAM"

Categorias

Valor	Descrição
0	Demais registros
1	Primeiro Registro da Família

[Teste: Checar se existe algum número diferente de 0 ou 1. Se encontrar, retornar erro indicando em qual linha.]



In [192]:

    
#Verifying if there was left some value other than 0 or 1
verifica_DUMMY(od2007_ex, 'F_FAM')









    



Total de erros encontrados: 0

"FE_FAM" e "NO_FAM"

Nada há que se fazer em relação aos dados das colunas "FE_FAM" e "NO_FAM"

Passo 15: "COND_MORA"

Substituir valores da coluna "COND_MORA"

Substituir todos valores 4 por 3
Substituir todos valores 5 por 4

Categorias anteriores

Valor	Descrição
1	Alugada
2	Própria
3	Cedida
4	Outros
5	Não respondeu

Categorias novas

Valor	Descrição
1	Alugada
2	Própria
3	Outros
4	Não respondeu

[Teste: Checar se existe algum número < 1 ou > 4. Se encontrar, retornar erro indicando em qual linha.]



In [193]:

    
if not impressao:
    #Counting for check "COND_MORA"
    od2007_ex['COND_MORA'].value_counts()









    Out[193]:





1    2489
2    2113
3     320
4      42
5      36
dtype: int64



In [194]:

    
#Replacing the values 4 for 3
od2007_ex.loc[od2007_ex['COND_MORA']==4,'COND_MORA'] = 3
#Replacing the values 5 for 4
od2007_ex.loc[od2007_ex['COND_MORA']==5,'COND_MORA'] = 4



In [195]:

    
if not impressao:
    #Counting "COND_MORA" in order to compare the values before and after the replacement
    od2007_ex['COND_MORA'].value_counts()









    Out[195]:





1    2489
2    2113
3     362
4      36
dtype: int64



In [196]:

    
if not impressao:
    #Verifying value interval for check - conditions: "COND_MORA < 1" and "COND_MORA > 4"
    od2007_ex[(od2007_ex['COND_MORA']<1) | (od2007_ex['COND_MORA']>4)]









    Out[196]:






  
    
      
      UCOD_DOM
      ANO
      CD_ENTRE
      DIA_SEM
      ZONA_DOM
      SUBZONA_DOM
      MUN_DOM
      CO_DOM_X
      CO_DOM_Y
      ID_DOM
      ...
      TIPO_VIAG
      H_SAIDA
      MIN_SAIDA
      ANDA_ORIG
      H_CHEG
      MIN_CHEG
      ANDA_DEST
      DURACAO
      TIPO_EST_AUTO
      VALOR_EST_AUTO
    
  
  
  

0 rows × 91 columns

"QT_AUTO", "QT_BICI" e QT_MOTO"

Nada há que se fazer em relação aos dados das colunas "QT_AUTO", "QT_BICI" e QT_MOTO"

Passo 16: "CD_RENFAM"

Substituir valores da coluna "CD_RENFAM"

Substituir todos valores 2 por 0
Substituir todos valores 3 por 2
Substituir todos valores 4 por 2

Categorias anteriores

Valor	Descrição
1	Renda Familiar Declarada e Maior que Zero
2	Renda Familiar Declarada como Zero
3	Renda Atribuída pelo Critério Brasil
4	Renda Atribuída pela Média da Zona

Categorias novas

Valor	Descrição
0	Renda Familiar Declarada como Zero
1	Renda Familiar Declarada e Maior que Zero
2	Renda Atribuída

[Teste: Checar se existe algum número < 0 ou > 2. Se encontrar, retornar erro indicando em qual linha.]



In [197]:

    
if not impressao:
    #Counting for check "CD_RENFAM"
    od2007_ex['CD_RENFAM'].value_counts()









    Out[197]:





1    3304
3    1644
2      38
4      14
dtype: int64



In [198]:

    
#Replacing the values 2 for 0
od2007_ex.loc[od2007_ex['CD_RENFAM']==2,'CD_RENFAM'] = 0
#Replacing the values 3 for 2
od2007_ex.loc[od2007_ex['CD_RENFAM']==3,'CD_RENFAM'] = 2
#Replacing the values 4 for 2
od2007_ex.loc[od2007_ex['CD_RENFAM']==4,'CD_RENFAM'] = 2



In [199]:

    
if not impressao:
    #Counting "CD_RENFAM" in order to compare the values before and after the replacement
    od2007_ex['CD_RENFAM'].value_counts()









    Out[199]:





1    3304
2    1658
0      38
dtype: int64



In [200]:

    
if not impressao:
    #Verifying value interval for check - conditions: "CD_RENFAM < 0" and "CD_RENFAM > 2"
    od2007_ex[(od2007_ex['CD_RENFAM']<0) | (od2007_ex['CD_RENFAM']>2)]









    Out[200]:






  
    
      
      UCOD_DOM
      ANO
      CD_ENTRE
      DIA_SEM
      ZONA_DOM
      SUBZONA_DOM
      MUN_DOM
      CO_DOM_X
      CO_DOM_Y
      ID_DOM
      ...
      TIPO_VIAG
      H_SAIDA
      MIN_SAIDA
      ANDA_ORIG
      H_CHEG
      MIN_CHEG
      ANDA_DEST
      DURACAO
      TIPO_EST_AUTO
      VALOR_EST_AUTO
    
  
  
  

0 rows × 91 columns

"REN_FAM"

Nada há que se fazer em relação aos dados da coluna "REN_FAM"

Passo 17: "ID_PESS"

Construir o "ID_PESS"

Na coluna "ID_PESS", linha i, ler o valor da linha i da coluna "ID_FAM", e concatenar esse valor (10 dígitos) com o número da pessoa, que é o valor da linha i da coluna "NO_PESS" (com 2 dígitos).

Resultado será um ID_PESS, que pode se repetir nas linhas, de 12 dígitos.



In [201]:

    
#Generating "ID_PESS" from the concatenation of "ID_FAM" and "NO_PESS" variables
od2007_ex['ID_PESS'] = od2007_ex.apply(lambda row: gera_ID_PESS(row), axis=1)

Passo 18: "F_PESS"

Checar se existe algum erro na coluna "F_PESS"

Categorias

Valor	Descrição
0	Demais registros
1	Primeiro Registro da Pessoa

[Teste: Checar se existe algum número diferente de 0 ou 1. Se encontrar, retornar erro indicando em qual linha.]



In [202]:

    
#Verifying if there was left some value other than 0 or 1
verifica_DUMMY(od2007_ex, 'F_PESS')









    



Total de erros encontrados: 0

"FE_PESS" e "NO_PESS"

Nada há que se fazer em relação aos dados das colunas "FE_PESS" e "NO_PESS"

Passo 19: "SIT_FAM"

Substituir valores da coluna "SIT_FAM"

Substituir todos valores 5 por 4
Substituir todos valores 6 por 5
Substituir todos valores 7 por 6

Categorias anteriores

Valor	Descrição
1	Pessoa Responsável
2	Cônjuge/Companheiro(a)
3	Filho(a)/Enteado(a)
4	Outro Parente
5	Agregado
6	Empregado Residente
7	Parente do empregado

Categorias novas:

Valor	Descrição
1	Pessoa Responsável
2	Cônjuge/Companheiro(a)
3	Filho(a)/Enteado(a)
4	Outro Parente / Agregado
5	Empregado Residente
6	Outros (visitante não residente / parente do empregado)

[Teste: Checar se existe algum número < 1 ou > 6. Se encontrar, retornar erro indicando em qual linha.]



In [203]:

    
if not impressao:
    #Counting for check "SIT_FAM"
    od2007_ex['SIT_FAM'].value_counts()









    Out[203]:





1    2052
3    1397
2     907
4     476
5     131
6      33
7       4
dtype: int64



In [204]:

    
#Replacing the values 5 for 4
od2007_ex.loc[od2007_ex['SIT_FAM']==5,'SIT_FAM'] = 4
#Replacing the values 6 for 5
od2007_ex.loc[od2007_ex['SIT_FAM']==6,'SIT_FAM'] = 5
#Replacing the values 7 for 6
od2007_ex.loc[od2007_ex['SIT_FAM']==7,'SIT_FAM'] = 6



In [205]:

    
if not impressao:
    #Counting "SIT_FAM" in order to compare the values before and after the replacement
    od2007_ex['SIT_FAM'].value_counts()









    Out[205]:





1    2052
3    1397
2     907
4     607
5      33
6       4
dtype: int64



In [206]:

    
if not impressao:
    #Verifying value interval for check - conditions: "SIT_FAM < 1" and "SIT_FAM > 6"
    od2007_ex[(od2007_ex['SIT_FAM']<0) | (od2007_ex['SIT_FAM']>6)]









    Out[206]:






  
    
      
      UCOD_DOM
      ANO
      CD_ENTRE
      DIA_SEM
      ZONA_DOM
      SUBZONA_DOM
      MUN_DOM
      CO_DOM_X
      CO_DOM_Y
      ID_DOM
      ...
      TIPO_VIAG
      H_SAIDA
      MIN_SAIDA
      ANDA_ORIG
      H_CHEG
      MIN_CHEG
      ANDA_DEST
      DURACAO
      TIPO_EST_AUTO
      VALOR_EST_AUTO
    
  
  
  

0 rows × 91 columns

"IDADE"

Nada há que se fazer em relação aos dados da coluna "IDADE"

Passo 20: "SEXO"

Substituir valores da coluna "SEXO"

Substituir todos valores 2 por 0

Categorias anteriores

Valor	Descrição
1	Masculino
2	Feminino

Categorias novas

Valor	Descrição
0	Feminino
1	Masculino

[Teste: Checar se existe algum número diferente de 0 ou 1. Se encontrar, retornar erro indicando em qual linha.]



In [207]:

    
if not impressao:
    #Counting for check "SEXO"
    od2007_ex['SEXO'].value_counts()









    Out[207]:





2    2580
1    2420
dtype: int64



In [208]:

    
#Replacing the values 2 for 0
od2007_ex.loc[od2007_ex['SEXO']==2,'SEXO'] = 0



In [209]:

    
if not impressao:
    #Counting "SEXO" in order to compare the values before and after the replacement
    od2007_ex['SEXO'].value_counts()









    Out[209]:





0    2580
1    2420
dtype: int64



In [210]:

    
#Verifying if there was left some value other than 0 or 1
verifica_DUMMY(od2007_ex, 'SEXO')









    



Total de erros encontrados: 0

Passo 21: "ESTUDA"

Substituir valores da coluna "ESTUDA"

Substituir todos valores 1 por 0
Substituir todos valores 2, 3, 4, 5, 6 e 7 por 1

Categorias anteriores

Valor	Descrição
1	Não
2	Creche/Pré-Escola
3	1º Grau/Fundamental
4	2º Grau/Médio
5	??
6	Superior/Universitário
7	Outros

Categorias novas

Valor	Descrição
0	Não estuda
1	Estuda

[Teste: Checar se existe algum número diferente de 0 ou 1. Se encontrar, retornar erro indicando em qual linha.]



In [211]:

    
if not impressao:
    #Counting for check "ESTUDA"
    od2007_ex['ESTUDA'].value_counts()









    Out[211]:





1    3721
3     493
5     258
2     240
4     170
6     118
dtype: int64



In [212]:

    
#Replacing the values 1 for 0
od2007_ex.loc[od2007_ex['ESTUDA']==1,'ESTUDA'] = 0
#Replacing the values 2 for 1
od2007_ex.loc[od2007_ex['ESTUDA']==2,'ESTUDA'] = 1
#Replacing the values 3 for 1
od2007_ex.loc[od2007_ex['ESTUDA']==3,'ESTUDA'] = 1
#Replacing the values 4 for 1
od2007_ex.loc[od2007_ex['ESTUDA']==4,'ESTUDA'] = 1
#Replacing the values 5 for 1
od2007_ex.loc[od2007_ex['ESTUDA']==5,'ESTUDA'] = 1
#Replacing the values 6 for 1
od2007_ex.loc[od2007_ex['ESTUDA']==6,'ESTUDA'] = 1
#Replacing the values 7 for 1
od2007_ex.loc[od2007_ex['ESTUDA']==7,'ESTUDA'] = 1



In [213]:

    
if not impressao:
    #Counting "ESTUDA" in order to compare the values before and after the replacement
    od2007_ex['ESTUDA'].value_counts()









    Out[213]:





0    3721
1    1279
dtype: int64



In [214]:

    
#Verifying if there was left some value other than 0 or 1
verifica_DUMMY(od2007_ex, 'ESTUDA')









    



Total de erros encontrados: 0

Passo 22: "GRAU_INSTR"

Substituir valores da coluna "GRAU_INSTR"

Substituir todos valores 2 por 1
Substituir todos valores 3 por 2
Substituir todos valores 4 por 3
Substituir todos valores 5 por 4

Categorias anteriores:

Valor	Descrição
1	Não-alfabetizado/Primário Incompleto
2	Primário Completo/Ginásio Incompleto
3	Ginásio Completo/Colegial Incompleto
4	Colegial Completo/Superior Incompleto
5	Superior Completo

Categorias novas

Valor	Descrição
1	Não-Alfabetizado/Fundamental Incompleto
2	Fundamental Completo/Médio Incompleto
3	Médio Completo/Superior Incompleto
4	Superior completo

[Teste: Checar se existe algum número < 1 ou > 4. Se encontrar, retornar erro indicando em qual linha.]



In [215]:

    
if not impressao:
    #Counting for check "GRAU_INSTR"
    od2007_ex['GRAU_INSTR'].value_counts()









    Out[215]:





4    1622
2     988
3     817
1     805
5     768
dtype: int64



In [216]:

    
#Replacing the values 2 for 1
od2007_ex.loc[od2007_ex['GRAU_INSTR']==2,'GRAU_INSTR'] = 1
#Replacing the values 3 for 2
od2007_ex.loc[od2007_ex['GRAU_INSTR']==3,'GRAU_INSTR'] = 2
#Replacing the values 4 for 3
od2007_ex.loc[od2007_ex['GRAU_INSTR']==4,'GRAU_INSTR'] = 3
#Replacing the values 5 for 4
od2007_ex.loc[od2007_ex['GRAU_INSTR']==5,'GRAU_INSTR'] = 4



In [217]:

    
if not impressao:
    #Counting "GRAU_INSTR" in order to compare the values before and after the replacement
    od2007_ex['GRAU_INSTR'].value_counts()









    Out[217]:





1    1793
3    1622
2     817
4     768
dtype: int64



In [218]:

    
if not impressao:
    #Verifying value interval for check - conditions: "GRAU_INSTR < 1" and "GRAU_INSTR > 4"
    od2007_ex[(od2007_ex['GRAU_INSTR']<1) | (od2007_ex['GRAU_INSTR']>4)]









    Out[218]:






  
    
      
      UCOD_DOM
      ANO
      CD_ENTRE
      DIA_SEM
      ZONA_DOM
      SUBZONA_DOM
      MUN_DOM
      CO_DOM_X
      CO_DOM_Y
      ID_DOM
      ...
      TIPO_VIAG
      H_SAIDA
      MIN_SAIDA
      ANDA_ORIG
      H_CHEG
      MIN_CHEG
      ANDA_DEST
      DURACAO
      TIPO_EST_AUTO
      VALOR_EST_AUTO
    
  
  
  

0 rows × 91 columns

Passo 23: "OCUP"

Substituir valores da coluna "OCUP"

Substituir todos valores 2 por 1
Substituir todos valores 3 por 2
Substituir todos valores 4 por 3
Substituir todos valores 5 por 4
Substituir todos valores 6 por 5
Substituir todos valores 7 por 6
Substituir todos valores 8 por 7

Categorias anteriores

Valor	Descrição
1	Tem trabalho
2	Faz bico
3	Em licença médica
4	Aposentado / pensionista
5	Sem trabalho
6	Nunca trabalhou
7	Dona de casa
8	Estudante

Categorias novas

Valor	Descrição
1	Tem trabalho
2	Em licença médica
3	Aposentado / pensionista
4	Desempregado
5	Sem ocupação
6	Dona de casa
7	Estudante

[Teste: Checar se existe algum número < 0 ou > 7. Se encontrar, retornar erro indicando em qual linha.]



In [219]:

    
if not impressao:
    #Counting for check "OCUP"
    od2007_ex['OCUP'].value_counts()









    Out[219]:





1    2980
8     652
4     475
6     283
7     237
5     216
2     136
3      21
dtype: int64



In [220]:

    
#Replacing the values 2 for 1
od2007_ex.loc[od2007_ex['OCUP']==2,'OCUP'] = 1
#Replacing the values 3 for 2
od2007_ex.loc[od2007_ex['OCUP']==3,'OCUP'] = 2
#Replacing the values 4 for 3
od2007_ex.loc[od2007_ex['OCUP']==4,'OCUP'] = 3
#Replacing the values 5 for 4
od2007_ex.loc[od2007_ex['OCUP']==5,'OCUP'] = 4
#Replacing the values 6 for 5
od2007_ex.loc[od2007_ex['OCUP']==6,'OCUP'] = 5
#Replacing the values 7 for 6
od2007_ex.loc[od2007_ex['OCUP']==7,'OCUP'] = 6
#Replacing the values 8 for 7
od2007_ex.loc[od2007_ex['OCUP']==8,'OCUP'] = 7



In [221]:

    
if not impressao:
    #Counting "OCUP" in order to compare the values before and after the replacement
    od2007_ex['OCUP'].value_counts()









    Out[221]:





1    3116
7     652
3     475
5     283
6     237
4     216
2      21
dtype: int64



In [222]:

    
if not impressao:
    #Verifying value interval for check - conditions: "OCUP < 1" and "OCUP > 7"
    od2007_ex[(od2007_ex['OCUP']<1) | (od2007_ex['OCUP']>7)]









    Out[222]:






  
    
      
      UCOD_DOM
      ANO
      CD_ENTRE
      DIA_SEM
      ZONA_DOM
      SUBZONA_DOM
      MUN_DOM
      CO_DOM_X
      CO_DOM_Y
      ID_DOM
      ...
      TIPO_VIAG
      H_SAIDA
      MIN_SAIDA
      ANDA_ORIG
      H_CHEG
      MIN_CHEG
      ANDA_DEST
      DURACAO
      TIPO_EST_AUTO
      VALOR_EST_AUTO
    
  
  
  

0 rows × 91 columns

Passo 24: "SETOR_ATIV"

Substituir valores da coluna "SETOR_ATIV"

Na coluna "SETOR_ATIV", linha i, ler o valor da linha i da coluna "SETOR_ATIV", daí, buscar o mesmo valor na coluna "COD" do arquivo setor_ativ-2007.csv. Ao achar, retornar o valor da mesma linha, só que da coluna "COD_UNIF"

Categorias anteriores

ver arquivo .csv

Categorias novas

Valor	Descrição
1	Agrícola
2	Construção Civil
3	Indústria
4	Comércio
5	Administração Pública
6	Serviços de Transporte
7	Serviços
8	Serviços Autônomos
9	Outros
10	Não se aplica

[Teste: Checar se existe algum número < 1 ou > 10. Se encontrar, retornar erro indicando em qual linha.]



In [223]:

    
if not impressao:
    #Counting for check "SETOR_ATIV"
    od2007_ex['SETOR_ATIV'].value_counts()









    Out[223]:





0     1832
14     823
4      813
12     442
3      241
9      174
10     142
11     133
13     121
7       95
8       74
2       43
5       39
6       25
1        3
dtype: int64



In [224]:

    
#Getting from the csv file the "CD_UNIF" (unified code for activity sector) correspondent to the "SETOR_ATIV" code
od2007_ex['SETOR_ATIV'] = od2007_ex.apply(lambda row: consulta_refext(row, 'setor_ativ-2007.csv', 'COD', 'SETOR_ATIV', 'COD_UNIF'), axis=1)



In [225]:

    
if not impressao:
    #Counting "SETOR_ATIV" in order to compare the values before and after the replacement
    od2007_ex['SETOR_ATIV'].value_counts()









    Out[225]:





0    1832
7    1060
9     823
4     813
3     241
5     121
6      64
2      43
1       3
dtype: int64

Passo 25: "CD_RENIND"

Nada há que se fazer em relação aos dados da coluna "CD_RENIND"

Categorias anteriores

Valor	Descrição
1	Tem renda
2	Não tem renda
3	Não declarou

Categorias novas

Valor	Descrição
1	Tem renda
2	Não tem renda
3	Não declarou

[Teste: Checar se existe algum número < 1 ou > 3. Se encontrar, retornar erro indicando em qual linha.]



In [226]:

    
if not impressao:
    #Verifying value interval for check - conditions: "CD_RENIND < 1" and "CD_RENIND > 3"
    od2007_ex[(od2007_ex['CD_RENIND']<1) | (od2007_ex['CD_RENIND']>3)]









    Out[226]:






  
    
      
      UCOD_DOM
      ANO
      CD_ENTRE
      DIA_SEM
      ZONA_DOM
      SUBZONA_DOM
      MUN_DOM
      CO_DOM_X
      CO_DOM_Y
      ID_DOM
      ...
      TIPO_VIAG
      H_SAIDA
      MIN_SAIDA
      ANDA_ORIG
      H_CHEG
      MIN_CHEG
      ANDA_DEST
      DURACAO
      TIPO_EST_AUTO
      VALOR_EST_AUTO
    
  
  
  

0 rows × 91 columns

"REN_IND"

Nada há que se fazer em relação aos dados da coluna "REN_IND"

Passo 26: "UCOD_ESC"

Na coluna "UCOD_ESC", linha i, ler o valor da linha i da coluna "ZONA_ESC", daí, buscar o mesmo valor na coluna "Zona 2007" do arquivo UCOD-2007.csv. Ao achar, retornar o valor da mesma linha, só que da coluna "UCOD_ESC"

[Teste: no banco completo, checar se o min == 1 e o max == 67]



In [227]:

    
#Getting from the csv file the "UCOD" code correspondent to the "ZONA_ESC" code
od2007_ex['UCOD_ESC'] = od2007_ex.apply(lambda row: consulta_refext(row, 'UCOD-2007.csv', 'Zona 2007', 'ZONA_ESC', 'UCOD'), axis=1)



In [228]:

    
if not impressao:
    #Describing data ("UCOD_ESC" column) - count, mean, std, min and max
    od2007_ex['UCOD_ESC'].describe()









    Out[228]:





count    5000.000000
mean        2.083200
std         6.545598
min         0.000000
25%         0.000000
50%         0.000000
75%         1.000000
max        65.000000
Name: UCOD_ESC, dtype: float64



In [229]:

    
if not impressao:
    #Count for check "UCOD_ESC"
    od2007_ex['UCOD_ESC'].value_counts()









    Out[229]:





0     3695
4      380
5      226
2      133
1      125
3      111
19      50
7       46
23      36
8       25
13      21
6       15
43      15
24      13
9        9
35       8
15       8
20       8
58       7
21       6
39       6
53       6
14       6
10       5
11       5
60       4
26       4
50       4
25       4
30       4
65       4
42       3
33       2
44       2
41       2
61       2
dtype: int64



In [230]:

    
if not impressao:
    #Verifying value interval for check - conditions: "UCOD_ESC < 1" and "UCOD_ESC > 67"
    #The 'error' returns must be related to "UCOD_ESC" == 0, that is, trips that are not school purposed
    od2007_ex[(od2007_ex['UCOD_ESC']<1) | (od2007_ex['UCOD_ESC']>67)]









    Out[230]:






  
    
      
      UCOD_DOM
      ANO
      CD_ENTRE
      DIA_SEM
      ZONA_DOM
      SUBZONA_DOM
      MUN_DOM
      CO_DOM_X
      CO_DOM_Y
      ID_DOM
      ...
      TIPO_VIAG
      H_SAIDA
      MIN_SAIDA
      ANDA_ORIG
      H_CHEG
      MIN_CHEG
      ANDA_DEST
      DURACAO
      TIPO_EST_AUTO
      VALOR_EST_AUTO
    
  
  
    
      0
      1
      4
      1
      6
      1
      NaN
      36
      333729
      7394430
      40010001
      ...
      3
      8
      0
      0
      8
      10
      0
      10
      0
      0
    
    
      1
      1
      4
      1
      6
      1
      NaN
      36
      333729
      7394430
      40010001
      ...
      3
      17
      30
      0
      17
      40
      0
      10
      0
      0
    
    
      2
      1
      4
      1
      5
      1
      NaN
      36
      333858
      7394484
      40010018
      ...
      1
      4
      30
      2
      5
      45
      2
      75
      0
      0
    
    
      3
      1
      4
      1
      5
      1
      NaN
      36
      333858
      7394484
      40010018
      ...
      1
      18
      10
      2
      19
      30
      2
      80
      0
      0
    
    
      4
      1
      4
      1
      0
      1
      NaN
      36
      333858
      7394484
      40010018
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      5
      1
      4
      1
      5
      1
      NaN
      36
      333801
      7394422
      40010019
      ...
      4
      9
      30
      1
      10
      0
      1
      30
      0
      0
    
    
      6
      1
      4
      1
      5
      1
      NaN
      36
      333801
      7394422
      40010019
      ...
      4
      15
      0
      1
      15
      30
      1
      30
      0
      0
    
    
      7
      1
      4
      1
      5
      1
      NaN
      36
      333801
      7394422
      40010019
      ...
      4
      18
      30
      1
      19
      0
      1
      30
      0
      0
    
    
      8
      1
      4
      1
      5
      1
      NaN
      36
      333801
      7394422
      40010019
      ...
      4
      23
      45
      1
      0
      15
      1
      30
      0
      0
    
    
      9
      1
      4
      1
      0
      1
      NaN
      36
      333801
      7394422
      40010019
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      16
      1
      4
      1
      6
      1
      NaN
      36
      333819
      7394525
      40010024
      ...
      3
      22
      0
      0
      22
      10
      0
      10
      0
      0
    
    
      17
      1
      4
      1
      6
      1
      NaN
      36
      333819
      7394525
      40010024
      ...
      3
      16
      0
      0
      16
      10
      0
      10
      0
      0
    
    
      18
      1
      4
      1
      6
      1
      NaN
      36
      333819
      7394525
      40010024
      ...
      3
      18
      0
      0
      18
      10
      0
      10
      0
      0
    
    
      19
      1
      4
      1
      2
      1
      NaN
      36
      333738
      7394460
      40010032
      ...
      3
      11
      45
      0
      12
      5
      0
      20
      0
      0
    
    
      20
      1
      4
      1
      2
      1
      NaN
      36
      333738
      7394460
      40010032
      ...
      3
      12
      40
      0
      12
      50
      0
      10
      0
      0
    
    
      21
      1
      4
      1
      2
      1
      NaN
      36
      333738
      7394460
      40010032
      ...
      3
      13
      0
      0
      13
      20
      0
      20
      0
      0
    
    
      22
      1
      4
      1
      2
      1
      NaN
      36
      333738
      7394460
      40010032
      ...
      3
      14
      15
      0
      14
      40
      0
      25
      0
      0
    
    
      23
      1
      4
      1
      2
      1
      NaN
      36
      333738
      7394460
      40010032
      ...
      1
      18
      0
      10
      18
      25
      10
      25
      0
      0
    
    
      24
      1
      4
      1
      3
      1
      NaN
      36
      333739
      7394550
      40010042
      ...
      3
      10
      0
      0
      10
      15
      0
      15
      0
      0
    
    
      25
      1
      4
      1
      3
      1
      NaN
      36
      333739
      7394550
      40010042
      ...
      3
      11
      30
      0
      11
      45
      0
      15
      0
      0
    
    
      26
      1
      4
      1
      3
      1
      NaN
      36
      333739
      7394550
      40010042
      ...
      1
      8
      0
      10
      8
      30
      5
      30
      0
      0
    
    
      27
      1
      4
      1
      3
      1
      NaN
      36
      333739
      7394550
      40010042
      ...
      1
      10
      0
      20
      10
      40
      10
      40
      0
      0
    
    
      28
      1
      4
      1
      3
      1
      NaN
      36
      333739
      7394550
      40010042
      ...
      1
      11
      45
      10
      14
      30
      10
      165
      0
      0
    
    
      29
      1
      4
      1
      3
      1
      NaN
      36
      333739
      7394550
      40010042
      ...
      3
      18
      0
      0
      18
      10
      0
      10
      0
      0
    
    
      30
      1
      4
      1
      3
      1
      NaN
      36
      333739
      7394550
      40010042
      ...
      3
      18
      50
      0
      19
      5
      0
      15
      0
      0
    
    
      31
      1
      4
      1
      3
      1
      NaN
      36
      333840
      7394468
      40010047
      ...
      2
      7
      30
      1
      7
      45
      1
      15
      0
      0
    
    
      32
      1
      4
      1
      3
      1
      NaN
      36
      333840
      7394468
      40010047
      ...
      1
      10
      40
      15
      11
      30
      1
      50
      0
      0
    
    
      33
      1
      4
      1
      3
      1
      NaN
      36
      333840
      7394468
      40010047
      ...
      2
      12
      10
      0
      12
      45
      0
      35
      0
      0
    
    
      48
      1
      4
      1
      6
      1
      NaN
      36
      333738
      7394460
      40011003
      ...
      1
      7
      30
      10
      8
      30
      5
      60
      0
      0
    
    
      49
      1
      4
      1
      6
      1
      NaN
      36
      333738
      7394460
      40011003
      ...
      1
      10
      0
      10
      10
      20
      5
      20
      0
      0
    
    
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
    
    
      4952
      5
      4
      1
      6
      11
      NaN
      36
      335808
      7397246
      40111164
      ...
      1
      7
      0
      5
      7
      50
      5
      50
      0
      0
    
    
      4953
      5
      4
      1
      6
      11
      NaN
      36
      335808
      7397246
      40111164
      ...
      1
      17
      20
      5
      19
      0
      3
      100
      0
      0
    
    
      4956
      5
      4
      1
      0
      11
      NaN
      36
      335808
      7397246
      40111164
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4957
      5
      4
      1
      3
      11
      NaN
      36
      335848
      7397343
      40111166
      ...
      3
      14
      0
      15
      14
      25
      0
      25
      0
      0
    
    
      4958
      5
      4
      1
      3
      11
      NaN
      36
      335848
      7397343
      40111166
      ...
      3
      16
      0
      15
      16
      25
      0
      25
      0
      0
    
    
      4959
      5
      4
      1
      0
      11
      NaN
      36
      335848
      7397343
      40111166
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4964
      5
      4
      1
      0
      11
      NaN
      36
      335848
      7397343
      40111166
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4965
      5
      4
      1
      0
      11
      NaN
      36
      335848
      7397343
      40111166
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4966
      5
      4
      1
      3
      11
      NaN
      36
      335748
      7397321
      40111167
      ...
      2
      8
      0
      0
      8
      20
      0
      20
      0
      0
    
    
      4967
      5
      4
      1
      3
      11
      NaN
      36
      335748
      7397321
      40111167
      ...
      2
      11
      40
      0
      12
      0
      0
      20
      0
      0
    
    
      4968
      5
      4
      1
      3
      11
      NaN
      36
      335748
      7397321
      40111167
      ...
      2
      8
      0
      0
      8
      20
      0
      20
      0
      0
    
    
      4969
      5
      4
      1
      3
      11
      NaN
      36
      335748
      7397321
      40111167
      ...
      2
      11
      40
      0
      12
      0
      0
      20
      0
      0
    
    
      4970
      5
      4
      1
      0
      11
      NaN
      36
      335748
      7397321
      40111167
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4971
      5
      4
      1
      5
      11
      NaN
      36
      336005
      7397304
      40111171
      ...
      2
      6
      30
      0
      7
      0
      0
      30
      8
      0
    
    
      4972
      5
      4
      1
      5
      11
      NaN
      36
      336005
      7397304
      40111171
      ...
      2
      19
      0
      0
      19
      40
      0
      40
      8
      0
    
    
      4973
      5
      4
      1
      5
      11
      NaN
      36
      336005
      7397304
      40111171
      ...
      3
      7
      30
      0
      7
      50
      0
      20
      0
      0
    
    
      4974
      5
      4
      1
      5
      11
      NaN
      36
      336005
      7397304
      40111171
      ...
      3
      8
      0
      0
      8
      30
      0
      30
      0
      0
    
    
      4975
      5
      4
      1
      5
      11
      NaN
      36
      336005
      7397304
      40111171
      ...
      3
      15
      30
      0
      15
      50
      0
      20
      0
      0
    
    
      4976
      5
      4
      1
      5
      11
      NaN
      36
      336005
      7397304
      40111171
      ...
      3
      16
      0
      0
      16
      30
      0
      30
      0
      0
    
    
      4981
      5
      4
      1
      5
      11
      NaN
      36
      335786
      7397283
      40111172
      ...
      3
      10
      0
      0
      10
      30
      0
      30
      0
      0
    
    
      4982
      5
      4
      1
      5
      11
      NaN
      36
      335786
      7397283
      40111172
      ...
      3
      11
      30
      0
      12
      0
      0
      30
      0
      0
    
    
      4983
      5
      4
      1
      5
      11
      NaN
      36
      335786
      7397283
      40111172
      ...
      3
      11
      45
      0
      12
      15
      0
      30
      0
      0
    
    
      4984
      5
      4
      1
      5
      11
      NaN
      36
      335786
      7397283
      40111172
      ...
      3
      14
      0
      0
      14
      30
      0
      30
      0
      0
    
    
      4989
      5
      4
      1
      2
      11
      NaN
      36
      335794
      7397088
      40111194
      ...
      1
      7
      0
      1
      7
      20
      10
      20
      0
      0
    
    
      4990
      5
      4
      1
      2
      11
      NaN
      36
      335794
      7397088
      40111194
      ...
      1
      17
      0
      10
      17
      30
      3
      30
      0
      0
    
    
      4991
      5
      4
      1
      0
      11
      NaN
      36
      335794
      7397088
      40111194
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4996
      5
      4
      1
      2
      11
      NaN
      36
      335794
      7397088
      40111194
      ...
      1
      6
      25
      1
      8
      15
      10
      110
      0
      0
    
    
      4997
      5
      4
      1
      2
      11
      NaN
      36
      335794
      7397088
      40111194
      ...
      1
      17
      30
      10
      19
      35
      5
      125
      0
      0
    
    
      4998
      5
      4
      1
      2
      11
      NaN
      36
      335885
      7397331
      40111201
      ...
      3
      8
      0
      0
      8
      20
      0
      20
      0
      0
    
    
      4999
      5
      4
      1
      2
      11
      NaN
      36
      335885
      7397331
      40111201
      ...
      3
      11
      30
      0
      12
      10
      0
      40
      0
      0
    
  

3695 rows × 91 columns

Passo 27: "ZONA_ESC"

Checar se existe algum erro

Categorias:

1 a 460

[Teste: Checar se existe algum número < 1 ou > 460. Se encontrar, retornar erro indicando em qual linha.]



In [231]:

    
if not impressao:
    #Verifying value interval for check - conditions: "ZONA_ESC < 1" and "ZONA_ESC > 460"
    #The 'error' returns must be related to "ZONA_ESC" == 0, that is, trips that are not school purposed
    od2007_ex[(od2007_ex['ZONA_ESC']<1) | (od2007_ex['ZONA_ESC']>460)]









    Out[231]:






  
    
      
      UCOD_DOM
      ANO
      CD_ENTRE
      DIA_SEM
      ZONA_DOM
      SUBZONA_DOM
      MUN_DOM
      CO_DOM_X
      CO_DOM_Y
      ID_DOM
      ...
      TIPO_VIAG
      H_SAIDA
      MIN_SAIDA
      ANDA_ORIG
      H_CHEG
      MIN_CHEG
      ANDA_DEST
      DURACAO
      TIPO_EST_AUTO
      VALOR_EST_AUTO
    
  
  
    
      0
      1
      4
      1
      6
      1
      NaN
      36
      333729
      7394430
      40010001
      ...
      3
      8
      0
      0
      8
      10
      0
      10
      0
      0
    
    
      1
      1
      4
      1
      6
      1
      NaN
      36
      333729
      7394430
      40010001
      ...
      3
      17
      30
      0
      17
      40
      0
      10
      0
      0
    
    
      2
      1
      4
      1
      5
      1
      NaN
      36
      333858
      7394484
      40010018
      ...
      1
      4
      30
      2
      5
      45
      2
      75
      0
      0
    
    
      3
      1
      4
      1
      5
      1
      NaN
      36
      333858
      7394484
      40010018
      ...
      1
      18
      10
      2
      19
      30
      2
      80
      0
      0
    
    
      4
      1
      4
      1
      0
      1
      NaN
      36
      333858
      7394484
      40010018
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      5
      1
      4
      1
      5
      1
      NaN
      36
      333801
      7394422
      40010019
      ...
      4
      9
      30
      1
      10
      0
      1
      30
      0
      0
    
    
      6
      1
      4
      1
      5
      1
      NaN
      36
      333801
      7394422
      40010019
      ...
      4
      15
      0
      1
      15
      30
      1
      30
      0
      0
    
    
      7
      1
      4
      1
      5
      1
      NaN
      36
      333801
      7394422
      40010019
      ...
      4
      18
      30
      1
      19
      0
      1
      30
      0
      0
    
    
      8
      1
      4
      1
      5
      1
      NaN
      36
      333801
      7394422
      40010019
      ...
      4
      23
      45
      1
      0
      15
      1
      30
      0
      0
    
    
      9
      1
      4
      1
      0
      1
      NaN
      36
      333801
      7394422
      40010019
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      16
      1
      4
      1
      6
      1
      NaN
      36
      333819
      7394525
      40010024
      ...
      3
      22
      0
      0
      22
      10
      0
      10
      0
      0
    
    
      17
      1
      4
      1
      6
      1
      NaN
      36
      333819
      7394525
      40010024
      ...
      3
      16
      0
      0
      16
      10
      0
      10
      0
      0
    
    
      18
      1
      4
      1
      6
      1
      NaN
      36
      333819
      7394525
      40010024
      ...
      3
      18
      0
      0
      18
      10
      0
      10
      0
      0
    
    
      19
      1
      4
      1
      2
      1
      NaN
      36
      333738
      7394460
      40010032
      ...
      3
      11
      45
      0
      12
      5
      0
      20
      0
      0
    
    
      20
      1
      4
      1
      2
      1
      NaN
      36
      333738
      7394460
      40010032
      ...
      3
      12
      40
      0
      12
      50
      0
      10
      0
      0
    
    
      21
      1
      4
      1
      2
      1
      NaN
      36
      333738
      7394460
      40010032
      ...
      3
      13
      0
      0
      13
      20
      0
      20
      0
      0
    
    
      22
      1
      4
      1
      2
      1
      NaN
      36
      333738
      7394460
      40010032
      ...
      3
      14
      15
      0
      14
      40
      0
      25
      0
      0
    
    
      23
      1
      4
      1
      2
      1
      NaN
      36
      333738
      7394460
      40010032
      ...
      1
      18
      0
      10
      18
      25
      10
      25
      0
      0
    
    
      24
      1
      4
      1
      3
      1
      NaN
      36
      333739
      7394550
      40010042
      ...
      3
      10
      0
      0
      10
      15
      0
      15
      0
      0
    
    
      25
      1
      4
      1
      3
      1
      NaN
      36
      333739
      7394550
      40010042
      ...
      3
      11
      30
      0
      11
      45
      0
      15
      0
      0
    
    
      26
      1
      4
      1
      3
      1
      NaN
      36
      333739
      7394550
      40010042
      ...
      1
      8
      0
      10
      8
      30
      5
      30
      0
      0
    
    
      27
      1
      4
      1
      3
      1
      NaN
      36
      333739
      7394550
      40010042
      ...
      1
      10
      0
      20
      10
      40
      10
      40
      0
      0
    
    
      28
      1
      4
      1
      3
      1
      NaN
      36
      333739
      7394550
      40010042
      ...
      1
      11
      45
      10
      14
      30
      10
      165
      0
      0
    
    
      29
      1
      4
      1
      3
      1
      NaN
      36
      333739
      7394550
      40010042
      ...
      3
      18
      0
      0
      18
      10
      0
      10
      0
      0
    
    
      30
      1
      4
      1
      3
      1
      NaN
      36
      333739
      7394550
      40010042
      ...
      3
      18
      50
      0
      19
      5
      0
      15
      0
      0
    
    
      31
      1
      4
      1
      3
      1
      NaN
      36
      333840
      7394468
      40010047
      ...
      2
      7
      30
      1
      7
      45
      1
      15
      0
      0
    
    
      32
      1
      4
      1
      3
      1
      NaN
      36
      333840
      7394468
      40010047
      ...
      1
      10
      40
      15
      11
      30
      1
      50
      0
      0
    
    
      33
      1
      4
      1
      3
      1
      NaN
      36
      333840
      7394468
      40010047
      ...
      2
      12
      10
      0
      12
      45
      0
      35
      0
      0
    
    
      48
      1
      4
      1
      6
      1
      NaN
      36
      333738
      7394460
      40011003
      ...
      1
      7
      30
      10
      8
      30
      5
      60
      0
      0
    
    
      49
      1
      4
      1
      6
      1
      NaN
      36
      333738
      7394460
      40011003
      ...
      1
      10
      0
      10
      10
      20
      5
      20
      0
      0
    
    
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
    
    
      4952
      5
      4
      1
      6
      11
      NaN
      36
      335808
      7397246
      40111164
      ...
      1
      7
      0
      5
      7
      50
      5
      50
      0
      0
    
    
      4953
      5
      4
      1
      6
      11
      NaN
      36
      335808
      7397246
      40111164
      ...
      1
      17
      20
      5
      19
      0
      3
      100
      0
      0
    
    
      4956
      5
      4
      1
      0
      11
      NaN
      36
      335808
      7397246
      40111164
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4957
      5
      4
      1
      3
      11
      NaN
      36
      335848
      7397343
      40111166
      ...
      3
      14
      0
      15
      14
      25
      0
      25
      0
      0
    
    
      4958
      5
      4
      1
      3
      11
      NaN
      36
      335848
      7397343
      40111166
      ...
      3
      16
      0
      15
      16
      25
      0
      25
      0
      0
    
    
      4959
      5
      4
      1
      0
      11
      NaN
      36
      335848
      7397343
      40111166
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4964
      5
      4
      1
      0
      11
      NaN
      36
      335848
      7397343
      40111166
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4965
      5
      4
      1
      0
      11
      NaN
      36
      335848
      7397343
      40111166
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4966
      5
      4
      1
      3
      11
      NaN
      36
      335748
      7397321
      40111167
      ...
      2
      8
      0
      0
      8
      20
      0
      20
      0
      0
    
    
      4967
      5
      4
      1
      3
      11
      NaN
      36
      335748
      7397321
      40111167
      ...
      2
      11
      40
      0
      12
      0
      0
      20
      0
      0
    
    
      4968
      5
      4
      1
      3
      11
      NaN
      36
      335748
      7397321
      40111167
      ...
      2
      8
      0
      0
      8
      20
      0
      20
      0
      0
    
    
      4969
      5
      4
      1
      3
      11
      NaN
      36
      335748
      7397321
      40111167
      ...
      2
      11
      40
      0
      12
      0
      0
      20
      0
      0
    
    
      4970
      5
      4
      1
      0
      11
      NaN
      36
      335748
      7397321
      40111167
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4971
      5
      4
      1
      5
      11
      NaN
      36
      336005
      7397304
      40111171
      ...
      2
      6
      30
      0
      7
      0
      0
      30
      8
      0
    
    
      4972
      5
      4
      1
      5
      11
      NaN
      36
      336005
      7397304
      40111171
      ...
      2
      19
      0
      0
      19
      40
      0
      40
      8
      0
    
    
      4973
      5
      4
      1
      5
      11
      NaN
      36
      336005
      7397304
      40111171
      ...
      3
      7
      30
      0
      7
      50
      0
      20
      0
      0
    
    
      4974
      5
      4
      1
      5
      11
      NaN
      36
      336005
      7397304
      40111171
      ...
      3
      8
      0
      0
      8
      30
      0
      30
      0
      0
    
    
      4975
      5
      4
      1
      5
      11
      NaN
      36
      336005
      7397304
      40111171
      ...
      3
      15
      30
      0
      15
      50
      0
      20
      0
      0
    
    
      4976
      5
      4
      1
      5
      11
      NaN
      36
      336005
      7397304
      40111171
      ...
      3
      16
      0
      0
      16
      30
      0
      30
      0
      0
    
    
      4981
      5
      4
      1
      5
      11
      NaN
      36
      335786
      7397283
      40111172
      ...
      3
      10
      0
      0
      10
      30
      0
      30
      0
      0
    
    
      4982
      5
      4
      1
      5
      11
      NaN
      36
      335786
      7397283
      40111172
      ...
      3
      11
      30
      0
      12
      0
      0
      30
      0
      0
    
    
      4983
      5
      4
      1
      5
      11
      NaN
      36
      335786
      7397283
      40111172
      ...
      3
      11
      45
      0
      12
      15
      0
      30
      0
      0
    
    
      4984
      5
      4
      1
      5
      11
      NaN
      36
      335786
      7397283
      40111172
      ...
      3
      14
      0
      0
      14
      30
      0
      30
      0
      0
    
    
      4989
      5
      4
      1
      2
      11
      NaN
      36
      335794
      7397088
      40111194
      ...
      1
      7
      0
      1
      7
      20
      10
      20
      0
      0
    
    
      4990
      5
      4
      1
      2
      11
      NaN
      36
      335794
      7397088
      40111194
      ...
      1
      17
      0
      10
      17
      30
      3
      30
      0
      0
    
    
      4991
      5
      4
      1
      0
      11
      NaN
      36
      335794
      7397088
      40111194
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4996
      5
      4
      1
      2
      11
      NaN
      36
      335794
      7397088
      40111194
      ...
      1
      6
      25
      1
      8
      15
      10
      110
      0
      0
    
    
      4997
      5
      4
      1
      2
      11
      NaN
      36
      335794
      7397088
      40111194
      ...
      1
      17
      30
      10
      19
      35
      5
      125
      0
      0
    
    
      4998
      5
      4
      1
      2
      11
      NaN
      36
      335885
      7397331
      40111201
      ...
      3
      8
      0
      0
      8
      20
      0
      20
      0
      0
    
    
      4999
      5
      4
      1
      2
      11
      NaN
      36
      335885
      7397331
      40111201
      ...
      3
      11
      30
      0
      12
      10
      0
      40
      0
      0
    
  

3695 rows × 91 columns

Passo 28: "SUBZONA_ESC"

A coluna "SUBZONA_ESC" ficará vazia (missing values) em 2007 porque este ano já contém os dados de coordenadas.

Para os anos em que esse input não existe originalmente, esse campo é critério para inserção de coordenadas.

Passo 29: "MUN_ESC"

Checar se existe algum erro

Categorias

1 a 39

[Teste: Checar se existe algum número < 1 ou > 39. Se encontrar, retornar erro indicando em qual linha.]



In [232]:

    
if not impressao:
    #Verifying value interval for check - conditions: "MUN_ESC < 1" and "MUN_ESC > 39"
    #The 'error' returns must be related to "MUN_ESC" == 0, that is, trips that are not school purposed
    od2007_ex[(od2007_ex['MUN_ESC']<1) | (od2007_ex['MUN_ESC']>39)]









    Out[232]:






  
    
      
      UCOD_DOM
      ANO
      CD_ENTRE
      DIA_SEM
      ZONA_DOM
      SUBZONA_DOM
      MUN_DOM
      CO_DOM_X
      CO_DOM_Y
      ID_DOM
      ...
      TIPO_VIAG
      H_SAIDA
      MIN_SAIDA
      ANDA_ORIG
      H_CHEG
      MIN_CHEG
      ANDA_DEST
      DURACAO
      TIPO_EST_AUTO
      VALOR_EST_AUTO
    
  
  
    
      0
      1
      4
      1
      6
      1
      NaN
      36
      333729
      7394430
      40010001
      ...
      3
      8
      0
      0
      8
      10
      0
      10
      0
      0
    
    
      1
      1
      4
      1
      6
      1
      NaN
      36
      333729
      7394430
      40010001
      ...
      3
      17
      30
      0
      17
      40
      0
      10
      0
      0
    
    
      2
      1
      4
      1
      5
      1
      NaN
      36
      333858
      7394484
      40010018
      ...
      1
      4
      30
      2
      5
      45
      2
      75
      0
      0
    
    
      3
      1
      4
      1
      5
      1
      NaN
      36
      333858
      7394484
      40010018
      ...
      1
      18
      10
      2
      19
      30
      2
      80
      0
      0
    
    
      4
      1
      4
      1
      0
      1
      NaN
      36
      333858
      7394484
      40010018
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      5
      1
      4
      1
      5
      1
      NaN
      36
      333801
      7394422
      40010019
      ...
      4
      9
      30
      1
      10
      0
      1
      30
      0
      0
    
    
      6
      1
      4
      1
      5
      1
      NaN
      36
      333801
      7394422
      40010019
      ...
      4
      15
      0
      1
      15
      30
      1
      30
      0
      0
    
    
      7
      1
      4
      1
      5
      1
      NaN
      36
      333801
      7394422
      40010019
      ...
      4
      18
      30
      1
      19
      0
      1
      30
      0
      0
    
    
      8
      1
      4
      1
      5
      1
      NaN
      36
      333801
      7394422
      40010019
      ...
      4
      23
      45
      1
      0
      15
      1
      30
      0
      0
    
    
      9
      1
      4
      1
      0
      1
      NaN
      36
      333801
      7394422
      40010019
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      16
      1
      4
      1
      6
      1
      NaN
      36
      333819
      7394525
      40010024
      ...
      3
      22
      0
      0
      22
      10
      0
      10
      0
      0
    
    
      17
      1
      4
      1
      6
      1
      NaN
      36
      333819
      7394525
      40010024
      ...
      3
      16
      0
      0
      16
      10
      0
      10
      0
      0
    
    
      18
      1
      4
      1
      6
      1
      NaN
      36
      333819
      7394525
      40010024
      ...
      3
      18
      0
      0
      18
      10
      0
      10
      0
      0
    
    
      19
      1
      4
      1
      2
      1
      NaN
      36
      333738
      7394460
      40010032
      ...
      3
      11
      45
      0
      12
      5
      0
      20
      0
      0
    
    
      20
      1
      4
      1
      2
      1
      NaN
      36
      333738
      7394460
      40010032
      ...
      3
      12
      40
      0
      12
      50
      0
      10
      0
      0
    
    
      21
      1
      4
      1
      2
      1
      NaN
      36
      333738
      7394460
      40010032
      ...
      3
      13
      0
      0
      13
      20
      0
      20
      0
      0
    
    
      22
      1
      4
      1
      2
      1
      NaN
      36
      333738
      7394460
      40010032
      ...
      3
      14
      15
      0
      14
      40
      0
      25
      0
      0
    
    
      23
      1
      4
      1
      2
      1
      NaN
      36
      333738
      7394460
      40010032
      ...
      1
      18
      0
      10
      18
      25
      10
      25
      0
      0
    
    
      24
      1
      4
      1
      3
      1
      NaN
      36
      333739
      7394550
      40010042
      ...
      3
      10
      0
      0
      10
      15
      0
      15
      0
      0
    
    
      25
      1
      4
      1
      3
      1
      NaN
      36
      333739
      7394550
      40010042
      ...
      3
      11
      30
      0
      11
      45
      0
      15
      0
      0
    
    
      26
      1
      4
      1
      3
      1
      NaN
      36
      333739
      7394550
      40010042
      ...
      1
      8
      0
      10
      8
      30
      5
      30
      0
      0
    
    
      27
      1
      4
      1
      3
      1
      NaN
      36
      333739
      7394550
      40010042
      ...
      1
      10
      0
      20
      10
      40
      10
      40
      0
      0
    
    
      28
      1
      4
      1
      3
      1
      NaN
      36
      333739
      7394550
      40010042
      ...
      1
      11
      45
      10
      14
      30
      10
      165
      0
      0
    
    
      29
      1
      4
      1
      3
      1
      NaN
      36
      333739
      7394550
      40010042
      ...
      3
      18
      0
      0
      18
      10
      0
      10
      0
      0
    
    
      30
      1
      4
      1
      3
      1
      NaN
      36
      333739
      7394550
      40010042
      ...
      3
      18
      50
      0
      19
      5
      0
      15
      0
      0
    
    
      31
      1
      4
      1
      3
      1
      NaN
      36
      333840
      7394468
      40010047
      ...
      2
      7
      30
      1
      7
      45
      1
      15
      0
      0
    
    
      32
      1
      4
      1
      3
      1
      NaN
      36
      333840
      7394468
      40010047
      ...
      1
      10
      40
      15
      11
      30
      1
      50
      0
      0
    
    
      33
      1
      4
      1
      3
      1
      NaN
      36
      333840
      7394468
      40010047
      ...
      2
      12
      10
      0
      12
      45
      0
      35
      0
      0
    
    
      48
      1
      4
      1
      6
      1
      NaN
      36
      333738
      7394460
      40011003
      ...
      1
      7
      30
      10
      8
      30
      5
      60
      0
      0
    
    
      49
      1
      4
      1
      6
      1
      NaN
      36
      333738
      7394460
      40011003
      ...
      1
      10
      0
      10
      10
      20
      5
      20
      0
      0
    
    
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
    
    
      4952
      5
      4
      1
      6
      11
      NaN
      36
      335808
      7397246
      40111164
      ...
      1
      7
      0
      5
      7
      50
      5
      50
      0
      0
    
    
      4953
      5
      4
      1
      6
      11
      NaN
      36
      335808
      7397246
      40111164
      ...
      1
      17
      20
      5
      19
      0
      3
      100
      0
      0
    
    
      4956
      5
      4
      1
      0
      11
      NaN
      36
      335808
      7397246
      40111164
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4957
      5
      4
      1
      3
      11
      NaN
      36
      335848
      7397343
      40111166
      ...
      3
      14
      0
      15
      14
      25
      0
      25
      0
      0
    
    
      4958
      5
      4
      1
      3
      11
      NaN
      36
      335848
      7397343
      40111166
      ...
      3
      16
      0
      15
      16
      25
      0
      25
      0
      0
    
    
      4959
      5
      4
      1
      0
      11
      NaN
      36
      335848
      7397343
      40111166
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4964
      5
      4
      1
      0
      11
      NaN
      36
      335848
      7397343
      40111166
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4965
      5
      4
      1
      0
      11
      NaN
      36
      335848
      7397343
      40111166
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4966
      5
      4
      1
      3
      11
      NaN
      36
      335748
      7397321
      40111167
      ...
      2
      8
      0
      0
      8
      20
      0
      20
      0
      0
    
    
      4967
      5
      4
      1
      3
      11
      NaN
      36
      335748
      7397321
      40111167
      ...
      2
      11
      40
      0
      12
      0
      0
      20
      0
      0
    
    
      4968
      5
      4
      1
      3
      11
      NaN
      36
      335748
      7397321
      40111167
      ...
      2
      8
      0
      0
      8
      20
      0
      20
      0
      0
    
    
      4969
      5
      4
      1
      3
      11
      NaN
      36
      335748
      7397321
      40111167
      ...
      2
      11
      40
      0
      12
      0
      0
      20
      0
      0
    
    
      4970
      5
      4
      1
      0
      11
      NaN
      36
      335748
      7397321
      40111167
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4971
      5
      4
      1
      5
      11
      NaN
      36
      336005
      7397304
      40111171
      ...
      2
      6
      30
      0
      7
      0
      0
      30
      8
      0
    
    
      4972
      5
      4
      1
      5
      11
      NaN
      36
      336005
      7397304
      40111171
      ...
      2
      19
      0
      0
      19
      40
      0
      40
      8
      0
    
    
      4973
      5
      4
      1
      5
      11
      NaN
      36
      336005
      7397304
      40111171
      ...
      3
      7
      30
      0
      7
      50
      0
      20
      0
      0
    
    
      4974
      5
      4
      1
      5
      11
      NaN
      36
      336005
      7397304
      40111171
      ...
      3
      8
      0
      0
      8
      30
      0
      30
      0
      0
    
    
      4975
      5
      4
      1
      5
      11
      NaN
      36
      336005
      7397304
      40111171
      ...
      3
      15
      30
      0
      15
      50
      0
      20
      0
      0
    
    
      4976
      5
      4
      1
      5
      11
      NaN
      36
      336005
      7397304
      40111171
      ...
      3
      16
      0
      0
      16
      30
      0
      30
      0
      0
    
    
      4981
      5
      4
      1
      5
      11
      NaN
      36
      335786
      7397283
      40111172
      ...
      3
      10
      0
      0
      10
      30
      0
      30
      0
      0
    
    
      4982
      5
      4
      1
      5
      11
      NaN
      36
      335786
      7397283
      40111172
      ...
      3
      11
      30
      0
      12
      0
      0
      30
      0
      0
    
    
      4983
      5
      4
      1
      5
      11
      NaN
      36
      335786
      7397283
      40111172
      ...
      3
      11
      45
      0
      12
      15
      0
      30
      0
      0
    
    
      4984
      5
      4
      1
      5
      11
      NaN
      36
      335786
      7397283
      40111172
      ...
      3
      14
      0
      0
      14
      30
      0
      30
      0
      0
    
    
      4989
      5
      4
      1
      2
      11
      NaN
      36
      335794
      7397088
      40111194
      ...
      1
      7
      0
      1
      7
      20
      10
      20
      0
      0
    
    
      4990
      5
      4
      1
      2
      11
      NaN
      36
      335794
      7397088
      40111194
      ...
      1
      17
      0
      10
      17
      30
      3
      30
      0
      0
    
    
      4991
      5
      4
      1
      0
      11
      NaN
      36
      335794
      7397088
      40111194
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4996
      5
      4
      1
      2
      11
      NaN
      36
      335794
      7397088
      40111194
      ...
      1
      6
      25
      1
      8
      15
      10
      110
      0
      0
    
    
      4997
      5
      4
      1
      2
      11
      NaN
      36
      335794
      7397088
      40111194
      ...
      1
      17
      30
      10
      19
      35
      5
      125
      0
      0
    
    
      4998
      5
      4
      1
      2
      11
      NaN
      36
      335885
      7397331
      40111201
      ...
      3
      8
      0
      0
      8
      20
      0
      20
      0
      0
    
    
      4999
      5
      4
      1
      2
      11
      NaN
      36
      335885
      7397331
      40111201
      ...
      3
      11
      30
      0
      12
      10
      0
      40
      0
      0
    
  

3695 rows × 91 columns

Passo 30: "CO_ESC_X"

Em 2007 já existe a informação de "CO_ESC_X"

Para os demais anos:

[Na coluna "CO_ESC_X", linha i, ler o valor da linha i da coluna "SUBZONA_ESC", daí, buscar o mesmo valor na coluna "Subzonas_XXXX" do arquivo CO-SUBZONAS-XXXX.csv. Ao achar, retornar o valor da mesma linha, só que da coluna "CO_X"]

[Obs.: ainda preciso construir esses csv, ou seja, determinar os centroides das subzonas a partir do MapInfo]

Passo 31: "CO_ESC_Y"

Em 2007 já existe a informação de "CO_ESC_Y"

Para os demais anos:

[Na coluna "CO_ESC_Y", linha i, ler o valor da linha i da coluna "SUBZONA_ESC", daí, buscar o mesmo valor na coluna "Subzonas_XXXX" do arquivo CO-SUBZONAS-XXXX.csv. Ao achar, retornar o valor da mesma linha, só que da coluna "CO_Y"]

[Obs.: ainda preciso construir esses csv, ou seja, determinar os centroides das subzonas a partir do MapInfo]

Passo 32: "UCOD_TRAB1"

Na coluna "UCOD_TRAB1", linha i, ler o valor da linha i da coluna "ZONA_TRAB1", daí, buscar o mesmo valor na coluna "Zona 2007" do arquivo UCOD-2007.csv. Ao achar, retornar o valor da mesma linha, só que da coluna "UCOD_TRAB1"

[Teste: no banco completo, checar se o min == 1 e o max == 67]



In [233]:

    
#Getting from the csv file the "UCOD" code correspondent to the "ZONA_TRAB1" code
od2007_ex['UCOD_TRAB1'] = od2007_ex.apply(lambda row: consulta_refext(row, 'UCOD-2007.csv', 'Zona 2007', 'ZONA_TRAB1', 'UCOD'), axis=1)



In [234]:

    
if not impressao:
    #Describing data ("UCOD_TRAB1" column) - count, mean, std, min and max
    od2007_ex['UCOD_TRAB1'].describe()









    Out[234]:





count    5000.00000
mean        4.61520
std         9.27465
min         0.00000
25%         0.00000
50%         1.00000
75%         4.00000
max        65.00000
Name: UCOD_TRAB1, dtype: float64



In [235]:

    
if not impressao:
    #Count for check "UCOD_TRAB1"
    od2007_ex['UCOD_TRAB1'].value_counts()









    Out[235]:





0     1844
1     1005
4      730
5      311
2      183
3      120
13     105
19      73
14      70
8       57
10      49
12      42
23      37
24      32
15      28
6       27
11      27
41      19
7       19
43      19
9       17
39      15
17      12
30      11
32      10
44       9
38       8
21       8
58       8
57       7
46       7
26       7
37       7
29       6
61       6
16       6
34       6
48       5
40       5
63       5
25       4
60       4
42       4
54       4
59       3
50       3
62       3
49       2
53       2
22       2
28       2
27       2
65       2
55       1
dtype: int64



In [236]:

    
if not impressao:
    #Verifying value interval for check - conditions: "UCOD_TRAB1 < 1" and "UCOD_TRAB1 > 67"
    #The 'error' returns must be related to "UCOD_TRAB1" == 0, that is, trips that are not school purposed
    od2007_ex[(od2007_ex['UCOD_TRAB1']<1) | (od2007_ex['UCOD_TRAB1']>67)]









    Out[236]:






  
    
      
      UCOD_DOM
      ANO
      CD_ENTRE
      DIA_SEM
      ZONA_DOM
      SUBZONA_DOM
      MUN_DOM
      CO_DOM_X
      CO_DOM_Y
      ID_DOM
      ...
      TIPO_VIAG
      H_SAIDA
      MIN_SAIDA
      ANDA_ORIG
      H_CHEG
      MIN_CHEG
      ANDA_DEST
      DURACAO
      TIPO_EST_AUTO
      VALOR_EST_AUTO
    
  
  
    
      4
      1
      4
      1
      0
      1
      NaN
      36
      333858
      7394484
      40010018
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      9
      1
      4
      1
      0
      1
      NaN
      36
      333801
      7394422
      40010019
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      10
      1
      4
      1
      5
      1
      NaN
      36
      333801
      7394422
      40010019
      ...
      3
      6
      35
      0
      6
      40
      0
      5
      0
      0
    
    
      11
      1
      4
      1
      5
      1
      NaN
      36
      333801
      7394422
      40010019
      ...
      3
      12
      20
      0
      12
      25
      0
      5
      0
      0
    
    
      17
      1
      4
      1
      6
      1
      NaN
      36
      333819
      7394525
      40010024
      ...
      3
      16
      0
      0
      16
      10
      0
      10
      0
      0
    
    
      18
      1
      4
      1
      6
      1
      NaN
      36
      333819
      7394525
      40010024
      ...
      3
      18
      0
      0
      18
      10
      0
      10
      0
      0
    
    
      24
      1
      4
      1
      3
      1
      NaN
      36
      333739
      7394550
      40010042
      ...
      3
      10
      0
      0
      10
      15
      0
      15
      0
      0
    
    
      25
      1
      4
      1
      3
      1
      NaN
      36
      333739
      7394550
      40010042
      ...
      3
      11
      30
      0
      11
      45
      0
      15
      0
      0
    
    
      26
      1
      4
      1
      3
      1
      NaN
      36
      333739
      7394550
      40010042
      ...
      1
      8
      0
      10
      8
      30
      5
      30
      0
      0
    
    
      27
      1
      4
      1
      3
      1
      NaN
      36
      333739
      7394550
      40010042
      ...
      1
      10
      0
      20
      10
      40
      10
      40
      0
      0
    
    
      28
      1
      4
      1
      3
      1
      NaN
      36
      333739
      7394550
      40010042
      ...
      1
      11
      45
      10
      14
      30
      10
      165
      0
      0
    
    
      29
      1
      4
      1
      3
      1
      NaN
      36
      333739
      7394550
      40010042
      ...
      3
      18
      0
      0
      18
      10
      0
      10
      0
      0
    
    
      30
      1
      4
      1
      3
      1
      NaN
      36
      333739
      7394550
      40010042
      ...
      3
      18
      50
      0
      19
      5
      0
      15
      0
      0
    
    
      34
      1
      4
      1
      3
      1
      NaN
      36
      333840
      7394468
      40010047
      ...
      2
      7
      30
      1
      7
      45
      1
      15
      5
      0
    
    
      35
      1
      4
      1
      3
      1
      NaN
      36
      333840
      7394468
      40010047
      ...
      2
      10
      15
      0
      10
      45
      0
      30
      4
      0
    
    
      36
      1
      4
      1
      3
      1
      NaN
      36
      333840
      7394468
      40010047
      ...
      2
      11
      30
      0
      12
      5
      0
      35
      1
      0
    
    
      37
      1
      4
      1
      3
      1
      NaN
      36
      333840
      7394468
      40010047
      ...
      2
      12
      10
      0
      12
      30
      0
      20
      5
      0
    
    
      38
      1
      4
      1
      3
      1
      NaN
      36
      333840
      7394468
      40010047
      ...
      1
      12
      40
      5
      13
      15
      5
      35
      0
      0
    
    
      39
      1
      4
      1
      3
      1
      NaN
      36
      333840
      7394468
      40010047
      ...
      1
      17
      0
      10
      17
      40
      15
      40
      0
      0
    
    
      40
      1
      4
      1
      3
      1
      NaN
      36
      333840
      7394468
      40010047
      ...
      3
      21
      0
      5
      21
      30
      10
      30
      0
      0
    
    
      41
      1
      4
      1
      3
      1
      NaN
      36
      333840
      7394468
      40010047
      ...
      3
      6
      30
      0
      6
      45
      0
      15
      0
      0
    
    
      42
      1
      4
      1
      3
      1
      NaN
      36
      333840
      7394468
      40010047
      ...
      3
      12
      20
      0
      12
      35
      0
      15
      0
      0
    
    
      43
      1
      4
      1
      3
      1
      NaN
      36
      333840
      7394468
      40010047
      ...
      3
      15
      0
      0
      15
      10
      0
      10
      0
      0
    
    
      44
      1
      4
      1
      3
      1
      NaN
      36
      333840
      7394468
      40010047
      ...
      3
      16
      15
      0
      16
      30
      0
      15
      0
      0
    
    
      45
      1
      4
      1
      3
      1
      NaN
      36
      333840
      7394468
      40010047
      ...
      2
      7
      30
      1
      7
      45
      1
      15
      0
      0
    
    
      46
      1
      4
      1
      3
      1
      NaN
      36
      333840
      7394468
      40010047
      ...
      1
      10
      40
      1
      11
      30
      1
      50
      0
      0
    
    
      47
      1
      4
      1
      3
      1
      NaN
      36
      333840
      7394468
      40010047
      ...
      2
      12
      10
      1
      12
      45
      5
      35
      0
      0
    
    
      54
      1
      4
      1
      6
      1
      NaN
      36
      333738
      7394460
      40011007
      ...
      3
      12
      0
      0
      12
      40
      0
      40
      0
      0
    
    
      55
      1
      4
      1
      6
      1
      NaN
      36
      333738
      7394460
      40011007
      ...
      3
      18
      0
      0
      19
      30
      0
      90
      0
      0
    
    
      71
      1
      4
      1
      0
      1
      NaN
      36
      333622
      7394465
      40011018
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
    
    
      4954
      5
      4
      1
      6
      11
      NaN
      36
      335808
      7397246
      40111164
      ...
      3
      7
      0
      0
      7
      5
      0
      5
      0
      0
    
    
      4955
      5
      4
      1
      6
      11
      NaN
      36
      335808
      7397246
      40111164
      ...
      3
      12
      45
      0
      12
      50
      0
      5
      0
      0
    
    
      4956
      5
      4
      1
      0
      11
      NaN
      36
      335808
      7397246
      40111164
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4959
      5
      4
      1
      0
      11
      NaN
      36
      335848
      7397343
      40111166
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4960
      5
      4
      1
      3
      11
      NaN
      36
      335848
      7397343
      40111166
      ...
      3
      7
      0
      15
      7
      25
      0
      25
      0
      0
    
    
      4961
      5
      4
      1
      3
      11
      NaN
      36
      335848
      7397343
      40111166
      ...
      3
      12
      30
      15
      12
      55
      0
      25
      0
      0
    
    
      4962
      5
      4
      1
      3
      11
      NaN
      36
      335848
      7397343
      40111166
      ...
      3
      12
      40
      15
      13
      3
      0
      23
      0
      0
    
    
      4963
      5
      4
      1
      3
      11
      NaN
      36
      335848
      7397343
      40111166
      ...
      3
      18
      0
      15
      18
      25
      0
      25
      0
      0
    
    
      4964
      5
      4
      1
      0
      11
      NaN
      36
      335848
      7397343
      40111166
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4965
      5
      4
      1
      0
      11
      NaN
      36
      335848
      7397343
      40111166
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4966
      5
      4
      1
      3
      11
      NaN
      36
      335748
      7397321
      40111167
      ...
      2
      8
      0
      0
      8
      20
      0
      20
      0
      0
    
    
      4967
      5
      4
      1
      3
      11
      NaN
      36
      335748
      7397321
      40111167
      ...
      2
      11
      40
      0
      12
      0
      0
      20
      0
      0
    
    
      4968
      5
      4
      1
      3
      11
      NaN
      36
      335748
      7397321
      40111167
      ...
      2
      8
      0
      0
      8
      20
      0
      20
      0
      0
    
    
      4969
      5
      4
      1
      3
      11
      NaN
      36
      335748
      7397321
      40111167
      ...
      2
      11
      40
      0
      12
      0
      0
      20
      0
      0
    
    
      4970
      5
      4
      1
      0
      11
      NaN
      36
      335748
      7397321
      40111167
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4973
      5
      4
      1
      5
      11
      NaN
      36
      336005
      7397304
      40111171
      ...
      3
      7
      30
      0
      7
      50
      0
      20
      0
      0
    
    
      4974
      5
      4
      1
      5
      11
      NaN
      36
      336005
      7397304
      40111171
      ...
      3
      8
      0
      0
      8
      30
      0
      30
      0
      0
    
    
      4975
      5
      4
      1
      5
      11
      NaN
      36
      336005
      7397304
      40111171
      ...
      3
      15
      30
      0
      15
      50
      0
      20
      0
      0
    
    
      4976
      5
      4
      1
      5
      11
      NaN
      36
      336005
      7397304
      40111171
      ...
      3
      16
      0
      0
      16
      30
      0
      30
      0
      0
    
    
      4979
      5
      4
      1
      5
      11
      NaN
      36
      336005
      7397304
      40111171
      ...
      3
      7
      30
      0
      7
      50
      0
      20
      0
      0
    
    
      4980
      5
      4
      1
      5
      11
      NaN
      36
      336005
      7397304
      40111171
      ...
      3
      16
      0
      0
      16
      30
      0
      30
      0
      0
    
    
      4985
      5
      4
      1
      5
      11
      NaN
      36
      335786
      7397283
      40111172
      ...
      1
      11
      30
      0
      12
      0
      0
      30
      0
      0
    
    
      4986
      5
      4
      1
      5
      11
      NaN
      36
      335786
      7397283
      40111172
      ...
      1
      18
      0
      0
      18
      40
      0
      40
      0
      0
    
    
      4987
      5
      4
      1
      5
      11
      NaN
      36
      335786
      7397283
      40111172
      ...
      1
      11
      30
      0
      12
      0
      0
      30
      0
      0
    
    
      4988
      5
      4
      1
      5
      11
      NaN
      36
      335786
      7397283
      40111172
      ...
      1
      18
      0
      0
      18
      30
      0
      30
      0
      0
    
    
      4991
      5
      4
      1
      0
      11
      NaN
      36
      335794
      7397088
      40111194
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4992
      5
      4
      1
      2
      11
      NaN
      36
      335794
      7397088
      40111194
      ...
      1
      6
      25
      1
      7
      30
      5
      65
      0
      0
    
    
      4993
      5
      4
      1
      2
      11
      NaN
      36
      335794
      7397088
      40111194
      ...
      1
      11
      30
      5
      12
      30
      5
      60
      0
      0
    
    
      4994
      5
      4
      1
      2
      11
      NaN
      36
      335794
      7397088
      40111194
      ...
      1
      6
      25
      1
      7
      45
      5
      80
      0
      0
    
    
      4995
      5
      4
      1
      2
      11
      NaN
      36
      335794
      7397088
      40111194
      ...
      1
      19
      0
      5
      20
      45
      5
      105
      0
      0
    
  

1844 rows × 91 columns

Passo 33: "ZONA_TRAB1"

Checar se existe algum erro

Categorias:

1 a 460

[Teste: Checar se existe algum número < 1 ou > 460. Se encontrar, retornar erro indicando em qual linha.]



In [237]:

    
if not impressao:
    #Verifying value interval for check - conditions: "ZONA_TRAB1 < 1" and "ZONA_TRAB1 > 460"
    #The 'error' returns must be related to "ZONA_TRAB1"==0, that is, trips that are not school purposed
    od2007_ex[(od2007_ex['ZONA_TRAB1']<1) | (od2007_ex['ZONA_TRAB1']>460)]









    Out[237]:






  
    
      
      UCOD_DOM
      ANO
      CD_ENTRE
      DIA_SEM
      ZONA_DOM
      SUBZONA_DOM
      MUN_DOM
      CO_DOM_X
      CO_DOM_Y
      ID_DOM
      ...
      TIPO_VIAG
      H_SAIDA
      MIN_SAIDA
      ANDA_ORIG
      H_CHEG
      MIN_CHEG
      ANDA_DEST
      DURACAO
      TIPO_EST_AUTO
      VALOR_EST_AUTO
    
  
  
    
      4
      1
      4
      1
      0
      1
      NaN
      36
      333858
      7394484
      40010018
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      9
      1
      4
      1
      0
      1
      NaN
      36
      333801
      7394422
      40010019
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      10
      1
      4
      1
      5
      1
      NaN
      36
      333801
      7394422
      40010019
      ...
      3
      6
      35
      0
      6
      40
      0
      5
      0
      0
    
    
      11
      1
      4
      1
      5
      1
      NaN
      36
      333801
      7394422
      40010019
      ...
      3
      12
      20
      0
      12
      25
      0
      5
      0
      0
    
    
      17
      1
      4
      1
      6
      1
      NaN
      36
      333819
      7394525
      40010024
      ...
      3
      16
      0
      0
      16
      10
      0
      10
      0
      0
    
    
      18
      1
      4
      1
      6
      1
      NaN
      36
      333819
      7394525
      40010024
      ...
      3
      18
      0
      0
      18
      10
      0
      10
      0
      0
    
    
      24
      1
      4
      1
      3
      1
      NaN
      36
      333739
      7394550
      40010042
      ...
      3
      10
      0
      0
      10
      15
      0
      15
      0
      0
    
    
      25
      1
      4
      1
      3
      1
      NaN
      36
      333739
      7394550
      40010042
      ...
      3
      11
      30
      0
      11
      45
      0
      15
      0
      0
    
    
      26
      1
      4
      1
      3
      1
      NaN
      36
      333739
      7394550
      40010042
      ...
      1
      8
      0
      10
      8
      30
      5
      30
      0
      0
    
    
      27
      1
      4
      1
      3
      1
      NaN
      36
      333739
      7394550
      40010042
      ...
      1
      10
      0
      20
      10
      40
      10
      40
      0
      0
    
    
      28
      1
      4
      1
      3
      1
      NaN
      36
      333739
      7394550
      40010042
      ...
      1
      11
      45
      10
      14
      30
      10
      165
      0
      0
    
    
      29
      1
      4
      1
      3
      1
      NaN
      36
      333739
      7394550
      40010042
      ...
      3
      18
      0
      0
      18
      10
      0
      10
      0
      0
    
    
      30
      1
      4
      1
      3
      1
      NaN
      36
      333739
      7394550
      40010042
      ...
      3
      18
      50
      0
      19
      5
      0
      15
      0
      0
    
    
      34
      1
      4
      1
      3
      1
      NaN
      36
      333840
      7394468
      40010047
      ...
      2
      7
      30
      1
      7
      45
      1
      15
      5
      0
    
    
      35
      1
      4
      1
      3
      1
      NaN
      36
      333840
      7394468
      40010047
      ...
      2
      10
      15
      0
      10
      45
      0
      30
      4
      0
    
    
      36
      1
      4
      1
      3
      1
      NaN
      36
      333840
      7394468
      40010047
      ...
      2
      11
      30
      0
      12
      5
      0
      35
      1
      0
    
    
      37
      1
      4
      1
      3
      1
      NaN
      36
      333840
      7394468
      40010047
      ...
      2
      12
      10
      0
      12
      30
      0
      20
      5
      0
    
    
      38
      1
      4
      1
      3
      1
      NaN
      36
      333840
      7394468
      40010047
      ...
      1
      12
      40
      5
      13
      15
      5
      35
      0
      0
    
    
      39
      1
      4
      1
      3
      1
      NaN
      36
      333840
      7394468
      40010047
      ...
      1
      17
      0
      10
      17
      40
      15
      40
      0
      0
    
    
      40
      1
      4
      1
      3
      1
      NaN
      36
      333840
      7394468
      40010047
      ...
      3
      21
      0
      5
      21
      30
      10
      30
      0
      0
    
    
      41
      1
      4
      1
      3
      1
      NaN
      36
      333840
      7394468
      40010047
      ...
      3
      6
      30
      0
      6
      45
      0
      15
      0
      0
    
    
      42
      1
      4
      1
      3
      1
      NaN
      36
      333840
      7394468
      40010047
      ...
      3
      12
      20
      0
      12
      35
      0
      15
      0
      0
    
    
      43
      1
      4
      1
      3
      1
      NaN
      36
      333840
      7394468
      40010047
      ...
      3
      15
      0
      0
      15
      10
      0
      10
      0
      0
    
    
      44
      1
      4
      1
      3
      1
      NaN
      36
      333840
      7394468
      40010047
      ...
      3
      16
      15
      0
      16
      30
      0
      15
      0
      0
    
    
      45
      1
      4
      1
      3
      1
      NaN
      36
      333840
      7394468
      40010047
      ...
      2
      7
      30
      1
      7
      45
      1
      15
      0
      0
    
    
      46
      1
      4
      1
      3
      1
      NaN
      36
      333840
      7394468
      40010047
      ...
      1
      10
      40
      1
      11
      30
      1
      50
      0
      0
    
    
      47
      1
      4
      1
      3
      1
      NaN
      36
      333840
      7394468
      40010047
      ...
      2
      12
      10
      1
      12
      45
      5
      35
      0
      0
    
    
      54
      1
      4
      1
      6
      1
      NaN
      36
      333738
      7394460
      40011007
      ...
      3
      12
      0
      0
      12
      40
      0
      40
      0
      0
    
    
      55
      1
      4
      1
      6
      1
      NaN
      36
      333738
      7394460
      40011007
      ...
      3
      18
      0
      0
      19
      30
      0
      90
      0
      0
    
    
      71
      1
      4
      1
      0
      1
      NaN
      36
      333622
      7394465
      40011018
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
    
    
      4954
      5
      4
      1
      6
      11
      NaN
      36
      335808
      7397246
      40111164
      ...
      3
      7
      0
      0
      7
      5
      0
      5
      0
      0
    
    
      4955
      5
      4
      1
      6
      11
      NaN
      36
      335808
      7397246
      40111164
      ...
      3
      12
      45
      0
      12
      50
      0
      5
      0
      0
    
    
      4956
      5
      4
      1
      0
      11
      NaN
      36
      335808
      7397246
      40111164
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4959
      5
      4
      1
      0
      11
      NaN
      36
      335848
      7397343
      40111166
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4960
      5
      4
      1
      3
      11
      NaN
      36
      335848
      7397343
      40111166
      ...
      3
      7
      0
      15
      7
      25
      0
      25
      0
      0
    
    
      4961
      5
      4
      1
      3
      11
      NaN
      36
      335848
      7397343
      40111166
      ...
      3
      12
      30
      15
      12
      55
      0
      25
      0
      0
    
    
      4962
      5
      4
      1
      3
      11
      NaN
      36
      335848
      7397343
      40111166
      ...
      3
      12
      40
      15
      13
      3
      0
      23
      0
      0
    
    
      4963
      5
      4
      1
      3
      11
      NaN
      36
      335848
      7397343
      40111166
      ...
      3
      18
      0
      15
      18
      25
      0
      25
      0
      0
    
    
      4964
      5
      4
      1
      0
      11
      NaN
      36
      335848
      7397343
      40111166
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4965
      5
      4
      1
      0
      11
      NaN
      36
      335848
      7397343
      40111166
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4966
      5
      4
      1
      3
      11
      NaN
      36
      335748
      7397321
      40111167
      ...
      2
      8
      0
      0
      8
      20
      0
      20
      0
      0
    
    
      4967
      5
      4
      1
      3
      11
      NaN
      36
      335748
      7397321
      40111167
      ...
      2
      11
      40
      0
      12
      0
      0
      20
      0
      0
    
    
      4968
      5
      4
      1
      3
      11
      NaN
      36
      335748
      7397321
      40111167
      ...
      2
      8
      0
      0
      8
      20
      0
      20
      0
      0
    
    
      4969
      5
      4
      1
      3
      11
      NaN
      36
      335748
      7397321
      40111167
      ...
      2
      11
      40
      0
      12
      0
      0
      20
      0
      0
    
    
      4970
      5
      4
      1
      0
      11
      NaN
      36
      335748
      7397321
      40111167
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4973
      5
      4
      1
      5
      11
      NaN
      36
      336005
      7397304
      40111171
      ...
      3
      7
      30
      0
      7
      50
      0
      20
      0
      0
    
    
      4974
      5
      4
      1
      5
      11
      NaN
      36
      336005
      7397304
      40111171
      ...
      3
      8
      0
      0
      8
      30
      0
      30
      0
      0
    
    
      4975
      5
      4
      1
      5
      11
      NaN
      36
      336005
      7397304
      40111171
      ...
      3
      15
      30
      0
      15
      50
      0
      20
      0
      0
    
    
      4976
      5
      4
      1
      5
      11
      NaN
      36
      336005
      7397304
      40111171
      ...
      3
      16
      0
      0
      16
      30
      0
      30
      0
      0
    
    
      4979
      5
      4
      1
      5
      11
      NaN
      36
      336005
      7397304
      40111171
      ...
      3
      7
      30
      0
      7
      50
      0
      20
      0
      0
    
    
      4980
      5
      4
      1
      5
      11
      NaN
      36
      336005
      7397304
      40111171
      ...
      3
      16
      0
      0
      16
      30
      0
      30
      0
      0
    
    
      4985
      5
      4
      1
      5
      11
      NaN
      36
      335786
      7397283
      40111172
      ...
      1
      11
      30
      0
      12
      0
      0
      30
      0
      0
    
    
      4986
      5
      4
      1
      5
      11
      NaN
      36
      335786
      7397283
      40111172
      ...
      1
      18
      0
      0
      18
      40
      0
      40
      0
      0
    
    
      4987
      5
      4
      1
      5
      11
      NaN
      36
      335786
      7397283
      40111172
      ...
      1
      11
      30
      0
      12
      0
      0
      30
      0
      0
    
    
      4988
      5
      4
      1
      5
      11
      NaN
      36
      335786
      7397283
      40111172
      ...
      1
      18
      0
      0
      18
      30
      0
      30
      0
      0
    
    
      4991
      5
      4
      1
      0
      11
      NaN
      36
      335794
      7397088
      40111194
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4992
      5
      4
      1
      2
      11
      NaN
      36
      335794
      7397088
      40111194
      ...
      1
      6
      25
      1
      7
      30
      5
      65
      0
      0
    
    
      4993
      5
      4
      1
      2
      11
      NaN
      36
      335794
      7397088
      40111194
      ...
      1
      11
      30
      5
      12
      30
      5
      60
      0
      0
    
    
      4994
      5
      4
      1
      2
      11
      NaN
      36
      335794
      7397088
      40111194
      ...
      1
      6
      25
      1
      7
      45
      5
      80
      0
      0
    
    
      4995
      5
      4
      1
      2
      11
      NaN
      36
      335794
      7397088
      40111194
      ...
      1
      19
      0
      5
      20
      45
      5
      105
      0
      0
    
  

1844 rows × 91 columns

Passo 34: "SUBZONA_TRAB1"

A coluna "SUBZONA_TRAB1" ficará vazia (missing values) em 2007 porque este ano já contém os dados de coordenadas.

Para os anos em que esse input não existe originalmente, esse campo é critério para inserção de coordenadas.

Passo 35: "MUN_TRAB1"

Checar se existe algum erro

Categorias

1 a 39

[Teste: Checar se existe algum número < 1 ou > 39. Se encontrar, retornar erro indicando em qual linha.]



In [238]:

    
if not impressao:
    #Verifying value interval for check - conditions: "MUN_TRAB1 < 1" ou de "MUN_TRAB1 > 39"
    #The 'error' returns must be related to "MUN_TRAB1" == 0, that is, trips that are not school purposed
    od2007_ex[(od2007_ex['MUN_TRAB1']<1) | (od2007_ex['MUN_TRAB1']>39)]









    Out[238]:






  
    
      
      UCOD_DOM
      ANO
      CD_ENTRE
      DIA_SEM
      ZONA_DOM
      SUBZONA_DOM
      MUN_DOM
      CO_DOM_X
      CO_DOM_Y
      ID_DOM
      ...
      TIPO_VIAG
      H_SAIDA
      MIN_SAIDA
      ANDA_ORIG
      H_CHEG
      MIN_CHEG
      ANDA_DEST
      DURACAO
      TIPO_EST_AUTO
      VALOR_EST_AUTO
    
  
  
    
      4
      1
      4
      1
      0
      1
      NaN
      36
      333858
      7394484
      40010018
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      9
      1
      4
      1
      0
      1
      NaN
      36
      333801
      7394422
      40010019
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      10
      1
      4
      1
      5
      1
      NaN
      36
      333801
      7394422
      40010019
      ...
      3
      6
      35
      0
      6
      40
      0
      5
      0
      0
    
    
      11
      1
      4
      1
      5
      1
      NaN
      36
      333801
      7394422
      40010019
      ...
      3
      12
      20
      0
      12
      25
      0
      5
      0
      0
    
    
      17
      1
      4
      1
      6
      1
      NaN
      36
      333819
      7394525
      40010024
      ...
      3
      16
      0
      0
      16
      10
      0
      10
      0
      0
    
    
      18
      1
      4
      1
      6
      1
      NaN
      36
      333819
      7394525
      40010024
      ...
      3
      18
      0
      0
      18
      10
      0
      10
      0
      0
    
    
      24
      1
      4
      1
      3
      1
      NaN
      36
      333739
      7394550
      40010042
      ...
      3
      10
      0
      0
      10
      15
      0
      15
      0
      0
    
    
      25
      1
      4
      1
      3
      1
      NaN
      36
      333739
      7394550
      40010042
      ...
      3
      11
      30
      0
      11
      45
      0
      15
      0
      0
    
    
      26
      1
      4
      1
      3
      1
      NaN
      36
      333739
      7394550
      40010042
      ...
      1
      8
      0
      10
      8
      30
      5
      30
      0
      0
    
    
      27
      1
      4
      1
      3
      1
      NaN
      36
      333739
      7394550
      40010042
      ...
      1
      10
      0
      20
      10
      40
      10
      40
      0
      0
    
    
      28
      1
      4
      1
      3
      1
      NaN
      36
      333739
      7394550
      40010042
      ...
      1
      11
      45
      10
      14
      30
      10
      165
      0
      0
    
    
      29
      1
      4
      1
      3
      1
      NaN
      36
      333739
      7394550
      40010042
      ...
      3
      18
      0
      0
      18
      10
      0
      10
      0
      0
    
    
      30
      1
      4
      1
      3
      1
      NaN
      36
      333739
      7394550
      40010042
      ...
      3
      18
      50
      0
      19
      5
      0
      15
      0
      0
    
    
      34
      1
      4
      1
      3
      1
      NaN
      36
      333840
      7394468
      40010047
      ...
      2
      7
      30
      1
      7
      45
      1
      15
      5
      0
    
    
      35
      1
      4
      1
      3
      1
      NaN
      36
      333840
      7394468
      40010047
      ...
      2
      10
      15
      0
      10
      45
      0
      30
      4
      0
    
    
      36
      1
      4
      1
      3
      1
      NaN
      36
      333840
      7394468
      40010047
      ...
      2
      11
      30
      0
      12
      5
      0
      35
      1
      0
    
    
      37
      1
      4
      1
      3
      1
      NaN
      36
      333840
      7394468
      40010047
      ...
      2
      12
      10
      0
      12
      30
      0
      20
      5
      0
    
    
      38
      1
      4
      1
      3
      1
      NaN
      36
      333840
      7394468
      40010047
      ...
      1
      12
      40
      5
      13
      15
      5
      35
      0
      0
    
    
      39
      1
      4
      1
      3
      1
      NaN
      36
      333840
      7394468
      40010047
      ...
      1
      17
      0
      10
      17
      40
      15
      40
      0
      0
    
    
      40
      1
      4
      1
      3
      1
      NaN
      36
      333840
      7394468
      40010047
      ...
      3
      21
      0
      5
      21
      30
      10
      30
      0
      0
    
    
      41
      1
      4
      1
      3
      1
      NaN
      36
      333840
      7394468
      40010047
      ...
      3
      6
      30
      0
      6
      45
      0
      15
      0
      0
    
    
      42
      1
      4
      1
      3
      1
      NaN
      36
      333840
      7394468
      40010047
      ...
      3
      12
      20
      0
      12
      35
      0
      15
      0
      0
    
    
      43
      1
      4
      1
      3
      1
      NaN
      36
      333840
      7394468
      40010047
      ...
      3
      15
      0
      0
      15
      10
      0
      10
      0
      0
    
    
      44
      1
      4
      1
      3
      1
      NaN
      36
      333840
      7394468
      40010047
      ...
      3
      16
      15
      0
      16
      30
      0
      15
      0
      0
    
    
      45
      1
      4
      1
      3
      1
      NaN
      36
      333840
      7394468
      40010047
      ...
      2
      7
      30
      1
      7
      45
      1
      15
      0
      0
    
    
      46
      1
      4
      1
      3
      1
      NaN
      36
      333840
      7394468
      40010047
      ...
      1
      10
      40
      1
      11
      30
      1
      50
      0
      0
    
    
      47
      1
      4
      1
      3
      1
      NaN
      36
      333840
      7394468
      40010047
      ...
      2
      12
      10
      1
      12
      45
      5
      35
      0
      0
    
    
      54
      1
      4
      1
      6
      1
      NaN
      36
      333738
      7394460
      40011007
      ...
      3
      12
      0
      0
      12
      40
      0
      40
      0
      0
    
    
      55
      1
      4
      1
      6
      1
      NaN
      36
      333738
      7394460
      40011007
      ...
      3
      18
      0
      0
      19
      30
      0
      90
      0
      0
    
    
      71
      1
      4
      1
      0
      1
      NaN
      36
      333622
      7394465
      40011018
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
    
    
      4954
      5
      4
      1
      6
      11
      NaN
      36
      335808
      7397246
      40111164
      ...
      3
      7
      0
      0
      7
      5
      0
      5
      0
      0
    
    
      4955
      5
      4
      1
      6
      11
      NaN
      36
      335808
      7397246
      40111164
      ...
      3
      12
      45
      0
      12
      50
      0
      5
      0
      0
    
    
      4956
      5
      4
      1
      0
      11
      NaN
      36
      335808
      7397246
      40111164
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4959
      5
      4
      1
      0
      11
      NaN
      36
      335848
      7397343
      40111166
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4960
      5
      4
      1
      3
      11
      NaN
      36
      335848
      7397343
      40111166
      ...
      3
      7
      0
      15
      7
      25
      0
      25
      0
      0
    
    
      4961
      5
      4
      1
      3
      11
      NaN
      36
      335848
      7397343
      40111166
      ...
      3
      12
      30
      15
      12
      55
      0
      25
      0
      0
    
    
      4962
      5
      4
      1
      3
      11
      NaN
      36
      335848
      7397343
      40111166
      ...
      3
      12
      40
      15
      13
      3
      0
      23
      0
      0
    
    
      4963
      5
      4
      1
      3
      11
      NaN
      36
      335848
      7397343
      40111166
      ...
      3
      18
      0
      15
      18
      25
      0
      25
      0
      0
    
    
      4964
      5
      4
      1
      0
      11
      NaN
      36
      335848
      7397343
      40111166
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4965
      5
      4
      1
      0
      11
      NaN
      36
      335848
      7397343
      40111166
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4966
      5
      4
      1
      3
      11
      NaN
      36
      335748
      7397321
      40111167
      ...
      2
      8
      0
      0
      8
      20
      0
      20
      0
      0
    
    
      4967
      5
      4
      1
      3
      11
      NaN
      36
      335748
      7397321
      40111167
      ...
      2
      11
      40
      0
      12
      0
      0
      20
      0
      0
    
    
      4968
      5
      4
      1
      3
      11
      NaN
      36
      335748
      7397321
      40111167
      ...
      2
      8
      0
      0
      8
      20
      0
      20
      0
      0
    
    
      4969
      5
      4
      1
      3
      11
      NaN
      36
      335748
      7397321
      40111167
      ...
      2
      11
      40
      0
      12
      0
      0
      20
      0
      0
    
    
      4970
      5
      4
      1
      0
      11
      NaN
      36
      335748
      7397321
      40111167
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4973
      5
      4
      1
      5
      11
      NaN
      36
      336005
      7397304
      40111171
      ...
      3
      7
      30
      0
      7
      50
      0
      20
      0
      0
    
    
      4974
      5
      4
      1
      5
      11
      NaN
      36
      336005
      7397304
      40111171
      ...
      3
      8
      0
      0
      8
      30
      0
      30
      0
      0
    
    
      4975
      5
      4
      1
      5
      11
      NaN
      36
      336005
      7397304
      40111171
      ...
      3
      15
      30
      0
      15
      50
      0
      20
      0
      0
    
    
      4976
      5
      4
      1
      5
      11
      NaN
      36
      336005
      7397304
      40111171
      ...
      3
      16
      0
      0
      16
      30
      0
      30
      0
      0
    
    
      4979
      5
      4
      1
      5
      11
      NaN
      36
      336005
      7397304
      40111171
      ...
      3
      7
      30
      0
      7
      50
      0
      20
      0
      0
    
    
      4980
      5
      4
      1
      5
      11
      NaN
      36
      336005
      7397304
      40111171
      ...
      3
      16
      0
      0
      16
      30
      0
      30
      0
      0
    
    
      4985
      5
      4
      1
      5
      11
      NaN
      36
      335786
      7397283
      40111172
      ...
      1
      11
      30
      0
      12
      0
      0
      30
      0
      0
    
    
      4986
      5
      4
      1
      5
      11
      NaN
      36
      335786
      7397283
      40111172
      ...
      1
      18
      0
      0
      18
      40
      0
      40
      0
      0
    
    
      4987
      5
      4
      1
      5
      11
      NaN
      36
      335786
      7397283
      40111172
      ...
      1
      11
      30
      0
      12
      0
      0
      30
      0
      0
    
    
      4988
      5
      4
      1
      5
      11
      NaN
      36
      335786
      7397283
      40111172
      ...
      1
      18
      0
      0
      18
      30
      0
      30
      0
      0
    
    
      4991
      5
      4
      1
      0
      11
      NaN
      36
      335794
      7397088
      40111194
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4992
      5
      4
      1
      2
      11
      NaN
      36
      335794
      7397088
      40111194
      ...
      1
      6
      25
      1
      7
      30
      5
      65
      0
      0
    
    
      4993
      5
      4
      1
      2
      11
      NaN
      36
      335794
      7397088
      40111194
      ...
      1
      11
      30
      5
      12
      30
      5
      60
      0
      0
    
    
      4994
      5
      4
      1
      2
      11
      NaN
      36
      335794
      7397088
      40111194
      ...
      1
      6
      25
      1
      7
      45
      5
      80
      0
      0
    
    
      4995
      5
      4
      1
      2
      11
      NaN
      36
      335794
      7397088
      40111194
      ...
      1
      19
      0
      5
      20
      45
      5
      105
      0
      0
    
  

1844 rows × 91 columns

Passo 36: "CO_TRAB1_X"

Em 2007 já existe a informação de "CO_TRAB1_X"

Para os demais anos:

[Na coluna "CO_TRAB1_X", linha i, ler o valor da linha i da coluna "SUBZONA_TRAB1", daí, buscar o mesmo valor na coluna "Subzonas_XXXX" do arquivo CO-SUBZONAS-XXXX.csv. Ao achar, retornar o valor da mesma linha, só que da coluna "CO_X"]

[Obs.: ainda preciso construir esses csv, ou seja, determinar os centroides das subzonas a partir do MapInfo]

Passo 37: "CO_TRAB1_Y"

Em 2007 já existe a informação de "CO_TRAB1_Y"

Para os demais anos:

[Na coluna "CO_TRAB1_Y", linha i, ler o valor da linha i da coluna "SUBZONA_TRAB1", daí, buscar o mesmo valor na coluna "Subzonas_XXXX" do arquivo CO-SUBZONAS-XXXX.csv. Ao achar, retornar o valor da mesma linha, só que da coluna "CO_Y"]

[Obs.: ainda preciso construir esses csv, ou seja, determinar os centroides das subzonas a partir do MapInfo]

Passo 38: "UCOD_TRAB2"

Na coluna "UCOD_TRAB2", linha i, ler o valor da linha i da coluna "ZONA_TRAB1", daí, buscar o mesmo valor na coluna "Zona 2007" do arquivo UCOD-2007.csv. Ao achar, retornar o valor da mesma linha, só que da coluna "UCOD_TRAB2"

[Teste: no banco completo, checar se o min == 1 e o max == 67]



In [239]:

    
#Getting from the csv file the "UCOD" code correspondent to the "ZONA_TRAB2" code
od2007_ex['UCOD_TRAB2'] = od2007_ex.apply(lambda row: consulta_refext(row, 'UCOD-2007.csv', 'Zona 2007', 'ZONA_TRAB2', 'UCOD'), axis=1)



In [240]:

    
if not impressao:
    #Describing data ("UCOD_TRAB2" column) - count, mean, std, min and max
    od2007_ex['UCOD_TRAB2'].describe()









    Out[240]:





count    5000.000000
mean        0.276400
std         2.330212
min         0.000000
25%         0.000000
50%         0.000000
75%         0.000000
max        50.000000
Name: UCOD_TRAB2, dtype: float64



In [241]:

    
if not impressao:
    #Count for check "UCOD_TRAB2"
    od2007_ex['UCOD_TRAB2'].value_counts()









    Out[241]:





0     4875
1       24
4       18
19      18
13      12
21       8
3        6
12       6
2        5
38       4
30       4
10       4
15       4
5        4
8        3
16       2
11       2
50       1
dtype: int64



In [242]:

    
if not impressao:
    #Verifying value interval for check - conditions: "UCOD_TRAB2 < 1" and "UCOD_TRAB2 > 67"
    #The 'error' returns must be related to "UCOD_TRAB2" == 0, that is, trips that are not school purposed
    od2007_ex[(od2007_ex['UCOD_TRAB2']<1) | (od2007_ex['UCOD_TRAB2']>67)]









    Out[242]:






  
    
      
      UCOD_DOM
      ANO
      CD_ENTRE
      DIA_SEM
      ZONA_DOM
      SUBZONA_DOM
      MUN_DOM
      CO_DOM_X
      CO_DOM_Y
      ID_DOM
      ...
      TIPO_VIAG
      H_SAIDA
      MIN_SAIDA
      ANDA_ORIG
      H_CHEG
      MIN_CHEG
      ANDA_DEST
      DURACAO
      TIPO_EST_AUTO
      VALOR_EST_AUTO
    
  
  
    
      0
      1
      4
      1
      6
      1
      NaN
      36
      333729
      7394430
      40010001
      ...
      3
      8
      0
      0
      8
      10
      0
      10
      0
      0
    
    
      1
      1
      4
      1
      6
      1
      NaN
      36
      333729
      7394430
      40010001
      ...
      3
      17
      30
      0
      17
      40
      0
      10
      0
      0
    
    
      2
      1
      4
      1
      5
      1
      NaN
      36
      333858
      7394484
      40010018
      ...
      1
      4
      30
      2
      5
      45
      2
      75
      0
      0
    
    
      3
      1
      4
      1
      5
      1
      NaN
      36
      333858
      7394484
      40010018
      ...
      1
      18
      10
      2
      19
      30
      2
      80
      0
      0
    
    
      4
      1
      4
      1
      0
      1
      NaN
      36
      333858
      7394484
      40010018
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      5
      1
      4
      1
      5
      1
      NaN
      36
      333801
      7394422
      40010019
      ...
      4
      9
      30
      1
      10
      0
      1
      30
      0
      0
    
    
      6
      1
      4
      1
      5
      1
      NaN
      36
      333801
      7394422
      40010019
      ...
      4
      15
      0
      1
      15
      30
      1
      30
      0
      0
    
    
      7
      1
      4
      1
      5
      1
      NaN
      36
      333801
      7394422
      40010019
      ...
      4
      18
      30
      1
      19
      0
      1
      30
      0
      0
    
    
      8
      1
      4
      1
      5
      1
      NaN
      36
      333801
      7394422
      40010019
      ...
      4
      23
      45
      1
      0
      15
      1
      30
      0
      0
    
    
      9
      1
      4
      1
      0
      1
      NaN
      36
      333801
      7394422
      40010019
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      10
      1
      4
      1
      5
      1
      NaN
      36
      333801
      7394422
      40010019
      ...
      3
      6
      35
      0
      6
      40
      0
      5
      0
      0
    
    
      11
      1
      4
      1
      5
      1
      NaN
      36
      333801
      7394422
      40010019
      ...
      3
      12
      20
      0
      12
      25
      0
      5
      0
      0
    
    
      12
      1
      4
      1
      3
      1
      NaN
      36
      333610
      7394494
      40010021
      ...
      1
      7
      0
      10
      7
      30
      1
      30
      0
      0
    
    
      13
      1
      4
      1
      3
      1
      NaN
      36
      333610
      7394494
      40010021
      ...
      3
      8
      0
      0
      8
      20
      0
      20
      0
      0
    
    
      14
      1
      4
      1
      3
      1
      NaN
      36
      333610
      7394494
      40010021
      ...
      3
      12
      0
      0
      12
      40
      0
      40
      0
      0
    
    
      15
      1
      4
      1
      3
      1
      NaN
      36
      333610
      7394494
      40010021
      ...
      1
      19
      0
      0
      19
      45
      10
      45
      0
      0
    
    
      17
      1
      4
      1
      6
      1
      NaN
      36
      333819
      7394525
      40010024
      ...
      3
      16
      0
      0
      16
      10
      0
      10
      0
      0
    
    
      18
      1
      4
      1
      6
      1
      NaN
      36
      333819
      7394525
      40010024
      ...
      3
      18
      0
      0
      18
      10
      0
      10
      0
      0
    
    
      19
      1
      4
      1
      2
      1
      NaN
      36
      333738
      7394460
      40010032
      ...
      3
      11
      45
      0
      12
      5
      0
      20
      0
      0
    
    
      20
      1
      4
      1
      2
      1
      NaN
      36
      333738
      7394460
      40010032
      ...
      3
      12
      40
      0
      12
      50
      0
      10
      0
      0
    
    
      21
      1
      4
      1
      2
      1
      NaN
      36
      333738
      7394460
      40010032
      ...
      3
      13
      0
      0
      13
      20
      0
      20
      0
      0
    
    
      22
      1
      4
      1
      2
      1
      NaN
      36
      333738
      7394460
      40010032
      ...
      3
      14
      15
      0
      14
      40
      0
      25
      0
      0
    
    
      23
      1
      4
      1
      2
      1
      NaN
      36
      333738
      7394460
      40010032
      ...
      1
      18
      0
      10
      18
      25
      10
      25
      0
      0
    
    
      24
      1
      4
      1
      3
      1
      NaN
      36
      333739
      7394550
      40010042
      ...
      3
      10
      0
      0
      10
      15
      0
      15
      0
      0
    
    
      25
      1
      4
      1
      3
      1
      NaN
      36
      333739
      7394550
      40010042
      ...
      3
      11
      30
      0
      11
      45
      0
      15
      0
      0
    
    
      26
      1
      4
      1
      3
      1
      NaN
      36
      333739
      7394550
      40010042
      ...
      1
      8
      0
      10
      8
      30
      5
      30
      0
      0
    
    
      27
      1
      4
      1
      3
      1
      NaN
      36
      333739
      7394550
      40010042
      ...
      1
      10
      0
      20
      10
      40
      10
      40
      0
      0
    
    
      28
      1
      4
      1
      3
      1
      NaN
      36
      333739
      7394550
      40010042
      ...
      1
      11
      45
      10
      14
      30
      10
      165
      0
      0
    
    
      29
      1
      4
      1
      3
      1
      NaN
      36
      333739
      7394550
      40010042
      ...
      3
      18
      0
      0
      18
      10
      0
      10
      0
      0
    
    
      30
      1
      4
      1
      3
      1
      NaN
      36
      333739
      7394550
      40010042
      ...
      3
      18
      50
      0
      19
      5
      0
      15
      0
      0
    
    
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
    
    
      4970
      5
      4
      1
      0
      11
      NaN
      36
      335748
      7397321
      40111167
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4971
      5
      4
      1
      5
      11
      NaN
      36
      336005
      7397304
      40111171
      ...
      2
      6
      30
      0
      7
      0
      0
      30
      8
      0
    
    
      4972
      5
      4
      1
      5
      11
      NaN
      36
      336005
      7397304
      40111171
      ...
      2
      19
      0
      0
      19
      40
      0
      40
      8
      0
    
    
      4973
      5
      4
      1
      5
      11
      NaN
      36
      336005
      7397304
      40111171
      ...
      3
      7
      30
      0
      7
      50
      0
      20
      0
      0
    
    
      4974
      5
      4
      1
      5
      11
      NaN
      36
      336005
      7397304
      40111171
      ...
      3
      8
      0
      0
      8
      30
      0
      30
      0
      0
    
    
      4975
      5
      4
      1
      5
      11
      NaN
      36
      336005
      7397304
      40111171
      ...
      3
      15
      30
      0
      15
      50
      0
      20
      0
      0
    
    
      4976
      5
      4
      1
      5
      11
      NaN
      36
      336005
      7397304
      40111171
      ...
      3
      16
      0
      0
      16
      30
      0
      30
      0
      0
    
    
      4977
      5
      4
      1
      5
      11
      NaN
      36
      336005
      7397304
      40111171
      ...
      3
      7
      40
      0
      8
      0
      0
      20
      0
      0
    
    
      4978
      5
      4
      1
      5
      11
      NaN
      36
      336005
      7397304
      40111171
      ...
      3
      18
      0
      0
      18
      20
      0
      20
      0
      0
    
    
      4979
      5
      4
      1
      5
      11
      NaN
      36
      336005
      7397304
      40111171
      ...
      3
      7
      30
      0
      7
      50
      0
      20
      0
      0
    
    
      4980
      5
      4
      1
      5
      11
      NaN
      36
      336005
      7397304
      40111171
      ...
      3
      16
      0
      0
      16
      30
      0
      30
      0
      0
    
    
      4981
      5
      4
      1
      5
      11
      NaN
      36
      335786
      7397283
      40111172
      ...
      3
      10
      0
      0
      10
      30
      0
      30
      0
      0
    
    
      4982
      5
      4
      1
      5
      11
      NaN
      36
      335786
      7397283
      40111172
      ...
      3
      11
      30
      0
      12
      0
      0
      30
      0
      0
    
    
      4983
      5
      4
      1
      5
      11
      NaN
      36
      335786
      7397283
      40111172
      ...
      3
      11
      45
      0
      12
      15
      0
      30
      0
      0
    
    
      4984
      5
      4
      1
      5
      11
      NaN
      36
      335786
      7397283
      40111172
      ...
      3
      14
      0
      0
      14
      30
      0
      30
      0
      0
    
    
      4985
      5
      4
      1
      5
      11
      NaN
      36
      335786
      7397283
      40111172
      ...
      1
      11
      30
      0
      12
      0
      0
      30
      0
      0
    
    
      4986
      5
      4
      1
      5
      11
      NaN
      36
      335786
      7397283
      40111172
      ...
      1
      18
      0
      0
      18
      40
      0
      40
      0
      0
    
    
      4987
      5
      4
      1
      5
      11
      NaN
      36
      335786
      7397283
      40111172
      ...
      1
      11
      30
      0
      12
      0
      0
      30
      0
      0
    
    
      4988
      5
      4
      1
      5
      11
      NaN
      36
      335786
      7397283
      40111172
      ...
      1
      18
      0
      0
      18
      30
      0
      30
      0
      0
    
    
      4989
      5
      4
      1
      2
      11
      NaN
      36
      335794
      7397088
      40111194
      ...
      1
      7
      0
      1
      7
      20
      10
      20
      0
      0
    
    
      4990
      5
      4
      1
      2
      11
      NaN
      36
      335794
      7397088
      40111194
      ...
      1
      17
      0
      10
      17
      30
      3
      30
      0
      0
    
    
      4991
      5
      4
      1
      0
      11
      NaN
      36
      335794
      7397088
      40111194
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4992
      5
      4
      1
      2
      11
      NaN
      36
      335794
      7397088
      40111194
      ...
      1
      6
      25
      1
      7
      30
      5
      65
      0
      0
    
    
      4993
      5
      4
      1
      2
      11
      NaN
      36
      335794
      7397088
      40111194
      ...
      1
      11
      30
      5
      12
      30
      5
      60
      0
      0
    
    
      4994
      5
      4
      1
      2
      11
      NaN
      36
      335794
      7397088
      40111194
      ...
      1
      6
      25
      1
      7
      45
      5
      80
      0
      0
    
    
      4995
      5
      4
      1
      2
      11
      NaN
      36
      335794
      7397088
      40111194
      ...
      1
      19
      0
      5
      20
      45
      5
      105
      0
      0
    
    
      4996
      5
      4
      1
      2
      11
      NaN
      36
      335794
      7397088
      40111194
      ...
      1
      6
      25
      1
      8
      15
      10
      110
      0
      0
    
    
      4997
      5
      4
      1
      2
      11
      NaN
      36
      335794
      7397088
      40111194
      ...
      1
      17
      30
      10
      19
      35
      5
      125
      0
      0
    
    
      4998
      5
      4
      1
      2
      11
      NaN
      36
      335885
      7397331
      40111201
      ...
      3
      8
      0
      0
      8
      20
      0
      20
      0
      0
    
    
      4999
      5
      4
      1
      2
      11
      NaN
      36
      335885
      7397331
      40111201
      ...
      3
      11
      30
      0
      12
      10
      0
      40
      0
      0
    
  

4875 rows × 91 columns

Passo 39: "ZONA_TRAB2"

Checar se existe algum erro

Categorias:

1 a 460

[Teste: Checar se existe algum número < 1 ou > 460. Se encontrar, retornar erro indicando em qual linha.]



In [243]:

    
if not impressao:
    #Verifying value interval for check - conditions: "ZONA_TRAB2 < 1" and "ZONA_TRAB2 > 460"
    #The 'error' returns must be related to "ZONA_TRAB2"==0, that is, trips that are not school purposed
    od2007_ex[(od2007_ex['ZONA_TRAB2']<1) | (od2007_ex['ZONA_TRAB2']>460)]









    Out[243]:






  
    
      
      UCOD_DOM
      ANO
      CD_ENTRE
      DIA_SEM
      ZONA_DOM
      SUBZONA_DOM
      MUN_DOM
      CO_DOM_X
      CO_DOM_Y
      ID_DOM
      ...
      TIPO_VIAG
      H_SAIDA
      MIN_SAIDA
      ANDA_ORIG
      H_CHEG
      MIN_CHEG
      ANDA_DEST
      DURACAO
      TIPO_EST_AUTO
      VALOR_EST_AUTO
    
  
  
    
      0
      1
      4
      1
      6
      1
      NaN
      36
      333729
      7394430
      40010001
      ...
      3
      8
      0
      0
      8
      10
      0
      10
      0
      0
    
    
      1
      1
      4
      1
      6
      1
      NaN
      36
      333729
      7394430
      40010001
      ...
      3
      17
      30
      0
      17
      40
      0
      10
      0
      0
    
    
      2
      1
      4
      1
      5
      1
      NaN
      36
      333858
      7394484
      40010018
      ...
      1
      4
      30
      2
      5
      45
      2
      75
      0
      0
    
    
      3
      1
      4
      1
      5
      1
      NaN
      36
      333858
      7394484
      40010018
      ...
      1
      18
      10
      2
      19
      30
      2
      80
      0
      0
    
    
      4
      1
      4
      1
      0
      1
      NaN
      36
      333858
      7394484
      40010018
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      5
      1
      4
      1
      5
      1
      NaN
      36
      333801
      7394422
      40010019
      ...
      4
      9
      30
      1
      10
      0
      1
      30
      0
      0
    
    
      6
      1
      4
      1
      5
      1
      NaN
      36
      333801
      7394422
      40010019
      ...
      4
      15
      0
      1
      15
      30
      1
      30
      0
      0
    
    
      7
      1
      4
      1
      5
      1
      NaN
      36
      333801
      7394422
      40010019
      ...
      4
      18
      30
      1
      19
      0
      1
      30
      0
      0
    
    
      8
      1
      4
      1
      5
      1
      NaN
      36
      333801
      7394422
      40010019
      ...
      4
      23
      45
      1
      0
      15
      1
      30
      0
      0
    
    
      9
      1
      4
      1
      0
      1
      NaN
      36
      333801
      7394422
      40010019
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      10
      1
      4
      1
      5
      1
      NaN
      36
      333801
      7394422
      40010019
      ...
      3
      6
      35
      0
      6
      40
      0
      5
      0
      0
    
    
      11
      1
      4
      1
      5
      1
      NaN
      36
      333801
      7394422
      40010019
      ...
      3
      12
      20
      0
      12
      25
      0
      5
      0
      0
    
    
      12
      1
      4
      1
      3
      1
      NaN
      36
      333610
      7394494
      40010021
      ...
      1
      7
      0
      10
      7
      30
      1
      30
      0
      0
    
    
      13
      1
      4
      1
      3
      1
      NaN
      36
      333610
      7394494
      40010021
      ...
      3
      8
      0
      0
      8
      20
      0
      20
      0
      0
    
    
      14
      1
      4
      1
      3
      1
      NaN
      36
      333610
      7394494
      40010021
      ...
      3
      12
      0
      0
      12
      40
      0
      40
      0
      0
    
    
      15
      1
      4
      1
      3
      1
      NaN
      36
      333610
      7394494
      40010021
      ...
      1
      19
      0
      0
      19
      45
      10
      45
      0
      0
    
    
      17
      1
      4
      1
      6
      1
      NaN
      36
      333819
      7394525
      40010024
      ...
      3
      16
      0
      0
      16
      10
      0
      10
      0
      0
    
    
      18
      1
      4
      1
      6
      1
      NaN
      36
      333819
      7394525
      40010024
      ...
      3
      18
      0
      0
      18
      10
      0
      10
      0
      0
    
    
      19
      1
      4
      1
      2
      1
      NaN
      36
      333738
      7394460
      40010032
      ...
      3
      11
      45
      0
      12
      5
      0
      20
      0
      0
    
    
      20
      1
      4
      1
      2
      1
      NaN
      36
      333738
      7394460
      40010032
      ...
      3
      12
      40
      0
      12
      50
      0
      10
      0
      0
    
    
      21
      1
      4
      1
      2
      1
      NaN
      36
      333738
      7394460
      40010032
      ...
      3
      13
      0
      0
      13
      20
      0
      20
      0
      0
    
    
      22
      1
      4
      1
      2
      1
      NaN
      36
      333738
      7394460
      40010032
      ...
      3
      14
      15
      0
      14
      40
      0
      25
      0
      0
    
    
      23
      1
      4
      1
      2
      1
      NaN
      36
      333738
      7394460
      40010032
      ...
      1
      18
      0
      10
      18
      25
      10
      25
      0
      0
    
    
      24
      1
      4
      1
      3
      1
      NaN
      36
      333739
      7394550
      40010042
      ...
      3
      10
      0
      0
      10
      15
      0
      15
      0
      0
    
    
      25
      1
      4
      1
      3
      1
      NaN
      36
      333739
      7394550
      40010042
      ...
      3
      11
      30
      0
      11
      45
      0
      15
      0
      0
    
    
      26
      1
      4
      1
      3
      1
      NaN
      36
      333739
      7394550
      40010042
      ...
      1
      8
      0
      10
      8
      30
      5
      30
      0
      0
    
    
      27
      1
      4
      1
      3
      1
      NaN
      36
      333739
      7394550
      40010042
      ...
      1
      10
      0
      20
      10
      40
      10
      40
      0
      0
    
    
      28
      1
      4
      1
      3
      1
      NaN
      36
      333739
      7394550
      40010042
      ...
      1
      11
      45
      10
      14
      30
      10
      165
      0
      0
    
    
      29
      1
      4
      1
      3
      1
      NaN
      36
      333739
      7394550
      40010042
      ...
      3
      18
      0
      0
      18
      10
      0
      10
      0
      0
    
    
      30
      1
      4
      1
      3
      1
      NaN
      36
      333739
      7394550
      40010042
      ...
      3
      18
      50
      0
      19
      5
      0
      15
      0
      0
    
    
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
    
    
      4970
      5
      4
      1
      0
      11
      NaN
      36
      335748
      7397321
      40111167
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4971
      5
      4
      1
      5
      11
      NaN
      36
      336005
      7397304
      40111171
      ...
      2
      6
      30
      0
      7
      0
      0
      30
      8
      0
    
    
      4972
      5
      4
      1
      5
      11
      NaN
      36
      336005
      7397304
      40111171
      ...
      2
      19
      0
      0
      19
      40
      0
      40
      8
      0
    
    
      4973
      5
      4
      1
      5
      11
      NaN
      36
      336005
      7397304
      40111171
      ...
      3
      7
      30
      0
      7
      50
      0
      20
      0
      0
    
    
      4974
      5
      4
      1
      5
      11
      NaN
      36
      336005
      7397304
      40111171
      ...
      3
      8
      0
      0
      8
      30
      0
      30
      0
      0
    
    
      4975
      5
      4
      1
      5
      11
      NaN
      36
      336005
      7397304
      40111171
      ...
      3
      15
      30
      0
      15
      50
      0
      20
      0
      0
    
    
      4976
      5
      4
      1
      5
      11
      NaN
      36
      336005
      7397304
      40111171
      ...
      3
      16
      0
      0
      16
      30
      0
      30
      0
      0
    
    
      4977
      5
      4
      1
      5
      11
      NaN
      36
      336005
      7397304
      40111171
      ...
      3
      7
      40
      0
      8
      0
      0
      20
      0
      0
    
    
      4978
      5
      4
      1
      5
      11
      NaN
      36
      336005
      7397304
      40111171
      ...
      3
      18
      0
      0
      18
      20
      0
      20
      0
      0
    
    
      4979
      5
      4
      1
      5
      11
      NaN
      36
      336005
      7397304
      40111171
      ...
      3
      7
      30
      0
      7
      50
      0
      20
      0
      0
    
    
      4980
      5
      4
      1
      5
      11
      NaN
      36
      336005
      7397304
      40111171
      ...
      3
      16
      0
      0
      16
      30
      0
      30
      0
      0
    
    
      4981
      5
      4
      1
      5
      11
      NaN
      36
      335786
      7397283
      40111172
      ...
      3
      10
      0
      0
      10
      30
      0
      30
      0
      0
    
    
      4982
      5
      4
      1
      5
      11
      NaN
      36
      335786
      7397283
      40111172
      ...
      3
      11
      30
      0
      12
      0
      0
      30
      0
      0
    
    
      4983
      5
      4
      1
      5
      11
      NaN
      36
      335786
      7397283
      40111172
      ...
      3
      11
      45
      0
      12
      15
      0
      30
      0
      0
    
    
      4984
      5
      4
      1
      5
      11
      NaN
      36
      335786
      7397283
      40111172
      ...
      3
      14
      0
      0
      14
      30
      0
      30
      0
      0
    
    
      4985
      5
      4
      1
      5
      11
      NaN
      36
      335786
      7397283
      40111172
      ...
      1
      11
      30
      0
      12
      0
      0
      30
      0
      0
    
    
      4986
      5
      4
      1
      5
      11
      NaN
      36
      335786
      7397283
      40111172
      ...
      1
      18
      0
      0
      18
      40
      0
      40
      0
      0
    
    
      4987
      5
      4
      1
      5
      11
      NaN
      36
      335786
      7397283
      40111172
      ...
      1
      11
      30
      0
      12
      0
      0
      30
      0
      0
    
    
      4988
      5
      4
      1
      5
      11
      NaN
      36
      335786
      7397283
      40111172
      ...
      1
      18
      0
      0
      18
      30
      0
      30
      0
      0
    
    
      4989
      5
      4
      1
      2
      11
      NaN
      36
      335794
      7397088
      40111194
      ...
      1
      7
      0
      1
      7
      20
      10
      20
      0
      0
    
    
      4990
      5
      4
      1
      2
      11
      NaN
      36
      335794
      7397088
      40111194
      ...
      1
      17
      0
      10
      17
      30
      3
      30
      0
      0
    
    
      4991
      5
      4
      1
      0
      11
      NaN
      36
      335794
      7397088
      40111194
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4992
      5
      4
      1
      2
      11
      NaN
      36
      335794
      7397088
      40111194
      ...
      1
      6
      25
      1
      7
      30
      5
      65
      0
      0
    
    
      4993
      5
      4
      1
      2
      11
      NaN
      36
      335794
      7397088
      40111194
      ...
      1
      11
      30
      5
      12
      30
      5
      60
      0
      0
    
    
      4994
      5
      4
      1
      2
      11
      NaN
      36
      335794
      7397088
      40111194
      ...
      1
      6
      25
      1
      7
      45
      5
      80
      0
      0
    
    
      4995
      5
      4
      1
      2
      11
      NaN
      36
      335794
      7397088
      40111194
      ...
      1
      19
      0
      5
      20
      45
      5
      105
      0
      0
    
    
      4996
      5
      4
      1
      2
      11
      NaN
      36
      335794
      7397088
      40111194
      ...
      1
      6
      25
      1
      8
      15
      10
      110
      0
      0
    
    
      4997
      5
      4
      1
      2
      11
      NaN
      36
      335794
      7397088
      40111194
      ...
      1
      17
      30
      10
      19
      35
      5
      125
      0
      0
    
    
      4998
      5
      4
      1
      2
      11
      NaN
      36
      335885
      7397331
      40111201
      ...
      3
      8
      0
      0
      8
      20
      0
      20
      0
      0
    
    
      4999
      5
      4
      1
      2
      11
      NaN
      36
      335885
      7397331
      40111201
      ...
      3
      11
      30
      0
      12
      10
      0
      40
      0
      0
    
  

4875 rows × 91 columns

Passo 40: "SUBZONA_TRAB2"

A coluna "SUBZONA_TRAB2" ficará vazia (missing values) em 2007 porque este ano já contém os dados de coordenadas.

Para os anos em que esse input não existe originalmente, esse campo é critério para inserção de coordenadas.

Passo 41: "MUN_TRAB2"

Checar se existe algum erro

Categorias

1 a 39

[Teste: Checar se existe algum número < 1 ou > 39. Se encontrar, retornar erro indicando em qual linha.]



In [244]:

    
if not impressao:
    #Verifying value interval for check - conditions: "MUN_TRAB2 < 1" ou de "MUN_TRAB2 > 39"
    #The 'error' returns must be related to "MUN_TRAB2" == 0, that is, trips that are not school purposed
    od2007_ex[(od2007_ex['MUN_TRAB2']<1) | (od2007_ex['MUN_TRAB2']>39)]









    Out[244]:






  
    
      
      UCOD_DOM
      ANO
      CD_ENTRE
      DIA_SEM
      ZONA_DOM
      SUBZONA_DOM
      MUN_DOM
      CO_DOM_X
      CO_DOM_Y
      ID_DOM
      ...
      TIPO_VIAG
      H_SAIDA
      MIN_SAIDA
      ANDA_ORIG
      H_CHEG
      MIN_CHEG
      ANDA_DEST
      DURACAO
      TIPO_EST_AUTO
      VALOR_EST_AUTO
    
  
  
    
      0
      1
      4
      1
      6
      1
      NaN
      36
      333729
      7394430
      40010001
      ...
      3
      8
      0
      0
      8
      10
      0
      10
      0
      0
    
    
      1
      1
      4
      1
      6
      1
      NaN
      36
      333729
      7394430
      40010001
      ...
      3
      17
      30
      0
      17
      40
      0
      10
      0
      0
    
    
      2
      1
      4
      1
      5
      1
      NaN
      36
      333858
      7394484
      40010018
      ...
      1
      4
      30
      2
      5
      45
      2
      75
      0
      0
    
    
      3
      1
      4
      1
      5
      1
      NaN
      36
      333858
      7394484
      40010018
      ...
      1
      18
      10
      2
      19
      30
      2
      80
      0
      0
    
    
      4
      1
      4
      1
      0
      1
      NaN
      36
      333858
      7394484
      40010018
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      5
      1
      4
      1
      5
      1
      NaN
      36
      333801
      7394422
      40010019
      ...
      4
      9
      30
      1
      10
      0
      1
      30
      0
      0
    
    
      6
      1
      4
      1
      5
      1
      NaN
      36
      333801
      7394422
      40010019
      ...
      4
      15
      0
      1
      15
      30
      1
      30
      0
      0
    
    
      7
      1
      4
      1
      5
      1
      NaN
      36
      333801
      7394422
      40010019
      ...
      4
      18
      30
      1
      19
      0
      1
      30
      0
      0
    
    
      8
      1
      4
      1
      5
      1
      NaN
      36
      333801
      7394422
      40010019
      ...
      4
      23
      45
      1
      0
      15
      1
      30
      0
      0
    
    
      9
      1
      4
      1
      0
      1
      NaN
      36
      333801
      7394422
      40010019
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      10
      1
      4
      1
      5
      1
      NaN
      36
      333801
      7394422
      40010019
      ...
      3
      6
      35
      0
      6
      40
      0
      5
      0
      0
    
    
      11
      1
      4
      1
      5
      1
      NaN
      36
      333801
      7394422
      40010019
      ...
      3
      12
      20
      0
      12
      25
      0
      5
      0
      0
    
    
      12
      1
      4
      1
      3
      1
      NaN
      36
      333610
      7394494
      40010021
      ...
      1
      7
      0
      10
      7
      30
      1
      30
      0
      0
    
    
      13
      1
      4
      1
      3
      1
      NaN
      36
      333610
      7394494
      40010021
      ...
      3
      8
      0
      0
      8
      20
      0
      20
      0
      0
    
    
      14
      1
      4
      1
      3
      1
      NaN
      36
      333610
      7394494
      40010021
      ...
      3
      12
      0
      0
      12
      40
      0
      40
      0
      0
    
    
      15
      1
      4
      1
      3
      1
      NaN
      36
      333610
      7394494
      40010021
      ...
      1
      19
      0
      0
      19
      45
      10
      45
      0
      0
    
    
      17
      1
      4
      1
      6
      1
      NaN
      36
      333819
      7394525
      40010024
      ...
      3
      16
      0
      0
      16
      10
      0
      10
      0
      0
    
    
      18
      1
      4
      1
      6
      1
      NaN
      36
      333819
      7394525
      40010024
      ...
      3
      18
      0
      0
      18
      10
      0
      10
      0
      0
    
    
      19
      1
      4
      1
      2
      1
      NaN
      36
      333738
      7394460
      40010032
      ...
      3
      11
      45
      0
      12
      5
      0
      20
      0
      0
    
    
      20
      1
      4
      1
      2
      1
      NaN
      36
      333738
      7394460
      40010032
      ...
      3
      12
      40
      0
      12
      50
      0
      10
      0
      0
    
    
      21
      1
      4
      1
      2
      1
      NaN
      36
      333738
      7394460
      40010032
      ...
      3
      13
      0
      0
      13
      20
      0
      20
      0
      0
    
    
      22
      1
      4
      1
      2
      1
      NaN
      36
      333738
      7394460
      40010032
      ...
      3
      14
      15
      0
      14
      40
      0
      25
      0
      0
    
    
      23
      1
      4
      1
      2
      1
      NaN
      36
      333738
      7394460
      40010032
      ...
      1
      18
      0
      10
      18
      25
      10
      25
      0
      0
    
    
      24
      1
      4
      1
      3
      1
      NaN
      36
      333739
      7394550
      40010042
      ...
      3
      10
      0
      0
      10
      15
      0
      15
      0
      0
    
    
      25
      1
      4
      1
      3
      1
      NaN
      36
      333739
      7394550
      40010042
      ...
      3
      11
      30
      0
      11
      45
      0
      15
      0
      0
    
    
      26
      1
      4
      1
      3
      1
      NaN
      36
      333739
      7394550
      40010042
      ...
      1
      8
      0
      10
      8
      30
      5
      30
      0
      0
    
    
      27
      1
      4
      1
      3
      1
      NaN
      36
      333739
      7394550
      40010042
      ...
      1
      10
      0
      20
      10
      40
      10
      40
      0
      0
    
    
      28
      1
      4
      1
      3
      1
      NaN
      36
      333739
      7394550
      40010042
      ...
      1
      11
      45
      10
      14
      30
      10
      165
      0
      0
    
    
      29
      1
      4
      1
      3
      1
      NaN
      36
      333739
      7394550
      40010042
      ...
      3
      18
      0
      0
      18
      10
      0
      10
      0
      0
    
    
      30
      1
      4
      1
      3
      1
      NaN
      36
      333739
      7394550
      40010042
      ...
      3
      18
      50
      0
      19
      5
      0
      15
      0
      0
    
    
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
    
    
      4970
      5
      4
      1
      0
      11
      NaN
      36
      335748
      7397321
      40111167
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4971
      5
      4
      1
      5
      11
      NaN
      36
      336005
      7397304
      40111171
      ...
      2
      6
      30
      0
      7
      0
      0
      30
      8
      0
    
    
      4972
      5
      4
      1
      5
      11
      NaN
      36
      336005
      7397304
      40111171
      ...
      2
      19
      0
      0
      19
      40
      0
      40
      8
      0
    
    
      4973
      5
      4
      1
      5
      11
      NaN
      36
      336005
      7397304
      40111171
      ...
      3
      7
      30
      0
      7
      50
      0
      20
      0
      0
    
    
      4974
      5
      4
      1
      5
      11
      NaN
      36
      336005
      7397304
      40111171
      ...
      3
      8
      0
      0
      8
      30
      0
      30
      0
      0
    
    
      4975
      5
      4
      1
      5
      11
      NaN
      36
      336005
      7397304
      40111171
      ...
      3
      15
      30
      0
      15
      50
      0
      20
      0
      0
    
    
      4976
      5
      4
      1
      5
      11
      NaN
      36
      336005
      7397304
      40111171
      ...
      3
      16
      0
      0
      16
      30
      0
      30
      0
      0
    
    
      4977
      5
      4
      1
      5
      11
      NaN
      36
      336005
      7397304
      40111171
      ...
      3
      7
      40
      0
      8
      0
      0
      20
      0
      0
    
    
      4978
      5
      4
      1
      5
      11
      NaN
      36
      336005
      7397304
      40111171
      ...
      3
      18
      0
      0
      18
      20
      0
      20
      0
      0
    
    
      4979
      5
      4
      1
      5
      11
      NaN
      36
      336005
      7397304
      40111171
      ...
      3
      7
      30
      0
      7
      50
      0
      20
      0
      0
    
    
      4980
      5
      4
      1
      5
      11
      NaN
      36
      336005
      7397304
      40111171
      ...
      3
      16
      0
      0
      16
      30
      0
      30
      0
      0
    
    
      4981
      5
      4
      1
      5
      11
      NaN
      36
      335786
      7397283
      40111172
      ...
      3
      10
      0
      0
      10
      30
      0
      30
      0
      0
    
    
      4982
      5
      4
      1
      5
      11
      NaN
      36
      335786
      7397283
      40111172
      ...
      3
      11
      30
      0
      12
      0
      0
      30
      0
      0
    
    
      4983
      5
      4
      1
      5
      11
      NaN
      36
      335786
      7397283
      40111172
      ...
      3
      11
      45
      0
      12
      15
      0
      30
      0
      0
    
    
      4984
      5
      4
      1
      5
      11
      NaN
      36
      335786
      7397283
      40111172
      ...
      3
      14
      0
      0
      14
      30
      0
      30
      0
      0
    
    
      4985
      5
      4
      1
      5
      11
      NaN
      36
      335786
      7397283
      40111172
      ...
      1
      11
      30
      0
      12
      0
      0
      30
      0
      0
    
    
      4986
      5
      4
      1
      5
      11
      NaN
      36
      335786
      7397283
      40111172
      ...
      1
      18
      0
      0
      18
      40
      0
      40
      0
      0
    
    
      4987
      5
      4
      1
      5
      11
      NaN
      36
      335786
      7397283
      40111172
      ...
      1
      11
      30
      0
      12
      0
      0
      30
      0
      0
    
    
      4988
      5
      4
      1
      5
      11
      NaN
      36
      335786
      7397283
      40111172
      ...
      1
      18
      0
      0
      18
      30
      0
      30
      0
      0
    
    
      4989
      5
      4
      1
      2
      11
      NaN
      36
      335794
      7397088
      40111194
      ...
      1
      7
      0
      1
      7
      20
      10
      20
      0
      0
    
    
      4990
      5
      4
      1
      2
      11
      NaN
      36
      335794
      7397088
      40111194
      ...
      1
      17
      0
      10
      17
      30
      3
      30
      0
      0
    
    
      4991
      5
      4
      1
      0
      11
      NaN
      36
      335794
      7397088
      40111194
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4992
      5
      4
      1
      2
      11
      NaN
      36
      335794
      7397088
      40111194
      ...
      1
      6
      25
      1
      7
      30
      5
      65
      0
      0
    
    
      4993
      5
      4
      1
      2
      11
      NaN
      36
      335794
      7397088
      40111194
      ...
      1
      11
      30
      5
      12
      30
      5
      60
      0
      0
    
    
      4994
      5
      4
      1
      2
      11
      NaN
      36
      335794
      7397088
      40111194
      ...
      1
      6
      25
      1
      7
      45
      5
      80
      0
      0
    
    
      4995
      5
      4
      1
      2
      11
      NaN
      36
      335794
      7397088
      40111194
      ...
      1
      19
      0
      5
      20
      45
      5
      105
      0
      0
    
    
      4996
      5
      4
      1
      2
      11
      NaN
      36
      335794
      7397088
      40111194
      ...
      1
      6
      25
      1
      8
      15
      10
      110
      0
      0
    
    
      4997
      5
      4
      1
      2
      11
      NaN
      36
      335794
      7397088
      40111194
      ...
      1
      17
      30
      10
      19
      35
      5
      125
      0
      0
    
    
      4998
      5
      4
      1
      2
      11
      NaN
      36
      335885
      7397331
      40111201
      ...
      3
      8
      0
      0
      8
      20
      0
      20
      0
      0
    
    
      4999
      5
      4
      1
      2
      11
      NaN
      36
      335885
      7397331
      40111201
      ...
      3
      11
      30
      0
      12
      10
      0
      40
      0
      0
    
  

4875 rows × 91 columns

Passo 42: "CO_TRAB2_X"

Em 2007 já existe a informação de "CO_TRAB2_X"

Para os demais anos:

[Na coluna "CO_TRAB2_X", linha i, ler o valor da linha i da coluna "SUBZONA_TRAB2", daí, buscar o mesmo valor na coluna "Subzonas_XXXX" do arquivo CO-SUBZONAS-XXXX.csv. Ao achar, retornar o valor da mesma linha, só que da coluna "CO_X"]

[Obs.: ainda preciso construir esses csv, ou seja, determinar os centroides das subzonas a partir do MapInfo]

Passo 43: "CO_TRAB2_Y"

Em 2007 já existe a informação de "CO_TRAB2_Y"

Para os demais anos:

[Na coluna "CO_TRAB2_Y", linha i, ler o valor da linha i da coluna "SUBZONA_TRAB2", daí, buscar o mesmo valor na coluna "Subzonas_XXXX" do arquivo CO-SUBZONAS-XXXX.csv. Ao achar, retornar o valor da mesma linha, só que da coluna "CO_Y"]

[Obs.: ainda preciso construir esses csv, ou seja, determinar os centroides das subzonas a partir do MapInfo]

Passo 44: "ID_VIAG"

Construir o "ID_VIAG"

Na coluna "ID_VIAG", linha i, ler o valor da linha i da coluna "ID_PESS", e concatenar esse valor (12 dígitos) com o número da pessoa, que é o valor da linha i da coluna "NO_VIAG" (com 2 dígitos).

Resultado será um ID_VIAG, que pode se repetir nas linhas, 14 dígitos.



In [245]:

    
#Generating "ID_VIAG" from the concatenation of "ID_PESS" and "NO_VIAG" variables
od2007_ex['ID_VIAG'] = od2007_ex.apply(lambda row: gera_ID_VIAG(row), axis=1)

Passo 45: "F_VIAG"

Checar se existe algum erro na coluna "F_VIAG"

Categorias

Valor	Descrição
0	Demais registros
1	Primeiro Registro da Viagem

JÀ SEI!!! TEM QUE GERAR!!!!

[Teste: Checar se existe algum número diferente de 0 ou 1. Se encontrar, retornar erro indicando em qual linha.]



In [246]:

    
if not impressao:
    #Count for check "F_VIAG"
    od2007_ex['F_VIAG'].value_counts()









    Out[246]:





Series([], dtype: int64)



In [247]:

    
#Verifying if there was left some value other than 0 or 1
verifica_DUMMY(od2007_ex, 'F_VIAG')









    



---------------------------------------------------------------------------
ValueError                                Traceback (most recent call last)
<ipython-input-247-6f1e99ccc47d> in <module>()
      1 #Verifying if there was left some value other than 0 or 1
----> 2 verifica_DUMMY(od2007_ex, 'F_VIAG')

<ipython-input-153-c7d70df90efd> in verifica_DUMMY(data_frame, nome_variavel)
      7     contador_de_erros = 0
      8     for index, value in data_frame.iterrows():
----> 9         if int(value[nome_variavel]) != 1 and int(value[nome_variavel]) != 0:
     10             print("Erro encontrado no registro " + str(index+1) + ". Valor encontrado: " + str(value[nome_variavel]))
     11             contador_de_erros += 1

ValueError: cannot convert float NaN to integer

"FE_VIAG" e "NO_VIAG"

Nada há que se fazer em relação aos dados das colunas "FE_VIAG" e "NO_VIAG"

"TOT_VIAG"

Nada há que se fazer em relação aos dados das colunas "TOT_VIAG"

Passo 46: "UCOD_ORIG"

Na coluna "UCOD_ORIG", linha i, ler o valor da linha i da coluna "ZONA_ORIG", daí, buscar o mesmo valor na coluna "Zona 2007" do arquivo UCOD-2007.csv. Ao achar, retornar o valor da mesma linha, só que da coluna "UCOD_ORIG"

[Teste: no banco completo, checar se o min == 1 e o max == 67]



In [248]:

    
#Getting from the csv file the "UCOD" code correspondent to the "ZONA_ORIG" code
od2007_ex['UCOD_ORIG'] = od2007_ex.apply(lambda row: consulta_refext(row, 'UCOD-2007.csv', 'Zona 2007', 'ZONA_ORIG', 'UCOD'), axis=1)



In [249]:

    
if not impressao:
    #Describing data ("UCOD_ORIG" column) - count, mean, std, min and max
    od2007_ex['UCOD_ORIG'].describe()









    Out[249]:





count    5000.000000
mean        4.641600
std         8.208814
min         0.000000
25%         1.000000
50%         3.000000
75%         4.000000
max        65.000000
Name: UCOD_ORIG, dtype: float64



In [250]:

    
if not impressao:
    #Count for check "UCOD_ORIG"
    od2007_ex['UCOD_ORIG'].value_counts()









    Out[250]:





1     1585
4     1212
0      705
5      584
2      157
3      131
19      71
13      65
8       54
14      31
23      31
10      30
7       29
6       25
12      25
24      22
15      18
11      17
9       17
30      13
43      13
21      12
60      10
29      10
41       9
39       9
17       8
26       7
16       6
63       6
58       6
44       5
38       5
34       4
42       4
35       4
37       4
61       4
22       4
50       4
46       4
20       3
59       3
25       3
33       3
27       3
32       2
31       2
55       2
62       2
28       2
54       2
40       2
18       2
53       2
57       2
65       2
36       1
48       1
49       1
dtype: int64



In [251]:

    
if not impressao:
    #Verifying value interval for check - conditions: "UCOD_ORIG < 1" and "UCOD_ORIG > 67"
    #The 'error' returns must be related to "UCOD_ORIG" == 0, that is, trips that are not school purposed
    od2007_ex[(od2007_ex['UCOD_ORIG']<1) | (od2007_ex['UCOD_ORIG']>67)]









    Out[251]:






  
    
      
      UCOD_DOM
      ANO
      CD_ENTRE
      DIA_SEM
      ZONA_DOM
      SUBZONA_DOM
      MUN_DOM
      CO_DOM_X
      CO_DOM_Y
      ID_DOM
      ...
      TIPO_VIAG
      H_SAIDA
      MIN_SAIDA
      ANDA_ORIG
      H_CHEG
      MIN_CHEG
      ANDA_DEST
      DURACAO
      TIPO_EST_AUTO
      VALOR_EST_AUTO
    
  
  
    
      4
      1
      4
      1
      0
      1
      NaN
      36
      333858
      7394484
      40010018
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      9
      1
      4
      1
      0
      1
      NaN
      36
      333801
      7394422
      40010019
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      71
      1
      4
      1
      0
      1
      NaN
      36
      333622
      7394465
      40011018
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      72
      1
      4
      1
      0
      1
      NaN
      36
      333622
      7394465
      40011018
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      88
      1
      4
      1
      0
      1
      NaN
      36
      333739
      7394550
      40011027
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      105
      1
      4
      1
      0
      1
      NaN
      36
      333683
      7394479
      40011033
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      140
      1
      4
      0
      0
      1
      NaN
      36
      333807
      7394422
      40011066
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      143
      1
      4
      1
      0
      1
      NaN
      36
      333800
      7394465
      40011067
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      146
      1
      4
      1
      0
      1
      NaN
      36
      333738
      7394460
      40011073
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      155
      1
      4
      1
      0
      1
      NaN
      36
      333739
      7394550
      40011077
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      205
      1
      4
      1
      0
      1
      NaN
      36
      333729
      7394551
      40011132
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      216
      1
      4
      1
      0
      1
      NaN
      36
      333739
      7394550
      40011134
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      245
      1
      4
      1
      0
      1
      NaN
      36
      333739
      7394550
      40011161
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      246
      1
      4
      1
      0
      1
      NaN
      36
      333739
      7394550
      40011161
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      253
      1
      4
      0
      0
      1
      NaN
      36
      333880
      7394458
      40011162
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      256
      1
      4
      1
      0
      1
      NaN
      36
      333728
      7394534
      40011165
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      257
      1
      4
      1
      0
      1
      NaN
      36
      333728
      7394534
      40011165
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      280
      1
      4
      0
      0
      2
      NaN
      36
      333721
      7394629
      40020040
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      281
      1
      4
      0
      0
      2
      NaN
      36
      333721
      7394629
      40020040
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      282
      1
      4
      0
      0
      2
      NaN
      36
      333721
      7394629
      40020040
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      283
      1
      4
      0
      0
      2
      NaN
      36
      333721
      7394629
      40020040
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      316
      1
      4
      1
      0
      2
      NaN
      36
      333593
      7396032
      40021014
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      317
      1
      4
      1
      0
      2
      NaN
      36
      333593
      7396032
      40021014
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      320
      1
      4
      0
      0
      2
      NaN
      36
      333573
      7396022
      40021020
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      331
      1
      4
      1
      0
      2
      NaN
      36
      333516
      7396150
      40021025
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      342
      1
      4
      1
      0
      2
      NaN
      36
      333413
      7396177
      40021030
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      349
      1
      4
      1
      0
      2
      NaN
      36
      333413
      7396177
      40021030
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      350
      1
      4
      1
      0
      2
      NaN
      36
      333413
      7396177
      40021030
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      353
      1
      4
      1
      0
      2
      NaN
      36
      333446
      7395979
      40021031
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      354
      1
      4
      1
      0
      2
      NaN
      36
      333446
      7395979
      40021031
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
    
    
      4779
      5
      4
      1
      0
      11
      NaN
      36
      335282
      7397403
      40111016
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4780
      5
      4
      1
      0
      11
      NaN
      36
      335282
      7397403
      40111016
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4781
      5
      4
      1
      0
      11
      NaN
      36
      335282
      7397403
      40111016
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4794
      5
      4
      0
      0
      11
      NaN
      36
      335108
      7397559
      40111020
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4795
      5
      4
      1
      0
      11
      NaN
      36
      335095
      7397824
      40111021
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4800
      5
      4
      0
      0
      11
      NaN
      36
      335431
      7397340
      40111024
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4801
      5
      4
      0
      0
      11
      NaN
      36
      335431
      7397340
      40111024
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4804
      5
      4
      1
      0
      11
      NaN
      36
      334955
      7397603
      40111064
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4805
      5
      4
      1
      0
      11
      NaN
      36
      334955
      7397603
      40111064
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4814
      5
      4
      1
      0
      11
      NaN
      36
      335675
      7397437
      40111081
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4839
      5
      4
      1
      0
      11
      NaN
      36
      335730
      7397340
      40111086
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4840
      5
      4
      1
      0
      11
      NaN
      36
      335730
      7397340
      40111086
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4843
      5
      4
      0
      0
      11
      NaN
      36
      335872
      7397009
      40111092
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4854
      5
      4
      1
      0
      11
      NaN
      36
      335753
      7397316
      40111103
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4859
      5
      4
      1
      0
      11
      NaN
      36
      335753
      7397316
      40111103
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4860
      5
      4
      1
      0
      11
      NaN
      36
      335753
      7397316
      40111103
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4861
      5
      4
      0
      0
      11
      NaN
      36
      335826
      7397243
      40111104
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4862
      5
      4
      0
      0
      11
      NaN
      36
      335952
      7397207
      40111105
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4865
      5
      4
      0
      0
      11
      NaN
      36
      335846
      7397209
      40111108
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4892
      5
      4
      1
      0
      11
      NaN
      36
      335874
      7397355
      40111121
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4893
      5
      4
      1
      0
      11
      NaN
      36
      335874
      7397355
      40111121
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4898
      5
      4
      1
      0
      11
      NaN
      36
      335733
      7397337
      40111124
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4914
      5
      4
      1
      0
      11
      NaN
      36
      335850
      7397219
      40111126
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4941
      5
      4
      1
      0
      11
      NaN
      36
      335735
      7397496
      40111161
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4956
      5
      4
      1
      0
      11
      NaN
      36
      335808
      7397246
      40111164
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4959
      5
      4
      1
      0
      11
      NaN
      36
      335848
      7397343
      40111166
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4964
      5
      4
      1
      0
      11
      NaN
      36
      335848
      7397343
      40111166
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4965
      5
      4
      1
      0
      11
      NaN
      36
      335848
      7397343
      40111166
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4970
      5
      4
      1
      0
      11
      NaN
      36
      335748
      7397321
      40111167
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4991
      5
      4
      1
      0
      11
      NaN
      36
      335794
      7397088
      40111194
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
  

705 rows × 91 columns

Passo 47: "ZONA_ORIG"

Checar se existe algum erro

Categorias:

1 a 460

[Teste: Checar se existe algum número < 1 ou > 460. Se encontrar, retornar erro indicando em qual linha.]



In [252]:

    
if not impressao:
    #Verifying value interval for check - conditions: "ZONA_ORIG < 1" and "ZONA_ORIG > 460"
    #The 'error' returns must be related to "ZONA_ORIG"==0, that is, trips that are not school purposed
    od2007_ex[(od2007_ex['ZONA_ORIG']<1) | (od2007_ex['ZONA_ORIG']>460)]









    Out[252]:






  
    
      
      UCOD_DOM
      ANO
      CD_ENTRE
      DIA_SEM
      ZONA_DOM
      SUBZONA_DOM
      MUN_DOM
      CO_DOM_X
      CO_DOM_Y
      ID_DOM
      ...
      TIPO_VIAG
      H_SAIDA
      MIN_SAIDA
      ANDA_ORIG
      H_CHEG
      MIN_CHEG
      ANDA_DEST
      DURACAO
      TIPO_EST_AUTO
      VALOR_EST_AUTO
    
  
  
    
      4
      1
      4
      1
      0
      1
      NaN
      36
      333858
      7394484
      40010018
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      9
      1
      4
      1
      0
      1
      NaN
      36
      333801
      7394422
      40010019
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      71
      1
      4
      1
      0
      1
      NaN
      36
      333622
      7394465
      40011018
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      72
      1
      4
      1
      0
      1
      NaN
      36
      333622
      7394465
      40011018
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      88
      1
      4
      1
      0
      1
      NaN
      36
      333739
      7394550
      40011027
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      105
      1
      4
      1
      0
      1
      NaN
      36
      333683
      7394479
      40011033
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      140
      1
      4
      0
      0
      1
      NaN
      36
      333807
      7394422
      40011066
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      143
      1
      4
      1
      0
      1
      NaN
      36
      333800
      7394465
      40011067
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      146
      1
      4
      1
      0
      1
      NaN
      36
      333738
      7394460
      40011073
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      155
      1
      4
      1
      0
      1
      NaN
      36
      333739
      7394550
      40011077
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      205
      1
      4
      1
      0
      1
      NaN
      36
      333729
      7394551
      40011132
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      216
      1
      4
      1
      0
      1
      NaN
      36
      333739
      7394550
      40011134
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      245
      1
      4
      1
      0
      1
      NaN
      36
      333739
      7394550
      40011161
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      246
      1
      4
      1
      0
      1
      NaN
      36
      333739
      7394550
      40011161
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      253
      1
      4
      0
      0
      1
      NaN
      36
      333880
      7394458
      40011162
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      256
      1
      4
      1
      0
      1
      NaN
      36
      333728
      7394534
      40011165
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      257
      1
      4
      1
      0
      1
      NaN
      36
      333728
      7394534
      40011165
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      280
      1
      4
      0
      0
      2
      NaN
      36
      333721
      7394629
      40020040
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      281
      1
      4
      0
      0
      2
      NaN
      36
      333721
      7394629
      40020040
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      282
      1
      4
      0
      0
      2
      NaN
      36
      333721
      7394629
      40020040
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      283
      1
      4
      0
      0
      2
      NaN
      36
      333721
      7394629
      40020040
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      316
      1
      4
      1
      0
      2
      NaN
      36
      333593
      7396032
      40021014
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      317
      1
      4
      1
      0
      2
      NaN
      36
      333593
      7396032
      40021014
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      320
      1
      4
      0
      0
      2
      NaN
      36
      333573
      7396022
      40021020
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      331
      1
      4
      1
      0
      2
      NaN
      36
      333516
      7396150
      40021025
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      342
      1
      4
      1
      0
      2
      NaN
      36
      333413
      7396177
      40021030
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      349
      1
      4
      1
      0
      2
      NaN
      36
      333413
      7396177
      40021030
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      350
      1
      4
      1
      0
      2
      NaN
      36
      333413
      7396177
      40021030
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      353
      1
      4
      1
      0
      2
      NaN
      36
      333446
      7395979
      40021031
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      354
      1
      4
      1
      0
      2
      NaN
      36
      333446
      7395979
      40021031
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
    
    
      4779
      5
      4
      1
      0
      11
      NaN
      36
      335282
      7397403
      40111016
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4780
      5
      4
      1
      0
      11
      NaN
      36
      335282
      7397403
      40111016
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4781
      5
      4
      1
      0
      11
      NaN
      36
      335282
      7397403
      40111016
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4794
      5
      4
      0
      0
      11
      NaN
      36
      335108
      7397559
      40111020
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4795
      5
      4
      1
      0
      11
      NaN
      36
      335095
      7397824
      40111021
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4800
      5
      4
      0
      0
      11
      NaN
      36
      335431
      7397340
      40111024
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4801
      5
      4
      0
      0
      11
      NaN
      36
      335431
      7397340
      40111024
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4804
      5
      4
      1
      0
      11
      NaN
      36
      334955
      7397603
      40111064
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4805
      5
      4
      1
      0
      11
      NaN
      36
      334955
      7397603
      40111064
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4814
      5
      4
      1
      0
      11
      NaN
      36
      335675
      7397437
      40111081
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4839
      5
      4
      1
      0
      11
      NaN
      36
      335730
      7397340
      40111086
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4840
      5
      4
      1
      0
      11
      NaN
      36
      335730
      7397340
      40111086
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4843
      5
      4
      0
      0
      11
      NaN
      36
      335872
      7397009
      40111092
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4854
      5
      4
      1
      0
      11
      NaN
      36
      335753
      7397316
      40111103
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4859
      5
      4
      1
      0
      11
      NaN
      36
      335753
      7397316
      40111103
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4860
      5
      4
      1
      0
      11
      NaN
      36
      335753
      7397316
      40111103
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4861
      5
      4
      0
      0
      11
      NaN
      36
      335826
      7397243
      40111104
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4862
      5
      4
      0
      0
      11
      NaN
      36
      335952
      7397207
      40111105
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4865
      5
      4
      0
      0
      11
      NaN
      36
      335846
      7397209
      40111108
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4892
      5
      4
      1
      0
      11
      NaN
      36
      335874
      7397355
      40111121
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4893
      5
      4
      1
      0
      11
      NaN
      36
      335874
      7397355
      40111121
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4898
      5
      4
      1
      0
      11
      NaN
      36
      335733
      7397337
      40111124
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4914
      5
      4
      1
      0
      11
      NaN
      36
      335850
      7397219
      40111126
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4941
      5
      4
      1
      0
      11
      NaN
      36
      335735
      7397496
      40111161
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4956
      5
      4
      1
      0
      11
      NaN
      36
      335808
      7397246
      40111164
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4959
      5
      4
      1
      0
      11
      NaN
      36
      335848
      7397343
      40111166
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4964
      5
      4
      1
      0
      11
      NaN
      36
      335848
      7397343
      40111166
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4965
      5
      4
      1
      0
      11
      NaN
      36
      335848
      7397343
      40111166
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4970
      5
      4
      1
      0
      11
      NaN
      36
      335748
      7397321
      40111167
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4991
      5
      4
      1
      0
      11
      NaN
      36
      335794
      7397088
      40111194
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
  

705 rows × 91 columns

Passo 48: "SUBZONA_ORIG"

A coluna "SUBZONA_ORIG" ficará vazia (missing values) em 2007 porque este ano já contém os dados de coordenadas.

Para os anos em que esse input não existe originalmente, esse campo é critério para inserção de coordenadas.

Passo 49: "MUN_ORIG"

Checar se existe algum erro

Categorias

1 a 39

[Teste: Checar se existe algum número < 1 ou > 39. Se encontrar, retornar erro indicando em qual linha.]



In [253]:

    
if not impressao:
    #Verifying value interval for check - conditions: "MUN_ORIG < 1" ou de "MUN_ORIG > 39"
    #The 'error' returns must be related to "MUN_ORIG" == 0, that is, trips that are not school purposed
    od2007_ex[(od2007_ex['MUN_ORIG']<1) | (od2007_ex['MUN_ORIG']>39)]









    Out[253]:






  
    
      
      UCOD_DOM
      ANO
      CD_ENTRE
      DIA_SEM
      ZONA_DOM
      SUBZONA_DOM
      MUN_DOM
      CO_DOM_X
      CO_DOM_Y
      ID_DOM
      ...
      TIPO_VIAG
      H_SAIDA
      MIN_SAIDA
      ANDA_ORIG
      H_CHEG
      MIN_CHEG
      ANDA_DEST
      DURACAO
      TIPO_EST_AUTO
      VALOR_EST_AUTO
    
  
  
    
      4
      1
      4
      1
      0
      1
      NaN
      36
      333858
      7394484
      40010018
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      9
      1
      4
      1
      0
      1
      NaN
      36
      333801
      7394422
      40010019
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      71
      1
      4
      1
      0
      1
      NaN
      36
      333622
      7394465
      40011018
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      72
      1
      4
      1
      0
      1
      NaN
      36
      333622
      7394465
      40011018
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      88
      1
      4
      1
      0
      1
      NaN
      36
      333739
      7394550
      40011027
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      105
      1
      4
      1
      0
      1
      NaN
      36
      333683
      7394479
      40011033
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      140
      1
      4
      0
      0
      1
      NaN
      36
      333807
      7394422
      40011066
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      143
      1
      4
      1
      0
      1
      NaN
      36
      333800
      7394465
      40011067
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      146
      1
      4
      1
      0
      1
      NaN
      36
      333738
      7394460
      40011073
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      155
      1
      4
      1
      0
      1
      NaN
      36
      333739
      7394550
      40011077
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      205
      1
      4
      1
      0
      1
      NaN
      36
      333729
      7394551
      40011132
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      216
      1
      4
      1
      0
      1
      NaN
      36
      333739
      7394550
      40011134
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      245
      1
      4
      1
      0
      1
      NaN
      36
      333739
      7394550
      40011161
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      246
      1
      4
      1
      0
      1
      NaN
      36
      333739
      7394550
      40011161
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      253
      1
      4
      0
      0
      1
      NaN
      36
      333880
      7394458
      40011162
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      256
      1
      4
      1
      0
      1
      NaN
      36
      333728
      7394534
      40011165
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      257
      1
      4
      1
      0
      1
      NaN
      36
      333728
      7394534
      40011165
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      280
      1
      4
      0
      0
      2
      NaN
      36
      333721
      7394629
      40020040
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      281
      1
      4
      0
      0
      2
      NaN
      36
      333721
      7394629
      40020040
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      282
      1
      4
      0
      0
      2
      NaN
      36
      333721
      7394629
      40020040
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      283
      1
      4
      0
      0
      2
      NaN
      36
      333721
      7394629
      40020040
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      316
      1
      4
      1
      0
      2
      NaN
      36
      333593
      7396032
      40021014
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      317
      1
      4
      1
      0
      2
      NaN
      36
      333593
      7396032
      40021014
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      320
      1
      4
      0
      0
      2
      NaN
      36
      333573
      7396022
      40021020
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      331
      1
      4
      1
      0
      2
      NaN
      36
      333516
      7396150
      40021025
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      342
      1
      4
      1
      0
      2
      NaN
      36
      333413
      7396177
      40021030
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      349
      1
      4
      1
      0
      2
      NaN
      36
      333413
      7396177
      40021030
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      350
      1
      4
      1
      0
      2
      NaN
      36
      333413
      7396177
      40021030
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      353
      1
      4
      1
      0
      2
      NaN
      36
      333446
      7395979
      40021031
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      354
      1
      4
      1
      0
      2
      NaN
      36
      333446
      7395979
      40021031
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
    
    
      4779
      5
      4
      1
      0
      11
      NaN
      36
      335282
      7397403
      40111016
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4780
      5
      4
      1
      0
      11
      NaN
      36
      335282
      7397403
      40111016
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4781
      5
      4
      1
      0
      11
      NaN
      36
      335282
      7397403
      40111016
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4794
      5
      4
      0
      0
      11
      NaN
      36
      335108
      7397559
      40111020
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4795
      5
      4
      1
      0
      11
      NaN
      36
      335095
      7397824
      40111021
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4800
      5
      4
      0
      0
      11
      NaN
      36
      335431
      7397340
      40111024
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4801
      5
      4
      0
      0
      11
      NaN
      36
      335431
      7397340
      40111024
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4804
      5
      4
      1
      0
      11
      NaN
      36
      334955
      7397603
      40111064
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4805
      5
      4
      1
      0
      11
      NaN
      36
      334955
      7397603
      40111064
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4814
      5
      4
      1
      0
      11
      NaN
      36
      335675
      7397437
      40111081
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4839
      5
      4
      1
      0
      11
      NaN
      36
      335730
      7397340
      40111086
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4840
      5
      4
      1
      0
      11
      NaN
      36
      335730
      7397340
      40111086
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4843
      5
      4
      0
      0
      11
      NaN
      36
      335872
      7397009
      40111092
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4854
      5
      4
      1
      0
      11
      NaN
      36
      335753
      7397316
      40111103
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4859
      5
      4
      1
      0
      11
      NaN
      36
      335753
      7397316
      40111103
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4860
      5
      4
      1
      0
      11
      NaN
      36
      335753
      7397316
      40111103
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4861
      5
      4
      0
      0
      11
      NaN
      36
      335826
      7397243
      40111104
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4862
      5
      4
      0
      0
      11
      NaN
      36
      335952
      7397207
      40111105
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4865
      5
      4
      0
      0
      11
      NaN
      36
      335846
      7397209
      40111108
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4892
      5
      4
      1
      0
      11
      NaN
      36
      335874
      7397355
      40111121
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4893
      5
      4
      1
      0
      11
      NaN
      36
      335874
      7397355
      40111121
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4898
      5
      4
      1
      0
      11
      NaN
      36
      335733
      7397337
      40111124
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4914
      5
      4
      1
      0
      11
      NaN
      36
      335850
      7397219
      40111126
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4941
      5
      4
      1
      0
      11
      NaN
      36
      335735
      7397496
      40111161
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4956
      5
      4
      1
      0
      11
      NaN
      36
      335808
      7397246
      40111164
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4959
      5
      4
      1
      0
      11
      NaN
      36
      335848
      7397343
      40111166
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4964
      5
      4
      1
      0
      11
      NaN
      36
      335848
      7397343
      40111166
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4965
      5
      4
      1
      0
      11
      NaN
      36
      335848
      7397343
      40111166
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4970
      5
      4
      1
      0
      11
      NaN
      36
      335748
      7397321
      40111167
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4991
      5
      4
      1
      0
      11
      NaN
      36
      335794
      7397088
      40111194
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
  

705 rows × 91 columns

Passo 50: "CO_ORIG_X"

Em 2007 já existe a informação de "CO_ORIG_X"

Para os demais anos:

[Na coluna "CO_ORIG_X", linha i, ler o valor da linha i da coluna "SUBZONA_ORIG", daí, buscar o mesmo valor na coluna "Subzonas_XXXX" do arquivo CO-SUBZONAS-XXXX.csv. Ao achar, retornar o valor da mesma linha, só que da coluna "CO_X"]

[Obs.: ainda preciso construir esses csv, ou seja, determinar os centroides das subzonas a partir do MapInfo]

Passo 51: "CO_ORIG_Y"

Em 2007 já existe a informação de "CO_ORIG_Y"

Para os demais anos:

[Na coluna "CO_ORIG_Y", linha i, ler o valor da linha i da coluna "SUBZONA_ORIG", daí, buscar o mesmo valor na coluna "Subzonas_XXXX" do arquivo CO-SUBZONAS-XXXX.csv. Ao achar, retornar o valor da mesma linha, só que da coluna "CO_Y"]

[Obs.: ainda preciso construir esses csv, ou seja, determinar os centroides das subzonas a partir do MapInfo]

Passo 52: "UCOD_DEST"

Na coluna "UCOD_DEST", linha i, ler o valor da linha i da coluna "ZONA_DEST", daí, buscar o mesmo valor na coluna "Zona 2007" do arquivo UCOD-2007.csv. Ao achar, retornar o valor da mesma linha, só que da coluna "UCOD_DEST"

[Teste: no banco completo, checar se o min == 1 e o max == 67]



In [254]:

    
#Getting from the csv file the "UCOD" code correspondent to the "ZONA_DEST" code
od2007_ex['UCOD_DEST'] = od2007_ex.apply(lambda row: consulta_refext(row, 'UCOD-2007.csv', 'Zona 2007', 'ZONA_DEST', 'UCOD'), axis=1)



In [255]:

    
if not impressao:
    #Describing data ("UCOD_DEST" column) - count, mean, std, min and max
    od2007_ex['UCOD_DEST'].describe()









    Out[255]:





count    5000.000000
mean        4.736800
std         8.478626
min         0.000000
25%         1.000000
50%         3.000000
75%         4.000000
max        66.000000
Name: UCOD_DEST, dtype: float64



In [256]:

    
if not impressao:
    #Count for check "UCOD_DEST"
    od2007_ex['UCOD_DEST'].value_counts()









    Out[256]:





1     1578
4     1202
0      705
5      584
2      160
3      132
19      73
13      66
8       56
10      30
7       30
14      30
23      29
6       25
12      25
24      21
15      19
9       18
11      17
30      14
60      13
21      12
41      12
43      12
29       9
39       9
17       8
63       8
26       7
58       6
      ... 
16       5
46       4
61       4
35       4
20       4
34       4
37       4
22       4
50       4
42       4
27       3
54       3
25       3
59       3
33       3
36       2
31       2
28       2
32       2
65       2
40       2
62       2
53       2
48       1
66       1
45       1
49       1
57       1
55       1
18       1
dtype: int64



In [257]:

    
if not impressao:
    #Verifying value interval for check - conditions: "UCOD_DEST < 1" and "UCOD_DEST > 67"
    #The 'error' returns must be related to "UCOD_DEST" == 0, that is, trips that are not school purposed
    od2007_ex[(od2007_ex['UCOD_DEST']<1) | (od2007_ex['UCOD_DEST']>67)]









    Out[257]:






  
    
      
      UCOD_DOM
      ANO
      CD_ENTRE
      DIA_SEM
      ZONA_DOM
      SUBZONA_DOM
      MUN_DOM
      CO_DOM_X
      CO_DOM_Y
      ID_DOM
      ...
      TIPO_VIAG
      H_SAIDA
      MIN_SAIDA
      ANDA_ORIG
      H_CHEG
      MIN_CHEG
      ANDA_DEST
      DURACAO
      TIPO_EST_AUTO
      VALOR_EST_AUTO
    
  
  
    
      4
      1
      4
      1
      0
      1
      NaN
      36
      333858
      7394484
      40010018
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      9
      1
      4
      1
      0
      1
      NaN
      36
      333801
      7394422
      40010019
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      71
      1
      4
      1
      0
      1
      NaN
      36
      333622
      7394465
      40011018
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      72
      1
      4
      1
      0
      1
      NaN
      36
      333622
      7394465
      40011018
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      88
      1
      4
      1
      0
      1
      NaN
      36
      333739
      7394550
      40011027
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      105
      1
      4
      1
      0
      1
      NaN
      36
      333683
      7394479
      40011033
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      140
      1
      4
      0
      0
      1
      NaN
      36
      333807
      7394422
      40011066
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      143
      1
      4
      1
      0
      1
      NaN
      36
      333800
      7394465
      40011067
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      146
      1
      4
      1
      0
      1
      NaN
      36
      333738
      7394460
      40011073
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      155
      1
      4
      1
      0
      1
      NaN
      36
      333739
      7394550
      40011077
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      205
      1
      4
      1
      0
      1
      NaN
      36
      333729
      7394551
      40011132
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      216
      1
      4
      1
      0
      1
      NaN
      36
      333739
      7394550
      40011134
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      245
      1
      4
      1
      0
      1
      NaN
      36
      333739
      7394550
      40011161
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      246
      1
      4
      1
      0
      1
      NaN
      36
      333739
      7394550
      40011161
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      253
      1
      4
      0
      0
      1
      NaN
      36
      333880
      7394458
      40011162
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      256
      1
      4
      1
      0
      1
      NaN
      36
      333728
      7394534
      40011165
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      257
      1
      4
      1
      0
      1
      NaN
      36
      333728
      7394534
      40011165
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      280
      1
      4
      0
      0
      2
      NaN
      36
      333721
      7394629
      40020040
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      281
      1
      4
      0
      0
      2
      NaN
      36
      333721
      7394629
      40020040
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      282
      1
      4
      0
      0
      2
      NaN
      36
      333721
      7394629
      40020040
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      283
      1
      4
      0
      0
      2
      NaN
      36
      333721
      7394629
      40020040
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      316
      1
      4
      1
      0
      2
      NaN
      36
      333593
      7396032
      40021014
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      317
      1
      4
      1
      0
      2
      NaN
      36
      333593
      7396032
      40021014
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      320
      1
      4
      0
      0
      2
      NaN
      36
      333573
      7396022
      40021020
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      331
      1
      4
      1
      0
      2
      NaN
      36
      333516
      7396150
      40021025
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      342
      1
      4
      1
      0
      2
      NaN
      36
      333413
      7396177
      40021030
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      349
      1
      4
      1
      0
      2
      NaN
      36
      333413
      7396177
      40021030
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      350
      1
      4
      1
      0
      2
      NaN
      36
      333413
      7396177
      40021030
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      353
      1
      4
      1
      0
      2
      NaN
      36
      333446
      7395979
      40021031
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      354
      1
      4
      1
      0
      2
      NaN
      36
      333446
      7395979
      40021031
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
    
    
      4779
      5
      4
      1
      0
      11
      NaN
      36
      335282
      7397403
      40111016
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4780
      5
      4
      1
      0
      11
      NaN
      36
      335282
      7397403
      40111016
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4781
      5
      4
      1
      0
      11
      NaN
      36
      335282
      7397403
      40111016
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4794
      5
      4
      0
      0
      11
      NaN
      36
      335108
      7397559
      40111020
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4795
      5
      4
      1
      0
      11
      NaN
      36
      335095
      7397824
      40111021
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4800
      5
      4
      0
      0
      11
      NaN
      36
      335431
      7397340
      40111024
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4801
      5
      4
      0
      0
      11
      NaN
      36
      335431
      7397340
      40111024
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4804
      5
      4
      1
      0
      11
      NaN
      36
      334955
      7397603
      40111064
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4805
      5
      4
      1
      0
      11
      NaN
      36
      334955
      7397603
      40111064
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4814
      5
      4
      1
      0
      11
      NaN
      36
      335675
      7397437
      40111081
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4839
      5
      4
      1
      0
      11
      NaN
      36
      335730
      7397340
      40111086
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4840
      5
      4
      1
      0
      11
      NaN
      36
      335730
      7397340
      40111086
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4843
      5
      4
      0
      0
      11
      NaN
      36
      335872
      7397009
      40111092
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4854
      5
      4
      1
      0
      11
      NaN
      36
      335753
      7397316
      40111103
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4859
      5
      4
      1
      0
      11
      NaN
      36
      335753
      7397316
      40111103
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4860
      5
      4
      1
      0
      11
      NaN
      36
      335753
      7397316
      40111103
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4861
      5
      4
      0
      0
      11
      NaN
      36
      335826
      7397243
      40111104
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4862
      5
      4
      0
      0
      11
      NaN
      36
      335952
      7397207
      40111105
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4865
      5
      4
      0
      0
      11
      NaN
      36
      335846
      7397209
      40111108
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4892
      5
      4
      1
      0
      11
      NaN
      36
      335874
      7397355
      40111121
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4893
      5
      4
      1
      0
      11
      NaN
      36
      335874
      7397355
      40111121
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4898
      5
      4
      1
      0
      11
      NaN
      36
      335733
      7397337
      40111124
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4914
      5
      4
      1
      0
      11
      NaN
      36
      335850
      7397219
      40111126
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4941
      5
      4
      1
      0
      11
      NaN
      36
      335735
      7397496
      40111161
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4956
      5
      4
      1
      0
      11
      NaN
      36
      335808
      7397246
      40111164
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4959
      5
      4
      1
      0
      11
      NaN
      36
      335848
      7397343
      40111166
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4964
      5
      4
      1
      0
      11
      NaN
      36
      335848
      7397343
      40111166
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4965
      5
      4
      1
      0
      11
      NaN
      36
      335848
      7397343
      40111166
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4970
      5
      4
      1
      0
      11
      NaN
      36
      335748
      7397321
      40111167
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4991
      5
      4
      1
      0
      11
      NaN
      36
      335794
      7397088
      40111194
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
  

705 rows × 91 columns

Passo 53: "ZONA_DEST"

Checar se existe algum erro

Categorias:

1 a 460

[Teste: Checar se existe algum número < 1 ou > 460. Se encontrar, retornar erro indicando em qual linha.]



In [258]:

    
if not impressao:
    #Verifying value interval for check - conditions: "ZONA_DEST < 1" and "ZONA_DEST > 460"
    #The 'error' returns must be related to "ZONA_DEST"==0, that is, trips that are not school purposed
    od2007_ex[(od2007_ex['ZONA_DEST']<1) | (od2007_ex['ZONA_DEST']>460)]









    Out[258]:






  
    
      
      UCOD_DOM
      ANO
      CD_ENTRE
      DIA_SEM
      ZONA_DOM
      SUBZONA_DOM
      MUN_DOM
      CO_DOM_X
      CO_DOM_Y
      ID_DOM
      ...
      TIPO_VIAG
      H_SAIDA
      MIN_SAIDA
      ANDA_ORIG
      H_CHEG
      MIN_CHEG
      ANDA_DEST
      DURACAO
      TIPO_EST_AUTO
      VALOR_EST_AUTO
    
  
  
    
      4
      1
      4
      1
      0
      1
      NaN
      36
      333858
      7394484
      40010018
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      9
      1
      4
      1
      0
      1
      NaN
      36
      333801
      7394422
      40010019
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      71
      1
      4
      1
      0
      1
      NaN
      36
      333622
      7394465
      40011018
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      72
      1
      4
      1
      0
      1
      NaN
      36
      333622
      7394465
      40011018
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      88
      1
      4
      1
      0
      1
      NaN
      36
      333739
      7394550
      40011027
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      105
      1
      4
      1
      0
      1
      NaN
      36
      333683
      7394479
      40011033
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      140
      1
      4
      0
      0
      1
      NaN
      36
      333807
      7394422
      40011066
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      143
      1
      4
      1
      0
      1
      NaN
      36
      333800
      7394465
      40011067
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      146
      1
      4
      1
      0
      1
      NaN
      36
      333738
      7394460
      40011073
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      155
      1
      4
      1
      0
      1
      NaN
      36
      333739
      7394550
      40011077
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      205
      1
      4
      1
      0
      1
      NaN
      36
      333729
      7394551
      40011132
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      216
      1
      4
      1
      0
      1
      NaN
      36
      333739
      7394550
      40011134
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      245
      1
      4
      1
      0
      1
      NaN
      36
      333739
      7394550
      40011161
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      246
      1
      4
      1
      0
      1
      NaN
      36
      333739
      7394550
      40011161
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      253
      1
      4
      0
      0
      1
      NaN
      36
      333880
      7394458
      40011162
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      256
      1
      4
      1
      0
      1
      NaN
      36
      333728
      7394534
      40011165
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      257
      1
      4
      1
      0
      1
      NaN
      36
      333728
      7394534
      40011165
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      280
      1
      4
      0
      0
      2
      NaN
      36
      333721
      7394629
      40020040
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      281
      1
      4
      0
      0
      2
      NaN
      36
      333721
      7394629
      40020040
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      282
      1
      4
      0
      0
      2
      NaN
      36
      333721
      7394629
      40020040
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      283
      1
      4
      0
      0
      2
      NaN
      36
      333721
      7394629
      40020040
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      316
      1
      4
      1
      0
      2
      NaN
      36
      333593
      7396032
      40021014
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      317
      1
      4
      1
      0
      2
      NaN
      36
      333593
      7396032
      40021014
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      320
      1
      4
      0
      0
      2
      NaN
      36
      333573
      7396022
      40021020
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      331
      1
      4
      1
      0
      2
      NaN
      36
      333516
      7396150
      40021025
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      342
      1
      4
      1
      0
      2
      NaN
      36
      333413
      7396177
      40021030
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      349
      1
      4
      1
      0
      2
      NaN
      36
      333413
      7396177
      40021030
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      350
      1
      4
      1
      0
      2
      NaN
      36
      333413
      7396177
      40021030
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      353
      1
      4
      1
      0
      2
      NaN
      36
      333446
      7395979
      40021031
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      354
      1
      4
      1
      0
      2
      NaN
      36
      333446
      7395979
      40021031
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
    
    
      4779
      5
      4
      1
      0
      11
      NaN
      36
      335282
      7397403
      40111016
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4780
      5
      4
      1
      0
      11
      NaN
      36
      335282
      7397403
      40111016
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4781
      5
      4
      1
      0
      11
      NaN
      36
      335282
      7397403
      40111016
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4794
      5
      4
      0
      0
      11
      NaN
      36
      335108
      7397559
      40111020
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4795
      5
      4
      1
      0
      11
      NaN
      36
      335095
      7397824
      40111021
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4800
      5
      4
      0
      0
      11
      NaN
      36
      335431
      7397340
      40111024
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4801
      5
      4
      0
      0
      11
      NaN
      36
      335431
      7397340
      40111024
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4804
      5
      4
      1
      0
      11
      NaN
      36
      334955
      7397603
      40111064
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4805
      5
      4
      1
      0
      11
      NaN
      36
      334955
      7397603
      40111064
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4814
      5
      4
      1
      0
      11
      NaN
      36
      335675
      7397437
      40111081
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4839
      5
      4
      1
      0
      11
      NaN
      36
      335730
      7397340
      40111086
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4840
      5
      4
      1
      0
      11
      NaN
      36
      335730
      7397340
      40111086
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4843
      5
      4
      0
      0
      11
      NaN
      36
      335872
      7397009
      40111092
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4854
      5
      4
      1
      0
      11
      NaN
      36
      335753
      7397316
      40111103
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4859
      5
      4
      1
      0
      11
      NaN
      36
      335753
      7397316
      40111103
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4860
      5
      4
      1
      0
      11
      NaN
      36
      335753
      7397316
      40111103
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4861
      5
      4
      0
      0
      11
      NaN
      36
      335826
      7397243
      40111104
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4862
      5
      4
      0
      0
      11
      NaN
      36
      335952
      7397207
      40111105
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4865
      5
      4
      0
      0
      11
      NaN
      36
      335846
      7397209
      40111108
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4892
      5
      4
      1
      0
      11
      NaN
      36
      335874
      7397355
      40111121
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4893
      5
      4
      1
      0
      11
      NaN
      36
      335874
      7397355
      40111121
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4898
      5
      4
      1
      0
      11
      NaN
      36
      335733
      7397337
      40111124
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4914
      5
      4
      1
      0
      11
      NaN
      36
      335850
      7397219
      40111126
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4941
      5
      4
      1
      0
      11
      NaN
      36
      335735
      7397496
      40111161
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4956
      5
      4
      1
      0
      11
      NaN
      36
      335808
      7397246
      40111164
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4959
      5
      4
      1
      0
      11
      NaN
      36
      335848
      7397343
      40111166
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4964
      5
      4
      1
      0
      11
      NaN
      36
      335848
      7397343
      40111166
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4965
      5
      4
      1
      0
      11
      NaN
      36
      335848
      7397343
      40111166
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4970
      5
      4
      1
      0
      11
      NaN
      36
      335748
      7397321
      40111167
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4991
      5
      4
      1
      0
      11
      NaN
      36
      335794
      7397088
      40111194
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
  

705 rows × 91 columns

Passo 54: "SUBZONA_DEST"

A coluna "SUBZONA_DEST" ficará vazia (missing values) em 2007 porque este ano já contém os dados de coordenadas.

Para os anos em que esse input não existe originalmente, esse campo é critério para inserção de coordenadas.

Passo 55: "MUN_DEST"

Checar se existe algum erro

Categorias

1 a 39

[Teste: Checar se existe algum número < 1 ou > 39. Se encontrar, retornar erro indicando em qual linha.]



In [259]:

    
if not impressao:
    #Verifying value interval for check - conditions: "MUN_DEST < 1" ou de "MUN_DEST > 39"
    #The 'error' returns must be related to "MUN_DEST" == 0, that is, trips that are not school purposed
    od2007_ex[(od2007_ex['MUN_DEST']<1) | (od2007_ex['MUN_DEST']>39)]









    Out[259]:






  
    
      
      UCOD_DOM
      ANO
      CD_ENTRE
      DIA_SEM
      ZONA_DOM
      SUBZONA_DOM
      MUN_DOM
      CO_DOM_X
      CO_DOM_Y
      ID_DOM
      ...
      TIPO_VIAG
      H_SAIDA
      MIN_SAIDA
      ANDA_ORIG
      H_CHEG
      MIN_CHEG
      ANDA_DEST
      DURACAO
      TIPO_EST_AUTO
      VALOR_EST_AUTO
    
  
  
    
      4
      1
      4
      1
      0
      1
      NaN
      36
      333858
      7394484
      40010018
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      9
      1
      4
      1
      0
      1
      NaN
      36
      333801
      7394422
      40010019
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      71
      1
      4
      1
      0
      1
      NaN
      36
      333622
      7394465
      40011018
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      72
      1
      4
      1
      0
      1
      NaN
      36
      333622
      7394465
      40011018
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      88
      1
      4
      1
      0
      1
      NaN
      36
      333739
      7394550
      40011027
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      105
      1
      4
      1
      0
      1
      NaN
      36
      333683
      7394479
      40011033
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      140
      1
      4
      0
      0
      1
      NaN
      36
      333807
      7394422
      40011066
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      143
      1
      4
      1
      0
      1
      NaN
      36
      333800
      7394465
      40011067
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      146
      1
      4
      1
      0
      1
      NaN
      36
      333738
      7394460
      40011073
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      155
      1
      4
      1
      0
      1
      NaN
      36
      333739
      7394550
      40011077
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      205
      1
      4
      1
      0
      1
      NaN
      36
      333729
      7394551
      40011132
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      216
      1
      4
      1
      0
      1
      NaN
      36
      333739
      7394550
      40011134
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      245
      1
      4
      1
      0
      1
      NaN
      36
      333739
      7394550
      40011161
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      246
      1
      4
      1
      0
      1
      NaN
      36
      333739
      7394550
      40011161
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      253
      1
      4
      0
      0
      1
      NaN
      36
      333880
      7394458
      40011162
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      256
      1
      4
      1
      0
      1
      NaN
      36
      333728
      7394534
      40011165
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      257
      1
      4
      1
      0
      1
      NaN
      36
      333728
      7394534
      40011165
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      280
      1
      4
      0
      0
      2
      NaN
      36
      333721
      7394629
      40020040
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      281
      1
      4
      0
      0
      2
      NaN
      36
      333721
      7394629
      40020040
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      282
      1
      4
      0
      0
      2
      NaN
      36
      333721
      7394629
      40020040
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      283
      1
      4
      0
      0
      2
      NaN
      36
      333721
      7394629
      40020040
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      316
      1
      4
      1
      0
      2
      NaN
      36
      333593
      7396032
      40021014
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      317
      1
      4
      1
      0
      2
      NaN
      36
      333593
      7396032
      40021014
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      320
      1
      4
      0
      0
      2
      NaN
      36
      333573
      7396022
      40021020
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      331
      1
      4
      1
      0
      2
      NaN
      36
      333516
      7396150
      40021025
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      342
      1
      4
      1
      0
      2
      NaN
      36
      333413
      7396177
      40021030
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      349
      1
      4
      1
      0
      2
      NaN
      36
      333413
      7396177
      40021030
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      350
      1
      4
      1
      0
      2
      NaN
      36
      333413
      7396177
      40021030
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      353
      1
      4
      1
      0
      2
      NaN
      36
      333446
      7395979
      40021031
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      354
      1
      4
      1
      0
      2
      NaN
      36
      333446
      7395979
      40021031
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
    
    
      4779
      5
      4
      1
      0
      11
      NaN
      36
      335282
      7397403
      40111016
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4780
      5
      4
      1
      0
      11
      NaN
      36
      335282
      7397403
      40111016
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4781
      5
      4
      1
      0
      11
      NaN
      36
      335282
      7397403
      40111016
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4794
      5
      4
      0
      0
      11
      NaN
      36
      335108
      7397559
      40111020
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4795
      5
      4
      1
      0
      11
      NaN
      36
      335095
      7397824
      40111021
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4800
      5
      4
      0
      0
      11
      NaN
      36
      335431
      7397340
      40111024
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4801
      5
      4
      0
      0
      11
      NaN
      36
      335431
      7397340
      40111024
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4804
      5
      4
      1
      0
      11
      NaN
      36
      334955
      7397603
      40111064
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4805
      5
      4
      1
      0
      11
      NaN
      36
      334955
      7397603
      40111064
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4814
      5
      4
      1
      0
      11
      NaN
      36
      335675
      7397437
      40111081
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4839
      5
      4
      1
      0
      11
      NaN
      36
      335730
      7397340
      40111086
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4840
      5
      4
      1
      0
      11
      NaN
      36
      335730
      7397340
      40111086
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4843
      5
      4
      0
      0
      11
      NaN
      36
      335872
      7397009
      40111092
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4854
      5
      4
      1
      0
      11
      NaN
      36
      335753
      7397316
      40111103
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4859
      5
      4
      1
      0
      11
      NaN
      36
      335753
      7397316
      40111103
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4860
      5
      4
      1
      0
      11
      NaN
      36
      335753
      7397316
      40111103
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4861
      5
      4
      0
      0
      11
      NaN
      36
      335826
      7397243
      40111104
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4862
      5
      4
      0
      0
      11
      NaN
      36
      335952
      7397207
      40111105
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4865
      5
      4
      0
      0
      11
      NaN
      36
      335846
      7397209
      40111108
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4892
      5
      4
      1
      0
      11
      NaN
      36
      335874
      7397355
      40111121
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4893
      5
      4
      1
      0
      11
      NaN
      36
      335874
      7397355
      40111121
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4898
      5
      4
      1
      0
      11
      NaN
      36
      335733
      7397337
      40111124
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4914
      5
      4
      1
      0
      11
      NaN
      36
      335850
      7397219
      40111126
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4941
      5
      4
      1
      0
      11
      NaN
      36
      335735
      7397496
      40111161
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4956
      5
      4
      1
      0
      11
      NaN
      36
      335808
      7397246
      40111164
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4959
      5
      4
      1
      0
      11
      NaN
      36
      335848
      7397343
      40111166
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4964
      5
      4
      1
      0
      11
      NaN
      36
      335848
      7397343
      40111166
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4965
      5
      4
      1
      0
      11
      NaN
      36
      335848
      7397343
      40111166
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4970
      5
      4
      1
      0
      11
      NaN
      36
      335748
      7397321
      40111167
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4991
      5
      4
      1
      0
      11
      NaN
      36
      335794
      7397088
      40111194
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
  

705 rows × 91 columns

Passo 56: "CO_DEST_X"

Em 2007 já existe a informação de "CO_DEST_X"

Para os demais anos:

[Na coluna "CO_DEST_X", linha i, ler o valor da linha i da coluna "SUBZONA_DEST", daí, buscar o mesmo valor na coluna "Subzonas_XXXX" do arquivo CO-SUBZONAS-XXXX.csv. Ao achar, retornar o valor da mesma linha, só que da coluna "CO_X"]

[Obs.: ainda preciso construir esses csv, ou seja, determinar os centroides das subzonas a partir do MapInfo]

Passo 57: "CO_DEST_Y"

Em 2007 já existe a informação de "CO_DEST_Y"

Para os demais anos:

[Na coluna "CO_DEST_Y", linha i, ler o valor da linha i da coluna "SUBZONA_DEST", daí, buscar o mesmo valor na coluna "Subzonas_XXXX" do arquivo CO-SUBZONAS-XXXX.csv. Ao achar, retornar o valor da mesma linha, só que da coluna "CO_Y"]

[Obs.: ainda preciso construir esses csv, ou seja, determinar os centroides das subzonas a partir do MapInfo]

Passo 58: "DIST_VIAG"

Em 2007 já existe a informação de "DIST_VIAG"

Nos demais anos é preciso calcular a distância euclidiana (a partir da CO_ORIG_X;CO_ORIG_Y e CO_DEST_X;CO_DEST_Y)

Passo 59: "MOTIVO_ORIG"

Substituir valores da coluna "MOTIVO_ORIG"

Substituir todos valores 10 por 9

Categorias anteriores

Valor	Descrição
1	Trabalho/Indústria
2	Trabalho/Comércio
3	Trabalho/Serviços
4	Educação
5	Compras
6	Saúde
7	Lazer
8	Residência
9	Procurar Emprego
10	Assuntos Pessoais

Categorias novas

Valor	Descrição
1	Trabalho/Indústria
2	Trabalho/Comércio
3	Trabalho/Serviços
4	Educação
5	Compras
6	Saúde
7	Lazer
8	Residência
9	Outros

[Teste: Checar se existe algum número < 1 ou > 9. Se encontrar, retornar erro indicando em qual linha.]



In [260]:

    
if not impressao:
    #Counting for check "MOTIVO_ORIG"
    od2007_ex['MOTIVO_ORIG'].value_counts()









    Out[260]:





8     1998
4      726
3      714
0      705
2      344
10     151
7      112
5      101
1       74
6       71
9        4
dtype: int64



In [261]:

    
#Replacing the values 10 for 9
od2007_ex.loc[od2007_ex['MOTIVO_ORIG']==10,'MOTIVO_ORIG'] = 9



In [262]:

    
if not impressao:
    #Counting "MOTIVO_ORIG" in order to compare the values before and after the replacement
    od2007_ex['MOTIVO_ORIG'].value_counts()









    Out[262]:





8    1998
4     726
3     714
0     705
2     344
9     155
7     112
5     101
1      74
6      71
dtype: int64



In [263]:

    
if not impressao:
    #Verifying value interval for check - conditions: "MOTIVO_ORIG < 1" and "MOTIVO_ORIG > 9"
    od2007_ex[(od2007_ex['MOTIVO_ORIG']<1) | (od2007_ex['MOTIVO_ORIG']>9)]









    Out[263]:






  
    
      
      UCOD_DOM
      ANO
      CD_ENTRE
      DIA_SEM
      ZONA_DOM
      SUBZONA_DOM
      MUN_DOM
      CO_DOM_X
      CO_DOM_Y
      ID_DOM
      ...
      TIPO_VIAG
      H_SAIDA
      MIN_SAIDA
      ANDA_ORIG
      H_CHEG
      MIN_CHEG
      ANDA_DEST
      DURACAO
      TIPO_EST_AUTO
      VALOR_EST_AUTO
    
  
  
    
      4
      1
      4
      1
      0
      1
      NaN
      36
      333858
      7394484
      40010018
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      9
      1
      4
      1
      0
      1
      NaN
      36
      333801
      7394422
      40010019
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      71
      1
      4
      1
      0
      1
      NaN
      36
      333622
      7394465
      40011018
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      72
      1
      4
      1
      0
      1
      NaN
      36
      333622
      7394465
      40011018
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      88
      1
      4
      1
      0
      1
      NaN
      36
      333739
      7394550
      40011027
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      105
      1
      4
      1
      0
      1
      NaN
      36
      333683
      7394479
      40011033
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      140
      1
      4
      0
      0
      1
      NaN
      36
      333807
      7394422
      40011066
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      143
      1
      4
      1
      0
      1
      NaN
      36
      333800
      7394465
      40011067
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      146
      1
      4
      1
      0
      1
      NaN
      36
      333738
      7394460
      40011073
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      155
      1
      4
      1
      0
      1
      NaN
      36
      333739
      7394550
      40011077
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      205
      1
      4
      1
      0
      1
      NaN
      36
      333729
      7394551
      40011132
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      216
      1
      4
      1
      0
      1
      NaN
      36
      333739
      7394550
      40011134
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      245
      1
      4
      1
      0
      1
      NaN
      36
      333739
      7394550
      40011161
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      246
      1
      4
      1
      0
      1
      NaN
      36
      333739
      7394550
      40011161
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      253
      1
      4
      0
      0
      1
      NaN
      36
      333880
      7394458
      40011162
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      256
      1
      4
      1
      0
      1
      NaN
      36
      333728
      7394534
      40011165
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      257
      1
      4
      1
      0
      1
      NaN
      36
      333728
      7394534
      40011165
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      280
      1
      4
      0
      0
      2
      NaN
      36
      333721
      7394629
      40020040
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      281
      1
      4
      0
      0
      2
      NaN
      36
      333721
      7394629
      40020040
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      282
      1
      4
      0
      0
      2
      NaN
      36
      333721
      7394629
      40020040
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      283
      1
      4
      0
      0
      2
      NaN
      36
      333721
      7394629
      40020040
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      316
      1
      4
      1
      0
      2
      NaN
      36
      333593
      7396032
      40021014
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      317
      1
      4
      1
      0
      2
      NaN
      36
      333593
      7396032
      40021014
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      320
      1
      4
      0
      0
      2
      NaN
      36
      333573
      7396022
      40021020
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      331
      1
      4
      1
      0
      2
      NaN
      36
      333516
      7396150
      40021025
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      342
      1
      4
      1
      0
      2
      NaN
      36
      333413
      7396177
      40021030
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      349
      1
      4
      1
      0
      2
      NaN
      36
      333413
      7396177
      40021030
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      350
      1
      4
      1
      0
      2
      NaN
      36
      333413
      7396177
      40021030
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      353
      1
      4
      1
      0
      2
      NaN
      36
      333446
      7395979
      40021031
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      354
      1
      4
      1
      0
      2
      NaN
      36
      333446
      7395979
      40021031
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
    
    
      4779
      5
      4
      1
      0
      11
      NaN
      36
      335282
      7397403
      40111016
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4780
      5
      4
      1
      0
      11
      NaN
      36
      335282
      7397403
      40111016
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4781
      5
      4
      1
      0
      11
      NaN
      36
      335282
      7397403
      40111016
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4794
      5
      4
      0
      0
      11
      NaN
      36
      335108
      7397559
      40111020
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4795
      5
      4
      1
      0
      11
      NaN
      36
      335095
      7397824
      40111021
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4800
      5
      4
      0
      0
      11
      NaN
      36
      335431
      7397340
      40111024
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4801
      5
      4
      0
      0
      11
      NaN
      36
      335431
      7397340
      40111024
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4804
      5
      4
      1
      0
      11
      NaN
      36
      334955
      7397603
      40111064
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4805
      5
      4
      1
      0
      11
      NaN
      36
      334955
      7397603
      40111064
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4814
      5
      4
      1
      0
      11
      NaN
      36
      335675
      7397437
      40111081
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4839
      5
      4
      1
      0
      11
      NaN
      36
      335730
      7397340
      40111086
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4840
      5
      4
      1
      0
      11
      NaN
      36
      335730
      7397340
      40111086
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4843
      5
      4
      0
      0
      11
      NaN
      36
      335872
      7397009
      40111092
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4854
      5
      4
      1
      0
      11
      NaN
      36
      335753
      7397316
      40111103
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4859
      5
      4
      1
      0
      11
      NaN
      36
      335753
      7397316
      40111103
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4860
      5
      4
      1
      0
      11
      NaN
      36
      335753
      7397316
      40111103
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4861
      5
      4
      0
      0
      11
      NaN
      36
      335826
      7397243
      40111104
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4862
      5
      4
      0
      0
      11
      NaN
      36
      335952
      7397207
      40111105
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4865
      5
      4
      0
      0
      11
      NaN
      36
      335846
      7397209
      40111108
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4892
      5
      4
      1
      0
      11
      NaN
      36
      335874
      7397355
      40111121
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4893
      5
      4
      1
      0
      11
      NaN
      36
      335874
      7397355
      40111121
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4898
      5
      4
      1
      0
      11
      NaN
      36
      335733
      7397337
      40111124
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4914
      5
      4
      1
      0
      11
      NaN
      36
      335850
      7397219
      40111126
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4941
      5
      4
      1
      0
      11
      NaN
      36
      335735
      7397496
      40111161
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4956
      5
      4
      1
      0
      11
      NaN
      36
      335808
      7397246
      40111164
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4959
      5
      4
      1
      0
      11
      NaN
      36
      335848
      7397343
      40111166
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4964
      5
      4
      1
      0
      11
      NaN
      36
      335848
      7397343
      40111166
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4965
      5
      4
      1
      0
      11
      NaN
      36
      335848
      7397343
      40111166
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4970
      5
      4
      1
      0
      11
      NaN
      36
      335748
      7397321
      40111167
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4991
      5
      4
      1
      0
      11
      NaN
      36
      335794
      7397088
      40111194
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
  

705 rows × 91 columns

Passo 60: "MOTIVO_DEST"

Substituir valores da coluna "MOTIVO_DEST"

Substituir todos valores 10 por 9

Categorias anteriores

Valor	Descrição
1	Trabalho/Indústria
2	Trabalho/Comércio
3	Trabalho/Serviços
4	Educação
5	Compras
6	Saúde
7	Lazer
8	Residência
9	Procurar Emprego
10	Assuntos Pessoais

Categorias novas

Valor	Descrição
1	Trabalho/Indústria
2	Trabalho/Comércio
3	Trabalho/Serviços
4	Educação
5	Compras
6	Saúde
7	Lazer
8	Residência
9	Outros

[Teste: Checar se existe algum número < 1 ou > 9. Se encontrar, retornar erro indicando em qual linha.]



In [264]:

    
if not impressao:
    #Counting for check "MOTIVO_DEST"
    od2007_ex['MOTIVO_DEST'].value_counts()









    Out[264]:





8     1959
4      731
3      727
0      705
2      355
10     147
7      127
5      102
1       72
6       71
9        4
dtype: int64



In [265]:

    
#Replacing the values 10 for 9
od2007_ex.loc[od2007_ex['MOTIVO_DEST']==10,'MOTIVO_DEST'] = 9



In [266]:

    
if not impressao:
    #Counting "MOTIVO_DEST in order to compare the values before and after the replacement
    od2007_ex['MOTIVO_DEST'].value_counts()









    Out[266]:





8    1959
4     731
3     727
0     705
2     355
9     151
7     127
5     102
1      72
6      71
dtype: int64



In [267]:

    
if not impressao:
    #Verifying value interval for check - conditions: "MOTIVO_DEST < 1" and "MOTIVO_DEST > 9"
    od2007_ex[(od2007_ex['MOTIVO_DEST']<1) | (od2007_ex['MOTIVO_DEST']>9)]









    Out[267]:






  
    
      
      UCOD_DOM
      ANO
      CD_ENTRE
      DIA_SEM
      ZONA_DOM
      SUBZONA_DOM
      MUN_DOM
      CO_DOM_X
      CO_DOM_Y
      ID_DOM
      ...
      TIPO_VIAG
      H_SAIDA
      MIN_SAIDA
      ANDA_ORIG
      H_CHEG
      MIN_CHEG
      ANDA_DEST
      DURACAO
      TIPO_EST_AUTO
      VALOR_EST_AUTO
    
  
  
    
      4
      1
      4
      1
      0
      1
      NaN
      36
      333858
      7394484
      40010018
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      9
      1
      4
      1
      0
      1
      NaN
      36
      333801
      7394422
      40010019
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      71
      1
      4
      1
      0
      1
      NaN
      36
      333622
      7394465
      40011018
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      72
      1
      4
      1
      0
      1
      NaN
      36
      333622
      7394465
      40011018
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      88
      1
      4
      1
      0
      1
      NaN
      36
      333739
      7394550
      40011027
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      105
      1
      4
      1
      0
      1
      NaN
      36
      333683
      7394479
      40011033
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      140
      1
      4
      0
      0
      1
      NaN
      36
      333807
      7394422
      40011066
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      143
      1
      4
      1
      0
      1
      NaN
      36
      333800
      7394465
      40011067
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      146
      1
      4
      1
      0
      1
      NaN
      36
      333738
      7394460
      40011073
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      155
      1
      4
      1
      0
      1
      NaN
      36
      333739
      7394550
      40011077
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      205
      1
      4
      1
      0
      1
      NaN
      36
      333729
      7394551
      40011132
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      216
      1
      4
      1
      0
      1
      NaN
      36
      333739
      7394550
      40011134
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      245
      1
      4
      1
      0
      1
      NaN
      36
      333739
      7394550
      40011161
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      246
      1
      4
      1
      0
      1
      NaN
      36
      333739
      7394550
      40011161
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      253
      1
      4
      0
      0
      1
      NaN
      36
      333880
      7394458
      40011162
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      256
      1
      4
      1
      0
      1
      NaN
      36
      333728
      7394534
      40011165
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      257
      1
      4
      1
      0
      1
      NaN
      36
      333728
      7394534
      40011165
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      280
      1
      4
      0
      0
      2
      NaN
      36
      333721
      7394629
      40020040
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      281
      1
      4
      0
      0
      2
      NaN
      36
      333721
      7394629
      40020040
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      282
      1
      4
      0
      0
      2
      NaN
      36
      333721
      7394629
      40020040
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      283
      1
      4
      0
      0
      2
      NaN
      36
      333721
      7394629
      40020040
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      316
      1
      4
      1
      0
      2
      NaN
      36
      333593
      7396032
      40021014
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      317
      1
      4
      1
      0
      2
      NaN
      36
      333593
      7396032
      40021014
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      320
      1
      4
      0
      0
      2
      NaN
      36
      333573
      7396022
      40021020
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      331
      1
      4
      1
      0
      2
      NaN
      36
      333516
      7396150
      40021025
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      342
      1
      4
      1
      0
      2
      NaN
      36
      333413
      7396177
      40021030
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      349
      1
      4
      1
      0
      2
      NaN
      36
      333413
      7396177
      40021030
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      350
      1
      4
      1
      0
      2
      NaN
      36
      333413
      7396177
      40021030
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      353
      1
      4
      1
      0
      2
      NaN
      36
      333446
      7395979
      40021031
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      354
      1
      4
      1
      0
      2
      NaN
      36
      333446
      7395979
      40021031
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
    
    
      4779
      5
      4
      1
      0
      11
      NaN
      36
      335282
      7397403
      40111016
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4780
      5
      4
      1
      0
      11
      NaN
      36
      335282
      7397403
      40111016
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4781
      5
      4
      1
      0
      11
      NaN
      36
      335282
      7397403
      40111016
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4794
      5
      4
      0
      0
      11
      NaN
      36
      335108
      7397559
      40111020
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4795
      5
      4
      1
      0
      11
      NaN
      36
      335095
      7397824
      40111021
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4800
      5
      4
      0
      0
      11
      NaN
      36
      335431
      7397340
      40111024
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4801
      5
      4
      0
      0
      11
      NaN
      36
      335431
      7397340
      40111024
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4804
      5
      4
      1
      0
      11
      NaN
      36
      334955
      7397603
      40111064
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4805
      5
      4
      1
      0
      11
      NaN
      36
      334955
      7397603
      40111064
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4814
      5
      4
      1
      0
      11
      NaN
      36
      335675
      7397437
      40111081
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4839
      5
      4
      1
      0
      11
      NaN
      36
      335730
      7397340
      40111086
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4840
      5
      4
      1
      0
      11
      NaN
      36
      335730
      7397340
      40111086
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4843
      5
      4
      0
      0
      11
      NaN
      36
      335872
      7397009
      40111092
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4854
      5
      4
      1
      0
      11
      NaN
      36
      335753
      7397316
      40111103
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4859
      5
      4
      1
      0
      11
      NaN
      36
      335753
      7397316
      40111103
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4860
      5
      4
      1
      0
      11
      NaN
      36
      335753
      7397316
      40111103
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4861
      5
      4
      0
      0
      11
      NaN
      36
      335826
      7397243
      40111104
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4862
      5
      4
      0
      0
      11
      NaN
      36
      335952
      7397207
      40111105
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4865
      5
      4
      0
      0
      11
      NaN
      36
      335846
      7397209
      40111108
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4892
      5
      4
      1
      0
      11
      NaN
      36
      335874
      7397355
      40111121
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4893
      5
      4
      1
      0
      11
      NaN
      36
      335874
      7397355
      40111121
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4898
      5
      4
      1
      0
      11
      NaN
      36
      335733
      7397337
      40111124
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4914
      5
      4
      1
      0
      11
      NaN
      36
      335850
      7397219
      40111126
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4941
      5
      4
      1
      0
      11
      NaN
      36
      335735
      7397496
      40111161
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4956
      5
      4
      1
      0
      11
      NaN
      36
      335808
      7397246
      40111164
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4959
      5
      4
      1
      0
      11
      NaN
      36
      335848
      7397343
      40111166
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4964
      5
      4
      1
      0
      11
      NaN
      36
      335848
      7397343
      40111166
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4965
      5
      4
      1
      0
      11
      NaN
      36
      335848
      7397343
      40111166
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4970
      5
      4
      1
      0
      11
      NaN
      36
      335748
      7397321
      40111167
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4991
      5
      4
      1
      0
      11
      NaN
      36
      335794
      7397088
      40111194
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
  

705 rows × 91 columns

Passo 61: "MODO1"

Substituir valores da coluna "MODO1"

Substituir todos valores 2 por 1
Substituir todos valores 3 por 1
Substituir todos valores 4 por 2
Substituir todos valores 5 por 2
Substituir todos valores 6 por 3
Substituir todos valores 7 por 4
Substituir todos valores 8 por 5
Substituir todos valores 9 por 6
Substituir todos valores 10 por 6
Substituir todos valores 11 por 6
Substituir todos valores 12 por 7
Substituir todos valores 13 por 8
Substituir todos valores 14 por 9
Substituir todos valores 15 por 10
Substituir todos valores 16 por 11
Substituir todos valores 17 por 12

Categorias anteriores

Valor	Descrição
1	Ônibus Município S.Paulo
2	Ônibus Outros Municípios
3	Ônibus Metropolitano
4	Ônibus Fretado
5	Escolar
6	Dirigindo Automóvel
7	Passageiro de Automóvel
8	Táxi
9	Microônibus/Van Município de S.Paulo
10	Microônibus/Van Outros Municípios
11	Microônibus/Van Metropolitano
12	Metrô
13	Trem
14	Moto
15	Bicicleta
16	A Pé
17	Outros

Categorias novas

Valor	Descrição
1	Ônibus
2	Ônibus Escolar / Empresa
3	Dirigindo Automóvel
4	Passageiro de Automóvel
5	Táxi
6	Lotação / Perua / Van / Microônibus
7	Metrô
8	Trem
9	Moto
10	Bicicleta
11	A Pé
12	Outros

[Teste: Checar se existe algum número < 1 ou > 12. Se encontrar, retornar erro indicando em qual linha.]



In [268]:

    
if not impressao:
    #Counting for check "MODO1"
    od2007_ex['MODO1'].value_counts()









    Out[268]:





16    2299
0      705
1      693
12     479
6      402
7      197
15      61
5       50
14      31
13      28
8       24
4       13
9       12
2        4
3        1
10       1
dtype: int64



In [269]:

    
#Replacing the values 2 for 1
od2007_ex.loc[od2007_ex['MODO1']==2,'MODO1'] = 1
#Replacing the values 3 for 1
od2007_ex.loc[od2007_ex['MODO1']==3,'MODO1'] = 1
#Replacing the values 4 for 2
od2007_ex.loc[od2007_ex['MODO1']==4,'MODO1'] = 2
#Replacing the values 5 for 2
od2007_ex.loc[od2007_ex['MODO1']==5,'MODO1'] = 2
#Replacing the values 6 for 3
od2007_ex.loc[od2007_ex['MODO1']==6,'MODO1'] = 3
#Replacing the values 7 for 4
od2007_ex.loc[od2007_ex['MODO1']==7,'MODO1'] = 4
#Replacing the values 8 for 5
od2007_ex.loc[od2007_ex['MODO1']==8,'MODO1'] = 5
#Replacing the values 9 for 6
od2007_ex.loc[od2007_ex['MODO1']==9,'MODO1'] = 6
#Replacing the values 10 for 6
od2007_ex.loc[od2007_ex['MODO1']==10,'MODO1'] = 6
#Replacing the values 11 for 6
od2007_ex.loc[od2007_ex['MODO1']==11,'MODO1'] = 6
#Replacing the values 12 for 7
od2007_ex.loc[od2007_ex['MODO1']==12,'MODO1'] = 7
#Replacing the values 13 for 8
od2007_ex.loc[od2007_ex['MODO1']==13,'MODO1'] = 8
#Replacing the values 14 for 9
od2007_ex.loc[od2007_ex['MODO1']==14,'MODO1'] = 9
#Replacing the values 15 for 10
od2007_ex.loc[od2007_ex['MODO1']==15,'MODO1'] = 10
#Replacing the values 16 for 11
od2007_ex.loc[od2007_ex['MODO1']==16,'MODO1'] = 11
#Replacing the values 17 for 11
od2007_ex.loc[od2007_ex['MODO1']==17,'MODO1'] = 12



In [270]:

    
if not impressao:
    #Counting "MODO1 in order to compare the values before and after the replacement
    od2007_ex['MODO1'].value_counts()









    Out[270]:





11    2299
0      705
1      698
7      479
3      402
4      197
2       63
10      61
9       31
8       28
5       24
6       13
dtype: int64



In [271]:

    
if not impressao:
    #Verifying value interval for check - conditions: "MODO1 < 1" and "MODO1 > 12"
    od2007_ex[(od2007_ex['MODO1']<1) | (od2007_ex['MODO1']>12)]









    Out[271]:






  
    
      
      UCOD_DOM
      ANO
      CD_ENTRE
      DIA_SEM
      ZONA_DOM
      SUBZONA_DOM
      MUN_DOM
      CO_DOM_X
      CO_DOM_Y
      ID_DOM
      ...
      TIPO_VIAG
      H_SAIDA
      MIN_SAIDA
      ANDA_ORIG
      H_CHEG
      MIN_CHEG
      ANDA_DEST
      DURACAO
      TIPO_EST_AUTO
      VALOR_EST_AUTO
    
  
  
    
      4
      1
      4
      1
      0
      1
      NaN
      36
      333858
      7394484
      40010018
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      9
      1
      4
      1
      0
      1
      NaN
      36
      333801
      7394422
      40010019
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      71
      1
      4
      1
      0
      1
      NaN
      36
      333622
      7394465
      40011018
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      72
      1
      4
      1
      0
      1
      NaN
      36
      333622
      7394465
      40011018
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      88
      1
      4
      1
      0
      1
      NaN
      36
      333739
      7394550
      40011027
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      105
      1
      4
      1
      0
      1
      NaN
      36
      333683
      7394479
      40011033
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      140
      1
      4
      0
      0
      1
      NaN
      36
      333807
      7394422
      40011066
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      143
      1
      4
      1
      0
      1
      NaN
      36
      333800
      7394465
      40011067
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      146
      1
      4
      1
      0
      1
      NaN
      36
      333738
      7394460
      40011073
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      155
      1
      4
      1
      0
      1
      NaN
      36
      333739
      7394550
      40011077
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      205
      1
      4
      1
      0
      1
      NaN
      36
      333729
      7394551
      40011132
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      216
      1
      4
      1
      0
      1
      NaN
      36
      333739
      7394550
      40011134
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      245
      1
      4
      1
      0
      1
      NaN
      36
      333739
      7394550
      40011161
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      246
      1
      4
      1
      0
      1
      NaN
      36
      333739
      7394550
      40011161
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      253
      1
      4
      0
      0
      1
      NaN
      36
      333880
      7394458
      40011162
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      256
      1
      4
      1
      0
      1
      NaN
      36
      333728
      7394534
      40011165
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      257
      1
      4
      1
      0
      1
      NaN
      36
      333728
      7394534
      40011165
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      280
      1
      4
      0
      0
      2
      NaN
      36
      333721
      7394629
      40020040
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      281
      1
      4
      0
      0
      2
      NaN
      36
      333721
      7394629
      40020040
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      282
      1
      4
      0
      0
      2
      NaN
      36
      333721
      7394629
      40020040
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      283
      1
      4
      0
      0
      2
      NaN
      36
      333721
      7394629
      40020040
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      316
      1
      4
      1
      0
      2
      NaN
      36
      333593
      7396032
      40021014
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      317
      1
      4
      1
      0
      2
      NaN
      36
      333593
      7396032
      40021014
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      320
      1
      4
      0
      0
      2
      NaN
      36
      333573
      7396022
      40021020
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      331
      1
      4
      1
      0
      2
      NaN
      36
      333516
      7396150
      40021025
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      342
      1
      4
      1
      0
      2
      NaN
      36
      333413
      7396177
      40021030
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      349
      1
      4
      1
      0
      2
      NaN
      36
      333413
      7396177
      40021030
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      350
      1
      4
      1
      0
      2
      NaN
      36
      333413
      7396177
      40021030
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      353
      1
      4
      1
      0
      2
      NaN
      36
      333446
      7395979
      40021031
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      354
      1
      4
      1
      0
      2
      NaN
      36
      333446
      7395979
      40021031
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
    
    
      4779
      5
      4
      1
      0
      11
      NaN
      36
      335282
      7397403
      40111016
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4780
      5
      4
      1
      0
      11
      NaN
      36
      335282
      7397403
      40111016
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4781
      5
      4
      1
      0
      11
      NaN
      36
      335282
      7397403
      40111016
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4794
      5
      4
      0
      0
      11
      NaN
      36
      335108
      7397559
      40111020
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4795
      5
      4
      1
      0
      11
      NaN
      36
      335095
      7397824
      40111021
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4800
      5
      4
      0
      0
      11
      NaN
      36
      335431
      7397340
      40111024
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4801
      5
      4
      0
      0
      11
      NaN
      36
      335431
      7397340
      40111024
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4804
      5
      4
      1
      0
      11
      NaN
      36
      334955
      7397603
      40111064
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4805
      5
      4
      1
      0
      11
      NaN
      36
      334955
      7397603
      40111064
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4814
      5
      4
      1
      0
      11
      NaN
      36
      335675
      7397437
      40111081
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4839
      5
      4
      1
      0
      11
      NaN
      36
      335730
      7397340
      40111086
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4840
      5
      4
      1
      0
      11
      NaN
      36
      335730
      7397340
      40111086
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4843
      5
      4
      0
      0
      11
      NaN
      36
      335872
      7397009
      40111092
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4854
      5
      4
      1
      0
      11
      NaN
      36
      335753
      7397316
      40111103
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4859
      5
      4
      1
      0
      11
      NaN
      36
      335753
      7397316
      40111103
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4860
      5
      4
      1
      0
      11
      NaN
      36
      335753
      7397316
      40111103
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4861
      5
      4
      0
      0
      11
      NaN
      36
      335826
      7397243
      40111104
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4862
      5
      4
      0
      0
      11
      NaN
      36
      335952
      7397207
      40111105
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4865
      5
      4
      0
      0
      11
      NaN
      36
      335846
      7397209
      40111108
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4892
      5
      4
      1
      0
      11
      NaN
      36
      335874
      7397355
      40111121
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4893
      5
      4
      1
      0
      11
      NaN
      36
      335874
      7397355
      40111121
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4898
      5
      4
      1
      0
      11
      NaN
      36
      335733
      7397337
      40111124
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4914
      5
      4
      1
      0
      11
      NaN
      36
      335850
      7397219
      40111126
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4941
      5
      4
      1
      0
      11
      NaN
      36
      335735
      7397496
      40111161
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4956
      5
      4
      1
      0
      11
      NaN
      36
      335808
      7397246
      40111164
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4959
      5
      4
      1
      0
      11
      NaN
      36
      335848
      7397343
      40111166
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4964
      5
      4
      1
      0
      11
      NaN
      36
      335848
      7397343
      40111166
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4965
      5
      4
      1
      0
      11
      NaN
      36
      335848
      7397343
      40111166
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4970
      5
      4
      1
      0
      11
      NaN
      36
      335748
      7397321
      40111167
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4991
      5
      4
      1
      0
      11
      NaN
      36
      335794
      7397088
      40111194
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
  

705 rows × 91 columns

Passo 62: "MODO2"

Substituir valores da coluna "MODO2"

~ mesmas categorias utilizadas no MODO1 ~



In [272]:

    
if not impressao:
    #Counting for check "MODO2"
    od2007_ex['MODO2'].value_counts()









    Out[272]:





0     4732
1      145
12      87
13      19
9        8
4        3
6        2
2        2
11       1
7        1
dtype: int64



In [273]:

    
#Replacing the values 2 for 1
od2007_ex.loc[od2007_ex['MODO2']==2,'MODO2'] = 1
#Replacing the values 3 for 1
od2007_ex.loc[od2007_ex['MODO2']==3,'MODO2'] = 1
#Replacing the values 4 for 2
od2007_ex.loc[od2007_ex['MODO2']==4,'MODO2'] = 2
#Replacing the values 5 for 2
od2007_ex.loc[od2007_ex['MODO2']==5,'MODO2'] = 2
#Replacing the values 6 for 3
od2007_ex.loc[od2007_ex['MODO2']==6,'MODO2'] = 3
#Replacing the values 7 for 4
od2007_ex.loc[od2007_ex['MODO2']==7,'MODO2'] = 4
#Replacing the values 8 for 5
od2007_ex.loc[od2007_ex['MODO2']==8,'MODO2'] = 5
#Replacing the values 9 for 6
od2007_ex.loc[od2007_ex['MODO2']==9,'MODO2'] = 6
#Replacing the values 10 for 6
od2007_ex.loc[od2007_ex['MODO2']==10,'MODO2'] = 6
#Replacing the values 11 for 6
od2007_ex.loc[od2007_ex['MODO2']==11,'MODO2'] = 6
#Replacing the values 12 for 7
od2007_ex.loc[od2007_ex['MODO2']==12,'MODO2'] = 7
#Replacing the values 13 for 8
od2007_ex.loc[od2007_ex['MODO2']==13,'MODO2'] = 8
#Replacing the values 14 for 9
od2007_ex.loc[od2007_ex['MODO2']==14,'MODO2'] = 9
#Replacing the values 15 for 10
od2007_ex.loc[od2007_ex['MODO2']==15,'MODO2'] = 10
#Replacing the values 16 for 11
od2007_ex.loc[od2007_ex['MODO2']==16,'MODO2'] = 11
#Replacing the values 17 for 11
od2007_ex.loc[od2007_ex['MODO2']==17,'MODO2'] = 12



In [274]:

    
if not impressao:
    #Counting "MODO2 in order to compare the values before and after the replacement
    od2007_ex['MODO2'].value_counts()









    Out[274]:





0    4732
1     147
7      87
8      19
6       9
2       3
3       2
4       1
dtype: int64



In [275]:

    
if not impressao:
    #Verifying value interval for check - conditions: "MODO2 < 1" and "MODO2 > 12"
    od2007_ex[(od2007_ex['MODO2']<1) | (od2007_ex['MODO2']>12)]









    Out[275]:






  
    
      
      UCOD_DOM
      ANO
      CD_ENTRE
      DIA_SEM
      ZONA_DOM
      SUBZONA_DOM
      MUN_DOM
      CO_DOM_X
      CO_DOM_Y
      ID_DOM
      ...
      TIPO_VIAG
      H_SAIDA
      MIN_SAIDA
      ANDA_ORIG
      H_CHEG
      MIN_CHEG
      ANDA_DEST
      DURACAO
      TIPO_EST_AUTO
      VALOR_EST_AUTO
    
  
  
    
      0
      1
      4
      1
      6
      1
      NaN
      36
      333729
      7394430
      40010001
      ...
      3
      8
      0
      0
      8
      10
      0
      10
      0
      0
    
    
      1
      1
      4
      1
      6
      1
      NaN
      36
      333729
      7394430
      40010001
      ...
      3
      17
      30
      0
      17
      40
      0
      10
      0
      0
    
    
      4
      1
      4
      1
      0
      1
      NaN
      36
      333858
      7394484
      40010018
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      5
      1
      4
      1
      5
      1
      NaN
      36
      333801
      7394422
      40010019
      ...
      4
      9
      30
      1
      10
      0
      1
      30
      0
      0
    
    
      6
      1
      4
      1
      5
      1
      NaN
      36
      333801
      7394422
      40010019
      ...
      4
      15
      0
      1
      15
      30
      1
      30
      0
      0
    
    
      7
      1
      4
      1
      5
      1
      NaN
      36
      333801
      7394422
      40010019
      ...
      4
      18
      30
      1
      19
      0
      1
      30
      0
      0
    
    
      8
      1
      4
      1
      5
      1
      NaN
      36
      333801
      7394422
      40010019
      ...
      4
      23
      45
      1
      0
      15
      1
      30
      0
      0
    
    
      9
      1
      4
      1
      0
      1
      NaN
      36
      333801
      7394422
      40010019
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      10
      1
      4
      1
      5
      1
      NaN
      36
      333801
      7394422
      40010019
      ...
      3
      6
      35
      0
      6
      40
      0
      5
      0
      0
    
    
      11
      1
      4
      1
      5
      1
      NaN
      36
      333801
      7394422
      40010019
      ...
      3
      12
      20
      0
      12
      25
      0
      5
      0
      0
    
    
      12
      1
      4
      1
      3
      1
      NaN
      36
      333610
      7394494
      40010021
      ...
      1
      7
      0
      10
      7
      30
      1
      30
      0
      0
    
    
      13
      1
      4
      1
      3
      1
      NaN
      36
      333610
      7394494
      40010021
      ...
      3
      8
      0
      0
      8
      20
      0
      20
      0
      0
    
    
      14
      1
      4
      1
      3
      1
      NaN
      36
      333610
      7394494
      40010021
      ...
      3
      12
      0
      0
      12
      40
      0
      40
      0
      0
    
    
      15
      1
      4
      1
      3
      1
      NaN
      36
      333610
      7394494
      40010021
      ...
      1
      19
      0
      0
      19
      45
      10
      45
      0
      0
    
    
      16
      1
      4
      1
      6
      1
      NaN
      36
      333819
      7394525
      40010024
      ...
      3
      22
      0
      0
      22
      10
      0
      10
      0
      0
    
    
      17
      1
      4
      1
      6
      1
      NaN
      36
      333819
      7394525
      40010024
      ...
      3
      16
      0
      0
      16
      10
      0
      10
      0
      0
    
    
      18
      1
      4
      1
      6
      1
      NaN
      36
      333819
      7394525
      40010024
      ...
      3
      18
      0
      0
      18
      10
      0
      10
      0
      0
    
    
      19
      1
      4
      1
      2
      1
      NaN
      36
      333738
      7394460
      40010032
      ...
      3
      11
      45
      0
      12
      5
      0
      20
      0
      0
    
    
      20
      1
      4
      1
      2
      1
      NaN
      36
      333738
      7394460
      40010032
      ...
      3
      12
      40
      0
      12
      50
      0
      10
      0
      0
    
    
      21
      1
      4
      1
      2
      1
      NaN
      36
      333738
      7394460
      40010032
      ...
      3
      13
      0
      0
      13
      20
      0
      20
      0
      0
    
    
      22
      1
      4
      1
      2
      1
      NaN
      36
      333738
      7394460
      40010032
      ...
      3
      14
      15
      0
      14
      40
      0
      25
      0
      0
    
    
      23
      1
      4
      1
      2
      1
      NaN
      36
      333738
      7394460
      40010032
      ...
      1
      18
      0
      10
      18
      25
      10
      25
      0
      0
    
    
      24
      1
      4
      1
      3
      1
      NaN
      36
      333739
      7394550
      40010042
      ...
      3
      10
      0
      0
      10
      15
      0
      15
      0
      0
    
    
      25
      1
      4
      1
      3
      1
      NaN
      36
      333739
      7394550
      40010042
      ...
      3
      11
      30
      0
      11
      45
      0
      15
      0
      0
    
    
      26
      1
      4
      1
      3
      1
      NaN
      36
      333739
      7394550
      40010042
      ...
      1
      8
      0
      10
      8
      30
      5
      30
      0
      0
    
    
      27
      1
      4
      1
      3
      1
      NaN
      36
      333739
      7394550
      40010042
      ...
      1
      10
      0
      20
      10
      40
      10
      40
      0
      0
    
    
      28
      1
      4
      1
      3
      1
      NaN
      36
      333739
      7394550
      40010042
      ...
      1
      11
      45
      10
      14
      30
      10
      165
      0
      0
    
    
      29
      1
      4
      1
      3
      1
      NaN
      36
      333739
      7394550
      40010042
      ...
      3
      18
      0
      0
      18
      10
      0
      10
      0
      0
    
    
      30
      1
      4
      1
      3
      1
      NaN
      36
      333739
      7394550
      40010042
      ...
      3
      18
      50
      0
      19
      5
      0
      15
      0
      0
    
    
      31
      1
      4
      1
      3
      1
      NaN
      36
      333840
      7394468
      40010047
      ...
      2
      7
      30
      1
      7
      45
      1
      15
      0
      0
    
    
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
    
    
      4964
      5
      4
      1
      0
      11
      NaN
      36
      335848
      7397343
      40111166
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4965
      5
      4
      1
      0
      11
      NaN
      36
      335848
      7397343
      40111166
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4966
      5
      4
      1
      3
      11
      NaN
      36
      335748
      7397321
      40111167
      ...
      2
      8
      0
      0
      8
      20
      0
      20
      0
      0
    
    
      4967
      5
      4
      1
      3
      11
      NaN
      36
      335748
      7397321
      40111167
      ...
      2
      11
      40
      0
      12
      0
      0
      20
      0
      0
    
    
      4968
      5
      4
      1
      3
      11
      NaN
      36
      335748
      7397321
      40111167
      ...
      2
      8
      0
      0
      8
      20
      0
      20
      0
      0
    
    
      4969
      5
      4
      1
      3
      11
      NaN
      36
      335748
      7397321
      40111167
      ...
      2
      11
      40
      0
      12
      0
      0
      20
      0
      0
    
    
      4970
      5
      4
      1
      0
      11
      NaN
      36
      335748
      7397321
      40111167
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4971
      5
      4
      1
      5
      11
      NaN
      36
      336005
      7397304
      40111171
      ...
      2
      6
      30
      0
      7
      0
      0
      30
      8
      0
    
    
      4972
      5
      4
      1
      5
      11
      NaN
      36
      336005
      7397304
      40111171
      ...
      2
      19
      0
      0
      19
      40
      0
      40
      8
      0
    
    
      4973
      5
      4
      1
      5
      11
      NaN
      36
      336005
      7397304
      40111171
      ...
      3
      7
      30
      0
      7
      50
      0
      20
      0
      0
    
    
      4974
      5
      4
      1
      5
      11
      NaN
      36
      336005
      7397304
      40111171
      ...
      3
      8
      0
      0
      8
      30
      0
      30
      0
      0
    
    
      4975
      5
      4
      1
      5
      11
      NaN
      36
      336005
      7397304
      40111171
      ...
      3
      15
      30
      0
      15
      50
      0
      20
      0
      0
    
    
      4976
      5
      4
      1
      5
      11
      NaN
      36
      336005
      7397304
      40111171
      ...
      3
      16
      0
      0
      16
      30
      0
      30
      0
      0
    
    
      4977
      5
      4
      1
      5
      11
      NaN
      36
      336005
      7397304
      40111171
      ...
      3
      7
      40
      0
      8
      0
      0
      20
      0
      0
    
    
      4978
      5
      4
      1
      5
      11
      NaN
      36
      336005
      7397304
      40111171
      ...
      3
      18
      0
      0
      18
      20
      0
      20
      0
      0
    
    
      4979
      5
      4
      1
      5
      11
      NaN
      36
      336005
      7397304
      40111171
      ...
      3
      7
      30
      0
      7
      50
      0
      20
      0
      0
    
    
      4980
      5
      4
      1
      5
      11
      NaN
      36
      336005
      7397304
      40111171
      ...
      3
      16
      0
      0
      16
      30
      0
      30
      0
      0
    
    
      4981
      5
      4
      1
      5
      11
      NaN
      36
      335786
      7397283
      40111172
      ...
      3
      10
      0
      0
      10
      30
      0
      30
      0
      0
    
    
      4982
      5
      4
      1
      5
      11
      NaN
      36
      335786
      7397283
      40111172
      ...
      3
      11
      30
      0
      12
      0
      0
      30
      0
      0
    
    
      4983
      5
      4
      1
      5
      11
      NaN
      36
      335786
      7397283
      40111172
      ...
      3
      11
      45
      0
      12
      15
      0
      30
      0
      0
    
    
      4984
      5
      4
      1
      5
      11
      NaN
      36
      335786
      7397283
      40111172
      ...
      3
      14
      0
      0
      14
      30
      0
      30
      0
      0
    
    
      4985
      5
      4
      1
      5
      11
      NaN
      36
      335786
      7397283
      40111172
      ...
      1
      11
      30
      0
      12
      0
      0
      30
      0
      0
    
    
      4986
      5
      4
      1
      5
      11
      NaN
      36
      335786
      7397283
      40111172
      ...
      1
      18
      0
      0
      18
      40
      0
      40
      0
      0
    
    
      4987
      5
      4
      1
      5
      11
      NaN
      36
      335786
      7397283
      40111172
      ...
      1
      11
      30
      0
      12
      0
      0
      30
      0
      0
    
    
      4988
      5
      4
      1
      5
      11
      NaN
      36
      335786
      7397283
      40111172
      ...
      1
      18
      0
      0
      18
      30
      0
      30
      0
      0
    
    
      4989
      5
      4
      1
      2
      11
      NaN
      36
      335794
      7397088
      40111194
      ...
      1
      7
      0
      1
      7
      20
      10
      20
      0
      0
    
    
      4990
      5
      4
      1
      2
      11
      NaN
      36
      335794
      7397088
      40111194
      ...
      1
      17
      0
      10
      17
      30
      3
      30
      0
      0
    
    
      4991
      5
      4
      1
      0
      11
      NaN
      36
      335794
      7397088
      40111194
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4998
      5
      4
      1
      2
      11
      NaN
      36
      335885
      7397331
      40111201
      ...
      3
      8
      0
      0
      8
      20
      0
      20
      0
      0
    
    
      4999
      5
      4
      1
      2
      11
      NaN
      36
      335885
      7397331
      40111201
      ...
      3
      11
      30
      0
      12
      10
      0
      40
      0
      0
    
  

4732 rows × 91 columns

Passo 63: "MODO3"

Substituir valores da coluna "MODO3"

~ mesmas categorias utilizadas no MODO1 ~



In [276]:

    
if not impressao:
    #Counting for check "MODO3"
    od2007_ex['MODO3'].value_counts()









    Out[276]:





0     4976
1       16
12       3
4        2
7        1
2        1
9        1
dtype: int64



In [277]:

    
#Replacing the values 2 for 1
od2007_ex.loc[od2007_ex['MODO3']==2,'MODO3'] = 1
#Replacing the values 3 for 1
od2007_ex.loc[od2007_ex['MODO3']==3,'MODO3'] = 1
#Replacing the values 4 for 2
od2007_ex.loc[od2007_ex['MODO3']==4,'MODO3'] = 2
#Replacing the values 5 for 2
od2007_ex.loc[od2007_ex['MODO3']==5,'MODO3'] = 2
#Replacing the values 6 for 3
od2007_ex.loc[od2007_ex['MODO3']==6,'MODO3'] = 3
#Replacing the values 7 for 4
od2007_ex.loc[od2007_ex['MODO3']==7,'MODO3'] = 4
#Replacing the values 8 for 5
od2007_ex.loc[od2007_ex['MODO3']==8,'MODO3'] = 5
#Replacing the values 9 for 6
od2007_ex.loc[od2007_ex['MODO3']==9,'MODO3'] = 6
#Replacing the values 10 for 6
od2007_ex.loc[od2007_ex['MODO3']==10,'MODO3'] = 6
#Replacing the values 11 for 6
od2007_ex.loc[od2007_ex['MODO3']==11,'MODO3'] = 6
#Replacing the values 12 for 7
od2007_ex.loc[od2007_ex['MODO3']==12,'MODO3'] = 7
#Replacing the values 13 for 8
od2007_ex.loc[od2007_ex['MODO3']==13,'MODO3'] = 8
#Replacing the values 14 for 9
od2007_ex.loc[od2007_ex['MODO3']==14,'MODO3'] = 9
#Replacing the values 15 for 10
od2007_ex.loc[od2007_ex['MODO3']==15,'MODO3'] = 10
#Replacing the values 16 for 11
od2007_ex.loc[od2007_ex['MODO3']==16,'MODO3'] = 11
#Replacing the values 17 for 11
od2007_ex.loc[od2007_ex['MODO3']==17,'MODO3'] = 12



In [278]:

    
if not impressao:
    #Counting "MODO3 in order to compare the values before and after the replacement
    od2007_ex['MODO3'].value_counts()









    Out[278]:





0    4976
1      17
7       3
2       2
6       1
4       1
dtype: int64



In [279]:

    
if not impressao:
    #Verifying value interval for check - conditions: "MODO3 < 1" and "MODO3 > 12"
    od2007_ex[(od2007_ex['MODO3']<1) | (od2007_ex['MODO3']>12)]









    Out[279]:






  
    
      
      UCOD_DOM
      ANO
      CD_ENTRE
      DIA_SEM
      ZONA_DOM
      SUBZONA_DOM
      MUN_DOM
      CO_DOM_X
      CO_DOM_Y
      ID_DOM
      ...
      TIPO_VIAG
      H_SAIDA
      MIN_SAIDA
      ANDA_ORIG
      H_CHEG
      MIN_CHEG
      ANDA_DEST
      DURACAO
      TIPO_EST_AUTO
      VALOR_EST_AUTO
    
  
  
    
      0
      1
      4
      1
      6
      1
      NaN
      36
      333729
      7394430
      40010001
      ...
      3
      8
      0
      0
      8
      10
      0
      10
      0
      0
    
    
      1
      1
      4
      1
      6
      1
      NaN
      36
      333729
      7394430
      40010001
      ...
      3
      17
      30
      0
      17
      40
      0
      10
      0
      0
    
    
      2
      1
      4
      1
      5
      1
      NaN
      36
      333858
      7394484
      40010018
      ...
      1
      4
      30
      2
      5
      45
      2
      75
      0
      0
    
    
      3
      1
      4
      1
      5
      1
      NaN
      36
      333858
      7394484
      40010018
      ...
      1
      18
      10
      2
      19
      30
      2
      80
      0
      0
    
    
      4
      1
      4
      1
      0
      1
      NaN
      36
      333858
      7394484
      40010018
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      5
      1
      4
      1
      5
      1
      NaN
      36
      333801
      7394422
      40010019
      ...
      4
      9
      30
      1
      10
      0
      1
      30
      0
      0
    
    
      6
      1
      4
      1
      5
      1
      NaN
      36
      333801
      7394422
      40010019
      ...
      4
      15
      0
      1
      15
      30
      1
      30
      0
      0
    
    
      7
      1
      4
      1
      5
      1
      NaN
      36
      333801
      7394422
      40010019
      ...
      4
      18
      30
      1
      19
      0
      1
      30
      0
      0
    
    
      8
      1
      4
      1
      5
      1
      NaN
      36
      333801
      7394422
      40010019
      ...
      4
      23
      45
      1
      0
      15
      1
      30
      0
      0
    
    
      9
      1
      4
      1
      0
      1
      NaN
      36
      333801
      7394422
      40010019
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      10
      1
      4
      1
      5
      1
      NaN
      36
      333801
      7394422
      40010019
      ...
      3
      6
      35
      0
      6
      40
      0
      5
      0
      0
    
    
      11
      1
      4
      1
      5
      1
      NaN
      36
      333801
      7394422
      40010019
      ...
      3
      12
      20
      0
      12
      25
      0
      5
      0
      0
    
    
      12
      1
      4
      1
      3
      1
      NaN
      36
      333610
      7394494
      40010021
      ...
      1
      7
      0
      10
      7
      30
      1
      30
      0
      0
    
    
      13
      1
      4
      1
      3
      1
      NaN
      36
      333610
      7394494
      40010021
      ...
      3
      8
      0
      0
      8
      20
      0
      20
      0
      0
    
    
      14
      1
      4
      1
      3
      1
      NaN
      36
      333610
      7394494
      40010021
      ...
      3
      12
      0
      0
      12
      40
      0
      40
      0
      0
    
    
      15
      1
      4
      1
      3
      1
      NaN
      36
      333610
      7394494
      40010021
      ...
      1
      19
      0
      0
      19
      45
      10
      45
      0
      0
    
    
      16
      1
      4
      1
      6
      1
      NaN
      36
      333819
      7394525
      40010024
      ...
      3
      22
      0
      0
      22
      10
      0
      10
      0
      0
    
    
      17
      1
      4
      1
      6
      1
      NaN
      36
      333819
      7394525
      40010024
      ...
      3
      16
      0
      0
      16
      10
      0
      10
      0
      0
    
    
      18
      1
      4
      1
      6
      1
      NaN
      36
      333819
      7394525
      40010024
      ...
      3
      18
      0
      0
      18
      10
      0
      10
      0
      0
    
    
      19
      1
      4
      1
      2
      1
      NaN
      36
      333738
      7394460
      40010032
      ...
      3
      11
      45
      0
      12
      5
      0
      20
      0
      0
    
    
      20
      1
      4
      1
      2
      1
      NaN
      36
      333738
      7394460
      40010032
      ...
      3
      12
      40
      0
      12
      50
      0
      10
      0
      0
    
    
      21
      1
      4
      1
      2
      1
      NaN
      36
      333738
      7394460
      40010032
      ...
      3
      13
      0
      0
      13
      20
      0
      20
      0
      0
    
    
      22
      1
      4
      1
      2
      1
      NaN
      36
      333738
      7394460
      40010032
      ...
      3
      14
      15
      0
      14
      40
      0
      25
      0
      0
    
    
      23
      1
      4
      1
      2
      1
      NaN
      36
      333738
      7394460
      40010032
      ...
      1
      18
      0
      10
      18
      25
      10
      25
      0
      0
    
    
      24
      1
      4
      1
      3
      1
      NaN
      36
      333739
      7394550
      40010042
      ...
      3
      10
      0
      0
      10
      15
      0
      15
      0
      0
    
    
      25
      1
      4
      1
      3
      1
      NaN
      36
      333739
      7394550
      40010042
      ...
      3
      11
      30
      0
      11
      45
      0
      15
      0
      0
    
    
      26
      1
      4
      1
      3
      1
      NaN
      36
      333739
      7394550
      40010042
      ...
      1
      8
      0
      10
      8
      30
      5
      30
      0
      0
    
    
      27
      1
      4
      1
      3
      1
      NaN
      36
      333739
      7394550
      40010042
      ...
      1
      10
      0
      20
      10
      40
      10
      40
      0
      0
    
    
      28
      1
      4
      1
      3
      1
      NaN
      36
      333739
      7394550
      40010042
      ...
      1
      11
      45
      10
      14
      30
      10
      165
      0
      0
    
    
      29
      1
      4
      1
      3
      1
      NaN
      36
      333739
      7394550
      40010042
      ...
      3
      18
      0
      0
      18
      10
      0
      10
      0
      0
    
    
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
    
    
      4970
      5
      4
      1
      0
      11
      NaN
      36
      335748
      7397321
      40111167
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4971
      5
      4
      1
      5
      11
      NaN
      36
      336005
      7397304
      40111171
      ...
      2
      6
      30
      0
      7
      0
      0
      30
      8
      0
    
    
      4972
      5
      4
      1
      5
      11
      NaN
      36
      336005
      7397304
      40111171
      ...
      2
      19
      0
      0
      19
      40
      0
      40
      8
      0
    
    
      4973
      5
      4
      1
      5
      11
      NaN
      36
      336005
      7397304
      40111171
      ...
      3
      7
      30
      0
      7
      50
      0
      20
      0
      0
    
    
      4974
      5
      4
      1
      5
      11
      NaN
      36
      336005
      7397304
      40111171
      ...
      3
      8
      0
      0
      8
      30
      0
      30
      0
      0
    
    
      4975
      5
      4
      1
      5
      11
      NaN
      36
      336005
      7397304
      40111171
      ...
      3
      15
      30
      0
      15
      50
      0
      20
      0
      0
    
    
      4976
      5
      4
      1
      5
      11
      NaN
      36
      336005
      7397304
      40111171
      ...
      3
      16
      0
      0
      16
      30
      0
      30
      0
      0
    
    
      4977
      5
      4
      1
      5
      11
      NaN
      36
      336005
      7397304
      40111171
      ...
      3
      7
      40
      0
      8
      0
      0
      20
      0
      0
    
    
      4978
      5
      4
      1
      5
      11
      NaN
      36
      336005
      7397304
      40111171
      ...
      3
      18
      0
      0
      18
      20
      0
      20
      0
      0
    
    
      4979
      5
      4
      1
      5
      11
      NaN
      36
      336005
      7397304
      40111171
      ...
      3
      7
      30
      0
      7
      50
      0
      20
      0
      0
    
    
      4980
      5
      4
      1
      5
      11
      NaN
      36
      336005
      7397304
      40111171
      ...
      3
      16
      0
      0
      16
      30
      0
      30
      0
      0
    
    
      4981
      5
      4
      1
      5
      11
      NaN
      36
      335786
      7397283
      40111172
      ...
      3
      10
      0
      0
      10
      30
      0
      30
      0
      0
    
    
      4982
      5
      4
      1
      5
      11
      NaN
      36
      335786
      7397283
      40111172
      ...
      3
      11
      30
      0
      12
      0
      0
      30
      0
      0
    
    
      4983
      5
      4
      1
      5
      11
      NaN
      36
      335786
      7397283
      40111172
      ...
      3
      11
      45
      0
      12
      15
      0
      30
      0
      0
    
    
      4984
      5
      4
      1
      5
      11
      NaN
      36
      335786
      7397283
      40111172
      ...
      3
      14
      0
      0
      14
      30
      0
      30
      0
      0
    
    
      4985
      5
      4
      1
      5
      11
      NaN
      36
      335786
      7397283
      40111172
      ...
      1
      11
      30
      0
      12
      0
      0
      30
      0
      0
    
    
      4986
      5
      4
      1
      5
      11
      NaN
      36
      335786
      7397283
      40111172
      ...
      1
      18
      0
      0
      18
      40
      0
      40
      0
      0
    
    
      4987
      5
      4
      1
      5
      11
      NaN
      36
      335786
      7397283
      40111172
      ...
      1
      11
      30
      0
      12
      0
      0
      30
      0
      0
    
    
      4988
      5
      4
      1
      5
      11
      NaN
      36
      335786
      7397283
      40111172
      ...
      1
      18
      0
      0
      18
      30
      0
      30
      0
      0
    
    
      4989
      5
      4
      1
      2
      11
      NaN
      36
      335794
      7397088
      40111194
      ...
      1
      7
      0
      1
      7
      20
      10
      20
      0
      0
    
    
      4990
      5
      4
      1
      2
      11
      NaN
      36
      335794
      7397088
      40111194
      ...
      1
      17
      0
      10
      17
      30
      3
      30
      0
      0
    
    
      4991
      5
      4
      1
      0
      11
      NaN
      36
      335794
      7397088
      40111194
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4992
      5
      4
      1
      2
      11
      NaN
      36
      335794
      7397088
      40111194
      ...
      1
      6
      25
      1
      7
      30
      5
      65
      0
      0
    
    
      4993
      5
      4
      1
      2
      11
      NaN
      36
      335794
      7397088
      40111194
      ...
      1
      11
      30
      5
      12
      30
      5
      60
      0
      0
    
    
      4994
      5
      4
      1
      2
      11
      NaN
      36
      335794
      7397088
      40111194
      ...
      1
      6
      25
      1
      7
      45
      5
      80
      0
      0
    
    
      4995
      5
      4
      1
      2
      11
      NaN
      36
      335794
      7397088
      40111194
      ...
      1
      19
      0
      5
      20
      45
      5
      105
      0
      0
    
    
      4996
      5
      4
      1
      2
      11
      NaN
      36
      335794
      7397088
      40111194
      ...
      1
      6
      25
      1
      8
      15
      10
      110
      0
      0
    
    
      4997
      5
      4
      1
      2
      11
      NaN
      36
      335794
      7397088
      40111194
      ...
      1
      17
      30
      10
      19
      35
      5
      125
      0
      0
    
    
      4998
      5
      4
      1
      2
      11
      NaN
      36
      335885
      7397331
      40111201
      ...
      3
      8
      0
      0
      8
      20
      0
      20
      0
      0
    
    
      4999
      5
      4
      1
      2
      11
      NaN
      36
      335885
      7397331
      40111201
      ...
      3
      11
      30
      0
      12
      10
      0
      40
      0
      0
    
  

4976 rows × 91 columns

Passo 64: "MODO4"

Substituir valores da coluna "MODO4"

~ mesmas categorias utilizadas no MODO1 ~



In [280]:

    
if not impressao:
    #Counting for check "MODO4"
    od2007_ex['MODO4'].value_counts()









    Out[280]:





0    5000
dtype: int64



In [281]:

    
#Replacing the values 2 for 1
od2007_ex.loc[od2007_ex['MODO4']==2,'MODO4'] = 1
#Replacing the values 3 for 1
od2007_ex.loc[od2007_ex['MODO4']==3,'MODO4'] = 1
#Replacing the values 4 for 2
od2007_ex.loc[od2007_ex['MODO4']==4,'MODO4'] = 2
#Replacing the values 5 for 2
od2007_ex.loc[od2007_ex['MODO4']==5,'MODO4'] = 2
#Replacing the values 6 for 3
od2007_ex.loc[od2007_ex['MODO4']==6,'MODO4'] = 3
#Replacing the values 7 for 4
od2007_ex.loc[od2007_ex['MODO4']==7,'MODO4'] = 4
#Replacing the values 8 for 5
od2007_ex.loc[od2007_ex['MODO4']==8,'MODO4'] = 5
#Replacing the values 9 for 6
od2007_ex.loc[od2007_ex['MODO4']==9,'MODO4'] = 6
#Replacing the values 10 for 6
od2007_ex.loc[od2007_ex['MODO4']==10,'MODO4'] = 6
#Replacing the values 11 for 6
od2007_ex.loc[od2007_ex['MODO4']==11,'MODO4'] = 6
#Replacing the values 12 for 7
od2007_ex.loc[od2007_ex['MODO4']==12,'MODO4'] = 7
#Replacing the values 13 for 8
od2007_ex.loc[od2007_ex['MODO4']==13,'MODO4'] = 8
#Replacing the values 14 for 9
od2007_ex.loc[od2007_ex['MODO4']==14,'MODO4'] = 9
#Replacing the values 15 for 10
od2007_ex.loc[od2007_ex['MODO4']==15,'MODO4'] = 10
#Replacing the values 16 for 11
od2007_ex.loc[od2007_ex['MODO4']==16,'MODO4'] = 11
#Replacing the values 17 for 11
od2007_ex.loc[od2007_ex['MODO4']==17,'MODO4'] = 12



In [282]:

    
if not impressao:
    #Counting "MODO4 in order to compare the values before and after the replacement
    od2007_ex['MODO4'].value_counts()









    Out[282]:





0    5000
dtype: int64



In [283]:

    
if not impressao:
    #Verifying value interval for check - conditions: "MODO4 < 1" and "MODO4 > 12"
    od2007_ex[(od2007_ex['MODO4']<1) | (od2007_ex['MODO4']>12)]









    Out[283]:






  
    
      
      UCOD_DOM
      ANO
      CD_ENTRE
      DIA_SEM
      ZONA_DOM
      SUBZONA_DOM
      MUN_DOM
      CO_DOM_X
      CO_DOM_Y
      ID_DOM
      ...
      TIPO_VIAG
      H_SAIDA
      MIN_SAIDA
      ANDA_ORIG
      H_CHEG
      MIN_CHEG
      ANDA_DEST
      DURACAO
      TIPO_EST_AUTO
      VALOR_EST_AUTO
    
  
  
    
      0
      1
      4
      1
      6
      1
      NaN
      36
      333729
      7394430
      40010001
      ...
      3
      8
      0
      0
      8
      10
      0
      10
      0
      0
    
    
      1
      1
      4
      1
      6
      1
      NaN
      36
      333729
      7394430
      40010001
      ...
      3
      17
      30
      0
      17
      40
      0
      10
      0
      0
    
    
      2
      1
      4
      1
      5
      1
      NaN
      36
      333858
      7394484
      40010018
      ...
      1
      4
      30
      2
      5
      45
      2
      75
      0
      0
    
    
      3
      1
      4
      1
      5
      1
      NaN
      36
      333858
      7394484
      40010018
      ...
      1
      18
      10
      2
      19
      30
      2
      80
      0
      0
    
    
      4
      1
      4
      1
      0
      1
      NaN
      36
      333858
      7394484
      40010018
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      5
      1
      4
      1
      5
      1
      NaN
      36
      333801
      7394422
      40010019
      ...
      4
      9
      30
      1
      10
      0
      1
      30
      0
      0
    
    
      6
      1
      4
      1
      5
      1
      NaN
      36
      333801
      7394422
      40010019
      ...
      4
      15
      0
      1
      15
      30
      1
      30
      0
      0
    
    
      7
      1
      4
      1
      5
      1
      NaN
      36
      333801
      7394422
      40010019
      ...
      4
      18
      30
      1
      19
      0
      1
      30
      0
      0
    
    
      8
      1
      4
      1
      5
      1
      NaN
      36
      333801
      7394422
      40010019
      ...
      4
      23
      45
      1
      0
      15
      1
      30
      0
      0
    
    
      9
      1
      4
      1
      0
      1
      NaN
      36
      333801
      7394422
      40010019
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      10
      1
      4
      1
      5
      1
      NaN
      36
      333801
      7394422
      40010019
      ...
      3
      6
      35
      0
      6
      40
      0
      5
      0
      0
    
    
      11
      1
      4
      1
      5
      1
      NaN
      36
      333801
      7394422
      40010019
      ...
      3
      12
      20
      0
      12
      25
      0
      5
      0
      0
    
    
      12
      1
      4
      1
      3
      1
      NaN
      36
      333610
      7394494
      40010021
      ...
      1
      7
      0
      10
      7
      30
      1
      30
      0
      0
    
    
      13
      1
      4
      1
      3
      1
      NaN
      36
      333610
      7394494
      40010021
      ...
      3
      8
      0
      0
      8
      20
      0
      20
      0
      0
    
    
      14
      1
      4
      1
      3
      1
      NaN
      36
      333610
      7394494
      40010021
      ...
      3
      12
      0
      0
      12
      40
      0
      40
      0
      0
    
    
      15
      1
      4
      1
      3
      1
      NaN
      36
      333610
      7394494
      40010021
      ...
      1
      19
      0
      0
      19
      45
      10
      45
      0
      0
    
    
      16
      1
      4
      1
      6
      1
      NaN
      36
      333819
      7394525
      40010024
      ...
      3
      22
      0
      0
      22
      10
      0
      10
      0
      0
    
    
      17
      1
      4
      1
      6
      1
      NaN
      36
      333819
      7394525
      40010024
      ...
      3
      16
      0
      0
      16
      10
      0
      10
      0
      0
    
    
      18
      1
      4
      1
      6
      1
      NaN
      36
      333819
      7394525
      40010024
      ...
      3
      18
      0
      0
      18
      10
      0
      10
      0
      0
    
    
      19
      1
      4
      1
      2
      1
      NaN
      36
      333738
      7394460
      40010032
      ...
      3
      11
      45
      0
      12
      5
      0
      20
      0
      0
    
    
      20
      1
      4
      1
      2
      1
      NaN
      36
      333738
      7394460
      40010032
      ...
      3
      12
      40
      0
      12
      50
      0
      10
      0
      0
    
    
      21
      1
      4
      1
      2
      1
      NaN
      36
      333738
      7394460
      40010032
      ...
      3
      13
      0
      0
      13
      20
      0
      20
      0
      0
    
    
      22
      1
      4
      1
      2
      1
      NaN
      36
      333738
      7394460
      40010032
      ...
      3
      14
      15
      0
      14
      40
      0
      25
      0
      0
    
    
      23
      1
      4
      1
      2
      1
      NaN
      36
      333738
      7394460
      40010032
      ...
      1
      18
      0
      10
      18
      25
      10
      25
      0
      0
    
    
      24
      1
      4
      1
      3
      1
      NaN
      36
      333739
      7394550
      40010042
      ...
      3
      10
      0
      0
      10
      15
      0
      15
      0
      0
    
    
      25
      1
      4
      1
      3
      1
      NaN
      36
      333739
      7394550
      40010042
      ...
      3
      11
      30
      0
      11
      45
      0
      15
      0
      0
    
    
      26
      1
      4
      1
      3
      1
      NaN
      36
      333739
      7394550
      40010042
      ...
      1
      8
      0
      10
      8
      30
      5
      30
      0
      0
    
    
      27
      1
      4
      1
      3
      1
      NaN
      36
      333739
      7394550
      40010042
      ...
      1
      10
      0
      20
      10
      40
      10
      40
      0
      0
    
    
      28
      1
      4
      1
      3
      1
      NaN
      36
      333739
      7394550
      40010042
      ...
      1
      11
      45
      10
      14
      30
      10
      165
      0
      0
    
    
      29
      1
      4
      1
      3
      1
      NaN
      36
      333739
      7394550
      40010042
      ...
      3
      18
      0
      0
      18
      10
      0
      10
      0
      0
    
    
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
    
    
      4970
      5
      4
      1
      0
      11
      NaN
      36
      335748
      7397321
      40111167
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4971
      5
      4
      1
      5
      11
      NaN
      36
      336005
      7397304
      40111171
      ...
      2
      6
      30
      0
      7
      0
      0
      30
      8
      0
    
    
      4972
      5
      4
      1
      5
      11
      NaN
      36
      336005
      7397304
      40111171
      ...
      2
      19
      0
      0
      19
      40
      0
      40
      8
      0
    
    
      4973
      5
      4
      1
      5
      11
      NaN
      36
      336005
      7397304
      40111171
      ...
      3
      7
      30
      0
      7
      50
      0
      20
      0
      0
    
    
      4974
      5
      4
      1
      5
      11
      NaN
      36
      336005
      7397304
      40111171
      ...
      3
      8
      0
      0
      8
      30
      0
      30
      0
      0
    
    
      4975
      5
      4
      1
      5
      11
      NaN
      36
      336005
      7397304
      40111171
      ...
      3
      15
      30
      0
      15
      50
      0
      20
      0
      0
    
    
      4976
      5
      4
      1
      5
      11
      NaN
      36
      336005
      7397304
      40111171
      ...
      3
      16
      0
      0
      16
      30
      0
      30
      0
      0
    
    
      4977
      5
      4
      1
      5
      11
      NaN
      36
      336005
      7397304
      40111171
      ...
      3
      7
      40
      0
      8
      0
      0
      20
      0
      0
    
    
      4978
      5
      4
      1
      5
      11
      NaN
      36
      336005
      7397304
      40111171
      ...
      3
      18
      0
      0
      18
      20
      0
      20
      0
      0
    
    
      4979
      5
      4
      1
      5
      11
      NaN
      36
      336005
      7397304
      40111171
      ...
      3
      7
      30
      0
      7
      50
      0
      20
      0
      0
    
    
      4980
      5
      4
      1
      5
      11
      NaN
      36
      336005
      7397304
      40111171
      ...
      3
      16
      0
      0
      16
      30
      0
      30
      0
      0
    
    
      4981
      5
      4
      1
      5
      11
      NaN
      36
      335786
      7397283
      40111172
      ...
      3
      10
      0
      0
      10
      30
      0
      30
      0
      0
    
    
      4982
      5
      4
      1
      5
      11
      NaN
      36
      335786
      7397283
      40111172
      ...
      3
      11
      30
      0
      12
      0
      0
      30
      0
      0
    
    
      4983
      5
      4
      1
      5
      11
      NaN
      36
      335786
      7397283
      40111172
      ...
      3
      11
      45
      0
      12
      15
      0
      30
      0
      0
    
    
      4984
      5
      4
      1
      5
      11
      NaN
      36
      335786
      7397283
      40111172
      ...
      3
      14
      0
      0
      14
      30
      0
      30
      0
      0
    
    
      4985
      5
      4
      1
      5
      11
      NaN
      36
      335786
      7397283
      40111172
      ...
      1
      11
      30
      0
      12
      0
      0
      30
      0
      0
    
    
      4986
      5
      4
      1
      5
      11
      NaN
      36
      335786
      7397283
      40111172
      ...
      1
      18
      0
      0
      18
      40
      0
      40
      0
      0
    
    
      4987
      5
      4
      1
      5
      11
      NaN
      36
      335786
      7397283
      40111172
      ...
      1
      11
      30
      0
      12
      0
      0
      30
      0
      0
    
    
      4988
      5
      4
      1
      5
      11
      NaN
      36
      335786
      7397283
      40111172
      ...
      1
      18
      0
      0
      18
      30
      0
      30
      0
      0
    
    
      4989
      5
      4
      1
      2
      11
      NaN
      36
      335794
      7397088
      40111194
      ...
      1
      7
      0
      1
      7
      20
      10
      20
      0
      0
    
    
      4990
      5
      4
      1
      2
      11
      NaN
      36
      335794
      7397088
      40111194
      ...
      1
      17
      0
      10
      17
      30
      3
      30
      0
      0
    
    
      4991
      5
      4
      1
      0
      11
      NaN
      36
      335794
      7397088
      40111194
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4992
      5
      4
      1
      2
      11
      NaN
      36
      335794
      7397088
      40111194
      ...
      1
      6
      25
      1
      7
      30
      5
      65
      0
      0
    
    
      4993
      5
      4
      1
      2
      11
      NaN
      36
      335794
      7397088
      40111194
      ...
      1
      11
      30
      5
      12
      30
      5
      60
      0
      0
    
    
      4994
      5
      4
      1
      2
      11
      NaN
      36
      335794
      7397088
      40111194
      ...
      1
      6
      25
      1
      7
      45
      5
      80
      0
      0
    
    
      4995
      5
      4
      1
      2
      11
      NaN
      36
      335794
      7397088
      40111194
      ...
      1
      19
      0
      5
      20
      45
      5
      105
      0
      0
    
    
      4996
      5
      4
      1
      2
      11
      NaN
      36
      335794
      7397088
      40111194
      ...
      1
      6
      25
      1
      8
      15
      10
      110
      0
      0
    
    
      4997
      5
      4
      1
      2
      11
      NaN
      36
      335794
      7397088
      40111194
      ...
      1
      17
      30
      10
      19
      35
      5
      125
      0
      0
    
    
      4998
      5
      4
      1
      2
      11
      NaN
      36
      335885
      7397331
      40111201
      ...
      3
      8
      0
      0
      8
      20
      0
      20
      0
      0
    
    
      4999
      5
      4
      1
      2
      11
      NaN
      36
      335885
      7397331
      40111201
      ...
      3
      11
      30
      0
      12
      10
      0
      40
      0
      0
    
  

5000 rows × 91 columns

Passo 65: "MODO_PRIN"

Substituir valores da coluna "MODO_PRIN"

~ mesmas categorias utilizadas no MODO_1 ~



In [284]:

    
if not impressao:
    #Counting for check "MODO_PRIN"
    od2007_ex['MODO_PRIN'].value_counts()









    Out[284]:





16    2299
0      705
1      636
12     569
6      400
7      192
15      61
5       50
14      31
8       22
13      17
4       10
9        5
2        2
10       1
dtype: int64



In [285]:

    
#Replacing the values 2 for 1
od2007_ex.loc[od2007_ex['MODO_PRIN']==2,'MODO_PRIN'] = 1
#Replacing the values 3 for 1
od2007_ex.loc[od2007_ex['MODO_PRIN']==3,'MODO_PRIN'] = 1
#Replacing the values 4 for 2
od2007_ex.loc[od2007_ex['MODO_PRIN']==4,'MODO_PRIN'] = 2
#Replacing the values 5 for 2
od2007_ex.loc[od2007_ex['MODO_PRIN']==5,'MODO_PRIN'] = 2
#Replacing the values 6 for 3
od2007_ex.loc[od2007_ex['MODO_PRIN']==6,'MODO_PRIN'] = 3
#Replacing the values 7 for 4
od2007_ex.loc[od2007_ex['MODO_PRIN']==7,'MODO_PRIN'] = 4
#Replacing the values 8 for 5
od2007_ex.loc[od2007_ex['MODO_PRIN']==8,'MODO_PRIN'] = 5
#Replacing the values 9 for 6
od2007_ex.loc[od2007_ex['MODO_PRIN']==9,'MODO_PRIN'] = 6
#Replacing the values 10 for 6
od2007_ex.loc[od2007_ex['MODO_PRIN']==10,'MODO_PRIN'] = 6
#Replacing the values 11 for 6
od2007_ex.loc[od2007_ex['MODO_PRIN']==11,'MODO_PRIN'] = 6
#Replacing the values 12 for 7
od2007_ex.loc[od2007_ex['MODO_PRIN']==12,'MODO_PRIN'] = 7
#Replacing the values 13 for 8
od2007_ex.loc[od2007_ex['MODO_PRIN']==13,'MODO_PRIN'] = 8
#Replacing the values 14 for 9
od2007_ex.loc[od2007_ex['MODO_PRIN']==14,'MODO_PRIN'] = 9
#Replacing the values 15 for 10
od2007_ex.loc[od2007_ex['MODO_PRIN']==15,'MODO_PRIN'] = 10
#Replacing the values 16 for 11
od2007_ex.loc[od2007_ex['MODO_PRIN']==16,'MODO_PRIN'] = 11
#Replacing the values 17 for 11
od2007_ex.loc[od2007_ex['MODO_PRIN']==17,'MODO_PRIN'] = 12



In [286]:

    
if not impressao:
    #Counting "MODO_PRIN in order to compare the values before and after the replacement
    od2007_ex['MODO_PRIN'].value_counts()









    Out[286]:





11    2299
0      705
1      638
7      569
3      400
4      192
10      61
2       60
9       31
5       22
8       17
6        6
dtype: int64



In [287]:

    
if not impressao:
    #Verifying value interval for check - conditions: "MODO_PRIN < 1" and "MODO_PRIN > 12"
    od2007_ex[(od2007_ex['MODO_PRIN']<1) | (od2007_ex['MODO_PRIN']>12)]









    Out[287]:






  
    
      
      UCOD_DOM
      ANO
      CD_ENTRE
      DIA_SEM
      ZONA_DOM
      SUBZONA_DOM
      MUN_DOM
      CO_DOM_X
      CO_DOM_Y
      ID_DOM
      ...
      TIPO_VIAG
      H_SAIDA
      MIN_SAIDA
      ANDA_ORIG
      H_CHEG
      MIN_CHEG
      ANDA_DEST
      DURACAO
      TIPO_EST_AUTO
      VALOR_EST_AUTO
    
  
  
    
      4
      1
      4
      1
      0
      1
      NaN
      36
      333858
      7394484
      40010018
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      9
      1
      4
      1
      0
      1
      NaN
      36
      333801
      7394422
      40010019
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      71
      1
      4
      1
      0
      1
      NaN
      36
      333622
      7394465
      40011018
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      72
      1
      4
      1
      0
      1
      NaN
      36
      333622
      7394465
      40011018
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      88
      1
      4
      1
      0
      1
      NaN
      36
      333739
      7394550
      40011027
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      105
      1
      4
      1
      0
      1
      NaN
      36
      333683
      7394479
      40011033
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      140
      1
      4
      0
      0
      1
      NaN
      36
      333807
      7394422
      40011066
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      143
      1
      4
      1
      0
      1
      NaN
      36
      333800
      7394465
      40011067
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      146
      1
      4
      1
      0
      1
      NaN
      36
      333738
      7394460
      40011073
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      155
      1
      4
      1
      0
      1
      NaN
      36
      333739
      7394550
      40011077
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      205
      1
      4
      1
      0
      1
      NaN
      36
      333729
      7394551
      40011132
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      216
      1
      4
      1
      0
      1
      NaN
      36
      333739
      7394550
      40011134
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      245
      1
      4
      1
      0
      1
      NaN
      36
      333739
      7394550
      40011161
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      246
      1
      4
      1
      0
      1
      NaN
      36
      333739
      7394550
      40011161
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      253
      1
      4
      0
      0
      1
      NaN
      36
      333880
      7394458
      40011162
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      256
      1
      4
      1
      0
      1
      NaN
      36
      333728
      7394534
      40011165
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      257
      1
      4
      1
      0
      1
      NaN
      36
      333728
      7394534
      40011165
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      280
      1
      4
      0
      0
      2
      NaN
      36
      333721
      7394629
      40020040
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      281
      1
      4
      0
      0
      2
      NaN
      36
      333721
      7394629
      40020040
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      282
      1
      4
      0
      0
      2
      NaN
      36
      333721
      7394629
      40020040
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      283
      1
      4
      0
      0
      2
      NaN
      36
      333721
      7394629
      40020040
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      316
      1
      4
      1
      0
      2
      NaN
      36
      333593
      7396032
      40021014
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      317
      1
      4
      1
      0
      2
      NaN
      36
      333593
      7396032
      40021014
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      320
      1
      4
      0
      0
      2
      NaN
      36
      333573
      7396022
      40021020
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      331
      1
      4
      1
      0
      2
      NaN
      36
      333516
      7396150
      40021025
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      342
      1
      4
      1
      0
      2
      NaN
      36
      333413
      7396177
      40021030
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      349
      1
      4
      1
      0
      2
      NaN
      36
      333413
      7396177
      40021030
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      350
      1
      4
      1
      0
      2
      NaN
      36
      333413
      7396177
      40021030
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      353
      1
      4
      1
      0
      2
      NaN
      36
      333446
      7395979
      40021031
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      354
      1
      4
      1
      0
      2
      NaN
      36
      333446
      7395979
      40021031
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
    
    
      4779
      5
      4
      1
      0
      11
      NaN
      36
      335282
      7397403
      40111016
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4780
      5
      4
      1
      0
      11
      NaN
      36
      335282
      7397403
      40111016
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4781
      5
      4
      1
      0
      11
      NaN
      36
      335282
      7397403
      40111016
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4794
      5
      4
      0
      0
      11
      NaN
      36
      335108
      7397559
      40111020
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4795
      5
      4
      1
      0
      11
      NaN
      36
      335095
      7397824
      40111021
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4800
      5
      4
      0
      0
      11
      NaN
      36
      335431
      7397340
      40111024
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4801
      5
      4
      0
      0
      11
      NaN
      36
      335431
      7397340
      40111024
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4804
      5
      4
      1
      0
      11
      NaN
      36
      334955
      7397603
      40111064
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4805
      5
      4
      1
      0
      11
      NaN
      36
      334955
      7397603
      40111064
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4814
      5
      4
      1
      0
      11
      NaN
      36
      335675
      7397437
      40111081
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4839
      5
      4
      1
      0
      11
      NaN
      36
      335730
      7397340
      40111086
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4840
      5
      4
      1
      0
      11
      NaN
      36
      335730
      7397340
      40111086
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4843
      5
      4
      0
      0
      11
      NaN
      36
      335872
      7397009
      40111092
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4854
      5
      4
      1
      0
      11
      NaN
      36
      335753
      7397316
      40111103
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4859
      5
      4
      1
      0
      11
      NaN
      36
      335753
      7397316
      40111103
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4860
      5
      4
      1
      0
      11
      NaN
      36
      335753
      7397316
      40111103
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4861
      5
      4
      0
      0
      11
      NaN
      36
      335826
      7397243
      40111104
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4862
      5
      4
      0
      0
      11
      NaN
      36
      335952
      7397207
      40111105
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4865
      5
      4
      0
      0
      11
      NaN
      36
      335846
      7397209
      40111108
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4892
      5
      4
      1
      0
      11
      NaN
      36
      335874
      7397355
      40111121
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4893
      5
      4
      1
      0
      11
      NaN
      36
      335874
      7397355
      40111121
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4898
      5
      4
      1
      0
      11
      NaN
      36
      335733
      7397337
      40111124
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4914
      5
      4
      1
      0
      11
      NaN
      36
      335850
      7397219
      40111126
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4941
      5
      4
      1
      0
      11
      NaN
      36
      335735
      7397496
      40111161
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4956
      5
      4
      1
      0
      11
      NaN
      36
      335808
      7397246
      40111164
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4959
      5
      4
      1
      0
      11
      NaN
      36
      335848
      7397343
      40111166
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4964
      5
      4
      1
      0
      11
      NaN
      36
      335848
      7397343
      40111166
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4965
      5
      4
      1
      0
      11
      NaN
      36
      335848
      7397343
      40111166
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4970
      5
      4
      1
      0
      11
      NaN
      36
      335748
      7397321
      40111167
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
    
      4991
      5
      4
      1
      0
      11
      NaN
      36
      335794
      7397088
      40111194
      ...
      0
      0
      0
      0
      0
      0
      0
      0
      0
      0
    
  

705 rows × 91 columns

"TIPO_VIAG"; "H_SAIDA"; "MIN_SAIDA"; "ANDA_ORIG"; "H_CHEG"; "MIN_CHEG"; "ANDA_DEST" e "DURACAO"

Nada há que se fazer em relação aos dados das colunas "TIPO_VIAG"; "H_SAIDA"; "MIN_SAIDA"; "ANDA_ORIG"; "H_CHEG"; "MIN_CHEG"; "ANDA_DEST" e "DURACAO"

Passo 66: "TIPO_EST_AUTO"

Substituir valores da coluna "TIPO_EST_AUTO"

Substituir todos valores 2 por 5
Substituir todos valores 3 por 4
Substituir todos valores 4 por 3
Substituir todos valores 6 por 2
Substituir todos valores 7 por 2
Substituir todos valores 8 por 0

Categorias anteriores

Valor	Descrição
1	Não Estacionou
2	Zona Azul / Zona Marrom
3	Estacionamento Patrocinado
4	Estacionamento Próprio
5	Meio-Fio
6	Avulso
7	Mensal
8	Não Respondeu

Categorias novas

Valor	Descrição
0	Não Respondeu
1	Não Estacionou
2	Estacionamento Particular (Avulso / Mensal)
3	Estacionamento Próprio
4	Estacionamento Patrocinado
5	Rua (meio fio / zona azul / zona marrom / parquímetro)

[Teste: Checar se existe algum número < 0 ou > 5. Se encontrar, retornar erro indicando em qual linha.]



In [288]:

    
if not impressao:
    #Counting for check "TIPO_EST_AUTO"
    od2007_ex['TIPO_EST_AUTO'].value_counts()









    Out[288]:





0    4596
4     142
5      82
3      72
1      48
7      39
8      12
6       5
2       4
dtype: int64



In [289]:

    
#Replacing the values 2 for 5
od2007_ex.loc[od2007_ex['TIPO_EST_AUTO']==2,'TIPO_EST_AUTO'] = 5
#Replacing the values 3 for 4
od2007_ex.loc[od2007_ex['TIPO_EST_AUTO']==3,'TIPO_EST_AUTO'] = 4
#Replacing the values 4 for 3
od2007_ex.loc[od2007_ex['TIPO_EST_AUTO']==4,'TIPO_EST_AUTO'] = 3
#Replacing the values 6 for 2
od2007_ex.loc[od2007_ex['TIPO_EST_AUTO']==6,'TIPO_EST_AUTO'] = 2
#Replacing the values 7 for 2
od2007_ex.loc[od2007_ex['TIPO_EST_AUTO']==7,'TIPO_EST_AUTO'] = 2
#Replacing the values 8 for 0
od2007_ex.loc[od2007_ex['TIPO_EST_AUTO']==8,'TIPO_EST_AUTO'] = 0



In [290]:

    
if not impressao:
    #Counting "TIPO_EST_AUTO in order to compare the values before and after the replacement
    od2007_ex['TIPO_EST_AUTO'].value_counts()









    Out[290]:





0    4608
3     214
5      86
1      48
2      44
dtype: int64



In [291]:

    
if not impressao:
    #Verifying value interval for check - conditions: "TIPO_EST_AUTO < 0" and "TIPO_EST_AUTO > 5"
    od2007_ex[(od2007_ex['TIPO_EST_AUTO']<0) | (od2007_ex['TIPO_EST_AUTO']>5)]









    Out[291]:






  
    
      
      UCOD_DOM
      ANO
      CD_ENTRE
      DIA_SEM
      ZONA_DOM
      SUBZONA_DOM
      MUN_DOM
      CO_DOM_X
      CO_DOM_Y
      ID_DOM
      ...
      TIPO_VIAG
      H_SAIDA
      MIN_SAIDA
      ANDA_ORIG
      H_CHEG
      MIN_CHEG
      ANDA_DEST
      DURACAO
      TIPO_EST_AUTO
      VALOR_EST_AUTO
    
  
  
  

0 rows × 91 columns

"VALOR_EST_AUTO"

Nada há que se fazer em relação aos dados da coluna "VALOR_EST_AUTO"



In [ ]:

	UCOD_DOM	ANO	CD_ENTRE	DIA_SEM	ZONA_DOM	SUBZONA_DOM	MUN_DOM	CO_DOM_X	CO_DOM_Y	ID_DOM	...	TIPO_VIAG	H_SAIDA	MIN_SAIDA	ANDA_ORIG	H_CHEG	MIN_CHEG	ANDA_DEST	DURACAO	TIPO_EST_AUTO	VALOR_EST_AUTO
count	0	0	5000.000000	5000.000000	5000.000000	0	5000	5000.000000	5000.000000	5000.000000	...	5000.000000	5000.000000	5000.000000	5000.000000	5000.000000	5000.00000	5000.000000	5000.000000	5000.000000	5000.000000
mean	NaN	NaN	5.955000	3.505800	6.196600	NaN	36	333194.919400	7396076.016600	63683.969000	...	1.944200	11.159000	15.863200	1.708400	11.415000	18.36280	1.680600	24.195600	0.329800	0.961800
std	NaN	NaN	0.207325	2.022074	2.768299	NaN	0	1054.619144	1254.622705	27216.197166	...	1.152281	6.536778	18.340681	3.703473	6.613919	18.10171	3.592654	25.497462	1.212488	12.430287
min	NaN	NaN	5.000000	0.000000	1.000000	NaN	36	331372.000000	7393989.000000	10001.000000	...	0.000000	0.000000	0.000000	0.000000	0.000000	0.00000	0.000000	0.000000	0.000000	0.000000
25%	NaN	NaN	6.000000	2.000000	4.000000	NaN	36	332308.000000	7394890.000000	41447.000000	...	1.000000	7.000000	0.000000	0.000000	7.000000	0.00000	0.000000	7.000000	0.000000	0.000000
50%	NaN	NaN	6.000000	4.000000	6.000000	NaN	36	332999.500000	7396106.000000	67044.000000	...	2.000000	12.000000	0.000000	0.000000	12.000000	15.00000	0.000000	15.000000	0.000000	0.000000
75%	NaN	NaN	6.000000	5.000000	8.000000	NaN	36	333780.000000	7397231.000000	81210.000000	...	3.000000	17.000000	30.000000	1.000000	17.000000	30.00000	1.000000	30.000000	0.000000	0.000000
max	NaN	NaN	6.000000	6.000000	11.000000	NaN	36	336071.000000	7398071.000000	111201.000000	...	4.000000	23.000000	59.000000	40.000000	23.000000	58.00000	40.000000	210.000000	8.000000	500.000000

	UCOD_DOM	ANO	CD_ENTRE	DIA_SEM	ZONA_DOM	SUBZONA_DOM	MUN_DOM	CO_DOM_X	CO_DOM_Y	ID_DOM	...	TIPO_VIAG	H_SAIDA	MIN_SAIDA	ANDA_ORIG	H_CHEG	MIN_CHEG	ANDA_DEST	DURACAO	TIPO_EST_AUTO	VALOR_EST_AUTO
4	1	4	1	0	1	NaN	36	333858	7394484	10018	...	0	0	0	0	0	0	0	0	0	0
9	1	4	1	0	1	NaN	36	333801	7394422	10019	...	0	0	0	0	0	0	0	0	0	0
71	1	4	1	0	1	NaN	36	333622	7394465	11018	...	0	0	0	0	0	0	0	0	0	0
72	1	4	1	0	1	NaN	36	333622	7394465	11018	...	0	0	0	0	0	0	0	0	0	0
88	1	4	1	0	1	NaN	36	333739	7394550	11027	...	0	0	0	0	0	0	0	0	0	0
105	1	4	1	0	1	NaN	36	333683	7394479	11033	...	0	0	0	0	0	0	0	0	0	0
140	1	4	0	0	1	NaN	36	333807	7394422	11066	...	0	0	0	0	0	0	0	0	0	0
143	1	4	1	0	1	NaN	36	333800	7394465	11067	...	0	0	0	0	0	0	0	0	0	0
146	1	4	1	0	1	NaN	36	333738	7394460	11073	...	0	0	0	0	0	0	0	0	0	0
155	1	4	1	0	1	NaN	36	333739	7394550	11077	...	0	0	0	0	0	0	0	0	0	0
205	1	4	1	0	1	NaN	36	333729	7394551	11132	...	0	0	0	0	0	0	0	0	0	0
216	1	4	1	0	1	NaN	36	333739	7394550	11134	...	0	0	0	0	0	0	0	0	0	0
245	1	4	1	0	1	NaN	36	333739	7394550	11161	...	0	0	0	0	0	0	0	0	0	0
246	1	4	1	0	1	NaN	36	333739	7394550	11161	...	0	0	0	0	0	0	0	0	0	0
253	1	4	0	0	1	NaN	36	333880	7394458	11162	...	0	0	0	0	0	0	0	0	0	0
256	1	4	1	0	1	NaN	36	333728	7394534	11165	...	0	0	0	0	0	0	0	0	0	0
257	1	4	1	0	1	NaN	36	333728	7394534	11165	...	0	0	0	0	0	0	0	0	0	0
280	1	4	0	0	2	NaN	36	333721	7394629	20040	...	0	0	0	0	0	0	0	0	0	0
281	1	4	0	0	2	NaN	36	333721	7394629	20040	...	0	0	0	0	0	0	0	0	0	0
282	1	4	0	0	2	NaN	36	333721	7394629	20040	...	0	0	0	0	0	0	0	0	0	0
283	1	4	0	0	2	NaN	36	333721	7394629	20040	...	0	0	0	0	0	0	0	0	0	0
316	1	4	1	0	2	NaN	36	333593	7396032	21014	...	0	0	0	0	0	0	0	0	0	0
317	1	4	1	0	2	NaN	36	333593	7396032	21014	...	0	0	0	0	0	0	0	0	0	0
320	1	4	0	0	2	NaN	36	333573	7396022	21020	...	0	0	0	0	0	0	0	0	0	0
331	1	4	1	0	2	NaN	36	333516	7396150	21025	...	0	0	0	0	0	0	0	0	0	0
342	1	4	1	0	2	NaN	36	333413	7396177	21030	...	0	0	0	0	0	0	0	0	0	0
349	1	4	1	0	2	NaN	36	333413	7396177	21030	...	0	0	0	0	0	0	0	0	0	0
350	1	4	1	0	2	NaN	36	333413	7396177	21030	...	0	0	0	0	0	0	0	0	0	0
353	1	4	1	0	2	NaN	36	333446	7395979	21031	...	0	0	0	0	0	0	0	0	0	0
354	1	4	1	0	2	NaN	36	333446	7395979	21031	...	0	0	0	0	0	0	0	0	0	0
...	...	...	...	...	...	...	...	...	...	...	...	...	...	...	...	...	...	...	...	...	...
4779	5	4	1	0	11	NaN	36	335282	7397403	111016	...	0	0	0	0	0	0	0	0	0	0
4780	5	4	1	0	11	NaN	36	335282	7397403	111016	...	0	0	0	0	0	0	0	0	0	0
4781	5	4	1	0	11	NaN	36	335282	7397403	111016	...	0	0	0	0	0	0	0	0	0	0
4794	5	4	0	0	11	NaN	36	335108	7397559	111020	...	0	0	0	0	0	0	0	0	0	0
4795	5	4	1	0	11	NaN	36	335095	7397824	111021	...	0	0	0	0	0	0	0	0	0	0
4800	5	4	0	0	11	NaN	36	335431	7397340	111024	...	0	0	0	0	0	0	0	0	0	0
4801	5	4	0	0	11	NaN	36	335431	7397340	111024	...	0	0	0	0	0	0	0	0	0	0
4804	5	4	1	0	11	NaN	36	334955	7397603	111064	...	0	0	0	0	0	0	0	0	0	0
4805	5	4	1	0	11	NaN	36	334955	7397603	111064	...	0	0	0	0	0	0	0	0	0	0
4814	5	4	1	0	11	NaN	36	335675	7397437	111081	...	0	0	0	0	0	0	0	0	0	0
4839	5	4	1	0	11	NaN	36	335730	7397340	111086	...	0	0	0	0	0	0	0	0	0	0
4840	5	4	1	0	11	NaN	36	335730	7397340	111086	...	0	0	0	0	0	0	0	0	0	0
4843	5	4	0	0	11	NaN	36	335872	7397009	111092	...	0	0	0	0	0	0	0	0	0	0
4854	5	4	1	0	11	NaN	36	335753	7397316	111103	...	0	0	0	0	0	0	0	0	0	0
4859	5	4	1	0	11	NaN	36	335753	7397316	111103	...	0	0	0	0	0	0	0	0	0	0
4860	5	4	1	0	11	NaN	36	335753	7397316	111103	...	0	0	0	0	0	0	0	0	0	0
4861	5	4	0	0	11	NaN	36	335826	7397243	111104	...	0	0	0	0	0	0	0	0	0	0
4862	5	4	0	0	11	NaN	36	335952	7397207	111105	...	0	0	0	0	0	0	0	0	0	0
4865	5	4	0	0	11	NaN	36	335846	7397209	111108	...	0	0	0	0	0	0	0	0	0	0
4892	5	4	1	0	11	NaN	36	335874	7397355	111121	...	0	0	0	0	0	0	0	0	0	0
4893	5	4	1	0	11	NaN	36	335874	7397355	111121	...	0	0	0	0	0	0	0	0	0	0
4898	5	4	1	0	11	NaN	36	335733	7397337	111124	...	0	0	0	0	0	0	0	0	0	0
4914	5	4	1	0	11	NaN	36	335850	7397219	111126	...	0	0	0	0	0	0	0	0	0	0
4941	5	4	1	0	11	NaN	36	335735	7397496	111161	...	0	0	0	0	0	0	0	0	0	0
4956	5	4	1	0	11	NaN	36	335808	7397246	111164	...	0	0	0	0	0	0	0	0	0	0
4959	5	4	1	0	11	NaN	36	335848	7397343	111166	...	0	0	0	0	0	0	0	0	0	0
4964	5	4	1	0	11	NaN	36	335848	7397343	111166	...	0	0	0	0	0	0	0	0	0	0
4965	5	4	1	0	11	NaN	36	335848	7397343	111166	...	0	0	0	0	0	0	0	0	0	0
4970	5	4	1	0	11	NaN	36	335748	7397321	111167	...	0	0	0	0	0	0	0	0	0	0
4991	5	4	1	0	11	NaN	36	335794	7397088	111194	...	0	0	0	0	0	0	0	0	0	0

	UCOD_DOM	ANO	CD_ENTRE	DIA_SEM	ZONA_DOM	SUBZONA_DOM	MUN_DOM	CO_DOM_X	CO_DOM_Y	ID_DOM	...	TIPO_VIAG	H_SAIDA	MIN_SAIDA	ANDA_ORIG	H_CHEG	MIN_CHEG	ANDA_DEST	DURACAO	TIPO_EST_AUTO	VALOR_EST_AUTO
0	1	4	1	6	1	NaN	36	333729	7394430	40010001	...	3	8	0	0	8	10	0	10	0	0
1	1	4	1	6	1	NaN	36	333729	7394430	40010001	...	3	17	30	0	17	40	0	10	0	0
2	1	4	1	5	1	NaN	36	333858	7394484	40010018	...	1	4	30	2	5	45	2	75	0	0
3	1	4	1	5	1	NaN	36	333858	7394484	40010018	...	1	18	10	2	19	30	2	80	0	0
4	1	4	1	0	1	NaN	36	333858	7394484	40010018	...	0	0	0	0	0	0	0	0	0	0
5	1	4	1	5	1	NaN	36	333801	7394422	40010019	...	4	9	30	1	10	0	1	30	0	0
6	1	4	1	5	1	NaN	36	333801	7394422	40010019	...	4	15	0	1	15	30	1	30	0	0
7	1	4	1	5	1	NaN	36	333801	7394422	40010019	...	4	18	30	1	19	0	1	30	0	0
8	1	4	1	5	1	NaN	36	333801	7394422	40010019	...	4	23	45	1	0	15	1	30	0	0
9	1	4	1	0	1	NaN	36	333801	7394422	40010019	...	0	0	0	0	0	0	0	0	0	0
16	1	4	1	6	1	NaN	36	333819	7394525	40010024	...	3	22	0	0	22	10	0	10	0	0
17	1	4	1	6	1	NaN	36	333819	7394525	40010024	...	3	16	0	0	16	10	0	10	0	0
18	1	4	1	6	1	NaN	36	333819	7394525	40010024	...	3	18	0	0	18	10	0	10	0	0
19	1	4	1	2	1	NaN	36	333738	7394460	40010032	...	3	11	45	0	12	5	0	20	0	0
20	1	4	1	2	1	NaN	36	333738	7394460	40010032	...	3	12	40	0	12	50	0	10	0	0
21	1	4	1	2	1	NaN	36	333738	7394460	40010032	...	3	13	0	0	13	20	0	20	0	0
22	1	4	1	2	1	NaN	36	333738	7394460	40010032	...	3	14	15	0	14	40	0	25	0	0
23	1	4	1	2	1	NaN	36	333738	7394460	40010032	...	1	18	0	10	18	25	10	25	0	0
24	1	4	1	3	1	NaN	36	333739	7394550	40010042	...	3	10	0	0	10	15	0	15	0	0
25	1	4	1	3	1	NaN	36	333739	7394550	40010042	...	3	11	30	0	11	45	0	15	0	0
26	1	4	1	3	1	NaN	36	333739	7394550	40010042	...	1	8	0	10	8	30	5	30	0	0
27	1	4	1	3	1	NaN	36	333739	7394550	40010042	...	1	10	0	20	10	40	10	40	0	0
28	1	4	1	3	1	NaN	36	333739	7394550	40010042	...	1	11	45	10	14	30	10	165	0	0
29	1	4	1	3	1	NaN	36	333739	7394550	40010042	...	3	18	0	0	18	10	0	10	0	0
30	1	4	1	3	1	NaN	36	333739	7394550	40010042	...	3	18	50	0	19	5	0	15	0	0
31	1	4	1	3	1	NaN	36	333840	7394468	40010047	...	2	7	30	1	7	45	1	15	0	0
32	1	4	1	3	1	NaN	36	333840	7394468	40010047	...	1	10	40	15	11	30	1	50	0	0
33	1	4	1	3	1	NaN	36	333840	7394468	40010047	...	2	12	10	0	12	45	0	35	0	0
48	1	4	1	6	1	NaN	36	333738	7394460	40011003	...	1	7	30	10	8	30	5	60	0	0
49	1	4	1	6	1	NaN	36	333738	7394460	40011003	...	1	10	0	10	10	20	5	20	0	0
...	...	...	...	...	...	...	...	...	...	...	...	...	...	...	...	...	...	...	...	...	...
4952	5	4	1	6	11	NaN	36	335808	7397246	40111164	...	1	7	0	5	7	50	5	50	0	0
4953	5	4	1	6	11	NaN	36	335808	7397246	40111164	...	1	17	20	5	19	0	3	100	0	0
4956	5	4	1	0	11	NaN	36	335808	7397246	40111164	...	0	0	0	0	0	0	0	0	0	0
4957	5	4	1	3	11	NaN	36	335848	7397343	40111166	...	3	14	0	15	14	25	0	25	0	0
4958	5	4	1	3	11	NaN	36	335848	7397343	40111166	...	3	16	0	15	16	25	0	25	0	0
4959	5	4	1	0	11	NaN	36	335848	7397343	40111166	...	0	0	0	0	0	0	0	0	0	0
4964	5	4	1	0	11	NaN	36	335848	7397343	40111166	...	0	0	0	0	0	0	0	0	0	0
4965	5	4	1	0	11	NaN	36	335848	7397343	40111166	...	0	0	0	0	0	0	0	0	0	0
4966	5	4	1	3	11	NaN	36	335748	7397321	40111167	...	2	8	0	0	8	20	0	20	0	0
4967	5	4	1	3	11	NaN	36	335748	7397321	40111167	...	2	11	40	0	12	0	0	20	0	0
4968	5	4	1	3	11	NaN	36	335748	7397321	40111167	...	2	8	0	0	8	20	0	20	0	0
4969	5	4	1	3	11	NaN	36	335748	7397321	40111167	...	2	11	40	0	12	0	0	20	0	0
4970	5	4	1	0	11	NaN	36	335748	7397321	40111167	...	0	0	0	0	0	0	0	0	0	0
4971	5	4	1	5	11	NaN	36	336005	7397304	40111171	...	2	6	30	0	7	0	0	30	8	0
4972	5	4	1	5	11	NaN	36	336005	7397304	40111171	...	2	19	0	0	19	40	0	40	8	0
4973	5	4	1	5	11	NaN	36	336005	7397304	40111171	...	3	7	30	0	7	50	0	20	0	0
4974	5	4	1	5	11	NaN	36	336005	7397304	40111171	...	3	8	0	0	8	30	0	30	0	0
4975	5	4	1	5	11	NaN	36	336005	7397304	40111171	...	3	15	30	0	15	50	0	20	0	0
4976	5	4	1	5	11	NaN	36	336005	7397304	40111171	...	3	16	0	0	16	30	0	30	0	0
4981	5	4	1	5	11	NaN	36	335786	7397283	40111172	...	3	10	0	0	10	30	0	30	0	0
4982	5	4	1	5	11	NaN	36	335786	7397283	40111172	...	3	11	30	0	12	0	0	30	0	0
4983	5	4	1	5	11	NaN	36	335786	7397283	40111172	...	3	11	45	0	12	15	0	30	0	0
4984	5	4	1	5	11	NaN	36	335786	7397283	40111172	...	3	14	0	0	14	30	0	30	0	0
4989	5	4	1	2	11	NaN	36	335794	7397088	40111194	...	1	7	0	1	7	20	10	20	0	0
4990	5	4	1	2	11	NaN	36	335794	7397088	40111194	...	1	17	0	10	17	30	3	30	0	0
4991	5	4	1	0	11	NaN	36	335794	7397088	40111194	...	0	0	0	0	0	0	0	0	0	0
4996	5	4	1	2	11	NaN	36	335794	7397088	40111194	...	1	6	25	1	8	15	10	110	0	0
4997	5	4	1	2	11	NaN	36	335794	7397088	40111194	...	1	17	30	10	19	35	5	125	0	0
4998	5	4	1	2	11	NaN	36	335885	7397331	40111201	...	3	8	0	0	8	20	0	20	0	0
4999	5	4	1	2	11	NaN	36	335885	7397331	40111201	...	3	11	30	0	12	10	0	40	0	0