In [ ]:
import pandas as pd
In [1]:
import pandas as pd
import pandas as pd
df = pd.read_csv('/home/anderson/Desktop/Sao-Paulo-Crime-Study/output.csv', encoding = 'latin1')
In [2]:
df.head()
Out[2]:
In [3]:
#Verificando tipo dados das colunas
df.info()
In [ ]:
In [5]:
df['HORA_OCORRENCIA_BO'].value_counts()
Out[5]:
In [6]:
#Sera que temos boletins inclusive desse ano ?
df['ANO_BO'].max()
Out[6]:
In [22]:
#Verificando variáveis que podem conter tipos de crimes
df['RUBRICA'].value_counts()
Out[22]:
In [8]:
#Excelente, vamos quer quantos tipos de crimes diferentes temos aqui registrados :
df['RUBRICA'].nunique()
Out[8]:
In [12]:
df['DATA_OCORRENCIA_BO'].value_counts()
Out[12]:
In [14]:
df['DATA_OCORRENCIA_BO'] = pd.to_datetime(df['DATA_OCORRENCIA_BO'])
In [17]:
df['dia_da_semana'] = df['DATA_OCORRENCIA_BO'].dt.weekday_name
In [50]:
import matplotlib.pyplot as plt
import seaborn as sns
sns.set_style('darkgrid')
In [51]:
semana = pd.DataFrame(df['dia_da_semana'].value_counts())
In [52]:
semana.plot(title = 'Distribuição dos Crimes por dia da Semana' , kind='barh',color = 'red', use_index=True, legend=True, sort_columns=True)
Out[52]:
In [53]:
df['mes'] = df['DATA_OCORRENCIA_BO'].dt.month
In [54]:
mes = pd.DataFrame(df['mes'].value_counts())
mes.head()
Out[54]:
In [55]:
mes['numero de crimes'] = mes.index
mes.head()
Out[55]:
In [57]:
mes.plot(title = 'Distribuição dos Crimes por dia mês' , kind='barh',color = 'blue', use_index=True, legend=True, sort_columns=True)
Out[57]:
In [66]:
top_10_horario_crimes = pd.DataFrame(df['HORA_OCORRENCIA_BO'].value_counts().head(10))
top_10_horario_crimes
Out[66]:
In [68]:
top_10_horario_crimes.plot(title = 'Top 10 de horarios de maior ocorrencia de crimes' , kind='barh',color = 'purple', use_index=True, legend=False, sort_columns=True)
Out[68]:
In [71]:
df['CIDADE'].value_counts()
Out[71]:
In [72]:
df['LOGRADOURO'].value_counts()
Out[72]:
In [24]:
df['DESCR_TIPOLOCAL'].value_counts()
Out[24]:
In [13]:
#E agora vamos ver quais são
df['RUBRICA'].unique()
Out[13]:
In [73]:
df['FLAG_VITIMA_FATAL'].value_counts()
Out[73]:
In [77]:
homicidios_qualificados = df[df['RUBRICA']=='HomicÃ\xaddio qualificado (art. 121, §2o.)']
In [78]:
homicidios_qualificados['LOGRADOURO'].value_counts()
Out[78]:
In [ ]:
In [ ]:
In [ ]:
In [ ]: