In [1]:
import pandas

In [2]:
df = pandas.read_csv("./Cluster-Crime-Janeiro.csv")

In [4]:
de = df['NATUREZA DA OCORRÊNCIA'].groupby(df['CLUSTER']).describe()

In [5]:
df['NATUREZA DA OCORRÊNCIA'].describe()


Out[5]:
count                    542
unique                   145
top       VEÍCULO LOCALIZADO
freq                     194
Name: NATUREZA DA OCORRÊNCIA, dtype: object

In [6]:
de


Out[6]:
count unique top freq
CLUSTER
-1 233 85 VEÍCULO LOCALIZADO 81
0 8 5 VEÍCULO LOCALIZADO 4
1 22 10 VEÍCULO LOCALIZADO 8
2 7 7 CRIME CONTRA A ADMINISTRAÇÃO PÚBLICA (T.C.O.) 1
3 18 11 VEÍCULO LOCALIZADO 7
4 63 23 VEÍCULO LOCALIZADO 25
5 6 4 VEÍCULO LOCALIZADO 3
6 5 4 TRÁFICO DE ENTORPECENTES 2
7 6 4 VEÍCULO LOCALIZADO 3
8 7 3 VEÍCULO LOCALIZADO 5
9 14 6 VEÍCULO LOCALIZADO 6
10 22 14 MORTE A BALA 4
11 12 7 VEÍCULO LOCALIZADO 6
12 6 4 VEÍCULO LOCALIZADO 3
13 5 2 VEÍCULO LOCALIZADO 4
14 13 8 VEÍCULO LOCALIZADO 5
15 6 3 VEÍCULO LOCALIZADO 3
16 15 8 VEÍCULO LOCALIZADO 5
17 5 4 VEÍCULO LOCALIZADO 2
18 8 6 MORTE A BALA 2
19 6 5 VEÍCULO LOCALIZADO 2
20 9 5 VEÍCULO LOCALIZADO 5
21 6 5 VEÍCULO LOCALIZADO 2
22 10 6 VEÍCULO LOCALIZADO 5
23 6 3 TRÁFICO DE ENTORPECENTES 4
24 8 8 PORTE ILEGAL DE ARMA (ATO INFRACIONAL/FLAGRANTE) 1
25 5 5 PERTURBAÇÃO AO SOSSEGO ALHEIO - EM CARRO (T.C.O.) 1
26 6 3 MORTE A BALA 4
27 5 5 MORTE A BALA 1

In [7]:
new_df = df.groupby('CLUSTER')

In [8]:
crimes = new_df['NATUREZA DA OCORRÊNCIA'].count()

In [9]:
import matplotlib.pyplot as plt
import numpy as np
import matplotlib.ticker as ticker

In [12]:
crimes.plot(kind='barh', figsize=(10,8), color='#cc0000')
plt.title('Crimes Number (Jan 2017)')
plt.xlabel('Number')
plt.ylabel('Cluster - Região')
plt.tight_layout()
ax = plt.gca()
ax.xaxis.set_major_formatter(ticker.StrMethodFormatter('{x:,.0f}'))
plt.show()



In [10]:



Out[10]:
CLUSTER
-1     233
 0       8
 1      22
 2       7
 3      18
 4      63
 5       6
 6       5
 7       6
 8       7
 9      14
 10     22
 11     12
 12      6
 13      5
 14     13
 15      6
 16     15
 17      5
 18      8
 19      6
 20      9
 21      6
 22     10
 23      6
 24      8
 25      5
 26      6
 27      5
Name: NATUREZA DA OCORRÊNCIA, dtype: int64

In [ ]: