Antes de começar, você precisa instalar o pacote Anaconda Python que pode ser baixado gratuitamente no site da Continuum. Lá vão estar todas as instruções para se instalar o pacote em qualquer sistema operacional.
O primeiro passo para começar a brincar com os dados é baixá-los no site do INEP. Depois, basta descompacta-los em uma pasta qualquer. Lembre-se que o endereço para essa pasta é importante, porque você precisa indica-lo no código.
Nesse exemplo, eu uso uma biblioteca chamada pandas e considero que o arquivo descompactado chama-se "dados.csv". Nesse primeiro bloco eu importo a biblioteca e leio o arquivo descompactado através da função read_csv
.
In [1]:
import pandas
enem2014 = pandas.read_csv("dados.csv")
Agora vamos imprimir as 5 primeiras linhas do arquivo. Note que, como esse arquivo possui muitas colunas, o resultado fica resumido. De qualquer forma, é possível acessar todas as colunas.
In [2]:
enem2014.head(n=5)
Out[2]:
Nesse próximo bloco, eu quero imprimir apenas os municípios do estado de São Paulo:
In [3]:
enem2014[enem2014.UF_RESIDENCIA=='SP'].NO_MUNICIPIO_RESIDENCIA
Out[3]:
In [ ]: