In [1]:
import sys
sys.path.append('../')
from src.posprocessamento.pca import escolas_2013_pos_pca, escolas_2013_pd, colunas_questoes, fitted_pca

In [2]:
%matplotlib inline
import matplotlib.pyplot as plt

In [3]:
escolas_2013_pd.reset_index(drop=True, inplace=True)

In [4]:
indices_grupos = {}
indices_grupos[1] = escolas_2013_pd[escolas_2013_pd.NIVEL_SOCIO_ECONOMICO == 'Grupo 1'].index.values
indices_grupos[2] = escolas_2013_pd[escolas_2013_pd.NIVEL_SOCIO_ECONOMICO == 'Grupo 2'].index.values
indices_grupos[3] = escolas_2013_pd[escolas_2013_pd.NIVEL_SOCIO_ECONOMICO == 'Grupo 3'].index.values
indices_grupos[4] = escolas_2013_pd[escolas_2013_pd.NIVEL_SOCIO_ECONOMICO == 'Grupo 4'].index.values
indices_grupos[5] = escolas_2013_pd[escolas_2013_pd.NIVEL_SOCIO_ECONOMICO == 'Grupo 5'].index.values
indices_grupos[6] = escolas_2013_pd[escolas_2013_pd.NIVEL_SOCIO_ECONOMICO == 'Grupo 6'].index.values
indices_grupos[7] = escolas_2013_pd[escolas_2013_pd.NIVEL_SOCIO_ECONOMICO == 'Grupo 7'].index.values

In [5]:
color_increment = 1.0 / 7.0
colors = [str(i*color_increment) for i in range(1, 8)]

In [10]:
for i in range(1, 8):
    rows = indices_grupos[i]
    plt.scatter(escolas_2013_pos_pca[rows, 0], escolas_2013_pos_pca[rows, 1], c=colors[i-1])
    plt.xlim(-20, 10)
    plt.ylim(-10, 10)
    plt.show()



In [7]:
sorted(fitted_pca.components_[1])


Out[7]:
[-0.32944936801933694,
 -0.32109604518561019,
 -0.29754797303538433,
 -0.21218778366543714,
 -0.21194934879110697,
 -0.20708110042129005,
 -0.2033555895256226,
 -0.19750936881057965,
 -0.17356323276354968,
 -0.15458329350021885,
 -0.11662594646115583,
 -0.10397297081395716,
 -0.039755622460747091,
 -0.033334861345016516,
 -0.025208191150867153,
 -0.0098855661292279948,
 -0.0070017785945578441,
 -0.0031778807015888527,
 0.01107069132667431,
 0.014362386262719308,
 0.017350683280759737,
 0.018629670496993805,
 0.022940025939355721,
 0.023242833163569343,
 0.033599032826255815,
 0.043304894687351381,
 0.046349427494032786,
 0.050964603983071205,
 0.056985705305565154,
 0.059120734378122181,
 0.059523839989834938,
 0.061230045954901974,
 0.062270791623494151,
 0.064370371927280776,
 0.064970437066856471,
 0.077509352581144247,
 0.077869231223014479,
 0.11017039355708842,
 0.12247207872892148,
 0.12379656795455407,
 0.12668313954786792,
 0.12715921174316278,
 0.12916872472949703,
 0.13045812805525253,
 0.1356802865309655,
 0.1361661136566579,
 0.14033081392166652,
 0.16144141033742349,
 0.16505110567955764,
 0.17601937948326341,
 0.18288641619600321,
 0.18802536838370013,
 0.19610931411031271]

In [11]:
from src.posprocessamento.pca import colunas_questoes
colunas_questoes[[i[0] for i in sorted(enumerate(fitted_pca.components_[0]), key=lambda x:x[1])][0:10]]


Out[11]:
array(['Q_RECURSOS_SALA_DE_MUSICA', 'Q_RECURSOS_SALA_DE_ARTES_PLASTICAS',
       'Q_INFRA_TELHADO', 'Q_INFRA_PAREDES', 'Q_RECURSOS_AUDITORIO',
       'Q_BIBLIOTECA_BRINQUEDOTECA', 'Q_RECURSOS_MIMEOGRAFO',
       'Q_RECURSOS_LABORATORIO_CIENCIA', 'Q_INFRA_SALAS_DE_AULA',
       'Q_INFRA_PISO'], dtype=object)

In [12]:
from src.posprocessamento.pca import colunas_questoes
colunas_questoes[[i[0] for i in sorted(enumerate(fitted_pca.components_[1]), key=lambda x:x[1])][0:10]]


Out[12]:
array(['Q_BIBLIOTECA_ALUNOS_PODEM_LEVAR_LIVROS',
       'Q_BIBLIOTECA_PROFESSORES_PODEM_LEVAR_LIVROS',
       'Q_BIBLIOTECA_COMUNIDADE_PODE_LEVAR_LIVROS',
       'Q_BIBLIOTECA_PESSOA_NO_ATENDIMENTO',
       'Q_BIBLIOTECA_ABERTA_A_COMUNIDADE',
       'Q_BIBLIOTECA_ACERVO_DIVERSIFICADO', 'Q_RECURSOS_BIBLIOTECA',
       'Q_BIBLIOTECA_LIVROS_PODEM_SER_EMPRESTADOS',
       'Q_BIBLIOTECA_ESPACO_AREJADO_E_ILUMINADO',
       'Q_BIBLIOTECA_ESPACO_DE_ESTUDOS_COLETIVO'], dtype=object)