In [1]:
import pandas as pd
import numpy as np

import matplotlib.pyplot as plt
from matplotlib.finance import candlestick_ohlc
import seaborn as sns
sns.set_style('whitegrid')
%matplotlib inline

DS de Datamining

Vous allez réaliser une étude de données sur les élections régionales de 2015 et le vote FN (LFN) au 1er tour).

Vous devez m'envoyer par mail à arm.gilles@gmail.com le résultat (votre fichier .ipynb) sous la forme de nom_prenom.ipynb avant la fin de l'examen.

Exemple : Pierre ROLAND --> pierre_roland.ipynb

Le fichier à analyser est dans le répertoire data sous le nom de regionnal_2015.csv

1. Charges le fichier et afficher les 5 premières lignes :


In [ ]:

2. Quelles est le nombre de ligne et colonnes de se fichier ?


In [ ]:

3. Y'a t'il des données absente dans le fichiers ? Si oui combien ?


In [ ]:

4. Quelle est la commune qui à le plus de personnes qui n'ont pas voté ?


In [ ]:

5. Quelle est la commune qui à suivant le ratio d'abstentions le plus fort (selon les nombre d'inscrit)


In [ ]:

6. Quelle est la commune qui à le plus voter FN avec une population supérieur ou égal à 8000.


In [ ]:

7. calculer le % de vote FN par rapport au nombre de votant


In [ ]:

8. Le pourcentage du vote FN à Bordeaux :


In [ ]:

9. Quelle est la moyenne de % de vote FN par région (trié du plus fort ou moins fort) :


In [ ]:

10. Montrez si il existe une relation entre le % de vote FN et le % d'absetention :£


In [ ]:

11. Montrer la relation entre le nombre d'inscrit et le nombre de vote FN pour certaines régions :

Utilisation de graphiques recommandés

Région : PROVENCE-ALPES-COTE D'AZUR


In [ ]:

Région : AQUITAINE


In [ ]:

12 Comparer & analyser ces 2 régions (Aquitaine et Provence Alpes-cote d'azur)

L'analyse est ouverte ici, il n'y a pas de bonnes ou mauvaises réponses. Votre méthodologie d'analyse sera notée ainsi que votre faculté à communiquer de façon simple et précises vos résultats.


In [ ]:


In [ ]:


In [ ]:


In [ ]: