In [1]:
import pandas as pd
import re

In [3]:
df = pd.read_csv("data/20140315_PAP-2008-2013.csv", encoding='utf-8')
df["PAP ACCORDE"] = df["PAP ACCORDE"].apply(lambda x : re.sub('[^0-9\.]', '', str(x))).apply(lambda x : 0 if x == '' else x).astype('float')*1.0
#df["pays"] = df["pays"].apply(lambda x : u"ÉTATS-UNIS" if x == u"ÉTATS-UNIS " else u"RÉPUBLIQUE TCHÈQUE" if x == u"RÉP. TCHÈQUE" else x)
#df.to_csv("data/20140315_PAP-2008-2013.new.csv", index=False, encoding='utf-8')
df['PAP ACCORDE'].sum()


Out[3]:
2624449.4699999997

In [4]:
PapParPays = df[["pays","PAP ACCORDE"]].groupby('pays').sum().sort('PAP ACCORDE', ascending=False)
#PapParPays

In [5]:
pays2iso = pd.read_csv("data/pays2iso.csv", encoding='utf-8', squeeze=False)
pays2iso.index = pays2iso['pays']
pays2iso = pays2iso['iso']
pays2iso


Out[5]:
pays
ESPAGNE               ES
ARGENTINE             AR
RUSSIE                RU
CHINE                 CN
ÉTATS-UNIS            US
BRÉSIL                BR
POLOGNE               PL
LIBAN                 LB
PORTUGAL              PT
RÉPUBLIQUE TCHÈQUE    CZ
GRÈCE                 GR
ROUMANIE              RO
HONGRIE               HU
JAPON                 JP
CROATIE               HR
...
INDONÉSIE    ID
NICARAGUA    NI
NORVÈGE      NO
MACÉDOINE    MK
ÉGYPTE       EG
COLOMBIE     CO
CHILI        CL
SUISSE       CH
CAMBODGE     KH
ÉTHIOPIE     ET
SLOVAQUIE    SK
MONGOLIE     MN
URUGUAY      UY
SYRIE        SY
CAMEROUN     CM
Name: iso, Length: 63, dtype: object

In [6]:
PapParPays['iso'] = pays2iso[PapParPays.index]

In [7]:
PapParPays


Out[7]:
PAP ACCORDE iso
pays
ESPAGNE 198216.67 ES
ARGENTINE 149934.00 AR
RUSSIE 140437.00 RU
CHINE 138630.00 CN
ÉTATS-UNIS 135883.21 US
BRÉSIL 132186.00 BR
POLOGNE 128594.00 PL
LIBAN 100008.00 LB
PORTUGAL 96396.00 PT
RÉPUBLIQUE TCHÈQUE 88448.80 CZ
GRÈCE 78740.00 GR
ROUMANIE 73655.05 RO
HONGRIE 68512.84 HU
JAPON 62014.50 JP
CROATIE 60760.00 HR
DANEMARK 58585.00 DK
VIETNAM 55955.00 VN
AUTRICHE 52470.00 AT
ISRAËL 50012.00 IL
ITALIE 47790.00 IT
SERBIE 46435.00 RS
CORÉE DU SUD 44268.00 KR
ALLEMAGNE 44190.00 DE
SLOVÉNIE 40814.00 SI
ALGÉRIE 38979.00 DZ
BULGARIE 38645.00 BG
MEXIQUE 35960.00 MX
MAROC 31137.40 MA
LITUANIE 30937.00 LT
FINLANDE 30900.00 FI
GÉORGIE 30025.20 GE
ESTONIE 28072.00 EE
UKRAINE 27420.00 UA
IRAN 24364.00 IR
CANADA 22175.00 CA
TAIWAN 20427.00 TW
INDE 20235.00 IN
LETTONIE 18250.00 LV
TURQUIE 18205.00 TR
VENEZUELA 15565.00 BE
BIÉLORUSSIE 15450.00 BY
TUNISIE 12800.00 TN
MOLDAVIE 12020.00 MD
ALBANIE 9785.00 AL
coédition régionale Amérique latine 8350.00 XX
ISLANDE 8000.00 FK
AFRIQUE DU SUD 5720.00 ZA
ARMÉNIE 4428.00 AM
INDONÉSIE 3567.80 ID
NICARAGUA 2900.00 NI
CAMEROUN 2000.00 CM
NORVÈGE 2000.00 NO
MACÉDOINE 1950.00 MK
ÉGYPTE 1850.00 EG
COLOMBIE 1700.00 CO
CHILI 1500.00 CL
SUISSE 1500.00 CH
CAMBODGE 1463.00 KH
ÉTHIOPIE 1200.00 ET
SLOVAQUIE 630.00 SK
... ...

63 rows × 2 columns


In [8]:
PapParPays.to_csv("data/par_pays.csv", encoding='utf-8')

In [ ]: