ISWC from SACEM website

ISWC extracted from SACEM website, which is annoying to browse.


In [1]:
import re
import requests
import bs4

In [2]:
resp = requests.request(
    'GET', 
    'https://sigried.sacem.fr/oeuvres/oeuvre/rechercheOeuvre.do?'
    'titre=&tiers=Claude+DEBUSSY&searchoption=default&ftad=true&page=1')

In [3]:
soup = bs4.BeautifulSoup(resp.content, 'html.parser')
dt = soup.find_all('dt')
dd = soup.find_all('dd')
for idx, (t, d) in enumerate(zip(dt, dd)):
    if 'Arrangeur' not in d.get_text():
        print(t.div.a.span.string)
        print(d.find_all('span')[-1].string)
        print('https://sigried.sacem.fr/oeuvres/oeuvre/printOeuvre.do?cocv='
              + re.match(r'javascript:getDetail\((.*)\);', 
                         t.div.a.get('href')).group(1))
        print()


BEAU SOIR
T-004.011.955.8
https://sigried.sacem.fr/oeuvres/oeuvre/printOeuvre.do?cocv=6089548011

CLOCHES
T-004.013.769.6
https://sigried.sacem.fr/oeuvres/oeuvre/printOeuvre.do?cocv=6203136011

ROMANCE
T-004.023.344.0
https://sigried.sacem.fr/oeuvres/oeuvre/printOeuvre.do?cocv=6787093211

PELLEAS ET MELISANDE
T-003.013.803.4
https://sigried.sacem.fr/oeuvres/oeuvre/printOeuvre.do?cocv=6684168011

MARTYRE DE ST SEBASTIEN
T-900.758.995.9
https://sigried.sacem.fr/oeuvres/oeuvre/printOeuvre.do?cocv=6563414011

AIMONS NOUS ET DORMONS
T-004.032.977.8
https://sigried.sacem.fr/oeuvres/oeuvre/printOeuvre.do?cocv=7602069411

ROMANCE
T-004.039.887.5
https://sigried.sacem.fr/oeuvres/oeuvre/printOeuvre.do?cocv=7815423011