notebook.community

Edit and run



In [14]:

    
#given a playlist id from Beats, generate track IDs.  Output of list of track IDs will go to Beats2EchoNest.py.  setlist runs Beats2EchoNest, EN_id2summary, Distance Matrix, Thresholding

import requests
import json
from json import load
from pprint import pprint 
import urllib2
from urllib2 import urlopen
import pandas as pd
from pandas import *
import numpy as np
from numpy import *
import urllib
import scipy
from scipy import *
from scipy.spatial.distance import pdist, wminkowski, squareform
import matplotlib.pyplot as plt
import prettyplotlib as ppl
import networkx as nx
from networkx.algorithms.traversal.depth_first_search import dfs_tree
from collections import defaultdict
from operator import itemgetter
import random

def setlist(beats_playlist):
    
    track_id = beatspl2tracks(beats_playlist)
    #print track_id
    
    EN_id_list = beats2echonest(track_id)
    #print EN_id_list
    
    songdatalist, dist_matrix, playlist= EN_id2summary(filename, EN_id_list)
    #print summarydf
    
    
    UTlist, orderlist = DiGraph(songdatalist, dist_matrix, playlist)
    
    
    
    
    
#--------------------------------------------------------------------
def beatspl2tracks(beats_playlist):
    
    access_token = '?access_token=hr9fk9dftzuzmpnsutqmq95a'
    client_id = '&client_id=cu4dweftqe5nt2wcpukcvgqu'
    
    url = 'https://partner.api.beatsmusic.com/v1/api/playlists/' + beats_playlist + access_token
    response = requests.get(url)
    json_obj = json.loads(response.text)
    pprint(json_obj)
    datum = json_obj['data']['refs']['tracks']
    
    track_id = []
    
    for song in datum:
        t = song['id']
        track_id.append(t.encode('utf-8'))
    
    return track_id

#--------------------------------------------------------------------
def beats2echonest(track_id):
    beats_url = 'https://partner.api.beatsmusic.com/v1/api/tracks/'

    #initialize list of identifier dicts
    identifier = []
    EN_id_list = []
    
    for tracks in track_id:
        beats_url = 'https://partner.api.beatsmusic.com/v1/api/tracks/'
        #print tracks
        query = tracks + "?"
        client_id = 'client_id=cu4dweftqe5nt2wcpukcvgqu'
        beats_url = beats_url + query + client_id
        #print beats_url
        
        response = requests.get(beats_url)
        json_obj = json.loads(response.text)
     
            
        trackname = json_obj['data']['title'].encode('utf-8')
        artist = json_obj['data']['artist_display_name'].encode('utf-8')
        duration = json_obj['data']['duration']
        min_duration = int(duration)*0.95
        max_duration = int(duration)*1.05
        
        tidentifier = {'artist':artist,'title':trackname, 'max_duration':max_duration, 'min_duration':min_duration}
        tidentifier = urllib.urlencode(tidentifier)
        identifier.append(tidentifier)
    
    #search for track in Echonest
    EN_id = []
    
    for codes in identifier:
        #print tracks
        apikey = 'W89S7QJCCHFARWJGD'
        jsonformat = '&format=json&results=1&'
        summary_request = '&bucket=audio_summary'
        
        url ='http://developer.echonest.com/api/v4/song/search?api_key=' + apikey + jsonformat + codes+  summary_request        
        

        response = urllib2.urlopen(url)

        json_obj = json.load(response)
        if len(json_obj['response']['songs'])==0:
            continue
            #EN_id = ' '
        else:
            EN_id = json_obj['response']['songs'][0]['id']
        EN_id_list.append(EN_id.encode('utf-8'))
    
    
    return EN_id_list
#--------------------------------------------------------------------



def EN_id2summary(filename, EN_id_list):
    #set up dataframe for collection
    df = pd.DataFrame({'artist': [], 'track_id':[], 'song':[],'key':[], 'tempo':[], 'energy':[], 'liveness':[], 'analysis_url':[], 'speechiness':[], 'acousticness':[], 'danceability':[], 'time_signature':[], 'duration':[], 'loudness':[], 'valence':[], 'mode':[]})

    columns = ['artist','track_id','song','key', 'tempo', 'energy', 'liveness', 'analysis_url', 'speechiness', 'acousticness', 'danceability', 'time_signature', 'duration', 'loudness', 'valence', 'mode']
    playlist = []
    
    for song in EN_id_list:
        if song == " ":
            tempdf = pd.DataFrame([(" "," "," "," "," "," "," "," "," "," "," "," "," "," "," "," ")], index = [0], columns = columns)
        else:
            apikey = 'W89S7QJCCHFARWJGD'
            jsonformat = '&format=json&results=1&'
            summary_request = '&bucket=audio_summary'
            id_url = 'id=' + str(song)
            
            url ='http://developer.echonest.com/api/v4/song/profile?api_key=' + apikey + jsonformat + id_url+  summary_request        
            response = urllib2.urlopen(url)
            json_obj = json.load(response)
        
            EN_id = json_obj['response']['songs'][0]['id']
        
            tempdict = json_obj['response']['songs'][0]['audio_summary']
            tempdf = pd.DataFrame(tempdict, index = [1])

            tempdf['artist']= json_obj['response']['songs'][0]['artist_id']
            tempdf['track_id']= json_obj['response']['songs'][0]['id']
            tempdf['song']=json_obj['response']['songs'][0]['title']
            playlist.append(json_obj['response']['songs'][0]['title'])
    
        df = df.append(tempdf, ignore_index = True)
        

    summarydf = pd.DataFrame(df, columns = columns)

    songdatalist = []

    #convert to list of rows (list of lists)
    for i in summarydf.index:
        row = summarydf.ix[i]
        
        rowlist = []
        
        if row['tempo'] == " ":
            rowlist = [" "," "," "," "," "," ", " "]
        else:
            rowlist = [row ['song'], row['track_id'], row['tempo'],row['energy'],row['danceability'],row['loudness'],row['valence']]#track_id
            #print rowlist
            
        songdatalist.append(rowlist)


    ranges = zip(*songdatalist)[2:]
    #print ranges
    minimum = map(min, ranges)
    maximum = map(max, ranges)
    rangemap = [m-n for m,n in zip( maximum, minimum)]
    
    weights = [float(1/r) for r in rangemap]
    
    X = np.array(songdatalist)
    
    X1 = X[:, 2:]
    #print X1
    
    distances = pdist(X1, wminkowski, 2, weights)
    dist_matrix= squareform(distances)
    #print dist_matrix
    
    distancelist = []
    for index in range(0, len(dist_matrix)):
        distancelist.append(dist_matrix[index])

    transformed = np.array(distancelist)

    fig, ax = ppl.subplots(1)

    ppl.pcolormesh(fig, ax, transformed)
    fig.savefig(str(filename))
    
    return songdatalist, dist_matrix, playlist


#------------------------------------------------------------------------------

def DiGraph(songdatalist, dist_matrix, playlist):
    

    #convert to dataframe with trackIDs as columns
    columns = ['a','b','c','d','e','f','g','h','i','k','j','l','m','n','o','p','q','r']
    df = pd.DataFrame(dist_matrix, index = playlist, columns = playlist)
    #print df
    
    index = 0
    row = 2
    
    tups = []
    cols = columns
    
    #put distance matrix into list of lists [[track1, track2, weight],...] for depth first search
    for index1, rows in enumerate(df):
        for index, cols in enumerate(df):
            mytups = [df.index[index1], df.columns[index], df.ix[index1][index]]
            tups.append(mytups)
    #transform weights to create a higher penalty for higher weights

    scores = []
    
    for item in tups:
        scores.append(item[2])
    
    scores = sorted(scores, reverse=True)
    
    average_score = sum(scores)/float(len(scores))    

    for worst in scores:
        for tup in tups:
            if tup[2] == 0:
                tups.remove(tup)

    shuffleweight=[]
    mintup = 5
    maxtup = 0
    
    for tup in tups:
        if tup[0] != tup[1]:
            shuffleweight.append(tup[2])  #add a weight to the shuffle collection
            if tup[2] < mintup:   #find the minimum weight in the whole graph
                mintup = tup[2]
            if tup[2] > maxtup:   #find the maximum weight in the whole graph
                maxtup = tup[2]

    shufflerange = maxtup - mintup
    # get an idea of the distribution of transition scores
    
    '''show histogram of 
    plt.hist(p, bins = 20, cumulative=True)
    plt.show()
    '''
    
    #prune edges from graph by removing lists in the edges list
    for worst in scores:
        for tup in tups:
            if tup[2] >= average_score:
                tups.remove(tup)
            if tup[2] == 1:
                tups.remove(tup)
                
    tups_weights = []  #get weights of all kept tups for shuffle validation
    for tup in tups:
        tups_weights.append(tup[2])
    
    DG=nx.DiGraph()
    DG.add_weighted_edges_from(tups)
    #start DFS from each node in DG. Order is the order of songs in a playlist starting from a node; Orderlist 
    orderlist=[]
    avg_edges=[]
    weightlistlist=[]
    
    
    for index, nodes in enumerate(DG): #start a DFS at each node
        order = list(nx.dfs_edges(DG, nodes)) #order of the search is recorded for this node
        orderlist.append(order)  #added to a list of paths
        weightlist = []
        for song in order:
            for tup in tups:
                if tup[0]==str(song[0]):
                    if tup[1]==str(song[1]):
                        weightlist.append(tup[2])  #get the weight of the edges
    
        weightlistlist.append(weightlist)
        avg_edge = sum(weightlist)/len(weightlist)  #edge weight per track in this playlist
        avg_edges.append(avg_edge)    #edge weight per track for all playlists
        
 
    #min(enumerate(a), key=itemgetter(1))[0]
    minval, idxmin = min((val, idx) for (idx,val) in enumerate(avg_edges))
    print str(minval) + "is at " + str(idxmin)
    
    print orderlist[idxmin]
    bestlist = orderlist[idxmin]
    
                
    avgshuffleweight= sum(shuffleweight)/len(shuffleweight)


    
    improvement = (avgshuffleweight - .5618343)/shufflerange
    
    return weightlistlist, orderlist, avg_edges, bestlist, tups_weights, shufflerange, shuffleweight
'''    #build a Directed graph
    DG=nx.DiGraph()
    DG.add_weighted_edges_from(tups)
    #print DG.neighbors('a')
    
    #iterate over all starting songs
    Tlist = []
    orderlist = []
    for node in DG:

        T = nx.dfs_tree(DG,node)
        #print nx.dfs_postorder_nodes(T)
        order = list(v for u,v,d in nx.dfs_labeled_edges(DG,source=node)
          if d['dir']=='reverse')
        orderlist.append(order)
    print orderlist[0]
        
    #print(list(nx.dfs_labeled_edges(T,node)))
    Tlist.append(T)
    #print(list(T.edges()))
    #print Tlist
    
    
    UTlist = []
    for trees in Tlist:
        UT=T.to_undirected()
        #print(nx.connected_components(UT))
        UTlist.append(nx.connected_components(UT))'''


#---------------------------------------------------------------------------------

# <codecell>

plid = 'pl152858163299746048'
track_id = beatspl2tracks(plid)

EN_id_list = beats2echonest(track_id)

filename = 'neverresethead'

songdatalist, dist_matrix, playlist= EN_id2summary(filename, EN_id_list)

weightlistlist, orderlist, avg_edges, bestlist, tups_weights, shufflerange, shuffleweight= DiGraph(songdatalist, dist_matrix, playlist)









    



{u'code': u'OK',
 u'data': {u'access': u'public',
           u'created_at': 1393442626,
           u'description': u'Not familiar with dubstep? Listen to these select tracks from dubstep stars to get you started!',
           u'duration': 3910,
           u'id': u'pl152858163299746048',
           u'name': u'Dubstep 101',
           u'parental_advisory': True,
           u'published_at': 1394041774,
           u'refs': {u'author': {u'display': u'PopCrush',
                                 u'id': u'cr126511200937837056',
                                 u'ref_type': u'curator'},
                     u'tracks': [{u'display': u'Promises',
                                  u'id': u'tr56903677',
                                  u'ref_type': u'track'},
                                 {u'display': u'Kiss My Lips (Feat. Dev)',
                                  u'id': u'tr64249899',
                                  u'ref_type': u'track'},
                                 {u'display': u"Killin' It",
                                  u'id': u'tr69480537',
                                  u'ref_type': u'track'},
                                 {u'display': u'Bangarang (Feat. Sirah)',
                                  u'id': u'tr62721487',
                                  u'ref_type': u'track'},
                                 {u'display': u'Still With Me (Seven Lions Remix) (Feat. Cristina Soto)',
                                  u'id': u'tr72906961',
                                  u'ref_type': u'track'},
                                 {u'display': u'Lights (Bassnectar Remix)',
                                  u'id': u'tr53824041',
                                  u'ref_type': u'track'},
                                 {u'display': u"I Can't Stop",
                                  u'id': u'tr77195503',
                                  u'ref_type': u'track'},
                                 {u'display': u'Bonfire',
                                  u'id': u'tr68685835',
                                  u'ref_type': u'track'},
                                 {u'display': u'Tidal Wave',
                                  u'id': u'tr90186209',
                                  u'ref_type': u'track'},
                                 {u'display': u'Katy On A Mission',
                                  u'id': u'tr58067023',
                                  u'ref_type': u'track'},
                                 {u'display': u'Thumbs Up',
                                  u'id': u'tr75428807',
                                  u'ref_type': u'track'},
                                 {u'display': u'Crystallize',
                                  u'id': u'tr90529833',
                                  u'ref_type': u'track'},
                                 {u'display': u'Still Getting It Ft. Skrillex',
                                  u'id': u'tr58300865',
                                  u'ref_type': u'track'},
                                 {u'display': u'Messiah (Alvin Risk Remix)',
                                  u'id': u'tr80420193',
                                  u'ref_type': u'track'},
                                 {u'display': u'Somebody To Love',
                                  u'id': u'tr72914979',
                                  u'ref_type': u'track'},
                                 {u'display': u'Gold',
                                  u'id': u'tr91301649',
                                  u'ref_type': u'track'}],
                     u'user': {u'display': u'popcrush',
                               u'id': u'cr126511200937837056',
                               u'ref_type': u'curator'}},
           u'total_subscribers': 681,
           u'total_tracks': 16,
           u'type': u'playlist',
           u'updated_at': 1394041774,
           u'user_display_name': u'PopCrush'}}
0.593059206365is at 14
[(u'Messiah (Alvin Risk Remix)', u'Promises'), (u'Promises', u'Thumbs Up'), (u'Thumbs Up', u'Somebody To Love'), (u'Somebody To Love', u'Katy on a Mission'), (u'Katy on a Mission', u'Lights (Bassnectar Remix)'), (u'Lights (Bassnectar Remix)', u"I Can't Stop"), (u"I Can't Stop", u'Gold (feat. Yuna)'), (u'Gold (feat. Yuna)', u'Still Getting It'), (u'Still Getting It', u'Tidal Wave'), (u'Tidal Wave', u'Kiss My Lips (feat. Dev)'), (u'Kiss My Lips (feat. Dev)', u'Bangarang (feat. Sirah)'), (u'Kiss My Lips (feat. Dev)', u"Killin' It"), (u'Still Getting It', u'Bonfire'), (u'Gold (feat. Yuna)', u'Crystallize')]



In [15]:

    
#print len(bestlist)
#print tups_weights
k = len(bestlist)
shuffle = random.sample(shuffleweight, k+1)
print shuffle
avg_shuffle = sum(shuffle)/len(shuffle)
print avg_shuffle
print shufflerange
improvement = (avg_shuffle - .58097)/avg_shuffle
print improvement









    



[0.74942561874122071, 0.97081944963585443, 1.0813270594660191, 0.45532014037167612, 0.79068837221447785, 0.78388876395587559, 1.1940539240833024, 0.45532014037167612, 0.93375879466389056, 0.52213144833902037, 0.94432418156885112, 0.87380475876820574, 0.66130634165097479, 0.89342131076859066, 1.2324380460042286]
0.836135223374
1.67254552011
0.30517219732



In [16]:

    
print weightlistlist[11]









    



[0.48291699376586339, 0.6478594143900348, 0.5993878519096425, 0.48541998430014144, 0.77717839905358865, 0.61122900311305439, 0.67597339859659011, 0.63851752266563422, 0.74942561874122071, 0.54753210907357841, 0.58607142587709748, 0.74704736950108064, 0.51882650722521717, 0.68834702414927018]



In [19]:









    



---------------------------------------------------------------------------
AttributeError                            Traceback (most recent call last)
<ipython-input-19-56a5db1ab868> in <module>()
      4 
      5 fig, ax = ppl.subplots(1)
----> 6 ppl.pcolormesh(fig, ax, heat_linear)
      7 fig.savefig('app/static/'+str(filename + 'bestpath'))

/usr/local/lib/python2.7/dist-packages/prettyplotlib/_pcolormesh.pyc in pcolormesh(*args, **kwargs)
     34     x = args[0]
     35 
---> 36     kwargs.setdefault('vmax', x.max())
     37     kwargs.setdefault('vmin', x.min())
     38 

AttributeError: 'list' object has no attribute 'max'



In [ ]: