In [1]:

    
using JSON, ProgressMeter, JLD, LightGraphs

Community Detection on twitter network using non-negative matrix factorization and graph regularization.

This implements the DualNMF algorithm in this paper: Community Detection in Political Twitter Networks using Nonnegative Matrix Factorization Methods

Prerequisites:

the retweet graph as a LightGraphs object
the user/graph matrix



In [18]:

    
user_word = JLD.load("/media/henripal/hd1/data/new_mat.jld", "new_mat");
graph = JLD.load("/media/henripal/hd1/data/graph.jld", "graph");



In [19]:

    
size(user_word,2)









    Out[19]:





5132

Building a word/word similarity matrix from the user/word matrix

We iterate on columns because its faster and memory friendly in Julia:



In [20]:

    
function sparse_similarity(m::SparseMatrixCSC)::SparseMatrixCSC
    normalized_user_word = spzeros(size(m)...)
    norms = [norm(m[:,i]) for i in 1:size(m,2)]
    @showprogress for (col,s) in enumerate(norms)
        s == 0 && continue # What does a "normalized" column with a sum of zero look like?
        normalized_user_word[:,col] = m[:,col]/s
    end
    return normalized_user_word' * normalized_user_word
end


# this builds a LightGraphs graph from a similartiy matrix
function build_graph_from_similarity(similarity::Matrix, cutoff::Float64)::Graph
    length = size(similarity, 1)
    graph = Graph(length)
    for i in 1:length
        for j in 1:i-1
            similarity[i, j] > cutoff && add_edge!(graph, i, j)
        end
    end
    graph
end









    Out[20]:





sparse_similarity (generic function with 1 method)



In [21]:

    
# this succesively builds the similarity matrix then
# builds the graph from the similarity matrix

cutoff = .4
similarity = sparse_similarity(user_word)
word_graph = build_graph_from_similarity(full(similarity), cutoff)









    



Progress: 100%|█████████████████████████████████████████| Time: 0:04:16






    Out[21]:





5132×5132 sparse matrix with 24981772 Float64 nonzero entries:
	[1   ,    1]  =  1.0
	[2   ,    1]  =  0.104883
	[3   ,    1]  =  0.0077162
	[4   ,    1]  =  0.134559
	[5   ,    1]  =  0.0689679
	[6   ,    1]  =  0.0223928
	[7   ,    1]  =  0.00913363
	[8   ,    1]  =  0.146813
	[9   ,    1]  =  0.0788164
	[10  ,    1]  =  0.116557
	⋮
	[5122, 5132]  =  0.120978
	[5123, 5132]  =  0.177761
	[5124, 5132]  =  0.0172602
	[5125, 5132]  =  0.266282
	[5126, 5132]  =  0.195395
	[5127, 5132]  =  0.0338713
	[5128, 5132]  =  0.138883
	[5129, 5132]  =  0.127958
	[5130, 5132]  =  0.300903
	[5131, 5132]  =  0.229402
	[5132, 5132]  =  1.0

Algorithm

calculate the Laplacian matrices
define the update functions
define the cost function
iterate the update functions

Some remarks: the cost function is quite expensive, so we do not calculate it everytime. It would be maybe useful to adaptively calculate it?

Some of the helper functions are a little strange looking; this is because these matrices are huge, some are not sparse, and the memory usage can get a little out of control. Hence the column iterations, some precalculations, etc..



In [22]:

    
# calculating the laplacian matrices and plusminus laplacian:
L_c = laplacian_matrix(graph)
word_laplacian = laplacian_matrix(word_graph)
wl_plus = (abs(word_laplacian)+word_laplacian)/2
wl_minus = (abs(word_laplacian)-word_laplacian)/2
gl_plus = (abs(L_c)+L_c)/2
gl_minus = (abs(L_c)-L_c)/2









    Out[22]:





1205559×1205559 sparse matrix with 7484416 Int64 nonzero entries:
	[1      ,       1]  =  8
	[2      ,       1]  =  -1
	[3      ,       1]  =  -1
	[4      ,       1]  =  -1
	[5      ,       1]  =  -1
	[6      ,       1]  =  -1
	[7      ,       1]  =  -1
	[8      ,       1]  =  -1
	[9      ,       1]  =  -1
	[1      ,       2]  =  -1
	⋮
	[1205555, 1205555]  =  2
	[234    , 1205556]  =  -1
	[235    , 1205556]  =  -1
	[1205556, 1205556]  =  2
	[11575  , 1205557]  =  -1
	[1205557, 1205557]  =  1
	[94     , 1205558]  =  -1
	[1205558, 1205558]  =  2
	[1205559, 1205558]  =  -1
	[1205558, 1205559]  =  -1
	[1205559, 1205559]  =  1



In [28]:

    
# parameters and initializing W and U
clusters = 60
α = 10
β = 10
users = size(L_c,1)
words = size(word_laplacian ,1)
W = .5 * spones(sprand(words, clusters, .5))
U = .5 * spones(sprand(users, clusters, .5))









    Out[28]:





1205559×60 sparse matrix with 36172295 Float64 nonzero entries:
	[2      ,       1]  =  0.5
	[4      ,       1]  =  0.5
	[6      ,       1]  =  0.5
	[9      ,       1]  =  0.5
	[10     ,       1]  =  0.5
	[13     ,       1]  =  0.5
	[14     ,       1]  =  0.5
	[15     ,       1]  =  0.5
	[16     ,       1]  =  0.5
	[19     ,       1]  =  0.5
	⋮
	[1205542,      60]  =  0.5
	[1205547,      60]  =  0.5
	[1205548,      60]  =  0.5
	[1205549,      60]  =  0.5
	[1205550,      60]  =  0.5
	[1205551,      60]  =  0.5
	[1205552,      60]  =  0.5
	[1205553,      60]  =  0.5
	[1205554,      60]  =  0.5
	[1205558,      60]  =  0.5
	[1205559,      60]  =  0.5



In [30]:

    
# memory friendly update functions

function update_U(U::SparseMatrixCSC, W::SparseMatrixCSC)::SparseMatrixCSC
    WpW = W' * W
    return U .* sqrt((user_word * W + α * gl_minus * U) ./ (U * WpW + α * gl_plus * U))
end

function update_W(U::SparseMatrixCSC, W::SparseMatrixCSC)::SparseMatrixCSC
    UpU = U' * U
    return W .* sqrt((user_word' * U + β * wl_minus * W) ./ (W * UpU + β * wl_plus * W))
end









    Out[30]:





update_U (generic function with 1 method)



In [32]:

    
# memory friendly frobenius norms and objective functions

function my_frobenius(uw::SparseMatrixCSC, U::SparseMatrixCSC, W::SparseMatrixCSC)::Float64
    (users, words) = size(uw)
    wp = W'
    clusters = size(U,2)
    result = 0
    @showprogress for j in 1:words
        uwp_j = U*wp[:, j]
        result += norm(uw[:, j] - uwp_j)^2
    end
    result
end

function obj(U::SparseMatrixCSC, W::SparseMatrixCSC)::Float64
    my_frobenius(user_word, U, W) + α * trace(U' * L_c * U) + β * trace(W' * word_laplacian * W)
end









    Out[32]:





obj (generic function with 1 method)

This is where we run the algorithm. Somewhat time intensive but not crazily so



In [47]:

    
tolerance = .05
delta = 1000
stride = 10

err = obj(U, W)

while delta > tolerance
    for i in 1:stride
        U = update_U(U, W);
        W = update_W(U, W);
    end
    newerr = obj(U,W)
    delta = abs(newerr - err)
    err = newerr
end









    



Progress: 100%|█████████████████████████████████████████| Time: 0:09:33



In [49]:

    
JLD.save("/media/henripal/hd1/data/U_60.jld", "U_60", U)



In [51]:

    
# another helper functions, assigns the communities based on the highest probability of being in that community

function assign_communities(u::SparseMatrixCSC)
    (n_user, n_cluster) = size(u)
    communities = Array{Int64,1}(n_user)
    @showprogress for user in 1:n_user
        communities[user] = indmax(u[user, :])
    end
    communities
end









    Out[51]:





assign_communities (generic function with 1 method)



In [52]:

    
comm = assign_communities(U)









    



Progress: 100%|█████████████████████████████████████████| Time: 0:00:10






    Out[52]:





1205559-element Array{Int64,1}:
 19
 27
 31
  7
 19
 19
 59
 22
 18
 31
 31
 25
 44
  ⋮
 41
 25
 41
 21
 51
 57
 10
 17
 31
  9
  2
 30



In [53]:

    
using Plots









    



WARNING: using Plots.density in module Main conflicts with an existing identifier.
WARNING: using Plots.translate in module Main conflicts with an existing identifier.
WARNING: using Plots.center in module Main conflicts with an existing identifier.



In [55]:

    
histogram(comm, nbins = 60)









    Out[55]:

Some post-processing to vizualize data using projector, and restrict ourselves to the 10k largest accounts.

This is totally in rough draft form



In [10]:

    
U_60 = JLD.load("/media/henripal/hd1/data/U_60.jld", "U_60")









    Out[10]:





1205559×60 sparse matrix with 35334538 Float64 nonzero entries:
	[2      ,       1]  =  0.0495808
	[6      ,       1]  =  0.00918191
	[9      ,       1]  =  0.123767
	[10     ,       1]  =  0.000630212
	[13     ,       1]  =  0.00385952
	[14     ,       1]  =  0.00347653
	[15     ,       1]  =  0.00244331
	[16     ,       1]  =  0.000328876
	[19     ,       1]  =  0.00363582
	[20     ,       1]  =  0.00131454
	⋮
	[1205542,      60]  =  8.94298e-39
	[1205547,      60]  =  5.19441e-202
	[1205548,      60]  =  2.42452e-200
	[1205549,      60]  =  7.16569e-5
	[1205550,      60]  =  7.76278e-30
	[1205551,      60]  =  0.0097963
	[1205552,      60]  =  5.43669e-8
	[1205553,      60]  =  1.072e-5
	[1205554,      60]  =  6.15074e-75
	[1205558,      60]  =  0.000951541
	[1205559,      60]  =  0.000741547



In [12]:

    
using DataFrames



In [25]:

    
name_followers = readtable("/media/henripal/hd1/data/name_to_follower.csv", header = false);



In [26]:

    
rename!(name_followers,:x1,:name)
rename!(name_followers,:x2, :followers)









    Out[26]:




name followers
1 GavaironJ 5
2 bocchijoto 1834
3 cannabinolsen 1
4 angelman61 32
5 alex_latrice21 199
6 turnipkween 242
7 EveMorante 747
8 mwutley 113
9 LetsCllnk 59
10 positivelytaco 173
11 SachaStein 171
12 andino__20 155
13 Bonduran1 598
14 pretocaetano 259
15 TheLos 967
16 LaylaGerhart 4
17 stolethetart 34
18 aryalptara 450
19 asvpxstephaniex 107
20 Doreen58 84
21 ivysharIey 274
22 YSemerel 8
23 LVIaLondres 549
24 monsterfromars 856
25 SassyBroncoFan 11
26 karururo 74
27 thaecn 11
28 Raulggrc 641
29 ZireLLi_B 285
30 tamtinke2 114
&vellip &vellip &vellip



In [32]:

    
sort!(name_followers, cols= :followers, rev = true);



In [35]:

    
name_followers = name_followers[1:10000,:]









    Out[35]:




name followers
1 MileyCyrus 31598990
2 TheEconomist 18303980
3 POTUS 14277895
4 funnyordie 13936034
5 TIME 12715214
6 ArvindKejriwal 10276363
7 SarahKSilverman 9776677
8 jk_rowling 9056612
9 HuffingtonPost 8868956
10 people 7546839
11 lemondefr 6668668
12 NPR 6584109
13 PerezHilton 6560967
14 guardian 6210222
15 EW 6031204
16 lilyallen 5905870
17 piersmorgan 5433143
18 RedHourBen 5225214
19 htTweets 4999547
20 TheFunnyTeens 4590964
21 billboard 4434723
22 dumbassgenius 4383367
23 hitRECordJoe 4164075
24 todonoticias 4037759
25 DannyDeVito 3967433
26 jack 3960340
27 SkyNews 3762095
28 MMFlint 3736617
29 IndiaToday 3687969
30 BritishVogue 3472942
&vellip &vellip &vellip



In [36]:

    
name_followers[:ind] = [name_to_index[n] for n in name_followers[:name]]









    Out[36]:





10000-element Array{Int64,1}:
 1105228
  400654
  430428
  519328
   18442
 1024618
 1058073
  701067
  521599
  441624
  928554
   21126
  883751
       ⋮
 1056759
  389300
  861936
 1060834
  628955
  783077
  146505
  687415
  538132
  373521
  903695
  727673



In [38]:

    
user_vectors = Array{Float64,2}(10000, 60)









    Out[38]:





10000×60 Array{Float64,2}:
 5.31633e-318  5.26693e-318  5.21753e-318  …  4.09076e-319  3.47501e-319
 5.31633e-318  5.26692e-318  5.21753e-318     4.09081e-319  3.47506e-319
 5.31632e-318  5.26692e-318  5.21751e-318     4.09086e-319  3.47511e-319
 5.31632e-318  5.26691e-318  5.21751e-318     4.09091e-319  3.47516e-319
 5.31631e-318  5.2669e-318   5.21748e-318     4.09096e-319  3.47521e-319
 5.31631e-318  5.26691e-318  5.21749e-318  …  4.09101e-319  3.47526e-319
 5.3163e-318   5.26689e-318  5.21749e-318     4.09106e-319  3.47531e-319
 5.3163e-318   5.2669e-318   5.2175e-318      4.09111e-319  3.47536e-319
 5.31629e-318  5.26689e-318  5.2175e-318      4.09116e-319  3.47541e-319
 5.31629e-318  5.26688e-318  5.21747e-318     4.09121e-319  3.47546e-319
 5.31628e-318  5.26688e-318  5.21747e-318  …  4.09126e-319  3.4755e-319 
 5.31628e-318  5.26687e-318  5.21748e-318     4.09131e-319  3.47555e-319
 5.31627e-318  5.26687e-318  5.21745e-318     4.09136e-319  3.4756e-319 
 ⋮                                         ⋱                            
 5.26699e-318  5.21759e-318  5.16818e-318     3.47442e-319  2.59236e-319
 5.26698e-318  5.21759e-318  5.16814e-318     3.47447e-319  2.59241e-319
 5.26698e-318  5.21757e-318  5.16814e-318  …  3.47452e-319  2.59246e-319
 5.26697e-318  5.21757e-318  5.16815e-318     3.47457e-319  2.59251e-319
 5.26696e-318  5.21756e-318  5.16815e-318     3.47462e-319  2.59256e-319
 5.26697e-318  5.21756e-318  5.16816e-318     3.47466e-319  2.59261e-319
 5.26696e-318  5.21755e-318  5.16816e-318     3.47471e-319  2.59266e-319
 5.26695e-318  5.21755e-318  5.16817e-318  …  3.47476e-319  2.59271e-319
 5.26695e-318  5.21754e-318  5.16812e-318     3.47481e-319  2.59276e-319
 5.26694e-318  5.21754e-318  5.16812e-318     3.47486e-319  2.59281e-319
 5.26694e-318  5.21752e-318  5.16813e-318     3.47491e-319  2.59286e-319
 5.26693e-318  5.21752e-318  5.16813e-318     3.47496e-319  2.59291e-319



In [41]:

    
for i in 1:10000, j in 1:60
    user_vectors[i, j] = U_60[name_followers[:ind][i], j]
end



In [43]:

    
user_cluster = DataFrame(user_vectors)









    Out[43]:




x1 x2 x3 x4 x5 x6 x7 x8 x9 x10 x11 x12 x13 x14 x15 x16 x17 x18 x19 x20 x21 x22 x23 x24 x25 x26 x27 x28 x29 x30 x31 x32 x33 x34 x35 x36 x37 x38 x39 x40 x41 x42 x43 x44 x45 x46 x47 x48 x49 x50 x51 x52 x53 x54 x55 x56 x57 x58 x59 x60
1 0.0003308432856116264 0.00023556579292053693 2.0446540121546803e-10 0.0 0.0 0.0 0.0 0.0023846671602313157 0.0 0.0 1.6802939987742255e-6 0.0 2.014624184008981e-5 1.3887591951182302e-8 3.064388919408614e-42 0.0 0.00012192591171959283 0.0028448940191847525 8.754336407056734e-5 0.0 0.044498164798964075 0.00014910775143976663 0.0 0.0062730740032405155 0.0 4.573211742164153e-6 0.003984731289917218 0.0 0.0 0.0 0.0 0.0010430127076793336 0.0 0.0 6.587998420877805e-5 0.0 0.0 0.0 0.005361382893127455 0.0 0.0007355158623978776 0.0008112884222575503 0.0 5.8160241596373914e-5 0.0 0.0 0.0003344268464441192 0.00553142754076147 0.0006128464480507761 0.0014175367508819355 0.0 0.0 0.0 0.0 0.0008470209740478379 0.004493430134649289 0.0023314149353175326 0.0 0.0 0.0
2 0.012185938992453698 0.007520346598927166 0.0 0.0 0.0 0.0 0.002790785545341013 0.000439382143195168 0.0 0.0 0.0 0.0 0.0 4.705423402757473e-39 1.2545409526519993e-7 0.010573547372347187 0.0 0.0 8.530843319542127e-27 0.0 0.0015000041049208408 0.0 0.0 0.0 0.0 0.0 0.00046473389681072724 0.0 0.0 1.1834661896183532e-33 0.0 0.00911536167853829 1.063352318605058e-44 0.002258826631600358 0.0 0.00039758467685113924 0.0020938145798602256 1.2654353806380195e-147 0.0 0.0011614075145673446 0.0 1.5617438169482512e-77 4.2474198281799115e-5 0.0 3.425544054559048e-5 0.0 6.867498516563607e-39 0.0026496856867044482 0.0 0.0 6.157052518337497e-17 0.0 4.154087665370867e-30 0.0 8.69547615838423e-24 0.0 8.984054254422174e-28 4.607879997896263e-5 0.0 3.905345380474349e-20
3 0.0 0.0 4.020239757033454e-24 0.0 0.0 7.1523067998953e-5 0.0 0.0005110360732394288 0.0 0.0 3.024365460555043e-6 0.0 3.1404478241281815e-5 0.0 0.0 0.0003074021603834905 0.0 0.0 0.0 0.0 6.289792525958274e-7 0.003557902637807497 0.0 0.0 1.2213750773923446e-14 0.025782587377123693 0.0 5.770156877870895e-6 6.53461782663682e-7 2.2871680716142906e-23 0.0 0.000104118694924968 2.236325870673125e-25 3.2812142603073855e-7 0.0 0.003517295057961414 0.0 1.3710349762929702e-142 1.7124600972339375e-30 0.0010301990333658104 0.0 3.1587700870857397e-16 0.006979161111813753 0.010136481932131538 0.0 0.0 0.0 0.0 0.002934064627641937 0.0 0.0 0.0003102983439209935 0.0 0.0 0.0 0.0 1.319297570782638e-5 0.0 0.0 0.0023441462028319865
4 0.0017747488671678486 0.0 3.8932615628673544e-26 0.0 0.0 0.0 0.0020622585463183594 0.0 0.0 0.0 0.0 6.886827065372384e-26 0.0 0.016605417395298003 0.0 0.005625564296704098 0.0007861195454822195 0.0 8.296795781269439e-19 0.0 0.004489961625987464 0.0 8.987477612678408e-5 0.0 4.544902190476385e-16 0.0 0.0 0.0017504705214968948 0.00022072143368432497 0.0 0.0 0.0 5.312240722715251e-31 0.0 0.0 0.0 0.0008721710688863963 0.0 0.0 0.0 0.042418985581581616 0.0 0.00029934319668378074 0.0 0.00012346971071342522 4.4390717534201144e-58 4.632406866563366e-29 0.0 0.0 0.00012421581861712244 1.984309035718981e-17 0.0 4.538956728803023e-22 0.0 0.0 0.0 2.904558844407672e-21 0.00024209566710284213 0.0037723766604976405 0.0
5 0.009788426324280628 0.0 2.3076090435205563e-9 0.0 0.0 0.0003145196539987476 0.012325762995579496 0.0 0.015500435540805345 0.0 2.672768750511227e-5 0.009603790613093237 0.0 0.0 0.0 0.01320465891791403 0.01038910379979191 0.017645209904107263 0.0 0.0008529141569550366 0.0 0.0066143481924247245 0.0 7.810202183096931e-13 0.05294513664114524 0.00011567592144047174 0.0 0.0 0.025747690785669696 0.0 0.06523723681043811 0.0 0.0 0.0 0.0 0.0 0.010207420264402169 3.0045663718339554e-5 0.0 0.0 0.022034786479435728 0.0 0.0 0.0 0.0039776570924686845 0.0017355855189742848 0.0 0.0 0.007821576465136837 0.0 0.0 2.1126924436052718e-13 0.0002901655326990168 0.0 0.0 0.0 0.0 0.0 0.0 0.0004784013468876284
6 0.0 0.0 2.182879405819539e-58 0.004946402200529859 0.0 0.0018532675317762446 0.0 0.0 9.249687767222297e-10 0.015323013470651174 6.471332095499124e-11 0.0 0.0 1.2063111448355473e-70 0.0 0.0 0.023992583847566976 0.0 0.0 0.0017559547072461318 0.018974438026860118 0.003405255013473325 0.0 4.5392163798588044e-26 8.8061286360795e-8 0.0 0.005000122596520707 0.013701370327684714 0.0 0.0 0.01222736299490559 0.0 1.0701099586687758e-6 0.0 0.006243652211012231 0.0 0.014574640251053648 4.874173178347575e-99 0.0 0.00629296355103089 0.0 0.0 0.006851009714986377 0.0 0.0029335416090089904 0.0 0.0 0.0 0.023134162111670985 0.0 5.641185407919584e-9 0.0 0.0 0.0 0.0 0.01176445478145046 7.071123609227314e-9 0.0011216584882642237 0.0 7.378274962461545e-7
7 0.0 0.0027797025816920146 3.3979398156249452e-12 0.0 0.0 8.814023086303373e-5 0.01852826979120223 0.0001598856456812938 0.0 0.0 6.459061909324168e-43 0.0 0.0 8.947071998935866e-75 0.0 0.0 0.0 0.0 7.936404288729375e-27 0.0 0.0 0.0 0.0013250059654989562 2.6718651633135695e-64 0.0 0.004825048812851818 0.0 0.0 0.0 0.0009158804433650519 0.014413955959510318 0.03120793178866664 0.0 0.012221924550864658 0.0 0.0 0.0 0.0 0.0 0.000677146875989436 0.0 0.0 0.00021949919765095103 0.01576477672512033 0.0 1.4231777811334748e-35 1.3217539247370314e-15 0.008299741517839843 0.0 0.0 0.0 3.899171473008588e-50 4.881385673693359e-37 2.044953017265063e-34 3.2883968231742943e-38 0.010546262714803481 0.0 8.312479537985108e-5 0.0 6.378597348496437e-28
8 0.021237213446824763 0.0 0.0 0.0015214434174566159 0.0 0.0 0.014378579634028995 0.0 7.1284457103681e-66 0.01807540057680555 4.921543795518432e-22 1.8136484282461668e-16 0.0 0.0 0.0 0.0030799000317495106 0.006007928859142657 0.0 1.1382048004529657e-13 0.00233658272601978 0.003935494046252248 0.0 0.0004950025341129744 0.0006650281454821298 7.34856003740948e-27 0.0 0.0 0.00479222771246516 0.0 0.0 0.011197387414021582 0.006392467820638125 4.761109215242714e-102 0.0 0.0 0.0 0.007219979673335546 0.0 2.45778942403467e-21 0.0006045983450701034 0.020469037441863437 0.0 0.00023439479345636972 0.0 0.0 0.0 2.3408454799743908e-33 0.0 0.007092526928807924 0.0 0.0 4.11377373247869e-10 0.0 1.2699217240398904e-23 0.0 0.0 0.0 0.00143552512104713 0.0 0.0
9 0.0 0.007195826832677521 1.9618794256116788e-22 0.003226132861064214 0.0 0.0 0.0 0.0003118287020611477 0.0 0.0339630800378309 0.0 8.511212034605835e-39 0.0 0.029001290883476288 2.5586945656458567e-29 0.0 0.01764212704006636 0.004491497445522094 0.0 0.0 0.009243577543616342 0.0 0.0014760643150309868 0.0 6.802802880433979e-6 0.0 0.0 0.0 0.0 0.0 0.06716062677751973 0.015893208143138646 0.0 0.0 0.0 0.0 0.000616169997021767 1.2126143733393911e-74 0.0 0.0 0.054973932294184076 0.0 0.0 0.0 0.0 2.3883638756848187e-53 0.0 0.001610222150823828 0.0 0.0008031122882017705 6.5421801775161704e-52 0.0 0.0 0.0 1.0456763609141535e-18 0.0 0.0 0.00048041399877252075 0.0 3.4261832108056713e-40
10 0.0007357356967699866 0.0 0.0 0.0005703687767974772 0.0 8.611848964174645e-6 0.002694151267232488 6.769001887003399e-6 5.754035278129778e-49 0.0030869141421982996 0.0 5.611663497219378e-49 2.8482500190617526e-27 0.0 0.0 0.0013524287578476663 0.000652978747484903 0.001265074885469236 0.0 0.0 0.0029036833203755236 9.442109112482463e-5 0.0 0.0 8.216481952841038e-5 0.0017741147072722662 3.205783333790314e-5 0.0 0.0 2.4671910525406004e-42 0.0694796984582975 0.0034047367537242664 0.0 3.614442224176738e-5 0.0 4.109265413636677e-5 7.096420012284045e-5 0.0 0.0 0.0 0.001924383926429539 0.0 8.918559383454957e-6 0.0 0.0 1.0114729707463713e-65 0.0 2.6310247696736657e-5 0.0 0.0 0.0 0.0 0.0 2.0115125766097873e-56 0.0 0.00020714274701155795 6.077641004401616e-6 4.908573499800462e-5 0.0 1.1012975263377428e-51
11 0.0 0.0 4.755182558599087e-38 0.0 0.0 0.015167320661544078 0.0 0.006241779303097515 0.0 0.0 0.0 0.0 0.0 1.3675593812257677e-14 0.0 0.4594250090832404 0.073707241521459 0.019563971604433492 0.0 0.031651411875995974 0.0 0.0 0.0 9.443869951194534e-9 0.0 0.0 0.0 0.0 0.0617453394016651 0.0 0.04897052172053521 0.0 6.126319672157516e-5 0.016601904365449154 0.0 0.0 0.0 1.1118216498416854e-62 5.116429813514793e-7 0.0 0.0 0.0 0.0061085012506005175 0.05102226352965699 0.008128979997998139 7.383448131240064e-9 6.506337651988628e-8 0.0 0.0 0.0 0.0 1.3606063799524002e-35 0.0 0.0 7.908738340088591e-11 0.0 0.0 0.0 0.0 0.0
12 0.007317548214938165 0.0 5.1466475220660164e-14 0.0 1.056491322434247e-11 0.0012675495445763794 0.010900020477695773 0.0011216991601560233 0.0 0.0 2.3219549328631168e-7 4.402186342223603e-24 0.0 1.2387837142152423e-35 0.0 0.009948082162509775 0.01808297249927333 0.026739990501505904 1.4864041950911461e-5 0.0010970353686077176 0.029932796127079758 0.0011255985143511337 0.03334796283189776 0.0 0.0 0.0 0.0020816374445337617 0.025022674208482136 0.0 0.018021933180435767 0.06741027210339576 0.0 0.0001165665598788776 0.009903451005911697 0.020746994377218442 0.0 0.0 3.615937737371287e-29 0.0 0.0065015870602484135 0.03518563567027733 0.0 0.002555376818636787 0.0 0.004548557330944188 1.1888107777183815e-5 0.004808099398195864 0.0034196725845630984 0.0 0.0 0.00016845239754190408 1.3191703573514609e-15 0.0 9.586527270660217e-7 0.0 0.0 0.0039391087792432986 0.0003704605406269919 0.0016036718549729924 0.0
13 0.0 0.0 1.5867736056820864e-245 0.0 3.6869401910794603e-88 0.0 0.0 0.0 0.0 0.0 9.859288274766614e-34 0.0 2.58531310451153e-45 1.7223123273641381e-102 4.15348698230008e-74 0.011972491594494714 0.010413692739582701 0.0 7.716633057753672e-35 0.0 0.0 0.0 0.0 0.0 0.0 0.004400921924033694 0.0 0.0 0.0020525198187129117 0.0 0.0 0.0 0.0 0.0010410289655367125 0.0010442575370897952 0.0010862241653857773 0.0 2.437700532133408e-153 1.1387262873557054e-71 0.0006223174425100537 0.0 0.0 0.0 0.006568254456391556 0.0002638208408731651 1.0855153386662732e-46 2.2566143601016862e-35 0.001990016384942764 0.012652397502875397 0.00032278353216318607 0.0 0.0 0.0 0.0 0.0 0.0 1.0220049067290253e-43 0.00020985971794915495 0.0018277288388432564 1.5835446017854633e-151
14 0.00020448001039201968 4.5738495342258925e-5 5.396701624857244e-202 0.0 9.049908825629075e-39 0.0 0.0 0.0 0.0011465531009226919 0.0 0.0 5.526574547439375e-50 0.0003358338018744915 6.82448832617364e-107 2.9445363723902807e-16 0.0002918286493552109 0.0 0.0 0.0 0.0 0.021102557792350856 0.0014200860283271133 0.0 0.0 0.0017406197197675488 0.0 0.0 0.0 0.0 1.9440763935540164e-21 0.0 0.0014790933686445234 0.0006032226131648641 0.00674023664776326 0.00010008438960694786 0.006102602638226535 0.007377091799096529 0.0 0.0020067212144709488 0.0 0.0 0.0 0.0018996058650374383 0.00017307346237853958 0.0030326458696177555 0.00029683400816695615 0.0 0.009676619133236877 0.0 0.00224051840908537 0.0005530535495019131 0.0 1.0186329072166427e-5 0.0 0.0010088287388380765 0.0 0.0 0.0 0.0 0.0
15 0.0025642885418608657 0.0 2.1516473706676736e-13 0.0 0.0 4.3318669174034834e-6 0.0 0.0 1.3846451876700926e-49 0.01507778378870331 0.0 0.0 0.0 4.9336242874416535e-115 0.0 0.006278215077829249 0.0 0.014014484127909562 6.974972464493002e-12 1.2904100663128434e-5 0.0 0.0 0.0 3.709317767809059e-69 0.0 0.004367587208308595 2.692255178236415e-5 0.00040558476963509595 0.0002830868847224222 0.0 0.0 0.013850207428515369 0.0 0.0 0.0 3.4745349249668655e-5 0.00013066264872753282 9.299739147653046e-87 1.1796969911036216e-42 3.516546421461397e-5 0.009007179346666817 0.0 0.0 0.07700319089097224 0.0 0.0 7.377472189822059e-42 0.00017194213646203654 0.0019590798985627445 0.0 0.0 0.0 1.7983032989673563e-31 2.2182911137674775e-49 0.0 0.00042052686354972023 0.004735423989359686 0.0 0.0 6.070325777653096e-43
16 0.0 0.0 3.326445244708997e-7 0.0 0.0 0.001698612962552999 0.08602705766232134 0.0019358963601878302 0.0 0.0 0.0 0.0 1.4378741176195567e-9 1.5886997392405432e-46 1.0299698426346623e-23 0.0 0.035638581977764726 0.029559693242024364 3.103435554370457e-8 0.0 0.07114071030794406 0.0033282950623084178 0.05259842616429157 1.4155089046675734e-41 0.0 0.041058879753156925 0.0030178319106999585 0.039952931610215764 0.019816436236358207 0.0 0.38402553206854895 0.0 0.0 0.010614590060815195 0.0 0.0 0.0 1.4322570789182196e-41 0.0 0.0032620622475391273 0.13645889671343678 0.0 0.0012380596570973753 0.0 0.0014610952866001593 0.0 7.747145453894382e-7 0.0 0.0 0.00811512344784986 0.0 0.0 0.0 2.5772014816756534e-17 4.480064258557233e-8 0.016846681122917644 0.0007530154987909008 0.0 0.0 0.0
17 0.003740043392096441 0.000805921819544553 2.0217667578545755e-22 0.0 2.2556416910763044e-28 0.0 0.0 0.02565136166797551 0.0015538182822610591 0.0 1.2461326501067271e-5 0.0 0.00017583212639216784 0.0 0.0 0.0 0.0 0.1403126858137423 0.004340957135213471 0.0 0.0 0.007610330858769425 0.0 0.0 0.12057794943670563 0.0 0.015252288615509337 0.0 0.0 8.475278553244229e-26 0.0 0.0 0.004428506627809487 0.0 0.00034775797119550387 0.03866394600362718 0.0 0.0 0.0077661336078525 0.0 0.01486867187693328 0.0 0.007548180893225958 0.0109055882456665 0.01931968731195314 0.0 0.0028663637730370023 0.0 0.0 0.0 0.0 7.653015771609385e-32 1.4174784644369366e-5 1.6297393372852333e-7 0.007714320784341508 0.07017892762476773 0.0 2.5024082016117106e-5 0.0 0.0
18 0.006128901968958203 0.0 0.0 0.0006450348871431239 0.0 0.00034416402489482616 0.0015761428386193352 0.00012177975293976192 3.4705655818998465e-27 0.013046833524917444 0.0 0.0 0.0 1.3955798744951263e-122 0.0 0.0 0.0 0.0 2.6452203048820354e-20 0.00011034602795613112 0.0 0.0 0.00012570737874285272 0.0 1.0350511050917589e-21 0.0 0.0014859080764787554 0.0 0.0 0.0 0.008931258758172498 0.009213784239552469 0.0 0.003723841476369287 0.002066359253264251 0.0 0.0018745232465550792 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 8.875151280115714e-32 0.0 0.0 0.01478589069634323 0.0004716788860123495 1.98156573848303e-42 1.0344531372905702e-46 0.0 4.834512802431814e-243 6.532118069714816e-25 0.0006154626062827168 0.0 0.0002580246683664941 0.0 0.0
19 0.0 9.999879011043507e-5 0.0 0.0 1.3387767496799246e-17 5.401768180852536e-8 0.0 0.0 0.0 0.0 0.0 3.813823054766971e-80 3.113090761803714e-44 0.0 0.0 0.0 0.0 0.0 5.731756748233698e-44 0.0 0.0 1.7426188793383248e-7 0.0 2.2465114756188864e-7 7.100823033319127e-21 0.006776182190348608 6.631501352065248e-5 4.909052136483631e-5 3.356624349817002e-5 1.2841517090261625e-189 0.003069198943679849 0.0012534694438281848 0.0 0.0 0.0 1.281634733714912e-7 3.2651408850778638e-6 0.0 0.0 0.0 0.0 5.212514753365408e-98 0.0 0.0 7.36453849875381e-8 0.0 1.4480971666050266e-51 4.3481146644556315e-6 0.0017162602382532791 2.053078817049253e-7 0.0 0.0 0.0 0.03534777251759535 9.542602598514165e-51 0.0695304878007944 2.340224396644117e-53 0.0 5.647992533286518e-5 1.2872240434616918e-74
20 0.0011113183401486463 0.0002771859152732582 5.9466628776308925e-8 0.0 0.0 3.96170750416727e-5 0.0 0.0 2.85598042491174e-89 0.0 0.0 2.6103588304353928e-58 0.0 0.0 4.357860848695559e-99 0.0 0.0 0.0013440569059703406 0.0 4.824494840284024e-5 0.0 0.0001560057956419797 0.0 0.0 0.0001138654719976487 0.0 0.0 0.0 0.0 0.0 0.07087176312730054 0.0 8.076139769535077e-182 0.0 0.0005686878172288234 0.00013444466213653774 0.0005208108333694408 0.0 0.0 0.0 0.004125619421568015 0.0 0.0 0.013171511143340876 5.2891853706849495e-5 0.0 5.181365801927377e-58 0.0001497464224823804 0.0 0.0 0.0 3.1789147699368665e-20 2.6549337064418825e-30 0.0 0.0 0.0008388065403325034 0.0 0.00020442173269929234 0.0 0.0
21 0.0 0.0043411429411399725 0.0 0.0 0.0 0.0 0.0 0.0 0.0037785557494503736 0.0 0.0022339167882805826 0.0 0.0038819307605836104 0.0 0.0 0.005615281092322995 0.01831194749581813 0.0 0.0 0.017482901816443432 0.0 0.01960388889798585 0.0 3.2078427663772057e-6 0.04178540349677842 0.0 0.01810479217498156 0.012523031615648078 0.0 3.971160363734896e-5 0.09225329216513611 0.018345964535228073 9.642559645407678e-10 0.0 0.0072809048645048335 0.0 0.027328305889904966 0.0 0.0 0.013596891062667513 0.0 1.1137144616173448e-11 0.014712740385705796 0.040701570523875324 0.011714579152727712 0.009848815348305577 0.0 0.0 0.016349639818273313 0.01852397676232506 0.0038451422449202726 8.767590593510485e-6 0.008580592415350833 0.0023592660065639088 0.0 0.018627867597028263 0.0 0.005384187937200843 0.0 0.0
22 0.0033494764991255275 0.0 3.091985831895584e-211 0.00016152703804431985 0.0 0.0 0.007061998245933606 2.6990822793649762e-5 0.0 0.0 0.0 1.1661028267322304e-72 9.745864842728471e-35 0.0 0.0 0.0 0.009721132407614788 0.0009387434041914005 0.0 0.0 0.0 0.00016491654210175962 0.0 8.13478270346616e-101 0.0 0.0014831528840422398 0.000679888158008183 0.0022975920143173353 0.0 4.8170259282885495e-26 0.0055392408350458415 0.0 0.0 0.0029142444737123617 0.0015536588271295938 0.0 0.0 0.0 2.0061016326391844e-39 0.00030072586184595106 0.0 2.213635524959732e-221 0.00016792022555027597 0.0 0.0 4.476887046261101e-22 1.2159008620676597e-23 0.0015898380002585348 0.014137248639927035 0.0 0.0 0.0 0.0 3.8423830274129606e-32 0.0 0.00336889270674119 0.0 0.0 0.004653643515198681 7.577160936135913e-97
23 0.0 0.0 0.0 0.0008036708840998846 9.969101655612104e-39 1.3962465423649773e-5 0.0 0.0 0.0 0.025072310831262677 3.294619584434729e-35 0.0 8.693760490376928e-28 0.0 3.513328146208825e-100 0.0 0.0 0.0 4.419475210915718e-14 0.0 0.008321145183860906 0.0 0.006286823599831681 0.0 0.04334861082534865 0.0 6.126607654731565e-5 0.0 7.025995274949137e-5 0.0 0.0 0.0 1.6867395932254108e-194 0.0 0.0007138517536376544 2.6573742601421058e-5 1.16398071471101e-5 5.9274567467731665e-86 1.0856777521757893e-74 0.0 0.0 0.0 3.4293442630432786e-5 0.0 2.1020356704897426e-5 0.0 9.194369818032449e-39 7.391180940215377e-5 0.009462914251435434 0.001128238736213415 0.0 2.7246927090680344e-17 4.556522952597801e-34 2.9329052980517483e-48 0.0 5.138426265404471e-5 2.287639051189262e-6 0.0010744980304578846 0.0 0.0
24 0.005543202348142878 0.0011912909075833707 0.0 0.0 0.0 0.0 0.0 7.982727941271713e-5 0.0 0.0069895841175551445 2.6834964907715243e-81 1.9650867966762763e-78 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0018996666563107845 0.0 0.0 1.6412357556423329e-59 7.989947582074964e-51 0.0030026210422142907 0.0003328748951067842 0.0008171074845492699 0.00162607992225384 0.0 0.0 0.0 2.591426453275734e-16 0.0003773616265390149 0.0007193086290094254 0.00014526106449176774 0.0 8.625009863369085e-78 1.290148416898703e-57 0.00023009971699472818 0.021319727898060494 0.0 0.0 0.003468091018408626 0.0 4.30006874186567e-62 1.3250540808863525e-150 0.0013044555178883842 0.0028478388608307536 4.354390140083496e-5 1.553540073914648e-61 3.126868740215103e-42 1.3491871959270767e-45 7.88363508890628e-111 0.0 0.0009952744282472224 4.4399207801333105e-24 0.0002710444599884169 0.0007565231630615187 0.0
25 5.4148679033299455e-5 0.0 5.744732633480829e-11 0.006267154921855436 0.0 0.0009724119704027279 0.0 0.0 0.0 0.0 3.6571747144796755e-5 5.023875853958544e-31 0.00022653212014505457 0.0 1.3655453212555112e-70 7.235316347380485e-5 0.0 0.0 0.0030764370081334843 0.00023767290683354003 0.0 0.0 0.0 0.0 0.0 0.0 0.0003077937800088454 0.0 0.0090894338041155 2.5500939962275076e-44 0.05696740092057232 0.0 0.0 0.010482800275478559 1.635060814075337e-6 0.0028079901853574865 0.0 1.2599965551538377e-93 0.005274100161282836 0.0 0.0 0.0 0.0 0.00012298389599603413 0.0005895007621655457 0.0 0.0 0.0 0.0 0.01056086028920833 0.006137298375498428 1.8769347350970286e-27 7.30161789780687e-6 2.716650943744761e-8 0.0 0.0 0.0 2.733228288939811e-7 2.019683250496061e-6 0.0
26 0.009822474577002568 0.0 0.0 0.0010682184319053788 1.8772083220845714e-39 1.2022744652003125e-5 0.0 2.479016422982124e-5 4.26318922084248e-29 0.011518498373518518 3.4950589176145315e-29 1.5454005129711574e-27 1.4426486165703242e-24 0.0 2.632661224737485e-53 0.0 0.0 0.0 0.0 7.925466446176761e-5 0.014359663772482755 0.0 0.0 0.0 0.02205763460915143 0.007330178289864419 6.295150620959165e-5 0.0011730898029384124 0.0005759464703104949 0.0 0.0 0.0 3.435817915048784e-39 0.0 0.0 0.0 0.0 3.421113673581968e-88 1.8627892599548077e-25 3.719560270454346e-5 0.0 0.0 0.0 0.0 9.990012047097616e-6 0.0 0.0 0.0 0.0 0.0006758366883510173 0.0 2.754086052445391e-19 1.1893808678716802e-23 1.5706207204688035e-34 0.0 0.0001835648390699165 0.0 9.044793289171919e-5 0.0 0.0
27 0.0 0.0030634467453725255 0.0 0.0 0.0 0.00011679446715709462 0.0046827692863939474 0.0 0.0 0.006612636668379505 1.4101562387432536e-22 1.2902979571834794e-23 0.0 4.526626402276788e-65 0.0 0.0 0.004670207940096816 0.0 0.0 0.0 0.0 0.0010392291809260864 0.0 0.0 0.0049905868941783815 0.0 0.00010647320605732357 0.0005345096185089994 0.00030437087892313587 0.0 0.13838489779866905 0.0 0.0 0.0 0.0005194480496240514 0.0 0.00019954474523792027 0.0 2.4959314582831454e-12 0.00017001633465365997 0.019120139577244313 4.2229540097745605e-150 0.00018549589044903383 0.0 0.0 0.0 1.3171645519643673e-27 0.00030491313859496875 0.008183233467567459 0.0 0.0 0.0 2.7220211950370956e-10 2.3460300555592948e-51 0.0 0.000500089652263692 0.0009820625080552215 0.0 0.0 0.0
28 0.0 0.0 2.0804057785554173e-6 0.0 0.0 0.0 0.012416707291186326 8.541317590119994e-5 0.0 0.0 3.2913940589835106e-32 0.0 1.1531140873552832e-32 0.0 0.0 0.0 0.0 0.0 0.0 0.0001895446569235564 0.021385456347469425 0.0 0.005743515587241383 0.0 0.00033486731432358455 0.010840306607096237 0.0006270018028848727 0.0 0.0 0.0 0.13549339066608582 0.0 0.0 0.0 0.011096993534511487 0.0 0.001517060704226543 1.4329157451676534e-42 3.2144791787248893e-21 0.0002684783631112476 0.0 0.0 0.0001582628026118549 0.025716485510987028 0.0 5.9011696012034735e-40 0.0 0.002176654930883733 0.011659052609753575 0.0 3.1812555660326e-29 0.0 6.66478206051896e-36 0.0 0.0 0.0 3.4984663182429066e-9 0.0 0.0 0.0
29 0.0 0.0 3.597061109780807e-10 0.0002706560867254789 0.0 1.248557649853732e-5 0.0020285208806818758 2.5454971544607745e-5 3.508885205283459e-51 0.005276319071732594 0.0 0.0 0.0 2.6108003745823184e-81 0.0 0.0023267487634893187 0.0 0.0 2.798222741072345e-12 0.0 0.0053836696516663205 4.7996397138800584e-5 0.0 5.097946362411215e-40 0.001797410864798552 0.0006675317847287073 0.0 0.0 0.0 0.0 0.06306199282784561 0.0 5.690789082818212e-26 0.0 7.34987119622455e-5 0.0 0.0 0.0 0.0 0.0 0.0 0.0 1.0364518816136793e-5 0.014734963433814401 0.0 3.6887894006629026e-63 1.8771426001677794e-86 0.0 0.0 0.0 0.0 1.0649066230037764e-21 0.0 3.876685866647511e-43 0.0 9.084175721235827e-5 5.828112161275778e-6 0.0 0.0 1.1183048751992571e-66
30 0.00028857571023048413 0.0 0.0 0.0 0.0 7.126389610408108e-6 0.0 9.344350092167608e-6 0.0 0.0063559688407160905 0.0 1.3136423793401037e-13 0.0 1.403253957901199e-66 6.548928332851371e-13 0.0 0.0 0.0 0.0 0.0 0.003347919104262181 0.0 0.0 2.218277832602591e-36 0.0 0.0070717387720037215 4.551554843203721e-6 0.0009392877012338778 0.0 8.936154728636963e-52 0.06448336432254301 0.0 5.199986259275717e-78 0.0007302665672747344 0.0 0.00019115871595739792 0.0 1.540700967784537e-81 0.0 0.00011052256420069953 0.0 4.917361001116743e-104 6.874214247196746e-5 0.0 1.0863485513950449e-5 7.091235968799541e-13 0.0 0.0005417537666494942 0.0 0.0 3.197292064603831e-14 0.0 7.234242811009404e-16 8.691175389869988e-20 5.529413980384877e-5 0.0005898383341196942 6.106425239367501e-5 2.1484891148713907e-5 0.0008224534771603322 3.6531555795533595e-11
&vellip &vellip &vellip &vellip &vellip &vellip &vellip &vellip &vellip &vellip &vellip &vellip &vellip &vellip &vellip &vellip &vellip &vellip &vellip &vellip &vellip &vellip &vellip &vellip &vellip &vellip &vellip &vellip &vellip &vellip &vellip &vellip &vellip &vellip &vellip &vellip &vellip &vellip &vellip &vellip &vellip &vellip &vellip &vellip &vellip &vellip &vellip &vellip &vellip &vellip &vellip &vellip &vellip &vellip &vellip &vellip &vellip &vellip &vellip &vellip &vellip



In [62]:

    
class = [indmax(user_vectors[i,:]) for i in 1:10000];
class_freq = zeros(60)
for class_no in class
    class_freq[class_no] = class_freq[class_no]+1
end



In [74]:

    
best_classes = [i for i in 1:60 if class_freq[i] > 250]









    Out[74]:





10-element Array{Int64,1}:
  7
 10
 17
 21
 25
 29
 31
 34
 41
 44



In [78]:

    
new_class = [indmax(user_vectors[i, best_classes]) for i in 1:10000]









    Out[78]:





10000-element Array{Int64,1}:
  4
  1
 10
  9
  7
  3
  1
  9
  7
  7
  3
  7
  3
  ⋮
  7
  7
  5
  7
  9
  7
  5
  5
  8
  2
  6
  2



In [79]:

    
name_followers[:class] = string.(new_class)









    Out[79]:





10000-element Array{String,1}:
 "4" 
 "1" 
 "10"
 "9" 
 "7" 
 "3" 
 "1" 
 "9" 
 "7" 
 "7" 
 "3" 
 "7" 
 "3" 
 ⋮   
 "7" 
 "7" 
 "5" 
 "7" 
 "9" 
 "7" 
 "5" 
 "5" 
 "8" 
 "2" 
 "6" 
 "2"



In [80]:

    
writetable("/media/henripal/hd1/data/attributes.tsv",name_followers[:,[:name, :class, :followers]])



In [53]:

    
writetable("/media/henripal/hd1/data/vectors.tsv",user_cluster, header = false)



In [20]:

    
df









    Out[20]:




x1 x2 x3 x4 x5 x6 x7 x8 x9 x10 x11 x12 x13 x14 x15 x16 x17 x18 x19 x20 x21 x22 x23 x24 x25 x26 x27 x28 x29 x30 x31 x32 x33 x34 x35 x36 x37 x38 x39 x40 x41 x42 x43 x44 x45 x46 x47 x48 x49 x50 x51 x52 x53 x54 x55 x56 x57 x58 x59 x60 name
1 0.0 0.0 0.0 0.0 0.0051725596147227 0.026945830598873732 0.10775474686882859 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0003681329605147508 0.05019964953095866 0.0 0.01634360690677292 0.2769832659687579 0.0 0.0 0.0 0.011138582784611212 0.0 0.0 0.0 0.0 0.050674768950433255 0.0 0.0 0.0 0.011685303315783595 5.982337113625717e-7 0.025341281084838997 0.0 0.1397876310794631 0.0 2.557728206998708e-50 0.022798613032828093 0.11137848732635668 0.033592642112617435 1.1281923594343566e-20 0.0 0.0 0.0 0.00031783142602080953 0.0 0.0 0.0 0.08351004447658451 0.009862793276377544 0.0015407854886804928 0.014428228467605742 0.0 0.0 0.01562588099842397 0.0 0.03947191471247384 0.09654327952085223 0.025225820001461275 Deborah87958167
2 0.049580753988165444 0.2508836444918074 0.0 0.0 0.0 0.0 0.04489051981720582 0.1469489793379341 0.006060481798182574 0.029514101635304844 0.0890455518754558 0.0 0.0 0.0 0.0002022396002893607 0.005661225864393524 0.0 0.0 0.0 0.0 0.0 0.058310273766597205 0.0 0.0 0.0 0.0 0.3711326910656078 0.0 0.18335415663300975 0.0 0.0 0.0 0.0033604598334223044 0.0 0.0 0.0 0.0 0.0 0.04542499610223528 0.07414130821506772 0.08966204938609933 0.0 0.11555116359807116 0.0 0.17541942420018627 0.0 0.0 0.0 0.0 0.2132898499804196 0.0 0.0031261188507839795 0.0 0.07288551281835083 0.0 0.08977849524134132 0.0 0.05134670979062862 0.08354029060885172 0.0 texasfarmgirl1836
3 0.0 8.713427609010385e-9 0.0 0.0 2.506603772409537e-16 0.0014415837633974843 0.009184575106136393 0.0014634597958376704 0.0 0.0 1.4087849542070368e-9 3.0556874831156914e-6 0.0 2.081966235264321e-18 0.0 0.020324572789786673 0.0 0.0 0.0 0.0 0.0 0.0 0.016042098750867012 0.0 0.0 5.010620238826393e-7 0.0 0.006732738181303161 0.0 0.004281777076742496 0.0483308829964388 0.0 1.7176459235562508e-11 0.0 0.0 0.0 0.007889798225674597 3.1674231391041387e-9 0.028718489356872427 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0021219079093766796 4.806771499892348e-9 0.0 0.0034717900607107335 3.0484456781940202e-5 2.9008845144491245e-12 0.0 0.0 0.0 0.0 0.0017901387836809907 0.0 0.0 0.0 Squatch
4 0.0 0.0 0.0 0.0 6.757009503150856e-9 0.0 0.004290304298363777 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 5.349674366843527e-8 0.0 1.8740760403039192e-19 0.0 0.0 0.0 0.0 2.647414737804112e-16 0.0 0.0 0.0 0.0 7.659799678820569e-12 0.0 0.0 0.0 6.995064178052164e-13 0.0 4.167343897568493e-10 0.0 0.0 0.0 0.0 0.0 0.0 3.690302282820236e-9 6.2441708347947e-253 0.0 0.0 0.0 3.9245758136038415e-24 0.0 0.0 0.0 4.468493945327262e-6 0.0 3.943752366065573e-7 0.0 0.0 0.0 0.0 0.0 3.399631642317278e-9 0.0 0.00033363499990994886 Lu Who
5 0.0 0.0 2.978697870558589e-20 0.05610419050580491 0.0 0.0 0.1006611078941685 0.0 0.0 0.0 0.0017628746836431215 1.844669806182308e-20 0.002818507875767357 0.0 0.0 0.0 0.0291893271717699 0.0 0.2695722422915973 0.0 0.029762575540874536 0.07906190763660918 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.046634138804370874 0.0 0.0 0.0 0.0 0.0 0.16956119494466845 0.0 4.626771949675073e-103 0.0 0.0 0.0 8.911343599386976e-17 0.0 0.0 0.05665828725416513 0.0004112506664022114 0.0 0.02254564482163113 0.0 0.0542322502647718 0.004808077603267288 0.0011385726686938334 0.0 0.014768789225195375 0.0 0.0 0.0008794133262373876 0.044051796341177264 0.0862211039196512 0.0 SongsOfLaredo
6 0.009181913913791745 0.0 1.1601476735579242e-5 0.0 0.00035113379363617604 0.010457945596979469 0.01890423467102866 0.024182000824113852 0.0081186890821123 0.019336573934026782 0.0 0.0 0.0020369611070950775 0.0002501484514695846 0.0 0.0 0.007764641419741867 0.0 0.07971543948692807 0.014415242658270294 0.03100934410246285 0.0 0.025303611760274857 0.0 0.04141569848179266 0.01773688481428575 0.028663842332646797 0.0 0.023666765466495245 0.0 0.045465174523809285 0.017773289768186835 0.0003725663814940007 0.02036893439985751 0.0 0.0 0.01496255824068227 0.00030803357641239984 0.010958580847009208 0.017470724831291008 0.0 0.0 0.0204814971584374 0.0 0.0 0.0 0.005035069648163644 0.0 0.010079617761172522 0.02972699720470811 0.0 0.00015112658916434333 0.0 0.0020671534594210554 0.0 0.0 0.0 0.0051867768069129554 0.0 0.006842609054683921 Diva
7 0.0 0.0 2.3967158997252667e-60 0.0026379852716760218 0.0 0.001282763077187216 0.0 0.002326131250786013 0.000625355234237181 0.0009767573238737871 0.0 7.193653953955475e-22 0.0 5.78946163199559e-5 0.0001288921913390062 0.00245653371747196 0.0007506580977638626 0.0021812525491235993 0.0 0.0020837798871042156 0.0 0.0029422896365983776 0.0 0.000272685521605035 0.0007651872749692171 0.006682360157414971 0.006692463902183609 0.002548762373939285 0.0 0.0 0.0 0.0005859831123454848 0.0 0.0015597661737651227 0.001645000586493498 0.0 0.002025928866827085 8.776629921270553e-5 0.0006581320477483928 0.0 0.0 0.0 0.0 0.0 0.0018964989185212523 0.0 0.00038209984584630955 0.0014458860558547028 0.0006333530551765767 0.0 0.0018660162430173934 0.00019424565526117982 0.006695748302560984 0.0 0.0 0.0 0.0 0.002594251029092963 0.00802039883981044 0.0 Bishop Talbert Swan
8 0.0 0.04518022359918355 9.901165630897684e-10 0.0 0.002479099334911487 0.0 0.024890882787008427 0.04986101102844383 0.005343184235990782 0.0 0.011429581398605152 0.00020674685947477575 0.0103953275155155 0.0 0.0 0.0 0.011325671937118725 0.07149284019904631 0.024892527128397273 0.03353523124804041 0.0 0.08534197831653251 0.0 0.0 0.027820842745634688 0.0 0.0 0.0 0.05804196588066303 0.0 0.0 0.01998466460025582 0.004647780777987694 0.0 0.014294323094792446 0.05800013243184003 0.0 0.0 0.013591507880039917 0.0 0.024724107622598065 1.1869259060345287e-19 0.0 0.0 0.0 0.006262468748888978 0.0 0.05543410132789589 0.0 0.04887137090970813 0.0 0.0007788165647688682 0.0 0.0 0.0 0.050187806617375416 0.013096040042260051 0.01989925045367709 0.0 0.0 NadelParis
9 0.12376719906865302 0.0 0.0 0.19564145265852595 0.0 0.0 0.0 0.2165843169258248 0.014208239318267167 0.08910275054044048 0.0 0.0 0.04722566221460834 0.004080310092706528 0.0 0.09758453517481964 0.0 0.21843914061600594 0.08724514295553207 0.15560248176801728 0.0 0.0 0.17720710784201224 0.0041316371291309625 0.0 0.16161611378574364 0.0 0.0 0.201735419245724 0.0030575955987884934 0.0 0.06787911498543787 0.0 0.1649389280626942 0.0 0.0 0.0 0.004558901633675444 0.0 0.0 0.0 0.0013791879830501335 0.0 0.09934706895693526 0.0 0.0 0.0 0.0 0.11486295755815844 0.1998184284610503 0.0 0.003158214605868633 0.09320449989894602 0.0 0.0 0.0 0.06420821979915595 0.0964917155223417 0.0 0.06096894985040057 Buster Brown
10 0.0006302122970406467 0.0 0.0 0.002930957099592802 0.0 0.00010991332101195628 0.0 0.0 0.0 0.0055263328725501945 0.0 0.0 0.0 5.070940608576437e-111 0.0 0.0023343973799688704 0.004127633621725951 0.0006671644998917521 7.2232019446884e-8 5.772973437045301e-5 0.0018521188304016923 0.0 0.0 3.1330272313714247e-49 0.0 0.0 0.0001839835938070411 0.0 8.752101699406091e-5 0.0 0.07275899481941522 0.0 5.495776547174534e-227 0.0 0.00011684876508815942 0.0 0.0003589721220444513 0.0 8.277897290652263e-37 0.0 0.0 5.336674395654321e-23 9.995083574115849e-5 0.0 0.00012388637668221946 0.0 0.0 0.0 0.0 0.00016891524375577222 0.0 0.0 1.0818763300871864e-24 0.0 0.0 0.0 0.0 0.00014465847971916363 0.0 1.144927345117208e-23 AdolescentIdle



In [ ]:

	name	followers
1	GavaironJ	5
2	bocchijoto	1834
3	cannabinolsen	1
4	angelman61	32
5	alex_latrice21	199
6	turnipkween	242
7	EveMorante	747
8	mwutley	113
9	LetsCllnk	59
10	positivelytaco	173
11	SachaStein	171
12	andino__20	155
13	Bonduran1	598
14	pretocaetano	259
15	TheLos	967
16	LaylaGerhart	4
17	stolethetart	34
18	aryalptara	450
19	asvpxstephaniex	107
20	Doreen58	84
21	ivysharIey	274
22	YSemerel	8
23	LVIaLondres	549
24	monsterfromars	856
25	SassyBroncoFan	11
26	karururo	74
27	thaecn	11
28	Raulggrc	641
29	ZireLLi_B	285
30	tamtinke2	114
&vellip	&vellip	&vellip

	name	followers
1	MileyCyrus	31598990
2	TheEconomist	18303980
3	POTUS	14277895
4	funnyordie	13936034
5	TIME	12715214
6	ArvindKejriwal	10276363
7	SarahKSilverman	9776677
8	jk_rowling	9056612
9	HuffingtonPost	8868956
10	people	7546839
11	lemondefr	6668668
12	NPR	6584109
13	PerezHilton	6560967
14	guardian	6210222
15	EW	6031204
16	lilyallen	5905870
17	piersmorgan	5433143
18	RedHourBen	5225214
19	htTweets	4999547
20	TheFunnyTeens	4590964
21	billboard	4434723
22	dumbassgenius	4383367
23	hitRECordJoe	4164075
24	todonoticias	4037759
25	DannyDeVito	3967433
26	jack	3960340
27	SkyNews	3762095
28	MMFlint	3736617
29	IndiaToday	3687969
30	BritishVogue	3472942
&vellip	&vellip	&vellip

	x1	x2	x3	x4	x5	x6	x7	x8	x9	x10	x11	x12	x13	x14	x15	x16	x17	x18	x19	x20	x21	x22	x23	x24	x25	x26	x27	x28	x29	x30	x31	x32	x33	x34	x35	x36	x37	x38	x39	x40	x41	x42	x43	x44	x45	x46	x47	x48	x49	x50	x51	x52	x53	x54	x56	x57	x58	x59	x60	name
1	0.0	0.0	0.0	0.0	0.0051725596147227	0.026945830598873732	0.10775474686882859	0.0	0.0	0.0	0.0	0.0	0.0	0.0	0.0003681329605147508	0.05019964953095866	0.0	0.01634360690677292	0.2769832659687579	0.0	0.0	0.0	0.011138582784611212	0.0	0.0	0.0	0.0	0.050674768950433255	0.0	0.0	0.0	0.011685303315783595	5.982337113625717e-7	0.025341281084838997	0.0	0.1397876310794631	0.0	2.557728206998708e-50	0.022798613032828093	0.11137848732635668	0.033592642112617435	1.1281923594343566e-20	0.0	0.0	0.0	0.00031783142602080953	0.0	0.0	0.0	0.08351004447658451	0.009862793276377544	0.0015407854886804928	0.014428228467605742	0.0	0.01562588099842397	0.0	0.03947191471247384	0.09654327952085223	0.025225820001461275	Deborah87958167
2	0.049580753988165444	0.2508836444918074	0.0	0.0	0.0	0.0	0.04489051981720582	0.1469489793379341	0.006060481798182574	0.029514101635304844	0.0890455518754558	0.0	0.0	0.0	0.0002022396002893607	0.005661225864393524	0.0	0.0	0.0	0.0	0.0	0.058310273766597205	0.0	0.0	0.0	0.0	0.3711326910656078	0.0	0.18335415663300975	0.0	0.0	0.0	0.0033604598334223044	0.0	0.0	0.0	0.0	0.0	0.04542499610223528	0.07414130821506772	0.08966204938609933	0.0	0.11555116359807116	0.0	0.17541942420018627	0.0	0.0	0.0	0.0	0.2132898499804196	0.0	0.0031261188507839795	0.0	0.07288551281835083	0.08977849524134132	0.0	0.05134670979062862	0.08354029060885172	0.0	texasfarmgirl1836
3	0.0	8.713427609010385e-9	0.0	0.0	2.506603772409537e-16	0.0014415837633974843	0.009184575106136393	0.0014634597958376704	0.0	0.0	1.4087849542070368e-9	3.0556874831156914e-6	0.0	2.081966235264321e-18	0.0	0.020324572789786673	0.0	0.0	0.0	0.0	0.0	0.0	0.016042098750867012	0.0	0.0	5.010620238826393e-7	0.0	0.006732738181303161	0.0	0.004281777076742496	0.0483308829964388	0.0	1.7176459235562508e-11	0.0	0.0	0.0	0.007889798225674597	3.1674231391041387e-9	0.028718489356872427	0.0	0.0	0.0	0.0	0.0	0.0	0.0	0.0021219079093766796	4.806771499892348e-9	0.0	0.0034717900607107335	3.0484456781940202e-5	2.9008845144491245e-12	0.0	0.0	0.0	0.0017901387836809907	0.0	0.0	0.0	Squatch
4	0.0	0.0	0.0	0.0	6.757009503150856e-9	0.0	0.004290304298363777	0.0	0.0	0.0	0.0	0.0	0.0	0.0	0.0	5.349674366843527e-8	0.0	1.8740760403039192e-19	0.0	0.0	0.0	0.0	2.647414737804112e-16	0.0	0.0	0.0	0.0	7.659799678820569e-12	0.0	0.0	0.0	6.995064178052164e-13	0.0	4.167343897568493e-10	0.0	0.0	0.0	0.0	0.0	0.0	3.690302282820236e-9	6.2441708347947e-253	0.0	0.0	0.0	3.9245758136038415e-24	0.0	0.0	0.0	4.468493945327262e-6	0.0	3.943752366065573e-7	0.0	0.0	0.0	0.0	3.399631642317278e-9	0.0	0.00033363499990994886	Lu Who
5	0.0	0.0	2.978697870558589e-20	0.05610419050580491	0.0	0.0	0.1006611078941685	0.0	0.0	0.0	0.0017628746836431215	1.844669806182308e-20	0.002818507875767357	0.0	0.0	0.0	0.0291893271717699	0.0	0.2695722422915973	0.0	0.029762575540874536	0.07906190763660918	0.0	0.0	0.0	0.0	0.0	0.0	0.0	0.046634138804370874	0.0	0.0	0.0	0.0	0.0	0.16956119494466845	0.0	4.626771949675073e-103	0.0	0.0	0.0	8.911343599386976e-17	0.0	0.0	0.05665828725416513	0.0004112506664022114	0.0	0.02254564482163113	0.0	0.0542322502647718	0.004808077603267288	0.0011385726686938334	0.0	0.014768789225195375	0.0	0.0008794133262373876	0.044051796341177264	0.0862211039196512	0.0	SongsOfLaredo
6	0.009181913913791745	0.0	1.1601476735579242e-5	0.0	0.00035113379363617604	0.010457945596979469	0.01890423467102866	0.024182000824113852	0.0081186890821123	0.019336573934026782	0.0	0.0	0.0020369611070950775	0.0002501484514695846	0.0	0.0	0.007764641419741867	0.0	0.07971543948692807	0.014415242658270294	0.03100934410246285	0.0	0.025303611760274857	0.0	0.04141569848179266	0.01773688481428575	0.028663842332646797	0.0	0.023666765466495245	0.0	0.045465174523809285	0.017773289768186835	0.0003725663814940007	0.02036893439985751	0.0	0.0	0.01496255824068227	0.00030803357641239984	0.010958580847009208	0.017470724831291008	0.0	0.0	0.0204814971584374	0.0	0.0	0.0	0.005035069648163644	0.0	0.010079617761172522	0.02972699720470811	0.0	0.00015112658916434333	0.0	0.0020671534594210554	0.0	0.0	0.0051867768069129554	0.0	0.006842609054683921	Diva
7	0.0	0.0	2.3967158997252667e-60	0.0026379852716760218	0.0	0.001282763077187216	0.0	0.002326131250786013	0.000625355234237181	0.0009767573238737871	0.0	7.193653953955475e-22	0.0	5.78946163199559e-5	0.0001288921913390062	0.00245653371747196	0.0007506580977638626	0.0021812525491235993	0.0	0.0020837798871042156	0.0	0.0029422896365983776	0.0	0.000272685521605035	0.0007651872749692171	0.006682360157414971	0.006692463902183609	0.002548762373939285	0.0	0.0	0.0	0.0005859831123454848	0.0	0.0015597661737651227	0.001645000586493498	0.0	0.002025928866827085	8.776629921270553e-5	0.0006581320477483928	0.0	0.0	0.0	0.0	0.0	0.0018964989185212523	0.0	0.00038209984584630955	0.0014458860558547028	0.0006333530551765767	0.0	0.0018660162430173934	0.00019424565526117982	0.006695748302560984	0.0	0.0	0.0	0.002594251029092963	0.00802039883981044	0.0	Bishop Talbert Swan
8	0.0	0.04518022359918355	9.901165630897684e-10	0.0	0.002479099334911487	0.0	0.024890882787008427	0.04986101102844383	0.005343184235990782	0.0	0.011429581398605152	0.00020674685947477575	0.0103953275155155	0.0	0.0	0.0	0.011325671937118725	0.07149284019904631	0.024892527128397273	0.03353523124804041	0.0	0.08534197831653251	0.0	0.0	0.027820842745634688	0.0	0.0	0.0	0.05804196588066303	0.0	0.0	0.01998466460025582	0.004647780777987694	0.0	0.014294323094792446	0.05800013243184003	0.0	0.0	0.013591507880039917	0.0	0.024724107622598065	1.1869259060345287e-19	0.0	0.0	0.0	0.006262468748888978	0.0	0.05543410132789589	0.0	0.04887137090970813	0.0	0.0007788165647688682	0.0	0.0	0.050187806617375416	0.013096040042260051	0.01989925045367709	0.0	0.0	NadelParis
9	0.12376719906865302	0.0	0.0	0.19564145265852595	0.0	0.0	0.0	0.2165843169258248	0.014208239318267167	0.08910275054044048	0.0	0.0	0.04722566221460834	0.004080310092706528	0.0	0.09758453517481964	0.0	0.21843914061600594	0.08724514295553207	0.15560248176801728	0.0	0.0	0.17720710784201224	0.0041316371291309625	0.0	0.16161611378574364	0.0	0.0	0.201735419245724	0.0030575955987884934	0.0	0.06787911498543787	0.0	0.1649389280626942	0.0	0.0	0.0	0.004558901633675444	0.0	0.0	0.0	0.0013791879830501335	0.0	0.09934706895693526	0.0	0.0	0.0	0.0	0.11486295755815844	0.1998184284610503	0.0	0.003158214605868633	0.09320449989894602	0.0	0.0	0.06420821979915595	0.0964917155223417	0.0	0.06096894985040057	Buster Brown
10	0.0006302122970406467	0.0	0.0	0.002930957099592802	0.0	0.00010991332101195628	0.0	0.0	0.0	0.0055263328725501945	0.0	0.0	0.0	5.070940608576437e-111	0.0	0.0023343973799688704	0.004127633621725951	0.0006671644998917521	7.2232019446884e-8	5.772973437045301e-5	0.0018521188304016923	0.0	0.0	3.1330272313714247e-49	0.0	0.0	0.0001839835938070411	0.0	8.752101699406091e-5	0.0	0.07275899481941522	0.0	5.495776547174534e-227	0.0	0.00011684876508815942	0.0	0.0003589721220444513	0.0	8.277897290652263e-37	0.0	0.0	5.336674395654321e-23	9.995083574115849e-5	0.0	0.00012388637668221946	0.0	0.0	0.0	0.0	0.00016891524375577222	0.0	0.0	1.0818763300871864e-24	0.0	0.0	0.0	0.00014465847971916363	0.0	1.144927345117208e-23	AdolescentIdle