Learning to Transform JSON WANE files into network graph files

This notebook contains an early exploration of WANE files.

The inital files were examples taken from the Internet Archive documentation for WANE files.

This is basically a learning file for using JSON to work with the WANE files, eventually leading to exporting the WANE data into graph files for use with Gephi.



In [2]:

    
import json
import csv



In [3]:

    
data = []
for line in open('wane1.json', 'r'):
    data.append(json.loads(line))



In [4]:

    
data[1]









    Out[4]:





{'digest': 'sha1:W5D7CYMHTMSQR6RRYLBJZXJIQPC5PJ2S',
 'named_entities': {'locations': [''],
  'organizations': [''],
  'persons': ['UltraLinx']},
 'timestamp': '20141019212349',
 'url': 'http://finitebeings.tumblr.com/post/93990513608/5k-race-for-the-cure-funny?route=%2Fpost%2F%3Aid%2F%3Asummary'}



In [5]:

    
len(data)









    Out[5]:





3



In [6]:

    
for item in data:
    print(['url'])









    



['url']
['url']
['url']



In [7]:

    
for item in data:
    print(item['url'])









    



http://dissonantwinstonsmith.wordpress.com/2014/08/24/im-sick-of/?like_comment=79&_wpnonce=0fc57aa499&replytocom=93
http://finitebeings.tumblr.com/post/93990513608/5k-race-for-the-cure-funny?route=%2Fpost%2F%3Aid%2F%3Asummary
http://www.studlife.com/archives/Sports/2006/07/25/MaintainingsomeSouthBendontheSouthHowtobeatrueWUsportsfan/



In [8]:

    
type(data)









    Out[8]:





list



In [9]:

    
for item in data:
    print(item['digest'])









    



sha1:747IKFWUCVQVXY7TX2NMYFL422T4TRQX
sha1:W5D7CYMHTMSQR6RRYLBJZXJIQPC5PJ2S
sha1:QBXYTSBSEMRYTL47FSNPZ3JNC4Q3WCSZ



In [10]:

    
for item in data:
    print(item['named_entities'])









    



{'organizations': ['Dissonant Winston Smith Dissonant Winston Smith Menu Skip', 'Twitter Facebook Google', 'Google', 'Facebook', 'Wal-Mart', 'CNN', 'Bearcats'], 'locations': ['North County', 'America', 'St. Louis County St. Louis County Police St. Louis County', 'St. Louis', 'WordPress.com', 'Middle East'], 'persons': ['Stell', 'Tom Jackson', 'Smith', 'Pamela Fillingim', 'Darren Wilson Eric Fowler Eric Vickers Ferguson Ferguson', 'Ferguson', 'Rob Crawford', 'Kley', 'Erin Miller', 'darren wilson', 'Mike', 'Daniel Garrelts', 'Darren Wilson', 'Rath', 'Ellis Wyatt', 'Nick', 'Wilson', 'Mike Browns', 'Trayvon', 'Jane Jacoby', 'Kley Potter', 'Mike Brown', 'Michael', 'Michael Brown', 'Angela', 'Pablo', 'Jon Stewart', 'George Zimmerman Jamilah Nasheed KTVI', 'mike brown', 'Heather', 'Pamela fillingim', 'pamela fillingim', 'Susan']}
{'organizations': [''], 'locations': [''], 'persons': ['UltraLinx']}
{'organizations': ['Student Life Archives', 'Edition Student Life Breaking News Alerts Student Life Weekly Digest Student Life', 'University of Texas', 'Washington University', 'Facebook', 'Gators', 'UF', 'Virginia Tech'], 'locations': ['Miami', 'Virginia', 'Fort Lauderdale', 'Wash.', 'Va.', 'Blacksburg', 'St. Louis', 'Clayton', 'Fla.', 'Chapel Hill', 'Michigan State', 'Austin', 'North Carolina', 'Michigan'], 'persons': ['Scott Kaufman-Ross', 'Jim Druckenmiller', 'Ann Arbor', 'Sagartz', 'Scott Stern', 'Michael Vick']}



In [11]:

    
for item in data:
    print(item['named_entities']['persons'])









    



['Stell', 'Tom Jackson', 'Smith', 'Pamela Fillingim', 'Darren Wilson Eric Fowler Eric Vickers Ferguson Ferguson', 'Ferguson', 'Rob Crawford', 'Kley', 'Erin Miller', 'darren wilson', 'Mike', 'Daniel Garrelts', 'Darren Wilson', 'Rath', 'Ellis Wyatt', 'Nick', 'Wilson', 'Mike Browns', 'Trayvon', 'Jane Jacoby', 'Kley Potter', 'Mike Brown', 'Michael', 'Michael Brown', 'Angela', 'Pablo', 'Jon Stewart', 'George Zimmerman Jamilah Nasheed KTVI', 'mike brown', 'Heather', 'Pamela fillingim', 'pamela fillingim', 'Susan']
['UltraLinx']
['Scott Kaufman-Ross', 'Jim Druckenmiller', 'Ann Arbor', 'Sagartz', 'Scott Stern', 'Michael Vick']



In [12]:

    
for item in data:
    print(item['named_entities']['organizations'])









    



['Dissonant Winston Smith Dissonant Winston Smith Menu Skip', 'Twitter Facebook Google', 'Google', 'Facebook', 'Wal-Mart', 'CNN', 'Bearcats']
['']
['Student Life Archives', 'Edition Student Life Breaking News Alerts Student Life Weekly Digest Student Life', 'University of Texas', 'Washington University', 'Facebook', 'Gators', 'UF', 'Virginia Tech']



In [13]:

    
for item in data:
    print(item['named_entities']['locations'])









    



['North County', 'America', 'St. Louis County St. Louis County Police St. Louis County', 'St. Louis', 'WordPress.com', 'Middle East']
['']
['Miami', 'Virginia', 'Fort Lauderdale', 'Wash.', 'Va.', 'Blacksburg', 'St. Louis', 'Clayton', 'Fla.', 'Chapel Hill', 'Michigan State', 'Austin', 'North Carolina', 'Michigan']



In [14]:

    
type(data[2]['named_entities']['locations'])









    Out[14]:





list



In [15]:

    
data[1]['url']









    Out[15]:





'http://finitebeings.tumblr.com/post/93990513608/5k-race-for-the-cure-funny?route=%2Fpost%2F%3Aid%2F%3Asummary'

Moving to using networkx for generating graphs in Python and exporting to Gephi

So I'm reasonably confident about importing the JSON data at this point and accessing the different items in the data structure. Now the next step is putting this into a graph.



In [16]:

    
import networkx as nx
G=nx.Graph()



In [17]:

    
for item in data:
    G.add_node(item['url'])



In [18]:

    
G.number_of_nodes()









    Out[18]:





3



In [19]:

    
G.nodes()









    Out[19]:





['http://www.studlife.com/archives/Sports/2006/07/25/MaintainingsomeSouthBendontheSouthHowtobeatrueWUsportsfan/',
 'http://dissonantwinstonsmith.wordpress.com/2014/08/24/im-sick-of/?like_comment=79&_wpnonce=0fc57aa499&replytocom=93',
 'http://finitebeings.tumblr.com/post/93990513608/5k-race-for-the-cure-funny?route=%2Fpost%2F%3Aid%2F%3Asummary']



In [20]:

    
for item in data:
    G.add_nodes_from(item['named_entities']['persons'])



In [21]:

    
edges = []
for item in data:
    for index in range(len(item['named_entities']['persons'])):
        l = [[item['url'], item['named_entities']['persons'][index]]]
        edges.extend(tuple(l))



In [22]:

    
print(data[0]['named_entities']['persons'][0])









    



Stell



In [23]:

    
print(edges[3])









    



['http://dissonantwinstonsmith.wordpress.com/2014/08/24/im-sick-of/?like_comment=79&_wpnonce=0fc57aa499&replytocom=93', 'Pamela Fillingim']



In [24]:

    
edges









    Out[24]:





[['http://dissonantwinstonsmith.wordpress.com/2014/08/24/im-sick-of/?like_comment=79&_wpnonce=0fc57aa499&replytocom=93',
  'Stell'],
 ['http://dissonantwinstonsmith.wordpress.com/2014/08/24/im-sick-of/?like_comment=79&_wpnonce=0fc57aa499&replytocom=93',
  'Tom Jackson'],
 ['http://dissonantwinstonsmith.wordpress.com/2014/08/24/im-sick-of/?like_comment=79&_wpnonce=0fc57aa499&replytocom=93',
  'Smith'],
 ['http://dissonantwinstonsmith.wordpress.com/2014/08/24/im-sick-of/?like_comment=79&_wpnonce=0fc57aa499&replytocom=93',
  'Pamela Fillingim'],
 ['http://dissonantwinstonsmith.wordpress.com/2014/08/24/im-sick-of/?like_comment=79&_wpnonce=0fc57aa499&replytocom=93',
  'Darren Wilson Eric Fowler Eric Vickers Ferguson Ferguson'],
 ['http://dissonantwinstonsmith.wordpress.com/2014/08/24/im-sick-of/?like_comment=79&_wpnonce=0fc57aa499&replytocom=93',
  'Ferguson'],
 ['http://dissonantwinstonsmith.wordpress.com/2014/08/24/im-sick-of/?like_comment=79&_wpnonce=0fc57aa499&replytocom=93',
  'Rob Crawford'],
 ['http://dissonantwinstonsmith.wordpress.com/2014/08/24/im-sick-of/?like_comment=79&_wpnonce=0fc57aa499&replytocom=93',
  'Kley'],
 ['http://dissonantwinstonsmith.wordpress.com/2014/08/24/im-sick-of/?like_comment=79&_wpnonce=0fc57aa499&replytocom=93',
  'Erin Miller'],
 ['http://dissonantwinstonsmith.wordpress.com/2014/08/24/im-sick-of/?like_comment=79&_wpnonce=0fc57aa499&replytocom=93',
  'darren wilson'],
 ['http://dissonantwinstonsmith.wordpress.com/2014/08/24/im-sick-of/?like_comment=79&_wpnonce=0fc57aa499&replytocom=93',
  'Mike'],
 ['http://dissonantwinstonsmith.wordpress.com/2014/08/24/im-sick-of/?like_comment=79&_wpnonce=0fc57aa499&replytocom=93',
  'Daniel Garrelts'],
 ['http://dissonantwinstonsmith.wordpress.com/2014/08/24/im-sick-of/?like_comment=79&_wpnonce=0fc57aa499&replytocom=93',
  'Darren Wilson'],
 ['http://dissonantwinstonsmith.wordpress.com/2014/08/24/im-sick-of/?like_comment=79&_wpnonce=0fc57aa499&replytocom=93',
  'Rath'],
 ['http://dissonantwinstonsmith.wordpress.com/2014/08/24/im-sick-of/?like_comment=79&_wpnonce=0fc57aa499&replytocom=93',
  'Ellis Wyatt'],
 ['http://dissonantwinstonsmith.wordpress.com/2014/08/24/im-sick-of/?like_comment=79&_wpnonce=0fc57aa499&replytocom=93',
  'Nick'],
 ['http://dissonantwinstonsmith.wordpress.com/2014/08/24/im-sick-of/?like_comment=79&_wpnonce=0fc57aa499&replytocom=93',
  'Wilson'],
 ['http://dissonantwinstonsmith.wordpress.com/2014/08/24/im-sick-of/?like_comment=79&_wpnonce=0fc57aa499&replytocom=93',
  'Mike Browns'],
 ['http://dissonantwinstonsmith.wordpress.com/2014/08/24/im-sick-of/?like_comment=79&_wpnonce=0fc57aa499&replytocom=93',
  'Trayvon'],
 ['http://dissonantwinstonsmith.wordpress.com/2014/08/24/im-sick-of/?like_comment=79&_wpnonce=0fc57aa499&replytocom=93',
  'Jane Jacoby'],
 ['http://dissonantwinstonsmith.wordpress.com/2014/08/24/im-sick-of/?like_comment=79&_wpnonce=0fc57aa499&replytocom=93',
  'Kley Potter'],
 ['http://dissonantwinstonsmith.wordpress.com/2014/08/24/im-sick-of/?like_comment=79&_wpnonce=0fc57aa499&replytocom=93',
  'Mike Brown'],
 ['http://dissonantwinstonsmith.wordpress.com/2014/08/24/im-sick-of/?like_comment=79&_wpnonce=0fc57aa499&replytocom=93',
  'Michael'],
 ['http://dissonantwinstonsmith.wordpress.com/2014/08/24/im-sick-of/?like_comment=79&_wpnonce=0fc57aa499&replytocom=93',
  'Michael Brown'],
 ['http://dissonantwinstonsmith.wordpress.com/2014/08/24/im-sick-of/?like_comment=79&_wpnonce=0fc57aa499&replytocom=93',
  'Angela'],
 ['http://dissonantwinstonsmith.wordpress.com/2014/08/24/im-sick-of/?like_comment=79&_wpnonce=0fc57aa499&replytocom=93',
  'Pablo'],
 ['http://dissonantwinstonsmith.wordpress.com/2014/08/24/im-sick-of/?like_comment=79&_wpnonce=0fc57aa499&replytocom=93',
  'Jon Stewart'],
 ['http://dissonantwinstonsmith.wordpress.com/2014/08/24/im-sick-of/?like_comment=79&_wpnonce=0fc57aa499&replytocom=93',
  'George Zimmerman Jamilah Nasheed KTVI'],
 ['http://dissonantwinstonsmith.wordpress.com/2014/08/24/im-sick-of/?like_comment=79&_wpnonce=0fc57aa499&replytocom=93',
  'mike brown'],
 ['http://dissonantwinstonsmith.wordpress.com/2014/08/24/im-sick-of/?like_comment=79&_wpnonce=0fc57aa499&replytocom=93',
  'Heather'],
 ['http://dissonantwinstonsmith.wordpress.com/2014/08/24/im-sick-of/?like_comment=79&_wpnonce=0fc57aa499&replytocom=93',
  'Pamela fillingim'],
 ['http://dissonantwinstonsmith.wordpress.com/2014/08/24/im-sick-of/?like_comment=79&_wpnonce=0fc57aa499&replytocom=93',
  'pamela fillingim'],
 ['http://dissonantwinstonsmith.wordpress.com/2014/08/24/im-sick-of/?like_comment=79&_wpnonce=0fc57aa499&replytocom=93',
  'Susan'],
 ['http://finitebeings.tumblr.com/post/93990513608/5k-race-for-the-cure-funny?route=%2Fpost%2F%3Aid%2F%3Asummary',
  'UltraLinx'],
 ['http://www.studlife.com/archives/Sports/2006/07/25/MaintainingsomeSouthBendontheSouthHowtobeatrueWUsportsfan/',
  'Scott Kaufman-Ross'],
 ['http://www.studlife.com/archives/Sports/2006/07/25/MaintainingsomeSouthBendontheSouthHowtobeatrueWUsportsfan/',
  'Jim Druckenmiller'],
 ['http://www.studlife.com/archives/Sports/2006/07/25/MaintainingsomeSouthBendontheSouthHowtobeatrueWUsportsfan/',
  'Ann Arbor'],
 ['http://www.studlife.com/archives/Sports/2006/07/25/MaintainingsomeSouthBendontheSouthHowtobeatrueWUsportsfan/',
  'Sagartz'],
 ['http://www.studlife.com/archives/Sports/2006/07/25/MaintainingsomeSouthBendontheSouthHowtobeatrueWUsportsfan/',
  'Scott Stern'],
 ['http://www.studlife.com/archives/Sports/2006/07/25/MaintainingsomeSouthBendontheSouthHowtobeatrueWUsportsfan/',
  'Michael Vick']]



In [25]:

    
G.add_edges_from(edges)



In [26]:

    
G.edges()









    Out[26]:





[('Michael',
  'http://dissonantwinstonsmith.wordpress.com/2014/08/24/im-sick-of/?like_comment=79&_wpnonce=0fc57aa499&replytocom=93'),
 ('Jim Druckenmiller',
  'http://www.studlife.com/archives/Sports/2006/07/25/MaintainingsomeSouthBendontheSouthHowtobeatrueWUsportsfan/'),
 ('Jon Stewart',
  'http://dissonantwinstonsmith.wordpress.com/2014/08/24/im-sick-of/?like_comment=79&_wpnonce=0fc57aa499&replytocom=93'),
 ('http://www.studlife.com/archives/Sports/2006/07/25/MaintainingsomeSouthBendontheSouthHowtobeatrueWUsportsfan/',
  'Scott Kaufman-Ross'),
 ('http://www.studlife.com/archives/Sports/2006/07/25/MaintainingsomeSouthBendontheSouthHowtobeatrueWUsportsfan/',
  'Michael Vick'),
 ('http://www.studlife.com/archives/Sports/2006/07/25/MaintainingsomeSouthBendontheSouthHowtobeatrueWUsportsfan/',
  'Sagartz'),
 ('http://www.studlife.com/archives/Sports/2006/07/25/MaintainingsomeSouthBendontheSouthHowtobeatrueWUsportsfan/',
  'Ann Arbor'),
 ('http://www.studlife.com/archives/Sports/2006/07/25/MaintainingsomeSouthBendontheSouthHowtobeatrueWUsportsfan/',
  'Scott Stern'),
 ('UltraLinx',
  'http://finitebeings.tumblr.com/post/93990513608/5k-race-for-the-cure-funny?route=%2Fpost%2F%3Aid%2F%3Asummary'),
 ('Ferguson',
  'http://dissonantwinstonsmith.wordpress.com/2014/08/24/im-sick-of/?like_comment=79&_wpnonce=0fc57aa499&replytocom=93'),
 ('Heather',
  'http://dissonantwinstonsmith.wordpress.com/2014/08/24/im-sick-of/?like_comment=79&_wpnonce=0fc57aa499&replytocom=93'),
 ('darren wilson',
  'http://dissonantwinstonsmith.wordpress.com/2014/08/24/im-sick-of/?like_comment=79&_wpnonce=0fc57aa499&replytocom=93'),
 ('Jane Jacoby',
  'http://dissonantwinstonsmith.wordpress.com/2014/08/24/im-sick-of/?like_comment=79&_wpnonce=0fc57aa499&replytocom=93'),
 ('Michael Brown',
  'http://dissonantwinstonsmith.wordpress.com/2014/08/24/im-sick-of/?like_comment=79&_wpnonce=0fc57aa499&replytocom=93'),
 ('Erin Miller',
  'http://dissonantwinstonsmith.wordpress.com/2014/08/24/im-sick-of/?like_comment=79&_wpnonce=0fc57aa499&replytocom=93'),
 ('pamela fillingim',
  'http://dissonantwinstonsmith.wordpress.com/2014/08/24/im-sick-of/?like_comment=79&_wpnonce=0fc57aa499&replytocom=93'),
 ('Nick',
  'http://dissonantwinstonsmith.wordpress.com/2014/08/24/im-sick-of/?like_comment=79&_wpnonce=0fc57aa499&replytocom=93'),
 ('Mike',
  'http://dissonantwinstonsmith.wordpress.com/2014/08/24/im-sick-of/?like_comment=79&_wpnonce=0fc57aa499&replytocom=93'),
 ('Darren Wilson Eric Fowler Eric Vickers Ferguson Ferguson',
  'http://dissonantwinstonsmith.wordpress.com/2014/08/24/im-sick-of/?like_comment=79&_wpnonce=0fc57aa499&replytocom=93'),
 ('Mike Brown',
  'http://dissonantwinstonsmith.wordpress.com/2014/08/24/im-sick-of/?like_comment=79&_wpnonce=0fc57aa499&replytocom=93'),
 ('Stell',
  'http://dissonantwinstonsmith.wordpress.com/2014/08/24/im-sick-of/?like_comment=79&_wpnonce=0fc57aa499&replytocom=93'),
 ('Kley',
  'http://dissonantwinstonsmith.wordpress.com/2014/08/24/im-sick-of/?like_comment=79&_wpnonce=0fc57aa499&replytocom=93'),
 ('Pamela Fillingim',
  'http://dissonantwinstonsmith.wordpress.com/2014/08/24/im-sick-of/?like_comment=79&_wpnonce=0fc57aa499&replytocom=93'),
 ('Ellis Wyatt',
  'http://dissonantwinstonsmith.wordpress.com/2014/08/24/im-sick-of/?like_comment=79&_wpnonce=0fc57aa499&replytocom=93'),
 ('Smith',
  'http://dissonantwinstonsmith.wordpress.com/2014/08/24/im-sick-of/?like_comment=79&_wpnonce=0fc57aa499&replytocom=93'),
 ('http://dissonantwinstonsmith.wordpress.com/2014/08/24/im-sick-of/?like_comment=79&_wpnonce=0fc57aa499&replytocom=93',
  'Angela'),
 ('http://dissonantwinstonsmith.wordpress.com/2014/08/24/im-sick-of/?like_comment=79&_wpnonce=0fc57aa499&replytocom=93',
  'Trayvon'),
 ('http://dissonantwinstonsmith.wordpress.com/2014/08/24/im-sick-of/?like_comment=79&_wpnonce=0fc57aa499&replytocom=93',
  'Pamela fillingim'),
 ('http://dissonantwinstonsmith.wordpress.com/2014/08/24/im-sick-of/?like_comment=79&_wpnonce=0fc57aa499&replytocom=93',
  'Rob Crawford'),
 ('http://dissonantwinstonsmith.wordpress.com/2014/08/24/im-sick-of/?like_comment=79&_wpnonce=0fc57aa499&replytocom=93',
  'Daniel Garrelts'),
 ('http://dissonantwinstonsmith.wordpress.com/2014/08/24/im-sick-of/?like_comment=79&_wpnonce=0fc57aa499&replytocom=93',
  'Rath'),
 ('http://dissonantwinstonsmith.wordpress.com/2014/08/24/im-sick-of/?like_comment=79&_wpnonce=0fc57aa499&replytocom=93',
  'Susan'),
 ('http://dissonantwinstonsmith.wordpress.com/2014/08/24/im-sick-of/?like_comment=79&_wpnonce=0fc57aa499&replytocom=93',
  'Pablo'),
 ('http://dissonantwinstonsmith.wordpress.com/2014/08/24/im-sick-of/?like_comment=79&_wpnonce=0fc57aa499&replytocom=93',
  'Wilson'),
 ('http://dissonantwinstonsmith.wordpress.com/2014/08/24/im-sick-of/?like_comment=79&_wpnonce=0fc57aa499&replytocom=93',
  'Kley Potter'),
 ('http://dissonantwinstonsmith.wordpress.com/2014/08/24/im-sick-of/?like_comment=79&_wpnonce=0fc57aa499&replytocom=93',
  'Darren Wilson'),
 ('http://dissonantwinstonsmith.wordpress.com/2014/08/24/im-sick-of/?like_comment=79&_wpnonce=0fc57aa499&replytocom=93',
  'George Zimmerman Jamilah Nasheed KTVI'),
 ('http://dissonantwinstonsmith.wordpress.com/2014/08/24/im-sick-of/?like_comment=79&_wpnonce=0fc57aa499&replytocom=93',
  'Mike Browns'),
 ('http://dissonantwinstonsmith.wordpress.com/2014/08/24/im-sick-of/?like_comment=79&_wpnonce=0fc57aa499&replytocom=93',
  'Tom Jackson'),
 ('http://dissonantwinstonsmith.wordpress.com/2014/08/24/im-sick-of/?like_comment=79&_wpnonce=0fc57aa499&replytocom=93',
  'mike brown')]



In [27]:

    
sorted(nx.degree(G).values())









    Out[27]:





[1,
 1,
 1,
 1,
 1,
 1,
 1,
 1,
 1,
 1,
 1,
 1,
 1,
 1,
 1,
 1,
 1,
 1,
 1,
 1,
 1,
 1,
 1,
 1,
 1,
 1,
 1,
 1,
 1,
 1,
 1,
 1,
 1,
 1,
 1,
 1,
 1,
 1,
 1,
 1,
 1,
 6,
 33]



In [28]:

    
G.nodes()









    Out[28]:





['Michael',
 'Jim Druckenmiller',
 'Jon Stewart',
 'http://www.studlife.com/archives/Sports/2006/07/25/MaintainingsomeSouthBendontheSouthHowtobeatrueWUsportsfan/',
 'UltraLinx',
 'http://finitebeings.tumblr.com/post/93990513608/5k-race-for-the-cure-funny?route=%2Fpost%2F%3Aid%2F%3Asummary',
 'Ferguson',
 'Heather',
 'Scott Stern',
 'darren wilson',
 'Jane Jacoby',
 'Michael Brown',
 'Ann Arbor',
 'Erin Miller',
 'pamela fillingim',
 'Nick',
 'Sagartz',
 'Mike',
 'Darren Wilson Eric Fowler Eric Vickers Ferguson Ferguson',
 'Mike Brown',
 'Stell',
 'Kley',
 'Pamela Fillingim',
 'Ellis Wyatt',
 'Smith',
 'Scott Kaufman-Ross',
 'Michael Vick',
 'http://dissonantwinstonsmith.wordpress.com/2014/08/24/im-sick-of/?like_comment=79&_wpnonce=0fc57aa499&replytocom=93',
 'Trayvon',
 'Pamela fillingim',
 'Rob Crawford',
 'Daniel Garrelts',
 'Rath',
 'Angela',
 'Susan',
 'Pablo',
 'Wilson',
 'Kley Potter',
 'Darren Wilson',
 'George Zimmerman Jamilah Nasheed KTVI',
 'Mike Browns',
 'Tom Jackson',
 'mike brown']



In [30]:

    
nx.write_graphml(G,"./graph1.gml")