notebook.community

Edit and run



In [236]:

    
import asyncio
import aiohttp
import operator
import os
import numpy as np
import pandas as pd
import requests

from functools import wraps
from itertools import chain
from urllib.parse import urljoin



In [2]:

    
# Copied from pyencoded-tools/encodedcc.py to avoid dependency.
class ENC_Key:
    def __init__(self, keyfile, keyname):
        if os.path.isfile(str(keyfile)):
            keys_f = open(keyfile, 'r')
            keys_json_string = keys_f.read()
            keys_f.close()
            keys = json.loads(keys_json_string)
        else:
            keys = keyfile
        key_dict = keys[keyname]
        self.authid = key_dict['key']
        self.authpw = key_dict['secret']
        self.server = key_dict['server']
        if not self.server.endswith("/"):
            self.server += "/"

            
class ENC_Connection(object):
    def __init__(self, key):
        self.headers = {'content-type': 'application/json', 'accept': 'application/json'}
        self.server = key.server
        self.auth = (key.authid, key.authpw)



In [3]:

    
# Define key if private data desired.
key = ENC_Key(os.path.expanduser("~/keypairs.json"), 'prod')
auth = (key.authid, key.authpw)
base_url = 'https://www.encodeproject.org'
associated_search = urljoin(base_url, '/search/?type={}&{}={}&{}')
json_all = 'limit=all&format=json'
json_only = 'format=json'
request_auth = aiohttp.BasicAuth(key.authid, key.authpw)
loop = asyncio.get_event_loop()



In [4]:

    
def create_session():
    connector = aiohttp.TCPConnector(keepalive_timeout=100, limit=100)
    return aiohttp.ClientSession(connector=connector)



In [5]:

    
session = create_session()



In [93]:

    
# Utils.

def get_data(url):
    r = requests.get(url, auth=auth)
    try:
        assert r.status_code == 200
    except AssertionError as e:
        raise Exception(url, r.text) from e
    try:
        return r.json()['@graph']
    except KeyError:
        return r.json()

async def async_get_data(url, session, request_auth=request_auth):
    r = await session.get(url, auth=request_auth)
    try:
        assert r.status == 200
    except AssertionError as e:
        raise Exception(url, await r.text()) from e
    return await r.json()
     
def quick_grab_data(urls, session=session, loop=loop):
    f = [async_get_data(url, session) for url in urls]
    results = loop.run_until_complete(asyncio.gather(*f))
    try:
        return [subobject for item in results for subobject in item['@graph']]
    except KeyError:
        return results
    
def get_associated(item_type, related_field, related_ids):
    urls = [associated_search.format(item_type,
                                          related_field,
                                          related_id,
                                          json_all)
            for related_id in related_ids]
    return quick_grab_data(urls)

def print_relation(relation):
    for k, v in sorted(relation.items()):
        print('tech_rep', k,
              'in:', [(p[0], p[1]) for p in v['parents']],
              'out:', [(c[0], c[1]) for c in v['children']], end='\n\n')



In [7]:

    
#session.close()



In [235]:

    
operator_map = {'equals': operator.eq,
                'not_equals': operator.ne,
                'contains': operator.contains}

def process_stream(processors):
    """
    Apply all processors to stream. Requires yield_files(files) to be passed
    in as first item in list.
    """
    stream = ()
    for processor in processors:
        stream = processor(stream)
    return stream

def processor(f):
    """
    Return processor function applied to stream.
    """
    @wraps(f)
    def new_func(*args, **kwargs):
        def processor(stream):
            return f(stream, *args, **kwargs)
        return processor
    return new_func

def generator(f):
    """
    Return function that provides original data to stream.
    """
    @wraps(f)
    @processor
    def new_func(stream, *args, **kwargs):
        yield from f(*args, **kwargs)
    return new_func

@generator      
def yield_files(files):
    """
    Initiate processing stream with files.
    """
    for file in files:
        yield file

@processor
def filter_field_by_comparison(stream, field=None, value=None, comparison='equals'):
    """
    Filter list of dictionaries based on field value, filter value, and comparison.
    
    Parameters
    ----------
    stream : generator
        Original data plus applied processing steps passed in by @processor decorator.
    field : string
        Name of field in dictionary.
    value : string or list (for contains)
        Filter value to compare to field value.
    comparison : {'equals' | 'not_equals' | 'contains'}
        Operator used for comparing values. Default is equals.
    """
    if operator_map.get(comparison) is None:
        raise ValueError('Comparison must be one of: {}'.format(list(operator_map.keys())))
    for file in stream:
        # Make sure filter value exists.
        if value is None:
            raise ValueError('Must specify value')
        # Continue if key not in specific file.
        if file.get(field) is None:
            continue
        # Order of variables matter for contains.
        left, right = value, file.get(field)
        if comparison == 'contains' and isinstance(value, str):
            left, right = file.get(field), value
        # Yield only files that match filter.
        if operator_map[comparison](left, right):
            yield file

def match(data, *args):
    """
    Pass in data and filters.
    """
    yield from process_stream([s for s in chain([yield_files(data)], [*args])])

    
def _find_relation(data, in_type, out_type, experiment):
    parents =  list(match(data,
                          filter_field_by_comparison(field='output_type',
                                                     value=in_type['output_type']),
                          filter_field_by_comparison(field='file_type',
                                                     value=in_type['file_type']),
                          filter_field_by_comparison(field='status',
                                                     value=in_type['status'],
                                                     comparison='contains')))
    children = list(match(data,
                          filter_field_by_comparison(field='output_type',
                                                     value=out_type['output_type']),
                          filter_field_by_comparison(field='file_type',
                                                     value=out_type['file_type']),
                          filter_field_by_comparison(field='status',
                                                     value=out_type['status'],
                                                     comparison='contains')))
    return {'parents': [(p.get('accession', p.get('uuid')),
                         p.get('file_type'),
                         p.get('output_type'),
                         p.get('status'),
                         experiment) for p in parents],
             'children': [(c.get('accession', c.get('uuid')),
                         c.get('file_type'),
                         c.get('output_type'),
                         c.get('status'),
                         experiment) for c in children]}


def _extract_values_from_pattern(field, in_type, out_type):
    """
    Returns set of values in both in_type and out_type for given field.
    """
    values = []
    for value in chain([in_type], [out_type]):
        # Flatten if value is a list.
        if isinstance(value.get(field), list):
            values.extend(value.get(field))
        else:
            values.append(value.get(field))
    if None in values:
        raise ValueError('Must specify {} in pattern.'.format(field))
    return set(values)

def basic_pattern(experiment, in_type, out_type, **kwargs):
    """
    Returns relationship of Files in Experiment given in_type and out_type.
    
    Parameters
    ----------
    experiment : string
        Accession of the Experiment of interest.
    in_type : dict
        (file_type, output_type, status, match_rep=True/False)
    out_type : tuple
        (file_type, output_type, status, match_rep=True/False)
    **kwargs : string
        Field name and filter value for additonal filters to apply to all associated files.
    """
    additional_filters = []
    calculated_relationships = {}
    if in_type['match_rep'] != out_type['match_rep']:
            raise ValueError('Match_rep mismatch between in and out pattern.')
    # Pull pattern data.
    filter_statuses = _extract_values_from_pattern('status', in_type, out_type)
    filter_types = _extract_values_from_pattern('file_type', in_type, out_type)
    filter_replicate = _extract_values_from_pattern('match_rep', in_type, out_type).pop()
    # Optional filtering by fields passed to kwargs.
    if kwargs:
        for k,v in kwargs.items():
            additional_filters.append(filter_field_by_comparison(field=k,
                                                                 value=v,
                                                                 comparison='equals'))
    # Get all files associated with experiment.
    associated_files = get_associated(item_type='File', related_field='dataset', related_ids=[experiment])
    # Filter by status, file_formats, and additional_filters:
    by_status_format_additional = list(match(associated_files,
                                      filter_field_by_comparison(field='status',
                                                         value=list(filter_statuses),
                                                         comparison='contains'),
                                      filter_field_by_comparison(field='file_type',
                                                         value=list(filter_types),
                                                         comparison='contains'), 
                                      *additional_filters))
    if filter_replicate:
        # Flatten lists of tech_reps.
        tech_reps = set([tech_rep for f in by_status_format_additional
                         for tech_rep in f['technical_replicates']])
        # Match files by tech_rep.
        for rep in tech_reps:
            pairs = list(match(by_status_format_additional,
                               filter_field_by_comparison(field='technical_replicates',
                                                          value=str(rep),
                                                          comparison='contains')))
            calculated_relationships[rep] = _find_relation(pairs, in_type, out_type, experiment)
    else:
        calculated_relationships['None'] = _find_relation(by_status_format_additional, in_type, out_type, experiment)
    return calculated_relationships



In [238]:

    
# RIP-seq patterns:
in_type1 = dict(file_type='fastq', output_type='reads', status='released', match_rep=True)
out_type1 = dict(file_type='bam', output_type='alignments', status='released', match_rep=True)

in_type2 = dict(file_type='bam', output_type='alignments', status='released', match_rep=True)
out_type2 = dict(file_type='bigWig', output_type='signal', status='released', match_rep=True)

in_type3 = dict(file_type='bam', output_type='alignments', status='released', match_rep=False)
out_type3 = dict(file_type='bed broadPeak', output_type='peaks', status='released', match_rep=False)

in_type4 = dict(file_type='bed broadPeak', output_type='peaks', status='released', match_rep=False)
out_type4 = dict(file_type='bigBed broadPeak', output_type='peaks', status='released', match_rep=False)

# Build list of results.
relationships = [basic_pattern(experiment_id, in_type1, out_type1),
                 basic_pattern(experiment_id, in_type2, out_type2),
                 basic_pattern(experiment_id, in_type3, out_type3),
                 basic_pattern(experiment_id, in_type4, out_type4)]

# Gingeras RNA microarray patterns:
url = 'https://www.encodeproject.org/search/?type=Experiment&assay_title=RNA+microarray&audit.INTERNAL_ACTION.category=missing+derived_from&award.rfa=ENCODE2&lab.title=Thomas+Gingeras%2C+CSHL&format=json&limit=all'
in_type1 = dict(file_type='bed broadPeak', output_type='transcribed fragments', status=['revoked', 'released'], match_rep=False)
out_type1 = dict(file_type='bigBed broadPeak', output_type='transcribed fragments', status=['revoked', 'released'], match_rep=False)

in_type2 = dict(file_type='bed broadPeak', output_type='filtered transcribed fragments', status=['revoked', 'released'], match_rep=False)
out_type2 = dict(file_type='bigBed broadPeak', output_type='filtered transcribed fragments', status=['revoked', 'released'], match_rep=False)

in_type3 = dict(file_type='bed broadPeak', output_type='transcribed fragments', status=['revoked', 'released'], match_rep=False)
out_type3 = dict(file_type='bed broadPeak', output_type='filtered transcribed fragments', status=['revoked', 'released'], match_rep=False)

url = 'https://www.encodeproject.org/search/?type=Experiment&assay_title=RNA+microarray&lab.title=Gregory+Crawford%2C+Duke&audit.INTERNAL_ACTION.category=missing+derived_from&format=json&limit=all'
# Crawford RNA microarray pattern:
in_type1 = dict(file_type='bed broadPeak', output_type='exon quantifications', status=['released', 'deleted', 'revoked'], match_rep=True)
out_type1 = dict(file_type='bigBed broadPeak', output_type='exon quantifications', status=['released', 'deleted', 'revoked'], match_rep=True)



In [292]:

    
url = 'https://www.encodeproject.org/search/?type=Experiment&assay_title=RNA+microarray&lab.title=Gregory+Crawford%2C+Duke&audit.INTERNAL_ACTION.category=missing+derived_from&format=json&limit=all'
exp = [f['@id'] for f in quick_grab_data([url])]
len(exp)









    Out[292]:





66



In [293]:

    
results = []
for e in exp:
    experiment_id = e
    relationships = [basic_pattern(experiment_id, in_type1, out_type1)]
    results.append(relationships)



In [294]:

    
dfpd = []
for x in results:
    for y in x:
        for k, v in y.items():
            d = {'accession': ' '.join([t[0] for t in v['children']]),
                 'derived_from:list': ','.join(['/files/{}/'.format(t[0]) for t in v['parents']])}
            dfpd.append(d)



In [299]:

    
pd.DataFrame(dfpd).replace('', np.nan).dropna().reset_index(drop=True)\
#.to_csv('../../calculated_derived_from_crawford_rna_microarray_patch_10_20_2017.tsv', sep='\t', index=False)









    Out[299]:







  
    
      
      accession
      derived_from:list
    
  
  
    
      0
      ENCFF000KMY
      /files/ENCFF001TFE/
    
    
      1
      ENCFF000KNE
      /files/ENCFF001TFG/
    
    
      2
      ENCFF000KNA
      /files/ENCFF001TFF/
    
    
      3
      ENCFF000KMW
      /files/ENCFF001TFD/
    
    
      4
      ENCFF000KMO
      /files/ENCFF001TEZ/
    
    
      5
      ENCFF000KMQ
      /files/ENCFF001TFA/
    
    
      6
      ENCFF000KJQ
      /files/ENCFF001TDR/
    
    
      7
      ENCFF000KJS
      /files/ENCFF001TDS/
    
    
      8
      ENCFF000KTQ
      /files/ENCFF001THS/
    
    
      9
      ENCFF000KKJ
      /files/ENCFF001TEA/
    
    
      10
      ENCFF000KKI
      /files/ENCFF001TDZ/
    
    
      11
      ENCFF000KOT
      /files/ENCFF001TFX/
    
    
      12
      ENCFF000KOR
      /files/ENCFF001TFW/
    
    
      13
      ENCFF000KSU
      /files/ENCFF001THJ/
    
    
      14
      ENCFF000KSS
      /files/ENCFF001THI/
    
    
      15
      ENCFF000KRQ
      /files/ENCFF001TGX/
    
    
      16
      ENCFF000KRS
      /files/ENCFF001TGY/
    
    
      17
      ENCFF000KSC
      /files/ENCFF001THC/
    
    
      18
      ENCFF000KSE
      /files/ENCFF001THD/
    
    
      19
      ENCFF000KSG
      /files/ENCFF001THE/
    
    
      20
      ENCFF000KSI
      /files/ENCFF001THF/
    
    
      21
      ENCFF000KTP
      /files/ENCFF001THQ/
    
    
      22
      ENCFF000KRI
      /files/ENCFF001TGV/
    
    
      23
      ENCFF000KRG
      /files/ENCFF001TGU/
    
    
      24
      ENCFF000KQX
      /files/ENCFF001TGR/
    
    
      25
      ENCFF000KQV
      /files/ENCFF001TGQ/
    
    
      26
      ENCFF000KNT
      /files/ENCFF001TFK/
    
    
      27
      ENCFF000KNV
      /files/ENCFF001TFL/
    
    
      28
      ENCFF000KLW
      /files/ENCFF001TEQ/
    
    
      29
      ENCFF000KLY
      /files/ENCFF001TER/
    
    
      ...
      ...
      ...
    
    
      75
      ENCFF000KLS
      /files/ENCFF001TEO/
    
    
      76
      ENCFF000KLU
      /files/ENCFF001TEP/
    
    
      77
      ENCFF000KKE
      /files/ENCFF001TDX/
    
    
      78
      ENCFF000KKG
      /files/ENCFF001TDY/
    
    
      79
      ENCFF000KMM
      /files/ENCFF001TEY/
    
    
      80
      ENCFF000KMK
      /files/ENCFF001TEX/
    
    
      81
      ENCFF000KPG
      /files/ENCFF001TGC/
    
    
      82
      ENCFF000KPE
      /files/ENCFF001TGB/
    
    
      83
      ENCFF000KPI
      /files/ENCFF001TGD/
    
    
      84
      ENCFF000KOH
      /files/ENCFF001TFR/
    
    
      85
      ENCFF000KOJ
      /files/ENCFF001TFS/
    
    
      86
      ENCFF000KOL
      /files/ENCFF001TFT/
    
    
      87
      ENCFF000KKX
      /files/ENCFF001TEH/
    
    
      88
      ENCFF000KKW
      /files/ENCFF001TEG/
    
    
      89
      ENCFF000KKY
      /files/ENCFF001TEI/
    
    
      90
      ENCFF000KRU
      /files/ENCFF001TGZ/
    
    
      91
      ENCFF000KRW
      /files/ENCFF001THA/
    
    
      92
      ENCFF000KRY
      /files/ENCFF001THB/
    
    
      93
      ENCFF000KRO
      /files/ENCFF001TGW/
    
    
      94
      ENCFF000KJW
      /files/ENCFF001TDT/
    
    
      95
      ENCFF000KJY
      /files/ENCFF001TDU/
    
    
      96
      ENCFF000KMS
      /files/ENCFF001TFB/
    
    
      97
      ENCFF000KMU
      /files/ENCFF001TFC/
    
    
      98
      ENCFF000KPP
      /files/ENCFF001TGF/
    
    
      99
      ENCFF000KPN
      /files/ENCFF001TGE/
    
    
      100
      ENCFF000KMA
      /files/ENCFF001TES/
    
    
      101
      ENCFF000KMC
      /files/ENCFF001TET/
    
    
      102
      ENCFF000KTA
      /files/ENCFF001THL/
    
    
      103
      ENCFF000KSZ
      /files/ENCFF001THK/
    
    
      104
      ENCFF000KTB
      /files/ENCFF001THM/
    
  

105 rows × 2 columns



In [ ]:



In [144]:

    
url = 'https://www.encodeproject.org/search/?type=Experiment&assay_title=RNA+microarray&audit.INTERNAL_ACTION.category=missing+derived_from&award.rfa=ENCODE2&lab.title=Thomas+Gingeras%2C+CSHL&format=json&limit=all'
exp = [f['accession'] for f in quick_grab_data([url])]

in_type1 = dict(file_type='bed broadPeak', output_type='transcribed fragments', status=['revoked', 'released'], match_rep=False)
out_type1 = dict(file_type='bigBed broadPeak', output_type='transcribed fragments', status=['revoked', 'released'], match_rep=False)

in_type2 = dict(file_type='bed broadPeak', output_type='filtered transcribed fragments', status=['revoked', 'released'], match_rep=False)
out_type2 = dict(file_type='bigBed broadPeak', output_type='filtered transcribed fragments', status=['revoked', 'released'], match_rep=False)

in_type3 = dict(file_type='bed broadPeak', output_type='transcribed fragments', status=['revoked', 'released'], match_rep=False)
out_type3 = dict(file_type='bed broadPeak', output_type='filtered transcribed fragments', status=['revoked', 'released'], match_rep=False)



In [145]:

    
len(exp)









    Out[145]:





26



In [147]:

    
for e in exp:
    print()
    experiment_id = '/experiments/{}/'.format(e)
    relationships = [basic_pattern(experiment_id, in_type1, out_type1),
                     basic_pattern(experiment_id, in_type2, out_type2),
                     basic_pattern(experiment_id, in_type3, out_type3)]
    print('For:', experiment_id, end='\n\n')
    for i, relation in enumerate(relationships):
        print_relation(relation)









    



For: /experiments/ENCSR000AWA/

tech_rep None in: [('ENCFF001SNI', 'bed broadPeak')] out: [('ENCFF000ABS', 'bigBed broadPeak')]

tech_rep None in: [('ENCFF001SMI', 'bed broadPeak')] out: [('ENCFF000AAV', 'bigBed broadPeak')]

tech_rep None in: [('ENCFF001SNI', 'bed broadPeak')] out: [('ENCFF001SMI', 'bed broadPeak')]


For: /experiments/ENCSR000AWM/

tech_rep None in: [('ENCFF001SNW', 'bed broadPeak')] out: [('ENCFF000ACI', 'bigBed broadPeak')]

tech_rep None in: [('ENCFF001SMW', 'bed broadPeak')] out: [('ENCFF000ABI', 'bigBed broadPeak')]

tech_rep None in: [('ENCFF001SNW', 'bed broadPeak')] out: [('ENCFF001SMW', 'bed broadPeak')]


For: /experiments/ENCSR000AWJ/

tech_rep None in: [('ENCFF001SNR', 'bed broadPeak')] out: [('ENCFF000ACD', 'bigBed broadPeak')]

tech_rep None in: [('ENCFF001SMR', 'bed broadPeak')] out: [('ENCFF000ABD', 'bigBed broadPeak')]

tech_rep None in: [('ENCFF001SNR', 'bed broadPeak')] out: [('ENCFF001SMR', 'bed broadPeak')]


For: /experiments/ENCSR000AWN/

tech_rep None in: [('ENCFF001SNV', 'bed broadPeak')] out: [('ENCFF000ACH', 'bigBed broadPeak')]

tech_rep None in: [('ENCFF001SMV', 'bed broadPeak')] out: [('ENCFF000ABH', 'bigBed broadPeak')]

tech_rep None in: [('ENCFF001SNV', 'bed broadPeak')] out: [('ENCFF001SMV', 'bed broadPeak')]


For: /experiments/ENCSR000AWI/

tech_rep None in: [('ENCFF001SOI', 'bed broadPeak')] out: [('ENCFF000ACR', 'bigBed broadPeak')]

tech_rep None in: [('ENCFF001SNF', 'bed broadPeak')] out: [('ENCFF000ABU', 'bigBed broadPeak')]

tech_rep None in: [('ENCFF001SOI', 'bed broadPeak')] out: [('ENCFF001SNF', 'bed broadPeak')]


For: /experiments/ENCSR000AWD/

tech_rep None in: [('ENCFF001SNT', 'bed broadPeak')] out: [('ENCFF000ACF', 'bigBed broadPeak')]

tech_rep None in: [('ENCFF001SMT', 'bed broadPeak')] out: [('ENCFF000ABF', 'bigBed broadPeak')]

tech_rep None in: [('ENCFF001SNT', 'bed broadPeak')] out: [('ENCFF001SMT', 'bed broadPeak')]


For: /experiments/ENCSR000AWV/

tech_rep None in: [('ENCFF001SOD', 'bed broadPeak')] out: [('ENCFF000ACP', 'bigBed broadPeak')]

tech_rep None in: [('ENCFF001SND', 'bed broadPeak')] out: [('ENCFF000ABP', 'bigBed broadPeak')]

tech_rep None in: [('ENCFF001SOD', 'bed broadPeak')] out: [('ENCFF001SND', 'bed broadPeak')]


For: /experiments/ENCSR000AWR/

tech_rep None in: [('ENCFF001SNN', 'bed broadPeak')] out: [('ENCFF000ABZ', 'bigBed broadPeak')]

tech_rep None in: [('ENCFF001SMN', 'bed broadPeak')] out: [('ENCFF000AAZ', 'bigBed broadPeak')]

tech_rep None in: [('ENCFF001SNN', 'bed broadPeak')] out: [('ENCFF001SMN', 'bed broadPeak')]


For: /experiments/ENCSR000AWY/

tech_rep None in: [('ENCFF001SNJ', 'bed broadPeak')] out: [('ENCFF000ABV', 'bigBed broadPeak')]

tech_rep None in: [('ENCFF001SMJ', 'bed broadPeak')] out: [('ENCFF000AAU', 'bigBed broadPeak')]

tech_rep None in: [('ENCFF001SNJ', 'bed broadPeak')] out: [('ENCFF001SMJ', 'bed broadPeak')]


For: /experiments/ENCSR000AWB/

tech_rep None in: [('ENCFF001SNK', 'bed broadPeak')] out: [('ENCFF000ABW', 'bigBed broadPeak')]

tech_rep None in: [('ENCFF001SMK', 'bed broadPeak')] out: [('ENCFF000AAW', 'bigBed broadPeak')]

tech_rep None in: [('ENCFF001SNK', 'bed broadPeak')] out: [('ENCFF001SMK', 'bed broadPeak')]


For: /experiments/ENCSR000AWU/

tech_rep None in: [('ENCFF001SOC', 'bed broadPeak')] out: [('ENCFF000ACO', 'bigBed broadPeak')]

tech_rep None in: [('ENCFF001SNC', 'bed broadPeak')] out: [('ENCFF000ABO', 'bigBed broadPeak')]

tech_rep None in: [('ENCFF001SOC', 'bed broadPeak')] out: [('ENCFF001SNC', 'bed broadPeak')]


For: /experiments/ENCSR000AWQ/

tech_rep None in: [('ENCFF001SNM', 'bed broadPeak')] out: [('ENCFF000ABY', 'bigBed broadPeak')]

tech_rep None in: [('ENCFF001SMM', 'bed broadPeak')] out: [('ENCFF000AAY', 'bigBed broadPeak')]

tech_rep None in: [('ENCFF001SNM', 'bed broadPeak')] out: [('ENCFF001SMM', 'bed broadPeak')]


For: /experiments/ENCSR000AWK/

tech_rep None in: [('ENCFF001SNH', 'bed broadPeak')] out: [('ENCFF000ABQ', 'bigBed broadPeak')]

tech_rep None in: [('ENCFF001SMH', 'bed broadPeak')] out: [('ENCFF000AAT', 'bigBed broadPeak')]

tech_rep None in: [('ENCFF001SNH', 'bed broadPeak')] out: [('ENCFF001SMH', 'bed broadPeak')]


For: /experiments/ENCSR000AWX/

tech_rep None in: [('ENCFF001SNQ', 'bed broadPeak')] out: [('ENCFF000ACC', 'bigBed broadPeak')]

tech_rep None in: [('ENCFF001SMQ', 'bed broadPeak')] out: [('ENCFF000ABC', 'bigBed broadPeak')]

tech_rep None in: [('ENCFF001SNQ', 'bed broadPeak')] out: [('ENCFF001SMQ', 'bed broadPeak')]


For: /experiments/ENCSR000AWW/

tech_rep None in: [('ENCFF001SNP', 'bed broadPeak')] out: [('ENCFF000ACB', 'bigBed broadPeak')]

tech_rep None in: [('ENCFF001SMP', 'bed broadPeak')] out: [('ENCFF000ABB', 'bigBed broadPeak')]

tech_rep None in: [('ENCFF001SNP', 'bed broadPeak')] out: [('ENCFF001SMP', 'bed broadPeak')]


For: /experiments/ENCSR000AWL/

tech_rep None in: [('ENCFF001SNS', 'bed broadPeak')] out: [('ENCFF000ACE', 'bigBed broadPeak')]

tech_rep None in: [('ENCFF001SMS', 'bed broadPeak')] out: [('ENCFF000ABE', 'bigBed broadPeak')]

tech_rep None in: [('ENCFF001SNS', 'bed broadPeak')] out: [('ENCFF001SMS', 'bed broadPeak')]


For: /experiments/ENCSR000AWZ/

tech_rep None in: [('ENCFF001SNO', 'bed broadPeak')] out: [('ENCFF000ACA', 'bigBed broadPeak')]

tech_rep None in: [('ENCFF001SMO', 'bed broadPeak')] out: [('ENCFF000ABA', 'bigBed broadPeak')]

tech_rep None in: [('ENCFF001SNO', 'bed broadPeak')] out: [('ENCFF001SMO', 'bed broadPeak')]


For: /experiments/ENCSR000AWE/

tech_rep None in: [('ENCFF001SNU', 'bed broadPeak')] out: [('ENCFF000ACG', 'bigBed broadPeak')]

tech_rep None in: [('ENCFF001SMU', 'bed broadPeak')] out: [('ENCFF000ABG', 'bigBed broadPeak')]

tech_rep None in: [('ENCFF001SNU', 'bed broadPeak')] out: [('ENCFF001SMU', 'bed broadPeak')]


For: /experiments/ENCSR000AWH/

tech_rep None in: [('ENCFF001SOE', 'bed broadPeak')] out: [('ENCFF000ACQ', 'bigBed broadPeak')]

tech_rep None in: [('ENCFF001SNE', 'bed broadPeak')] out: [('ENCFF000ABT', 'bigBed broadPeak')]

tech_rep None in: [('ENCFF001SOE', 'bed broadPeak')] out: [('ENCFF001SNE', 'bed broadPeak')]


For: /experiments/ENCSR000AWS/

tech_rep None in: [('ENCFF001SOA', 'bed broadPeak')] out: [('ENCFF000ACM', 'bigBed broadPeak')]

tech_rep None in: [('ENCFF001SNA', 'bed broadPeak')] out: [('ENCFF000ABM', 'bigBed broadPeak')]

tech_rep None in: [('ENCFF001SOA', 'bed broadPeak')] out: [('ENCFF001SNA', 'bed broadPeak')]


For: /experiments/ENCSR000AWO/

tech_rep None in: [('ENCFF001SNG', 'bed broadPeak')] out: [('ENCFF000ABR', 'bigBed broadPeak')]

tech_rep None in: [('ENCFF001SMG', 'bed broadPeak')] out: [('ENCFF000AAS', 'bigBed broadPeak')]

tech_rep None in: [('ENCFF001SNG', 'bed broadPeak')] out: [('ENCFF001SMG', 'bed broadPeak')]


For: /experiments/ENCSR000AWP/

tech_rep None in: [('ENCFF001SNL', 'bed broadPeak')] out: [('ENCFF000ABX', 'bigBed broadPeak')]

tech_rep None in: [('ENCFF001SML', 'bed broadPeak')] out: [('ENCFF000AAX', 'bigBed broadPeak')]

tech_rep None in: [('ENCFF001SNL', 'bed broadPeak')] out: [('ENCFF001SML', 'bed broadPeak')]


For: /experiments/ENCSR000AWC/

tech_rep None in: [('ENCFF001SNZ', 'bed broadPeak')] out: [('ENCFF000ACL', 'bigBed broadPeak')]

tech_rep None in: [('ENCFF001SMZ', 'bed broadPeak')] out: [('ENCFF000ABL', 'bigBed broadPeak')]

tech_rep None in: [('ENCFF001SNZ', 'bed broadPeak')] out: [('ENCFF001SMZ', 'bed broadPeak')]


For: /experiments/ENCSR000AWF/

tech_rep None in: [('ENCFF001SNX', 'bed broadPeak')] out: [('ENCFF000ACJ', 'bigBed broadPeak')]

tech_rep None in: [('ENCFF001SMX', 'bed broadPeak')] out: [('ENCFF000ABJ', 'bigBed broadPeak')]

tech_rep None in: [('ENCFF001SNX', 'bed broadPeak')] out: [('ENCFF001SMX', 'bed broadPeak')]


For: /experiments/ENCSR000AWG/

tech_rep None in: [('ENCFF001SNY', 'bed broadPeak')] out: [('ENCFF000ACK', 'bigBed broadPeak')]

tech_rep None in: [('ENCFF001SMY', 'bed broadPeak')] out: [('ENCFF000ABK', 'bigBed broadPeak')]

tech_rep None in: [('ENCFF001SNY', 'bed broadPeak')] out: [('ENCFF001SMY', 'bed broadPeak')]


For: /experiments/ENCSR000AWT/

tech_rep None in: [('ENCFF001SOB', 'bed broadPeak')] out: [('ENCFF000ACN', 'bigBed broadPeak')]

tech_rep None in: [('ENCFF001SNB', 'bed broadPeak')] out: [('ENCFF000ABN', 'bigBed broadPeak')]

tech_rep None in: [('ENCFF001SOB', 'bed broadPeak')] out: [('ENCFF001SNB', 'bed broadPeak')]



In [ ]:



In [ ]:

	accession	derived_from:list
0	ENCFF000KMY	/files/ENCFF001TFE/
1	ENCFF000KNE	/files/ENCFF001TFG/
2	ENCFF000KNA	/files/ENCFF001TFF/
3	ENCFF000KMW	/files/ENCFF001TFD/
4	ENCFF000KMO	/files/ENCFF001TEZ/
5	ENCFF000KMQ	/files/ENCFF001TFA/
6	ENCFF000KJQ	/files/ENCFF001TDR/
7	ENCFF000KJS	/files/ENCFF001TDS/
8	ENCFF000KTQ	/files/ENCFF001THS/
9	ENCFF000KKJ	/files/ENCFF001TEA/
10	ENCFF000KKI	/files/ENCFF001TDZ/
11	ENCFF000KOT	/files/ENCFF001TFX/
12	ENCFF000KOR	/files/ENCFF001TFW/
13	ENCFF000KSU	/files/ENCFF001THJ/
14	ENCFF000KSS	/files/ENCFF001THI/
15	ENCFF000KRQ	/files/ENCFF001TGX/
16	ENCFF000KRS	/files/ENCFF001TGY/
17	ENCFF000KSC	/files/ENCFF001THC/
18	ENCFF000KSE	/files/ENCFF001THD/
19	ENCFF000KSG	/files/ENCFF001THE/
20	ENCFF000KSI	/files/ENCFF001THF/
21	ENCFF000KTP	/files/ENCFF001THQ/
22	ENCFF000KRI	/files/ENCFF001TGV/
23	ENCFF000KRG	/files/ENCFF001TGU/
24	ENCFF000KQX	/files/ENCFF001TGR/
25	ENCFF000KQV	/files/ENCFF001TGQ/
26	ENCFF000KNT	/files/ENCFF001TFK/
27	ENCFF000KNV	/files/ENCFF001TFL/
28	ENCFF000KLW	/files/ENCFF001TEQ/
29	ENCFF000KLY	/files/ENCFF001TER/
...	...	...
75	ENCFF000KLS	/files/ENCFF001TEO/
76	ENCFF000KLU	/files/ENCFF001TEP/
77	ENCFF000KKE	/files/ENCFF001TDX/
78	ENCFF000KKG	/files/ENCFF001TDY/
79	ENCFF000KMM	/files/ENCFF001TEY/
80	ENCFF000KMK	/files/ENCFF001TEX/
81	ENCFF000KPG	/files/ENCFF001TGC/
82	ENCFF000KPE	/files/ENCFF001TGB/
83	ENCFF000KPI	/files/ENCFF001TGD/
84	ENCFF000KOH	/files/ENCFF001TFR/
85	ENCFF000KOJ	/files/ENCFF001TFS/
86	ENCFF000KOL	/files/ENCFF001TFT/
87	ENCFF000KKX	/files/ENCFF001TEH/
88	ENCFF000KKW	/files/ENCFF001TEG/
89	ENCFF000KKY	/files/ENCFF001TEI/
90	ENCFF000KRU	/files/ENCFF001TGZ/
91	ENCFF000KRW	/files/ENCFF001THA/
92	ENCFF000KRY	/files/ENCFF001THB/
93	ENCFF000KRO	/files/ENCFF001TGW/
94	ENCFF000KJW	/files/ENCFF001TDT/
95	ENCFF000KJY	/files/ENCFF001TDU/
96	ENCFF000KMS	/files/ENCFF001TFB/
97	ENCFF000KMU	/files/ENCFF001TFC/
98	ENCFF000KPP	/files/ENCFF001TGF/
99	ENCFF000KPN	/files/ENCFF001TGE/
100	ENCFF000KMA	/files/ENCFF001TES/
101	ENCFF000KMC	/files/ENCFF001TET/
102	ENCFF000KTA	/files/ENCFF001THL/
103	ENCFF000KSZ	/files/ENCFF001THK/
104	ENCFF000KTB	/files/ENCFF001THM/