In [1]:
from itertools import product
from collections import defaultdict

from numpy import zeros, empty, allclose, real_if_close, diag, array
from numpy.random import choice, random
from numpy.linalg import eig, inv
from scipy import sparse

In [2]:
__author__ = 'Ben Kaehler'
__copyright__ = 'Copyright 2015, Ben Kaehler'
__credits__ = ['Ben Kaehler']
__license__ = 'GPLv3 or any later version'
__maintainer__ = 'Ben Kaehler'
__email__ = 'benjamin.kaehler@anu.edu.au'
__status__ = 'pre-alpha'
__version__ = '0.0.1-dev'

In [3]:
def gen_stat_seq(transition_probabilities, num_samples):
    keys = transition_probabilities.keys()
    k = len(keys[0]) # Markov order
    for key in keys[1:]:
        assert len(key) == k, 'from seqs must all be same length'
    alphabet = set()
    for key in keys:
        alphabet.update(key)
    alphabet = tuple(alphabet)
    m = len(alphabet) # Number of to states
    n = m**k # Number of from states
    bigP = zeros((n,n))
    P = zeros((n,m))
    longalph = [''.join(s) for s in product(*[alphabet]*k)]
    mapfr = dict(map(reversed, enumerate(longalph)))
    mapto = dict(map(reversed, enumerate(alphabet)))
    for fr in transition_probabilities:
        for to, p in transition_probabilities[fr].items():
            P[mapfr[fr],mapto[to]] = p
            bigP[mapfr[fr],mapfr[fr[1:]+to]] = p
    v, w = eig(bigP)
    pi = real_if_close(inv(w)[v.argmax()])
    pi /= pi.sum()
    pi = pi.astype(float)
    assert allclose(pi.dot(bigP), pi)
    #assert (pi.imag == 0.).all(), max(abs(pi.imag))
    
    result = empty(num_samples, dtype=str)
    result[:k] = list(choice(longalph, p=pi)[:num_samples])
    
    for i in range(k, num_samples):
        fr = ''.join(result[i-k:i])
        result[i] = choice(alphabet, p=P[mapfr[fr]])
        
    return ''.join(result)

In [4]:
alphabet = 'ACGT'
k = 5
P = random((len(alphabet)**k, len(alphabet)))

In [5]:
list(product(*[('a', 'b')]*4))dd


Out[5]:
[('a', 'a', 'a', 'a'),
 ('a', 'a', 'a', 'b'),
 ('a', 'a', 'b', 'a'),
 ('a', 'a', 'b', 'b'),
 ('a', 'b', 'a', 'a'),
 ('a', 'b', 'a', 'b'),
 ('a', 'b', 'b', 'a'),
 ('a', 'b', 'b', 'b'),
 ('b', 'a', 'a', 'a'),
 ('b', 'a', 'a', 'b'),
 ('b', 'a', 'b', 'a'),
 ('b', 'a', 'b', 'b'),
 ('b', 'b', 'a', 'a'),
 ('b', 'b', 'a', 'b'),
 ('b', 'b', 'b', 'a'),
 ('b', 'b', 'b', 'b')]

In [13]:
P = diag(1./P.sum(1)).dot(P)

In [10]:
diag(1./P.sum(1)).dot(P)


Out[10]:
array([[ 0.1667322 ,  0.12417383,  0.51957906,  0.1895149 ],
       [ 0.38869014,  0.37374245,  0.21818503,  0.01938237],
       [ 0.28253395,  0.00881317,  0.29911749,  0.40953539],
       ..., 
       [ 0.30875586,  0.08664592,  0.35401034,  0.25058788],
       [ 0.00629845,  0.41329743,  0.12617963,  0.45422449],
       [ 0.16692242,  0.21195335,  0.32838299,  0.29274124]])

In [11]:
mapfr = dict(enumerate((''.join(s) for s in product(*[alphabet]*k))))
mapto = dict(enumerate(alphabet))
transition_probabilities = defaultdict(dict)
for i, j in product(range(P.shape[0]), range(P.shape[1])):
    transition_probabilities[mapfr[i]][mapto[j]] = P[i,j]

In [12]:
transition_probabilities


Out[12]:
defaultdict(dict,
            {'GCCCG': {'A': 0.33848563945269022,
              'C': 0.25700906038349897,
              'G': 0.075438945051622824,
              'T': 0.3290663551121879},
             'GCCCA': {'A': 0.22810850066594626,
              'C': 0.049052271374052207,
              'G': 0.40103875610016382,
              'T': 0.32180047185983768},
             'CGGAA': {'A': 0.08454634895866435,
              'C': 0.13942468937641633,
              'G': 0.3597041714235415,
              'T': 0.41632479024137775},
             'GCCCC': {'A': 0.18509042203708392,
              'C': 0.42265417637527097,
              'G': 0.09385821325106572,
              'T': 0.29839718833657947},
             'CCTAT': {'A': 0.21816136779882217,
              'C': 0.19835925594840731,
              'G': 0.29318572585227626,
              'T': 0.29029365040049432},
             'GCCCT': {'A': 0.15070150056710124,
              'C': 0.258672367249829,
              'G': 0.22520272209918696,
              'T': 0.36542341008388274},
             'CCTAA': {'A': 0.17473701877800821,
              'C': 0.40875072343525687,
              'G': 0.07872624656371123,
              'T': 0.3377860112230236},
             'CCTAC': {'A': 0.23843144071818081,
              'C': 0.31047092490988409,
              'G': 0.42983980127882554,
              'T': 0.021257833093109441},
             'CCTAG': {'A': 0.14367954438910996,
              'C': 0.57723807087119783,
              'G': 0.21757096691799596,
              'T': 0.061511417821696279},
             'TGGTG': {'A': 0.1944923269528519,
              'C': 0.36645441135159751,
              'G': 0.16316182987017205,
              'T': 0.27589143182537845},
             'AGTCT': {'A': 0.098939743574220945,
              'C': 0.36775727836291072,
              'G': 0.36028597543748153,
              'T': 0.17301700262538686},
             'GGCTG': {'A': 0.077192462822462046,
              'C': 0.336243990872163,
              'G': 0.1310923464070417,
              'T': 0.45547119989833329},
             'TGGTC': {'A': 0.30230781698947956,
              'C': 0.34385307773607476,
              'G': 0.25525492610807715,
              'T': 0.098584179166368538},
             'GGCTA': {'A': 0.31937490064360941,
              'C': 0.17233131882782637,
              'G': 0.30404458369624338,
              'T': 0.20424919683232098},
             'TGGTA': {'A': 0.12233299520092754,
              'C': 0.37217299035464319,
              'G': 0.37771438282615633,
              'T': 0.12777963161827305},
             'GGCTC': {'A': 0.09769981340740895,
              'C': 0.31424005139008643,
              'G': 0.52357397023516772,
              'T': 0.064486164967337042},
             'CGCAC': {'A': 0.036553968871726066,
              'C': 0.46242793425323725,
              'G': 0.46287414503846147,
              'T': 0.038143951836575256},
             'TTACT': {'A': 0.30307395902875728,
              'C': 0.19811905912364886,
              'G': 0.3595845410521934,
              'T': 0.13922244079540042},
             'CGCAA': {'A': 0.34313033008999899,
              'C': 0.36879126056399708,
              'G': 0.079308673965179988,
              'T': 0.20876973538082405},
             'CGCAG': {'A': 0.35525078340952998,
              'C': 0.063894817359667427,
              'G': 0.27765579123667955,
              'T': 0.30319860799412296},
             'GGCTT': {'A': 0.32466891558377403,
              'C': 0.35968592902049989,
              'G': 0.020015283544933232,
              'T': 0.29562987185079304},
             'TGGTT': {'A': 0.12324578299979949,
              'C': 0.33653693808610069,
              'G': 0.25504596678543345,
              'T': 0.28517131212866648},
             'TTACG': {'A': 0.2985749940380743,
              'C': 0.22063462852197518,
              'G': 0.22806629511579329,
              'T': 0.25272408232415733},
             'TTACA': {'A': 0.25272392024858692,
              'C': 0.43167474133121214,
              'G': 0.015258735829505248,
              'T': 0.30034260259069562},
             'TTACC': {'A': 0.48083061566460394,
              'C': 0.012317363935092113,
              'G': 0.089264338261111215,
              'T': 0.41758768213919284},
             'CGCAT': {'A': 0.21152738394467377,
              'C': 0.28659618888379729,
              'G': 0.33089486599232382,
              'T': 0.17098156117920518},
             'TTCAT': {'A': 0.13718407979001615,
              'C': 0.43042134198877841,
              'G': 0.29482423243477579,
              'T': 0.13757034578642952},
             'TTCAG': {'A': 0.080259277388022895,
              'C': 0.66696115785487853,
              'G': 0.069961408849138138,
              'T': 0.18281815590796047},
             'TTCAA': {'A': 0.31328224089240775,
              'C': 0.27822047894596796,
              'G': 0.36155275714910584,
              'T': 0.046944523012518523},
             'TTCAC': {'A': 0.18925575166472147,
              'C': 0.21991452424890001,
              'G': 0.34091107923659492,
              'T': 0.24991864484978366},
             'GAAAG': {'A': 0.30041201920531269,
              'C': 0.20270490130549942,
              'G': 0.36634508466567528,
              'T': 0.13053799482351258},
             'GAAAC': {'A': 0.30073010127706035,
              'C': 0.27153236910273754,
              'G': 0.017975396085440225,
              'T': 0.40976213353476182},
             'GAAAA': {'A': 0.26124101659047388,
              'C': 0.22698923073060256,
              'G': 0.15712868935133595,
              'T': 0.35464106332758771},
             'GACTT': {'A': 0.35861297498478945,
              'C': 0.35159999534856751,
              'G': 0.17992084041054801,
              'T': 0.1098661892560952},
             'GAAAT': {'A': 0.28278130576676025,
              'C': 0.10795425878292124,
              'G': 0.35119326422009245,
              'T': 0.25807117123022616},
             'GACTG': {'A': 0.27452436368888172,
              'C': 0.12026980680041385,
              'G': 0.21032629895548827,
              'T': 0.39487953055521624},
             'GACTC': {'A': 0.31200240983680233,
              'C': 0.3746697231242978,
              'G': 0.037933088975850848,
              'T': 0.27539477806304907},
             'GACTA': {'A': 0.1182447799530896,
              'C': 0.28538607417193418,
              'G': 0.19495563148703879,
              'T': 0.4014135143879376},
             'CCTTT': {'A': 0.23065142908092157,
              'C': 0.26962417338999112,
              'G': 0.046328539835666573,
              'T': 0.45339585769342072},
             'CCTTC': {'A': 0.27958425992433916,
              'C': 0.13483049717374535,
              'G': 0.28550478521854744,
              'T': 0.30008045768336805},
             'CCTTA': {'A': 0.084377712269974744,
              'C': 0.68140169235116599,
              'G': 0.2311154248464439,
              'T': 0.0031051705324152937},
             'CCTTG': {'A': 0.28103613878888478,
              'C': 0.23556130324283428,
              'G': 0.15141191676885524,
              'T': 0.33199064119942562},
             'TGGCG': {'A': 0.093243439984750945,
              'C': 0.42109424174105381,
              'G': 0.41128648102762705,
              'T': 0.074375837246568127},
             'TGGCC': {'A': 0.16668365056527876,
              'C': 0.15666774567788944,
              'G': 0.54380145557557591,
              'T': 0.13284714818125584},
             'TGGCA': {'A': 0.14712958061497267,
              'C': 0.10637401147386449,
              'G': 0.41724628208691988,
              'T': 0.32925012582424296},
             'TGGCT': {'A': 0.3720656480046331,
              'C': 0.23570852876776011,
              'G': 0.33508134271733775,
              'T': 0.057144480510268984},
             'GCTTG': {'A': 0.028653176418497957,
              'C': 0.16843876720063744,
              'G': 0.40655717363426469,
              'T': 0.3963508827465998},
             'AATGT': {'A': 0.20875226753425144,
              'C': 0.10482724762177087,
              'G': 0.44851359377073741,
              'T': 0.23790689107324017},
             'GCTTC': {'A': 0.094442722962072956,
              'C': 0.28254736184186818,
              'G': 0.27757633837911405,
              'T': 0.34543357681694464},
             'GCTTA': {'A': 0.1347606676658665,
              'C': 0.32967683819097182,
              'G': 0.32808581739133991,
              'T': 0.20747667675182185},
             'CGGCA': {'A': 0.39968672106120373,
              'C': 0.11688140407945484,
              'G': 0.26986367953528284,
              'T': 0.21356819532405846},
             'CACTC': {'A': 0.34994785977634896,
              'C': 0.15984345543483863,
              'G': 0.25054903050793947,
              'T': 0.23965965428087307},
             'CGGCC': {'A': 0.24082086064811326,
              'C': 0.21319469115375125,
              'G': 0.23211090441587895,
              'T': 0.31387354378225651},
             'CACTA': {'A': 0.4219194840497314,
              'C': 0.099477031960982953,
              'G': 0.32577396323249469,
              'T': 0.1528295207567909},
             'CACTG': {'A': 0.21944341699649131,
              'C': 0.24046794847274638,
              'G': 0.23739832514866452,
              'T': 0.30269030938209768},
             'CGGCG': {'A': 0.28052470860085715,
              'C': 0.12857456770473208,
              'G': 0.43398769844554153,
              'T': 0.15691302524886921},
             'AATGG': {'A': 0.29293874636404837,
              'C': 0.13187553122899692,
              'G': 0.44206843514135419,
              'T': 0.13311728726560054},
             'GTGGG': {'A': 0.32754990303158227,
              'C': 0.058738208294813882,
              'G': 0.24478848523480939,
              'T': 0.36892340343879454},
             'AATGC': {'A': 0.31165397560399777,
              'C': 0.28538366236651141,
              'G': 0.14324744626103045,
              'T': 0.25971491576846034},
             'AATGA': {'A': 0.34483112130413668,
              'C': 0.30423172926014924,
              'G': 0.053386222962492132,
              'T': 0.29755092647322179},
             'CGGCT': {'A': 0.45708498101268885,
              'C': 0.21484563781516849,
              'G': 0.14307756554396953,
              'T': 0.1849918156281731},
             'CACTT': {'A': 0.2620269078671208,
              'C': 0.18311054582543512,
              'G': 0.40976173829296259,
              'T': 0.14510080801448139},
             'GTGGA': {'A': 0.29420355739103998,
              'C': 0.2919348292558081,
              'G': 0.23304254934960791,
              'T': 0.18081906400354397},
             'GGGCT': {'A': 0.3324738684226311,
              'C': 0.33021687929366805,
              'G': 0.058530479231988078,
              'T': 0.27877877305171284},
             'ACTAT': {'A': 0.16621068122641824,
              'C': 0.34888081485998906,
              'G': 0.19777417266543224,
              'T': 0.2871343312481604},
             'ATACA': {'A': 0.1139890450506176,
              'C': 0.34312229279582296,
              'G': 0.40712585375915827,
              'T': 0.13576280839440122},
             'ATACC': {'A': 0.11359121980546563,
              'C': 0.29915586771663671,
              'G': 0.21205107733992842,
              'T': 0.37520183513796918},
             'ATACG': {'A': 0.3555341943180016,
              'C': 0.31111474920403798,
              'G': 0.2164112233657503,
              'T': 0.11693983311221023},
             'ACTAC': {'A': 0.13004832287448437,
              'C': 0.4260742149368405,
              'G': 0.26484188320566249,
              'T': 0.17903557898301259},
             'GGGCG': {'A': 0.32704727331478023,
              'C': 0.184720360478839,
              'G': 0.12613412174127925,
              'T': 0.36209824446510158},
             'ACTAA': {'A': 0.025303292935934765,
              'C': 0.43172443207004474,
              'G': 0.24284211744992726,
              'T': 0.30013015754409322},
             'GGGCA': {'A': 0.014691469712229632,
              'C': 0.51870899853081598,
              'G': 0.06559342062849495,
              'T': 0.40100611112845935},
             'ACTAG': {'A': 0.31935932315850718,
              'C': 0.086617188398674466,
              'G': 0.068354999467892294,
              'T': 0.52566848897492602},
             'GGGCC': {'A': 0.03479644924432284,
              'C': 0.65044591845266753,
              'G': 0.24239491220149237,
              'T': 0.072362720101517133},
             'ATACT': {'A': 0.11975856350310708,
              'C': 0.0738944524728153,
              'G': 0.42895750315940906,
              'T': 0.37738948086466856},
             'AGTTT': {'A': 0.072379799106589801,
              'C': 0.29279665435084612,
              'G': 0.31491733024569235,
              'T': 0.31990621629687188},
             'AGGTT': {'A': 0.29044648705363435,
              'C': 0.20422291859685779,
              'G': 0.18393097235600531,
              'T': 0.32139962199350247},
             'GATAC': {'A': 0.20033233532982395,
              'C': 0.3479899829899602,
              'G': 0.089154492139253874,
              'T': 0.36252318954096191},
             'AGTTA': {'A': 0.113915215337016,
              'C': 0.30761941090430961,
              'G': 0.33260464386636512,
              'T': 0.24586072989230914},
             'AGTTC': {'A': 0.22199383307795736,
              'C': 0.36193955092946284,
              'G': 0.34109963093876788,
              'T': 0.074966985053811747},
             'AGTTG': {'A': 0.078245787467316544,
              'C': 0.29783542422052611,
              'G': 0.27337661692542486,
              'T': 0.35054217138673249},
             'AGGTC': {'A': 0.36903307546192843,
              'C': 0.37826695691588941,
              'G': 0.21396923323447045,
              'T': 0.038730734387711789},
             'AGGTA': {'A': 0.092573789722067895,
              'C': 0.17316160701221078,
              'G': 0.52942348426896602,
              'T': 0.20484111899675531},
             'AGGTG': {'A': 0.14455359028152734,
              'C': 0.15816540327438749,
              'G': 0.36433903511113325,
              'T': 0.33294197133295195},
             'GTGGT': {'A': 0.082460957872489221,
              'C': 0.45901530898157211,
              'G': 0.051659769358330228,
              'T': 0.40686396378760853},
             'ATTGG': {'A': 0.21428522631038976,
              'C': 0.18283976996664117,
              'G': 0.45407119023103842,
              'T': 0.1488038134919307},
             'GTGTG': {'A': 0.043370473945366493,
              'C': 0.26869856025536787,
              'G': 0.29612411199590927,
              'T': 0.39180685380335645},
             'GCTCG': {'A': 0.073784224060459244,
              'C': 0.56706577724020879,
              'G': 0.13769351480686917,
              'T': 0.2214564838924627},
             'ATGAT': {'A': 0.14833255320729596,
              'C': 0.40197712399652413,
              'G': 0.080137259830804289,
              'T': 0.36955306296537571},
             'GCTCC': {'A': 0.12887095454871761,
              'C': 0.13685310864415512,
              'G': 0.36741746010685744,
              'T': 0.36685847670026989},
             'GCTCA': {'A': 0.29485177165755494,
              'C': 0.24164427637376867,
              'G': 0.15605386191860382,
              'T': 0.30745009005007246},
             'CAATT': {'A': 0.14284696516066439,
              'C': 0.09089606281968661,
              'G': 0.17024438541283257,
              'T': 0.59601258660681644},
             'ATGAA': {'A': 0.18745447591551559,
              'C': 0.21607704446079268,
              'G': 0.4472694105172963,
              'T': 0.14919906910639535},
             'GCTCT': {'A': 0.31526558990205322,
              'C': 0.31565410658055537,
              'G': 0.30095084677460832,
              'T': 0.068129456742783187},
             'ATGAC': {'A': 0.3122419547786478,
              'C': 0.14728045343498236,
              'G': 0.25427485927751231,
              'T': 0.28620273250885758},
             'GGCGC': {'A': 0.30473787643159922,
              'C': 0.31142733767285397,
              'G': 0.24238821977901509,
              'T': 0.14144656611653178},
             'ATGAG': {'A': 0.13132548580499009,
              'C': 0.34443370637332399,
              'G': 0.27198848234523693,
              'T': 0.25225232547644888},
             'GATAT': {'A': 0.35618436156956707,
              'C': 0.15455794385808869,
              'G': 0.33391775831156978,
              'T': 0.15533993626077441},
             'CGTAT': {'A': 0.80322421139694034,
              'C': 0.011445828344959847,
              'G': 0.14064007633015471,
              'T': 0.044689883927945248},
             'GGTGG': {'A': 0.28672112891978985,
              'C': 0.20746978415757503,
              'G': 0.20052088536942142,
              'T': 0.3052882015532139},
             'GGTGC': {'A': 0.38562858138966533,
              'C': 0.29020835491437741,
              'G': 0.30777708153706473,
              'T': 0.016385982158892455},
             'GGTGA': {'A': 0.39366074507606613,
              'C': 0.18757472104638404,
              'G': 0.11974045534818439,
              'T': 0.29902407852936547},
             'TAGCT': {'A': 0.13624057009321119,
              'C': 0.3322108085171121,
              'G': 0.24006747438884718,
              'T': 0.29148114700082955},
             'ACTTT': {'A': 0.35806763448540868,
              'C': 0.09170176984139311,
              'G': 0.16556106591778091,
              'T': 0.38466952975541746},
             'GGTGT': {'A': 0.37804801703485452,
              'C': 0.28718185451443767,
              'G': 0.26796103641910524,
              'T': 0.066809092031602652},
             'CGTAG': {'A': 0.14967194823830302,
              'C': 0.06524784440285826,
              'G': 0.42521250726504689,
              'T': 0.35986770009379182},
             'CGTAA': {'A': 0.39933144925460584,
              'C': 0.28875415266085841,
              'G': 0.2412499418098219,
              'T': 0.07066445627471396},
             'CGTAC': {'A': 0.18384587870002594,
              'C': 0.46011073173470202,
              'G': 0.20258497306312134,
              'T': 0.15345841650215084},
             'ACTTG': {'A': 0.18354358579820726,
              'C': 0.24261137477369565,
              'G': 0.25441120289442692,
              'T': 0.31943383653367008},
             'TAGCG': {'A': 0.1936668603090983,
              'C': 0.14626112602810584,
              'G': 0.14613057917746367,
              'T': 0.51394143448533225},
             'ACTTA': {'A': 0.34642580722357103,
              'C': 0.22694988227884896,
              'G': 0.40176961468702832,
              'T': 0.024854695810551653},
             'TAGCA': {'A': 0.29671918530213104,
              'C': 0.08411813307203192,
              'G': 0.29880314963482135,
              'T': 0.32035953199101552},
             'ACTTC': {'A': 0.11135018268005238,
              'C': 0.04478983214446116,
              'G': 0.48764175059910625,
              'T': 0.35621823457638013},
             'TAGCC': {'A': 0.21351059164973454,
              'C': 0.07711580881098469,
              'G': 0.3083042977968028,
              'T': 0.40106930174247796},
             'TGAGA': {'A': 0.18354923423560643,
              'C': 0.26209346994864957,
              'G': 0.39377384141837291,
              'T': 0.16058345439737101},
             'TGAGC': {'A': 0.46472213457961858,
              'C': 0.20447316493490819,
              'G': 0.062053316997942601,
              'T': 0.26875138348753069},
             'TGAGG': {'A': 0.38716209716606509,
              'C': 0.27179000067116138,
              'G': 0.06891814393620678,
              'T': 0.27212975822656676},
             'TGAGT': {'A': 0.29933046690728665,
              'C': 0.15311056142872309,
              'G': 0.29051316705638947,
              'T': 0.25704580460760074},
             'CAATA': {'A': 0.32918306581808682,
              'C': 0.40466628557803491,
              'G': 0.17210568628469433,
              'T': 0.094044962319183911},
             'TCGCG': {'A': 0.28871699058868688,
              'C': 0.19590619871371887,
              'G': 0.0041723761708203346,
              'T': 0.51120443452677389},
             'GGAGC': {'A': 0.33788576097809497,
              'C': 0.025921100524078724,
              'G': 0.54352436876053012,
              'T': 0.092668769737296222},
             'AGGAG': {'A': 0.017234957932008216,
              'C': 0.58253774830259808,
              'G': 0.081134915807132835,
              'T': 0.31909237795826101},
             'CAATC': {'A': 0.65604543554050576,
              'C': 0.20495999886919741,
              'G': 0.12130680656608145,
              'T': 0.017687759024215217},
             'AGGAA': {'A': 0.31980503944726413,
              'C': 0.35891341563785001,
              'G': 0.043672214727864755,
              'T': 0.27760933018702116},
             'AGGAC': {'A': 0.21431937544311805,
              'C': 0.24444400310609707,
              'G': 0.22178370698277794,
              'T': 0.319452914468007},
             'TCTAC': {'A': 0.43742662292201234,
              'C': 0.31724244246784572,
              'G': 0.098207661509735575,
              'T': 0.14712327310040629},
             'TCTAA': {'A': 0.34548646711745445,
              'C': 0.30816926577863035,
              'G': 0.17796635660366483,
              'T': 0.16837791050025044},
             'TCTAG': {'A': 0.3450122727654254,
              'C': 0.041640817449343372,
              'G': 0.4273323077645782,
              'T': 0.18601460202065317},
             'AGGAT': {'A': 0.068552323458258693,
              'C': 0.30276581743951653,
              'G': 0.1885793767634226,
              'T': 0.44010248233880234},
             'TCCAG': {'A': 0.028625003109517634,
              'C': 0.18050621299442654,
              'G': 0.21677830874932963,
              'T': 0.57409047514672618},
             'GGAGT': {'A': 0.11159873628351762,
              'C': 0.37389801613889501,
              'G': 0.091063962217337507,
              'T': 0.42343928536024994},
             'TCTAT': {'A': 0.16025237662620889,
              'C': 0.16859300637285857,
              'G': 0.63239239346783171,
              'T': 0.03876222353310093},
             'ATTCT': {'A': 0.41952630348138475,
              'C': 0.22210759892749057,
              'G': 0.25195792758702251,
              'T': 0.10640817000410209},
             'AAGTC': {'A': 0.11253455321276788,
              'C': 0.25239160094986007,
              'G': 0.53978421157134704,
              'T': 0.095289634266025061},
             'AAGTG': {'A': 0.2965453037531382,
              'C': 0.27081538081326889,
              'G': 0.16946978565048557,
              'T': 0.26316952978310731},
             'GTTAA': {'A': 0.22972174274861043,
              'C': 0.59341644013136896,
              'G': 0.10472396803523555,
              'T': 0.072137849084784988},
             'GTTAC': {'A': 0.039038162698276764,
              'C': 0.016726216784138135,
              'G': 0.50746740654130229,
              'T': 0.43676821397628274},
             'TCCAC': {'A': 0.31946452812380971,
              'C': 0.17854653672822757,
              'G': 0.22774484222188227,
              'T': 0.27424409292608048},
             'GTTAG': {'A': 0.28886196826961674,
              'C': 0.31828450633355798,
              'G': 0.35869092894407978,
              'T': 0.034162596452745379},
             'ACGAA': {'A': 0.035996510082004982,
              'C': 0.2357168731458304,
              'G': 0.40686004450676744,
              'T': 0.32142657226539723},
             'ATTCG': {'A': 0.66427702400378252,
              'C': 0.040980080209745515,
              'G': 0.24070602947745542,
              'T': 0.054036866309016413},
             'ATTCA': {'A': 0.097747942221119641,
              'C': 0.0447295160611993,
              'G': 0.291635512893825,
              'T': 0.565887028823856},
             'ATTCC': {'A': 0.0085160586028060672,
              'C': 0.012351850114761503,
              'G': 0.47378838073681911,
              'T': 0.50534371054561333},
             'TGCCC': {'A': 0.16056385996920766,
              'C': 0.29315758838484252,
              'G': 0.13659139414140073,
              'T': 0.40968715750454904},
             'GTTAT': {'A': 0.11345818985791745,
              'C': 0.2882456179397897,
              'G': 0.25033831603047252,
              'T': 0.34795787617182034},
             'TGCGT': {'A': 0.6098658137407047,
              'C': 0.20870657906545573,
              'G': 0.15939944043038096,
              'T': 0.022028166763458808},
             'TTGGC': {'A': 0.26164083347421696,
              'C': 0.36893703451759718,
              'G': 0.23045977752352945,
              'T': 0.13896235448465638},
             'TTGGA': {'A': 0.44861181431907615,
              'C': 0.20545217000855767,
              'G': 0.13968540969409865,
              'T': 0.20625060597826766},
             'TTGGG': {'A': 0.33084546183254226,
              'C': 0.1555615962628619,
              'G': 0.26467275624799647,
              'T': 0.24892018565659954},
             'TGCGG': {'A': 0.16810930273411576,
              'C': 0.078426334218905061,
              'G': 0.42054933972551661,
              'T': 0.33291502332146261},
             'TGCGC': {'A': 0.22516420502021095,
              'C': 0.23439333110242166,
              'G': 0.28401239414336765,
              'T': 0.25643006973399968},
             'TGCGA': {'A': 0.33595399947151172,
              'C': 0.39420647532622105,
              'G': 0.23382973463232765,
              'T': 0.036009790569939588},
             'TTGGT': {'A': 0.24165087012827507,
              'C': 0.3318534363250305,
              'G': 0.074352987720892938,
              'T': 0.35214270582580132},
             'TCGCT': {'A': 0.091926549766551818,
              'C': 0.25864364791265848,
              'G': 0.31154437452027312,
              'T': 0.33788542780051661},
             'CCGCT': {'A': 0.13554035371298301,
              'C': 0.30337072954142497,
              'G': 0.27725446931546605,
              'T': 0.28383444743012598},
             'CCGCG': {'A': 0.21057486583476617,
              'C': 0.39355976310833218,
              'G': 0.10862270647127191,
              'T': 0.28724266458562958},
             'CCGCA': {'A': 0.35096808408158386,
              'C': 0.17720767202672971,
              'G': 0.13987842782451795,
              'T': 0.3319458160671685},
             'CCGCC': {'A': 0.34695630904325647,
              'C': 0.1333694759652595,
              'G': 0.29274935378026778,
              'T': 0.22692486121121647},
             'CGGTT': {'A': 0.1531195129699453,
              'C': 0.27751344333098088,
              'G': 0.38601633915774297,
              'T': 0.18335070454133079},
             'TAAGC': {'A': 0.39938091223100775,
              'C': 0.18939519703259536,
              'G': 0.30817687048124737,
              'T': 0.10304702025514957},
             'TAAGA': {'A': 0.3163866501158516,
              'C': 0.01749489546529542,
              'G': 0.26184213550819641,
              'T': 0.40427631891065657},
             'TAAGG': {'A': 0.066736893541555722,
              'C': 0.5468361404329658,
              'G': 0.058886909222258053,
              'T': 0.32754005680322046},
             'CGGTG': {'A': 0.31445162844224372,
              'C': 0.015749792546555289,
              'G': 0.28077526724394469,
              'T': 0.3890233117672563},
             'CGGTA': {'A': 0.35578887744404702,
              'C': 0.26608688514689488,
              'G': 0.15296905467529776,
              'T': 0.22515518273376042},
             'TAAGT': {'A': 0.28222371857928641,
              'C': 0.32441018816639222,
              'G': 0.034994167477158576,
              'T': 0.35837192577716281},
             'CGGTC': {'A': 0.29478460751521246,
              'C': 0.16981369688465953,
              'G': 0.41096157742155653,
              'T': 0.12444011817857144},
             'AAGAC': {'A': 0.23914853809644518,
              'C': 0.24011420675384923,
              'G': 0.28892414642824304,
              'T': 0.23181310872146249},
             'AAGAA': {'A': 0.41418404626486577,
              'C': 0.4315898645650954,
              'G': 0.052521915083777994,
              'T': 0.10170417408626078},
             'AAGAG': {'A': 0.28021989694433291,
              'C': 0.32529894299101453,
              'G': 0.37791777708261604,
              'T': 0.016563382982036363},
             'CCCTG': {'A': 0.44292145477748041,
              'C': 0.29120761790452121,
              'G': 0.16322106203506859,
              'T': 0.10264986528292976},
             'CCCTA': {'A': 0.42033331904732685,
              'C': 0.39488367685025116,
              'G': 0.023091164854810324,
              'T': 0.16169183924761169},
             'CCCTC': {'A': 0.3118356045824684,
              'C': 0.012667362131605443,
              'G': 0.23041953955069996,
              'T': 0.4450774937352262},
             'AAGAT': {'A': 0.47539343624276781,
              'C': 0.1507460505060659,
              'G': 0.33497996138149105,
              'T': 0.038880551869675192},
             'CCCTT': {'A': 0.26911567566791522,
              'C': 0.50091560144500613,
              'G': 0.01120414395237514,
              'T': 0.21876457893470355},
             'CTGGA': {'A': 0.1360233671724832,
              'C': 0.40980166544481894,
              'G': 0.063190038858092615,
              'T': 0.39098492852460515},
             'CTGGC': {'A': 0.32877076094057511,
              'C': 0.0095943952912890592,
              'G': 0.39902044794328123,
              'T': 0.26261439582485457},
             'CTGGG': {'A': 0.33407960572675166,
              'C': 0.272661788874211,
              'G': 0.10245369603623132,
              'T': 0.29080490936280595},
             'ACCGG': {'A': 0.055656751927361699,
              'C': 0.20573749657432117,
              'G': 0.63198232841314583,
              'T': 0.10662342308517141},
             'ACCGC': {'A': 0.35541137309690662,
              'C': 0.23762757729018935,
              'G': 0.10845409725955249,
              'T': 0.29850695235335151},
             'ACCGA': {'A': 0.47091762383282948,
              'C': 0.020647957093489742,
              'G': 0.08157791877302896,
              'T': 0.4268565003006517},
             'CTGGT': {'A': 0.21508095961796708,
              'C': 0.23597114828816243,
              'G': 0.37401613360324759,
              'T': 0.17493175849062284},
             'ACCGT': {'A': 0.34414573585540364,
              'C': 0.25285168869090863,
              'G': 0.088866262231594467,
              'T': 0.31413631322209334},
             'TACAT': {'A': 0.00081419908730719645,
              'C': 0.21589651443153896,
              'G': 0.33613777449634435,
              'T': 0.44715151198480951},
             'CCTGG': {'A': 0.286727280670316,
              'C': 0.2665593097524197,
              'G': 0.1700378061736677,
              'T': 0.27667560340359632},
             'CCTGC': {'A': 0.37523531296374224,
              'C': 0.02088091147610709,
              'G': 0.19399391667710683,
              'T': 0.4098898588830438},
             'CCTGA': {'A': 0.097592437177843328,
              'C': 0.20210807528244654,
              'G': 0.32216252040259186,
              'T': 0.37813696713711825},
             'TACAC': {'A': 0.14040089659776409,
              'C': 0.03672218420267194,
              'G': 0.71278960119226686,
              'T': 0.11008731800729721},
             'TACAA': {'A': 0.39211562858427818,
              'C': 0.12006060439478317,
              'G': 0.42380665808529933,
              'T': 0.064017108935639416},
             'TACAG': {'A': 0.31541310798472066,
              'C': 0.13432421322819643,
              'G': 0.29738934864492006,
              'T': 0.25287333014216279},
             'CCTGT': {'A': 0.017863908908840247,
              'C': 0.20457974806750834,
              'G': 0.42343110992377375,
              'T': 0.35412523309987765},
             'CAAGA': {'A': 0.16922049818175999,
              'C': 0.25690370524864981,
              'G': 0.29556898532900627,
              'T': 0.2783068112405841},
             'CAAGC': {'A': 0.43888831922138793,
              'C': 0.0098860156182375234,
              'G': 0.12143590116665436,
              'T': 0.42978976399372026},
             'CAAGG': {'A': 0.46162339499201832,
              'C': 0.39367635633909381,
              'G': 0.071847979524170241,
              'T': 0.072852269144717555},
             'CATAC': {'A': 0.11797702281319143,
              'C': 0.17582209456822931,
              'G': 0.31132345884098273,
              'T': 0.39487742377759655},
             'CATAA': {'A': 0.050813316384398288,
              'C': 0.1030910610075908,
              'G': 0.67365843366914291,
              'T': 0.17243718893886814},
             'CATAG': {'A': 0.02606451609003374,
              'C': 0.40138132176595026,
              'G': 0.14218463615491914,
              'T': 0.43036952598909672},
             'TGTTG': {'A': 0.18129057893400005,
              'C': 0.33005653705236537,
              'G': 0.30348487473294,
              'T': 0.18516800928069449},
             'CAAGT': {'A': 0.25192983930015367,
              'C': 0.22641132458962035,
              'G': 0.24841683215309704,
              'T': 0.27324200395712883},
             'CATAT': {'A': 0.35722787692076757,
              'C': 0.075360851183378319,
              'G': 0.35280007544571951,
              'T': 0.21461119645013477},
             'GAAGT': {'A': 0.039151139171331027,
              'C': 0.60352184209455761,
              'G': 0.051262354824268747,
              'T': 0.30606466390984244},
             'GAAGG': {'A': 0.31739901660623376,
              'C': 0.37136315589397406,
              'G': 0.080448094580178708,
              'T': 0.23078973291961341},
             'GAAGA': {'A': 0.33148685972025327,
              'C': 0.31745075836698977,
              'G': 0.24517652153350253,
              'T': 0.10588586037925439},
             'GAAGC': {'A': 0.068946847973923461,
              'C': 0.20916105375274621,
              'G': 0.37754904993000082,
              'T': 0.34434304834332946},
             'TCCAT': {'A': 0.39909976444252515,
              'C': 0.10255435140385036,
              'G': 0.15065887647752471,
              'T': 0.34768700767609972},
             'ATCCT': {'A': 0.1983030956395751,
              'C': 0.011596813303821814,
              'G': 0.45392203413616239,
              'T': 0.33617805692044056},
             'GAGGC': {'A': 0.43484622180255234,
              'C': 0.31722974658405467,
              'G': 0.14181096013875891,
              'T': 0.10611307147463415},
             'GAGGA': {'A': 0.44936799821994533,
              'C': 0.1442282878093667,
              'G': 0.032984187983977821,
              'T': 0.37341952598671013},
             'GTATT': {'A': 0.30705189807040256,
              'C': 0.073740813928149324,
              'G': 0.32836275118127023,
              'T': 0.2908445368201778},
             'GTATC': {'A': 0.24843638802726931,
              'C': 0.13105632651919805,
              'G': 0.21857447028433871,
              'T': 0.40193281516919405},
             'ATCCG': {'A': 0.37122606084097282,
              'C': 0.11849464565901147,
              'G': 0.38487389728002397,
              'T': 0.12540539621999172},
             'GTATA': {'A': 0.33416589762765686,
              'C': 0.44919184390249856,
              'G': 0.15944519269521371,
              'T': 0.057197065774630886},
             'GAGGT': {'A': 0.2295411077197774,
              'C': 0.1429139636438454,
              'G': 0.13831110478885203,
              'T': 0.48923382384752523},
             'GTATG': {'A': 0.36632219175570246,
              'C': 0.011997953386570925,
              'G': 0.38100012316781889,
              'T': 0.24067973168990761},
             'TCCAA': {'A': 0.24670850483146284,
              'C': 0.29527496098763834,
              'G': 0.22243039287334726,
              'T': 0.23558614130755162},
             'ATCCA': {'A': 0.28088960882341923,
              'C': 0.34994503938160587,
              'G': 0.35458003950811723,
              'T': 0.014585312286857605},
             'TACTT': {'A': 0.43108310987752324,
              'C': 0.19963230780519609,
              'G': 0.03531769161154847,
              'T': 0.33396689070573216},
             'GTCCG': {'A': 0.10952638831167409,
              'C': 0.23789258824367376,
              'G': 0.39780537994013382,
              'T': 0.25477564350451837},
             'GTCCA': {'A': 0.28786442058930251,
              'C': 0.25779104823258769,
              'G': 0.18813475707038704,
              'T': 0.2662097741077229},
             'GTCCC': {'A': 0.46240005018478386,
              'C': 0.23871067091398154,
              'G': 0.027161919668983486,
              'T': 0.27172735923225116},
             'GTCCT': {'A': 0.25349791922650383,
              'C': 0.31708725208633592,
              'G': 0.22948780736219068,
              'T': 0.19992702132496962},
             'TACTG': {'A': 0.22230650198049498,
              'C': 0.20157987839025868,
              'G': 0.2521834551083727,
              'T': 0.32393016452087359},
             'TACTA': {'A': 0.31944729329860527,
              'C': 0.30768905371237992,
              'G': 0.21618086937453482,
              'T': 0.15668278361447993},
             'TACTC': {'A': 0.29548626565979325,
              'C': 0.15824576198571749,
              'G': 0.30178744627307558,
              'T': 0.2444805260814136},
             'AGCGT': {'A': 0.76597245085628074,
              'C': 0.12395183252566647,
              'G': 0.093355392674950591,
              'T': 0.016720323943102119},
             'AGCGC': {'A': 0.4355781227656349,
              'C': 0.28543352028779173,
              'G': 0.18452002226985981,
              'T': 0.094468334676713589},
             'AGCGA': {'A': 0.21451358678339191,
              'C': 0.65849137305083116,
              'G': 0.12061148712492627,
              'T': 0.0063835530408507084},
             'AGCGG': {'A': 0.60375000062176853,
              'C': 0.17991039174319096,
              'G': 0.20728908604286336,
              'T': 0.0090505215921770476},
             'TCAGT': {'A': 0.31798195998006973,
              'C': 0.27050519213764146,
              'G': 0.069900279851184507,
              'T': 0.34161256803110424},
             'CTTCT': {'A': 0.29101663063204608,
              'C': 0.35394480564107461,
              'G': 0.078900437577997265,
              'T': 0.27613812614888206},
             'CTTCC': {'A': 0.19278946739322461,
              'C': 0.31574433655066314,
              'G': 0.07865170171938228,
              'T': 0.41281449433672984},
             'CTTCA': {'A': 0.41377754911923015,
              'C': 0.14998299485915331,
              'G': 0.27755105308555034,
              'T': 0.1586884029360662},
             'TCAGG': {'A': 0.044465260764295085,
              'C': 0.12083123702419778,
              'G': 0.48139247296724103,
              'T': 0.35331102924426599},
             'CTTCG': {'A': 0.27842394956882444,
              'C': 0.28519037407807113,
              'G': 0.30197803404811291,
              'T': 0.13440764230499141},
             'TCAGA': {'A': 0.36489007225870829,
              'C': 0.41659260197167725,
              'G': 0.067632544496401645,
              'T': 0.15088478127321286},
             'TCAGC': {'A': 0.19483635526574439,
              'C': 0.23394008524846024,
              'G': 0.50577114941927759,
              'T': 0.065452410066517766},
             'AAAAT': {'A': 0.10060020970041705,
              'C': 0.25712010609346808,
              'G': 0.34687051902525368,
              'T': 0.29540916518086108},
             'TCAAA': {'A': 0.42911324009212165,
              'C': 0.10190816880294359,
              'G': 0.018792783384788979,
              'T': 0.45018580772014577},
             'AAAAA': {'A': 0.16673219940105441,
              'C': 0.12417383464231564,
              'G': 0.51957906228244377,
              'T': 0.18951490367418627},
             'AAAAC': {'A': 0.38869013860837115,
              'C': 0.37374245433672082,
              'G': 0.21818503420829172,
              'T': 0.019382372846616404},
             'AAAAG': {'A': 0.28253395276022197,
              'C': 0.0088131710168325213,
              'G': 0.29911748998782772,
              'T': 0.4095353862351177},
             'GGATT': {'A': 0.35163639910914218,
              'C': 0.41904645943069763,
              'G': 0.032763666838781125,
              'T': 0.19655347462137907},
             'CGTTG': {'A': 0.18090868120128054,
              'C': 0.28314785780013746,
              'G': 0.18594617442965269,
              'T': 0.3499972865689292},
             'CGTTC': {'A': 0.090959877241692133,
              'C': 0.41080990140273843,
              'G': 0.35299369046586437,
              'T': 0.14523653088970515},
             'CGTTA': {'A': 0.55888085504183094,
              'C': 0.22473610222103635,
              'G': 0.033013502660816957,
              'T': 0.18336954007631592},
             'GGATG': {'A': 0.45975183553164345,
              'C': 0.28587008191723823,
              'G': 0.18321154512523952,
              'T': 0.071166537425878723},
             'GGATC': {'A': 0.074378038739960906,
              'C': 0.2416391241558872,
              'G': 0.064130796386354702,
              'T': 0.6198520407177972},
             'GGATA': {'A': 0.23349561556512721,
              'C': 0.30336263028586996,
              'G': 0.38711594209997308,
              'T': 0.076025812049029778},
             'CGTTT': {'A': 0.19920774910192465,
              'C': 0.43446935160208366,
              'G': 0.10419074078499825,
              'T': 0.26213215851099347},
             'TTTTT': {'A': 0.16692242196389054,
              'C': 0.21195335013878414,
              'G': 0.3283829887628521,
              'T': 0.29274123913447331},
             'AGTGA': {'A': 0.082503123023671548,
              'C': 0.31030430726484048,
              'G': 0.30152241260394791,
              'T': 0.30567015710753992},
             'AGTGC': {'A': 0.2308186138962183,
              'C': 0.060767167995206026,
              'G': 0.14385540070341213,
              'T': 0.56455881740516356},
             'AGTGG': {'A': 0.36461230521255139,
              'C': 0.24108032875713767,
              'G': 0.17476909626649229,
              'T': 0.21953826976381874},
             'TTTTG': {'A': 0.0062984504390572659,
              'C': 0.41329742873862246,
              'G': 0.12617963188763526,
              'T': 0.45422448893468487},
             'TTTTA': {'A': 0.15301386912295464,
              'C': 0.13850867680186821,
              'G': 0.34613721697582261,
              'T': 0.36234023709935442},
             'TTTTC': {'A': 0.30875585631272884,
              'C': 0.08664592227728847,
              'G': 0.35401033754364192,
              'T': 0.25058788386634073},
             'AGTGT': {'A': 0.44988938680802709,
              'C': 0.27263192696672806,
              'G': 0.19527815259962381,
              'T': 0.082200533625621242},
             'ATGGG': {'A': 0.24153874878489326,
              'C': 0.19327883860727826,
              'G': 0.24988889218592159,
              'T': 0.31529352042190689},
             'ATGGC': {'A': 0.30844124367833969,
              'C': 0.25740934975934671,
              'G': 0.16928565045714361,
              'T': 0.26486375610516993},
             'ATGGA': {'A': 0.47206535156601581,
              'C': 0.18149263121183432,
              'G': 0.28168437591000067,
              'T': 0.064757641312149214},
             'CCAGC': {'A': 0.28970054237901427,
              'C': 0.14303908514116251,
              'G': 0.35966696294831663,
              'T': 0.20759340953150637},
             'CCAGA': {'A': 0.34315362736735855,
              'C': 0.1694670401701063,
              'G': 0.14623143413124365,
              'T': 0.34114789833129155},
             'CCAGG': {'A': 0.30549438713476651,
              'C': 0.31746533110914615,
              'G': 0.12062887348796919,
              'T': 0.2564114082681182},
             'ATGGT': {'A': 0.2241341571702303,
              'C': 0.20430052897576062,
              'G': 0.37204149915840729,
              'T': 0.19952381469560182},
             'ATCCC': {'A': 0.41635458096729466,
              'C': 0.17712691989501206,
              'G': 0.38639366159857574,
              'T': 0.020124837539117608},
             'CCAGT': {'A': 0.077255238650760616,
              'C': 0.31224054914659694,
              'G': 0.071823959239669347,
              'T': 0.53868025296297328},
             'AACCA': {'A': 0.046129607899040886,
              'C': 0.15549970413760719,
              'G': 0.35163742159428013,
              'T': 0.4467332663690719},
             'AACCC': {'A': 0.27642739159802132,
              'C': 0.293440470248235,
              'G': 0.29331085220797287,
              'T': 0.13682128594577078},
             'AACCG': {'A': 0.23102254942237391,
              'C': 0.33536904340633605,
              'G': 0.24520833147000462,
              'T': 0.18840007570128547},
             'AACCT': {'A': 0.12326489834218934,
              'C': 0.35392000433519799,
              'G': 0.38400871240112588,
              'T': 0.13880638492148681},
             'GCCTA': {'A': 0.24578776101229316,
              'C': 0.10998195150756224,
              'G': 0.41560094699145694,
              'T': 0.22862934048868758},
             'GCCTC': {'A': 0.26166443004211176,
              'C': 0.31483728654288046,
              'G': 0.19647464885766339,
              'T': 0.22702363455734445},
             'GCCTG': {'A': 0.24769773876147963,
              'C': 0.25732138725256676,
              'G': 0.2614425222939103,
              'T': 0.23353835169204346},
             'CTAAG': {'A': 0.29788932375675004,
              'C': 0.13487327999323442,
              'G': 0.1675464825110777,
              'T': 0.39969091373893789},
             'CTAAA': {'A': 0.16970133933400733,
              'C': 0.30116047677631325,
              'G': 0.24104883917325062,
              'T': 0.28808934471642872},
             'GCACT': {'A': 0.38609447084854348,
              'C': 0.383887075732257,
              'G': 0.072166118253500083,
              'T': 0.15785233516569949},
             'GCCTT': {'A': 0.20453805116751203,
              'C': 0.55769169895197712,
              'G': 0.097189894148893369,
              'T': 0.14058035573161751},
             'GCACC': {'A': 0.33762048093140756,
              'C': 0.053275276331930577,
              'G': 0.53169035867335324,
              'T': 0.077413884063308583},
             'GCACA': {'A': 0.24681215390749489,
              'C': 0.037351330701826092,
              'G': 0.22353240376862452,
              'T': 0.49230411162205445},
             'GCACG': {'A': 0.40112047828546693,
              'C': 0.068508209827675401,
              'G': 0.16007072005586506,
              'T': 0.37030059183099251},
             'TTATT': {'A': 0.18776259464811942,
              'C': 0.29331075881571256,
              'G': 0.21947731960676531,
              'T': 0.29944932692940279},
             'TTATA': {'A': 0.16980816670047424,
              'C': 0.323650486204138,
              'G': 0.17902636832468233,
              'T': 0.3275149787707054},
             'TTATC': {'A': 0.22358306167330874,
              'C': 0.10989287797150145,
              'G': 0.15121834910983029,
              'T': 0.51530571124535951},
             'TTATG': {'A': 0.38178042412571306,
              'C': 0.24175058483089193,
              'G': 0.025620801247650846,
              'T': 0.35084818979574411},
             'ACCTT': {'A': 0.10395904607259626,
              'C': 0.61595119941533005,
              'G': 0.092823140910864105,
              'T': 0.18726661360120955},
             'CAGCT': {'A': 0.20192846923998706,
              'C': 0.23612636521466629,
              'G': 0.23809059432262131,
              'T': 0.32385457122272537},
             'ACCTC': {'A': 0.35209814314723209,
              'C': 0.25305939486623985,
              'G': 0.017268174285939613,
              'T': 0.37757428770058843},
             'ACCTA': {'A': 0.43248818346968543,
              'C': 0.15461389526082239,
              'G': 0.093166458939530808,
              'T': 0.31973146232996152},
             'ACCTG': {'A': 0.12580104240522436,
              'C': 0.52404372473785343,
              'G': 0.2220687318653683,
              'T': 0.12808650099155394},
             'CAGCG': {'A': 0.052974365833569965,
              'C': 0.33522111981631553,
              'G': 0.36737808672662015,
              'T': 0.24442642762349423},
             'CAGCC': {'A': 0.48242185179239128,
              'C': 0.091911920160230087,
              'G': 0.26613151243718419,
              'T': 0.15953471561019461},
             'CAGCA': {'A': 0.24092093207279802,
              'C': 0.40309419325700518,
              'G': 0.076507553541843895,
              'T': 0.27947732112835283},
             'TGAAT': {'A': 0.27450200950899356,
              'C': 0.04546877243613489,
              'G': 0.26727822606947826,
              'T': 0.41275099198539333},
             'TGAAG': {'A': 0.43132120495127585,
              'C': 0.0064154293409902016,
              'G': 0.020432858706213034,
              'T': 0.54183050700152102},
             'TGAAC': {'A': 0.18183270898253931,
              'C': 0.23017959562924864,
              'G': 0.28533902957243257,
              'T': 0.30264866581577948},
             'TGAAA': {'A': 0.16905793774275987,
              'C': 0.2070177325667813,
              'G': 0.42405801159892098,
              'T': 0.19986631809153793},
             'GCCAC': {'A': 0.26818022396109925,
              'C': 0.436970666323858,
              'G': 0.17286781924187114,
              'T': 0.12198129047317166},
             'GCCAA': {'A': 0.33452445470450398,
              'C': 0.0027841997045139912,
              'G': 0.24168043206029999,
              'T': 0.42101091353068215},
             'GCCAG': {'A': 0.30572307946367799,
              'C': 0.2937724914191629,
              'G': 0.3279379265280814,
              'T': 0.072566502589077778},
             'GCCAT': {'A': 0.3599405195531325,
              'C': 0.32034459784843572,
              'G': 0.17471932377520616,
              'T': 0.14499555882322571},
             'GTGAC': {'A': 0.33952628722808559,
              'C': 0.03114391753590302,
              'G': 0.28233123756417239,
              'T': 0.34699855767183896},
             'GTGAA': {'A': 0.27638350166205222,
              'C': 0.18959071146074927,
              'G': 0.23758134657316085,
              'T': 0.29644444030403755},
             'GTGAG': {'A': 0.026480560905986984,
              'C': 0.0053531453889648379,
              'G': 0.27065025999867515,
              'T': 0.69751603370637305},
             'TTAAT': {'A': 0.050494570167484223,
              'C': 0.20244338603750991,
              'G': 0.40667683587132242,
              'T': 0.34038520792368337},
             'CGCGA': {'A': 0.30255486273108229,
              'C': 0.083777509593461405,
              'G': 0.18034142404089096,
              'T': 0.43332620363456525},
             'CGCGC': {'A': 0.32338525547752578,
              'C': 0.064670592383721373,
              'G': 0.23082231822145954,
              'T': 0.38112183391729337},
             'CGCGG': {'A': 0.37444470407735198,
              'C': 0.027945424234941372,
              'G': 0.28109248686211502,
              'T': 0.31651738482559155},
             'TTAAC': {'A': 0.28337050934513042,
              'C': 0.51070785239452365,
              'G': 0.17174301030291544,
              'T': 0.034178627957430478},
             'TTAAA': {'A': 7.1770217251015923e-05,
              'C': 0.16888614057852502,
              'G': 0.36528637705775235,
              'T': 0.4657557121464716},
             'AGTAA': {'A': 0.03637436990005314,
              'C': 0.20913972417064691,
              'G': 0.30834733271867859,
              'T': 0.44613857321062139},
             'TTAAG': {'A': 0.33740903359012936,
              'C': 0.039485902234646077,
              'G': 0.33116837660865017,
              'T': 0.29193668756657448},
             'AGGCC': {'A': 0.030200196527382622,
              'C': 0.25235082145680632,
              'G': 0.35481694266695901,
              'T': 0.36263203934885219},
             'CTGAT': {'A': 0.11846558991299998,
              'C': 0.23440182313593697,
              'G': 0.054220223127581395,
              'T': 0.59291236382348167},
             'TTCCT': {'A': 0.087133541372573967,
              'C': 0.39017907756514658,
              'G': 0.38525518808732134,
              'T': 0.1374321929749579},
             'ACCAT': {'A': 0.28022482540627491,
              'C': 0.097431232728949962,
              'G': 0.1380321036934494,
              'T': 0.48431183817132584},
             'CAGTT': {'A': 0.51751467243402505,
              'C': 0.02716697962357709,
              'G': 0.097578337025422734,
              'T': 0.3577400109169751},
             'GCGCC': {'A': 0.29436464972418031,
              'C': 0.084200481870093435,
              'G': 0.41669677389149484,
              'T': 0.20473809451423133},
             'TTCCC': {'A': 0.011490656721874618,
              'C': 0.48735623691469898,
              'G': 0.3644426719919524,
              'T': 0.13671043437147393},
             'CTGAG': {'A': 0.16597055509631609,
              'C': 0.37893897124417031,
              'G': 0.23748513216189945,
              'T': 0.21760534149761421},
             'TTCCA': {'A': 0.38717439013029853,
              'C': 0.2542993576756068,
              'G': 0.20210617092156277,
              'T': 0.1564200812725319},
             'TTCCG': {'A': 0.11713882932834038,
              'C': 0.41180956367872984,
              'G': 0.2041393739241591,
              'T': 0.26691223306877065},
             'CTGAC': {'A': 0.187345852348446,
              'C': 0.28838721664680533,
              'G': 0.18005661462058634,
              'T': 0.34421031638416227},
             'CTGAA': {'A': 0.39160858105259294,
              'C': 0.23452460536690525,
              'G': 0.0049159758951047884,
              'T': 0.36895083768539688},
             'CAGTG': {'A': 0.39981495185944937,
              'C': 0.091545717560418655,
              'G': 0.16218278552256968,
              'T': 0.34645654505756229},
             'ACCAG': {'A': 0.27782476421180108,
              'C': 0.27596957675125172,
              'G': 0.23881202098422941,
              'T': 0.20739363805271785},
             'ACCAA': {'A': 0.38126574638589128,
              'C': 0.36396921577316566,
              'G': 0.21267128333521021,
              'T': 0.042093754505732939},
             'CAGTC': {'A': 0.30629626647351954,
              'C': 0.10487827835695515,
              'G': 0.25879699402971057,
              'T': 0.33002846113981482},
             'ACCAC': {'A': 0.17894659541778996,
              'C': 0.40359999160655891,
              'G': 0.24486511675449824,
              'T': 0.17258829622115285},
             'CAGTA': {'A': 0.082901559345661319,
              'C': 0.34301971038393286,
              'G': 0.306485642233425,
              'T': 0.26759308803698084},
             'GCTTT': {'A': 0.20088230123380207,
              'C': 0.3712909213919206,
              'G': 0.054387266081303856,
              'T': 0.37343951129297359},
             'TCCTG': {'A': 0.52929186047018462,
              'C': 0.32256411548270553,
              'G': 0.11246772900242739,
              'T': 0.035676295044682435},
             'GTACC': {'A': 0.37219705179030432,
              'C': 0.35734088830112271,
              'G': 0.10814794109436673,
              'T': 0.1623141188142061},
             'GTACA': {'A': 0.1401177337174272,
              'C': 0.034769937016670797,
              'G': 0.47337206601420645,
              'T': 0.35174026325169538},
             'TCCTC': {'A': 0.16801383351986857,
              'C': 0.25285891963308083,
              'G': 0.30608802606363766,
              'T': 0.27303922078341286},
             'GTACG': {'A': 0.19281669106661506,
              'C': 0.21546597150935046,
              'G': 0.27389393321437538,
              'T': 0.31782340420965904},
             'TCCTA': {'A': 0.25292338842024287,
              'C': 0.27278871736103566,
              'G': 0.25940132215111261,
              'T': 0.21488657206760869},
             'TCCTT': {'A': 0.60129578650402238,
              'C': 0.27605742546843715,
              'G': 0.10333712855173242,
              'T': 0.019309659475808059},
             'GTACT': {'A': 0.37183896559398638,
              'C': 0.12187541238307102,
              'G': 0.18612463730321843,
              'T': 0.32016098471972421},
             'TCGTC': {'A': 0.12363142329203906,
              'C': 0.27004538925654525,
              'G': 0.31948918396861958,
              'T': 0.28683400348279636},
             'AGCTG': {'A': 0.099887188533084592,
              'C': 0.27690640188884252,
              'G': 0.27725362164593598,
              'T': 0.34595278793213691},
             'TCGTA': {'A': 0.4039438849336181,
              'C': 0.27421781600591755,
              'G': 0.012844246789217216,
              'T': 0.30899405227124704},
             'TGGAG': {'A': 0.22739481297747621,
              'C': 0.35513119199933391,
              'G': 0.347146461341718,
              'T': 0.070327533681471932},
             'TCGTG': {'A': 0.09496611628614654,
              'C': 0.41660850821863465,
              'G': 0.13476214461441896,
              'T': 0.35366323088079982},
             'AGCTC': {'A': 0.37467891792591279,
              'C': 0.41227141673732703,
              'G': 0.14396895333429696,
              'T': 0.069080712002463282},
             'TGGAC': {'A': 0.033401190200252194,
              'C': 0.3076181815492845,
              'G': 0.34744254049427037,
              'T': 0.31153808775619302},
             'TGGAT': {'A': 0.042850476782344493,
              'C': 0.17696617930405317,
              'G': 0.44337263400308979,
              'T': 0.3368107099105126},
             'AGCTT': {'A': 0.19347924330018365,
              'C': 0.20272454369979337,
              'G': 0.48151740026287398,
              'T': 0.12227881273714884},
             'TCGTT': {'A': 0.5285341719694,
              'C': 0.032291503505174138,
              'G': 0.12634910395433688,
              'T': 0.31282522057108891},
             'GAGAT': {'A': 0.3810916430110034,
              'C': 0.28346856228471684,
              'G': 0.079041649733303757,
              'T': 0.25639814497097607},
             'ACACG': {'A': 0.22819133255506263,
              'C': 0.033518358898971555,
              'G': 0.35545429866311812,
              'T': 0.38283600988284761},
             'CGGAT': {'A': 0.35325862177953832,
              'C': 0.26022815105389002,
              'G': 0.28387919078417517,
              'T': 0.10263403638239642},
             'ACACA': {'A': 0.40884857966799243,
              'C': 0.26252414091490656,
              'G': 0.20057309235803072,
              'T': 0.12805418705907029},
             'ACACC': {'A': 0.082617473637553507,
              'C': 0.30985998955492627,
              'G': 0.3041852902369393,
              'T': 0.30333724657058087},
             'ATATG': {'A': 0.3262026382560026,
              'C': 0.4683832900552734,
              'G': 0.091711399997614448,
              'T': 0.1137026716911097},
             'ATATA': {'A': 0.34936910210634786,
              'C': 0.34980200290328251,
              'G': 0.27061283985077633,
              'T': 0.030216055139593398},
             'ATATC': {'A': 0.62863871435271157,
              'C': 0.21487697717719417,
              'G': 0.025048650095355895,
              'T': 0.13143565837473845},
             'CGGAG': {'A': 0.10830523455564792,
              'C': 0.051023479471152301,
              'G': 0.41682301385486187,
              'T': 0.42384827211833792},
             'ACACT': {'A': 0.095617203354017036,
              'C': 0.41164112113542228,
              'G': 0.40408978049614125,
              'T': 0.088651895014419446},
             'GAGAG': {'A': 0.15984505293178558,
              'C': 0.27813757897378283,
              'G': 0.32213218956605999,
              'T': 0.23988517852837166},
             'CGGAC': {'A': 0.0087802675713136383,
              'C': 0.54724342724432906,
              'G': 0.325030114057553,
              'T': 0.11894619112680418},
             'GAGAC': {'A': 0.0064930341684398948,
              'C': 0.43617740917565995,
              'G': 0.15735811162002411,
              'T': 0.39997144503587601},
             'ATATT': {'A': 0.16701390936196195,
              'C': 0.4135111409067449,
              'G': 0.012652412064433669,
              'T': 0.4068225376668595},
             'GGGAT': {'A': 0.28610692215675265,
              'C': 0.28034985610897578,
              'G': 0.22101503181877447,
              'T': 0.21252818991549713},
             'GAATG': {'A': 0.044783733507527075,
              'C': 0.10000070694760387,
              'G': 0.39573255753440539,
              'T': 0.45948300201046366},
             'ACTCT': {'A': 0.38491114316887498,
              'C': 0.081194973318174019,
              'G': 0.48495993865477299,
              'T': 0.048933944858177987},
             'GAATA': {'A': 0.30544525912145121,
              'C': 0.078059693276855274,
              'G': 0.32324805787653677,
              'T': 0.29324698972515667},
             'GAATC': {'A': 0.32106785414641914,
              'C': 0.20547803081261168,
              'G': 0.18551931014551884,
              'T': 0.28793480489545042},
             'GGGAC': {'A': 0.096643988954852572,
              'C': 0.21940879255255646,
              'G': 0.074164262212463222,
              'T': 0.6097829562801278},
             'GGGAA': {'A': 0.26402827217032304,
              'C': 0.3488351223485589,
              'G': 0.3479864334035383,
              'T': 0.039150172077579655},
             'GGGAG': {'A': 0.14491055436079514,
              'C': 0.36246250030403343,
              'G': 0.27437597237030859,
              'T': 0.21825097296486279},
             'GAATT': {'A': 0.36740590376393056,
              'C': 0.20718588224189879,
              'G': 0.32864584530287205,
              'T': 0.096762368691298561},
             'ACTCA': {'A': 0.30447076345233254,
              'C': 0.43264412296980226,
              'G': 0.025514724130640827,
              'T': 0.23737038944722447},
             'ACTCC': {'A': 0.31864249792186428,
              'C': 0.32213587262390153,
              'G': 0.035283431256015838,
              'T': 0.32393819819821845},
             'ACTCG': {'A': 0.27933489212748519,
              'C': 0.27234091913371816,
              'G': 0.041018287723985074,
              'T': 0.40730590101481168},
             'TATGG': {'A': 0.2893924251619045,
              'C': 0.39775283793493227,
              'G': 0.0039646080591971547,
              'T': 0.30889012884396605},
             'TATGC': {'A': 0.25151339782840504,
              'C': 0.25335717340616598,
              'G': 0.23003469471252155,
              'T': 0.2650947340529074},
             'TATGA': {'A': 0.21840561346716905,
              'C': 0.34401770716046437,
              'G': 0.11515705673162639,
              'T': 0.3224196226407402},
             'TATGT': {'A': 0.083218951849277065,
              'C': 0.38545075286042962,
              'G': 0.45564233656755787,
              'T': 0.075687958722735552},
             'GATGT': {'A': 0.24904452057746734,
              'C': 0.26186789912642838,
              'G': 0.40899624561975523,
              'T': 0.08009133467634906},
             'GATGA': {'A': 0.056922657065450147,
              'C': 0.36670312296664692,
              'G': 0.31597522616195001,
              'T': 0.26039899380595288},
             'GATGC': {'A': 0.2198983717249752,
              'C': 0.19560443779886558,
              'G': 0.57902823122277813,
              'T': 0.0054689592533811995},
             'GATGG': {'A': 0.078937668971630445,
              'C': 0.27978572853245987,
              'G': 0.3897439239498714,
              'T': 0.25153267854603839},
             'AACTT': {'A': 0.2454132305794392,
              'C': 0.31653713593388877,
              'G': 0.17668002277663802,
              'T': 0.26136961071003401},
             'GCTAG': {'A': 0.29347537717354383,
              'C': 0.093270516405579235,
              'G': 0.28385876918597702,
              'T': 0.32939533723489978},
             'GCTAA': {'A': 0.59150068616913098,
              'C': 0.11921715405759742,
              'G': 0.10717920815526243,
              'T': 0.18210295161800907},
             'GCTAC': {'A': 0.10930388200731865,
              'C': 0.22799307247046602,
              'G': 0.50163678756620034,
              'T': 0.16106625795601512},
             'AACTG': {'A': 0.2539518755330194,
              'C': 0.21699916542153819,
              'G': 0.24829231405951172,
              'T': 0.28075664498593084},
             'AACTA': {'A': 0.22047798334270718,
              'C': 0.093046903468608277,
              'G': 0.54696350900731494,
              'T': 0.13951160418136954},
             'AACTC': {'A': 0.070507151670961499,
              'C': 0.030958276072811833,
              'G': 0.43451157875767876,
              'T': 0.46402299349854792},
             'GCTAT': {'A': 0.064672346026316413,
              'C': 0.35170717361432863,
              'G': 0.23241760900107356,
              'T': 0.35120287135828132},
             'GTGTA': {'A': 0.32332327501513197,
              'C': 0.28831060248244239,
              'G': 0.27673555459265453,
              'T': 0.11163056790977113},
             'ATTAC': {'A': 0.03627939381827204,
              'C': 0.43750606896751526,
              'G': 0.18112551719000602,
              'T': 0.34508902002420672},
             'CGTGT': {'A': 0.085217141502461555,
              'C': 0.39540644899818295,
              'G': 0.32252337808728182,
              'T': 0.19685303141207358},
             'CGTGC': {'A': 0.30064952156178226,
              'C': 0.35351873966222008,
              'G': 0.29849242696405343,
              'T': 0.04733931181194425},
             'CGTGA': {'A': 0.30596030197456497,
              'C': 0.086435897067872206,
              'G': 0.32687833887212125,
              'T': 0.28072546208544158},
             'CGTGG': {'A': 0.36567874554391239,
              'C': 0.061975641654098065,
              'G': 0.21754892027653686,
              'T': 0.35479669252545259},
             'ATTAG': {'A': 0.23221006256393481,
              'C': 0.099018995456986572,
              'G': 0.51897891477669666,
              'T': 0.14979202720238194},
             'TGTCA': {'A': 0.28862429893441982,
              'C': 0.30000915104668247,
              'G': 0.10095934020973237,
              'T': 0.3104072098091652},
             'TGTCC': {'A': 0.098122463875308749,
              'C': 0.30550327932836119,
              'G': 0.29911055337682457,
              'T': 0.29726370341950548},
             'TGTCG': {'A': 0.21338392922976632,
              'C': 0.2113423525951342,
              'G': 0.42422873557909196,
              'T': 0.15104498259600743},
             'AGTAT': {'A': 0.07600523238261668,
              'C': 0.36452992997234801,
              'G': 0.13001274338832575,
              'T': 0.42945209425670966},
             'CCGTT': {'A': 0.34526380424675107,
              'C': 0.12990828365163914,
              'G': 0.29083804086408793,
              'T': 0.2339898712375218},
             'TGTCT': {'A': 0.083844508286601491,
              'C': 0.24497229949672567,
              'G': 0.3419992555447901,
              'T': 0.32918393667188278},
             'CCGTA': {'A': 0.30164082707333878,
              'C': 0.15466209298820127,
              'G': 0.12089180790145702,
              'T': 0.42280527203700285},
             'CCGTC': {'A': 0.08895143345715624,
              'C': 0.22412511076664721,
              'G': 0.032715255331619814,
              'T': 0.65420820044457673},
             'AGTAC': {'A': 0.38301932535590399,
              'C': 0.1888099804317461,
              'G': 0.22768225496188119,
              'T': 0.2004884392504688},
             'CCGTG': {'A': 0.11142873394412735,
              'C': 0.32829544419257378,
              'G': 0.26817723485641914,
              'T': 0.2920985870068798},
             'GCGCA': {'A': 0.28598022904840659,
              'C': 0.25920481185733396,
              'G': 0.21994753853294363,
              'T': 0.2348674205613159},
             'AGGCA': {'A': 0.13277484997366995,
              'C': 0.33242574415679582,
              'G': 0.04751926395470208,
              'T': 0.48728014191483227},
             'AGGCG': {'A': 0.17958340840173118,
              'C': 0.35616935683889511,
              'G': 0.056609838529256433,
              'T': 0.40763739623011724},
             'TCTGT': {'A': 0.18728509056394321,
              'C': 0.37410972043238089,
              'G': 0.21808293502932341,
              'T': 0.22052225397435246},
             'GCGCG': {'A': 0.018692761956952551,
              'C': 0.44952467233034898,
              'G': 0.31891019761059508,
              'T': 0.21287236810210344},
             'GGAAA': {'A': 0.13729642200576225,
              'C': 0.33258327457742493,
              'G': 0.15884333671105674,
              'T': 0.37127696670575605},
             'GGAAC': {'A': 0.027783339293030604,
              'C': 0.3036312048024129,
              'G': 0.44017400876520935,
              'T': 0.22841144713934719},
             'GGAAG': {'A': 0.16624699255399902,
              'C': 0.3878495807365952,
              'G': 0.062705131877144715,
              'T': 0.38319829483226103},
             'TCTGA': {'A': 0.31723685691564213,
              'C': 0.33445775574405529,
              'G': 0.21331808859257859,
              'T': 0.13498729874772408},
             'TCTGC': {'A': 0.4241084589881951,
              'C': 0.2543490724379221,
              'G': 0.086816757189061927,
              'T': 0.23472571138482073},
             'GCGCT': {'A': 0.39031778093067249,
              'C': 0.51649924727515562,
              'G': 0.041850381729407166,
              'T': 0.051332590064764899},
             'TCTGG': {'A': 0.1795417209554053,
              'C': 0.29358584954705624,
              'G': 0.16876779617242124,
              'T': 0.35810463332511711},
             'AGGCT': {'A': 0.25539155740182246,
              'C': 0.20295224783750868,
              'G': 0.15349902021102343,
              'T': 0.38815717454964543},
             'GGAAT': {'A': 0.24937596384902722,
              'C': 0.19220140752487352,
              'G': 0.29436684069384855,
              'T': 0.26405578793225082},
             'GTTCT': {'A': 0.13909757641095971,
              'C': 0.34658872785135625,
              'G': 0.30226386559475515,
              'T': 0.21204983014292897},
             'ATTAT': {'A': 0.19107856977589924,
              'C': 0.58610562116362852,
              'G': 0.20633586965747658,
              'T': 0.016479939402995834},
             'GGAGG': {'A': 0.42062808565957044,
              'C': 0.40590786484411123,
              'G': 0.042125181854746355,
              'T': 0.13133886764157204},
             'GTTCG': {'A': 0.4815734168272619,
              'C': 0.074089945774642507,
              'G': 0.18962618394437655,
              'T': 0.25471045345371912},
             'ATTAA': {'A': 0.12030732572495223,
              'C': 0.38882603132286059,
              'G': 0.39224912015573649,
              'T': 0.09861752279645053},
             'GTTCC': {'A': 0.029333127858798363,
              'C': 0.43792481214642276,
              'G': 0.33924485614795902,
              'T': 0.19349720384681979},
             'GTTCA': {'A': 0.36671714728367744,
              'C': 0.22901993422426503,
              'G': 0.34402111556084458,
              'T': 0.060241802931212854},
             'CTCGT': {'A': 0.21132240943318417,
              'C': 0.3733024923395975,
              'G': 0.40881536148265146,
              'T': 0.0065597367445668188},
             'TTGAT': {'A': 0.3397928959134402,
              'C': 0.02892297295061947,
              'G': 0.32063704541004723,
              'T': 0.310647085725893},
             'ACGGT': {'A': 0.30769226620694512,
              'C': 0.031932682990042899,
              'G': 0.33159945131068896,
              'T': 0.32877559949232316},
             'ACGGC': {'A': 0.34230928911436798,
              'C': 0.2428051315618894,
              'G': 0.087330021982278128,
              'T': 0.32755555734146452},
             'ACGGA': {'A': 0.39648316532182604,
              'C': 0.14844124819804216,
              'G': 0.41939963972978617,
              'T': 0.035675946750345633},
             'CTCGG': {'A': 0.22727714934978999,
              'C': 0.15433565349545145,
              'G': 0.23707534570343475,
              'T': 0.3813118514513239},
             'ACGGG': {'A': 0.78067192395426577,
              'C': 0.20146023127718282,
              'G': 0.010412400501790297,
              'T': 0.0074554442667612427},
             'CTCGA': {'A': 0.053370600162919959,
              'C': 0.14788068525890039,
              'G': 0.42891972106764914,
              'T': 0.36982899351053056},
             'TTGAG': {'A': 0.13674317499490121,
              'C': 0.26915869472341364,
              'G': 0.24522730406912019,
              'T': 0.34887082621256499},
             'CTCGC': {'A': 0.18349726663837593,
              'C': 0.076295517984355146,
              'G': 0.36771879932607249,
              'T': 0.37248841605119642},
             'GGCCT': {'A': 0.032443685817762566,
              'C': 0.70788967965802652,
              'G': 0.12944217690584639,
              'T': 0.13022445761836438},
             'TGATA': {'A': 0.44608433964797634,
              'C': 0.025909284221811806,
              'G': 0.2359743615655529,
              'T': 0.29203201456465877},
             'TGATC': {'A': 0.32199831074580593,
              'C': 0.25789298615224815,
              'G': 0.21350550712945093,
              'T': 0.20660319597249502},
             'TGATG': {'A': 0.29808035126691773,
              'C': 0.2300689329799083,
              'G': 0.27293799915739486,
              'T': 0.19891271659577933},
             'CCGAT': {'A': 0.10467804639218747,
              'C': 0.018683896519100514,
              'G': 0.36206140009909482,
              'T': 0.51457665698961719},
             'GGCCA': {'A': 0.16824439645086783,
              'C': 0.21654442264158377,
              'G': 0.16287773281357368,
              'T': 0.45233344809397469},
             'GGCCC': {'A': 0.33580286381625585,
              'C': 0.32926913658017121,
              'G': 0.28407396465152496,
              'T': 0.050854034952048002},
             'GGCCG': {'A': 0.31321056411738513,
              'C': 0.16234179616891725,
              'G': 0.18137719195109769,
              'T': 0.34307044776260004},
             'CCGAC': {'A': 0.17933519078311544,
              'C': 0.21887491336298898,
              'G': 0.23266260143148074,
              'T': 0.36912729442241488},
             'CCGAA': {'A': 0.26737366702316323,
              'C': 0.2291178756746898,
              'G': 0.21220089208199311,
              'T': 0.29130756522015372},
             'CCGAG': {'A': 0.26712087449137001,
              'C': 0.28895372072455139,
              'G': 0.15687539705218018,
              'T': 0.28705000773189843},
             'TGATT': {'A': 0.033064171236311869,
              'C': 0.33141072064553062,
              'G': 0.3387028312983586,
              'T': 0.29682227681979895},
             'TTGAA': {'A': 0.40996287945787346,
              'C': 0.32232827349236565,
              'G': 0.22822070169640968,
              'T': 0.039488145353351288},
             'TTGAC': {'A': 0.19158459430460129,
              'C': 0.091132748562437249,
              'G': 0.54629071563904719,
              'T': 0.17099194149391433},
             'GTCGG': {'A': 0.35511466237127876,
              'C': 0.13860232397581071,
              'G': 0.34778673680811018,
              'T': 0.15849627684480028},
             'TAACG': {'A': 0.3938531012175307,
              'C': 0.0022592237054654758,
              'G': 0.35396997556268683,
              'T': 0.24991769951431714},
             'AAGGA': {'A': 0.40416472920035013,
              'C': 0.14409728305775213,
              'G': 0.31744580649652404,
              'T': 0.1342921812453737},
             'AAGGC': {'A': 0.10098969872252726,
              'C': 0.37556155920929613,
              'G': 0.38881958416498913,
              'T': 0.13462915790318747},
             'TTTGG': {'A': 0.47549691579402187,
              'C': 0.04536785077859861,
              'G': 0.25161310948436388,
              'T': 0.22752212394301563},
             'TTTGA': {'A': 0.1286533803944534,
              'C': 0.1870735320150001,
              'G': 0.48263710862062431,
              'T': 0.20163597896992216},
             'AAGGG': {'A': 0.28718761890343181,
              'C': 0.31967540419883622,
              'G': 0.34489940399095642,
              'T': 0.048237572906775529},
             'TTTGC': {'A': 0.2811768997322,
              'C': 0.079505848080485927,
              'G': 0.34279669893708486,
              'T': 0.29652055325022925},
             'TTTGT': {'A': 0.050043962186476373,
              'C': 0.51859072284995433,
              'G': 0.33544766742271992,
              'T': 0.095917647540849485},
             'AAGGT': {'A': 0.36565891715476279,
              'C': 0.039321153642243103,
              'G': 0.31278620111165722,
              'T': 0.28223372809133696},
             'GACGC': {'A': 0.16625321256204093,
              'C': 0.30706132432259603,
              'G': 0.11027787512181078,
              'T': 0.41640758799355221},
             'GACGA': {'A': 0.011586605268583593,
              'C': 0.31807234662373352,
              'G': 0.40015729644158732,
              'T': 0.27018375166609576},
             'GACGG': {'A': 0.29617584547374015,
              'C': 0.35759914663184228,
              'G': 0.070535398052263845,
              'T': 0.27568960984215379},
             'GACGT': {'A': 0.1962533491274939,
              'C': 0.13641988703731825,
              'G': 0.29321879018803032,
              'T': 0.37410797364715759},
             'TACCT': {'A': 0.31617026859018399,
              'C': 0.32029866227255727,
              'G': 0.095817796722933418,
              'T': 0.26771327241432546},
             'TACCA': {'A': 0.23671685391783537,
              'C': 0.15126165019679813,
              'G': 0.29133958154381162,
              'T': 0.32068191434155474},
             'TACCC': {'A': 0.22999103988730862,
              'C': 0.090143493422175924,
              'G': 0.37311809427771775,
              'T': 0.30674737241279765},
             'TACCG': {'A': 0.153111009968177,
              'C': 0.11858545494717254,
              'G': 0.69251742306247888,
              'T': 0.035786112022171454},
             'CATCT': {'A': 0.26117092760081217,
              'C': 0.18018061249299663,
              'G': 0.26326765883313147,
              'T': 0.29538080107305975},
             'TAACT': {'A': 0.31545043583967303,
              'C': 0.1203244705251043,
              'G': 0.34280597083004172,
              'T': 0.22141912280518089},
             'CATCA': {'A': 0.25779400267007502,
              'C': 0.28774276015856559,
              'G': 0.22908537386659819,
              'T': 0.22537786330476131},
             'CATCC': {'A': 0.11975578566222017,
              'C': 0.54963619037075928,
              'G': 0.28932352718945314,
              'T': 0.041284496777567431},
             'CATCG': {'A': 0.014664408573580777,
              'C': 0.33165379964781261,
              'G': 0.4343450255646219,
              'T': 0.21933676621398465},
             'CACGG': {'A': 0.19289998809927872,
              'C': 0.43943570394203924,
              'G': 0.21221834340068865,
              'T': 0.15544596455799334},
             'CACGC': {'A': 0.25525857704271437,
              'C': 0.35985551725521525,
              'G': 0.18400304495112224,
              'T': 0.20088286075094833},
             'CACGA': {'A': 0.4087380876906157,
              'C': 0.1121175216402957,
              'G': 0.44324756690584116,
              'T': 0.035896823763247522},
             'CACGT': {'A': 0.12824001157345033,
              'C': 0.18643750615169977,
              'G': 0.037603690977842011,
              'T': 0.64771879129700771},
             'GTGTT': {'A': 0.27605058673928973,
              'C': 0.22690814944236312,
              'G': 0.14102472761009718,
              'T': 0.35601653620825013},
             'TCCGT': {'A': 0.10673361191388815,
              'C': 0.32548640027226367,
              'G': 0.13073905471750571,
              'T': 0.4370409330963424},
             'CTGTA': {'A': 0.5411673547306769,
              'C': 0.10998919738566636,
              'G': 0.2057070128808331,
              'T': 0.14313643500282358},
             'TTCTC': {'A': 0.39892145510028287,
              'C': 0.079467654278261149,
              'G': 0.25702891250516008,
              'T': 0.26458197811629597},
             'CTGTC': {'A': 0.24204812374375295,
              'C': 0.2597329111825577,
              'G': 0.30008280651992586,
              'T': 0.19813615855376351},
             'TTCTA': {'A': 0.23324701561434355,
              'C': 0.32975955771865212,
              'G': 0.29200856844695633,
              'T': 0.14498485822004797},
             'TTCTG': {'A': 0.22373365384829763,
              'C': 0.17993152215948036,
              'G': 0.37985634610609842,
              'T': 0.21647847788612365},
             'CTGTG': {'A': 0.12143193685291852,
              'C': 0.28598187916517132,
              'G': 0.31808955867474253,
              'T': 0.27449662530716762},
             'TCCGC': {'A': 0.12883076218430173,
              'C': 0.32273942486349833,
              'G': 0.30045423099695545,
              'T': 0.24797558195524444},
             'TCCGA': {'A': 0.206674558580863,
              'C': 0.20780735067791672,
              'G': 0.34534279093821751,
              'T': 0.24017529980300281},
             'TCCGG': {'A': 0.13977784223753539,
              'C': 0.18268938313882627,
              'G': 0.27799906045194206,
              'T': 0.39953371417169625},
             'ATCAG': {'A': 0.12463776257454558,
              'C': 0.33772919411894936,
              'G': 0.53240044893958438,
              'T': 0.0052325943669207647},
             'CTGTT': {'A': 0.15695947291263809,
              'C': 0.25600115429090547,
              'G': 0.20532121688397489,
              'T': 0.38171815591248154},
             'TTCTT': {'A': 0.096792419482922679,
              'C': 0.12215245706963841,
              'G': 0.37107865448194,
              'T': 0.409976468965499},
             'ATCAC': {'A': 0.26464503998965172,
              'C': 0.17843540733319332,
              'G': 0.24697631174754295,
              'T': 0.30994324092961201},
             'AAACG': {'A': 0.36419860951778577,
              'C': 0.092326552671534542,
              'G': 0.27853841161369858,
              'T': 0.26493642619698127},
             'AAACC': {'A': 0.3765942985398143,
              'C': 0.22525750627452731,
              'G': 0.32976729848373876,
              'T': 0.06838089670191945},
             'AAACA': {'A': 0.4199306294908694,
              'C': 0.17585283473137381,
              'G': 0.21531444807251007,
              'T': 0.18890208770524655},
             'AAACT': {'A': 0.077664075166308105,
              'C': 0.29381801448586009,
              'G': 0.40994309435321463,
              'T': 0.21857481599461701},
             'AGTAG': {'A': 0.26708868720495887,
              'C': 0.15691225856789909,
              'G': 0.30545081072964919,
              'T': 0.27054824349749285},
             'CGGGG': {'A': 0.025657040591220277,
              'C': 0.063093034089588829,
              'G': 0.58517855431627519,
              'T': 0.32607137100291578},
             'CGAGT': {'A': 0.42178009358594032,
              'C': 0.077698429278711373,
              'G': 0.46080651366767145,
              'T': 0.039714963467676979},
             'CGGGA': {'A': 0.14610116363650211,
              'C': 0.41802631151458192,
              'G': 0.29872406531215806,
              'T': 0.13714845953675792},
             'CGGGC': {'A': 0.34705684856644015,
              'C': 0.22609529027385541,
              'G': 0.14271069606816483,
              'T': 0.28413716509153952},
             'GGTTT': {'A': 0.052223070690788208,
              'C': 0.42277954170129151,
              'G': 0.4640925180476006,
              'T': 0.060904869560319611},
             'CGCTA': {'A': 0.14306900844857853,
              'C': 0.1672491766997351,
              'G': 0.33535413922408536,
              'T': 0.35432767562760104},
             'CGCTC': {'A': 0.21321676209539456,
              'C': 0.24805557682798016,
              'G': 0.31430009622469091,
              'T': 0.22442756485193435},
             'TCAAT': {'A': 0.26608548094983997,
              'C': 0.40384423138006897,
              'G': 0.30046752710723462,
              'T': 0.029602760562856538},
             'CGCTG': {'A': 0.30695467199444287,
              'C': 0.41000130988233968,
              'G': 0.18170474846830201,
              'T': 0.10133926965491545},
             'GGTTC': {'A': 0.1704131873201391,
              'C': 0.082375024510489447,
              'G': 0.066849206284069221,
              'T': 0.68036258188530219},
             'CGGGT': {'A': 0.16652789489811887,
              'C': 0.019536550881786432,
              'G': 0.31129186333712988,
              'T': 0.50264369088296479},
             'GGTTA': {'A': 0.3890887509941735,
              'C': 0.23167594423271404,
              'G': 0.01653187664708837,
              'T': 0.36270342812602413},
             'GGTTG': {'A': 0.38911384780548236,
              'C': 0.18665812199747511,
              'G': 0.40018404709711197,
              'T': 0.024043983099930635},
             'CGAGA': {'A': 0.34730607200532804,
              'C': 0.0015555289278982587,
              'G': 0.3235198186944836,
              'T': 0.32761858037229008},
             'TCAAC': {'A': 0.65678942746136371,
              'C': 0.088319562656151748,
              'G': 0.11256038974795805,
              'T': 0.14233062013452649},
             'TCTTG': {'A': 0.1482512046423802,
              'C': 0.29571029725117076,
              'G': 0.235017355991957,
              'T': 0.32102114211449201},
             'CGCTT': {'A': 0.12582163926263096,
              'C': 0.32485721997675754,
              'G': 0.19523818171787366,
              'T': 0.35408295904273779},
             'TCAAG': {'A': 0.06984861905702712,
              'C': 0.4789364892932601,
              'G': 0.076819484263942153,
              'T': 0.37439540738577065},
             'ATAGG': {'A': 0.28775608362878985,
              'C': 0.3270129257026726,
              'G': 0.28987975415500328,
              'T': 0.095351236513534221},
             'ATAGA': {'A': 0.32110733587257217,
              'C': 0.2466589363221792,
              'G': 0.099560985757803172,
              'T': 0.33267274204744551},
             'TATTT': {'A': 0.18797729723581691,
              'C': 0.034604467594159562,
              'G': 0.32245760061129597,
              'T': 0.45496063455872754},
             'ATAGC': {'A': 0.35831215418713414,
              'C': 0.40126285252302085,
              'G': 0.20077769425047826,
              'T': 0.039647299039366722},
             'ATAGT': {'A': 0.37765097955497773,
              'C': 0.3659932551608156,
              'G': 0.078645980724413256,
              'T': 0.17770978455979342},
             'TATTC': {'A': 0.3458987745878494,
              'C': 0.27671379245711919,
              'G': 0.10133727173329489,
              'T': 0.27605016122173648},
             'TATTA': {'A': 0.24651239251348137,
              'C': 0.056782881023931989,
              'G': 0.33859158182666199,
              'T': 0.35811314463592464},
             'TATTG': {'A': 0.24406255321020395,
              'C': 0.11898855675296889,
              'G': 0.27978978480304878,
              'T': 0.35715910523377847},
             'GCGTT': {'A': 0.12767548042083346,
              'C': 0.29957201462770983,
              'G': 0.18757018872223208,
              'T': 0.38518231622922472},
             'AAATG': {'A': 0.29517527505615038,
              'C': 0.16626522419824291,
              'G': 0.18941094103064934,
              'T': 0.34914855971495734},
             'AAATC': {'A': 0.24280120467712329,
              'C': 0.38119599915289171,
              'G': 0.030321372491408989,
              'T': 0.34568142367857607},
             'AAATA': {'A': 0.062044859103362736,
              'C': 0.22092151953401742,
              'G': 0.31330479182755427,
              'T': 0.40372882953506567},
             'AAATT': {'A': 0.071042200911022285,
              'C': 0.012223017385737237,
              'G': 0.24716314963565497,
              'T': 0.66957163206758541},
             'GCGTG': {'A': 0.3171450334852966,
              'C': 0.20925852417794091,
              'G': 0.3486531820643291,
              'T': 0.12494326027243337},
             'GCGTA': {'A': 0.18298894829809365,
              'C': 0.30401148291541025,
              'G': 0.29732951657678258,
              'T': 0.21567005220971355},
             'GCGTC': {'A': 0.025368494763782969,
              'C': 0.26148750437919022,
              'G': 0.41868121793504831,
              'T': 0.29446278292197847},
             'GGGTT': {'A': 0.34392328082861479,
              'C': 0.011225683764999458,
              'G': 0.39911500273460249,
              'T': 0.24573603267178329},
             'AGACA': {'A': 0.3581108620984873,
              'C': 0.07963234161935015,
              'G': 0.3588723212203348,
              'T': 0.20338447506182777},
             'GATAG': {'A': 0.39371944976193562,
              'C': 0.13025640799993105,
              'G': 0.44984212948947716,
              'T': 0.026182012748656155},
             'AGACC': {'A': 0.17844836166035707,
              'C': 0.26841010699337453,
              'G': 0.18081159357037763,
              'T': 0.37232993777589074},
             'CCCCT': {'A': 0.20744339354214497,
              'C': 0.17498428564223775,
              'G': 0.37781194310527727,
              'T': 0.23976037771034014},
             'AGACG': {'A': 0.16684044300269643,
              'C': 0.137115421462605,
              'G': 0.26324542298739217,
              'T': 0.43279871254730651},
             'GATAA': {'A': 0.22314439350435525,
              'C': 0.34249446602548306,
              'G': 0.39601751947191377,
              'T': 0.038343620998247813},
             'CCCCA': {'A': 0.14532810113462574,
              'C': 0.40128431526715469,
              'G': 0.35342206738045295,
              'T': 0.09996551621776667},
             'CCCCC': {'A': 0.3050892586162422,
              'C': 0.12679343944461396,
              'G': 0.31590500398941201,
              'T': 0.25221229794973188},
             'AGACT': {'A': 0.34517145063292054,
              'C': 0.27220398895606068,
              'G': 0.3485042625070825,
              'T': 0.034120297903936093},
             'CCCCG': {'A': 0.47160767986648977,
              'C': 0.18212892567933911,
              'G': 0.055152203539649877,
              'T': 0.2911111909145212},
             'AGCAA': {'A': 0.26028880172634838,
              'C': 0.30159280011511264,
              'G': 0.19262149792404451,
              'T': 0.24549690023449455},
             'TCGCC': {'A': 0.15495174984834328,
              'C': 0.40713533739064889,
              'G': 0.29235421245164056,
              'T': 0.14555870030936716},
             'AGCAC': {'A': 0.26377941858948162,
              'C': 0.56413958197006642,
              'G': 0.16151895909533684,
              'T': 0.010562040345115015},
             'TCGCA': {'A': 0.046087331810781451,
              'C': 0.37323964126775799,
              'G': 0.28359102689936982,
              'T': 0.29708200002209079},
             'CCAAT': {'A': 0.14869457842108552,
              'C': 0.26370519375344864,
              'G': 0.2999972727300243,
              'T': 0.28760295509544165},
             'AGCAG': {'A': 0.13742519714401488,
              'C': 0.20401836730624051,
              'G': 0.21125324037705071,
              'T': 0.44730319517269385},
             'CCAAA': {'A': 0.33305027746089988,
              'C': 0.27959763924218445,
              'G': 0.25943926802667366,
              'T': 0.12791281527024209},
             'CCAAC': {'A': 0.16240239619895741,
              'C': 0.29194869162043047,
              'G': 0.43429057296331675,
              'T': 0.11135833921729532},
             'AGCAT': {'A': 0.19856720124315147,
              'C': 0.1408575633390434,
              'G': 0.36090424863644727,
              'T': 0.29967098678135773},
             'CCAAG': {'A': 0.51822060614527177,
              'C': 0.39534104857153374,
              'G': 0.077408600352918772,
              'T': 0.0090297449302758001},
             'CTAAC': {'A': 0.27837037498142603,
              'C': 0.2777883134642915,
              'G': 0.20051215522078497,
              'T': 0.24332915633349755},
             'TGTTT': {'A': 0.37316295535622379,
              'C': 0.028146106969538714,
              'G': 0.37853630138053723,
              'T': 0.2201546362937003},
             'TCATG': {'A': 0.04011222083526652,
              'C': 0.37398167876977506,
              'G': 0.045674832909662851,
              'T': 0.5402312674852956},
             'TCATA': {'A': 0.27862667278128833,
              'C': 0.33691210858054771,
              'G': 0.32370590531792576,
              'T': 0.060755313320238306},
             'TCATC': {'A': 0.035222114195399577,
              'C': 0.2638571015372066,
              'G': 0.38196901022225116,
              'T': 0.31895177404514269},
             'GGGTA': {'A': 0.071713965185181638,
              'C': 0.22841282778285868,
              'G': 0.30582423942611686,
              'T': 0.39404896760584296},
             'AACAG': {'A': 0.052731632155011018,
              'C': 0.39509457772544648,
              'G': 0.16832785282705198,
              'T': 0.38384593729249045},
             'TATAT': {'A': 0.26990350577386951,
              'C': 0.34633834195590613,
              'G': 0.062387527947971234,
              'T': 0.32137062432225316},
             'AACAC': {'A': 0.13761796726608644,
              'C': 0.33575180554839629,
              'G': 0.13284355630721301,
              'T': 0.39378667087830432},
             'AACAA': {'A': 0.062534646838353511,
              'C': 0.27798859493521927,
              'G': 0.40198694407203162,
              'T': 0.25748981415439559},
             'TCATT': {'A': 0.16011842978572918,
              'C': 0.049951990555873391,
              'G': 0.66777439792818638,
              'T': 0.122155181730211},
             'GGGTC': {'A': 0.37435033886660801,
              'C': 0.12634586583819704,
              'G': 0.40098661969535387,
              'T': 0.098317175599841031},
             'TGTTA': {'A': 0.16040587120554509,
              'C': 0.35191480031405381,
              'G': 0.20247542518587139,
              'T': 0.28520390329452955},
             'TGTTC': {'A': 0.39509624467535115,
              'C': 0.42271751443120592,
              'G': 0.090525700367894146,
              'T': 0.091660540525548659},
             'TATAG': {'A': 0.359040723956912,
              'C': 0.36202837816812339,
              'G': 0.22318619549402985,
              'T': 0.055744702380934576},
             'AACAT': {'A': 0.20628698397380943,
              'C': 0.41879777448807076,
              'G': 0.21514473374094037,
              'T': 0.15977050779717936},
             'TATAA': {'A': 0.11226583957682672,
              'C': 0.31619399185068453,
              'G': 0.38281604625248278,
              'T': 0.18872412232000596},
             'TATAC': {'A': 0.063899448236582251,
              'C': 0.27996493440201736,
              'G': 0.26659627800563018,
              'T': 0.38953933935577023},
             'CTAGC': {'A': 0.3465495467171224,
              'C': 0.21962765181842281,
              'G': 0.18104056907454291,
              'T': 0.25278223238991199},
             'CTAGA': {'A': 0.14928884451370139,
              'C': 0.49794448024600835,
              'G': 0.27696385964913295,
              'T': 0.075802815591157327},
             'CTAGG': {'A': 0.40231429663319646,
              'C': 0.29200132523606315,
              'G': 0.00011989764066762089,
              'T': 0.30556448049007268},
             'CTAAT': {'A': 0.092600376265161294,
              'C': 0.43259769724728619,
              'G': 0.082450992306218177,
              'T': 0.39235093418133432},
             'CTAGT': {'A': 0.048512519729665395,
              'C': 0.53449895349950427,
              'G': 0.34371122094813739,
              'T': 0.073277305822693012},
             'TAATG': {'A': 0.22010408504765439,
              'C': 0.40346889720971318,
              'G': 0.10175158874387324,
              'T': 0.2746754289987593},
             'TAATC': {'A': 0.13031414547956213,
              'C': 0.47023872286840485,
              'G': 0.09540908828066634,
              'T': 0.3040380433713667},
             'TAATA': {'A': 0.28097039930766565,
              'C': 0.27272071545136234,
              'G': 0.15103050447376018,
              'T': 0.29527838076721186},
             'TAATT': {'A': 0.42335855496595937,
              'C': 0.023466754625265332,
              'G': 0.22092716522744185,
              'T': 0.33224752518133338},
             'TGACT': {'A': 0.13387945485317423,
              'C': 0.39268763981015969,
              'G': 0.25459715769793789,
              'T': 0.21883574763872823},
             'TGACG': {'A': 0.14910776602892784,
              'C': 0.54585032034139769,
              'G': 0.11888359213385578,
              'T': 0.18615832149581854},
             'TGACA': {'A': 0.39123054138738605,
              'C': 0.2450493148776946,
              'G': 0.13164715707410274,
              'T': 0.23207298666081658},
             'TGACC': {'A': 0.12782835883806079,
              'C': 0.5319545181987545,
              'G': 0.34016103537467307,
              'T': 5.608758851167557e-05},
             'GCCGA': {'A': 0.43542964807943063,
              'C': 0.25540903057205822,
              'G': 0.16515177886492813,
              'T': 0.14400954248358322},
             'GCCGC': {'A': 0.43138731183994061,
              'C': 0.0097546695221125152,
              'G': 0.36981194240015053,
              'T': 0.18904607623779651},
             'GCCGG': {'A': 0.4330799872024923,
              'C': 0.039406509599900927,
              'G': 0.084030035687729224,
              'T': 0.44348346750987749},
             'GCCGT': {'A': 0.10678118310157815,
              'C': 0.15654312249892191,
              'G': 0.67046236531294379,
              'T': 0.066213329086556},
             'CACAT': {'A': 0.37269999360196204,
              'C': 0.32108148107381379,
              'G': 0.010776275844080507,
              'T': 0.29544224948014364},
             'TAACC': {'A': 0.0041874291348921828,
              'C': 0.22091656133092843,
              'G': 0.56146025546591982,
              'T': 0.21343575406825976},
             'TAACA': {'A': 0.26655414523296406,
              'C': 0.17412090450905654,
              'G': 0.2316812567798846,
              'T': 0.32764369347809469},
             'GTGCA': {'A': 0.16909907633282212,
              'C': 0.21905540883205765,
              'G': 0.1074568547273119,
              'T': 0.50438866010780836},
             'ACGCG': {'A': 0.28088408626743683,
              'C': 0.35622758372678875,
              'G': 0.060574757600870485,
              'T': 0.30231357240490403},
             'GTGCC': {'A': 0.54764077503500275,
              'C': 0.4258060346011302,
              'G': 0.0022104409376380945,
              'T': 0.024342749426228952},
             'CGATT': {'A': 0.37591596933686766,
              'C': 0.09746566837695439,
              'G': 0.35557618666272783,
              'T': 0.17104217562345014},
             'GTGCG': {'A': 0.34782310635437219,
              'C': 0.049526322248809131,
              'G': 0.35127790431869016,
              'T': 0.25137266707812855},
             'CACAG': {'A': 0.32735420569576262,
              'C': 0.47831981473105456,
              'G': 0.14043077866571457,
              'T': 0.053895200907468334},
             'CACAA': {'A': 0.73818394844500534,
              'C': 0.099191056097540073,
              'G': 0.1391681727894096,
              'T': 0.02345682266804491},
             'CACAC': {'A': 0.29937660140118105,
              'C': 0.060050148783925734,
              'G': 0.53174453301189151,
              'T': 0.10882871680300175},
             'CGATC': {'A': 0.030550218185117346,
              'C': 0.19470158042658819,
              'G': 0.40153702045878631,
              'T': 0.37321118092950817},
             'CGATA': {'A': 0.1291902196417338,
              'C': 0.14226235541448914,
              'G': 0.37846005555553736,
              'T': 0.35008736938823976},
             'GTGCT': {'A': 0.10905148515822358,
              'C': 0.17859973232700596,
              'G': 0.050175194734620877,
              'T': 0.66217358778014956},
             'CGATG': {'A': 0.51074780458493596,
              'C': 0.18318967414788728,
              'G': 0.093835202059733683,
              'T': 0.21222731920744325},
             'ACATA': {'A': 0.19375741867064836,
              'C': 0.2747178958400035,
              'G': 0.069424538199811661,
              'T': 0.46210014728953641},
             'ACATC': {'A': 0.17068200516863022,
              'C': 0.4642225199848074,
              'G': 0.047912988041896261,
              'T': 0.31718248680466615},
             'ACATG': {'A': 0.3737692967550979,
              'C': 0.075650004420404093,
              'G': 0.20630819615288687,
              'T': 0.34427250267161119},
             'CTGCT': {'A': 0.28944473948483057,
              'C': 0.34434391752501764,
              'G': 0.18617750693128357,
              'T': 0.18003383605886839},
             'TCTTA': {'A': 0.32906735890997607,
              'C': 0.12425316523168448,
              'G': 0.087815923377751043,
              'T': 0.45886355248058858},
             'TCTTC': {'A': 0.33492404767797679,
              'C': 0.37191943691865298,
              'G': 0.26425677926859825,
              'T': 0.028899736134771838},
             'ACCCT': {'A': 0.17385724081455803,
              'C': 0.34583680825203145,
              'G': 0.19180320249566937,
              'T': 0.28850274843774115},
             'ACATT': {'A': 0.14271149252478138,
              'C': 0.25357174759279133,
              'G': 0.29172867002258124,
              'T': 0.311988089859846},
             'ACCCC': {'A': 0.15410822630266865,
              'C': 0.22765860222234069,
              'G': 0.35539486342902321,
              'T': 0.26283830804596758},
             'AATTG': {'A': 0.017660400503347363,
              'C': 0.21185463602632731,
              'G': 0.46713295348694706,
              'T': 0.30335200998337836},
             'ACCCA': {'A': 0.27679299146426262,
              'C': 0.27165795619211119,
              'G': 0.2673083863858316,
              'T': 0.18424066595779467},
             'CTGCG': {'A': 0.42112194640765022,
              'C': 0.13228811901019275,
              'G': 0.33134110798181404,
              'T': 0.11524882660034298},
             'TCTTT': {'A': 0.35741670475291054,
              'C': 0.2022708047991591,
              'G': 0.35848847795630973,
              'T': 0.081824012491620732},
             'CTGCA': {'A': 0.14189785420925216,
              'C': 0.20607949951699964,
              'G': 0.2804852021688044,
              'T': 0.37153744410494388},
             'CTGCC': {'A': 0.25060351859155783,
              'C': 0.35129693541985052,
              'G': 0.15806874994961595,
              'T': 0.24003079603897565},
             'ATCTT': {'A': 0.088047506209499179,
              'C': 0.35782533498085878,
              'G': 0.109131217196619,
              'T': 0.44499594161302292},
             'GTAAT': {'A': 0.286898073725525,
              'C': 0.21174898870763764,
              'G': 0.25017554947652598,
              'T': 0.25117738809031154},
             'CAACT': {'A': 0.065034279966240172,
              'C': 0.22025306122715854,
              'G': 0.19020312646095405,
              'T': 0.52450953234564734},
             'ATCTG': {'A': 0.2018062564589857,
              'C': 0.32629424956168201,
              'G': 0.18863986047030959,
              'T': 0.28325963350902267},
             'GTAAA': {'A': 0.28239273845895774,
              'C': 0.18830704919541932,
              'G': 0.23969230618804332,
              'T': 0.28960790615757953},
             'GTAAC': {'A': 0.67883008841381065,
              'C': 0.15001716762069514,
              'G': 0.15302974659215579,
              'T': 0.01812299737333839},
             'ATCTC': {'A': 0.0283129333335061,
              'C': 0.50165502303732645,
              'G': 0.34582040826403848,
              'T': 0.12421163536512903},
             'ATCTA': {'A': 0.22655729273689307,
              'C': 0.14674249798951586,
              'G': 0.28857195008577069,
              'T': 0.33812825918782041},
             'GTAAG': {'A': 0.075180669221690324,
              'C': 0.41362947506222963,
              'G': 0.34505611205023484,
              'T': 0.1661337436658451},
             'CAACG': {'A': 0.26423707713159195,
              'C': 0.20059997485736675,
              'G': 0.1399756924860229,
              'T': 0.39518725552501843},
             'CAACA': {'A': 0.054963043417756506,
              'C': 0.719366808965195,
              'G': 0.056305574332263436,
              'T': 0.16936457328478505},
             'CAACC': {'A': 0.071780385339428515,
              'C': 0.016780224983507081,
              'G': 0.35678978864887828,
              'T': 0.55464960102818617},
             'ATGTT': {'A': 0.51831268185349211,
              'C': 0.061575055932107173,
              'G': 0.32409509630691608,
              'T': 0.096017165907484797},
             'TGGGC': {'A': 0.31559603244516832,
              'C': 0.42593561500769139,
              'G': 0.17371651525101509,
              'T': 0.084751837296125218},
             'TGGGA': {'A': 0.21756022635880426,
              'C': 0.58346726666921556,
              'G': 0.017455169915102049,
              'T': 0.18151733705687789},
             'TGGGG': {'A': 0.053818323410388412,
              'C': 0.26033087933881871,
              'G': 0.33758014713199308,
              'T': 0.34827065011879982},
             'ATGTC': {'A': 0.18702293347349672,
              'C': 0.19231202868945801,
              'G': 0.27919005847701228,
              'T': 0.3414749793600329},
             'ATGTA': {'A': 0.14219932509997582,
              'C': 0.35156807017433778,
              'G': 0.23387250491582523,
              'T': 0.27236009980986131},
             'ATGTG': {'A': 0.39536987278794744,
              'C': 0.19744229578447084,
              'G': 0.11426827552632869,
              'T': 0.29291955590125307},
             'TGGGT': {'A': 0.23166659919730087,
              'C': 0.35183431918977076,
              'G': 0.084788782135762297,
              'T': 0.33171029947716602},
             'ACAAC': {'A': 0.2382677032594463,
              'C': 0.24604328554252283,
              'G': 0.10135898886666339,
              'T': 0.41433002233136768},
             'TTAGC': {'A': 0.45688222610469048,
              'C': 0.28574084585148662,
              'G': 0.16954159989422038,
              'T': 0.087835328149602598},
             'ACAAG': {'A': 0.33461769802641955,
              'C': 0.16289475371223111,
              'G': 0.24864139148182876,
              'T': 0.25384615677952066},
             'TTAGG': {'A': 0.24730547157645161,
              'C': 0.21791345541052207,
              'G': 0.42793713188799687,
              'T': 0.10684394112502932},
             'GAGCT': {'A': 0.076693216513150961,
              'C': 0.10974735640811152,
              'G': 0.38799476997106008,
              'T': 0.42556465710767738},
             'AATTT': {'A': 0.33013454347120297,
              'C': 0.39565877285409434,
              'G': 0.046345332833794876,
              'T': 0.22786135084090789},
             'GGAGA': {'A': 0.19719898108859338,
              'C': 0.17032657964104519,
              'G': 0.20869870288204079,
              'T': 0.42377573638832067},
             'AATCT': {'A': 0.380004091113331,
              'C': 0.22353136363223203,
              'G': 0.38438173700648448,
              'T': 0.012082808247952501},
             'GAGCC': {'A': 0.20349191002108108,
              'C': 0.11778779827440523,
              'G': 0.37375169770038558,
              'T': 0.30496859400412807},
             'GAGCA': {'A': 0.42679367801553386,
              'C': 0.14471536053575754,
              'G': 0.21574462931328589,
              'T': 0.21274633213542271},
             'GAGCG': {'A': 0.28535873910291731,
              'C': 0.33413692012750207,
              'G': 0.055233719184846174,
              'T': 0.32527062158473435},
             'TTAGT': {'A': 0.081031453059389469,
              'C': 0.23339088535100827,
              'G': 0.55454264692409505,
              'T': 0.13103501466550713},
             'ACAAT': {'A': 0.27580942085310822,
              'C': 0.13613196387870552,
              'G': 0.2481667405062937,
              'T': 0.33989187476189253},
             'AATCC': {'A': 0.44714032963172901,
              'C': 0.31267143309142903,
              'G': 0.20045063068719832,
              'T': 0.039737606589643704},
             'AATCA': {'A': 0.40059840970241173,
              'C': 0.15657038610372481,
              'G': 0.14602884686138651,
              'T': 0.29680235733247701},
             'AATCG': {'A': 0.4051811423429183,
              'C': 0.30163951138333928,
              'G': 0.076957760538585052,
              'T': 0.21622158573515729},
             'GGGGT': {'A': 0.11757746826162367,
              'C': 0.32089290141641702,
              'G': 0.34826686964616271,
              'T': 0.2132627606757965},
             'CCCAG': {'A': 0.3833558093674867,
              'C': 0.11272834979110202,
              'G': 0.066502914334495372,
              'T': 0.43741292650691582},
             'GGGGA': {'A': 0.43629125764880372,
              'C': 0.41368110541192266,
              'G': 0.049755151259510431,
              'T': 0.10027248567976314},
             'GGGGC': {'A': 0.47049736580966006,
              'C': 0.085021106240498454,
              'G': 0.074540353476595822,
              'T': 0.36994117447324565},
             'GGGGG': {'A': 0.095956437863992688,
              'C': 0.25593078168704664,
              'G': 0.32064426831648796,
              'T': 0.32746851213247269},
             'TAGGA': {'A': 0.031835783888550177,
              'C': 0.23068542494108002,
              'G': 0.51626458006355103,
              'T': 0.22121421110681855},
             'TAGGC': {'A': 0.38456124105231704,
              'C': 0.17491498753411711,
              'G': 0.26091878326647722,
              'T': 0.17960498814708858},
             'TAGGG': {'A': 0.17159209653610055,
              'C': 0.29262230783554743,
              'G': 0.352678177983129,
              'T': 0.18310741764522298},
             'AGATT': {'A': 0.036420602603001943,
              'C': 0.40976879902209368,
              'G': 0.42632887810346431,
              'T': 0.12748172027143989},
             'TAGGT': {'A': 0.63093825538598469,
              'C': 0.1686277427963995,
              'G': 0.19703304874245606,
              'T': 0.0034009530751598436},
             'ACGCC': {'A': 0.41330214538159638,
              'C': 0.11249999585527312,
              'G': 0.46467740228959986,
              'T': 0.0095204564735306956},
             'AGATG': {'A': 0.18775148547168818,
              'C': 0.32809991616493223,
              'G': 0.31993654208124311,
              'T': 0.16421205628213656},
             'AGATA': {'A': 0.35525487270689199,
              'C': 0.05516482977955138,
              'G': 0.39095691692176193,
              'T': 0.19862338059179474},
             'AGATC': {'A': 0.0046368000159533792,
              'C': 0.29245215886207609,
              'G': 0.2677805386805745,
              'T': 0.43513050244139612},
             'CTATA': {'A': 0.32978040418249471,
              'C': 0.0060673247531525375,
              'G': 0.3879299771997452,
              'T': 0.27622229386460745},
             'GGACT': {'A': 0.31406333204110493,
              'C': 0.10870580351464665,
              'G': 0.16907067904164247,
              'T': 0.40816018540260607},
             'CGAAG': {'A': 0.15078371179564126,
              'C': 0.17899343513834678,
              'G': 0.35249294272292314,
              'T': 0.31772991034308878},
             'CGAAA': {'A': 0.38594911056883391,
              'C': 0.045768985236629929,
              'G': 0.43944363644691259,
              'T': 0.12883826774762358},
             'CGAAC': {'A': 0.18085149811881041,
              'C': 0.26738418534940078,
              'G': 0.25640643510715772,
              'T': 0.2953578814246311},
             'ATAAC': {'A': 0.34423399916034808,
              'C': 0.19127219213279636,
              'G': 0.29161586072428386,
              'T': 0.17287794798257169},
             'GCTGC': {'A': 0.028915819750204883,
              'C': 0.41698311510961583,
              'G': 0.49711185278082004,
              'T': 0.05698921235935938},
             'GCTGA': {'A': 0.051551336214174182,
              'C': 0.47317829360405161,
              'G': 0.18397876270211808,
              'T': 0.29129160747965599},
             'GCTGG': {'A': 0.31886155846683056,
              'C': 0.6032226512429818,
              'G': 0.039276958258992543,
              'T': 0.038638832031195294},
             'CGAAT': {'A': 0.330864278698904,
              'C': 0.21485839359560041,
              'G': 0.14461718293249576,
              'T': 0.30966014477299963},
             'ATAAA': {'A': 0.13754780562949542,
              'C': 0.47562300162211685,
              'G': 0.31818000911458871,
              'T': 0.06864918363379903},
             'GCTGT': {'A': 0.42922154650266586,
              'C': 0.12888271883231317,
              'G': 0.15354157285552952,
              'T': 0.28835416180949142},
             'GGTCC': {'A': 0.23805702631819087,
              'C': 0.41708966684997206,
              'G': 0.034820673387745527,
              'T': 0.31003263344409138},
             'GGTCA': {'A': 0.041340553155320134,
              'C': 0.10391385250348581,
              'G': 0.76540874323252461,
              'T': 0.089336851108669665},
             'GGTCG': {'A': 0.14388667842227859,
              'C': 0.21182192761402385,
              'G': 0.11728765918667276,
              'T': 0.52700373477702478},
             'CTATT': {'A': 0.22188144208436045,
              'C': 0.26269465690973787,
              'G': 0.089658636235663974,
              'T': 0.42576526477023779},
             'GGTCT': {'A': 0.2926971504211105,
              'C': 0.14716832073403813,
              'G': 0.24508723417189621,
              'T': 0.31504729467295522},
             'GCATG': {'A': 8.4617643196337831e-05,
              'C': 0.36054764267871886,
              'G': 0.53922086860433094,
              'T': 0.10014687107375381},
             'TTAGA': {'A': 0.2616529112489272,
              'C': 0.3545955966176233,
              'G': 0.25454232987134467,
              'T': 0.12920916226210474},
             'AAGTA': {'A': 0.27361622286301301,
              'C': 0.28375214919228714,
              'G': 0.2284544487926819,
              'T': 0.21417717915201789},
             'TGTAG': {'A': 0.42524068643578677,
              'C': 0.042155878219303465,
              'G': 0.1181314351386879,
              'T': 0.41447200020622194},
             'TGTAC': {'A': 0.17476843736483647,
              'C': 0.15023619143670713,
              'G': 0.50338373576799167,
              'T': 0.17161163543046465},
             'ACAAA': {'A': 0.45814023031157397,
              'C': 0.31847159269455005,
              'G': 0.08385191772806691,
              'T': 0.1395362592658089},
             'TGTAA': {'A': 0.18316438895582376,
              'C': 0.26854030607562079,
              'G': 0.26656884200875453,
              'T': 0.28172646295980097},
             'TGTAT': {'A': 0.38567885104527111,
              'C': 0.13911678740975567,
              'G': 0.26184913019571476,
              'T': 0.21335523134925846},
             'AGTCG': {'A': 0.27138775874782423,
              'C': 0.26308575561169101,
              'G': 0.39036879418688686,
              'T': 0.075157691453598088},
             'AGTCA': {'A': 0.39198792734452448,
              'C': 0.37923022424994168,
              'G': 0.067153688132800343,
              'T': 0.16162816027273352},
             'AGTCC': {'A': 0.191292531032177,
              'C': 0.35778698629953948,
              'G': 0.26873520196300177,
              'T': 0.18218528070528178},
             'GCGAG': {'A': 0.43334686862928118,
              'C': 0.10754891459267338,
              'G': 0.054714715415270933,
              'T': 0.40438950136277452},
             'GCGAC': {'A': 0.24741288460515232,
              'C': 0.34779778879242373,
              'G': 0.39949560878679308,
              'T': 0.0052937178156307824},
             'GCGAA': {'A': 0.24665185454637276,
              'C': 0.25630166431139523,
              'G': 0.067446960976312337,
              'T': 0.42959952016591973},
             'GGACG': {'A': 0.21132773940890939,
              'C': 0.26399814675544619,
              'G': 0.23210810866115925,
              'T': 0.29256600517448528},
             'GGACC': {'A': 0.12255192005879559,
              'C': 0.11744447272767913,
              'G': 0.085225722568590678,
              'T': 0.67477788464493471},
             'GGACA': {'A': 0.33387198054623829,
              'C': 0.1756813392592072,
              'G': 0.26909178114254184,
              'T': 0.22135489905201261},
             'ACGCT': {'A': 0.39375348388161407,
              'C': 0.2975362000899282,
              'G': 0.10498043937384292,
              'T': 0.20372987665461467},
             'GCGAT': {'A': 0.079008433723109464,
              'C': 0.42168349888233009,
              'G': 0.16428808091340105,
              'T': 0.33501998648115933},
             'AACGT': {'A': 0.45015054170303959,
              'C': 0.091797563371689539,
              'G': 0.33935727835294016,
              'T': 0.11869461657233067},
             'ATTGT': {'A': 0.24610978924979687,
              'C': 0.02714530254039579,
              'G': 0.63323119579087506,
              'T': 0.093513712418932304},
             'ATTGA': {'A': 0.1173814707028798,
              'C': 0.26439877967060199,
              'G': 0.28195857065435281,
              'T': 0.33626117897216545},
             'ATTGC': {'A': 0.29362207537139967,
              'C': 0.30503657394698752,
              'G': 0.28492132409099163,
              'T': 0.11642002659062116},
             'AACGA': {'A': 0.2740552273796571,
              'C': 0.217030681529264,
              'G': 0.29973588943971868,
              'T': 0.2091782016513602},
             'GAGGG': {'A': 0.27147392740384235,
              'C': 0.097081899677959466,
              'G': 0.32857653870272335,
              'T': 0.30286763421547497},
             'AACGC': {'A': 0.17621633625056299,
              'C': 0.46555683905321332,
              'G': 0.24370490018672961,
              'T': 0.11452192450949397},
             'CTCAT': {'A': 0.34978222412862187,
              'C': 0.0002312550424085486,
              'G': 0.56600571203995009,
              'T': 0.083980808789019465},
             'TTGCT': {'A': 0.37721569108916869,
              'C': 0.26659086718601049,
              'G': 0.24498853201481069,
              'T': 0.11120490971001011},
             'ACGAT': {'A': 0.11037003751195053,
              'C': 0.25333575751055698,
              'G': 0.27577244825369251,
              'T': 0.36052175672379999},
             'TGCCT': {'A': 0.15525121767894762,
              'C': 0.38921494836337484,
              'G': 0.13540790584606954,
              'T': 0.32012592811160806},
             'CTCAC': {'A': 0.40974085492087037,
              'C': 0.40413437211330039,
              'G': 0.097956640235667955,
              'T': 0.088168132730161428},
             'CTCAA': {'A': 0.2477074642832347,
              'C': 0.23759289413097065,
              'G': 0.19632488012116794,
              'T': 0.31837476146462679},
             'CTCAG': {'A': 0.1755672007875132,
              'C': 0.24273577148284151,
              'G': 0.26708558010839845,
              'T': 0.31461144762124704},
             'TTGCG': {'A': 0.18450774176205231,
              'C': 0.15859968344394812,
              'G': 0.37623445939430122,
              'T': 0.28065811539969826},
             'AAGTT': {'A': 0.28408547072411755,
              'C': 0.1303182292548809,
              'G': 0.41322652023228296,
              'T': 0.1723697797887187},
             'ACGAC': {'A': 0.1809453410614302,
              'C': 0.31165313631040098,
              'G': 0.12858786598361471,
              'T': 0.37881365664455413},
             'TGCCA': {'A': 0.34086266205181293,
              'C': 0.11686570494321924,
              'G': 0.4170811826388372,
              'T': 0.12519045036613072},
             'TTGCC': {'A': 0.42291640654273849,
              'C': 0.38976551339646792,
              'G': 0.038204344498388894,
              'T': 0.14911373556240487},
             'TGCCG': {'A': 0.31350892842072975,
              'C': 0.3064392252432464,
              'G': 0.31217800313965788,
              'T': 0.067873843196366079},
             'TTGCA': {'A': 0.23570039404370416,
              'C': 0.36195770705909952,
              'G': 0.18365758463242809,
              'T': 0.21868431426476809},
             'GGCAT': {'A': 0.35228592844192608,
              'C': 0.41802389973870668,
              'G': 0.2027465960263064,
              'T': 0.026943575793060795},
             'GGCAG': {'A': 0.25554866016308242,
              'C': 0.18533537579041176,
              'G': 0.24030124179119569,
              'T': 0.31881472225531005},
             'GGCAC': {'A': 0.22368642138021252,
              'C': 0.21271229843510855,
              'G': 0.26791205052430228,
              'T': 0.29568922966037653},
             'GGCAA': {'A': 0.33363436527939716,
              'C': 0.1060943540536595,
              'G': 0.1303959545115505,
              'T': 0.42987532615539298},
             'CCGGA': {'A': 0.11729842258953838,
              'C': 0.088311984966118917,
              'G': 0.42078569122135062,
              'T': 0.3736039012229922},
             'CCGGC': {'A': 0.053278119442254676,
              'C': 0.28652953801601982,
              'G': 0.38976562270463644,
              'T': 0.27042671983708894},
             'CCGGG': {'A': 0.4386426503162853,
              'C': 0.022406043384643682,
              'G': 0.50699669872661546,
              'T': 0.031954607572455565},
             'CCGGT': {'A': 0.31214397938754274,
              'C': 0.18137855138524239,
              'G': 0.25629908615144065,
              'T': 0.25017838307577428},
             'AGGGC': {'A': 0.43415697556184962,
              'C': 0.12916484736021286,
              'G': 0.044462580298095973,
              'T': 0.3922155967798418},
             'GATTA': {'A': 0.25704246026179223,
              'C': 0.22182697012753,
              'G': 0.12600554758445653,
              'T': 0.39512502202622118},
             'GATTC': {'A': 0.1964800803518609,
              'C': 0.023097279180580861,
              'G': 0.23539977589589142,
              'T': 0.54502286457166693},
             'AGGGA': {'A': 0.13842428913915383,
              'C': 0.38878143030329537,
              'G': 0.078319395519283116,
              'T': 0.39447488503826766},
             'GATTG': {'A': 0.23734649407839209,
              'C': 0.16862258416311515,
              'G': 0.37725792972661165,
              'T': 0.21677299203188113},
             'CAGGC': {'A': 0.41007287100808881,
              'C': 0.4329403678908596,
              'G': 0.14369918694881398,
              'T': 0.013287574152237615},
             'TTTAC': {'A': 0.13133631744451318,
              'C': 0.3314419722912007,
              'G': 0.28503627582597107,
              'T': 0.25218543443831493},
             'CAGGA': {'A': 0.311726504821356,
              'C': 0.11048355919134148,
              'G': 0.31688274442019843,
              'T': 0.26090719156710407},
             'TTTAA': {'A': 0.37853242057364395,
              'C': 0.2927749775543671,
              'G': 0.096641968706606074,
              'T': 0.23205063316538296},
             'CAGGG': {'A': 0.42973083909218618,
              'C': 0.061155078348563124,
              'G': 0.33498565371567379,
              'T': 0.1741284288435769},
             'TTTAG': {'A': 0.088451716814035228,
              'C': 0.33434209180624597,
              'G': 0.49307235578386355,
              'T': 0.084133835595855466},
             'GATTT': {'A': 0.225873837596796,
              'C': 0.05465720826891407,
              'G': 0.35370841043935497,
              'T': 0.36576054369493494},
             'TTTAT': {'A': 0.23525228965851297,
              'C': 0.11746952549525989,
              'G': 0.53942615872378497,
              'T': 0.10785202612244196},
             'CAGGT': {'A': 0.18264542223733826,
              'C': 0.18316398519351143,
              'G': 0.15918222839127971,
              'T': 0.47500836417787062},
             'GACAT': {'A': 0.3112021992678356,
              'C': 0.16809139230558934,
              'G': 0.12862476712769116,
              'T': 0.39208164129888379},
             'CTCTT': {'A': 0.4933525512955319,
              'C': 0.009936140983848863,
              'G': 0.061522576246334122,
              'T': 0.43518873147428511},
             'TTGTT': {'A': 0.24263855637350076,
              'C': 0.11594665929682881,
              'G': 0.22726439191627359,
              'T': 0.4141503924133968},
             'GACAA': {'A': 0.16173690758762113,
              'C': 0.17589275557379655,
              'G': 0.24668689467324312,
              'T': 0.4156834421653392},
             'GACAC': {'A': 0.25308078589241195,
              'C': 0.27417222214445658,
              'G': 0.30091281453279006,
              'T': 0.17183417743034138},
             'GACAG': {'A': 0.31649986855258272,
              'C': 0.42334748462998312,
              'G': 0.035142410864789267,
              'T': 0.22501023595264491},
             'TTGTG': {'A': 0.1757749726665209,
              'C': 0.28670984739485383,
              'G': 0.49939161411185057,
              'T': 0.038123565826774598},
             'CTCTG': {'A': 0.060038043052268952,
              'C': 0.38612553744371286,
              'G': 0.15758250104782842,
              'T': 0.39625391845618968},
             'CTCTA': {'A': 0.030327332078996197,
              'C': 0.3419114475464059,
              'G': 0.29289032279358118,
              'T': 0.33487089758101674},
             'TTGTC': {'A': 0.42821294705715479,
              'C': 0.07897689655386439,
              'G': 0.038685866739653817,
              'T': 0.45412428964932694},
             'CTCTC': {'A': 0.22831268908897115,
              'C': 0.051513277296557546,
              'G': 0.37685018118067493,
              'T': 0.34332385243379632},
             'TTGTA': {'A': 0.24622378506508363,
              'C': 0.052737527220572886,
              'G': 0.28932213232768761,
              'T': 0.41171655538665586},
             'CATTT': {'A': 0.16375055107058123,
              'C': 0.40271560868981099,
              'G': 0.22043446604951303,
              'T': 0.21309937419009461},
             'CCTCT': {'A': 0.22411606174606732,
              'C': 0.2194466440361463,
              'G': 0.24367075526854634,
              'T': 0.31276653894924},
             'GTCTT': {'A': 0.25358033481655406,
              'C': 0.25606306854619004,
              'G': 0.20395518993665726,
              'T': 0.28640140670059866},
             'CCTCC': {'A': 0.10394204804230311,
              'C': 0.26201947594995689,
              'G': 0.3911589491692542,
              'T': 0.24287952683848565},
             'CATTG': {'A': 0.1700130595477477,
              'C': 0.32351358465012425,
              'G': 0.35630114794803619,
              'T': 0.15017220785409177},
             'CCTCA': {'A': 0.39981876562545376,
              'C': 0.081484906678079727,
              'G': 0.19910231737455156,
              'T': 0.31959401032191509},
             'CATTA': {'A': 0.12927522229527197,
              'C': 0.066849670315877921,
              'G': 0.41824189131825484,
              'T': 0.38563321607059525},
             'CCTCG': {'A': 0.11210558610692321,
              'C': 0.37888775096710392,
              'G': 0.3811137087413688,
              'T': 0.12789295418460414},
             'CATTC': {'A': 0.27129306922137003,
              'C': 0.27742934110169198,
              'G': 0.1050544249899111,
              'T': 0.34622316468702685},
             'ACCCG': {'A': 0.10290232847523666,
              'C': 0.47850029258748134,
              'G': 0.13023921929334081,
              'T': 0.28835815964394124},
             'CGCCG': {'A': 0.27049417527531655,
              'C': 0.057402216058595343,
              'G': 0.32886246755067522,
              'T': 0.34324114111541293},
             'CGCCA': {'A': 0.052334761246438564,
              'C': 0.10377017941311777,
              'G': 0.38363183993475086,
              'T': 0.46026321940569281},
             'CGCCC': {'A': 0.62304568858623488,
              'C': 0.00065095219919418426,
              'G': 0.074408844592273801,
              'T': 0.30189451462229699},
             'CGCCT': {'A': 0.32562484611735681,
              'C': 0.098937200751180357,
              'G': 0.54245080698890358,
              'T': 0.032987146142559209},
             'GAACT': {'A': 0.23155048018362079,
              'C': 0.046763736806545643,
              'G': 0.1684217520089151,
              'T': 0.55326403100091848},
             'GTCTA': {'A': 0.13140027729673254,
              'C': 0.39684514246343133,
              'G': 0.14095477034726003,
              'T': 0.33079980989257618},
             'GAACA': {'A': 0.19080558907198,
              'C': 0.34909663059406992,
              'G': 0.23765301924934512,
              'T': 0.22244476108460509},
             'GAACC': {'A': 0.24445154760888893,
              'C': 0.52033274873173663,
              'G': 0.0087852685690326428,
              'T': 0.22643043509034186},
             'GTCTC': {'A': 0.1689231185122714,
              'C': 0.27096979325401127,
              'G': 0.29276984295377539,
              'T': 0.2673372452799419},
             'GAACG': {'A': 0.11596600435994325,
              'C': 0.40109210504589715,
              'G': 0.3174439799068306,
              'T': 0.16549791068732897},
             'CGCGT': {'A': 0.40236268608352938,
              'C': 0.11279205572866011,
              'G': 0.36382103754227496,
              'T': 0.12102422064553546},
             'ATCGT': {'A': 0.1723128340667702,
              'C': 0.094757776142713024,
              'G': 0.60277041079217197,
              'T': 0.13015897899834478},
             'GTCTG': {'A': 0.33797239751871638,
              'C': 0.15383833726795978,
              'G': 0.19883238808297729,
              'T': 0.30935687713034643},
             'ATCGC': {'A': 0.32067871932860847,
              'C': 0.4345202949813432,
              'G': 0.18775411460502223,
              'T': 0.057046871085025957},
             'ATCGA': {'A': 0.078589317453130705,
              'C': 0.21760966879882102,
              'G': 0.22397162269755633,
              'T': 0.47982939105049205},
             'ATCGG': {'A': 0.013052894351439309,
              'C': 0.4357231663799227,
              'G': 0.16056734034894346,
              'T': 0.39065659891969462},
             'GTAGG': {'A': 0.16183288744222793,
              'C': 0.67548114319433705,
              'G': 0.041557072481804867,
              'T': 0.12112889688163019},
             'GTCGT': {'A': 0.23319334672075492,
              'C': 0.24780965348952372,
              'G': 0.31936845941526382,
              'T': 0.19962854037445762},
             'GTAGC': {'A': 0.40743242579138944,
              'C': 0.40239954895073521,
              'G': 0.12546499834583746,
              'T': 0.064703026912038109},
             'GTAGA': {'A': 0.30556255626056505,
              'C': 0.079236201927457547,
              'G': 0.29541983202001842,
              'T': 0.31978140979195896},
             'GTCGA': {'A': 0.10408268895489158,
              'C': 0.14778711763145924,
              'G': 0.3855345473525329,
              'T': 0.36259564606111627},
             'GTAGT': {'A': 0.48696157593689166,
              'C': 0.25241809831455753,
              'G': 0.027425356629795422,
              'T': 0.23319496911875551},
             'GTCGC': {'A': 0.19776335168976014,
              'C': 0.28451484051407433,
              'G': 0.27615847756726997,
              'T': 0.24156333022889551},
             'GGGTG': {'A': 0.3062466134307299,
              'C': 0.25765099001674302,
              'G': 0.19769255525535434,
              'T': 0.23840984129717269},
             'ACGAG': {'A': 0.42251965277066067,
              'C': 0.4059321653029016,
              'G': 0.05626854717408649,
              'T': 0.11527963475235109},
             'GTGAT': {'A': 0.016394953241200484,
              'C': 0.79904128740659774,
              'G': 0.044444422333179523,
              'T': 0.14011933701902232},
             'ACTGT': {'A': 0.26087952682159182,
              'C': 0.015304398618021214,
              'G': 0.28836425614282296,
              'T': 0.43545181841756397},
             'TCACA': {'A': 0.36939802039361558,
              'C': 0.20869573998027333,
              'G': 0.051464818544440329,
              'T': 0.37044142108167072},
             'TCACC': {'A': 0.13569773629477291,
              'C': 0.30362660668192831,
              'G': 0.36816793787675189,
              'T': 0.19250771914654694},
             'ATAAG': {'A': 0.095490023807154184,
              'C': 0.36870068000696105,
              'G': 0.45521342641646212,
              'T': 0.080595869769422693},
             'TCACG': {'A': 0.33170771813055255,
              'C': 0.39675232342603844,
              'G': 0.094607131792730809,
              'T': 0.17693282665067811},
             'CTTGG': {'A': 0.31814625451830125,
              'C': 0.29354595370646114,
              'G': 0.13868034996264977,
              'T': 0.24962744181258784},
             'GAGTC': {'A': 0.095405887797660086,
              'C': 0.22575685946464319,
              'G': 0.34370278030565632,
              'T': 0.33513447243204048},
             'GAGTA': {'A': 0.33090071046591352,
              'C': 0.32604922709989753,
              'G': 0.056778899603075125,
              'T': 0.2862711628311137},
             'CTTGC': {'A': 0.13874822612135959,
              'C': 0.25672579378756755,
              'G': 0.28051628541823664,
              'T': 0.32400969467283636},
             'GAGTG': {'A': 0.1454941889877272,
              'C': 0.24126677613313971,
              'G': 0.24954293146600595,
              'T': 0.36369610341312708},
             'CTTGA': {'A': 0.42750817229800708,
              'C': 0.14535090038255602,
              'G': 0.37436290275352291,
              'T': 0.052778024565913954},
             'ATCAT': {'A': 0.22877361934712526,
              'C': 0.066416597036874525,
              'G': 0.41753737087568776,
              'T': 0.28727241274031262},
             'ACTGG': {'A': 0.080560269277910282,
              'C': 0.45416579866974732,
              'G': 0.35320630336828968,
              'T': 0.11206762868405266},
             'TCACT': {'A': 0.063338003527720649,
              'C': 0.34631147747751651,
              'G': 0.21480694151492721,
              'T': 0.37554357747983558},
             'ACTGA': {'A': 0.0038279038660704091,
              'C': 0.19112172648675518,
              'G': 0.49475908307496747,
              'T': 0.310291286572207},
             'ATAAT': {'A': 0.34699871025184115,
              'C': 0.41766148656815305,
              'G': 0.047792509023823392,
              'T': 0.18754729415618243},
             'ACTGC': {'A': 0.11343355213953964,
              'C': 0.34448438947700438,
              'G': 0.34084133027609531,
              'T': 0.20124072810736068},
             'CTTGT': {'A': 0.0013970857103899918,
              'C': 0.58939946872150728,
              'G': 0.10937820962692553,
              'T': 0.2998252359411771},
             'GAGTT': {'A': 0.2665432973105144,
              'C': 0.15104481737907741,
              'G': 0.26763270112859766,
              'T': 0.3147791841818105},
             'GATCT': {'A': 0.39929946017193235,
              'C': 0.53107150090987376,
              'G': 0.04921763174572568,
              'T': 0.020411407172468206},
             'AGAAT': {'A': 0.46986580319575266,
              'C': 0.24982277955399343,
              'G': 0.23233604982008638,
              'T': 0.047975367430167705},
             'ACGCA': {'A': 0.30081781954307474,
              'C': 0.20171161619495731,
              'G': 0.25678384817701794,
              'T': 0.24068671608495001},
             'AGAAG': {'A': 0.35728109163730826,
              'C': 0.13787464207646821,
              'G': 0.43178190167904201,
              'T': 0.073062364607181421},
             'GATCG': {'A': 0.085890831902417947,
              'C': 0.27599226509912783,
              'G': 0.44732754470918479,
              'T': 0.19078935828926935},
             'AGAAC': {'A': 0.0010934421346773617,
              'C': 0.27150907980800648,
              'G': 0.2149788187204078,
              'T': 0.51241865933690833},
             'GATCA': {'A': 0.40898555740476128,
              'C': 0.16130635593362289,
              'G': 0.034489413569120095,
              'T': 0.39521867309249575},
             'AGAAA': {'A': 0.38554258142506176,
              'C': 0.22442001164362538,
              'G': 0.18635117067048951,
              'T': 0.20368623626082344},
             'GATCC': {'A': 0.37481356623293788,
              'C': 0.0029354145536395581,
              'G': 0.40428831547640315,
              'T': 0.21796270373701937},
             'ATGCA': {'A': 0.36051743097662065,
              'C': 0.4045088563333975,
              'G': 0.026561427387432505,
              'T': 0.20841228530254927},
             'AGCCG': {'A': 0.28074445922818103,
              'C': 0.30299679765596121,
              'G': 0.20855576130794812,
              'T': 0.20770298180790964},
             'ATGCC': {'A': 0.0097838548861141107,
              'C': 0.59503355654780044,
              'G': 0.3485812254744311,
              'T': 0.046601363091654364},
             'CCACT': {'A': 0.24384515760852099,
              'C': 0.30103295031300892,
              'G': 0.21880237095938984,
              'T': 0.23631952111908019},
             'AGCCC': {'A': 0.11482550597698588,
              'C': 0.31918199124559504,
              'G': 0.26991119812064429,
              'T': 0.29608130465677479},
             'ATGCG': {'A': 0.33327121881989852,
              'C': 0.11905239775043364,
              'G': 0.22120551082015963,
              'T': 0.3264708726095083},
             'AGCCA': {'A': 0.082887944543522302,
              'C': 0.39063768222088752,
              'G': 0.14303468745841807,
              'T': 0.38343968577717208},
             'TCGAG': {'A': 0.31285527673897012,
              'C': 0.21622983237842514,
              'G': 0.2275628532265567,
              'T': 0.24335203765604807},
             'CCACG': {'A': 0.0074663600436360332,
              'C': 0.30614566120981873,
              'G': 0.12174811073231351,
              'T': 0.56463986801423172},
             'AGCCT': {'A': 0.061277387435625261,
              'C': 0.092925431264184163,
              'G': 0.51147603320668789,
              'T': 0.33432114809350266},
             'CCACC': {'A': 0.2947839278833308,
              'C': 0.64540375349408041,
              'G': 0.019034089946066167,
              'T': 0.040778228676522511},
             'ATGCT': {'A': 0.12769699641267032,
              'C': 0.27227025905224955,
              'G': 0.28745734170001402,
              'T': 0.31257540283506607},
             'TAGAT': {'A': 0.27222517247494571,
              'C': 0.18155493041131035,
              'G': 0.079070732289710732,
              'T': 0.46714916482403329},
             'AACGG': {'A': 0.21237437852973209,
              'C': 0.26499567411705233,
              'G': 0.3547821828446831,
              'T': 0.16784776450853245},
             'CGTCG': {'A': 0.41826915053788755,
              'C': 0.1187352775811726,
              'G': 0.19899366399550905,
              'T': 0.26400190788543076},
             'CGTCC': {'A': 0.25394746784981659,
              'C': 0.099652337240852984,
              'G': 0.42823054232095481,
              'T': 0.21816965258837565},
             'TATCT': {'A': 0.41826836235255382,
              'C': 0.012178251830090235,
              'G': 0.26358999452773813,
              'T': 0.30596339128961786},
             'TAGAG': {'A': 0.44007583688317092,
              'C': 0.016624893048138131,
              'G': 0.10274097713007609,
              'T': 0.44055829293861487},
             'TAGAC': {'A': 0.22869668351895042,
              'C': 0.16587293054188559,
              'G': 0.33800073504773287,
              'T': 0.26742965089143123},
             'TAGAA': {'A': 0.14376363252885199,
              'C': 0.18805725318959335,
              'G': 0.35778012612480942,
              'T': 0.31039898815674544},
             'TATCC': {'A': 0.3774809876779549,
              'C': 0.57182211831623053,
              'G': 0.0088903317478763073,
              'T': 0.041806562257938308},
             'CGTCT': {'A': 0.27593367285675691,
              'C': 0.42796794293195883,
              'G': 0.23040263776870529,
              'T': 0.065695746442579028},
             'TATCG': {'A': 0.19383592203010186,
              'C': 0.26619854920739161,
              'G': 0.21324988239447046,
              'T': 0.32671564636803607},
             'ACGTG': {'A': 0.36236977215506672,
              'C': 0.17812531297232331,
              'G': 0.4079428422935818,
              'T': 0.051562072579028118},
             'GCGGT': {'A': 0.33181016406866209,
              'C': 0.32051448822753881,
              'G': 0.18304827643835028,
              'T': 0.16462707126544876},
             'GCGGG': {'A': 0.29227250984470493,
              'C': 0.047968595158329901,
              'G': 0.069912046302345876,
              'T': 0.58984684869461945},
             'GCGGA': {'A': 0.59157627491207021,
              'C': 0.30998574396597528,
              'G': 0.0098374691358067458,
              'T': 0.088600511986147712},
             'GCGGC': {'A': 0.19978982167758041,
              'C': 0.24825181822512998,
              'G': 0.19024280548858538,
              'T': 0.36171555460870419},
             'ACGTC': {'A': 0.21393431542839569,
              'C': 0.17885465888409235,
              'G': 0.46661787915150754,
              'T': 0.14059314653600433},
             'GCAGG': {'A': 0.22553459171561382,
              'C': 0.34080260477746221,
              'G': 0.13115614816865606,
              'T': 0.30250665533826782},
             'TCGAT': {'A': 0.090219432730876126,
              'C': 0.2088415573633286,
              'G': 0.27812356938386423,
              'T': 0.42281544052193099},
             'TCTCG': {'A': 0.083769054180439687,
              'C': 0.29230698724593307,
              'G': 0.24693661868727063,
              'T': 0.37698733988635647},
             'ACGTA': {'A': 0.21130517876408972,
              'C': 0.13104090673423269,
              'G': 0.49593214643023764,
              'T': 0.16172176807143995},
             'TCTCA': {'A': 0.19486127259450084,
              'C': 0.19921813903855323,
              'G': 0.28075745568197719,
              'T': 0.32516313268496894},
             'GCAGA': {'A': 0.41057969758447876,
              'C': 0.13956311931220372,
              'G': 0.31063224671606532,
              'T': 0.13922493638725206},
             'CCACA': {'A': 0.1103287051362284,
              'C': 0.45637440706207444,
              'G': 0.13590026589050566,
              'T': 0.29739662191119159},
             'TCTCT': {'A': 0.36238966241884429,
              'C': 0.33122153067355814,
              'G': 0.033333449783146354,
              'T': 0.27305535712445134},
             'GCAGT': {'A': 0.24782800013520503,
              'C': 0.38537378903959829,
              'G': 0.23642907196841029,
              'T': 0.13036913885678633},
             'GTTGC': {'A': 0.13285473155385802,
              'C': 0.31213205071497613,
              'G': 0.33382045932560134,
              'T': 0.22119275840556449},
             'TCGAA': {'A': 0.27561816573325948,
              'C': 0.22925666703795261,
              'G': 0.34992380035807108,
              'T': 0.14520136687071677},
             'GTTGG': {'A': 0.31707789543010434,
              'C': 0.42224818518862661,
              'G': 0.17820057498601924,
              'T': 0.082473344395249934},
             'CCCAA': {'A': 0.21277524466749281,
              'C': 0.06347851317637089,
              'G': 0.43245698611802652,
              'T': 0.29128925603810985},
             'CCATT': {'A': 0.33715091017909371,
              'C': 0.04255520289926619,
              'G': 0.45862469184022919,
              'T': 0.16166919508141095},
             'CCCAT': {'A': 0.11551768948244613,
              'C': 0.10775138698621348,
              'G': 0.34393332056118059,
              'T': 0.43279760297015979},
             'GTTGT': {'A': 0.23959351820967795,
              'C': 0.3462249837328959,
              'G': 0.30020368892914329,
              'T': 0.11397780912828299},
             'CCATG': {'A': 0.52503489068327414,
              'C': 0.009780636422091156,
              'G': 0.1966910054438841,
              'T': 0.26849346745075048},
             'CCATC': {'A': 0.32166488329036858,
              'C': 0.18683867657771935,
              'G': 0.26831998587731865,
              'T': 0.22317645425459348},
             'GTGGC': {'A': 0.040344704793347889,
              'C': 0.4070091217271527,
              'G': 0.46829656117927571,
              'T': 0.084349612300223642},
             'CCATA': {'A': 0.19463451732803042,
              'C': 0.25990190237554928,
              'G': 0.27220391677215899,
              'T': 0.27325966352426129},
             'ATTTT': {'A': 0.26938606463304315,
              'C': 0.2947650852232101,
              'G': 0.12622895626340508,
              'T': 0.30961989388034167},
             'TGTGT': {'A': 0.34393542837521468,
              'C': 0.22800705808392666,
              'G': 0.37906539435723646,
              'T': 0.048992119183622077},
             'ACGTT': {'A': 0.14702743675959626,
              'C': 0.1815535596961102,
              'G': 0.3072149714392719,
              'T': 0.36420403210502156},
             'ATTTA': {'A': 0.1424618001367994,
              'C': 0.31738773607878651,
              'G': 0.36204249162435281,
              'T': 0.17810797216006127},
             'ATTTC': {'A': 0.21518570955500874,
              'C': 0.28336845166539026,
              'G': 0.21086816629093294,
              'T': 0.29057767248866817},
             'ATTTG': {'A': 0.34440615122113621,
              'C': 0.262882001202493,
              'G': 0.37117574533906889,
              'T': 0.021536102237301839},
             'TGTGG': {'A': 0.14017481420053707,
              'C': 0.2851658286931677,
              'G': 0.1511261512426462,
              'T': 0.42353320586364906},
             'TGTGA': {'A': 0.26916823019303565,
              'C': 0.29031545634833622,
              'G': 0.42154845092727122,
              'T': 0.018967862531356947},
             'TGTGC': {'A': 0.34125455088398621,
              'C': 0.061612656219340527,
              'G': 0.38909426986048146,
              'T': 0.2080385230361918},
             'GGCGG': {'A': 0.37924545663949216,
              'C': 0.05072685911743189,
              'G': 0.40323748721165353,
              'T': 0.16679019703142225},
             'GGCGA': {'A': 0.16083224412616376,
              'C': 0.44256978258328444,
              'G': 0.30161897419158162,
              'T': 0.094978999098970132},
             'GTGTC': {'A': 0.036783529091982889,
              'C': 0.38905835382298698,
              'G': 0.41501129503679435,
              'T': 0.15914682204823569},
             'GGCGT': {'A': 0.35230721564868911,
              'C': 0.088177701004656564,
              'G': 0.37558221712949041,
              'T': 0.18393286621716404},
             'CGTCA': {'A': 0.080219901805852839,
              'C': 0.040066928132364385,
              'G': 0.78030781621251255,
              'T': 0.099405353849270253},
             'CAATG': {'A': 0.25811405896973505,
              'C': 0.34404715860952978,
              'G': 0.064743425785282208,
              'T': 0.33309535663545309},
             'CACCT': {'A': 0.17563869873033863,
              'C': 0.1705515611947756,
              'G': 0.092186270686370433,
              'T': 0.56162346938851526},
             'TAAAG': {'A': 0.34410336929156538,
              'C': 0.04735925180968447,
              'G': 0.30546440959585303,
              'T': 0.30307296930289723},
             'TAAAA': {'A': 0.21539878402493787,
              'C': 0.27273798067449667,
              'G': 0.19676008855751451,
              'T': 0.31510314674305079},
             'TAAAC': {'A': 0.1611885322922256,
              'C': 0.15181805715532046,
              'G': 0.4157594984052424,
              'T': 0.27123391214721149},
             'CACCC': {'A': 0.42537459278027612,
              'C': 0.4279760549858303,
              'G': 0.14526896716034413,
              'T': 0.0013803850735492954},
             'CACCA': {'A': 0.39283195127459697,
              'C': 0.11792212334008717,
              'G': 0.30442723096202751,
              'T': 0.1848186944232883},
             'CACCG': {'A': 0.18031524710992433,
              'C': 0.13147343873996509,
              'G': 0.31635793741395568,
              'T': 0.37185337673615498},
             'TCGAC': {'A': 0.064000706849181382,
              'C': 0.41244271885678474,
              'G': 0.34465630352432369,
              'T': 0.17890027076971016},
             'TAAAT': {'A': 0.34587618356586208,
              'C': 0.25229501899323109,
              'G': 0.11164158766179309,
              'T': 0.29018720977911366},
             'AAGCG': {'A': 0.42763695346442415,
              'C': 0.28070756754901888,
              'G': 0.093853527316336519,
              'T': 0.19780195167022016},
             'AAGCA': {'A': 0.20791859180330227,
              'C': 0.21941149963773843,
              'G': 0.28862945536870965,
              'T': 0.28404045319024951},
             'AAGCC': {'A': 0.31766954057272601,
              'C': 0.26052973386618589,
              'G': 0.13697279977824095,
              'T': 0.28482792578284716},
             'AAGCT': {'A': 0.34298923959945499,
              'C': 0.075452104632451653,
              'G': 0.33074593578204292,
              'T': 0.25081271998605037},
             'TATCA': {'A': 0.2742168103335319,
              'C': 0.35852127738789386,
              'G': 0.13697537225009851,
              'T': 0.23028654002847584},
             'TTCGG': {'A': 0.19136097208993902,
              'C': 0.1084025895563971,
              'G': 0.41244700715501292,
              'T': 0.28778943119865097},
             'TTCGC': {'A': 0.10618990741952733,
              'C': 0.28618455770489526,
              'G': 0.42243189380259033,
              'T': 0.18519364107298697},
             'TTCGA': {'A': 0.076978933579759393,
              'C': 0.18814114385937669,
              'G': 0.24420235124009446,
              'T': 0.49067757132076939},
             'TTCGT': {'A': 0.35226118758881225,
              'C': 0.46740870048590921,
              'G': 0.11728699712409034,
              'T': 0.063043114801188155},
             'TACGT': {'A': 0.558082481847329,
              'C': 0.10017912928465773,
              'G': 0.25318274536438234,
              'T': 0.088555643503630738},
             'CAAAT': {'A': 0.2808422867531864,
              'C': 0.0891486088612434,
              'G': 0.094351915166820011,
              'T': 0.53565718921875005},
             'TACGG': {'A': 0.26523090078045108,
              'C': 0.37253945799048865,
              'G': 0.024339660850750632,
              'T': 0.33788998037830953},
             'TACGA': {'A': 0.22426500348696027,
              'C': 0.37110318412088594,
              'G': 0.33686351101672329,
              'T': 0.067768301375430787},
             'TACGC': {'A': 0.69179572327279804,
              'C': 0.12520923823560948,
              'G': 0.17525510326097424,
              'T': 0.0077399352306182605},
             'CAAAC': {'A': 0.12049216117800142,
              'C': 0.27564998523112016,
              'G': 0.2476220873529329,
              'T': 0.35623576623794545},
             'CAAAA': {'A': 0.0063540425180088726,
              'C': 0.28689555643002979,
              'G': 0.47804835408023943,
              'T': 0.22870204697172186},
             'CAAAG': {'A': 0.23322388011280609,
              'C': 0.35071219962720329,
              'G': 0.071649898144288085,
              'T': 0.34441402211570243},
             'CATGG': {'A': 0.35872920504175243,
              'C': 0.094440651221904107,
              'G': 0.44055513787598699,
              'T': 0.10627500586035661},
             'CATGA': {'A': 0.37910645100662443,
              'C': 0.15552502401580764,
              'G': 0.32627044338344802,
              'T': 0.1390980815941199},
             'CATGC': {'A': 0.29581129576540793,
              'C': 0.24968271098347519,
              'G': 0.34759611942541796,
              'T': 0.1069098738256988},
             'CATGT': {'A': 0.11943995473375593,
              'C': 0.33992309509948782,
              'G': 0.23370699728579342,
              'T': 0.30692995288096292},
             'CTTTT': {'A': 0.32870684116080739,
              'C': 0.24384202579784264,
              'G': 0.20293691823699081,
              'T': 0.2245142148043591},
             'ACAGA': {'A': 0.36839891280838694,
              'C': 0.28251456663025015,
              'G': 0.30107676586979781,
              'T': 0.048009754691565057},
             'ACAGC': {'A': 0.23750005586358844,
              'C': 0.14849306438564266,
              'G': 0.32925689943948788,
              'T': 0.28474998031128107},
             'ACAGG': {'A': 0.15261281542814797,
              'C': 0.34648399579363159,
              'G': 0.13215469231995525,
              'T': 0.36874849645826518},
             'CTTTC': {'A': 0.37271206826684972,
              'C': 0.33508062880003259,
              'G': 0.15997715100210877,
              'T': 0.1322301519310087},
             'CTTTA': {'A': 0.33344526438411465,
              'C': 0.17232735931970403,
              'G': 0.22173465220559521,
              'T': 0.27249272409058606},
             'CTTTG': {'A': 0.33299212035000914,
              'C': 0.32310573758379307,
              'G': 0.18572096780909342,
              'T': 0.15818117425710421},
             'ACAGT': {'A': 0.024248798122371195,
              'C': 0.34265079196262532,
              'G': 0.32273108844312193,
              'T': 0.31036932147188168},
             'AATAA': {'A': 0.2618534006133944,
              'C': 0.20170204566780173,
              'G': 0.25999601350171114,
              'T': 0.27644854021709275},
             'AATAC': {'A': 0.06857305951605773,
              'C': 0.61278600711154985,
              'G': 0.18242865146813694,
              'T': 0.13621228190425533},
             'AATAG': {'A': 0.32668097992026596,
              'C': 0.28981004908285868,
              'G': 0.33523394599550882,
              'T': 0.048275025001366795},
             'TCCCG': {'A': 0.2660834932514714,
              'C': 0.018901965673312926,
              'G': 0.34435953117016477,
              'T': 0.37065500990505085},
             'TCCCC': {'A': 0.22137053847328542,
              'C': 0.23272134880201581,
              'G': 0.35944278958121773,
              'T': 0.18646532314348091},
             'TCCCA': {'A': 0.054158994874577357,
              'C': 0.81630637825052577,
              'G': 0.095873628163655536,
              'T': 0.033660998711241542},
             'AATAT': {'A': 0.29625185766186246,
              'C': 0.11726473981149474,
              'G': 0.28612377213738482,
              'T': 0.30035963038925806},
             'TCCCT': {'A': 0.082077175421205434,
              'C': 0.28771013682497504,
              'G': 0.31054813591239006,
              'T': 0.3196645518414295},
             'GTCAG': {'A': 0.0068036048458619694,
              'C': 0.47043895330473012,
              'G': 0.11292122580136989,
              'T': 0.40983621604803794},
             'GTCAC': {'A': 0.65854120478595568,
              'C': 0.18520826374352439,
              'G': 0.036013295942679324,
              'T': 0.12023723552784055},
             'GTCAA': {'A': 0.53954149468774426,
              'C': 0.1485484130733955,
              'G': 0.1546049933291363,
              'T': 0.15730509890972408},
             'GTCAT': {'A': 0.063236282488028511,
              'C': 0.25097420800790377,
              'G': 0.28362265830955741,
              'T': 0.40216685119451023},
             'GTTTT': {'A': 0.2221203137120509,
              'C': 0.5904881511178558,
              'G': 0.16360430231846906,
              'T': 0.023787232851624374},
             'TCGGT': {'A': 0.31705003896764555,
              'C': 0.1404618137287621,
              'G': 0.099229407446699461,
              'T': 0.44325873985689296},
             'GTTTG': {'A': 0.13995200048334461,
              'C': 0.2061013319356344,
              'G': 0.38833382517447346,
              'T': 0.26561284240654764},
             'GTTTC': {'A': 0.37985545833526202,
              'C': 0.33520346397730028,
              'G': 0.15965902480966454,
              'T': 0.12528205287777303},
             'GTTTA': {'A': 0.091531917619879888,
              'C': 0.49346528291342073,
              'G': 0.12603829567099251,
              'T': 0.28896450379570676},
             'TCGGG': {'A': 0.19019192545311459,
              'C': 0.33750142626671836,
              'G': 0.27483375392197779,
              'T': 0.19747289435818918},
             'TCGGC': {'A': 0.17239387121509667,
              'C': 0.29010311395802835,
              'G': 0.32045576577354595,
              'T': 0.21704724905332898},
             'TCGGA': {'A': 0.15834835112459245,
              'C': 0.1569275689269797,
              'G': 0.33591214204863823,
              'T': 0.34881193789978965},
             'CGACC': {'A': 0.15521050020140079,
              'C': 0.30129902771376704,
              'G': 0.31213739013935538,
              'T': 0.23135308194547691},
             'CGACA': {'A': 0.1851133405481131,
              'C': 0.19745153218753192,
              'G': 0.32373362981117454,
              'T': 0.29370149745318064},
             'CGACG': {'A': 0.020694689387240305,
              'C': 0.25061744274409642,
              'G': 0.34509005363077866,
              'T': 0.38359781423788464},
             'CTTAT': {'A': 0.21357058151703912,
              'C': 0.28554100772845054,
              'G': 0.25393767414654655,
              'T': 0.24695073660796393},
             'CGACT': {'A': 0.11637757757722032,
              'C': 0.29430803492558733,
              'G': 0.29813440150000781,
              'T': 0.29117998599718442},
             'CTTAG': {'A': 0.041262365453588301,
              'C': 0.21764521792755886,
              'G': 0.28911811816799926,
              'T': 0.45197429845085352},
             'CTTAA': {'A': 0.1950426429278003,
              'C': 0.12347166425455929,
              'G': 0.20714730686547281,
              'T': 0.47433838595216771},
             'CTTAC': {'A': 0.27720103638527721,
              'C': 0.26658020508878549,
              'G': 0.26923021245652018,
              'T': 0.18698854606941723},
             'AATTC': {'A': 0.078086943914932802,
              'C': 0.19193520352593105,
              'G': 0.3570038408117126,
              'T': 0.37297401174742351},
             'CGAGG': {'A': 0.13012971014319102,
              'C': 0.050944702202171281,
              'G': 0.46400342647603082,
              'T': 0.35492216117860687},
             'AATTA': {'A': 0.4507866109185642,
              'C': 0.090336155746275459,
              'G': 0.38529272747045412,
              'T': 0.073584505864706204},
             'GGTAT': {'A': 0.29675768528762131,
              'C': 0.562668681182244,
              'G': 0.13573473013333548,
              'T': 0.0048389033967990869},
             'AAAGT': {'A': 0.257220964709097,
              'C': 0.16666028436435973,
              'G': 0.33376384628913824,
              'T': 0.24235490463740503},
             'AAAGC': {'A': 0.22723170806856427,
              'C': 0.26816605509918112,
              'G': 0.095159939875051044,
              'T': 0.40944229695720336},
             'GGTAA': {'A': 0.3653180429578976,
              'C': 0.14940856086743787,
              'G': 0.11641607457412681,
              'T': 0.36885732160053769},
             'AAAGA': {'A': 0.1656318660973351,
              'C': 0.3108574639944659,
              'G': 0.33352061336426864,
              'T': 0.18999005654393028},
             'GGTAC': {'A': 0.44356987522986463,
              'C': 0.46245723499947039,
              'G': 0.074943302643673146,
              'T': 0.019029587126991626},
             'AAAGG': {'A': 0.30534973916300795,
              'C': 0.48410303863897902,
              'G': 0.15962247095536372,
              'T': 0.050924751242649439},
             'GGTAG': {'A': 0.23494555809558229,
              'C': 0.38050878369803365,
              'G': 0.05810937004260102,
              'T': 0.32643628816378284},
             'CGAGC': {'A': 0.27057764415299351,
              'C': 0.22779776079768094,
              'G': 0.25550500955189881,
              'T': 0.24611958549742666},
             'CTATG': {'A': 0.38053698688125381,
              'C': 0.11087383504132449,
              'G': 0.17150216736100288,
              'T': 0.33708701071641872},
             'TGCAA': {'A': 0.264392073878506,
              'C': 0.43927396489806997,
              'G': 0.26606014142158713,
              'T': 0.030273819801836757},
             'TGCAC': {'A': 0.58903423176010705,
              'C': 0.11221055916268412,
              'G': 0.069847426201546506,
              'T': 0.22890778287566235},
             'CTATC': {'A': 0.22141007245104538,
              'C': 0.22002150536052772,
              'G': 0.26864698537123216,
              'T': 0.28992143681719479},
             'GCATT': {'A': 0.042530656261315566,
              'C': 0.49464591633529087,
              'G': 0.076026603560391981,
              'T': 0.38679682384300179},
             'TGCAG': {'A': 0.23052973390646878,
              'C': 0.23618934520888743,
              'G': 0.13130992919601647,
              'T': 0.40197099168862727},
             'TAGTA': {'A': 0.30373232589809512,
              'C': 0.34298318108652326,
              'G': 0.27671092006605774,
              'T': 0.076573572949323848},
             'GCAGC': {'A': 0.3032151341129305,
              'C': 0.2388008422844746,
              'G': 0.21486197261096301,
              'T': 0.24312205099163195},
             'TAGTC': {'A': 0.054614320497648638,
              'C': 0.2744061793343277,
              'G': 0.22956279426755602,
              'T': 0.44141670590046767},
             'TAGTG': {'A': 0.019128629156465654,
              'C': 0.40029825291677457,
              'G': 0.33510956294071775,
              'T': 0.245463554986042},
             'TGGAA': {'A': 0.11137433157099128,
              'C': 0.26628320896790564,
              'G': 0.35490008236333803,
              'T': 0.26744237709776519},
             'GCATC': {'A': 0.071023268519123578,
              'C': 0.36792168232653716,
              'G': 0.37258471204076027,
              'T': 0.18847033711357902},
             'GCATA': {'A': 0.46230938841580521,
              'C': 0.061421134009911019,
              'G': 0.12646331423074242,
              'T': 0.3498061633435412},
             'TGCAT': {'A': 0.24743471779967313,
              'C': 0.043999200730839787,
              'G': 0.33412810836555223,
              'T': 0.37443797310393495},
             'TCTCC': {'A': 0.52556416203397438,
              'C': 0.29340419672794221,
              'G': 0.16254283933655292,
              'T': 0.018488801901530509},
             'AGCTA': {'A': 0.25117086644188219,
              'C': 0.055242314319752205,
              'G': 0.40147835496538081,
              'T': 0.29210846427298481},
             'TAGTT': {'A': 0.35930246296225743,
              'C': 0.15592396955865545,
              'G': 0.19775162980236699,
              'T': 0.28702193767672013},
             'CCCGT': {'A': 0.2638535022617155,
              'C': 0.41434004360343074,
              'G': 0.078546022294853135,
              'T': 0.24326043184000057},
             'AGAGG': {'A': 0.24057151402351887,
              'C': 0.19967848711523015,
              'G': 0.20385622891609551,
              'T': 0.35589376994515537},
             'AGGGT': {'A': 0.10944892961577195,
              'C': 0.37926703284292618,
              'G': 0.34270703541809922,
              'T': 0.1685770021232027},
             'AGAGA': {'A': 0.3072701798153924,
              'C': 0.39067862374502244,
              'G': 0.099062492200524183,
              'T': 0.20298870423906085},
             'AGAGC': {'A': 0.077629211127871842,
              'C': 0.011889488765327621,
              'G': 0.52714138613381734,
              'T': 0.38333991397298328},
             'AGGGG': {'A': 0.71395163289209762,
              'C': 0.1141421941517466,
              'G': 0.083855498558500621,
              'T': 0.08805067439765546},
             'AGAGT': {'A': 0.22086537556797256,
              'C': 0.26299443242455778,
              'G': 0.24080792134703652,
              'T': 0.27533227066043314},
             'CCCGG': {'A': 0.0079138001696083086,
              'C': 0.50181954190308187,
              'G': 0.37620337031220441,
              'T': 0.11406328761510542},
             'CCCGA': {'A': 0.20654485150098681,
              'C': 0.41952442175069049,
              'G': 0.20686988116972571,
              'T': 0.16706084557859699},
             'CCCGC': {'A': 0.1592192470073579,
              'C': 0.38421307587171977,
              'G': 0.3188822910965522,
              'T': 0.13768538602437014},
             'CTCCT': {'A': 0.44719864191207109,
              'C': 0.29799024889890058,
              'G': 0.1759723430060153,
              'T': 0.078838766183013068},
             'CTCCA': {'A': 0.014701058401606666,
              'C': 0.56050220480542623,
              'G': 0.38406187546736154,
              'T': 0.040734861325605463},
             'CTCCC': {'A': 0.11836836774706155,
              'C': 0.51829161162182547,
              'G': 0.11775557575132446,
              'T': 0.24558444487978853},
             'CTCCG': {'A': 0.26431948508161379,
              'C': 0.187426266253094,
              'G': 0.42614586212338057,
              'T': 0.12210838654191167},
             'TGCTC': {'A': 0.26122163997837822,
              'C': 0.08404943286337202,
              'G': 0.25090380108172261,
              'T': 0.40382512607652721},
             'CTACG': {'A': 0.24321868009676936,
              'C': 0.35835285974098757,
              'G': 0.37384759608620338,
              'T': 0.02458086407603963},
             'TGCTA': {'A': 0.00073034264729183714,
              'C': 0.36155986446799154,
              'G': 0.18227547609031663,
              'T': 0.45543431679439994},
             'TGCTG': {'A': 0.45686659223063497,
              'C': 0.1997008732869737,
              'G': 0.016570707844212915,
              'T': 0.32686182663817842},
             ...})

In [3]:
print gen_stat_seq(transition_probabilities, 1050)


GTTACCAGGGCTCTGCTCTGCGAAACACCGCGTTGTGGGTTGATTGGCCTGTCTGCGCATCGCATAGTCTTGACGCAAAAAGCCCTGCGGATCAGATGGCGGTCCCTCCCTGTGATATATTAAGCTCTCCTCCGACCCACCGGAATGGGAAAAGCACACCTTCGTCGCTGCAACTACAGCAACGATCAGAAGTCGCTAATAGGTGTACATGCGCTTCTACGGAGACGTTGATTCTAATCGTAGGCTAACACCTAGGTGATCACCGCATCGCGATCTGGCAGCCATTCCCAGGTGGAATGCCACGGCGGCGGGGGAGACAATGGGAATCAATTTAGGCGTGTCTCGTGCCCGTTGCCCGCTTGATACGCGCGGCGCCTAGGTGAATCAGTTCTCAATCGACAATCTTAAGTAGGCAATAATCCTTGACCCAGCGGCTAATTAACCGGGTCGACCCAGCCAACCCCCATGCCCAGAAACGACTCTCAATCCCTCACTCGATTGGCTGGTAGACTAAGACCCCTCAAGTGTTTTCACCATCCATGCTCGATACGGAGACGTTGGTCGGCGCCAACCGGAAGTTTCTGTGTTCTAGCTGGCCTATCTTAGTCCAAGTGTTTTCAATCTGTGGTAACGACTTCATGATCTGGGCTCATGAAACCTACAGCTTATCTGGGGTTGGAGTACCTCACTCGCGAGTGTCAGACCGGCAATATTCGCATCCGAGCTTATCGTACAGGATAACGGAGCAGTCCGGAAGAACTATTCCATTTAGATAACCGGAGGCATCTGTGATCGATCGGTGCCATACATATCATCGAAACAAAGCACTACGGAGATGGCGAGTCGTGTCGGGCGAAAGTGTCTGGGATGAGAATACTAGCTCTCCGTCTATCGGCAGGTACCGGTGGAGTGGTATTGTGGACGATACGACGGCGCCGCGTTTCCCACATTGAACTGGGGTTCTTGATTTTTGACCCAGTTTTCCTATGTATGGCTCAAAGCATGTCACGAGATGGCCGGATGCCTAAGGGTGCGAAGTTTCAACAGTAA
/opt/local/Library/Frameworks/Python.framework/Versions/2.7/lib/python2.7/site-packages/ipykernel/__main__.py:24: ComplexWarning: Casting complex values to real discards the imaginary part

In [ ]:


In [13]:
keys = transition_probabilities.keys()
k = len(keys[0]) # Markov order

In [14]:
for key in keys[1:]:
    assert len(key) == k, 'from seqs must all be same length'

In [16]:
alphabet = set()
for key in keys:
    alphabet.update(key)
alphabet = tuple(alphabet)
alphabet


Out[16]:
('A', 'C', 'T', 'G')

In [18]:
m = len(alphabet) # Number of to states
n = m**k # Number of from states
bigP = zeros((n,n))

In [19]:
P = zeros((n,m))
longalph = [''.join(s) for s in product(*[alphabet]*k)]
mapfr = dict(map(reversed, enumerate(longalph)))
mapto = dict(map(reversed, enumerate(alphabet)))
for fr in transition_probabilities:
    for to, p in transition_probabilities[fr].items():
        P[mapfr[fr],mapto[to]] = p
        bigP[mapfr[fr],mapfr[fr[1:]+to]] = p

In [20]:
v, w = eig(bigP)

In [21]:
v


Out[21]:
array([ 1.00000000+0.j        , -0.55777492+0.09459752j,
       -0.55777492-0.09459752j, ..., -0.04531047+0.j        ,
       -0.04278437+0.j        ,  0.01541106+0.j        ])

In [22]:
eig?

In [23]:
pi = real_if_close(inv(w)[v.argmax()])

In [40]:
pi


Out[40]:
array([ 0.33333333,  0.66666667])

In [39]:
pi/=pi.sum()

In [25]:
pi /= pi.sum()

In [26]:
pi = pi.astype(float)


/usr/local/lib/python2.7/dist-packages/ipykernel/__main__.py:1: ComplexWarning: Casting complex values to real discards the imaginary part
  if __name__ == '__main__':

In [27]:
assert allclose(pi.dot(bigP), pi)

In [ ]:
#assert (pi.imag == 0.).all(), max(abs(pi.imag))

result = empty(num_samples, dtype=str)
result[:k] = list(choice(longalph, p=pi)[:num_samples])

In [ ]:


In [ ]:


In [ ]:


In [ ]:


In [ ]:


In [ ]:


In [ ]:


In [ ]:


In [ ]:


In [ ]:


In [ ]:


In [ ]:


In [ ]:


In [ ]:


In [ ]:


In [ ]:


In [ ]:


In [ ]:


In [ ]:


In [ ]:


In [ ]:


In [ ]:


In [ ]:


In [45]:
?inv

In [ ]:


In [ ]:


In [ ]:


In [2]:
t = {'A': {"A": 0.4, "B": 0.6}, "B": {"A":0.3, "B":0.7}}

In [2]:
P = array([[0.4, 0.6],[0.3, 0.7]])

In [3]:
P


Out[3]:
array([[ 0.4,  0.6],
       [ 0.3,  0.7]])

In [7]:
v, w = eig(P.T)

In [8]:
pi = real_if_close(w[:,v.argmax()])

In [ ]:


In [9]:
pi /= pi.sum()
pi = pi.astype(float)

assert allclose(pi.dot(P), pi)

In [16]:
longalph = list("AB")
num_samples = 30
k = 2

In [18]:
result = empty(num_samples, dtype=str)
result[:k] = list(choice(longalph, p=pi)[:num_samples])
    
for i in range(k, num_samples):
    fr = ''.join(result[i-k:i])
    result[i] = choice(longalph, p=P)


---------------------------------------------------------------------------
NameError                                 Traceback (most recent call last)
<ipython-input-18-8512abde3669> in <module>()
      4 for i in range(k, num_samples):
      5     fr = ''.join(result[i-k:i])
----> 6     result[i] = choice(longalph, p=P[mapfr[fr]])

NameError: name 'mapfr' is not defined

In [53]:



Out[53]:
array([ 0.33333333,  0.66666667])

In [54]:
import screed

In [56]:
a = screed.open('/home/kevin/ws/gbs/gbstrim/data/EMarginata1910_10_B8_il.fastq.gz')

In [59]:
for x in a:
    r = x
    break