In [1]:
import matplotlib

import pandas as pd
%matplotlib inline

In [2]:
import aggregate_mummer_results

In [3]:
import mummer_all_bins

In [4]:
import numpy as np
import os
import sys

import glob

In [5]:
sys.path.append('./support_files/')
import summarise_bins

In [6]:
sample_path = './mummer_results/Methylophilus_methylotrophus-79_Ga0081650_to_Methylophilus_methylotrophus-55_Ga0081633.tsv'

In [7]:
result = aggregate_mummer_results.prepare_result(sample_path)

In [8]:
result.head(3)


Out[8]:
TAGS (ref) TAGS (query) LEN 1 LEN 2 LEN R LEN Q COV R COV Q % IDY mummer file ref bin query bin ref contig query contig query name query contig count query bin name ref name ref contig count ref bin name
0 Ga0081633_102 Ga0081650_106 5220 5209 214587 402304 2.43 1.29 85.32 Methylophilus_methylotrophus-79_Ga0081650_to_M... Ga0081633 Ga0081650 102 106 Methylophilus methylotrophus-79 17 Methylophilus_methylotrophus-79_Ga0081650 Methylophilus methylotrophus-55 17 Methylophilus_methylotrophus-55_Ga0081633
1 Ga0081633_102 Ga0081650_106 4945 4944 214587 402304 2.30 1.23 87.04 Methylophilus_methylotrophus-79_Ga0081650_to_M... Ga0081633 Ga0081650 102 106 Methylophilus methylotrophus-79 17 Methylophilus_methylotrophus-79_Ga0081650 Methylophilus methylotrophus-55 17 Methylophilus_methylotrophus-55_Ga0081633
2 Ga0081633_102 Ga0081650_106 2385 2380 214587 402304 1.11 0.59 82.87 Methylophilus_methylotrophus-79_Ga0081650_to_M... Ga0081633 Ga0081650 102 106 Methylophilus methylotrophus-79 17 Methylophilus_methylotrophus-79_Ga0081650 Methylophilus methylotrophus-55 17 Methylophilus_methylotrophus-55_Ga0081633

In [9]:
result.shape


Out[9]:
(435, 20)

In [10]:
result['% IDY'].plot.hist()


Out[10]:
<matplotlib.axes._subplots.AxesSubplot at 0x10bac2f28>

In [11]:
aggregate_mummer_results.plot_identity_vs_len(sample_path, save_path=None)


aggregate_mummer_results.plot_IDY_vs_len( './mummer_results/Methylophilus_methylotrophus-79_Ga0081650_to_Methylophilus_methylotrophus-55_Ga0081633.tsv')

In [12]:
#for fp in glob.glob('./mummer_results/*.tsv'):
#    aggregate_mummer_results.plot_IDY_vs_len(fp)
#glob.glob('/path/to/dir/*.csv')

In [13]:
result.head(2)


Out[13]:
TAGS (ref) TAGS (query) LEN 1 LEN 2 LEN R LEN Q COV R COV Q % IDY mummer file ref bin query bin ref contig query contig query name query contig count query bin name ref name ref contig count ref bin name
0 Ga0081633_102 Ga0081650_106 5220 5209 214587 402304 2.43 1.29 85.32 Methylophilus_methylotrophus-79_Ga0081650_to_M... Ga0081633 Ga0081650 102 106 Methylophilus methylotrophus-79 17 Methylophilus_methylotrophus-79_Ga0081650 Methylophilus methylotrophus-55 17 Methylophilus_methylotrophus-55_Ga0081633
1 Ga0081633_102 Ga0081650_106 4945 4944 214587 402304 2.30 1.23 87.04 Methylophilus_methylotrophus-79_Ga0081650_to_M... Ga0081633 Ga0081650 102 106 Methylophilus methylotrophus-79 17 Methylophilus_methylotrophus-79_Ga0081650 Methylophilus methylotrophus-55 17 Methylophilus_methylotrophus-55_Ga0081633

In [14]:
aggregate_mummer_results.percent_identity(result)


Out[14]:
86.185741442944547

In [15]:
test_samples = glob.glob('./mummer_results/*.tsv')[1:20]

i_res = aggregate_mummer_results.percent_idty_all_results(test_samples)


./mummer_results/Bacteroidetes-8_Ga0081654_to_Opitutae-129_Ga0081615.tsv has zero rows; omit it from summary
--> ./mummer_results/Methylosarcina_lacus-69_Ga0081643_to_Acidovorax-123_Ga0081609.tsv:
shape: (1, 10)
/Users/janet/sshfs/meta4_bins/janalysis/compare_fauzi_bins/aggregate_mummer_results.py:114: SettingWithCopyWarning: 
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: http://pandas.pydata.org/pandas-docs/stable/indexing.html#indexing-view-versus-copy
  summary['% identity'] = p_id
--> ./mummer_results/Methylosarcina_lacus-55_Ga0081634_to_Acidovorax-79_Ga0081651.tsv:
shape: (2, 10)
./mummer_results/Methylosarcina-21_Ga0081622_to_Bacteriovorax-49_Ga0081630.tsv has zero rows; omit it from summary
--> ./mummer_results/Methylotenera_mobilis-76-1_Ga0081647_to_Methylotenera_mobilis-63_Ga0081640.tsv:
shape: (3, 10)
--> ./mummer_results/Methylobacter-69_Ga0081641_to_Acidovorax-127_Ga0081613.tsv:
shape: (4, 10)
--> ./mummer_results/Methylophilus_methylotrophus-127-1_Ga0081611_to_Acidovorax-21_Ga0081621.tsv:
shape: (5, 10)
./mummer_results/Methylosarcina_lacus-69_Ga0081643_to_Methylophilus_methylotrophus-79_Ga0081650.tsv has zero rows; omit it from summary
./mummer_results/Bacteriovorax-49_Ga0081630_to_Burkholderiales-55_Ga0081635.tsv has zero rows; omit it from summary
./mummer_results/Methylobacte-98r_Ga0081657_to_Methylophilus_methylotrophus-127-1_Ga0081611.tsv has zero rows; omit it from summary
--> ./mummer_results/Methylophilus_methylotrophus-69_Ga0081642_to_Methylotenera_mobilis-49_Ga0081627.tsv:
shape: (6, 10)
./mummer_results/Methylosarcina-21_Ga0081622_to_Bacteriovorax-63_Ga0081639.tsv has zero rows; omit it from summary
--> ./mummer_results/Opititae-40_Ga0081625_to_Acidovorax-21_Ga0081621.tsv:
shape: (7, 10)
./mummer_results/Acidovorax-98_Ga0081659_to_Methylophilus_methylotrophus-98_Ga0081658.tsv has zero rows; omit it from summary
--> ./mummer_results/Methylobacte-98r_Ga0081657_to_Methylobacte-98r_Ga0081657.tsv:
shape: (8, 10)
./mummer_results/Methylosarcina_lacus-55_Ga0081634_to_Bacteriovorax-49_Ga0081630.tsv has zero rows; omit it from summary
./mummer_results/Bacteriovorax-21_Ga0081619_to_Bacteria-21_Ga0081620.tsv has zero rows; omit it from summary
./mummer_results/Methylobacter_tundripaludum-129_Ga0081614_to_Bacteriovora-8x_Ga0081656.tsv has zero rows; omit it from summary
--> ./mummer_results/Acidovorax-123_Ga0081609_to_Methylophilaceae-8_Ga0081655.tsv:
shape: (9, 10)
number of empty and filled files: 10, 9

In [16]:
i_res.head()


Out[16]:
mummer file ref bin query bin query name query contig count query bin name ref name ref contig count ref bin name % identity
0 Methylosarcina_lacus-69_Ga0081643_to_Acidovora... Ga0081609 Ga0081643 Methylosarcina lacus-69 217 Methylosarcina_lacus-69_Ga0081643 Acidovorax-123 18 Acidovorax-123_Ga0081609 82.767176
0 Methylosarcina_lacus-55_Ga0081634_to_Acidovora... Ga0081651 Ga0081634 Methylosarcina lacus-55 443 Methylosarcina_lacus-55_Ga0081634 Acidovorax-79 98 Acidovorax-79_Ga0081651 79.679943
0 Methylotenera_mobilis-76-1_Ga0081647_to_Methyl... Ga0081640 Ga0081647 Methylotenera mobilis-76-1 208 Methylotenera_mobilis-76-1_Ga0081647 Methylotenera mobilis-63 291 Methylotenera_mobilis-63_Ga0081640 84.924765
0 Methylobacter-69_Ga0081641_to_Acidovorax-127_G... Ga0081613 Ga0081641 Methylobacter-69 180 Methylobacter-69_Ga0081641 Acidovorax-127 60 Acidovorax-127_Ga0081613 85.230000
0 Methylophilus_methylotrophus-127-1_Ga0081611_t... Ga0081621 Ga0081611 Methylophilus methylotrophus-127-1 142 Methylophilus_methylotrophus-127-1_Ga0081611 Acidovorax-21 446 Acidovorax-21_Ga0081621 98.720000

In [17]:
i_res.shape


Out[17]:
(9, 10)

In [18]:
i_res[['% identity']]


Out[18]:
% identity
0 82.767176
0 79.679943
0 84.924765
0 85.230000
0 98.720000
0 82.977163
0 79.899179
0 100.000000
0 89.022353

In [19]:
res_piv = i_res.pivot(index='query name', columns='ref name', values='% identity')

In [20]:
res_piv.fillna(value=0, inplace = True)

In [21]:
res_piv


Out[21]:
ref name Acidovorax-123 Acidovorax-127 Acidovorax-21 Acidovorax-79 Methylobacte-98r Methylophilaceae-8 Methylotenera mobilis-49 Methylotenera mobilis-63
query name
Acidovorax-123 0.000000 0.00 0.000000 0.000000 0.0 89.022353 0.000000 0.000000
Methylobacte-98r 0.000000 0.00 0.000000 0.000000 100.0 0.000000 0.000000 0.000000
Methylobacter-69 0.000000 85.23 0.000000 0.000000 0.0 0.000000 0.000000 0.000000
Methylophilus methylotrophus-127-1 0.000000 0.00 98.720000 0.000000 0.0 0.000000 0.000000 0.000000
Methylophilus methylotrophus-69 0.000000 0.00 0.000000 0.000000 0.0 0.000000 82.977163 0.000000
Methylosarcina lacus-55 0.000000 0.00 0.000000 79.679943 0.0 0.000000 0.000000 0.000000
Methylosarcina lacus-69 82.767176 0.00 0.000000 0.000000 0.0 0.000000 0.000000 0.000000
Methylotenera mobilis-76-1 0.000000 0.00 0.000000 0.000000 0.0 0.000000 0.000000 84.924765
Opititae-40 0.000000 0.00 79.899179 0.000000 0.0 0.000000 0.000000 0.000000

In [22]:
import seaborn as sns

In [23]:
# This is just a toy for proof of principle of the pivot stuff. 
sns.heatmap(res_piv)


Out[23]:
<matplotlib.axes._subplots.AxesSubplot at 0x110acac50>

In [24]:
pid = pd.read_csv('./percent_identities.tsv', sep='\t')

In [25]:
pid.shape


Out[25]:
(1394, 11)

In [26]:
pid.head(2)


Out[26]:
Unnamed: 0 mummer file ref bin query bin query name query contig count query bin name ref name ref contig count ref bin name % identity
0 0 Rhodocyclaceae-49_Ga0081631_to_Methylophilacea... Ga0081624 Ga0081631 Rhodocyclaceae-49 190 Rhodocyclaceae-49_Ga0081631 Methylophilaceae-40 240 Methylophilaceae-40_Ga0081624 86.967273
1 0 Methylosarcina_lacus-69_Ga0081643_to_Acidovora... Ga0081609 Ga0081643 Methylosarcina lacus-69 217 Methylosarcina_lacus-69_Ga0081643 Acidovorax-123 18 Acidovorax-123_Ga0081609 82.767176

In [27]:
pid[['query name', 'ref name']].drop_duplicates().shape


Out[27]:
(1338, 2)
pid[pid[['query name', 'ref name']].duplicated() == True]['mummer file'].astype(str)

In [28]:
pd.set_option('display.height', 1000)
pd.set_option('display.max_rows', 500)
pd.set_option('display.max_columns', 500)
pd.set_option('display.width', 1000)


height has been deprecated.


In [29]:
pd.options.display.max_colwidth = 110

In [30]:
pid[pid[['query name', 'ref name']].duplicated() == True]['mummer file'].astype(str).shape


Out[30]:
(56,)

This notebook and data dir was developed before I discovered naming problems.

I am going to drop the problem name from analysis hereafter because I'm not willing to spend the time to really fix an old broken dir for a lab presentation:

drop Methylotenera mobilis-49


In [31]:
# Drop Methylotenera mobilis-49 from all the analysis. 
pid = pid[pid['query name'] != 'Methylotenera mobilis-49']
pid = pid[pid['ref name'] != 'Methylotenera mobilis-49']

In [32]:
pid[pid[['query name', 'ref name']].duplicated() == True]['mummer file'].astype(str)


Out[32]:
Series([], Name: mummer file, dtype: object)

In [33]:
# all files contain Methylotenera_mobilis-49
pid[pid[['query name', 'ref name']].duplicated() == True]['mummer file'].str.contains('Methylotenera_mobilis-49')


Out[33]:
Series([], Name: mummer file, dtype: bool)

In [34]:
res_piv = pid[['query name', 'ref name','% identity']
             ].pivot(index='query name', 
                     columns = 'ref name', values = '% identity')

In [35]:
res_piv


Out[35]:
ref name Acidovora-69x Acidovorax-123 Acidovorax-127 Acidovorax-21 Acidovorax-75 Acidovorax-79 Acidovorax-98 Bacteria-21 Bacteriovora-8x Bacteriovorax-21 Bacteriovorax-49 Bacteriovorax-63 Bacteroidetes-49 Bacteroidetes-76 Bacteroidetes-8 Burkholderiales-129 Burkholderiales-55 Burkholderiales-76 Flavobacteriaceae-49 Flavobacteriaceae-79-1 Flavobacteriaceae-79-2 Methylobacte-98r Methylobacter tundripaludum-129 Methylobacter-123 Methylobacter-69 Methylococcaceae-21 Methylococcaceae-55 Methylophilaceae-40 Methylophilaceae-49 Methylophilaceae-55 Methylophilaceae-8 Methylophilus methylotrophus-127-1 Methylophilus methylotrophus-127-2 Methylophilus methylotrophus-129-1 Methylophilus methylotrophus-129-2 Methylophilus methylotrophus-55 Methylophilus methylotrophus-69 Methylophilus methylotrophus-79 Methylophilus methylotrophus-98 Methylosarcina lacus-55 Methylosarcina lacus-69 Methylosarcina-21 Methylotenera mobilis-123 Methylotenera mobilis-63 Methylotenera mobilis-76-1 Methylotenera mobilis-76-2 Methylovulum miyakonense-55 Opititae-40 Opitutae-129 Rhodocyclaceae-127 Rhodocyclaceae-49
query name
Acidovora-69x 100.000000 83.328437 85.077685 86.034390 83.888180 82.072900 91.267779 NaN NaN NaN NaN NaN NaN NaN 81.110000 84.944395 91.314493 82.175841 NaN NaN 77.450000 88.832806 85.677666 89.849263 88.832806 NaN 81.733996 NaN 81.458739 83.740000 NaN NaN NaN NaN NaN NaN 78.980000 78.980000 78.980000 87.404236 81.589249 86.783149 NaN NaN NaN NaN 83.380000 81.770000 81.411689 82.668980 82.464425
Acidovorax-123 83.023570 100.000000 83.338216 84.081746 84.211748 81.890727 83.794635 81.380000 NaN NaN NaN NaN NaN 82.380000 83.030000 90.587023 83.524403 81.407163 NaN NaN 90.750000 NaN 85.710000 NaN NaN NaN 80.990000 100.000000 100.000000 84.897908 89.022353 80.830000 79.970000 NaN 80.660062 82.547465 NaN NaN NaN 83.135438 82.771458 79.430000 100.000000 100.000000 100.000000 100.000000 NaN 84.068616 84.658238 82.919758 88.865756
Acidovorax-127 85.313629 83.586406 100.000000 98.145849 85.024562 83.623296 86.255271 NaN NaN NaN NaN NaN NaN NaN 83.420000 84.962633 82.988562 81.301708 NaN NaN 89.380000 85.230000 84.280000 82.680000 85.230000 NaN 82.655979 100.000000 100.000000 88.470937 100.000000 79.898609 79.590000 NaN NaN 99.341447 82.781386 82.781386 85.306357 78.455007 80.225427 81.186930 100.000000 100.000000 100.000000 100.000000 NaN 81.707402 83.284458 82.379770 82.673609
Acidovorax-21 86.077996 84.089559 97.409449 100.000000 85.107015 82.990891 87.515067 NaN NaN NaN NaN NaN NaN NaN 80.730000 84.164807 83.418926 81.405300 NaN NaN NaN 85.450000 84.510000 83.330000 85.450000 80.480000 84.566304 98.780000 100.000000 81.094697 100.000000 98.720000 NaN 97.750000 NaN 98.205783 98.720000 98.720000 98.720000 84.271924 NaN NaN 97.670000 100.000000 97.730000 97.670000 NaN 79.904077 81.967189 81.715295 82.156455
Acidovorax-75 83.957796 84.180171 84.670302 85.076147 100.000000 81.389797 84.004084 NaN NaN NaN NaN NaN NaN 90.670000 87.266339 84.864060 83.025380 81.449245 NaN NaN 90.090000 83.056525 84.260000 NaN 83.056525 NaN 81.504045 100.000000 98.693595 99.569442 86.703690 79.358995 NaN 97.545031 96.200000 84.990967 96.200000 96.200000 96.200000 84.875440 NaN NaN 98.075000 98.220667 99.374750 100.000000 87.050000 81.281496 84.281402 81.976518 82.602917
Acidovorax-79 82.149704 82.313609 83.407785 82.820443 81.550192 99.973989 81.705685 NaN NaN NaN NaN NaN NaN NaN NaN 93.439842 81.797615 81.754820 NaN NaN NaN NaN NaN NaN NaN NaN 98.770000 NaN NaN NaN 82.220000 81.400000 NaN NaN 76.350000 NaN 81.640000 81.640000 81.640000 79.679943 77.599610 78.259471 NaN NaN NaN NaN NaN NaN 83.550000 81.934486 81.824032
Acidovorax-98 91.458225 83.451002 85.709540 87.666721 84.202193 81.022943 100.000000 NaN NaN NaN NaN NaN NaN NaN 83.870000 85.142119 83.108014 82.741050 NaN NaN 83.140000 83.680000 86.208012 NaN 83.680000 80.166304 83.248243 NaN NaN 82.016082 NaN 79.246559 76.750000 97.780000 NaN 82.645881 NaN NaN NaN 80.935551 81.602830 82.836172 NaN NaN 97.750000 NaN 79.480000 82.987750 83.199000 83.901157 82.232058
Bacteria-21 NaN 81.380000 NaN NaN NaN NaN NaN 100.000000 NaN NaN NaN NaN 83.600000 89.425431 NaN NaN NaN NaN 93.872911 82.441102 NaN NaN 85.018153 NaN NaN 88.806020 NaN NaN NaN NaN NaN 100.000000 96.590000 100.000000 NaN 96.590000 83.356569 83.356569 83.356569 88.171901 90.750000 NaN 97.607949 93.195404 88.492500 95.372038 NaN 83.720000 84.100000 NaN NaN
Bacteriovora-8x NaN NaN NaN NaN NaN NaN NaN NaN 100.000000 97.479819 97.467120 99.334022 NaN NaN NaN NaN NaN NaN 100.000000 NaN NaN NaN NaN NaN 95.450000 93.730000 NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN 98.268415 NaN NaN NaN NaN NaN NaN 81.470000 81.960000 NaN NaN
Bacteriovorax-21 NaN NaN NaN NaN NaN NaN NaN NaN 97.907047 100.000000 98.855536 97.152600 NaN NaN NaN NaN NaN NaN 96.772992 NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN 94.950000 NaN NaN NaN NaN NaN NaN
Bacteriovorax-49 NaN NaN NaN NaN NaN NaN NaN NaN 97.479951 98.726784 100.000000 97.219948 NaN NaN NaN NaN NaN NaN 99.521053 NaN NaN NaN NaN 100.000000 NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN
Bacteriovorax-63 NaN NaN NaN NaN NaN NaN NaN NaN 99.658703 96.825472 97.429824 100.000000 NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN
Bacteroidetes-49 NaN NaN NaN NaN NaN NaN NaN 83.610000 NaN NaN NaN NaN 100.000000 92.293639 84.378806 NaN NaN NaN 91.193132 NaN NaN NaN 82.200000 NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN 80.690000 NaN NaN
Bacteroidetes-76 NaN 82.380000 NaN NaN 90.670000 NaN NaN 89.440464 NaN NaN NaN NaN 92.232578 100.000000 81.154441 NaN NaN NaN 92.058318 NaN NaN 89.546862 92.582461 96.614802 89.546862 NaN NaN NaN 100.000000 NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN 89.600000 NaN 89.630000 NaN 97.360000 89.210000 NaN NaN
Bacteroidetes-8 81.110000 82.102500 83.420000 80.730000 87.266339 NaN 83.870000 NaN NaN NaN NaN NaN 84.378806 81.154441 100.000000 83.930000 80.070000 86.630000 NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN 95.840000 96.443756 92.180000 NaN NaN NaN NaN NaN NaN NaN 81.090000 80.400000
Burkholderiales-129 84.871755 90.435770 83.998184 84.301392 84.743663 92.856276 84.813822 NaN NaN NaN NaN NaN NaN NaN 83.930000 100.000000 91.002264 83.408268 NaN NaN NaN NaN 80.230000 NaN NaN NaN NaN 100.000000 100.000000 100.000000 100.000000 NaN NaN 98.780000 NaN 98.780000 NaN NaN NaN 80.250000 76.380000 81.450000 100.000000 94.709437 99.178770 100.000000 NaN 90.870000 84.240000 82.165193 84.719012
Burkholderiales-55 93.163155 83.109130 82.847118 83.093372 82.800071 81.674622 82.646736 NaN NaN NaN NaN NaN NaN NaN 80.070000 92.482311 100.000000 81.737998 NaN NaN 93.409281 NaN NaN 91.180000 NaN NaN 78.550000 98.780000 100.000000 84.856593 100.000000 98.720000 NaN 78.150000 81.250000 81.406757 85.785953 85.785953 85.785953 NaN 93.423043 81.760415 100.000000 100.000000 100.000000 98.810000 80.153469 80.515007 79.860203 81.602596 81.233147
Burkholderiales-76 81.883515 81.842970 81.236385 80.825661 81.313671 81.728344 83.039459 NaN NaN NaN NaN NaN NaN NaN 86.630000 83.233419 81.777475 100.000000 NaN NaN NaN NaN 82.750000 100.000000 NaN NaN NaN NaN 85.200000 100.000000 78.360000 98.680000 84.672082 NaN 84.150000 83.971582 84.358596 84.358596 84.824521 80.670000 80.482948 81.020000 88.237821 83.970000 89.740000 85.087460 87.550000 83.540000 80.440000 83.931425 84.208016
Flavobacteriaceae-49 NaN NaN NaN NaN NaN NaN NaN 93.433932 100.000000 96.771398 NaN NaN 87.905168 90.800000 NaN NaN NaN NaN 100.000000 83.077946 82.755834 89.250567 92.381319 91.849117 89.432461 NaN NaN NaN NaN NaN NaN 100.000000 97.620000 100.000000 NaN 97.620000 97.620000 97.620000 97.620000 NaN NaN NaN NaN 99.247807 98.810000 99.279765 NaN NaN NaN NaN NaN
Flavobacteriaceae-79-1 NaN NaN NaN NaN NaN NaN NaN 82.441102 NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN 83.137950 100.000000 83.545606 NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN
Flavobacteriaceae-79-2 77.450000 90.750000 89.380000 NaN 90.090000 NaN 83.140000 NaN NaN NaN NaN NaN NaN NaN NaN NaN 93.409281 NaN 82.873189 83.596284 100.000000 NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN
Methylobacte-98r 88.832806 NaN 85.230000 85.450000 83.056525 NaN 83.680000 NaN NaN NaN NaN NaN NaN 89.546099 NaN NaN NaN NaN 89.262523 NaN NaN 100.000000 87.741498 86.554693 99.889289 82.979476 81.946986 90.120000 80.960000 82.802397 78.860000 NaN NaN 77.420000 NaN 77.840000 NaN NaN NaN 83.266225 94.421634 82.527462 NaN 86.246462 NaN 97.663435 82.493587 NaN NaN 81.970000 82.061192
Methylobacter tundripaludum-129 85.677666 85.710000 84.280000 84.510000 84.260000 NaN 86.208012 85.025386 NaN NaN NaN NaN 82.200000 92.706619 NaN 80.290000 NaN 82.750000 92.551287 NaN NaN 87.812064 100.000000 90.536830 87.722928 82.610635 82.907775 79.880000 79.980000 84.617882 NaN NaN 79.880550 NaN NaN 77.070000 83.700000 83.700000 83.700000 83.256190 83.954871 82.377805 NaN 92.018998 NaN 79.790000 82.900013 88.550000 88.550000 88.804742 94.493634
Methylobacter-123 89.853726 NaN 82.680000 83.330000 NaN NaN NaN NaN NaN NaN 100.000000 NaN NaN 95.649187 NaN NaN 91.180000 100.000000 91.811635 NaN NaN 86.690404 90.293804 99.973064 86.802022 83.208558 82.319340 79.613749 78.520000 NaN 80.840000 NaN 78.930000 80.210000 NaN 80.800000 NaN NaN NaN 82.439871 83.533403 82.326017 NaN 93.618504 NaN 80.385293 82.274031 92.470000 89.800000 82.064968 89.897605
Methylobacter-69 88.832806 NaN 85.230000 85.450000 83.056525 NaN 83.680000 NaN 95.450000 NaN NaN NaN NaN 89.546099 NaN NaN NaN NaN 89.531728 NaN NaN 99.857355 87.694332 86.828878 100.000000 86.700431 81.841131 90.120000 80.960000 82.802397 78.860000 NaN NaN 77.420000 NaN 77.840000 NaN NaN NaN 85.604385 83.895302 83.115893 NaN 87.826583 NaN 97.663435 82.521064 NaN NaN 81.970000 82.061192
Methylococcaceae-21 NaN NaN NaN 80.480000 NaN NaN 80.166304 90.124093 93.730000 NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN 82.952369 82.910356 83.179029 85.898357 99.974296 82.573427 93.964521 NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN 92.222068 88.146393 87.540876 NaN 81.980000 NaN 81.170000 82.850358 NaN NaN 84.850000 NaN
Methylococcaceae-55 81.733996 80.990000 84.696913 84.375016 80.899708 98.770000 83.248243 NaN NaN NaN NaN NaN NaN NaN NaN NaN 78.550000 NaN NaN NaN NaN 81.939754 82.756194 82.181031 81.920668 82.109806 100.000000 NaN NaN 82.870000 NaN NaN NaN NaN NaN NaN NaN NaN NaN 83.562238 83.428476 82.623003 82.490000 NaN NaN 84.910000 82.234361 NaN NaN 81.369770 83.720157
Methylophilaceae-40 NaN 100.000000 100.000000 98.780000 100.000000 NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN 100.000000 NaN NaN NaN NaN NaN 90.120000 79.880000 79.613749 90.120000 94.983217 NaN 100.000000 98.510703 82.835943 83.669864 82.314735 81.411288 83.238935 82.489604 82.198023 82.630142 82.579826 82.461706 NaN NaN NaN 87.264718 85.556770 83.595626 92.667869 NaN NaN NaN NaN 86.916540
Methylophilaceae-49 81.458739 100.000000 100.000000 100.000000 98.693595 NaN NaN NaN NaN NaN NaN NaN NaN 100.000000 NaN 100.000000 100.000000 85.200000 NaN NaN NaN 80.960000 79.980000 78.520000 80.960000 NaN NaN 98.423570 100.000000 83.038144 83.691924 82.115909 82.118426 82.516676 81.748504 82.561834 83.092798 83.013736 83.276154 NaN NaN NaN 85.437169 85.221087 84.684718 90.378949 NaN NaN NaN NaN 100.000000
Methylophilaceae-55 83.740000 85.926757 89.778546 84.205696 99.060820 NaN 82.016082 NaN NaN NaN NaN NaN NaN NaN NaN 100.000000 86.880972 100.000000 NaN NaN NaN 82.802397 84.617967 NaN 82.802397 NaN 82.870000 82.279460 82.738049 100.000000 80.780335 81.629387 81.717684 81.668607 82.159731 82.017085 81.465462 81.465462 81.349942 NaN NaN NaN 81.871703 82.374724 81.655419 83.131497 83.566895 NaN NaN 82.001662 80.397762
Methylophilaceae-8 NaN 89.022353 100.000000 100.000000 86.703690 82.220000 NaN NaN NaN NaN NaN NaN NaN NaN NaN 100.000000 100.000000 78.360000 NaN NaN NaN 78.860000 NaN 80.840000 78.860000 NaN NaN 83.741882 83.773353 81.608725 99.955475 81.932531 81.903661 81.878000 82.392891 81.705134 81.619697 81.685157 81.472307 NaN NaN NaN 83.412075 83.834830 82.677163 83.189389 NaN NaN NaN NaN 81.012474
Methylophilus methylotrophus-127-1 NaN 80.904543 79.898609 98.720000 79.358995 81.400000 79.246559 100.000000 NaN NaN NaN NaN NaN NaN NaN NaN NaN 98.680000 100.000000 NaN NaN NaN NaN NaN NaN NaN NaN 82.960385 82.813153 81.950940 81.446827 100.000000 87.717969 85.929868 88.245953 86.152003 88.318596 88.330908 88.302099 NaN NaN NaN 84.903939 83.279354 81.735611 83.464099 NaN NaN NaN NaN NaN
Methylophilus methylotrophus-127-2 NaN 79.970000 79.590000 NaN NaN NaN 76.750000 96.590000 NaN NaN NaN NaN NaN NaN NaN NaN NaN 84.672082 97.620000 NaN NaN NaN 79.880550 78.930000 NaN NaN NaN 81.669261 81.840084 81.847112 81.921319 87.718999 99.965137 85.997466 96.445264 86.021259 96.717549 96.705940 96.767421 NaN NaN NaN 83.215866 83.116388 81.657024 86.683028 NaN NaN NaN 77.250000 78.730000
Methylophilus methylotrophus-129-1 79.750000 NaN NaN 97.750000 97.545031 NaN 97.780000 100.000000 NaN NaN NaN NaN NaN NaN NaN 98.780000 78.150000 NaN 100.000000 NaN NaN 77.420000 NaN 80.210000 77.420000 NaN NaN 83.015053 82.682160 82.055272 82.108566 85.901044 86.033003 99.970288 85.568169 97.415019 86.786027 86.758993 86.855039 NaN NaN NaN 81.722423 83.856524 82.085849 81.978257 NaN NaN NaN 80.750000 81.104419
Methylophilus methylotrophus-129-2 NaN 80.661320 NaN NaN 96.200000 70.040000 NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN 81.250000 84.150000 NaN NaN NaN NaN NaN NaN NaN NaN NaN 82.734257 81.905186 82.534101 82.164513 87.847511 96.562451 85.616077 100.000000 85.930658 96.712763 96.758635 96.713228 NaN NaN NaN 83.049557 83.489159 82.059552 83.947561 80.730000 NaN NaN 77.250000 NaN
Methylophilus methylotrophus-55 NaN 82.547465 99.341447 98.203054 84.990967 NaN 82.663876 96.590000 NaN NaN NaN NaN NaN NaN NaN 98.780000 79.646089 83.971582 97.620000 NaN NaN 77.840000 77.070000 80.800000 77.840000 NaN NaN 81.052955 82.489333 81.993368 81.738989 86.147665 88.935919 97.743152 85.578708 100.000000 86.206858 86.113493 86.236857 NaN NaN NaN 83.038778 82.762869 82.357786 82.173660 NaN NaN NaN NaN 76.710000
Methylophilus methylotrophus-69 78.980000 NaN 82.781386 98.720000 96.200000 81.640000 NaN 83.356569 NaN NaN NaN NaN NaN NaN NaN NaN 81.950000 84.358596 97.620000 NaN NaN NaN 83.700000 NaN NaN NaN NaN 82.669231 82.866785 81.677167 81.586681 88.026944 97.032423 88.037293 96.839145 86.071842 100.000000 99.996689 99.996147 NaN NaN NaN 83.607161 83.731750 82.982759 83.225143 NaN NaN NaN 79.940000 83.500000
Methylophilus methylotrophus-79 78.980000 NaN 82.781386 98.720000 96.200000 81.640000 NaN 83.356569 NaN NaN NaN NaN NaN NaN NaN NaN 81.950000 84.358596 97.620000 NaN NaN NaN 83.700000 NaN NaN NaN NaN 82.094329 82.942920 81.447678 81.576208 87.956002 97.122660 89.163687 96.868590 86.185741 99.996734 100.000000 99.997006 NaN NaN NaN 83.208480 83.806234 83.328907 82.695885 NaN NaN NaN 79.940000 83.500000
Methylophilus methylotrophus-98 78.980000 NaN 85.306357 98.720000 96.200000 81.640000 NaN 83.356569 NaN NaN NaN NaN NaN NaN NaN NaN 81.950000 84.824521 97.620000 NaN NaN NaN 83.700000 NaN NaN NaN NaN 82.243590 82.933072 81.593895 81.531631 88.164709 96.931506 88.166112 96.766992 86.074155 99.999136 99.994778 100.000000 NaN NaN NaN 83.514490 83.731750 83.069388 83.270608 NaN NaN NaN 79.940000 NaN
Methylosarcina lacus-55 86.739976 82.358251 78.453731 79.560000 84.864459 79.679943 80.923205 88.171901 NaN NaN NaN NaN NaN NaN 95.840000 80.210000 NaN 80.670000 NaN NaN NaN 83.436108 83.432921 82.224119 85.605918 92.101954 83.315050 NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN 100.000000 98.266661 89.025048 NaN NaN 80.350000 NaN 82.813991 NaN NaN 79.830195 81.070324
Methylosarcina lacus-69 81.589249 82.767176 80.153520 79.560000 NaN 77.599861 81.600840 90.589718 96.832229 NaN NaN NaN NaN NaN 96.443756 76.380000 93.420718 80.066795 NaN NaN NaN 93.840515 83.640512 83.167218 84.123121 88.338977 82.962860 NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN 98.573418 100.000000 89.678676 NaN NaN NaN NaN 87.975756 NaN 73.380000 80.664012 81.655762
Methylosarcina-21 86.783149 79.532395 81.170724 NaN NaN 78.972461 82.826173 NaN NaN NaN NaN NaN NaN NaN 92.180000 81.450000 81.762647 79.694000 NaN NaN NaN 82.120297 82.321161 82.185569 82.561668 87.854740 82.707521 NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN 90.058056 90.445605 99.957843 NaN NaN NaN NaN 85.736886 NaN NaN 81.744985 82.929324
Methylotenera mobilis-123 NaN 100.000000 100.000000 98.785506 98.711159 NaN NaN 97.607949 NaN NaN NaN NaN NaN NaN NaN 100.000000 100.000000 88.237821 NaN NaN NaN NaN NaN NaN NaN NaN 82.490000 87.328452 85.759153 82.541069 83.807251 84.503198 83.113396 82.349795 83.555039 83.460925 84.161370 84.102780 84.108076 NaN NaN NaN 100.000000 98.306833 84.942398 98.991738 NaN NaN NaN NaN 100.000000
Methylotenera mobilis-63 NaN 100.000000 100.000000 100.000000 98.220667 NaN NaN 93.256871 NaN NaN NaN NaN NaN 89.600000 NaN 94.709437 NaN 83.970000 99.154501 NaN NaN 86.551627 92.009169 94.378501 87.634607 81.980000 NaN 85.778706 85.752132 83.758479 84.043537 83.434911 83.118032 83.655519 83.546859 83.256365 84.437895 84.437895 84.437895 NaN NaN NaN 98.349528 100.000000 85.158420 97.872774 NaN NaN NaN NaN 100.000000
Methylotenera mobilis-76-1 NaN 100.000000 100.000000 98.048984 99.577890 NaN 97.750000 87.639044 NaN 94.950000 NaN NaN NaN NaN NaN 99.178770 100.000000 89.740000 98.810000 NaN NaN NaN NaN NaN NaN NaN NaN 83.396098 84.567916 82.719398 82.670608 81.981304 81.823443 82.648932 82.345059 83.152087 83.388920 83.311364 83.495471 80.350000 NaN NaN 84.842097 84.924765 99.948403 84.149272 NaN NaN NaN NaN 100.000000
Methylotenera mobilis-76-2 NaN 100.000000 100.000000 98.224970 100.000000 NaN NaN 95.795254 NaN NaN NaN NaN NaN 89.630000 NaN 100.000000 100.000000 85.088969 99.283075 NaN NaN 97.007179 79.790000 81.111704 97.007179 81.170000 84.910000 91.915209 90.166668 86.124040 83.046121 85.599242 87.455131 83.605088 84.927509 83.979256 84.987476 84.856474 85.071927 NaN NaN NaN 98.834717 97.606696 84.334533 100.000000 NaN NaN NaN NaN 100.000000
Methylovulum miyakonense-55 83.290000 NaN NaN NaN 87.050000 NaN 79.480000 NaN NaN NaN NaN NaN NaN NaN NaN NaN 80.153469 NaN NaN NaN NaN 82.555510 82.502375 82.443947 82.553988 83.466936 82.540211 NaN NaN 82.451323 NaN NaN NaN NaN 80.730000 NaN NaN NaN NaN 82.933111 87.651976 86.164601 NaN NaN NaN NaN 100.000000 NaN NaN 82.180000 83.570000
Opititae-40 81.770000 84.068616 80.549123 79.899179 81.281496 NaN 82.987750 83.720000 81.470000 NaN NaN NaN NaN 97.360000 NaN 90.870000 80.466054 83.540000 NaN NaN NaN NaN 88.550000 92.470000 NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN 100.000000 86.227444 89.817096 91.840710
Opitutae-129 81.792944 84.704145 83.009060 81.974071 84.281532 83.550000 83.243267 84.100000 81.960000 NaN NaN NaN 80.690000 89.210000 NaN 84.240000 80.604465 80.440000 NaN NaN NaN NaN 88.550000 89.800000 NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN 73.380000 NaN NaN NaN NaN NaN NaN 85.565404 100.000000 83.267519 82.121907
Rhodocyclaceae-127 82.471391 82.530770 82.406036 81.477145 82.158156 81.785421 83.683718 NaN NaN NaN NaN NaN NaN NaN 81.060000 82.067306 82.203936 84.186436 NaN NaN NaN 81.970000 88.804742 82.064968 81.970000 84.850000 81.373840 NaN NaN 81.407743 NaN NaN 77.250000 80.750000 77.250000 NaN 79.940000 79.940000 79.940000 79.830195 80.664012 81.831328 NaN NaN NaN NaN 82.180000 91.675489 83.271262 100.000000 95.838851
Rhodocyclaceae-49 82.384567 86.482835 82.154758 82.097128 82.563162 81.746011 82.251697 NaN NaN NaN NaN NaN NaN NaN 80.360000 85.686095 81.611996 84.710942 NaN NaN NaN 82.048177 94.497748 89.894862 82.048177 NaN 83.719765 86.967273 100.000000 80.427798 81.012474 NaN 78.730000 81.104419 NaN 76.710000 83.500000 83.500000 NaN 81.070324 81.655182 82.926655 NaN 100.000000 NaN 100.000000 83.570000 92.574368 82.735197 95.854762 100.000000

In [36]:
p = sns.heatmap(res_piv)



In [37]:
p.figure.set_size_inches(15, 15)

In [38]:
p.figure.tight_layout()

In [39]:
p.figure.savefig("160528_fauzi_bin_ANIs.pdf")

In [ ]: