In [1]:
import matplotlib
import pandas as pd
%matplotlib inline
In [2]:
import aggregate_mummer_results
In [3]:
import mummer_all_bins
In [4]:
import numpy as np
import os
import sys
import glob
In [5]:
sys.path.append('./support_files/')
import summarise_bins
In [6]:
sample_path = './mummer_results/Methylophilus_methylotrophus-79_Ga0081650_to_Methylophilus_methylotrophus-55_Ga0081633.tsv'
In [7]:
result = aggregate_mummer_results.prepare_result(sample_path)
In [8]:
result.head(3)
Out[8]:
TAGS (ref)
TAGS (query)
LEN 1
LEN 2
LEN R
LEN Q
COV R
COV Q
% IDY
mummer file
ref bin
query bin
ref contig
query contig
query name
query contig count
query bin name
ref name
ref contig count
ref bin name
0
Ga0081633_102
Ga0081650_106
5220
5209
214587
402304
2.43
1.29
85.32
Methylophilus_methylotrophus-79_Ga0081650_to_M...
Ga0081633
Ga0081650
102
106
Methylophilus methylotrophus-79
17
Methylophilus_methylotrophus-79_Ga0081650
Methylophilus methylotrophus-55
17
Methylophilus_methylotrophus-55_Ga0081633
1
Ga0081633_102
Ga0081650_106
4945
4944
214587
402304
2.30
1.23
87.04
Methylophilus_methylotrophus-79_Ga0081650_to_M...
Ga0081633
Ga0081650
102
106
Methylophilus methylotrophus-79
17
Methylophilus_methylotrophus-79_Ga0081650
Methylophilus methylotrophus-55
17
Methylophilus_methylotrophus-55_Ga0081633
2
Ga0081633_102
Ga0081650_106
2385
2380
214587
402304
1.11
0.59
82.87
Methylophilus_methylotrophus-79_Ga0081650_to_M...
Ga0081633
Ga0081650
102
106
Methylophilus methylotrophus-79
17
Methylophilus_methylotrophus-79_Ga0081650
Methylophilus methylotrophus-55
17
Methylophilus_methylotrophus-55_Ga0081633
In [9]:
result.shape
Out[9]:
(435, 20)
In [10]:
result['% IDY'].plot.hist()
Out[10]:
<matplotlib.axes._subplots.AxesSubplot at 0x10bac2f28>
In [11]:
aggregate_mummer_results.plot_identity_vs_len(sample_path, save_path=None)
In [12]:
#for fp in glob.glob('./mummer_results/*.tsv'):
# aggregate_mummer_results.plot_IDY_vs_len(fp)
#glob.glob('/path/to/dir/*.csv')
In [13]:
result.head(2)
Out[13]:
TAGS (ref)
TAGS (query)
LEN 1
LEN 2
LEN R
LEN Q
COV R
COV Q
% IDY
mummer file
ref bin
query bin
ref contig
query contig
query name
query contig count
query bin name
ref name
ref contig count
ref bin name
0
Ga0081633_102
Ga0081650_106
5220
5209
214587
402304
2.43
1.29
85.32
Methylophilus_methylotrophus-79_Ga0081650_to_M...
Ga0081633
Ga0081650
102
106
Methylophilus methylotrophus-79
17
Methylophilus_methylotrophus-79_Ga0081650
Methylophilus methylotrophus-55
17
Methylophilus_methylotrophus-55_Ga0081633
1
Ga0081633_102
Ga0081650_106
4945
4944
214587
402304
2.30
1.23
87.04
Methylophilus_methylotrophus-79_Ga0081650_to_M...
Ga0081633
Ga0081650
102
106
Methylophilus methylotrophus-79
17
Methylophilus_methylotrophus-79_Ga0081650
Methylophilus methylotrophus-55
17
Methylophilus_methylotrophus-55_Ga0081633
In [14]:
aggregate_mummer_results.percent_identity(result)
Out[14]:
86.185741442944547
In [15]:
test_samples = glob.glob('./mummer_results/*.tsv')[1:20]
i_res = aggregate_mummer_results.percent_idty_all_results(test_samples)
./mummer_results/Bacteroidetes-8_Ga0081654_to_Opitutae-129_Ga0081615.tsv has zero rows; omit it from summary
--> ./mummer_results/Methylosarcina_lacus-69_Ga0081643_to_Acidovorax-123_Ga0081609.tsv:
shape: (1, 10)
/Users/janet/sshfs/meta4_bins/janalysis/compare_fauzi_bins/aggregate_mummer_results.py:114: SettingWithCopyWarning:
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead
See the caveats in the documentation: http://pandas.pydata.org/pandas-docs/stable/indexing.html#indexing-view-versus-copy
summary['% identity'] = p_id
--> ./mummer_results/Methylosarcina_lacus-55_Ga0081634_to_Acidovorax-79_Ga0081651.tsv:
shape: (2, 10)
./mummer_results/Methylosarcina-21_Ga0081622_to_Bacteriovorax-49_Ga0081630.tsv has zero rows; omit it from summary
--> ./mummer_results/Methylotenera_mobilis-76-1_Ga0081647_to_Methylotenera_mobilis-63_Ga0081640.tsv:
shape: (3, 10)
--> ./mummer_results/Methylobacter-69_Ga0081641_to_Acidovorax-127_Ga0081613.tsv:
shape: (4, 10)
--> ./mummer_results/Methylophilus_methylotrophus-127-1_Ga0081611_to_Acidovorax-21_Ga0081621.tsv:
shape: (5, 10)
./mummer_results/Methylosarcina_lacus-69_Ga0081643_to_Methylophilus_methylotrophus-79_Ga0081650.tsv has zero rows; omit it from summary
./mummer_results/Bacteriovorax-49_Ga0081630_to_Burkholderiales-55_Ga0081635.tsv has zero rows; omit it from summary
./mummer_results/Methylobacte-98r_Ga0081657_to_Methylophilus_methylotrophus-127-1_Ga0081611.tsv has zero rows; omit it from summary
--> ./mummer_results/Methylophilus_methylotrophus-69_Ga0081642_to_Methylotenera_mobilis-49_Ga0081627.tsv:
shape: (6, 10)
./mummer_results/Methylosarcina-21_Ga0081622_to_Bacteriovorax-63_Ga0081639.tsv has zero rows; omit it from summary
--> ./mummer_results/Opititae-40_Ga0081625_to_Acidovorax-21_Ga0081621.tsv:
shape: (7, 10)
./mummer_results/Acidovorax-98_Ga0081659_to_Methylophilus_methylotrophus-98_Ga0081658.tsv has zero rows; omit it from summary
--> ./mummer_results/Methylobacte-98r_Ga0081657_to_Methylobacte-98r_Ga0081657.tsv:
shape: (8, 10)
./mummer_results/Methylosarcina_lacus-55_Ga0081634_to_Bacteriovorax-49_Ga0081630.tsv has zero rows; omit it from summary
./mummer_results/Bacteriovorax-21_Ga0081619_to_Bacteria-21_Ga0081620.tsv has zero rows; omit it from summary
./mummer_results/Methylobacter_tundripaludum-129_Ga0081614_to_Bacteriovora-8x_Ga0081656.tsv has zero rows; omit it from summary
--> ./mummer_results/Acidovorax-123_Ga0081609_to_Methylophilaceae-8_Ga0081655.tsv:
shape: (9, 10)
number of empty and filled files: 10, 9
In [16]:
i_res.head()
Out[16]:
mummer file
ref bin
query bin
query name
query contig count
query bin name
ref name
ref contig count
ref bin name
% identity
0
Methylosarcina_lacus-69_Ga0081643_to_Acidovora...
Ga0081609
Ga0081643
Methylosarcina lacus-69
217
Methylosarcina_lacus-69_Ga0081643
Acidovorax-123
18
Acidovorax-123_Ga0081609
82.767176
0
Methylosarcina_lacus-55_Ga0081634_to_Acidovora...
Ga0081651
Ga0081634
Methylosarcina lacus-55
443
Methylosarcina_lacus-55_Ga0081634
Acidovorax-79
98
Acidovorax-79_Ga0081651
79.679943
0
Methylotenera_mobilis-76-1_Ga0081647_to_Methyl...
Ga0081640
Ga0081647
Methylotenera mobilis-76-1
208
Methylotenera_mobilis-76-1_Ga0081647
Methylotenera mobilis-63
291
Methylotenera_mobilis-63_Ga0081640
84.924765
0
Methylobacter-69_Ga0081641_to_Acidovorax-127_G...
Ga0081613
Ga0081641
Methylobacter-69
180
Methylobacter-69_Ga0081641
Acidovorax-127
60
Acidovorax-127_Ga0081613
85.230000
0
Methylophilus_methylotrophus-127-1_Ga0081611_t...
Ga0081621
Ga0081611
Methylophilus methylotrophus-127-1
142
Methylophilus_methylotrophus-127-1_Ga0081611
Acidovorax-21
446
Acidovorax-21_Ga0081621
98.720000
In [17]:
i_res.shape
Out[17]:
(9, 10)
In [18]:
i_res[['% identity']]
Out[18]:
% identity
0
82.767176
0
79.679943
0
84.924765
0
85.230000
0
98.720000
0
82.977163
0
79.899179
0
100.000000
0
89.022353
In [19]:
res_piv = i_res.pivot(index='query name', columns='ref name', values='% identity')
In [20]:
res_piv.fillna(value=0, inplace = True)
In [21]:
res_piv
Out[21]:
ref name
Acidovorax-123
Acidovorax-127
Acidovorax-21
Acidovorax-79
Methylobacte-98r
Methylophilaceae-8
Methylotenera mobilis-49
Methylotenera mobilis-63
query name
Acidovorax-123
0.000000
0.00
0.000000
0.000000
0.0
89.022353
0.000000
0.000000
Methylobacte-98r
0.000000
0.00
0.000000
0.000000
100.0
0.000000
0.000000
0.000000
Methylobacter-69
0.000000
85.23
0.000000
0.000000
0.0
0.000000
0.000000
0.000000
Methylophilus methylotrophus-127-1
0.000000
0.00
98.720000
0.000000
0.0
0.000000
0.000000
0.000000
Methylophilus methylotrophus-69
0.000000
0.00
0.000000
0.000000
0.0
0.000000
82.977163
0.000000
Methylosarcina lacus-55
0.000000
0.00
0.000000
79.679943
0.0
0.000000
0.000000
0.000000
Methylosarcina lacus-69
82.767176
0.00
0.000000
0.000000
0.0
0.000000
0.000000
0.000000
Methylotenera mobilis-76-1
0.000000
0.00
0.000000
0.000000
0.0
0.000000
0.000000
84.924765
Opititae-40
0.000000
0.00
79.899179
0.000000
0.0
0.000000
0.000000
0.000000
In [22]:
import seaborn as sns
In [23]:
# This is just a toy for proof of principle of the pivot stuff.
sns.heatmap(res_piv)
Out[23]:
<matplotlib.axes._subplots.AxesSubplot at 0x110acac50>
In [24]:
pid = pd.read_csv('./percent_identities.tsv', sep='\t')
In [25]:
pid.shape
Out[25]:
(1394, 11)
In [26]:
pid.head(2)
Out[26]:
Unnamed: 0
mummer file
ref bin
query bin
query name
query contig count
query bin name
ref name
ref contig count
ref bin name
% identity
0
0
Rhodocyclaceae-49_Ga0081631_to_Methylophilacea...
Ga0081624
Ga0081631
Rhodocyclaceae-49
190
Rhodocyclaceae-49_Ga0081631
Methylophilaceae-40
240
Methylophilaceae-40_Ga0081624
86.967273
1
0
Methylosarcina_lacus-69_Ga0081643_to_Acidovora...
Ga0081609
Ga0081643
Methylosarcina lacus-69
217
Methylosarcina_lacus-69_Ga0081643
Acidovorax-123
18
Acidovorax-123_Ga0081609
82.767176
In [27]:
pid[['query name', 'ref name']].drop_duplicates().shape
Out[27]:
(1338, 2)
In [28]:
pd.set_option('display.height', 1000)
pd.set_option('display.max_rows', 500)
pd.set_option('display.max_columns', 500)
pd.set_option('display.width', 1000)
height has been deprecated.
In [29]:
pd.options.display.max_colwidth = 110
In [30]:
pid[pid[['query name', 'ref name']].duplicated() == True]['mummer file'].astype(str).shape
Out[30]:
(56,)
In [31]:
# Drop Methylotenera mobilis-49 from all the analysis.
pid = pid[pid['query name'] != 'Methylotenera mobilis-49']
pid = pid[pid['ref name'] != 'Methylotenera mobilis-49']
In [32]:
pid[pid[['query name', 'ref name']].duplicated() == True]['mummer file'].astype(str)
Out[32]:
Series([], Name: mummer file, dtype: object)
In [33]:
# all files contain Methylotenera_mobilis-49
pid[pid[['query name', 'ref name']].duplicated() == True]['mummer file'].str.contains('Methylotenera_mobilis-49')
Out[33]:
Series([], Name: mummer file, dtype: bool)
In [34]:
res_piv = pid[['query name', 'ref name','% identity']
].pivot(index='query name',
columns = 'ref name', values = '% identity')
In [35]:
res_piv
Out[35]:
ref name
Acidovora-69x
Acidovorax-123
Acidovorax-127
Acidovorax-21
Acidovorax-75
Acidovorax-79
Acidovorax-98
Bacteria-21
Bacteriovora-8x
Bacteriovorax-21
Bacteriovorax-49
Bacteriovorax-63
Bacteroidetes-49
Bacteroidetes-76
Bacteroidetes-8
Burkholderiales-129
Burkholderiales-55
Burkholderiales-76
Flavobacteriaceae-49
Flavobacteriaceae-79-1
Flavobacteriaceae-79-2
Methylobacte-98r
Methylobacter tundripaludum-129
Methylobacter-123
Methylobacter-69
Methylococcaceae-21
Methylococcaceae-55
Methylophilaceae-40
Methylophilaceae-49
Methylophilaceae-55
Methylophilaceae-8
Methylophilus methylotrophus-127-1
Methylophilus methylotrophus-127-2
Methylophilus methylotrophus-129-1
Methylophilus methylotrophus-129-2
Methylophilus methylotrophus-55
Methylophilus methylotrophus-69
Methylophilus methylotrophus-79
Methylophilus methylotrophus-98
Methylosarcina lacus-55
Methylosarcina lacus-69
Methylosarcina-21
Methylotenera mobilis-123
Methylotenera mobilis-63
Methylotenera mobilis-76-1
Methylotenera mobilis-76-2
Methylovulum miyakonense-55
Opititae-40
Opitutae-129
Rhodocyclaceae-127
Rhodocyclaceae-49
query name
Acidovora-69x
100.000000
83.328437
85.077685
86.034390
83.888180
82.072900
91.267779
NaN
NaN
NaN
NaN
NaN
NaN
NaN
81.110000
84.944395
91.314493
82.175841
NaN
NaN
77.450000
88.832806
85.677666
89.849263
88.832806
NaN
81.733996
NaN
81.458739
83.740000
NaN
NaN
NaN
NaN
NaN
NaN
78.980000
78.980000
78.980000
87.404236
81.589249
86.783149
NaN
NaN
NaN
NaN
83.380000
81.770000
81.411689
82.668980
82.464425
Acidovorax-123
83.023570
100.000000
83.338216
84.081746
84.211748
81.890727
83.794635
81.380000
NaN
NaN
NaN
NaN
NaN
82.380000
83.030000
90.587023
83.524403
81.407163
NaN
NaN
90.750000
NaN
85.710000
NaN
NaN
NaN
80.990000
100.000000
100.000000
84.897908
89.022353
80.830000
79.970000
NaN
80.660062
82.547465
NaN
NaN
NaN
83.135438
82.771458
79.430000
100.000000
100.000000
100.000000
100.000000
NaN
84.068616
84.658238
82.919758
88.865756
Acidovorax-127
85.313629
83.586406
100.000000
98.145849
85.024562
83.623296
86.255271
NaN
NaN
NaN
NaN
NaN
NaN
NaN
83.420000
84.962633
82.988562
81.301708
NaN
NaN
89.380000
85.230000
84.280000
82.680000
85.230000
NaN
82.655979
100.000000
100.000000
88.470937
100.000000
79.898609
79.590000
NaN
NaN
99.341447
82.781386
82.781386
85.306357
78.455007
80.225427
81.186930
100.000000
100.000000
100.000000
100.000000
NaN
81.707402
83.284458
82.379770
82.673609
Acidovorax-21
86.077996
84.089559
97.409449
100.000000
85.107015
82.990891
87.515067
NaN
NaN
NaN
NaN
NaN
NaN
NaN
80.730000
84.164807
83.418926
81.405300
NaN
NaN
NaN
85.450000
84.510000
83.330000
85.450000
80.480000
84.566304
98.780000
100.000000
81.094697
100.000000
98.720000
NaN
97.750000
NaN
98.205783
98.720000
98.720000
98.720000
84.271924
NaN
NaN
97.670000
100.000000
97.730000
97.670000
NaN
79.904077
81.967189
81.715295
82.156455
Acidovorax-75
83.957796
84.180171
84.670302
85.076147
100.000000
81.389797
84.004084
NaN
NaN
NaN
NaN
NaN
NaN
90.670000
87.266339
84.864060
83.025380
81.449245
NaN
NaN
90.090000
83.056525
84.260000
NaN
83.056525
NaN
81.504045
100.000000
98.693595
99.569442
86.703690
79.358995
NaN
97.545031
96.200000
84.990967
96.200000
96.200000
96.200000
84.875440
NaN
NaN
98.075000
98.220667
99.374750
100.000000
87.050000
81.281496
84.281402
81.976518
82.602917
Acidovorax-79
82.149704
82.313609
83.407785
82.820443
81.550192
99.973989
81.705685
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
93.439842
81.797615
81.754820
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
98.770000
NaN
NaN
NaN
82.220000
81.400000
NaN
NaN
76.350000
NaN
81.640000
81.640000
81.640000
79.679943
77.599610
78.259471
NaN
NaN
NaN
NaN
NaN
NaN
83.550000
81.934486
81.824032
Acidovorax-98
91.458225
83.451002
85.709540
87.666721
84.202193
81.022943
100.000000
NaN
NaN
NaN
NaN
NaN
NaN
NaN
83.870000
85.142119
83.108014
82.741050
NaN
NaN
83.140000
83.680000
86.208012
NaN
83.680000
80.166304
83.248243
NaN
NaN
82.016082
NaN
79.246559
76.750000
97.780000
NaN
82.645881
NaN
NaN
NaN
80.935551
81.602830
82.836172
NaN
NaN
97.750000
NaN
79.480000
82.987750
83.199000
83.901157
82.232058
Bacteria-21
NaN
81.380000
NaN
NaN
NaN
NaN
NaN
100.000000
NaN
NaN
NaN
NaN
83.600000
89.425431
NaN
NaN
NaN
NaN
93.872911
82.441102
NaN
NaN
85.018153
NaN
NaN
88.806020
NaN
NaN
NaN
NaN
NaN
100.000000
96.590000
100.000000
NaN
96.590000
83.356569
83.356569
83.356569
88.171901
90.750000
NaN
97.607949
93.195404
88.492500
95.372038
NaN
83.720000
84.100000
NaN
NaN
Bacteriovora-8x
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
100.000000
97.479819
97.467120
99.334022
NaN
NaN
NaN
NaN
NaN
NaN
100.000000
NaN
NaN
NaN
NaN
NaN
95.450000
93.730000
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
98.268415
NaN
NaN
NaN
NaN
NaN
NaN
81.470000
81.960000
NaN
NaN
Bacteriovorax-21
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
97.907047
100.000000
98.855536
97.152600
NaN
NaN
NaN
NaN
NaN
NaN
96.772992
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
94.950000
NaN
NaN
NaN
NaN
NaN
NaN
Bacteriovorax-49
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
97.479951
98.726784
100.000000
97.219948
NaN
NaN
NaN
NaN
NaN
NaN
99.521053
NaN
NaN
NaN
NaN
100.000000
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
Bacteriovorax-63
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
99.658703
96.825472
97.429824
100.000000
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
Bacteroidetes-49
NaN
NaN
NaN
NaN
NaN
NaN
NaN
83.610000
NaN
NaN
NaN
NaN
100.000000
92.293639
84.378806
NaN
NaN
NaN
91.193132
NaN
NaN
NaN
82.200000
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
80.690000
NaN
NaN
Bacteroidetes-76
NaN
82.380000
NaN
NaN
90.670000
NaN
NaN
89.440464
NaN
NaN
NaN
NaN
92.232578
100.000000
81.154441
NaN
NaN
NaN
92.058318
NaN
NaN
89.546862
92.582461
96.614802
89.546862
NaN
NaN
NaN
100.000000
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
89.600000
NaN
89.630000
NaN
97.360000
89.210000
NaN
NaN
Bacteroidetes-8
81.110000
82.102500
83.420000
80.730000
87.266339
NaN
83.870000
NaN
NaN
NaN
NaN
NaN
84.378806
81.154441
100.000000
83.930000
80.070000
86.630000
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
95.840000
96.443756
92.180000
NaN
NaN
NaN
NaN
NaN
NaN
NaN
81.090000
80.400000
Burkholderiales-129
84.871755
90.435770
83.998184
84.301392
84.743663
92.856276
84.813822
NaN
NaN
NaN
NaN
NaN
NaN
NaN
83.930000
100.000000
91.002264
83.408268
NaN
NaN
NaN
NaN
80.230000
NaN
NaN
NaN
NaN
100.000000
100.000000
100.000000
100.000000
NaN
NaN
98.780000
NaN
98.780000
NaN
NaN
NaN
80.250000
76.380000
81.450000
100.000000
94.709437
99.178770
100.000000
NaN
90.870000
84.240000
82.165193
84.719012
Burkholderiales-55
93.163155
83.109130
82.847118
83.093372
82.800071
81.674622
82.646736
NaN
NaN
NaN
NaN
NaN
NaN
NaN
80.070000
92.482311
100.000000
81.737998
NaN
NaN
93.409281
NaN
NaN
91.180000
NaN
NaN
78.550000
98.780000
100.000000
84.856593
100.000000
98.720000
NaN
78.150000
81.250000
81.406757
85.785953
85.785953
85.785953
NaN
93.423043
81.760415
100.000000
100.000000
100.000000
98.810000
80.153469
80.515007
79.860203
81.602596
81.233147
Burkholderiales-76
81.883515
81.842970
81.236385
80.825661
81.313671
81.728344
83.039459
NaN
NaN
NaN
NaN
NaN
NaN
NaN
86.630000
83.233419
81.777475
100.000000
NaN
NaN
NaN
NaN
82.750000
100.000000
NaN
NaN
NaN
NaN
85.200000
100.000000
78.360000
98.680000
84.672082
NaN
84.150000
83.971582
84.358596
84.358596
84.824521
80.670000
80.482948
81.020000
88.237821
83.970000
89.740000
85.087460
87.550000
83.540000
80.440000
83.931425
84.208016
Flavobacteriaceae-49
NaN
NaN
NaN
NaN
NaN
NaN
NaN
93.433932
100.000000
96.771398
NaN
NaN
87.905168
90.800000
NaN
NaN
NaN
NaN
100.000000
83.077946
82.755834
89.250567
92.381319
91.849117
89.432461
NaN
NaN
NaN
NaN
NaN
NaN
100.000000
97.620000
100.000000
NaN
97.620000
97.620000
97.620000
97.620000
NaN
NaN
NaN
NaN
99.247807
98.810000
99.279765
NaN
NaN
NaN
NaN
NaN
Flavobacteriaceae-79-1
NaN
NaN
NaN
NaN
NaN
NaN
NaN
82.441102
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
83.137950
100.000000
83.545606
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
Flavobacteriaceae-79-2
77.450000
90.750000
89.380000
NaN
90.090000
NaN
83.140000
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
93.409281
NaN
82.873189
83.596284
100.000000
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
Methylobacte-98r
88.832806
NaN
85.230000
85.450000
83.056525
NaN
83.680000
NaN
NaN
NaN
NaN
NaN
NaN
89.546099
NaN
NaN
NaN
NaN
89.262523
NaN
NaN
100.000000
87.741498
86.554693
99.889289
82.979476
81.946986
90.120000
80.960000
82.802397
78.860000
NaN
NaN
77.420000
NaN
77.840000
NaN
NaN
NaN
83.266225
94.421634
82.527462
NaN
86.246462
NaN
97.663435
82.493587
NaN
NaN
81.970000
82.061192
Methylobacter tundripaludum-129
85.677666
85.710000
84.280000
84.510000
84.260000
NaN
86.208012
85.025386
NaN
NaN
NaN
NaN
82.200000
92.706619
NaN
80.290000
NaN
82.750000
92.551287
NaN
NaN
87.812064
100.000000
90.536830
87.722928
82.610635
82.907775
79.880000
79.980000
84.617882
NaN
NaN
79.880550
NaN
NaN
77.070000
83.700000
83.700000
83.700000
83.256190
83.954871
82.377805
NaN
92.018998
NaN
79.790000
82.900013
88.550000
88.550000
88.804742
94.493634
Methylobacter-123
89.853726
NaN
82.680000
83.330000
NaN
NaN
NaN
NaN
NaN
NaN
100.000000
NaN
NaN
95.649187
NaN
NaN
91.180000
100.000000
91.811635
NaN
NaN
86.690404
90.293804
99.973064
86.802022
83.208558
82.319340
79.613749
78.520000
NaN
80.840000
NaN
78.930000
80.210000
NaN
80.800000
NaN
NaN
NaN
82.439871
83.533403
82.326017
NaN
93.618504
NaN
80.385293
82.274031
92.470000
89.800000
82.064968
89.897605
Methylobacter-69
88.832806
NaN
85.230000
85.450000
83.056525
NaN
83.680000
NaN
95.450000
NaN
NaN
NaN
NaN
89.546099
NaN
NaN
NaN
NaN
89.531728
NaN
NaN
99.857355
87.694332
86.828878
100.000000
86.700431
81.841131
90.120000
80.960000
82.802397
78.860000
NaN
NaN
77.420000
NaN
77.840000
NaN
NaN
NaN
85.604385
83.895302
83.115893
NaN
87.826583
NaN
97.663435
82.521064
NaN
NaN
81.970000
82.061192
Methylococcaceae-21
NaN
NaN
NaN
80.480000
NaN
NaN
80.166304
90.124093
93.730000
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
82.952369
82.910356
83.179029
85.898357
99.974296
82.573427
93.964521
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
92.222068
88.146393
87.540876
NaN
81.980000
NaN
81.170000
82.850358
NaN
NaN
84.850000
NaN
Methylococcaceae-55
81.733996
80.990000
84.696913
84.375016
80.899708
98.770000
83.248243
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
78.550000
NaN
NaN
NaN
NaN
81.939754
82.756194
82.181031
81.920668
82.109806
100.000000
NaN
NaN
82.870000
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
83.562238
83.428476
82.623003
82.490000
NaN
NaN
84.910000
82.234361
NaN
NaN
81.369770
83.720157
Methylophilaceae-40
NaN
100.000000
100.000000
98.780000
100.000000
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
100.000000
NaN
NaN
NaN
NaN
NaN
90.120000
79.880000
79.613749
90.120000
94.983217
NaN
100.000000
98.510703
82.835943
83.669864
82.314735
81.411288
83.238935
82.489604
82.198023
82.630142
82.579826
82.461706
NaN
NaN
NaN
87.264718
85.556770
83.595626
92.667869
NaN
NaN
NaN
NaN
86.916540
Methylophilaceae-49
81.458739
100.000000
100.000000
100.000000
98.693595
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
100.000000
NaN
100.000000
100.000000
85.200000
NaN
NaN
NaN
80.960000
79.980000
78.520000
80.960000
NaN
NaN
98.423570
100.000000
83.038144
83.691924
82.115909
82.118426
82.516676
81.748504
82.561834
83.092798
83.013736
83.276154
NaN
NaN
NaN
85.437169
85.221087
84.684718
90.378949
NaN
NaN
NaN
NaN
100.000000
Methylophilaceae-55
83.740000
85.926757
89.778546
84.205696
99.060820
NaN
82.016082
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
100.000000
86.880972
100.000000
NaN
NaN
NaN
82.802397
84.617967
NaN
82.802397
NaN
82.870000
82.279460
82.738049
100.000000
80.780335
81.629387
81.717684
81.668607
82.159731
82.017085
81.465462
81.465462
81.349942
NaN
NaN
NaN
81.871703
82.374724
81.655419
83.131497
83.566895
NaN
NaN
82.001662
80.397762
Methylophilaceae-8
NaN
89.022353
100.000000
100.000000
86.703690
82.220000
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
100.000000
100.000000
78.360000
NaN
NaN
NaN
78.860000
NaN
80.840000
78.860000
NaN
NaN
83.741882
83.773353
81.608725
99.955475
81.932531
81.903661
81.878000
82.392891
81.705134
81.619697
81.685157
81.472307
NaN
NaN
NaN
83.412075
83.834830
82.677163
83.189389
NaN
NaN
NaN
NaN
81.012474
Methylophilus methylotrophus-127-1
NaN
80.904543
79.898609
98.720000
79.358995
81.400000
79.246559
100.000000
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
98.680000
100.000000
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
82.960385
82.813153
81.950940
81.446827
100.000000
87.717969
85.929868
88.245953
86.152003
88.318596
88.330908
88.302099
NaN
NaN
NaN
84.903939
83.279354
81.735611
83.464099
NaN
NaN
NaN
NaN
NaN
Methylophilus methylotrophus-127-2
NaN
79.970000
79.590000
NaN
NaN
NaN
76.750000
96.590000
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
84.672082
97.620000
NaN
NaN
NaN
79.880550
78.930000
NaN
NaN
NaN
81.669261
81.840084
81.847112
81.921319
87.718999
99.965137
85.997466
96.445264
86.021259
96.717549
96.705940
96.767421
NaN
NaN
NaN
83.215866
83.116388
81.657024
86.683028
NaN
NaN
NaN
77.250000
78.730000
Methylophilus methylotrophus-129-1
79.750000
NaN
NaN
97.750000
97.545031
NaN
97.780000
100.000000
NaN
NaN
NaN
NaN
NaN
NaN
NaN
98.780000
78.150000
NaN
100.000000
NaN
NaN
77.420000
NaN
80.210000
77.420000
NaN
NaN
83.015053
82.682160
82.055272
82.108566
85.901044
86.033003
99.970288
85.568169
97.415019
86.786027
86.758993
86.855039
NaN
NaN
NaN
81.722423
83.856524
82.085849
81.978257
NaN
NaN
NaN
80.750000
81.104419
Methylophilus methylotrophus-129-2
NaN
80.661320
NaN
NaN
96.200000
70.040000
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
81.250000
84.150000
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
82.734257
81.905186
82.534101
82.164513
87.847511
96.562451
85.616077
100.000000
85.930658
96.712763
96.758635
96.713228
NaN
NaN
NaN
83.049557
83.489159
82.059552
83.947561
80.730000
NaN
NaN
77.250000
NaN
Methylophilus methylotrophus-55
NaN
82.547465
99.341447
98.203054
84.990967
NaN
82.663876
96.590000
NaN
NaN
NaN
NaN
NaN
NaN
NaN
98.780000
79.646089
83.971582
97.620000
NaN
NaN
77.840000
77.070000
80.800000
77.840000
NaN
NaN
81.052955
82.489333
81.993368
81.738989
86.147665
88.935919
97.743152
85.578708
100.000000
86.206858
86.113493
86.236857
NaN
NaN
NaN
83.038778
82.762869
82.357786
82.173660
NaN
NaN
NaN
NaN
76.710000
Methylophilus methylotrophus-69
78.980000
NaN
82.781386
98.720000
96.200000
81.640000
NaN
83.356569
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
81.950000
84.358596
97.620000
NaN
NaN
NaN
83.700000
NaN
NaN
NaN
NaN
82.669231
82.866785
81.677167
81.586681
88.026944
97.032423
88.037293
96.839145
86.071842
100.000000
99.996689
99.996147
NaN
NaN
NaN
83.607161
83.731750
82.982759
83.225143
NaN
NaN
NaN
79.940000
83.500000
Methylophilus methylotrophus-79
78.980000
NaN
82.781386
98.720000
96.200000
81.640000
NaN
83.356569
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
81.950000
84.358596
97.620000
NaN
NaN
NaN
83.700000
NaN
NaN
NaN
NaN
82.094329
82.942920
81.447678
81.576208
87.956002
97.122660
89.163687
96.868590
86.185741
99.996734
100.000000
99.997006
NaN
NaN
NaN
83.208480
83.806234
83.328907
82.695885
NaN
NaN
NaN
79.940000
83.500000
Methylophilus methylotrophus-98
78.980000
NaN
85.306357
98.720000
96.200000
81.640000
NaN
83.356569
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
81.950000
84.824521
97.620000
NaN
NaN
NaN
83.700000
NaN
NaN
NaN
NaN
82.243590
82.933072
81.593895
81.531631
88.164709
96.931506
88.166112
96.766992
86.074155
99.999136
99.994778
100.000000
NaN
NaN
NaN
83.514490
83.731750
83.069388
83.270608
NaN
NaN
NaN
79.940000
NaN
Methylosarcina lacus-55
86.739976
82.358251
78.453731
79.560000
84.864459
79.679943
80.923205
88.171901
NaN
NaN
NaN
NaN
NaN
NaN
95.840000
80.210000
NaN
80.670000
NaN
NaN
NaN
83.436108
83.432921
82.224119
85.605918
92.101954
83.315050
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
100.000000
98.266661
89.025048
NaN
NaN
80.350000
NaN
82.813991
NaN
NaN
79.830195
81.070324
Methylosarcina lacus-69
81.589249
82.767176
80.153520
79.560000
NaN
77.599861
81.600840
90.589718
96.832229
NaN
NaN
NaN
NaN
NaN
96.443756
76.380000
93.420718
80.066795
NaN
NaN
NaN
93.840515
83.640512
83.167218
84.123121
88.338977
82.962860
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
98.573418
100.000000
89.678676
NaN
NaN
NaN
NaN
87.975756
NaN
73.380000
80.664012
81.655762
Methylosarcina-21
86.783149
79.532395
81.170724
NaN
NaN
78.972461
82.826173
NaN
NaN
NaN
NaN
NaN
NaN
NaN
92.180000
81.450000
81.762647
79.694000
NaN
NaN
NaN
82.120297
82.321161
82.185569
82.561668
87.854740
82.707521
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
90.058056
90.445605
99.957843
NaN
NaN
NaN
NaN
85.736886
NaN
NaN
81.744985
82.929324
Methylotenera mobilis-123
NaN
100.000000
100.000000
98.785506
98.711159
NaN
NaN
97.607949
NaN
NaN
NaN
NaN
NaN
NaN
NaN
100.000000
100.000000
88.237821
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
82.490000
87.328452
85.759153
82.541069
83.807251
84.503198
83.113396
82.349795
83.555039
83.460925
84.161370
84.102780
84.108076
NaN
NaN
NaN
100.000000
98.306833
84.942398
98.991738
NaN
NaN
NaN
NaN
100.000000
Methylotenera mobilis-63
NaN
100.000000
100.000000
100.000000
98.220667
NaN
NaN
93.256871
NaN
NaN
NaN
NaN
NaN
89.600000
NaN
94.709437
NaN
83.970000
99.154501
NaN
NaN
86.551627
92.009169
94.378501
87.634607
81.980000
NaN
85.778706
85.752132
83.758479
84.043537
83.434911
83.118032
83.655519
83.546859
83.256365
84.437895
84.437895
84.437895
NaN
NaN
NaN
98.349528
100.000000
85.158420
97.872774
NaN
NaN
NaN
NaN
100.000000
Methylotenera mobilis-76-1
NaN
100.000000
100.000000
98.048984
99.577890
NaN
97.750000
87.639044
NaN
94.950000
NaN
NaN
NaN
NaN
NaN
99.178770
100.000000
89.740000
98.810000
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
83.396098
84.567916
82.719398
82.670608
81.981304
81.823443
82.648932
82.345059
83.152087
83.388920
83.311364
83.495471
80.350000
NaN
NaN
84.842097
84.924765
99.948403
84.149272
NaN
NaN
NaN
NaN
100.000000
Methylotenera mobilis-76-2
NaN
100.000000
100.000000
98.224970
100.000000
NaN
NaN
95.795254
NaN
NaN
NaN
NaN
NaN
89.630000
NaN
100.000000
100.000000
85.088969
99.283075
NaN
NaN
97.007179
79.790000
81.111704
97.007179
81.170000
84.910000
91.915209
90.166668
86.124040
83.046121
85.599242
87.455131
83.605088
84.927509
83.979256
84.987476
84.856474
85.071927
NaN
NaN
NaN
98.834717
97.606696
84.334533
100.000000
NaN
NaN
NaN
NaN
100.000000
Methylovulum miyakonense-55
83.290000
NaN
NaN
NaN
87.050000
NaN
79.480000
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
80.153469
NaN
NaN
NaN
NaN
82.555510
82.502375
82.443947
82.553988
83.466936
82.540211
NaN
NaN
82.451323
NaN
NaN
NaN
NaN
80.730000
NaN
NaN
NaN
NaN
82.933111
87.651976
86.164601
NaN
NaN
NaN
NaN
100.000000
NaN
NaN
82.180000
83.570000
Opititae-40
81.770000
84.068616
80.549123
79.899179
81.281496
NaN
82.987750
83.720000
81.470000
NaN
NaN
NaN
NaN
97.360000
NaN
90.870000
80.466054
83.540000
NaN
NaN
NaN
NaN
88.550000
92.470000
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
100.000000
86.227444
89.817096
91.840710
Opitutae-129
81.792944
84.704145
83.009060
81.974071
84.281532
83.550000
83.243267
84.100000
81.960000
NaN
NaN
NaN
80.690000
89.210000
NaN
84.240000
80.604465
80.440000
NaN
NaN
NaN
NaN
88.550000
89.800000
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
NaN
73.380000
NaN
NaN
NaN
NaN
NaN
NaN
85.565404
100.000000
83.267519
82.121907
Rhodocyclaceae-127
82.471391
82.530770
82.406036
81.477145
82.158156
81.785421
83.683718
NaN
NaN
NaN
NaN
NaN
NaN
NaN
81.060000
82.067306
82.203936
84.186436
NaN
NaN
NaN
81.970000
88.804742
82.064968
81.970000
84.850000
81.373840
NaN
NaN
81.407743
NaN
NaN
77.250000
80.750000
77.250000
NaN
79.940000
79.940000
79.940000
79.830195
80.664012
81.831328
NaN
NaN
NaN
NaN
82.180000
91.675489
83.271262
100.000000
95.838851
Rhodocyclaceae-49
82.384567
86.482835
82.154758
82.097128
82.563162
81.746011
82.251697
NaN
NaN
NaN
NaN
NaN
NaN
NaN
80.360000
85.686095
81.611996
84.710942
NaN
NaN
NaN
82.048177
94.497748
89.894862
82.048177
NaN
83.719765
86.967273
100.000000
80.427798
81.012474
NaN
78.730000
81.104419
NaN
76.710000
83.500000
83.500000
NaN
81.070324
81.655182
82.926655
NaN
100.000000
NaN
100.000000
83.570000
92.574368
82.735197
95.854762
100.000000
In [36]:
p = sns.heatmap(res_piv)
In [37]:
p.figure.set_size_inches(15, 15)
In [38]:
p.figure.tight_layout()
In [39]:
p.figure.savefig("160528_fauzi_bin_ANIs.pdf")
In [ ]:
Content source: JanetMatsen/meta4_bins_janalysis
Similar notebooks: