In [ ]:
# Reload when code changed:
%load_ext autoreload
%autoreload 2
%pwd

In [ ]:
import sys
path = "../w_github_sharkdata/proj_sharkdata/proj_sharkdata/sharkdata_core/dwca_generator"
sys.path.append(path)

In [ ]:
%matplotlib inline
import pandas as pd
import numpy as np
import dwca_generator

In [ ]:


In [ ]:
dwca = dwca_generator.DarwinCoreArchiveGenerator('Bacterioplankton')
dwca.add_data('test_data/shark_data.txt')
dwca.add_metadata('test_data/shark_metadata.txt')

In [ ]:
print('Length: ' + str(len(dwca._data_df)))
dwca._data_df

In [ ]:
dwca._data_df.info()

In [ ]:
print(len(dwca._data_df.shark_sample_id_md5.value_counts()))
print(dwca._data_df.shark_sample_id_md5.value_counts().max())
print(dwca._data_df.shark_sample_id_md5.value_counts().min())

In [ ]:
dwca.create_dwca_file()

In [ ]:
dwca._metadata_dict

In [ ]:


In [ ]:
#dwca._data_df.value.plot()

In [ ]:
#dwca._data_df.value.max()

In [ ]:
#dwca._data_df.parameter.unique()

In [ ]: