In [13]:
import os
from pydatajson import DataJson
dj = DataJson()
catalog = os.path.join("samples", "catalogo-justicia.json")
dj.generate_catalogs_indicators(catalog)
Out[13]:
El método devuelve un objeto tuple con dos valores, el primero los indicadores del catálogo individual, y el segundo los indicadores de la red entera, que para este caso, al ser la red entera constituída por un único catálogo, son exactamente idénticos. Se calculan los siguientes indicadores:
datasets_cantdistribuciones_cantdatasets_meta_ok_cant, datasets_meta_error_cant, datasets_meta_ok_pctcatalogo_ultima_actualizacion_dias, datasets_actualizados_cant, datasets_no_actualizados_cant, datasets_actualizados_pctcampos_recomendados_pct, campos_optativos_pctdatasets_frecuencia_cantdistribuciones_formatos_cantNotar que los últimos dos son a su vez diccionarios, con las claves representando los formatos / frecuencias particulares y sus valores, la cantidad.
In [18]:
import os
from pydatajson import DataJson
dj = DataJson()
catalogs = [
os.path.join("samples", "catalogo-justicia.json"),
"http://datos.gob.ar/data.json"
]
dj.generate_catalogs_indicators(catalogs)
Out[18]:
El método opcionalmente acepta un segundo parámetro: el catálogo central de la red de nodos. De estar presente, se calculan indicadores sobre la cantidad de datasets federados en la red central para cada catálogo, es decir, la cantidad de datasets del catálogo particular presentes en el catálogo central. El diccionario resultado contiene los indicadores datasets_federados_cant, datasets_no_federados_cant, datasets_federados_pct.
In [18]:
import os
from pydatajson import DataJson
dj = DataJson()
catalogs = [
os.path.join("samples", "catalogo-justicia.json"),
]
central_catalog = "http://datos.gob.ar/data.json"
dj.generate_catalogs_indicators(catalogs, central_catalog)
Out[18]: