In [13]:
import os
from pydatajson import DataJson
dj = DataJson()
catalog = os.path.join("samples", "catalogo-justicia.json")
dj.generate_catalogs_indicators(catalog)
Out[13]:
El método devuelve un objeto tuple con dos valores, el primero los indicadores del catálogo individual, y el segundo los indicadores de la red entera, que para este caso, al ser la red entera constituída por un único catálogo, son exactamente idénticos. Se calculan los siguientes indicadores:
datasets_cant
distribuciones_cant
datasets_meta_ok_cant
, datasets_meta_error_cant
, datasets_meta_ok_pct
catalogo_ultima_actualizacion_dias
, datasets_actualizados_cant
, datasets_no_actualizados_cant
, datasets_actualizados_pct
campos_recomendados_pct
, campos_optativos_pct
datasets_frecuencia_cant
distribuciones_formatos_cant
Notar que los últimos dos son a su vez diccionarios, con las claves representando los formatos / frecuencias particulares y sus valores, la cantidad.
In [18]:
import os
from pydatajson import DataJson
dj = DataJson()
catalogs = [
os.path.join("samples", "catalogo-justicia.json"),
"http://datos.gob.ar/data.json"
]
dj.generate_catalogs_indicators(catalogs)
Out[18]:
El método opcionalmente acepta un segundo parámetro: el catálogo central de la red de nodos. De estar presente, se calculan indicadores sobre la cantidad de datasets federados en la red central para cada catálogo, es decir, la cantidad de datasets del catálogo particular presentes en el catálogo central. El diccionario resultado contiene los indicadores datasets_federados_cant
, datasets_no_federados_cant
, datasets_federados_pct
.
In [18]:
import os
from pydatajson import DataJson
dj = DataJson()
catalogs = [
os.path.join("samples", "catalogo-justicia.json"),
]
central_catalog = "http://datos.gob.ar/data.json"
dj.generate_catalogs_indicators(catalogs, central_catalog)
Out[18]: