Datové sady

Říjen 1, 2020

Každý dataset má několik atributů (metadat), jejichž hodnoty je možné při jeho zakládání nastavit či později editovat (titulek, název, URL adresa, domovská stránka, popis, licence, tagy, zdroje, skupiny, autor, verze, stav, email autora).

V našem případě jde o vlastní datové soubory týkající se závažných havárií, pracovních úrazů, smrtelných pracovních úrazů, přehledu ocenění v BOZP a datové sady cizích institucí – SZÚ, ÚZIS, SÚIP, MZd, ČSÚ a ČSSZ:

• nemoci z povolání

• pracovní úrazy

• smrtelné pracovní úrazy

• realizované kontroly v rámci inspekce práce včetně výše udělených pokut

• závažné havárie a mimořádné události a objekty spadající pod zákon o prevenci závažných havárií

• oceněné podniky z hlediska BOZP

• adresáře institucí zabývající se činnostmi souvisejícími s problematikou BOZP atd., např. poskytovatelé zdravotních služeb

Datová sada je nejprve popsána výše uvedenými metadaty a následně je přidán datový zdroj. Každý datový set může obsahovat více datových zdrojů.

Datový zdroj lze vložit nahráním souboru nebo uvedením URL odkazu na zdroj. Datový zdroj vlastních datasetů či upravované datasety jiných organizací jsou přímo uloženy v našem katalogu. Datasety ostatních institucí jsou v CKANu evidovány a popsány, avšak na datový zdroj je odkazováno. Tímto způsobem je v některých případech zajištěna automatická aktualizace.

U datového zdroje uvedeme jeho název, stručný popis a formát. Dále je nezbytné zvolit vhodné zobrazení datového zdroje, a to dle příslušného formátu. Základní zobrazení nabízí tyto možnosti:

  • prohlížeč dat (data explorer) – mřížka, graf, mapa
  • obrázek – formáty jpeg, png
  • Tableau – zobrazení tematických dashboardů
  • webová stránka – webové stránky
  • PDF – embedované pdf soubory

Jednotlivá zobrazení lze v rámci jednoho datového zdroje řadit dle zvoleného pořadí.

Zpracovaný dataset dále přiřadíme do předdefinovaných skupin a showcases.

Každý zobrazený dataset si může uživatel stáhnout či přejít na původní datový zdroj.

Jednotlivé datasety lze také sdílet prostřednictvím sociálních sítí Facebook a Twitter.

Většina datových sad je doplněna vizualizací v podobě dashboardů vytvořených softwarovým nástrojem Tableau.