Tento repozitář obsahuje kód s pipelinem, který integruje (meta)data o českých školách a napojuje je na databázi škol podpořených v projektu Česko.digital Učíme online.
Výsledný dataset umožňuje snadnou geolokaci a analýzu podpořených škol s ohledem na využíváné technologie a technickou podporu, to vše v kontextu ostatních škol i základních údajů o nich a jejich obcích.

Technicky jde o {targets} pipeline v R, což umožňuje efektivnivní workflow a la make. Kód je stavěn tak, aby neopakoval již proběhlé kroky, běžel automaticky a šel od začátku do konce spustit i na jiném stroji (díky {renv}, který se stará o replikaci prostředí, ale je potřeba mít přístupové klíče do API Googlu a Airtable a práva ke zdrojovým Google sheets a Airtable bázi).

Detailnější technická a datová dokumentace je v přípravě.

Výstup

Exportován v této uzavřeném google tabulce - obsahuje neveřejná data.

Zdroje dat

Detailnější dokumentace výstupního datasetu je v přípravě.

TO DO

Data

  • doplnit RED IZO škol, které nešly napojit na registr

Pipeline a dokumentace

  • formální dokumentace výstupních dat
  • racionalizovat názvy sloupců
  • detekce/rating kvality napojení na registr

Šířeji

Data, která by stálo za to prozkoumat

  • obory vzdělávání v jednotlivých školách
  • typ území - aglomerace (Urban Audit)
  • finanční výkazy škol (Státní pokladna)
  • eurofondy
  • skutečné počty žáků podle dat pro RUD
  • finanční data obcí
  • socioek data obcí - nejspíš dostupná jen nezaměstnanost
  • covid data obcí
  • data z ročenky školství (asi mission impossible, špatně strukturovaná data)

(Výzkumná otázka: které školy si říkají o pomoc?)