CV02 – Klimatická data ve formátu NetCDF a GRIB

Formát prostorových dat GRIB

Formát GRB (též známý jako GRIB, z anglického GRIdded Binary) je standardizovaný formát pro ukládání a přenos meteorologických dat, často používaný pro distribuci výstupů z numerických předpovědních modelů počasí. Je vyvinut a udržován Světovou meteorologickou organizací (WMO) a je široce používán meteorologickými službami po celém světě.

Hlavní charakteristiky formátu GRB/GRIB:

  1. Binární formát:
    • GRB je binární formát, což umožňuje vysokou kompresi a efektivní ukládání velkých objemů meteorologických dat. Tato efektivita je důležitá zejména pro globální modely, které produkují obrovské množství dat.
  2. Data v mřížce (gridded data):
    • Data jsou organizována v mřížce, kde každá buňka obsahuje určitou meteorologickou veličinu, jako je teplota, tlak, vítr, vlhkost atd. Tato mřížka může pokrývat celé zemské povrchy nebo specifické regiony.
  3. Podpora vícero vrstev a parametrů:
    • GRB může obsahovat různé parametry (např. tlak, teplotu, vlhkost) pro různé vertikální úrovně atmosféry (např. povrch, hladiny v troposféře, stratosféře atd.). To umožňuje analýzu předpovědí v různých výškách a vrstvách atmosféry.
  4. Komprese a efektivní ukládání:
    • GRB využívá kompresní metody, jako je použití ztrátové a bezztrátové komprese, aby minimalizoval velikost souboru. To je zvláště užitečné pro distribuční účely a přenos přes internet.
  5. Verze formátu:
    • Existují dvě hlavní verze formátu: GRIB1 a GRIB2. GRIB2 je novější verzí, která poskytuje vylepšené možnosti komprese a podporu širší škály meteorologických proměnných.

Formát prostorových dat NetCDF

NetCDF (Network Common Data Form) je formát určený pro ukládání a sdílení vědeckých dat, zejména těch, které mají více dimenzí (například čas, výška, šířka). NetCDF umožňuje efektivní uložení a přístup k velkým souborům dat, což je často potřeba v meteorologii, klimatologii, oceánografii a dalších vědních oborech.

Struktura NetCDF Souboru:

NetCDF soubor se skládá ze tří hlavních komponent: dimenzí, proměnných a atributů.

Dimenze:

  • Dimenze definují velikost datových polí (například čas, šířka, výška).
  • Každá dimenze má název a délku.
  • Dimenze mohou být neomezené (unlimited), což znamená, že jejich délka může růst (např. časová dimenze).

Proměnné:

  • Proměnné jsou multidimenzionální pole dat uložená v NetCDF souboru.
  • Každá proměnná má přidružené dimenze a může mít také přidružené atributy.

Atributy:

  • Atributy poskytují metadata o souboru nebo jednotlivých proměnných.
  • Globální atributy jsou přidružené k celému souboru, zatímco proměnné atributy jsou přidružené k jednotlivým proměnným.

Data potřebná ke cvičení

ERA5 Hourly Data on Single Levels from 1940 to Present: https://cds-beta.climate.copernicus.eu/

ERA5 je pátá generace klimatických dat produkovaných Evropským centrem pro střednědobé předpovědi počasí (ECMWF). ERA5 poskytuje globální klimatická data na hodinové bázi od roku 1940 do současnosti. Tato data jsou široce využívána při výzkumu klimatu, meteorologii a dalších geovědních oborech.

Stažení těchto dat je časově náročné, proto pro účely tohoto cvičení už data pro rok 2023 byla stažena s těmito parametry:

Zadání cvičení

  • v prostředí QGIS vizualizujte data ERA5 o směru větru ve výšce 10m nad povrchem a vytvořte animovaný GIF (soubor GRB)
  • v prostředí ArcGIS Pro analyzujte průměrné hodnoty teploty za posledních 10 let (2014 – 2023) ve vámi vytvořených bodech, vykreslete graf
  • vypočítejte zonální statistiku v jednotlivých okresech ČR

Postup cvičení v QGIS

  • přidejte si data z ERA5 do prostředí QGIS, nutno nastavit souřadnicový systém WGS84 (4326) u této vrstvy a přidejte si i vrstvu okresů ČR, jako souřadnicový referenční systém projektu nastavte Pseudo-Mercator (3857). Podle časového rozsahu stažených dat se zobrazuje první rastr v celé sadě, v našem případě síla větru v m/s 1.1.2023 v čase 0:00.

  • ve vlastnostech vrstvy s klimatickými daty v kartě Symbologie je možné si zvolit jakou proměnnou chceme vykreslit (vítr, teplota, srážky). U větru je možné zapnout vektory směru větru. Otestujte různé možnosti nastavení symbologie u větru (barevný rozsah, vzhled vektoru apod.).

  • v nástrojové liště je k dispozici nástroj Časový ovladač Panel, který umožňuje pracovat s daty, u kterých je k dispozici časová složka. Vyzkoušejte si možnosti animované časové navigace.
  • před exportem a tvorbou animovaného GIF je vhodné doplnit informace a datu a čase
    • vytvořte dočasnou bodovou vrstvu pro popisek, který umístěte do rastru (Vrstva – Vytvořit vrstvu – Nová dočasná bodová vrstva)
    • ve vlastnostech této vrstvy v záložce Časový zaškrtněte možnost Dynamic Temporal Control a z rozbalovacího menu vyberte možnost Překreslit pouze vrstvu
    • v záložce Popisky zvolte možnost Jednotlivé popisky a do pole Hodnota vyplňte: format_date (@map_start_time, ‘dd MMMM yyyy’) || ‘\n’ || format_date (@map_start_time, ‘HH:mm’)

  • vyberte si časový interval v rozsahu 1 týdne a exportujte animaci
  • využijte některý z online nástrojů např. https://ezgif.com/ a vytvořte si animovaný GIF

Postup cvičení v ArcGIS PRO

  • Soubor mean2014_2023.nc, který obsahuje průměrné měsíční hodnoty teplot v K od roku 2014 do roku 2023, přidejte pomocí Add data – Multidimensional Raster Layer. V ArcGIS Pro “multidimensional raster” označuje typ rastrového datového formátu, který ukládá data s více dimenzemi. Typicky to zahrnuje tři hlavní dimenze: prostorovou (x, y), časovou a případně i další, jako je výška nebo hloubka. Tento formát je často používán pro uchování komplexních datových sad, jako jsou klimatické modely, oceánografické údaje nebo meteorologická data.

  • po přidání multidimenzionálního rastru se aktivuje menu Multidimensional, kde je možno si vybírat konkrétní datum
  • vytvořte si vlastní bodovou vrstvu (minimálně 10 bodů v celé ČR), pro kterou se budou odečítat údaje o průměrných teplotách
  • s využitím nástroje Sample nechejte pro každý bod extrahovat průměrnou hodnotu teploty v daném měsíci od roku 2014 do 2023, pro všechny body vykreslete v Excelu průběh hodnot, interpretujte průběh i vzhledem k poloze bodu
  • vypočítejte pro okresy ČR zonální statistiku Zonal statistics as Table (mean), data je nutné nechat zpracovat jako Multidimenzionální. Získáte tak tabulku, kde pro každý měsíc budete mít spočítanou průměrnou teplotu v daném okrese. Převeďte hodnoty na stupně Celsia a pro jeden měsíc hodnoty správně vizualizujte v mapě okresů.

Zonální statistika je analytická technika, která se používá k výpočtu statistických hodnot (např. průměr, součet, minimum, maximum, standardní odchylka) rastrových dat v rámci definovaných zón. Zóny jsou definovány jako oblasti vektorové vrstvy, které mohou být reprezentovány buď jako polygonové, liniové nebo bodové prvky. Tento typ analýzy umožňuje uživatelům porovnávat hodnoty rastrových dat mezi různými oblastmi zájmu.