Encyklopedia architektury danych — zasoby edukacyjne dla analityków Polska
Strona główna Data Lake Data Warehouse ETL Modelowanie danych Governance danych O nas Kontakt
Zarządzanie danymi

Governance danych

Data governance to zbiór polityk, procesów i odpowiedzialności definiujących sposób zarządzania danymi w organizacji. Obejmuje kontrolę nad jakością, dostępnością, spójnością i bezpieczeństwem zasobów danych przez cały ich cykl życia.

Definicja i zakres

Governance danych (data governance) to formalne ramy organizacyjne i techniczne definiujące reguły postępowania z danymi. W praktyce obejmuje: określenie właścicielstwa danych, ustanowienie polityk dostępu i bezpieczeństwa, definicję standardów jakości, zarządzanie cyklem życia danych i zapewnienie zgodności z regulacjami prawnymi.

Governance jest procesem ciągłym — nie jednorazowym projektem. Wymaga zaangażowania zarówno stron technicznych (inżynierowie danych, administratorzy) jak i biznesowych (właściciele domen, menedżerowie ds. compliance).

Articles published on this website summarize publicly available information, industry research and educational materials.

Katalog danych

Katalog danych (data catalog) to centralne repozytorium metadanych opisujące zasoby danych dostępne w organizacji. Pełni rolę indeksu — umożliwia znajdowanie, rozumienie i ocenę przydatności zbiorów danych bez konieczności bezpośredniego dostępu do systemów źródłowych.

Typowe elementy katalogu danych:

  • Techniczne metadane (schemat, typy kolumn, rozmiar)
  • Biznesowe metadane (opis, właściciel, domena, certyfikacja)
  • Lineage (ślad przepływu danych od źródła do raportu)
  • Profile jakości (statystyki kolumn, procent wypełnienia)
  • Tagi klasyfikacyjne (dane osobowe, poufne, publiczne)

Klasyfikacja danych

Klasyfikacja danych to proces przypisywania poziomów wrażliwości i kategorii tematycznych do zbiorów danych. Umożliwia stosowanie odpowiednich kontroli bezpieczeństwa i dostępu w zależności od charakteru danych.

Klasa Opis Przykłady Kontrole
Publiczne Dane przeznaczone do publicznego udostępnienia Cenniki, raporty roczne Brak ograniczeń dostępu
Wewnętrzne Dane do użytku służbowego Procedury, dane operacyjne Dostęp dla pracowników
Poufne Dane biznesowo wrażliwe Dane klientów, strategie Kontrola dostępu, szyfrowanie
Ściśle tajne Dane o wysokim ryzyku ujawnienia Dane osobowe, hasła, klucze Rygorystyczna kontrola, audyt

Data Stewardship

Data steward (zarządca danych) to osoba odpowiedzialna za jakość, spójność i dostępność danych w określonej domenie biznesowej. Pełni rolę pośrednika między stroną techniczną (inżynierowie danych) a biznesową (użytkownicy danych).

Obowiązki data steward obejmują: definiowanie standardów dla atrybutów, weryfikację jakości, zarządzanie definicjami biznesowymi w słowniku pojęć i rozstrzyganie sporów dotyczących semantyki danych.

Jakość danych

Jakość danych oceniana jest według sześciu wymiarów:

Wymiar Definicja Miara
Kompletność Czy dane zawierają wszystkie wymagane wartości? % wypełnionych pól
Dokładność Czy wartości odpowiadają rzeczywistości? % rekordów bez błędów
Spójność Czy te same dane są zgodne w różnych systemach? % rekordów zgodnych cross-system
Terminowość Czy dane są aktualne? Opóźnienie od zdarzenia do zapisu
Unikalność Czy brak jest duplikatów? % unikalnych kluczy
Ważność Czy wartości spełniają reguły domenowe? % rekordów w dopuszczalnym zakresie

Regulacje i zgodność

Governance danych w Polsce i UE musi uwzględniać wymagania regulacyjne dotyczące ochrony danych osobowych i cyberbezpieczeństwa. Kluczowe regulacje to RODO (GDPR) — dotyczące przetwarzania danych osobowych i DORA — rozporządzenie o cyfrowej odporności operacyjnej dla sektora finansowego.

Governance danych ułatwia spełnienie wymagań regulacyjnych przez: prowadzenie rejestru czynności przetwarzania, klasyfikację danych osobowych, implementację prawa do bycia zapomnianym i dokumentowanie przepływów danych między systemami.