Definicja i zakres
Governance danych (data governance) to formalne ramy organizacyjne i techniczne definiujące reguły postępowania z danymi. W praktyce obejmuje: określenie właścicielstwa danych, ustanowienie polityk dostępu i bezpieczeństwa, definicję standardów jakości, zarządzanie cyklem życia danych i zapewnienie zgodności z regulacjami prawnymi.
Governance jest procesem ciągłym — nie jednorazowym projektem. Wymaga zaangażowania zarówno stron technicznych (inżynierowie danych, administratorzy) jak i biznesowych (właściciele domen, menedżerowie ds. compliance).
Articles published on this website summarize publicly available information, industry research and educational materials.
Katalog danych
Katalog danych (data catalog) to centralne repozytorium metadanych opisujące zasoby danych dostępne w organizacji. Pełni rolę indeksu — umożliwia znajdowanie, rozumienie i ocenę przydatności zbiorów danych bez konieczności bezpośredniego dostępu do systemów źródłowych.
Typowe elementy katalogu danych:
- Techniczne metadane (schemat, typy kolumn, rozmiar)
- Biznesowe metadane (opis, właściciel, domena, certyfikacja)
- Lineage (ślad przepływu danych od źródła do raportu)
- Profile jakości (statystyki kolumn, procent wypełnienia)
- Tagi klasyfikacyjne (dane osobowe, poufne, publiczne)
Klasyfikacja danych
Klasyfikacja danych to proces przypisywania poziomów wrażliwości i kategorii tematycznych do zbiorów danych. Umożliwia stosowanie odpowiednich kontroli bezpieczeństwa i dostępu w zależności od charakteru danych.
| Klasa | Opis | Przykłady | Kontrole |
|---|---|---|---|
| Publiczne | Dane przeznaczone do publicznego udostępnienia | Cenniki, raporty roczne | Brak ograniczeń dostępu |
| Wewnętrzne | Dane do użytku służbowego | Procedury, dane operacyjne | Dostęp dla pracowników |
| Poufne | Dane biznesowo wrażliwe | Dane klientów, strategie | Kontrola dostępu, szyfrowanie |
| Ściśle tajne | Dane o wysokim ryzyku ujawnienia | Dane osobowe, hasła, klucze | Rygorystyczna kontrola, audyt |
Data Stewardship
Data steward (zarządca danych) to osoba odpowiedzialna za jakość, spójność i dostępność danych w określonej domenie biznesowej. Pełni rolę pośrednika między stroną techniczną (inżynierowie danych) a biznesową (użytkownicy danych).
Obowiązki data steward obejmują: definiowanie standardów dla atrybutów, weryfikację jakości, zarządzanie definicjami biznesowymi w słowniku pojęć i rozstrzyganie sporów dotyczących semantyki danych.
Jakość danych
Jakość danych oceniana jest według sześciu wymiarów:
| Wymiar | Definicja | Miara |
|---|---|---|
| Kompletność | Czy dane zawierają wszystkie wymagane wartości? | % wypełnionych pól |
| Dokładność | Czy wartości odpowiadają rzeczywistości? | % rekordów bez błędów |
| Spójność | Czy te same dane są zgodne w różnych systemach? | % rekordów zgodnych cross-system |
| Terminowość | Czy dane są aktualne? | Opóźnienie od zdarzenia do zapisu |
| Unikalność | Czy brak jest duplikatów? | % unikalnych kluczy |
| Ważność | Czy wartości spełniają reguły domenowe? | % rekordów w dopuszczalnym zakresie |
Regulacje i zgodność
Governance danych w Polsce i UE musi uwzględniać wymagania regulacyjne dotyczące ochrony danych osobowych i cyberbezpieczeństwa. Kluczowe regulacje to RODO (GDPR) — dotyczące przetwarzania danych osobowych i DORA — rozporządzenie o cyfrowej odporności operacyjnej dla sektora finansowego.
Governance danych ułatwia spełnienie wymagań regulacyjnych przez: prowadzenie rejestru czynności przetwarzania, klasyfikację danych osobowych, implementację prawa do bycia zapomnianym i dokumentowanie przepływów danych między systemami.