Encyklopedia architektury danych — zasoby edukacyjne dla analityków Polska
Strona główna Data Lake Data Warehouse ETL Modelowanie danych Governance danych O nas Kontakt
Encyklopedia architektury danych

Fundamenty analityczne środowisk enterprise

Strukturyzowany przewodnik po projektowaniu architektury danych — od modeli przechowywania po integrację źródeł informacji w środowiskach korporacyjnych.

Przeglądaj tematy O projekcie
Schemat bazy danych — architektura danych
Tematy główne

Obszary tematyczne

Przechowywanie

Data Lake

Centralne repozytorium surowych danych w formacie natywnym. Architektura, strefy danych i wzorce organizacji zasobów.

Czytaj dalej →
Analityka

Data Warehouse

Hurtownia danych zorientowana na zapytania analityczne. Schemat gwiazdy, płatka śniegu i modele kolumnowe.

Czytaj dalej →
Integracja

ETL

Procesy Extract, Transform, Load. Narzędzia, harmonogramy, jakość danych i podejście ELT w środowiskach chmurowych.

Czytaj dalej →
Projektowanie

Modelowanie danych

Modele konceptualne, logiczne i fizyczne. Normalizacja, denormalizacja i diagram encja-relacja w praktyce.

Czytaj dalej →
Zarządzanie

Governance danych

Polityki zarządzania danymi, klasyfikacja, katalog danych i zgodność z regulacjami w organizacjach.

Czytaj dalej →
Zestawienie

Porównanie głównych wzorców przechowywania danych

Cecha Data Lake Data Warehouse Data Lakehouse
Format danych Surowy, dowolny format Ustrukturyzowany Otwarty format kolumnowy
Schemat Schema-on-read Schema-on-write Schema-on-read/write
Typowe zastosowanie ML, eksploracja danych BI, raporty operacyjne Analityka ujednolicona
Koszt przechowywania Niski Wyższy Niski do średniego
Wydajność zapytań Zależna od formatu Wysoka (OLAP) Wysoka z deltalogiem
Kluczowe pojęcia

Najczęściej wyszukiwane definicje

Czym różni się data lake od data warehouse?
Data lake przechowuje dane w formacie surowym bez narzuconego schematu. Data warehouse wymaga ustrukturyzowania danych przed załadowaniem. Wybór zależy od przypadku użycia: eksploracja vs. raportowanie operacyjne.
Co to jest schemat gwiazdy?
Schemat gwiazdy to wzorzec modelowania w hurtowni danych. Centralna tabela faktów połączona z tabelami wymiarów. Optymalizuje zapytania analityczne przez denormalizację wybranych danych.
Kiedy stosować ELT zamiast ETL?
ELT (Extract, Load, Transform) jest preferowane w środowiskach chmurowych z wydajnymi silnikami SQL. Dane ładowane są najpierw do docelowego repozytorium, a transformacje wykonywane in-situ.
Czym jest katalog danych?
Katalog danych to centralne repozytorium metadanych opisujące dostępne zasoby danych w organizacji. Zawiera informacje o źródle, właścicielu, jakości i klasyfikacji każdego zbioru.
Zasoby edukacyjne

Słownik pojęć architektury danych

Artykuły napisane z myślą o analitykach i architektach danych pracujących w środowiskach enterprise.

Przeglądaj słownik