Encyklopedia architektury danych

Fundamenty analityczne środowisk enterprise

Strukturyzowany przewodnik po projektowaniu architektury danych — od modeli przechowywania po integrację źródeł informacji w środowiskach korporacyjnych.

Przeglądaj tematy O projekcie

Schemat bazy danych — architektura danych

Tematy główne

Obszary tematyczne

Przechowywanie

Data Lake

Centralne repozytorium surowych danych w formacie natywnym. Architektura, strefy danych i wzorce organizacji zasobów.

Czytaj dalej →

Analityka

Data Warehouse

Hurtownia danych zorientowana na zapytania analityczne. Schemat gwiazdy, płatka śniegu i modele kolumnowe.

Czytaj dalej →

Integracja

ETL

Procesy Extract, Transform, Load. Narzędzia, harmonogramy, jakość danych i podejście ELT w środowiskach chmurowych.

Czytaj dalej →

Projektowanie

Modelowanie danych

Modele konceptualne, logiczne i fizyczne. Normalizacja, denormalizacja i diagram encja-relacja w praktyce.

Czytaj dalej →

Zarządzanie

Governance danych

Polityki zarządzania danymi, klasyfikacja, katalog danych i zgodność z regulacjami w organizacjach.

Czytaj dalej →

Zestawienie

Porównanie głównych wzorców przechowywania danych

Cecha	Data Lake	Data Warehouse	Data Lakehouse
Format danych	Surowy, dowolny format	Ustrukturyzowany	Otwarty format kolumnowy
Schemat	Schema-on-read	Schema-on-write	Schema-on-read/write
Typowe zastosowanie	ML, eksploracja danych	BI, raporty operacyjne	Analityka ujednolicona
Koszt przechowywania	Niski	Wyższy	Niski do średniego
Wydajność zapytań	Zależna od formatu	Wysoka (OLAP)	Wysoka z deltalogiem

Kluczowe pojęcia

Najczęściej wyszukiwane definicje

Czym różni się data lake od data warehouse?

Data lake przechowuje dane w formacie surowym bez narzuconego schematu. Data warehouse wymaga ustrukturyzowania danych przed załadowaniem. Wybór zależy od przypadku użycia: eksploracja vs. raportowanie operacyjne.

Co to jest schemat gwiazdy?

Schemat gwiazdy to wzorzec modelowania w hurtowni danych. Centralna tabela faktów połączona z tabelami wymiarów. Optymalizuje zapytania analityczne przez denormalizację wybranych danych.

Kiedy stosować ELT zamiast ETL?

ELT (Extract, Load, Transform) jest preferowane w środowiskach chmurowych z wydajnymi silnikami SQL. Dane ładowane są najpierw do docelowego repozytorium, a transformacje wykonywane in-situ.

Czym jest katalog danych?

Katalog danych to centralne repozytorium metadanych opisujące dostępne zasoby danych w organizacji. Zawiera informacje o źródle, właścicielu, jakości i klasyfikacji każdego zbioru.

Zasoby edukacyjne

Słownik pojęć architektury danych

Artykuły napisane z myślą o analitykach i architektach danych pracujących w środowiskach enterprise.

Przeglądaj słownik