Strukturyzowany przewodnik po projektowaniu architektury danych — od modeli przechowywania po integrację źródeł informacji w środowiskach korporacyjnych.
Centralne repozytorium surowych danych w formacie natywnym. Architektura, strefy danych i wzorce organizacji zasobów.
Czytaj dalej →Hurtownia danych zorientowana na zapytania analityczne. Schemat gwiazdy, płatka śniegu i modele kolumnowe.
Czytaj dalej →Procesy Extract, Transform, Load. Narzędzia, harmonogramy, jakość danych i podejście ELT w środowiskach chmurowych.
Czytaj dalej →Modele konceptualne, logiczne i fizyczne. Normalizacja, denormalizacja i diagram encja-relacja w praktyce.
Czytaj dalej →Polityki zarządzania danymi, klasyfikacja, katalog danych i zgodność z regulacjami w organizacjach.
Czytaj dalej →| Cecha | Data Lake | Data Warehouse | Data Lakehouse |
|---|---|---|---|
| Format danych | Surowy, dowolny format | Ustrukturyzowany | Otwarty format kolumnowy |
| Schemat | Schema-on-read | Schema-on-write | Schema-on-read/write |
| Typowe zastosowanie | ML, eksploracja danych | BI, raporty operacyjne | Analityka ujednolicona |
| Koszt przechowywania | Niski | Wyższy | Niski do średniego |
| Wydajność zapytań | Zależna od formatu | Wysoka (OLAP) | Wysoka z deltalogiem |
Artykuły napisane z myślą o analitykach i architektach danych pracujących w środowiskach enterprise.
Przeglądaj słownik