Die Data Vault-Modellierung entwickelt sich schnell zum Standardansatz für die Modellierung eines Data Warehouses. Im Vergleich zu anderen populären Ansätzen stellt die Data Vault-Modellierung einen Paradigmenwechsel dar – eine neue Art des Denkens.
DATA VAULT 2.0 // DATA VAULT AUTOMATISIERUNG
Data Vault ist eine Modellierungstechnik für Data Warehouses, die insbesondere für agile Data Warehouses geeignet ist. Sie bietet eine hohe Flexibilität bei Erweiterungen, eine vollständige unitemporale Historisierung der Daten und erlaubt eine starke Parallelisierung der Datenladeprozesse.
Entwickelt wurde die Data-Vault-Modellierung in den 1990ern von Dan Linstedt. Nach ersten Veröffentlichungen im Jahr 2000 erlangte sie ab 2002 durch eine Reihe von Artikeln größere Aufmerksamkeit. 2007 gewann Linstedt die Unterstützung Bill Inmons, der sie als die „optimale Wahl“ für seine DW-2.0-Architektur bezeichnete.
areto ist Spezialist für die seit 2013 von Linstedt unter der Bezeichnung Data Vault 2.0 propagierten Paket aus Modellierungs-, Architektur- und Methodologieansätzen. Beachtenswert sind auch die Veröffentlichungen von Hans Hultgren über Data-Vault-Modellierung und von John Giles über die Erstellung von Data-Vault-Modellen mit Hilfe von Patterns.
Die dimensionale Modellierung von Kimball hat den Fokus auf einfache Datenanalysen und ist optimal für die Zugriffsschicht eines Data Warehouses.
Bill Inmon propagierte eine Enterprise- Integrationsschicht in 3. Normalform, die alle Quellsysteme in ein einheitliches, historisiertes Fachbereichsmodell transformiert. Die Modellierung in 3. Normalform ist optimiert für operative Systeme und stößt bei Datenintegration schnell an seine Grenzen.
ARCHITEKTUR UND MODELLIERUNG
ARCHITEKTUR UND MODELLIERUNG
Data Vault ermöglicht eine flexible und schnelle Anpassung des Data Warehouses. Für Unternehmen ein wirklicher Vorteil. Statische Data Warehouses werden mit der Zeit immer komplexer. Das führt automatisch zu höheren Kosten bei den kontinuierlich auftretenden Erweiterungen und Änderungen am Data Warehouse. Die umfangreichen Implementierungs- und Testzyklen führen aber nicht nur zu einer Kostensteigerung, sondern auch oft zu personellen Engpässen, Innovationsstau und zu einer aufwendigen Suche nach ETL- und Modellierungsexpert*innen.
Unternehmen, die im heutigen Wettbwerb bestehen wollen, können sich diese Wartezeiten nicht leisten. Sie müssen schnell auf sich ständig ändernde aktuelle Marktbedürfnisse reagieren. Das muss sich auch im Data Warehouse widerspiegeln. Hier ist Data Vault die Lösung.
Moderne Data Warehouses sind agil!
Modern
Data Vault vereint das Beste aus der dimensionalen und normalisierten Modellierungswelt. Data Vault wurde speziell entwickelt wurde, um Agilität, Flexibilität und Skalierbarkeitsprobleme zu lösen. Es wurde als granulares, nichtflüchtiges, prüfbares, historisches Repository für Unternehmensdaten aus mehreren Betriebssystemen entwickelt.
Modular
Änderungen erweitern das Modell, ohne Bestehendes zu verändern. So gibt es kaum Auswirkungen auf bestehende Prozesse und nur einen minimalen Testaufwand (Regressionstests).
Skalierbar
Vollständige Parallelisierung der Beladung. Unterschiedliche Schnittstellen können unabhängig voneinander geladen werden. Inkrementelle Vorgehensweise. Inhalt ist insert only und mit SCD2-Historisierung versehen. ETL bzw. ELT kann/soll automatisiert stattfinden.
Data Vault wurde nicht als reines Datenmodell entwickelt, sondern viel mehr als allumfassende Methodensammlung:
Mit Data Vault modellieren Sie ein additives und agiles Data Warehouse!
Methoden zur Datenmodellierung
Methoden zur Datenverarbeitung
Architekturgrundsätze
Agiler Entwicklungsprozess
Die Data Vault-Architektur besteht im Wesentlichen aus drei Schichten, auch „Layer“ genannt:
Data Vault 2.0 bietet eine hohe Flexibilität bei Erweiterungen des DWH, eine vollständige Historisierung der Daten und erlaubt eine starke Parallelisierung der Datenladeprozesse. Bei der Modellierung werden alle zu einem Objekt gehörenden Informationen in drei Kategorien eingeteilt und strikt voneinander getrennt.
In die erste Kategorie „Hub“ gehören Informationen, die ein Objekt eindeutig beschreiben, d.h. seine Identität geben (z.B. Produktnummer beim Produkt).
Hub – Ist der “Stamm” einer Entität (Integrationsanker):
Die zweite Kategorie „Link“ beschreibt Beziehungen zwischen Objekten (z.B. Zuordnung eines Produkts zu einem Vertriebskanal).
Link – Bildet die Beziehungen zwischen Hubs ab:
Attribute, die ein Objekt beschreiben (z.B. Produktname) gehören in die dritte Kategorie, den „Satellit“.
Satellit – Speichert die Detaildaten von Hubs und Links:
Durch diese Art der Modellierung sind Änderungen flexibel möglich, so dass keine bestehenden Tabellen angepasst werden müssen. Es werden einfach neue Tabellen hinzugefügt. Durch die starke Schematisierung der Datenladeprozesse können Templates verwendet werden. So ist eine Änderung bzw. Erweiterung des Datenladeprozesses meist schon durch eine Anpassung der Konfiguration möglich.
Im Interesse unserer Kund*innen sorgen wir für eine möglichst weitgehende Standardisierung der Datenintegration. Die zunehmende Verbreitung von Data Vault als Datenmodellierungsmethode für das Data Warehouse hat zur Entwicklung zahlreicher Data Warehouse Automation (DWA) Lösungen geführt. Die Kombination von führenden DWA-Tools, analytischer Datenbanken wie Exasol oder Snowflake und der technischen Expertise von areto führt zu einer hohen Zeit- und Kostenersparnis. Wir bieten hierzu marktführende Lösungen unserer Partner WhereScape, Data Vault Builder und Matillion oder auch unsere Open Source Lösung areto Data Chef, welche wir bereits bei vielen Kundenprojekten schätzen gelernt haben und erfolgreich einsetzen.
Der Data Vault Architektur- und Modellierungsansatz ermöglicht mit seinen einfachen und verständlichen Modellierungsparadigmen sowie Namenskonventionen ein schnelles Verständnis der Daten. Data Vault vereint das beste aus der dimensionalen und normalisierten Modellierungswelt. Dadurch ist die Modellierung skalierbar, flexibel und in sich konsistent. Sie ist an die individuellen Bedürfnisse eines Unternehmens anpassbar und bietet eine optimale Unterstützung für agile Vorgehensmodelle.
Data Vault revolutioniert durch seine neue Art der Datenintegration und Datenbereitstellung die Architektur des Data Warehouse. Durch die starke Standardisierung der Abläufe ist es möglich, die Datenbereitstellung zu einem sehr hohen Grad zu automatisieren.
Mit Data Vault schaffen Sie neue Möglichkeiten und Perspektiven Ihr Unternehmen wachsen zu lassen und in die Zukunft zu führen.
Buchen Sie sich einen Support-Termin mit einem unserer Data Vault 2.0-Expert*innen! Schnelle Lösungsansätze und best-practise zu Ihren konkreten Problemstellungen im Umgang mit dem innovativen Modellierungs-, Architekturansatz zur agilen Data Warehouse Modellierung!
Kosten
0,5 Stunden – 110 €
1,0 Stunden – 200 €
2,0 Stunden – 350 €
Die Data Vault 2.0 Sprechstunde bietet Ihnen die Möglichkeit, kurzfristig Unterstützung bei kleinen und großen Fragestellungen zu erhalten. Profitieren Sie von der Erfahrung unserer Expert*innen bei der Lösung Ihrer Problemstellung. So können Sie sich schnell wieder Ihrer eigentlichen Arbeit widmen.
Mit den areto Data Vault-Expert*innen zur data driven company!
Finden Sie heraus, wo Ihr Unternehmen aktuell auf dem Weg zur data-driven-company steht.
Wir analysieren den Status Quo und zeigen Ihnen, welche Potenziale vorhanden sind.
Wie wollen Sie starten?
kostenfreie Beratung & Demotermine
Haben Sie schon eine Strategie für Ihre zukünftige DWH-Lösung? Nutzen Sie bereits die Vorteile moderner Cloudplattformen und Automatisierungen? Gern zeigen wir Ihnen Beispiele, wie unsere Kund*innen die agilen und skalierbaren DWH-Lösungen von areto bereits nutzen.
Workshops / Coachings
Sie erhalten in unseren Workshops und Coachings das nötige Know-how für den Aufbau eines modernen DWH. Das areto DWH-TrainingCenter bietet eine breite Auswahl an Lerninhalten.
Proof of Concepts