Benutzer-Werkzeuge

Webseiten-Werkzeuge


design:data-vault:entitaeten:satellit

Data Vault Satellit

Data Vault Satellit

Bei der Data Vault Modellierung ist ein Satellit ein Objekt, welches weder einen Primär- noch einen Geschäftsschlüssel enthält.1) Im dem Satelliten werden alle Informationen gespeichert, welche das Geschäftsobjekt (siehe Hub) oder eine Geschäftsbeziehung (siehe Link) beschreiben.2) Dies geschiet je nachdem ob der Satellit mit einem Hub oder einem Link verknüpft wird.3) Ein Beispiel für beschreibende Daten bei der Verknüpfung mit einem Hub sind Vor- bzw. Nachname eines Kunden. Bei der Verknüpfung mit einem Link sind beispielsweise die Wahl des Zahlungsmittels bei einem Kaufvertrag in einem Satelliten gespeichert. Ein einzelner Satellit kann nur einen Hub oder Link beschreiben, jedoch können mehrere Satelliten mit einem einzelnen Hub oder Link verknüpft sein. Ein Satellit wird verwendet um alle Änderungen an den Quelldatten revisionssicher zu speichern.

Metadaten eines Satelliten

Ein Satellit enthält in den meisten Fällen die folgenden Attribute4) zur Beschreibung der Daten:

  1. Zeitstempel: Der Zeitstempel hält detailliert mit Datum und Uhrzeit fest, wann ein Datensatz in das Data Warehouse geladen wurde.
  2. Sitzungs-ID: Die Sitzungs-ID ist eine einzigartige Kennzeichnung zur Identifizierung einer ETL-Sitzung im System.
  3. Datenherkunft: Das Attribut Datenherkunft beschreibt, aus welchem Quellsystem die Daten in das Data Warehouse geladen wurden.

Des Weiteren werden häufig die folgenden Attribute in den Satelliten gespeichert:

  1. Hash Differnce: Ist dafür da, um Änderungen an den descriptiven Informationen mit hoher Performance erkennen zu können, nur wenn Änderungen vorliegen, werden neue Datensätze in den Satelliten geladen.
  2. Extract Date: Dieses optionale Attribute speichert die Zeit und das Datum, wann die Daten aus dem Quellsystem geladen worden sind.

Trennung von Satelliten

Im Data Vault Modell werden descriptive Information eines Geschäftsobjektes nicht in einem Satellit gespeichert. Stattdessen werden die Datensätze in Satelliten aus unterschiedlichen Gründen getrennt gespeichert.

  1. Trennung von Satelliten nach Quellsystemen: Die Satelliten werden häufig direkt pro Quellsystem erstellt. Dies hat zum einen den Vorteil, dass neue Quellsysteme direkt als neue Satelliten in das Data Vault Schema integriert werden können. Außerdem können Satelliten mit nicht mehr benötigten Quellsystemen aus dem Data Vault Modell entfernt werden, ohne dass auf Abhängigkeiten innerhalb des Satellites Rücksicht genommen werden muss. Die Inhalte von gleichen funktionalen Daten von verschiedenen Quellsystemen weisen meistens unterschiedliche Strukturen auf. Durch die Speicherung in verschiedenen Satelliten je Quellsystem entfällt die Zusammenführung in ein einheitliches Schema. Ein weiterer primärer Grund ist die volle auditfähigkeit des Modelles. Sofern mehrere Quellsysteme in einem Satelliten gespeichert würden, wäre nicht klar, welches Quellsystem für den neuen Eintrag zuständig ist.
  2. Trennung nach der Häufigkeit der Änderungen: In vielen Quellsystemen gibt es Datensätze, welche sich nie oder nur ganz selten ändern. In manchen Geschäftsfällen ändern sich die Stammdaten von dem eigenen Unternehmen kaum. Behörden, werden Ihren Namen und die Anschrift eher selten wechseln. Stammdaten von Lieferanten werden ebenfalls nicht so häufig geändert. Andere Datensätze wie z. B. eine Tabelle mit allen Bestellungen wird sich sehr häufig ändern, sodass ständig neue Datensätze geschrieben werden. Einen kompletten neuen Datensätz in den Satelliten zu schreiben, nur weil sich ein Teil der Daten ändert wäre nicht effezient. Daher werden einzelne Stammdaten wie z. B. Unternehmensformen, welche sich nahezu nie ändern und z. B. Ansprechpartner im Unternehmen oder Anschrift, welche sich deutlich häufiger ändern oft getrennt gespeichert.

Hauptsächliche Quellen:

Lindstedt, D. / Olschimke, M.: Building a scalable Data Warehouse with Data Vault 2.0 (2016)

Alle Artikel dieser Kategorie

<nspages design:data-vault:entitaeten:satellit -h1 -textPages=„“ -exclude:start >

1) , 2) , 3) , 4)
Hultgren, Hans. Modeling the Agile Data Warehouse with Data Vault. Brighton Hamilton, 2012. S. 114. Print.
design/data-vault/entitaeten/satellit.txt · Zuletzt geändert: 2020/08/20 16:59 (Externe Bearbeitung)