Benutzer-Werkzeuge

Webseiten-Werkzeuge


konzepte:datenwuerfel

Datenwürfel (engl. data cube)

Der Begriff Datenwürfel bezeichnet spezielle Organisationsform von Daten. Ziel dieses Konzeptes ist es, Daten mehrdimensional und intuitiv analysierbar zu machen.

Anwendungsgebiet

Datenwürfel ordnen Daten entlang betriebswirtschaftlicher Variablen bzw. Kennzahlen (wie z. B. Umsatz oder Kostengrößen) entlang unterschiedlicher Dimensionen (wie z. B. Kunde, Artikeln, Niederlassungen oder Regionen) an. Diese Daten lassen sich im zeitlichen Verlauf analysieren.

Datenwürfeln kommt in modernen Unternehmen eine immer größere Bedeutung zu, eignen sie sich doch, um komplexe Fragestellungen anhand von mehrdimensionalen Analysen zu beantworten. Mit Mehrdimensionalität ist hier gemeint, dass die Fragestellung des Anwenders sich in der Regel auf verschiedenen Dimensionen wie z. B. Ort, Zeit oder bestimmte Kennzahlen einschränken lässt. Ein Beispiel wäre hier z. B. der Absatz eines bestimmten Quartals in einer bestimmten Region.

Multidimensionale Datenwürfel ermöglichen es dem Benutzer, diese Dimensionen zu kombinieren um die verschiedensten Fragestellungen zu beantworten. Im genannten Beispiel könnte das Ergebnis z. B. zusätzlich analysiert werden nach der Dimension Produkt oder Monat. Die Dimensionen können durch den Benutzer kombiniert werden, gefiltert werden, aggregiert werden oder detailliert werden.

Eigenschaften

Datenwürfel Die Folgenden Eigenschaften eines Datenwürfels sind die Funktion grundlegend:

Datenmodell
Eine mehrdimensionale Datenstruktur erhalten die zuvor beschriebenen Datenwürfel durch die zugrunde liegende Modellierungstechnik. Im Gegensatz zu dem traditionellen Entity-Relationship-Modell konzentriert sich die mulitdimensionale Datenmodellierung auf die Speicherung der Daten in ihrer natürlichen, denormalisierten Form. Auf relationalen Datenbanken wird mit speziellen Modellierungstechniken eine virtuelle multidimensionale Sicht erzeugt.

Beispiele für diese Modellierungstechniken sind:

  • Snowflake Schema
  • Starflake Schema
  • Starcluster Schema
  • Galaxy Schema
  • Constellation Schema

Technologie
Datenwürfel benötigen wesentlich mehr Speicherplatz als herkömmliche, relationale Datenbanken, weil jede mögliche Dimensionsinformation innerhalb eines Datensatzes gespeichert werden muss. Zudem müssen die Daten auf sehr leistungstarken Rechnern zur Verfügung gestellt werden, um eine performante Analyse und eine flexible Kombinatorik zu ermöglichen.

Intuitive Analysemöglichkeiten
Der OLAP (On-Line-Analytical Processing) Technologie kommt im Zuge der Analyse multidimensionaler Datenwürfel eine besondere Bedeutung zu. Es handelt sich dabei um eine Softwaretechnik die Managern und qualifizierten Mitarbeitern schnelle, interaktive und vielfältige Zugriffe auf relevante und konsistente Informationen ermöglicht.

Konsistenz
Obwohl sich die Datenwürfel aus verschiedensten Systemen der Unternehmung speist, darf der Benutzer keinen formalen Unterschied zwischen Informationseinheiten aus unterschiedlichen Systemen erkennen können.

Quellen

Gabriel, Roland. Data Warehouse & Data Mining. Herdecke, 2009.

konzepte/datenwuerfel.txt · Zuletzt geändert: 2020/08/20 17:00 (Externe Bearbeitung)