Benutzer-Werkzeuge

Webseiten-Werkzeuge


konzepte:metadaten

Meta-Daten

Meta-Daten

In einem Datawarehouse (DHW) werden unternehmensweite neue und historische Informationen bzw. Daten eines Unternehmens gesammelt, die dem Management zur Unterstützung von Entscheidungen dienen. Data Marts wiederum sind kleine Datawarehouses, die Daten z.B. von einzelnen Abteilungen beinhalten. Ein Datenbanksystem enthält nicht nur die Datenbank an sich, sondern auch eine vollständige Definition der Datenbankstruktur und Einschränkungen bezüglich der Daten. Diese Definition wird in einem Datenbankkatalog festgehalten, der Informationen wie Typ und Speicherformat jeden Datenelements enthält. Diese gespeicherten Informationen werden Metadaten genannt,1) die in einem Repositorium (Metadatenserver) gespeichert und verwaltet werden.2)

Unter Metadaten versteht man jede Art von Information, die für Konstruktion, Entwurf und Benutzung eines Informationssystems benötigt wird.3) Das aus dem griechisch stammenden Wort „Meta“ bedeutet ursprünglich 'danach', 'neben', 'unter', somit sind Metadaten im Wesentlichen Daten, die etwas anderes beschreiben.4) Metadaten sind Daten über Daten, d.h. sie sind beschreibende Informationen über Inhalt, Zusammenhang, Struktur und Bedeutung von Daten, prozessbezogene Informationen über deren Verarbeitung5) sowie die Beschreibung von Anwendungen und Zugriffsrechten.6)

Bedeutung

Metadaten sind maßgeblich daran beteiligt, wie gut das Data-Warehouse-System die Daten bereitstellen kann. Das Ziel ist es, Daten besser zu verstehen, zu benutzen und zu verwalten.7) Die Transaktionen der Daten, d.h. wie und wann die Daten geladen wurden und woher die Daten stammen, kann nachvollzogen werden.8) Eine Strukturbeschreibung enthält z.B. bibliografische Angaben aus einem Zeitschriftenartikel wie Autor, Heft, Band und Seitenzahl, der Zeitschrift, in der der Artikel erschienen ist.9) Beispielsweise können Bücher mit Metadaten wie Titel, Autor oder Schlüsselbegriffe, besser wiedergefunden, klassifiziert und verwaltet werden.10) Nutzer können die Metadaten aus einem Repositorium abrufen, die dort aus sämtlichen Anwendungen des Unternehmens zusammengeführt wurden.11)

Nutzung

Metadaten werden oft für das Informations-Ressource-Management benutzt und sollten diverse Informationen verwalten und speichern wie:12)

  • Detailinformationen über Speicherstrukturen, Zugriffspfade oder Dateigrößen
  • Nutzungsstatistiken wie Häufigkeiten von Anfragen oder Zugriffstatistiken auf diverse Datenbankteile
  • Beschreibungen, Zuständigkeiten und Zugriffsrechte der Datenbanknutzer
  • Beschreibung des Datenbankschemas
  • Beschreibung der Beziehung zwischen Transaktion und Benutzer
  • Beziehung zwischen Datenbankelementen und –Transaktionen

Auf Grund der Business Intelligence Plattform (BIP) können die Nutzer eines DHW u. A. auf die gespeicherten Daten zugreifen und sie analysieren (siehe Abb. 1). Operative und externe Daten werden in das DHW transformiert und mittels Metadaten lassen sich Abfragen verwalten. Durch das Online Analytical Processing OLAP können die Anwender intuitiv und leicht durch einen komplexen Datensatz navigieren. Durch das Data Mining werden Zusammenhänge zwischen Daten hergestellt, durch dessen Informationen z.B. Zielgruppen effektiver ansprechen zu können oder Marketingstrategien zu optimieren.13)

Klassifizierung

Metadaten lassen sich nach fünf Kriterien klassifizieren:14)

  1. Typ: Primärmetadaten, d.h. Strukturdefinitionen des Data Warehouse, der Quellsysteme und der Datenbank, sowie Prozessmetadaten, z.B. Protokolldateien oder Ausführungspläne der Prozesse. Organisatorische Aspekte wie Informationen über Mitarbeiter oder Organisationsstrukturen können als separate Kategorie aufgeführt, oder den Primärdaten zugeordnet werden.
  2. Abstraktion: Metadaten können konzeptuell (sprachliche Darstellung), logisch (formalere Darstellung wie Datenbankschema) und physisch (konkrete Implementation) modelliert werden.
  3. Herkunft: Das zu verfügende Quellsystem, das produzierende Werkzeug oder der einzelne Anwender sollte als Herkunft identifizierbar sein.
  4. Erstellungs-/ Verwendungszeitpunkt: Beim Erstellungszeitpunkt lassen sich Entwurfsmetadaten (z.B. Schemadefinitionen), Aufbaumetadaten (z.B. Log Files) und Verwendungsmetadaten (z.B. Zugriffsmuster) unterscheiden. Der Verwendungszeitpunkt lässt sich beim Entwurf (z.B. Metadaten von CASE Werkzeugen), bei der Verwendung (z.B. OLAP-Metadaten) oder beim Data-Warehouse Aufbau (z.B. Transformationsregeln) klassifizieren.
  5. Anwendersicht: Je nach Art des Anwenders bzw. Zielgruppe können Metadaten und ihre Struktur von unterschiedlichen Perspektive betrachtet werden, z.B. Business Metadaten bzw. fachliche Metadaten (betriebswirtschaftliche Begriffe) oder technische Metadaten (wie Schemata Definitionen).

Fachliche Metadaten

Fachliche Metadaten umfassen z.B. Fachbegriffe, domänenspezifisches Wissen oder Kontextinformationen wie benutzte Maßeinheiten oder Datumsformate. Sie dienen dem Endanwender, damit er die Analyseanwendungen effektiver einsetzen, relevante Daten finden und Auswertungen interpretieren kann.15)

Technische Metadaten

Technische Metadaten umfassen z.B. Beschreibungen der Datenschemata oder Transformation und Analyse der Daten wie Dateiname, Erstellungsdatum, Beschreibung oder Autor. Sie sind von Administratoren und Anwendungsentwicklern erstellt worden und sind für sie bestimmt.16) Metadaten können aktiv (wenn sie zum Ausführungszeitpunkt von entsprechenden Werkzeugen interpretiert und ausgeführt werden), passiv (als konsistente Dokumentation), oder semiaktiv (bei Speicherung von Strukturinformationen) genutzt werden.17)

Fazit

Metadaten vereinfachen die Administration und die Wartung eines Data-Warehouse-Systems und ermöglichen es, Informationen aus dem Datawarehouse zu gewinnen. Zudem dienen sie dem Datawarehouse Manager als Steuerungsinstrument.18)

Literaturverzeichnis

  • Bauer, A./ Günzel, H. (Hrsg.) (2004). Data Warehouse Systeme-Architektur, Entwickung, Anwendung. 2., überarbeitete und aktualisierte Auflage. Heidelberg: dpunkt Verlag GmbH.
  • Elmasri, R./ Navathe, S. B. (2005). Grundlagen von Datenbanksystemen - Ausgabe Grundstudium. 3. Auflage. München: Pearson Studium.
  • Heuner, A./ Saake, G. (2000). Datenbanken: Konzepte und Sprachen. 2., aktualisierte und erweiterte Auflage. Bonn: MITP GmbH.

Internetquellen

1)
Vgl. Elmasri/ Navathe (2005), S. 22.
2)
Vgl. Bauer/ Günzel (Hrsg.) (2004), S. 330.
3) , 17)
Vgl. Bauer/ Günzel (Hrsg.) (2004), S. 328.
5) , 8) , 15) , 16)
Vgl. Bauer/ Günzel (Hrsg.) (2004), S. 69.
6)
Vgl. Elmasri/ Navathe (2005), S. 368.
7) , 10)
Vgl. Bauer/ Günzel (Hrsg.) (2004), S. 327.
9)
Vgl. Heune/ Saake (2000), S. 419.
12)
Vgl. Elmasri/ Navathe (2005), S. 368
14)
Vgl. Bauer/ Günzel (Hrsg.) (2004), S. 336 ff.
18)
Vgl. Bauer/ Günzel (Hrsg.) (2004), S. 68 ff.
konzepte/metadaten.txt · Zuletzt geändert: 2020/08/20 17:00 (Externe Bearbeitung)