Benutzer-Werkzeuge

Webseiten-Werkzeuge


konzepte:datenbereinigung
  • Bookmark "Datenbereinigung" auf del.icio.us
  • Bookmark "Datenbereinigung" auf Digg
  • Bookmark "Datenbereinigung" auf Furl
  • Bookmark "Datenbereinigung" auf Reddit
  • Bookmark "Datenbereinigung" auf Ask
  • Bookmark "Datenbereinigung" auf Google
  • Bookmark "Datenbereinigung" auf Netscape
  • Bookmark "Datenbereinigung" auf StumbleUpon
  • Bookmark "Datenbereinigung" auf Technorati
  • Bookmark "Datenbereinigung" auf Live Bookmarks
  • Bookmark "Datenbereinigung" auf Yahoo! Myweb
  • Bookmark "Datenbereinigung" auf Facebook
  • Bookmark "Datenbereinigung" auf Newsvine
  • Bookmark "Datenbereinigung" auf Yahoo! Bookmarks
  • Bookmark "Datenbereinigung" auf Twitter
  • Bookmark "Datenbereinigung" auf myAOL
  • Bookmark "Datenbereinigung" auf Slashdot
  • Bookmark "Datenbereinigung" auf Mister Wong

Datenbereinigung


Die Datenbereinigung beschreibt den Prozess der Korrektur oder des Entfernens von Daten aus einer Datenbank, wenn die Daten dort in fehlerhafter, unvollständiger, falsch formatierter oder doppelter Form vorliegen. 1) Unter einer Datenbereinigung wird zudem ein einmaliger oder wiederholter Vorgang zur Wiederherstellung einer korrekter Datenbasis verstanden. Wiederholte Bereinigungsprozesse werden als nachträgliche Korrektur bereits entstandener Datenfehler bezeichnet.

Datenanalyse
Bei kritischen Datenfehlern oder hochdynamischen Daten ist eine Datenbereinigung ohne weitere Maßnahmen in der Regel nur eine kurzfristige Lösung. Daher ist es sinnvoll, neben der Datenbereinigung auch weitere Maßnahmen zu ergreifen, die eine erneute Entstehung von Datenfehlern verhindert. Um die Maßnahmen erfolgreich durchzuführen, bedarf es bei der Analayse der Fehlerursachen die Berücksichtigung der bestehenden Prozesse und Datenflüsse.
Die Ursachen von Datenfehlern können zahlreich sein. Das Datenmodell und die Anwendungen, die die Daten bearbeiten oder die Datenflüsse und bestehenden Prozesse sowie die beteiligten Anwender können Datenfehler verursachen. Beispielsweise können Anwender durch Hör- und Tippfehler, mangelnder Sorgfalt oder kriminelle Absichten Fehler verursachen.2)

Kriterien für Datenfehler und Korrekturmaßnahmen
Um die passenden Maßnahmen zur Fehlerbeiseitung bei Daten anzuwenden, lassen sich Datenfehler mit folgenden Kriterien bewerten.

Bedeutung der Daten: Dieses Kriterium bewertet die Bedeutung der Daten für das Unternehmen und dessen Geschäftsprozesse sowie die Konsequenzen, die sich aus den Datenfehlern ergeben. Mögliche Konsequenzen können beispielsweise Fehlentscheidungen im strategischen sowie operativen Bereich sein, da für die Entscheidungen herangezogende Informationen unvollständig und fehlerhaft sein kann und die Entscheidungsbasis somit nicht verlässlich ist. Weitere Konsequenzen könnte ein Imageschaden sein, da zum Beispiel Fehler in Kundendaten zu einer fehlerhaften Ansprache der Kunden in Briefen oder E-Mail führen kann.

Anforderung an die Datenqualität: Anforderungen sind zum Beispiel valide Daten, dass die Daten beispielsweise den gleichen Datentypen oder bestimmte Höchstwerte besitzen. Außerdem müssen Daten vollständig und einheitlich, sowie vor (un-)absichtlicher Manipulation geschützt sein.

Art der Fehler: Die Fehler können in fachliche und technische Fehler klassifiziert werden. Technische Fehler können beispielsweise Widersprüche gegen eine logische, aber nicht in der Datenbank definierte referentielle Integrität sein. Fachliche Fehler sind zum Beispiel inhaltlich falsche, widersprüchliche oder unplausible Werte. Durch die Fehlerkategorie lassen sich bereits Bereinigungsmaßnahmen ableiten.

Art der Bereinigungsmaßnahmen: Die Art der Bereinigungsmaßnahme hängt vom Fehlerfall und der zur Verfügung stehenden Anwendungen ab. Es gibt grundsätzlich folgende Maßnahmen: eine manuelle Bereinigung wird dann vorgenommen, wenn die Fehleranzahl sowie manuelle Aufwand gering ist und es keine Regeln gibt, nach denen maschinell gearbeitet werden kann. Eine maschinelle Bereinigung wird vorgenommen, wenn es eine große Anzahl von Fehlern gibt und diese durch Regeln automatisiert korrigiert werden können. Diese Bereinigung kann durch ein spezielles Programm oder durch Datenbankmittel (SQL) erfolgen. Eine Mischform aus manueller und maschineller Bereinigung, wenn ein Großteil maschinell korrigiert werden kann und nur in Einzel- bzw. Sonderfällen manuell eingegriffen werden muss. 3)

Methoden zur Datenbereinigung
Methoden, die für die Datenbereinigung angewendet werden können sind beispielsweise, dass durch das Ableiten aus anderen Daten korrekte Werte abgeleitet werden (zum Beispiel die Anrede aus dem Nachnamen). Auch können fehlerhafte Daten durch andere Daten aus anderen Systemen ersetzt werden. Außerdem können Default-Werte anstelle von fehlerhaften Daten verwendet werden. Weiterhin können die Daten herausgefiltert und entfernt werden. Redundante Daten können erkannt und vermieden werden. 4)

  • Bookmark "Datenbereinigung" auf del.icio.us
  • Bookmark "Datenbereinigung" auf Digg
  • Bookmark "Datenbereinigung" auf Furl
  • Bookmark "Datenbereinigung" auf Reddit
  • Bookmark "Datenbereinigung" auf Ask
  • Bookmark "Datenbereinigung" auf Google
  • Bookmark "Datenbereinigung" auf Netscape
  • Bookmark "Datenbereinigung" auf StumbleUpon
  • Bookmark "Datenbereinigung" auf Technorati
  • Bookmark "Datenbereinigung" auf Live Bookmarks
  • Bookmark "Datenbereinigung" auf Yahoo! Myweb
  • Bookmark "Datenbereinigung" auf Facebook
  • Bookmark "Datenbereinigung" auf Newsvine
  • Bookmark "Datenbereinigung" auf Yahoo! Bookmarks
  • Bookmark "Datenbereinigung" auf Twitter
  • Bookmark "Datenbereinigung" auf myAOL
  • Bookmark "Datenbereinigung" auf Slashdot
  • Bookmark "Datenbereinigung" auf Mister Wong
konzepte/datenbereinigung.txt · Zuletzt geändert: 2016/05/05 22:23 von kalversb