Benutzer-Werkzeuge

Webseiten-Werkzeuge


konzepte:data_mining
  • Bookmark "Data Mining" auf del.icio.us
  • Bookmark "Data Mining" auf Digg
  • Bookmark "Data Mining" auf Furl
  • Bookmark "Data Mining" auf Reddit
  • Bookmark "Data Mining" auf Ask
  • Bookmark "Data Mining" auf Google
  • Bookmark "Data Mining" auf Netscape
  • Bookmark "Data Mining" auf StumbleUpon
  • Bookmark "Data Mining" auf Technorati
  • Bookmark "Data Mining" auf Live Bookmarks
  • Bookmark "Data Mining" auf Yahoo! Myweb
  • Bookmark "Data Mining" auf Facebook
  • Bookmark "Data Mining" auf Newsvine
  • Bookmark "Data Mining" auf Yahoo! Bookmarks
  • Bookmark "Data Mining" auf Twitter
  • Bookmark "Data Mining" auf myAOL
  • Bookmark "Data Mining" auf Slashdot
  • Bookmark "Data Mining" auf Mister Wong

Data Mining

Data Mining Mit Hilfe von Data Mining (Deutsch: Datenmustererkennung) werden große Datenbestände analysiert, um bis dahin unerkannte und verborgene Zusammenhänge zwischen den einzelnen Daten zu entdecken. Die Daten werden nach mathematisch-statistischen Verfahren maschinell ausgewertet, um somit neue entscheidungsrelevante Information aus diesem Datenbestand zu extrahieren.

Wird das Data-Mining als einzelner Prozess betrachtet, dann werden die Analyseziele erst während und nicht vor dem eigentlichen Data Mining formuliert. Somit kann das Data Mining als ein sich mehrfach wiederholender, also iterativer Prozess gesehen werden, in dem die Ergebnisse empirisch ermittelt werden. Aus diesem Grund hat sich der aus dem Englischen stammende Begriff „Mining“ etabliert, da in einem stetigen Fortlauf innerhalb der Daten nach neue Erkenntnissen „gegraben“ wird.

Das Data Mining ist auch als einen operativen Teilprozess eines KDD-Prozesses (Knowledge-Discovery in Databases) genutzt, in der die üblichen Algorithmen und Verfahren des Data Minings angewendet werden, um neue Erkenntnisse aus einem Datenbestand zu gewinnen. Der KDD-Prozess umfasst jedoch weitere Schritte wie die Ergebnisevaluation und –interpretation. Damit werden die Informationen aus dem Data Mining Prozess als Problem- Lösungsanalyse herangezogen, um eine Entscheidung zu erleichtern.

Anwendungsgebiete

Das Data Mining wird maßgeblich im Marketing, Controlling sowie für Finanzdienstleistungen angewendet, um Hypothesen zu ausgesuchten Beziehungen zu testen.

  1. Marketing: Zielgruppenidentifikation, Segmentierung, Analyse des Kaufverhaltens: Unter welchen Bedingungen, wie z. B. der Tageszeit, kaufen bestimmte Kundengruppen vermehrt ein Produkt.
  2. Controlling: Bei der Sekundärforschung im Vertriebs-Controlling oder Marketing-Controlling: Untersuchung von Kundenaffinitäten und Leistungsbewertung.
  3. Banken & Versicherungen: Risiko-Bewertung, Gestaltung von individuellen Risiko-Prämien, Missbrauchsentdeckung
  4. Produktion: Prozess-Analysen, Six-Sigma
  5. E-Business: Individuelle automatisierte Produktberatung und Unterstützung der Kaufentscheidung des Kunden, wie bsp. bei Amazon
  6. Wissenschaft: Auswertung von Messdaten allgemein, Astronomie, Pharmazie, etc.

Methoden

Folgende Methoden werden grundsätzlich herangezogen:

  1. Vorhersage- und Klassifikationsmodelle: Es werden Klassenwahrscheinlichkeiten und Hypothesen aufgestellt, um Beziehungen zwischen Roh- oder aggregierten Daten zu ermitteln. Dazu dienen beispielsweise die
    1. Regressionsanalyse, ein Bereich der multivariaten Analysemethoden
    2. Entscheidungsbaumverfahren oder künstlichen neuronalen Netzen: Der Einsatz von künstlichen neuronalen Netzen ermöglicht mittels der künstlichen Intelligenz Muster (Engl.: Patterns) in den Daten zu erkennen.
  2. Segmentierungen oder Clustering: Die Daten werden nach bestimmten Variablen segmentiert bzw. nach Homogenität und Heterogenität unterschieden. Übliche Verfahren sind dazu die Varianzanalyse, das K-Means-Verfahren oder die Kohonen-Netze.
  3. Dimensionsreduktion: Um die Komplexität von Informationen zu reduzieren, werden gewisse Variablen ausgeblendet, um das Modell zu vereinfachen und damit die Fähigkeit der Modellentwicklung und der empirischen iterativen Informationsgewinnung zu erhöhen.
  4. Assoziationsanalysen: Beziehungen zwischen den Daten sollen bei der Assoziationsanalyse als heuristischer Ansatz aufgedeckt werden. Es wird ermittelt, wie häufig gewisse Attribute innerhalb des gesamten Datenbestandes vorkommen und wie diese in einem Muster zusammenhängen. Als grundlegende Verfahren werden Assoziationsregeln, Sequenzmuster oder Link-Analysen verwendet.

Wichtige Internet-Links für das Data Mining:

http://www.autonlab.org/tutorials/

http://www.thearling.com/

  • Bookmark "Data Mining" auf del.icio.us
  • Bookmark "Data Mining" auf Digg
  • Bookmark "Data Mining" auf Furl
  • Bookmark "Data Mining" auf Reddit
  • Bookmark "Data Mining" auf Ask
  • Bookmark "Data Mining" auf Google
  • Bookmark "Data Mining" auf Netscape
  • Bookmark "Data Mining" auf StumbleUpon
  • Bookmark "Data Mining" auf Technorati
  • Bookmark "Data Mining" auf Live Bookmarks
  • Bookmark "Data Mining" auf Yahoo! Myweb
  • Bookmark "Data Mining" auf Facebook
  • Bookmark "Data Mining" auf Newsvine
  • Bookmark "Data Mining" auf Yahoo! Bookmarks
  • Bookmark "Data Mining" auf Twitter
  • Bookmark "Data Mining" auf myAOL
  • Bookmark "Data Mining" auf Slashdot
  • Bookmark "Data Mining" auf Mister Wong
konzepte/data_mining.txt · Zuletzt geändert: 2014/10/19 13:38 (Externe Bearbeitung)