Benutzer-Werkzeuge

Webseiten-Werkzeuge


analyse:k-means-algorithmus
  • Bookmark "K-Means Algorithmus" auf del.icio.us
  • Bookmark "K-Means Algorithmus" auf Digg
  • Bookmark "K-Means Algorithmus" auf Furl
  • Bookmark "K-Means Algorithmus" auf Reddit
  • Bookmark "K-Means Algorithmus" auf Ask
  • Bookmark "K-Means Algorithmus" auf Google
  • Bookmark "K-Means Algorithmus" auf Netscape
  • Bookmark "K-Means Algorithmus" auf StumbleUpon
  • Bookmark "K-Means Algorithmus" auf Technorati
  • Bookmark "K-Means Algorithmus" auf Live Bookmarks
  • Bookmark "K-Means Algorithmus" auf Yahoo! Myweb
  • Bookmark "K-Means Algorithmus" auf Facebook
  • Bookmark "K-Means Algorithmus" auf Newsvine
  • Bookmark "K-Means Algorithmus" auf Yahoo! Bookmarks
  • Bookmark "K-Means Algorithmus" auf Twitter
  • Bookmark "K-Means Algorithmus" auf myAOL
  • Bookmark "K-Means Algorithmus" auf Slashdot
  • Bookmark "K-Means Algorithmus" auf Mister Wong

K-Means Algorithmus

Der K-Means Algorithmus ist ein Verfahren, dass im Umfeld des DWH häufig zur Clusteranalyse verwendet wird. Der Algorithmus existiert bereits seit 1957 und wurde von den Wissenschaftlern Loyd und Forgy 1982 erstmalig in einer Informatik Zeitschrifft unter dem Titel „Least squares quantization in PCM“ veröffentlicht. Der K-Means Algorithmus dient dazu eine ungeordnete Gruppe von Objekten in eine Partition von Clustern zu sortieren, in denen jedes Objekt durch die geringste euklidische Distanz direkt zu einem Clustermittelpunkt zugeordnet werden kann. Im Falle der Anwendung des Algorithmus im Umfeld des DWH werden andere Distanzmaße zur Gruppierung verwendet. Die Funktionsweise des K-Means Algorithmus lässt sich in vier schritte Gliedern. Zuerst wird die Objektmenge in eine Anfangspartition von n Clustern aufgeteilt. Daraufhin wird für jedes Element die Distanz - je nach Distanzmaß unterschiedlich – zum Clustermittelpunkt berechnet. Daraufhin wird jedes Objekt verschoben, das eine kürzere Distanz zu einem anderen Clustermittelpunkt hat als dem Eigenen. Anschließend werden die Clustermittelpunkte neu berechnet und der Algorithmus startet erneut mit schritt zwei, bis keine Objekte mehr verschoben werden können. Ein Nachteil des K-Means Algorithmus ist, dass das Clusterergebnis von der Wahl der Startpunkte abhängen kann. Daher ist es von Vorteil, wenn verschiedene Startpunkte für die Cluster gewählt werden, welche die Reihenfolge der Cluster und die Reihenfolge der Objekte in einem Cluster variieren. Besonders im DWH Umfeld ist darauf zu achten, dass der Algorithmus nur angewendet werden kann, wenn der Mittelpunkt eines Clusters eindeutig definiert werden kann. Dies ist beispielsweise bei ordinalen Merkmalen nicht möglich. Somit ist die Anwendung des Algorithmus zur Datenanalyse meist auf numerische Merkmale beschränkt. Des Weiteren muss vor der Anwendung des Algorithmus bereits eine Betrachtung der Clusterung erfolgt sein, denn dieser erzielt keine sinnvollen Ergebnisse, wenn die einzelnen Cluster nicht konvex sind, dass heiß das die Daten z.B. länglich gestreut wären. Außerdem ist die Methode sehr empfindlich gegenüber Ausreißern und verrauschten Daten, da diese die Berechnung des Mittelpunktes stark beeinflussen können. Im Bereich des DWH wird der Algorithmus für Data-Mining eingesetzt. Er ermöglicht es eine ungeordnete Menge an Daten schrittweise zu strukturieren. Somit ist es möglich Trends oder Muster in Datensätzen zu erkennen, die zur Datenanalyase genutzt werden können. In einem möglichen Anwendungsfall könnte mit Hilfe des K-Means Algorithmus z.B. eine Segmentierung der Kundendatenbank erfolgen.

  • Bookmark "K-Means Algorithmus" auf del.icio.us
  • Bookmark "K-Means Algorithmus" auf Digg
  • Bookmark "K-Means Algorithmus" auf Furl
  • Bookmark "K-Means Algorithmus" auf Reddit
  • Bookmark "K-Means Algorithmus" auf Ask
  • Bookmark "K-Means Algorithmus" auf Google
  • Bookmark "K-Means Algorithmus" auf Netscape
  • Bookmark "K-Means Algorithmus" auf StumbleUpon
  • Bookmark "K-Means Algorithmus" auf Technorati
  • Bookmark "K-Means Algorithmus" auf Live Bookmarks
  • Bookmark "K-Means Algorithmus" auf Yahoo! Myweb
  • Bookmark "K-Means Algorithmus" auf Facebook
  • Bookmark "K-Means Algorithmus" auf Newsvine
  • Bookmark "K-Means Algorithmus" auf Yahoo! Bookmarks
  • Bookmark "K-Means Algorithmus" auf Twitter
  • Bookmark "K-Means Algorithmus" auf myAOL
  • Bookmark "K-Means Algorithmus" auf Slashdot
  • Bookmark "K-Means Algorithmus" auf Mister Wong
analyse/k-means-algorithmus.txt · Zuletzt geändert: 2016/06/24 16:40 von molschimke