Benutzer-Werkzeuge

Webseiten-Werkzeuge


konzepte:vielfalt
  • Bookmark "Vielfalt (Big Data)" auf del.icio.us
  • Bookmark "Vielfalt (Big Data)" auf Digg
  • Bookmark "Vielfalt (Big Data)" auf Furl
  • Bookmark "Vielfalt (Big Data)" auf Reddit
  • Bookmark "Vielfalt (Big Data)" auf Ask
  • Bookmark "Vielfalt (Big Data)" auf Google
  • Bookmark "Vielfalt (Big Data)" auf Netscape
  • Bookmark "Vielfalt (Big Data)" auf StumbleUpon
  • Bookmark "Vielfalt (Big Data)" auf Technorati
  • Bookmark "Vielfalt (Big Data)" auf Live Bookmarks
  • Bookmark "Vielfalt (Big Data)" auf Yahoo! Myweb
  • Bookmark "Vielfalt (Big Data)" auf Facebook
  • Bookmark "Vielfalt (Big Data)" auf Newsvine
  • Bookmark "Vielfalt (Big Data)" auf Yahoo! Bookmarks
  • Bookmark "Vielfalt (Big Data)" auf Twitter
  • Bookmark "Vielfalt (Big Data)" auf myAOL
  • Bookmark "Vielfalt (Big Data)" auf Slashdot
  • Bookmark "Vielfalt (Big Data)" auf Mister Wong

Vielfalt (Big Data)

Eine sehr wichtige Eigenschaft von Big Data besteht in der Vielfalt der Daten. Die für Big Data relevanten Daten kommen oft aus sehr unterschiedlichen Datenquellen und besitzen daher auch viele verschiedene Strukturen und Datenformate.

1)

Durch die verschiedenen Strukturen und Datenformate entstehen dabei oft große Datenmengen die gespeichert, analysiert und ausgewertet werden müssen. Diese Datenmengen stellen allerdings die bisherigen relationalen Datenbanksysteme vor große Probleme, da die Daten keine einheitliche Struktur besitzen und dadurch keine Zusammenhänge erkannt werden können.

Das Entstehen von großen Datenmengen kann dabei verschiedene Gründe haben. So werden heutzutage allerhand Daten aus den Bereichen Wissenschaft, Internet und Kommunikation gespeichert um sie nach brauchbaren Ergebnissen zu durchsuchen und dadurch neue Erkenntnisse gewinnen zu können. Unternehmen können durch das Wissen in großen Datenmengen effizienter werden und sich von anderen Unternehmen abheben. Dadurch kann die strategische und operative Steuerung stetig verbessert werden und das Risiko minimiert werden.

Um diese Vielfalt der Daten verarbeiten zu können, benötigt man daher eine digitale Wertschöfpungsstrategie in der auf alle relevanten Daten geachtet wird um Begriffe miteinander zu verknüpfen und auswerten zu können.

Datenformate

Bei den Datenformaten gibt es dabei unterschiedliche Klassen zu betrachten. Strukturierte Daten haben ein bestimmtes Format und sind in einer relationalen Datenbank gespeichert. Diese Datenbanken haben Spalten-Bezeichnungen und können leicht bearbeitet werden.

Strukturierte Daten sind Daten in relationalen Datenbanken.

Semistrukturierte Daten unterliegen keiner allgemeinen Struktur, sondern besitzen nur Teilinformationen über die Struktur. Diese Daten stammen oft aus unterschiedlichen Quellen und können daher unterschiedlichen Typ-Bezeichnungen besitzen.

Semistrukturierte Daten sind z.B. XML-Dateien Unstrukturierte Daten besitzen keine formalisierte Struktur und können daher nicht durch eine vordefinierte Schnittstelle verarbeitet werden. Über diese Daten ist zwar der Datentyp bekannt, allerdings kann dadurch nicht auf den Inhalt der Daten zugegriffen werden.

Unstrukturierte Daten sind z.B. E-Mails oder Bilder.

Datenquellen

Die Datenquellen werden unterschieden in internen und externen Datenquellen.
Für eine genauere Beschreibung von den verschiedenen Arten siehe Datenquelle.

„Wo sind die wertvollsten Informationen zu finden?“ ist eine der wichtigsten Fragen über die Datenquelle. Wobei das „wertvoll“ an den Zielen des Unternehmens festzumachen ist. Um viele Erkenntnisse gewinnen zu können, müssen viele unterschiedliche Datenquellen einbezogen werden. Um wertvolle Informationen aus einer viel Zahl von Datenquellen zu bekommen, müssen Muster in den Daten analysiert und verarbeitet werden. Hierbei spielt das Data Mining eine große Rolle.

Beliebte Datenquellen für Big Data sind z.B. Logfiles, Metadaten, Finanzdaten, Transaktionsdaten aus Bank- bzw. Geschäftsabläufen, mobile sowie Cloud-basierte Anwendungen, Clickstream-Daten aus Web-Anwendungen oder Sensoren.

Data Mining

Bei dem Prozess des Data Mining werden große Mengen von Daten verarbeitet, um Zusammenhänge zu erkennen und zu analysieren.

Quellen

1)
erstellt von grafal
  • Bookmark "Vielfalt (Big Data)" auf del.icio.us
  • Bookmark "Vielfalt (Big Data)" auf Digg
  • Bookmark "Vielfalt (Big Data)" auf Furl
  • Bookmark "Vielfalt (Big Data)" auf Reddit
  • Bookmark "Vielfalt (Big Data)" auf Ask
  • Bookmark "Vielfalt (Big Data)" auf Google
  • Bookmark "Vielfalt (Big Data)" auf Netscape
  • Bookmark "Vielfalt (Big Data)" auf StumbleUpon
  • Bookmark "Vielfalt (Big Data)" auf Technorati
  • Bookmark "Vielfalt (Big Data)" auf Live Bookmarks
  • Bookmark "Vielfalt (Big Data)" auf Yahoo! Myweb
  • Bookmark "Vielfalt (Big Data)" auf Facebook
  • Bookmark "Vielfalt (Big Data)" auf Newsvine
  • Bookmark "Vielfalt (Big Data)" auf Yahoo! Bookmarks
  • Bookmark "Vielfalt (Big Data)" auf Twitter
  • Bookmark "Vielfalt (Big Data)" auf myAOL
  • Bookmark "Vielfalt (Big Data)" auf Slashdot
  • Bookmark "Vielfalt (Big Data)" auf Mister Wong
konzepte/vielfalt.txt · Zuletzt geändert: 2017/03/30 22:00 von grafal