Informationen sind im Informationszeitalter die Ware Nummer 1. Adressen werden zu hohen Preisen weiterverkauft und Großunternehmen werden immer hungriger nach den Daten. Doch was bringt die Datensammelwut gerade für Ihre Firma?
Daten vs Information
In der Informationstheorie unterscheidet man zwischen Daten und Information. Beide misst man in der Einheit „Bit“. Der Unterschied liegt daran, dass Daten die Darstellungsform von Information sind. Man kann also 5 Bit Informationen mit 50 Bit Daten darstellen, allerdings nie 2 Bit Information mit nur 1 Bit Daten. Eine Information ist beispielsweise, ob Deutschland Weltmeister ist. Nehmen wir an, die Chance läge bei 50-50, so ist der Informationsgehalt einer solchen Meldung 1 Bit. Die Meldung kann allerdings in einem Textschnipsel von etwa 10.000 Bit Größe verpackt sein. Die 10.000 Datenbits des kleinen Textes von etwa 300 Wörtern enthält also nur 1 Bit relevante Information für uns. Wir müssen also teilweise viele Daten sammeln, um an ein wenig wertvolle Information zu kommen. So weiß man nach etwa 1.000 Webseitenbesuchern erst, wie attraktiv die Webseite für ihre Leser ist. Bei weniger Besuchern wären die Daten nicht aussagekräftig.
Daten strukturieren
Der größte Teil unserer Daten liegt unstrukturiert vor. Unter unstrukturierten Daten versteht man Webseiten, Dateien, Ordner, Textdokumente, Excel-Tabellen, Präsentationen und Zettel.
Strukturierte Daten hingegen sind in ein sogenanntes Schema gepresst. Anstatt Informationen auf Dokumente verstreut zu lagern, speichert man zu den Daten zusätzlich, welche Bedeutung sie haben. Ein Schema kann beispielsweise von folgender Form sein: Person(Name, Vorname, Anschrift, Geburtsdatum)
. Ein Datensatz wäre dann von der Form ('Anton', 'Müller', 'Musterstraße 1, 01234 Musterstadt', 01.01.1991)
.
Die strukturierte Form, Daten zu speichern bietet vor allem in der Auswertung zahlreiche Vorteile. So lässt sich aus dem Geburtsdatum leicht das Alter einer Person oder gar das Durchschnittsalter aller Personen berechnen. Daten in der richtigen Struktur vorliegen zu haben vereinfacht deren Verwertbarkeit enorm. Bei ausreichend Datensätzen empfehle ich es jedem, seine Daten zu strukturieren.
Zusammenhänge feststellen
Die Auswertung der Daten hat als Ziel, aus den Daten Informationen zu extrahieren. Die Informationen, die uns interessieren, sind meist Zusammenhänge. Beispiele für Zusammenhänge, die man bilden kann:
- Abends surfen mehr Leute im Internet als Vormittags
- Um ca. 21:00 finden die meisten Verkäufe statt
- Personen, die über eine Werbekampagne die Seite finden, springen schneller ab als Personen, denen die Seite von einem Blog empfohlen wurde
- Kunden, bei denen bereits eine Beschwerde erfolgreich gelöst wurde, kaufen häufiger ein zweites Mal
- Der Umsatz dieses Jahr beträgt XYZ Euro
Grundsätzlich segmentiert man die Daten nach verschiedenen Ausgangsgrößen und beobachtet dann die Zielgrößen. Beispiele für Ausgangsgrößen sind Alter, Umsatz, Uhrzeit oder bestimmte Merkmale des Datensatzes. Zielgrößen können Gewinn oder Umsatz sein.
Der Nutzen der Daten liegt auf der Hand:
- Vormittags könnte man Wartungsarbeiten an der Seite durchführen
- Werbekampagnen können so eingeschränkt werden, dass sie nur um ca. 21:00 Besucher auf die Seite holen
- Man könnte mehr Energie in Blogbeiträge investieren anstatt in Werbung
- Man behandelt Beschwerden als Chance und löst die Beschwerde zur vollsten Zufriedenheit des Kunden
- Strategien können festgelegt werden
Big Data
Aus Daten extrahierte Informationen sind umso genauer, je mehr Ausgangsdaten man zur Verfügung hat. Deshalb heißt die Devise sammeln, sammeln, sammeln. Methoden zum Sammeln gibt es viele:
- Man kann die Daten über Formulare eingeben
- Man kann die Daten aus unstrukturierten Daten extrahieren
- Man kann die Daten importieren (Beispielsweise Bankauszüge im CSV-Format)
- Man kann die Daten mit Sensoren aufnehmen (Sensoren können auch Barcode-Leser und Webseite-Skripte sein)
- Man kann die Daten kaufen
Für jede Situation sind natürlich andere Methoden geeignet.
Rechtliche Situation
Die Speicherung personenbezogener Daten bedarf einer Genehmigung der Person. Die Person hinter den Daten hat außerdem weitgehende Rechte über Einsicht bis zu Korrektur und Löschung der Daten. Wann immer es möglich ist, sollte man die gesammelten Daten von den Personen trennen. Dadurch lässt sich nicht mehr nachvollziehen, wer hinter dem Datensatz steht und man kann die Daten für den eigentlichen Geschäftszweck benutzen.
Fazit
Fangen Sie jetzt an, alte Datenbestände zu strukturieren und mehr neue Daten zu sammeln. Es kann Ihnen in Zukunft nur Vorteile bringen.
Comments are closed