{"id":1020,"date":"2016-08-12T16:52:04","date_gmt":"2016-08-12T14:52:04","guid":{"rendered":"https:\/\/launix.de\/launix\/?p=1020"},"modified":"2023-07-11T12:24:27","modified_gmt":"2023-07-11T10:24:27","slug":"daten-geschickt-sammeln-big-data-fuer-jedermann","status":"publish","type":"post","link":"https:\/\/launix.de\/launix\/en\/daten-geschickt-sammeln-big-data-fuer-jedermann\/","title":{"rendered":"Daten geschickt sammeln &#8211; Big Data f\u00fcr Jedermann"},"content":{"rendered":"<p>Informationen sind im Informationszeitalter die Ware Nummer 1. Adressen werden zu hohen Preisen weiterverkauft und Gro\u00dfunternehmen werden immer hungriger nach den Daten. Doch was bringt die Datensammelwut gerade f\u00fcr Ihre Firma?<\/p>\n<p><!--more--><br \/>\n<script async src=\"\/\/pagead2.googlesyndication.com\/pagead\/js\/adsbygoogle.js\"><\/script>\r\n<!-- responsive -->\r\n<ins class=\"adsbygoogle\"\r\n     style=\"display:block\"\r\n     data-ad-client=\"ca-pub-8447808153780075\"\r\n     data-ad-slot=\"6876660058\"\r\n     data-ad-format=\"auto\"><\/ins>\r\n<script>\r\n(adsbygoogle = window.adsbygoogle || []).push({});\r\n<\/script><\/p>\n<h2>Daten vs Information<\/h2>\n<p>In der Informationstheorie unterscheidet man zwischen Daten und Information. Beide misst man in der Einheit &#8220;Bit&#8221;. Der Unterschied liegt daran, dass Daten die Darstellungsform von Information sind. Man kann also 5 Bit Informationen mit 50 Bit Daten darstellen, allerdings nie 2 Bit Information mit nur 1 Bit Daten. Eine Information ist beispielsweise, ob Deutschland Weltmeister ist. Nehmen wir an, die Chance l\u00e4ge bei 50-50, so ist der Informationsgehalt einer solchen Meldung 1 Bit. Die Meldung kann allerdings in einem Textschnipsel von etwa 10.000 Bit Gr\u00f6\u00dfe verpackt sein. Die 10.000 Datenbits des kleinen Textes von etwa 300 W\u00f6rtern enth\u00e4lt also nur 1 Bit relevante Information f\u00fcr uns. Wir m\u00fcssen also teilweise viele Daten sammeln, um an ein wenig wertvolle Information zu kommen. So wei\u00df man nach etwa 1.000 Webseitenbesuchern erst, wie attraktiv die Webseite f\u00fcr ihre Leser ist. Bei weniger Besuchern w\u00e4ren die Daten nicht aussagekr\u00e4ftig.<\/p>\n<h2>Daten strukturieren<\/h2>\n<p>Der gr\u00f6\u00dfte Teil unserer Daten liegt unstrukturiert vor. Unter unstrukturierten Daten versteht man Webseiten, Dateien, Ordner, Textdokumente, Excel-Tabellen, Pr\u00e4sentationen und Zettel.<\/p>\n<p>Strukturierte Daten hingegen sind in ein sogenanntes Schema gepresst. Anstatt Informationen auf Dokumente verstreut zu lagern, speichert man zu den Daten zus\u00e4tzlich, welche Bedeutung sie haben. Ein Schema kann beispielsweise von folgender Form sein: <code>Person(Name, Vorname, Anschrift, Geburtsdatum)<\/code>. Ein Datensatz w\u00e4re dann von der Form <code>('Anton', 'M\u00fcller', 'Musterstra\u00dfe 1, 01234 Musterstadt', 01.01.1991)<\/code>.<\/p>\n<p>Die strukturierte Form, Daten zu speichern bietet vor allem in der Auswertung zahlreiche Vorteile. So l\u00e4sst sich aus dem Geburtsdatum leicht das Alter einer Person oder gar das Durchschnittsalter aller Personen berechnen. Daten in der richtigen Struktur vorliegen zu haben vereinfacht deren Verwertbarkeit enorm. Bei ausreichend Datens\u00e4tzen empfehle ich es <b>jedem<\/b>, seine Daten zu strukturieren.<\/p>\n<script async src=\"\/\/pagead2.googlesyndication.com\/pagead\/js\/adsbygoogle.js\"><\/script>\r\n<!-- responsive -->\r\n<ins class=\"adsbygoogle\"\r\n     style=\"display:block\"\r\n     data-ad-client=\"ca-pub-8447808153780075\"\r\n     data-ad-slot=\"6876660058\"\r\n     data-ad-format=\"auto\"><\/ins>\r\n<script>\r\n(adsbygoogle = window.adsbygoogle || []).push({});\r\n<\/script>\n<h2>Zusammenh\u00e4nge feststellen<\/h2>\n<p>Die Auswertung der Daten hat als Ziel, aus den Daten Informationen zu extrahieren. Die Informationen, die uns interessieren, sind meist Zusammenh\u00e4nge. Beispiele f\u00fcr Zusammenh\u00e4nge, die man bilden kann:<\/p>\n<ul>\n<li>Abends surfen mehr Leute im Internet als Vormittags<\/li>\n<li>Um ca. 21:00 finden die meisten Verk\u00e4ufe statt<\/li>\n<li>Personen, die \u00fcber eine Werbekampagne die Seite finden, springen schneller ab als Personen, denen die Seite von einem Blog empfohlen wurde<\/li>\n<li>Kunden, bei denen bereits eine Beschwerde erfolgreich gel\u00f6st wurde, kaufen h\u00e4ufiger ein zweites Mal<\/li>\n<li>Der Umsatz dieses Jahr betr\u00e4gt XYZ Euro<\/li>\n<\/ul>\n<p>Grunds\u00e4tzlich segmentiert man die Daten nach verschiedenen Ausgangsgr\u00f6\u00dfen und beobachtet dann die Zielgr\u00f6\u00dfen. Beispiele f\u00fcr Ausgangsgr\u00f6\u00dfen sind Alter, Umsatz, Uhrzeit oder bestimmte Merkmale des Datensatzes. Zielgr\u00f6\u00dfen k\u00f6nnen Gewinn oder Umsatz sein.<\/p>\n<p>Der Nutzen der Daten liegt auf der Hand:<\/p>\n<ul>\n<li>Vormittags k\u00f6nnte man Wartungsarbeiten an der Seite durchf\u00fchren<\/li>\n<li>Werbekampagnen k\u00f6nnen so eingeschr\u00e4nkt werden, dass sie nur um ca. 21:00 Besucher auf die Seite holen<\/li>\n<li>Man k\u00f6nnte mehr Energie in Blogbeitr\u00e4ge investieren anstatt in Werbung<\/li>\n<li>Man behandelt Beschwerden als Chance und l\u00f6st die Beschwerde zur <b>vollsten<\/b> Zufriedenheit des Kunden<\/li>\n<li>Strategien k\u00f6nnen festgelegt werden<\/li>\n<\/ul>\n<h2>Big Data<\/h2>\n<p>Aus Daten extrahierte Informationen sind umso genauer, je mehr Ausgangsdaten man zur Verf\u00fcgung hat. Deshalb hei\u00dft die Devise <b>sammeln, sammeln, sammeln<\/b>. Methoden zum Sammeln gibt es viele:<\/p>\n<ul>\n<li>Man kann die Daten \u00fcber Formulare eingeben<\/li>\n<li>Man kann die Daten aus unstrukturierten Daten extrahieren<\/li>\n<li>Man kann die Daten importieren (Beispielsweise Bankausz\u00fcge im CSV-Format)<\/li>\n<li>Man kann die Daten mit Sensoren aufnehmen (Sensoren k\u00f6nnen auch Barcode-Leser und Webseite-Skripte sein)<\/li>\n<li>Man kann die Daten kaufen<\/li>\n<\/ul>\n<p>F\u00fcr jede Situation sind nat\u00fcrlich andere Methoden geeignet.<\/p>\n<h2>Rechtliche Situation<\/h2>\n<p>Die Speicherung personenbezogener Daten bedarf einer Genehmigung der Person. Die Person hinter den Daten hat au\u00dferdem weitgehende Rechte \u00fcber Einsicht bis zu Korrektur und L\u00f6schung der Daten. Wann immer es m\u00f6glich ist, sollte man die gesammelten Daten von den Personen trennen. Dadurch l\u00e4sst sich nicht mehr nachvollziehen, wer hinter dem Datensatz steht und man kann die Daten f\u00fcr den eigentlichen Gesch\u00e4ftszweck benutzen.<\/p>\n<h2>Fazit<\/h2>\n<p>Fangen Sie <b>jetzt<\/b> an, alte Datenbest\u00e4nde zu strukturieren und mehr neue Daten zu sammeln. Es kann Ihnen in Zukunft nur Vorteile bringen.<\/p>","protected":false},"excerpt":{"rendered":"<p>Informationen sind im Informationszeitalter die Ware Nummer 1. Adressen werden zu hohen Preisen weiterverkauft und Gro\u00dfunternehmen werden immer hungriger nach den Daten. Doch was bringt die Datensammelwut gerade f\u00fcr Ihre Firma?<\/p>","protected":false},"author":2,"featured_media":0,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"_editorskit_title_hidden":false,"_editorskit_reading_time":0,"_editorskit_is_block_options_detached":false,"_editorskit_block_options_position":"{}","_uag_custom_page_level_css":"","footnotes":""},"categories":[128],"tags":[46],"class_list":["post-1020","post","type-post","status-publish","format-standard","hentry","category-programming","tag-datenverarbeitung","single-item"],"featured_image_urls_v2":{"full":"","thumbnail":"","medium":"","medium_large":"","large":"","1536x1536":"","2048x2048":"","trp-custom-language-flag":"","xs-thumb":"","appku-shop-single":""},"post_excerpt_stackable_v2":"<p>Informationen sind im Informationszeitalter die Ware Nummer 1. Adressen werden zu hohen Preisen weiterverkauft und Gro\u00dfunternehmen werden immer hungriger nach den Daten. Doch was bringt die Datensammelwut gerade f\u00fcr Ihre Firma? Daten vs Information In der Informationstheorie unterscheidet man zwischen Daten und Information. Beide misst man in der Einheit &#8220;Bit&#8221;. Der Unterschied liegt daran, dass Daten die Darstellungsform von Information sind. Man kann also 5 Bit Informationen mit 50 Bit Daten darstellen, allerdings nie 2 Bit Information mit nur 1 Bit Daten. Eine Information ist beispielsweise, ob Deutschland Weltmeister ist. Nehmen wir an, die Chance l\u00e4ge bei 50-50, so ist&hellip;<\/p>\n","category_list_v2":"<a href=\"https:\/\/launix.de\/launix\/en\/category\/programming\/\" rel=\"category tag\">Programming<\/a>","author_info_v2":{"name":"Carl-Philip H\u00e4nsch","url":"https:\/\/launix.de\/launix\/en\/author\/carli\/"},"comments_num_v2":"0 comments","uagb_featured_image_src":{"full":false,"thumbnail":false,"medium":false,"medium_large":false,"large":false,"1536x1536":false,"2048x2048":false,"trp-custom-language-flag":false,"xs-thumb":false,"appku-shop-single":false},"uagb_author_info":{"display_name":"Carl-Philip H\u00e4nsch","author_link":"https:\/\/launix.de\/launix\/en\/author\/carli\/"},"uagb_comment_info":0,"uagb_excerpt":"Informationen sind im Informationszeitalter die Ware Nummer 1. Adressen werden zu hohen Preisen weiterverkauft und Gro\u00dfunternehmen werden immer hungriger nach den Daten. Doch was bringt die Datensammelwut gerade f\u00fcr Ihre Firma?","_links":{"self":[{"href":"https:\/\/launix.de\/launix\/en\/wp-json\/wp\/v2\/posts\/1020","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/launix.de\/launix\/en\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/launix.de\/launix\/en\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/launix.de\/launix\/en\/wp-json\/wp\/v2\/users\/2"}],"replies":[{"embeddable":true,"href":"https:\/\/launix.de\/launix\/en\/wp-json\/wp\/v2\/comments?post=1020"}],"version-history":[{"count":4,"href":"https:\/\/launix.de\/launix\/en\/wp-json\/wp\/v2\/posts\/1020\/revisions"}],"predecessor-version":[{"id":2228,"href":"https:\/\/launix.de\/launix\/en\/wp-json\/wp\/v2\/posts\/1020\/revisions\/2228"}],"wp:attachment":[{"href":"https:\/\/launix.de\/launix\/en\/wp-json\/wp\/v2\/media?parent=1020"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/launix.de\/launix\/en\/wp-json\/wp\/v2\/categories?post=1020"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/launix.de\/launix\/en\/wp-json\/wp\/v2\/tags?post=1020"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}