Logo biancahoegel.de


Daten

Unter Daten versteht man im Allgemeinen Angaben, (Zahlen-)Werte oder formulierbare Befunde, die durch Messung, Beobachtung u.a. gewonnen wurden. In der Umgangssprache versteht man darunter Gegebenheiten, Tatsachen und Ereignisse. Daneben existieren in verschiedenen Fachbereichen, wie z.B. der Informatik oder der Wirtschaftstheorie, unterschiedliche – wenn auch meist ähnliche – Definitionen. Eine einheitliche Definition gibt es jedoch nicht.

Im Datenschutzrecht sind im Wesentlichen die personenbezogenen Daten gemeint, d.h. Angaben über natürliche Personen, z.B. das Geburtsdatum oder der Wohnort.

Für die Datenverarbeitung und (Wirtschafts-)Informatik werden Daten als Zeichen (oder Symbole) definiert, die Informationen darstellen und die dem Zweck der Verarbeitung dienen.

Die Wirtschaftstheorie beschreibt Daten als diejenigen volkswirtschaftlichen Gegebenheiten, die einen wesentlichen Einfluss auf den Ablauf der Wirtschaft haben, selbst dabei aber nicht beeinflusst werden.

Etymologie und Sprachgebrauch

Daten oder zuvor Data sind eigentlich Pluralbildungen von Datum, das als Lehnwort aus dem Lateinischen zurückgeht auf datum ‚gegeben‘ (Partizip Perfekt Passiv zu lat. dare ‚geben‘) bzw. substantiviert ‚das Gegebene‘. Auf wichtigeren Schriftstücken war in der üblichen Einleitungsformel vermerkt „datum …“ („gegeben (am) …“) mit <Zeitangabe> und eventueller <Ortsangabe> – womit deren Inhalt „das Gegebene“ wurde. Die Pluralform Daten zu Datum folgt anderen Wörtern lateinischen Ursprungs wie StudienStudium oder IndividuenIndividuum.

Da sich in der deutschen Sprache die Bedeutung von „Datum“ im allgemeinen Sprachgebrauch eingeengt hat auf Kalenderdatum, wird für die Pluralbildung im Sinne von Zeitpunkten oft nicht die Wortform „Daten“ benutzt, sondern stattdessen von „Datumsangaben“ oder „Terminen“ gesprochen. Umgekehrt werden für die Einzahl von „Daten“ im weiteren Sinn als eine gegebene Messung, Information oder Zeichen(kette) dann Wörter wie „Wert“, „Angabe“ oder „Datenelement“ verwendet. Es handelt sich also um ein Pluraletantum.

Daten im Unterschied zu Information

Obwohl diese beiden Ausdrücke in der Umgangssprache oft synonym benutzt werden, unterscheidet die Informationstheorie beide dem Begriff nach grundlegend voneinander.

Recht

Das deutsche Recht verwendet an verschiedenen Stellen den Datenbegriff, weist aber keine diesbezügliche Definition auf. Verwendet wird der Begriff etwa im Datenschutz (Art. 4 Nr. 1 DSGVO) oder im Strafrecht unter „Ausspähen von Daten“ (§ 202a StGB); „Daten“ in diesem Sinn sind „nur solche, die elektronisch, magnetisch oder sonst nicht unmittelbar wahrnehmbar gespeichert sind oder übermittelt werden.“ Diese strafrechtliche Bestimmung von Daten stellt auf die technische Sicht von Daten als maschinenlesbar codierte Zeichen ab, die an ein Speicher- oder Übertragungsmedium gebunden sind. Davon zu unterscheiden ist eine semantische Dimension von Daten als Träger von Informationen. Diese Unterscheidung hat auch eine rechtliche Bedeutung. Die Frage nach dem rechtlichen Schutz für den Informationsgehalt von Daten führt in den Anwendungsbereich des geistigen Eigentums (Urheberrecht, gewerblicher Rechtsschutz) oder des Datenschutzes. Unbefugte Veränderungen der Codierung auf einem Datenträger sind dagegen als Eingriff in das Sacheigentum am Datenträger anzusehen und damit sachenrechtlich und ggf. auch strafrechtlich relevant.

Eigentum an Daten: Ein dem Sacheigentum (§§ 903 ff. BGB) entsprechendes Eigentum an Daten kennt das geltende Recht in Deutschland nicht. Da die Eigentumsvorschriften auf eine ausschließliche Zuordnung einer nicht beliebig vermehrbaren und eindeutig identifizierbaren Sache ausgerichtet sind, passen sie nicht zum Charakter von Daten als beliebig, fast ohne Kosten vermehrbares, nicht-rivales Gut. Wohl aber erkennt das geltende Recht ein Eigentum an Datenträgern an. Noch nicht abschließend geklärt ist bisher, in wieweit sich das Eigentum am Datenträger oder an einem Daten produzierenden Gerät auf die gespeicherten bzw. produzierten Daten erstreckt.

Das österreichische Kernstrafrecht kennt den Datenbegriff seit der Einführung des § 126a StGB (Datenbeschädigung). Im Laufe der Zeit wurden weitere Tatbestände hinzugefügt, sodass heute auch der betrügerische Datenverarbeitungsmissbrauch (§ 148a StGB), Datenfälschung (§ 225a StGB), die Störung der Funktionsfähigkeit eines Computersystems (§ 126b StGB) und diverse Vorfelddelikte bestraft werden können.

Weiters findet sich eine differenzierte Darstellung des Begriffs im § 4 Datenschutzgesetz 2000 (DSG). So wird zwischen personenbezogenen und nicht personenbezogenen Daten unterschieden, wobei nur erstere durch das DSG geschützt werden.

Informatik

Laut Definition der inzwischen abgelösten Norm DIN 44300 Nr. 19 waren Daten (ab 1985) „Gebilde aus Zeichen oder kontinuierliche Funktionen, die aufgrund bekannter oder unterstellter Abmachungen Informationen darstellen, vorrangig zum Zweck der Verarbeitung und als deren Ergebnis.“

Gemäß Terminologie der geltenden Norm des internationalen Technologiestandards ISO/IEC 2382-1 für Informationstechnik (seit 1993) sind Daten – Data: „a reinterpretable representation of information in a formalized manner, suitable for communication, interpretation, or processing“ – eine wieder interpretierbare Darstellung von Information in formalisierter Art, geeignet zur Kommunikation, Interpretation oder Verarbeitung.

In der Informatik und Datenverarbeitung versteht man Daten gemeinhin als (maschinen-) lesbare und -bearbeitbare, in der Regel digitale Repräsentation von Information. Ihr Inhalt wird dazu meist zunächst in Zeichen bzw. Zeichenketten kodiert, deren Aufbau strengen Regeln folgt, der sogenannten Syntax. Um aus Daten wieder die Informationen zu abstrahieren, müssen sie in einem Bedeutungskontext interpretiert werden. So kann eine Ziffernfolge wie „123456“ zum Beispiel in Abhängigkeit vom Kontext für eine Telefonnummer, eine Kontonummer oder die Anzahl von Kfz-Neuzulassungen in einem bestimmten Zeitraum stehen. Die betrachtete Zeichenfolge „123456“ oder auch „11110001001000000“ als solche kann nur als Aneinanderreihung von Ziffern erkannt werden; ihre konkrete Bedeutung wird erst im jeweils passenden Kontext (siehe Semantik) klar.

Die Speicherung von Daten erfolgt auf Datenspeichern, wie z.B. Festplatten, DVDs, Flash-Speichern oder auch Magnetbändern, früher z.B. auch Lochkarten. Diese Datenträger gelten als Hardware, während die auf/in ihnen enthaltenen Daten als „immaterieller Begriff“ zu verstehen sind.

Die Form der Darstellung von Daten nennt man Kodierung, die Menge der dabei möglichen Zeichen nennt man Codealphabet (z.B. UTF-8). Daten können unterschiedlich kodiert sein, d.h. in unterschiedlichen Codes notieren, aber dennoch die gleiche Information repräsentieren. In der heutigen Digitaltechnik hat sich die Kodierung in binärer Form fast ausschließlich durchgesetzt. Ein Bit ist dabei die kleinste Informationseinheit. Grundsätzlich ist neben Binärcode auch die Verwendung von Alphabeten mit mehr als zwei Symbolen möglich.

Kategorisierung von Daten

Man unterscheidet:

Nach dem Grad ihrer Beständigkeit unterscheidet man:

Weitere Begriffe für Datenarten:

Formen der Verarbeitung von Daten

Als Datenoperationen beim Speichern von Daten sind nach dem Prinzip „CRUD“ das erstmalige Erfassen von Daten (create), das Lesen (read), das Verändern (update) und das Löschen (delete) zu unterscheiden. Gegenstand solcher Operationen ist zumeist eine bestimmte Gruppe von Daten (wie eine Kundenadresse, Bestellung etc.), die z.B. nach den Regeln der Datenmodellierung gebildet wurde. Diese datentechnischen Operationen werden durch Computerprogramme ausgelöst, d.h. über entsprechende, in diesen enthaltene Befehle (als Teil eines implementierten Algorithmus’) vorgegeben. Die Operationen sind einerseits selbst Input-/Output-Befehle in Bezug auf den Datenbestand, sie stehen zum Teil aber auch im Zusammenhang mit Eingabe und Ausgabe seitens der Benutzer des Computerprogramms.

Zweck der Speicherung von Daten ist in der Regel ihre spätere Nutzung. Dabei lässt sich die einfache Wiedergabe (z.B. in Form von Anzeigen oder Listen) unterscheiden von dem Auswerten, bei dem die Daten in unterschiedliche logische, mathematische oder darstellende Verfahren einfließen (z.B. zur Summenbildung, Durchschnittsberechnung, Differenzbildung, Datenabgleich, als grafische Diagramme usw.).

Eine besondere Form der Daten-Verarbeitung sind der Datenimport (Dateiimport) und Datenexport (Dateiexport) als gängige Methode zum Datenaustausch zwischen verschiedenen Systemen. Hierbei ist unter Umständen auch eine Datenkonvertierung erforderlich, wenn Ausgangs- und Zielsystem unterschiedliche Datenformate oder Dateiformate verwenden.

Betrachtungs- und Wirkungsebenen für Daten

Wie Daten entstehen und welche Begriffe/Bezeichnungen dabei auftreten können

Der Begriff „Daten“ tritt in unterschiedlichen, miteinander im Zusammenhang stehenden Wirkungs- und Betrachtungsebenen auf. Dies sind im Wesentlichen:

Daten in der Programmierung

Daten sind vornehmlich Quelle und Ziel der Verarbeitung in Computerprogrammen. Dazu sind im Programm, d.h. in dessen Quelltext, dem Verarbeitungszweck entsprechende Deklarationen und Befehle erforderlich. Diese können, abhängig von der Programmiersprache, erhebliche syntaktische und auch sprachlich-begriffliche (semantische) Unterschiede aufweisen. Wichtige datenbezogenen Begriffe sind hier (jeweils mit Synonymen, ähnlichen Begriffen und Beispiel angegeben):

Weitere Datenbegriffe, denen in der Programmierung / Softwareentwicklung eine wesentliche Bedeutung zukommt, sind beispielsweise: Datenmodellierung, Eingabe und Ausgabe, Datenfluss, …

Bemerkenswertes

Seit der Jahrtausendwende soll der Anteil der digitalen Daten den der analogen Aufzeichnungsbestände überschritten haben. 1,8 Zettabytes (1021 Bytes = 1,8 Billionen Gigabytes) an digitalen Informationen. Das Gesamtvolumen wuchs in den letzten fünf Jahren um den Faktor fünf und wächst zurzeit täglich um 1018 Bytes. Wollte man die gesamte Datenmenge auf DVD brennen, so benötigte man einen Stapel DVDs, der von der Erde zum Mond und wieder zurück reichen würde.

Auch in den nächsten Jahren wird sich der weltweite Datenverkehr voraussichtlich vervielfachen, ebenso wie der Anteil an „dunkler Information“, was bedeutet, dass immer mehr Information zwischen Maschinen ausgetauscht wird. Für 2020 wird „die Menge an Daten, die erstellt, vervielfältigt und konsumiert werden, bei etwa 40 Zettabytes liegen – und damit 50-mal so hoch sein wie noch vor drei Jahren“.

Es wird geschätzt, dass die technologische Kapazität der Welt zum Speichern von Informationen von 2,6 (optimal komprimierten) Exabyte im Jahr 1986 - das entspricht weniger als einer 730-MB- CD-ROM pro Person (539 MB pro Person) - auf 295 (optimal komprimierte) Exabyte im Jahr 2007 gestiegen ist. Dies entspricht dem Informationsäquivalent von fast 61 CD-ROMs pro Person im Jahr 2007.

Betriebs- und Volkswirtschaftslehre

In Betriebs- und Volkswirtschaftslehre versteht man unter Daten gegebene und meist durch den Entscheidungsträger nicht beeinflussbare ökonomische Größen. Beide Wissenschaften nehmen die etymologische Herkunft des Wortes (datum, ‚das Gegebene‘) sehr ernst. Die Umwelteinflüsse auf diese Entscheidungen teilt man in endogene Faktoren wie die innerbetriebliche Akzeptanz von Unternehmensentscheidungen oder die Störanfälligkeit bei der Durchführung der Leistungsprozesse und exogene Faktoren ein. Hierzu gehören naturbedingte (Angaben zum Klima und Wetter) und gesellschaftsbedingte Daten (wie Gesetze, Tarifverträge, Aktionsparameter der Konkurrenten, Lieferanten und Abnehmer oder Institutionen), die nicht als Reaktion auf eigene Aktionsparameter zu verstehen sind. Unterbleibt jeglicher Beeinflussungsversuch durch den Entscheidungsträger, handelt es sich wie bei den naturbedingten Gegebenheiten auch bei den gesellschaftsbedingten um Datenparameter. Sie sind insbesondere die durch die äußere Umgebung eines Unternehmens (Markt, Staat, Zentralbank, Aufsichtsbehörden, Ausland) festgelegten Rahmenbedingungen, welche zumindest kurzfristig weder direkt noch indirekt durch eigene Entscheidungen beeinflussbar sind. Der Entscheidungsrahmen sieht mithin die Entscheidungsumwelt als ein unveränderliches Datum an.

Als wesentliche Entscheidungsgrundlage dienen Unternehmensdaten, die ein Unternehmen bei seiner Tätigkeit innerhalb eines Geschäftsjahres sammelt. Lediglich ein geringer Teil aus dem Rechnungswesen gelangt im Rahmen der Publizitätspflicht aus bilanzrechtlichen Gründen durch Veröffentlichung im Jahresabschluss oder in Quartalsberichten an die interessierte Öffentlichkeit.

Beispiele

Daten im allgemeinen Sinn

Daten in der Informatik

Siehe auch

Trenner
Basierend auf einem Artikel in: Wikipedia.de
Seitenende
Seite zurück
©  biancahoegel.de
Datum der letzten Änderung: Jena, den: 23.11. 2022